KR20070084187A - Pufa 폴리케티드 신타제 시스템 및 그의 용도 - Google Patents
Pufa 폴리케티드 신타제 시스템 및 그의 용도 Download PDFInfo
- Publication number
- KR20070084187A KR20070084187A KR1020077010711A KR20077010711A KR20070084187A KR 20070084187 A KR20070084187 A KR 20070084187A KR 1020077010711 A KR1020077010711 A KR 1020077010711A KR 20077010711 A KR20077010711 A KR 20077010711A KR 20070084187 A KR20070084187 A KR 20070084187A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- activity
- domain
- acp
- genetically modified
- Prior art date
Links
- 108010030975 Polyketide Synthases Proteins 0.000 title claims abstract description 591
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 claims abstract description 651
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 379
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 274
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 252
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 176
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 176
- 244000005700 microbiome Species 0.000 claims abstract description 166
- 239000012634 fragment Substances 0.000 claims abstract description 145
- 238000000034 method Methods 0.000 claims abstract description 124
- 230000001580 bacterial effect Effects 0.000 claims abstract description 81
- 230000000975 bioactive effect Effects 0.000 claims abstract description 46
- 235000003869 genetically modified organism Nutrition 0.000 claims abstract description 21
- 241000333170 Shewanella japonica Species 0.000 claims abstract description 3
- 241000947863 Shewanella olleyana Species 0.000 claims abstract description 3
- 230000000694 effects Effects 0.000 claims description 234
- 241000196324 Embryophyta Species 0.000 claims description 204
- 230000004071 biological effect Effects 0.000 claims description 204
- 150000001413 amino acids Chemical group 0.000 claims description 141
- MBMBGCFOFBJSGT-KUBAVDMBSA-N docosahexaenoic acid Natural products CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 claims description 112
- 108700016155 Acyl transferases Proteins 0.000 claims description 105
- 102000057234 Acyl transferases Human genes 0.000 claims description 102
- 241000233671 Schizochytrium Species 0.000 claims description 102
- 101710198510 Enoyl-[acyl-carrier-protein] reductase [NADH] Proteins 0.000 claims description 94
- 238000004519 manufacturing process Methods 0.000 claims description 93
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 92
- 235000020673 eicosapentaenoic acid Nutrition 0.000 claims description 83
- 101710146995 Acyl carrier protein Proteins 0.000 claims description 82
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 77
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 claims description 75
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 claims description 75
- 229960005135 eicosapentaenoic acid Drugs 0.000 claims description 75
- 108010019608 3-Oxoacyl-(Acyl-Carrier-Protein) Synthase Proteins 0.000 claims description 73
- 102100037149 3-oxoacyl-[acyl-carrier-protein] synthase, mitochondrial Human genes 0.000 claims description 73
- 239000000047 product Substances 0.000 claims description 70
- 241000894006 Bacteria Species 0.000 claims description 68
- 238000012239 gene modification Methods 0.000 claims description 66
- 230000005017 genetic modification Effects 0.000 claims description 65
- 235000013617 genetically modified food Nutrition 0.000 claims description 65
- 235000020669 docosahexaenoic acid Nutrition 0.000 claims description 62
- 238000012986 modification Methods 0.000 claims description 59
- 230000004048 modification Effects 0.000 claims description 58
- 229940090949 docosahexaenoic acid Drugs 0.000 claims description 52
- YUFFSWGQGVEMMI-JLNKQSITSA-N (7Z,10Z,13Z,16Z,19Z)-docosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCCCC(O)=O YUFFSWGQGVEMMI-JLNKQSITSA-N 0.000 claims description 37
- 230000015572 biosynthetic process Effects 0.000 claims description 35
- 230000014509 gene expression Effects 0.000 claims description 35
- 235000021294 Docosapentaenoic acid Nutrition 0.000 claims description 34
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 claims description 32
- 244000184734 Pyrus japonica Species 0.000 claims description 32
- 102000004357 Transferases Human genes 0.000 claims description 32
- 108090000992 Transferases Proteins 0.000 claims description 32
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 claims description 32
- 238000003786 synthesis reaction Methods 0.000 claims description 32
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 claims description 30
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 claims description 30
- 239000012467 final product Substances 0.000 claims description 24
- 241000233675 Thraustochytrium Species 0.000 claims description 22
- 150000004665 fatty acids Chemical class 0.000 claims description 22
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 20
- 229930195729 fatty acid Natural products 0.000 claims description 20
- 239000000194 fatty acid Substances 0.000 claims description 20
- 235000020660 omega-3 fatty acid Nutrition 0.000 claims description 20
- 241001467333 Thraustochytriaceae Species 0.000 claims description 18
- 150000001875 compounds Chemical class 0.000 claims description 17
- 238000006467 substitution reaction Methods 0.000 claims description 17
- 230000035772 mutation Effects 0.000 claims description 16
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 15
- 239000003814 drug Substances 0.000 claims description 14
- 229940079593 drug Drugs 0.000 claims description 13
- 230000000813 microbial effect Effects 0.000 claims description 13
- 230000000295 complement effect Effects 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 12
- 230000037430 deletion Effects 0.000 claims description 12
- 102000004316 Oxidoreductases Human genes 0.000 claims description 10
- 108090000854 Oxidoreductases Proteins 0.000 claims description 10
- 239000003242 anti bacterial agent Substances 0.000 claims description 10
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 claims description 10
- 229940088710 antibiotic agent Drugs 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 8
- 238000006911 enzymatic reaction Methods 0.000 claims description 8
- 239000002253 acid Substances 0.000 claims description 7
- 238000006317 isomerization reaction Methods 0.000 claims description 7
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 6
- 229910052799 carbon Inorganic materials 0.000 claims description 6
- 241001465754 Metazoa Species 0.000 claims description 5
- 235000021342 arachidonic acid Nutrition 0.000 claims description 5
- 229940114079 arachidonic acid Drugs 0.000 claims description 5
- 239000011203 carbon fibre reinforced carbon Substances 0.000 claims description 5
- 235000020244 animal milk Nutrition 0.000 claims description 4
- 230000003115 biocidal effect Effects 0.000 claims description 4
- 235000013336 milk Nutrition 0.000 claims description 4
- 239000008267 milk Substances 0.000 claims description 4
- 210000004080 milk Anatomy 0.000 claims description 4
- MJYQFWSXKFLTAY-OVEQLNGDSA-N (2r,3r)-2,3-bis[(4-hydroxy-3-methoxyphenyl)methyl]butane-1,4-diol;(2r,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O.C1=C(O)C(OC)=CC(C[C@@H](CO)[C@H](CO)CC=2C=C(OC)C(O)=CC=2)=C1 MJYQFWSXKFLTAY-OVEQLNGDSA-N 0.000 claims description 3
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 claims description 3
- 240000002791 Brassica napus Species 0.000 claims description 3
- 235000006008 Brassica napus var napus Nutrition 0.000 claims description 3
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 claims description 3
- 244000188595 Brassica sinapistrum Species 0.000 claims description 3
- 244000020518 Carthamus tinctorius Species 0.000 claims description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 3
- 244000068988 Glycine max Species 0.000 claims description 3
- 235000010469 Glycine max Nutrition 0.000 claims description 3
- 244000020551 Helianthus annuus Species 0.000 claims description 3
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 3
- 244000061176 Nicotiana tabacum Species 0.000 claims description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 3
- 208000001132 Osteoporosis Diseases 0.000 claims description 3
- 240000008042 Zea mays Species 0.000 claims description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 3
- 229940121363 anti-inflammatory agent Drugs 0.000 claims description 3
- 239000002260 anti-inflammatory agent Substances 0.000 claims description 3
- 229940127226 anticholesterol agent Drugs 0.000 claims description 3
- 239000001961 anticonvulsive agent Substances 0.000 claims description 3
- 235000005822 corn Nutrition 0.000 claims description 3
- 230000003412 degenerative effect Effects 0.000 claims description 3
- 235000015872 dietary supplement Nutrition 0.000 claims description 3
- 235000004426 flaxseed Nutrition 0.000 claims description 3
- 235000013350 formula milk Nutrition 0.000 claims description 3
- 150000004668 long chain fatty acids Chemical class 0.000 claims description 3
- 230000004770 neurodegeneration Effects 0.000 claims description 3
- 208000015122 neurodegenerative disease Diseases 0.000 claims description 3
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 3
- 239000003529 anticholesteremic agent Substances 0.000 claims description 2
- 229940125681 anticonvulsant agent Drugs 0.000 claims description 2
- 239000000935 antidepressant agent Substances 0.000 claims description 2
- 239000002246 antineoplastic agent Substances 0.000 claims description 2
- 229940127089 cytotoxic agent Drugs 0.000 claims description 2
- 235000013305 food Nutrition 0.000 claims description 2
- 208000019423 liver disease Diseases 0.000 claims description 2
- 101710160066 Mitochondrial holo-[acyl-carrier-protein] synthase Proteins 0.000 claims 22
- 238000002955 isolation Methods 0.000 claims 1
- 239000008194 pharmaceutical composition Substances 0.000 claims 1
- 150000002632 lipids Chemical class 0.000 abstract description 16
- 235000018102 proteins Nutrition 0.000 description 231
- 235000001014 amino acid Nutrition 0.000 description 95
- 229940024606 amino acid Drugs 0.000 description 95
- 210000004027 cell Anatomy 0.000 description 84
- 125000003275 alpha amino acid group Chemical group 0.000 description 67
- 239000002773 nucleotide Substances 0.000 description 65
- 125000003729 nucleotide group Chemical group 0.000 description 64
- 102000004190 Enzymes Human genes 0.000 description 63
- 108090000790 Enzymes Proteins 0.000 description 63
- 108050002233 Beta-ketoacyl synthases Proteins 0.000 description 61
- 102000011802 Beta-ketoacyl synthases Human genes 0.000 description 60
- 108700026244 Open Reading Frames Proteins 0.000 description 40
- 230000006870 function Effects 0.000 description 38
- 102000000157 3-oxoacyl-(acyl-carrier-protein) reductase Human genes 0.000 description 35
- 108010055468 3-oxoacyl-(acyl-carrier-protein) reductase Proteins 0.000 description 35
- 241001491670 Labyrinthula Species 0.000 description 35
- 239000013598 vector Substances 0.000 description 30
- 241000894007 species Species 0.000 description 29
- 241000588724 Escherichia coli Species 0.000 description 28
- 150000003904 phospholipids Chemical class 0.000 description 26
- 108090000765 processed proteins & peptides Proteins 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 23
- 238000009396 hybridization Methods 0.000 description 21
- 230000009466 transformation Effects 0.000 description 21
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 20
- 108020004414 DNA Proteins 0.000 description 20
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 20
- 101001136034 Homo sapiens Phosphoribosylformylglycinamidine synthase Proteins 0.000 description 20
- 150000005857 PFAS Chemical class 0.000 description 20
- 102100036473 Phosphoribosylformylglycinamidine synthase Human genes 0.000 description 20
- 230000002068 genetic effect Effects 0.000 description 19
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 19
- 241000233866 Fungi Species 0.000 description 18
- 230000001965 increasing effect Effects 0.000 description 18
- 239000002609 medium Substances 0.000 description 17
- 231100000350 mutagenesis Toxicity 0.000 description 17
- 241000206602 Eukaryota Species 0.000 description 16
- 238000002703 mutagenesis Methods 0.000 description 16
- 241000195493 Cryptophyta Species 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 230000012010 growth Effects 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 13
- 230000004151 fermentation Effects 0.000 description 13
- 238000012216 screening Methods 0.000 description 13
- 230000014616 translation Effects 0.000 description 13
- 102000004867 Hydro-Lyases Human genes 0.000 description 12
- 108090001042 Hydro-Lyases Proteins 0.000 description 12
- 241001491678 Ulkenia Species 0.000 description 12
- 125000002252 acyl group Chemical group 0.000 description 12
- 210000000349 chromosome Anatomy 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 11
- 108091081024 Start codon Proteins 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 238000010353 genetic engineering Methods 0.000 description 11
- 239000003921 oil Substances 0.000 description 11
- 235000019198 oils Nutrition 0.000 description 11
- 230000037361 pathway Effects 0.000 description 11
- 101710130262 Probable Vpr-like protein Proteins 0.000 description 10
- 230000007423 decrease Effects 0.000 description 10
- 241001462977 Elina Species 0.000 description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 9
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 9
- 210000003495 flagella Anatomy 0.000 description 9
- 238000002744 homologous recombination Methods 0.000 description 9
- 239000012528 membrane Substances 0.000 description 9
- 238000001890 transfection Methods 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 8
- 230000002538 fungal effect Effects 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 230000006801 homologous recombination Effects 0.000 description 8
- 238000002156 mixing Methods 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 229920001184 polypeptide Polymers 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 7
- 241001467308 Labyrinthuloides Species 0.000 description 7
- 241000294598 Moritella marina Species 0.000 description 7
- 239000007795 chemical reaction product Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 150000003626 triacylglycerols Chemical class 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000006722 reduction reaction Methods 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 241000589158 Agrobacterium Species 0.000 description 5
- 241001466451 Stramenopiles Species 0.000 description 5
- 230000004075 alteration Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 229940127282 angiotensin receptor antagonist Drugs 0.000 description 5
- 210000004102 animal cell Anatomy 0.000 description 5
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 5
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 108091008053 gene clusters Proteins 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- -1 methyl carbon Chemical compound 0.000 description 5
- 229930001119 polyketide Natural products 0.000 description 5
- 230000004952 protein activity Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 5
- MENFZXMQSYYVRK-CRCGJGBYSA-N (4Z,7Z,10Z,13Z,16Z,19Z)-docosahexaenoyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MENFZXMQSYYVRK-CRCGJGBYSA-N 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- 229910000831 Steel Inorganic materials 0.000 description 4
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 238000001994 activation Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000004136 fatty acid synthesis Effects 0.000 description 4
- 125000001924 fatty-acyl group Chemical group 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 150000003881 polyketide derivatives Chemical class 0.000 description 4
- 230000004481 post-translational protein modification Effects 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000003127 radioimmunoassay Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 210000003705 ribosome Anatomy 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 4
- 239000002689 soil Substances 0.000 description 4
- 239000010959 steel Substances 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 241000251468 Actinopterygii Species 0.000 description 3
- 244000063299 Bacillus subtilis Species 0.000 description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 description 3
- 108700003860 Bacterial Genes Proteins 0.000 description 3
- 102000003813 Cis-trans-isomerases Human genes 0.000 description 3
- 108090000175 Cis-trans-isomerases Proteins 0.000 description 3
- 229930194542 Keto Natural products 0.000 description 3
- 241001491672 Labyrinthulaceae Species 0.000 description 3
- 241001491708 Macrocystis Species 0.000 description 3
- 241001138688 Parietichytrium sarkarianum Species 0.000 description 3
- 241000199919 Phaeophyceae Species 0.000 description 3
- 241001138690 Sicyoidochytrium minutum Species 0.000 description 3
- 241000003603 Thraustochytrium striatum Species 0.000 description 3
- 241000607598 Vibrio Species 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 102000045404 acyltransferase activity proteins Human genes 0.000 description 3
- 108700014220 acyltransferase activity proteins Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- JIWBIWFOSCKQMA-LTKCOYKYSA-N all-cis-octadeca-6,9,12,15-tetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/CCCCC(O)=O JIWBIWFOSCKQMA-LTKCOYKYSA-N 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 210000003763 chloroplast Anatomy 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000009833 condensation Methods 0.000 description 3
- 230000005494 condensation Effects 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000006297 dehydration reaction Methods 0.000 description 3
- 238000001212 derivatisation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 235000021588 free fatty acids Nutrition 0.000 description 3
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 125000000468 ketone group Chemical group 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 3
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 description 3
- 238000001243 protein synthesis Methods 0.000 description 3
- 210000001938 protoplast Anatomy 0.000 description 3
- 238000010188 recombinant method Methods 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 150000004671 saturated fatty acids Chemical class 0.000 description 3
- 235000003441 saturated fatty acids Nutrition 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000009469 supplementation Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 241000556533 uncultured marine bacterium Species 0.000 description 3
- 230000003827 upregulation Effects 0.000 description 3
- DVSZKTAMJJTWFG-SKCDLICFSA-N (2e,4e,6e,8e,10e,12e)-docosa-2,4,6,8,10,12-hexaenoic acid Chemical compound CCCCCCCCC\C=C\C=C\C=C\C=C\C=C\C=C\C(O)=O DVSZKTAMJJTWFG-SKCDLICFSA-N 0.000 description 2
- GZJLLYHBALOKEX-UHFFFAOYSA-N 6-Ketone, O18-Me-Ussuriedine Natural products CC=CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O GZJLLYHBALOKEX-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical group CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 2
- 102100036426 Acid phosphatase type 7 Human genes 0.000 description 2
- 102100022734 Acyl carrier protein, mitochondrial Human genes 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 241000003610 Aplanochytrium Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000003595 Aurantiochytrium limacinum Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 108010077805 Bacterial Proteins Proteins 0.000 description 2
- 241001138694 Botryochytrium radiatum Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 101100444336 Claviceps purpurea (strain 20.1) easH gene Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 101100409508 Escherichia coli prrC gene Proteins 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 101000928881 Homo sapiens Acid phosphatase type 7 Proteins 0.000 description 2
- 101000678845 Homo sapiens Acyl carrier protein, mitochondrial Proteins 0.000 description 2
- 101000611240 Homo sapiens Low molecular weight phosphotyrosine protein phosphatase Proteins 0.000 description 2
- 101000620894 Homo sapiens Lysophosphatidic acid phosphatase type 6 Proteins 0.000 description 2
- 101001001294 Homo sapiens Lysosomal acid phosphatase Proteins 0.000 description 2
- 101001001272 Homo sapiens Prostatic acid phosphatase Proteins 0.000 description 2
- 101000620880 Homo sapiens Tartrate-resistant acid phosphatase type 5 Proteins 0.000 description 2
- 101001122914 Homo sapiens Testicular acid phosphatase Proteins 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- 102100026384 L-aminoadipate-semialdehyde dehydrogenase-phosphopantetheinyl transferase Human genes 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 2
- 102100022916 Lysophosphatidic acid phosphatase type 6 Human genes 0.000 description 2
- 102100035699 Lysosomal acid phosphatase Human genes 0.000 description 2
- 241000235575 Mortierella Species 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 101150084291 ORFC gene Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 102100035703 Prostatic acid phosphatase Human genes 0.000 description 2
- 101100222028 Salmonella enteritidis csgC gene Proteins 0.000 description 2
- 241000598397 Schizochytrium sp. Species 0.000 description 2
- 102000009105 Short Chain Dehydrogenase-Reductases Human genes 0.000 description 2
- 108010048287 Short Chain Dehydrogenase-Reductases Proteins 0.000 description 2
- 229930182558 Sterol Natural products 0.000 description 2
- 102100022919 Tartrate-resistant acid phosphatase type 5 Human genes 0.000 description 2
- 102100028526 Testicular acid phosphatase Human genes 0.000 description 2
- 108010084455 Zeocin Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 description 2
- 235000020661 alpha-linolenic acid Nutrition 0.000 description 2
- 230000009435 amidation Effects 0.000 description 2
- 238000007112 amidation reaction Methods 0.000 description 2
- 230000001773 anti-convulsant effect Effects 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 125000001721 carboxyacetyl group Chemical group 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- YPHMISFOHDHNIV-FSZOTQKASA-N cycloheximide Chemical compound C1[C@@H](C)C[C@H](C)C(=O)[C@@H]1[C@H](O)CC1CC(=O)NC(=O)C1 YPHMISFOHDHNIV-FSZOTQKASA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000018044 dehydration Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- KAUVQQXNCKESLC-UHFFFAOYSA-N docosahexaenoic acid (DHA) Natural products COC(=O)C(C)NOCC1=CC=CC=C1 KAUVQQXNCKESLC-UHFFFAOYSA-N 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 230000006126 farnesylation Effects 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 230000006130 geranylgeranylation Effects 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000016784 immunoglobulin production Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000000099 in vitro assay Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 235000020778 linoleic acid Nutrition 0.000 description 2
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 2
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 description 2
- 229960004488 linolenic acid Drugs 0.000 description 2
- 235000020978 long-chain polyunsaturated fatty acids Nutrition 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- LTYOQGRJFJAKNA-VFLPNFFSSA-N malonyl-coa Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-VFLPNFFSSA-N 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 210000005060 membrane bound organelle Anatomy 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 230000011278 mitosis Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000004899 motility Effects 0.000 description 2
- 238000003541 multi-stage reaction Methods 0.000 description 2
- 108091005763 multidomain proteins Proteins 0.000 description 2
- 230000007498 myristoylation Effects 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- 210000000633 nuclear envelope Anatomy 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 238000012261 overproduction Methods 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000013823 prenylation Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000003660 reticulum Anatomy 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 235000003702 sterols Nutrition 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 150000007970 thio esters Chemical class 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 125000003203 triacylglycerol group Chemical group 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- 108020005075 5S Ribosomal RNA Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 101000935487 Agrobacterium fabrum (strain C58 / ATCC 33970) 3-oxopimeloyl-[acyl-carrier-protein] synthase Proteins 0.000 description 1
- 241001466460 Alveolata Species 0.000 description 1
- 241000224489 Amoeba Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000206761 Bacillariophyta Species 0.000 description 1
- 102100022443 CXADR-like membrane protein Human genes 0.000 description 1
- 101100421200 Caenorhabditis elegans sep-1 gene Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000206751 Chrysophyceae Species 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 241001633026 Coenocystis Species 0.000 description 1
- 241000392488 Corallochytrium Species 0.000 description 1
- 102100032182 Crooked neck-like protein 1 Human genes 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 102000036181 Fatty Acid Elongases Human genes 0.000 description 1
- 108010058732 Fatty Acid Elongases Proteins 0.000 description 1
- 108010087894 Fatty acid desaturases Proteins 0.000 description 1
- 102000009114 Fatty acid desaturases Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000759872 Griselinia lucida Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000901723 Homo sapiens CXADR-like membrane protein Proteins 0.000 description 1
- 241000003482 Japonochytrium Species 0.000 description 1
- 241001441073 Japonochytrium marinum Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241001254607 Leander Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 101710129019 Long-chain acyl-[acyl-carrier-protein] reductase Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 241001024304 Mino Species 0.000 description 1
- 101001014220 Monascus pilosus Dehydrogenase mokE Proteins 0.000 description 1
- 241000180113 Monodus Species 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000238413 Octopus Species 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 241001465255 Opisthokonta Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 101000573542 Penicillium citrinum Compactin nonaketide synthase, enoyl reductase component Proteins 0.000 description 1
- 241000206731 Phaeodactylum Species 0.000 description 1
- 241001260361 Photobacterium profundum Species 0.000 description 1
- 241000958364 Pohlia Species 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- 101710093543 Probable non-specific lipid-transfer protein Proteins 0.000 description 1
- 101000824284 Rattus norvegicus Acyl-[acyl-carrier-protein] hydrolase Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000206572 Rhodophyta Species 0.000 description 1
- 108020001027 Ribosomal DNA Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000233673 Schizochytrium aggregatum Species 0.000 description 1
- 241000003597 Schizochytrium minutum Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000863430 Shewanella Species 0.000 description 1
- 241000557283 Shewanella gelidimarina Species 0.000 description 1
- 241001180364 Spirochaetes Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 102000005488 Thioesterase Human genes 0.000 description 1
- 241000144181 Thraustochytrium aureum Species 0.000 description 1
- 241001501879 Thraustochytrium kinnei Species 0.000 description 1
- 241000323188 Thraustochytrium motivum Species 0.000 description 1
- 241000003604 Thraustochytrium pachydermum Species 0.000 description 1
- 241000817756 Thraustochytrium roseum Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 241001298226 Ulkenia sp. Species 0.000 description 1
- 241000003605 Ulkenia visurgensis Species 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000206764 Xanthophyceae Species 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000009056 active transport Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000001430 anti-depressive effect Effects 0.000 description 1
- 229940005513 antidepressants Drugs 0.000 description 1
- 229960003965 antiepileptics Drugs 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- WHGYBXFWUBPSRW-FOUAGVGXSA-N beta-cyclodextrin Chemical class OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO WHGYBXFWUBPSRW-FOUAGVGXSA-N 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001721 carbon Chemical class 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 239000012829 chemotherapy agent Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 101150047356 dec-1 gene Proteins 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- IQLUYYHUNSSHIY-HZUMYPAESA-N eicosatetraenoic acid Chemical compound CCCCCCCCCCC\C=C\C=C\C=C\C=C\C(O)=O IQLUYYHUNSSHIY-HZUMYPAESA-N 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 125000004050 enoyl group Chemical group 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- UKFXDFUAPNAMPJ-UHFFFAOYSA-N ethylmalonic acid Chemical compound CCC(C(O)=O)C(O)=O UKFXDFUAPNAMPJ-UHFFFAOYSA-N 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 101150078207 fabA gene Proteins 0.000 description 1
- 101150015067 fabB gene Proteins 0.000 description 1
- 150000002190 fatty acyls Chemical group 0.000 description 1
- 229940013317 fish oils Drugs 0.000 description 1
- 108010060641 flavanone synthetase Proteins 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000002875 fluorescence polarization Methods 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 235000013376 functional food Nutrition 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 239000003966 growth inhibitor Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 230000000102 heterotrophic effect Effects 0.000 description 1
- 230000009569 heterotrophic growth Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 235000005772 leucine Nutrition 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 1
- ZIYVHBGGAOATLY-UHFFFAOYSA-N methylmalonic acid Chemical group OC(=O)C(C)C(O)=O ZIYVHBGGAOATLY-UHFFFAOYSA-N 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 210000001577 neostriatum Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 229960000988 nystatin Drugs 0.000 description 1
- VQOXZBDYSJBXMA-NQTDYLQESA-N nystatin A1 Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/CC/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 VQOXZBDYSJBXMA-NQTDYLQESA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229910001562 pearlite Inorganic materials 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000037081 physical activity Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 239000010773 plant oil Substances 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 125000000830 polyketide group Chemical group 0.000 description 1
- 108010055896 polyornithine Proteins 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 235000020004 porter Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000002786 root growth Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 229960004793 sucrose Drugs 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 1
- 230000031068 symbiosis, encompassing mutualism through parasitism Effects 0.000 description 1
- 108020002982 thioesterase Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000006276 transfer reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 229910052902 vermiculite Inorganic materials 0.000 description 1
- 239000010455 vermiculite Substances 0.000 description 1
- 235000019354 vermiculite Nutrition 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 150000003735 xanthophylls Chemical class 0.000 description 1
- 235000008210 xanthophylls Nutrition 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6472—Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8247—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6432—Eicosapentaenoic acids [EPA]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6434—Docosahexenoic acids [DHA]
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Nutrition Science (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Virology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
본 발명은, 쉐바넬라 자포니카 또는 쉐바넬라 올레야나의 박테리아 미생물에서 유래된 완전한 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템, 및 그의 생물학적 활성 단편 및 상동체를 개시한다. 더욱 특히, 본 발명은 이러한 PUFA PKS 시스템, 이러한 PUFA PKS 시스템을 포함하는 단백질 및 그의 도메인, 이러한 PUFA PKS 시스템을 포함하는 유전자 변형된 유기체 (식물 및 미생물), 및 본원에 개시한 PUFA PKS 시스템의 제조 및 사용 방법에 관한 것이다. 본 발명은 또한 PUFA 폴리케티드 신타제 (PKS) 시스템을 조작하여 각종 다중불포화 지방산 (PUFA) 및 다른 생물활성 분자가 풍부한 지질을 효과적으로 생산하는 유전자 변형 식물 및 미생물, 및 그러한 생산 방법에 관한 것이기도 하다.
다중불포화 지방산, 폴리케티드 신타제 시스템, 유전자 변형, 식물, 미생물
Description
본 발명은 박테리아 미생물의 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템에 관한 것이다. 더욱 특히, 본 발명은 PUFA PKS 시스템을 코딩하는 핵산, PUFA PKS 시스템을 포함하는 그의 단백질 및 도메인, 이러한 PUFA PKS 시스템을 포함하는 유전자 변형 유기체, 및 본원에 기술된 PUFA PKS 시스템의 제조 및 사용 방법에 관한 것이다. 본 발명은 또한 PUFA 폴리케티드 신타제 (PKS) 시스템 조작에 의해 각종 다중불포화 지방산 (PUFA)이 풍부한 지질을 효율적으로 생산하는 유전자 변형 식물과 유전자 변형 미생물 및 그러한 생산 방법에 관한 것이다.
폴리케티드 신타제 (PKS) 시스템은 일반적으로 지방산 신타제 (FAS) 시스템과 관련이 있는 효소 복합체로서 당업계에 공지되어 있으나, 종종 크게 변형되어서 전형적으로는 지방산과의 유사성이 거의 없는 특이한 생성물이 생산된다. 그러나, 아세틸-CoA 및 말로닐-CoA로부터 다중불포화 지방산 (PUFA)을 합성할 수 있는 해양 박테리아 및 특정 미세조류(microalgae)에 폴리케티드 신타제 시스템이 존재한다는 것이 알려져 있다. 쉐바넬라(Shewanella) 및 또다른 해양 박테리아인 비브리오 마 리누스(Vibrio marinus) 중 PUFA 합성의 PKS 경로는 미국 특허 제6,140,486호에 상세하게 기재되어 있다. 진핵 트라우스토키트리드(Thraustochytrid), 쉬조키트리움(Schizochytrium) 중 PUFA 합성의 PKS 경로는 미국 특허 제6,566,583호에 상세하게 기재되어 있다. 쉬조키트리움 중 PUFA PKS 경로의 완전한 구조적 설명 및 트라우스토키트리움(Thraustochytrium) 중 PUFA PKS 경로의 확인 및 이들 경로의 이용에 관한 세부사항 등을 비롯하여, 트라우스토키트리알레스(Thraustochytriales)의 구성원과 같은 진핵생물 중 PUFA 합성의 PKS 경로는 2002년 12월 19일자로 공개된 미국 특허 출원 공개 제20020194641호 (2002년 4월 16일자로 출원된 미국 특허 출원 제10/124,800호에 상응함)에 상세하게 기재되어 있다. 2004년 3월 24일자로 출원된 미국 특허 출원 제10/810,352호는 트라우스토키트리움 중 PUFA PKS 경로의 완전한 구조적 설명을 기재하고 있고, 추가로 에이코사펜타엔산 (C20:5, ω-3) (EPA) 및 이러한 시스템을 이용하는 다른 PUFA의 생산에 관한 세부사항을 개시하고 있다.
연구가들은 전형적으로 제I형 (모듈형(modular) 또는 반복형(iterative)), 제II형 및 제III형이라고 지칭되는 3종의 기본 유형 중 하나에 속하는 것으로 문헌에 통상 기재되어 왔던 폴리케티드 신타제 (PKS) 시스템 연구를 시도하였다. 명확하게 하기 위해서, 제I형 모듈형 PKS 시스템은 이전에 단순히 "모듈형" PKS 시스템이라고도 지칭되어 왔고, 제I형 반복형 PKS 시스템은 이전에 단순히 "제I형" PKS 시스템이라고도 지칭되어 왔음을 염두에 두어야 한다. 제II형 시스템은 별개의 효소 반응을 수행하는 각각의 구별되는 단백질들을 특징으로 한다. 이 효소들은 함께 작용하여 최종 생성물이 생산되도록 하고, 시스템 중 각 개개의 효소는 전형적 으로 최종 생성물의 생산에 여러회 참여한다. 상기 유형의 시스템은 식물 및 박테리아 중에 존재하는 지방산 신타제 (FAS) 시스템과 유사한 방식으로 작동한다. 제I형 반복형 PKS 시스템은, 효소들이 반복적인 방식으로 이용되어 최종 생성물을 생산한다는 점에서 제II형 시스템과 유사하다. 제I형 반복형은 효소 활성이 별개의 단백질들에 의한 것이 아니라 더 커다란 단백질의 도메인으로서 발휘된다는 점에서 제II형과 차이가 있다. 이 시스템은 동물 및 진균 중 제I형 FAS 시스템과 유사하다.
제II형 시스템과는 달리, 제I형 모듈형 PKS 시스템에서는 각 효소 도메인이 최종 생성물의 생산에 1회씩만 사용된다. 상기 도메인은 매우 큰 단백질에 존재하며 각 반응의 생성물은 PKS 단백질의 또다른 도메인으로 이동된다. 추가로, 상기한 PKS 시스템에서 최종 생성물에 탄소-탄소 이중 결합이 혼입되는 경우, 이것은 통상적으로 트랜스 배위가 된다.
제III형 시스템은 보다 최근에 발견되었고, 축합 효소의 식물 칼콘(chalcone) 신타제 족에 속한다. 제III형 PKS는 제I형 및 제II형 PKS 시스템과 별개이며, 통상적으로 헤테로시클릭 최종 생성물을 생산하기 위한 반복적 축합 반응에서 유리 CoA 기질을 이용한다.
다중불포화 지방산 (PUFA)은 대개의 진핵생물 중 막 지질의 매우 중요한 성분이고 ([Lauritzen et al., Prog. Lipid Res. 40 1 (2001)], [McConn et al., Plant J. 15, 521 (1998)]), 특정 호르몬 및 신호전달 분자의 전구체이다 ([Heller et al., Drugs 55, 487 (1998)], [Creelman et al., Annu. Rev. Plant Physiol. Plant Mol. Biol. 48, 355 (1997)]). PUFA 합성의 공지된 경로는 신장 및 호기성 탈포화 반응에 의해 지방산 신타제 (FAS)로부터 유래되는 16:0 또는 18:0 포화 지방산 (약어 X:Y는 X개의 탄소 원자 및 Y개의 이중 결합 (PUFA 중에서는 통상적으로 시스형)을 함유하는 아실기를 나타냄. PUFA 중 이중 결합 위치는 이중 결합의 전체적 메틸렌 개입과 더불어 지방산 쇄의 메틸 탄소에 대해 표시됨 (예컨대, ω3 또는 ω6))의 프로세싱(processing)을 포함한다 ([Sprecher, Curr. Opin. Clin. Nutr. Metab. Care 2, 135 (1999)], [Parker-Barnes et al., Proc. Natl. Acad. Sci. USA 97, 8284 (2000)], [Shanklin et al., Annu. Rev. Plant Physiol. Plant Mol. Biol. 49, 611 (1998)]). 아세틸-CoA에서 출발하는 도코사헥사엔산 (DHA)의 합성에는 대략 30종의 별개의 효소 활성이 필요하고 지방산 합성 주기의 4회 반복 단계를 포함하는 대략 70가지 반응이 필요하다. 폴리케티드 신타제 (PKS)는 FAS와동일한 반응 중 일부를 수행하고 ([Hopwood et al., Annu. Rev. Genet. 24, 37 (1990)], [Bentley et al., Annu. Rev. Microbiol. 53, 411 (1999)]), 동일한 작은 단백질 (또는 도메인)인 아실 운반체 단백질 (ACP)을 탄소 쇄 성장을 위한 공유 부착 부위로서 이용한다. 그러나, 이들 효소 시스템에서는 FAS에서 보여지는 환원, 탈수 및 환원의 완전 주기가 종종 생략되어, 전형적으로 많은 케토기 및 히드록시기를 함유하고 또한 전형적으로 트랜스 배위인 탄소-탄소 이중 결합을 함유하는 고도로 유도체화된 탄소 쇄가 생산된다. PKS의 선형 생성물은 종종 고리화되어 항생제 및 많은 다른 2차 생성물을 비롯한 복잡한 생화학물질을 형성한다 ([Hopwood et al., (1990), (상기 문헌)], [Bentley et al., (1999), (상기 문헌)], [Keating et al., Curr. Opin. Chem. Biol. 3, 598 (1999)]).
도코사헥사엔산 (DHA, 22:6ω3) 및 에이코사펜타엔산 (EPA, 20:5ω3) 등과 같은 매우 장쇄의 PUFA는 쉐바넬라 종을 비롯한 여러가지 종의 해양 박테리아에서 보고된 바 있다 ([Nichols et al., Curr. Op. Biotechnol. 10, 240 (1999)], [Yazawa, Lipids 31, S (1996)], [DeLong et al., Appl. Environ. Microbiol. 51, 730 (1986)]). 쉐바넬라 종 균주 SCRC2738로부터의 게놈 단편 (플라스미드 pEPA로서 클로닝됨)을 분석하여, 이. 콜라이(E. coli)에서의 EPA 생산에 필요충분조건인 전체 20 Kb의 5개 오픈 리딩 프레임(open reading frame, Orf)을 확인하였다 [Yazawa, (1996), (상기 문헌)]. 예측된 단백질 도메인 중 여러개는 FAS 효소의 상동체였지만, 다른 영역은 공지된 기능의 단백질과 상동성이 없는 것으로 나타났다. 5개의 Orf 중 11개 이상의 영역이 추정적 효소 도메인으로서 확인될 수 있었다 (문헌 [Metz et al., Science 293:290-293 (2001)] 참조). 유전자 데이타베이스의 서열과 비교할 때, 이들 중 7개는 FAS 단백질보다는 PKS 단백질과 더 큰 관련이 있었다. 상기 군에는, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT), β-케토아실-ACP 신타제 (KS), β-케토아실-ACP 리덕타제 (KR), 아실트랜스퍼라제 (AT), 포스포판테테인 트랜스퍼라제, 쇄 길이 (또는 쇄 개시) 인자 (CLF) 및 6개 ACP 도메인의 매우 특이한 클러스터(cluster) (즉, PKS 또는 FAS 서열에서 2개 초과의 ACP 도메인이 클러스터되어 존재한다는 것은 이전에는 보고된 바 없었음)를 코딩한다고 추정되는 도메인이 포함된다. 쉐바넬라에서 확인된 PUFA 합성의 PKS 경로는 해양 박테리아에 흔한 것으로 여겨진다. 쉐바넬라 유전자 클러스터와의 상동성이 높은 유 전자가 포토박테리아 프로펀덤(Photobacterium profundum) [Allen et al., Appli. Environ. Microbiol. 65:1710 (1999)] 및 모리텔라 마리나(Moritella marina) (비브리오 마리누스)에서 확인된 바 있다 (미국 특허 제6,140,486호 (동일 문헌) 및 문헌 [Tanaka et al., Biotechnol. Lett. 21:939 (1999)] 참조).
다중불포화 지방산 (PUFA)은 영양 제제, 제약 제제, 산업 및 기타 목적에 유용하다고 여겨진다. 현재로는 PUFA가 천연 공급원 및 화학적 합성으로 공급되지만, 상업적 요구에는 충분치 않다. 현재로는 PUFA의 주요 공급원이 해양 어류이지만, 어류 스톡(stock)은 감소하고 있고 이것이 지속적인 자원이 될 수는 없다. 추가로, 중금속과 독성 유기 분자 둘다로 인한 오염은 해양 어류에서 유래된 오일에서의 심각한 문제이다. 오일 종자 작물에서 유래된 식물성 오일은 비교적 저렴하고 어류 오일에서와 같은 오염 문제가 없다. 그러나, 상업적으로 개발된 식물 오일 중에 존재하는 PUFA는 전형적으로 리놀레산 (델타 9 및 12 위치에 2개의 이중 결합을 갖는 18개 탄소 - 18:2 델타 9,12) 및 리놀렌산 (18:3 델타 9,12,15)으로 한정된다. 통상의 PUFA 합성 경로에서, 중쇄-길이의 포화 지방산 (지방산 신타제 (FAS) 시스템의 생성물)은 일련의 신장 및 탈포화 반응에 의해 변형된다. 리놀레산 및 리놀렌산으로부터 지방산을 합성하여 더욱 포화되고 더욱 장쇄인 PUFA를 생산하기 위해서는 수많은 별개의 데새투라제 및 에롱가제 효소들이 요구되기 때문에, EPA 및 도코사헥사엔산 (DHA) 등과 같은 PUFA를 발현시키기 위해서 식물 숙주 세포를 유전자조작하는 데에는 합성 달성을 위한 여러 별개의 효소들의 발현이 요구된다. 추가로, 이러한 PUFA를 사용가능한 양으로 생산하기 위해서는, 예를 들어 기질에 대한 경쟁 효소를 하향 조절하기 위한 유전자 조작, 돌연변이유발법 등에 의해 더 높은 효소 활성을 보유하도록 하는 유전자조작 또는 색소체 세포소기관으로의 효소 표적화 등과 같은 추가의 유전자조작 노력이 요구될 수 있다. 따라서, 이들 지방산을 천연적으로 생산하고 단리된 물질을 단독으로 발현하거나 상업적 요구량의 PUFA가 생산되도록 조작될 수 있는 이종 시스템과 조합되어 발현하는 종으로부터 PUFA 생합성에 관여하는 유전 물질을 얻는 것에 관심이 있다.
상기 논의된 쉐바넬라 및 비브리오 마리누스 등과 같은 해양 박테리아 중 PUFA PKS 시스템의 발견 (미국 특허 제6,140,486호 (동일 문헌) 참조)은 상업적으로 PUFA를 생산하기 위한 새로운 방법의 자원을 제공하였다. 그러나, 현재까지 PUFA PKS 시스템을 함유하는 것으로 확인된 해양 박테리아에는 상업적 수준에서의 이들의 유용성을 궁극적으로 제한할 수 있는 한계가 있다. 특히, 미국 특허 제6,140,486호는 이들 해양 박테리아 PUFA PKS 시스템이 식물의 유전자 변형에 사용될 수 있다고 개시하고 있지만, 천연적으로 차가운 해양 환경 중에서 서식하고 성장하는 해양 박테리아 및 이들 박테리아의 효소 시스템은 22℃ 초과에서 제대로 기능하지 못하고, 훨씬 더 낮은 온도에서 최적으로 기능할 수 있다. 반대로, PUFA PKS 시스템을 이용한 유전자 조작에 있어서의 관심 표적인 많은 작물들은 정상적인 성장 조건 온도가 22℃ 초과 내지 40℃ 초과까지의 범위이다. 따라서, 이들 해양 박테리아로부터의 PUFA PKS 시스템이 정상적인 성장 조건하에서의 식물 발현에 쉽게 적용될 수 있다고 예측되지는 않는다.
연구가들은 특히 에이코사펜타엔산 (EPA)의 생산과 관련하여 미생물을 광합 성 및 종속영양 배양물 둘다에서 성장시킴으로써 이들 미생물을 이용하여 EPA를 생산하고자 하였다. 또한, 이들은 배양 조건하의 유기체 생산성을 높이고자 하는 시도에서 고전적인 유전적 접근법 및 지시된 유전적 접근법 둘다를 이용하였다. 다른 연구가들은 각종 데새투라제 및 에롱가제 효소를 코딩하는 유전자의 도입을 통해 오일-종자 작물에서 EPA를 생산하고자 시도하였다.
연구가들은 적색 미세조류 (모노두스(Monodus)), 규조류 (예컨대 패오닥틸룸(Phaeodactylum)), 다른 미세조류 및 진균 (예컨대 저온에서 배양되는 모르티에렐라(Mortierella))의 배양물을 이용하고자 하는 시도를 해왔다. 그러나, 모든 경우에서, DHA 등과 같은 다른 장쇄 PUFA를 위한 기존의 상업적 미생물 생성 시스템에 비하여 생산성이 낮았다. 많은 경우에서, EPA는 트리아실글리세롤 (TAG) 형태가 아닌 인지질 (PL) 형태로 주로 존재한다. 종속영양 성장 조건하에서의 미세조류의 생산성은 광영양 조건하에서보다 훨씬 더 높을 수 있기 때문에, 연구가들은 특정 당 수송자를 코딩하는 유전자의 도입을 이용하여 영양성의 전환을 시도하여 성공하였다. 그러나, 새로 획득된 종속영양 성능을 이용하더라도, 오일 생산성은 여전히 비교적 낮았다.
상기 논의된 바와 같이, 여러가지 해양 박테리아가 PUFA (EPA 및 DHA)를 생산하는 것으로 밝혀진 바 있다. 그러나, 이들 박테리아는 유의한 양의 TAG를 생산하지 못하며, EPA는 주로 PL 막 형태로 존재한다. 이들 특정 박테리아에 의한 EPA의 생산 수준 및 이들 박테리아의 성장 특성 (상기 논의됨)은 EPA의 상업적 생산에 있어서의 이들의 유용성을 제한한다.
내인성으로 생산된 지방산을 변형시켜서 오일-종자 작물에서 EPA를 생산하고자 하는 많은 노력이 있었다. 지방산 에롱가제 및 데새투라제에 대한 각종 개개의 유전자를 갖는 이들 식물의 유전자 변형으로, 유의한 수준의 EPA를 함유하지만 또한 유의한 수준의 더욱 단쇄이며 덜 불포화된 혼합된 PUFA도 함유하는 잎 또는 종자가 생산되었다 ([Qi et al., Nature Biotech. 22:739 (2004)], PCT 공개 제WO 04/071467호, [Abbadi et al., Plant Cell 16:1 (2004)]). 반대로, 본원에 기재한 바와 같은 공지된 EPA-생산 PUFA PKS 시스템은 본질적으로 순수한 EPA인 PUFA 프로파일을 만든다.
따라서, 당업계에는 상업적 용도에 보다 우수한 융통성을 갖는 다른 PUFA PKS 시스템 및 상업적으로 유용한 생산 공정에서 소정량의 원하는 PUFA, 예를 들어 EPA가 풍부한 지질 (예컨대, PL 및 TAG)을 효율적으로 생산하는 생물학적 시스템에 대한 요구가 있다.
발명의 요약
본 발명의 한 실시양태는 일반적으로 쉐바넬라 자포니카(Shewanella japonica) 또는 쉐바넬라 올레야나(Shewanella olleyana)의 PUFA PKS 단백질 및 도메인을 코딩하는 단리된 핵산 분자, 및 그의 생물학적 활성 상동체 및 단편에 관한 것이다. 한 측면에서, 본 발명은
(a) 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 아미노산 서열을 코딩하는 핵산 서열,
(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케 토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편을 코딩하는 핵산 서열,
(c) 서열 2 또는 서열 8과 약 65% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하며, KS 활성, MAT 활성, KR 활성, ACP 활성 및 비-FabA-유사 데히드라제 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,
(d) 서열 3 또는 서열 9와 약 60% 이상 동일하고, 더욱 바람직하게는 약 70% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하며, AT 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,
(e) 서열 4 또는 서열 10과 약 70% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하며, KS 활성, CLF 활성 및 DH 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,
(f) 서열 6 또는 서열 12와 약 60% 이상 동일하고, 더욱 바람직하게는 약 70% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하며, PPTase 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열, 및
(g) 서열 11과 약 85% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하거나 서열 5와 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하며, ER 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열
로부터 선택된 핵산 서열을 포함하는 단리된 핵산 분자를 포함한다.
한 측면에서, (b)에 기재한 상기 단편은
(a) 서열 2의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 2의 단편,
(b) 서열 2의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 2의 단편,
(c) 서열 2의 위치 약 1264 내지 위치 약 1889로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 2의 단편,
(d) 서열 2의 위치 약 2264 내지 위치 약 2398로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 2의 단편,
(e) 서열 2의 위치 약 2504 내지 위치 약 2516을 포함하며, 비-FabA-유사 데히드라제 생물학적 활성을 보유하는 서열 2의 단편,
(f) 서열 3의 위치 약 378 내지 위치 약 684로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 3의 단편,
(g) 서열 4의 위치 약 5 내지 위치 약 483으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 4의 단편,
(h) 서열 4의 위치 약 489 내지 위치 약 771로 이루어지며, CLF 생물학적 활성을 보유하는 도메인인 서열 4의 단편,
(i) 서열 4의 위치 약 1428 내지 위치 약 1570으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,
(j) 서열 4의 위치 약 1881 내지 위치 약 2019로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,
(k) 서열 5의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 5의 단편,
(l) 서열 6의 위치 약 40 내지 위치 약 186으로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 6의 단편,
(m) 서열 8의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 8의 단편,
(n) 서열 8의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 8의 단편,
(o) 서열 8의 위치 약 1275 내지 위치 약 1872로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 8의 단편,
(p) 서열 8의 위치 약 2240 내지 위치 약 2374로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 8의 단편,
(q) 서열 8의 위치 약 2480 내지 2492를 포함하며, 비-FabA-유사 데히드라제 활성을 보유하는 서열 8의 단편,
(r) 서열 9의 위치 약 366 내지 위치 약 703으로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 9의 단편,
(s) 서열 10의 위치 약 10 내지 위치 약 488로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 10의 단편,
(t) 서열 10의 위치 약 502 내지 위치 약 750으로 이루어지며, CLF 생물학적 활성을 보유하는 도메인인 서열 10의 단편,
(u) 서열 10의 위치 약 1431 내지 위치 약 1573으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,
(v) 서열 10의 위치 약 1882 내지 위치 약 2020으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,
(w) 서열 11의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 11의 단편, 및
(x) 서열 12의 위치 약 29 내지 위치 약 177로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 12의 단편
으로부터 선택된다.
또한, 본 발명에는 임의의 상기 핵산 분자에 완전히 상보적인 핵산 서열로 본질적으로 구성된 핵산 분자가 포함된다. 추가로, 본 발명의 한 측면은 1개 이상의 발현 제어 서열에 작동가능하게 연결된 임의의 상기 핵산 분자를 포함하는 재조합 핵산 분자에 관한 것이다. 본 발명의 또다른 측면은 이러한 임의의 재조합 핵산 분자로 형질감염된 재조합 세포에 관한 것이다.
본 발명의 또다른 실시양태는 임의의 상기 핵산 분자에 의해 코딩되는, 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 생물학적 활성 단백질 또는 그의 도메인을 포함하는, PKS 시스템을 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부에 관한 것이다. 한 측면에서, 상기 유전자 변형 식물 또는 상기 식물의 일부는 유전자 변형의 결과로서 DHA (도코사헥사엔산 (C22:6, ω-3)), ARA (에이코사테트라엔산 또는 아라키돈산 (C20:4, n-6)), DPA (도코사펜타엔산 (C22:5, ω-6 또는 ω-3)) 및/또는 EPA (에이코사펜타엔산 (C20:5, ω-3)으로 구성된 군에서 선택된 1종 이상의 다중불포화 지방산을 생산한다. 특히 바람직한 실시양태에서, 상기 식물 또는 상기 식물의 일부는 DHA, EPA, EPA와 DHA, ARA와 DHA, 또는 ARA와 EPA를 생산한다. 유전자 변형 식물은 작물 및 임의의 쌍떡잎 식물 또는 외떡잎 식물을 포함할 수 있다. 바람직한 식물로는 캐놀라, 대두, 평지씨, 아마씨, 옥수수, 잇꽃, 해바라기 및 담배 등이 있으나 이에 제한되지 않는다.
본 발명의 또다른 실시양태는 임의의 상기 단리된 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물에 관한 것이다. 한 측면에서, 상기 미생물은 유전자 변형의 결과로서 DHA (도코사헥사엔산 (C22:6, ω-3)), ARA (에이코 사테트라엔산 또는 아라키돈산 (C20:4, n-6)), DPA (도코사펜타엔산 (C22:5, ω-6 또는 ω-3)) 및/또는 EPA (에이코사펜타엔산 (C20:5, ω-3)으로 구성된 군에서 선택된 다중불포화 지방산을 생산한다. 특히 바람직한 실시양태에서, 상기 미생물은 유전자 변형의 결과로서 DHA, EPA, EPA와 DHA, ARA와 DHA, 또는 ARA와 EPA를 생산한다. 한 측면에서, 상기 미생물은 쉬조키트리움 및 트라우스토키트리움 등을 포함하지만 이에 제한되지 않는 트라우스토키트리드이다. 한 측면에서, 상기 미생물은 박테리아이다.
한 측면에서, 상기한 유전자 변형 식물 또는 미생물은
(a) 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 아미노산 서열, 및
(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편
으로부터 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 것이다. 한 측면에서, 상기 식물은 서열 2, 서열 3, 서열 4, 서열 5 및/또는 서열 6으로부터 선택된 1종 이상의 아미노산 서열을 코딩하 는 핵산 분자를 재조합 발현하도록 유전자 변형된 것이다. 또다른 측면에서, 상기 식물 또는 미생물은 서열 2, 서열 3, 서열 4, 서열 5 및 서열 6을 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 것이다. 또다른 측면에서, 상기 식물 또는 미생물은 서열 8, 서열 9, 서열 10, 서열 11 및/또는 서열 12로부터 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 것이다. 또다른 측면에서, 상기 식물 또는 미생물은 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12를 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 것이다. 또다른 측면에서, 상기 식물 또는 미생물은 임의의 상기 단편을 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 것이다.
본 발명의 유전자 변형 식물 또는 상기 식물의 일부 또는 미생물 실시양태의 한 측면에서, 상기 식물 또는 미생물은 쉬조키트리움 및 트라우스토키트리움 등을 포함하지만 이에 제한되지 않는 트라우스토키트리드의 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 생물학적 활성 단백질 또는 도메인을 발현하도록 추가로 유전자 변형된 것이다. 한 측면에서, 이러한 단백질 또는 도메인은 (a) 서열 14, 서열 16 및 서열 18, 및 (b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로부터 선택된 아미노산 서열을 포함한다. 또다른 측면에서, 상기 단백질 또는 도메인은 (a) 서열 20, 서열 22 및 서열 24, 및 (b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로부터 선택된 아미노산 서열을 포함한다.
유전자 변형된 미생물에 관한 본 발명의 실시양태의 한 측면에서, 상기 미생물은 내인성 PUFA PKS시스템을 포함한다. 이러한 측면에서, 상기 내인성 PUFA PKS 시스템은 내인성 PUFA PKS 시스템의 하나 이상의 도메인을 코딩하는 핵산 서열을 상이한 PKS 시스템의 하나 이상의 도메인을 코딩하는 또다른 단리된 핵산 분자로 치환하여 변형될 수 있다. 상이한 PKS 시스템으로는 비-박테리아 PUFA PKS 시스템, 박테리아 PUFA PKS 시스템, 제I형 모듈형 PKS 시스템, 제I형 반복형 PKS 시스템, 제II형 PKS 시스템 및 제III형 PKS 시스템 등이 있으나 이에 제한되지 않는다. 또다른 측면에서, 상기 내인성 PUFA PKS 시스템은 내인성 PUFA PKS 시스템의 하나 이상의 도메인을 코딩하는 핵산 서열을 본 발명의 임의의 상기 단리된 핵산 분자로 치환하여 유전자 변형된 것이다. 또다른 측면에서, 상기 미생물은 C20 단위의 합성을 지시하는 쇄 길이 인자 또는 쇄 길이 인자와 β-케토아실-ACP 신타제 (KS) 도메인을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 것이다. 또다른 측면에서, 상기 내인성 PUFA PKS 시스템은 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인을 코딩하는 도메인 및 β-케토아실-ACP 신타제 (KS)를 코딩하는 도메인으로 구성된 군에서 선택된 도메인(들)에서 변형된 것이고, 이때 상기 변형은 변형되지 않은 경우에 비하여 PUFA PKS 시스템에 의해 생산되는 장쇄 지방산의 비율을 변경한다. 이러한 변형은 내인성 PUFA PKS 시스템의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH)를 이성질체화 활성을 보유하지 않는 DH 도메인으로 치환하는 것을 포함할 수 있다. 이러한 변형은 또한 상기 도메인의 전부 또는 일부의 결실, 상이한 유기체 중 상기 도메인의 상동성 도메인에 의한 상기 도메인의 치환, 및 상기 도메인의 돌연변이를 포함할 수도 있다. 한 측면에서, 상기 내인성 PUFA PKS 시스템은 에노일-ACP 리덕타제 (ER) 도메인에서 변형된 것이고, 이때 상기 변형은 변형되지 않은 경우에 비하여 상이한 화합물을 생산한다. 이러한 측면에서, 상기 변형은 ER 도메인의 전부 또는 일부의 결실, 상이한 유기체로부터의 ER 도메인에 의한 상기 ER 도메인의 치환, 및 상기 ER 도메인의 돌연변이를 포함할 수 있다.
본 발명의 또다른 실시양태는 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산에 효과적인 조건하에 상기한 유전자 변형 식물을 성장시키는 것을 포함하는, 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산 방법에 관한 것이다.
본 발명의 또다른 실시양태는 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산에 효과적인 조건하에 상기한 유전자 변형 미생물을 배양하는 것을 포함하는, 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산 방법에 관한 것이다.
바로 앞에 기재한 2가지 실시양태 중 어느 하나에서, 한 측면에서는 상기 유전자 변형이 내인성 PKS 시스템에 의해 생산되는 1종 이상의 생성물을 야생형 유기체에 비해 변화시킨다. 또다른 측면에서, 상기 유기체는 유전자 변형이 없는 천연 발생 유기체와는 상이한 다중불포화 지방산 (PUFA) 프로파일을 생성한다. 한 측면에서, 상기 생물활성 분자는 소염 제제, 화학요법제, 활성 부형제, 골다공증 약물, 항-우울제, 항-경련제, 항-헬리오박터 파일로리(Heliobactor pylori) 약물, 신경변성 질환 치료용 약물, 퇴행성 간 질환의 치료용 약물, 항생제 및 콜레스테롤 저하 제제로부터 선택된다. 또다른 측면에서, 상기 생물활성 분자는 항생제이다. 또다른 측면에서, 상기 생물활성 분자는 다중불포화 지방산 (PUFA)이다. 또다른 측면에서, 상기 생물활성 분자는 시스 배위의 탄소-탄소 이중 결합을 포함하는 분자이다. 또다른 측면에서, 상기 생물활성 분자는 매 3번째 탄소마다 이중 결합을 포함하는 분자이다.
본 발명의 또다른 실시양태는 상기한 본 발명의 1종 이상의 재조합 핵산 분자를 포함하는 PKS 시스템을 발현하도록 식물 세포를 유전자 변형하는 것을 포함하는, 천연 발생 식물과는 상이한 다중불포화 지방산 (PUFA) 프로파일을 갖는 식물의 생성 방법에 관한 것이다.
본 발명의 또다른 실시양태는 상기한 본 발명의 1종 이상의 재조합 핵산 분자를 발현하도록 미생물 세포를 유전자 변형하는 것을 포함하는, 재조합 미생물의 생성 방법에 관한 것이다.
본 발명의 또다른 실시양태는 최종 생성물에 상기 기재한 바와 같은 본 발명의 1종 이상의 재조합 핵산 분자를 발현하는 재조합 숙주 세포에 의해 생산된 오일을 첨가하는 것을 포함하는, 최종 생성물이 1종 이상의 지방산을 함유하도록 최종 생성물을 변형하는 방법에 관한 것이다. 예를 들어 상기 최종 생성물로는 식이보조제, 식품, 제약 제제, 인간화된 동물 유즙(乳汁)(milk) 및 분유(infant formula) 등이 있으나 이에 제한되지 않는다.
본 발명의 또다른 실시양태는 상기 기재한 바와 같은 본 발명의 1종 이상의 재조합 핵산 분자를 사용하여 유즙-생산 동물의 유즙-생산 세포를 유전자 변형하는 것을 포함하는, 인간화된 동물 유즙의 생산 방법에 관한 것이다.
본 발명의 또다른 실시양태는 재조합 박테리아 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템을 발현하도록 변형되고, 이때 상기 PUFA PKS가 반복형 효소 반응과 비-반복형 효소 반응 모두를 촉매하고 상기 PUFA PKS 시스템이
(a) 1개 이상의 에노일 ACP-리덕타제 (ER) 도메인,
(b) 6개 이상의 아실 운반체 단백질 (ACP) 도메인,
(c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인,
(d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인,
(e) 1개 이상의 케토리덕타제 (KR) 도메인,
(f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,
(g) 1개 이상의 쇄 길이 인자 (CLF) 도메인,
(h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및
(i) 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인
을 포함하는 것인 재조합 숙주 세포에 관한 것이다. 상기 PUFA PKS 시스템은 약 25℃ 이상의 온도에서 PUFA를 생산한다. 한 측면에서, 상기 PUFA PKS 시스템은
(a) 1개의 에노일 ACP-리덕타제 (ER) 도메인,
(b) 6개의 아실 운반체 단백질 (ACP) 도메인,
(c) 2개의 β-케토아실-ACP 신타제 (KS) 도메인,
(d) 1개의 아실트랜스퍼라제 (AT) 도메인,
(e) 1개의 케토리덕타제 (KR) 도메인,
(f) 2개의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,
(g) 1개의 쇄 길이 인자 (CLF) 도메인,
(h) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및
(i) 1개의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인
을 포함한다. 한 측면에서, 상기 PUFA PKS 시스템은 쉐바넬라 자포니카 및 쉐바넬라 올레야나로 구성된 군에서 선택된 해양 박테리아의 PUFA PKS 시스템이다.
본 발명의 또다른 실시양태는 박테리아 다중불포화 지방산 (PUFA) 폴리케티 드 신타제 (PKS) 시스템의 1종 이상의 단백질 또는 도메인을 포함하며, 이때 상기 박테리아 PUFA PKS 시스템이 반복형 효소 반응과 비-반복형 효소 반응 모두를 촉매하고 약 25℃ 이상의 온도에서 PUFA를 생산하고
(a) 1개 이상의 에노일 ACP-리덕타제 (ER) 도메인,
(b) 6개 이상의 아실 운반체 단백질 (ACP) 도메인,
(c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인,
(d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인,
(e) 1개 이상의 케토리덕타제 (KR) 도메인,
(f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,
(g) 1개 이상의 쇄 길이 인자 (CLF) 도메인,
(h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및
(i) 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인
을 포함하는 것인 유전자 변형 유기체에 관한 것이다. 상기 유전자 변형은 PUFA PKS 시스템의 활성에 영향을 준다. 한 측면에서, 상기 유기체는 박테리아 PUFA PKS 시스템의 1종 이상의 단백질 또는 도메인을 재조합 발현하도록 변형된다. 또다른 측면에서, 상기 유기체는 박테리아 PUFA PKS 시스템을 재조합 발현하도록 변형된다. 상기 유기체는 식물 또는 미생물을 포함할 수 있다. 한 측면에서, 상기 박테리아 PUFA PKS 시스템은 쉐바넬라 자포니카 및 쉐바넬라 올레야나로 구성된 군에서 선택된 해양 박테리아의 PUFA PKS 시스템이다. 또다른 측면에서, 상기 유기체는 제2의 상이한 PKS 시스템의 1종 이상의 추가의 단백질 또는 도메인을 발현한 다.
본 발명의 또다른 실시양태는 박테리아 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 단백질 또는 기능적 도메인을 코딩하며, 이때 상기 박테리아 PUFA PKS 시스템이 반복형 효소 반응과 비-반복형 효소 반응 모두를 촉매하고 약 25℃ 이상의 온도에서 PUFA를 생산하고
(a) 1개 이상의 에노일 ACP-리덕타제 (ER) 도메인,
(b) 6개 이상의 아실 운반체 단백질 (ACP) 도메인,
(c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인,
(d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인,
(e) 1개 이상의 케토리덕타제 (KR) 도메인,
(f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,
(g) 1개 이상의 쇄 길이 인자 (CLF) 도메인,
(h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및
(i) 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인
을 포함하는 것인 단리된 재조합 핵산 분자에 관한 것이다.
도 1은 쉐바넬라 종 SCRC-2738, 쉐바넬라 자포니카, 및 쉐바넬라 올레야나 유래의 EPA 생산 클러스터의 오픈 리딩 프레임 (ORF) 구조를 예시하는 모식도이다.
도 2는 쉐바넬라 종 SCRC-2738, 쉐바넬라 자포니카 및 쉐바넬라 올레야나 유래의 EPA 생산 유전자 클러스터의 도메인 구조를 예시하는 모식도이다.
도 3A는 쉐바넬라 자포니카 (코스미드 3F3)의 pfaB ORF의 말단부와 pfaC ORF의 출발부 사이의 중복 (서열 1의 뉴클레오티드 21101 내지 21150을 나타냄, 상보적 가닥 포함) 및 이들의 상응하는 아미노산 번역 (pfaB: 서열 3의 위치 751 내지 759, pfaC: 서열 4의 위치 1 내지 9)을 보여주는 서열 정렬이다
도 3B는 쉐바넬라 올레야나 (코스미드 9A10)의 pfaB ORF의 말단부와 pfaC ORF의 출발부 (서열 7의 뉴클레오티드 27943 내지 28008을 나타냄, 상보적 가닥 포함) 사이의 중복 및 이들의 상응하는 아미노산 번역 (pfaB: 서열 9의 위치 735 내지 742, pfaC: 서열 10의 위치 1 내지 9)을 보여주는 서열 정렬이다.
도 4는 pfaE ORF의 N-말단의 말단부 (Sja_pfaE: 서열 6의 위치 1 내지 70, Sol_pfaE: 서열 12의 위치 1 내지 59) vs . 쉐바넬라 종 SCRC-2738 orf2의 표시된 출발부 (orf2_ATG: 서열 61) 및 쉐바넬라 종 SCRC-2738 orf2의 실험적 기능성 출발부 (WO 98/55625) (orf2_TTG: 서열 62)를 보여주는 서열 정렬이다.
본 발명은 일반적으로 EPA를 천연 생산하고 약 30℃ 이하의 온도와 더 높은 (예컨대, 35℃ 이하 또는 그 이상) 온도에서 잘 성장하는 해양 박테리아의 서브세트로부터의 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템, 상기 PUFA PKS 시스템을 포함하는 유전자 변형 유기체, 및 생물활성 분자, 특히 DHA, DPA 및 EPA와 같은 PUFA를 비롯한 관심 생산물의 생산을 위한 상기 시스템의 제조 및 사용 방법에 관한 것이다.
본원에서 사용된 바와 같은 PUFA PKS 시스템 (PUFA 신타제 시스템이라고 지칭될 수도 있음)은 일반적으로 (1) 시스템의 천연 생산물로서 PUFA를 생산하고, (2) 선택된 주기에서 지방산 쇄의 반복형 프로세싱, 및 트랜스-시스 이성질체화 및 에노일 환원 반응을 비롯한 비-반복형 프로세싱 둘다를 수행하는 복합체 내에 집합된 다수의 다기능적 단백질을 포함한다는 구별되는 특징을 갖는다. 언급되는 PUFA PKS 시스템은 유기체내에서 복합체로 작용하여 PUFA를 생산하는 유전자 및 그의 코딩 생산물 모두를 통칭하여 지칭한다. 따라서, PUFA PKS 시스템은 구체적으로 천연 생산물이 PUFA인 PKS 시스템을 지칭한다.
더욱 구체적으로, 첫째, 본 발명의 기초를 이루는 PUFA PKS 시스템은 생산물로서 다중불포화 지방산 (PUFA)을 생산한다 (즉, 이러한 PKS 시스템을 내인성으로 (천연적으로) 함유하는 유기체는 상기 시스템을 사용하여 PUFA를 제조함). 본원에서 지칭되는 PUFA는 바람직하게는 16개 이상의 탄소, 더욱 바람직하게는 18개 이상의 탄소, 더욱 바람직하게는 20개 이상의 탄소, 더욱 바람직하게는 22개 이상의 탄소의 탄소 쇄 길이, 및 모두 시스 배위인 3개 이상, 바람직하게는 4개 이상, 더욱 바람직하게는 5개 이상, 훨씬 더욱 바람직하게는 6개 이상의 이중 결합을 갖는 다중불포화 지방산이다. 본 발명의 목적은 유전자 조작 또는 최종 생산물의 조작을 통해 목적하는 쇄 길이 및 목적하는 수의 이중 결합을 가진 다중불포화 지방산을 생산하는 PKS 시스템을 발견 또는 제조하는 것이다. PUFA의 예로는 DHA (도코사헥사엔산 (C22:6, ω-3)), ARA (에이코사테트라엔산 또는 아라키돈산 (C20:4, n-6)), DPA (도코사펜타엔산 (C22:5, ω-6 또는 ω-3)) 및 EPA (에이코사펜타엔산 (C20:5, ω-3)) 등이 있으나 이에 제한되지 않는다.
둘째, 본원에 기재한 PUFA PKS 시스템은 일반적으로 상기 시스템과 선행 기재된 PKS 시스템 (예컨대, 제I형 모듈형 또는 반복형, 제II형 또는 제III형)을 구별짖는 반복적 반응 및 비-반복적 반응 둘다를 포함하고 있다. 더욱 특히, 본원에 기재한 PUFA PKS 시스템은 매 주기 동안에 기능한다고 여겨지는 도메인뿐만 아니라 단지 일부 주기 동안에 기능한다고 여겨지는 도메인을 함유한다. 이러한 기능성의 주요 측면은 박테리아 Fab-A 효소에 대한 상동성을 나타내는 도메인과 연관이 있을 수 있다. 예를 들어, 이. 콜라이의 Fab-A 효소는 2종의 효소 활성을 보유하는 것으로 알려져 있다. 이 효소는 히드록시기를 함유하는 탄소 쇄로부터 물 분자 (H2O)가 제거되어 상기 탄소 쇄에 트랜스 이중 결합이 생기게 되는 탈수 활성을 갖고 있다. 또한, 이는 트랜스 이중 결합이 시스 배위로 전환되는 이소머라제 활성을 보유한다. 이러한 이성질체화는 인접한 탄소로의 이중 결합 위치의 이동과 함께 달성된다. PKS (및 FAS) 시스템에서, 탄소 주쇄는 탄소 2개씩의 증가분으로 연장된다. 따라서, 이들 PKS 시스템의 PUFA 생산물을 생산하는데 요구되는 연장 반응의 수를 예측할 수 있다. 예를 들어, DHA (C22:6, 모두 시스)를 생산하기 위해서는 10회의 연장 반응이 요구된다. 최종 생산물에는 단지 6개의 이중 결합이 있기 때문에, 이는 일부 반응 주기 동안에는 이중 결합이 (시스 이성질체로서) 유지되고, 다른 주기에서는 이중 결합이 다음 연장 전에 환원된다는 것을 의미한다.
해양 박테리아의 PUFA PKS 시스템의 발견 (미국 특허 제6,140,486호 참조) 이전에는, PKS 시스템이 반복적 및 선택적 효소 반응의 조합을 보유하는 것으로 알려지지 않았고, 시스 배위의 탄소-탄소 이중 결합을 생산할 수 있는 것으로 여겨지지도 않았다. 그러나, 본 발명에 의해 기재된 PUFA PKS 시스템은 시스 이중 결합의 도입 능력 및 주기 중 반응 순서의 변경 능력을 갖는다.
본원 발명의 발명자들은 PUFA PKS 시스템의 이러한 특징을 선행 기재된 (제I형 반복형 또는 모듈형, 제II형 또는 제III형) PKS 시스템에 의해 생산될 수 없는 범위의 생물활성 분자를 생산하는데 사용할 것을 제안한다. 이들 생물활성 분자로는 대다수가 하기에서 논의되어질 다중불포화 지방산 (PUFA), 항생제 또는 다른 생물활성 화합물 등이 있으나 이에 제한되지 않는다. 예를 들어, 본원에 기재한 PUFA PKS 유전자 구조의 지식을 사용한 임의의 수많은 방법이, PUFA PKS 유전자를 변경하거나 또는 이들 유전자의 일부를 다른 PKS 시스템을 비롯한 다른 합성 시스템과 조합하는데 사용되어 신규 생산물을 생산할 수 있다. 반복적 반응 및 선택적 반응이 둘다 일어나는 이들 특정 유형 시스템의 고유 능력으로 인해, 상기 시스템은 유사한 방법이 다른 유형의 PKS 시스템에 적용되는 경우에 발견되지 않는 생산물을 수득할 수 있다.
미국 특허 출원 제10/810,352호 (상기 문헌)에서, 본건의 발명자들은 PUFA를 전형적으로 생산하고 훨씬 더 낮은 온도에서 성장하는 다른 종 및 쉐바넬라 내의 균주를 비롯한 해양 박테리아를 함유하는 선행 기재된 PUFA PKS와는 대조적으로, PUFA (예컨대, EPA)를 생산하고 약 30℃ 이하의 온도에서 성장할 수 있는 놀라운 특징을 가지기 때문에 PUFA PKS 유전자의 공급원으로 사용하기에 특히 적합한 2종의 예시적 해양 박테리아 (예컨대 쉐바넬라 올레야나 및 쉐바넬라 자포니카)를 동정하였다. 발명자들은 드디어 쉐바넬라 올레야나 (오스트레일리안 콜렉션 오브 앤타르크틱 마이크로오르가니즘스(Australian Collection of Antarctic Microorganisms, ACAM) 균주 번호 644, 문헌 [Skerratt et al., Int. J. Syst. Evol. Microbiol 52, 2101 (2002)]) 및 쉐바넬라 자포니카 (아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection, ATCC) 균주 번호 BAA-316, 문헌 [Ivanova et al., Int. J. Syst. Evol. Microbiol. 51, 1027 (2001)]) 각각의 모든 PUFA PKS 오픈 리딩 프레임 (Orf)의 전장 게놈 서열을 클로닝하고 서열결정하였으며, 이들 특정 해양 박테리아의 PUFA PKS 시스템을 포함하는 도메인을 동정하였다. 따라서, 본 발명은 상업적 용도에 융통성을 갖는 추가의 PUFA PKS 시스템의 제공에 관한 상기 문제를 해결한다.
본원 발명의 발명자들이, 트라우스토키트리알레스 목(目)의 구성원, 예컨대 쉬조키트리움 및 트라우스토키트리움을 비롯한 진핵생물에서 PUFA를 생산하는 폴리케티드 신타제-유사 시스템의 조작에 의해, 하나 이상의 다양한 형태 (예컨대, 트리아실글리세롤 (TAG) 및 인지질 (PL))의 PUFA가 풍부한 지질을 효율적으로 생산하는 유전자 변형 미생물 및 생산 방법을 개발함으로써, 본 발명의 PUFA PKS 시스템은 또한 목적하는 PUFA, 예컨대 EPA가 풍부한 상업적으로 유용한 지질의 생산에 관련한 상기 문제를 해결하는 전략의 한 수단으로서 사용될 수 있다. 구체적인 예로써, 본원 발명의 발명자들은 종래 PUFA, 주로 도코사헥사엔산 (DHA, C22:6 n-3) 및 도코사펜타엔산 (DPA, C22:5 n-6)이 풍부한 오일의 상업적 생산용으로 최적화되었고, 이제 유기체의 오일 생산능 특징은 없애지 않으면서 DHA 생산이 EPA (C20:5 n-3) 생산 (또는 다른 PUFA 생산)으로 대체되도록 유전자 변형되어질 쉬조키트리움의 균주를 본원에 기재하고 있다. 본 발명의 한 실시양태에 기재한 해양 박테리아로부터의 해양 박테리아 PUFA PKS 유전자를 사용하여 이러한 유전자 변형 미생물을 생산할 수 있다. 본 발명의 개념은 하기 상세하게 기재된 다른 생산 유기체 및 다른 목적하는 PUFA에 쉽게 적용될 수 있기 때문에, 이것은 본 발명에 포함되는 기술의 단지 한 예이다.
본원에서 사용된 바와 같은 용어 "지질"은 인지질, 유리 지방산, 지방산의 에스테르, 트리아실글리세롤, 디아실글리세리드, 포스파티드, 스테롤 및 스테롤 에스테르, 카로테노이드, 크산토필 (예컨대, 옥시카로테노이드), 탄화수소, 및 당업자에게 공지된 다른 지질을 포함한다. 용어 "다중불포화 지방산" 및 "PUFA"는 유리 지방산 형태뿐만 아니라 동등한 다른 형태, 예컨대 TAG 형태 및 PL 형태를 포함한다.
한 실시양태에서, 본 발명에 따른 PUFA PKS 시스템은 적어도 (a) 1개 이상의 에노일-ACP 리덕타제 (ER) 도메인, (b) 6개 이상의 아실 운반체 단백질 (ACP) 도메인, (c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인, (d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인, (e) 1개 이상의 β-케토아실-ACP 리덕타제 (KR) 도메인, (f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인, (g) 1개 이상의 쇄 길이 인자 (CLF) 도메인, 및 (h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인을 포함한다. PUFA PKS 시스템은 또한 PUFA PKS 시스템의 한 부분이거나 또는 PUFA PKS 시스템에 보조적인 도메인 또는 단백질인 것으로 간주될 수 있는 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인을 포함한다. 한 실시양태에서, 본 발명에 따른 PUFA PKS 시스템은 또한 데히드라타제 (DH) 보존된 활성 부위 모티프를 함유하는 1개 이상의 영역을 포함한다. 이들 도메인 및 모티프의 기능은 일반적으로 당업계에 개별적으로 공지되어 있으며, 본 발명의 PUFA PKS 시스템과 관련하여 하기에 상세하게 기재될 것이다. 본 발명의 도메인은 단일 단백질로서 (즉, 도메인 및 단백질은 동일함), 또는 단일 단백질내 2개 이상의 (다중) 도메인 중 하나로서 발견될 수 있다. 상기 쉐바넬라 종의 PUFA PKS 시스템의 도메인 구조는 하기에 보다 상세하게 기재되며, 도 2에 예시되어 있다.
또다른 실시양태에서, PUFA PKS 시스템은 적어도 (a) 1개 이상의 에노일-ACP 리덕타제 (ER) 도메인, (b) 다중 아실 운반체 단백질 (ACP) 도메인(들) (적어도 1개 내지 4개, 바람직하게는 5개 이상, 더욱 바람직하게는 6개 이상, 훨씬 더욱 바람직하게는 7개, 8개, 9개, 또는 9개 이상), (c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인, (d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인, (e) 1개 이상의 β-케토아실-ACP 리덕타제 (KR) 도메인, (f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인, (g) 1개 이상의 쇄 길이 인자 (CLF) 도메인, (h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및 (i) 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인을 포함한다. 한 실시양태에서, 본 발명에 따른 PUFA PKS 시스템은 또한 데히드라타제 (DH) 보존된 활성 부위 모티프를 함유하는 1개 이상의 영역을 포함한다.
본 발명에 따라, β-케토아실-ACP 신타제 (KS) 생물학적 활성 (기능)을 보유하는 도메인 또는 단백질은 FAS (및 PKS) 신장 반응 주기의 개시 단계를 수행하는 효소로서 특성화된다. 용어 "β-케토아실-ACP 신타제"는 용어 "3-케토아실-ACP 신타제", "β-케토아실-ACP 신타제" 및 "케토-아실 ACP 신타제", 및 유사한 파생어와 구별없이 사용될 수 있다. 신장되도록 정해진 아실기는 티오에스테르 결합에 의해 효소의 활성 부위의 시스테인 잔기에 연결된다. 다중-단계 반응에서, 아실-효소는 말로닐-ACP와의 축합을 진행시켜 -케토아실-ACP, CO2 및 유리 효소를 형성한다. KS는 신장 주기에서 중요한 역할을 하고, 많은 시스템에서 반응 주기의 다른 효소들보다 더 큰 기질 특이성을 보유하는 것으로 제시되어 있다. 예를 들어, 이. 콜라이는 유기체의 생리학에서 각각 그만의 특정한 역할을 하는 3개의 별개의 KS 효소를 가지고 있다 (문헌 [Magnuson et al., Microbiol. Rev. 57, 522 (1993)] 참조). 본원에 기재한 PUFA-PKS 시스템의 2개의 KS 도메인은 연속적인 PUFA 생합성 반응에서 별개의 역할을 할 수 있다.
KS는 효소의 한 부류로서 익히 특성화되어 있다. 많은 입증된 KS 유전자의 서열이 공지되어 있고, 활성 부위 모티프가 확인되었으며, 다수의 결정 구조가 결정되었다. 공지된 KS 서열과의 상동성에 의해 단백질 (또는 단백질의 도메인)이 KS 족의 효소에 속하는지 쉽게 확인될 수 있다.
본 발명에 따라, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 생물학적 활성 (기능)을 보유하는 도메인 또는 단백질은 말로닐-CoA의 말로닐 부분을 ACP에 전달하는 것으로서 특성화된다. 용어 "말로닐-CoA:ACP 아실트랜스퍼라제"는 "말로닐 아실트랜스퍼라제" 및 유사한 파생어와 구별없이 사용될 수 있다. 상기 효소는 활성 부위 모티프 (GxSxG) 이외에, 이들을 MAT 효소로서 규명하는 연장된 모티프 (주요 위치에서의 R 및 Q 아미노산)를 보유한다 (하기에서 논의되는 AT 도메인과 대조적). 일부 PKS 시스템 (PUFA PKS 도메인은 제외)에서, MAT 도메인은 메틸- 또는 에틸-말로네이트를 (상응하는 CoA 에스테르로부터의) ACP 기 상에 우선적으로 로딩(loading)하고, 이에 의해 선형 탄소 쇄 내에 측쇄가 도입될 것이다. MAT 도메인은 공지된 MAT 서열과의 상동성 및 연장된 모티프 구조로써 알 수 있다.
본 발명에 따라, 아실 운반체 단백질 (ACP) 생물학적 활성 (기능)을 보유하는 도메인 또는 단백질은 단백질의 공유 결합된 보조인자에 티오에스테르 결합을 통해 성장되는 지방 아실 쇄의 운반체로서 기능하는 소 폴리펩티드 (전형적으로, 80 내지 100개 아미노산의 길이)인 것으로서 특성화된다. 이들 폴리펩티드는 개별적 단위로서, 또는 더 큰 단백질 내의 도메인으로서 존재한다. ACP는 CoA의 포스포판테테이닐 부분이 ACP의 고도로 보존된 세린 잔기로 전달됨으로써 불활성 아포-형태로부터 관능적 홀로-형태로 전환된다. 아실기는 포스포판테테이닐 부분의 유리 말단에서 티오에스테르 결합에 의해 ACP에 부착된다. ACP는 방사성 판테테인에 의한 표지화 및 공지된 ACP와의 서열 상동성에 의해 확인될 수 있다. 활성 부위 모티프의 변이의 존재 (LGIDS*, 예컨대 서열 2의 아미노산 1296 내지 1300 참조)는 또한 ACP의 표시이다.
본 발명에 따라, β-케토아실-ACP 리덕타제 (KR) 활성을 보유하는 도메인 또는 단백질은 3-케토아실 형태 ACP의 피리딘-뉴클레오티드-의존적 환원을 촉매하는 것으로서 특성화된다. 용어 "β-케토아실-ACP 리덕타제"는 용어 "케토리덕타제", "3-케토아실-ACP 리덕타제", "케토-아실 ACP 리덕타제", 및 상기 용어의 유사한 파생어와 구별없이 사용될 수 있다. 이는 데 노보(de novo) 지방산 생합성 신장 주기에서의 제1 환원 단계이며 폴리케티드 생합성에서 종종 수행되는 반응이다. 에노일-ACP 리덕타제 (ER) 중의 일족, FAS의 다른 리덕타제 족 (PUFA PKS 시스템 중에 존재하는 ER 족 제외), 및 단쇄 알콜 데히드로게나제 족과는 상당한 서열 유사성이 관찰된다. 이 PUFA PKS 영역의 Pfam 분석은 코어 영역에서 단쇄 알콜 데히드로게나제 족과의 상동성을 보여줄 수 있다. 상기 영역의 블라스트(Blast) 분석은 코어 영역에서 공지된 KR 효소에 대한 매치(match), 및 다른 특성화된 PUFA PKS 시스템으로부터의 도메인과 상동성을 갖는 연장된 영역을 보여줄 수 있다.
본 발명에 따라, 소정의 도메인 또는 단백질은 하기의 이론적 근거에 기초하여 쇄 길이 인자 (CLF)라고 지칭된다. CLF는 원래는 제II형 (해리된 효소) PKS 시스템의 특성으로서 기재되어 있으며, 최종 생산물의 신장 주기의 수 및 이에 따른 쇄 길이를 결정하는데 있어 역할을 한다고 가정되었다. CLF 아미노산 서열은 KS 도메인과의 상동성을 보여주지만 (KS 단백질과 이종이합체를 형성하는 것으로 생각되어짐), 활성 부위 시스테인이 없다. PKS 시스템에서 CLF의 역할은 논란의 소지가 있다. 증거 (문헌 [C. Bisang et al., Nature 401, 502 (1999)])는 (신장될 초기 아실기를 제공함으로써) PKS 시스템의 프라이밍(priming)에서의 역할을 시사한다. 이러한 역할에서, CLF 도메인은 (말로닐-ACP로서의) 말로네이트를 탈카르복실화하여 KS 활성 부위로 전달될 수 있는 아세테이트 기를 형성하는 것으로 생각되어진다. 따라서, 이러한 아세테이트는 초기 신장 (축합) 반응을 일으킬 수 있는 '프라이밍' 분자로서 작용한다. 제II형 CLF의 상동체는 일부 제I형 모듈형 PKS 시스템에서 '로딩' 도메인으로서 확인되었다. 그러나, 다른 최근의 증거는 쇄 길이를 결정하는데 있어 CLF 도메인의 진정한 역할을 시사한다 (문헌 [Yi et al., J. Am. Chem. Soc. 125:12708 (2003)] 참조). CLF의 서열 특징을 갖는 도메인이 모든 최근 확인된 PUFA PKS 시스템에서 발견되었고, 각각의 경우에 다중도메인 단백질의 부분으로서 발견되었다.
언급되는 "아실트랜스퍼라제" 또는 "AT"는 수많은 별개의 아실 전달 반응을 수행할 수 있는 일군의 효소를 지칭한다. 용어 "아실트랜스퍼라제"는 용어 "아실 트랜스퍼라제"와 구별없이 사용될 수 있다. 쉬조키트리움 도메인은 현재 검사된 다른 PUFA PKS 시스템 모두에 존재하는 도메인과의 양호한 상동성, 및 특정 기능이 확인된 일부 아실트랜스퍼라제 (예컨대 말로닐-CoA:ACP 아실트랜스퍼라제, MAT)와의 매우 약한 상동성을 보여준다. MAT와의 약한 상동성에도 불구하고, AT 도메인은 상기 효소의 연장된 모티프 구조 특성을 보유하지 않기 때문에 MAT로서 기능하는 것으로 간주되지 않는다 (상기 MAT 도메인 설명부분 참조). 이 개시내용의 목적을 위해, PUFA PKS 시스템의 AT 도메인의 기능으로는 지방 아실기를 OrfA ACP 도메인(들)로부터 물로 전달 (즉 지방 아실기를 유리 지방산으로서 방출하는 티오에스테라제), 지방 아실기를 CoA와 같은 수용자에게로 전달, 아실기를 다양한 ACP 도메인 중으로 전달, 또는 지방 아실기를 친지성 수용자 분자 (예컨대, 리소포스파드산)에게로 전달 등이 있으나 이에 제한되지 않는다.
본 발명에 따라, 에노일-ACP 리덕타제 (ER) 생물학적 활성을 보유하는 단백질 또는 도메인은 지방 아실-ACP에서의 (DH 활성에 의해 도입된) 트랜스-이중 결합을 환원시켜 상기 탄소를 완전히 포화시킨다. PUFA-PKS의 ER 도메인은 새롭게 특성화된 ER 효소 족 (문헌 [Heath et al., Nature 406, 145 (2000)] 참조)과의 상동성을 보여준다. 본 발명에 따라, 용어 "에노일-ACP 리덕타제"는 "에노일 리덕타제", "에노일 ACP-리덕타제" 및 "에노일 아실-ACP 리덕타제"와 구별없이 사용될 수 있다. 헤쓰(Heath) 및 록(Rock)은 스트렙토코커스 뉴모니애(Streptococcus pneumoniae)로부터 관심 유전자를 클로닝하고, 상기 유전자로부터 발현된 단백질을 정제하고, 이것이 시험관내 검정에서 ER 활성을 보유한다는 것을 입증함으로써, 상기 신규 부류의 ER 효소를 확인하였다. 본원에 기재한 박테리아 PUFA PKS 시스템은 1개의 ER 도메인을 함유한다.
본 발명에 따라, 데히드라제 또는 데히드라타제 (DH) 활성을 보유하는 단백질 또는 도메인은 탈수 반응을 촉매한다. 본원에서 일반적으로 사용되는 DH 활성에 대한 언급은 전형적으로 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 생물학적 활성을 지칭한다. FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 생물학적 활성은 β-케토아실-ACP로부터 HOH를 제거하여, 먼저 탄소 쇄에 트랜스 이중 결합을 만든다. 용어 "FabA-유사 β-히드록시아실-ACP 데히드라제"는 용어 "FabA-유사 β-히드록시아실-ACP 데히드라제", "β-히드록시아실-ACP 데히드라제", "데히드라제" 및 유사한 파생어와 구별없이 사용될 수 있다. PUFA PKS 시스템의 DH 도메인은 (다른 PKS 시스템의 DH 도메인보다) 자신의 FAS 시스템과 연관된 박테리아 DH 효소와 상동성을 보인다. 박테리아 DH의 서브세트인 FabA-유사 DH는 시스-트랜스 이소머라제 활성을 보유한다 (문헌 [Heath et al., J. Biol. Chem., 271, 27795 (1996)] 참조). FabA-유사 DH 단백질과의 상동성은 본원에 기재한 DH 도메인 중의 1개 또는 모두로 인해 PUFA PKS 생산물에 시스 이중 결합이 삽입된다는 것을 나타낸다.
본 발명의 단백질은 또한 일반적으로 본원에서 비-FabA-유사 DH 활성, 또는 비-FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 생물학적 활성이라고 지칭되는, FabA-유사 (예컨대, 상기 기재된 시스-트랜스 활성은 FabA-유사 활성과 연관이 있음)로서 특성화되지 않은 데히드라타제 활성을 보유할 수 있다. 더욱 구체적으로, 보존된 활성 부위 모티프 (대략 13개 아미노산의 길이: L*xxHxxxGxxxxP, 서열 2의 아미노산 2504 내지 2516, 모티프 L*은 I일 수도 있음)는 PKS 시스템의 데히드라타제 도메인에서 발견된다 (문헌 [Donadio S, Katz L. Gene. 1992 Feb 1;111(1):51-60] 참조). 본원에서 데히드라타제 (DH) 보존된 활성 부위 모티프 또는 DH 모티프라고도 지칭되는 상기 보존된 모티프가 현재까지 개시되어 있는 모든 공지된 PUFA-PKS 서열의 유사 영역 및 본원에 기재한 PUFA PKS 서열 (예컨대, 서열 2의 아미노산 2504 내지 2516, 또는 서열 8의 아미노산 2480 내지 2492)에서 발견되지만, 그의 모티프는 본 발명 이전에는 탐지되지 않은 것이다. 상기 보존된 모티프는 PUFA-PKS 서열 중에 고도의 상동성을 갖는 비-특성화된 영역 내에 있다. PUFA-PKS를 통한 PUFA의 제안된 생합성은 비-FabA 유사 탈수를 필요로 하고, 상기 모티프로 인해 반응이 일어날 것이다.
본 발명에 따라, 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 생물학적 활성 (기능)을 보유하는 도메인 또는 단백질은 4'-포스포판테테이닐 부분을 코엔자임(Coenzyme) A로부터 아실 운반체 단백질 (ACP)로 전달하는 효소로서 특성화된다. ACP의 불변의 세린 잔기로의 이러한 전달은 불활성 아포-형태를 홀로-형태로 활성화시킨다. 폴리케티드 및 지방산 합성 둘다에서, 포스포판테테인기는 성장하는 아실 쇄와 티오에스테르를 형성한다. PPTase는 지방산 합성, 폴리케티드 합성 및 비-리보솜 펩티드 합성에서 익히 특성화된 효소의 일족이다. 많은 PPTase의 서열이 공지되어 있고, 결정 구조가 결정되었으며 (예컨대, 문헌 [Reuter K, Mofid MR, Marahiel MA, Ficner R. "Crystal structure of the surfactin synthetase-activating enzyme sfp: a prototype of the 4'-phosphopantetheinyl transferase superfamily" EMBO J. 1999 Dec 1;18(23):6823-31] 참조), 활성에 중요한 아미노산 잔기의 돌연변이 분석을 행하였다 (문헌 [Mofid MR, Finking R, Essen LO, Marahiel MA. "Structure-based mutational analysis of the 4'-phosphopantetheinyl transferases Sfp from Bacillus subtilis: carrier protein recognition and reaction mechanism" Biochemistry. 2004 Apr 13;43(14):4128-36] 참조). PPTase에서의 이들 불변의 고도로 보존된 아미노산은 본원에 기재한 모든 쉐바넬라 균주로부터의 pfaE ORF 내에 함유된다. 추가로, 쉐바넬라 종 SCRC-2738 orf2의 pfaE ORF 상동체는 천연 균주에서의 활성 (문헌 [Yazawa K. "Production of eicosapentaenoic acid from marine bacteria". Lipids. 1996 Mar;31 Suppl:S297-300]), 및 이의 PPTase 활성을 확인하는 표지화 실험 (WO 98/55625)에 요구되는 것으로 제시되어 있다.
PUFA를 생산하고 약 25 내지 3O℃ 이하의 온도 및 더 높은 (예컨대, 35℃) 온도에서 잘 성장하는 특정 해양 박테리아 (예컨대, 쉐바넬라 올레야나 및 쉐바넬라 자포니카)의 PUFA PKS 시스템이 본 발명의 기본이지만, 본 발명은 예를 들어 미국 특허 제6,140,486호, 미국 특허 제6,566,583호, 미국 특허 출원 제10/124,800호 및 미국 특허 출원 제10/810,352호에 기재되어 있는 다른 박테리아 및 비-박테리아 PUFA PKS 시스템으로부터의 도메인과 관련한 상기 박테리아 PUFA PKS 시스템으로부터의 도메인의 용도를 고려한다. 더욱 특히, 본 발명의 PUFA PKS 시스템은 유전자 변형 미생물 및 식물에 의한 생물학적 생산물의 개선 및/또는 변형된 생산을 위해, 다른 PUFA PKS 시스템과 함께 사용되어 하이브리드 구조물 및 유전자 변형 미생물 및 식물을 생산할 수 있다. 예를 들어, 본 발명에 따라, 비-박테리아 PUFA PKS 기능적 도메인과 박테리아 PUFA PKS 기능적 도메인 (바람직하게는 본 발명의 것)뿐만 아니라 다른 PKS 시스템 (제I형, 제II형, 제III형) 또는 FAS 시스템으로부터의 PKS 기능적 도메인 또는 단백질을 포함하는 유전자 변형 유기체를 생산할 수 있다.
본원에서 언급되는 "비-박테리아 PUFA PKS" 시스템은 박테리아가 아닌 유기체로부터 단리된 PUFA PKS 시스템에 대한 언급이거나, 또는 박테리아가 아닌 유기체, 예컨대 진핵생물 또는 아르캐박테리아(archaebacterium)로부터의 PUFA PKS 시스템의 상동체, 또는 이로부터 유래된 상동체이다. 진핵생물은 더 고도로 분화된 세포를 가지고, 원핵생물은 덜 분화된 세포를 가진다는 세포의 분화 정도를 기초로 하여 진핵생물이 원핵생물과 구별된다. 일반적으로, 원핵생물은 핵막이 없고, 세포 분열 동안 유사분열이 나타나지 않고, 오직 하나의 염색체를 가지고, 이의 세포질이 70S 리보솜을 함유하고, 어떤 미토콘드리아, 세포질세망, 엽록체, 용해소체 또는 골지(Golgi) 장치도 보유하지 않으며, 이의 편모 (존재하는 경우)는 단일 원섬유로 구성되어 있다. 반대로, 진핵생물은 핵막이 있고, 세포 분열 동안 유사분열이 나타나고, 많은 염색체를 가지고, 이의 세포질이 80S 리보솜을 함유하고, 미토콘드리아, 세포질세망, 엽록체 (조류에서), 용해소체 및 골지 장치를 보유하며, 이의 편모 (존재하는 경우)는 많은 원섬유로 구성되어 있다. 일반적으로, 박테리아는 원핵생물이지만, 조류, 진균, 원생생물, 원충 및 고등 식물은 진핵생물이다.
비-박테리아 PUFA PKS 시스템은 상기 특허 및 특허 출원에 기재되어 있는 것을 포함하고, 특히 임의의 트라우스토키트리드로부터 단리되거나 유래된 임의의 PUFA PKS 시스템을 포함한다. 미국 특허 제6,566,583호에서, 쉐바넬라 종 균주 SCRC2738 PKS 유전자와의 상동성을 보여주는 쉬조키트리움으로부터 다수 cDNA 클론이 서열결정되었고, 다양한 클론이 2개의 부분적 오픈 리딩 프레임 및 1개의 완전한 오픈 리딩 프레임을 나타내는 핵산 서열로 조립되었다. 본원 발명의 발명자들에 의한 cDNA 및 게놈 클론의 추가의 서열결정으로 쉬조키트리움의 OrfA, OrfB 및 OrfC 각각의 전장 게놈 서열이 확인되었고, 쉐바넬라에서의 도메인과 상동성을 갖는 쉬조키트리움의 도메인이 완전히 확인되었다. 이들 유전자는 미국 특허 출원 제10/124,800호 (상기 문헌)에 상세하게 기재되어 있고, 하기에 약간 상세하게 기재되어 있다. 유사하게, 미국 특허 출원 제10/810,352호에 트라우스토키트리움 (구체적으로, 트라우스토키트리움 종 23B (ATCC 20892))의 PUFA PKS 시스템을 코딩하는 유전자의 전장 게놈 서열, 및 트라우스토키트리움의 PUFA PKS 시스템을 포함하는 도메인이 상세하게 기재되어 있다.
본 발명에 따라, 어구 "오픈 리딩 프레임"은 약어 "Orf"로 표기된다. 오픈 리딩 프레임에 의해 코딩되는 단백질은 모두 대문자로 "ORF"로서 표기될 수도 있고, 오픈 리딩 프레임의 핵산 서열은 모두 소문자로 "orf"로서 표기될 수도 있지만, 일관성을 위해 핵산 서열 또는 그에 의해 코딩되는 단백질을 기재하기 위해 본원에서는 "Orf"라는 철자가 우선적으로 사용됨을 염두에 두어야 한다. 언급되는 것이 단백질인지 핵산 서열인지의 여부는 용어 사용의 맥락으로부터 명백할 것이다.
도 1은 쉐바넬라 종 SCRC-2738 ("야자와(Yazawa)" 균주, 문헌 [Yazawa K. "Production of eicosapentaenoic acid from marine bacteria" Lipids. 1996 Mar;31 Suppl:S297-300])로부터의 PUFA PKS ("EPA 생산"이라고도 지칭됨) 클러스터 vs. 쉐바넬라 자포니카 (코스미드 3F3) 및 쉐바넬라 올레야나 (코스미드 9A10)로부터의 본 발명의 유전자 클러스터의 구조를 보여준다. 도 2는 쉐바넬라 종 SCRC-2738 ("야자와" 균주)로부터의 PUFA PKS 유전자 클러스터의 도메인 구조 vs. 쉐바넬라 자포니카 (코스미드 3F3) 및 쉐바넬라 올레야나 (코스미드 9A10)로부터의 유전자 클러스터에 의해 코딩된 것을 보여준다. 각각의 오픈 리딩 프레임의 도메인 구조는 하기에 기재되어 있다.
쉐바넬라
자포니카
PUFA
PKS
서열 1은 쉐바넬라 자포니카 코스미드 3F3에 대한 뉴클레오티드 서열이고, 표 1에 개시된 바와 같은 15개의 ORF를 함유하는 것으로 밝혀졌다 (실시예 2 참조). 상기 미생물의 PUFA PKS 시스템에 관한 ORF는 하기와 같이 특성화된다.
pfaA (서열 1의 뉴클레오티드 10491 내지 18854)는 β-케토아실-신타제 (KS) 도메인 (서열 1의 뉴클레오티드 10575 내지 12029, 서열 2의 아미노산 29 내지 513), 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인 (서열 1의 뉴클레오티드 12366 내지 13319, 서열 2의 아미노산 625 내지 943), 6개의 일렬식(tandem) 아실-운반체 단백질 (ACP) 도메인 (서열 1의 뉴클레오티드 14280 내지 16157, 서열 2의 아미노산 1264 내지 1889), β-케토아실-ACP 리덕타제 (KR) 도메인 (서열 1의 뉴클레오티드 17280 내지 17684, 서열 2의 아미노산 2264 내지 2398), 및 본원에서 DH-모티프 영역이라고 지칭되는 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 2의 아미노산 2504 내지 2516)를 함유하는 서열 2의 아미노산 2399 및 2787 사이의 PFAS A 단백질 영역을 보유하는 PUFA PKS 단백질인 PFAS A (서열 2)를 코딩한다.
PFAS A에서, C*가 아실 부착 부위인 KS 활성 부위 DXAC*는 서열 2의 아미노산 226 내지 229에 위치한다. S*가 아실 결합 부위인 MAT 활성 부위 GHS*XG는 서열 2의 아미노산 721 내지 725에 위치한다. S*가 포스포판테테인 부착 부위인 ACP 활성 부위 LGXDS*는 서열 2의 아미노산 1296 내지 1300, 아미노산 1402 내지 1406, 아미노산 1513 내지 1517, 아미노산 1614 내지 1618, 아미노산 1728 내지 1732, 및 아미노산 1843 내지 1847에 위치한다. 서열 2의 아미노산 2399와 2787 사이에, PFAS A는 또한 상기 언급된 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 2의 아미노산 2504 내지 2516)를 함유한다.
pfaB (서열 1의 뉴클레오티드 18851 내지 21130)는 아실트랜스퍼라제 (AT) 도메인 (서열 1의 뉴클레오티드 19982 내지 20902, 서열 3의 아미노산 378 내지 684)을 보유하는 PUFA PKS 단백질인 PFAS B (서열 3)를 코딩한다.
PFAS B에서, S*가 아실-부착 부위인 활성 부위 GXS*XG 모티프는 서열 3의 아미노산 463 내지 467에 위치한다.
pfaC (서열 1의 뉴클레오티드 21127 내지 27186)는 KS 도메인 (서열 1의 뉴클레오티드 21139 내지 22575, 서열 4의 아미노산 5 내지 483), 쇄 길이 인자 (CLF) 도메인 (서열 1의 뉴클레오티드 22591 내지 23439, 서열 4의 아미노산 489 내지 771), 및 DH1 (서열 1의 뉴클레오티드 25408 내지 25836, 서열 4의 아미노산 1428 내지 1570) 및 DH2 (서열 1의 뉴클레오티드 26767 내지 27183, 서열 4의 아미노산 1881 내지 2019)라고 지칭되는 2개의 FabA 3-히드록시아실-ACP 데히드라타제 도메인을 보유하는 PUFA PKS 단백질인 PFAS C (서열 4)를 코딩한다.
PFAS C에서, C*가 아실 부착 부위인 KS 활성 부위 DXAC*는 서열 4의 아미노산 211 내지 214에 위치한다.
pfaD (서열 1의 뉴클레오티드 27197 내지 28825)는 에노일 리덕타제 (ER) 도메인 (서열 1의 뉴클레오티드 27446 내지 28687, 서열 5의 아미노산 84 내지 497)을 보유하는 PUFA PKS 단백질인 PFAS D (서열 5)를 코딩한다.
pfaE (역방향 상보적 가닥 상의 서열 1의 뉴클레오티드 6150 내지 7061)는 동정된 도메인 (서열 1의 뉴클레오티드 6504 내지 6944, 서열 6의 아미노산 40 내지 186)을 갖는 4'-포스포판테테이닐 트랜스퍼라제 (PPTase)인 PFAS E (서열 6)를 코딩한다.
쉐바넬라
올레야나
PUFA
PKS
서열 7은 쉐바넬라 올레야나 코스미드 9A10에 대한 뉴클레오티드 서열이고, 표 2에 개시된 바와 같이 17개의 ORF를 함유하는 것으로 밝혀졌다 (실시예 2 참조). 상기 미생물의 PUFA PKS 시스템에 관한 ORF는 하기와 같이 특성화된다.
pfaA (서열 7의 뉴클레오티드 17437 내지 25743)는 β-케토아실-신타제 (KS) 도메인 (서열 7의 뉴클레오티드 17521 내지 18975, 서열 8의 아미노산 29 내지 513), 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인 (서열 7의 뉴클레오티드 19309 내지 20265, 서열 8의 아미노산 625 내지 943), 6개의 일렬식 아실-운반체 단백질 (ACP) 도메인 (서열 7의 뉴클레오티드 21259 내지 23052, 서열 8의 아미노산 1275 내지 1872), β-케토아실-ACP 리덕타제 (KR) 도메인 (서열 7의 뉴클레오티드 24154 내지 24558, 서열 8의 아미노산 2240 내지 2374), 및 본원에서 DH-모티프 영역이라고 지칭되는 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 8의 아미노산 2480 내지 2492)를 함유하는 서열 8의 아미노산 2241과 2768 사이에 PFAS A 단백질 영역을 보유하는 PUFA PKS 단백질인 PFAS A (서열 8)를 코딩한다.
PFAS A에서, C*가 아실 부착 부위인 KS 활성 부위 DXAC*는 서열 8의 아미노산 226 내지 229에 위치한다. S*가 아실 결합 부위인 MAT 활성 부위 GHS*XG는 서열 8의 아미노산 721 내지 725에 위치한다. S*가 포스포판테테인 부착 부위인 ACP 활성 부위 LGXDS*는 서열 8의 아미노산 1307 내지 1311, 아미노산 1408 내지 1412, 아미노산 1509 내지 1513, 아미노산 1617 내지 1621, 아미노산 1721 내지 1725, 및 아미노산 1826 내지 1830에 위치한다. 서열 8의 아미노산 2241과 2768 사이에 PFAS A는 또한 상기 언급된 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 8의 아미노산 2480 내지 2492)를 함유한다.
pfaB (서열 7의 뉴클레오티드 25740 내지 27971)는 아실트랜스퍼라제 (AT) 도메인 (서열 7의 뉴클레오티드 26837 내지 27848, 서열 9의 아미노산 366 내지 703)을 보유하는 PUFA PKS 단백질인 PFAS B (서열 9)를 코딩한다.
PFAS B에서, S*가 아실-부착 부위인 활성 부위 GXS*XG 모티프는 서열 9의 아미노산 451 내지 455에 위치한다.
pfaC (서열 7의 뉴클레오티드 27968 내지 34030)는 KS 도메인 (서열 7의 뉴클레오티드 27995 내지 29431, 서열 10의 아미노산 10 내지 488), 쇄 길이 인자 (CLF) 도메인 (서열 7의 뉴클레오티드 29471 내지 30217, 서열 10의 아미노산 502 내지 750), 및 DH1 (서열 7의 뉴클레오티드 32258 내지 32686, 서열 10의 아미노산 1431 내지 1573) 및 DH2 (서열 7의 뉴클레오티드 33611 내지 34027, 서열 10의 아미노산 1882 내지 2020)라고 지칭되는 2개의 FabA 3-히드록시아실-ACP 데히드라타제 도메인을 보유하는 PUFA PKS 단백질인 PFAS C (서열 10)를 코딩한다.
PFAS C에서, C*가 아실 부착 부위인 KS 활성 부위 DXAC*는 서열 10의 아미노산 216 내지 219에 위치한다.
pfaD (서열 7의 뉴클레오티드 34041 내지 35669)는 에노일 리덕타제 (ER) 도메인 (서열 7의 뉴클레오티드 34290 내지 35531, 서열 11의 아미노산 84 내지 497)을 보유하는 PUFA PKS 단백질인 PFAS D (서열 11)를 코딩한다.
pfaE (역방향 상보적 가닥 상의 서열 7의 뉴클레오티드 13027 내지 13899)는 동정된 도메인 (서열 7의 뉴클레오티드 13369 내지 13815, 서열 12의 아미노산 29 내지 177)을 갖는 4'-포스포판테테이닐 트랜스퍼라제 (PPTase)인 PFAS E (서열 12)를 코딩한다.
상기 기재된 쉐바넬라 균주로부터의 pfaC ORF 및 쉐바넬라 올레야나로부터의 pfaE ORF 둘다 이들의 출발 코돈으로서 TTG를 갖는 것으로 예측된다. TTG가 ATG 및 GTG보다 박테리아에서 덜 통상적인 출발 코돈이기 때문에, 이는 이. 콜라이 유전자의 1.1% 및 바실러스 섭틸리스 유전자의 11.2%에 대해 출발 코돈인 것으로 예측된다 (문헌 [Hannenhalli SS, Hayes WS, Hatzigeorgiou AG, Fickett JW. "Bacterial start site prediction". Nucleic Acids Res. 1999 Sep 1;27(17):3577-82] 참조). 이들 ORF가 TTG 코돈에서 출발한다는 여러 일련의 증거가 있다. 첫째, 모든 컴퓨터 유전자 검색 툴 (이지젠(EasyGene) 및 젠마크(GeneMark).hmm)는 이들 3개의 ORF에 대한 TTG 출발 코돈을 예측한다. 둘째, 이들 3개의 ORF 중 TTG 출발부로부터의 번역은 진뱅크(GenBank) 데이타베이스의 상동성 유전자와 동일 및 유사한 단백질 잔기의 공간적 배치 및 범위를 보존한다. 이들 유전자의 TTG 출발 코돈에 대한 또다른 일련의 증거는 예측된 리보솜 결합 부위 (RBS)이다. RBS는 출발 코돈의 대략 7 내지 12개의 상류 뉴클레오티드이고, 통상적으로 퓨린이 풍부하다. 표 5 (실시예 2 참조)는 모든 pfa ORF의 상류 영역 및 가능한 RBS를 보여준다. 모든 pfaC ORF는 TTG 출발 코돈의 표준적 RBS 상류에 대한 매우 고도의 상동성을 나타낸다. TTG 출발 코돈을 갖는 이들 3개의 ORF에 대한 대안적인 출발 코돈 및 RBS가 또한 표 5에 제시되어 있다. 또한 본원에 기재한 쉐바넬라 균주로부터의 pfaE ORF가 쉐바넬라 종 SCRC-2738 (진뱅크 관리 번호 U73935)로부터의 EPA 생합성 클러스터로부터의 orf2에 대해 상동적이라는 것을 염두에 두어야 한다. 표시된 ATG로부터의 쉐바넬라 종 SCRC-2738 orf2의 발현은 이종 발현 시스템에서의 EPA 생산을 지지하지 않는 것으로 제시되어 있다 (PCT 공개 제WO 98/55625호 참조). 별도의 상류 출발 코돈 TTG가 발현에 사용되는 경우에 EPA 생산이 이종 발현 시스템에서 관찰되었다. 본원에 기재한 두 개의 pfaE ORF에 대한 출발 코돈은 쉐바넬라 종 SCRC-2738의 orf2로부터의 별도의 TTG 출발 코돈으로부터 코딩되는 것과 유사 및 동일한 아미노산을 코딩한다 (도 4). 이 역시 쉐바넬라 올레야나로부터의 pfaE ORF에 대한 TTG 출발을 지지한다. 최종적으로, 두 쉐바넬라 균주로부터의 pfaC ORF 출발 코돈은 pfaB 정지 코돈과 중복된다 (도 3). ORF의 중복은 박테리아 오페론의 공통적 특징이며, 전사 수준에서 2개 이상의 유전자를 커플링시키는 하나의 수단인 것으로 생각되어진다.
본 발명의 한 실시양태는 본원에 기재한 박테리아 PUFA PKS 시스템으로부터 단리된 단백질 또는 도메인, 그의 상동체, 및/또는 그의 단편에 관한 것이다. 또한, 본원에 기재한 임의의 단백질, 도메인 또는 펩티드를 코딩하는 단리된 핵산 분자 (하기에서 상세하게 논의됨)가 본 발명에 포함된다. 본 발명에 따라, 단리된 단백질 또는 펩티드, 예컨대 PUFA PKS 시스템으로부터의 단백질 또는 펩티드는 그의 천연 환경으로부터 제거된 (즉, 인간 조작을 가한) 그의 단백질 또는 단편 (폴리펩티드 또는 펩티드를 포함)이며, 예를 들어 정제된 단백질, 부분적으로 정제된 단백질, 재조합으로 생산된 단백질, 및 합성적으로 생산된 단백질을 포함할 수 있다. 따라서, "단리된"은 단백질이 정제된 정도를 반영하지 않는다. 바람직하게는, 본 발명의 단리된 단백질은 재조합으로 생산된다. 단리된 펩티드는 합성적으로 (예컨대, 펩티드 합성과 같은 화학적으로) 또는 재조합으로 생산될 수 있다. 또한, 예로써 "쉐바넬라 자포니카 PUFA PKS 단백질"은 쉐바넬라 자포니카 미생물로부터의 PUFA PKS 단백질 (일반적으로 천연 발생 PUFA PKS 단백질의 상동체를 포함), 또는 쉐바넬라 자포니카로부터의 천연 발생 PUFA PKS 단백질의 구조 (예컨대, 서열) 및 혹은 기능에 대한 지식으로부터 다른 방법으로 생산된 PUFA PKS 단백질을 지칭한다. 바꿔 말하면, 일반적으로 언급되는 쉐바넬라 자포니카 PUFA PKS 단백질은 쉐바넬라 자포니카로부터의 천연 발생 PUFA PKS 단백질과 실질적으로 유사한 구조 및 기능을 가지거나, 또는 본원에 상세하게 기재된 바와 같은 쉐바넬라 자포니카로부터의 천연 발생 PUFA PKS 단백질의 생물학적으로 활성인 (즉, 생물학적 활성을 보유하는) 상동체인 임의의 PUFA PKS 단백질을 포함한다. 따라서, 쉐바넬라 자포니카 PUFA PKS 단백질은 정제된 단백질, 부분적으로 정제된 단백질, 재조합 단백질, 돌연변이/변형된 단백질 및 합성 단백질을 포함할 수 있다. 동일한 설명이 본원에 기재한 다른 단백질 또는 펩티드, 예컨대 쉐바넬라 올레야나로부터의 PUFA PKS 단백질 및 도메인에 대해 적용된다.
본 발명에 따라, 용어 "변형" 및 "돌연변이"는 특히 본원에 기재한 단백질 또는 펩티드의 제1 아미노산 서열 (또는 핵산 서열)의 변형/돌연변이에 대해 구별없이 사용될 수 있다. 용어 "변형"은 또한 메틸화, 파르네실화, 카르복시메틸화, 게라닐 게라닐화, 글리코실화, 인산화, 아세틸화, 미리스토일화, 프레닐화, 팔미트화 및/또는 아미드화 등이 있으나 이에 제한되지 않는, 단백질 또는 펩티드에서의 번역후 변형을 기재하기 위해 사용될 수 있다. 변형은 또한 예를 들어, 단백질 또는 펩티드의 또다른 화합물과의 착화를 포함할 수 있다. 이러한 변형은 예를 들어, 변형이 천연 야생형 단백질 또는 펩티드에서 발생하는 번역후 변형과 다른 경우에 돌연변이인 것으로 간주될 수 있다.
본원에서 사용된 바와 같은 용어 "상동체"는 천연 발생 단백질 또는 펩티드에서의 1회 이상의 소 변형 또는 돌연변이에 의해 천연 발생 단백질 또는 펩티드 (즉, "원형" 또는 "야생형" 단백질)와는 다르지만, 천연 발생 형태의 전반적인 기본 단백질 및 측쇄 구조를 유지하는 (즉, 상동체가 야생형 단백질과 관련되는 것임을 식별할 수 있도록) 단백질 또는 펩티드를 지칭하는데 사용된다. 이러한 변화로는 하나 이상의 아미노산 측쇄의 변화, 결실 (예컨대, 단백질 또는 펩티드의 말단절단형(truncated) 버전), 삽입 및/또는 치환을 비롯한 하나 이상의 아미노산의 변화, 하나 이상의 원자의 입체화학 변화, 및/또는 메틸화, 파르네실화, 게라닐 게라닐화, 글리코실화, 카르복시메틸화, 인산화, 아세틸화, 미리스토일화, 프레닐화, 팔미트화 및/또는 아미드화 등이 있으나 이에 제한되지 않는 부차적인 유도체화 등이 있으나 이에 제한되지 않는다. 상동체는 천연 발생 단백질 또는 펩티드와 비교하여 증진 또는 감소되거나, 또는 실질적으로 유사한 특성을 가질 수 있다. PUFA PKS 단백질 또는 도메인의 바람직한 상동체는 하기에 상세하게 기재되어 있다. 상동체는 합성적으로 생산된 상동체, 주어진 단백질 또는 도메인의 천연 발생 대립유전자 변이체, 또는 기준 서열이 유래된 유기체 이외의 유기체로부터의 상동성 서열을 포함할 수 있음을 염두에 두어야 한다.
보존적 치환은 전형적으로 글리신 및 알라닌, 발린, 이소루이신 및 루이신, 아스파르트산, 글루탐산, 아스파라긴 및 글루타민, 세린 및 트레오닌, 리신 및 아르기닌, 및 페닐알라닌 및 티로신 기 내에서의 치환을 포함한다. 치환은 또한 보존된 소수성 또는 친수성 (문헌 [Kyte and Doolittle, J. Mol. Biol. 157:105 (1982)])에 근거하거나, 또는 유사한 폴리펩티드 2차 구조의 추정 능력 (문헌 [Chou and Fasman, Adv. Enzymol. 47: 45 (1978)])에 근거하여 이루어질 수 있다.
상동체는 천연 대립유전자 변이 또는 천연 돌연변이의 결과일 수 있다. 단백질을 코딩하는 핵산의 천연 발생 대립유전자 변이체는 상기 단백질을 코딩하는 유전자와 본질적으로 동일한 게놈의 유전자좌 (또는 유전자좌들)에서 발생하는 유전자이지만, 예를 들어 돌연변이 또는 재조합에 의해 유발되는 천연 변이로 인해 유사하지만 동일하지는 않은 서열을 가진다. 대립유전자 변이체는 전형적으로 비교대상 유전자에 의해 코딩되는 단백질의 활성과 유사한 활성을 보유하는 단백질을 코딩한다. 대립유전자 변이체의 한 부류는 동일한 단백질을 코딩할 수 있지만, 유전자 코드의 동의성(degeneracy)으로 인해 상이한 핵산 서열을 갖는다. 대립유전자 변이체는 또한 유전자의 5' 또는 3' 비-번역 영역 (예컨대, 조절성 제어 영역)에서의 변경을 포함할 수 있다. 대립유전자 변이체는 당업자에게 익히 공지되어 있다.
상동체는 예를 들어, 무작위 또는 표적화된 돌연변이유발을 수행하기 위해 전형적 또는 재조합 DNA 기술을 사용한 단리된 천연 발생 단백질에 대한 직접 변형, 직접 단백질 합성, 또는 단백질을 코딩하는 핵산 서열에 대한 변형 등이 있으나 이에 제한되지 않는, 단백질의 생산에 대한 당업계에 공지된 기술을 사용하여 생산될 수 있다.
야생형 단백질과 비교한 단백질 상동체에서의 변형 또는 돌연변이는 천연 발생 (야생형) 단백질과 비교하여 상동체의 기본적인 생물학적 활성을 증가, 또는 감소시키거나, 또는 실질적으로 변화시키지 않는다. 일반적으로, 단백질의 생물학적 활성 또는 생물학적 작용은 생체내 (즉, 단백질의 천연 생리적 환경 내) 또는 시험관내 (즉, 실험실 조건 하에) 측정 또는 관찰된 바와 같은, 단백질의 천연 발생 형태라고 일컬어지는 단백질에 의해 제시 또는 수행되는 임의의 기능(들)을 지칭한다. PUFA PKS 시스템, 및 PUFA PKS 시스템을 구성하는 각각의 단백질/도메인의 생물학적 활성은 본원의 다른 곳에 상세하게 기재되어 있다. 단백질, 예컨대 상동체에서의 변형은 천연 발생 단백질과 동일한 생물학적 활성을 보유하는 단백질, 또는 천연 발생 단백질과 비교하여 감소 또는 증가된 생물학적 활성을 보유하는 단백질을 야기할 수 있다. 단백질 발현의 감소 또는 단백질 활성의 감소를 야기하는 변형은 단백질의 불활성화 (완전 또는 부분), 하향 조절, 또는 감소된 작용 (또는 활성)이라고 지칭될 수 있다. 유사하게, 단백질 발현의 증가 또는 단백질 활성의 증가를 야기하는 변형은 단백질의 증폭, 과다생산, 활성화, 증대, 상향 조절, 또는 증가된 작용 (또는 활성)이라고 지칭될 수 있다. 일반적으로 언급되는 야생형 단백질의 생물학적 활성을 보유하는 상동체는 상동체가 특히 생물학적 활성의 수준에 대해 야생형 단백질과 동일한 생물학적 활성을 보유한다는 것을 반드시 의미하는 것이 아니라는 사실을 염두에 두어야 한다. 오히려, 상동체는 야생형 단백질과 동일한 생물학적 활성보다는 야생형 단백질과 비교하여 감소 또는 증가된 수준의 활성에서 수행할 수 있다. PUFA PKS 시스템의 기능적 도메인은 생물학적 기능을 수행할 수 있는 (즉, 생물학적 활성을 보유하는) 도메인이다 (즉, 도메인은 단백질의 일부가 될 수 있음).
PUFA PKS 단백질 또는 도메인 생물학적 활성을 탐지 및 측정하는 방법으로는 PUFA PKS 단백질 또는 도메인의 전사의 측정, PUFA PKS 단백질 또는 도메인의 번역의 측정, PUFA PKS 단백질 또는 도메인의 번역후 변형의 측정, PUFA PKS 단백질 또는 도메인의 효소 활성의 측정, 및/또는 PUFA PKS 시스템의 1종 이상의 생산물의 생산 (예컨대, PUFA 생산) 측정 등이 있으나 이에 제한되지 않는다. 본 발명의 단리된 단백질 (상동체 포함)이 반드시 야생형 단백질의 생물학적 활성을 보유할 필요가 없다는 것을 염두에 두어야 한다. 예를 들어, PUFA PKS 단백질 또는 도메인은 예를 들어 말단절단형, 돌연변이형 또는 불활성 단백질일 수 있다. 이러한 단백질은 예를 들어 스크리닝 분석에 유용하거나, 또는 항체 생성과 같은 다른 목적에 유용하다. 바람직한 실시양태에서, 본 발명의 단리된 단백질은 (상기 논의된 바와 같이, 반드시 동등하지는 않지만) 야생형 단백질의 활성과 유사한 생물학적 활성을 보유한다.
단백질 발현 수준의 측정 방법으로는 일반적으로 웨스턴(Western) 블럿팅, 면역블럿팅, 효소-결합 면역흡착 검정법 (ELISA), 방사면역검정법 (RIA), 면역침강법, 표면 플라즈몬 공명법, 화학발광법, 형광 편광법, 인광법, 면역조직화학 분석법, 매트릭스-보조 레이저 탈착/이온화 비행시간형 (MALDI-TOF) 질량 분광법, 미세유세포분석법, 미세배열법, 현미경검사법, 형광 활성화 세포 분류법 (FACS) 및 유세포분석법뿐만 아니라, 효소 활성 또는 다른 단백질 파트너와의 상호작용이 있으나 이에 제한되지 않는 단백질의 특성에 근거한 검정법 등이 있으나 이에 제한되지 않는다. 결합 분석은 또한 당업계에 익히 공지되어 있다. 예를 들어, 비아코어(BIAcore) 기기를 사용하여 2종의 단백질 사이의 복합체 결합 상수를 측정할 수 있다. 복합체에 대한 해리 상수는 완충제가 칩 위를 통과할 때의 시간에 대한 굴절률의 변화를 모니터링함으로써 측정될 수 있다 (문헌 ([O'Shannessy et al. Anal. Biochem. 212:457 (1993)] 및 [Schuster et al., Nature 365:343 (1993)]) 참조). 한 단백질의 또다른 단백질에의 결합을 측정하는 다른 적합한 검정은 예를 들어, 효소-결합 면역흡착 검정법 (ELISA) 및 방사면역검정법 (RIA)과 같은 면역검정법, 또는 형광, UV 흡수, 원편광 2색성 또는 핵자기공명 (NMR)을 통해 단백질의 분광학적 또는 광학적 특성의 변화를 모니터링함으로써 결합을 측정하는 것을 포함한다.
한 실시양태에서, 본 발명은 서열 2 내지 서열 6 또는 서열 8 내지 서열 12 중 어느 하나, 또는 그의 생물학적 활성 도메인 또는 단편으로부터 선택되는 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 단리된 단백질에 관한 것이다. 서열 2 내지 서열 6 및 서열 8 내지 서열 12로 나타내어지는 PUFA PKS 단백질 내에 함유되는 도메인은 상기에 상세하게 기재되어 있다. 또다른 실시양태에서, 본 발명은 서열 2 내지 서열 6 및 서열 8 내지 서열 12 중 어느 하나로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 이러한 상동체는 서열 2 내지 서열 6 또는 서열 8 내지 서열 12 중 어느 하나와 약 60% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되고, 서열 2 내지 서열 6 또는 서열 8 내지 서열 12로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유한다. 추가의 실시양태에서, 본 발명은 서열 2 내지 서열 6 또는 서열 8 내지 서열 12 중 어느 하나로부터의 도메인의 생물학적 활성을 보유하며, 서열 2 내지 서열 6 또는 서열 8 내지 서열 12 중 하나로부터의 도메인와 약 60% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 2 내지 서열 6 또는 서열 8 내지 서열 12 중 하나로 나타내어지는 PUFA PKS 단백질의 도메인의 상동체에 관한 것이다. 추가의 다른 실시양태에서, 상기 상동체는 서열 2 내지 서열 6 또는 서열 8 내지 서열 12 중 어느 하나, 또는 이들 서열 내에 함유된 도메인와 약 65% 이상 동일하고, 더욱 바람직하게는 약 70% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다. 상기와 같이, 상동체는 바람직하게는 자신이 유래된 또는 관련된 단백질 또는 도메인 (즉, 기준 아미노산 서열을 갖는 단백질 또는 도메인)의 생물학적 활성을 보유한다.
본 발명의 한 실시양태는 서열 2로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 2 또는 본원에 상술된 바와 같은 서열 2 내의 생물학적 활성 도메인와 약 65% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 2로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 2 또는 그의 도메인과 약 70% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 65% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 3으로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 3 또는 본원에 상술된 바와 같은 서열 3 내의 생물학적 활성 도메인와 약 60% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 3으로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 3 또는 그의 도메인와 약 65% 이상 동일하고, 더욱 바람직하게는 약 70% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 4로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 4 또는 본원에 상술된 바와 같은 서열 4 내의 생물학적 활성 도메인과 약 70% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 4로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 4 또는 그의 도메인과 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 5로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 5 또는 본원에 상술된 바와 같은 서열 5 내의 생물학적 활성 도메인과 약 95% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 5로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 5 또는 그의 도메인과 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% 이상 동일하다.
본 발명의 또다른 실시양태는 서열 6으로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 6 또는 본원에 상술된 바와 같은 서열 6 내의 생물학적 활성 도메인와 약 60% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 6으로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 6 또는 그의 도메인와 약 65% 이상 동일하고, 더욱 바람직하게는 약 70% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 8로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 8 또는 본원에 상술된 바와 같은 서열 8 내의 생물학적 활성 도메인와 약 65% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 8로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 8 또는 그의 도메인과 약 70% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 9로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 9 또는 본원에 상술된 바와 같은 서열 9 내의 생물학적 활성 도메인와 약 60% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 9로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 9 또는 그의 도메인와 약 65% 이상 동일하고, 더욱 바람직하게는 약 70% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 10으로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 10 또는 본원에 상술된 바와 같은 서열 10 내의 생물학적 활성 도메인과 약 70% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 10으로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 10 또는 그의 도메인과 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 11로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 11 또는 본원에 상술된 바와 같은 서열 11 내의 생물학적 활성 도메인과 약 85% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 11로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 11 또는 그의 도메인과 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 또다른 실시양태는 서열 12로 나타내어지는 상응하는 단백질 내에 함유된 하나 이상의 도메인의 생물학적 활성을 보유하며, 서열 12 또는 본원에 상술된 바와 같은 서열 12 내의 생물학적 활성 도메인와 약 60% 이상 동일한 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성되는 서열 12로 나타내어지는 단백질의 단리된 상동체에 관한 것이다. 추가의 실시양태에서, 상동체는 서열 12 또는 그의 도메인와 약 65% 이상 동일하고, 더욱 바람직하게는 약 70% 이상 동일하고, 더욱 바람직하게는 약 75% 이상 동일하고, 더욱 바람직하게는 약 80% 이상 동일하고, 더욱 바람직하게는 약 85% 이상 동일하고, 더욱 바람직하게는 약 90% 이상 동일하고, 더욱 바람직하게는 약 95% 이상 동일하고, 더욱 바람직하게는 약 96% 이상 동일하고, 더욱 바람직하게는 약 97% 이상 동일하고, 더욱 바람직하게는 약 98% 이상 동일하고, 더욱 바람직하게는 약 99% (또는 60% 내지 99% 사이에서 1%씩의 증가분을 갖는 임의의 비율(%)) 이상 동일하다.
본 발명의 한 측면에서, 본원에 기재한 특정 PUFA PKS 단백질 또는 도메인의 상동체를 비롯하여 본 발명에 포함되는 PUFA PKS 단백질 또는 도메인은, 본원에 기재한 바와 같은 하나 이상의 도메인 또는 단백질의 생물학적 활성을 보유하며 서열 2 내지 서열 6 또는 서열 8 내지 서열 12 중 어느 하나로부터 선택되는 아미노산 서열의 약 100개 이상의 연속적인 아미노산을 포함하는 아미노산 서열을 포함한다. 추가의 측면에서, 단백질의 아미노산 서열은 임의의 서열 2 내지 서열 6 또는 서열 8 내지 서열 12의 약 200개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 300개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 400개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 500개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 600개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 700개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 800개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 900개 이상의 연속적인 아미노산, 더욱 바람직하게는 약 1000개 이상의 연속적인 아미노산을 포함한다.
본 발명의 바람직한 실시양태에서, 본 발명의 단리된 단백질 또는 도메인은 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11, 서열 12, 또는 그의 임의의 생물학적 활성 단편 또는 도메인으로부터 선택되는 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성된다.
한 실시양태에서, 본원에 기재한 상기 언급된 바와 같은 PUFA PKS 시스템의 생물학적 활성 도메인은 1) 서열 2의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인, 2) 서열 2의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인, 3) 서열 2의 위치 약 1264 내지 위치 약 1889로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인, 4) 서열 2의 위치 약 2264 내지 위치 약 2398로 이루어지며, KR 생물학적 활성을 보유하는 도메인, 5) 서열 2의 위치 약 2504 내지 위치 약 2516을 포함하는 서열이며, DH 생물학적 활성, 바람직하게는 비-FabA-유사 DH 활성을 보유하는 도메인, 6) 서열 3의 위치 약 378 내지 위치 약 684로 이루어지며, AT 생물학적 활성을 보유하는 도메인, 7) 서열 4의 위치 약 5 내지 위치 약 483으로 이루어지며, KS 생물학적 활성을 보유하는 도메인, 8) 서열 4의 위치 약 489 내지 위치 약 771로 이루어지며, CLF 생물학적 활성을 보유하는 도메인, 9) 서열 4의 위치 약 1428 내지 위치 약 1570으로 이루어지며, DH 생물학적 활성, 바람직하게는 FabA-유사 DH 활성을 보유하는 도메인, 10) 서열 4의 위치 약 1881 내지 위치 약 2019로 이루어지며, DH 생물학적 활성, 바람직하게는 FabA-유사 DH 활성을 보유하는 도메인, 11) 서열 5의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인, 12) 서열 6의 위치 약 40 내지 위치 약 186으로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인, 13) 서열 8의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인, 14) 서열 8의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인, 15) 서열 8의 위치 약 1275 내지 위치 약 1872로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인, 16) 서열 8의 위치 약 2240 내지 위치 약 2374로 이루어지며, KR 생물학적 활성을 보유하는 도메인, 17) 서열 8의 위치 약 2480 내지 위치 약 2492를 포함하며, DH 생물학적 활성, 바람직하게는 비-FabA-유사 DH 활성을 보유하는 서열, 18) 서열 9의 위치 약 366 내지 위치 약 703으로 이루어지며, AT 생물학적 활성을 보유하는 도메인, 19) 서열 10의 위치 약 10 내지 위치 약 488로 이루어지며, KS 생물학적 활성을 보유하는 도메인, 20) 서열 10의 위치 약 502 내지 위치 약 750으로 이루어지며, CLF 생물학적 활성을 보유하는 도메인, 21) 서열 10의 위치 약 1431 내지 위치 약 1573으로 이루어지며, DH 생물학적 활성, 바람직하게는 FabA-유사 DH 활성을 보유하는 도메인, 22) 서열 10의 위치 약 1882 내지 위치 약 2020으로 이루어지며, DH 생물학적 활성, 바람직하게는 FabA-유사 DH 활성을 보유하는 도메인, 23) 서열 11의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인, 또는 24) 서열 12의 위치 약 29 내지 위치 약 177로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인으로부터 선택되는 아미노산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성된다.
본 발명에 따라, 본원에 기재한 핵산 또는 아미노산 서열과 관련된 용어 "인접한(contiguous)" 또는 "연속적인(consecutive)"은 하나의 파손되지 않은 서열로 연결되어 있음을 의미한다. 예를 들어, 제1 서열이 제2 서열의 30개의 인접한 (또는 연속적인) 아미노산을 포함한다는 것은 제2 서열 내의 30개의 아미노산 잔기의 파손되지 않은 서열과 100% 동일한 30개의 아미노산 잔기의 파손되지 않은 서열을 제1 서열이 포함한다는 것을 의미한다. 유사하게, 제1 서열이 제2 서열과 "100% 동일성"을 갖는다는 것은 뉴클레오티드 또는 아미노산 사이의 갭 없이 제1 서열이 제2 서열에 정확하게 매치한다는 것을 의미한다.
달리 명시하지 않는다면, 본원에서 사용된 바와 같은 동일성(%)은 (1) 모두 표준 디폴트 파라미터를 이용하며 검색 서열의 낮은 복합도 영역은 디폴트에 의해 필터링되는, 아미노산 서치용 blastp, 핵산 서치용 blastn, 및 모든 6개 오픈 리딩 프레임에서의 핵산 서치 및 번역된 아미노산의 서치용 blastX를 사용한 BLAST 2.0 Basic BLAST 상동성 서치 (그 전문이 본원에 참고로 도입되어 있는 문헌 [Altschul, S.F., Madden, T.L., Schaaffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389]에 기재됨), (2) BLAST 2 정렬 (하기 기재되는 파라미터를 사용함), 및/또는 (3) 표준 디폴트 파라미터로의 PSI-BLAST (위치-특이적 반복 블라스트(Position-Specific Iterated BLAST)를 사용하여 수행되는 상동성의 평가를 지칭한다. BLAST 2.0 Basic BLAST 및 BLAST 2 사이의 표준 파라미터의 약간의 차이로 인해, 2개의 특정 서열이 BLAST 2 프로그램을 사용한 경우 상당한 상동성을 갖는 것으로 인식되는 반면, 그 서열 중 하나를 검색 서열로서 사용하여 BLAST 2.0 Basic BLAST에서 수행된 서치는 제2 서열을 최고 매치로 식별하지 않을 수 있음을 염두에 두어야 한다. 또한, PSI-BLAST는 서열 상동체의 탐색에 대한 고감도 방식인, "프로파일" 서치의 사용하기 쉬운 자동화 버전을 제공한다. 이 프로그램은 먼저 gapped BLAST 데이타베이스 서치를 수행한다. PSI-BLAST 프로그램은 얻어진 임의의 유의한 정렬로부터의 정보를 사용하여 위치-특이적 스코어 매트릭스를 구축하고, 이는 다음 라운드의 데이타베이스 서치에서 검색 서열을 대체한다. 따라서, 동일성(%)은 이들 프로그램 중 어느 하나를 사용함으로써 결정될 수 있는 것으로 이해되어진다.
2개의 특정 서열을 그 전문이 본원에 참고로 도입되어 있는 문헌 [Tatusova and Madden, "Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247 (1999)]에 기재된 바와 같은 BLAST 2 서열을 사용하여 서로 정렬할 수 있다. BLAST 2 서열 정렬은 2개의 서열 사이의 Gapped BLAST 서치 (BLAST 2.0)를 수행하여 생성된 정렬에 갭의 도입 (결실 및 삽입)을 허용하는 BLAST 2.0 알고리즘을 사용하여 blastp 또는 blastn에서 수행된다. 본원에서 명확하게 하기 위해, BLAST 2 서열 정렬은 다음과 같은 표준 디폴트 파라미터를 사용하여 수행된다:
blastn의 경우, 0 블로섬(BLOSUM)62 매트릭스를 사용:
blastp의 경우, 0 블로섬62 매트릭스를 사용:
본 발명에 따라, PUFA PKS 시스템의 하나 이상의 도메인의 생물학적 활성을 보유하는 아미노산 서열은 본원에 상세하게 기재한 PUFA PKS 시스템의 하나 이상의 도메인 (예컨대, KS 도메인, AT 도메인, CLF 도메인 등)의 생물학적 활성을 보유하는 아미노산 서열이다. 따라서, 본 발명에 유용한 단리된 단백질은 임의의 PUFA PKS 오픈 리딩 프레임의 번역 생산물, 임의의 PUFA PKS 도메인, 이러한 번역 생산물 또는 도메인의 임의의 생물학적 활성 단편, 또는 생물학적 활성을 보유하는 천연 발생 PUFA PKS 오픈 리딩 프레임 생산물 또는 도메인의 임의의 상동체를 포함할 수 있다.
본 발명의 또다른 실시양태에서, 본 발명의 PUFA PKS 시스템의 하나 이상의 도메인의 생물학적 활성을 보유하는 아미노산 서열은, 아미노산 서열을 코딩하는 핵산 서열이 중간 정도, 높은, 또는 매우 높은 엄격도 조건 (하기에 기재됨) 하에 천연 발생 PUFA PKS 단백질 또는 폴리펩티드를 코딩하는 핵산 분자 (즉, 천연 발생 PUFA PKS 단백질 또는 폴리펩티드를 코딩하는 핵산 가닥의 상보체)에 혼성화할 수 있다고 본원에 구체적으로 기재한 천연 발생 PUFA PKS 단백질 또는 폴리펩티드와 충분히 유사한 아미노산 서열을 포함한다. 바람직하게는, 본 발명의 PUFA PKS 시스템의 하나 이상의 도메인의 생물학적 활성을 보유하는 아미노산 서열은 중간 정도, 높은, 또는 매우 높은 엄격도 조건 하에 PUFA PKS 단백질 또는 도메인에 대한 임의의 상기 아미노산 서열을 코딩하는 핵산 서열의 상보체에 혼성화하는 핵산 서열에 의해 코딩된다. 상보적 서열의 추론 방법은 당업자에게 공지되어 있다. 아미노산 서열결정 및 핵산 서열결정 기술이 오차가 전혀 없는 것은 아니기 때문에, 본원에 나타내는 서열은 본 발명의 PUFA PKS 도메인 및 단백질의 식별할 수 있는 서열을 최대한으로 나타내는 것임을 염두에 두어야 한다.
본원에서 사용된 바와 같은 혼성화 조건은 핵산 분자를 사용해 유사한 핵산 분자를 확인하는 표준 혼성화 조건을 지칭한다. 이러한 표준 조건은 예를 들어, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press (1989)]에 개시되어 있다. 동일 문헌 [Sambrook et al]은 그 전문이 본원에 참고로 도입되어 있다 (구체적으로, 9.31-9.62 면 참조). 또한, 뉴클레오티드의 미스매치 정도를 다양하게 하는 혼성화를 달성하기 위한 적절한 혼성화 및 세척 조건을 계산하는 식은 예를 들어, 그 전문이 본원에 참고로 도입되어 있는 문헌 [Meinkoth et al., Anal. Biochem. 138, 267 (1984)]에 개시되어 있다.
더욱 특히, 본원에 지칭된 바와 같은 중간 정도의 엄격도 혼성화 및 세척 조건은 혼성화 반응에서 프로브(probe)로 사용되는 핵산 분자와 약 70% 이상의 핵산 서열 동일성을 갖는 핵산 분자가 단리되도록 하는 조건 (즉, 뉴클레오티드가 약 30% 이하 미스매치되도록 하는 조건)을 지칭한다. 본원에 지칭된 바와 같은 높은 엄격도 혼성화 및 세척 조건은 혼성화 반응에서 프로브로 사용되는 핵산 분자와 약 80% 이상의 핵산 서열 동일성을 갖는 핵산 분자가 단리되도록 하는 조건 (즉, 뉴클레오티드가 약 20% 이하 미스매치되도록 하는 조건)을 지칭한다. 본원에 지칭된 바와 같은 매우 높은 엄격도 혼성화 및 세척 조건은 혼성화 반응에서 프로브로 사용되는 핵산 분자와 약 90% 이상의 핵산 서열 동일성을 갖는 핵산 분자가 단리되도록 하는 조건 (즉, 뉴클레오티드가 약 10% 이하 미스매치되도록 하는 조건)을 지칭한다. 상기 논의된 바와 같이, 당업자는 동일 문헌 [Meinkoth et al]에서의 식을 사용하여 이러한 특정 수준의 뉴클레오티드 미스매치를 달성하기 위한 적절한 혼성화 및 세척 조건을 계산할 수 있다. 상기 조건은 DNA:RNA 또는 DNA:DNA 하이브리드가 형성되는지의 여부에 따라 달라질 것이다. DNA:DNA 하이브리드에 대한 계산된 융점은 DNA:RNA 하이브리드에서보다 10℃ 낮다. 특정 실시양태에서, DNA:DNA 하이브리드에 대한 엄격한 혼성화 조건은 적절한 세척 조건과 함께, 약 20℃ 내지 약 35℃ (낮은 엄격도), 더욱 바람직하게는 약 28℃ 내지 약 40℃ (더욱 엄격함), 훨씬 더욱 바람직하게는 약 35℃ 내지 약 45℃ (훨씬 더욱 엄격함) 온도에서 6X SSC (0.9 M Na+)의 이온 강도에서의 혼성화를 포함한다. 특정 실시양태에서, DNA:RNA 하이브리드에 대한 엄격한 혼성화 조건은 유사하게 엄격한 세척 조건과 함께, 약 30℃ 내지 약 45℃, 더욱 바람직하게는 약 38℃ 내지 약 50℃, 훨씬 더욱 바람직하게는 약 45℃ 내지 약 55℃ 온도에서 6X SSC (0.9 M Na+)의 이온 강도에서의 혼성화를 포함한다. 이들 값은 약 100개 뉴클레오티드보다 큰 분자, 0% 포름아미드 및 약 40%의 G + C 함량에 대한 융점의 계산을 기초로 한다. 별법으로, Tm은 상기 문헌 [Sambrook et al]의 9.31 내지 9.62 면에 기술된 바와 같이 경험적으로 계산될 수 있다. 일반적으로, 세척 조건은 가능한 한 엄격해야 하고, 선택된 혼성화 조건에 대해 적합해야 한다. 예를 들어, 혼성화 조건은 특정 하이브리드의 계산된 Tm의 대략 20 내지 25℃ 낮은 온도 조건 및 염의 조합을 포함할 수 있고, 세척 조건은 전형적으로 특정 하이브리드의 계산된 Tm의 대략 12 내지 20℃ 낮은 온도 조건 및 염의 조합을 포함한다. DNA:DNA 하이브리드와 함께 사용하기에 적합한 혼성화 조건의 한 예는 약 42℃에서 6X SSC (50% 포름아미드)에서의 2 내지 24시간 혼성화 후에, 약 2X SSC 및 실온에서 1회 이상 세척한 다음 더 높은 온도 및 더 낮은 이온 강도에서 추가로 세척 (예컨대, 약 0.1X 내지 0.5X SSC 및 약 37℃에서 1회 이상 세척한 다음, 약 0.1X 내지 0.5X SSC 및 약 68℃에서 1회 이상 세척)하는 것을 포함하는 세척 단계를 포함한다.
본 발명은 또한 하나 이상의 융합 절편에 부착되어 있는 임의의 PUFA PKS 단백질 또는 도메인, 또는 그의 임의의 상동체 또는 단편을 포함한다. 본 발명으로 사용하기에 적합한 융합 절편으로는 단백질의 안정성을 증진시킬 수 있고, 다른 바람직한 생물학적 활성을 제공할 수 있고/있거나, (예컨대, 친화 크로마토그래피에 의해) 단백질의 정제를 보조할 수 있는 절편 등이 있으나 이에 제한되지 않는다. 적합한 융합 절편은 목적하는 기능 (예컨대, 증가된 안정성, 용해도, 생물학적 활성을 부여하고/하거나, 단백질의 정제를 단순화시킴)을 갖는 임의 크기의 도메인일 수 있다. 융합 절편은, 목적하는 단백질의 간편한 회수를 가능케 하기 위해 단백질의 아미노 및/또는 카르복실 말단에 결합되어 절단하기 쉬울 수 있다. 융합 단백질은 바람직하게는 상기 논의된 바와 같은 본 발명의 단백질의 카르복실 및/또는 아미노 말단 말단부에 부착되어 있는 융합 절편을 포함하는 단백질을 코딩하는 융합 핵산 분자로 형질감염된 재조합 세포를 배양함으로써 생산된다.
본 발명의 한 실시양태에서, 상기-기재된 임의의 PUFA PKS 아미노산 서열 및 상기 서열의 상동체는 주어진 아미노산 서열의 C- 및/또는 N-말단 말단부 각각에 플랭킹(flanking)된 1개 이상 내지 약 20개 이하의 추가의 이종 아미노산과 함께 생산될 수 있다. 생성된 단백질 또는 폴리펩티드는 주어진 아미노산 서열을 "으로 본질적으로 구성되는"이라고 지칭될 수 있다. 본 발명에 따라, 이종 아미노산은 주어진 아미노산 서열에 플랭킹되는 천연적으로는 발견되지 않는 (즉, 생체내에서 천연 발견되지 않는) 아미노산의 서열, 또는 유전자에 존재할 때 주어진 아미노산 서열을 코딩하는 천연 발생 핵산 서열에 플랭킹된 천연 발생 서열 내의 뉴클레오티드가 주어진 아미노산 서열이 유래된 유기체에 대한 표준 코돈 사용법을 사용하여 번역되는 경우에 상기 뉴클레오티드에 의해 코딩되지 않는 아미노산의 서열이다. 유사하게, 어구 "으로 본질적으로 구성되는"은 본원에서 핵산 서열과 관련하여 사용되는 경우, 주어진 아미노산 서열을 코딩하는 핵산 서열의 5' 및/또는 3' 말단부 각각에서 1개 이상 내지 약 60개 이하의 추가의 이종 뉴클레오티드에 의해 플랭킹될 수 있는 주어진 아미노산 서열을 코딩하는 핵산 서열을 지칭한다. 주어진 아미노산 서열을 코딩하는 핵산 서열에 플랭킹된 이종 뉴클레오티드는 천연 유전자에 존재할 때 천연적으로는 발견되지 않는다 (즉, 생체내에서 천연 발견되지 않음).
본 발명의 단백질 또는 도메인, 및/또는 그의 상동체 또는 단편의 최소 크기는 한 측면에서, 필수적 생물학적 활성을 보유하기에 충분한 크기, 또는 항체 생성에 대한 항원으로서 또는 시험관내 검정에서의 표적으로서 작용하기에 충분한 크기이다. 한 실시양태에서, 본 발명의 단백질은 약 8개 이상 아미노산의 길이 (예컨대, 항체 에피토프에 적합하거나 또는 검정에서 검출가능한 펩티드로서 적합함), 또는 약 25개 이상 아미노산의 길이, 또는 약 50개 이상 아미노산의 길이, 또는 약 100개 이상 아미노산의 길이, 또는 약 150개 이상 아미노산의 길이, 또는 약 200개 이상 아미노산의 길이, 또는 약 250개 이상 아미노산의 길이, 또는 약 300개 이상 아미노산의 길이, 또는 약 350개 이상 아미노산의 길이, 또는 약 400개 이상 아미노산의 길이, 또는 약 450개 이상 아미노산의 길이, 또는 약 500개 이상 아미노산의 길이, 또는 8개 아미노산 내지 본 발명의 단백질 또는 도메인의 전장 또는 정수 단위 (예컨대, 8, 9, 10,...25, 26,...500, 501,...)로 더 긴 길이 이하의 임의의 길이이다. 단백질이 PUFA PKS 단백질, 도메인의 일부, 또는 그의 생물학적으로 활성이거나 유용한 단편, 또는 전장 PUFA PKS 단백질 또는 도메인, 및 필요한 경우 추가의 서열 (예컨대, 융합 단백질 서열)을 포함할 수 있다는 점에서 상기 단백질의 최대 크기에는 실제적인 제한 이외에 제한이 없다.
본 발명의 한 실시양태는 본원에 기재한 임의의 PUFA PKS 단백질 또는 도메인, 및 임의의 상기 단백질 또는 도메인의 상동체 또는 단편을 코딩하는 핵산 서열뿐만 아니라 그에 완전히 상보적인 핵산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성된 단리된 핵산 분자에 관한 것이다. 본 발명에 따라, 단리된 핵산 분자는 핵산 분자가 천연 발견되는 게놈 또는 염색체인 그의 천연 환경으로부터 수거된 (즉, 인간 조작을 가한) 핵산 분자이다. 따라서, "단리된"은 핵산 분자가 정제된 정도를 반드시 반영하지는 않지만, 분자는 핵산 분자가 천연 발견되는 완전한 게놈 또는 완전한 염색체를 포함하지 않는다는 것을 나타낸다. 단리된 핵산 분자는 유전자를 포함할 수 있다. 유전자를 포함하는 단리된 핵산 분자는 유전자를 포함하는 염색체의 단편이 아니라 유전자와 연관된 코딩 영역 및 조절성 영역을 포함하는 염색체의 단편이며, 본원에 기재한 바와 같은 PUFA PKS 시스템의 다른 단백질을 코딩하는 다른 유전자 이외에 상기 염색체 상에서 천연 발견되는 추가의 유전자는 없다. 단리된 핵산 분자는 또한 통상적으로 특정한 천연 핵산 서열에 플랭킹되지 않는 추가의 핵산 (즉, 이종 서열)이 (즉, 서열의 5' 및/또는 3' 말단부에서) 플랭킹된 특정 핵산 서열을 포함할 수 있다. 단리된 핵산 분자는 DNA, RNA (예컨대, mRNA), 또는 DNA 또는 RNA의 유도체 (예컨대, cDNA)를 포함할 수 있다. 어구 "핵산 분자"가 주로 물리적 핵산 분자를 지칭하고, 어구 "핵산 서열"이 주로 핵산 분자 상의 뉴클레오티드의 서열을 지칭하지만, 2개의 어구는 특히 단백질 또는 단백질의 도메인을 코딩할 수 있는 핵산 분자 또는 핵산 서열에 대해 구별없이 사용될 수 있다.
바람직하게는, 본 발명의 단리된 핵산 분자는 재조합 DNA 기술 (예컨대, 폴리머라제 연쇄 반응 (PCR) 증폭, 클로닝) 또는 화학적 합성을 사용하여 생산된다. 단리된 핵산 분자는, 변형이 본원에 기재한 바와 같은 PUFA PKS 시스템 생물학적 활성에 대한 목적하는 효과를 제공하는 방식으로 뉴클레오티드가 삽입, 결실, 치환, 및/또는 반전된 천연 대립유전자 변이체 및 변형된 핵산 분자 등을 포함하되 이에 제한되지 않는 천연 핵산 분자 및 이의 상동체를 포함한다. 단백질 상동체 (예컨대, 핵산 상동체에 의해 코딩된 단백질)는 상기에 상세하게 논의되었다.
핵산 분자 상동체는 당업자에게 공지된 수많은 방법을 사용하여 생산될 수 있다 (예를 들어, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press (1989)] 참조). 예를 들어, 핵산 분자는 전형적인 돌연변이유발 기술 및 재조합 DNA 기술, 예컨대 부위-지정 돌연변이유발, 돌연변이의 유도를 위한 핵산 분자의 화학적 처리, 핵산 단편의 제한 효소 절단, 핵산 단편의 라이게이션, 핵산 서열의 선택된 영역의 PCR 증폭 및/또는 돌연변이유발, 올리고뉴클레오티드 혼합물의 합성 및 핵산 분자의 혼합물을 "형성"하기 위한 혼합물 군의 라이게이션, 및 이들의 조합 등이 있으나 이에 제한되지 않는 다양한 기술을 사용하여 변형될 수 있다. 핵산 분자 상동체는 핵산 및/또는 야생형 유전자와의 혼성화에 의해 코딩되는 단백질의 기능에 대해 스크리닝하여 변형된 핵산의 혼합물로부터 선택될 수 있다.
본 발명의 핵산 분자의 최소 크기는 본 발명의 핵산 분자의 상보적 서열과 (예컨대, 중간 정도, 높은 또는 매우 높은 엄격도 조건 하에) 안정한 하이브리드를 형성할 수 있는 프로브 또는 올리고뉴클레오티드 프라이머를 형성하기에 충분한 크기, 또는 본 발명에 따른 PUFA PKS 시스템의 하나 이상의 도메인의 생물학적 활성을 보유하는 아미노산 서열을 코딩하기에 충분한 크기이다. 따라서, 이러한 단백질을 코딩하는 핵산 분자의 크기는 핵산 조성, 및 핵산 분자와 상보적 서열 사이의 상동성(%) 또는 동일성(%)뿐만 아니라 혼성화 조건 그 자체 (예컨대, 온도, 염 농도 및 포름아미드 농도)에 따라 달라질 수 있다. 올리고뉴클레오티드 프라이머 또는 프로브로서 사용되는 핵산 분자의 최소 크기는 전형적으로 핵산 분자에 GC가 풍부한 경우에는 약 12 이상 내지 약 15개 뉴클레오티드의 길이이고, AT가 풍부한 경우에는 약 15 이상 내지 약 18개 염기의 길이이다. 핵산 분자가 PUFA PKS 시스템의 도메인의 생물학적 활성 단편, PUFA PKS 시스템의 전체 도메인, PUFA PKS 시스템의 오픈 리딩 프레임 (Orf) 내의 다수의 도메인, PUFA PKS 시스템의 전체 단일- 또는 다중-도메인 단백질, 또는 PUFA PKS 시스템의 하나 이상의 단백질을 코딩하기에 충분한 서열을 포함할 수 있다는 점에서 본 발명의 핵산 분자의 최대 크기에는 실제적인 제한 이외에 제한이 없다.
본 발명의 한 실시양태에서, 단리된 핵산 분자는 본원에 기재한 쉐바넬라 자포니카 또는 쉐바넬라 올레야나로부터의 임의의 아미노산 서열 또는 이의 상동체를 비롯한 임의의 상기-기재된 아미노산 서열을 코딩하는 핵산 서열을 포함하거나, 이것으로 본질적으로 구성되거나, 또는 이것으로 구성된다. 한 측면에서, 상기 핵산 서열은 본원에 기재한 PUFA PKS 시스템의 하나 이상의 도메인 또는 단백질을 코딩하는 서열 1 또는 서열 7, 또는 서열 1 또는 서열 7의 임의의 단편 (절편, 일부)의 군으로부터 선택된다. 또다른 측면에서, 상기 핵산 서열은 본원에 기재한 PUFA PKS 시스템의 하나 이상의 도메인 또는 단백질을 코딩하는 서열 1 또는 서열 7의 임의의 상동체, 또는 서열 1 또는 서열 7의 임의의 단편을 포함한다 (상기 서열과 약 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일한 서열 포함). 또다른 측면에서, 상기 핵산 서열의 단편 및 임의의 상보적 서열은 본 발명에 포함된다.
본 발명의 또다른 실시양태는, 본원에 기재된 바와 같은 PUFA PKS 단백질의 하나 이상의 생물학적 활성 도메인 (또는 그의 상동체 또는 단편)을 갖는 단백질 또는 펩티드를 코딩하는 핵산 서열 및 재조합 벡터를 포함하는 재조합 핵산 분자를 포함한다. 이러한 핵산 서열은 상기에 상세하게 기재되어 있다. 본 발명에 따라, 재조합 벡터는, 선택된 핵산 서열을 조작하고 그 핵산 서열을 숙주 세포에 도입시키기 위한 도구로서 사용되는 유전자조작된 (즉, 인공적으로 생산된) 핵산 분자이다. 따라서, 재조합 벡터는 선택된 핵산 서열을 클로닝, 서열결정 및/또는 (예를 들어, 선택된 핵산 서열을 발현시키고/거나 숙주 세포에 전달하여 재조합 세포를 형성함으로써) 달리 조작하기 위한 용도로 적합하다. 전형적으로, 이러한 재조합 벡터는 이종 핵산 서열 (즉, 클로닝 또는 전달될 핵산 서열에 천연적으로 인접하여 존재하지 않는 핵산 서열)을 함유하나, 상기 벡터는 본 발명의 핵산 분자에 천연적으로 인접하여 존재하거나 본 발명의 핵산 분자의 발현에 유용한 조절성 핵산 서열 (예컨대, 프로모터, 비번역 영역)도 함유할 수 있다 (아래에서 상세하게 논의됨). 상기 벡터는 원핵성 또는 진핵성의 RNA 또는 DNA일 수 있고, 전형적으로는 플라스미드이다. 상기 벡터는 염색체외 요소 (예컨대, 플라스미드)로서 유지될 수 있거나, 또는 재조합 유기체 (예컨대, 미생물 또는 식물)의 염색체 내로 통합될 수 있다. 상기 벡터 전체는 숙주 세포 내의 적절한 장소에 남아 있을 수 있거나, 또는 특정 조건 하에 플라스미드 DNA가 결실되어 본 발명의 핵산 분자를 남길 수 있다. 통합된 핵산 분자는 염색체 프로모터 제어 하에 있거나, 천연 또는 플라스미드 프로모터 제어 하에 있거나, 또는 여러 프로모터 제어들의 조합 하에 있을 수 있다. 핵산 분자의 단일 또는 다중 카피는 염색체 내로 통합될 수 있다. 본 발명의 재조합 벡터는 1종 이상의 선별 마커를 함유할 수 있다.
한 실시양태에서, 본 발명의 재조합 핵산 분자에서 사용되는 재조합 벡터는 발현 벡터이다. 본원에서 사용된 "발현 벡터"란 어구는 코딩 생성물 (예컨대, 관심 단백질)의 생산에 적합한 벡터를 지칭한다. 이 실시양태에서, 생산될 생성물 (예컨대, PUFA PKS 도메인 또는 단백질)을 코딩하는 핵산 서열은 재조합 벡터에 삽입되어 재조합 핵산 분자를 생산한다. 생산될 단백질을 코딩하는 핵산 서열은, 재조합 숙주 세포 내에서 핵산 서열이 전사 및 번역될 수 있도록 하는 벡터 중의 조절 서열에 핵산 서열을 작동가능하게 연결하는 방식으로 벡터에 삽입된다.
또다른 실시양태에서, 본 발명의 재조합 핵산 분자에서 사용되는 재조합 벡터는 표적화 벡터이다. 본원에서 사용된 "표적화 벡터"란 어구는 특정 핵산 분자를 재조합 숙주 세포에 전달하는 데 사용되는 벡터를 지칭하며, 여기서 상기 핵산 분자는 숙주 세포 또는 미생물 내에서 내인성 유전자 또는 유전자의 일부를 결실, 불활성화 또는 대체시키는 데 사용된다 (즉, 표적화된 유전자 파괴 또는 넉아웃(knock-out) 기술을 위해 사용됨). 이러한 벡터는 당업계에 "넉아웃" 벡터로 알려져 있을 수도 있다. 이 실시양태의 한 측면에서, 벡터의 일부 (보다 전형적으로는, 벡터에 삽입된 핵산 분자 (즉, 삽입물))는 숙주 세포 내에 있는 표적 유전자 (즉, 결실 또는 불활성화되도록 표적화된 유전자)의 핵산 서열과 상동성인 핵산 서열을 갖는다. 벡터 삽입물의 핵산 서열은, 표적 유전자와 결합하여 표적 유전자 및 삽입물에 상동성 재조합 (이로써 내인성 표적 유전자가 결실, 불활성화, 감쇠 (즉, 돌연변이되거나 결실되는 내인성 표적 유전자 중 적어도 일부에 의함) 또는 대체됨)이 일어날 수 있도록 설계된다. 실시예 단락에는 예를 들어, 내인성 쉬조키트리움 유전자를 재조합 유전자로 대체하기 위한, 상기 유형의 재조합 벡터의 용도가 기재되어 있고, 미국 특허 출원 제10/124,807호 (미국 특허 출원 공보 제20030166207호로 2003년 9월 4일자 공개됨)에는 트라우스토키트리드의 유전적 형질전환을 위한 일반 기술이 상세하게 기재되어 있다. 식물을 위한 유전적 형질전환 기술은 당업계에 잘 알려져 있다. 본 발명의 실시양태에서, 본원에 기재된 해양 박테리아 유전자들은, 식물 또는 미생물 (예를 들어, 트라우스토키트리드)의 PUFA PKS 생산능을 개선 및/또는 변경 (변형, 변화)하기 위해 이들 식물 또는 미생물을 형질전환시키는 데 사용될 수 있다.
전형적으로, 재조합 핵산 분자는 1개 이상의 발현 제어 서열에 작동가능하게 연결된 본 발명의 1종 이상의 핵산 분자를 포함한다. 본원에서 사용된 "재조합 분자" 또는 "재조합 핵산 분자"란 어구는 1차적으로는, 발현 제어 서열에 작동가능하게 연결된 핵산 분자 또는 핵산 서열을 의미하나, 어구 "핵산 분자"와 구별없이 사용될 수 있다 (이러한 핵산 분자는 본원에서 논의된 바와 같은 재조합 분자임). 본 발명에 따라, "작동가능하게 연결된"이란 어구는 숙주 세포 내로 형질감염 (예를 들어, 형질전환, 형질도입, 형질감염, 접합 또는 전도(conduced))되었을 때 분자가 발현될 수 있도록, 핵산 분자를 발현 제어 서열 (예컨대, 전사 제어 서열 및/또는 번역 제어 서열)에 연결시킨 경우를 지칭한다. 전사 제어 서열은 전사의 개시, 신장, 또는 종결을 제어하는 서열이다. 특히 중요한 전사 제어 서열은 전사 개시를 제어하는 서열, 예를 들어 프로모터, 인핸서, 오퍼레이터 및 리프레서 서열이다. 적합한 전사 제어 서열에는 재조합 핵산 분자가 도입될 숙주 세포 또는 유기체에서 기능할 수 있는 임의의 전사 제어 서열이 포함된다.
또한, 본 발명의 재조합 핵산 분자는 추가의 조절 서열, 예를 들어 번역 조절 서열, 복제 개시점, 및 재조합 세포와 상용성인 여타 조절 서열을 함유할 수 있다. 한 실시양태에서, 본 발명의 재조합 분자 (숙주 세포 염색체 내로 통합된 분자 포함)는 또한, 발현된 단백질이, 단백질을 생산하는 세포로부터 분비되게 하는 분비 신호 (즉, 신호 절편 핵산 서열)를 함유한다. 적합한 신호 절편에는 발현될 단백질과 천연적으로 관련된 신호 절편, 또는 본 발명에 따른 단백질의 분비를 지시할 수 있는 임의의 이종 신호 절편이 포함된다. 또다른 실시양태에서, 본 발명의 재조합 분자는, 발현된 단백질이 숙주 세포의 막에 전달 및 삽입되도록 하는 선도 서열을 포함한다. 적합한 선도 서열로는 단백질과 천연적으로 관련된 선도 서열, 또는 단백질이 세포의 막에 전달 및 삽입되도록 지시할 수 있는 임의의 이종 선도 서열이 포함된다.
본 발명의 1종 이상의 재조합 분자는 본 발명의 코딩 생성물 (예컨대, PUFA PKS 도메인, 단백질 또는 시스템)을 생산하는 데 사용될 수 있다. 한 실시양태에서, 코딩 생성물은 본원에 기재된 바와 같은 핵산 분자를 단백질 생산에 효과적인 조건 하에 발현시킴으로써 생산된다. 코딩 단백질을 생산하기에 바람직한 방법은 숙주 세포를 1개 이상의 재조합 분자로 형질감염시켜 재조합 세포를 형성하는 것이다. 형질감염시키기에 적합한 숙주 세포로는, 형질감염될 수 있는 임의의 박테리아, 진균 (예컨대, 효모), 곤충, 식물 또는 동물 세포가 포함되나, 이에 제한되지는 않는다. 본 발명의 한 실시양태에서, 바람직한 숙주 세포는 트라우스토키트리드 숙주 세포 (하기에 상세하게 기재되어 있음) 또는 식물 숙주 세포이다. 숙주 세포는 비-형질감염 세포, 또는 이미 1종 이상의 다른 재조합 핵산 분자로 형질감염된 세포일 수 있다.
본 발명에 따라, "형질감염"이란 용어는 외인성 핵산 분자 (즉, 재조합 핵산 분자)가 세포에 삽입될 수 있는 임의의 방법을 나타낸다. "형질전환"이란 용어는, 핵산 분자가 미생물 세포 (예를 들어, 조류, 박테리아 및 효모) 또는 식물 세포에 도입되는 경우를 나타내는 데 사용되는 경우에 용어 "형질감염"과 구별없이 사용될 수 있다. 미생물 및 식물 시스템에서는, "형질전환"이란 용어가 미생물 또는 식물에 의한 외인성 핵산의 취득으로 인한 유전되는 변화를 기술하기 위해 사용되며, 용어 "형질감염"과 본질적으로 동의어이다. 그러나, 동물 세포의 경우, "형질전환"은 예를 들어, 동물 세포가 악성이 된 후에 배양시 세포의 성장 특성의 변화를 나타낼 수 있는 제2의 의미를 획득하였다. 따라서, 혼동을 피하기 위해, "형질감염"이란 용어는 동물 세포로의 외인성 핵산 도입과 관련하여 사용되는 것이 바람직하며, 이들 용어가 외인성 핵산을 세포에 도입하는 것과 관련되어 있다면, 본원에서 사용된 용어 "형질감염"은 동물 세포의 형질감염, 및 미생물 세포 및 식물 세포의 형질전환을 일반적으로 포함할 것이다. 따라서, 형질감염 기술로는 형질전환, 입자 충격(particle bombardment), 확산, 활성 수송, 배스 초음파 처리, 전기천공, 미량주사, 리포펙션(lipofection), 흡수, 감염 및 원형질체 융합이 포함되나, 이에 제한되지는 않는다.
재조합 DNA 기술을 이용하면, 예를 들어 숙주 세포 내에 있는 핵산 분자 카피 개수, 핵산 분자의 전사 효율, 생성된 전사물의 번역 효율, 및 번역후 변형 효율을 조작함으로써, 형질감염된 핵산 분자 발현의 제어를 개선할 수 있음을 당업자는 알 것이다. 또한, 프로모터 서열은 천연 프로모터에 비해 발현 수준을 개선하기 위해 유전공학적으로 조작될 수 있다. 핵산 분자 발현의 제어에 있어 유용한 재조합 기술로는 하나 이상의 숙주 세포 염색체로의 핵산 분자 통합, 벡터 안정성 서열로의 플라스미드 부가, 전사 제어 신호 (예컨대, 프로모터, 오퍼레이터, 인핸서)의 치환 또는 변형, 번역 제어 신호 (예컨대, 리보솜 결합 부위, 샤인-달가노 서열)의 치환 또는 변형, 숙주 세포의 코돈 용도에 부합하는 핵산 분자의 변형, 및 전사물을 불안정화시키는 서열의 결실이 포함되나, 이에 제한되지는 않는다.
재조합 핵산 분자 및 숙주 세포의 형질감염과 관련된 상기한 전반적인 논의는, PUFA PKS 시스템의 하나 이상의 생물학적 활성 도메인을 갖는 임의의 아미노산 서열을 코딩하는 것들, 여타 PKS 시스템의 아미노산 서열을 코딩하는 것들, 여타 단백질 또는 도메인을 코딩하는 것들을 비롯하여, 본원에서 논의된 모든 재조합 핵산 분자에 적용된다.
다중불포화 지방산 (PUFA)은 고급 진핵생물에 있어서 필수적인 막 구성요소이고, 수많은 지질-유래 신호전달 분자의 전구체이다. 본 발명의 PUFA PKS 시스템은 포화 지방산의 탈포화 및 신장이 요구되지 않는 PUFA 합성 경로를 이용한다. PUFA PKS 시스템이 촉매로 작용하는 경로는, 구조 및 메카니즘에 있어서 이전까지 알려져 있던 PKS 시스템의 경우와 구별된다. 시스 이중 결합의 생성은 위치-특이적 이소머라제와 관련이 있는 것으로 판단되며, 이들 효소는 새로운 항생제군의 생산에 유용한 것으로 생각된다.
1종 이상의 원하는 다중불포화 지방산 또는 여타 생물활성 분자를 유의하게 높은 수율로 생산하기 위해, 유기체, 바람직하게는 미생물 또는 식물의 유전자를 변형시켜, 미생물 또는 식물의 PUFA PKS 시스템의 활성 (특히, 최종 생성물)을 변경하거나, PUFA PKS 시스템을 미생물 또는 식물에 도입할 수 있다.
따라서, 본 발명의 한 실시양태는, 본원에 기재된 바와 같은 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 하나 이상의 생물학적 활성 도메인 (예컨대, 쉐바넬라 자포니카 또는 쉐바넬라 올레야나로부터의 PUFA PKS 시스템의 하나 이상의 도메인 또는 단백질, 또는 그의 생물학적 활성 단편 또는 상동체)을 포함하는 PKS 시스템을 발현하는 유전자 변형 미생물에 관한 것이다. 미생물의 유전자 변형은 유기체의 PKS 시스템의 활성에 영향을 미친다. PUFA PKS 시스템의 도메인은 상기 기재된 바와 같은 해양 박테리아 PUFA PKS 시스템의 임의의 도메인 (그의 상동체 포함)을 포함할 수 있고, 또한 임의의 다른 박테리아 또는 비-박테리아 미생물, 예를 들어 임의의 진핵 미생물, 특히 임의의 트라우스토키트리드 미생물로부터의 PUFA PKS 시스템의 임의의 도메인, 또는 상기 미국 특허 출원 제10/124,800호에 기재된 스크리닝 방법에 의해 동정된 미생물로부터의 PUFA PKS 시스템의 임의의 도메인을 포함할 수 있다. 간단히, 미국 특허 출원 제10/124,800호에 기재된 스크리닝 방법은 (a) 1종 이상의 PUFA를 생산하는 미생물을 선별하는 단계, 및 (b) 발효 배지 중 용존 산소량이 포화 상태의 약 5% 초과, 바람직하게는 약 10%, 보다 바람직하게는 약 15%, 더욱 바람직하게는 약 20%인 조건 하에 미생물이 생산하는 PUFA의 양보다 증가된 양으로, 발효 배지 중 용존 산소량이 포화 상태의 약 5% 미만인 조건 하에 PUFA를 생산할 수 있는, 단계 (a)로부터의 미생물을 동정하는 단계를 포함한다. 상기 미국 특허 제6,140,486호 (그 전문이 본원에 참고로 도입됨)에는 여타 박테리아 PUFA PKS 시스템의 단백질, 도메인 및 이들의 상동체가 기재되어 있다. 상기 미국 특허 제6,566,583호, 상기 미국 특허 출원 제10/124,800호, 및 상기 미국 특허 출원 제10/810,352호 (이들은 각각 그 전문이 본원에 참고로 도입됨)에는 트라우스토키트리드 PUFA PKS 시스템의 단백질, 도메인 및 이들의 상동체가 상세하게 기재되어 있다.
본 발명의 한 측면에서, 유전자 변형 유기체는 PUFA PKS 시스템을 내인적으로 함유 및 발현할 수 있고, 이때 유전자 변형이란 내인성 PUFA PKS 시스템의 하나 이상의 기능성 도메인의 유전자 변형일 수 있다 (이로써 상기 유전자 변형은 PUFA PKS 시스템의 활성에 어느 정도의 영향을 미침). 예를 들어, 본원에 기재된 쉐바넬라 자포니카 또는 쉐바넬라 올레야나 종은, 그 미생물의 PUFA PKS 기능의 어떤 변경 (변화, 변형)을 유발하는 내인성 PUFA PKS 유전자(들)을 변형시킴으로써 유전자 변형될 수 있다.
본 발명의 또다른 측면에서, 유전자 변형 유기체는 PUFA PKS 시스템을 내인적으로 함유 및 발현할 수 있고, 이때 유전자 변형이란 1개 이상의 외인성 핵산 서열 (예컨대, 재조합 핵산 분자)의 도입일 수 있다 (여기서, 상기 외인성 핵산 서열은 제2 PKS 시스템 (소정의 PUFA PKS 시스템 또는 또다른 유형의 PKS 시스템 포함)로부터의 하나 이상의 생물학적 활성 도메인 또는 단백질, 및/또는 PUFA PKS 시스템의 활성에 영향을 미치는 단백질을 코딩함). 본 발명의 이 측면에서, 유기체에서는 또한, 내인성 PUFA PKS 시스템을 포함하는 유전자(들)에 대한 하나 이상의 변형이 존재할 수 있다.
본 발명의 또다른 측면에서, 유전자 변형 유기체는 PUFA PKS 시스템을 반드시 내인적으로 (천연적으로) 함유하는 것은 아니며, PUFA PKS 시스템의 하나 이상의 생물학적 활성 도메인을 갖는 아미노산 서열을 코딩하는 1종 이상의 재조합 핵산 분자를 포함하도록 유전자 변형된다. 상기 유기체는 PUFA PKS 시스템 생성물 (생물활성 분자, 예를 들어 PUFA 또는 항생제)의 생산을 위한 PUFA PKS 시스템의 필수 구성요소들을 함께 코딩하는 2개 이상의 재조합 핵산 분자를 포함하거나, PUFA PKS 생성물의 생산을 위한 PUFA PKS 시스템의 필수 구성요소들을 포함하는 다수의 도메인을 코딩하는 재조합 핵산 분자를 포함하도록 유전자 변형되는 것이 바람직하다. 이들 측면 각각과 관련된 각종 실시양태가 아래에서 더욱 상세하게 논의될 것이다.
PUFA PKS 시스템, 또는 PUFA PKS 시스템을 포함하는 유기체의 유전자 변형에는, PUFA PKS 시스템의 하나 이상의 도메인 (도메인의 일부 포함), PUFA PKS 시스템의 둘 이상 또는 여러 도메인 (인접 도메인, 비-인접 도메인, 또는 PUFA PKS 시스템의 상이한 단백질 상에 있는 도메인 포함), PUFA PKS 시스템의 전체 단백질, 및 전체 PUFA PKS 시스템 (예컨대, PUFA PKS 유전자에 의해 코딩된 모든 단백질) 또는 심지어 둘 이상의 PUFA PKS 시스템 (예컨대, DHA를 천연적으로 생산하는 유기체로부터의 시스템 및 EPA를 천연적으로 생산하는 유기체로부터의 시스템)의 변형 및/또는 이용이 포함될 수 있음을 이해해야 한다. 따라서, 이러한 변형에는 내인성 PUFA PKS 시스템의 단일 도메인의 작은 변형, 내인성 PUFA PKS 시스템의 하나 이상의 도메인 또는 단백질의 치환, 결실 또는 부가, 재조합 PUFA PKS 시스템으로부터의 하나 이상의 도메인 또는 단백질의 도입, 내인성 PUFA PKS 시스템을 갖는 유기체에서의 제2 PUFA PKS 시스템 도입, 유기체의 전체 PUFA PKS 시스템을 상이한 유기체로부터의 PUFA PKS 시스템으로 대체, 또는 PUFA PKS 시스템을 내인적으로 갖지 않는 유기체로의 하나, 둘 또는 그 이상의 전체 PUFA PKS 시스템 도입이 포함될 수 있으나, 이에 제한되지는 않는다. 당업자는, PUFA PKS 시스템의 모든 유전자 변형이 본 발명에 포함된다는 점을 이해할 것이다.
본원에서 사용된 바와 같이, 유전자 변형 미생물에는 유전자 변형 박테리아, 원생생물, 미세조류, 진균 또는 여타 미생물, 특히 트라우스토키트리알레스 목의 속들 중 임의의 것 (예컨대, 트라우스토키트리드), 예를 들어 본원에 기재된 트라우스토키트리아세애(Thraustochytriaceae) 과 및 라비린툴라세애(Labyrinthulaceae) 과에 속하는 임의의 미생물 (예컨대, 쉬조키트리움, 트라우스토키트리움, 자포노키트리움(Japonochytrium), 라비린툴라(Labyrinthula), 라비린툴로이데스(Labyrinthuloides) 등)이 포함될 수 있다. 이러한 유전자 변형 미생물은, 원하는 결과 (즉, PUFA PKS 활성의 증가 또는 변형, 및/또는 PKS 시스템을 이용한 원하는 생성물의 생산)가 달성되도록 정상 (즉, 야생형 또는 천연 발생) 형태로부터 변형된 (즉, 돌연변이 또는 변화된) 게놈을 갖는다. 미생물의 유전자 변형은 전통적인 균주 개발 및/또는 분자유전학적 기술에 의해 달성될 수 있다. 당업계에 공지된 이러한 기술은 일반적으로, 미생물을 위한 용도로 개시되어 있다 (예를 들어, 문헌 [Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press]). 상기 샘브룩 등의 문헌은 본원에 그 전문이 참고로 도입된다. 유전자 변형 미생물에는, 미생물 내에서 원하는 효과를 제공하도록 핵산 분자들이 삽입, 결실 또는 변형된 (즉, 예를 들어 뉴클레오티드의 삽입, 결실, 치환 및/또는 역위에 의한 돌연변이된) 미생물이 포함될 수 있다.
유전자 변형에 적합한 숙주 미생물의 예로는 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 사카로마이세스 카를스베르겐시스(Saccharomyces carlsbergensis)를 비롯한 효모, 또는 칸디다(Candida), 클루이베로마이세스(Kluyveromyces)와 같은 여타 효모, 또는 다른 진균, 예를 들어 아스페르길루스(Aspergillus), 네우로스포라(Neurospora), 페니실리움(Penicillium) 등과 같은 사상성 진균이 포함되나, 이에 제한되지는 않는다. 또한, 박테리아 세포가 숙주로서 사용될 수 있다. 이러한 것들로는 발효 공정에서 유용할 수 있는 에쉐리히아 콜라이(Escherichia coli)가 포함되나, 이에 제한되지는 않는다. 또한, 비제한적인 예로서 락토바실루스(Lactobacillus) 종 또는 바실루스(Bacillus) 종이 숙주로서 사용될 수 있다.
본 발명에서 사용하기에 특히 바람직한 숙주 세포로는 트라우스토키트리아세애에 속하는 트라우스토키트리움, 자포노키트리움, 아플라노키트리움(Aplanochytrium), 엘리나 및 쉬조키트리움, 및 라비린툴라세애에 속하는 라비린툴라, 라비린툴로이데스 및 라비린토믹사(Labyrinthomyxa)를 비롯한 속으로부터의 미생물이 포함되나, 이에 제한되지는 않는다. 상기 속에 속하는 바람직한 종으로는 라비린툴라에 속하는 임의의 종, 예를 들어 라비린툴라 에스피., 라비린툴라 알게리엔시스(Labyrinthula algeriensis), 라비린툴라 치엔코우스키이(Labyrinthula cienkowskii), 라비린툴라 카토니이(Labyrinthula chattonii), 라비린툴라 코에노키스티스(Labyrinthula coenocystis), 라비린툴라 마크로키스티스(Labyrinthula macrocystis), 라비린툴라 마크로키스티스 아틀란티카(Labyrinthula macrocystis atlantica), 라비린툴라 마크로키스티스 마크로키스티스(Labyrinthula macrocystis macrocystis), 라비린툴라 마그니피카(Labyrinthula magnifica), 라비린툴라 미누타(Labyrinthula minuta), 라비린툴라 로스코펜시스(Labyrinthula roscoffensis), 라비린툴라 발카노비이(Labyrinthula valkanovii), 라비린툴라 비텔리나(Labyrinthula vitellina), 라비린툴라 비텔리나 파키피카(Labyrinthula vitellina pacifica), 라비린툴라 비텔리나 비텔리나(Labyrinthula vitellina vitellina), 라비린툴라 좁피이(Labyrinthula zopfii), 임의의 라비린툴로이데스 종, 예를 들어 라비린툴로이데스 에스피., 라비린툴로이데스 미누타, 라비린툴로이데스 스키조키트롭스(Labyrinthuloides schizochytrops), 임의의 라비린토믹사 종, 예를 들어 라비린토믹사 에스피., 라비린토믹사 폴리아(Labyrinthomyxa pohlia), 라비린토믹사 사우바게아우이(Labyrinthomyxa sauvageaui), 임의의 아플라노키트리움 종, 예를 들어 아플라노키트리움 에스피. 및 아플라노키트리움 케르구엘렌시스(Aplanochytrium kerguelensis), 임의의 엘리나 종, 예를 들어 엘리나 에스피., 엘리나 마리살바(Elina marisalba), 엘리나 시노리피카(Elina sinorifica), 임의의 자포노키트리움 종, 예를 들어 자포노키트리움 에스피., 자포노키트리움 마리눔(Japonochytrium marinum), 임의의 쉬조키트리움 종, 예를 들어 쉬조키트리움 에스피., 쉬조키트리움 아그레가툼(Schizochytrium aggregatum), 쉬조키트리움 리마시눔(Schizochytrium limacinum), 쉬조키트리움 미누툼(Schizochytrium minutum), 쉬조키트리움 옥토스포룸(Schizochytrium octosporum), 및 임의의 트라우스토키트리움 종, 예를 들어 트라우스토키트리움 에스피., 트라우스토키트리움 아그레가툼, 트라우스토키트리움 아루디멘탈레(Thraustochytrium arudimentale), 트라우스토키트리움 아우레움, 트라우스토키트리움 벤티콜라(Thraustochytrium benthicola), 트라우스토키트리움 글로보숨(Thraustochytrium globosum), 트라우스토키트리움 킨네이(Thraustochytrium kinnei), 트라우스토키트리움 모티붐(Thraustochytrium motivum), 트라우스토키트리움 파키데르뭄(Thraustochytrium pachydermum), 트라우스토키트리움 프롤리페룸(Thraustochytrium proliferum), 트라우스토키트리움 로세움(Thraustochytrium roseum), 트라우스토키트리움 스트리아툼(Thraustochytrium striatum), 울케니아 에스피.(Ulkenia sp.), 울케니아 미누타(Ulkenia minuta), 울케니아 프로푼다(Ulkenia profunda), 울케니아 라디아테(Ulkenia radiate), 울케니아 사르카리아나(Ulkenia sarkariana) 및 울케니아 비수르겐시스(Ulkenia visurgensis)가 포함되나, 이에 제한되지는 않는다. 상기 속에 속하는 특히 바람직한 종으로는 임의의 쉬조키트리움 종, 예를 들어 쉬조키트리움 아그레가툼, 쉬조키트리움 리마시눔, 쉬조키트리움 미누툼, 또는 임의의 트라우스토키트리움 종 (울케니아 비수르겐시스, 울케니아 아모에보이다(Ulkenia amoeboida), 울케니아 사르카리아나, 울케니아 프로푼다, 울케니아 라디아타(Ulkenia radiata), 울케니아 미누타 및 울케니아 에스피. BP-5601과 같은 상기한 울케니아 종 포함), 및 트라우스토키트리움 스트리아툼, 트라우스토키트리움 아우레움, 트라우스토키트리움 로세움, 및 임의의 자포노키트리움 종이 포함되나, 이에 제한되지는 않는다. 특히 바람직한 트라우스토키트리알레스 균주로는 쉬조키트리움 에스피. (S31)(ATCC 20888), 쉬조키트리움 에스피. (S8)(ATCC 20889), 쉬조키트리움 에스피. (LC-RM)(ATCC 18915), 쉬조키트리움 에스피. (SR21), 쉬조키트리움 아그레가툼 (골드스타인 및 벨스키)(ATCC 28209), 쉬조키트리움 리마시눔 (혼다 및 요코치)(IFO 32693), 트라우스토키트리움 에스피. (23B)(ATCC 20891), 트라우스토키트리움 스트리아툼 (슈나이더)(ATCC 24473), 트라우스토키트리움 아우레움 (골드스타인)(ATCC 34304), 트라우스토키트리움 로세움 (골드스타인)(ATCC 28210), 및 자포노키트리움 에스피. (L1)(ATCC 28207)가 포함되나, 이에 제한되지는 않는다.
본 발명에 따라, "트라우스토키트리드", "트라우스토키트리알레스 미생물" 및 "트라우스토키트리알레스 목의 미생물"이란 용어/어구는 구별없이 사용될 수 있으며, 트라우스토키트리알레스 목의 임의의 구성원 (트라우스토키트리아세애 과 및 라비린툴라세애 과 포함)을 지칭한다. 본원에서 사용된 "라비린툴리드(Labyrinthulid)" 및 "라비린툴라세애"란 용어는 구체적으로 라비린툴라세애 과의 구성원을 나타낸다. 본원에서 사용된 "트라우스토키트리아세애"란 용어는 구체적으로, 트라우스토키트리아세애 과의 구성원인 트라우스토키트리드를 나타낸다. 따라서, 본 발명에 있어서, 라비린툴리드의 구성원들은 트라우스토키트리드에 포함되는 것으로 간주된다.
개발로 인해, 트라우스토키트리드의 분류학에 대한 개정이 자주 이루어져 왔다. 일반적으로, 분류 이론가들은 트라우스토키트리드를 조류 또는 조류-유사 원생생물에 배치한다. 그러나, 분류학적 불확실성으로 인해, 본 발명에 기재된 균주들을, 다음 유기체들을 포함하는 트라우스토키트리드로 간주하는 것이 본 발명의 목적을 위한 최선이 될 것이다: 목: 트라우스토키트리알레스, 과: 트라우스토키트리아세애 (속: 트라우스토키트리움, 쉬조키트리움, 자포노키트리움, 아플라노키트리움 또는 엘리나) 또는 라비린툴라세애(속: 라비린툴라, 라비린툴로이데스, 또는 라비린토믹사). 또한, 알토르니아(Althornia) 속, 코랄로키트리움(Corallochytrium) 속, 디플로피리스(Diplophyrys) 속 및 피로소루스(Pyrrhosorus) 속은 때때로 트라우스토키트리아세애 과 또는 라비린툴라세애 과에 포함되고, 본 발명의 목적상 트라우스토키트리드 또는 트라우스토키트리알레스 목의 구성원에 포함된다. 본 발명 당시에는 트라우스토키트리드의 분류학에 대한 개정시, 라비린툴로이데스 속이 라비린툴라세애 과에 배치되었고, 트라우스토키트리아세애 과 및 라비린툴라세애 과 둘다가 스트라메노필레(Stramenopile) 계통에 배치된 것임을 인지해야 한다. 때때로, 라비린툴라세애는 라비린툴리드 또는 라비린툴라로 통칭되고, 라비린툴로이데스 또는 트라우스토키트리아세애는 트라우스토키트리드로 통칭되나, 상기 논의된 바와 같이 본 발명의 명료성을 위한 목적상, 트라우스토키트리드는 트라우스토키트리알레스 목의 모든 구성원을 포함하고/거나 트라우스토키트리아세애 및 라비린툴라세애의 구성원을 포함함을 유의해야 한다. 최근의 분류학적 변화가 하기에 요약되어 있다.
본원에 기술된 특정 단세포 미생물 균주들은 트라우스토키트리알레스 목의 구성원이다. 트라우스토키트리드는 진화 분류학적 이력을 갖는 해양 진핵생물이다. 트라우스토키트리드의 분류학적 배치에 관한 문제들은 모스(Moss) (문헌 ["The Biology of Marine Fungi", Cambridge University Press p. 105 (1986)]), 반웹(Bahnweb) 및 잭키(Jackie) (상기 문헌 p. 131) 및 챔벌레인(Chamberlain) 및 모스 (문헌 [Biosystems 21:341 (1988)])가 검토한 바 있다.
편의를 목적으로, 트라우스토키트리드는 처음에는 분류학자들에 의해 다른 무색의 유주자 진핵생물들과 함께 조균류(Phycomycetes) (조류-유사 진균)에 배치되었다. 그러나, 결국 분류명에서 조균류란 명칭이 사라지게 되었고, 트라우스토키트리드는 난균강(Oomycetes) (쌍편모 유주자균(zoosporic fungus))에 배치되었다. 최초에는, 난균강이 이형편모성(heterokont) 조류와 관련이 있는 것으로 가정되었는데, 최종적으로는 광범위한 초미세구조적 및 생화학적 연구 (바(Barr)의 문헌 [Barr. Biosystems 14:359 (1981)]에 요약됨)가 이러한 가정을 뒷받침하였다. 실제, 난균강은 리데일(Leedale) (문헌 [Leedale. Taxon 23:261 (1974)]) 및 다른 조류학자들에 의해 이형편모성 조류의 일부로서 받아들여진 바 있다. 그러나, 난균강 및 트라우스토키트리드는 이들의 종속영양성으로 인한 편의 문제로, 편의상 조류학자 (조류를 연구하는 과학자)보다는 진균학자 (진균을 연구하는 과학자)에 의해 주로 연구되어 왔다.
또다른 분류학적 시각에서, 진화생물학자들은 진핵생물이 어떻게 진화하는지에 대한 2가지 일반 이론을 수립하였다. 한 이론은 일련의 내공생(內共生)을 통한 막-결합 세포소기관의 외인성 기원을 제안하는데 (문헌 [Margulis, 1970, Origin of Eukaryotic Cells. Yale University Press, New Haven]), 예를 들어 미토콘드리아는 박테리아 내공생 생물로부터, 엽록체는 남조류(cyanophytes)로부터, 편모는 스피로캐테스(spirochaetes)로부터 유래된다. 다른 한 이론은 선조 원핵생물의 비-막-결합 시스템으로부터의 막-결합 세포소기관이 자생 프로세스를 통해 단계적으로 진화하는 것을 제안한다 (문헌 [Cavalier-Smith, 1975, Nature (Lond.) 256:462-468]). 그러나, 두 부류의 진화생물학자들 모두 난균강 및 트라우스토키트리드를 진균으로부터 분리시켜 이들을 황조류(chromophyte) 조류와 함께 황색조식물(Chromophyta) 계 (문헌 [Cavalier-Smith BioSystems 14:461 (1981)]) (이 계는 더욱 최근에 다른 원생생물을 포함하도록 확장되었고, 상기 계의 구성원은 현재 스트라메노필레로 지칭됨)에 배치하거나, 또는 모든 조류와 함께 원생생물계 (문헌 [Margulis and Sagen. Biosystems 18: 141 (1985)])에 배치하였다.
전자 현미경의 발달로, 트라우스토키트리드의 두 속인 트라우스토키트리움 및 쉬조키트리움의 유주자의 초미세구조에 대한 연구 (문헌 [Perkins, 1976, "Recent Advances in Aquatic Mycology" (ed. E. B. G. Jones), pp. 279-312, John Wiley & Sons, New York], [Kazama. Can. J. Bot. 58:2434 (1980)], [Barr, 1981, Biosystems 14:359-370])는 트라우스토키트리아세애가 난균강에 막연하게만 관련되어 있다는 우수한 증거를 제공하였다. 또한, 5-S 리보좀 RNA 서열의 상응하는 분석을 제공하는 유전자 데이타 (다변량 통계학의 형태)는, 트라우스토키트리알레스가 진균류와는 완전히 별개이며 적조류(red algae) 및 갈조류(brown algae) 및 난균강의 구성원과 가장 밀접하게 관련된, 명백히 독특한 진핵생물 군임을 시사한다 (문헌 [Mannella et al. Mol. Evol. 24:228 (1987)]). 대부분의 분류학자들은 트라우스토키트리드를 난균강으로부터 분리하는 것에 동의하였다 (문헌 [Bartnicki-Garcia. "Evolutionary Biology of the Fungi" (eds. Rayner, A. D. M., Brasier, C. M. & Moore, D.), p. 389, Cambridge University Press, Cambridge]).
요약하면, 카발리에-스미스 (Cavalier-Smith) (문헌 [Cavalier-Smith. BioSystems 14:461 (1981)], [Cavalier-Smith. Microbiol Rev. 57: 953 (1993)])의 분류학 시스템에 따르면, 트라우스토키트리드는 황색조식물 (스트라메노필레) 계에 속하는 황조류 조류로 분류된다. 보다 최근에는, 트라우스토키트리드가 진균류가 아니라 크로미스트(chromist)임을 입증하는 이형편모류(Heterokonta)의 18s rRNA 서명을 이용한 카발리에-스미스 등에 의해 상기 분류학적 배치가 재확인되었다 (문헌 [Cavalier-Smith et al. Phil. Tran. Roy. Soc. London Series BioSciences 346:387 (1994)]). 이에 따라 트라우스토키트리드는 진균류와 완전히 상이한 계에 배치되는데, 모두 진진균류(Eufungi) 계에 배치된다.
현재, 71개의 개별적인 진핵 유기체 군이 존재하고 (문헌 [Patterson. Am. Nat. 154:S96 (1999)]), 이들 군 중 4개의 주요 계통이 어느 정도 확실하게 확인되었다: (1) 알베오라테(Alveolate), (2) 스트라메노필레, (3) 육지 식물-녹조류-홍조류_회조류(Rhodophyte_Glaucophyte) ("식물") 클레이드(clade) 및 (4) 후편모성(Opisthokont) 클레이드 (진균류 및 동물). 이전까지는, 상기 4개의 주요 계통이 계로 분류되었으나, 일부 연구자들은 "계" 개념을 사용하는 것이 더 이상 유용하지 않다고 생각한다.
암스트롱(Armstrong)이 언급한 바와 같이, 스트라메노필레는 3부분으로 갈라진 관상형 헤어(hair)를 지칭하고, 이러한 계통의 대부분의 구성원은 그와 같은 헤어를 갖는 편모를 갖는다. 스트라메노필레 (단세포성 생물, 정자, 유주자)의 운동성 세포는 측면으로 삽입된 2개의 편모, 즉 편모의 추력(thrust)에 역행하는 3부분으로 갈라진 관상형 헤어를 갖는 긴 편모와 짧고 매끄러운 편모를 갖는 비대칭형이다. 이전에는, 군이 덜 광범위했을 때, 스트라메노필레는 크로미스타 (Chromista) 계 또는 이형편모성 (=상이한 편모) 조류로 칭해졌는데, 이러한 군들이 황녹 조류(yellow-green Algae), 황갈 조류(Golden-brown Algae), 유스티그마토파이트(Eustigmatophyte) 및 규조류(Diatom)와 함께 갈조류(Brown Algae 또는 Phaeophyte)로 구성되었기 때문이다. 그후, 일부 타가영양성 진균-유사 유기체, 수생 균류, 및 라비린툴리드 (점액 망상(net) 아메바)가 유사한 운동성 세포를 갖는 것으로 발견되어, 광합성 색소 또는 조류를 지칭하는 군 명칭이 부적절하게 되었다. 현재, 스트라메노필레 계통에 속하는 2개의 과는 라비린툴라시애 및 트라우스토키트리아세애이다. 역사적으로, 이러한 독특한 미생물에 대한 수많은 분류 전략이 존재하였으며, 이들 미생물은 종종, 동일한 목 (즉, 트라우스토키트리알레스) 하에 분류된다. 이러한 군의 구성원들의 관계는 여전히 밝혀지고 있다. 포터(Porter) 및 리앤더(Leander)는 단일 계통 내의 트라우스토키트리드-라비린툴리드 클레이드를 가리키는 18S 소형 서브유닛 리보좀 DNA를 기초로 하는 데이타를 수립하였다. 그러나, 상기 클레이드는 2개의 분지에 의해 뒷받침되고, 제1 분지는 트라우스토키트리움의 3가지 종 및 울케니아 프로푼다를 포함하며, 제2 분지는 라비린툴라의 3가지 종, 라비린툴로이데스의 2가지 종 및 쉬조키트리움 아그레가툼을 포함한다.
따라서, 본 발명에서 사용되는 트라우스토키트리드의 분류학적인 배치는 다음과 같이 요약된다:
계: 황색조식물 (스트라메노필레)
문: 이형편모류
목: 트라우스토키트리알레스 (트라우스토키트리드)
과: 트라우스토키트리아세애 또는 라비린툴라시애
속: 트라우스토키트리움, 쉬조키트리움, 자포노키트리움, 아플라노키트리움, 엘리나, 라비린툴라, 라비린툴로이데스 또는 라비린툴로믹사.
예전 분류학자들 중 일부는 트라우스토키트리움 속의 몇몇의 고유 구성원들 (아메바 모양의 생활 단계를 갖는 미생물)을, 울케니아로 불리는 별개의 속으로 분리하였다. 그러나, (모두는 아니어도) 거의 대부분의 트라우스토키트리드 (트라우스토키트리움 및 쉬조키트리움 포함)가 아메바 모양의 단계를 나타내고, 따라서 일부는 울케니아를 유용한 속으로 간주하지 않는 것으로 현재 알려져 있다. 본원에서 사용된 트라우스토키트리움 속은 울케니아를 포함할 것이다.
문 및 계의 상위 분류 내에서의 분류학적 배치의 불확실성에도 불구하고, 트라우스토키트리드는 그 구성원이 여전히 트라우스토키트리알레스 목 내에서 분류가능한 개별적이고 특징적인 분류를 유지한다.
본 발명의 또다른 실시양태는, 본원에 기재된 바와 같은 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 하나 이상의 생물학적 활성 도메인 또는 단백질을 포함하는 PKS 시스템을 재조합 발현하도록 유전자 변형된 유전자 변형 식물에 관한 것이다. PUFA PKS 시스템의 도메인에는, 상기 기재된 바와 같은 PUFA PKS 시스템의 임의의 도메인 (그의 상동체 포함)이 포함될 수 있고, 또한 임의의 박테리아 또는 비-박테리아 미생물 (임의의 진핵 미생물 및 임의의 트라우스토키트리드 미생물, 예를 들어 쉬조키트리움 및/또는 트라우스토키트리움 포함)로부터의 PUFA PKS 시스템의 임의의 도메인, 또는 상기 미국 특허 출원 제10/124,800호에 기재된 스크리닝 방법에 의해 동정된 미생물로부터의 PUFA PKS 시스템의 임의의 도메인이 포함될 수 있다. 또한, 식물은 또다른 PKS 시스템, 예를 들어 제I형 PKS 시스템 (반복형 또는 모듈형), 제II형 PKS 시스템 및/또는 제III형 PKS 시스템 (이에 제한되지는 않음)의 하나 이상의 도메인 또는 그의 생물학적 활성 단편으로 추가로 변형시킬 수 있다. 식물의 변형에는, PUFA PKS 시스템의 하나 이상의 도메인 (도메인의 일부 포함), PUFA PKS 시스템의 둘 이상 또는 여러 도메인 (인접 도메인, 비-인접 도메인, 또는 PUFA PKS 시스템의 상이한 단백질 상에 있는 도메인 포함), PUFA PKS 시스템의 전체 단백질, 및 전체 PUFA PKS 시스템 (예컨대, PUFA PKS 유전자에 의해 코딩된 모든 단백질) 또는 심지어 둘 이상의 PUFA PKS 시스템 (예컨대, DHA를 천연적으로 생산하는 유기체로부터의 시스템 및 EPA를 천연적으로 생산하는 유기체로부터의 시스템)의 변형 및/또는 이용이 포함될 수 있다.
본원에서 사용되는 유전자 변형 식물에는 고급식물, 특히 임의의 소비가능한 식물, 또는 본 발명의 원하는 생물활성 분자의 생산에 유용한 식물을 비롯한 임의의 유전자 변형 식물이 포함될 수 있다. 본원에서 사용된 "식물의 일부"에는 식물의 임의의 부분, 예를 들어 씨, 꽃가루, 배아, 꽃, 열매, 새싹, 잎, 뿌리, 줄기, 외식편 등이 포함되나, 이에 제한되지는 않는다. 유전자 변형 식물은, 원하는 결과 (즉, PUFA PKS 활성의 증가 또는 변형, 및/또는 PKS 시스템을 이용한 원하는 생성물의 생산)가 달성되도록 정상 (즉, 야생형 또는 천연 발생) 형태로부터 변형된 (즉, 돌연변이 또는 변화된) 게놈을 갖는다. 식물의 유전자 변형은 전통적인 균주 개발 및(또는) 분자유전학적 기술에 의해 달성될 수 있다. 원하는 아미노산 서열을 코딩하는 재조합 핵산 분자가 식물의 게놈에 도입된 트랜스제닉(transgenic) 식물의 생산 방법은 당업계에 알려져 있다. 본 발명에 따라 유전자 변형시키기에 바람직한 식물로는 인간을 비롯한 동물이 소비하기에 적합한 식물이 바람직하다.
본 발명에 따라 유전자 변형시키기에 바람직한 식물 (즉, 식물 숙주 세포)로는 쌍떡잎 및 외떡잎 식물을 비롯한 임의의 고등 식물, 특히 작물 (특히, 오일이 사용되는 식물)을 비롯한 소비가능한 식물이 포함되나, 이에 제한되지는 않는다. 이러한 식물에는, 예를 들어 캐놀라, 대두, 평지씨, 아마씨, 옥수수, 잇꽃, 해바라기 및 담배가 포함될 수 있다. 여타 바람직한 식물로는 약제, 향미료, 영양 약제(neutraceutical agent), 기능성 식품 원료 또는 화장 활성 작용제로서 사용되는 화합물을 생산하는 것으로 알려져 있는 식물, 또는 이들 화합물/작용제의 생산을 위해 유전공학적으로 조작된 식물이 포함된다.
본 발명에 따라, 유전자 변형 미생물 또는 식물에는 재조합 기술이나, 전통적인 돌연변이유발법 및 스크리닝 기술에 의해 변형된 미생물 또는 식물이 포함된다. 본원에서 사용된 바와 같이, 유전자 발현, 유전자 기능, 또는 유전자 생성물 (즉, 유전자에 의해 코딩된 단백질)의 기능의 감소를 초래하는 유전자 변형은 유전자의 (완전 또는 부분) 불활성화, 결실, 중단, 차단 또는 하향-조절을 의미할 수 있다. 예를 들어, 코딩된 단백질의 기능의 감소를 초래하는 유전자에서의 유전자 변형은 유전자의 완전한 결실 (즉, 유전자가 존재하지 않고, 따라서 단백질이 존재하지 않음), 단백질의 불완전한 번역 또는 무번역을 초래하는 유전자 돌연변이 (예를 들어, 단백질이 발현되지 않음), 또는 단백질의 고유 기능을 감소 또는 파괴시키는 유전자 돌연변이 (예를 들어, 효소적 활성 또는 작용이 감소되었거나 없는 단백질이 발현됨)의 결과일 수 있다. 유전자 발현 또는 기능의 증가를 초래하는 유전자 변형은 유전자의 증폭, 과다생산, 과발현, 활성화, 증대, 부가 또는 상향-조절을 의미할 수 있다.
본 발명에 따른 미생물 또는 식물의 유전자 변형은, 미생물 또는 식물에 의해 발현된 PKS 시스템의 활성에 바람직하게 영향을 미치며, 여기서 상기 PKS 시스템은 내인성이면서 유전자 변형되었거나, 또는 내인성이면서 유기체로 재조합 핵산 분자가 도입되었거나 (내인성 시스템의 변형은 선택적임), 또는 완전히 재조합 기술에 의해 제공된 시스템이다. PUFA PKS 시스템, 또는 이러한 시스템을 발현하는 유기체의 PUFA 생산 프로파일을 변경하는 경우는, 숙주 미생물 또는 식물이 1종 이상의 임의의 PUFA (또는 PUFA PKS 시스템에 의해 생산되는 다른 생물활성 분자)를 생산시, 유전자 변형이 없는 경우에 비해 (즉, 변형되지 않은 야생형 미생물 또는 식물, 또는 적어도 PUFA 합성과 관련하여 변형되지 않은 미생물 또는 식물 (즉, 유기체는 PUFA 합성과 관련되지 않은 여타 변형은 가질 수 있음)에 비해) 검출가능하거나 측정가능한 임의의 변화가 초래되는 경우를 포함한다. PKS 시스템의 활성에 영향을 미치는 경우는, 유전자 변형이 없는 경우에 비해, 임의의 유전자 변형이, 유기체에 의해 발현된 PKS 시스템에서의 검출가능하거나 측정가능한 임의의 변화를 초래하는 경우를 포함한다. PKS 시스템 상의 검출가능한 변화 또는 변형에는, 유전자 변형이 없는 내인성 PUFA PKS 시스템과 비교시 변형된 PUFA PKS 시스템의 하나 이상의 임의의 도메인의 발현 및/또는 생물학적 활성의 변화 또는 변형 (도입, 증가 또는 감소), 유기체가 측정가능한/검출가능한 PKS 시스템 활성 (예를 들어, PUFA PKS 시스템의 생성물의 생산)을 갖도록 유기체로의 PKS 시스템 활성 도입 (즉, 유기체는 유전자 변형 전 PKS 시스템 또는 PUFA PKS 시스템을 함유하지 않음), PKS 시스템 활성이 변형되도록, 유기체에 의해 내인적으로 발현된 PKS 시스템과 상이한 PKS 시스템으로부터의 기능성 도메인을 유기체로 도입 (예컨대, 본원에 기재된 바와 같은 박테리아 PUFA PKS 도메인을, 비-박테리아 PUFA PKS 시스템을 내인적으로 발현하는 유기체 (예를 들어, 트라우스토키트리드)에 도입함), PKS 시스템에 의해 생산된 생물활성 분자 (예컨대, PUFA)의 양의 변화 (예컨대, PKS 시스템은 유전자 변형이 없는 경우에 비해 주어진 생성물을 보다 많거나 (양의 증가) 또는 보다 적게 (양의 감소) 생산함), PKS 시스템에 의해 생산된 생물활성 분자 유형의 변화, 예를 들어 PUFA 유형의 변화 (예컨대, PKS 시스템은 또다른 PUFA 또는 상이한 PUFA, 또는 새롭거나 상이한 생성물, 또는 PKS 시스템에 의해 천연적으로 생단된 PUFA 또는 여타 생성물의 변이체를 생산함), 및/또는 PKS 시스템에 의해 생산된 다수의 생물활성 분자들의 비율 변화 (예컨대, PKS 시스템은 특정 PUFA 대 또다른 PUFA의 상이한 비율을 생성하거나, 유전자 변형이 없는 경우와 비교시 완전하게 상이한 지질 프로파일을 생성하거나, 또는 천연 배열과 비교시 각종 PUFA를 트리아실글리세롤 중의 상이한 위치에 배치함)이 포함될 수 있으나, 이에 제한되지는 않는다. 이러한 유전자 변형에는 임의 유형의 유전자 변형이 포함되고, 구체적으로는 재조합 기술 및/또는 전통적인 돌연변이유발법에 의한 변형이 포함된다.
PUFA PKS 시스템의 기능성 도메인 또는 단백질의 활성을 증가시키는 것은, 도메인 또는 단백질 시스템의 기능성의 증가를 초래하는, 도메인 또는 단백질을 함유하는 (또는 도메인 또는 단백질이 도입될) 유기체에서의 임의의 유전자 변형을 의미하고, 도메인 또는 단백질의 활성 (예를 들어, 특이적 활성 또는 생체내 효소 활성)의 증가, 도메인 또는 단백질 시스템의 억제 또는 분해의 감소, 및 도메인 또는 단백질의 과발현을 포함할 수 있음을 유의해야 한다. 예를 들어, 유전자 카피수가 증가될 수 있거나, 천연 프모로터보다 더 높은 수준의 발현을 제공하는 프로모터의 사용에 의해 발현 수준이 증가될 수 있거나, 또는 유전자에 의해 코딩된 도메인 또는 단백질의 활성을 증가시키기 위한 유전공학적 조작 또는 전통적인 돌연변이유발법에 의해 유전자가 변경될 수 있다.
이와 유사하게, PUFA PKS 시스템의 기능성 도메인 또는 단백질의 활성이 감소하는 것은, 도메인 또는 단백질의 기능성의 감소를 초래하는, 이러한 도메인 또는 단백질을 함유하는 유기체 (또는 도메인 또는 단백질이 도입될 유기체)에서의 임의의 유전자 변형을 의미하고, 도메인 또는 단백질 활성의 감소, 도메인 또는 단백질의 억제 또는 분해의 증가, 및 도메인 또는 단백질 발현의 감소 또는 제거를 포함한다. 예를 들어, 본 발명의 도메인 또는 단백질의 생산을 차단 또는 감소시키거나, 도메인 또는 단백질을 코딩하는 유전자 또는 그의 일부를 "넉아웃"시키거나, 도메인 또는 단백질 활성을 감소시키거나, 또는 도메인 또는 단백질 활성을 억제함으로써 본 발명의 도메인 또는 단백질의 작용을 감소시킬 수 있다. 도메인 또는 단백질의 생산을 차단 또는 감소시키는 경우는, 도메인 또는 단백질을 코딩하는 유전자를 성장 배지 내에서 유도 화합물의 존재가 요구되는 프로모터의 제어 하에 놓는 것을 포함할 수 있다. 유도인자가 배지로부터 고갈되도록 하는 조건을 구축함으로써, 도메인 또는 단백질을 코딩하는 유전자의 발현 (및 이에 따른 단백질 합성의 발현)이 중지될 수 있다. 본 발명자들은 실시예 단락에서, 트라우스토키트리드 미생물의 표적화 유전자를 결실 (넉아웃)시킬 수 있는 능력을 입증한다. 또한, 도메인 또는 단백질 활성을 차단 또는 감소시키는 경우는 미국 특허 제4,743,546호 (본원에 참고로 도입됨)에 기재된 것과 유사한 절단 기술 방법을 이용하는 경우를 포함할 수 있다. 이러한 방법을 이용하기 위해서는, 유전자가 게놈으로부터 특이적으로 제어 절단될 수 있도록 하는 특정 유전자 서열들 사이에, 관심 단백질을 코딩하는 유전자를 클로닝한다. 예를 들어, 미국 특허 제4,743,546호에서와 같은 배양물의 배양 온도의 이동에 의해, 또는 일부 다른 물리적 또는 영측면의 신호에 의해 절단을 촉진할 수 있다.
본 발명의 한 실시양태에서, 미생물의 내인성 PUFA PKS 시스템은 예를 들어, 전통적인 돌연변이유발법 및 선별 기술 및/또는 분자유전학적 기술 (유전공학적 기술 포함)에 의해 유전자 변형된다. 유전공학적 기술에는 예를 들어, 표적화 재조합 벡터를 이용하여 내인성 유전자의 일부를 결실시키거나 (실시예에서 입증됨) 내인성 유전자의 일부를 이종 서열로 대체하는 기술이 포함될 수 있다 (실시예에서 입증됨). 숙주 게놈에 도입될 수 있는 이종 서열의 예로는 또다른 PKS 시스템 또는 심지어 전체 PUFA PKS 시스템 (예컨대, PUFA PKS 시스템과 관련된 모든 유전자)으로부터의 하나 이상의 기능성 PUFA PKS 도메인 또는 단백질을 코딩하는 서열이 포함된다. 또한, 이종 서열은 PUFA PKS 시스템으로부터의 천연 도메인의 변형된 기능성 도메인 (상동체)을 코딩하는 서열을 포함할 수 있다. 숙주 게놈에 도입될 수 있는 여타 이종 서열에는, PKS 시스템 자체의 도메인은 아니나 내인성 PKS 시스템의 활성에 영향을 미치는 단백질 또는 기능성 도메인을 코딩하는 서열이 포함된다. 예를 들어, 포스포판테테이닐 트랜스퍼라제를 코딩하는 핵산 분자를 숙주 게놈에 도입할 수 있다. 내인성 PUFA PKS 시스템에 가해질 수 있는 특이적 변형은 본원에 상세하게 논의되어 있다.
또한, 유전자 변형 식물의 생성과 관련하여, 식물의 유전공학적 조작을 위한 방법들이 당업계에 잘 알려져 있다. 예를 들어, 생물학적 및 물리적 형질전환 프로토콜을 비롯한 수많은 식물 형질전환 방법이 개발되었다. 예를 들어, 문헌 [Miki et al., "Procedures for Introducing Foreign DNA into Plants", Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. and Thompson, J. E. Eds. (CRC Press, Inc., Boca Raton, 1993) pp. 67-88]을 참조한다. 또한, 식물 세포 또는 조직의 형질전환 및 식물의 재생을 위한 벡터 및 시험관내 배양 방법이 이용될 수 있다. 예를 들어, 문헌 [Gruber et al.,"Vectors for Plant Transformation", Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. and Thompson, J. E. Eds. (CRC Press, Inc., Boca Raton, 1993) pp. 89-119]를 참조한다.
발현 벡터를 식물에 도입하기 위해 가장 널리 이용되는 방법은 아그로박테리움의 천연 형질전환 시스템을 기초로 한다. 예를 들어, 문헌 [Horsch et al., Science 227:1229 (1985)]를 참조한다. 아그로박테리움 투메파시엔스(A. tumefaciens) 및 아그로박테리움 리조게네스(A. rhizogenes)는 식물 세포를 유전적으로 형질전환시키는 식물 병원성 토양 박테리아이다. 아그로박테리움 투메파시엔스 및 아그로박테리움 리조게네스의 Ti 및 Ri 플라스미드는 각각 식물의 유전적 형질전환을 초래하는 유전자를 갖는다. 예를 들어, 문헌 [Kado, C. I., Crit. Rev. Plant. Sci. 10:1 (1991)]을 참조한다. 그루버 등의 상기 문헌, 미키 등의 상기 문헌, 문헌 [Moloney et al., Plant Cell Reports 8:238 (1989)], 및 미국 특허 제4,940,838호 및 제5,464,763호를 비롯한 수많은 참고문헌에는 아그로박테리움 벡터 시스템 및 아그로박테리움-매개 유전자 전달 방법에 대한 설명이 제공되어 있다.
일반적으로 적용가능한 또다른 식물 형질전환 방법은 미세발사체(microprojectile)의 표면 상으로 DNA가 운반되는 미세발사체-매개 형질전환이다. 발현 벡터는, 식물 세포의 벽 및 막을 관통하기에 충분한 속도로 미세발사체를 가속시키는 생탄도 장치에 의해 식물 조직 내로 도입된다. 문헌 [Sanford et al., Part. Sci. Technol. 5:27 (1987)], [Sanford, J. C., Trends Biotech. 6:299 (1988)], [Sanford, J. C., Physio. Plant 79:206 (1990)], [Klein et al., Biotechnology 10:268 (1992)]를 참조한다.
DNA를 식물에게 물리적으로 전달하기 위한 또다른 방법은 표적 세포의 초음파 처리이다 (문헌 [Zhang et al., Bio/Technology 9:996 (1991)]). 별법으로, 리포좀 또는 스페로플라스트(speroplast) 융합물을 이용하여 발현 벡터를 식물에 도입하는 방법이 있다 (문헌 [Deshayes et al., EMBO J., 4:2731 (1985)], [Christou et al., Proc Natl. Acad. Sci. USA 84:3962 (1987)]). 또한, CaCl2 침전, 폴리비닐 알콜 또는 폴리-L-오르니틴을 이용하여 DNA를 원형질체로 직접 흡수시키는 방법이 보고된 바 있다 (문헌 [Hain et al., Mol. Gen. Genet. 199:161 (1985)] 및 [Draper et al., Plant Cell Physiol. 23:451 (1982)]). 또한, 원형질체 및 전체 세포 및 조직의 전기천공이 기술된 바 있다 (문헌 [Donn et al., In Abstracts of VIIth International Congress on Plant Cell and Tissue Culture IAPTC, A2-38, p. 53 (1990)], [D'Halluin et al., Plant Cell 4:1495-1505 (1992)] 및 [Spencer et al., Plant Mol. Biol. 24:51-61 (1994)]).
본 발명의 상기 실시양태의 한 측면에서, 유기체 (미생물 또는 식물)의 유전자 변형에는 (1) PUFA PKS 시스템의 하나 이상의 생물학적 활성 도메인을 갖는 아/미노산 서열을 코딩하는 재조합 핵산 분자를 숙주에 도입하는 것, 및/또는 (2) PUFA PKS 시스템의 활성에 영향을 미치는 1종 이상의 단백질 또는 기능성 도메인을 코딩하는 재조합 핵산 분자를 숙주에 도입하는 것이 포함될 수 있다. 숙주에는 (1) 임의의 PKS 시스템을 발현하지 않는 숙주 세포 (PKS 시스템의 모든 기능성 도메인이 숙주 세포에 도입되고, 적어도 하나의 기능성 도메인이 본원에 기재된 바와 같은 PUFA PKS 시스템으로부터 나옴), (2) 본원에 기재된 PUFA PKS 시스템의 하나 이상의 기능성 도메인을 갖는 (내인성 또는 재조합) PKS 시스템을 발현하는 숙주 세포, 및 (3) 본원에 기재된 PUFA PKS 시스템으로부터의 도메인 기능을 반드시 포함하지는 않는 (내인성 또는 재조합) PKS 시스템을 발현하는 숙주 세포 (이 경우, 숙주 세포에 도입된 재조합 핵산 분자는, 본원에 기재된 PUFA PKS 시스템의 하나 이상의 기능성 도메인을 코딩하는 핵산 서열을 포함함)가 포함될 수 있다. 다시 말하면, 본 발명은 본원에 기재된 PUFA PKS 시스템 (예컨대, 쉐바넬라 자포니카 또는 쉐바넬라 올레야나로부터의 시스템, 또는 이들 미생물로부터 유래된 시스템)으로부터의 하나 이상의 도메인을 (내인적으로, 또는 재조합 변형에 의한 도입을 통해) 포함하는 임의의 유전자 변형 유기체 (예컨대, 미생물 또는 식물)를 포함한다 (여기서, 유전자 변형은 숙주 세포의 PUFA PKS 활성에 상당한 영향을 미침).
본 발명은 특히, 미생물 및 식물을 유전자 변형시켜, 그 미생물 및 식물에 의한 PUFA PKS 생성물의 생산에 영향을 주기 위한, 본원에 기재된 해양 박테리아로부터의 PUFA PKS 시스템 및 그의 일부의 용도에 관한 것이다. 상기 논의된 바와 같이, 본 발명의 실시양태에서 유용한 박테리아는 약 20℃에 근접하거나 이를 초과하는 온도, 바람직하게는 약 25℃에 근접하거나 이를 초과하는 온도, 훨씬 더 바람직하게는 약 30℃에 근접하거나 이를 초과하는 온도 (또는, 20℃ 내지 3O℃ 또는 그 이상 사이에서 1℃씩 증가시킨 임의의 온도, 예컨대 21℃, 22℃, 23℃ ...)에서 성장할 수 있으며, 상기 온도에서 PUFA를 생산할 수 있는 PUFA PKS 시스템 (예컨대, 상기 온도에서 잘 기능할 수 있는 효소 및 단백질)을 갖는다. 바람직한 실시양태에서, 박테리아는 상기 온도에서 PUFA를 생산한다. 본원에서 앞서 기재된 바와 같이, 해양 박테리아인 다른 쉐바넬라 에스피. (예컨대, 균주 SCRC2738) 및 비브리오 마리누스 (미국 특허 제6,140,486호에 기재되어 있음)는 PUFA를 생산하지 않고 (또는, 실질적으로 검출가능한 수준 미만으로 PUFA를 생산하고), (성장하더라도) 보다 높은 온도 (예컨대, 20℃ 이상의 온도)에서는 잘 성장하지 않는데, 이로써 특히 현장 조건 하의 식물 용도에 있어서, 상기 박테리아로부터 유래된 PUFA PKS 시스템의 유용성이 제한된다.
본 발명의 한 실시양태에서, PUFA PKS 시스템을 가지며, 높은 온도에서 성장 및 PUFA를 생산할 수 있는 추가적인 박테리아를 확인할 수 있다. 예를 들어, 진핵세포 성장 억제제, 예를 들어 니스타틴(nystatin) (항진균제) 또는 시클로헥스이미드 (진핵생물 단백질 합성의 억제제)를, 해양 또는 하구 서식지와 같은 유형의 서식지/적소 또는 박테리아가 발견될 수 있는 여타 임의의 서식지로부터 수집된 물 샘플/토양 샘플로부터의 최초 균주를 배양/선별하는 데 사용되는 한천 플레이트에 첨가할 수 있다. 이러한 프로세스는 진핵생물 균주의 오염 없이 (또는 최소한으로 오염된) 박테리아 균주를 풍부화하기 위한 선별을 보조할 것이다. 이러한 선별 프로세스는, 플레이트를 승온 (예컨대, 20 내지 30℃, 또는 25 내지 30℃)에서 배양한 후에 1종 이상의 PUFA를 생산하는 균주를 선별하는 단계와 병행되어, 최초에는 (약 20℃ 미만, 더욱 바람직하게는 약 5℃ 미만의 온도에서만 PUFA를 생산하는 선행 기술의 박테리아 균주와는 달리) 승온에서 작용하는 PUFA PKS 시스템을 갖는 후보 박테리아 균주를 확인한다. 임의의 박테리아 공급원으로부터의 유전자에 있어서 보다 높은 온도에서의 PUFA PKS 기능을 평가하기 위해, 세포-무함유 추출물을 생산하고, 다양한 온도에서 PUFA 생산에 대해 시험한 다음, 보다 높은 온도 범위 (예컨대, 15℃, 20℃, 25℃, 또는 3O℃ 또는 심지어 그 이상)에서 효소적/생물학적 활성을 갖는 PUFA PKS 유전자를 함유하는 미생물을 선별할 수 있다. 본 발명자들은 PUFA PKS 유전자의 공급원으로서 특히 적합한 2종의 예시적인 박테리아 (예컨대, 쉐바넬라 올레야나 및 쉐바넬라 자포니카, 실시예 참조)를 확인하였고, 쉽게 확인될 수 있거나 PUFA PKS 유전자를 포함하는 것으로 알려져 있는 여타 미생물도 본 발명의 실시양태에서 유용할 수 있다 (예컨대, 쉐바넬라 겔리디마리나(Shewanella gelidimarina)).
본원에 기재된 특정 해양 박테리아로부터의 PUFA PKS 시스템 뿐만 아니라, 선행 기술의 비-박테리아 PUFA PKS 시스템 (예를 들어, 트라우스토키트리드로부터의 PUFA PKS 유전자를 이용함) 및 여타 진핵생물 PUFA PKS 시스템을 이용하고, PUFA 생성물의 범위에 EPA, DHA, ARA, GLA, SDA 등 (하기에 상세하게 기재되어 있음)이 포함되도록 그 범위를 확장하면서, 다양한 생물활성 분자 (항생제 포함), 다른 제약 화합물, 및 여타 바람직한 생성물을 생산하기 위해 유전자 혼합을 이용할 수 있다. 상기 생물활성 분자를 얻기 위한 방법에는 각종 유기체로부터의 유전자의 혼합 뿐만 아니라, 본원에 개시된 PUFA PKS 유전자를 유전자 변형시키기 위한 각종 방법도 포함된다. 본 발명의 박테리아 PUFA PKS 시스템의 유전적 기반 및 도메인 구조에 대한 정보는 다양한 생물활성 분자를 생산하는 새로운 유전자 변형 유기체를 설계하기 위한 토대를 제공한다. 특히, 본원에 기재된 박테리아 PUFA PKS 유전자를 사용함으로써, 선행 기술의 해양 박테리아로부터의 PUFA PKS 유전자를 이용시에 가능했던 것보다 높은 온도에서 기능하며 높은 수준으로 생성물을 생산하는 변형된 PUFA PKS 시스템을 생산할 수 있는 능력이 신장된다. 임의의 PKS 도메인 및 관련 유전자의 혼합 및 변형이 본 발명자들에 의해 고려되나, 예를 들어 유전자 변형 및 생물활성 분자 생산과 관련하여 PUFA-PKS 시스템의 가능한 각종 조작이 아래에서 논의된다.
상기 기재된 해양 박테리아 PUFA PKS 유전자와 함께 사용하기에 특히 유용한 PUFA PKS 유전자 및 단백질에는, 트라우스토키트리드로부터의 PUFA PKS 유전자, 예를 들어 쉬조키트리움 및 트라우스토키트리움으로 동정된 것들이 포함된다. 이러한 유전자는 본원에 기재된 해양 박테리아 유전자로부터의 각종 유전자, 그의 일부 및 그의 상동체와 함께, 변형, 표적화, 숙주 세포로의 도입 및/또는 달리 상기 논의된 유전자 혼합 및 변형에 있어 특히 유용하다. 이들은 상기 미국 특허 출원 제10/810,352호 (트라우스토키트리움), 상기 미국 특허 출원 제10/124,800호 (쉬조키트리움) 및 상기 미국 특허 제6,566,583호 (쉬조키트리움)에 상세하게 기재되어 있다. 쉬조키트리움 및 트라우스토키트리움의 PUFA PKS 유전자들은 3종의 다중-도메인-코딩 오픈 리딩 프레임 (본원에서 OrfA, OrfB 및 OrfC로 지칭됨)으로 구분된다.
쉬조키트리움 OrfA에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 13으로 표시된다. OrfA는 본원에서 서열 14로 표시되는 2910개 아미노산 서열을 코딩하는 8730개 뉴클레오티드 서열 (정지 코돈 미포함)이다. OrfA 내에는 12개의 도메인이 존재한다: (a) 1개의 β-케토아실-ACP 신타제 (KS) 도메인 (서열 14의 위치 약 1 내지 위치 약 500으로 표시됨), (b) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인 (서열 14의 위치 약 575 내지 위치 약 1000으로 표시됨), (c) 9개의 아실 운반체 단백질 (ACP) 도메인 (서열 14의 위치 약 1095 내지 위치 약 2096으로 표시됨, 9개의 ACP 도메인 각각에 대한 활성 부위 세린 잔기 (즉, 판테테인 결합 부위)의 위치는 서열 14의 아미노산 서열을 기준으로 ACP1 = S1157, ACP2 = S1266, ACP3 = S1377, ACP4 = S1488, ACP5 = S1604, ACP6 = S1715, ACP7 = S1819, ACP8 = S1930, 및 ACP9 = S2034임), 및 (d) 1개의 β-케토아실-ACP 리덕타제 (KR) 도메인 (서열 14의 위치 약 2200 내지 위치 약 2910으로 표시됨).
쉬조키트리움 OrfB에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 15으로 표시된다. OrfB는 본원에서 서열 16으로 표시되는 2059개 아미노산 서열을 코딩하는 6177개 뉴클레오티드 서열 (정지 코돈 미포함)이다. OrfB 내에는 4개의 도메인이 존재한다: (a) 1개의 β-케토아실-ACP 신타제 (KS) 도메인 (서열 16의 위치 약 1 내지 위치 약 450으로 표시됨), (b) 1개의 쇄 길이 인자 (CLF) 도메인 (서열 16의 위치 약 460 내지 위치 약 900으로 표시됨), (c) 1개의 아실트랜스퍼라제 (AT) 도메인 (서열 16의 위치 약 901 내지 위치 약 1400으로 표시됨), 및 (d) 1개의 에노일-ACP 리덕타제 (ER) 도메인 (서열 16의 위치 약 1550 내지 위치 약 2059로 표시됨).
쉬조키트리움 OrfC에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 17로 표시된다. OrfC는 본원에서 서열 18로 표시되는 1503개 아미노산 서열을 코딩하는 4509개 뉴클레오티드 서열 (정지 코돈 미포함)이다. OrfC 내에는 3개의 도메인이 존재한다: (a) 2개의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인 (각각 서열 18의 위치 약 1 내지 위치 약 450으로 표시되고, 서열 18의 위치 약 451 내지 위치 약 950으로 표시됨), 및 (b) 1개의 에노일-ACP 리덕타제 (ER) 도메인 (서열 18의 위치 약 1000 내지 위치 약 1502로 표시됨).
트라우스토키트리움 OrfA에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 19로 표시된다. OrfA는 본원에서 서열 20으로 표시되는 2811개 아미노산 서열을 코딩하는 8433개 뉴클레오티드 서열 (정지 코돈 미포함)이다. OrfA 내에는 11개의 도메인이 존재한다: (a) 1개의 β-케토아실-ACP 신타제 (KS) 도메인 (서열 20의 위치 약 1 내지 위치 약 500으로 표시됨), (b) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인 (서열 20의 위치 약 501 내지 위치 약 1000으로 표시됨), (c) 8개의 아실 운반체 단백질 (ACP) 도메인 (서열 20의 위치 약 1069 내지 위치 약 1998로 표시됨, 8개의 ACP 도메인 각각에 대한 활성 부위 세린 잔기 (즉, 판테테인 결합 부위)의 위치는 서열 20의 아미노산 서열을 기준으로 1128 (ACP1), 1244 (ACP2), 1360 (ACP3), 1476 (ACP4), 1592 (ACP5), 1708 (ACP6), 1824 (ACP7) 및 1940 (ACP8)임), 및 (d) 1개의 β-케토아실-ACP 리덕타제 (KR) 도메인 (서열 20의 위치 약 2001 내지 위치 약 2811로 표시됨).
트라우스토키트리움 OrfB에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 21로 표시된다. OrfB는 본원에서 서열 22로 표시되는 1935개 아미노산 서열을 코딩하는 5805개 뉴클레오티드 서열 (정지 코돈 미포함)이다. OrfB 내에는 4개의 도메인이 존재한다: (a) 1개의 β-케토아실-ACP 신타제 (KS) 도메인 (서열 22의 위치 약 1 내지 위치 약 500으로 표시됨), (b) 1개의 쇄 길이 인자 (CLF) 도메인 (서열 22의 위치 약 501 내지 위치 약 1000으로 표시됨), (c) 1개의 아실트랜스퍼라제 (AT) 도메인 (서열 22의 위치 약 1001 내지 위치 약 1500으로 표시됨), 및 (d) 1개의 에노일-ACP 리덕타제 (ER) 도메인 (서열 22의 위치 약 1501 내지 위치 약 1935로 표시됨).
트라우스토키트리움 OrfC에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 23으로 표시된다. OrfC는 본원에서 서열 24로 표시되는 1470개 아미노산 서열을 코딩하는 4410개 뉴클레오티드 서열 (정지 코돈 미포함)이다. OrfC 내에는 3개의 도메인이 존재한다: (a) 2개의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인 (각각 서열 24의 위치 약 1 내지 위치 약 500으로 표시되고, 서열 24의 위치 약 501 내지 위치 약 1000으로 표시됨), 및 (b) 1개의 에노일-ACP 리덕타제 (ER) 도메인 (서열 24의 위치 약 1001 내지 위치 약 1470으로 표시됨).
따라서, 본 발명은, 본원에 기재된 박테리아 PUFA PKS 시스템의 (예컨대, 본원에 기재된 쉐바넬라 자포니카 또는 쉐바넬라 올레야나 PUKA PKS 시스템으로부터의, 또는 이들로부터 유래된) 하나 이상의 기능성 도메인 또는 단백질 (또는 그의 생물학적 활성 단편 또는 상동체)을 코딩하는 유기체에서의 1개 이상의 핵산 서열을 유전자 변형시키고/거나, 이러한 도메인 또는 단백질을 코딩하는 핵산 서열을 포함하는 1종 이상의 재조합 핵산 분자를 발현함으로써 미생물 또는 식물 세포를 유전자 변형시키는 방법을 포함한다. 이러한 서열의 각종 실시양태, 유기체를 유전자 변형시키는 방법, 및 특이적 변형이 상기에 상세하게 기재되어 있다. 전형적으로, 특정 생물활성 분자(들)을 생산하는 특정 유전자 변형 유기체를 생산하기 위해 상기 방법이 이용된다.
본 발명의 특히 바람직한 실시양태는, PUFA PKS 시스템의 원하는 생성물 (예컨대, PUFA 또는 다른 생물활성 분자)을 생산하도록 본원에 기재된 PUFA PKS 유전자를 이용하여 유전자 변형시킨 유전자 변형 식물 또는 상기 식물의 일부에 관한 것이다. 본 발명의 박테리아 PUFA PKS 시스템의 유전적 기반 및 도메인 구조에 관한 정보는 각종 트라우스토키트리드 PUFA PKS 시스템의 유전적 기반 및 도메인 구조에 관한 정보와 함께, 다양한 생물활성 분자를 생산하는 새로운 유전자 변형 식물의 설계를 위한 토대를 제공한다. 예를 들어, 본원에 기재된 PUFA PKS 시스템으로부터의 도메인들의 각종 조합으로부터 유래된 새로운 PUFA PKS 구조물을 설계 및 유전자 조작할 수 있다. 우선, 원하는 생물활성 분자의 생산을 달성하기 위해, 상기 구조물을 미생물, 예를 들어 이. 콜라이, 효모 또는 트라우스토키트리드에서 생성하고, 예를 들어 구조물을 단리하고, 이를 식물의 형질전환에 사용하여 유사한 생물활성 분자 생산 특성을 식물에 부여할 수 있다. 식물이 PUFA PKS 시스템을 내인적으로 함유하는 것으로 알려져 있지는 않고, 따라서 본 발명의 PUFA PKS 시스템은, 독특한 지방산 생산능을 갖는 식물을 생성할 수 있는 기회를 제공한다. 본 발명의 특히 바람직한 실시양태는, 동일 식물 내에서 1종 이상의 PUFA (예를 들어, EPA, DHA, DPA, ARA, GLA, SDA 등)를 생산하도록 식물을 유전공학적으로 조작하는 것이다. 본 발명은 수많은 "디자이너 오일(designer oil)" 중 어느 하나를 다양한 비율 및 형태로 생산할 수 있는 능력을 제공한다. 또한, 본원에 기재된 특정 해양 박테리아로부터의 PUFA PKS 유전자에 대한 개시는 PUFA 생산의 범위를 보다 쉽게 확장시키고, 대부분의 작물의 성장에 이용되는 온도 범위 내에서 PUFA를 성공적으로 생산시킬 수 있는 기회를 제공한다.
본 발명의 또다른 실시양태는, 내인성 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템을 갖는 유전자 변형 트라우스토키트리드 미생물에 관한 것이며, 상기 내인성 PUFA PKS 시스템은 유전자 변형이 없는 트라우스토키트리드 미생물과 비교시, 미생물에 의한 다중불포화 지방산 (PUFA)의 발현 프로파일을 변경하기 위해 유전자 변형되었다. 본 발명에서 숙주 유기체로서 유용한 트라우스토키트리드 미생물은 PUFA PKS 시스템을 내인적으로 함유 및 발현한다. 본 발명에 근거한 유전자 변형에는, 본원에 기재된 박테리아 PUFA PKS 시스템으로부터의 PUFA PKS 도메인 또는 단백질 (또는 그의 상동체 또는 기능성 단편)을 코딩하는 1개 이상의 재조합 핵산 서열을 트라우스토키트리드에 도입하는 것이 포함된다. 또한, 트라우스토키트리드는 그의 내인성 PUFA PKS 유전자 내에 유전자 변형, 예를 들어 치환, 부가, 결실, 돌연변이 (예를 들어, 트라우스토키트리드 PUFA PKS 유전자의 부분적 또는 완전한 결실, 및 본 발명의 바람직한 해양 박테리아로부터의 PUFA PKS 유전자로 대체)를 함유할 수 있다.
본 발명의 상기 실시양태는, 본 발명자들이 개발한 유전자 변형 미생물 및 PUFA가 풍부화된 지질 (트리아실글리세롤 (TAG) 및 막-결합 인지질 (PL))의 효율적 생산 방법을 통해 원하는 PUFA (예를 들어, EPA)가 풍부화된 상업적으로 유용한 지질을 생산하는 데 특히 유용하다. 또한, 이러한 미생물은 추후에 식물 세포의 형질전환시 이용하기 위한 최적의 유전자 조합을 결정하는 "대리(surrogate)" 숙주로서 유용하나, 예를 들어 수많은 박테리아 및 효모 숙주를 비롯한 여타 미생물도 "대리" 숙주로서 사용될 수 있다.
본 발명의 이 특정 실시양태는 다음 정보로부터 부분적으로 유래된 것이다: (1) 선별된 미생물, 특히 트라우스토키트리드 (예를 들어, 상업적으로 개발된 쉬조키트리움 균주 ATCC 20888)의 유전적인 TAG 생산능의 이용, (2) 진핵생물 (특히, 트라우스토키트리알레스 목의 구성원) 및 본 발명에서 사용된 해양 박테리아에서의 PUFA PKS 생합성 경로 (즉, PUFA PKS 시스템)에 대한 본 발명자들의 상세한 이해, 및 (3) 쉬조키트리움에서의 상동성 유전자 재조합 시스템의 이용. 관여된 시스템들에 대한 본 발명의 발명자들의 정보를 기초로 하여, EPA 이외의 PUFA들을 생산하기 위한 일반적인 방법을 개발할 수 있다.
예를 들어, 본 발명의 한 실시양태에서, 내인성 트라우스토키트리드 PUFA PKS 유전자, 예를 들어 DHA 및 DPA를 정상적으로 생산하는 PUFA PKS 효소를 코딩하는 쉬조키트리움 유전자는 무작위 또는 표적화된 돌연변이유발법에 의해 변형되고/거나, (예컨대, 박테리아 또는 여타 공급원으로부터의) 상동성 PKS 단백질을 코딩하는 다른 유기체로부터의 유전자, 예를 들어 본원에 상세하게 기재된 쉐바넬라 자포니카 또는 쉐바넬라 올레야나로부터의 해양 박테리아 PUFA PKS 유전자로 대체되고/거나, 유전자 변형된 쉬조키트리움, 트라우스토키트리움 또는 여타 트라우스토키트리드 PUFA PKS 유전자로 대체된다. 상기 논의된 바와 같이, 해양 박테리아 및 트라우스토키트리드 또는 여타 PKS 시스템으로부터의 각종 도메인을 코딩하는 핵산 분자들의 조합은 "혼합 및 매치"되어 원하는 PUFA 또는 다른 생물활성 분자를 생산하게 될 구조물(들)을 생성할 수 있다. 도입 및/또는 변형된 유전자에 의해 코딩된 효소들의 생성물은 예를 들어, EPA일 수 있거나, 또는 그밖의 PUFA들을 비롯한 특정한 여타 관련 분자일 수 있다. 상기 방법의 한 특징은, 효율적 생산 및 PL 및 TAG로의 PUFA 도입에 필수적인 트라우스토키트리드 PUFA 합성 및 축적 기구의 내인성 구성요소들을 이용하면서, 예를 들어 해양 박테리아 유전자의 EPA 생산능을 이용하는 것이다. 특히, 본 발명의 상기 실시양태는, 유기체에 의해 생산되는 유형의 PUFA를 변형시키면서 모(parent) 균주의 높은 오일 생산성을 유지하는 것에 관한 것이다.
하기 논의 중 일부에서, 유기체인 쉬조키트리움이 예시적인 숙주 유기체로 이용되고 있지만, 트라우스토키트리움 속, 라비린툴로이데스 속 및 자포노키트리움 속의 구성원을 비롯한 임의의 트라우스토키트리드가 본 발명에 따라 변형될 수 있다. 또한, 예를 들어 상기 기재된 바와 같은 트라우스토키트리움은 본원에 기재된 방법에 의한 유전자 변형을 위한 숙주 유기체로서 기능할 수 있으나, 트라우스토키트리움 PUFA PKS 유전자는 또다른 트라우스토키트리드 (예를 들어, 쉬조키트리움)의 내인성 PUFA PKS 유전자를 변형시키기 위해 사용될 가능성이 보다 높다. 또한, 상기 미국 출원 제10/124,800호에 설명된 유기체의 스크리닝 방법을 이용하여, 본 발명의 방법에서 유용한 여타 유기체를 동정할 수 있고, 이러한 모든 유기체들은 본원에 포함된다. 또한, 본원에 제공된 예시적인 정보를 이용하여 PUFA PKS 시스템을 구축하고, 다른 미생물, 예를 들어 박테리아 또는 효모 내에서 생산하고, 식물 세포 내로 형질전환시켜 유전자 변형 식물을 생성할 수 있다. 본원에서 논의된 개념들은 필요에 따라 다양한 시스템에 적용될 수 있다.
본 발명의 상기 실시양태는 다음과 같이 설명될 수 있다. 예를 들어, 쉬조키트리움에서의 PUFA 합성 및 축적에 대한 본 발명자들의 현재적 이해를 바탕으로, 전반적인 생화학적 프로세스는 세 부분으로 나뉠 수 있다.
첫째, 쉬조키트리움 오일 중에 축적된 PUFA (DHA 및 DPA)는 상기 논의된 바와 같은 PUFA PKS 시스템의 생성물이다. 쉬조키트리움의 PUFA PKS 시스템은 유의한 양의 중간체 화합물의 방출 없이 말로닐-CoA를 최종 생성물로 전환시킨다. 쉬조키트리움 및 트라우스토키트리움의 경우, 이들 유기체에서의 실제적인 PUFA 합성에 필요한 것으로 공지된 모든 효소 도메인을 코딩하는 3개의 유전자가 앞서 확인된 바 있다 (Orfs A, B 및 C, 이들은 각각 쉬조키트리움의 경우 서열 13, 서열 15 및 서열 17로 표시되고, 트라우스토키트리움의 경우 서열 19, 서열 21 및 서열 23으로 표시됨). (일련의 상동성 효소 도메인을 함유하는 단백질을 코딩하는) 일련의 유사 유전자는 PUFA를 생산하는 여러 여타 비-진핵 유기체 (즉, 여러 해양 박테리아 균주)에서 클로닝 및 특성 분석되어 왔으나, 본 발명자들은 본 발명에서 2종의 특히 유용한 해양 박테리아 균주인 쉐바넬라 자포니카 및 쉐바넬라 올레야나로부터의 PUFA PKS 유전자를 확인 및 서열 결정하였다. 이들 해양 박테리아의 PUFA 생성물은 EPA이다. 본 발명의 실시양태에서, 발효 조건 중 생산 유기체 (예컨대, 쉬조키트리움)의 생리적 성장 요건이 충족된다면, 임의의 PUFA PKS 유전자 집합 또는 이들의 조합이 본원의 실시예에 기재된 쉬조키트리움 유전자를 대체하도록 구상될 수 있다. 특히, 상기 기재된 PUFA-생산 박테리아 균주는 비교적 높은 온도 (예컨대, 25℃ 초과)에서 잘 성장하고, 이는 또한 PUFA PKS 유전자 생성물이 쉬조키트리움의 표준 성장 온도 (25 내지 3O℃)에서 기능할 것임을 시사한다. 이러한 개시로부터, 현재로서는 연구되지 않거나 동정되지 않은 다른 PUFA-생산 박테리아도, 트라우스토키트리드의 변형에 유용한 PUFA PKS 유전자를 함유할 수 있다는 점이 당업자에게 명백할 것이다.
둘째, PUFA 합성에 직접적으로 관여하는 효소를 코딩하는 유전자 이외에도 "액세서리" 효소가 요구된다. 이러한 유전자는 PUFA PKS 복합체 중에 존재하는 아실-운반체 단백질 (ACP) 도메인을 활성화시키는 포스포판테테인 트랜스퍼라제 (PPTase)를 코딩한다. PUFA PKS 효소 복합체가 기능하기 위해서는 이러한 보조인자를 부가함으로써 ACP 도메인을 활성화시키는 것이 필요하다. 지금까지 확인된 PUFA PKS 시스템의 모든 ACP 도메인은 높은 수준의 아미노산 서열 보존 상태를 나타내는데, 이론에 얽매이는 것은 아니지만, 본 발명자들은 쉬조키트리움 및 여타 트라우스토키트리드의 PPTase가 다른 PUFA PKS 시스템으로부터의 ACP 도메인을 인식 및 활성화시킬 것이며 역으로도 가능할 것으로 생각한다. 이러한 유전자는 본원에 기재된 해양 박테리아 PUFA PKS 시스템에 PUFA PKS 시스템의 일부로서 확인 및 포함되고, 본 발명에 포함되는 유전자 변형 시나리오에서 이용될 수 있다. 이종 PPTase 및 PUFA PKS 유전자는 함께 작용하여 PUFA 생성물을 생산할 수 있다는 원리의 증거로서, 본 발명자들은 2종의 상이한 이종 PPTase와, 쉬조키트리움으로부터의 PUFA PKS 유전자를 이용하여 박테리아 숙주 세포에서 PUFA를 생산할 수 있음을 입증하였다.
셋째, 쉬조키트리움 및 여타 트라우스토키트리드의 경우, PUFA PKS 시스템의 생성물은 인지질 (PL) 및 트리아실글리세롤 (TAG)에 효율적으로 전달된다. 본 발명자들의 데이타는, PUFA가 PKS 복합체의 ACP 도메인으로부터 조효소 A (CoA)로 전달됨을 시사한다. 여타 진핵 유기체에서와 같이, 아실-CoA는 PL 및 TAG 분자를 형성하는 각종 아실-트랜스퍼라제를 위한 기질로서 기능할 것이다. 한편, 데이타는, 박테리아 내에서 CoA로의 전달이 이루어지지 않고, 오히려 PKS 복합체의 ACP 도메인으로부터, PL을 형성하는 아실-트랜스퍼라제로 직접 전달됨을 시사한다. PUFA를 ACP로부터 CoA로 전달하는 쉬조키트리움의 효소 시스템은 DHA 및 DPA를 명확하게 인식할 수 있고, 따라서 본 발명자들은, (PUFA PKS ACP 도메인에 부착된) PUFA PKS 시스템의 임의의 PUFA 생성물이 기질로서 작용할 것이라는 점을 예측할 수 있는 것으로 생각한다.
따라서, 본 발명의 한 실시양태에서, 본 발명자들은 또다른 트라우스토키트리드 숙주인 쉬조키트리움으로부터의 내인성 PPTase 또는 본 발명의 해양 박테리아로부터의 PPTase, 및 PUFA-ACP → PUFA-CoA 트랜스퍼라제 활성 및 TAG/PL 합성 시스템 (또는 다른 내인성 PUFA ACP → TAG/PL 메카니즘)을 이용하면서, 트라우스토키트리드 숙주에 있는 PUFA PKS 효소 복합체의 구성요소를 코딩하는 유전자를 (예를 들어, 본 발명의 해양 박테리아 PUFA PKS 시스템으로부터의 하나 이상의 도메인 또는 그의 기능성 부분을 코딩하는 1종 이상의 재조합 핵산 분자를 도입함으로써) 변경시키는 것을 제안한다. 본 발명의 상기 방법은 실험 데이타에 의해 뒷받침되며, 그 일부가 실시예 단락에 상세하게 기재되어 있다.
본 발명자들 및 다른 발명자들은 앞서 PUFA PKS 시스템이 유기체들 사이에서 전달될 수 있으며, 특정 부분들은 상호교환적임을 밝혔다. 보다 구체적으로, (쉐바넬라로부터의 PPTase와 함께) 해양 박테리아인 쉐바넬라 SCRC2738 (문헌 [Yazawa Lipids 31:S297 (1996)]) 및 비브리오 마리누스의 PUFA PKS 경로 (미국 특허 제6,140,486호)가 이종 숙주 (즉, 이. 콜라이)로 성공적으로 전달될 수 있는 것으로 앞서 밝힌 바 있다. 또한, 이들 2종의 유기체 (쉐바넬라 SCRC2738 및 비브리오 마리누스)로부터의 PUFA PKS 효소들의 서브유닛들간 구조적 상동성의 수준은 두 시스템으로부터의 유전자들을 혼합 및 매치시킬 수 있는 정도이다 (상기 미국 특허 제6,140,486호). 지금까지 확인된 모든 PUFA PKS 효소들의 기능성 도메인은 서로간에 특정한 서열 상동성을 나타낸다. 이와 유사하게, 데이타는 PUFA PKS 시스템 (해양 박테리아로부터의 시스템 포함)이 쉬조키트리움 및 여타 트라우스토키트리드로 전달될 수 있으며 이들 내에서 기능하게 될 것임을 시사한다.
본 발명자들은 이. 콜라이 숙주에서 쉬조키트리움으로부터의 PUFA PKS 유전자 (Orfs A, B 및 C)를 발현시켰으며, 세포가 DHA 및 DPA를, 쉬조키트리움에서의 PUFA의 내인적 생산의 경우와 대략 동일한 비율로 생산하였음을 입증하였다. 따라서, 재조합 쉬조키트리움 PUFA PKS 유전자는 기능성 PUFA 합성 시스템을 코딩하는 것으로 밝혀졌다. 또한, 트라우스토키트리움 23B OrfA 및 OrfC 유전자의 일부 또는 전부가 쉬조키트리움 내에서 기능하는 것으로 밝혀졌다 (실시예 7 참조). 또한, 본 발명자들은 전체 쉬조키트리움 orfC 코딩 서열을 트라우스토키트리움 23B orfC 코딩 서열로 완전하고 정확하게 대체하였고, 그 결과 쉬조키트리움 숙주에서의 PUFA 생산 프로파일이 트라우스토키트리움으로 이동하였다 (실시예 8 참조).
본 발명자들은 앞서 PPTase가 이종 PUFA PKS ACP 도메인을 활성화시킬 수 있음을 발견하였다. 적절한 PPTase 유전자 (이 경우, 쉐바넬라 SCRC2738로부터의 유전자)가 존재하는 경우에만, 비브리오 마리누스로부터의 PUFA PKS 유전자로 형질전환된 이. 콜라이에서 DHA가 생산된다 (상기 미국 특허 제6,140,486호 참조). 이는 쉐바넬라 PPTase가 비브리오 PUFA PKS ACP 도메인을 활성화시킬 수 있음을 입증한다. 또한, 본 발명자들은 바실루스 섭틸리스로부터의 PPTase (sfp)를 이용한, 쉬조키트리움 Orf A로부터의 ACP 도메인의 활성화 (판트에테이닐화)를 입증하였다 (실시예 3 참조). 또한, 본 발명자들은 노스톡(Nostoc)으로부터의 PPTase (HetI로 불림)에 의한, 쉬조키트리움 Orf A로부터의 ACP 도메인의 활성화 (판트에테이닐화)를 입증하였다 (실시예 3 참조). 또한, 재조합 쉬조키트리움 PUFA PKS 유전자를 이용한 이. 콜라이에서의 DHA 및 DPA의 생산에 대해 상기 논의된 바와 같은 실험에서 PPTase로서 HetI 효소를 사용하였다 (실시예 3).
또한, 데이타는 DHA-CoA 및 DPA-CoA가 쉬조키트리움 TAG 및 PL 합성 경로에서의 대사 중간체일 수 있음을 시사한다. 공개된 생화학적 데이타는, 박테리아에서, 새롭게 합성된 PUFA가 PUFA PKS ACP 도메인으로부터 인지질 합성 효소로 직접 전달되는 것임을 시사한다. 한편, 본 발명자들의 데이타는, 쉬조키트리움 (진핵 유기체)에서 PUFA PKS ACP 도메인 상의 PUFA와 표적 TAG 및 PL 분자들 사이에 중간체가 존재할 수 있음을 시사한다. 진핵생물의 세포질에서 지방산의 전형적인 운반체는 CoA이다. 본 발명자들은 쉬조키트리움 세포의 추출물을 조사하여, 유의한 수준의 화합물들이 HPLC 분획 (표준 물질: DHA-CoA, DPA-CoA, 16:0-CoA 및 18:1-CoA) 동안 함께 이동한다는 것을 발견하였다. 추정되는 DHA-CoA 및 DPA-CoA 피크를 질량 분광법에 의해 확인하였다. 한편, 본 발명자들은 비브리오 마리누스의 추출물에서 DHA-CoA를 검출할 수 없었기 때문에, PUFA를 최종 표적으로 전달 (예컨대, PL로 직접 전달)하는 데 있어서 상이한 메카니즘이 박테리아에 존재하는 것으로 판단하였다. 데이타는 새롭게 합성된 PUFA를 CoA로 전달하기 위한 메카니즘 (아마도, ACP에서 CoA로 직접 전달하는 메카니즘)이 쉬조키트리움에 존재함을 시사한다. TAG 및 PL 합성 효소는 모두 PUFA-CoA에 접근할 수 있다. DHA 및 DPA CoA가 생산된다는 사실은 효소 전달 기구가 소정 범위의 PUFA를 인식할 수 있음을 시사한다.
또한, 본 발명자들은 쉬조키트리움에서 Orf A 넉아웃, Orf B 넉아웃 및 Orf C 넉아웃을 생성하였다 (실시예 4 참조). 넉아웃 전략은, 쉬조키트리움에서 일어나는 것으로 입증된 상동성 재조합에 따른다 (상기 미국 특허 출원 제10/124,807호 참조). 넉아웃 구조물의 설계에서는 여러 전략이 이용될 수 있다. 상기 3개의 유전자를 불활성화시키는 데 이용되는 특정 전략에서는, 튜불린 프로모터에 결합된 제오신™ (Zeocin™) 내성 유전자 (pMON50000으로부터 유래됨, 미국 특허 출원 제10/124,807호 참조)를 Orf의 클로닝된 부분에 삽입하는 것이 이용되었다. 따라서, 중단된 코딩 영역을 함유하는 새로운 구조물을, 입자 충격을 통한 야생형 쉬조키트리움 세포의 형질 전환을 위해 사용하였다 (미국 특허 출원 제10/124,807호 참조). 포격된 세포를 제오신™ 및 PUFA 공급물을 함유하는 플레이트 상에 스프레딩하였다 (하기 참조). 이후, 상기 플레이트 상에서 성장한 콜로니를, PUFA가 보강되지 않은 제오신™ 플레이트 상에 스트리킹하였다. 성장을 위해 PUFA의 보강이 필요한 콜로니는, 상동성 재조합을 통해 불활성화된 PUFA PKS Orf를 갖는 경우의 후보이다. 상기 3가지 경우 모두에서, 세포를 각 쉬조키트리움 Orf의 전장 게놈 DNA 클론으로 형질전환시켜 넉아웃을 구조함으로써 상기 가정을 확인하였다. 또한, 일부 경우에서, 구조된 형질전환체에서 제오신™ 내성 유전자가 제거된 것으로 밝혀졌는데 (실시예 6 참조), 이는 도입된 기능성 유전자가 이중 상동성 재조합 (즉, 내성 마커의 결실)에 의해 고유 부위 내로 통합되었음을 나타낸다. 이러한 전략의 성공을 위한 핵심은 PUFA를 함유하는 성장 배지의 보강이다. 이 경우, 효과적인 보강 수단은, 부분적으로 메틸화된 베타-시클로덱스트린과 혼합한 후에 성장 배지에 첨가함으로써 PUFA를 격리(sequestration)시키는 것으로 밝혀졌다 (실시예 6 참조). 또한, 상기 실험은, 본원에 제공된 지침이 주어진 경우, 당업자가 PUFA PKS-함유 미생물 (예를 들어, 쉬조키트리움)에 있는 1종 이상의 PUFA PKS 유전자를 불활성화시키고, (예컨대, 재조합 유기체의 지방산 프로파일을 변경하기 위해) 본 발명에 따라 (예컨대, 다른 PKS 유전자의 도입에 의해) 추가로 유전자 변형시키는 데 사용될 수 있는 PUFA 영양요구체를 생성할 수 있음을 입증하였다.
본 발명의 유기체의 유전자 변형의 한 요소는 트라우스토키트리드 게놈을 직접적으로 형질전환시킬 수 있는 능력이다. 상기 미국 출원 제10/124,807호에서는, 단일 교차 상동성 재조합을 통한 쉬조키트리움의 형질전환, 및 이중 교차 상동성 재조합을 통한 표적화 유전자 치환이 입증되었다. 상기 논의된 바와 같이, 본 발명자들은 쉬조키트리움에서의 PUFA-PKA 시스템의 Orf A, Orf B 및 Orf C를 불활성화시키는 상동성 재조합 기술을 이용하였다. 생성된 돌연변이체는 PUFA를 함유하는 매질의 보강 상황에 따라 달라진다. 형질전환을 위한 여러 마커, 도입된 유전자의 고수준 발현을 위한 프로모터 요소, 및 외인성 유전 물질의 전달 방법이 개발되어 이용가능하다. 따라서, 트라우스토키트리드 및 유사한 PUFA PKS 시스템을 갖는 다른 진핵생물의 내인성 PUFA PKS 유전자를 넉아웃시키고, 이들을 다른 유기체, 예를 들어 본원에 기재된 해양 박테리아로부터의 유전자로 대체하기 위한 도구가 필요하며, 이는 상기 제안된 바와 같다.
EPA-풍부 TAG의 생산을 위한 한 방법에서, 생성물이 EPA인 PUFA PKS 시스템을 코딩하는 이종 유전자 (예를 들어, 본원에 기재된 쉐바넬라 자포니카 및 쉐바넬라 올레야나로부터의 유전자)를 부가함으로써 쉬조키트리움의 PUFA PKS 시스템을 변경할 수 있다. 내인성 PPTase는 이종 PUFA PKS 시스템의 ACP 도메인을 활성화시킬 것으로 예상되나, 본 발명자들은 또한, 해양 박테리아로부터의 PPTase를 클로닝 및 서열결정하였고, 이를 숙주에 도입할 수 있었다. 또한, EPA가 EPA-CoA로 전환될 것이고, 쉬조키트리움 TAG 및 PL 막에 용이하게 도입될 것으로 예상된다. 따라서, 한 실시양태에서, 생성된 미생물이 EPA 및 DHA를 생산하도록, EPA를 생산하는 이종 PUFA PKS 시스템을 코딩하는 유전자 (예컨대, 상기 해양 박테리아로부터의 유전자)를, DHA를 천연적으로 생산하는 미생물 (예컨대, 쉬조키트리움)에 도입할 수 있다. 예를 들어, 상기 기재된 2종의 상이한 PUFA PKS 시스템을 식물 세포에 도입함으로써 상기 기술을 유전자 변형 식물에 추가로 적용시켜, EPA 및 DHA, 또는 원하는 PUFA들의 임의의 조합을 생산하는 식물을 생성할 수 있다.
상기 방법의 한 변형에서, 최종 생성물이 DHA 및 DPA보다는 EPA가 되도록, 또는 최종 생성물이 EPA 및 DHA 및/또는 DPA가 되도록, 또는 최종 생성물이 DHA 및 DPA 대신에 EPA 및 ARA가 되도록, 내인성 쉬조키트리움 시스템의 관련 도메인을 (이종 유전자의 특이적 영역의 도입, 또는 쉬조키트리움 유전자 자체의 돌연변이유발에 의해) 변형시키는 기술이 이용될 수 있다. 이 기술은 다른 PUFA 최종 생성물의 생산시 적용될 수 있고, PUFA PKS 시스템을 포함하면서 PUFA PKS 시스템의 생성물을 인지질 (PL) 및 트리아실글리세롤 (TAG)에 효율적으로 전달할 수 있는 임의의 진핵 미생물에 적용될 수 있기 때문에 예시적인 방법이다. 특히, 본 발명은 내인성 PUFA PKS 시스템을 갖는 임의의 트라우스토키트리드 미생물 또는 임의의 다른 진핵생물에 적용될 수 있다 (하기에 예를 통해 상세하게 기재되어 있음). 또한, 본 발명은 임의의 적합한 숙주 유기체 (단, 본원에 기재된 바와 같은 각종 PUFA 프로파일의 생산을 위한 변형된 유전 물질이 이들 유기체 내로 형질전환될 수 있음)에 적용될 수 있다. 예를 들어, 실시예에서, 쉬조키트리움으로부터의 PUFA PKS 시스템은 이. 콜라이 내로 형질전환된다. 이어서, 본원에 기재된 방법에 의해 PUFA 생산 프로파일을 변경하기 위해 상기 형질전환된 유기체를 추가로 변형시킬 수 있다.
특히, 본 발명에서는, 본원에 기재된 PUFA PKS 시스템이 아닌 PKS 시스템 및 선행 기술의 PKS 시스템으로부터의 단백질 또는 도메인을 코딩하는 유전자 및 핵산 서열이 이용되며, 이는 상기 기재된 제I형 (반복형 또는 모듈형), 제II형 또는 제III형의 PKS 시스템을 비롯하여 박테리아 및 비-박테리아 PKS 시스템로부터의 유전자 및 핵산 서열을 포함한다. 이러한 유형의 PKS 시스템 각각을 발현하는 유기체는 당업계에 알려져 있으며, 본 발명의 유전자 변형 프로세스에서 유용한 핵산의 공급원으로서 기능할 수 있다.
바람직한 실시양태에서, 상기 PUFA PKS 시스템이 아닌 PKS 시스템 또는 여타 PUFA PKS 시스템으로부터의 단백질 또는 도메인을 코딩하는 유전자 및 핵산 서열은, PUFA의 생산에 바람직한 성장 특성을 갖는 유기체로부터 단리 또는 유래된다. 특히, 약 15℃ 이상, 2O℃ 이상, 25℃ 이상 또는 30℃ 이상, 또는 약 35℃ 이하의 온도에서, 또는 한 실시양태의 경우 약 20℃ 내지 35℃ 사이에서 1℃씩 증가시킨 임의의 온도에서 유전자 변형 트라우스토키트리드 미생물을 배양할 수 있는 것이 바람직하다. 따라서, 상기 온도에서 기능성 효소 활성을 갖는 PKS 단백질 또는 도메인이 바람직하다. 본원에 기재된 쉐바넬라 올레야나 또는 쉐바넬라 자포니카로부터의 PUFA PKS 유전자는 EPA를 천연적으로 생산하며, 25℃, 30℃ 또는 35℃ 이하의 온도에서 성장하는데, 이로써 이들 미생물은 본 발명의 이 실시양태에서 특히 유용하다 (실시예 1 및 2 참조).
또다른 바람직한 실시양태에서, 1개의 지방산 프로파일을 생성하는 PUFA PKS 시스템으로부터의 단백질 또는 도메인을 코딩하는 유전자 및 핵산 서열은 또다른 PUFA PKS 시스템을 변형시키고, 그에 의해 숙주의 지방산 프로파일을 변경시키기 위해 사용된다. 예를 들어, 트라우스토키트리움 23B (ATCC 20892)는 쉬조키트리움 종 (ATCC 20888)과 그의 지방산 프로파일에서 유의하게 상이하다. 트라우스토키트리움 23B는 쉬조키트리움 (ATCC 20888)에서의 단지 2-3:1에 비해 40:1 만큼 높은 DHA:DPA(n-6) 비율을 가질 수 있다. 트라우스토키트리움 23B는 더 높은 수준의 C20:5(n-3)을 가질 수도 있다. 그러나, 쉬조키트리움 (ATCC 20888)은 트라우스토키트리움 23B에 비해 우수한 오일 생산자이다. 쉬조키트리움은 DHA 및 도코사펜타엔산 (DPA, 22:5ω6)에 다량의 트리아실글리세롤, 예컨대 30% DHA + DPA (건조 중량)를 풍부하게 축적한다. 따라서, 본원 발명의 발명자들은 트라우스토키트리움 23B에 더 유사한 DHA:DPA 프로파일을 갖는 유전자 변형 쉬조키트리움 (즉, "슈퍼-DHA-생산자" 쉬조키트리움, 여기서 쉬조키트리움의 생산능은 트라우스토키트리움의 DHA:DPA 비율과 조합됨)을 생산하기 위해 트라우스토키트리움 23B PUFA PKS 유전자를 갖는 쉬조키트리움 내인성 PUFA PKS 시스템의 변형을 본원에 기재한다. 이 변형은 실시예 8에서 입증된다.
따라서, 본 발명은 특정 해양 박테리아 및 임의의 트라우스토키트리드 또는 다른 진핵 PUFA PKS 시스템으로부터의 유전자를 사용하고, PUFA 생성물의 범위를 확장하고/거나 변경하여 EPA, DHA, DPA, ARA, GLA, SDA 등을 포함하기 위해 유전자 믹싱을 추가로 사용한다. 이들 변경된 PUFA 생산 프로파일을 수득하는 방법은 각종 유기체로부터의 유전자를 트라우스토키트리드 PUFA PKS 유전자에 유전자 혼합하는 것 및 본원에 기술된 내인성 트라우스토키트리드 PUFA PKS 유전자를 유전자 변형시키는 각종 방법을 포함한다. 트라우스토키트리드 PUFA PKS 시스템 및 해양 박테리아 PUFA PKS 시스템의 유전적 기초 및 도메인 구조의 지식은 각종 PUFA 프로파일을 생성하는 신규 유전자 변형 유기체를 고안하는 기초를 제공한다. 트라우스토키트리드 등과 같은 미생물에서 제조된 신규 PUFA PKS 구조물은 단리될 수 있으며, 식물의 형질전환에 사용되어 그 식물에 유사한 PUFA 생산 특성을 부여할 수 있다.
임의의 하나 이상의 내인성 트라우스토키트리드 PUFA PKS 도메인은 본 발명에 따라 변경 또는 대체할 수 있는데 (예를 들어, 본 발명의 해양 박테리아로부터의 도메인으로), 이는 상기 변형이 원하는 결과를 생성하도록 제공한다 (즉, 미생물의 PUFA 생산 프로파일의 변경). 변경 또는 대체하기에 특히 바람직한 도메인으로는 쉬조키트리움 OrfB 또는 OrfC 중의 도메인에 상응하는 임의의 도메인 (β-케토아실-ACP 신타제 (KS), 아실트랜스퍼라제 (AT), FabA-유사 β-히드록시아실-ACP 데히드라제 (DH), 쇄 길이 인자 (CLF), 에노일 ACP-리덕타제 (ER), 트랜스-2-아실-ACP의 합성을 촉매하는 효소, 트랜스-2-아실-ACP에서 시스-3-아실-ACP로의 가역성 이성질체화를 촉매하는 효소, 및 시스-3-아실-ACP에서 시스-5-β-케토-아실-ACP로의 신장을 촉매하는 효소) 등이 있으나 이에 제한되지 않는다. 한 실시양태에서, 변경 또는 대체하기에 바람직한 도메인으로는 β-케토아실-ACP 신타제 (KS), FabA-유사 β-히드록시아실-ACP 데히드라제 (DH), 및 쇄 길이 인자 (CLF) 등이 있으나 이에 제한되지 않는다.
본 발명의 한 측면에서, 트라우스토키트리드 PUFA-PKS PUFA 생산은 CLF (쇄 길이 인자) 도메인을 변형시킴으로써 변경된다. 이 도메인은 제II형 (분리된 효소) PKS 시스템의 특징이다. 그의 아미노산 서열은 KS (케토 신타제 쌍) 도메인에 대해 상동성을 나타내지만, 활성 부위 시스테인를 결실하고 있다. CLF는 신장 주기의 수, 및 그에 따른 최종 생성물의 쇄 길이를 결정하는 기능을 할 수 있다. 본 발명의 이 실시양태에서, FAS 및 PKS 합성에 대한 현 상태의 지식을 사용하여, 비-박테리아 PUFA-PKS 시스템의 직접 변형에 의한 ARA의 생산에 대한 합리적 전략을 제공한다. PKS 시스템에서의 CLF의 기능에 관한 문헌에 논쟁이 있고 ([Bisang et al., Nature 401:502 (1999)], [Yi et al., J Am. Chem. Soc. 125:12708 (2003)]), 다른 도메인이 최종 생성물의 쇄 길이의 결정에 관련될 수 있는 것이 실현된다. 그러나, 쉬조키트리움이 DHA (C22:6, ω-3) 및 DPA (C22:5, ω-6)을 모두 생산하는 것은 유의하다. PUFA-PKS 시스템에서 시스 이중 결합은 성장 탄소 쇄의 합성 동안 도입된다. ω-3 및 ω-6 이중 결합의 배치가 분자의 합성 초기에 발생되기 때문에, 이들이 차후 최종 생성물 쇄 길이 결정에 영향을 미칠 것이라고 예상되지 않을 것이다. 따라서, 이론에 얽매이는 것은 아니지만, 본원 발명의 발명자들은 쉬조키트리움 PUFA-PKS 시스템 내로의 (C22 단위 대신) C20 단위의 합성에 관한 인자 (예컨대, CLF)의 도입이 EPA (C20:5, ω-3) 및 ARA (C20:4, ω-6)을 생산시킬 것이라고 여긴다. 예를 들어, 이종 시스템에서, EPA 생산 시스템으로부터 (예컨대, 포토박테리아, 또는 바람직하게는 하기 기재되는 바람직한 성장 요건을 갖는 미생물로부터의 것) 쉬조키트리움 유전자 세트로의 CLF의 직접적 치환에 의해 CLF를 활용할 것이다. 이어서, 생성된 형질전환체의 지방산은 EPA 및/또는 ARA를 생산하는 형질전환체를 동정하는 프로파일에서 변경에 대해 분석될 수 있다.
예를 들어, 본 발명의 이 측면에서, 본원에 상세하게 기재된 C20 PUFA-PKS 시스템, 예컨대 해양 박테리아 시스템으로부터의 CLF로 대체된 OrfB의 CLF를 갖는 클론을 작제할 수 있다. 마커 유전자는 코딩 영역의 하류에 삽입될 수 있다. 더욱 구체적으로, 본원에 기재하고, 미국 특허 출원 제10/124,807호 (상기 문헌)에 상세하게 기재된 트라우스토키트리드의 형질전환에 대한 상동성 재조합 시스템을 사용할 수 있다. 이어서, 야생형 트라우스토키트리드 세포 (예컨대, 쉬조키트리움 세포)를 형질전환시키고, 마커 표현형을 선별하고, 이어서 신규 CLF을 혼입한 것을 스크리닝할 수 있다. 즉, EPA 및/또는 ARA를 생산하는 형질전환체를 동정하는 지방산 프로파일에 대한 임의의 영향에 대해 이들 형질전환체를 분석할 것이다. 대안적이며 일부 경우에, 바람직하게는, 스와핑된 도메인의 영향에 대한 이러한 스크리닝은 이. 콜라이 (하기 기재됨) 또는 다른 시스템, 예컨대 이에 제한되지 않는 효모에서 수행될 수 있다. CLF와 관련된 것 이외에 일부 인자가 최종 생성물의 쇄 길이에 영향을 미치는 것이 발견되는 경우에, 유사한 전략이 그들 인자를 변경하기 위해 사용될 수 있다. 본 발명의 또다른 실시양태에서, 유기체는 쇄 길이 인자와 β-케토아실-ACP 신타제 (KS) 도메인을 모두 도입시킴으로써 변형된다.
본 발명의 또다른 측면에서, β-히드록시아실-ACP 데히드라제/케토 신타제 쌍의 변형 또는 치환이 고려된다. 이. 콜라이에서 시스-바센산 (C18:1,Δ11) 합성 동안, 시스 이중 결합의 생성은 특이적 DH 효소, β-히드록시아실-ACP 데히드라제, fabA 유전자의 생성물에 따라 달라지는 것으로 여겨진다. 이 효소는 β-케토아실-ACP로부터 HOH를 제거하고, 탄소 쇄에 초기에 트랜스 이중 결합을 생성한다. DH의 서브세트인 FabA-유사는 시스-트랜스 이소머라제 활성을 보유한다 [Heath et al., 1996, (상기 문헌)]. 박테리아 및 비-박테리아 PUFA-PKS 시스템의 신규 측면은 FabA-유사 DH 도메인의 존재이다. 이론에 얽매이는 것은 아니지만, 본원 발명의 발명자들은 이들 DH 도메인의 하나 또는 모두가 시스-트랜스 이소머라제 활성을 보유할 것으로 여긴다 (DH 도메인의 조작은 하기에 더 상세하게 논의됨).
이. 콜라이에서 불포화 지방산 합성의 또다른 측면은 특정 KS 효소, β-케토아실-ACP 신타제, fabB 유전자의 생성물에 대한 요건이다. 이는 (티오-에스테르 결합에 의해) 활성 부위에서 시스테인 잔기에 연결된 지방산을 말로닐-ACP으로 축합하는 효소이다. 다중-단계 반응에서, CO2는 유리되고, 선형 쇄는 2개 탄소에 의해 연장된다. 이 KS만 이중 결합을 함유한 탄소 쇄를 연장할 수 있는 것으로 여겨진다. 이 연장은 이중 결합이 시스 배위인 경우에만 발생되고, 트랜스 배위인 경우에는, 이중 결합이 에노일-ACP 리덕타제 (ER)에 의해 신장 전에 환원된다 [Heath et al., 1996, (상기 문헌)]. 지금까지 특징규명된 모든 PUFA-PKS 시스템은 2개의 KS 도메인을 가지며, 이들 중 하나는 이. 콜라이의 FabB-유사 KS에 다른 것에 비해 더 높은 상동성을 나타낸다. 또한, 이론에 얽매이는 것은 아니지만, 본원 발명의 발명자들은 PUFA-PKS 시스템에서 DH (FabA-유사) 및 KS (FabB-유사) 효소 도메인의 특이성 및 상호작용이 최종 생성물에서의 시스 이중 결합의 수 및 배치를 결정하는 것으로 여긴다. 2-탄소 신장 반응의 수가 PUFA-PKS 최종 생성물 중에 존재하는 이중 결합의 수보다 크기 때문에, 일부 연장 주기에서 완전한 환원이 발생되는 것을 측정할 수 있다. 따라서, DH 및 KS 도메인은 DHA/DPA 비율 또는 다른 장쇄 지방산 비율의 변경에 대한 표적으로 사용될 수 있다. 이들은 다른 시스템으로부터의 상동성 도메인의 도입 또는 이들 유전자 단편의 돌연변이유발에 의해 변형 및/또는 평가될 수 있다. 한 실시양태에서, FabA-유사 DH 도메인은 KS 파트너 도메인을 조금도 요구하지 않을 수 있다.
또다른 실시양태에서, ER (에노일-ACP 리덕타제 - 완전 포화된 탄소를 발생시키는 지방 아실-ACP에서 트랜스 이중 결합을 환원시키는 효소) 도메인은 PKS 시스템에 의해 생산된 생성물의 유형을 변화시키기 위해 변형 또는 치환될 수 있다. 예를 들어, 본원 발명의 발명자들은 쉬조키트리움 PUFA-PKS 시스템이 (1개 보다는) 2개의 ER 도메인을 갖는 것 중에서 이전에 기재된 박테리아 시스템과는 상이한 것을 인지한다. 이론에 얽매이는 것은 아니지만, 본원 발명의 발명자들은 이들 ER 도메인이 생성된 PKS 생산 생성물에 강력하게 영향을 미칠 수 있는 것으로 여긴다. 생성된 PKS 생성물은 넉아웃 개개의 도메인을 별개로 넉아웃시키거나, 그들의 뉴클레오티드 서열을 변형시키거나 또는 다른 유기체로부터의 ER 도메인, 예컨대 본원에 기재한 해양 박테리아로부터의 ER 도메인을 치환시킴으로써 변화될 수 있다.
본 발명의 또다른 측면에서, 시스- 및 트랜스-이중 결합의 믹스로 분자를 잠재적으로 생성시키며 이성질체화 활성을 보유하지 않는 DH 도메인에 대한 PUFA-PKS 시스템의 1개의 DH (FabA-유사) 도메인을 치환시키는 것이 고려된다. 쉬조키트리움 PUFA PKS 시스템의 현 생성물은 DHA 및 DPA (C22:5 ω6)이다. 시스템을 조작하여 C20 지방산을 생산하는 경우에, 생성물이 EPA 및 ARA (C20:4 ω6)일 것으로 예상할 것이다. 이는 ARA에 대한 신규 공급원을 제공할 수 있다. 상이한 DHA 대 DPA 비율을 생성하는 관련된 PUFA-PKS 시스템으로부터의 도메인을, 예를 들어 트라우스토키트리움 23B으로부터의 유전자를 사용하여 치환할 수도 있다 (미국 특허 출원 제10/124,800호 (상기 문헌)에서 동정된 PUFA PKS 시스템).
추가로, 한 실시양태에서, ER 도메인 중 하나가 트라우스토키트리드 PUFA PKS 시스템에서 (예컨대, 제거 또는 불활성화시킴으로써) 최종 생성물 프로파일을 변경시킨다. 유사한 전략은 다소 복잡한 접근법으로 PUFA-PKS 단백질의 별개 도메인 각각에 대한 직접 방식으로 시도될 수 있다. 물론, 단일 도메인의 조작에 제한되지 않을 것이다. 마지막으로, PUFA-PKS 시스템 및 다른 PKS 또는 FAS 시스템 (예컨대, 제I형, 제II형, 제III형)으로부터의 도메인 믹싱에 의해 접근법을 확장하여 전체 범위의 신규 PUFA 최종 생성물을 생성할 수 있다.
본원에 상세하게 기재된 박테리아 PUFA PKS 유전자가 쉬조키트리움에서 PUFA 생산을 변형시키기 위해 어떻게 사용될 수 있는가에 대한 예로서, 하기 논의를 제공한다. 또한, 본원에 기재한 모든 예는 다른 유전자 변형 미생물의 생성 또는 유전자 변형 식물의 생성에 동등하게 적용시킬 수 있다. 박테리아로부터의 PUFA PKS 유전자의 모든 현재 공지된 예는 3개 유전자 쉬조키트리움 세트에서와 동일한 도메인을 함유한 4개의 인접하게 연결된 유전자로서 존재한다. 더욱이, 본원 발명의 발명자들은 쉐바넬라 올레야나 및 쉐바넬라 자포니카로부터의 PUFA PKS 유전자가 단단히 클러스터된 이 배열로 나타난다는 것을 입증하였다. 본원에 기재한 박테리아 PUFA PKS 유전자의 DNA 서열은 내인성 PUFA PKS 유전자를 결손한 쉬조키트리움 균주의 형질전환을 위한 벡터를 고안하기 위해 당장 사용될 수 있다 (예컨대, 실시예 4, 6 및 7 참조). 온전한 박테리아 유전자 (코딩 서열)는 온전한 쉬조키트리움 유전자 (코딩 서열)를 대체함으로써 쉬조키트리움 유전자 발현 영역을 사용하기 위해 사용될 수 있고, 제4 박테리아 유전자는 게놈 내의 상이한 위치에 표적화될 수 있다. 대안적으로, 개개의 박테리아 PUFA PKS 기능적 도메인은 상동성 재조합의 유사한 기술에 의해 유사한 쉬조키트리움 도메인과 "스와핑(analogous)" 또는 교환될 수 있다. 또다른 별법으로서, 박테리아 PUFA PKS 유전자는 심지어 트라우스토키트리드로부터의 PUFA PKS 시스템에 첨가하여 하나 이상의 PUFA 신타제 활성을 보유한 유기체를 생성할 수 있다. 박테리아 PUFA PKS 유전자 또는 도메인의 서열이 쉬조키트리움 코돈 사용방식의 세부사항을 적응시키기 위해 변형되어야 할 수 있지만, 이는 당업자의 능력 범위 내라는 것이 이해된다.
천연 (내인성, 자연) PKS 시스템 내로 도입시킬 수 있는 다수의 유전자 무작위 또는 지정된 변경이 효소 기능을 불활성화시킬 것이라는 것이 인식된다. 따라서, 제어된 환경에서 트라우스토키트리드 PUFA PKS 시스템의 유전자 조작의 효과에 대해 시험하기 위해, 먼저 또다른 숙주, 예컨대 이. 콜라이 중의 재조합 시스템을 사용하여 시스템의 각종 측면을 조작하고, 그 결과를 평가할 수 있다. 예를 들어, 이. 콜라이의 FabB 균주는 불포화 지방산을 합성할 수 없고, 그의 일반 불포화 지방산에 대해 치환시켜 성장시킬 수 있는 지방산을 갖는 배지의 보충을 요구한다 (문헌 [Metz et al. (2001), (상기 문헌)] 참조). 그러나, (배지의 보충에 대한) 이 요건은 균주가 기능적 PUFA-PKS 시스템으로 형질전환되는 경우에 제거될 수 있다 (즉, 이. 콜라이 숙주에서 PUFA 생성을 생산하는 것 - 문헌 [Metz et al. (2001), (상기 문헌), 상기 간행물의 도 2A 참조] 참조). 형질전환된 FabB 균주는 보충 없는 성장을 위해 (불포화 지방산을 생산하기 위해) 기능적 PUFA-PKS 시스템을 즉시 요구한다. 이 예에서 중요한 요소는 광범위한 불포화 지방산의 생산이 충분할 것이라는 것이다 (심지어 불포화 지방산 치환체, 예컨대 분지쇄 지방산). 따라서, 본 발명의 또다른 바람직한 실시양태에서, 본원에 기술된 하나 이상의 PUFA PKS 유전자에 많은 다수의 돌연변이를 생성시키고, 이어서 적절하게 변형된 FabB 균주를 형질전환시키고 (예컨대, ER 도메인을 함유한 발현 구조물에서 돌연변이를 생성시키고, 별개의 플라스미드 상의 다른 필수 도메인을 보유한 FabB 균주를 형질전환시키거나 또는 염색체 내에 통합됨) 및 배지의 보충 없이 성장하는 그들 형질전환체에 대해서만 선별한다 (즉, FabB 결손을 보완할 수 있는 분자를 생산하는 능력을 여전히 보유함). 이. 콜라이의 FabA 균주는 FabB 균주와 유사한 표현형을 가지고, 상기한 예에서 별법의 균주로서 사용될 수도 있다.
PUFA PKS의 유전자 변형에 대한 한 시험 시스템은 실시예 단락에서 예시된다. 간략하게는, 숙주 미생물, 예컨대 이. 콜라이는 모든 또는 일부의 트라우스토키트리드 PUFA PKS 시스템 (예컨대, 쉬조키트리움의 Orf A, B 및 C)을 포함하는 PUFA PKS 시스템을 코딩하는 유전자 및 포스포판테테이닐 트랜스퍼라제 (PPTase)를 코딩하는 유전자로 형질전환시키며, 이는 활성 할로-ACP를 PKS 시스템에 생산하는 포스포판테테인 보조인자의 부착을 요구한다. PKS 시스템을 코딩하는 유전자는 하나 이상의 변형을 트라우스토키트리드 PUFA PKS 유전자에 도입하고/거나 다른 PKS 시스템으로부터의 도메인을 코딩하는 핵산을 트라우스토키트리드 유전자 (비-트라우스토키트리드 미생물로부터의 유전자 및 상이한 트라우스토키트리드 미생물로부터의 유전자를 포함함)에 도입하기 위해 유전적으로 유전자조작될 수 있다. PUFA PKS 시스템을 이. 콜라이에서 발현시키고, PUFA 생산 프로파일을 측정할 수 있다. 이 방식에서, 잠재적인 유전자 변형은 트라우스토키트리드 PUFA 생산 유기체의 조작 전에 평가될 수 있다.
본 발명은 트라우스토키트리드 PUFA PKS 시스템 중의 내인성 핵산 분자의 조작 및/또는 쉐바넬라 자포니카 PUFA PKS 시스템, 쉐바넬라 올레야나 PUFA PKS 시스템으로부터의 핵산 서열을 포함하는 단리된 핵산 분자의 용도를 포함하고, 트라우스토키트리드 PUFA PKS 시스템으로부터의 핵산 서열, 또는 임의의 이러한 핵산 서열의 상동성부를 추가로 포함할 수 있다. 한 측면에서, 본 발명은 하기 단백질 중 하나 이상의 생물학적 활성을 보유한 PUFA PKS 시스템으로부터의 도메인을 코딩하는 핵산 서열을 포함하는 핵산 분자의 변형 및/또는 용도에 관한 것이다: 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT), β-케토아실-ACP 신타제 (KS), 케토리덕타제 (KR), 아실트랜스퍼라제 (AT), FabA-유사 β-히드록시아실-ACP 데히드라제 (DH), 포스포판테테인 트랜스퍼라제, 쇄 길이 인자 (CLF), 아실 운반체 단백질 (ACP), 에노일 ACP-리덕타제 (ER), 트랜스-2-아실-ACP의 합성을 촉매하는 효소, 시스-3-아실-ACP로의 트랜스-2-아실-ACP의 가역성 이성질체화를 촉매하는 효소, 및/또는 시스-5-β-케토-아실-ACP로의 시스-3-아실-ACP의 신장을 촉매하는 효소. 숙주 트라우스토키트리드의 PUFA 생산 프로파일을 변경하기 위해 변형에 바람직한 도메인은 본원에서 이전에 논의되었다.
본 발명에 따른 유기체의 유전자 변형은 유기체가 유전자 변형된 내인성 PUFA PKS 시스템을 가지고/거나 재조합 핵산 분자가 유기체 내에 도입되거나 간에 바람직하게는 유기체에 의해 생산되는 PUFA의 유형, 양 및/또는 활성에 영향을 미친다. 본 발명에 따라, PUFA PKS 시스템의 활성에 영향을 미치는 것, 예컨대 PUFA 생산 프로파일에 영향을 미치는 것은 유전자 변형의 부재에 비해 유기체에 의해 발현되는 PUFA PKS 시스템의 임의의 생물학적 활성에서 임의의 검출가능 또는 측정가능한 변화 또는 변형을 유발하는 PUFA PKS 시스템과 상호작용하는 PUFA PKS 시스템 또는 유전자 중의 임의의 유전자 변형을 포함한다. 본 발명에 따라, 어구 "PUFA 프로파일", "PUFA 발현 프로파일" 및 "PUFA 생산 프로파일"은 구별없이 사용될 수 있고, 유기체에 의해 발현/생산되는 PUFA의 전체 프로파일을 나타낸다. PUFA 발현 프로파일은 유기체의 의해 발현되는 PUFA의 유형, 뿐만 아니라 생산되는 PUFA의 절대량 및 상대량을 포함할 수 있다. 따라서, PUFA 프로파일은 유기체에 의해 생산되는 서로에 대한 PUFA의 비율, 유기체에 의해 생산되는 PUFA의 유형, 및/또는 유기체에 의해 생산되는 PUFA의 유형 및 절대량 또는 상대량에 관해 기재될 수 있다.
상기 논의된 바와 같이, 숙주 유기체는 내인성 PUFA PKS 시스템과 함께 또는 없이 임의의 원핵 또는 진핵 유기체를 포함할 수 있고, 바람직하게는 인지질 (PL) 및 트리아실글리세롤 (TAG)로의 PUFA PKS 시스템의 생성물의 채널을 효율적으로 개방하는 능력을 보유한 진핵 미생물이다. 바람직한 숙주 미생물은 트라우스토키트리아세애 및 라비린툴라세애 과를 비롯한 트라우스토키트리알레스 목의 임의의 구성원이다. 이들 과들의 특히 바람직한 숙주 세포는 상기 기재되어 있다. 바람직한 숙주 식물 세포는 상업적으로 유용한 임의의 작물 또는 식물의 식물 세포를 포함한다.
본 발명의 한 실시양태에서, 유전적 유전자조작 및/또는 돌연변이유발 프로그램이 관심 PUFA 생산 프로파일을 갖는 트라우스토키트리드 미생물을 수득하는 선택적 스크리닝 방법과 조합될 수 있다는 것이 고려된다. 돌연변이유발 방법으로는 화학 돌연변이유발법, 유전자의 셔플링(shuffling), 특이적 효소 도메인을 코딩하는 유전자의 스위칭 영역, 또는 이들 유전자의 특이적 영역에 제한된 돌연변이유발법, 뿐만 아니라 기타 방법 등이 있으나 이에 제한되지 않는다.
예를 들어, 고처리량 돌연변이유발 방법은 원하는 PUFA 프로파일의 생성에 영향을 미치거나 또는 최적화시키기 위해 사용될 수 있다. 효과적인 모델 시스템이 개발된다면, 고처리량 방식으로 이들 유전자를 변형시킬 수 있다. 이들 기술의 사용은 2개의 수준으로 구상될 수 있다. 첫 번째, 관심 생성물 (예컨대, EPA)의 생산에 대한 충분히 선택적 스크리닝이 고안될 수 있는 경우에, 이는 이 생성물을 생산하는 시스템을 변경하는 시도에 사용될 수 있다 (예컨대, 다른 방법, 예컨대 상기 논의된 것 대신에, 또는 그와 협력하여). 추가로, 상기 약술된 방법이 관심 PUFA 프로파일을 생산하는 유전자 세트를 생성하는 경우에, 고처리량 기술은 이어서 시스템을 최적화하기 위해 사용될 수 있다. 예를 들어, 도입된 도메인이 비교적 낮은 온도에서만 기능하는 경우에, 선별 방법은 제한을 제거하도록 고안될 수 있다.
상기 기재된 바와 같이, 본 발명의 한 실시양태에서, 유전자 변형 미생물 또는 식물은 원하는 생물활성 분자 (생성물)를 합성하는 증대된 능력 또는 특이적 생성물을 합성하는 (예컨대, 특이적 항생제를 합성하는) 신규 도입된 능력을 보유하는 미생물 또는 식물을 포함한다. 본 발명에 따라, 생성물을 "합성하는 증대된 능력"은 미생물 또는 식물이 동일한 조건하에 배양 또는 성장된 야생형 미생물 또는 식물에 비해 증가된 양의 생성물의 생산물 (이전에 없었던 생성물의 임의의 생산을 포함함)을 생산하도록 생성물의 합성과 관련된 경로에서 임의의 증대, 또는 상향 조절을 나타낸다. 이러한 유전자 변형 유기체를 생산하는 방법은 상기 상세하게 기재되어 있고, 더욱이 임의의 PUFA PKS 시스템을 사용하여 기재된 임의의 예시적 변형이 식물에서의 발현에 적합하게 될 수 있다.
본 발명의 한 실시양태는 본 발명의 유전자 변형 미생물 또는 식물을 성장 또는 배양함으로써 원하는 생물활성 분자 (생성물 또는 화합물로서도 지칭됨)의 생산 방법이다. 이러한 방법은 본원 이전에 기재되고, 본 발명에 따른 유전자 변형을 각각 갖는 미생물 또는 식물을 발효 배지에서 배양시키거나 또는 적합한 환경, 예컨대 토양에서 성장시키는 단계를 포함한다. 본 발명의 PUFA PKS 시스템과 관련된 유전자 변형에 대한 바람직한 숙주 세포가 상기 기재되어 있다.
본 발명의 한 실시양태는 본 발명의 유전자 변형 미생물의 배양에 의한 원하는 PUFA의 생산 방법이다 (상기 상세하게 기재되어 있음). 이러한 방법은 본원 이전에 기재되고, 본 발명에 따른 유전자 변형을 보유하는 미생물을 PUFA(들)의 생산에 효과적인 조건하에 발효 배지에서 배양하는 단계를 포함한다. 적절하거나 또는 효과적인 배지는 트라우스토키트리드 및 다른 미생물을 포함하는 본 발명의 유전자 변형 미생물이 배양시에 원하는 PUFA 생성물(들)을 생산할 수 있는 임의의 배지를 나타낸다. 이러한 배지는 전형적으로 동화가능한 탄소, 질소 및 포스페이트 공급원을 포함하는 수성 배지이다. 이러한 배지는 적절한 염, 미네랄, 금속 및 다른 영양소를 포함할 수도 있다. 본 발명의 임의의 미생물은 통상의 발효 생물반응기에서 배양될 수 있다. 미생물은 배치(batch), 공급-배치, 세포 재순환, 및 연속 발효 등이 있으나 이에 제한되지 않는 임의의 발효 방법에 의해 배양될 수 있다. 본 발명에 따른 트라우스토키트리드 미생물에 대한 바람직한 성장 조건은 당업계에 잘 공지되어 있고, 예를 들어 미국 특허 제5,130,242호, 미국 특허 제5,340,742호, 및 미국 특허 제5,698,244호에 상세하게 기재되어 있으며, 이들 문헌은 각각 그 전문이 본원에 참고로 도입된다.
한 실시양태에서, 유전자 변형 미생물은 약 15℃ 이상의 온도에서 배양되고, 또다른 실시양태에서는 약 20℃ 이상의 온도에서 배양되고, 또다른 실시양태에서는 약 25℃ 이상의 온도에서 배양되고, 또다른 실시양태에서는 약 30℃ 이상의 온도에서 배양되고, 또다른 실시양태에서는 약 35℃ 이하 또는 그 이상의 온도에서 배양되며, 또다른 실시양태에서는 약 20℃ 내지 35℃ 사이에서 1℃씩의 증가분을 갖는 임의의 온도에서 배양된다.
원하는 PUFA(들) 및/또는 유전자 변형 미생물에 의해 생산된 다른 생물활성 분자는 통상의 분리 및 정제 기술로 발효 배지로부터 회수할 수 있다. 예를 들어, 발효 배지를 여과 또는 원심분리하여 미생물, 세포 파편 및 다른 미립자 물질을 제거할 수 있고, 생성물을 통상의 방법, 예컨대, 이온 교환, 크로마토그래피, 추출, 용매 추출, 상 분리, 막 분리, 전기투석, 역 삼투, 증류, 화학 유도체화 및 결정화에 의해 세포-무함유 상등액으로부터 회수할 수 있다. 대안적으로, PUFA(들), 또는 그의 추출물 및 각종 분획을 생산하는 미생물은 생성물로부터 미생물 성분을 제거하지 않고 사용될 수 있다.
바람직하게는, 본 발명의 유전자 변형 미생물은 EPA (C20:5, ω-3), DHA (C22:6, ω-3), DPA (C22:5, ω-6), ARA (C20:4, ω-6), GLA (C18:3, n-6), 및 SDA (C 18:4, n-3)) 등을 포함하지만 이에 제한되지 않는 1종 이상의 다중불포화 지방산을 생산한다. 바람직한 한 실시양태에서, 야생형 형태로 고수준의 DHA 및 DPA를 생산하는 쉬조키트리움은 본 발명에 따라 변형되어 고수준의 EPA를 생산하는 유전자이다. 상기 논의된 바와 같이, PUFA를 생산하기 위해 유전자 변형 트라우스토키트리드 미생물을 사용하는 한 이점은 PUFA가 인지질 (PL) 및 트리아실글리세리드 (TAG) 모두 내로 직접적으로 혼입되는 것이다.
바람직하게는, PUFA는 미생물 건조 중량의 약 5% 초과, 한 측면에서 6% 초과, 또다른 측면에서 7% 초과, 또다른 측면에서 8% 초과, 또다른 측면에서 9% 초과, 또다른 측면에서, 10% 초과 등의 양으로, 및 정수 수치의 비율(%)로 미생물 건조 중량의 90%까지 (예컨대, 15%, 20%, 30%, 40%, 50%, 및 이들 중간의 임의의 비율(%)) 생산된다.
본 발명의 원하는 생물활성 화합물의 생산 방법에서, 유전자 변형 식물은 발효 배지에서 배양되거나 또는 적합한 배지, 예컨대 토양에서 성장된다. 적절하거나 또는 효과적인 발효 배지를 상기에 상세하게 논의하였다. 고등 식물에 적합한 성장 배지는 토양, 모래, 뿌리 성장을 지지하는 임의의 다른 미립자 매질 (예컨대 질석, 펄라이트 등) 또는 수경 배양, 뿐만 아니라 적합한 빛, 물 및 고등 식물의 성장을 최적화하는 영양 보충물 등을 포함하지만 이에 제한되지 않는 식물에 대한 임의의 성장 배지를 포함한다. 본 발명의 유전자 변형 식물을 유전자조작하여 본 발명에 따라 유전자 변형된 PKS 시스템의 활성을 통해 유의한 양의 원하는 생성물을 생산한다. 상기 화합물은 식물로부터 화합물을 추출하는 정제 공정을 통해 회수될 수 있다. 바람직한 실시양태에서, 화합물은 식물을 수확함으로써 회수된다. 이 실시양태에서, 식물은 그의 천연 상태로 소비되거나 또는 소비재 생성물로 추가 가공될 수 있다.
생물활성 분자 생산에 유용한 많은 유전자 변형은 본원에 개시된 바와 같이 당업자에게 명백할 것이고, 각종 다른 변형은 본원 이전에 논의되어 왔다. 본 발명은 원하는 생물활성 분자를 생산하는 본원에 기재된 PUFA PKS 시스템과 관련된 임의의 유전자 변형을 고려한다.
본 발명에 따른 생물활성 분자는 생물학적 활성을 가지고, 본원에 기재한 바와 같은 비-박테리아 PUFA PKS 시스템의 하나 이상의 기능적 도메인의 생물학적 활성을 보유한 1종 이상의 아미노산 서열을 포함하는 PKS 시스템에 의해 생산될 수 있는 임의의 분자 (화합물, 생성물 등)를 포함한다. 이러한 생물활성 분자로는 다중불포화 지방산 (PUFA), 소염 제제, 화학요법제, 활성 부형제, 골다공증 약물, 항-우울제, 항-경련제, 항-헬리오박터 파일로리 약물, 신경변성 질환 치료용 약물, 퇴행성 간 질환의 치료용 약물, 항생제 및 콜레스테롤 저하 제제 등이 있으나 이에 제한되지 않을 수 있다. 본 발명의 PUFA PKS 시스템의 한 이점은 시스 배위의 탄소-탄소 이중 결합을 도입하는 이러한 시스템의 능력, 및 매 3번째 탄소마다 이중 결합을 포함하는 분자의 능력이다. 이 능력은 각종 화합물을 생산하기 위해 사용될 수 있다.
바람직하게는, 관심 생물활성 화합물은 유전자 변형 미생물에 의해 미생물 건조 중량의 약 0.05% 초과, 바람직하게는 약 0.1% 초과, 더욱 바람직하게는 약 0.25% 초과, 더욱 바람직하게는 약 0.5% 초과, 더욱 바람직하게는 약 0.75% 초과, 더욱 바람직하게는 약 1% 초과, 더욱 바람직하게는 약 2.5% 초과, 더욱 바람직하게는 약 5% 초과, 더욱 바람직하게는 약 10% 초과, 더욱 바람직하게는 약 15% 초과, 훨씬 더욱 바람직하게는 약 20% 초과의 양으로 생산된다. 지질 화합물의 경우에, 바람직하게는, 이러한 화합물은 미생물 건조 중량의 약 5% 초과의 양으로 생산된다. 소량으로 합성되는 다른 생물활성 화합물, 예컨대 항생제 또는 화합물의 경우, 미생물 건조 중량의 이러한 화합물을 보유하는 이들 균주는 상기 기재된 유형의 신규 PKS 시스템을 예측가능하게 함유하는 바와 같이 확인된다. 일부 실시양태에서, 특정 생물활성 분자 (화합물)은 축적보다는 미생물에 의해 분비된다. 따라서, 이러한 생물활성 분자는 배양 배지로부터 일반적으로 회수되고, 생산된 분자의 농도는 미생물 및 배양 크기에 따라 달라질 것이다.
본 발명의 한 실시양태는 PUFA PKS 시스템의 하나 이상의 생물학적 활성 도메인을 코딩하는 핵산 서열을 포함하는 1종 이상의 재조합 핵산 분자를 발현하는 재조합 숙주 세포 (미생물 또는 식물)에 의해 생산되는 오일을 최종 생성물에 첨가하는 것을 포함하는, (최종 생성물이 1종 이상의 지방산을 이미 가질 수 있으며, 그에 의해 1종 이상의 추가 지방산이 본 발명의 방법에 따라 제공되지만) 1종 이상의 지방산을 함유하도록 최종 생성물을 변형시키는 방법에 관한 것이다. PUFA PKS 시스템은 쉐바넬라 자포니카 또는 쉐바넬라 올레야나로부터의 박테리아 PUFA PKS 시스템, 또는 보통 (즉, 일반 또는 천연 조건 하에) 온도 22℃ 초과 온도에서 성장하고 PUFA를 생산할 수 있는 다른 박테리아로부터의 임의의 PUFA PKS 시스템을 비롯한 본원에 기재한 임의의 적합한 박테리아 또는 비-박테리아 PUFA PKS 시스템을 포함한다.
바람직하게는, 최종 생성물은 음식, 식이보조제, 제약 제제, 인간화된 동물 유즙 및 분유로 구성된 군에서 선택된다. 적합한 제약 제제로는 소염 제제, 화학요법제, 활성 부형제, 골다공증 약물, 항-우울제, 항-경련제, 항-헬리오박터 파일로리 약물, 신경변성 질환 치료용 약물, 퇴행성 간 질환의 치료용 약물, 항생제 및 콜레스테롤 저하 제제 등이 있으나 이에 제한되지 않는다. 한 실시양태에서, 최종 생성물은 만성 염증, 급성 염증, 위장 장애, 암, 악액질, 심장 재협착, 신경변성 장애, 간의 퇴행성 질병, 혈액 지질 질병, 골다공증, 골관절염, 자가면역 질환, 자간전증, 조산, 연령 관련 황반병증, 폐 질병, 및 과산화소체 질병으로 구성된 군에서 선택된 상태를 치료하기 위해 사용된다.
적합한 식품으로는 미세 제과 제품, 빵 및 롤, 아침식사용 시리얼, 가공 및 비가공 치즈, 조미료 (케찹, 마요네즈 등), 유제품 (유즙, 요거트), 푸딩 및 젤라틴 디저트, 탄산 음료, 차, 분말 음료 믹스, 가공 어류 제품, 과일-기재 음료, 츄잉 검, 경질 과자류, 동결 유제품, 가공 식육품, 견과 및 견과-기재 스프레드, 파스타, 가공 가금류 제품, 육즙 및 소스, 포테이토 칩 및 기타 칩 또는 크리스프, 초콜렛 및 기타 과자, 수프 및 수프 믹스, 대두 기재 제품 (유즙, 음료, 크림, 화이트너), 식물성유-기재 스프레드, 식물성-기재 음료 등이 있으나 이에 제한되지 않는다.
본 발명의 또다른 실시양태는 인간화된 동물 유즙의 생산 방법에 관한 것이다. 이 방법은 본원에 기재한 바와 같은 PUFA PKS 시스템의 하나 이상의 생물학적 활성 도메인을 코딩하는 핵산 서열을 포함하는 1종 이상의 재조합 핵산 분자를 갖는 유즙-생산 동물의 유즙-생산 세포를 유전자 변형시키는 단계를 포함한다.
숙주 세포를 유전자 변형시키고, 유전자 변형 비-인간, 유즙-생산 동물을 생산하는 방법은 당업계에 공지되어 있다. 변형시킬 숙주 동물의 예로는 트랜스진 발현 집단의 신속한 증식을 위해 유전자 조작 및 클로닝될 수 있는 소, 양, 돼지, 염소, 야크 등이 있다. 동물의 경우에, PKS-유사 트랜스진은 유전자 조절성 영역의 변형을 통해 표적 세포소기관, 조직 및 체액에서 발현을 위해 개질될 수 있다. 특히, 숙주 동물의 젖에서 PUFA를 생산하는데 관심이 있다.
하기하는 실시예는 본 발명을 예시하기 위한 것이지, 본 발명의 범위를 제한하려는 것이 아니다.
실시예
1
하기 실시예는 특정 EPA-생산 박테리아가 쉬조키트리움의 변형에 적합한 것 으로 여겨지는 PUFA PKS-유사 유전자를 함유한다는 것을 나타낸다.
쉐바넬라 속의 2개 EPA-생산 해양 박테리아 균주는 쉬조키트리움 발효의 전형적 온도에서 성장하고, PUFA PKS-유사 유전자를 보유하는 것으로 나타났다. 쉐바넬라 올레야나 (오스트레일리안 콜렉션 오브 앤타르크틱 마이크로오르가니즘스(Australian Collection of Antarctic Microorganisms, ACAM) 균주 번호 644, [Skerratt et al., Int. J. Syst. Evol. Microbiol 52, 2101 (2002)])는 EPA를 생산하고, 25 내지 3O℃ 이하에서 성장한다. 쉐바넬라 자포니카 (아메리칸 타입 컬쳐 콜렉션 (ATCC) 균주 번호 BAA-316, [Ivanova et al., Int. J. Syst. Evol. Microbiol. 51, 1027 (2001)])는 EPA를 생산하고, 30 내지 35℃ 이하에서 성장한다.
이들 박테리아 균주로부터 PUFA-PKS 유전자를 동정하고 단리하기 위해서, 박테리아 orf5/pfaA 유전자의 KS-MAT 영역 및 박테리아 orf7/pfaC 유전자의 DH-DH 영역에 대한 변성 PCR 프라이머 쌍을 쉐바넬라 SCRC-2738, 쉐바넬라 오네이덴시스(Shewanella oneidensis) MR-1, 쉐바넬라 종 GA-22, 포토박테리아 프로펀덤, 및 모리텔라 마리나에 대해 공개된 유전자 서열을 기초로 하여 고안하였다 (상기 논의 참조). 구체적으로, 프라이머 및 PCR 조건은 하기와 같이 고안하였다:
KS / AT 영역에 대한 프라이머: 하기 공개된 서열을 기초로 함.
쉐바넬라 종 SCRC-2738, 쉐바넬라 오네이덴시스 MR-1, 포토박테리아 프로펀덤, 모리텔라 마리나:
prRZ23 GGYATGMTGRTTGGTGAAGG (전방향, 서열 25)
prRZ24 TRTTSASRTAYTGYGAACCTTG (역방향, 서열 26)
DH 영역에 대한 프라이머: 하기 공개된 서열을 기초로 함.
쉐바넬라 종 GA-22, 쉐바넬라 종 SCRC-2738, 포토박테리아 프로펀덤, 모리텔라 마리나:
prRZ28 ATGKCNGAAGGTTGTGGCCA (전방향, 서열 27)
prRZ29 CCWGARATRAAGCCRTTDGGTTG (역방향, 서열 28)
PCR 조건 (박테리아 염색체 DNA를 주형으로 사용함)은 하기와 같았다:
반응 혼합물:
0.2 μM dNTP
0.1 μM 각 프라이머
8% DMSO
250 ng 염색체 DNA
2.5 U 헤르쿨라세® DNA 폴리머라제 (스트라타진(Stratagene))
1X 헤르쿨라세® 완충제
50 ㎕ 총 부피
PCR 프로토콜:
(1) 3분 동안 98℃, (2) 40초 동안 98℃, (3) 30초 동안 56℃, (4) 90초 동안 72℃, (5) 단계 2 내지 4를 29회 주기 동안 반복, (6) 10분 동안 72℃, (7) 6℃에 유지.
프라이머 쌍 모두의 경우에, PCR은 쉐바넬라 올레야나 또는 쉐바넬라 자포니카로부터의 염색체 DNA 주형을 사용하여 예상된 크기의 별개의 생성물을 제공하였다. 4종의 각각의 PCR 생성물을 pCR-BLUNT II-TOPO (인비트로젠(Invitrogen)) 내에 클로닝하고, 삽입물 서열을 M13 전방향 및 역방향 프라이머로 측정하였다. 모든 경우에서, 이에 의해 수득된 DNA 서열은 공지된 박테리아 PUFA PKS 유전자 영역에 고도로 상동성이었다.
박테리아 PCR 생성물로부터 수득된 DNA 서열을 표준 블라스트엑스 서치(Blastx search)로 쉬조키트리움 ATCC 20888로부터의 공지된 서열 및 PUFA PKS 유전자와 비교하였다 (BLAST 파라미터: 낮은 복합도 필터: On; Matrix: BLOSUM62; Word Size: 3; Gap Costs: Existance11, Extension 1 (문헌 [Altschul, S.F., Madden, T.L., Schaeaeffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389-3402]에 기재된 BLAST, 상기 문헌은 그 전문이 본원에 참고로 도입됨).
아미노산 수준에서, 쉐바넬라 올레야나 ACAM644 케토아실 신타제/아실 트랜스퍼라제 (KS-AT) 추정 아미노산 서열에 최고 정도의 상동성을 갖는 서열은 포토박테리아 프로펀덤 pfaA (동일성 = 70%, 양성 = 81%), 쉐바넬라 오네이덴시스 MR-1 "다중-도메인 β-케토아실 신타제" (동일성 = 66%, 양성 = 77%), 및 모리텔라 마리나 ORF8 (동일성 = 56%, 양성 = 71%)이었다. 쉬조키트리움 종 ATCC20888 orfA는 쉐바넬라 올레야나 KS-AT에 대한 추정 아미노산 서열에 대해 41% 동일하고, 56 % 양성이었다.
아미노산 수준에서는, 쉐바넬라 자포니카 ATCC BAA-316 케토아실 신타제/아실 트랜스퍼라제 (KS-AT) 추정 아미노산 서열에 최고 정도의 상동성을 갖는 서열은 쉐바넬라 오네이덴시스 MR-1 "다중-도메인 β-케토아실 신타제" (동일성 = 67%, 양성 = 79%), 쉐바넬라 종 SCRC-2738 orf5 (동일성 = 69%, 양성 = 77%), 및 모리텔라 마리나 ORF8 (동일성 = 56%, 양성 = 70%)이었다. 쉬조키트리움 종 ATCC20888 orfA는 쉐바넬라 자포니카 KS-AT에 대한 추정 아미노산 서열에 대해 41% 동일하고, 55% 양성이었다.
아미노산 수준에서, 쉐바넬라 올레야나 ACAM644 데히드로게나제 (DH) 추정 아미노산 서열에 최고 정도의 상동성을 갖는 서열은 쉐바넬라 종 SCRC-2738 orf7 (동일성 = 77%, 양성 = 86%), 포토박테리아 프로펀덤 pfaC (동일성 = 72%, 양성 = 81%), 및 쉐바넬라 오네이덴시스 MR-1 "다중-도메인 β-케토아실 신타제" (동일성 = 75%, 양성 = 83%)이었다. 쉬조키트리움 종 ATCC20888 orfC는 쉐바넬라 올레야나 DH에 대한 추정 아미노산 서열에 대해 26% 동일하고, 42% 양성이었다.
아미노산 수준에서, 쉐바넬라 자포니카 ATCC BAA-316 데히드로게나제 (DH) 추정 아미노산 서열에 최고 정도의 상동성을 갖는 서열은 쉐바넬라 종 SCRC-2738 orf7 (동일성 = 77%, 양성 = 86%), 포토박테리아 프로펀덤 pfaC (동일성 = 73%, 양성 = 83%) 및 쉐바넬라 오네이덴시스 MR-1 "다중-도메인 β-케토아실 신타제" (동일성 = 74%, 양성 = 81%)이었다. 쉬조키트리움 종 ATCC20888 orfC는 쉐바넬라 자포니카 DH에 대한 추정 아미노산 서열에 대해 27% 동일하고, 42% 양성이었다.
실시예
2
하기 실시예는 쉐바넬라 자포니카 및 쉐바넬라 올레야나로부터의 완전한 PUFA PKS 시스템을 코딩하는 DNA 클론의 생성, 동정, 서열결정 및 분석을 입증한다.
큰 게놈 DNA 단편 (대략 40 kB)으로 구성된 쉐바넬라 자포니카 및 쉐바넬라 올레야나 재조합 라이브러리를 코스미드 벡터 수퍼코스(Supercos)-1 (스트라타진)에서 표준 방법에 의해 생성하였다. 코스미드 라이브러리를 표준 콜로니 혼성화 과정에 의해 스크리닝하였다. 쉐바넬라 올레야나 코스미드 라이브러리를 2개의 별개 디곡시제닌-표지된 프로브로 스크리닝하였다. 각 프로브는 실시예 1에 기재한 EPA 생합성 유전자 클러스터의 절편에 상동성인 DNA 단편을 함유하였고, 각각이 클러스터의 양쪽 말단을 나타냈다. 이들 프로브는 주형으로서의 쉐바넬라 올레야나 DNA와 제1 프로브에 대해 프라이머 prRZ23 (서열 25) 및 prRZ24 (서열 26), 및 제2 프로브에 대해 prRZ28 (서열 27) 및 prRZ29 (서열 28)를 사용하여 PCR에 의해 생산하였다. 상기 실시예 1은 EPA 생합성 유전자의 절편에 상동성인 DNA 단편을 함유한 이들 변성 프라이머 및 유래된 PCR 생성물을 기재하였다. 쉐바넬라 자포니카카 특이적 프로브를 유사한 방식으로 생성시키고, 코스미드 라이브러리를 스크리닝하였다. 이 모든 경우에, 특정 코스미드에 대한 개개의 프로브의 강력한 혼성화는 EPA 생합성 유전자 클러스터에 상동성인 DNA를 함유한 클론을 나타냈다.
양쪽 프로브에 대해 강력한 혼성화를 갖는 클론을 이어서 이. 콜라이에서 EPA의 이종 생산에 대해 검정하였다. 이. 콜라이 코스미드 클론의 개개 단리된 세 포를 LB 브로쓰(broth) 2 mL 중에 밤새 3O℃에서 200 rpm 진탕과 함께 성장시켰다. 이 계대배양물 0.5 mL를 사용하여 LB 브로쓰 25 mL를 접종시키고, 세포를 2O℃에서 20시간 동안 성장시켰다. 세포를 이어서 원심분리로 수거하고, 동결건조에 의해 건조시켰다. 건조된 세포를 표준 가스 크로마토그래피 방법으로 지방 함량, 및 지방산 프로파일 및 함량에 대해 분석하였다. 비어 있는 수퍼코스-1 벡터를 함유한 이. 콜라이의 대조군 세포로부터 생산한 지방산에서 EPA는 검출되지 않았다. 에스. 자포니카 및 에스. 올레야나로부터의 특정 코스미드를 함유한 이. 콜라이 균주는 전형적으로 총 지방산의 3-8% EPA를 생산하였다.
쉐바넬라 올레야나로부터의 코스미드 9A10 및 쉐바넬라 자포니카카로부터의 코스미드 3F3을 전체 무작위 서열결정을 위해 선별하였다. 코스미드 클론을 무작위적으로 단편화시키고, 서브클로닝하고, 생성된 무작위 클론을 서열결정하였다. 크로마토그램을 분석하고, 프레드, 프라프 및 콘세드(Phred, Phrap and Consed) 프로그램을 사용하여 콘티그로 조립시켰다 ([Ewing, et al., Gemone Res. 8(3):175-185 (1998)], [Ewing, et al., Genome Res. 8(3): 186-194 (1998)], [Gordon et al., Genome Res. 8(3):195-202 (1998)]). 최종 콘티그의 각 뉴클레오티드 염기 쌍은 적어도 최소 응집된 프레드 스코어 40 (신뢰 수준 99.995%)에 의해 보호된다.
코스미드 3F3로부터의 39669 bp 콘티그의 뉴클레오티드 서열은 서열 1로서 나타낸다. 코스미드 9A10으로부터의 38794 bp 콘티그의 뉴클레오티드 서열은 서열 7로서 나타낸다. 쉐바넬라 자포니카 (코스미드 3F3) 및 쉐바넬라 올레야나 (코스 미드 9A10)로부터의 PUFA PKS 유전자 클러스터에 대한 각종 도메인 및 단백질의 서열은 본원에서 이전에 상세하게 기재하고 있고, 서열 2 내지 서열 6 및 서열 8 내지 서열 12로서 각각 나타낸다.
본원에 기재한 단백질 비교를 표준 BLAST 분석으로 수행하였다 (BLAST 파라미터: Blastp, 낮은 복합도 필터 On, 프로그램 - BLOSUM62, Gap cost -Existence: 11, Extension 1; (문헌 [Altschul, S.F., Madden, T.L., Schaeaeffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleics Acids Res. 25:3389-3402)]에 기재된 BLAST). 도메인 동정을 보존된 도메인 데이타베이스 및 서치 서비스 (CD-서치), v2.01로 수행하였다. CD-서치는 미국립 의학 도서관(the National library of Medicine) 및 미국립 보건원 (the National Institutes of Health)에 의해 후원되는 미국립 생명공학 정보 센터(the National Center for Biotechnology Information)에 대한 공공의 데이타베이스를 통해 사용가능한 공공의 접근가능 프로그램이다. CD-서치는 각종 데이타베이스로부터의 단백질 도메인을 함유한다. CD-서치는 조회된 단백질 서열 중의 도메인을 동정하는 BLAST 알고리즘을 사용한다 [Marchler-Bauer A, Bryant SH. "CD-Search: protein domain annotations on the fly." Nucleic Acids Res. 32:W327-331 (2004)]. 마지막으로, 오픈 리딩 프레임 (ORF)의 동정은 EasyGene 1.0 서버 [Larsen TS, Krogh A. "EasyGene -a prokaryotic gene finder that ranks ORFs by statistical significance", BMC Bioinformatics 2003, 4:21] 및 GeneMar.hmm 2.1 [Lukashin A. and Borodovsky M., "GeneMark.hmm: new solutions for gene finding" Nucleic Acids Res., Vol. 26, No. 4, pp. 1107-1115. 1998]의 사용으로 원조된다. 디폴트 셋팅을 EasyGene 분석에 사용하고, 콜라레균을 참조 유기체로서 사용하였다. 디폴트 셋팅은 GeneMark.hmm 프로그램 및 슈도네이티브.모델(Pseudonative.model)을 모델 유기체에 대한 셋팅으로서 사용하였다. 이들 프로그램은 박테리아 유전자를 예측하기 위해 히든 마르코브 모델 (Hidden Markov Models) 알고리즘을 사용한다.
표 1은 서열 1을 기초로 하는 출발 및 정지 코돈 코디네이트, 각 ORF의 총 뉴클레오티드 길이, 각 예측되는 단백질에 대한 총 아미노산, 각 예측되는 단백질에 대한 계산된 분자량, 공공의 진뱅크 데이타베이스에 대한 BLASTp 조회에서의 최고 상동성, 진뱅크 데이타베이스 중의 최소 상동성 목록의 GI 관리 번호 ("GenInfo 식별자" 서열 식별 번호), 및 제안된 기능 (EPA 생산과 관련된 경우)을 포함하는 쉐바넬라 자포니카로부터의 코스미드 3F3로부터의 ORF의 개요/분석을 나타낸다.
표 2는 서열 7을 기초로 하는 출발 및 정지 코돈 코디네이트, 및 쉐바넬라 자포니카에 대한 표 1에 나타낸 동일한 추가 정보를 포함하는 쉐바넬라 올레야나로부터의 코스미드 9A10으로부터의 ORF의 개요/분석을 나타낸다.
표 3은 쉐바넬라 올레야나 (코스미드 9A10) 및 또한 공공의 서열 데이타베이스에서 최고 수준의 동일성을 보유한 EPA-생산 유기체로부터의 단백질에 비해 쉐바넬라 자포니카 (코스미드 3F3)의 EPA 클러스터로부터의 추정 단백질의 동일성(%)을 나타낸다. 표 4는 뉴클레오티드 동일성과 관련한 표 3과 동일한 분석을 나타낸다.
표 5는 밑줄친 가능한 리보솜 결합 부위를 갖는 모든 표시된 pfa ORF로부터의 23개 뉴클레오티드 상류, 뿐만 아니라 TTG 출발 코돈으로 출발하는 것으로 표시된 ORF에 대한 별법의 출발 코돈 및 상류 뉴클레오티드를 나타낸다.
*역방향 상보적 가닥 상에
*역방향 상보적 가닥 상에
EPA 생합성 클러스터로부터의 ORF의 예측되는 출발 부위 (출발 코돈은 굵은 글씨로 나타냄) 가능한 리보솜 결합 부위를 밑줄침 모든 pfa ORF pfaC 별법의 출발부 비교 pfaC 별법의 부위 #1은 서열 1의 뉴클레오티드 21514에서 출발함 이는 표시된 pfaC 출발부의 387개 뉴클레오티드 하류임 pfaC 별법의 부위 #2는 서열 1의 뉴클레오티드 21460에서 출발함 이는 표시된 pfaC 출발부의 333개 뉴클레오티드 하류임 pfaC 별법의 부위 #1은 서열 7의 뉴클레오티드 28370에서 출발함 이는 표시된 pfaC 출발부의 402개 뉴클레오티드 하류임 pfaC 별법의 부위 #2는 서열 7의 뉴클레오티드 28151에서 출발함 이는 표시된 pfaC 출발부의 183개 뉴클레오티드 하류임 pfaE 별법의 출발부 비교 pfaE 별법의 부위 #1은 서열 7의 뉴클레오티드 13821에서 출발함 이는 표시된 pfaE 출발부의 78개 뉴클레오티드 상류임 pfaE 별법의 부위 #2는 서열 7의 뉴클레오티드 13743에서 출발함 이는 표시된 pfaE 출발부의 156개 뉴클레오티드 상류임 |
실시예
3
하기 실시예는 쉬조키트리움 Orf A, B 및 C가 이. 콜라이에서 기능적 발현을 통해 기능적 DHA/DPA 합성 효소를 코딩한다는 것을 입증한다.
이.
콜라이
형질전환체의 일반적 제조
DHA 및 DPA (Orf A, B 및 C; 각각 서열 13, 서열 15 및 서열 17)를 생산하는 쉬조키트리움 PUFA PKS 시스템을 코딩하는 3개 유전자를 단일 이. 콜라이 발현 벡터 (pET21c (노바젠(Novagen))으로부터 유래됨) 내로 클로닝하였다. 상기 유전자는 (T7 RNA-폴리머라제에 의해) 단일 메세지로서 전사하고, 각 유전자 앞에 클로닝된 리보솜-결합 부위는 번역을 개시한다. Orf B 코딩 서열의 변형이 이. 콜라이에서 전장 Orf B 단백질의 생산을 얻기 위해 필요하였다 (하기 참조). PPTase (하기 참조)를 코딩하는 액세서리 유전자를 제2 플라스미드 (pACYC184로부터 유래됨, 뉴 잉글랜드 바이오랩스(New England Biolabs)) 내로 클로닝하였다.
Orf B 유전자는 질량 약 224 kDa의 단백질을 코딩하는 것으로 예측된다. 이. 콜라이에서 상기 유전자의 발현에 대한 초기 시도는 겉보기 분자 질량 약 165 kDa의 단백질을 축적하였다 (SDS-PAGE 동안 공지된 질량의 단백질과 비교함으로써 판단함). Orf B 뉴클레오티드 서열의 조사는 15개의 연속적 세린 코돈 (이들 모두가 TCT 코돈임)을 함유한 영역을 나타냈다. 유전자 코드는 6개 상이한 세린 코돈을 함유하고, 이들 중 3개는 이. 콜라이에서 종종 사용된다. 본원 발명의 발명자들은 4개의 중복 올리고뉴클레오티드를 폴리머라제 쇄 반응 프로토콜과 조합 사용하여 세린 코돈 반복 영역을 함유하는 Orf B 유전자 (약 195개 염기 쌍, BspHI 내지 SacII 제한 효소 단편) 중 작은 일부를 재합성하였다. 합성 Orf B 단편에서, 이. 콜라이에 의해 보통 사용되는 3개 세린 코돈의 무작위 혼합물을 사용하고, 일부 다른 잠재적인 불확실 코돈도 바꾸었다 (즉, 이. 콜라이에 의해 거의 사용되는 않는 다른 코돈). 원래 Orf B 중에 존재하는 BspHI 내지 SacII 단편을 재합성된 단편으로 대체하고 (Orf B*를 수득함), 변형된 유전자를 관련 발현 벡터 내로 클로닝하였다. 변형된 Orf B*는 여전히 서열 16의 아미노산 서열을 코딩한다. 이. 콜라이에서의 변형된 Orf B* 클론의 발현은 약 224 kDa 단백질을 나타냈으며, 이는 Orf B의 전장 생성물을 생산하였다. 재합성된 Orf B* BspHI 내지 SacII 단편의 서열을 본원에서 서열 29로서 나타낸다. 서열 29로서 지칭하여, Orf B의 재합성된 BspHI 내지 SacII 영역의 뉴클레오티드 서열을 나타낸다. BspHI 제한 부위 및 SacII 제한 부위를 동정하였다. BspHI 부위는 Orf B CDS (서열 15)의 뉴클레오티드 4415에서 출발한다 (주의: Orf B CDS에 총 3개의 BspHI 부위가 있지만, SacII 부위는 단 1개임).
Orf A 단백질 (쉬조키트리움에서의 서열 14)의 ACP 도메인은 기능을 위해 포스포판테테인 군을 첨가함으로써 활성화되어야 한다. 이 일반 유형의 반응을 촉매하는 효소는 포스포판테테인 트랜스퍼라제 (PPTase)로 칭해진다. 이. 콜라이는 2개의 내인성 PPTase를 함유하지만, 쉬조키트리움으로부터의 Orf A ACP 도메인을 인식하지 않을 것으로 예상되었다. 이는 추가 PPTase 없이 이. 콜라이에서 Orf A, B* (상기 참조) 및 C를 발현시킴으로써 확인되었다. 이 형질전환체에서, DHA 생산은 검출되지 않았다. 본 발명의 발명자들은 이. 콜라이 PUFA PKS 발현 시스템에서 2개의 이종 PPTase를 시험하였다: (1) sfp (바실러스 섭틸리스로부터 유래됨) 및 (2) HetI (남조류 노스토크 균주 7120로부터 유래됨).
sfp PPTase는 잘 특징규명되어 있고, 광범위한 기질을 인식하는 그의 능력 때문에 널리 사용되고 있다. 공개된 서열 정보에 기초하여 [Nakana, et al., 1992, Molecular and General Genetics 232:9321], sfp에 대한 발현 벡터는 코딩 영역을 특징지어진 상류 및 하류 플랭킹 DNA 서열과 함께 pACYC-184 클로닝 벡터 내로 클로닝함으로써 작제하였다. 올리고뉴클레오티드
CGGGGTACCCGGGAGCCGCCTTGGCTTTGT (전방향, 서열 30), 및
AAACTGCAGCCCGGGTCCAGCTGGCAGGCACCCTG (역방향, 서열 31)를 사용하여 게놈 비. 섭틸리스 DNA로부터 목적하는 영역을 증폭하였다. 플라스미드: pBR301을 생성하기 위해 중간체인 높은 카피수 벡터 중의 마지막으로 pACYC184의 EcoRV 부위 내에 클로닝을 용이하게 하기 위해 편리한 제한 효소 부위를 올리고뉴클레오티드에 포함시켰다. sfp에 대해 예상되는 이동성을 갖는 신규 단백질의 존재를 나타내는 이 플라스미드로 형질전환시킨 이. 콜라이의 추출물을 조사하였다. Orf A, B*, C 단백질을 특정 조건하에 발현하는 세포에서의 sfp 구조물의 동시발현은 DHA를 생산하였다. 이 실험은 sfp가 쉬조키트리움 Orf A ACP 도메인을 활성화시킬 수 있음을 입증하였다. 또한, sfp 유전자와 회합된 조절성 요소를 사용하여 발현 카세트를 생성하였으며, 여기서 다른 유전자는 상기 발현 카세트 내에 삽입될 수 있다. 구체적으로, pBR301 중의 sfp 코딩 영역 (ATG의 상류 직전에 존재하는 3개 뉴클레오티드와 함께)은 (이 구조물에 대해) 몇몇 특이한 제한 효소 부위를 함유하도록 고안된 DNA의 53 염기 쌍 절편으로 대체하였다. 이 영역 중의 초기 제한 효소 부위는 NdeI이다. 이 부위에 끼워 넣어진 ATG 서열은 도입된 유전자에 대한 개시 메티오닌 코돈으로서 사용한다. 추가 제한 부위 (BglLL, NotI, SmaI, PmelI, HindIII, SpeI 및 XhoI)를 포함시켜 클로닝 과정을 용이하게 하였다. 이 발현 벡터 카세트의 기능성은 5' 말단에 NdeI 부위 및 3' 말단에 XhoI 부위를 갖는 sfp의 버전을 생산하는 PCR을 사용함으로써 시험하였다. 이 단편을 발현 카세트 내에 클로닝하고, Orf A, B* 및 C 발현 벡터와 함께 이. 콜라이 내로 전달하였다. 적절한 조건 하에, 이들 세포는 DHA를 축적하였으며, 이는 기능적 sfp가 생산되었음을 입증한다.
본원 발명의 발명자들이 알고 있는 바로는, HetI은 이종 상태에서 이전에 시험된 적이 없었다. HetI은 해당 유기체의 이형세포 중에 존재하는 당-지질 층의 성분인 장쇄 히드록시-지방산의 합성을 담당하는 것으로 공지된 노스토크에서의 유전자의 클러스테 중에 존재한다. 본원 발명의 발명자들은 이론에 얽매이는 것은 아니지만, HetI가 해당 클러스터 중에 존재하는 단백질인 Hgl E의 ACP를 활성화시키는 것으로 여겨진다. Hgl E의 2개 ACP 도메인은 쉬조키트리움 Orf A에서 발견되는 ACP 도메인에 대해 높은 정도의 서열 상동성을 가진다. 서열 32는 노스토크 HetI 단백질의 아미노산 서열을 나타낸다. HetI의 내인성 출발 코돈은 동정되지 않았다 (상기 추정적 단백질에는 메티오닌이 존재하지 않음). 오픈 리딩 프레임의 5' 말단 근처에 몇몇 잠재적인 다른 출발 코돈 (예컨대, TTG 및 ATT)이 있다. 상기 서열에는 메티오닌 코돈 (ATG)이 존재하지 않는다. HetI 발현 구조물을 가장 먼 5'의 잠재적인 다른 출발 코돈 (TTG)을 메티오닌 코돈 (ATG, 상기 기재된 NdeI 제한 효소 인식 부위의 부분으로서)으로 대체하기 위해 PCR을 사용하고, 코딩 서열의 3' 말단에 XhoI 부위를 도입시킴으로써 생산하였다. 변형된 HetI 코딩 서열을 이어서 sfp 조절성 요소를 함유한 pACYC184 벡터 구조물의 NdeI 및 XhoI 부위 내에 삽입하였다. 이. 콜라이에서의 이 HetI 구조물의 발현은 서열 데이타로부터 예상되는 크기의 신규 단백질을 나타냈다. 몇몇의 조건 하에 이. 콜라이에서 쉬조키트리움 Orf A, B*, C와 HetI를 공동-발현시킴으로써 이들 세포에 DHA 및 DPA를 축적시켰다. sfp 및 HetI을 비교하는 모든 실험에서, DHA 및 DPA는 sfp 구조물을 함유한 세포보다 HetI 구조물을 함유한 세포에서 더 축적되었다.
이.
콜라이
형질전환체에서의
DHA
및
DPA
의 생산
(1) 쉬조키트리움 PUFA PKS 유전자 (Orf A, B* 및 C) 및 (2) (sfp 또는 HetI로부터의) PPTase를 코딩하는 2개의 플라스미드로 유도가능 T7 RNA 폴리머라제 유전자를 함유하는 이. 콜라이 균주 BL21을 형질전환시켰다. 쉬조키트리움 단백질의 합성을 배지에 IPTG를 첨가함으로서 유도하는 반면에, PPTase 발현은 별개의 조절성 요소로 제어하였다 (상기 참조). 세포를 각종 정의된 조건 하에 2개의 이종 PPTase 유전자를 사용하여 성장시켰다. 상기 세포를 수거하고, 지방산을 메틸-에스테르 (FAME)로 전환시키고, 가스-액체 크로마토그래피로 분석하였다.
몇몇의 조건 하에, DHA 및 DPA는 쉬조키트리움 PUFA PKS 유전자, 및 2개의 이종 PPTases 중 하나를 발현하는 이. 콜라이 세포에서 검출하였다 (데이타는 나타내지 않음). DHA 또는 DPA가 대조군 세포로부터 생산된 FAME에서는 검출되지 않았다 (즉, 상기 세포를 Orf 중 하나가 결실된 플라스미드로 형질전환시킴). 이. 콜라이에서 관찰된 DHA 대 DPA 비율은 쉬조키트리움에서 관찰된 내인성 DHA 및 DPA 생산의 비율에 대략 이른다. 약 17%의 총 FAME를 나타내는 최고 수준의 PUFA (DHA 및 DPA)는 10% (중량) 글리세롤로 보충된 765 배지 (아메리칸 타입 컬쳐 콜렉션으로부터 입수가능한 제조법) 중에 32℃에서 성장한 세포에서 발견되었다. PUFA 축적을 5 또는 10% 글리세롤로 보충된 루리아(Luria) 브로쓰에서 성장시키는 경우 및 20℃에서 성장시키는 경우에도 관찰되었다. 성장 동안 적절한 항생제를 함유하여 유지하고, IPTG (최종 농도 0.5 mM)를 사용하여 Orf A, B* 및 C의 발현을 유도함으로써 각 플라스미드의 존재에 대해 선별하였다.
실시예
4
하기 실시예는 쉬조키트리움 PUFA PKS 효소 복합체를 코딩하는 유전자가 선택적으로 불활성화될 수 있고 (넉아웃), 배지가 다중불포화 지방산으로 보충되지 않는 경우에는 치사 표현형임을 입증한다.
상동성 재조합은 쉬조키트리움에 입증되었다 (동시계류중인 미국 특허 출원 제10/124,807호 참조, 그 전문이 본원에 참고로 도입됨). 쉬조키트리움 Orf A (서열 13)를 불활성화시키기 위해 고안된 플라스미드는 제노신™ 내성 마커를 Orf A 코딩 서열을 함유한 클론의 SmaI 부위 내에 삽입함으로써 생산하였다. 제노신™ 내성 마커는 플라스미드 pMON50000으로부터 수득하였다 (제노신™ 내성 유전자의 발현은 쉬조키트리움 유래 튜불린 프로모터 요소에 의해 유도됨 (미국 특허 출원 제10/124,807호 참조 (동일 문헌))). 따라서, 넉아웃 구조물은 5' 쉬조키트리움 Orf A 코딩 서열, tub-제노신™ 내성 요소 및 3' 쉬조키트리움 Orf A 코딩 서열로 구성되어 있으며, 이들 모두는 pBluescript II SK (+) 벡터 (스트라타진) 내로 클로닝하였다.
플라스미드를 입자 충격에 의해 쉬조키트리움 세로 내로 도입하고, 형질전환체를 제노신™을 함유하고 다중불포화 지방산 (PUFA)으로 보충한 플레이트 상에서 선별하였다 (실시예 5 참조). 제노신™ 및 PUFA 플레이트 상에서 성장한 콜로니를 PUFA 보충이 없는 플레이트 상에서 성장하는 능력에 대해 시험하고, 몇몇이 PUFA를 요구함을 발견하였다. 이들 PUFA 영양요구체는 추정적 Orf A 넉아웃이다. 몇몇의 이들 돌연변이체로부터 추출된 RNA의 노던 블럿 분석으로 전장 Orf A 메세지가 이들 돌연변이체에서 생성되지 않았음을 확인하였다.
이들 실험은 쉬조키트리움 유전자 (예컨대, Orf A)가 상동성 재조합을 통해 불활성화될 수 있고, Orf A의 불활성화는 치사 표현형을 나타내게 하고, 이들 돌연변이체가 PUFA로 배지를 보충하는 것에 의해 구조될 수 있다는 것을 입증하였다.
쉬조키트리움 Orf B (서열 15) 및 Orf C (서열 17)의 불활성화와 관련된 실험의 유사한 세트가 유사한 결과를 생성하였다. 즉, Orf B 및 Orf C는 상동성 재조합에 의해 개별적으로 불활성화될 수 있고, 이들 세포는 성장을 위해 PUFA 보충을 요구한다.
실시예
5
하기 실시예는 PUFA 영양요구체가 EPA로 보충된 배지 상에서 유지될 수 있다는 것을 나타내며, 이는 EPA가 쉬조키트리움에서 DHA를 치환할 수 있음을 입증한다.
실시예 4에 나타낸 바와 같이, PUFA PKS 복합체가 불활성화된 쉬조키트리움 세포는 생존하기 위해 PUFA의 보충을 요구하였다. 쉬조키트리움이 성장을 위해 이 시스템의 생성물에 대해 의존적임을 입증하는 것 이외에, 이 실험적 시스템은 돌연변이체를 구조하는 능력에 대한 각종 지방산의 시험을 허용한다. 돌연변이체 세포(임의의 3개 유전자가 불활성화됨)가 EPA로 보충된 배지 상에서도 성장하지만, DHA로 보충된 배지에서 성장함을 발견하였다. 이 결과는 DHA를 생산하는 내인성 PUFA PKS 복합체가 생성물이 EPA인 것으로 대체되는 경우에 세포가 생존가능할 것임을 나타낸다. 또한, 이들 돌연변이체 세포는 ARA 또는 GLA 보충에 의해 구조될 수 있으며, 이는 이들 생성물을 생산하는 유전자 변형 쉬조키트리움의 생산 가능성을 입증한다. PUFA 보충에 바람직한 방법이 배지에 PUFA 첨가 이전에 유리 지방산과 부분적 메틸화 베타-시클로덱스트린과의 조합을 포함하는 것을 염두에 두어야 한다.
실시예
6
하기 실시예는 불활성화된 PUFA 유전자가 PUFA 합성을 복구하기 위해 유전자의 활성 형태로 동일한 부위에서 대체될 수 있다는 것을 나타낸다.
아세토락테이트 신타제 유전자 부위에서의 이중 상동성 재조합이 쉬조키트리움에서 입증되었다 (미국 특허 출원 제10/124,807호, (상기 문헌) 참조). 본원 발명의 발명자들은 쉬조키트리움 Orf A 넉아웃 균주 (실시예 3에 기재됨)를 전장 쉬조키트리움 Orf A 게놈 클론으로 형질전환시키는 것에 의한 쉬조키트리움 PUFA PKS 유전자의 대체에 대한 이 개념을 시험하였다. 형질전환체는 보충 PUFA 없는 배지 상에서 성장할 수 있는 능력에 의해 선별하였다. 이들 PUFA 원영양체는 이어서 제노신™에 대한 내성에 대해 시험하고, 몇몇이 항생제에 민감성임을 발견하였다. 이들 결과는 도입된 쉬조키트리움 Orf A가 이중 상동성 재조합을 통해 넉아웃 균주에서 제노신™ 내성 유전자를 대체하였음을 나타낸다. 이 실험은 PUFA PKS 유전자 내에서의 유전자 대체에 대한 개념을 입증한다. 쉬조키트리움 Orf B 및 Orf C 넉아웃에 대한 유사한 실험도 동일한 결과를 나타냈다.
실시예
7
이 실시예는 트라우스토키트리움 23B PUFA PKS 유전자의 모두 또는 일부분이 쉬조키트리움에서 기능할 수 있음을 나타낸다.
미국 특허 출원 제10/124,800호 (상기 문헌)에 기재된 바와 같이, DHA-생산 원생생물 트라우스토키트리움 23B (Th. 23B)는 orfA, orfβ, 및 orfC 상동체를 함유한다는 것을 나타냈다. 3개의 Th. 23B 유전자의 완전한 게놈 클론을 사용하여 동족체 orf "넉아웃"을 함유한 제노신™-내성 쉬조키트리움 균주를 형질전환시켰다 (실시예 4 참조). 상보체화된 형질전환체에 대한 직접 선별을 PUFA 보충 부재하에 수행하였다. 이 방법에 의해, Th. 23B orfA 및 orfC 유전자가 쉬조키트리움 orfA 및 orfC 넉아웃 균주를 각각 PUFA 원영양체로 보완할 수 있음을 나타냈다. 제노신™ 내성을 보유하거나 결실하는 상보체화된 형질전환체를 발견하였다 (마커가 쉬조키트리움 유전자 내로 삽입되었으며, 이에 의해 넉아웃이라 정의함). 제노신™-내성 상보체화 형질전환체는 각 orf 영역의 쉬조키트리움 게놈 외부 내로 전체 트라우스토키트리움 유전자를 단일 교차 통합시킴으로써 발생되는 것 같다. 이 결과는 전체 트라우스토키트리움 유전자가 쉬조키트리움에 기능하고 있다는 것을 시사한다. 제노신™-민감성 상보체화 형질전환체는 일부 (또는 상상할 수 있는 모든) 트라우스토키트리움 유전자가 파괴된 제노신™ 내성 마커를 함유하는 쉬조키트리움 유전자의 동족체 영역을 기능적으로 대체하는 이중 교차 현상에 의해 발생하는 것 같다. 이 결과는 트라우스토키트리움 유전자의 분획이 쉬조키트리움에서 기능하고 있다는 것을 시사한다.
실시예
8
이 실시예에서, 전체 쉬조키트리움 orfC 코딩 서열은 트라우스토키트리움의 것 쪽으로 이동되는 PUFA 프로파일을 생성하는 트라우스토키트리움 23B orfC 코딩 서열에 의해 완전히 정확하게 대체된다.
쉬조키트리움 orfC 코딩 서열을 결실시키기 위해서, 그 직전 상류 (ATG 출발 코돈까지이지만 ATG 출발 코돈을 포함하지는 않음) 및 그 직후 하류 (TAA 정지 코돈 바로 뒤에서 시작함)의 대략 2kb DNA를 제노신™ 내성 마커 주변에 클로닝하였다. 상류 및 하류 영역은 마커를 갖는 orfC 코딩 서열을 효과적으로 대체한 이중 교차 재조합에 대해 상동성을 제공한다. 형질전환체를 보충 PUFA의 존재하에 제노신™ 내성에 대해 선별하고, PUFA 영양요구체에 대해 스크리닝하고, PCR 및 써던 블럿 분석에 의해 특징규명하였다. 유사하게, 쉬조키트리움 orfC 유전자 영역의 동일한 상류 및 하류 서열이 Th. 23B orf C 코딩 서열 (서열 23) 주변에 클로닝된 플라스미드를 작제하였다. 상기 기재된 바와 같이 이 플라스미드를 제노신™ 내성 PUFA 영양요구체 내로 형질전환시키는 것을 PUFA 원영양체에 대한 선별로 수행하였으며, 이는 쉬조키트리움에서 정확하게 기능하고, PUFA 영양요구체를 상보체화시키는 Th. 23B orfC 유전자에 의존한다. 제노신™ 민감성 형질전환체에 대한 차후 스크리닝은 제노신™ 내성 마커를 Th. 23B orfC 유전자로 대체하는 것에 의해 발생되는 것 같은 형질전환체를 동정하였다. 이들 orfC 대체 균주의 DHA:DPA 비율은 평균적으로 8.3 대 일반 값 ("야생형") 2.3이었다. 더 높은 비율은 이들 성장 조건 하에서 트라우스토키트리움 23B에 대해 대략 값 10에 이른다. 따라서, 이는 쉬조키트리움의 PUFA 프로파일이 PUFA 신타제 효소 복합체의 성분을 치환함으로써 조작될 수 있다는 것을 나타낸다.
더욱 구체적으로, 플라스미드의 제1 쌍은 쉬조키트리움 orfC 유전자 직전의 "상류" 및 그 직후의 "하류" 영역들을 포획하고, orfC 결실 벡터 뿐만 아니라 Th. 23B 대체 벡터를 모두 작제하기 위해 사용하였다.
프라이머 prRZ15 (서열 49) 및 prRZ16 (서열 50)을 사용하여 쉬조키트리움 orfC 영역의 클론으로부터 orfC 코딩 영역의 2000 bp 단편 상류를 증폭시켰다. 프라이머 prRZ15는 단편의 5' 말단에 KpnI 부위를 혼입하고, prRZ16은 쉬조키트리움 서열에 ATG 출발 코돈을 포함하지 않고 그 이하까지 상동성을 함유하고, BamHI 부위를 단편의 3' 말단에 혼입한다. PCR 생성물을 pCR-Blunt II (인비트로젠) 내로 클로닝하여 플라스미드 pREZ21을 생산하였다. 유사한 방식으로, 프라이머 prRZ17 (서열 51) 및 prRZ18 (서열 52)을 사용하여 orfC 코딩 영역 (TAA 정지 코돈은 함유하지 않음) 직후의 하류에 존재하는 1991 bp 단편을 증폭하지만, BamHI 부위를 5' 말단에 및 XbaI 부위를 3' 말단에 혼입하였다. 이 PCR 단편을 pCR-Blunt II (인비트로젠) 내로 클로닝하여 pREZ18을 생성하였다. 3개-성분 라이게이션에서, pREZ21로부터의 상류 영역 (KpnI-BamHI 단편으로서) 및 pREZ18의 하류 영역 (BamHI-XbaI 단편으로서)을 pBlueScriptII SK(+)의 KpnI-XbaI 부위 내에 클로닝하여 pREZ22를 수득하였다. pTUBZEO11-2로부터의 제노신™ 내성 마커 (a.k.a. pMON50000, 미국 특허 출원 제10/124,807호, (상기 문헌) 참조)를 1122 bp BamHI 단편으로서 pREZ22의 BamHI 부위 내에 삽입하여 pREZ23A 및 pREZ23B (제노신™ 내성 마커를 2 배향 중 1 배향으로 함유함)를 생산하였다. pREZ23 플라스미드를 이어서 사용하여 상기 기재한 바와 같이 입자 충격 형질전환에 의해 orfC 코딩 영역의 정확한 결실을 생성시켰다. 원하는 구조를 갖는 균주를 B32-Z1이라 명명하였다.
Th. 23B orfC 유전자의 삽입을 위한 플라스미드를 개발하기 위해, 1) 쉬조키트리움 상류 영역 및 Th. 23 B orfC 코딩 영역의 5' 말단과 2) Th. 23B orfC 코딩 영역의 3' 말단 및 쉬조키트리움 하류 영역 간의 정확한 연결부를 함유한 중간체 구조물을 먼저 생산한다. 이어서, Th. 23B orfC 코딩 영역의 내부 절편을 도입한다.
프라이머 prRZ29a (서열 53) 및 prRZ30 (서열 54)를 사용하여 쉬조키트리움 orfC 코딩 서열의 직전 상류에 존재하는 대략 100 bp를 증폭한다. 프라이머 prRZ29a는 쉬조키트리움 orfC ATG 출발 코돈의 SpeI 제한 부위 대략 95 bp 상류를 포함하고, prRZ30은 쉬조키트리움 orfC ATG 출발 코돈의 직전 상류에 존재하는 상동성부 19 bp 및 Th. 23B orfC 코딩 영역의 출발에 상동성인 15 bp (출발 ATG를 포함함)를 함유한다. 별개로, 대략 450 bp PCR 생성물은 클로닝된 Th. 23B 유전자를 주형으로서 사용하여 Th. 23B orfC 코딩 영역의 5' 말단으로부터 생산한다. 프라이머 prRZ31은 출발 ATG의 직전 상류에 존재하는 쉬조키트리움 orfC 코딩 서열의 15 bp 및 Th. 23B orfC 코딩 영역의 출발에서 상동성부 17 bp를 함유하고, 프라이머 prRZ32는 Th. 23B orfC ATG 출발 코돈의 대략 450 bp 하류에서 위치한 NruI 부위를 혼입하고, NruI 부위의 직전 하류에 존재하는 인공적인 SwaI 제한 부위를 추가로 포함한다. 따라서, 이들 2개 PCR 생성물은 prRZ30 (서열 54) 및 prRZ31 (서열 55)의 서열을 본질적으로 포함하는 출발 ATG에서 약 30 bp의 서로 중복 상동성부를 가진다. 2개 제1회 PCR 생성물 (prRZ29a (서열 53) X prRZ30 (서열 54), 약 100 bp, prRZ31 (서열 55) X prRZ32 (서열 56), 약 450 bp)을 주형으로 및 외부 프라이머 prRZ29a (서열 53) 및 prRZ32 (서열 56)의 믹스를 사용하는 제2회의 PCR은 상류 쉬조키트리움 orfC 영역 및 Th. 23B orf C 코딩 영역의 출발부 사이의 "완전 스티치(perfect stitch)"를 함유한 대략 520 bp 생성물을 생산하였다. 상기 PCR 생성물을 플라스미드 pCR-Blunt II 내로 클로닝하여 pREZ28을 생성하고, 삽입물의 서열을 확인하였다.
프라이머 prRZ33 (서열 57) 및 prRZ34 (서열 58)를 PCR에 사용하며 클로닝된 Th. 23B 유전자를 주형으로서 사용하여 Th. 23B orf C 코딩 영역의 3' 말단에서 대략 65 bp의 단편을 생산하였다. (prRZ33으로부터의) 이 단편의 상류 말단은 인공적인 SwaI 제한 부위를 함유하고, Th. 23B orfC TAA 종결 코돈의 대략 60 bp 상류에 SphI 제한 부위를 포함한다. (prRZ34로부터의) 이 단편의 하류 말단은 Th. 23B orf C 코딩 영역의 3' 말단에서 16 bp 및 orfC 코딩 영역 (종결 코돈을 포함함) 직후의 하류에 존재하는 쉬조키트리움 서열에 상동성인 18 bp를 함유한다. 프라이머 prRZ35 (서열 59) 및 prRZ36 (서열 60)을 사용하여 상기 orfC 코딩 영역 직후의 하류에 존재하며 쉬조키트리움 DNA에 상동성인 대략 250 bp 단편을 생산하였다. (prRZ35로부터의) 이 PCR 단편의 상류 말단은 Th. 23B orf C 코딩 영역 (TAA 정지 코돈을 계수함)의 말단부에 상동성인 15 bp를 함유하고, 하류 말단은 쉬조키트리움 정지 코돈의 약 240 bp 하류에 SalI 제한 부위를 함유하였다. 주형으로서의 2개의 제1회 PCR 생성물 (prRZ33 (서열 57) X prRZ34 (서열 58), 약 65 bp, prRZ35 (서열 59) X prRZ36 (서열 60), 약 250 bp) 및 외부 프라이머 prRZ33 (서열 57) 및 prRZ36 (서열 60)의 믹스를 사용하는 제2회의 PCR은 트라우스토키트리움 23B orfC 코딩 영역과 orfC 코딩 영역 직후의 하류에 존재하는 쉬조키트리움 DNA 영역 간의 "완전 스티치"를 함유한 대략 310 bp 생성물을 생산하였다. 상기 PCR 생성물을 플라스미드 pCR-Blunt II 내로 클로닝하여 pREZ29를 생산하고, 삽입물의 서열을 확인하였다.
다음에, 상류 및 하류 "완전 스티치" 영역을 pREZ22 내로 합하였다 (상기 참조). 3개 성분 라이게이션에서, pREZ28로부터의 SpeI/SwaI 단편 및 pREZ29의 SwaI/SalI 단편을 pREZ22의 SpeI/SalI 부위 내로 클로닝하여 pREZ32를 생산하였다. 마지막으로, 트라우스토키트리움 23B orfC 코딩 영역의 내부 벌크를 NruI/SphI 단편으로서 pREZ32 내로 클로닝하여 pREZ33을 생산하였다. 이어서, 이 플라스미드를 PUFA 원영양체에 대한 선별과 함께 사용하여 orfC 넉아웃 균주 B32-Z1을 형질전환시켰다.
본원에서 언급되거나 논의된 각 간행물은 그 전문이 본원에 참고로 도입된다.
본 발명의 각종 실시양태가 상세하게 기재되어 있지만, 이들 실시양태가 변형 및 개조될 수 있다는 것은 당업자에 명백하다. 그러나, 이러한 변형 및 개조는 하기하는 청구의 범위에 기재한 바와 같은 본 발명의 범위에 속한다는 것을 분명히 이해해야 한다.
SEQUENCE LISTING
<110> Weaver, Craig
Zirkle, Ross
James, Metz G.
<120> PUFA Polyketide Synthase Systems and Uses Thereof
<130> 2997-49-1-PCT
<150> 10/965,017
<151> 2004-10-13
<160> 62
<170> PatentIn version 3.3
<210> 1
<211> 39669
<212> DNA
<213> Sh. japonica
<400> 1
gatctggcga taacttactc cccattccac tgtatcagct gcctgcaacc tttaacggcg 60
atcataaacg cgtcattcgc tggcagacag agtggcaagc ctgtgatgaa ttacaaatgg 120
cagcggccac aaaggctgaa tttgcagcat tagaagaaat taccagtcat caaagtgatt 180
tatttagacg gggctgggat atcaggggcg gagttgagta tttaactaaa atcccaactt 240
attattattt ataccgtgtc ggtggcgaaa accttgccag tgaaaaaaac cgagcttgtc 300
cacgttgcgg ctcaaaagcg tggcgtttag atgagccatt attagacatg ttccacttta 360
ggtgcgagcc atgtcgaatt gtatcgaata tctcatggga tcatcagtaa aattatcttc 420
tcgtcaatag atactaatac aacgagttag ctgataacgc attatcggtt cattcaataa 480
aaaagccaga ccgcatctat agcctgatct atagcctggc ttttttattt tatgtccgaa 540
taagcaatta tttcttgcct ttaatcaaat cattccacat cattttcatt cgctgccaaa 600
tacctggatg agcaacatat tcctctacaa tcggctctac cggcggcgtt actcgtggtg 660
ttagcgcatc aataaattcc gcaagactat cggctaattt atctttgggc ctatcacctg 720
gaatttcaat ccacacactg ccatcttcat tatcgacagt aatcatctgt tcgccatcac 780
ctaaaacgcc aacaaaccaa gttggtgctt gtttaagctt tttcttcatc attaagtggc 840
caattacatt ttgttgcaaa gattcaaaat cttgctggtt ccaaacctgc agtaactccc 900
cttcgcccca tttagaatcg aaaaaaagtg gcgcagaaaa aaactcacca taaaaggcat 960
taatgtcttg atgaagcttg atgtctaatg catgttctac attactgaaa tctgaattac 1020
tttttcgttt taccgctttc caaaaaaccg caccgtcaga ttcaagatca tacttgcctt 1080
caatacaagc ggatccttgc ccaagtggga aataacgggg taactcgtct aatacatcct 1140
gataagcttg tatataacgg ctagaaaaat gttccaatga agttgaacaa gacacttaag 1200
atgctccagt tttgggttat aataaaagtc tattttgaca cggaaacaga ctagatgaca 1260
cacaatcacg acccctatag tgatgcagat gcacttaaag gactcacttt aggtcaatcg 1320
acgcaatatc aagcagaata tgatgcttca ctgctgcaag gggttcctcg taaacttaat 1380
cgcgacgcta ttgaattaac tgatactctg ccgtttcaag gggcagatat ttggactggc 1440
tacgagttat cttggttgaa cgccaaaggt aaacctatgg tcgcaatgat tgaagtttac 1500
cttgctatcg aaagtgataa tttaatcgaa tcaaaatcgt tcaagttgta tttaaacagc 1560
tttaaccaaa cacgttttga cagtgtagac cacgttcagc aaaccttaac cactgactta 1620
agccaatgcg ctaatggtaa ggtaacagtg aaagtgattg agcctaagca tttcaatact 1680
caacgtattg ttgaactacc tggcaattgt atcgatgagc tagatattga agtcaatgat 1740
tatgaattta accctgagta cttgcaagac agcactgaag agaaaaatgt tgtcgaaaca 1800
ctcacatcaa acttattaaa atctaactgt ttaatcactt cacagcctga ttggggaagt 1860
gtgatgatcc gttatcaagg cccaaagatt aatcatgaaa agctattgcg ctatttaatc 1920
tcattccgcc aacataatga atttcatgag caatgtgtag agcgtatttt taccgaccta 1980
aaacgatact gtcattgtac taagctcact gtttatgcac gttatactcg ccgcggtgga 2040
ttggatatca acccattcag aagcgacctt gagcaacctc cagagacgca ccgtttagca 2100
agacaataaa tagcttattc atcaatcagc ttaatgaata aagcctaatc cctaggcttt 2160
attcatttat tttctgtcgt aataccgagc ccttcatgcc tacagacaat gttacttgtt 2220
taacaccaac aactgacgat attcagtccc ataagcattt caaaatattt aaaccctttg 2280
gttttttaag tcagtttgtg cctgaaactc gaaagaaaaa acacttattg ggcgagttat 2340
gtcagtttcc agataaaacc atggcaattg gtcgattaga ccatgattct gaaggcttat 2400
tactgctaac aactgacggc atgatgagcc ataaagtgag aagtaaaggc atcgaaaaag 2460
aatattatgt tcaagtggat ggcgatatcg atgacaaggc gatgtcacaa ctacaaaacg 2520
gagttgaaat tggcattaat agcacgaaat atctcactca gccctgtaaa gcagtcaagc 2580
taaacgcaga gccaatactt ccctcacgcg gtaaaaaaat ccgcgatcca agacatggcc 2640
ccaccagctg ggtttcaatc acattaactg aaggtaaaaa ccgtcaaatc agaaaaatga 2700
ccgctgccgt tggctttgcc acattaaggc ttgttagggt cagaattggt aatatacata 2760
ttgatgatat gcgagctggc gacgttattg aactcaataa cttagattca gtaataaacc 2820
ctaaccttag ctaacccata aaacggggct attcatttat cggcttacct tactagttat 2880
tggttaaata cactttctcc atcgcagact ccaccagctc ccgtaaccac tttatcgcag 2940
ggtcttgatg attacgtgtt ggccaaatac tgtaaatcga aatcacttgg ctttcaaaag 3000
gcaagtccat caaaattaaa ttaaaaatag attgatagtt tttcgcgtag gtataaggcg 3060
caatacatat ggcatcggat ttactcacgc cagataacat cgtcagtaaa gaggattttt 3120
caccatacat atctcgttca ggtaaatggt ctgttgaaat catctctgca actcgctggt 3180
tatgacgatg aagtcgataa aacagatgct tagcagcgaa gtacgacact tcatctattc 3240
catgtttaaa ttgcgggtgc tcagccctag caacacaaac aagcttttcg gtggcaattt 3300
gcttactggt aaagctcgct tcagttggcg caacaatatc tagcgctaaa tcaatttgct 3360
gatttttaag ggcttgatat aaattaccct catctaaaat cgcttctgta aaaatgattt 3420
caacgccttt atccgtcagt gacttttcga tatctgcttc aatcaaatca ataattgatt 3480
cattagcgct gacatgaaat atccgttttg acaacgaagg gtcaaaggct ttaacgctat 3540
taatgcattg ttcgatttcg atgagtggca aacttaactg tcggtgcaag tgctgaccta 3600
tcgcagtgag agctatccct cttccttgcc taataaatag ttcaacaccc acaaccgctt 3660
taaaccgatt gatagcatta ctgactgacg actgagttaa tgcaaggtgc tccgctgcaa 3720
gcgtaataga ttgataatca catacacagc aaaaaactct aataaggtta agatccaact 3780
taagtaattg ttgttgcata agagcatcag actctaagtt ctcttgcttc atcacttctc 3840
ccataacaca tatcgccaaa tacattcaca cggtaaatgt attaaccatt tttagccata 3900
gttatatttg ggctttttat tgttaactta tctttaacaa taaaaagtac ccgaggccta 3960
catgagaaaa acacgagttg ctttagtcat cagtttatca tttaccaatg cagtggctgc 4020
tgcgcagcac gaacatgacc acatcagtct tgattaccag ggtaagcctg cgacgcccat 4080
taccgcagag cacaacaaag ccatagcaca aaagttaccg ttcgaagata aatccgcttt 4140
tgagcgcttt agtcgacata aaattgcctc ttttgatgaa gccaccgcca agatactgcg 4200
tgcagaattt aactttatca gtgacacgct tcctgattca gtcaaccctt cgttatatcg 4260
ccaagctcaa cttaatatgg taccagacgg gctctataaa gtgactgatg gcatttacca 4320
agtacgaggc actgacttat ctaacttaac ccttattcga ggtaaaacgg gttggattgt 4380
atatgacgtt ttattaacta aagaagctgt tcagcaatca ttaacatttg cttttgctca 4440
cttgcctgag ggcaaagatt tacctgttgt ggcaatgatt tactctcaca gccatgcaga 4500
tcatttcggt ggtgcccgtg gcgttcagga acgctaccct gatgtcaaag tgtatggttc 4560
atataatatt acccaagaga tagtggatga aaatgtactc gcgggtaatg tcatgagccg 4620
gcgagctgct taccaatacg gcgttacact cgataaacac aatcacggaa ttgtcgatgc 4680
agcgttagca aaaggtttat caaaaggcga aatcacttac gtcaaacctg attatgaact 4740
tcatcatcaa ggcaaatggg aaaccttgac cattgatggt cttgaaatgg tctttatgga 4800
tgcatctggc actgaagctg ccagtgaaat gatcacatat ataccatcta tgaaggcgct 4860
atggtcaggc gaattaacat atgatggtat gcacaatatt tataccttac gaggcgctaa 4920
agttcgcgac gcattaaaat ggtctaaaga cattaacgag atgattaatg catttggcga 4980
aaatgttcag gtactatttg cttcacattc tgcgccggta tggggaaata aagaaattaa 5040
tcattacctt cgcatgcagc gagataatta tggcctcgtt cataatcaat ctttacgttt 5100
agccaatgaa ggtgtggtaa tacaagatat tggtgatgca atcatggaaa ccattccaca 5160
aaatgtccaa gacgaatggt acaccaatgg ttatcacggt acatacagcc ataacgctaa 5220
agctgtgtac aacatgtatt taggctattt tgatatgaat ccagccaact taaacccctt 5280
acctacaaag gctgaagcaa ttaagtttgt agaatatatg ggcggcgcca acaatgtagt 5340
atcaaaagcg caagcagact tcaatcaagg cgagtatcgg tttgtcgcca ctgcattaaa 5400
taaggtggtc atggccgaac cacaacaccc ccaagcccga gaattacttg ccgataccta 5460
tgagcaactt ggctaccaag ccgaaggagc tggttggcga aatatttact taacaggtgc 5520
gcaagagtta cgtattggca ttaaacctgg cgcacctaaa tccgcatccg ctgatgttat 5580
cagcgaaatg gacatgtcca ctttatttga ctttctcgcg gttaaagttg acagcattaa 5640
cgccgccaag cttggcaata tcactttaaa tgtggtgaca caaagcggcg ataaaactga 5700
cacgctcttt gtagagttaa gtaacggaaa cttgagtaat atcaaagtag acgaggctaa 5760
aaaagccgat gccacactga caattaataa gtctgatgtc gttgcaatat tattaggtaa 5820
agcagatatg aaagcgttaa tgcaatcagg agctgcgagt atgcaaggtg acaaattagc 5880
atttgccaaa attgcatcaa cactggtgca atttaatcct gattttgaaa tcgtaccgct 5940
acagcatact cattagctca taacttaacg aaattcggct gcgaagtttt tcactctgct 6000
tctttgctta tattcactag tttaccaaga gtaatggcat gagagtttaa agcaaaaatg 6060
accgactaag acaagtgagg gaagattgtt ctgataagcc gtttttgatt agcagttaaa 6120
catccaaaaa accttaacag ttcgataaat cagttggttt ttatgaacat ttttatttgt 6180
tcatgccagc tgattttttt tgcctttaat tgaagtgtta atggcttttc gccaaaagcg 6240
aactcgccca cactcacagc aaatcgatat gaattattaa gcttacctaa acaacattgc 6300
cataaaggtg agacttcata aaaagactca acatcattag tctgttcaag ctcatcaacg 6360
tctgtaggct tcaataagct aagtgaaata tcatgctgaa ttggcaacaa ctgatcatct 6420
attgttaagt tagctaagct cggtgcagat aagtcaaatg caaacgattt aagcgacaag 6480
gccagtccca gtccctttgc tttaatataa gattctttca gtgcccataa atcgaaaaat 6540
cgctcacgct gctgactttc aggtaacgcc aataatgcag tttcttctgg ttttgaaaaa 6600
tagtgatgta aaattgaatg gatattcgtg ctttctcggc gacgttcaat atcgaccccc 6660
aattgaatgg gcattgaagc gtcctctttg gagtgaatga caccaataag caaccagtta 6720
ccactgtgac ttaaattaaa ctgtaagccc gtttgtttat attgcacagc cgatagccta 6780
ggtttgccct tctcaccata ctcaaattgc caatcgtctg gttcgatatt tgcaaagttc 6840
gataatacgc tgcgcaaata cccacgcacc attaaccctt gctgttgagc agcctgttga 6900
ataaaacgat ccactttatt tatctcagca tcagataacc atgaacgcac tgtagagacg 6960
gttttctcat ctaataaatt ggtatctaaa ggacaaaaaa ataattgaat agtgggtaaa 7020
gggctcaaac caaactcgca tttataatag caataagaca ttgtcgcttg ttctaggtcg 7080
ctaattcaac acataaacaa tcttgattga aaatgtcgtc taaggtttaa acaaataaag 7140
gaaggtttag acaaataaaa aagggttaag ccatccttaa ccctttgcat atcatctgtt 7200
atttcaataa gtattagcca atcaatctac cagtgctttt accgcctttt taggtaaaac 7260
atcataacgg ctaaactgca ttgaaaactg accttctcca cctgtcatag atttaagctt 7320
tgaagagtag ctactgacat tggcaagtgg cacttcaacg ctgacttcaa caagtccatt 7380
ggcatttgcc tgcgttccac aaataatgcc tctagatgca ctaatgtcac ctgtcacttc 7440
gccgacatgc tcttgcccaa ctaaaatgct catatcaact aatggttcta acattacagg 7500
ttttgctaac gatactgctt ctataaaagc ttttttaccc gccatcacaa aagcaatttc 7560
tttagagtct acactgtggt gtttgccatc caataacgtg acttttatgt cttgtaatgg 7620
atagccacct aactcaccgg ctagcatggc ttctcgcacg cctttctcta ctgctggaat 7680
atattgactt ggcactgagc caccaaccac cttcgaaata aactcaaagc cttcaccacg 7740
ctcaagtggc tcaatggcta attcaacttc accaaattgg ccagatccgc ctgattgttt 7800
tttatggcga taacggcatt gtgctttctc ggtgatggtt tctcgataag ccaccgccgg 7860
cgtatcagta tccatgtcga ggtggaacat attttgcgct ttttcaagcg caatttttaa 7920
atgcaaatcc ccttgacctt gcaatacggt ttgcccttca acctcacttc gagtgatgtg 7980
taaacttgga tcttcagcga ccagtttatt gagaacatcg gagatctttt gttcatcacc 8040
acgacgcttg gctgatacag ccaaaccaaa aataggttgc ggcacttcca gttctggtaa 8100
atgaaattca tcttcatcat ggctatcatg cagtacagaa ccaacactta atgcatccaa 8160
ttttgcaata gcgcaaatat cgccaggaaa cgcttgggat acattaattt gtttatcgcc 8220
ttgaagcttc attaagtgag agactttgaa aggtttgcgg ccttggccaa taagcagctt 8280
catgccaaca ttcagcgtcc cttggtacaa cctaaatacg cccagtcttc ctaaaaatgg 8340
gtcaattgaa acgctaaaca catgggctaa aacatgatct gttgcctttt gtgtcactgt 8400
tactggtgtc gactgttcac caaatccttt cataaattgt ggtgcattgg cttcaagtgg 8460
acttggcatg agtttgatca acatttctaa caatgaacta atcccaatat cttgttctgc 8520
acttgtaaag cagactggca ctaagtgccc cattctgagt gctttttcta gcggagcatg 8580
aagctgctga ggcgttaacg actcaccttg ctctaaatac aaggtcatta acgcttcatc 8640
ttcttcaagt accgtatcaa ctagctcatc tctagcacta gcaggttgac taaataatgt 8700
ctctgcactt tcatcacaat gtaaataaca atcaacaacg gcttttccat cggcactggg 8760
caagttaacc ggtaaacatc ggtgtccaaa ttgatgctga atgtcgatca tcacatctga 8820
cactcgcgtg agattactgt cgaggtggtt aatggcaata atcaccgctt taccttgcgc 8880
tcttgcagct tcaaaagcac gtttagtcac agactctata ccaacggcgg cattaataac 8940
caacagtact gactcaacgg caggcaaagg taataaggct cgcccgaaaa agtcaggtaa 9000
acctggcgtg tcgataaaat tgatatgatg ctgttgatac tgaaggtgta aaaatgaagg 9060
ctctaaactg tgacggtggg atttttcttg ggcagtgaaa tcagcatgat ttgtgccctt 9120
gtcgaccctg ccttttaacg atattgcctt agctctatac agcaatgctt caagcaagga 9180
tgatttgcct gctccaacat gtccgagcac agccaaatta cgggtttgct cagtagtaaa 9240
ctcagccata atggcctcct gttttcacat tattaaactt tccatattct tgtctaactt 9300
tgtttacgtt tggctattta ttgcgcataa aaatagcata cggggctaac aactcagatg 9360
aattgaccta gatcagtgtt tacatcggca acgtttttta taacaaaatc acccattcgg 9420
cttacaagtg ttagctaatt ctggtcgtat cagtgattaa ttagtttcgg gtgattgtat 9480
cgacccgaaa cctcaggtac tctgcatgct cgattgtgct aaaacgctaa ttttgaagat 9540
gaacaaacgt taatcttcac gtttttatac cgagtcccaa cagattgtac ggagtattca 9600
tcgaactatg gcagtcctta aatgaccgca aatagaaaag ctcacgctgt aactcaaaca 9660
gccgctaaga aagccacatc agaaaccgat gttgcgatgg cccctgttcg ccatagcaat 9720
gcaacaacga ctcctgaaat gcgtcaattt attcagactt ctgatttcag tgttagtcaa 9780
ttggctaaga ttcttaatat ctcggaagcc actgtcagaa agtggcgcaa gcgcgactca 9840
atcagtgata cgcccaatac tccacatcat ttgaaaacca cgctttcacc aatggaagaa 9900
tacgtggttg tgggacttcg ttatcaatta aaaatgtcac tggatagatt gcttcacgtc 9960
acacaacaat ttatcaaccc taacgtctct cgctctggtt tagcccgatg tttaaagcgc 10020
tacggcatat caaaactaga tgaatttgaa agccctcatg tgcctgagtg ttattttaat 10080
cagctgccta ttgttcaggg tacagatgta gcgacttata cactgaaccc tgaaacgctc 10140
gctaaaaccc ttgcattacc tgaagcgaca ccagataacg ttgtacaggt tgtatcgtta 10200
acgattccac ctcaactcac tcaagcggac agttattcca ttttgctcgg tgtcgacttt 10260
gcaaccgact gggtgtatct cgacatatat caagacaatc acacacaagc gacaaatcgt 10320
tatatcgctt atgtgttaaa gcacggcccg tttcatttac gtaagttatt agtcaaaaat 10380
taccacacct ttttagcccg ctttcctggc gcaacagttt tacaatccac ggaagcggca 10440
aaccaaaaaa ataaatcagc taaggatcag ctgaacactg gagactcaaa atgagccaag 10500
cccctacaaa tcctgagaca agctctcaag ataataacga gtcgcaagat acaagactga 10560
ataaacgtct taaagacatg cccattgcca ttgtcggcat ggccagtatc tttgccaact 10620
ctcgttacct gaataagttt tgggacttaa tcagcgaaaa aattgatgct attaccgaag 10680
tacctgatac ccactggcgc gctgaagatt actttgatgc tgacaagagc accccagata 10740
agagctactg taaacgcggt ggttttatcc ctgaagtgga ctttaaccca atggaatttg 10800
gcctgccgcc aaatatccta gaactgaccg atacttcgca attattgtca ttagtgattg 10860
ccaaagaagt gctagcagat gctggtgtca cttctgaata tgacactgat aaaatcggta 10920
ttactttagg tgtgggcggt ggccaaaaaa ttaatgccag cctaacagca cgtctgcaat 10980
accctgtgct taaaaaagta tttaaaagca gcggcctaag cgatgccgac agcgacatgc 11040
ttatcaaaaa attccaagac caatacattc actgggaaga aaactcgttc ccaggatcgc 11100
ttggtaatgt tattgctggt cgtattgcta accgctttga cttaggcggc atgaactgtg 11160
tggttgatgc ggcatgtgca ggttcacttg cggcaatgcg tatggcgtta accgaactgg 11220
ttgaaggccg cagcgaaatg atgatcactg gtggcgtatg taccgataac tcgccatcga 11280
tgtacatgag tttttcaaaa accccagcgt ttaccaccaa tgaaacgatt cagccatttg 11340
atatcgactc aaaaggcatg atgattggtg aaggcattgg catggtggca ttaaaacgtc 11400
ttgaagatgc tgagcgtgac ggtgaccgta tttactcagt cattaaaggg gtcggcgctt 11460
catctgatgg taagttcaaa tcaatttatg cacctcgacc tgaaggccaa gctaaagcgc 11520
tgaagcgtgc ttatgatgac gccggctttg cacctgaaac cgttggctta attgaagctc 11580
acggaacagg cactgcagcg ggtgatgtgg cagaatttaa tggtcttaaa tctgtatttg 11640
gtgagaatga ctcaacaaag caacacattg ctttaggttc agttaagtca caagtgggcc 11700
atactaaatc aactgcggga accgcgggtg tgattaaagc ggcgttagca ctgcatcata 11760
aagtgctgcc gccaaccatc aacgtctcta agcctaaccc taagcttaat gttgaggatt 11820
caccgttttt cattaacact gaaactcgcc cttggatgcc tcgccctgat ggcacaccac 11880
gccgagctgg tataagttcg ttcggttttg gtggcacaaa cttccactta gtactagaag 11940
aatacagccc agagcacagc cgtgatgaga aatatcgtca gcgccaagta gcacaaagct 12000
tattgattag cgctgacaat aaagctgagc tcattgcaga aatcaacaag cttaacgctg 12060
acatcagcgc gcttaaaggc acagataaca gcagcatcga acaagctgaa cttgcccgca 12120
ttgctaaact atatgctgtt cgcactttag atacttcagc agcccgtttg ggtcttgtgg 12180
tctcaagcct taatgaatta accactcaac ttggtttagc gttaaagcag ctaagtaacg 12240
acgctgaagc atggcaatta ccatcaggta cgagctatcg ctcatctgcg ctcatcacga 12300
ttaatgccaa ccaaaagacg actaaaggta aaaaagcagc taacacaccg aaagtagcag 12360
cattatttgc aggtcaaggt tctcagtacg tcaacatggg gattgatgtt gcttgtcact 12420
tccctgaaat gcgccagcaa ttaatcaaag ccgacaaggt atttgcaagc tttgataaaa 12480
cgccattatc gcaagtgatg ttcccaattc cagcctttga aaaagcagat aaagatgcgc 12540
aagcagcttt actcaccagc actgataacg cgcaaagcgc cattggtgta atgagcatga 12600
gccaatacca actgtttact caatcaggtt ttagcgcaga tatgtttgca ggtcacagct 12660
ttggtgagct ttcagctctt tgcgctgctg gcgttatttc taatgacgac tactaccaat 12720
tatcctatgc tcgcggcgct tcaatggccg catcagcagt tgataaagat ggcaatgaat 12780
tagataaagg cacgatgtac gccattatct tgccagctaa tgaaaatgat gcagcaaata 12840
gcgataacat cgctaaatta gaaagctgca ttagcgagtt tgaaggcgtt aaggtggcta 12900
actacaactc agccactcag ctagttattg caggcccaac acaaagctgc gccgatgcag 12960
ctaaagccat tgccgcttta ggctttaaag ctatcgcgct acctgtttct ggcgccttcc 13020
acacaccact tgtggggcat gcgcaaaagc catttgctaa agccattgat aaagctaagt 13080
tcacggcgag caaagtcgac ctgttctcaa atgccactgg tgacaaacac ccaagtgacg 13140
ctaaatcaat taaagccgct ttcaagcaac atatgctgca atcagttcgt tttactgatc 13200
agctgaacaa tatgtacgat gcgggagcgc gcgtatttgt cgagttcggc cctaagaaca 13260
ttctgcaaaa actggttgaa gcgaccctag gtaataaagc tgaagcggta tccgttatca 13320
gtatcaatcc aaaccctaag ggcaacagtg atgtgcaact tcgtgttgca gctatgcaac 13380
ttagcgtttt aggtgcgcca ctctcaagca ttgaccctta tcaagctgaa atcgcagctc 13440
ctgcggtacc aaaaggcatg aacgttaaac tcaatgcaac caaccacatc agtgcaccta 13500
ctcgtgccaa gatggaaaaa tcattagcaa caggccaagt aacctctcaa gttgtcgaaa 13560
caattgttga gaaagttatc gaaaaacctg ttgaaaaagt agtagagaag atcgtggaaa 13620
aagaagtcat taaaactgaa tatgttgaag ttgccacatc tggcgcaaca acagtgtcta 13680
acgttgcgcc tcaagcaata gcacctcatg catcagctca ggctgctcct gcttctggca 13740
gtttagaagc gttctttaat gcacaacagc aagccgctga tctgcatcag caattcttag 13800
cgattccgca gcaatatggt gacaccttta ctcacttgat ggcagagcaa agtaaaatgg 13860
ttgctgcagg ccaagccatt cctgaaagct tgcaacgctc gattgagtta ttccatcagc 13920
atcaagcgca aacgctacaa agtcacaccc tgtttttaga acaacaagct caggcaagcc 13980
aaaatgcatt aaacatgcta acgggtcaaa cacctgttac tgctcctgtt gttaacgcac 14040
caattgttaa ttcaccagta gttgaagcgg tgaaagtagc acctcctgta caaactcctg 14100
tcgtaaacac gccagtagta ccagcagtaa aggccacacc tgtagctcaa cctgctgcga 14160
tggccgctcc aaccccacct gttgaaccaa ttaaagcacc tgctcctgta gccgctcctg 14220
tagtaagtgc acctgtagtt cctacccctg ctggcttaag cgcacaaaca gccctgagct 14280
cacaaaaagt tctggatact atgttagaag tggttgcaga aaaaaccggt tacccaactg 14340
aaatgcttga acttagcatg gacatggaag cagacttagg catcgattca attaaacgtg 14400
ttgaaatatt aggtactgtt caagacgaac taccaacact gccagaactc agtcctgaag 14460
atttagctga gtgtcgtaca ttgggcgaaa tcgttgacta tatgggtagt aaactaccgg 14520
ccgcaggcgc tatgaacagc gacactgcaa atgcaactca cacagccgtt tccgcccctg 14580
ccgcttcagg tcttagcgca gaaacagtac tcaacactat gcttgaagtg gttgcagaaa 14640
aaacaggtta tccaactgaa atgcttgaac taagcatgga catggaagcc gatttaggca 14700
tcgattcaat taaacgtgtt gaaatattag gtactgttca agacgaactg ccaacaccgc 14760
cagagctaag ccctgaagat ttagctgagt gtcgtacact gggtgaaatc gtatcttata 14820
tgggtagtaa actacccgcc gcaggcgcta tgaactctaa acttcctgca agtgccgctg 14880
aagtagctca accccaaacc gcgccagttc aagctgcatc tggccttagc gctgaaacag 14940
ttctgaatac catgctagaa gtcgttgcag aaaaaaccgg ttacccaact gaaatgcttg 15000
aactcagcat ggacatggaa gccgatttag gcatcgattc aattaaacgt gttgaaatat 15060
taggtactgt tcaagacgaa ctgccaacac tgccagagct aagccctgaa gatttagctg 15120
agtgtcgtac tcttggtgaa atcgttgact acatgaactc taagctaccc gctgctggtt 15180
ctgccccagt tgcatcacca gttcagtctg cgactccggt atctggtctt agcgctgaaa 15240
cagttttgaa taccatgcta gaagtcgttg ctgaaaagac tggttatccg actgatatgc 15300
ttgaattaag catggatatg gaagccgatt taggcatcga ttcaatcaag cgtgttgaga 15360
tattaggtac tgttcaagac gagctgccaa cactacctga actcagccct gaagatttag 15420
ctgagtgtcg tactcttggc gagatcgttg actatatggg tagtaaacta cccgccgcag 15480
gcgctatgaa cactaagctt cctgctgaag gcgctaatac acaggccgcc gcaggcgctg 15540
ctcaagtagc agctactcaa acatcaggtt taagtgcgga acaagttcaa agcactatga 15600
tgacagtggt tgctgagaag accggttacc cgactgaaat gcttgaatta agcatggata 15660
tggaagcgga tttaggcatc gattcaatca agcgagttga gatcttaggt acagttcaag 15720
atgaacttcc gacgctacca gaacttaacc ctgaagattt agctgagtgt cgtacacttg 15780
gtgagatcgt ttcgtacatg ggtggtaaac tacccgccgc aggcgctatg aacactaagc 15840
tacctgctga aggcgctaat acacaggccg cagcaggcgc ttctcaagta gctgcctcaa 15900
ccgcagaaac agccctgagc gctgagcaag ttcaaagcac catgatgact gtggttgctg 15960
aaaaaaccgg ttacccaact gaaatgcttg aattgagcat ggatatggaa gcggatttag 16020
gcatcgattc aatcaagcgt gttgaaattt tagggacggt tcaagacgag cttccgggct 16080
tacctgaatt aaatcctgaa gatttagcag agtgtcgcac cctaggcgaa atcgtatctt 16140
atatgggcgc taaactgcca gccgcaggcg ctatgaacaa aaagcaagcg agcgttgaaa 16200
ctcaatctgc acccgcagca gagttagcaa ctgacttacc tcctcatcag gaagttgcgc 16260
taaaaaagct accagcggcg gataagttag ttgacggttt ttcaaaagac gcctgtatcg 16320
ttatcaatga tgacggccat aacgcaggtg ttttagctga aaaattagta gcaacaggcc 16380
taaccgtcgc cgttattcgt agccctgagt cagtgacatc tgcgcaatca ccgcttagca 16440
gtgatattgc cagcttcact ttatctgcgg tcaatgacga cgcgattagc gatgtcattg 16500
ctcaaattag caagcagcat aagatcgccg gttttgttca cctacaacct caactaacag 16560
cacaaggagc tttgccttta agtgatgctg gttttgtagc agtagagcaa gctttcttga 16620
tggctaaaca cctacagaaa ccatttgctg agctagcaaa aactgagcgt gtcagcttta 16680
tgactgtcag ccgcatcgat ggtggctttg gttacttaaa cacggctgaa cttgccaaag 16740
cagagctaaa ccaagctgca ttatcaggtt taactaaaac attaggtcat gagtggccaa 16800
ctgtgttctg tagagcattg gatattaccc caagctttga agctgtcgag ttagcacaag 16860
ccgttattgc agagctattt gatgttgata cagcaacagc tgaagtgggt attagcgacc 16920
aaggtcgtca tactttatca gctacggcaa ctgctcaaac ccgttaccaa accacatctt 16980
taaacagtga agatactgta ttggtgactg gcggtgctaa aggcgtcaca tttgaatgtg 17040
cccttactct tgccaaacaa actcagtcgc actttatttt agcgggtcgc agtgagcatt 17100
tagccggtaa tttaccgact tgggcaaaga gtgtcatagc ggctgcgcct aacgttagtg 17160
aagtaaacac aagtcagtta aaagcagcag caatcggatt tattcaatct caaggtaaca 17220
agccaacacc taagcaaatt gatgccttag tttggccgat taccagcagt ttagaaattg 17280
atcgctcatt agcagcattt aaagctgtcg gtgcaagtgc tgagtacatc agcatggatg 17340
tcagctcaga tgcagccatc aagcaatctc ttgcaggtgt taaaccgatt acaggcatca 17400
ttcatggtgc aggtgtactc gctgataaac atattcaaga caaaacctta gctgagttag 17460
gccgtgtata tggcactaaa gtgtcgggct ttgcaggtat catcaatgcg attgatgcaa 17520
gcaagttaaa actggttgct atgttctcat cagcagccgg cttctatggc aatactggcc 17580
aaagtgacta ctcaatgtct aatgagatcc tcaacaagac agcacttcaa cttgcagcta 17640
actacccgca agctaaagta atgagcttta actggggccc ttgggatggc ggaatggtca 17700
gttcagcatt gaagaaaatg tttgttgagc gcggcgtata cgttattcca ctcgataaag 17760
gcgcaaactt gtttgctcac agcctattgt ctgagtcggg cgtacagtta ttaattggtt 17820
caagcatgca gggctcaagc tcagcagata aaacaggcgc agctgtaaaa aagcttaatg 17880
cggactcttc gcttaatgcc gagggttcgc tgattctttc ttttactact cctgctaacc 17940
gtgttgtcaa caacgcggtt actgttgaac gtgtactaaa cccagtagca atgcccttcc 18000
ttgaagatca ttgcatcgcg ggtaatccag tactaccgac agtgtgcgcc atacaatgga 18060
tgcgtgaaac agcgcaacaa ttgtgtggtc tgcctgtgac tgttcaagat tataaattgc 18120
tgaaaggcat tattttcgag actaaagagc cgcaagtatt aacgctaaca ttgacgcaaa 18180
ctgaatcagg cttaaaagca ctgatcgcga gtcgtatgca tcgcgatcca atggatagct 18240
tgctaagacc tcagtatcaa gcaaaccttg tgatcaatga agccgtcatt aacggtcaaa 18300
ctttaacaac acagccaact atcgttgcgg atgcacaaca gttagcaagt gcaggtaaag 18360
tgattagcac tgacagcgaa ctttattcaa acggtagctt atttcatgga ccacgcctgc 18420
aaggcatcaa gcaagtcttg attgctgatg acacacaact ggtttgcaac gtggaattac 18480
cacatattag ttccgcagat tgcgcaggct ttgcgcctaa tctgtccata ggtggcagcc 18540
aagcatttgc tgaagatttg ctactgcaag ccatgttagt gtgggcacga attaaccatg 18600
atgctgcaag cttaccatcg actattggta agttaacgac ttattcacca tttgcatcag 18660
gcgataaagg ttacttggtg ttatctgtgc ttaagagtac cagccgttcg ttaacagctg 18720
atattgcact ttatcaccaa gatggtcgct tgagttgcac tatgagcagt gcaaaaacaa 18780
caattagcaa aagcttaaat gaggcatttc ttgcccctgc taaagcaatt gctgacttgc 18840
aggagtctgt gtgagcactc aactgactgc aaaaacggct gcaatcaata gtattcgtat 18900
agccttaaaa ctggtcgcga atgatcaaac atcattcgca ccagcacaaa atgctgatga 18960
catattttca gccataaaac cgtgttcatt agcgcaggtc attggcgagt ctgccattga 19020
ccttgaaatt gatgtatcaa gcttagatgc aggcatagat aaccttgcta cagcaagcca 19080
acaaacgctt agctttagtg attattttgc ccaagcgatt gcccatattg agcagcaaca 19140
tactgtgtta ctgagccatc cagcaatacc gtatcgagta ttgatgatgc cagcgattgt 19200
tgcagctaag catcgctgtc atccccatgc ctatttaacg ggtttgggag aagctgatga 19260
tatgcaatgc gctatgcaaa acgctttagc acaagctaaa cgtgagcaca ttactcctac 19320
cttggtcgat gtcactgagt taacttgtta taaagacaag tttactcagc ttgtcatgtt 19380
gataagccgt attgctgcgc gtcgtttacc tgacactaca ttgcctactg tcactagtga 19440
caagcagaac aatagcaatc aagccaatgc caaatattgg tttacccaaa tgcaccaaaa 19500
ccgtgttgct agctttaact ttacagaaaa tggcaagcaa cacgctgccg tttttgttca 19560
aggtactgaa ctggcccagg ccagctcgat gcttgatgaa aacagactat tcttcccctt 19620
agcagccaat acatctgctt gcatgatcca atctttgcat gagctattag tggcgctcaa 19680
taggcttaat cagcaacaaa gcaatccgtt agacagccag cggcttctaa acaagcctag 19740
ccatgttatc tctttaatgc tcaattactt aaaggcattt gatcaaacca aatccttgtc 19800
tgcagttatc atagccaact ctgtagtcac tgcaatcgca gaaattgagg ccatgttagc 19860
caaaatcagt acagcaagtg atgacacctc tggatcgata aatgaacttg agtacaaaac 19920
gccttcgggt agttgtttaa ccatcactca tcatgaagcg cttggtcgca gcggcgtgtg 19980
ttttgtgtat ccgggtgtgg gtacggttta tccgcaaatg tttgcacaac tgccacagta 20040
cttccccgct ctgtttgctc aacttgaacg tgatggcgat gtaaaagcca tgcttcaagc 20100
tgattgtatt tatgcagaaa atgccaaaac ctcagacatg aatttaggcg agcttgctat 20160
tgctggggtt ggcgcaagtt atatattaac taaagtgctt accgaacact ttgccattaa 20220
gcctgatttt gcaatgggct attctatggg tgaagcatca atgtgggcca gccttaatgt 20280
ctggaaaacg cctcacaata tgattgaagc cactcaaact aatagtattt tcacctctga 20340
tatttcaggc cgactcgact gcgtccgtca agcatggcaa ctcgaacagg gtgaagatat 20400
tgtttggaat agctttgttg tgcgtgctgc gccgactgaa atagaagccg tgcttgccga 20460
ttaccctcgc gcatatttag cgattataca aggtgatacc tgtgtattag cgggttgtga 20520
gcaaagctgt aaagccttat tgaaacaaat cggtaaacgt ggcattgcag caaatcgtgt 20580
cacagccatg cacacgcaac ccgccatgct tattcgtgat aatgttcaag cgttttatca 20640
gcaagctttg cacgaccaag atgtgcttga tgcacaagca agtagcatca aattcattag 20700
tgctgcgagt caaataccta tttcattgac cagtcaggac atcgccaatt ccattgcaga 20760
tacattttgt cagccactga acttcactaa actggtgaat aatgctcgtc atttaggtgc 20820
acgtttattt gttgaaattg gcgcagatag gcaaaccagt accttgatag ataaaattgc 20880
ccgcactgca gctaataccg attcacattt aaacgcgcca ctgtcagcca ttgcaatcaa 20940
tgccaaaggt gatgatcaaa cagcgctgct taaatgtatc gctcagctta tctcgcataa 21000
agtgccttta tctctacaat atctaactga gaatttatcc catttgttga ccgctagcat 21060
tactcgcgaa aaccgtcagc aaagccaaac cgctcagtta gctccacaat tagaaggaga 21120
acaatcttga gttctcaatc aaacgttccc aaaattgcca tcgtcggttt agcgactcag 21180
taccccgatg ctgatacgcc agcaaagttc tggcaaaatt tattagataa aaaagactct 21240
cgcagcacca ttagtcagca aaagctcaat gcaaacccag ctgactttca aggtgttcaa 21300
ggccagtctg accgttttta ttgtgacaaa ggtggctaca ttcaagactt tagttttgat 21360
gccaatggtt accgtattcc agctgcgcag tttaatggtc ttgacgacag ttttttatgg 21420
gcaacagaca cggcgcgtaa agcactcaat gatgctggtg tggatatcac taacagtcaa 21480
gataatgcga tattaaatcg cactggtatt gtcatgggta ccttgtcgtt cccaacggca 21540
aaatctaacg aattgtttgt gccgatttat cacagcgccg ttgaaaaagc gctacaagat 21600
aagctgcaac aacccagttt cacattgcag ccttttgata gtgagggata tagcaagcaa 21660
acaacgccag cctctttgtc taatggcgcc attgcacata atgcatcaaa attagtggcc 21720
gatgccctag ggttaggcgc agcacaactc agccttgatg ccgcttgcgc gagctcagtt 21780
tactcattaa agctagcttg tgattacttg catacaggca aagctgacat gatgcttgct 21840
ggtgcggttt caggcgcaga tcccttcttt attaacatgg gtttttctat cttccatgct 21900
tacccagacc atggcatttc agcgcctttt gatagtaatt caaaagggtt atttgcaggt 21960
gaaggtgctg gcgttttagt gctcaaacgt cttgaagatg ctgagcgtga tggcgaccat 22020
atttatgcac tagttagcgg cattggctta tccaacgatg gtaaaggtca atttgtactg 22080
agcccaaaca gtgatggtca agtcaaagcc tttgagcgtg cctatgcaga tgcagccatg 22140
catgatgaac atttcggccc tgataatatt gaggtcatcg agtgtcatgc cactggcaca 22200
ccgctgggtg ataaagttga actgacctcg atggaacgtt tttttaacga caaactcaat 22260
ggtagccata cgccattgat tggctcagct aaatcaaact taggtcattt gctgacggct 22320
gcgggtatgc ctgggatcat gaaaatgatt tttgccatgc gccaaggtat gttgccaccc 22380
agtatcaata ttagttcgcc aattacatca ccaaatcaga tgtttggccc tgctacatta 22440
cctaatgatg tattgccgtg gcctgataaa gcgggcaatc gtgctcgtca tgctggtgtc 22500
tcagtattcg gctttggtgg ttgtaatgcc cacttattga ttgagtcata tcacggacaa 22560
acgtcaacag ctccagctgc taataccatt aatgcacagt tgcctatgca tattacaggc 22620
atggcatcac actttgggcc gctgaataat attaaccgct ttgccaatgc aataaaccag 22680
caacaaacgg cctttactcc gctaccggca aaacgctgga aaggcttaga taaacatcct 22740
gagttattgc agcagcttgg tttggcgcaa acaccgccaa caggggctta tattgatcag 22800
tttgattttg acttcttgcg ttttaaagtg ccaccgaatg aagacgaccg cctgatttcg 22860
cagcagttat tgttgatgaa agttgcagac gaagcgattc atgatgccaa acttgcatct 22920
ggcagcaagg ttgctgtact ggttgcaatg gaaaccgagc ttgaactgca tcaattccgt 22980
gggcgagtta atttgcatac tcaaatcgca gccagcttaa atgcgcacgg tgtcagccta 23040
tctgacgatg agtaccaagc cctcgaaacc cttgcgatgg acagtgtttt agatgcggcc 23100
aagctgaacc aatacactag ctttattggt aatattatgg cgtcgcggat ctcatcgtta 23160
tgggatttta atggcccagc ctttacgatt tcagcaggcg agcagtcggt aaatcgttgt 23220
attgatgtgg cgcaaaacct attggctatg gagtcacgtc aagagccgct agatgccgtg 23280
atcatcgcag cagttgattt atctggcagt attgaaaata tcgtcctgaa aacggcaagt 23340
ctcgctaaaa caggtcaact acttccgctc agtattggtg aaggtgcggg tgcaatagta 23400
ctgcaggttg ccgaccaaac agccacagac tctgagccac tggatttaat tcatcaagca 23460
cttggtgctg tggacacacc atctgcggca atatcaggtt caacagaacg aatcagcagt 23520
gattccctta acagccacgg ggcgttaaac agctacgcta caatcaacag tttatcattt 23580
ggtcacatta gccaacttga agccatcagt gatgaattac tcacccctgc gggcttatct 23640
acaagtgata tcggcaagct agagctaaac caagctccag acttaaccca tattgattca 23700
gcgcaagcgc tatcacaact ttatagtcag tcagcaacaa ctcaagccaa atcatgtatc 23760
ggccatactt ttgccgcttc aggaatggca agcttgctgc acggactgct cattcaaaaa 23820
caagatgcgc attcaaacca aacggttcaa cccttaaata cccttgtcgc cacactcagt 23880
gagaaccagt gttcacagct actgatgagt caaactgctg aacagatctc ggctttaaac 23940
agtcgaatta atactgatat tgggcagcaa accgctaaaa aactgagcct tgttaaacaa 24000
gtgagcttag gtggacatga tatttatcag catattgtcg atacgccact agctgacatt 24060
gacaatattc gcgctaaaac ggcaaatctt atccctgccg taaccaatac aacgacgaac 24120
atgcttgagc gaggtcagtt tgtgtctcca caactaactc ctttagcacc aatgttcgac 24180
aagaataacg ctatgacaac agagacttct atgccgtttt cagatcgttc tacccagttt 24240
aatccagctc ctaaagctgc agcgcttaat gccaaagata gtgccaaagc taatgccaac 24300
gttaaagcta acgtgacgac agcaaacgta acaacagcaa accaagtgcc accagcacat 24360
ttaacggctt tcgagcaaaa tcaatggtta gcccataaag cgcaattagc atttttaaac 24420
agccgtgagc aaggcttaaa agtcgctgat gcgcttttaa agcagcaggt agcacaagca 24480
aatggtcagc cttatgttgc ccaaccgatt gcacaaccta ctgcagctgt acaagcagca 24540
aatgtgttag ccgagcctgt agcatctgct ccaatcttgc gtccggatca tgcaaatgtg 24600
ccaccttaca cagcgccgac tcctgctgat aagccatgta tttggaatta cgctgattta 24660
gttgaatacg ctgaaggcga tatcgctaag gtattcggcc ctgattacgc tgtgattgat 24720
aactactcgc gccgtgttcg cctaccgacc actgattatt tgctggtatc tcgcgtgact 24780
aaactcgatg cgaccatgaa tcaatataag ccgtgcagca tgacaacaga gtacgacatc 24840
cctgaagatg cgccgtacct tgtcgatggt caaattccat gggcggtcgc cgttgaatca 24900
ggccaatgtg atttaatgtt gatcagctac ttagggattg attttgaaaa caaaggtgaa 24960
cgtgtttatc gcttacttga ctgtacctta accttcttag atgacttacc acgcggcggt 25020
gacacactgc gctacgacat caagattaat aacttcgcta agaatggcga caccttacta 25080
ttcttcttct cgtatgagtg ttttgttggc gacaagatga ttctgaaaat ggacggcggt 25140
tgtgcaggct tctttaccga ccaagaattg gatgacggta aaggcgttat tcgcaccgac 25200
gatgagatta agctgcgtga aactgcgcta aacaatccta ataagcctcg ctttgagcca 25260
ttattgcatt gcgcccaaac tgagtttgat tatggtcaaa ttcatcattt gttaaatgca 25320
gatataggtg gctgtttcgc gggcgagcat cacaaccatc aacaagcttc aggtaagcaa 25380
gattcactgt gttttgcttc tgaaaagttc ttgatgattg agcaagtagg caaccttgat 25440
gttcatggcg gcgcatgggg cttaggcttt attgaaggtc ataagcaact ggcacctgat 25500
cattggtatt tcccatgtca ctttaaaggt gaccaagtca tggcggggtc attaatggct 25560
gaaggttgtg gtcaattact gcaattcttt atgctgcaca ttggtatgca cacgctcgtt 25620
gaaaatggcc gtttccaacc acttgaaaat gcttcacaaa aagtgcgttg tcgtggtcaa 25680
gttctgccgc agcacggtga actgacttac cggatggaaa tcactgaaat tggcattcac 25740
cctcgcccat atgccaaagc gaatattgat attttgctta acggtaaagc ggttgtcgac 25800
ttccaaaact taggtgtcat gatcaaagaa gaaagcgaat gtacgcgcta ccttaatgat 25860
acgcccgctg tcgatgcctc agctgatcga attaattcag caaccaataa tattctatac 25920
ccagcggctt caaccaatgc gccactcatg gctcaactgc ctgatttgaa tgccccaacg 25980
aataaaggcg ttatcccact gcaacatgtt gaagcgccga taattccaga ttatccaaat 26040
cgtactcctg ataccctgcc attcacggcg tatcacatgt tcgaatttgc cactggcaat 26100
attgaaaact gctttggacc ggactttagt atttaccgtg gtttcattcc accgcgcaca 26160
ccatgtggcg acttacagct aacgactcgt attgttgata ttcaaggtaa acgtggcgaa 26220
ttgaaaaagc catcatcgtg tatcgcagaa tatgaagtgc caactgatgc atggtatttc 26280
gctaaaaaca gccacgcctc ggtcatacct tattcagtgt tgatggaaat ttcactgcaa 26340
cctaacggct ttatttcagg ctacatgggc accacattag ggttccctgg tgaagagtta 26400
ttcttccgta acttagacgg tagtggtgaa ctattacgtg atgttgattt acgtggcaaa 26460
accatcgtta atgattcaaa gctattatca accgttattg ctggtagcaa catcattcaa 26520
agcttcacat ttgatttaag tgttgacggc gagcccttct acaaaggcag tgcggtattt 26580
ggctacttta aaggcgatgc gcttaaaaac cagttaggta ttgataacgg ccgtatcact 26640
caaccatggc atgttgaaaa taacgtccct gctgatatca ctgttgattt acttgataag 26700
caatctcgcg tgttccatgc tcccgctaat caaccacatt atcgcttagc tggcggtcaa 26760
cttaacttta tcgacaaagc tgaaatagtt gataaaggcg gtaaaaatgg cttaggttac 26820
ttgtcggcat ctcgcaccat tgacccaagt gattggttct tccaattcca tttccatcaa 26880
gatccagtga tgccaggttc attaggcgtt gaagccatta tcgagttaat gcaaacttac 26940
gccattagca aagacctagg taaaggtttc acaaacccga aatttggcca gattttatct 27000
gacatcaaat ggaagtaccg tggccaaatt aacccattga ataagcaaat gtcgttagat 27060
gtgcacatca gtgcagtcaa agatgaaaac ggcaaacgca tcatcgtagg cgacgccaac 27120
ctgagcaaag acgggttacg catttacgaa gtaaaagata tcgctatctg tatcgaagag 27180
gcataaagga ataataatga ctattagcac tcaaaacgaa aagctttctc catggccttg 27240
gcaagttgcg ccaagtgatg ccagctttga cactgccact atcggtaata aattaaaaga 27300
actcactcaa gcttgttatt tagtgagtca ccctgaaaaa ggcttaggta tttcgcaaaa 27360
cgcacaagta atgactgaaa gcataaacag ccaacaggat ttacctgtca gtgcatttgc 27420
ccctgcttta ggcactcaaa gcctaggcga cagtaacttc cgccgcgttc acggtgttaa 27480
atacgcctat tatgctggtg cgatggccaa tggtatttca tctgaagagt tagtgattgc 27540
attaggtcaa gcaggcattt tatgctcgtt cggcgcagct ggcttaattc catcacgcgt 27600
tgaacaagcc attaaccgca ttcaaaccgc acttccaaat ggcccgtaca tgtttaactt 27660
aatccatagt ccaagtgagc cagcactaga acgtggcagt gttgagctgt ttttaaaaca 27720
taaagtgcgc acggtagaag cttctgcatt tttaggctta accccgcaaa ttgtctatta 27780
ccgcgctgca ggtttaagcc gtgatgccca aggtgaagtg gtaattgcca acaaggttat 27840
tgccaaagtg agccgcacag aagtggcgag taagtttatg caaccagctc ctgctaaaat 27900
gctgcaaaaa ctggttgatg aaggcttaat caccccagag caaatggcgc ttgcccaatt 27960
agtgccaatg gctgatgacg tgactgcaga agccgattct ggcggtcata ctgataaccg 28020
tccattagtg acgctattgc caacaatttt ggcacttaaa gataaaatcc aagccgagta 28080
ccaatacaaa acacctattc gtgtcggttg tggcggcggt gtcggcaccc ctgatgcagc 28140
acttgcaacc tttaatatgg gcgcagctta tattgtgaca ggctcaatta accaagcttg 28200
tgttgaagcg ggtgccagtg aacacacgcg taaactactt gctacgactg aaatggccga 28260
tgtcaccatg gcgcctgctg ctgatatgtt cgagatgggc gttaagctac aagtagtaaa 28320
acgtggcacc ttattcccaa tgcgtgctaa taaactttat gaaatttata cccgttatga 28380
gtcgattgaa gccatcccag ccgaagaacg tgaaaagctt gaaaaacaag tcttccgctc 28440
gacccttgat gatatttggg ctggcactgt ggcgcacttt aatgaacgcg atccaaaaca 28500
aatcgagcgc gcagaaggta accctaagcg taaaatggcg cttattttcc gttggtactt 28560
aggtttatca agccgttggt ctaattctgg tgaagctggc cgtgagatgg attatcaaat 28620
ttgggccggt ccagcactgg gcgcgttcaa cgaatgggca aaaggcagct atttagatga 28680
ttatacccag cgaaatgcgg tagacttagc aaaacacttg atgcacggcg cagcttatca 28740
agcgcgtgta aacttactta ccgctcaagg tgtggcactg cctgttgaat tacagcgttg 28800
gagcccgctt gatcaggtta agtaagcctg ccaagcgtca tcaagctaag tcatttggat 28860
ataggtagcg gtaatgagcg aaacacaaaa acttgatttt tcagtggtta atggcacaac 28920
acttgagtcg ttcaaccaac aaaaaaatct gattaaacgc atgctaaaag gcaacagcgc 28980
aacatgtgct gaatgtaaca agccactaac gctgcaatta ccgcctaata ctaaaaatgc 29040
caaacctgcc gaaaaagcac ctgggatata ctgcgcaaaa ggctgcacag atattgaact 29100
ggatatggaa gctgtggcac ttttaaaata atacgatgaa ataacccata gattatttca 29160
tcattaccat ttaaaaaagg catcgaaaga tgccttttta ttgcaattaa ttgaccactt 29220
tatcaagtgg cgacttacct aatcactcac caaaataagt tattcagaat agtgaattta 29280
gaattgagag tttagggaat gctgttactg atacggttca aattaggtaa ttaaaatata 29340
cttcattgct tcacggttcc tgcacggttt ctgcacttta atcacataac attaaaaact 29400
cataatagcc attatcaact acgggttaac ttaggagttt acttatgttc agtccccttc 29460
tctattcgct ttttcaaacg ggatgtaaac catttcggca actattaatt ataccgctta 29520
ctagcttatg cctattaact gcttgtgata gctcagatga taccagcagc gaagagactg 29580
taataacagt acctgacact gaaattgaaa caccggttga ggagtataac gatactgatt 29640
ttgaagcaag cgattggacc gatgacaccc atagcaaaag tgcagatgcc aactttgatg 29700
aagtatttgc tgacaatgaa gtaaaacgcc ttgatgtggt ggtcactgaa gatcgctgga 29760
ccatcatgct taacgatatg actgatactt atggcacttt tggtacaacg actaattcaa 29820
acaaccttgt agatacagat gacaacccca ttatggtgcc agctgatatt tattacgaag 29880
gcaaacagtg gtatcgagtt ggtatccgtt ttaagggaaa ctcgtcactg caaaccagct 29940
ggcaacaagg cgtactcaag ttatctttta agttagattt tgatgagttt gaagactact 30000
acccacaaat cgacaatcaa cgattttatg gctttaaaaa gttaagtctt aaaaataatt 30060
acgatgatga gtcgcagtta cgtgaaaaag ttgccgccga tgtatttaaa gatgcaggtt 30120
tagccgtctc tcacaccgct ttttatactt tatatatcga ccatggtgat ggccctgaat 30180
actttggctt atataccctt gtggaagaag tcgatgacac ggtaattgat actcaattta 30240
gcagtgatga tggtaactta tataagcctg aggatgatgg tgcgaccttt attgaaggat 30300
ctttcagtga agacagtttt gaaaagaaaa ccaatgaaga tgatgaagat tggtcagata 30360
ttttagcttt attcgacgca ttacatgatg atacagcgac ttccgatcct gttacttggc 30420
gtgaaaacct tgaagctata tttgatgttg atgtgttctt gaaatatctc gcagtgaatg 30480
gcgtaattca aaactgggat acttacggat taatgcccca taattattat ctttacaacg 30540
atccagacac aaacaaatta acttggatcc catgggataa taatgaggca ttacaaacgg 30600
gtaaaatggg cggtgcatta gaacttaatt tctctgattt agactcaaat tcttggccat 30660
tgatagccaa aatctatgct gatgacacat accgggaacg ctataaccag tatttatctg 30720
acgttattag cgatagctat gaaaccaata aaatgcaggc aatttatgac agttactcag 30780
cattaataga gccttatgcc acaacagagt taacaggtta ctcattttta gagtctgcaa 30840
atgactttta tcaagcagtt gatgatttat ctgaacatgc tgaaagtcga acagacgccg 30900
taatcgatta cttaaacacg caataggttg tagatttttt ctgtcatttt gcagatacaa 30960
tgaaaacgaa agcagcactg gctactttcg tttttgttgc tatcaattca aaaccgttta 31020
ctagcgcaca ctttcttatt aaaaaataac accttaacaa gtcattgacc taaatcaaac 31080
ataatgtgaa aaagctaagg cactatgcct ctttattttt tagtttggtt atttccaatg 31140
agtgatatca aggcaaacaa tatagagcaa ccgctgacgg acgagtgcat tttactttct 31200
accactgatt tgaatggtaa tatcaaatac gccaatcaag cctttgcaga tatctctgag 31260
ttcacgacag atgaactcca cggaaaacca cacaatattg ttcgtcaccc tgatatgcct 31320
aaagcagctt ttgaatcctt gtggcaacgg gtcaaagacg gaaaaccttg gtttggtatc 31380
gttaaaaata aaagcaaaac aggcaagtat tattgggtta atgcctatat atcgccagtc 31440
tttgaaaacg gcaaaatgca tgaactacag tctgttcgac gtaaaccttg tcgtgaacac 31500
atcaattccg ctgaaaaaat ttacaaacag ttaaatcaag gtaaagcccc cagagaaacc 31560
acagcaccac tgcttagctt tacgggttca ctttgccttt gggcaaccgt tatttctttg 31620
ataggggtag tgtcttcgct cttcatgcca actttggtcg ccgctttttt cattccctta 31680
atggctggat ttgtcatgta ttacttaacg aggccgttaa aagaacttga aaataaggcc 31740
acaaaaatta tcgacgaccc aattgcttgc gggatttttt catcgagtca acatgagttg 31800
ggcaaaattg aattagcctt aaactactta gtcactgaaa tgggtggtgt tgtcggcagg 31860
atggcagatt cagccacctc cattagcgaa gaaagccagc aacttaatca aactatatcg 31920
accactcgtg aacgggttaa agaacaaaca caccaaaccc gtcaggccgc aacagcaatg 31980
gagcaaatga cggcaagctt cactgaagtt aatcaaaata cccgcaatac agcacaagaa 32040
attaccacca gccaagaggc tgctagtaaa ggtcacgata gtatggacaa agtagtcaat 32100
gcaattggcg agcttagaaa agaagtggtt catttctcaa cggtggtcaa tacaattgaa 32160
aaagacagcc aatcaatcgc atcggtccta ggagagatta aaggcatcgc agaacaaact 32220
aatttattag cgttaaatgc tgccattgaa gcggctcgag caggtgaaac tggccgtggg 32280
tttgccgttg tggcggacga agtaaggcaa ttatcaattc gcaccagtga ttccacatca 32340
gaaattgaac acatagtcac gaactttcaa aaaaccacaa aggaagcgac tcaagcaatg 32400
gagtctggtc agttgcaagc cgatttatca gtatccttag cagaagaagc ggatgacacc 32460
tttgctcagc tccttaactc aattaatcgc atacacgaaa tggctgagct taactcttca 32520
gccatgaacc aacaaacagc ggtcgcagaa gaaattagcc aatctatttt acagatagat 32580
gagatttcaa acctgacctt aattcaaacc gatgacaccc aaaacaagtg tgaacaaatg 32640
agccgattag ccaataaaac tcgtcattta tcgagacaat tttggacgca aacaatcgaa 32700
cgcaccaaat aaatacctcc aatattaccc aaagcgtcat aacctacatg ttgattatga 32760
cgcaatcttg ctcaacactg attaacttcc ccatgtttgc agataacgcg agatttagcg 32820
gctgattgac tattgccccc tctttctgat tgtcattttt tcctgttgtg acagtttatt 32880
ttttgataag actttttaat ttaaaaaatg ccctaatatc atatatacag ttaacgttaa 32940
gccatgctta taaagccgtt taaagcgatt caaagtgagg gtacacaatg acaaacgaat 33000
ttattccacc taaaaaatgg gtaatggaag aggaaaatgg cggcaagttt gccagtataa 33060
accgtcctga ctctggtgcg cgctatgata aagatttacc ggttgggaag catgcactgc 33120
agctttactc tatgggcacc ccaaacggcc aaaaagtcac gattatgttg gaagagctgt 33180
tagccgcagg gatcactgac gcagaatatg atgctcactt gattagcatt ggtgatagcg 33240
atcaattctc atcaggtttt gttagcgtta atccaaattc aaaaataccg gcattattag 33300
ataacagtac ctcaacgcct attaatgtat ttgagtcagg cgctatttta ctttacctcg 33360
ctgaaaaatt tggctgcttc ttaccaacag atttagctgc taaaacccaa gtcatgaatt 33420
ggttgttttg gctgcagggc tcggctcctt atttaggtgg cggttttggt cacttttatg 33480
cttacgcccc tgaaaagttt aaatacccta tcgacaggtt ctctatggag gccaagcgtc 33540
aacttgatgt acttgacaag caattagcta aacaccgctt cttgggtggt gatgagtata 33600
gtattgccga tattgcgaca tggccttggt acggaaattt ggtgcttgga aacctatatg 33660
aagcagcaga gtttttagat gttgaaagct accctaacct aatgcgctgg gcaaaagaca 33720
ttgaacaacg tccagctgtc gcgcgtggca gaatcattaa tcgaacctgg ggggaagagt 33780
gggaacaact agcgaatcgt catagcgccg aagatattga taatgtgctt aaacgtcagc 33840
cataacactc acaatttctc aatccattgg tagatcactc aattttgata atgtgagcct 33900
ttacctttga tgtgattcac tctcattggg aatgaagttt gataaagcgg taggcacacc 33960
atcaagtgct tatcgcatta ttgctaacca acaacccctt taccgattaa ccactttcaa 34020
gcttgttcca acaacataag cacgtcggct gtacgtctgg cggtaaagta atgataaaac 34080
cacaatgcgg gcaaaaatcc ccaatattta aacggacata agattgtgtt tgcttataca 34140
tcagcatcgc tcttcttttc gattatattg aggtgaatac atcgccatta gctgtgcttc 34200
tacagcaccc cttacacaaa caggctcacc atttagcgga ctaggtacag ttacgttagt 34260
cgcaatccat agctccatat cacgtattaa ctcctcttta actaacctgc cagccgtacc 34320
atgtgaccaa atacgttttc caagtagacc actctcgccg acatataaaa cctgatctcc 34380
tttcttgaaa aaatacaccc ccgaaatgtc tcttggtaac agagaaaacc agtgctttct 34440
tgttgcatac tcattaccct caaagtcata taagccataa gtttcgctat tacgattaac 34500
aagccatgct tgagatcaac tgatattagc gatatgagta aatgtaatac tgcccatttt 34560
aaaggtattc atctacgacc tcagcgcagt taaacccctg gtacatctgg ccatcaggcc 34620
tcaacttcga acttgttaca gcattatcac taacaaactt ggtataaatt gtatctactc 34680
ttttaacagg cttaccaaat aacactcgag tatttcctcc gatagcagat accagtcgac 34740
tacctagcat ctgatgttct tcagtttcta tctcatctaa tatggccaca acttgataag 34800
ccactggaat tttacggttt gcattgatga cataaaccca atctcctttt gagattgaac 34860
aaaagtcatc ccagccatgt tggccaggtg ctaaatcgaa aaaagcattg ttaccaagcg 34920
atgcatatat ttttcggtgt ggacgatcag ctatatttga tacaagaaat tttcgcataa 34980
tgaacaaagg cacttaatac acatgtgtat atactaatta agtttcccta caaagtaaac 35040
cgtactaagt acctttattg tttatttcaa tatagatcat attcaaataa cgctaatcat 35100
aacgactttt ttattgattt cattgaattt taggcgcaaa gttaactatg taaaccagct 35160
aattagaacg cttaaagagt aaaaagcgca cactagcaac acagataaaa gcaaaattgc 35220
gccagtacta tcagcacctt catatgaggt aaatatgaac aagctactaa tacttagagc 35280
agtgacgagg atttatgaca ccttcaacct ctgcaaaagc acccacttta ataccagcca 35340
actaaacttg ttagcgacag cgaatcacct catcgctgca tgctttaaca gcaaaagtcc 35400
agctaacgct aaaatcaaat cagcaagtat catcatttgt tacttattta acggcattgt 35460
ttttagcgta catgcaacgg atgagcacct taacagtaca aggcatcttc aaacgatttc 35520
cccgcttaaa accgctttgc atttggagac ttatttaggc ggacatagta caaatttagc 35580
taacaaagcc gcactttcgt ttgagttcgg ccagagaaat agtcagcatg tttgccatat 35640
aaccacaaca gaagagcatt taatgcaatc caataattta ctggaaaaca ttaatttaag 35700
tgaaaaacat ttcttctttg actgtcaaat tgataatgat ttttatgtat tatctaacca 35760
ataccgtact tatgcccaag tgataattaa gcaacctgac atcaactttc caatgtcgat 35820
gcatatagag gcgaaacttg tcacaattga tggcaagctg ctcaatgtca ccagtggtga 35880
tatctcactt aaacggaaat agctcacatg gaatttgaca caataagaga ttatttactg 35940
actaaacctt ttgctacaga agactttcca ttcggagaat ctactcacgt ttttaaagtt 36000
cactcgaaga tgtttgcact aatgtcatgg cgaaatgatg ctttgatggt taatgtaaag 36060
tgcgatcctg aagactcatt cgccctaaga gagatattta gcaatattac gacgggatat 36120
catatggaca agaaacattg gatttctatc tatttacagt caactgggag tgataaatct 36180
aaagaatctc gattaattcc agatggtgag gtattgcgca ttattgataa ttcataccta 36240
ttagtcgtcg acaaacttcc taagaagcaa caaacagcca tcaaactgca tttataacaa 36300
acaaatcaaa gcgctttata gggtttgagc aagactattt ttcagaaagc agagctgtgt 36360
gcactatttt ttcgatagta ttgtcttgct cacctaagaa ctgacaacca aactcgacac 36420
cattttcgaa taatttaaca ttacacactc tggctttaat ggtgaggttt tcttgttctg 36480
tagcctctat cacgatttca atctgctctc cctctgttaa ctcatctttt ccaccttcac 36540
taacttcaat atgacaacct gaaagtgaaa catcggtgat tttaacttgc cattggttat 36600
cacctaaagc gatattggcg gttaaatctg tcaacacacg tttggtcgaa cgtaaattgt 36660
gaataaccat attatctggg aaattcaata ccataatacg agatggctga ctcaaggttt 36720
gtttgattgt tgaaataaat gcgattacag atgcctcatg accttccact aaaccacgaa 36780
cagtcacttg tgagccctga gtaatgtact ggctgtagcc tcccaattta tttgcatctg 36840
gaaattgaat tagtatgaat tgttcaggta gataaccgat aaaaatggta cgaaaacgcc 36900
cttttttacc tgcaggagtc acaatatcaa tattgacagg cgtaccagcc aataagtatt 36960
taaattcttt agacaaaccc tctttagtat tgatttgttt tgtggtcatt ttaccttccc 37020
tgaacctttt atttcccaat caaagattag cacaagattt aacatacaca acagtgagtt 37080
aaccttaatt aaatgttatt catgtgcttg cacctcttgt atctagaggt ctatggtgaa 37140
tatcacaagg ttaaggtttt tgatgtaaaa cataaaagac attgcaccaa acctgaatat 37200
tgacggtcgt cagattcagt cgcctcagcc gttgacataa ggtaacggag ttaacatatg 37260
agaaatctag aattattcag cacagcatct atcgatcact tactttggtc taccagcact 37320
gactcaccca gcttagactc tccagcgtta gacgtattta ctgattttga tgtagcacgt 37380
cctattgtcg ttgatgcatc caccagcgca gtggccacag caataatcat ggaacaaacc 37440
catgcattta tgagattagt tgttgataag aataataaat ttttaggggt gataacgctg 37500
caagaattgt ctgaccataa tttatttgtt accgcgaaaa agctagacct tactgtagat 37560
gagcttttag tcacagaagt gatggtgcca agagaagagc tacaagcgtt tgactatcaa 37620
caaatttcaa cagccaaagt cagtgatata gtcaggcttt tgcaacaaaa taatttgcac 37680
cacatgctag tcatcgatca tgaattgcat catatccgag ggctgattgc agcgagtgac 37740
ttagccagaa aactcaatat gccaatagaa atacatcaac ggccttcttt cagccaaatt 37800
ttctctaatg cccattaatg attttgccta aacgatataa atcacggagc cacttacctg 37860
acaaatctca ggtaagtgac gataaacctt attgaatata cgcagaaact agccttgctg 37920
tgttagttgg ctttcttgtt caacaagctg attatcgaaa gcaacacact gatttttacc 37980
ataagtctta gcttgatata gggccaaatc cgctttttga ataatctctt tcgctgaggt 38040
gaagttgcta ggtatgcaag aagtaaaacc taaactcaag gtgacgattt tactttttga 38100
tcttgggtgc gggatgccga gttcggcaat tttcaaacga atatcttcag cgagttgcga 38160
cacactttct tgctgtccgt aacaaataat agcaaactct tcaccgccat aacggcatac 38220
cacatcggtt gaacgcacac atacctcagc tattgcttgc gatacttgta ttaagcattg 38280
atctccttgg tagtggccta agaaatcgtt ataagcttta aaacaatcaa tatcacacat 38340
gattaatgac actaattgtc gctctcttcg tgctagattg ataataaagt ccaattgaga 38400
atcgaactct ctgcgattgt tcagccctgt taatgcatca agctttgaaa gcttaaacaa 38460
tttagcactc gtacgttcac gctcaataat cccaaaaagt aattgtgcat ttccgcaatc 38520
gtctcgaagt attgctctcg ctttactcgt aaagtaaagg atctcacctt ggttagcgtc 38580
ataataagga aaacgattat ggtattcatc gatacgtcct aagcgcaagt cacagtaatc 38640
ttcaaaaatt cgcttagctt tatgggcatc ttttaccgca atatttttat tgtaatcccc 38700
agcgatagga caagtcttac taacagaatg ttgaagggta tttgagtcta aagagaacat 38760
gtcacgcatg ttactgttgc agtaaaaaac attactatta tcttctaagt ctattagcca 38820
ccaggaaaca cctgaaaagc ttaataactc ttgataaagc gtataatatt tttcaattcg 38880
cttatttgga aacgtcataa ttgattagcc actttgttca agctaaccat tagtcactta 38940
cgcaactaac tttcccttta gcaaaatgaa tcagcaaaac tactatgatt atagaccctg 39000
tttacgtaat ttcctgtttg cctctcattt agctcaaaac aatgtcgtta ataaatgccg 39060
ctaataaatg cattaaaccg ctgtccacct atgttcgata cacggcttta tttgggatac 39120
ttgctcagct aactgctctt gtgatgaata atcgacattg gcccaaagct taatctcaaa 39180
caccgcccct aaagcaacct ggccaacgcc tttaggtgta cctgtcatca caatgtcgcc 39240
atccactaac gtcataaatt cattcaccga agctagaata tcgtcagcac tgtacatcat 39300
taaatcgcta tgaccgagtt gcctgacttc accatcgatt gtcaattgaa agcaaaatgt 39360
agctccggca gttaacgaca atgaagataa actgacaaaa tcactaaata gagccgagcc 39420
gtcaaatgcc ttagctcgct cccatggtag ctgttgtgat ttaagtttgg actgcaattc 39480
tctcttggtt aggtctaatc ccacccctac cccatgaaac atcccattac gcactgaaaa 39540
acatagctct gtttcaaaat gaatcggctc ttgatgaaat gagatcagct gcgtggaaat 39600
cgcagagtta ggttttaaaa aaaccaccat atctgaaggc acctcattac ccagctcatg 39660
gatatgatc 39669
<210> 2
<211> 2787
<212> PRT
<213> Sh. japonica
<400> 2
Met Ser Gln Ala Pro Thr Asn Pro Glu Thr Ser Ser Gln Asp Asn Asn
1 5 10 15
Glu Ser Gln Asp Thr Arg Leu Asn Lys Arg Leu Lys Asp Met Pro Ile
20 25 30
Ala Ile Val Gly Met Ala Ser Ile Phe Ala Asn Ser Arg Tyr Leu Asn
35 40 45
Lys Phe Trp Asp Leu Ile Ser Glu Lys Ile Asp Ala Ile Thr Glu Val
50 55 60
Pro Asp Thr His Trp Arg Ala Glu Asp Tyr Phe Asp Ala Asp Lys Ser
65 70 75 80
Thr Pro Asp Lys Ser Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu Val
85 90 95
Asp Phe Asn Pro Met Glu Phe Gly Leu Pro Pro Asn Ile Leu Glu Leu
100 105 110
Thr Asp Thr Ser Gln Leu Leu Ser Leu Val Ile Ala Lys Glu Val Leu
115 120 125
Ala Asp Ala Gly Val Thr Ser Glu Tyr Asp Thr Asp Lys Ile Gly Ile
130 135 140
Thr Leu Gly Val Gly Gly Gly Gln Lys Ile Asn Ala Ser Leu Thr Ala
145 150 155 160
Arg Leu Gln Tyr Pro Val Leu Lys Lys Val Phe Lys Ser Ser Gly Leu
165 170 175
Ser Asp Ala Asp Ser Asp Met Leu Ile Lys Lys Phe Gln Asp Gln Tyr
180 185 190
Ile His Trp Glu Glu Asn Ser Phe Pro Gly Ser Leu Gly Asn Val Ile
195 200 205
Ala Gly Arg Ile Ala Asn Arg Phe Asp Leu Gly Gly Met Asn Cys Val
210 215 220
Val Asp Ala Ala Cys Ala Gly Ser Leu Ala Ala Met Arg Met Ala Leu
225 230 235 240
Thr Glu Leu Val Glu Gly Arg Ser Glu Met Met Ile Thr Gly Gly Val
245 250 255
Cys Thr Asp Asn Ser Pro Ser Met Tyr Met Ser Phe Ser Lys Thr Pro
260 265 270
Ala Phe Thr Thr Asn Glu Thr Ile Gln Pro Phe Asp Ile Asp Ser Lys
275 280 285
Gly Met Met Ile Gly Glu Gly Ile Gly Met Val Ala Leu Lys Arg Leu
290 295 300
Glu Asp Ala Glu Arg Asp Gly Asp Arg Ile Tyr Ser Val Ile Lys Gly
305 310 315 320
Val Gly Ala Ser Ser Asp Gly Lys Phe Lys Ser Ile Tyr Ala Pro Arg
325 330 335
Pro Glu Gly Gln Ala Lys Ala Leu Lys Arg Ala Tyr Asp Asp Ala Gly
340 345 350
Phe Ala Pro Glu Thr Val Gly Leu Ile Glu Ala His Gly Thr Gly Thr
355 360 365
Ala Ala Gly Asp Val Ala Glu Phe Asn Gly Leu Lys Ser Val Phe Gly
370 375 380
Glu Asn Asp Ser Thr Lys Gln His Ile Ala Leu Gly Ser Val Lys Ser
385 390 395 400
Gln Val Gly His Thr Lys Ser Thr Ala Gly Thr Ala Gly Val Ile Lys
405 410 415
Ala Ala Leu Ala Leu His His Lys Val Leu Pro Pro Thr Ile Asn Val
420 425 430
Ser Lys Pro Asn Pro Lys Leu Asn Val Glu Asp Ser Pro Phe Phe Ile
435 440 445
Asn Thr Glu Thr Arg Pro Trp Met Pro Arg Pro Asp Gly Thr Pro Arg
450 455 460
Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly Gly Thr Asn Phe His Leu
465 470 475 480
Val Leu Glu Glu Tyr Ser Pro Glu His Ser Arg Asp Glu Lys Tyr Arg
485 490 495
Gln Arg Gln Val Ala Gln Ser Leu Leu Ile Ser Ala Asp Asn Lys Ala
500 505 510
Glu Leu Ile Ala Glu Ile Asn Lys Leu Asn Ala Asp Ile Ser Ala Leu
515 520 525
Lys Gly Thr Asp Asn Ser Ser Ile Glu Gln Ala Glu Leu Ala Arg Ile
530 535 540
Ala Lys Leu Tyr Ala Val Arg Thr Leu Asp Thr Ser Ala Ala Arg Leu
545 550 555 560
Gly Leu Val Val Ser Ser Leu Asn Glu Leu Thr Thr Gln Leu Gly Leu
565 570 575
Ala Leu Lys Gln Leu Ser Asn Asp Ala Glu Ala Trp Gln Leu Pro Ser
580 585 590
Gly Thr Ser Tyr Arg Ser Ser Ala Leu Ile Thr Ile Asn Ala Asn Gln
595 600 605
Lys Thr Thr Lys Gly Lys Lys Ala Ala Asn Thr Pro Lys Val Ala Ala
610 615 620
Leu Phe Ala Gly Gln Gly Ser Gln Tyr Val Asn Met Gly Ile Asp Val
625 630 635 640
Ala Cys His Phe Pro Glu Met Arg Gln Gln Leu Ile Lys Ala Asp Lys
645 650 655
Val Phe Ala Ser Phe Asp Lys Thr Pro Leu Ser Gln Val Met Phe Pro
660 665 670
Ile Pro Ala Phe Glu Lys Ala Asp Lys Asp Ala Gln Ala Ala Leu Leu
675 680 685
Thr Ser Thr Asp Asn Ala Gln Ser Ala Ile Gly Val Met Ser Met Ser
690 695 700
Gln Tyr Gln Leu Phe Thr Gln Ser Gly Phe Ser Ala Asp Met Phe Ala
705 710 715 720
Gly His Ser Phe Gly Glu Leu Ser Ala Leu Cys Ala Ala Gly Val Ile
725 730 735
Ser Asn Asp Asp Tyr Tyr Gln Leu Ser Tyr Ala Arg Gly Ala Ser Met
740 745 750
Ala Ala Ser Ala Val Asp Lys Asp Gly Asn Glu Leu Asp Lys Gly Thr
755 760 765
Met Tyr Ala Ile Ile Leu Pro Ala Asn Glu Asn Asp Ala Ala Asn Ser
770 775 780
Asp Asn Ile Ala Lys Leu Glu Ser Cys Ile Ser Glu Phe Glu Gly Val
785 790 795 800
Lys Val Ala Asn Tyr Asn Ser Ala Thr Gln Leu Val Ile Ala Gly Pro
805 810 815
Thr Gln Ser Cys Ala Asp Ala Ala Lys Ala Ile Ala Ala Leu Gly Phe
820 825 830
Lys Ala Ile Ala Leu Pro Val Ser Gly Ala Phe His Thr Pro Leu Val
835 840 845
Gly His Ala Gln Lys Pro Phe Ala Lys Ala Ile Asp Lys Ala Lys Phe
850 855 860
Thr Ala Ser Lys Val Asp Leu Phe Ser Asn Ala Thr Gly Asp Lys His
865 870 875 880
Pro Ser Asp Ala Lys Ser Ile Lys Ala Ala Phe Lys Gln His Met Leu
885 890 895
Gln Ser Val Arg Phe Thr Asp Gln Leu Asn Asn Met Tyr Asp Ala Gly
900 905 910
Ala Arg Val Phe Val Glu Phe Gly Pro Lys Asn Ile Leu Gln Lys Leu
915 920 925
Val Glu Ala Thr Leu Gly Asn Lys Ala Glu Ala Val Ser Val Ile Ser
930 935 940
Ile Asn Pro Asn Pro Lys Gly Asn Ser Asp Val Gln Leu Arg Val Ala
945 950 955 960
Ala Met Gln Leu Ser Val Leu Gly Ala Pro Leu Ser Ser Ile Asp Pro
965 970 975
Tyr Gln Ala Glu Ile Ala Ala Pro Ala Val Pro Lys Gly Met Asn Val
980 985 990
Lys Leu Asn Ala Thr Asn His Ile Ser Ala Pro Thr Arg Ala Lys Met
995 1000 1005
Glu Lys Ser Leu Ala Thr Gly Gln Val Thr Ser Gln Val Val Glu
1010 1015 1020
Thr Ile Val Glu Lys Val Ile Glu Lys Pro Val Glu Lys Val Val
1025 1030 1035
Glu Lys Ile Val Glu Lys Glu Val Ile Lys Thr Glu Tyr Val Glu
1040 1045 1050
Val Ala Thr Ser Gly Ala Thr Thr Val Ser Asn Val Ala Pro Gln
1055 1060 1065
Ala Ile Ala Pro His Ala Ser Ala Gln Ala Ala Pro Ala Ser Gly
1070 1075 1080
Ser Leu Glu Ala Phe Phe Asn Ala Gln Gln Gln Ala Ala Asp Leu
1085 1090 1095
His Gln Gln Phe Leu Ala Ile Pro Gln Gln Tyr Gly Asp Thr Phe
1100 1105 1110
Thr His Leu Met Ala Glu Gln Ser Lys Met Val Ala Ala Gly Gln
1115 1120 1125
Ala Ile Pro Glu Ser Leu Gln Arg Ser Ile Glu Leu Phe His Gln
1130 1135 1140
His Gln Ala Gln Thr Leu Gln Ser His Thr Leu Phe Leu Glu Gln
1145 1150 1155
Gln Ala Gln Ala Ser Gln Asn Ala Leu Asn Met Leu Thr Gly Gln
1160 1165 1170
Thr Pro Val Thr Ala Pro Val Val Asn Ala Pro Ile Val Asn Ser
1175 1180 1185
Pro Val Val Glu Ala Val Lys Val Ala Pro Pro Val Gln Thr Pro
1190 1195 1200
Val Val Asn Thr Pro Val Val Pro Ala Val Lys Ala Thr Pro Val
1205 1210 1215
Ala Gln Pro Ala Ala Met Ala Ala Pro Thr Pro Pro Val Glu Pro
1220 1225 1230
Ile Lys Ala Pro Ala Pro Val Ala Ala Pro Val Val Ser Ala Pro
1235 1240 1245
Val Val Pro Thr Pro Ala Gly Leu Ser Ala Gln Thr Ala Leu Ser
1250 1255 1260
Ser Gln Lys Val Leu Asp Thr Met Leu Glu Val Val Ala Glu Lys
1265 1270 1275
Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu
1280 1285 1290
Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Gly
1295 1300 1305
Thr Val Gln Asp Glu Leu Pro Thr Leu Pro Glu Leu Ser Pro Glu
1310 1315 1320
Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val Asp Tyr Met
1325 1330 1335
Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn Ser Asp Thr Ala
1340 1345 1350
Asn Ala Thr His Thr Ala Val Ser Ala Pro Ala Ala Ser Gly Leu
1355 1360 1365
Ser Ala Glu Thr Val Leu Asn Thr Met Leu Glu Val Val Ala Glu
1370 1375 1380
Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser Met Asp Met
1385 1390 1395
Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu
1400 1405 1410
Gly Thr Val Gln Asp Glu Leu Pro Thr Pro Pro Glu Leu Ser Pro
1415 1420 1425
Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val Ser Tyr
1430 1435 1440
Met Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn Ser Lys Leu
1445 1450 1455
Pro Ala Ser Ala Ala Glu Val Ala Gln Pro Gln Thr Ala Pro Val
1460 1465 1470
Gln Ala Ala Ser Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met
1475 1480 1485
Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu
1490 1495 1500
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile
1505 1510 1515
Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr
1520 1525 1530
Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu
1535 1540 1545
Gly Glu Ile Val Asp Tyr Met Asn Ser Lys Leu Pro Ala Ala Gly
1550 1555 1560
Ser Ala Pro Val Ala Ser Pro Val Gln Ser Ala Thr Pro Val Ser
1565 1570 1575
Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met Leu Glu Val Val
1580 1585 1590
Ala Glu Lys Thr Gly Tyr Pro Thr Asp Met Leu Glu Leu Ser Met
1595 1600 1605
Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
1610 1615 1620
Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu Pro Glu Leu
1625 1630 1635
Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val
1640 1645 1650
Asp Tyr Met Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn Thr
1655 1660 1665
Lys Leu Pro Ala Glu Gly Ala Asn Thr Gln Ala Ala Ala Gly Ala
1670 1675 1680
Ala Gln Val Ala Ala Thr Gln Thr Ser Gly Leu Ser Ala Glu Gln
1685 1690 1695
Val Gln Ser Thr Met Met Thr Val Val Ala Glu Lys Thr Gly Tyr
1700 1705 1710
Pro Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu Ala Asp Leu
1715 1720 1725
Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Gly Thr Val Gln
1730 1735 1740
Asp Glu Leu Pro Thr Leu Pro Glu Leu Asn Pro Glu Asp Leu Ala
1745 1750 1755
Glu Cys Arg Thr Leu Gly Glu Ile Val Ser Tyr Met Gly Gly Lys
1760 1765 1770
Leu Pro Ala Ala Gly Ala Met Asn Thr Lys Leu Pro Ala Glu Gly
1775 1780 1785
Ala Asn Thr Gln Ala Ala Ala Gly Ala Ser Gln Val Ala Ala Ser
1790 1795 1800
Thr Ala Glu Thr Ala Leu Ser Ala Glu Gln Val Gln Ser Thr Met
1805 1810 1815
Met Thr Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu
1820 1825 1830
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile
1835 1840 1845
Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Gly
1850 1855 1860
Leu Pro Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu
1865 1870 1875
Gly Glu Ile Val Ser Tyr Met Gly Ala Lys Leu Pro Ala Ala Gly
1880 1885 1890
Ala Met Asn Lys Lys Gln Ala Ser Val Glu Thr Gln Ser Ala Pro
1895 1900 1905
Ala Ala Glu Leu Ala Thr Asp Leu Pro Pro His Gln Glu Val Ala
1910 1915 1920
Leu Lys Lys Leu Pro Ala Ala Asp Lys Leu Val Asp Gly Phe Ser
1925 1930 1935
Lys Asp Ala Cys Ile Val Ile Asn Asp Asp Gly His Asn Ala Gly
1940 1945 1950
Val Leu Ala Glu Lys Leu Val Ala Thr Gly Leu Thr Val Ala Val
1955 1960 1965
Ile Arg Ser Pro Glu Ser Val Thr Ser Ala Gln Ser Pro Leu Ser
1970 1975 1980
Ser Asp Ile Ala Ser Phe Thr Leu Ser Ala Val Asn Asp Asp Ala
1985 1990 1995
Ile Ser Asp Val Ile Ala Gln Ile Ser Lys Gln His Lys Ile Ala
2000 2005 2010
Gly Phe Val His Leu Gln Pro Gln Leu Thr Ala Gln Gly Ala Leu
2015 2020 2025
Pro Leu Ser Asp Ala Gly Phe Val Ala Val Glu Gln Ala Phe Leu
2030 2035 2040
Met Ala Lys His Leu Gln Lys Pro Phe Ala Glu Leu Ala Lys Thr
2045 2050 2055
Glu Arg Val Ser Phe Met Thr Val Ser Arg Ile Asp Gly Gly Phe
2060 2065 2070
Gly Tyr Leu Asn Thr Ala Glu Leu Ala Lys Ala Glu Leu Asn Gln
2075 2080 2085
Ala Ala Leu Ser Gly Leu Thr Lys Thr Leu Gly His Glu Trp Pro
2090 2095 2100
Thr Val Phe Cys Arg Ala Leu Asp Ile Thr Pro Ser Phe Glu Ala
2105 2110 2115
Val Glu Leu Ala Gln Ala Val Ile Ala Glu Leu Phe Asp Val Asp
2120 2125 2130
Thr Ala Thr Ala Glu Val Gly Ile Ser Asp Gln Gly Arg His Thr
2135 2140 2145
Leu Ser Ala Thr Ala Thr Ala Gln Thr Arg Tyr Gln Thr Thr Ser
2150 2155 2160
Leu Asn Ser Glu Asp Thr Val Leu Val Thr Gly Gly Ala Lys Gly
2165 2170 2175
Val Thr Phe Glu Cys Ala Leu Thr Leu Ala Lys Gln Thr Gln Ser
2180 2185 2190
His Phe Ile Leu Ala Gly Arg Ser Glu His Leu Ala Gly Asn Leu
2195 2200 2205
Pro Thr Trp Ala Lys Ser Val Ile Ala Ala Ala Pro Asn Val Ser
2210 2215 2220
Glu Val Asn Thr Ser Gln Leu Lys Ala Ala Ala Ile Gly Phe Ile
2225 2230 2235
Gln Ser Gln Gly Asn Lys Pro Thr Pro Lys Gln Ile Asp Ala Leu
2240 2245 2250
Val Trp Pro Ile Thr Ser Ser Leu Glu Ile Asp Arg Ser Leu Ala
2255 2260 2265
Ala Phe Lys Ala Val Gly Ala Ser Ala Glu Tyr Ile Ser Met Asp
2270 2275 2280
Val Ser Ser Asp Ala Ala Ile Lys Gln Ser Leu Ala Gly Val Lys
2285 2290 2295
Pro Ile Thr Gly Ile Ile His Gly Ala Gly Val Leu Ala Asp Lys
2300 2305 2310
His Ile Gln Asp Lys Thr Leu Ala Glu Leu Gly Arg Val Tyr Gly
2315 2320 2325
Thr Lys Val Ser Gly Phe Ala Gly Ile Ile Asn Ala Ile Asp Ala
2330 2335 2340
Ser Lys Leu Lys Leu Val Ala Met Phe Ser Ser Ala Ala Gly Phe
2345 2350 2355
Tyr Gly Asn Thr Gly Gln Ser Asp Tyr Ser Met Ser Asn Glu Ile
2360 2365 2370
Leu Asn Lys Thr Ala Leu Gln Leu Ala Ala Asn Tyr Pro Gln Ala
2375 2380 2385
Lys Val Met Ser Phe Asn Trp Gly Pro Trp Asp Gly Gly Met Val
2390 2395 2400
Ser Ser Ala Leu Lys Lys Met Phe Val Glu Arg Gly Val Tyr Val
2405 2410 2415
Ile Pro Leu Asp Lys Gly Ala Asn Leu Phe Ala His Ser Leu Leu
2420 2425 2430
Ser Glu Ser Gly Val Gln Leu Leu Ile Gly Ser Ser Met Gln Gly
2435 2440 2445
Ser Ser Ser Ala Asp Lys Thr Gly Ala Ala Val Lys Lys Leu Asn
2450 2455 2460
Ala Asp Ser Ser Leu Asn Ala Glu Gly Ser Leu Ile Leu Ser Phe
2465 2470 2475
Thr Thr Pro Ala Asn Arg Val Val Asn Asn Ala Val Thr Val Glu
2480 2485 2490
Arg Val Leu Asn Pro Val Ala Met Pro Phe Leu Glu Asp His Cys
2495 2500 2505
Ile Ala Gly Asn Pro Val Leu Pro Thr Val Cys Ala Ile Gln Trp
2510 2515 2520
Met Arg Glu Thr Ala Gln Gln Leu Cys Gly Leu Pro Val Thr Val
2525 2530 2535
Gln Asp Tyr Lys Leu Leu Lys Gly Ile Ile Phe Glu Thr Lys Glu
2540 2545 2550
Pro Gln Val Leu Thr Leu Thr Leu Thr Gln Thr Glu Ser Gly Leu
2555 2560 2565
Lys Ala Leu Ile Ala Ser Arg Met His Arg Asp Pro Met Asp Ser
2570 2575 2580
Leu Leu Arg Pro Gln Tyr Gln Ala Asn Leu Val Ile Asn Glu Ala
2585 2590 2595
Val Ile Asn Gly Gln Thr Leu Thr Thr Gln Pro Thr Ile Val Ala
2600 2605 2610
Asp Ala Gln Gln Leu Ala Ser Ala Gly Lys Val Ile Ser Thr Asp
2615 2620 2625
Ser Glu Leu Tyr Ser Asn Gly Ser Leu Phe His Gly Pro Arg Leu
2630 2635 2640
Gln Gly Ile Lys Gln Val Leu Ile Ala Asp Asp Thr Gln Leu Val
2645 2650 2655
Cys Asn Val Glu Leu Pro His Ile Ser Ser Ala Asp Cys Ala Gly
2660 2665 2670
Phe Ala Pro Asn Leu Ser Ile Gly Gly Ser Gln Ala Phe Ala Glu
2675 2680 2685
Asp Leu Leu Leu Gln Ala Met Leu Val Trp Ala Arg Ile Asn His
2690 2695 2700
Asp Ala Ala Ser Leu Pro Ser Thr Ile Gly Lys Leu Thr Thr Tyr
2705 2710 2715
Ser Pro Phe Ala Ser Gly Asp Lys Gly Tyr Leu Val Leu Ser Val
2720 2725 2730
Leu Lys Ser Thr Ser Arg Ser Leu Thr Ala Asp Ile Ala Leu Tyr
2735 2740 2745
His Gln Asp Gly Arg Leu Ser Cys Thr Met Ser Ser Ala Lys Thr
2750 2755 2760
Thr Ile Ser Lys Ser Leu Asn Glu Ala Phe Leu Ala Pro Ala Lys
2765 2770 2775
Ala Ile Ala Asp Leu Gln Glu Ser Val
2780 2785
<210> 3
<211> 759
<212> PRT
<213> Sh. japonica
<400> 3
Val Ser Thr Gln Leu Thr Ala Lys Thr Ala Ala Ile Asn Ser Ile Arg
1 5 10 15
Ile Ala Leu Lys Leu Val Ala Asn Asp Gln Thr Ser Phe Ala Pro Ala
20 25 30
Gln Asn Ala Asp Asp Ile Phe Ser Ala Ile Lys Pro Cys Ser Leu Ala
35 40 45
Gln Val Ile Gly Glu Ser Ala Ile Asp Leu Glu Ile Asp Val Ser Ser
50 55 60
Leu Asp Ala Gly Ile Asp Asn Leu Ala Thr Ala Ser Gln Gln Thr Leu
65 70 75 80
Ser Phe Ser Asp Tyr Phe Ala Gln Ala Ile Ala His Ile Glu Gln Gln
85 90 95
His Thr Val Leu Leu Ser His Pro Ala Ile Pro Tyr Arg Val Leu Met
100 105 110
Met Pro Ala Ile Val Ala Ala Lys His Arg Cys His Pro His Ala Tyr
115 120 125
Leu Thr Gly Leu Gly Glu Ala Asp Asp Met Gln Cys Ala Met Gln Asn
130 135 140
Ala Leu Ala Gln Ala Lys Arg Glu His Ile Thr Pro Thr Leu Val Asp
145 150 155 160
Val Thr Glu Leu Thr Cys Tyr Lys Asp Lys Phe Thr Gln Leu Val Met
165 170 175
Leu Ile Ser Arg Ile Ala Ala Arg Arg Leu Pro Asp Thr Thr Leu Pro
180 185 190
Thr Val Thr Ser Asp Lys Gln Asn Asn Ser Asn Gln Ala Asn Ala Lys
195 200 205
Tyr Trp Phe Thr Gln Met His Gln Asn Arg Val Ala Ser Phe Asn Phe
210 215 220
Thr Glu Asn Gly Lys Gln His Ala Ala Val Phe Val Gln Gly Thr Glu
225 230 235 240
Leu Ala Gln Ala Ser Ser Met Leu Asp Glu Asn Arg Leu Phe Phe Pro
245 250 255
Leu Ala Ala Asn Thr Ser Ala Cys Met Ile Gln Ser Leu His Glu Leu
260 265 270
Leu Val Ala Leu Asn Arg Leu Asn Gln Gln Gln Ser Asn Pro Leu Asp
275 280 285
Ser Gln Arg Leu Leu Asn Lys Pro Ser His Val Ile Ser Leu Met Leu
290 295 300
Asn Tyr Leu Lys Ala Phe Asp Gln Thr Lys Ser Leu Ser Ala Val Ile
305 310 315 320
Ile Ala Asn Ser Val Val Thr Ala Ile Ala Glu Ile Glu Ala Met Leu
325 330 335
Ala Lys Ile Ser Thr Ala Ser Asp Asp Thr Ser Gly Ser Ile Asn Glu
340 345 350
Leu Glu Tyr Lys Thr Pro Ser Gly Ser Cys Leu Thr Ile Thr His His
355 360 365
Glu Ala Leu Gly Arg Ser Gly Val Cys Phe Val Tyr Pro Gly Val Gly
370 375 380
Thr Val Tyr Pro Gln Met Phe Ala Gln Leu Pro Gln Tyr Phe Pro Ala
385 390 395 400
Leu Phe Ala Gln Leu Glu Arg Asp Gly Asp Val Lys Ala Met Leu Gln
405 410 415
Ala Asp Cys Ile Tyr Ala Glu Asn Ala Lys Thr Ser Asp Met Asn Leu
420 425 430
Gly Glu Leu Ala Ile Ala Gly Val Gly Ala Ser Tyr Ile Leu Thr Lys
435 440 445
Val Leu Thr Glu His Phe Ala Ile Lys Pro Asp Phe Ala Met Gly Tyr
450 455 460
Ser Met Gly Glu Ala Ser Met Trp Ala Ser Leu Asn Val Trp Lys Thr
465 470 475 480
Pro His Asn Met Ile Glu Ala Thr Gln Thr Asn Ser Ile Phe Thr Ser
485 490 495
Asp Ile Ser Gly Arg Leu Asp Cys Val Arg Gln Ala Trp Gln Leu Glu
500 505 510
Gln Gly Glu Asp Ile Val Trp Asn Ser Phe Val Val Arg Ala Ala Pro
515 520 525
Thr Glu Ile Glu Ala Val Leu Ala Asp Tyr Pro Arg Ala Tyr Leu Ala
530 535 540
Ile Ile Gln Gly Asp Thr Cys Val Leu Ala Gly Cys Glu Gln Ser Cys
545 550 555 560
Lys Ala Leu Leu Lys Gln Ile Gly Lys Arg Gly Ile Ala Ala Asn Arg
565 570 575
Val Thr Ala Met His Thr Gln Pro Ala Met Leu Ile Arg Asp Asn Val
580 585 590
Gln Ala Phe Tyr Gln Gln Ala Leu His Asp Gln Asp Val Leu Asp Ala
595 600 605
Gln Ala Ser Ser Ile Lys Phe Ile Ser Ala Ala Ser Gln Ile Pro Ile
610 615 620
Ser Leu Thr Ser Gln Asp Ile Ala Asn Ser Ile Ala Asp Thr Phe Cys
625 630 635 640
Gln Pro Leu Asn Phe Thr Lys Leu Val Asn Asn Ala Arg His Leu Gly
645 650 655
Ala Arg Leu Phe Val Glu Ile Gly Ala Asp Arg Gln Thr Ser Thr Leu
660 665 670
Ile Asp Lys Ile Ala Arg Thr Ala Ala Asn Thr Asp Ser His Leu Asn
675 680 685
Ala Pro Leu Ser Ala Ile Ala Ile Asn Ala Lys Gly Asp Asp Gln Thr
690 695 700
Ala Leu Leu Lys Cys Ile Ala Gln Leu Ile Ser His Lys Val Pro Leu
705 710 715 720
Ser Leu Gln Tyr Leu Thr Glu Asn Leu Ser His Leu Leu Thr Ala Ser
725 730 735
Ile Thr Arg Glu Asn Arg Gln Gln Ser Gln Thr Ala Gln Leu Ala Pro
740 745 750
Gln Leu Glu Gly Glu Gln Ser
755
<210> 4
<211> 2019
<212> PRT
<213> Sh. japonica
<400> 4
Leu Ser Ser Gln Ser Asn Val Pro Lys Ile Ala Ile Val Gly Leu Ala
1 5 10 15
Thr Gln Tyr Pro Asp Ala Asp Thr Pro Ala Lys Phe Trp Gln Asn Leu
20 25 30
Leu Asp Lys Lys Asp Ser Arg Ser Thr Ile Ser Gln Gln Lys Leu Asn
35 40 45
Ala Asn Pro Ala Asp Phe Gln Gly Val Gln Gly Gln Ser Asp Arg Phe
50 55 60
Tyr Cys Asp Lys Gly Gly Tyr Ile Gln Asp Phe Ser Phe Asp Ala Asn
65 70 75 80
Gly Tyr Arg Ile Pro Ala Ala Gln Phe Asn Gly Leu Asp Asp Ser Phe
85 90 95
Leu Trp Ala Thr Asp Thr Ala Arg Lys Ala Leu Asn Asp Ala Gly Val
100 105 110
Asp Ile Thr Asn Ser Gln Asp Asn Ala Ile Leu Asn Arg Thr Gly Ile
115 120 125
Val Met Gly Thr Leu Ser Phe Pro Thr Ala Lys Ser Asn Glu Leu Phe
130 135 140
Val Pro Ile Tyr His Ser Ala Val Glu Lys Ala Leu Gln Asp Lys Leu
145 150 155 160
Gln Gln Pro Ser Phe Thr Leu Gln Pro Phe Asp Ser Glu Gly Tyr Ser
165 170 175
Lys Gln Thr Thr Pro Ala Ser Leu Ser Asn Gly Ala Ile Ala His Asn
180 185 190
Ala Ser Lys Leu Val Ala Asp Ala Leu Gly Leu Gly Ala Ala Gln Leu
195 200 205
Ser Leu Asp Ala Ala Cys Ala Ser Ser Val Tyr Ser Leu Lys Leu Ala
210 215 220
Cys Asp Tyr Leu His Thr Gly Lys Ala Asp Met Met Leu Ala Gly Ala
225 230 235 240
Val Ser Gly Ala Asp Pro Phe Phe Ile Asn Met Gly Phe Ser Ile Phe
245 250 255
His Ala Tyr Pro Asp His Gly Ile Ser Ala Pro Phe Asp Ser Asn Ser
260 265 270
Lys Gly Leu Phe Ala Gly Glu Gly Ala Gly Val Leu Val Leu Lys Arg
275 280 285
Leu Glu Asp Ala Glu Arg Asp Gly Asp His Ile Tyr Ala Leu Val Ser
290 295 300
Gly Ile Gly Leu Ser Asn Asp Gly Lys Gly Gln Phe Val Leu Ser Pro
305 310 315 320
Asn Ser Asp Gly Gln Val Lys Ala Phe Glu Arg Ala Tyr Ala Asp Ala
325 330 335
Ala Met His Asp Glu His Phe Gly Pro Asp Asn Ile Glu Val Ile Glu
340 345 350
Cys His Ala Thr Gly Thr Pro Leu Gly Asp Lys Val Glu Leu Thr Ser
355 360 365
Met Glu Arg Phe Phe Asn Asp Lys Leu Asn Gly Ser His Thr Pro Leu
370 375 380
Ile Gly Ser Ala Lys Ser Asn Leu Gly His Leu Leu Thr Ala Ala Gly
385 390 395 400
Met Pro Gly Ile Met Lys Met Ile Phe Ala Met Arg Gln Gly Met Leu
405 410 415
Pro Pro Ser Ile Asn Ile Ser Ser Pro Ile Thr Ser Pro Asn Gln Met
420 425 430
Phe Gly Pro Ala Thr Leu Pro Asn Asp Val Leu Pro Trp Pro Asp Lys
435 440 445
Ala Gly Asn Arg Ala Arg His Ala Gly Val Ser Val Phe Gly Phe Gly
450 455 460
Gly Cys Asn Ala His Leu Leu Ile Glu Ser Tyr His Gly Gln Thr Ser
465 470 475 480
Thr Ala Pro Ala Ala Asn Thr Ile Asn Ala Gln Leu Pro Met His Ile
485 490 495
Thr Gly Met Ala Ser His Phe Gly Pro Leu Asn Asn Ile Asn Arg Phe
500 505 510
Ala Asn Ala Ile Asn Gln Gln Gln Thr Ala Phe Thr Pro Leu Pro Ala
515 520 525
Lys Arg Trp Lys Gly Leu Asp Lys His Pro Glu Leu Leu Gln Gln Leu
530 535 540
Gly Leu Ala Gln Thr Pro Pro Thr Gly Ala Tyr Ile Asp Gln Phe Asp
545 550 555 560
Phe Asp Phe Leu Arg Phe Lys Val Pro Pro Asn Glu Asp Asp Arg Leu
565 570 575
Ile Ser Gln Gln Leu Leu Leu Met Lys Val Ala Asp Glu Ala Ile His
580 585 590
Asp Ala Lys Leu Ala Ser Gly Ser Lys Val Ala Val Leu Val Ala Met
595 600 605
Glu Thr Glu Leu Glu Leu His Gln Phe Arg Gly Arg Val Asn Leu His
610 615 620
Thr Gln Ile Ala Ala Ser Leu Asn Ala His Gly Val Ser Leu Ser Asp
625 630 635 640
Asp Glu Tyr Gln Ala Leu Glu Thr Leu Ala Met Asp Ser Val Leu Asp
645 650 655
Ala Ala Lys Leu Asn Gln Tyr Thr Ser Phe Ile Gly Asn Ile Met Ala
660 665 670
Ser Arg Ile Ser Ser Leu Trp Asp Phe Asn Gly Pro Ala Phe Thr Ile
675 680 685
Ser Ala Gly Glu Gln Ser Val Asn Arg Cys Ile Asp Val Ala Gln Asn
690 695 700
Leu Leu Ala Met Glu Ser Arg Gln Glu Pro Leu Asp Ala Val Ile Ile
705 710 715 720
Ala Ala Val Asp Leu Ser Gly Ser Ile Glu Asn Ile Val Leu Lys Thr
725 730 735
Ala Ser Leu Ala Lys Thr Gly Gln Leu Leu Pro Leu Ser Ile Gly Glu
740 745 750
Gly Ala Gly Ala Ile Val Leu Gln Val Ala Asp Gln Thr Ala Thr Asp
755 760 765
Ser Glu Pro Leu Asp Leu Ile His Gln Ala Leu Gly Ala Val Asp Thr
770 775 780
Pro Ser Ala Ala Ile Ser Gly Ser Thr Glu Arg Ile Ser Ser Asp Ser
785 790 795 800
Leu Asn Ser His Gly Ala Leu Asn Ser Tyr Ala Thr Ile Asn Ser Leu
805 810 815
Ser Phe Gly His Ile Ser Gln Leu Glu Ala Ile Ser Asp Glu Leu Leu
820 825 830
Thr Pro Ala Gly Leu Ser Thr Ser Asp Ile Gly Lys Leu Glu Leu Asn
835 840 845
Gln Ala Pro Asp Leu Thr His Ile Asp Ser Ala Gln Ala Leu Ser Gln
850 855 860
Leu Tyr Ser Gln Ser Ala Thr Thr Gln Ala Lys Ser Cys Ile Gly His
865 870 875 880
Thr Phe Ala Ala Ser Gly Met Ala Ser Leu Leu His Gly Leu Leu Ile
885 890 895
Gln Lys Gln Asp Ala His Ser Asn Gln Thr Val Gln Pro Leu Asn Thr
900 905 910
Leu Val Ala Thr Leu Ser Glu Asn Gln Cys Ser Gln Leu Leu Met Ser
915 920 925
Gln Thr Ala Glu Gln Ile Ser Ala Leu Asn Ser Arg Ile Asn Thr Asp
930 935 940
Ile Gly Gln Gln Thr Ala Lys Lys Leu Ser Leu Val Lys Gln Val Ser
945 950 955 960
Leu Gly Gly His Asp Ile Tyr Gln His Ile Val Asp Thr Pro Leu Ala
965 970 975
Asp Ile Asp Asn Ile Arg Ala Lys Thr Ala Asn Leu Ile Pro Ala Val
980 985 990
Thr Asn Thr Thr Thr Asn Met Leu Glu Arg Gly Gln Phe Val Ser Pro
995 1000 1005
Gln Leu Thr Pro Leu Ala Pro Met Phe Asp Lys Asn Asn Ala Met
1010 1015 1020
Thr Thr Glu Thr Ser Met Pro Phe Ser Asp Arg Ser Thr Gln Phe
1025 1030 1035
Asn Pro Ala Pro Lys Ala Ala Ala Leu Asn Ala Lys Asp Ser Ala
1040 1045 1050
Lys Ala Asn Ala Asn Val Lys Ala Asn Val Thr Thr Ala Asn Val
1055 1060 1065
Thr Thr Ala Asn Gln Val Pro Pro Ala His Leu Thr Ala Phe Glu
1070 1075 1080
Gln Asn Gln Trp Leu Ala His Lys Ala Gln Leu Ala Phe Leu Asn
1085 1090 1095
Ser Arg Glu Gln Gly Leu Lys Val Ala Asp Ala Leu Leu Lys Gln
1100 1105 1110
Gln Val Ala Gln Ala Asn Gly Gln Pro Tyr Val Ala Gln Pro Ile
1115 1120 1125
Ala Gln Pro Thr Ala Ala Val Gln Ala Ala Asn Val Leu Ala Glu
1130 1135 1140
Pro Val Ala Ser Ala Pro Ile Leu Arg Pro Asp His Ala Asn Val
1145 1150 1155
Pro Pro Tyr Thr Ala Pro Thr Pro Ala Asp Lys Pro Cys Ile Trp
1160 1165 1170
Asn Tyr Ala Asp Leu Val Glu Tyr Ala Glu Gly Asp Ile Ala Lys
1175 1180 1185
Val Phe Gly Pro Asp Tyr Ala Val Ile Asp Asn Tyr Ser Arg Arg
1190 1195 1200
Val Arg Leu Pro Thr Thr Asp Tyr Leu Leu Val Ser Arg Val Thr
1205 1210 1215
Lys Leu Asp Ala Thr Met Asn Gln Tyr Lys Pro Cys Ser Met Thr
1220 1225 1230
Thr Glu Tyr Asp Ile Pro Glu Asp Ala Pro Tyr Leu Val Asp Gly
1235 1240 1245
Gln Ile Pro Trp Ala Val Ala Val Glu Ser Gly Gln Cys Asp Leu
1250 1255 1260
Met Leu Ile Ser Tyr Leu Gly Ile Asp Phe Glu Asn Lys Gly Glu
1265 1270 1275
Arg Val Tyr Arg Leu Leu Asp Cys Thr Leu Thr Phe Leu Asp Asp
1280 1285 1290
Leu Pro Arg Gly Gly Asp Thr Leu Arg Tyr Asp Ile Lys Ile Asn
1295 1300 1305
Asn Phe Ala Lys Asn Gly Asp Thr Leu Leu Phe Phe Phe Ser Tyr
1310 1315 1320
Glu Cys Phe Val Gly Asp Lys Met Ile Leu Lys Met Asp Gly Gly
1325 1330 1335
Cys Ala Gly Phe Phe Thr Asp Gln Glu Leu Asp Asp Gly Lys Gly
1340 1345 1350
Val Ile Arg Thr Asp Asp Glu Ile Lys Leu Arg Glu Thr Ala Leu
1355 1360 1365
Asn Asn Pro Asn Lys Pro Arg Phe Glu Pro Leu Leu His Cys Ala
1370 1375 1380
Gln Thr Glu Phe Asp Tyr Gly Gln Ile His His Leu Leu Asn Ala
1385 1390 1395
Asp Ile Gly Gly Cys Phe Ala Gly Glu His His Asn His Gln Gln
1400 1405 1410
Ala Ser Gly Lys Gln Asp Ser Leu Cys Phe Ala Ser Glu Lys Phe
1415 1420 1425
Leu Met Ile Glu Gln Val Gly Asn Leu Asp Val His Gly Gly Ala
1430 1435 1440
Trp Gly Leu Gly Phe Ile Glu Gly His Lys Gln Leu Ala Pro Asp
1445 1450 1455
His Trp Tyr Phe Pro Cys His Phe Lys Gly Asp Gln Val Met Ala
1460 1465 1470
Gly Ser Leu Met Ala Glu Gly Cys Gly Gln Leu Leu Gln Phe Phe
1475 1480 1485
Met Leu His Ile Gly Met His Thr Leu Val Glu Asn Gly Arg Phe
1490 1495 1500
Gln Pro Leu Glu Asn Ala Ser Gln Lys Val Arg Cys Arg Gly Gln
1505 1510 1515
Val Leu Pro Gln His Gly Glu Leu Thr Tyr Arg Met Glu Ile Thr
1520 1525 1530
Glu Ile Gly Ile His Pro Arg Pro Tyr Ala Lys Ala Asn Ile Asp
1535 1540 1545
Ile Leu Leu Asn Gly Lys Ala Val Val Asp Phe Gln Asn Leu Gly
1550 1555 1560
Val Met Ile Lys Glu Glu Ser Glu Cys Thr Arg Tyr Leu Asn Asp
1565 1570 1575
Thr Pro Ala Val Asp Ala Ser Ala Asp Arg Ile Asn Ser Ala Thr
1580 1585 1590
Asn Asn Ile Leu Tyr Pro Ala Ala Ser Thr Asn Ala Pro Leu Met
1595 1600 1605
Ala Gln Leu Pro Asp Leu Asn Ala Pro Thr Asn Lys Gly Val Ile
1610 1615 1620
Pro Leu Gln His Val Glu Ala Pro Ile Ile Pro Asp Tyr Pro Asn
1625 1630 1635
Arg Thr Pro Asp Thr Leu Pro Phe Thr Ala Tyr His Met Phe Glu
1640 1645 1650
Phe Ala Thr Gly Asn Ile Glu Asn Cys Phe Gly Pro Asp Phe Ser
1655 1660 1665
Ile Tyr Arg Gly Phe Ile Pro Pro Arg Thr Pro Cys Gly Asp Leu
1670 1675 1680
Gln Leu Thr Thr Arg Ile Val Asp Ile Gln Gly Lys Arg Gly Glu
1685 1690 1695
Leu Lys Lys Pro Ser Ser Cys Ile Ala Glu Tyr Glu Val Pro Thr
1700 1705 1710
Asp Ala Trp Tyr Phe Ala Lys Asn Ser His Ala Ser Val Ile Pro
1715 1720 1725
Tyr Ser Val Leu Met Glu Ile Ser Leu Gln Pro Asn Gly Phe Ile
1730 1735 1740
Ser Gly Tyr Met Gly Thr Thr Leu Gly Phe Pro Gly Glu Glu Leu
1745 1750 1755
Phe Phe Arg Asn Leu Asp Gly Ser Gly Glu Leu Leu Arg Asp Val
1760 1765 1770
Asp Leu Arg Gly Lys Thr Ile Val Asn Asp Ser Lys Leu Leu Ser
1775 1780 1785
Thr Val Ile Ala Gly Ser Asn Ile Ile Gln Ser Phe Thr Phe Asp
1790 1795 1800
Leu Ser Val Asp Gly Glu Pro Phe Tyr Lys Gly Ser Ala Val Phe
1805 1810 1815
Gly Tyr Phe Lys Gly Asp Ala Leu Lys Asn Gln Leu Gly Ile Asp
1820 1825 1830
Asn Gly Arg Ile Thr Gln Pro Trp His Val Glu Asn Asn Val Pro
1835 1840 1845
Ala Asp Ile Thr Val Asp Leu Leu Asp Lys Gln Ser Arg Val Phe
1850 1855 1860
His Ala Pro Ala Asn Gln Pro His Tyr Arg Leu Ala Gly Gly Gln
1865 1870 1875
Leu Asn Phe Ile Asp Lys Ala Glu Ile Val Asp Lys Gly Gly Lys
1880 1885 1890
Asn Gly Leu Gly Tyr Leu Ser Ala Ser Arg Thr Ile Asp Pro Ser
1895 1900 1905
Asp Trp Phe Phe Gln Phe His Phe His Gln Asp Pro Val Met Pro
1910 1915 1920
Gly Ser Leu Gly Val Glu Ala Ile Ile Glu Leu Met Gln Thr Tyr
1925 1930 1935
Ala Ile Ser Lys Asp Leu Gly Lys Gly Phe Thr Asn Pro Lys Phe
1940 1945 1950
Gly Gln Ile Leu Ser Asp Ile Lys Trp Lys Tyr Arg Gly Gln Ile
1955 1960 1965
Asn Pro Leu Asn Lys Gln Met Ser Leu Asp Val His Ile Ser Ala
1970 1975 1980
Val Lys Asp Glu Asn Gly Lys Arg Ile Ile Val Gly Asp Ala Asn
1985 1990 1995
Leu Ser Lys Asp Gly Leu Arg Ile Tyr Glu Val Lys Asp Ile Ala
2000 2005 2010
Ile Cys Ile Glu Glu Ala
2015
<210> 5
<211> 542
<212> PRT
<213> Sh. japonica
<400> 5
Met Thr Ile Ser Thr Gln Asn Glu Lys Leu Ser Pro Trp Pro Trp Gln
1 5 10 15
Val Ala Pro Ser Asp Ala Ser Phe Asp Thr Ala Thr Ile Gly Asn Lys
20 25 30
Leu Lys Glu Leu Thr Gln Ala Cys Tyr Leu Val Ser His Pro Glu Lys
35 40 45
Gly Leu Gly Ile Ser Gln Asn Ala Gln Val Met Thr Glu Ser Ile Asn
50 55 60
Ser Gln Gln Asp Leu Pro Val Ser Ala Phe Ala Pro Ala Leu Gly Thr
65 70 75 80
Gln Ser Leu Gly Asp Ser Asn Phe Arg Arg Val His Gly Val Lys Tyr
85 90 95
Ala Tyr Tyr Ala Gly Ala Met Ala Asn Gly Ile Ser Ser Glu Glu Leu
100 105 110
Val Ile Ala Leu Gly Gln Ala Gly Ile Leu Cys Ser Phe Gly Ala Ala
115 120 125
Gly Leu Ile Pro Ser Arg Val Glu Gln Ala Ile Asn Arg Ile Gln Thr
130 135 140
Ala Leu Pro Asn Gly Pro Tyr Met Phe Asn Leu Ile His Ser Pro Ser
145 150 155 160
Glu Pro Ala Leu Glu Arg Gly Ser Val Glu Leu Phe Leu Lys His Lys
165 170 175
Val Arg Thr Val Glu Ala Ser Ala Phe Leu Gly Leu Thr Pro Gln Ile
180 185 190
Val Tyr Tyr Arg Ala Ala Gly Leu Ser Arg Asp Ala Gln Gly Glu Val
195 200 205
Val Ile Ala Asn Lys Val Ile Ala Lys Val Ser Arg Thr Glu Val Ala
210 215 220
Ser Lys Phe Met Gln Pro Ala Pro Ala Lys Met Leu Gln Lys Leu Val
225 230 235 240
Asp Glu Gly Leu Ile Thr Pro Glu Gln Met Ala Leu Ala Gln Leu Val
245 250 255
Pro Met Ala Asp Asp Val Thr Ala Glu Ala Asp Ser Gly Gly His Thr
260 265 270
Asp Asn Arg Pro Leu Val Thr Leu Leu Pro Thr Ile Leu Ala Leu Lys
275 280 285
Asp Lys Ile Gln Ala Glu Tyr Gln Tyr Lys Thr Pro Ile Arg Val Gly
290 295 300
Cys Gly Gly Gly Val Gly Thr Pro Asp Ala Ala Leu Ala Thr Phe Asn
305 310 315 320
Met Gly Ala Ala Tyr Ile Val Thr Gly Ser Ile Asn Gln Ala Cys Val
325 330 335
Glu Ala Gly Ala Ser Glu His Thr Arg Lys Leu Leu Ala Thr Thr Glu
340 345 350
Met Ala Asp Val Thr Met Ala Pro Ala Ala Asp Met Phe Glu Met Gly
355 360 365
Val Lys Leu Gln Val Val Lys Arg Gly Thr Leu Phe Pro Met Arg Ala
370 375 380
Asn Lys Leu Tyr Glu Ile Tyr Thr Arg Tyr Glu Ser Ile Glu Ala Ile
385 390 395 400
Pro Ala Glu Glu Arg Glu Lys Leu Glu Lys Gln Val Phe Arg Ser Thr
405 410 415
Leu Asp Asp Ile Trp Ala Gly Thr Val Ala His Phe Asn Glu Arg Asp
420 425 430
Pro Lys Gln Ile Glu Arg Ala Glu Gly Asn Pro Lys Arg Lys Met Ala
435 440 445
Leu Ile Phe Arg Trp Tyr Leu Gly Leu Ser Ser Arg Trp Ser Asn Ser
450 455 460
Gly Glu Ala Gly Arg Glu Met Asp Tyr Gln Ile Trp Ala Gly Pro Ala
465 470 475 480
Leu Gly Ala Phe Asn Glu Trp Ala Lys Gly Ser Tyr Leu Asp Asp Tyr
485 490 495
Thr Gln Arg Asn Ala Val Asp Leu Ala Lys His Leu Met His Gly Ala
500 505 510
Ala Tyr Gln Ala Arg Val Asn Leu Leu Thr Ala Gln Gly Val Ala Leu
515 520 525
Pro Val Glu Leu Gln Arg Trp Ser Pro Leu Asp Gln Val Lys
530 535 540
<210> 6
<211> 303
<212> PRT
<213> Sh. japonica
<400> 6
Met Ser Tyr Cys Tyr Tyr Lys Cys Glu Phe Gly Leu Ser Pro Leu Pro
1 5 10 15
Thr Ile Gln Leu Phe Phe Cys Pro Leu Asp Thr Asn Leu Leu Asp Glu
20 25 30
Lys Thr Val Ser Thr Val Arg Ser Trp Leu Ser Asp Ala Glu Ile Asn
35 40 45
Lys Val Asp Arg Phe Ile Gln Gln Ala Ala Gln Gln Gln Gly Leu Met
50 55 60
Val Arg Gly Tyr Leu Arg Ser Val Leu Ser Asn Phe Ala Asn Ile Glu
65 70 75 80
Pro Asp Asp Trp Gln Phe Glu Tyr Gly Glu Lys Gly Lys Pro Arg Leu
85 90 95
Ser Ala Val Gln Tyr Lys Gln Thr Gly Leu Gln Phe Asn Leu Ser His
100 105 110
Ser Gly Asn Trp Leu Leu Ile Gly Val Ile His Ser Lys Glu Asp Ala
115 120 125
Ser Met Pro Ile Gln Leu Gly Val Asp Ile Glu Arg Arg Arg Glu Ser
130 135 140
Thr Asn Ile His Ser Ile Leu His His Tyr Phe Ser Lys Pro Glu Glu
145 150 155 160
Thr Ala Leu Leu Ala Leu Pro Glu Ser Gln Gln Arg Glu Arg Phe Phe
165 170 175
Asp Leu Trp Ala Leu Lys Glu Ser Tyr Ile Lys Ala Lys Gly Leu Gly
180 185 190
Leu Ala Leu Ser Leu Lys Ser Phe Ala Phe Asp Leu Ser Ala Pro Ser
195 200 205
Leu Ala Asn Leu Thr Ile Asp Asp Gln Leu Leu Pro Ile Gln His Asp
210 215 220
Ile Ser Leu Ser Leu Leu Lys Pro Thr Asp Val Asp Glu Leu Glu Gln
225 230 235 240
Thr Asn Asp Val Glu Ser Phe Tyr Glu Val Ser Pro Leu Trp Gln Cys
245 250 255
Cys Leu Gly Lys Leu Asn Asn Ser Tyr Arg Phe Ala Val Ser Val Gly
260 265 270
Glu Phe Ala Phe Gly Glu Lys Pro Leu Thr Leu Gln Leu Lys Ala Lys
275 280 285
Lys Ile Ser Trp His Glu Gln Ile Lys Met Phe Ile Lys Thr Asn
290 295 300
<210> 7
<211> 38794
<212> DNA
<213> Sh. olleyana
<400> 7
gatccagtgt tattcaacca aattgaagca ttgaatactc cttatccttt tccaattcaa 60
ggccatgctc aattcgccat cgtgttttgg cgagaagatg agataccgtt tatttggttt 120
ttaaagcttc cgcttgatga acaagggtta ttgtctccag ctcaacgtag ccaattcatc 180
aaaatgatcc tcgaagcctt aggccgagat cctaccaaag cgctttctga tgaagaacaa 240
gagcgttatg ctaatcatcc gttcagcttc aaaccgagtc aggagaagct agccttattt 300
aacgcattag taaaaaaaca gttaagccaa caagcctcgg cgcagtacga atatgctgct 360
cagtactttg aaaatttgaa tgaaaaaaac gctcaagatg acagctggca gcaactgggt 420
ttacaaggca tcgccgatgt ctgtgtccgc ttagataagt ttgaccatga taagcatatt 480
aatacggcaa tgaagcttgc tcccttagaa gtacaagccg caatttgcca atgtttagaa 540
catgttgctg tttcaaatac attagctgaa accttatacg ataatttgtc atctgctgaa 600
gtggaacata aacatatcta ccttcgcgct cttgcttcac agcctgaatt gactcaaaaa 660
gcgattcagc aactggttaa tttacagcaa ctcgatgaga atttattaat cactattgca 720
gcaagaagtt ggacggcttt aaaagatgat gcaactcgca aactttatct tgaagtctta 780
gctaaccaac cacaaaactt ctttaatcaa gtttttgctg atatcgtagc tattccaagt 840
ctacggaact cactgctact tgatttaaga agtgctgatc gtagtgaaaa actttcttcc 900
gccatcggcg gattatttag ggccgttagc caatgatgtc agactttatt ttaatcgttg 960
ctgttgtggt tgttgctgca ttcttttggc agttacgcca gatggctgaa atcagtcgcc 1020
gatatgctga gagatcttgt gccaatcaaa aagtacaatt actcgcgatt gcgatggaat 1080
cagctagacc tagtattggc ggttcaacag gtttatgttg gcgagcaaaa tttatgtttg 1140
aattcagcac cgatggtatt aaccaatacc gcggtcatat caacatgcac agcaaaaaaa 1200
tagagaaaat taattggcct attttccctg agcccgaatg gatggatgcg ccaatggcaa 1260
aaggcaaatt cggtggttgt ggcggcgcat cgagctgtaa ctcaggtaag tgtcgttaag 1320
cctcaacaac tgcctaatca gtgagtcatt gtagagttaa tgtcactcgt atttactcaa 1380
aatatagtta caacaaaact gattattatc gtaataaaat aagcgctatt aggagaaatt 1440
cactcttaat ggcgtttttt attggctaag tgattttttg tacgattgtt ggaaaacaca 1500
caagtcaaaa aatacttcac gtatggttat atatttagcc caaaagaaag accgcggcaa 1560
taaattgtcg cggcctcttg tacttttgtt aagccatcca gctatatctg tgctccctgc 1620
accatccatg cgtctaactt gctccgtgcg ctatccttat tctatccttg atgttccatg 1680
tacatttaag tactgtcctt cttactcgat tatcctttga ccgagcctgc tcaaatcctt 1740
aagcgtgtcc tttaattcgt ccgtggtttt cttccatgac atccttgatt caatttactg 1800
catccattgc aatcactgtt ttccttaaca gctcaaatcc attttattga tgtccaattt 1860
ataaaatcca tttaaccata aagtctttca tcatcttcga tgtcagtgtc atccataaac 1920
actatcgttt tccttaacga cgctttatcg tccacttaat taatgtgcct tagtcatcat 1980
cctgatgagc aacaacaata attaaggttc atcctgagca agccagcaca ataatctatt 2040
gtaacgctct gttgtaacaa tctcatgtta caaccacctg caaaaatcct attcagctgc 2100
agtctgaatt caaactgcta aacacttcct gtgcttattt gcttccttgt gattaatttt 2160
aatcgatatg tgagcaaata aatatgcaca aaacacacaa ttaacatcaa cccaacaaac 2220
aagcttggca cccataaaat taaactattt aaatacagta acttaaataa aaacacttca 2280
acatcgttat ggttaaagcg tttaatctca caacttttgt gagatatatc tcacaaagag 2340
tataggaaag acagaaggta agtcttttgg cctattcaca catttaacat ttgttaggta 2400
aaagtgcata aatattgatt tgaactgaac ataaaaaagc ccgaccttat aaataaggtc 2460
aggctcattt tactctttgt tagctatcct gctaaattgt gctccctgct ccatccatgc 2520
gactatatgt gcttcctgct ccatttatcc atttcaactc aatttccttg tattgcccca 2580
aatagagcat tacatgagtt ttcattcctt tgaatcagtc tatccatttg actgaaagtc 2640
ttactcctag atataccatc ctggtatttg cttcctgcaa tccttcatct tcctgatgag 2700
ggtcatcctt gtttcagtta atcattaact gagcttatgc ccattccttg agcgtgtcct 2760
tgtttcatcc tgaattggtt gttactcacc cagcatttac tcgataaata actaaattca 2820
cttaagcagc aatattcact taaaccaaat agttaattaa ctgttcttgt cttgcggcta 2880
cttcctgtaa ctcactaagt taatatattg attgcttaat gagttcattg taataaatgg 2940
atgaaataga gataggtaaa aaacgagcag aaacaaaaac ttcacaaacc tgaaattcag 3000
accaaaaact caagcacttg ttttatatcc acaaattaat aaaaaagtaa gatattgagt 3060
atttgggcta aacgaatacc tacatcaatg tgagataagt ctcacaaacg gaagtaacag 3120
ttagcttgaa taatttccca acttaaactg tttttttaac atttgtgcaa acatcaccca 3180
atcagctaat agactataaa acgggtactc gaatgttgct ggtcggtttt tctcaaacac 3240
aaaatggcca acccacgcaa aaccatagcc aatcacgggt aaaagccaca attgccacca 3300
ctgctgatta atgagcgtta taacaatcaa tattatgatt aatccacttc caacataatg 3360
cagccttcta caagtggcat cttgatgttg tgataaatag aaagggtaaa aagatttaaa 3420
gtcttggtat tttttttcgc tcatcttatc gtctccactt atatattatt gtttttgaga 3480
aagatgctaa acagaactgt agacaacata tggttcacaa aatgacagtt ttatttactt 3540
ggataaatga gaatttcacc atcgacactg ccaattgtta attcagacaa atgattaaag 3600
ccttcacgag caaataattc tgcatgctta gggttattca cgaaaacacc gataccatca 3660
agttctggct gctcatcaca ccaacttaac actgcctgga tcagcttagc gccattacct 3720
ttactttgct caattggcga taaagcaata aattgcaaaa taccatactg cttactcggc 3780
aagctttcta agatactgtg ctcttttttc atgagcgctt gggtcgagtt ccaaccggta 3840
cctaacacca ttttcaaacg ccaatgccaa taacggctct cacctaatgg cacttgatga 3900
gttatgacac aggcgactcc aatgagcctt tcaccatcga accagccaat taaaggttgt 3960
tcttgttgcc aaagttccgt taactcctcg cgaatagagg cacgtagttt ctgctcgtaa 4020
ctagcttggt tagtagtagc aagagcttca ataaagaaag gatcatcatg gtaagcgtta 4080
taaataattg atgcagccac gcgtaaatct tctgcagtta aataaacagc tctgtgttct 4140
tctaacgtgt tttgttccat gtttacactc tttactaaac caagttaata gttacaactt 4200
aacaagttta aaacatattg caattttaat gctgtcacct aggcttaaag atatctcgat 4260
agccaagtac acgataaatt ggggatgaaa atggatacaa cttcagcaac acttgctcac 4320
ttgtttgaac agctaggatt ggattcatca gatgctggaa taagcgtttt tctatcgcaa 4380
cataccatca aagcaagtac aaatttaact gaggctgact tttggaataa tgctcaaaga 4440
gcatttttag aagagagttt aaaagatgac gcccagtggt cagaactggt agaccaactg 4500
gacgttttgt taaggcaata gccacaagct tttaataagg caattgccaa aagcaaaggc 4560
cactctttga aacacattaa aaagtgacag tgcttaatag tttatttaaa ttttttgata 4620
cgcagtgtca ccccaaccca ctagcttatt atcactaatg acaaccggcg tacactcatc 4680
ttttgtggtc ttgccgtcac ctttactcca ttgagtacga taaaagagta cgtttacttc 4740
ttttttcggg ctttcggcgt ctgcctgagt aacgtatgcc tcactaaaat ctgcagttcc 4800
cattaatata gtgacttgat ctctcgccat acccatagtg agttttgata aattggctct 4860
gttagtttgt tgctgtgttt cccaataaga atcactatgg ttaccttcgc tgccaccaac 4920
atgaaataca caaccactta atgtaaggct acttgcagcc attaaaaatg ctaaacccaa 4980
ttttgttttc atgatacttc cttattatta aaatgattct cacgtaattt ctactcaaac 5040
tgcttttgag atacgttata atgttgtcta ttatcattaa gctaaaaaca tgccaaagtt 5100
tatacttttg attttattga atattattta atgaacatta ataagtaagt attttcacta 5160
atccatattg aggattttca ccaattatga gtccaatcga acaagtcctc gctgcagcga 5220
aaaccattgc attgaatggc catacaccga cgatggcatt agttaaaggt aagctcggtg 5280
gcaaagtgcc catgcctttg cttatccaag ggttacaaca atttaaagct attccgaaag 5340
accaatggca aactctgcct gacttaggtg attcacttga atcaaataag cctgcagcca 5400
acacagatac ccaagccata gaacaaaagc tactgactca aatgcagcaa atgaaaaccg 5460
aatttgaaag caaaatttcg ttattagaac aacgtattgc ccaacttgaa aacaaagcgt 5520
aaatacataa ataactgtcg ttagcgctgt taatcattgg cacgattgac tactagtacg 5580
attaaccact gcctaataac gctgacgcat cgcgcttata accccaaagt taaacggaac 5640
cccatgtttg tcacagagct aagatttgaa tgttttgcgg ataccacaat caccgcagcc 5700
gaaaaagcca ttaaccatta cctcgaatct ttgcgagcca acggccaagc cttgggaaga 5760
gaatttgccg tcgcatttaa tgaaggtgag tttaaagtta ggttattaat gccagaaaaa 5820
accagtctat cgactcgtca taatagtcct tggacgaaac aagcgttaaa ccagctcacc 5880
gaagctaaat tacttgcccc tcgtgaaaag tttattggcc aagatatcaa ctctgaagtc 5940
agtaattcag aaacacctag ctggcaggtg ctttatacta gctacgttca tatgtgctcg 6000
cctataagaa gtggcgataa cttgttgcct attccgcttt atcagatccc agccagcttt 6060
aatggcgatc ataaacgggt tatccgctgg caaacagaat ggcaagcttg tgatgaatta 6120
caaatggctg cagccacaaa agccgaattt gccgctttag aagagattac ctcccataaa 6180
agtgacttat tcagacgagg ttgggacata cgcggtagag ttgaattcat cactaagata 6240
ccgacttact attatctata ccgagtaggc ggcgacagtt tagctagtga aaaagagcgt 6300
gcctgccctc gttgtggttc taaagaatgg cgtttagatg aaccattact cgatatgttc 6360
catttcagat gtgagccttg ccgcatagta tctaacatct cttgggatca tcaataagtt 6420
gttatgaaat ccaaataata aagccagaca tttgtctggc tttattataa ttaatcattc 6480
atcaactgat taaattaaga cttcttacct ttaatcaaat cagcccacat cattttcatg 6540
cgttgccaaa tgcctgggtg cgcgacatag ttatcttcaa caataggttc aacaggtggc 6600
atcacgcgcg gggttaatcc atcaataaac tcagctaaac tgtcagcgag tttatcttta 6660
ggcttatcac caggaatttc aatccacaca ctgccatctt cgttatcaac agtaatcatt 6720
tgatcgccat cacctaatac gccaacaaac caagtgggtg cttgtttgag ctttttcttc 6780
ataatcagat gaccaatcac attttgttgc aaagattcaa agtcttgctg attccaaact 6840
tgcaatagct caccttctcc ccaagttgaa tcaaaatata aaggcgcaga aaaatattcg 6900
ccataaaacg catttatatc ttggtgcaac ttaagctcta aagcatgttc tacattactg 6960
aaatttgagc tatttttacg tttaatcgct ttccaaaaaa ccgcatcatc tgaatcaaga 7020
tcatacttac cttcaataca ggcggatcct tgcccaagtg ggaaataacg gggaaactcg 7080
cctaatacat cctgataagc ttgaaaataa cggctagaaa aatgatccaa tgaagttgaa 7140
caagacactt aagatgctcc aattttgggt tataatataa gtctattttg acacggaaac 7200
agactagatg acacacaatc acgatcccta tagtgatgca gatgcactta aaggactgac 7260
tttaggtcaa acgacacaat atcaagcaga atatgatgct tcactgctac aaggggttcc 7320
tcgtaaactc aatcgtgatg ccatagcatt aaccgattcg ctcccttttc agggcgcaga 7380
tatctggacc ggctatgaat tatcttggct aaatgccaaa ggcaaaccaa tggttgccat 7440
tattgaagtt tacctcgcta tcgaaagtga taatttaatc gaatctaaat cgtttaaact 7500
gtatctcaac agctttaacc aaacacgttt tgagtcagtt gagcaggtac agcaaacatt 7560
agtcactgac ttaagccatt gtgctaatgg cgaagtgaca gttaaagtga ttgaacctaa 7620
acattttaat actcaacgta ttgtcgaatt accaggtaat tgtatcgacg aacttgatat 7680
tgaagtggat gactacgagt ttaatcctga ctatctacaa gacagtactg aagataaaaa 7740
cgttgtcgaa acagtcacat ctaacttatt gaaatcaaac tgtcttatta cctctcagcc 7800
agattggggt agtgtcatga tccgttatca agggcctaaa attaatcatg agaagttgct 7860
tcgctacttg atttctttcc gccaacataa cgaattccat gagcagtgtg ttgaacgtat 7920
atttactgac ttaaaacgct actgtaactg cactaaacta acggtatatg cccgttatac 7980
tcgacgtggc ggtttagaca ttaatccttt cagaagtgat tttgaacaac cacctgaaac 8040
ccatcgttta gcaagacagt aatgggtttc taataataaa aagcctgcaa ttgcaggctt 8100
ttatattgtt tatagtcggc actaaaattt ttacgcataa tgcccaataa tagccgctaa 8160
atcatctacc gtattggcaa tatgatcagg tttaacatgc cagctttctg gctctgattg 8220
gctataagct gctgcaacag aaatgacctt ggcatcgctg cctaattcta attgcaaatt 8280
acgggcaaat tgtgcatccg cttcatgatc cccgatgtac atcagtaagt tactatttgc 8340
gtgacccagt attgattcaa cacatttcag gccgccgaat gggtgtggtt tttgattacc 8400
gttaggtaca tcgtcatagc caataatcgc tttaaacggt gcaccaattt cattgctatt 8460
gagaacacgg cgaatattat tttgcgaatt ttgcgaacag atcccgtgat caaaatgaga 8520
aaactgttca acaaccccct taatgccgtc aaatagcatg acttctgttt cattcttttc 8580
ttgaaactca gcccacatgc ttccagcttg aagcatttca ttttcagtta acccatagta 8640
atcaacatag agttgctgcc aatttttagc accatgatta gcttcatggt aattagcttc 8700
gcttagtaag tacttaggca agttttcgcc agttaaatgc ggtgcaacga tagacagtat 8760
tgctttggtg atatcaatat ttttcggtac agaattgact agagttccat cataatccca 8820
aagtattgcg tctaatttca ttgcatcatc tcattgttta ataaacggta ttaaggagta 8880
cactgttggt gtaaaaagtg gctcagatga atctcgttaa atacctttaa attatgtaac 8940
gagaaatctg gcgattaaaa taagcttcat cgtgttaaaa aacaactgtt atcacctcag 9000
tctgagctac ctgttaagtt tttactgctc gcgtcatcat cttaaaaaat tggttaaaac 9060
tgacttcatg agggttcagt gcatctcctg caaatggacc atataataag gaaccgtata 9120
atatagcctc attgaggttt atagattaag agcaataaca ctactcatgc caaaaccaac 9180
ctgtttaacg gaattaaatc aagagtcgct caatgactct caagagcatc agcactttaa 9240
aatatttaaa ccttatggat ttttgagcca gtttgttcct gaaacacgaa agaaaaagca 9300
cttacttgca gagctctcaa acttccccga aaaaaccatg gcgattggtc gcttagatca 9360
cgattccgaa ggcttactct tgctcacaac agacggcatg atgagtcata aagtaagaag 9420
caaaggcata gaaaaagagt attacgtgca agtggatggc gatattaacg atgaggctgt 9480
atctctgtta caaaatgggg ttgaaattgg catcaatggc acaaaatatc ttaccctgcc 9540
ttgtaaagca ttcaagctaa acgcagagcc aatgcttccc tcacgcggta aaaaaattcg 9600
cgatccaagg catgggccaa ccagttgggt atcgatcacc ttatgtgaag gtaaaaatcg 9660
tcaaataaga aagatgacag cagcagtagg ttttgcgacc ttaaggctag taagagtcag 9720
aattggcgat attcatattg atgccatgca agcaggcgat gttatttctc tgagcaattt 9780
tgacgcggct attaatagcg ataattaacg gtcactttct agcaaataca ccttttccat 9840
tgctgtttca actaactcac gtaaccactt cgttgccggg tcttgttgat tacgggtcgg 9900
ccaaatgctg taaattgata tcaattggct ttcgaacggt aaatccatca aggttaaatt 9960
aaaagtagat tgatagtttt tagcataggt atatggcgca atgcagattg catcagattt 10020
gctgactccc gataacatgg tgagcaaaga tgatttttcg ccatacatat ggcgttcagg 10080
taaatgctct gtagaaataa tctctgctac tcgctgatta tgtcgatgta atcggtaaaa 10140
caaatgttta gccgtaaaat acgactgctc atcaatacca tttttaaatt gaggatggtt 10200
cgccctcgcg acacaaacga gcttttcggt agcaatttgt ttgctggaaa atgatgcttc 10260
gctcggcgcc acaatatcta acgctaaatc aatatgctgt ttttgaagcg cttgatataa 10320
attaccttca tcaataatcg cttcagtaaa gatgatttca acgcctttat cagccaccga 10380
tttttcaata tcggcctcaa tcaaatcaat aattgattca tttgcactga catgaaaaac 10440
acgttttgat tgctgcgggt caaacacttt aacgctatta atacactgct ctatatcgat 10500
taaagatggt cctaaggttt ggtgcaaatg ttggcctatt gcggtaagag caatacctcg 10560
accttgcctg acaaataact ccgccccaac aagggtttta aagcggttaa ttgcattgct 10620
gacagaagat tgggttagtg aaaggtgctc tgctgcaagt gtaattgatt gataatcaca 10680
tacactacaa aataccctaa caagattaag atcgagctta tgcagctctt gttggctcct 10740
ttcttgttgc agttgttcta attgcaattg ccctaaacct tgcttcactt ttaccacctt 10800
aatacgtcat ttgaacaaat agatttccaa tacaaatgct cattcaagtc attgattctc 10860
gcctaataca ttcacacagt aaatgtatta actattctta gccatagtta tctttgccaa 10920
ttttgttgtt aacttatatt caacaacaat aaatcctaga ggcttacatg agaaaatcat 10980
tacttggttt agcgattacc ctaacgttta ccacccaagc ttttgcagct caacatgaac 11040
acgaccatat cactgttgat taccatggta agcccgcaac tcctatcact gctgaacata 11100
ataagtcagt agcaaaaacc ttaaactttg atgataaagc cgcttttgag cgatttagca 11160
aaaacaaaat cgcctcattt gatgaagcta cagccaaaat tctacgagca gaatttagct 11220
ttattagtga agagttaccg gactctgtaa acccatcatt atatcgtcaa gcacagctga 11280
atatggtgcc aaacggacta tataaagtca caggtggtat ctaccaagtc cgtggtacag 11340
acttatctaa cctaaccctt atccgaggca aaactggctg gattgcttat gatgtattac 11400
tcaccaaaga agcagcgcag caatcgttaa agtttgcttt tgctaactta ccagaaggtc 11460
aggatttacc tgttgtcgcg atgatttact ctcatagcca tgccgaccac tttggcggtg 11520
cccgtggagt gcaggaacta tatcctgatg tgaaagtcta tggttcaaac aatatcacct 11580
cagaaattgt tgatgagaat gttcttgctg gtaacgtgat gagccgccgc gcagcatatc 11640
aatatggcgc cacactgggt aaacacgacc acggtattgt ggatgcagca cttgccaaag 11700
gtttatcaaa aggtgaaatc acttacgtta aacccgacta tgaacttaat cataaaggta 11760
aatgggaaac cttaaccatt gatggtcttg aaatggtatt tatggatgcc tctggcactg 11820
aagccgccag tgaaatgatc acctacattc cgtcaatgaa agcgctatgg tcaggtgaat 11880
taacttatga tggcatgcac aatgtataca ccttaagagg agctaaagta cgcgactctt 11940
taaaatggtc taaagacatt aatgaaatga ttaacgcctt tggtgaagac gtaaacgtat 12000
tatttgcctc tcattcagcg ccagtttggg gcaataaaga ggttaatcat taccttcgca 12060
tgcagcgtga taactatggt ttagttcata accagtcaat gcgtttagcc aatgacggca 12120
tagttattca agatattggc gacgctatca tggagaccat acctcaaaac gttcaagacg 12180
aatggtacac caatggttat cacggcacct atagtcataa tgccaaagct gtatacaaca 12240
tgtacttagg ctactttgac atgaatccag ccaatttaaa tccattaacc actaaagcag 12300
aagcaacaaa atttgttgaa tatatgggcg gtgcagataa cgtggtgaaa aaatcaaaac 12360
atgattttag ccaaggagag tatcgctttg ttgccacagc acttaataaa gtcgttatgg 12420
cagatccaca acacgatgca gcccgagagt tacttgcaga cacctacgaa cagctaggtt 12480
atcaagctga aggggctggg tggcgtaata tttatctcac tggtgctcaa gagttacgag 12540
tgggtattaa gcctggcgcg ccaaagtcgg cctctgctga tgtgatcagc gaaatggaca 12600
tgtcgacctt atttgatttc ttagcagtaa aagtcgacag cattaaagct gcggcacttg 12660
gtaacattac cttgaatgta gtgacacaag atggaagcca aaccaacacc ttatttgttg 12720
agttaagtaa cggtaactta agcaatattg ctgtcgagtc tccaaaacaa gctgatgcaa 12780
ctctgactgt aaataaagct gatgtggttg gcatactatt aggcaagacg aatatgaaag 12840
cgctgatgca atcaggtgcg gcgacaatgg aaggtgacaa acaggctttc gctaaaatcg 12900
cttcgactct agtgcaattt aatcctgact ttgaaatcgt tccattaaag catgctcatt 12960
aattagggct tgttaaatga tgagagtcta gtggctcaga ataaacagtt ttaaaacgaa 13020
acagttttac ctatcagttg gtttgaaggc gtgatttaca acttcaagcc aactgatttt 13080
ttttgctttc agctccggag gtaactcgtc tgaatttgta gacgcacgac ccacactcac 13140
agcaaaacga tacaaatcat caagctttcc taaataacaa tgccactgcg gggcaatgac 13200
aaaatcctct aataaaccat cagagtcact cgcctttagt aagcttaact tgacattttg 13260
ttggatggtg attgtctcac tgttaacttg tagttcaccc acacttgagg cagataaatc 13320
aaacgcaaaa gattttagcg ataaagctag acctaagcct ttcgctttta tataagactc 13380
cttaagcgcc cataaatcaa aaaagcgttc tctgtgttta tcttcagcta aagccagtaa 13440
tgcactctct tctggttttg aaaaatagtg atttagaatc gaatgaatat tcgttgtttc 13500
acgacggcgt tcaatgtcta caccaagttc tatatctgtt tgttgttgag ctgttccata 13560
tgtgtttgcc accccgatta acaaccagtc accactgtga ctcagattaa actgcaaacc 13620
agtttgcgca aactgctccg ccgttaacct cggcttgccc ttctcaccat attcaaattg 13680
ccattgctgc ggctcaacac tagcaaagcg cgataacaca ctgcgtaaat agcctcgcac 13740
cattaaacct tgttctctag atgattgctg aataaaacga tcaacctttt tgacctcatc 13800
ttcaggcagc catgaacgca caatagacgc agtcgattca tctaataaat cagtattaag 13860
gggacagaaa aataattgaa tgacggttgg cggcttcaaa ctaggctcag gctaaattgg 13920
caatgtacca ttgtcgcttg ttttaggaag cgatttcaac aagcaaggtt acttatcgat 13980
atggttgcgg cgttaatacg ctgatgtgtc aacgccaaaa cgtgggttca ctgaactaaa 14040
acagtcttga actaacttta attaatccaa aacaaactta atttacctga tgaaaaaaag 14100
ggttgagcaa tgctcaaccc tctatgggtt ttatcctata acaggcattt aaaaattact 14160
ctgccagtgc ttttactgcc ttttgaggaa gcacatcgta gcggctgaaa tgcatcgaga 14220
attgcccttc gccacctgtc atcgacttaa gccgagtgga gtaattactc acgttagcca 14280
gtggcgcttc aacactcact tccactaaac cattgctact tgcttgggta ccgcaaacga 14340
tacctcttga agaactaata tcccccgtaa tttcacccac atggttttga gccacatgaa 14400
tttgcatatc aacgataggt tctaaaataa ccggctgagc cagttttacc gcttccataa 14460
aggctttttt gcccgccata acaaaagcaa tctcctttga atcgacactg tgatgcttgc 14520
catcaagcaa agttaccttc acatcctgta atgggtatcc acccatttcg cccgctaaca 14580
tggcttcgcg tacacctttc tcaacggctg gaatgtactg ggttggcaca gaaccgccca 14640
ccacttggga gacaaactca aaaccttgtc cacgcgctaa cggttcaact tttaattcaa 14700
cttcgccaaa ttggccagat ccacctgatt gctttttatg acgatatcga tactctgcct 14760
cagccataat ggtttcacgg taagccacag ccggcgtatc agtttccata tccacattaa 14820
ataaattttg cgctttctct aaggcaattt gaaggtgtaa gtcaccttgt ccttgcagca 14880
cggtttgacc ttcagcttcg ttgcgactga tttgtaaact tggatcttcg gccaccagct 14940
tatttaatac ttccgatatt ttctgctcat caccacggcg tttagctgat actgccagac 15000
caaaaatagg ttgcgggaat ttaagctcgg gtaaatggaa ttcatcttca tcatgactat 15060
cgtgaagcac agctcccaca gataactctt caagcttagc aatggcgcaa atatcaccag 15120
gtaacgcttg attgacatta atttgtttgt cgccttgaag tttcattaag tgagacactt 15180
taaacggctt gcgtccgcta ccaatgaaca atttcattcc cacagaaatc gtaccttgat 15240
acaagcggaa aacccccata cgtccaaaga acggatctat cgccacccta aatacatgcg 15300
ctaaaacatg atcagaggct ttttgagtga catcaatcgg cttagcttca tcaccgtagc 15360
ctttaataaa ttgcggcgga ttcgcttcaa gtggattcgg cattaactta accagaatct 15420
ctaacaacga actgatgcca atatcttgct ctgcgctagt aaaacaaact ggcaccaagt 15480
gccccattct taacgctgtt tccaatggcg catgcagttg ctctggcgta agtgattcgc 15540
cttgttctaa ataaagctcc attaaagctt catcttcttc aagtacggta tcaaccagct 15600
catctcttgc tgtagcggca ttgctaaaca aagtattgaa agtttcatca caatgtaagt 15660
agcagtcaac cacatcatcg accaaaccat cagctgtaac attgggtaaa ttaaccggta 15720
agcatctgtg gccaaattga tgttgaatat ccatcatcac atcaaacacc ttggcttcat 15780
ttccatccat gtgatttatc gcaatgatga ctgctttacc ttggcttcga gcagcttcaa 15840
atgctcgttt tgtcacggat tcaatgccaa cacttgcgtt caccactaac aatacagatt 15900
caacaccagg taatggtaat agcgcacgtc caaagaagtc gggtaatcca ggagtatcga 15960
tgaaattgat gtggtgagat tgataatcga gatttaaaaa tgaaggttct aaactgtgac 16020
gatgagattt ttcttgggca gtgaaatcag catgatttgt acccttatcg accctgcctt 16080
ttaaacttat agcatcagcg ctaaagagta acgcctcaag taacgaggat ttacctgcgc 16140
ctgtgtgtcc gagcactgcc agattgcgga tttgctcagt ggtaaactca gccatgatgg 16200
cctcctttgt tcacattatt aaactatcca tatctttgtc ttactatgtt tacatttgac 16260
gataaaacac ccataaattc agtatagatc ggtaacattg ttgaataatt gacacagatc 16320
actctttaca cccgcaacgt tttttataac aaaatcaccc attcagctta caagtgttag 16380
ctctttctgg tcgtatcagt aattaattag tttcgggtga ttgtatcgac ctgaaacctc 16440
aggtactctg catgctcgat tgtgataaaa cgctaataat gaagatgaac aaacgttaat 16500
cttcagtatt ttttagagag tcccaataga ttgtacggag tgttcattct gctatggccg 16560
tccttaaatg actgcaaacc gacaagctaa atcagccact aaaacagtgg taaaaaaatc 16620
ctcttccgat tgtgatgtag cgagcacacc tgtgcgccat cgtaatgcga caacgacccc 16680
cgaaatgcgt caatttatcc aaacttccga ctttagtgtc agccagttgg ctaaaattct 16740
gaacatatca gaagccacgg taagaaaatg gcgcaaacgt gactccatca gcgatacacc 16800
caatacgcca catcacttaa aaaccaccct ttcacctatg gaagagtatg tggttgttgg 16860
cttacgttat cagctgaaaa tgccgttaga cagattgcta aaagtcactc aacagttcat 16920
caataaagat gtttctcgtt caggacttgc ccgctgctta aaacgctacg gtgtatcgaa 16980
actcgatgaa ttcgaaagcc cctatgttcc agaacgctat ttcaaccaat taccgattgt 17040
tcagggtaca gatgtagcga cttacacact gaaccctgaa actcttgcta aaaccctgtc 17100
attgcctgaa gccacaccag acaatgtggt gcaagtggta tccctaacga ttccacctca 17160
actgactcaa gcagacagct attccatttt actcggtgtc gactttgcaa ccgactgggt 17220
gtatctcgac atttatcaag acaaccacac acaagcaacc aatcgctata tcgcttatgt 17280
gttaaagcac ggaccgttcc atttacgtaa attactcgtc aaaaattatc atactttttt 17340
agcccgtttt cctggtgcaa cagtgttgca ctctgtggaa gcggcgaacc aaaaaaataa 17400
atcagctaag gatcagctga acactggaga ctcaaaatga gccaagcccc tacaaatcct 17460
gagacctcat ctcaagataa caacgagtcg caagatacaa gactgaacaa acgtcttaaa 17520
gacatgccta ttgccatcgt cggcatggca agtatctttg ctaattctcg ttacctgaat 17580
aagttttggg acttaatcag cgagaagatt gatgccatca cagaagtgcc tgatacccat 17640
tggcgcgctg aagattactt tgatgccgat aaaagcaccc cagataaaag ctactgtaaa 17700
cgtggtggat ttatcccaga agttgatttc aacccaatgg aattcggcct gccaccaaat 17760
attttagaac tgactgatac ttcgcaattg ctatcattag tgattgccaa agaagtgctt 17820
gcagatgcgg gcgttacctc tgagtacgat accgacaaaa tcggtattac gctgggtgtg 17880
ggtggcggtc aaaagattaa tgcaagctta accgcgcgcc tacaataccc agtacttaaa 17940
aaagtattta agagcagtgg tctaagtgat gctgacagcg atatgctgat caaaaagttc 18000
caagaccaat acattcactg ggaagaaaat tcattcccag gctcactagg taatgttatt 18060
gctggtcgta ttgctaaccg cttcgatttg ggcggcatga actgtgtagt agatgctgca 18120
tgtgcgggct ctcttgctgc aatgcgtatg gcgttaactg agctagttga aggccgcagt 18180
gaaatgatga tcacaggtgg tgtgtgtacc gataactcac catcaatgta tatgagtttc 18240
tctaaaacgc ctgcgttcac caccaatgaa accattcagc catttgatat cgactcaaaa 18300
ggcatgatga ttggtgaagg tatcggcatg gtagcactta agcgcctaga agatgctgag 18360
cgtgatggcg accgtattta ttctgtgatt aaaggtgtcg gcgcttcatc agacggtaaa 18420
tttaagagta tttatgcacc gcgccctgaa ggccaagcaa aagcattaaa acgagcttat 18480
gatgacgctg gttttgcccc tgaaacagtt ggcttaatcg aagctcacgg tacgggtact 18540
gctgcaggtg atgtagccga atttaacggc cttaaatctg tatttggtga aaacgatcca 18600
actaagcaac acatcgcttt aggttcagtg aaatcacaag tgggtcacac gaaatcaacc 18660
gctggtactg ctggcgtgat taaagctgcc cttgccctgc accataaagt attgccaccg 18720
accattaacg tctctaagcc aaaccctaag cttaatgttg aggattcacc gtttttcgtt 18780
aataccgaaa cacgcccatg gatgcctcgc cctgacggca ctcctcgccg tgctggtatt 18840
agctcgttcg gttttggtgg aactaacttc cacttagtat tagaagaata cacccctgag 18900
cacagccatg atgagaaata ccgtcaacgc caagtggctc aaagcttatt aatgagtgct 18960
gataataaag cagccttgat tgcagaagtg aataagctaa ctgcagacat cagcgcgctt 19020
aaaggcacag ataacagcag cattgaacaa gctgaacttg ctcgcattgc taaactatat 19080
gctgttcgca ccatagatac ttcagcagcc cgtttaggtc ttgtggtatc aagccttaat 19140
gaattaacca ctcagcttgg tttagcgtta aagcagctta ataatgatgt tgatgcatgg 19200
caactgccat cagggactag ctaccgctct tcagcactca tcacgattaa tgcaaaccaa 19260
aaggcgacta aaggtaaaaa agcgactaac gcaccgaaag ttgcagcatt gtttgcaggt 19320
caaggctctc agtacgtcaa catgggtatt gaagtcgctt gtcacttccc tgaaatgcgt 19380
cagcaattaa tcaaggccga taaagtattc gcaagctttg ataaaacccc gctgtctcag 19440
gtgatgttcc cgattccagc ctttgaaaaa gcagataaag atgcacaagc agctttactc 19500
accagcactg ataacgcgca aagcgccatt ggtgtaatga gcatgagcca ataccaattg 19560
tttactcagt ctggtttcag tgcggatatg tttgcaggtc acagctttgg tgaactgtcg 19620
gctttatgtg ctgctggcgt tatctctaat gacgattact accagttatc atttgctcgt 19680
ggtgcagcta tggcttcatc agcagttgat aaagatggca atgagctaga taaaggcacc 19740
atgtacgcca ttatcttgcc agccaatgaa gctgatgctg caaacagcga taacatcgcc 19800
aagctagaaa cctgtatctg tgagtttgat ggcgtgaaag tcgctaacta caactctgcg 19860
actcaattag tgattgctgg cccaacggac tcttgtgcaa atgcagccaa agccattagt 19920
gctttaggct ttaaagccat tgcgcttcct gtatcaggtg ccttccatac tccacttgtt 19980
gggcatgcgc aaaaaccttt tgcaaaggca attgataaag ctaaatttac tgccagcaaa 20040
gttgatttat tctctaatgc gacaggtgaa aagcatcctg ctgatgctaa atcaattaaa 20100
gcggcgttca aacagcacat gttgcaatca gtgcgtttca ctgaccaatt aaacaatatg 20160
tatgatgctg gtgcccgtgt atttgttgag ttcggaccta agaatatttt acaaaagctg 20220
gttgaagcaa cgctaggtaa taaagctgaa gctgtatctg tgattagcat taaccctaat 20280
cctaaaggca atagcgatgt gcaattacgt gtcgctgcta tgcaacttag cgtattaggc 20340
gctccgctta ctgaagttga cccttaccaa gctgaaatcg cagcccctgc tgtaccaaaa 20400
ggtatgaacg tcaagttaac tgcgtcaaac cacatcagcg caccaactcg tgccaagatg 20460
gaaaaatcat tagcaacagg ccaagtcact tcacaaatcg ttgaaacgat tgtagagaaa 20520
gttatcgaaa tgccagttga aaaagtagta gagaaaatcg tggaaaaaga agttatcaaa 20580
actgaatatg ttgaagttgc cgcatctggc gcaacagcag tgcctaacgc cgctgcacca 20640
gtggctcaag cttctcaagt aatagcacct caaatgcaag ttcaggcaac gcctgtagct 20700
ggcagcttag aagcgttctt taatgcacaa cagcaagccg ctgatttaca tcagcaattc 20760
ttagccattc cacaacagta tggtgacacc tttacacacc taatggccga gcaaagtaaa 20820
atggccgctg ctggacatgc tattcctgag agcctacaac gttcaatgga gctattccac 20880
caacatcaag ctcaaacact acaaagtcat actttgttcc ttgagcagca agcacaatca 20940
agccaaaacg cattaagcat gctgactggc caagcaccag ctacaacaac gccagctgtt 21000
aatgctccta gagttaatgc gcctatcact gaaaatccag tagttgctgc gccagtcgtt 21060
gaagctgtta aagtagccgc tacggttcaa actccgacgg cacaagctcc agctgttcaa 21120
gcgtcaatta ctcaaactgc tgccaaacca gccgctatgg ccgctccagc gccacgtatt 21180
gaaccagtaa aagcaactgc cccagttgca gctcctgtcg ttgcgccagc agttgcagca 21240
gcacctgcag gtttaagcgc agaaacagtt ctgaatacta tgttagaagt ggttgcagaa 21300
aaaacaggtt acccaactga aatgcttgaa ttaagcatgg atatggaagc tgatcttggt 21360
attgattcta tcaaacgtgt tgagatctta ggtactgttc aagacgaact gccaacacta 21420
cctgaactaa gccctgaaga tttagccgag tgtcgtacgc ttggtgaaat cgttgactac 21480
atgaactcta aacttcctaa aagtgacgct tcaggaactc aaacgcaagt cgcgccagtt 21540
caagcagcat caggccttag cgctgaaaca gttctgaata ccatgcttga agtggttgct 21600
gaaaagaccg gttacccaac tgaaatgctt gaattaagca tggatatgga ggctgatctt 21660
ggtattgatt ctatcaaacg tgttgagatc ttaggtactg ttcaagacga actgccaaca 21720
ctgccagaac taagccctga agatttagct gaatgtcgta ctcttggcga aatcgttgac 21780
tacatgaaca gcaagcttcc tgctgctggc tctactccag ttgcatcacc agttcagtct 21840
gcggctccgg tatctggcct tagcgctgaa acagttctga ataccatgtt agaagtggtt 21900
gctgaaaaga ctggttaccc aactgaaatg cttgaattaa gcatggatat ggaagccgat 21960
ttaggtatcg attcaatcaa gcgtgttgag attctaggaa ccgttcaaga tgaactgcca 22020
acactgccag agcttagccc tgaagattta gctgagtgtc gtactcttgg tgaaatcgtt 22080
gactacatga actctaagct tcctacaagt tcagccgcag gcgctaatac acaggctgta 22140
gctccagttg ctcaagaatc aggtttaagt gctgaaacag ccttgagcgc gcaagaagtt 22200
caaagcacta tgatgactgt agttgctgaa aaaaccggtt acccaactga aatgcttgaa 22260
ttaagcatgg atatggaagc cgatttaggc atcgattcaa tcaagcgagt tgaaattcta 22320
ggtacagttc aagacgaatt accaacacta cctgagctaa gtcctgaaga tctagctgaa 22380
tgtcgtactc ttggtgaaat cgtatcttat atgaattcta agttacccgc cgcaggcgct 22440
atgaacagca cagccgttgt agctcaagct tctggtttaa gtgctgaaac agccttgagc 22500
gcgcaagaag tacaaagcac catgatgact gtggttgctg aaaaaaccgg ttacccaact 22560
gaaatgcttg agctaagcat ggatatggaa gcggatttag gcatcgattc aatcaaacga 22620
gttgagatct taggtacagt tcaagatgaa ctaccaacgc taccagagct taaccctgaa 22680
gatttagctg agtgtcgtac ccttggcgaa atcgtgagct acatgaacag caagcttcct 22740
gctgtcagtg cgacaactgc cgcagggact caaacacaag cagccgcagg cgctactcaa 22800
gcttctggtt taagtgcaga gcaagtgcaa agcactatga tgacagtcgt tgctgaaaaa 22860
accggttacc caactgaaat gcttgagcta agcatggata tggaagcaga tttaggcatc 22920
gattcaatca aacgtgttga aattttaggg acggttcaag acgagcttcc aggcttacct 22980
gaattaaacc ctgaagattt agcagagtgt cgcaccctag gtgaaatcgt tagctatatg 23040
aacagcaaac tttcaacaag tgcagctgaa ggctctcagc caacgctaag ctcaactgac 23100
acttcaccag caacagccac agctgagtta gcaacagact tacctcctca tcaggaagtt 23160
gctctaaaaa agctaccagc ggcggataag ttagttgacg ttttttcaaa agacgcatgt 23220
atcgttatca atgatgacgg ccataacgca ggtgttttag ctgaaaaatt agtagcaaca 23280
ggcctaaccg tcgccgttat tcgtagccct gagtcagtga catctgcgca atcaccgctt 23340
agcagtgata ttgccagctt cactttatct gcggtcaatg acgacgcgat tagcgatgtc 23400
attgctcaaa ttagcaagca acataagatc gccggctttg ttcacctgca acctcaacta 23460
acagcacaag gtgctttgcc attaagtgat gcaggttttg tagcagtgga gcaagctttc 23520
ttgatggcta aacacctaca gaaaccattt gctgagctag ctaaaactga gcgcgtaagc 23580
tttatgactg ttagccgcat tgatggcgga tttggttact taaacagtaa cgaacttgca 23640
aaggctgagc taaaccaagc tgcattatct ggtttaacta aaacattagg tcatgagtgg 23700
ccaactgtgt tctgtagagc attggatatt accccaagct ttgaggcagt tgagttagca 23760
caagccgtta ttgaagagtt atttgatctt gatactgcaa ctgctgaagt gggtattagc 23820
gaccaaggtc gtcatacctt atctgctacc actgcagctc aaacccgtta ccaaaccaca 23880
tcattaaaca atgaagatac agtgttggtg actggcggag caaaaggcgt cacattcgaa 23940
tgtgccctta cccttgcgaa acaaactcag tcacacttta tcttagcggg tcgcagtgag 24000
catttagccg gtaatttacc gacttgggct caaggcaaac aggctaaaga attgaaagct 24060
gctgcaattg gatttattca atctcaaggt aataagccaa caccaaagca aattgatgcc 24120
ttagtttggc cgattaccag cagtttagaa attgatcgct cattagcagc atttaaagct 24180
gtcggtgcaa gtgctgaata catcagcatg gatgtcagct cagatgcagc catcaagcaa 24240
tcacttgctg gcctcaaacc gattacaggc atcattcatg gtgcgggggt actcgccgat 24300
aaacacattc aagacaaaac attagctgag ttaggccgtg tatatggcac taaagtctcg 24360
ggctttgccg gcatcatcaa tgcgattgat gcaagtaaat tgaagctagt tgctatgttc 24420
tcatcagcag cgggtttcta tggcaacact ggtcaaagtg attactcaat gtcgaatgag 24480
atcctaaaca agacagcact acaacttgca gcgaactacc cgcaagcaaa agtgatgagc 24540
tttaactggg gaccttggga cggcggtatg gtcagttcag cgttaaagaa aatgtttgtt 24600
gagcgcggcg tatacgttat tccactcgat aaaggcgcaa acttgtttgc tcacagccta 24660
ttgtctgaat ctggcgtaca gctattaatt ggttcaagta tgcagggctc aagctcagca 24720
gctaaaacag gcgcagctgt aaaaaagctt aatgcggact cttcgcttaa tgccgagggt 24780
tcgctgattc tttcttttac tgctccagat aaccgtgttg ttaacaacgc ggttactgtt 24840
gaacgagtac taaacccagt tgcaatgccc ttccttgaag atcattgcat cgcgggtaat 24900
ccagtactgc caacagtgtg cgctatacaa tggatgcgtg aaactgcgca aaaactgtgt 24960
ggcctacctg tgacggttca agattataaa ttgctgaaag gcattatttt cgagactaaa 25020
gagccacaag tattaacgct gacattgacg caaacagaat caggcttaaa agcactgatt 25080
gcgagtcgta tgcaaagtga tgccgttgat agcttgctta gacctcagta tcaagcaaac 25140
ctgattgtta acgagaagat tgttaacgag aaggttgcta aagaagcggt ttcaaccacg 25200
ctaccaactg cagcaaaaaa tgcgcagcaa ttagcaagct caggtaaagt cattagcact 25260
gatagcgagc tatatagcaa tggcagctta ttccacggcc ctcgccttca aggaataaag 25320
cagttgttaa ttgccaacga tgagcaattg gtttgctcag ttgagttgcc tcaaattacc 25380
gctgtagatt gcgcaagctt tacaccgcaa acaggtttag gtggtagtca ggctttcgct 25440
gaagacttac ttttacaagc catgttagtg tgggcgcgta tcaaacacga tgcagcgagc 25500
ttaccgtcaa ccattggtga attaaccaca tacgccccat tcgcctcggg tgataaaggt 25560
tacttagtgt taactgtgct taaaagtact agccgttcat tgactgctga tattgcgctt 25620
tatcatcaag atggccgctt aagctgcact atgctaagcg caaaaacgac catcagcaaa 25680
agcttgaatg aggccttttt agccccagcc aaagcattag ctgatttgca ggagtctgtg 25740
tgagtaatca actgcctcct tcaacgtctg ctattaaaag catgcgaata gccttaaaga 25800
tggttgcgaa tgagcaagtc tcattcgcaa catcttcagg caatgatttt agtgccaata 25860
gctttgcagc gattaagcct tgctcattag ctgaggccat tggcgcttca gcaattgatc 25920
ttgaaattga tgtatcaagc ctagatgcga gtttgagtga aaacgctgtt aataaagcac 25980
ttagctttaa tgactatttt gctcaagcca tcatccatat cgagcaacaa catacggttt 26040
tactcagtca ccctgaatta ccgtatcgct tattaatgat gccagcgatt gtggcggcta 26100
aacatcgttg ccatcctcat gcctacttaa ccggtttggg tgaagctgat gatatgccaa 26160
gtgcaataaa tgcggcttta gttcaagcca agcgtgcaca cattaaacct actcatgtcg 26220
atgcgactca attaacttgt tataaagata agtttgccca gttggttatg ctgataggca 26280
gcattgccac tcgcagtgtg ccaaatacag tttcagaaaa tcagtcagct gatgctcaat 26340
actggttcac tgaaatgcac caaaatcgcg ttgccagctt taattttagt gaaggcaata 26400
agcaacacag tgcagtcttt gtccaaggca ctgagcttgc tcaagcaagt tctttggtag 26460
atgacaatcg actatttttg cctgtatcag ccaatgacct tggaatgatg aaacagcagc 26520
tgcaagcatt aagcagtcaa ttggctgcgc tgcctgcaca acatgacaag agtgacagtt 26580
ccgctatctc cttcatgctt agccagctaa agcaatttga tcagacccag cctttatcgg 26640
cagttgttat ggcaaattca gtgactaatg cagtaagtga aatcaatgtc atgcttagca 26700
cgattggtaa agctgaagcc actgcggcaa atgaagttca agctaaaagc aacttaagca 26760
ttgaacacaa aaccccgtca ggaagctgct ttcatctcac ttcagataaa gtacttggca 26820
ataatggcct gtgttttgtt taccctggcg tgggcacggt atacccgcaa atgtttgctc 26880
aactgccgcg ctactttcca gcattatttg cccagctaga gcgcgatggt gatgtcaaag 26940
ccatgctgca agcggatagt atttatgctg aaaatgctaa aaccactgac atgagcttag 27000
gtgaactagc tattgcaggt gtaggcgcaa gttacatcct aaccaaagtg ctcactgagc 27060
atttcggcat taagcctaac tttgccatgg gttactcaat gggcgaggca tcaatgtggg 27120
ccagtcttga tgtgtggaaa acaccccaca atatgattga agcaacgcaa actaacagta 27180
tttttaccac tgacatttcg ggccgcttag actgcgttcg tcaagcatgg cagctagaac 27240
atggcgaaga cattgtttgg aatagctttg tggttcgtgc agcgcctgct gatatcgaaa 27300
aagtattagc tgatttccca cgtgcatacc ttgctatcat ccaaggtgat acttgtgtgc 27360
ttgcaggctg tgaggaaagc tgtaaagcgc tacttaaaca aattggtaaa cgtggcatag 27420
cagcgaatcg agtaaccgca atgcacacta aacctgcgat gcttattcga gacaacgtac 27480
aagcctttta tcagcagcct ttgcatgagc aagatgttat tgcacctttc gcaagccaaa 27540
ttaaatttat cagcgctgca agccaatcgc cgattaattt aaccagtgaa gcgattgcaa 27600
catccattgc tgataccttt tgtcagccgt tagattttac acaattagtc aataatgcac 27660
gtcatttagg cgcctcgctt tttgtcgaaa tcggcgctga cagacaaacg acaacactga 27720
ttgacaaaat ctcgcgtacc tctgaaatgg cgcaaacatg ccaagccatt tcagtgaatg 27780
caaaaggcga tgaccaaact gcgctactta aatgtattgc tcaactgatt actcataaaa 27840
ccccaatttc gctcgattat cttactgaga ccttgtcgag tttactgacg acaacattgg 27900
cggcagaaaa acgaagtaat caccacacag gcaatatgtt ggcccctcaa ttagaaggag 27960
aacaatcttg agttctcaat caactaatct aaatacaaca gtcccaaaga ttgccattgt 28020
aggtttagcg actcaatatc ccgatgcgga tacgcccgct aaattctggc aaaacttatt 28080
agacaaaaaa gactctcgaa gcacgattaa cagccaaaag ctcaatgcaa acccagctga 28140
ctatcaaggt gtgcaaggtg agtctgaccg tttttattgt gataaaggcg gctacattca 28200
aaacttcagt tttgatgcta atggctatcg tattcctgcc gagcaattta gcggccttga 28260
tgacagtttt ttatgggcaa ccgatacagc acgtaaagca ttgaatgatg ctggtgttga 28320
tattacaaac ccacaaaaca atggcgcatt aaaccgcacc ggtattgtca tgggaacact 28380
atcgtttcca acggctaaat ccaatgaact gttcgtaccg atttatcaca gcgcagtaga 28440
aaaagcgttg caagataaac tgcaacaacc aagtttcaca ttgcagccat ttgatagtga 28500
aggatatagt cagcaaacaa cgtcagcttc tttgtctaat ggcgccattg ctcacaatgc 28560
atctaaacta gtcgccgatg cgctaggctt aggtgcagcg caattaagcc ttgatgctgc 28620
ttgtgcaagt tctgtttact cattaaagct tgcctgtgat tatttgcata ctggcaaagc 28680
tgacatgatg ttagctggcg cagtttctgg cgctgaccca ttctttatta acatgggttt 28740
ctccattttc cacgcctacc ctgaccacgg tatttcagcg ccatttgata gtaattcaaa 28800
aggtttgttt gctggtgaag gtgctggtgt tttagtcctt aaacgccttg aagatgctga 28860
gcgcgatggc gaccatattt atgcactcgt tagcggtatc ggtttatcaa atgacggcaa 28920
aggccaattt gtattaagcc caaacagcga cggccaagtt aaagcattcg aacgtgctta 28980
tgctgatgct gctatgcatg atgaaaactt tggcccaaac aacatagaag tgcttgagtg 29040
tcacgcaaca ggtacgccat taggtgacaa agttgagctg acgtcaatgg agcgcttttt 29100
tagcgacaaa ctcaatggca gtaacacgcc gttaattggt tcagctaagt ctaacttagg 29160
ccacttgctg actgctgcag gtatgccagg gatcatgaaa atgatttttg cgatgcgcca 29220
aggtgttctg ccgccaagta ttaatattag cgcaccgatt gcttcaccat cagaaatgtt 29280
tggccctgca accttaccta atgatgttct cccttggcct gataaagctg gcaatacagc 29340
ccgccatgcg ggtgtgtcag tatttggttt tggcggttgt aatgcccatt tattagttga 29400
gtcatacttt gcgaagagtc atggccagcc ttctagcaca gagttagtta aaccagcgac 29460
aacgaccatc aatgcgcaaa tgccaatgca cattaccggt atggcatcac actttggttc 29520
gttgtcgaac gtaaatgact ttgctgatgc ggtaaataac aatcaaaccg catttacctc 29580
attgccagct aaacgctgga aaggtttaga taaacaccca gagttattac aaaaattcgg 29640
actgagtcaa gctgcgccaa caggtgctta tattgatcaa tttgatttcg acttcttacg 29700
ctttaaagtg ccacccaatg aagatgaccg tttaatctcg cagcaattgt tattaatgaa 29760
agtagcagat gaagccattc atgatgccaa acttgagtca ggtagcaaag tggcggtttt 29820
ggttgcaatg gaaacagaac ttgaattaca tcagttccgt ggccgcgtta acttacatac 29880
ccaaatagct gccagcttaa cagcccatgg cgtgagctta tctgatagcg aataccaagc 29940
attagaaacc attgcgatgg acagcgtgtt agatgccgcc aagcttaacc aatacaccag 30000
ctttattggt aatattatgg cgtcacgcat ctcatcatta tgggatttta atggccctgc 30060
ctttacgatt tcagcaggcg agcaatcagt taaccgctgt attgatgtgg cgcaaaacct 30120
actggcgatg gagtctcgtc aagagcctct agatgcagcg attattgccg cagtggattt 30180
atctggcagt attgaaaata tcgtgcttaa aacggcgaac attaataaaa caggctcaac 30240
tgaagcactc aatattggtg aaggggctgg cgcaattgta ttgcaagcag ccgctattga 30300
tagcgagcac tgcgacctaa tacatcaagg tttaggcgcg ttagatacgc tagattcagc 30360
aagcacccac agttatggca ccatcgacag tttggcattt ggtcatacag accagctttc 30420
aaccattagc gatgacgtgt taactcctgt tggattggct gcaactgata ttgatttatt 30480
agagttaaac caagcacctg atttgctcaa tattgataat gcgcaaatgc tatcgcagct 30540
atttaaccaa tcgagcacca gcaaagcgca atcttgtatc gggcacactt ttgccgcttc 30600
cggtattgcc agcttattgc atggcttatt gaaaactcga ttgaatgctt ctgtgcagaa 30660
cgctaactcg gatagcaaac tgagcaataa gcccaaccaa aaggccataa tcgctacttt 30720
gagcgaaaac cagtgttcgc agcttcttat cagccaaaac gctgaacaag caagcgcgat 30780
gagcactcgt attgacactg atatacaagc gcaaacggcc aagaaattga gcctagttaa 30840
gcaagtcagt ttaggtggtc gtgacatcta ccagcatatt gttgatgcgc cactggctaa 30900
cattgacagt attagagcga aagttgccaa gcttaaccct gttgcaccta caactgtgat 30960
gaacttacat gaccgcggcc aatttatcgc gccagctcat gccaattcag cgcctatgtc 31020
cgctaacaat aattcaatga ctacagagac ttctatgccg ttttctgatc gttcaaccca 31080
gtttaaccct acacctaaag tggctacgcc tactgcactt tccactcagg cagctcaggc 31140
aactcagtca gctcaaacgt cttcagtgac gagctctgtc gcagcaatta gccaagtgcc 31200
acctacgcat ttaagcgctt ttgagcaaaa ccaatggtta gcacatcaag cgcaattagc 31260
atttttaaag agccgcgaac aaggcttaaa agtcgctgat gcacttttaa agcaagagat 31320
tgcacaagca aatggtcagc cttatgttgc ccaatcgacg gcacaagctg tagcgcccgt 31380
ccaagcggca aacgtgttag cgcagccaat agcatctgcg tcaatcttgc gtccagatca 31440
tgcaaatgtg ccaccctaca cagcgcctat cccagcgaat aagccatgta tttggaacta 31500
cgctgattta gtagaatatg ccgaaggtga tattgccaaa gtatttggcc cagattacgc 31560
cgtgattgat aactactctc gccgcgtacg ccttcctaca actgattact tattggtatc 31620
tcgcgttact aaactcgatg caacaatgaa ccaatataag ccttgtagca tgaccacaga 31680
gtatgacatc ccagaagatg caccttactt agtcgatggc caaatccctt gggcggtagc 31740
cgttgaatca ggccagtgtg atttaatgct gatcagttat ttaggcattg attttgaaaa 31800
caaaggtgag cgtgtttacc gtttacttga ttgtacgctg accttcttag gcgacttacc 31860
tcgtggcggc gacacattgc gttacgacat taaaatcaat aacttcgcta agaatggcga 31920
gacactatta ttcttcttct cctacgaatg tttcgtcggc gataagatgg tcttaaaaat 31980
ggatggcggc tgtgctggct tctttaccga ccaagagtta gatgacggta aaggggttat 32040
ttacaccgaa gatgaaatca aaacccgtga agcggcgtta aatacgccaa acaaaccgcg 32100
ttttgaaccg ctattacatt gtgctcagac tcaatttgac tatggtcaaa tccatcattt 32160
actcaatgct gatattggca gctgttttgc tggcgaacac cataaccacc agcaagcatc 32220
aggtaagcaa gactcattat gttttgcctc tgaaaagttc ttgatgattg agcaagtggg 32280
caatttagaa gtccatggcg gcgcttgggg cttaggcttt atcgaaggcc ataaacaatt 32340
agcacctgat cattggtact tcccttgtca tttccaaggc gaccaagtaa tggctggctc 32400
attaatggct gaaggttgtg gccaattatt gcagttcttc atgctgcaca ttggtatgca 32460
caccttagtt gaaaacggac gtttccagcc tttagaaaat gcttcacaaa aagtacgttg 32520
tcgtggccaa gtactgccac aacatggtga actgacgtac cgcatggaag tcacagaaat 32580
tggtactcac cctcgcccat acgccaaagc caatattgaa atattgctca atggtaaagc 32640
ggtcgtggac ttccaaaatc ttggggtgat gattaaagaa gaaggtgaat gtactcgtta 32700
cactgccgac tctactgaaa cacatacaac ctcaggcaca gtccaaaaaa acaacagcca 32760
caacacacca gcatcattaa atgcaccgtt aatggcacaa gtgccagact taagtgaacc 32820
agccaataaa ggcgttatcc cgctgcaaca tgttgaagcg cctatgctgc cagactaccc 32880
aaatcgaacc cctgatacgc tgccgttcac cgcgtaccat atgtttgagt ttgcaacagg 32940
tgacatcgaa aactgttttg gacctgactt tagtatttac cggggcttta ttccgccgcg 33000
cacgccatgt ggtgacttac agctaacaac ccgtgttgtt gatattcaag gtaaacgtgg 33060
cgagcttaaa aaaccgtcat cgtgtatcgc tgaatatgaa gtgccaaccg atgcgtggta 33120
ttttgctaaa aacagtcacg cttcagtgat gccttactcg gtattaatgg aaatatcact 33180
gcaaccaaac ggatttattt cgggttacat gggcacaacc cttggtttcc cagggcaaga 33240
gctattcttc cgtaaccttg atggtagcgg tgagttattg tgtgatgtag atttacgcgg 33300
caaaaccatt gtcaatgatt ctaagctatt atctaccgtt attgccggca gtaacatcat 33360
ccaaagtttc agctttgatt taagtgttga tggcgagcct ttctatactg gtagcgctgt 33420
atttggttac tttaaaggtg atgcacttaa aaaccagcta ggtattgata atggccgtat 33480
tactcagcca tggcatgttg aaaataacgt agcggctgat atcaccgttg atttgcttga 33540
taagcagtcc cgcgtattcc atgcaccagc aaaccagcca cattatcgtt tagctggcgg 33600
tcaacttaac tttatcgaca aagctgaaat cgttgataaa ggcggtaaaa atggtttagg 33660
ttacttgtct gcctcacgca ccattgaccc aagtgattgg ttcttccagt tccacttcca 33720
tcaagatcct gtgatgccag gttcattagg cgttgaagca attatcgagt taatgcaaac 33780
ttacgccatc agtaaagacc taggtaaagg tttcactaac ccgaaatttg gtcagatttt 33840
gtctgacatc aaatggaagt accgtggcca aatcaaccca ctaaataagc aaatgtcgct 33900
ggatgtgcac atcagtgcag tcaaagatga aaacggcaaa cgtatcattg tgggtgacgc 33960
aaacctcagc aaagacggtt tacgtattta cgaagtaaaa gacatcgcta tctgtatcga 34020
agaggcataa aggaataata atgactatta gcactcaaaa cgaaaagctt tctccatggc 34080
cttggcaagt agccccaagt gatgccagct ttgagaatgc cgctatcggt aaaaaattaa 34140
aagaactgtc tcaggcgtgt tatttaatta accaccctga aaaaggctta ggtatttcgc 34200
aaaacgcaca agtaatgact gaaagcatga acagccagca agacttacca gttagtgcat 34260
ttgcacctgc tttaggcact caaagcttag gcgacagtaa tttccgccgc gttcacggag 34320
taaaatacgc ctactacgct ggcgcgatgg ccaatggtat ttcatctgaa gagttagtga 34380
ttgcattagg ccaagctggt attttgtgtt catttggcgc agcaggatta attccatctc 34440
gcgtagaaca agccattaat cgcattcaaa cggcgctacc caatggcccg tacatgttta 34500
acttaatcca cagcccaagt gagccagcat tagaacgtgg cagtgttgag ttatttttaa 34560
aacataaagt gcgcacggtt gaagcatcag catttttagg gttaaccccg caaattgtct 34620
attaccgcgc tgcaggttta agccgtgatg ctcaaggtga agtggttata gccaacaagg 34680
ttatcgctaa agtaagccgc acagaagtag cgagtaagtt catgcaacct gcacctgcta 34740
aaatgctgca aaagctggtt gatgaaggct taatcacacc tgagcaaatg gagctcgcac 34800
aattagtccc aatggcagat gatgtgacag cagaggctga ttctggtggt cataccgata 34860
accgtccatt agtgacgcta ttgccaacaa ttttggcgct taaagataaa attcaagccg 34920
agtaccaata caagacgcct attcgtgtcg gttgcggcgg cggcgtggga acacctgatg 34980
cagcattagc gacctttaac atgggcgcag cgtatatcgt taccggctca atcaaccaag 35040
cgtgtgttga agctggtgcc agtgaacata ctcgtaaatt attagcgaca acagaaatgg 35100
ccgatgtcac catggcacct gctgctgata tgtttgaaat gggcgttaaa ctacaagtgg 35160
ttaagcgcgg tacactattc ccaatgcgtg ccaacaagct ttatgagatt tacactcgtt 35220
atgaatcaat tgaagcgatt ccagctgaag aacgtgaaaa actagagaaa caagttttcc 35280
gttcaaccct tgatgatatt tgggcaggca ctgtggctca ctttaacgaa cgcgacccta 35340
agcaaatcga acgcgcagaa ggaaacccta agcgtaaaat ggcactgatt ttccgttggt 35400
acttaggttt atcaagccgc tggtcaaatt cgggcgaagt cggccgtgaa atggattacc 35460
aaatttgggc aggtcctgca cttggtgcgt tcaatgaatg ggcaaaaggc agctatttag 35520
atgattatac ccagcgaaat gcggtagact tggccaaaca cttgatgcat ggcgcagctt 35580
atcaagcccg cgttaactta ttaactgctc aaggcgtggc actgccggtt gaattgcaac 35640
gctggagccc gctagatcag gttaagtaac ggacgttgta gctttataac gtcagcagtg 35700
atactcgcca tattgcgatc aagttaacca ttactattgt gccactcact caacatgagt 35760
ggcacattga tatttagttt gcagttaggt aacagtatga gcgaaaccca aaagttagat 35820
ttttcagcgg taaatggcac aacactagcc tcgtttaatc agcataaaaa cttgatcaaa 35880
cgtatgctaa aaggcaacag cgctgaatgt agcgagtgta aaaaaccact cactttgcaa 35940
ttaccgccta acattaagaa cgctaaacca agtgataaag caccaggcat atattgcgca 36000
aaaggctgta ccgatatcga gctagatatg gaagcagtgg cattaatgaa gtagccgaag 36060
ataagaacac agttctttag gtataagcct ttataagcac aattacgaag caccttatgg 36120
gtgcttttac ttttcctatc ccaccaaaga tattgtttta actaacttaa gaagggttag 36180
tatgtggcat aactaactca gctaaccatt cataatattt ttcattccca tgaatccaat 36240
ccacttgtcc atttgaataa gttattgggc tgataaattc atgaaagtca taaccttctt 36300
cgataaaaat acgagcagca ttgacaaacg ttatatcaaa ttgtgctagt acgtaatcta 36360
tcgcctcaaa atatgcaaaa ataatatttg ccataggttt agcttcttca acaaatttac 36420
taaaaggagg atctgaaaca acaattactt tatggccaat acttttcaat ttgatcaaaa 36480
tagataattg atcctgaatg tcatcatgaa agtaatctac aaattcctta gtctcaatat 36540
tactaatccc ttgtggatat tgacgtttca cccagtctac aaatctagct gcactttgat 36600
gtgtctgtag acccacatta catataactg tagattgact aaccgtttta ttattttcat 36660
gtatagataa gttatttaat acatctttcc aaagtgttct agacgctgca ctttctaaag 36720
gcacgaatat ctcagtatca catatagcaa acttcttttg cgcgaaccct gatccattca 36780
ttatcattcc tcctgtatga ggaatattcc ttaatttcat tgcattagaa agttttccca 36840
tatgactatc accaaatatg gaaatggaat ccccgtcatt cgatagttgt ttagagttca 36900
actttctaga agcttgtaaa aactcttcat cgcaaactac ttcatcactt actgttttat 36960
caactttatc ggtaattgaa atatctttac ttaatgtttc accaaaatgc ttcatgacat 37020
aactgaccat ctctgctgta acagttctta gattttcctt aaatctatag tctgtagaaa 37080
tgggtaatgt aactaattca taagaaggaa aataactaaa tactgcctca tattcactta 37140
gttcacctgc aacagctcgt aatgtcgact tagagtattg gttagcgatt gctatatgat 37200
ttgacgtagc tgtagctgtt aatggtacgg gtgagacagt gagtacaatc tgaatgttag 37260
gatttataca ttctacaact ttagctattt ctttaagatc attttgaatt tcagcgaatg 37320
taaaattatg aaaattataa tttttttgtt tatattctcc ttggataacc ccgggacaac 37380
taggatagca aaccccattt atatcaaacc atgcttctgt taatcccaat gtaaaaatta 37440
acacatcagt cttcgcaatt gtttgcttca tttcatcaac ggcagctttt cttgcctgaa 37500
ttaaagcact ctcggatgag taacctaact cgttatataa aggtcttagc aaatcataga 37560
atcttgtttc attgtgataa attgagtgat ctgtcttgaa gctctgatta tcacaattaa 37620
gccactgtaa aaaacacctt ggcgtataaa catttccaaa agcaaaacta gatacattag 37680
cttcgtctaa ttcactttga ttaaaattaa aattattgtc atttagccac ttaccgacat 37740
gctgagcaaa acatgaacca actgacgata ttctgggcac attagttttg aaatttatat 37800
caaccaaatt agatattgtt tcttcaaaat agttttgaga aacaacgcca gttttccaaa 37860
agtgctggga agctttatgt gtataaggtg tcaatttaaa ctccaaaaat gatatggtta 37920
agctcatagt caaattagtg actttcatta aagtaagcat tatatatgcc atttaaatac 37980
taactataaa actgaaattc gacttgccac tcacccacca aatagccttg ctaaatctat 38040
tcctctcgtc ataaagtctc atttttacca acaaaaataa tgcgttaaca tttttttgac 38100
ctgtatcaat aataagtctt attagctaag gcactatgcc tcattatttt taatgtggtt 38160
atatttttta tgagtcaaat caaggctaac aacaatattg agcaagcgct aactgacaat 38220
tgcattcttt tgtcgaccac agatctgaat ggcaacataa aatacgccaa taaagcattt 38280
gccgatattt cagaatacag cactgaagag ctacatggac agcctcataa tattgttcgt 38340
caccctgata tgcctaaagc tgcatttaaa gcactttggg atcgtgtaaa agatggcaaa 38400
ccatggtgtg gcatcgttaa aaataaaacc aaatctggca aatattactg ggtgaatgcg 38460
tatatttcgc cagtttttga aaatggccgt ttacatgaac ttcaatcaat cagacgtaaa 38520
ccatgtcagg cacatatcaa atcagctgaa agcatctacc aacaacttaa tgaaggtaaa 38580
gaacctgctg cgatatcacc accactcttt agcttcacgg gtgcactctg cctatgggca 38640
gtgtttatct cgttaattgg cgttatttct tcgttattaa tgcctacgct agttgcagca 38700
ttttttatcc cgttactggc aggttttggt atttactttc taacaagacc ccttaaagaa 38760
cttgaaacta aagccaccaa tattattgat gatc 38794
<210> 8
<211> 2768
<212> PRT
<213> Sh. olleyana
<400> 8
Met Ser Gln Ala Pro Thr Asn Pro Glu Thr Ser Ser Gln Asp Asn Asn
1 5 10 15
Glu Ser Gln Asp Thr Arg Leu Asn Lys Arg Leu Lys Asp Met Pro Ile
20 25 30
Ala Ile Val Gly Met Ala Ser Ile Phe Ala Asn Ser Arg Tyr Leu Asn
35 40 45
Lys Phe Trp Asp Leu Ile Ser Glu Lys Ile Asp Ala Ile Thr Glu Val
50 55 60
Pro Asp Thr His Trp Arg Ala Glu Asp Tyr Phe Asp Ala Asp Lys Ser
65 70 75 80
Thr Pro Asp Lys Ser Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu Val
85 90 95
Asp Phe Asn Pro Met Glu Phe Gly Leu Pro Pro Asn Ile Leu Glu Leu
100 105 110
Thr Asp Thr Ser Gln Leu Leu Ser Leu Val Ile Ala Lys Glu Val Leu
115 120 125
Ala Asp Ala Gly Val Thr Ser Glu Tyr Asp Thr Asp Lys Ile Gly Ile
130 135 140
Thr Leu Gly Val Gly Gly Gly Gln Lys Ile Asn Ala Ser Leu Thr Ala
145 150 155 160
Arg Leu Gln Tyr Pro Val Leu Lys Lys Val Phe Lys Ser Ser Gly Leu
165 170 175
Ser Asp Ala Asp Ser Asp Met Leu Ile Lys Lys Phe Gln Asp Gln Tyr
180 185 190
Ile His Trp Glu Glu Asn Ser Phe Pro Gly Ser Leu Gly Asn Val Ile
195 200 205
Ala Gly Arg Ile Ala Asn Arg Phe Asp Leu Gly Gly Met Asn Cys Val
210 215 220
Val Asp Ala Ala Cys Ala Gly Ser Leu Ala Ala Met Arg Met Ala Leu
225 230 235 240
Thr Glu Leu Val Glu Gly Arg Ser Glu Met Met Ile Thr Gly Gly Val
245 250 255
Cys Thr Asp Asn Ser Pro Ser Met Tyr Met Ser Phe Ser Lys Thr Pro
260 265 270
Ala Phe Thr Thr Asn Glu Thr Ile Gln Pro Phe Asp Ile Asp Ser Lys
275 280 285
Gly Met Met Ile Gly Glu Gly Ile Gly Met Val Ala Leu Lys Arg Leu
290 295 300
Glu Asp Ala Glu Arg Asp Gly Asp Arg Ile Tyr Ser Val Ile Lys Gly
305 310 315 320
Val Gly Ala Ser Ser Asp Gly Lys Phe Lys Ser Ile Tyr Ala Pro Arg
325 330 335
Pro Glu Gly Gln Ala Lys Ala Leu Lys Arg Ala Tyr Asp Asp Ala Gly
340 345 350
Phe Ala Pro Glu Thr Val Gly Leu Ile Glu Ala His Gly Thr Gly Thr
355 360 365
Ala Ala Gly Asp Val Ala Glu Phe Asn Gly Leu Lys Ser Val Phe Gly
370 375 380
Glu Asn Asp Pro Thr Lys Gln His Ile Ala Leu Gly Ser Val Lys Ser
385 390 395 400
Gln Val Gly His Thr Lys Ser Thr Ala Gly Thr Ala Gly Val Ile Lys
405 410 415
Ala Ala Leu Ala Leu His His Lys Val Leu Pro Pro Thr Ile Asn Val
420 425 430
Ser Lys Pro Asn Pro Lys Leu Asn Val Glu Asp Ser Pro Phe Phe Val
435 440 445
Asn Thr Glu Thr Arg Pro Trp Met Pro Arg Pro Asp Gly Thr Pro Arg
450 455 460
Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly Gly Thr Asn Phe His Leu
465 470 475 480
Val Leu Glu Glu Tyr Thr Pro Glu His Ser His Asp Glu Lys Tyr Arg
485 490 495
Gln Arg Gln Val Ala Gln Ser Leu Leu Met Ser Ala Asp Asn Lys Ala
500 505 510
Ala Leu Ile Ala Glu Val Asn Lys Leu Thr Ala Asp Ile Ser Ala Leu
515 520 525
Lys Gly Thr Asp Asn Ser Ser Ile Glu Gln Ala Glu Leu Ala Arg Ile
530 535 540
Ala Lys Leu Tyr Ala Val Arg Thr Ile Asp Thr Ser Ala Ala Arg Leu
545 550 555 560
Gly Leu Val Val Ser Ser Leu Asn Glu Leu Thr Thr Gln Leu Gly Leu
565 570 575
Ala Leu Lys Gln Leu Asn Asn Asp Val Asp Ala Trp Gln Leu Pro Ser
580 585 590
Gly Thr Ser Tyr Arg Ser Ser Ala Leu Ile Thr Ile Asn Ala Asn Gln
595 600 605
Lys Ala Thr Lys Gly Lys Lys Ala Thr Asn Ala Pro Lys Val Ala Ala
610 615 620
Leu Phe Ala Gly Gln Gly Ser Gln Tyr Val Asn Met Gly Ile Glu Val
625 630 635 640
Ala Cys His Phe Pro Glu Met Arg Gln Gln Leu Ile Lys Ala Asp Lys
645 650 655
Val Phe Ala Ser Phe Asp Lys Thr Pro Leu Ser Gln Val Met Phe Pro
660 665 670
Ile Pro Ala Phe Glu Lys Ala Asp Lys Asp Ala Gln Ala Ala Leu Leu
675 680 685
Thr Ser Thr Asp Asn Ala Gln Ser Ala Ile Gly Val Met Ser Met Ser
690 695 700
Gln Tyr Gln Leu Phe Thr Gln Ser Gly Phe Ser Ala Asp Met Phe Ala
705 710 715 720
Gly His Ser Phe Gly Glu Leu Ser Ala Leu Cys Ala Ala Gly Val Ile
725 730 735
Ser Asn Asp Asp Tyr Tyr Gln Leu Ser Phe Ala Arg Gly Ala Ala Met
740 745 750
Ala Ser Ser Ala Val Asp Lys Asp Gly Asn Glu Leu Asp Lys Gly Thr
755 760 765
Met Tyr Ala Ile Ile Leu Pro Ala Asn Glu Ala Asp Ala Ala Asn Ser
770 775 780
Asp Asn Ile Ala Lys Leu Glu Thr Cys Ile Cys Glu Phe Asp Gly Val
785 790 795 800
Lys Val Ala Asn Tyr Asn Ser Ala Thr Gln Leu Val Ile Ala Gly Pro
805 810 815
Thr Asp Ser Cys Ala Asn Ala Ala Lys Ala Ile Ser Ala Leu Gly Phe
820 825 830
Lys Ala Ile Ala Leu Pro Val Ser Gly Ala Phe His Thr Pro Leu Val
835 840 845
Gly His Ala Gln Lys Pro Phe Ala Lys Ala Ile Asp Lys Ala Lys Phe
850 855 860
Thr Ala Ser Lys Val Asp Leu Phe Ser Asn Ala Thr Gly Glu Lys His
865 870 875 880
Pro Ala Asp Ala Lys Ser Ile Lys Ala Ala Phe Lys Gln His Met Leu
885 890 895
Gln Ser Val Arg Phe Thr Asp Gln Leu Asn Asn Met Tyr Asp Ala Gly
900 905 910
Ala Arg Val Phe Val Glu Phe Gly Pro Lys Asn Ile Leu Gln Lys Leu
915 920 925
Val Glu Ala Thr Leu Gly Asn Lys Ala Glu Ala Val Ser Val Ile Ser
930 935 940
Ile Asn Pro Asn Pro Lys Gly Asn Ser Asp Val Gln Leu Arg Val Ala
945 950 955 960
Ala Met Gln Leu Ser Val Leu Gly Ala Pro Leu Thr Glu Val Asp Pro
965 970 975
Tyr Gln Ala Glu Ile Ala Ala Pro Ala Val Pro Lys Gly Met Asn Val
980 985 990
Lys Leu Thr Ala Ser Asn His Ile Ser Ala Pro Thr Arg Ala Lys Met
995 1000 1005
Glu Lys Ser Leu Ala Thr Gly Gln Val Thr Ser Gln Ile Val Glu
1010 1015 1020
Thr Ile Val Glu Lys Val Ile Glu Met Pro Val Glu Lys Val Val
1025 1030 1035
Glu Lys Ile Val Glu Lys Glu Val Ile Lys Thr Glu Tyr Val Glu
1040 1045 1050
Val Ala Ala Ser Gly Ala Thr Ala Val Pro Asn Ala Ala Ala Pro
1055 1060 1065
Val Ala Gln Ala Ser Gln Val Ile Ala Pro Gln Met Gln Val Gln
1070 1075 1080
Ala Thr Pro Val Ala Gly Ser Leu Glu Ala Phe Phe Asn Ala Gln
1085 1090 1095
Gln Gln Ala Ala Asp Leu His Gln Gln Phe Leu Ala Ile Pro Gln
1100 1105 1110
Gln Tyr Gly Asp Thr Phe Thr His Leu Met Ala Glu Gln Ser Lys
1115 1120 1125
Met Ala Ala Ala Gly His Ala Ile Pro Glu Ser Leu Gln Arg Ser
1130 1135 1140
Met Glu Leu Phe His Gln His Gln Ala Gln Thr Leu Gln Ser His
1145 1150 1155
Thr Leu Phe Leu Glu Gln Gln Ala Gln Ser Ser Gln Asn Ala Leu
1160 1165 1170
Ser Met Leu Thr Gly Gln Ala Pro Ala Thr Thr Thr Pro Ala Val
1175 1180 1185
Asn Ala Pro Arg Val Asn Ala Pro Ile Thr Glu Asn Pro Val Val
1190 1195 1200
Ala Ala Pro Val Val Glu Ala Val Lys Val Ala Ala Thr Val Gln
1205 1210 1215
Thr Pro Thr Ala Gln Ala Pro Ala Val Gln Ala Ser Ile Thr Gln
1220 1225 1230
Thr Ala Ala Lys Pro Ala Ala Met Ala Ala Pro Ala Pro Arg Ile
1235 1240 1245
Glu Pro Val Lys Ala Thr Ala Pro Val Ala Ala Pro Val Val Ala
1250 1255 1260
Pro Ala Val Ala Ala Ala Pro Ala Gly Leu Ser Ala Glu Thr Val
1265 1270 1275
Leu Asn Thr Met Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro
1280 1285 1290
Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly
1295 1300 1305
Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp
1310 1315 1320
Glu Leu Pro Thr Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu
1325 1330 1335
Cys Arg Thr Leu Gly Glu Ile Val Asp Tyr Met Asn Ser Lys Leu
1340 1345 1350
Pro Lys Ser Asp Ala Ser Gly Thr Gln Thr Gln Val Ala Pro Val
1355 1360 1365
Gln Ala Ala Ser Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met
1370 1375 1380
Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu
1385 1390 1395
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile
1400 1405 1410
Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr
1415 1420 1425
Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu
1430 1435 1440
Gly Glu Ile Val Asp Tyr Met Asn Ser Lys Leu Pro Ala Ala Gly
1445 1450 1455
Ser Thr Pro Val Ala Ser Pro Val Gln Ser Ala Ala Pro Val Ser
1460 1465 1470
Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met Leu Glu Val Val
1475 1480 1485
Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser Met
1490 1495 1500
Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
1505 1510 1515
Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu Pro Glu Leu
1520 1525 1530
Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val
1535 1540 1545
Asp Tyr Met Asn Ser Lys Leu Pro Thr Ser Ser Ala Ala Gly Ala
1550 1555 1560
Asn Thr Gln Ala Val Ala Pro Val Ala Gln Glu Ser Gly Leu Ser
1565 1570 1575
Ala Glu Thr Ala Leu Ser Ala Gln Glu Val Gln Ser Thr Met Met
1580 1585 1590
Thr Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu
1595 1600 1605
Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys
1610 1615 1620
Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu
1625 1630 1635
Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly
1640 1645 1650
Glu Ile Val Ser Tyr Met Asn Ser Lys Leu Pro Ala Ala Gly Ala
1655 1660 1665
Met Asn Ser Thr Ala Val Val Ala Gln Ala Ser Gly Leu Ser Ala
1670 1675 1680
Glu Thr Ala Leu Ser Ala Gln Glu Val Gln Ser Thr Met Met Thr
1685 1690 1695
Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu
1700 1705 1710
Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg
1715 1720 1725
Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu Pro
1730 1735 1740
Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu
1745 1750 1755
Ile Val Ser Tyr Met Asn Ser Lys Leu Pro Ala Val Ser Ala Thr
1760 1765 1770
Thr Ala Ala Gly Thr Gln Thr Gln Ala Ala Ala Gly Ala Thr Gln
1775 1780 1785
Ala Ser Gly Leu Ser Ala Glu Gln Val Gln Ser Thr Met Met Thr
1790 1795 1800
Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu
1805 1810 1815
Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg
1820 1825 1830
Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Gly Leu Pro
1835 1840 1845
Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu
1850 1855 1860
Ile Val Ser Tyr Met Asn Ser Lys Leu Ser Thr Ser Ala Ala Glu
1865 1870 1875
Gly Ser Gln Pro Thr Leu Ser Ser Thr Asp Thr Ser Pro Ala Thr
1880 1885 1890
Ala Thr Ala Glu Leu Ala Thr Asp Leu Pro Pro His Gln Glu Val
1895 1900 1905
Ala Leu Lys Lys Leu Pro Ala Ala Asp Lys Leu Val Asp Val Phe
1910 1915 1920
Ser Lys Asp Ala Cys Ile Val Ile Asn Asp Asp Gly His Asn Ala
1925 1930 1935
Gly Val Leu Ala Glu Lys Leu Val Ala Thr Gly Leu Thr Val Ala
1940 1945 1950
Val Ile Arg Ser Pro Glu Ser Val Thr Ser Ala Gln Ser Pro Leu
1955 1960 1965
Ser Ser Asp Ile Ala Ser Phe Thr Leu Ser Ala Val Asn Asp Asp
1970 1975 1980
Ala Ile Ser Asp Val Ile Ala Gln Ile Ser Lys Gln His Lys Ile
1985 1990 1995
Ala Gly Phe Val His Leu Gln Pro Gln Leu Thr Ala Gln Gly Ala
2000 2005 2010
Leu Pro Leu Ser Asp Ala Gly Phe Val Ala Val Glu Gln Ala Phe
2015 2020 2025
Leu Met Ala Lys His Leu Gln Lys Pro Phe Ala Glu Leu Ala Lys
2030 2035 2040
Thr Glu Arg Val Ser Phe Met Thr Val Ser Arg Ile Asp Gly Gly
2045 2050 2055
Phe Gly Tyr Leu Asn Ser Asn Glu Leu Ala Lys Ala Glu Leu Asn
2060 2065 2070
Gln Ala Ala Leu Ser Gly Leu Thr Lys Thr Leu Gly His Glu Trp
2075 2080 2085
Pro Thr Val Phe Cys Arg Ala Leu Asp Ile Thr Pro Ser Phe Glu
2090 2095 2100
Ala Val Glu Leu Ala Gln Ala Val Ile Glu Glu Leu Phe Asp Leu
2105 2110 2115
Asp Thr Ala Thr Ala Glu Val Gly Ile Ser Asp Gln Gly Arg His
2120 2125 2130
Thr Leu Ser Ala Thr Thr Ala Ala Gln Thr Arg Tyr Gln Thr Thr
2135 2140 2145
Ser Leu Asn Asn Glu Asp Thr Val Leu Val Thr Gly Gly Ala Lys
2150 2155 2160
Gly Val Thr Phe Glu Cys Ala Leu Thr Leu Ala Lys Gln Thr Gln
2165 2170 2175
Ser His Phe Ile Leu Ala Gly Arg Ser Glu His Leu Ala Gly Asn
2180 2185 2190
Leu Pro Thr Trp Ala Gln Gly Lys Gln Ala Lys Glu Leu Lys Ala
2195 2200 2205
Ala Ala Ile Gly Phe Ile Gln Ser Gln Gly Asn Lys Pro Thr Pro
2210 2215 2220
Lys Gln Ile Asp Ala Leu Val Trp Pro Ile Thr Ser Ser Leu Glu
2225 2230 2235
Ile Asp Arg Ser Leu Ala Ala Phe Lys Ala Val Gly Ala Ser Ala
2240 2245 2250
Glu Tyr Ile Ser Met Asp Val Ser Ser Asp Ala Ala Ile Lys Gln
2255 2260 2265
Ser Leu Ala Gly Leu Lys Pro Ile Thr Gly Ile Ile His Gly Ala
2270 2275 2280
Gly Val Leu Ala Asp Lys His Ile Gln Asp Lys Thr Leu Ala Glu
2285 2290 2295
Leu Gly Arg Val Tyr Gly Thr Lys Val Ser Gly Phe Ala Gly Ile
2300 2305 2310
Ile Asn Ala Ile Asp Ala Ser Lys Leu Lys Leu Val Ala Met Phe
2315 2320 2325
Ser Ser Ala Ala Gly Phe Tyr Gly Asn Thr Gly Gln Ser Asp Tyr
2330 2335 2340
Ser Met Ser Asn Glu Ile Leu Asn Lys Thr Ala Leu Gln Leu Ala
2345 2350 2355
Ala Asn Tyr Pro Gln Ala Lys Val Met Ser Phe Asn Trp Gly Pro
2360 2365 2370
Trp Asp Gly Gly Met Val Ser Ser Ala Leu Lys Lys Met Phe Val
2375 2380 2385
Glu Arg Gly Val Tyr Val Ile Pro Leu Asp Lys Gly Ala Asn Leu
2390 2395 2400
Phe Ala His Ser Leu Leu Ser Glu Ser Gly Val Gln Leu Leu Ile
2405 2410 2415
Gly Ser Ser Met Gln Gly Ser Ser Ser Ala Ala Lys Thr Gly Ala
2420 2425 2430
Ala Val Lys Lys Leu Asn Ala Asp Ser Ser Leu Asn Ala Glu Gly
2435 2440 2445
Ser Leu Ile Leu Ser Phe Thr Ala Pro Asp Asn Arg Val Val Asn
2450 2455 2460
Asn Ala Val Thr Val Glu Arg Val Leu Asn Pro Val Ala Met Pro
2465 2470 2475
Phe Leu Glu Asp His Cys Ile Ala Gly Asn Pro Val Leu Pro Thr
2480 2485 2490
Val Cys Ala Ile Gln Trp Met Arg Glu Thr Ala Gln Lys Leu Cys
2495 2500 2505
Gly Leu Pro Val Thr Val Gln Asp Tyr Lys Leu Leu Lys Gly Ile
2510 2515 2520
Ile Phe Glu Thr Lys Glu Pro Gln Val Leu Thr Leu Thr Leu Thr
2525 2530 2535
Gln Thr Glu Ser Gly Leu Lys Ala Leu Ile Ala Ser Arg Met Gln
2540 2545 2550
Ser Asp Ala Val Asp Ser Leu Leu Arg Pro Gln Tyr Gln Ala Asn
2555 2560 2565
Leu Ile Val Asn Glu Lys Ile Val Asn Glu Lys Val Ala Lys Glu
2570 2575 2580
Ala Val Ser Thr Thr Leu Pro Thr Ala Ala Lys Asn Ala Gln Gln
2585 2590 2595
Leu Ala Ser Ser Gly Lys Val Ile Ser Thr Asp Ser Glu Leu Tyr
2600 2605 2610
Ser Asn Gly Ser Leu Phe His Gly Pro Arg Leu Gln Gly Ile Lys
2615 2620 2625
Gln Leu Leu Ile Ala Asn Asp Glu Gln Leu Val Cys Ser Val Glu
2630 2635 2640
Leu Pro Gln Ile Thr Ala Val Asp Cys Ala Ser Phe Thr Pro Gln
2645 2650 2655
Thr Gly Leu Gly Gly Ser Gln Ala Phe Ala Glu Asp Leu Leu Leu
2660 2665 2670
Gln Ala Met Leu Val Trp Ala Arg Ile Lys His Asp Ala Ala Ser
2675 2680 2685
Leu Pro Ser Thr Ile Gly Glu Leu Thr Thr Tyr Ala Pro Phe Ala
2690 2695 2700
Ser Gly Asp Lys Gly Tyr Leu Val Leu Thr Val Leu Lys Ser Thr
2705 2710 2715
Ser Arg Ser Leu Thr Ala Asp Ile Ala Leu Tyr His Gln Asp Gly
2720 2725 2730
Arg Leu Ser Cys Thr Met Leu Ser Ala Lys Thr Thr Ile Ser Lys
2735 2740 2745
Ser Leu Asn Glu Ala Phe Leu Ala Pro Ala Lys Ala Leu Ala Asp
2750 2755 2760
Leu Gln Glu Ser Val
2765
<210> 9
<211> 743
<212> PRT
<213> Sh. olleyana
<400> 9
Val Ser Asn Gln Leu Pro Pro Ser Thr Ser Ala Ile Lys Ser Met Arg
1 5 10 15
Ile Ala Leu Lys Met Val Ala Asn Glu Gln Val Ser Phe Ala Thr Ser
20 25 30
Ser Gly Asn Asp Phe Ser Ala Asn Ser Phe Ala Ala Ile Lys Pro Cys
35 40 45
Ser Leu Ala Glu Ala Ile Gly Ala Ser Ala Ile Asp Leu Glu Ile Asp
50 55 60
Val Ser Ser Leu Asp Ala Ser Leu Ser Glu Asn Ala Val Asn Lys Ala
65 70 75 80
Leu Ser Phe Asn Asp Tyr Phe Ala Gln Ala Ile Ile His Ile Glu Gln
85 90 95
Gln His Thr Val Leu Leu Ser His Pro Glu Leu Pro Tyr Arg Leu Leu
100 105 110
Met Met Pro Ala Ile Val Ala Ala Lys His Arg Cys His Pro His Ala
115 120 125
Tyr Leu Thr Gly Leu Gly Glu Ala Asp Asp Met Pro Ser Ala Ile Asn
130 135 140
Ala Ala Leu Val Gln Ala Lys Arg Ala His Ile Lys Pro Thr His Val
145 150 155 160
Asp Ala Thr Gln Leu Thr Cys Tyr Lys Asp Lys Phe Ala Gln Leu Val
165 170 175
Met Leu Ile Gly Ser Ile Ala Thr Arg Ser Val Pro Asn Thr Val Ser
180 185 190
Glu Asn Gln Ser Ala Asp Ala Gln Tyr Trp Phe Thr Glu Met His Gln
195 200 205
Asn Arg Val Ala Ser Phe Asn Phe Ser Glu Gly Asn Lys Gln His Ser
210 215 220
Ala Val Phe Val Gln Gly Thr Glu Leu Ala Gln Ala Ser Ser Leu Val
225 230 235 240
Asp Asp Asn Arg Leu Phe Leu Pro Val Ser Ala Asn Asp Leu Gly Met
245 250 255
Met Lys Gln Gln Leu Gln Ala Leu Ser Ser Gln Leu Ala Ala Leu Pro
260 265 270
Ala Gln His Asp Lys Ser Asp Ser Ser Ala Ile Ser Phe Met Leu Ser
275 280 285
Gln Leu Lys Gln Phe Asp Gln Thr Gln Pro Leu Ser Ala Val Val Met
290 295 300
Ala Asn Ser Val Thr Asn Ala Val Ser Glu Ile Asn Val Met Leu Ser
305 310 315 320
Thr Ile Gly Lys Ala Glu Ala Thr Ala Ala Asn Glu Val Gln Ala Lys
325 330 335
Ser Asn Leu Ser Ile Glu His Lys Thr Pro Ser Gly Ser Cys Phe His
340 345 350
Leu Thr Ser Asp Lys Val Leu Gly Asn Asn Gly Leu Cys Phe Val Tyr
355 360 365
Pro Gly Val Gly Thr Val Tyr Pro Gln Met Phe Ala Gln Leu Pro Arg
370 375 380
Tyr Phe Pro Ala Leu Phe Ala Gln Leu Glu Arg Asp Gly Asp Val Lys
385 390 395 400
Ala Met Leu Gln Ala Asp Ser Ile Tyr Ala Glu Asn Ala Lys Thr Thr
405 410 415
Asp Met Ser Leu Gly Glu Leu Ala Ile Ala Gly Val Gly Ala Ser Tyr
420 425 430
Ile Leu Thr Lys Val Leu Thr Glu His Phe Gly Ile Lys Pro Asn Phe
435 440 445
Ala Met Gly Tyr Ser Met Gly Glu Ala Ser Met Trp Ala Ser Leu Asp
450 455 460
Val Trp Lys Thr Pro His Asn Met Ile Glu Ala Thr Gln Thr Asn Ser
465 470 475 480
Ile Phe Thr Thr Asp Ile Ser Gly Arg Leu Asp Cys Val Arg Gln Ala
485 490 495
Trp Gln Leu Glu His Gly Glu Asp Ile Val Trp Asn Ser Phe Val Val
500 505 510
Arg Ala Ala Pro Ala Asp Ile Glu Lys Val Leu Ala Asp Phe Pro Arg
515 520 525
Ala Tyr Leu Ala Ile Ile Gln Gly Asp Thr Cys Val Leu Ala Gly Cys
530 535 540
Glu Glu Ser Cys Lys Ala Leu Leu Lys Gln Ile Gly Lys Arg Gly Ile
545 550 555 560
Ala Ala Asn Arg Val Thr Ala Met His Thr Lys Pro Ala Met Leu Ile
565 570 575
Arg Asp Asn Val Gln Ala Phe Tyr Gln Gln Pro Leu His Glu Gln Asp
580 585 590
Val Ile Ala Pro Phe Ala Ser Gln Ile Lys Phe Ile Ser Ala Ala Ser
595 600 605
Gln Ser Pro Ile Asn Leu Thr Ser Glu Ala Ile Ala Thr Ser Ile Ala
610 615 620
Asp Thr Phe Cys Gln Pro Leu Asp Phe Thr Gln Leu Val Asn Asn Ala
625 630 635 640
Arg His Leu Gly Ala Ser Leu Phe Val Glu Ile Gly Ala Asp Arg Gln
645 650 655
Thr Thr Thr Leu Ile Asp Lys Ile Ser Arg Thr Ser Glu Met Ala Gln
660 665 670
Thr Cys Gln Ala Ile Ser Val Asn Ala Lys Gly Asp Asp Gln Thr Ala
675 680 685
Leu Leu Lys Cys Ile Ala Gln Leu Ile Thr His Lys Thr Pro Ile Ser
690 695 700
Leu Asp Tyr Leu Thr Glu Thr Leu Ser Ser Leu Leu Thr Thr Thr Leu
705 710 715 720
Ala Ala Glu Lys Arg Ser Asn His His Thr Gly Asn Met Leu Ala Pro
725 730 735
Gln Leu Glu Gly Glu Gln Ser
740
<210> 10
<211> 2020
<212> PRT
<213> Sh. olleyana
<400> 10
Leu Ser Ser Gln Ser Thr Asn Leu Asn Thr Thr Val Pro Lys Ile Ala
1 5 10 15
Ile Val Gly Leu Ala Thr Gln Tyr Pro Asp Ala Asp Thr Pro Ala Lys
20 25 30
Phe Trp Gln Asn Leu Leu Asp Lys Lys Asp Ser Arg Ser Thr Ile Asn
35 40 45
Ser Gln Lys Leu Asn Ala Asn Pro Ala Asp Tyr Gln Gly Val Gln Gly
50 55 60
Glu Ser Asp Arg Phe Tyr Cys Asp Lys Gly Gly Tyr Ile Gln Asn Phe
65 70 75 80
Ser Phe Asp Ala Asn Gly Tyr Arg Ile Pro Ala Glu Gln Phe Ser Gly
85 90 95
Leu Asp Asp Ser Phe Leu Trp Ala Thr Asp Thr Ala Arg Lys Ala Leu
100 105 110
Asn Asp Ala Gly Val Asp Ile Thr Asn Pro Gln Asn Asn Gly Ala Leu
115 120 125
Asn Arg Thr Gly Ile Val Met Gly Thr Leu Ser Phe Pro Thr Ala Lys
130 135 140
Ser Asn Glu Leu Phe Val Pro Ile Tyr His Ser Ala Val Glu Lys Ala
145 150 155 160
Leu Gln Asp Lys Leu Gln Gln Pro Ser Phe Thr Leu Gln Pro Phe Asp
165 170 175
Ser Glu Gly Tyr Ser Gln Gln Thr Thr Ser Ala Ser Leu Ser Asn Gly
180 185 190
Ala Ile Ala His Asn Ala Ser Lys Leu Val Ala Asp Ala Leu Gly Leu
195 200 205
Gly Ala Ala Gln Leu Ser Leu Asp Ala Ala Cys Ala Ser Ser Val Tyr
210 215 220
Ser Leu Lys Leu Ala Cys Asp Tyr Leu His Thr Gly Lys Ala Asp Met
225 230 235 240
Met Leu Ala Gly Ala Val Ser Gly Ala Asp Pro Phe Phe Ile Asn Met
245 250 255
Gly Phe Ser Ile Phe His Ala Tyr Pro Asp His Gly Ile Ser Ala Pro
260 265 270
Phe Asp Ser Asn Ser Lys Gly Leu Phe Ala Gly Glu Gly Ala Gly Val
275 280 285
Leu Val Leu Lys Arg Leu Glu Asp Ala Glu Arg Asp Gly Asp His Ile
290 295 300
Tyr Ala Leu Val Ser Gly Ile Gly Leu Ser Asn Asp Gly Lys Gly Gln
305 310 315 320
Phe Val Leu Ser Pro Asn Ser Asp Gly Gln Val Lys Ala Phe Glu Arg
325 330 335
Ala Tyr Ala Asp Ala Ala Met His Asp Glu Asn Phe Gly Pro Asn Asn
340 345 350
Ile Glu Val Leu Glu Cys His Ala Thr Gly Thr Pro Leu Gly Asp Lys
355 360 365
Val Glu Leu Thr Ser Met Glu Arg Phe Phe Ser Asp Lys Leu Asn Gly
370 375 380
Ser Asn Thr Pro Leu Ile Gly Ser Ala Lys Ser Asn Leu Gly His Leu
385 390 395 400
Leu Thr Ala Ala Gly Met Pro Gly Ile Met Lys Met Ile Phe Ala Met
405 410 415
Arg Gln Gly Val Leu Pro Pro Ser Ile Asn Ile Ser Ala Pro Ile Ala
420 425 430
Ser Pro Ser Glu Met Phe Gly Pro Ala Thr Leu Pro Asn Asp Val Leu
435 440 445
Pro Trp Pro Asp Lys Ala Gly Asn Thr Ala Arg His Ala Gly Val Ser
450 455 460
Val Phe Gly Phe Gly Gly Cys Asn Ala His Leu Leu Val Glu Ser Tyr
465 470 475 480
Phe Ala Lys Ser His Gly Gln Pro Ser Ser Thr Glu Leu Val Lys Pro
485 490 495
Ala Thr Thr Thr Ile Asn Ala Gln Met Pro Met His Ile Thr Gly Met
500 505 510
Ala Ser His Phe Gly Ser Leu Ser Asn Val Asn Asp Phe Ala Asp Ala
515 520 525
Val Asn Asn Asn Gln Thr Ala Phe Thr Ser Leu Pro Ala Lys Arg Trp
530 535 540
Lys Gly Leu Asp Lys His Pro Glu Leu Leu Gln Lys Phe Gly Leu Ser
545 550 555 560
Gln Ala Ala Pro Thr Gly Ala Tyr Ile Asp Gln Phe Asp Phe Asp Phe
565 570 575
Leu Arg Phe Lys Val Pro Pro Asn Glu Asp Asp Arg Leu Ile Ser Gln
580 585 590
Gln Leu Leu Leu Met Lys Val Ala Asp Glu Ala Ile His Asp Ala Lys
595 600 605
Leu Glu Ser Gly Ser Lys Val Ala Val Leu Val Ala Met Glu Thr Glu
610 615 620
Leu Glu Leu His Gln Phe Arg Gly Arg Val Asn Leu His Thr Gln Ile
625 630 635 640
Ala Ala Ser Leu Thr Ala His Gly Val Ser Leu Ser Asp Ser Glu Tyr
645 650 655
Gln Ala Leu Glu Thr Ile Ala Met Asp Ser Val Leu Asp Ala Ala Lys
660 665 670
Leu Asn Gln Tyr Thr Ser Phe Ile Gly Asn Ile Met Ala Ser Arg Ile
675 680 685
Ser Ser Leu Trp Asp Phe Asn Gly Pro Ala Phe Thr Ile Ser Ala Gly
690 695 700
Glu Gln Ser Val Asn Arg Cys Ile Asp Val Ala Gln Asn Leu Leu Ala
705 710 715 720
Met Glu Ser Arg Gln Glu Pro Leu Asp Ala Ala Ile Ile Ala Ala Val
725 730 735
Asp Leu Ser Gly Ser Ile Glu Asn Ile Val Leu Lys Thr Ala Asn Ile
740 745 750
Asn Lys Thr Gly Ser Thr Glu Ala Leu Asn Ile Gly Glu Gly Ala Gly
755 760 765
Ala Ile Val Leu Gln Ala Ala Ala Ile Asp Ser Glu His Cys Asp Leu
770 775 780
Ile His Gln Gly Leu Gly Ala Leu Asp Thr Leu Asp Ser Ala Ser Thr
785 790 795 800
His Ser Tyr Gly Thr Ile Asp Ser Leu Ala Phe Gly His Thr Asp Gln
805 810 815
Leu Ser Thr Ile Ser Asp Asp Val Leu Thr Pro Val Gly Leu Ala Ala
820 825 830
Thr Asp Ile Asp Leu Leu Glu Leu Asn Gln Ala Pro Asp Leu Leu Asn
835 840 845
Ile Asp Asn Ala Gln Met Leu Ser Gln Leu Phe Asn Gln Ser Ser Thr
850 855 860
Ser Lys Ala Gln Ser Cys Ile Gly His Thr Phe Ala Ala Ser Gly Ile
865 870 875 880
Ala Ser Leu Leu His Gly Leu Leu Lys Thr Arg Leu Asn Ala Ser Val
885 890 895
Gln Asn Ala Asn Ser Asp Ser Lys Leu Ser Asn Lys Pro Asn Gln Lys
900 905 910
Ala Ile Ile Ala Thr Leu Ser Glu Asn Gln Cys Ser Gln Leu Leu Ile
915 920 925
Ser Gln Asn Ala Glu Gln Ala Ser Ala Met Ser Thr Arg Ile Asp Thr
930 935 940
Asp Ile Gln Ala Gln Thr Ala Lys Lys Leu Ser Leu Val Lys Gln Val
945 950 955 960
Ser Leu Gly Gly Arg Asp Ile Tyr Gln His Ile Val Asp Ala Pro Leu
965 970 975
Ala Asn Ile Asp Ser Ile Arg Ala Lys Val Ala Lys Leu Asn Pro Val
980 985 990
Ala Pro Thr Thr Val Met Asn Leu His Asp Arg Gly Gln Phe Ile Ala
995 1000 1005
Pro Ala His Ala Asn Ser Ala Pro Met Ser Ala Asn Asn Asn Ser
1010 1015 1020
Met Thr Thr Glu Thr Ser Met Pro Phe Ser Asp Arg Ser Thr Gln
1025 1030 1035
Phe Asn Pro Thr Pro Lys Val Ala Thr Pro Thr Ala Leu Ser Thr
1040 1045 1050
Gln Ala Ala Gln Ala Thr Gln Ser Ala Gln Thr Ser Ser Val Thr
1055 1060 1065
Ser Ser Val Ala Ala Ile Ser Gln Val Pro Pro Thr His Leu Ser
1070 1075 1080
Ala Phe Glu Gln Asn Gln Trp Leu Ala His Gln Ala Gln Leu Ala
1085 1090 1095
Phe Leu Lys Ser Arg Glu Gln Gly Leu Lys Val Ala Asp Ala Leu
1100 1105 1110
Leu Lys Gln Glu Ile Ala Gln Ala Asn Gly Gln Pro Tyr Val Ala
1115 1120 1125
Gln Ser Thr Ala Gln Ala Val Ala Pro Val Gln Ala Ala Asn Val
1130 1135 1140
Leu Ala Gln Pro Ile Ala Ser Ala Ser Ile Leu Arg Pro Asp His
1145 1150 1155
Ala Asn Val Pro Pro Tyr Thr Ala Pro Ile Pro Ala Asn Lys Pro
1160 1165 1170
Cys Ile Trp Asn Tyr Ala Asp Leu Val Glu Tyr Ala Glu Gly Asp
1175 1180 1185
Ile Ala Lys Val Phe Gly Pro Asp Tyr Ala Val Ile Asp Asn Tyr
1190 1195 1200
Ser Arg Arg Val Arg Leu Pro Thr Thr Asp Tyr Leu Leu Val Ser
1205 1210 1215
Arg Val Thr Lys Leu Asp Ala Thr Met Asn Gln Tyr Lys Pro Cys
1220 1225 1230
Ser Met Thr Thr Glu Tyr Asp Ile Pro Glu Asp Ala Pro Tyr Leu
1235 1240 1245
Val Asp Gly Gln Ile Pro Trp Ala Val Ala Val Glu Ser Gly Gln
1250 1255 1260
Cys Asp Leu Met Leu Ile Ser Tyr Leu Gly Ile Asp Phe Glu Asn
1265 1270 1275
Lys Gly Glu Arg Val Tyr Arg Leu Leu Asp Cys Thr Leu Thr Phe
1280 1285 1290
Leu Gly Asp Leu Pro Arg Gly Gly Asp Thr Leu Arg Tyr Asp Ile
1295 1300 1305
Lys Ile Asn Asn Phe Ala Lys Asn Gly Glu Thr Leu Leu Phe Phe
1310 1315 1320
Phe Ser Tyr Glu Cys Phe Val Gly Asp Lys Met Val Leu Lys Met
1325 1330 1335
Asp Gly Gly Cys Ala Gly Phe Phe Thr Asp Gln Glu Leu Asp Asp
1340 1345 1350
Gly Lys Gly Val Ile Tyr Thr Glu Asp Glu Ile Lys Thr Arg Glu
1355 1360 1365
Ala Ala Leu Asn Thr Pro Asn Lys Pro Arg Phe Glu Pro Leu Leu
1370 1375 1380
His Cys Ala Gln Thr Gln Phe Asp Tyr Gly Gln Ile His His Leu
1385 1390 1395
Leu Asn Ala Asp Ile Gly Ser Cys Phe Ala Gly Glu His His Asn
1400 1405 1410
His Gln Gln Ala Ser Gly Lys Gln Asp Ser Leu Cys Phe Ala Ser
1415 1420 1425
Glu Lys Phe Leu Met Ile Glu Gln Val Gly Asn Leu Glu Val His
1430 1435 1440
Gly Gly Ala Trp Gly Leu Gly Phe Ile Glu Gly His Lys Gln Leu
1445 1450 1455
Ala Pro Asp His Trp Tyr Phe Pro Cys His Phe Gln Gly Asp Gln
1460 1465 1470
Val Met Ala Gly Ser Leu Met Ala Glu Gly Cys Gly Gln Leu Leu
1475 1480 1485
Gln Phe Phe Met Leu His Ile Gly Met His Thr Leu Val Glu Asn
1490 1495 1500
Gly Arg Phe Gln Pro Leu Glu Asn Ala Ser Gln Lys Val Arg Cys
1505 1510 1515
Arg Gly Gln Val Leu Pro Gln His Gly Glu Leu Thr Tyr Arg Met
1520 1525 1530
Glu Val Thr Glu Ile Gly Thr His Pro Arg Pro Tyr Ala Lys Ala
1535 1540 1545
Asn Ile Glu Ile Leu Leu Asn Gly Lys Ala Val Val Asp Phe Gln
1550 1555 1560
Asn Leu Gly Val Met Ile Lys Glu Glu Gly Glu Cys Thr Arg Tyr
1565 1570 1575
Thr Ala Asp Ser Thr Glu Thr His Thr Thr Ser Gly Thr Val Gln
1580 1585 1590
Lys Asn Asn Ser His Asn Thr Pro Ala Ser Leu Asn Ala Pro Leu
1595 1600 1605
Met Ala Gln Val Pro Asp Leu Ser Glu Pro Ala Asn Lys Gly Val
1610 1615 1620
Ile Pro Leu Gln His Val Glu Ala Pro Met Leu Pro Asp Tyr Pro
1625 1630 1635
Asn Arg Thr Pro Asp Thr Leu Pro Phe Thr Ala Tyr His Met Phe
1640 1645 1650
Glu Phe Ala Thr Gly Asp Ile Glu Asn Cys Phe Gly Pro Asp Phe
1655 1660 1665
Ser Ile Tyr Arg Gly Phe Ile Pro Pro Arg Thr Pro Cys Gly Asp
1670 1675 1680
Leu Gln Leu Thr Thr Arg Val Val Asp Ile Gln Gly Lys Arg Gly
1685 1690 1695
Glu Leu Lys Lys Pro Ser Ser Cys Ile Ala Glu Tyr Glu Val Pro
1700 1705 1710
Thr Asp Ala Trp Tyr Phe Ala Lys Asn Ser His Ala Ser Val Met
1715 1720 1725
Pro Tyr Ser Val Leu Met Glu Ile Ser Leu Gln Pro Asn Gly Phe
1730 1735 1740
Ile Ser Gly Tyr Met Gly Thr Thr Leu Gly Phe Pro Gly Gln Glu
1745 1750 1755
Leu Phe Phe Arg Asn Leu Asp Gly Ser Gly Glu Leu Leu Cys Asp
1760 1765 1770
Val Asp Leu Arg Gly Lys Thr Ile Val Asn Asp Ser Lys Leu Leu
1775 1780 1785
Ser Thr Val Ile Ala Gly Ser Asn Ile Ile Gln Ser Phe Ser Phe
1790 1795 1800
Asp Leu Ser Val Asp Gly Glu Pro Phe Tyr Thr Gly Ser Ala Val
1805 1810 1815
Phe Gly Tyr Phe Lys Gly Asp Ala Leu Lys Asn Gln Leu Gly Ile
1820 1825 1830
Asp Asn Gly Arg Ile Thr Gln Pro Trp His Val Glu Asn Asn Val
1835 1840 1845
Ala Ala Asp Ile Thr Val Asp Leu Leu Asp Lys Gln Ser Arg Val
1850 1855 1860
Phe His Ala Pro Ala Asn Gln Pro His Tyr Arg Leu Ala Gly Gly
1865 1870 1875
Gln Leu Asn Phe Ile Asp Lys Ala Glu Ile Val Asp Lys Gly Gly
1880 1885 1890
Lys Asn Gly Leu Gly Tyr Leu Ser Ala Ser Arg Thr Ile Asp Pro
1895 1900 1905
Ser Asp Trp Phe Phe Gln Phe His Phe His Gln Asp Pro Val Met
1910 1915 1920
Pro Gly Ser Leu Gly Val Glu Ala Ile Ile Glu Leu Met Gln Thr
1925 1930 1935
Tyr Ala Ile Ser Lys Asp Leu Gly Lys Gly Phe Thr Asn Pro Lys
1940 1945 1950
Phe Gly Gln Ile Leu Ser Asp Ile Lys Trp Lys Tyr Arg Gly Gln
1955 1960 1965
Ile Asn Pro Leu Asn Lys Gln Met Ser Leu Asp Val His Ile Ser
1970 1975 1980
Ala Val Lys Asp Glu Asn Gly Lys Arg Ile Ile Val Gly Asp Ala
1985 1990 1995
Asn Leu Ser Lys Asp Gly Leu Arg Ile Tyr Glu Val Lys Asp Ile
2000 2005 2010
Ala Ile Cys Ile Glu Glu Ala
2015 2020
<210> 11
<211> 542
<212> PRT
<213> Sh. olleyana
<400> 11
Met Thr Ile Ser Thr Gln Asn Glu Lys Leu Ser Pro Trp Pro Trp Gln
1 5 10 15
Val Ala Pro Ser Asp Ala Ser Phe Glu Asn Ala Ala Ile Gly Lys Lys
20 25 30
Leu Lys Glu Leu Ser Gln Ala Cys Tyr Leu Ile Asn His Pro Glu Lys
35 40 45
Gly Leu Gly Ile Ser Gln Asn Ala Gln Val Met Thr Glu Ser Met Asn
50 55 60
Ser Gln Gln Asp Leu Pro Val Ser Ala Phe Ala Pro Ala Leu Gly Thr
65 70 75 80
Gln Ser Leu Gly Asp Ser Asn Phe Arg Arg Val His Gly Val Lys Tyr
85 90 95
Ala Tyr Tyr Ala Gly Ala Met Ala Asn Gly Ile Ser Ser Glu Glu Leu
100 105 110
Val Ile Ala Leu Gly Gln Ala Gly Ile Leu Cys Ser Phe Gly Ala Ala
115 120 125
Gly Leu Ile Pro Ser Arg Val Glu Gln Ala Ile Asn Arg Ile Gln Thr
130 135 140
Ala Leu Pro Asn Gly Pro Tyr Met Phe Asn Leu Ile His Ser Pro Ser
145 150 155 160
Glu Pro Ala Leu Glu Arg Gly Ser Val Glu Leu Phe Leu Lys His Lys
165 170 175
Val Arg Thr Val Glu Ala Ser Ala Phe Leu Gly Leu Thr Pro Gln Ile
180 185 190
Val Tyr Tyr Arg Ala Ala Gly Leu Ser Arg Asp Ala Gln Gly Glu Val
195 200 205
Val Ile Ala Asn Lys Val Ile Ala Lys Val Ser Arg Thr Glu Val Ala
210 215 220
Ser Lys Phe Met Gln Pro Ala Pro Ala Lys Met Leu Gln Lys Leu Val
225 230 235 240
Asp Glu Gly Leu Ile Thr Pro Glu Gln Met Glu Leu Ala Gln Leu Val
245 250 255
Pro Met Ala Asp Asp Val Thr Ala Glu Ala Asp Ser Gly Gly His Thr
260 265 270
Asp Asn Arg Pro Leu Val Thr Leu Leu Pro Thr Ile Leu Ala Leu Lys
275 280 285
Asp Lys Ile Gln Ala Glu Tyr Gln Tyr Lys Thr Pro Ile Arg Val Gly
290 295 300
Cys Gly Gly Gly Val Gly Thr Pro Asp Ala Ala Leu Ala Thr Phe Asn
305 310 315 320
Met Gly Ala Ala Tyr Ile Val Thr Gly Ser Ile Asn Gln Ala Cys Val
325 330 335
Glu Ala Gly Ala Ser Glu His Thr Arg Lys Leu Leu Ala Thr Thr Glu
340 345 350
Met Ala Asp Val Thr Met Ala Pro Ala Ala Asp Met Phe Glu Met Gly
355 360 365
Val Lys Leu Gln Val Val Lys Arg Gly Thr Leu Phe Pro Met Arg Ala
370 375 380
Asn Lys Leu Tyr Glu Ile Tyr Thr Arg Tyr Glu Ser Ile Glu Ala Ile
385 390 395 400
Pro Ala Glu Glu Arg Glu Lys Leu Glu Lys Gln Val Phe Arg Ser Thr
405 410 415
Leu Asp Asp Ile Trp Ala Gly Thr Val Ala His Phe Asn Glu Arg Asp
420 425 430
Pro Lys Gln Ile Glu Arg Ala Glu Gly Asn Pro Lys Arg Lys Met Ala
435 440 445
Leu Ile Phe Arg Trp Tyr Leu Gly Leu Ser Ser Arg Trp Ser Asn Ser
450 455 460
Gly Glu Val Gly Arg Glu Met Asp Tyr Gln Ile Trp Ala Gly Pro Ala
465 470 475 480
Leu Gly Ala Phe Asn Glu Trp Ala Lys Gly Ser Tyr Leu Asp Asp Tyr
485 490 495
Thr Gln Arg Asn Ala Val Asp Leu Ala Lys His Leu Met His Gly Ala
500 505 510
Ala Tyr Gln Ala Arg Val Asn Leu Leu Thr Ala Gln Gly Val Ala Leu
515 520 525
Pro Val Glu Leu Gln Arg Trp Ser Pro Leu Asp Gln Val Lys
530 535 540
<210> 12
<211> 290
<212> PRT
<213> Sh. olleyana
<400> 12
Leu Lys Pro Pro Thr Val Ile Gln Leu Phe Phe Cys Pro Leu Asn Thr
1 5 10 15
Asp Leu Leu Asp Glu Ser Thr Ala Ser Ile Val Arg Ser Trp Leu Pro
20 25 30
Glu Asp Glu Val Lys Lys Val Asp Arg Phe Ile Gln Gln Ser Ser Arg
35 40 45
Glu Gln Gly Leu Met Val Arg Gly Tyr Leu Arg Ser Val Leu Ser Arg
50 55 60
Phe Ala Ser Val Glu Pro Gln Gln Trp Gln Phe Glu Tyr Gly Glu Lys
65 70 75 80
Gly Lys Pro Arg Leu Thr Ala Glu Gln Phe Ala Gln Thr Gly Leu Gln
85 90 95
Phe Asn Leu Ser His Ser Gly Asp Trp Leu Leu Ile Gly Val Ala Asn
100 105 110
Thr Tyr Gly Thr Ala Gln Gln Gln Thr Asp Ile Glu Leu Gly Val Asp
115 120 125
Ile Glu Arg Arg Arg Glu Thr Thr Asn Ile His Ser Ile Leu Asn His
130 135 140
Tyr Phe Ser Lys Pro Glu Glu Ser Ala Leu Leu Ala Leu Ala Glu Asp
145 150 155 160
Lys His Arg Glu Arg Phe Phe Asp Leu Trp Ala Leu Lys Glu Ser Tyr
165 170 175
Ile Lys Ala Lys Gly Leu Gly Leu Ala Leu Ser Leu Lys Ser Phe Ala
180 185 190
Phe Asp Leu Ser Ala Ser Ser Val Gly Glu Leu Gln Val Asn Ser Glu
195 200 205
Thr Ile Thr Ile Gln Gln Asn Val Lys Leu Ser Leu Leu Lys Ala Ser
210 215 220
Asp Ser Asp Gly Leu Leu Glu Asp Phe Val Ile Ala Pro Gln Trp His
225 230 235 240
Cys Tyr Leu Gly Lys Leu Asp Asp Leu Tyr Arg Phe Ala Val Ser Val
245 250 255
Gly Arg Ala Ser Thr Asn Ser Asp Glu Leu Pro Pro Glu Leu Lys Ala
260 265 270
Lys Lys Ile Ser Trp Leu Glu Val Val Asn His Ala Phe Lys Pro Thr
275 280 285
Asp Arg
290
<210> 13
<211> 8730
<212> DNA
<213> Schizochytrium sp.
<400> 13
atggcggccc gtctgcagga gcaaaaggga ggcgagatgg atacccgcat tgccatcatc 60
ggcatgtcgg ccatcctccc ctgcggcacg accgtgcgcg agtcgtggga gaccatccgc 120
gccggcatcg actgcctgtc ggatctcccc gaggaccgcg tcgacgtgac ggcgtacttt 180
gaccccgtca agaccaccaa ggacaagatc tactgcaagc gcggtggctt cattcccgag 240
tacgactttg acgcccgcga gttcggactc aacatgttcc agatggagga ctcggacgca 300
aaccagacca tctcgcttct caaggtcaag gaggccctcc aggacgccgg catcgacgcc 360
ctcggcaagg aaaagaagaa catcggctgc gtgctcggca ttggcggcgg ccaaaagtcc 420
agccacgagt tctactcgcg ccttaattat gttgtcgtgg agaaggtcct ccgcaagatg 480
ggcatgcccg aggaggacgt caaggtcgcc gtcgaaaagt acaaggccaa cttccccgag 540
tggcgcctcg actccttccc tggcttcctc ggcaacgtca ccgccggtcg ctgcaccaac 600
accttcaacc tcgacggcat gaactgcgtt gtcgacgccg catgcgcctc gtccctcatc 660
gccgtcaagg tcgccatcga cgagctgctc tacggtgact gcgacatgat ggtcaccggt 720
gccacctgca cggataactc catcggcatg tacatggcct tctccaagac ccccgtgttc 780
tccacggacc ccagcgtgcg cgcctacgac gaaaagacaa agggcatgct catcggcgag 840
ggctccgcca tgctcgtcct caagcgctac gccgacgccg tccgcgacgg cgatgagatc 900
cacgctgtta ttcgcggctg cgcctcctcc agtgatggca aggccgccgg catctacacg 960
cccaccattt cgggccagga ggaggccctc cgccgcgcct acaaccgcgc ctgtgtcgac 1020
ccggccaccg tcactctcgt cgagggtcac ggcaccggta ctcccgttgg cgaccgcatc 1080
gagctcaccg ccttgcgcaa cctctttgac aaggcctacg gcgagggcaa caccgaaaag 1140
gtcgctgtgg gcagcatcaa gtccagcatc ggccatctca aggccgtcgc cggtctcgcc 1200
ggtatgatca aggtcatcat ggcgctcaag cacaagactc tcccgggcac catcaacgtc 1260
gacaacccac ccaacctcta cgacaacacg cccatcaacg agtcctcgct ctacattaac 1320
accatgaacc gcccctggtt cccgccccct ggtgtgcccc gccgcgccgg catttcgagc 1380
tttggctttg gtggcgccaa ctaccacgcc gtcctcgagg aggccgagcc cgagcacacg 1440
accgcgtacc gcctcaacaa gcgcccgcag cccgtgctca tgatggccgc cacgcccgcg 1500
gccctccagt cgctctgcga ggcccagctc aaggagttcg aggccgccat caaggagaac 1560
gagaccgtca agaacaccgc ctacatcaag tgcgtcaagt tcggcgagca gttcaaattc 1620
cctggctcca tcccggccac aaacgcgcgc ctcggcttcc tcgtcaagga tgctgaggat 1680
gcctgctcca ccctccgtgc catctgcgcc caattcgcca aggatgtcac caaggaggcc 1740
tggcgcctcc cccgcgaggg cgtcagcttc cgcgccaagg gcatcgccac caacggcgct 1800
gtcgccgcgc tcttctccgg ccagggcgcg cagtacacgc acatgtttag cgaggtggcc 1860
atgaactggc cccagttccg ccagagcatt gccgccatgg acgccgccca gtccaaggtc 1920
gctggaagcg acaaggactt tgagcgcgtc tcccaggtcc tctacccgcg caagccgtac 1980
gagcgtgagc ccgagcagaa ccccaagaag atctccctca ccgcctactc gcagccctcg 2040
accctggcct gcgctctcgg tgcctttgag atcttcaagg aggccggctt caccccggac 2100
tttgccgccg gccattcgct cggtgagttc gccgccctct acgccgcggg ctgcgtcgac 2160
cgcgacgagc tctttgagct tgtctgccgc cgcgcccgca tcatgggcgg caaggacgca 2220
ccggccaccc ccaagggatg catggccgcc gtcattggcc ccaacgccga gaacatcaag 2280
gtccaggccg ccaacgtctg gctcggcaac tccaactcgc cttcgcagac cgtcatcacc 2340
ggctccgtcg aaggtatcca ggccgagagc gcccgcctcc agaaggaggg cttccgcgtc 2400
gtgcctcttg cctgcgagag cgccttccac tcgccccaga tggagaacgc ctcgtcggcc 2460
ttcaaggacg tcatctccaa ggtctccttc cgcaccccca aggccgagac caagctcttc 2520
agcaacgtct ctggcgagac ctaccccacg gacgcccgcg agatgcttac gcagcacatg 2580
accagcagcg tcaagttcct cacccaggtc cgcaacatgc accaggccgg tgcgcgcatc 2640
tttgtcgagt tcggacccaa gcaggtgctc tccaagcttg tctccgagac cctcaaggat 2700
gacccctcgg ttgtcaccgt ctctgtcaac ccggcctcgg gcacggattc ggacatccag 2760
ctccgcgacg cggccgtcca gctcgttgtc gctggcgtca accttcaggg ctttgacaag 2820
tgggacgccc ccgatgccac ccgcatgcag gccatcaaga agaagcgcac taccctccgc 2880
ctttcggccg ccacctacgt ctcggacaag accaagaagg tccgcgacgc cgccatgaac 2940
gatggccgct gcgtcaccta cctcaagggc gccgcaccgc tcatcaaggc cccggagccc 3000
gttgtcgacg aggccgccaa gcgcgaggcc gagcgtctcc agaaggagct tcaggatgcc 3060
cagcgccagc tcgacgacgc caagcgcgcc gccgccgagg ccaactccaa gctcgccgct 3120
gccaaggagg aggccaagac cgccgctgct tcggccaagc ccgcagttga cactgctgtt 3180
gtcgaaaagc atcgtgccat cctcaagtcc atgctcgcgg agctcgatgg ctacggatcg 3240
gtcgacgctt cttccctcca gcagcagcag cagcagcaga cggcccccgc cccggtcaag 3300
gctgctgcgc ctgccgcccc cgttgcctcg gcccctgccc cggctgtctc gaacgagctt 3360
cttgagaagg ccgagactgt cgtcatggag gtcctcgccg ccaagaccgg ctacgagacc 3420
gacatgatcg aggctgacat ggagctcgag accgagctcg gcattgactc catcaagcgt 3480
gtcgagatcc tctccgaggt ccaggccatg ctcaatgtcg aggccaagga tgtcgatgcc 3540
ctcagccgca ctcgcactgt tggtgaggtt gtcaacgcca tgaaggccga gatcgctggc 3600
agctctgccc cggcgcctgc tgccgctgct ccggctccgg ccaaggctgc ccctgccgcc 3660
gctgcgcctg ctgtctcgaa cgagcttctc gagaaggccg agaccgtcgt catggaggtc 3720
ctcgccgcca agactggcta cgagactgac atgatcgagt ccgacatgga gctcgagact 3780
gagctcggca ttgactccat caagcgtgtc gagatcctct ccgaggttca ggccatgctc 3840
aacgtcgagg ccaaggacgt cgacgctctc agccgcactc gcactgtggg tgaggtcgtc 3900
aacgccatga aggctgagat cgctggtggc tctgccccgg cgcctgccgc cgctgcccca 3960
ggtccggctg ctgccgcccc tgcgcctgcc gccgccgccc ctgctgtctc gaacgagctt 4020
cttgagaagg ccgagaccgt cgtcatggag gtcctcgccg ccaagactgg ctacgagact 4080
gacatgatcg agtccgacat ggagctcgag accgagctcg gcattgactc catcaagcgt 4140
gtcgagattc tctccgaggt ccaggccatg ctcaacgtcg aggccaagga cgtcgacgct 4200
ctcagccgca cccgcactgt tggcgaggtc gtcgatgcca tgaaggccga gatcgctggt 4260
ggctctgccc cggcgcctgc cgccgctgct cctgctccgg ctgctgccgc ccctgcgcct 4320
gccgcccctg cgcctgctgt ctcgagcgag cttctcgaga aggccgagac tgtcgtcatg 4380
gaggtcctcg ccgccaagac tggctacgag actgacatga tcgagtccga catggagctc 4440
gagaccgagc tcggcattga ctccatcaag cgtgtcgaga ttctctccga ggtccaggcc 4500
atgctcaacg tcgaggccaa ggacgtcgac gctctcagcc gcacccgcac tgttggcgag 4560
gtcgtcgatg ccatgaaggc cgagatcgct ggtggctctg ccccggcgcc tgccgccgct 4620
gctcctgctc cggctgctgc cgcccctgcg cctgccgccc ctgcgcctgc cgcccctgcg 4680
cctgctgtct cgagcgagct tctcgagaag gccgagactg tcgtcatgga ggtcctcgcc 4740
gccaagactg gctacgagac tgacatgatt gagtccgaca tggagctcga gaccgagctc 4800
ggcattgact ccatcaagcg tgtcgagatt ctctccgagg ttcaggccat gctcaacgtc 4860
gaggccaagg acgtcgacgc tctcagccgc actcgcactg ttggtgaggt cgtcgatgcc 4920
atgaaggctg agatcgctgg cagctccgcc tcggcgcctg ccgccgctgc tcctgctccg 4980
gctgctgccg ctcctgcgcc cgctgccgcc gcccctgctg tctcgaacga gcttctcgag 5040
aaagccgaga ctgtcgtcat ggaggtcctc gccgccaaga ctggctacga gactgacatg 5100
atcgagtccg acatggagct cgagactgag ctcggcattg actccatcaa gcgtgtcgag 5160
atcctctccg aggttcaggc catgctcaac gtcgaggcca aggacgtcga tgccctcagc 5220
cgcacccgca ctgttggcga ggttgtcgat gccatgaagg ccgagatcgc tggtggctct 5280
gccccggcgc ctgccgccgc tgcccctgct ccggctgccg ccgcccctgc tgtctcgaac 5340
gagcttctcg agaaggccga gactgtcgtc atggaggtcc tcgccgccaa gactggctac 5400
gagaccgaca tgatcgagtc cgacatggag ctcgagaccg agctcggcat tgactccatc 5460
aagcgtgtcg agattctctc cgaggttcag gccatgctca acgtcgaggc caaggacgtc 5520
gatgctctca gccgcactcg cactgttggc gaggtcgtcg atgccatgaa ggctgagatc 5580
gccggcagct ccgccccggc gcctgccgcc gctgctcctg ctccggctgc tgccgctcct 5640
gcgcccgctg ccgctgcccc tgctgtctcg agcgagcttc tcgagaaggc cgagaccgtc 5700
gtcatggagg tcctcgccgc caagactggc tacgagactg acatgattga gtccgacatg 5760
gagctcgaga ctgagctcgg cattgactcc atcaagcgtg tcgagatcct ctccgaggtt 5820
caggccatgc tcaacgtcga ggccaaggac gtcgatgccc tcagccgcac ccgcactgtt 5880
ggcgaggttg tcgatgccat gaaggccgag atcgctggtg gctctgcccc ggcgcctgcc 5940
gccgctgccc ctgctccggc tgccgccgcc cctgctgtct cgaacgagct tcttgagaag 6000
gccgagaccg tcgtcatgga ggtcctcgcc gccaagactg gctacgagac cgacatgatc 6060
gagtccgaca tggagctcga gaccgagctc ggcattgact ccatcaagcg tgtcgagatt 6120
ctctccgagg ttcaggccat gctcaacgtc gaggccaagg acgtcgacgc tctcagccgc 6180
actcgcactg ttggcgaggt cgtcgatgcc atgaaggctg agatcgctgg tggctctgcc 6240
ccggcgcctg ccgccgctgc tcctgcctcg gctggcgccg cgcctgcggt caagattgac 6300
tcggtccacg gcgctgactg tgatgatctt tccctgatgc acgccaaggt ggttgacatc 6360
cgccgcccgg acgagctcat cctggagcgc cccgagaacc gccccgttct cgttgtcgat 6420
gacggcagcg agctcaccct cgccctggtc cgcgtcctcg gcgcctgcgc cgttgtcctg 6480
acctttgagg gtctccagct cgctcagcgc gctggtgccg ctgccatccg ccacgtgctc 6540
gccaaggatc tttccgcgga gagcgccgag aaggccatca aggaggccga gcagcgcttt 6600
ggcgctctcg gcggcttcat ctcgcagcag gcggagcgct tcgagcccgc cgaaatcctc 6660
ggcttcacgc tcatgtgcgc caagttcgcc aaggcttccc tctgcacggc tgtggctggc 6720
ggccgcccgg cctttatcgg tgtggcgcgc cttgacggcc gcctcggatt cacttcgcag 6780
ggcacttctg acgcgctcaa gcgtgcccag cgtggtgcca tctttggcct ctgcaagacc 6840
atcggcctcg agtggtccga gtctgacgtc ttttcccgcg gcgtggacat tgctcagggc 6900
atgcaccccg aggatgccgc cgtggcgatt gtgcgcgaga tggcgtgcgc tgacattcgc 6960
attcgcgagg tcggcattgg cgcaaaccag cagcgctgca cgatccgtgc cgccaagctc 7020
gagaccggca acccgcagcg ccagatcgcc aaggacgacg tgctgctcgt ttctggcggc 7080
gctcgcggca tcacgcctct ttgcatccgg gagatcacgc gccagatcgc gggcggcaag 7140
tacattctgc ttggccgcag caaggtctct gcgagcgaac cggcatggtg cgctggcatc 7200
actgacgaga aggctgtgca aaaggctgct acccaggagc tcaagcgcgc ctttagcgct 7260
ggcgagggcc ccaagcccac gccccgcgct gtcactaagc ttgtgggctc tgttcttggc 7320
gctcgcgagg tgcgcagctc tattgctgcg attgaagcgc tcggcggcaa ggccatctac 7380
tcgtcgtgcg acgtgaactc tgccgccgac gtggccaagg ccgtgcgcga tgccgagtcc 7440
cagctcggtg cccgcgtctc gggcatcgtt catgcctcgg gcgtgctccg cgaccgtctc 7500
atcgagaaga agctccccga cgagttcgac gccgtctttg gcaccaaggt caccggtctc 7560
gagaacctcc tcgccgccgt cgaccgcgcc aacctcaagc acatggtcct cttcagctcg 7620
ctcgccggct tccacggcaa cgtcggccag tctgactacg ccatggccaa cgaggccctt 7680
aacaagatgg gcctcgagct cgccaaggac gtctcggtca agtcgatctg cttcggtccc 7740
tgggacggtg gcatggtgac gccgcagctc aagaagcagt tccaggagat gggcgtgcag 7800
atcatccccc gcgagggcgg cgctgatacc gtggcgcgca tcgtgctcgg ctcctcgccg 7860
gctgagatcc ttgtcggcaa ctggcgcacc ccgtccaaga aggtcggctc ggacaccatc 7920
accctgcacc gcaagatttc cgccaagtcc aaccccttcc tcgaggacca cgtcatccag 7980
ggccgccgcg tgctgcccat gacgctggcc attggctcgc tcgcggagac ctgcctcggc 8040
ctcttccccg gctactcgct ctgggccatt gacgacgccc agctcttcaa gggtgtcact 8100
gtcgacggcg acgtcaactg cgaggtgacc ctcaccccgt cgacggcgcc ctcgggccgc 8160
gtcaacgtcc aggccacgct caagaccttt tccagcggca agctggtccc ggcctaccgc 8220
gccgtcatcg tgctctccaa ccagggcgcg cccccggcca acgccaccat gcagccgccc 8280
tcgctcgatg ccgatccggc gctccagggc tccgtctacg acggcaagac cctcttccac 8340
ggcccggcct tccgcggcat cgatgacgtg ctctcgtgca ccaagagcca gcttgtggcc 8400
aagtgcagcg ctgtccccgg ctccgacgcc gctcgcggcg agtttgccac ggacactgac 8460
gcccatgacc ccttcgtgaa cgacctggcc tttcaggcca tgctcgtctg ggtgcgccgc 8520
acgctcggcc aggctgcgct ccccaactcg atccagcgca tcgtccagca ccgcccggtc 8580
ccgcaggaca agcccttcta cattaccctc cgctccaacc agtcgggcgg tcactcccag 8640
cacaagcacg cccttcagtt ccacaacgag cagggcgatc tcttcattga tgtccaggct 8700
tcggtcatcg ccacggacag ccttgccttc 8730
<210> 14
<211> 2910
<212> PRT
<213> Schizochytrium sp.
<400> 14
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1 5 10 15
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
20 25 30
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
35 40 45
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
50 55 60
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65 70 75 80
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
85 90 95
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
100 105 110
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
115 120 125
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
130 135 140
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145 150 155 160
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
165 170 175
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
180 185 190
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
195 200 205
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
210 215 220
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225 230 235 240
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
245 250 255
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
260 265 270
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
275 280 285
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
290 295 300
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305 310 315 320
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
325 330 335
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
340 345 350
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
355 360 365
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
370 375 380
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385 390 395 400
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
405 410 415
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
420 425 430
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
435 440 445
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
450 455 460
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465 470 475 480
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
485 490 495
Ala Thr Pro Ala Ala Leu Gln Ser Leu Cys Glu Ala Gln Leu Lys Glu
500 505 510
Phe Glu Ala Ala Ile Lys Glu Asn Glu Thr Val Lys Asn Thr Ala Tyr
515 520 525
Ile Lys Cys Val Lys Phe Gly Glu Gln Phe Lys Phe Pro Gly Ser Ile
530 535 540
Pro Ala Thr Asn Ala Arg Leu Gly Phe Leu Val Lys Asp Ala Glu Asp
545 550 555 560
Ala Cys Ser Thr Leu Arg Ala Ile Cys Ala Gln Phe Ala Lys Asp Val
565 570 575
Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe Arg Ala
580 585 590
Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser Gly Gln
595 600 605
Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn Trp Pro
610 615 620
Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser Lys Val
625 630 635 640
Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu Tyr Pro
645 650 655
Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asn Pro Lys Lys Ile Ser
660 665 670
Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu Gly Ala
675 680 685
Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala Ala Gly
690 695 700
His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys Val Asp
705 710 715 720
Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile Met Gly
725 730 735
Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala Val Ile
740 745 750
Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val Trp Leu
755 760 765
Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser Val Glu
770 775 780
Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe Arg Val
785 790 795 800
Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met Glu Asn
805 810 815
Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe Arg Thr
820 825 830
Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu Thr Tyr
835 840 845
Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser Ser Val
850 855 860
Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala Arg Ile
865 870 875 880
Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val Ser Glu
885 890 895
Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn Pro Ala
900 905 910
Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val Gln Leu
915 920 925
Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp Ala Pro
930 935 940
Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr Leu Arg
945 950 955 960
Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val Arg Asp
965 970 975
Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly Ala Ala
980 985 990
Pro Leu Ile Lys Ala Pro Glu Pro Val Val Asp Glu Ala Ala Lys Arg
995 1000 1005
Glu Ala Glu Arg Leu Gln Lys Glu Leu Gln Asp Ala Gln Arg Gln
1010 1015 1020
Leu Asp Asp Ala Lys Arg Ala Ala Ala Glu Ala Asn Ser Lys Leu
1025 1030 1035
Ala Ala Ala Lys Glu Glu Ala Lys Thr Ala Ala Ala Ser Ala Lys
1040 1045 1050
Pro Ala Val Asp Thr Ala Val Val Glu Lys His Arg Ala Ile Leu
1055 1060 1065
Lys Ser Met Leu Ala Glu Leu Asp Gly Tyr Gly Ser Val Asp Ala
1070 1075 1080
Ser Ser Leu Gln Gln Gln Gln Gln Gln Gln Thr Ala Pro Ala Pro
1085 1090 1095
Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser Ala Pro Ala
1100 1105 1110
Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val
1115 1120 1125
Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile
1130 1135 1140
Glu Ala Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile
1145 1150 1155
Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val
1160 1165 1170
Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly
1175 1180 1185
Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala
1190 1195 1200
Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Lys Ala Ala Pro
1205 1210 1215
Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala
1220 1225 1230
Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu
1235 1240 1245
Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly
1250 1255 1260
Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala
1265 1270 1275
Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr
1280 1285 1290
Arg Thr Val Gly Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala
1295 1300 1305
Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Gly Pro Ala
1310 1315 1320
Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn
1325 1330 1335
Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala
1340 1345 1350
Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu
1355 1360 1365
Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile
1370 1375 1380
Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
1385 1390 1395
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala
1400 1405 1410
Met Lys Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala
1415 1420 1425
Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Pro
1430 1435 1440
Ala Pro Ala Val Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val
1445 1450 1455
Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met
1460 1465 1470
Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser
1475 1480 1485
Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn
1490 1495 1500
Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val
1505 1510 1515
Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Gly Ser
1520 1525 1530
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala
1535 1540 1545
Pro Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Pro Ala Val
1550 1555 1560
Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val
1565 1570 1575
Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp
1580 1585 1590
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val
1595 1600 1605
Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys
1610 1615 1620
Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val
1625 1630 1635
Asp Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala Ser Ala Pro
1640 1645 1650
Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala
1655 1660 1665
Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu
1670 1675 1680
Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr
1685 1690 1695
Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile
1700 1705 1710
Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met
1715 1720 1725
Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg
1730 1735 1740
Thr Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly
1745 1750 1755
Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala
1760 1765 1770
Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr
1775 1780 1785
Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp
1790 1795 1800
Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp
1805 1810 1815
Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu
1820 1825 1830
Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr
1835 1840 1845
Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Ser
1850 1855 1860
Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala
1865 1870 1875
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Ser Glu Leu
1880 1885 1890
Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys
1895 1900 1905
Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu
1910 1915 1920
Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser
1925 1930 1935
Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala
1940 1945 1950
Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys
1955 1960 1965
Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala
1970 1975 1980
Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu
1985 1990 1995
Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr
2000 2005 2010
Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr
2015 2020 2025
Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu
2030 2035 2040
Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu
2045 2050 2055
Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys Ala
2060 2065 2070
Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro
2075 2080 2085
Ala Ser Ala Gly Ala Ala Pro Ala Val Lys Ile Asp Ser Val His
2090 2095 2100
Gly Ala Asp Cys Asp Asp Leu Ser Leu Met His Ala Lys Val Val
2105 2110 2115
Asp Ile Arg Arg Pro Asp Glu Leu Ile Leu Glu Arg Pro Glu Asn
2120 2125 2130
Arg Pro Val Leu Val Val Asp Asp Gly Ser Glu Leu Thr Leu Ala
2135 2140 2145
Leu Val Arg Val Leu Gly Ala Cys Ala Val Val Leu Thr Phe Glu
2150 2155 2160
Gly Leu Gln Leu Ala Gln Arg Ala Gly Ala Ala Ala Ile Arg His
2165 2170 2175
Val Leu Ala Lys Asp Leu Ser Ala Glu Ser Ala Glu Lys Ala Ile
2180 2185 2190
Lys Glu Ala Glu Gln Arg Phe Gly Ala Leu Gly Gly Phe Ile Ser
2195 2200 2205
Gln Gln Ala Glu Arg Phe Glu Pro Ala Glu Ile Leu Gly Phe Thr
2210 2215 2220
Leu Met Cys Ala Lys Phe Ala Lys Ala Ser Leu Cys Thr Ala Val
2225 2230 2235
Ala Gly Gly Arg Pro Ala Phe Ile Gly Val Ala Arg Leu Asp Gly
2240 2245 2250
Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser Asp Ala Leu Lys Arg
2255 2260 2265
Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys Thr Ile Gly Leu
2270 2275 2280
Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val Asp Ile Ala
2285 2290 2295
Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val Arg Glu
2300 2305 2310
Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly Ala
2315 2320 2325
Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
2330 2335 2340
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser
2345 2350 2355
Gly Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr
2360 2365 2370
Arg Gln Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys
2375 2380 2385
Val Ser Ala Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu
2390 2395 2400
Lys Ala Val Gln Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe
2405 2410 2415
Ser Ala Gly Glu Gly Pro Lys Pro Thr Pro Arg Ala Val Thr Lys
2420 2425 2430
Leu Val Gly Ser Val Leu Gly Ala Arg Glu Val Arg Ser Ser Ile
2435 2440 2445
Ala Ala Ile Glu Ala Leu Gly Gly Lys Ala Ile Tyr Ser Ser Cys
2450 2455 2460
Asp Val Asn Ser Ala Ala Asp Val Ala Lys Ala Val Arg Asp Ala
2465 2470 2475
Glu Ser Gln Leu Gly Ala Arg Val Ser Gly Ile Val His Ala Ser
2480 2485 2490
Gly Val Leu Arg Asp Arg Leu Ile Glu Lys Lys Leu Pro Asp Glu
2495 2500 2505
Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly Leu Glu Asn Leu
2510 2515 2520
Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met Val Leu Phe
2525 2530 2535
Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser Asp Tyr
2540 2545 2550
Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu Ala
2555 2560 2565
Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
2570 2575 2580
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly
2585 2590 2595
Val Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg
2600 2605 2610
Ile Val Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp
2615 2620 2625
Arg Thr Pro Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His
2630 2635 2640
Arg Lys Ile Ser Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val
2645 2650 2655
Ile Gln Gly Arg Arg Val Leu Pro Met Thr Leu Ala Ile Gly Ser
2660 2665 2670
Leu Ala Glu Thr Cys Leu Gly Leu Phe Pro Gly Tyr Ser Leu Trp
2675 2680 2685
Ala Ile Asp Asp Ala Gln Leu Phe Lys Gly Val Thr Val Asp Gly
2690 2695 2700
Asp Val Asn Cys Glu Val Thr Leu Thr Pro Ser Thr Ala Pro Ser
2705 2710 2715
Gly Arg Val Asn Val Gln Ala Thr Leu Lys Thr Phe Ser Ser Gly
2720 2725 2730
Lys Leu Val Pro Ala Tyr Arg Ala Val Ile Val Leu Ser Asn Gln
2735 2740 2745
Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro Pro Ser Leu Asp
2750 2755 2760
Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly Lys Thr Leu
2765 2770 2775
Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu Ser Cys
2780 2785 2790
Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly Ser
2795 2800 2805
Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
2810 2815 2820
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val
2825 2830 2835
Arg Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg
2840 2845 2850
Ile Val Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile
2855 2860 2865
Thr Leu Arg Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His
2870 2875 2880
Ala Leu Gln Phe His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val
2885 2890 2895
Gln Ala Ser Val Ile Ala Thr Asp Ser Leu Ala Phe
2900 2905 2910
<210> 15
<211> 6177
<212> DNA
<213> Schizochytrium sp.
<400> 15
atggccgctc ggaatgtgag cgccgcgcat gagatgcacg atgaaaagcg catcgccgtc 60
gtcggcatgg ccgtccagta cgccggatgc aaaaccaagg acgagttctg ggaggtgctc 120
atgaacggca aggtcgagtc caaggtgatc agcgacaaac gactcggctc caactaccgc 180
gccgagcact acaaagcaga gcgcagcaag tatgccgaca ccttttgcaa cgaaacgtac 240
ggcacccttg acgagaacga gatcgacaac gagcacgaac tcctcctcaa cctcgccaag 300
caggcactcg cagagacatc cgtcaaagac tcgacacgct gcggcatcgt cagcggctgc 360
ctctcgttcc ccatggacaa cctccagggt gaactcctca acgtgtacca aaaccatgtc 420
gagaaaaagc tcggggcccg cgtcttcaag gacgcctccc attggtccga acgcgagcag 480
tccaacaaac ccgaggccgg tgaccgccgc atcttcatgg acccggcctc cttcgtcgcc 540
gaagaactca acctcggcgc ccttcactac tccgtcgacg cagcatgcgc cacggcgctc 600
tacgtgctcc gcctcgcgca ggatcatctc gtctccggcg ccgccgacgt catgctctgc 660
ggtgccacct gcctgccgga gccctttttc atcctttcgg gcttttccac cttccaggcc 720
atgcccgtcg gcacgggcca gaacgtgtcc atgccgctgc acaaggacag ccagggcctc 780
accccgggtg agggcggctc catcatggtc ctcaagcgtc tcgatgatgc catccgcgac 840
ggcgaccaca tttacggcac ccttctcggc gccaatgtca gcaactccgg cacaggtctg 900
cccctcaagc cccttctccc cagcgagaaa aagtgcctca tggacaccta cacgcgcatt 960
aacgtgcacc cgcacaagat tcagtacgtc gagtgccacg ccaccggcac gccccagggt 1020
gatcgtgtgg aaatcgacgc cgtcaaggcc tgctttgaag gcaaggtccc ccgtttcggt 1080
accacaaagg gcaactttgg acacacccts gycgcagccg gctttgccgg tatgtgcaag 1140
gtcctcctct ccatgaagca tggcatcatc ccgcccaccc cgggtatcga tgacgagacc 1200
aagatggacc ctctcgtcgt ctccggtgag gccatcccat ggccagagac caacggcgag 1260
cccaagcgcg ccggtctctc ggcctttggc tttggtggca ccaacgccca tgccgtcttt 1320
gaggagcatg acccctccaa cgccgcctgc acgggccacg actccatttc tgcgctctcg 1380
gcccgctgcg gcggtgaaag caacatgcgc atcgccatca ctggtatgga cgccaccttt 1440
ggcgctctca agggactcga cgccttcgag cgcgccattt acaccggcgc tcacggtgcc 1500
atcccactcc cagaaaagcg ctggcgcttt ctcggcaagg acaaggactt tcttgacctc 1560
tgcggcgtca aggccacccc gcacggctgc tacattgaag atgttgaggt cgacttccag 1620
cgcctccgca cgcccatgac ccctgaagac atgctcctcc ctcagcagct tctggccgtc 1680
accaccattg accgcgccat cctcgactcg ggaatgaaaa agggtggcaa tgtcgccgtc 1740
tttgtcggcc tcggcaccga cctcgagctc taccgtcacc gtgctcgcgt cgctctcaag 1800
gagcgcgtcc gccctgaagc ctccaagaag ctcaatgaca tgatgcagta cattaacgac 1860
tgcggcacat ccacatcgta cacctcgtac attggcaacc tcgtcgccac gcgcgtctcg 1920
tcgcagtggg gcttcacggg cccctccttt acgatcaccg agggcaacaa ctccgtctac 1980
cgctgcgccg agctcggcaa gtacctcctc gagaccggcg aggtcgatgg cgtcgtcgtt 2040
gcgggtgtcg atctctgcgg cagtgccgaa aacctttacg tcaagtctcg ccgcttcaag 2100
gtgtccacct ccgatacccc gcgcgccagc tttgacgccg ccgccgatgg ctactttgtc 2160
ggcgagggct gcggtgcctt tgtgctcaag cgtgagacta gctgcaccaa ggacgaccgt 2220
atctacgctt gcatggatgc catcgtccct ggcaacgtcc ctagcgcctg cttgcgcgag 2280
gccctcgacc aggcgcgcgt caagccgggc gatatcgaga tgctcgagct cagcgccgac 2340
tccgcccgcc acctcaagga cccgtccgtc ctgcccaagg agctcactgc cgaggaggaa 2400
atcggcggcc ttcagacgat ccttcgtgac gatgacaagc tcccgcgcaa cgtcgcaacg 2460
ggcagtgtca aggccaccgt cggtgacacc ggttatgcct ctggtgctgc cagcctcatc 2520
aaggctgcgc tttgcatcta caaccgctac ctgcccagca acggcgacga ctgggatgaa 2580
cccgcccctg aggcgccctg ggacagcacc ctctttgcgt gccagacctc gcgcgcttgg 2640
ctcaagaacc ctggcgagcg tcgctatgcg gccgtctcgg gcgtctccga gacgcgctcg 2700
tgctattccg tgctcctctc cgaagccgag ggccactacg agcgcgagaa ccgcatctcg 2760
ctcgacgagg aggcgcccaa gctcattgtg cttcgcgccg actcccacga ggagatcctt 2820
ggtcgcctcg acaagatccg cgagcgcttc ttgcagccca cgggcgccgc cccgcgcgag 2880
tccgagctca aggcgcaggc ccgccgcatc ttcctcgagc tcctcggcga gacccttgcc 2940
caggatgccg cttcttcagg ctcgcaaaag cccctcgctc tcagcctcgt ctccacgccc 3000
tccaagctcc agcgcgaggt cgagctcgcg gccaagggta tcccgcgctg cctcaagatg 3060
cgccgcgatt ggagctcccc tgctggcagc cgctacgcgc ctgagccgct cgccagcgac 3120
cgcgtcgcct tcatgtacgg cgaaggtcgc agcccttact acggcatcac ccaagacatt 3180
caccgcattt ggcccgaact ccacgaggtc atcaacgaaa agacgaaccg tctctgggcc 3240
gaaggcgacc gctgggtcat gccgcgcgcc agcttcaagt cggagctcga gagccagcag 3300
caagagtttg atcgcaacat gattgaaatg ttccgtcttg gaatcctcac ctcaattgcc 3360
ttcaccaatc tggcgcgcga cgttctcaac atcacgccca aggccgcctt tggcctcagt 3420
cttggcgaga tttccatgat ttttgccttt tccaagaaga acggtctcat ctccgaccag 3480
ctcaccaagg atcttcgcga gtccgacgtg tggaacaagg ctctggccgt tgaatttaat 3540
gcgctgcgcg aggcctgggg cattccacag agtgtcccca aggacgagtt ctggcaaggc 3600
tacattgtgc gcggcaccaa gcaggatatc gaggcggcca tcgccccgga cagcaagtac 3660
gtgcgcctca ccatcatcaa tgatgccaac accgccctca ttagcggcaa gcccgacgcc 3720
tgcaaggctg cgatcgcgcg tctcggtggc aacattcctg cgcttcccgt gacccagggc 3780
atgtgcggcc actgccccga ggtgggacct tataccaagg atatcgccaa gatccatgcc 3840
aaccttgagt tccccgttgt cgacggcctt gacctctgga ccacaatcaa ccagaagcgc 3900
ctcgtgccac gcgccacggg cgccaaggac gaatgggccc cttcttcctt tggcgagtac 3960
gccggccagc tctacgagaa gcaggctaac ttcccccaaa tcgtcgagac catttacaag 4020
caaaactacg acgtctttgt cgaggttggg cccaacaacc accgtagcac cgcagtgcgc 4080
accacgcttg gtccccagcg caaccacctt gctggcgcca tcgacaagca gaacgaggat 4140
gcttggacga ccatcgtcaa gcttgtggct tcgctcaagg cccaccttgt tcctggcgtc 4200
acgatctcgc cgctgtacca ctccaagctt gtggcggagg ctcaggcttg ctacgctgcg 4260
ctctgcaagg gtgaaaagcc caagaagaac aagtttgtgc gcaagattca gctcaacggt 4320
cgcttcaaca gcaaggcgga ccccatctcc tcggccgatc ttgccagctt tccgcctgcg 4380
gaccctgcca ttgaagccgc catctcgagc cgcatcatga agcctgtcgc tcccaagttc 4440
tacgcgcgtc tcaacattga cgagcaggac gagacccgag atccgatcct caacaaggac 4500
aacgcgccgt cttcttcttc ttcttcttct tcttcttctt cttcttcttc ttctccgtcg 4560
cctgctcctt cggcccccgt gcaaaagaag gctgctcccg ccgcggagac caaggctgtt 4620
gcttcggctg acgcacttcg cagtgccctg ctcgatctcg acagtatgct tgcgctgagc 4680
tctgccagtg cctccggcaa ccttgttgag actgcgccta gcgacgcctc ggtcattgtg 4740
ccgccctgca acattgcgga tctcggcagc cgcgccttca tgaaaacgta cggtgtttcg 4800
gcgcctctgt acacgggcgc catggccaag ggcattgcct ctgcggacct cgtcattgcc 4860
gccggccgcc agggcatcct tgcgtccttt ggcgccggcg gacttcccat gcaggttgtg 4920
cgtgagtcca tcgaaaagat tcaggccgcc ctgcccaatg gcccgtacgc tgtcaacctt 4980
atccattctc cctttgacag caacctcgaa aagggcaatg tcgatctctt cctcgagaag 5040
ggtgtcacct ttgtcgaggc ctcggccttt atgacgctca ccccgcaggt cgtgcggtac 5100
cgcgcggctg gcctcacgcg caacgccgac ggctcggtca acatccgcaa ccgtatcatt 5160
ggcaaggtct cgcgcaccga gctcgccgag atgttcatgc gtcctgcgcc cgagcacctt 5220
cttcagaagc tcattgcttc cggcgagatc aaccaggagc aggccgagct cgcccgccgt 5280
gttcccgtcg ctgacgacat cgcggtcgaa gctgactcgg gtggccacac cgacaaccgc 5340
cccatccacg tcattctgcc cctcatcatc aaccttcgcg accgccttca ccgcgagtgc 5400
ggctacccgg ccaaccttcg cgtccgtgtg ggcgccggcg gtggcattgg gtgcccccag 5460
gcggcgctgg ccaccttcaa catgggtgcc tcctttattg tcaccggcac cgtgaaccag 5520
gtcgccaagc agtcgggcac gtgcgacaat gtgcgcaagc agctcgcgaa ggccacttac 5580
tcggacgtat gcatggcccc ggctgccgac atgttcgagg aaggcgtcaa gcttcaggtc 5640
ctcaagaagg gaaccatgtt tccctcgcgc gccaacaagc tctacgagct cttttgcaag 5700
tacgactcgt tcgagtccat gccccccgca gagcttgcgc gcgtcgagaa gcgcatcttc 5760
agccgcgcgc tcgaagaggt ctgggacgag accaaaaact tttacattaa ccgtcttcac 5820
aacccggaga agatccagcg cgccgagcgc gaccccaagc tcaagatgtc gctgtgcttt 5880
cgctggtacc tgagcctggc gagccgctgg gccaacactg gagcttccga tcgcgtcatg 5940
gactaccagg tctggtgcgg tcctgccatt ggttccttca acgatttcat caagggaact 6000
taccttgatc cggccgtcgc aaacgagtac ccgtgcgtcg ttcagattaa caagcagatc 6060
cttcgtggag cgtgcttctt gcgccgtctc gaaattctgc gcaacgcacg cctttccgat 6120
ggcgctgccg ctcttgtggc cagcatcgat gacacatacg tcccggccga gaagctg 6177
<210> 16
<211> 2059
<212> PRT
<213> Schizochytrium sp.
<220>
<221> misc_feature
<222> (1)..(2059)
<223> Xaa = Ala or Val
<400> 16
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1 5 10 15
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
20 25 30
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
35 40 45
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
50 55 60
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65 70 75 80
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
85 90 95
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
100 105 110
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
115 120 125
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
130 135 140
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145 150 155 160
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
165 170 175
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
180 185 190
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
195 200 205
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
210 215 220
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225 230 235 240
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
245 250 255
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
260 265 270
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
275 280 285
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
290 295 300
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305 310 315 320
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
325 330 335
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
340 345 350
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
355 360 365
Thr Leu Xaa Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
370 375 380
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385 390 395 400
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
405 410 415
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
420 425 430
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
435 440 445
Ala Cys Thr Gly His Asp Ser Ile Ser Ala Leu Ser Ala Arg Cys Gly
450 455 460
Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly Met Asp Ala Thr Phe
465 470 475 480
Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg Ala Ile Tyr Thr Gly
485 490 495
Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg Trp Arg Phe Leu Gly
500 505 510
Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val Lys Ala Thr Pro His
515 520 525
Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe Gln Arg Leu Arg Thr
530 535 540
Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln Gln Leu Leu Ala Val
545 550 555 560
Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly Met Lys Lys Gly Gly
565 570 575
Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg
580 585 590
His Arg Ala Arg Val Ala Leu Lys Glu Arg Val Arg Pro Glu Ala Ser
595 600 605
Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn Asp Cys Gly Thr Ser
610 615 620
Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Val Ser
625 630 635 640
Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Ile Thr Glu Gly Asn
645 650 655
Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys Tyr Leu Leu Glu Thr
660 665 670
Gly Glu Val Asp Gly Val Val Val Ala Gly Val Asp Leu Cys Gly Ser
675 680 685
Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe Lys Val Ser Thr Ser
690 695 700
Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala Asp Gly Tyr Phe Val
705 710 715 720
Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg Glu Thr Ser Cys Thr
725 730 735
Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala Ile Val Pro Gly Asn
740 745 750
Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp Gln Ala Arg Val Lys
755 760 765
Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala Asp Ser Ala Arg His
770 775 780
Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu Thr Ala Glu Glu Glu
785 790 795 800
Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp Asp Lys Leu Pro Arg
805 810 815
Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val Gly Asp Thr Gly Tyr
820 825 830
Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala Leu Cys Ile Tyr Asn
835 840 845
Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp Glu Pro Ala Pro Glu
850 855 860
Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln Thr Ser Arg Ala Trp
865 870 875 880
Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala Val Ser Gly Val Ser
885 890 895
Glu Thr Arg Ser Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His
900 905 910
Tyr Glu Arg Glu Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu
915 920 925
Ile Val Leu Arg Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp
930 935 940
Lys Ile Arg Glu Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu
945 950 955 960
Ser Glu Leu Lys Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly
965 970 975
Glu Thr Leu Ala Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu
980 985 990
Ala Leu Ser Leu Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu
995 1000 1005
Leu Ala Ala Lys Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp
1010 1015 1020
Trp Ser Ser Pro Ala Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala
1025 1030 1035
Ser Asp Arg Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr
1040 1045 1050
Tyr Gly Ile Thr Gln Asp Ile His Arg Ile Trp Pro Glu Leu His
1055 1060 1065
Glu Val Ile Asn Glu Lys Thr Asn Arg Leu Trp Ala Glu Gly Asp
1070 1075 1080
Arg Trp Val Met Pro Arg Ala Ser Phe Lys Ser Glu Leu Glu Ser
1085 1090 1095
Gln Gln Gln Glu Phe Asp Arg Asn Met Ile Glu Met Phe Arg Leu
1100 1105 1110
Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu Ala Arg Asp Val
1115 1120 1125
Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser Leu Gly Glu
1130 1135 1140
Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu Ile Ser
1145 1150 1155
Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn Lys
1160 1165 1170
Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
1175 1180 1185
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val
1190 1195 1200
Arg Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser
1205 1210 1215
Lys Tyr Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu
1220 1225 1230
Ile Ser Gly Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu
1235 1240 1245
Gly Gly Asn Ile Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly
1250 1255 1260
His Cys Pro Glu Val Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile
1265 1270 1275
His Ala Asn Leu Glu Phe Pro Val Val Asp Gly Leu Asp Leu Trp
1280 1285 1290
Thr Thr Ile Asn Gln Lys Arg Leu Val Pro Arg Ala Thr Gly Ala
1295 1300 1305
Lys Asp Glu Trp Ala Pro Ser Ser Phe Gly Glu Tyr Ala Gly Gln
1310 1315 1320
Leu Tyr Glu Lys Gln Ala Asn Phe Pro Gln Ile Val Glu Thr Ile
1325 1330 1335
Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu Val Gly Pro Asn Asn
1340 1345 1350
His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly Pro Gln Arg Asn
1355 1360 1365
His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp Ala Trp Thr
1370 1375 1380
Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu Val Pro
1385 1390 1395
Gly Val Thr Ile Ser Pro Leu Tyr His Ser Lys Leu Val Ala Glu
1400 1405 1410
Ala Gln Ala Cys Tyr Ala Ala Leu Cys Lys Gly Glu Lys Pro Lys
1415 1420 1425
Lys Asn Lys Phe Val Arg Lys Ile Gln Leu Asn Gly Arg Phe Asn
1430 1435 1440
Ser Lys Ala Asp Pro Ile Ser Ser Ala Asp Leu Ala Ser Phe Pro
1445 1450 1455
Pro Ala Asp Pro Ala Ile Glu Ala Ala Ile Ser Ser Arg Ile Met
1460 1465 1470
Lys Pro Val Ala Pro Lys Phe Tyr Ala Arg Leu Asn Ile Asp Glu
1475 1480 1485
Gln Asp Glu Thr Arg Asp Pro Ile Leu Asn Lys Asp Asn Ala Pro
1490 1495 1500
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
1505 1510 1515
Pro Ser Pro Ala Pro Ser Ala Pro Val Gln Lys Lys Ala Ala Pro
1520 1525 1530
Ala Ala Glu Thr Lys Ala Val Ala Ser Ala Asp Ala Leu Arg Ser
1535 1540 1545
Ala Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser
1550 1555 1560
Ala Ser Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val
1565 1570 1575
Ile Val Pro Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe
1580 1585 1590
Met Lys Thr Tyr Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met
1595 1600 1605
Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Arg
1610 1615 1620
Gln Gly Ile Leu Ala Ser Phe Gly Ala Gly Gly Leu Pro Met Gln
1625 1630 1635
Val Val Arg Glu Ser Ile Glu Lys Ile Gln Ala Ala Leu Pro Asn
1640 1645 1650
Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
1655 1660 1665
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val Thr
1670 1675 1680
Phe Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val Val
1685 1690 1695
Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala Asp Gly Ser Val
1700 1705 1710
Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
1715 1720 1725
Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu Gln Lys
1730 1735 1740
Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu Ala
1745 1750 1755
Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
1760 1765 1770
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu
1775 1780 1785
Ile Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro
1790 1795 1800
Ala Asn Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys
1805 1810 1815
Pro Gln Ala Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile
1820 1825 1830
Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys
1835 1840 1845
Asp Asn Val Arg Lys Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val
1850 1855 1860
Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys Leu
1865 1870 1875
Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn Lys
1880 1885 1890
Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ser Met Pro
1895 1900 1905
Pro Ala Glu Leu Ala Arg Val Glu Lys Arg Ile Phe Ser Arg Ala
1910 1915 1920
Leu Glu Glu Val Trp Asp Glu Thr Lys Asn Phe Tyr Ile Asn Arg
1925 1930 1935
Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu Arg Asp Pro Lys
1940 1945 1950
Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser Leu Ala Ser
1955 1960 1965
Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp Tyr Gln
1970 1975 1980
Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile Lys
1985 1990 1995
Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
2000 2005 2010
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg
2015 2020 2025
Arg Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala
2030 2035 2040
Ala Leu Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys
2045 2050 2055
Leu
<210> 17
<211> 4509
<212> DNA
<213> Schizochytrium sp.
<400> 17
atggcgctcc gtgtcaagac gaacaagaag ccatgctggg agatgaccaa ggaggagctg 60
accagcggca agaccgaggt gttcaactat gaggaactcc tcgagttcgc agagggcgac 120
atcgccaagg tcttcggacc cgagttcgcc gtcatcgaca agtacccgcg ccgcgtgcgc 180
ctgcccgccc gcgagtacct gctcgtgacc cgcgtcaccc tcatggacgc cgaggtcaac 240
aactaccgcg tcggcgcccg catggtcacc gagtacgatc tccccgtcaa cggagagctc 300
tccgagggcg gagactgccc ctgggccgtc ctggtcgaga gtggccagtg cgatctcatg 360
ctcatctcct acatgggcat tgacttccag aaccagggcg accgcgtcta ccgcctgctc 420
aacaccacgc tcacctttta cggcgtggcc cacgagggcg agaccctcga gtacgacatt 480
cgcgtcaccg gcttcgccaa gcgtctcgac ggcggcatct ccatgttctt cttcgagtac 540
gactgctacg tcaacggccg cctcctcatc gagatgcgcg atggctgcgc cggcttcttc 600
accaacgagg agctcgacgc cggcaagggc gtcgtcttca cccgcggcga cctcgccgcc 660
cgcgccaaga tcccaaagca ggacgtctcc ccctacgccg tcgccccctg cctccacaag 720
accaagctca acgaaaagga gatgcagacc ctcgtcgaca aggactgggc atccgtcttt 780
ggctccaaga acggcatgcc ggaaatcaac tacaaactct gcgcgcgtaa gatgctcatg 840
attgaccgcg tcaccagcat tgaccacaag ggcggtgtct acggcctcgg tcagctcgtc 900
ggtgaaaaga tcctcgagcg cgaccactgg tactttccct gccactttgt caaggatcag 960
gtcatggccg gatccctcgt ctccgacggc tgcagccaga tgctcaagat gtacatgatc 1020
tggctcggcc tccacctcac caccggaccc tttgacttcc gcccggtcaa cggccacccc 1080
aacaaggtcc gctgccgcgg ccaaatctcc ccgcacaagg gcaagctcgt ctacgtcatg 1140
gagatcaagg agatgggctt cgacgaggac aacgacccgt acgccattgc cgacgtcaac 1200
atcattgatg tcgacttcga aaagggccag gactttagcc tcgaccgcat cagcgactac 1260
ggcaagggcg acctcaacaa gaagatcgtc gtcgacttta agggcatcgc tctcaagatg 1320
cagaagcgct ccaccaacaa gaacccctcc aaggttcagc ccgtctttgc caacggcgcc 1380
gccactgtcg gccccgaggc ctccaaggct tcctccggcg ccagcgccag cgccagcgcc 1440
gccccggcca agcctgcctt cagcgccgat gttcttgcgc ccaagcccgt tgcccttccc 1500
gagcacatcc tcaagggcga cgccctcgcc cccaaggaga tgtcctggca ccccatggcc 1560
cgcatcccgg gcaacccgac gccctctttt gcgccctcgg cctacaagcc gcgcaacatc 1620
gcctttacgc ccttccccgg caaccccaac gataacgacc acaccccggg caagatgccg 1680
ctcacctggt tcaacatggc cgagttcatg gccggcaagg tcagcatgtg cctcggcccc 1740
gagttcgcca agttcgacga ctcgaacacc agccgcagcc ccgcttggga cctcgctctc 1800
gtcacccgcg ccgtgtctgt gtctgacctc aagcacgtca actaccgcaa catcgacctc 1860
gacccctcca agggtaccat ggtcggcgag ttcgactgcc ccgcggacgc ctggttctac 1920
aagggcgcct gcaacgatgc ccacatgccg tactcgatcc tcatggagat cgccctccag 1980
acctcgggtg tgctcacctc ggtgctcaag gcgcccctga ccatggagaa ggacgacatc 2040
ctcttccgca acctcgacgc caacgccgag ttcgtgcgcg ccgacctcga ctaccgcggc 2100
aagactatcc gcaacgtcac caagtgcact ggctacagca tgctcggcga gatgggcgtc 2160
caccgcttca cctttgagct ctacgtcgat gatgtgctct tttacaaggg ctcgacctcg 2220
ttcggctggt tcgtgcccga ggtctttgcc gcccaggccg gcctcgacaa cggccgcaag 2280
tcggagccct ggttcattga gaacaaggtt ccggcctcgc aggtctcctc ctttgacgtg 2340
cgccccaacg gcagcggccg caccgccatc ttcgccaacg cccccagcgg cgcccagctc 2400
aaccgccgca cggaccaggg ccagtacctc gacgccgtcg acattgtctc cggcagcggc 2460
aagaagagcc tcggctacgc ccacggttcc aagacggtca acccgaacga ctggttcttc 2520
tcgtgccact tttggtttga ctcggtcatg cccggaagtc tcggtgtcga gtccatgttc 2580
cagctcgtcg aggccatcgc cgcccacgag gatctcgctg gcaaagcacg gcattgccaa 2640
ccccaccttt gtgcacgccc ccgggcaaga tcaagctgga agtaccgcgg ccagctcacg 2700
cccaagagca agaagatgga ctcggaggtc cacatcgtgt ccgtggacgc ccacgacggc 2760
gttgtcgacc tcgtcgccga cggcttcctc tgggccgaca gcctccgcgt ctactcggtg 2820
agcaacattc gcgtgcgcat cgcctccggt gaggcccctg ccgccgcctc ctccgccgcc 2880
tctgtgggct cctcggcttc gtccgtcgag cgcacgcgct cgagccccgc tgtcgcctcc 2940
ggcccggccc agaccatcga cctcaagcag ctcaagaccg agctcctcga gctcgatgcc 3000
ccgctctacc tctcgcagga cccgaccagc ggccagctca agaagcacac cgacgtggcc 3060
tccggccagg ccaccatcgt gcagccctgc acgctcggcg acctcggtga ccgctccttc 3120
atggagacct acggcgtcgt cgccccgctg tacacgggcg ccatggccaa gggcattgcc 3180
tcggcggacc tcgtcatcgc cgccggcaag cgcaagatcc tcggctcctt tggcgccggc 3240
ggcctcccca tgcaccacgt gcgcgccgcc ctcgagaaga tccaggccgc cctgcctcag 3300
ggcccctacg ccgtcaacct catccactcg ccttttgaca gcaacctcga gaagggcaac 3360
gtcgatctct tcctcgagaa gggcgtcact gtggtggagg cctcggcatt catgaccctc 3420
accccgcagg tcgtgcgcta ccgcgccgcc ggcctctcgc gcaacgccga cggttcggtc 3480
aacatccgca accgcatcat cggcaaggtc tcgcgcaccg agctcgccga gatgttcatc 3540
cgcccggccc cggagcacct cctcgagaag ctcatcgcct cgggcgagat cacccaggag 3600
caggccgagc tcgcgcgccg cgttcccgtc gccgacgata tcgctgtcga ggctgactcg 3660
ggcggccaca ccgacaaccg ccccatccac gtcatcctcc cgctcatcat caacctccgc 3720
aaccgcctgc accgcgagtg cggctacccc gcgcacctcc gcgtccgcgt tggcgccggc 3780
ggtggcgtcg gctgcccgca ggccgccgcc gccgcgctca ccatgggcgc cgccttcatc 3840
gtcaccggca ctgtcaacca ggtcgccaag cagtccggca cctgcgacaa cgtgcgcaag 3900
cagctctcgc aggccaccta ctcggatatc tgcatggccc cggccgccga catgttcgag 3960
gagggcgtca agctccaggt cctcaagaag ggaaccatgt tcccctcgcg cgccaacaag 4020
ctctacgagc tcttttgcaa gtacgactcc ttcgactcca tgcctcctgc cgagctcgag 4080
cgcatcgaga agcgtatctt caagcgcgca ctccaggagg tctgggagga gaccaaggac 4140
ttttacatta acggtctcaa gaacccggag aagatccagc gcgccgagca cgaccccaag 4200
ctcaagatgt cgctctgctt ccgctggtac cttggtcttg ccagccgctg ggccaacatg 4260
ggcgccccgg accgcgtcat ggactaccag gtctggtgtg gcccggccat tggcgccttc 4320
aacgacttca tcaagggcac ctacctcgac cccgctgtct ccaacgagta cccctgtgtc 4380
gtccagatca acctgcaaat cctccgtggt gcctgctacc tgcgccgtct caacgccctg 4440
cgcaacgacc cgcgcattga cctcgagacc gaggatgctg cctttgtcta cgagcccacc 4500
aacgcgctc 4509
<210> 18
<211> 1503
<212> PRT
<213> Schizochytrium sp.
<400> 18
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1 5 10 15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
35 40 45
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65 70 75 80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
100 105 110
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
180 185 190
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
195 200 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
210 215 220
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225 230 235 240
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
245 250 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
260 265 270
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
275 280 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
290 295 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
325 330 335
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
340 345 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
370 375 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385 390 395 400
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
405 410 415
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
420 425 430
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
435 440 445
Pro Ser Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly
450 455 460
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala
465 470 475 480
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro
485 490 495
Val Ala Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys
500 505 510
Glu Met Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro
515 520 525
Ser Phe Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro
530 535 540
Phe Pro Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro
545 550 555 560
Leu Thr Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met
565 570 575
Cys Leu Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg
580 585 590
Ser Pro Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser
595 600 605
Asp Leu Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys
610 615 620
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr
625 630 635 640
Lys Gly Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu
645 650 655
Ile Ala Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro
660 665 670
Leu Thr Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn
675 680 685
Ala Glu Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg
690 695 700
Asn Val Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val
705 710 715 720
His Arg Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys
725 730 735
Gly Ser Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln
740 745 750
Ala Gly Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn
755 760 765
Lys Val Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly
770 775 780
Ser Gly Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu
785 790 795 800
Asn Arg Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val
805 810 815
Ser Gly Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr
820 825 830
Val Asn Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser
835 840 845
Val Met Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu
850 855 860
Ala Ile Ala Ala His Glu Asp Leu Ala Gly Lys Ala Arg His Cys Gln
865 870 875 880
Pro His Leu Cys Ala Arg Pro Arg Ala Arg Ser Ser Trp Lys Tyr Arg
885 890 895
Gly Gln Leu Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile
900 905 910
Val Ser Val Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly
915 920 925
Phe Leu Trp Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg
930 935 940
Val Arg Ile Ala Ser Gly Glu Ala Pro Ala Ala Ala Ser Ser Ala Ala
945 950 955 960
Ser Val Gly Ser Ser Ala Ser Ser Val Glu Arg Thr Arg Ser Ser Pro
965 970 975
Ala Val Ala Ser Gly Pro Ala Gln Thr Ile Asp Leu Lys Gln Leu Lys
980 985 990
Thr Glu Leu Leu Glu Leu Asp Ala Pro Leu Tyr Leu Ser Gln Asp Pro
995 1000 1005
Thr Ser Gly Gln Leu Lys Lys His Thr Asp Val Ala Ser Gly Gln
1010 1015 1020
Ala Thr Ile Val Gln Pro Cys Thr Leu Gly Asp Leu Gly Asp Arg
1025 1030 1035
Ser Phe Met Glu Thr Tyr Gly Val Val Ala Pro Leu Tyr Thr Gly
1040 1045 1050
Ala Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala
1055 1060 1065
Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro
1070 1075 1080
Met His His Val Arg Ala Ala Leu Glu Lys Ile Gln Ala Ala Leu
1085 1090 1095
Pro Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp
1100 1105 1110
Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly
1115 1120 1125
Val Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln
1130 1135 1140
Val Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly
1145 1150 1155
Ser Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr
1160 1165 1170
Glu Leu Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu
1175 1180 1185
Glu Lys Leu Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu
1190 1195 1200
Leu Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala
1205 1210 1215
Asp Ser Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu
1220 1225 1230
Pro Leu Ile Ile Asn Leu Arg Asn Arg Leu His Arg Glu Cys Gly
1235 1240 1245
Tyr Pro Ala His Leu Arg Val Arg Val Gly Ala Gly Gly Gly Val
1250 1255 1260
Gly Cys Pro Gln Ala Ala Ala Ala Ala Leu Thr Met Gly Ala Ala
1265 1270 1275
Phe Ile Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly
1280 1285 1290
Thr Cys Asp Asn Val Arg Lys Gln Leu Ser Gln Ala Thr Tyr Ser
1295 1300 1305
Asp Ile Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val
1310 1315 1320
Lys Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala
1325 1330 1335
Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Asp Ser
1340 1345 1350
Met Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe Lys
1355 1360 1365
Arg Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile
1370 1375 1380
Asn Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp
1385 1390 1395
Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu
1400 1405 1410
Ala Ser Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp
1415 1420 1425
Tyr Gln Val Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe
1430 1435 1440
Ile Lys Gly Thr Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro
1445 1450 1455
Cys Val Val Gln Ile Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr
1460 1465 1470
Leu Arg Arg Leu Asn Ala Leu Arg Asn Asp Pro Arg Ile Asp Leu
1475 1480 1485
Glu Thr Glu Asp Ala Ala Phe Val Tyr Glu Pro Thr Asn Ala Leu
1490 1495 1500
<210> 19
<211> 8436
<212> DNA
<213> Thraustochytrium sp.
<400> 19
atgaaggaca tggaagatag acgggtcgct attgtgggca tgtcagctca cttgccttgt 60
gggacagatg tgaaggaatc atggcaggct attcgcgatg gaatcgactg tctaagtgac 120
ctacccgcgg atcgtctcga cgttacagct tactacaatc ccaacaaagc cacgaaagac 180
aagatctact gcaaacgggg tggcttcatc ccgaactatg acttcgaccc ccgcgaattt 240
gggctcaaca tgtttcaaat ggaagactct gatgcgaatc agacacttac cttgctcaaa 300
gtcaaacaag ctctcgaaga tgcaagcata gagcctttca ccaaggagaa gaagaacatt 360
ggatgtgttt taggtattgg tgggggccaa aaggcgagtc atgagttcta ctctcgtctc 420
aactacgttg tcgttgaaaa ggtacttcgg aaaatgggtt taccagatgc tgatgttgaa 480
gaagctgtgg agaaatacaa ggcaaatttt cccgagtggc gcctagactc tttccctggg 540
tttcttggga atgtaacggc tggtcggtgc agtaacacct tcaacatgga aggtatgaac 600
tgcgttgtgg atgctgcatg tgccagttct ctaattgcaa tcaaggttgc agttgaagag 660
ctactctttg gtgactgtga caccatgatt gcaggtgcca cctgcacgga caattcactt 720
ggcatgtaca tggccttctc taaaacgcca gttttttcta ctgacccaag tgtccgcgcg 780
tatgatgaga aaacaaaagg gatgctaatt ggagaaggtt cagcaatgtt cgttcttaaa 840
cgctatgcgg atgccgtacg tgatggcgac acaattcacg cggttctgcg ttcttgctct 900
tcgtctagtg atggaaaagc ggcaggaatt tatactccta ctatatctgg acaagaagaa 960
gctttgcgtc gagcgtatgc ccgtgcgggg gtatgtccat ctacgatcgg gcttgttgag 1020
ggtcacggga cagggacccc tgttggagat cgcattgagt taacagctct gcggaacttg 1080
tttgacaaag cttttggtag caagaaggaa caaatagcag ttggcagcat aaagtctcag 1140
ataggtcacc tgaaatctgt tgccggcttt gccggcttgg tcaaagctgt gcttgcgctt 1200
aaacacaaaa cgctcccagg ttcgattaat gtcgaccagc cacctttgtt gtatgacggt 1260
actcaaattc aagactcttc tttatatatc aacaagacaa atagaccatg gtttacgcaa 1320
aacaagcttc cgcgtcgggc tggtgtctca agttttggat ttggaggtgc aaactaccac 1380
gcggttctgg aagaattcga gcccgagcat gaaaaaccat accgcctcaa tactgttgga 1440
catcctgtcc tcttgtacgc tccgtctgtg gaagccctca aagtactttg caacgaccag 1500
cttgcggagc tcacaattgc attggaagag gcaaaaacac ataaaaatgt tgacaaagtt 1560
tgtggctaca agtttattga cgaatttcag ctccaaggaa gctgtcctcc agaaaatccg 1620
agagtaggat ttttagcaac actgcctact tcaaatatca ttgtcgcgct taaggcaatt 1680
ctcgcgcagc ttgatgcaaa accagatgcg aagaaatggg atttgcctca taaaaaggct 1740
tttggggcta ccttcgcatc gtcttcagtg aaaggctctg ttgctgcgct cttcgcagga 1800
cagggtaccc agtacttaaa catgttctct gatgtggcaa tgaactggcc accgttccgt 1860
gacagcattg tcgcaatgga agaagctcaa actgaggtat ttgagggcca agttgaacca 1920
attagcaaag ttctgtttcc acgagagcgc tatgcatccg aaagtgaaca ggggaatgaa 1980
cttctttgct taacagagta ctctcagcca actacgatag cagccgcagt aggggccttc 2040
gatattttca aagcggctgg ctttaagcca gacatggttg gagggcattc acttggcgaa 2100
tttgctgctt tgtacgcggc tgggtccatt tcgcgtgacg acctgtacaa gcttgtgtgc 2160
aaacgggcaa aggcaatggc gaacgctagt gacggagcta tggcagcagt gattggccca 2220
gatgcacgtc tagttacgcc acaaaatagt gacgtttatg tcgcaaactt caactccgca 2280
actcaagtag tcatcagtgg cactgttcaa ggtgtgaaag aagagtcgaa attgctcatt 2340
tcaaaggggt tccgcgtact gccacttaaa tgccagggcg ccttccattc tcctttgatg 2400
gggccttctg aggatagttt caaatcactt gtggagactt gtaccatctc gccgccaaaa 2460
aatgtgaaat tcttttgcaa tgttagtggc aaggaaagcc caaacccaaa acagaccctc 2520
aagtcacaca tgacgtctag cgttcagttc gaggagcaga ttcgtaacat gtacgatgcc 2580
ggagcacgtg tttttctgga gtttggaccc cgccaagtcc ttgcaaagct tatcgcggaa 2640
atgtttccct cgtgtacagc tatcagcgtt aaccccgcga gcagtggtga cagtgacgtg 2700
caactccgcc tcgccgccgt aaaattcgcg gtctcgggtg cagcccttag cacctttgat 2760
ccatgggagt atcgcaagcc acaagatctt cttattcgaa aaccacgaaa aactgccctt 2820
gttctatcag cagcaacata tgtttcccca aagactcttg cagaacgtaa aaaggctatg 2880
gaagatatca agctagtatc cattacacca agagatagta tggtatcaat tggaaaaatc 2940
gcgcaagaag tacggacagc taaacagcct ttagaaaccg aaattcgaag actcaacaaa 3000
gaattagaac atctcaagag agagctagca gcagccaaag cgagtgtcaa gtctgcatca 3060
aaaagctcta aagagcgatc tgtcctatca aagcaccgcg ctttgcttca aaacattttg 3120
caagactacg atgatcttcg tgtggtgcca ttcgctgttc gttctgttgc agtggacaac 3180
accgcgccgt atgctgacca agtttcgacc ccagcgtcag agcggtcggc ttcaccgctt 3240
ttcgagaaac gcagttcggt ttcgtcagca cgcctcgctg aagctgaagc cgcggtactg 3300
agcgttctcg cagacaagac aggctacgac agctcaatga tcgagatgga catggacctg 3360
gagagtgagc ttggcgttga tagcatcaaa cgcgtggaga tcatgagcga ggttcaaacg 3420
ctgctcagcg tggaagtctc cgacgttgac gctctgtcaa gaaccaagac tgttggcgac 3480
gtcatcgagg cgatgaagct ggaactcggt ggaccccaag gccagacttt gaccgcggaa 3540
tcgatccgtc agccaccggt gtccgagcct gctgtaccga cctcatcgtc aagcagtatt 3600
gctaatgttt cgtcagcacg cctcgctgaa gctgaagctg cggtactgag cgttctcgca 3660
gacaagacag gctacgacag ctcaatgatc gagatggaca tggacctgga gagcgagctt 3720
ggcgttgata gcatcaaacg cgtggagatc atgagcgagg ttcaaacgct gctcagcgtg 3780
gaagtctccg acgttgacgc tctgtcaaga actaagactg ttggcgacgt catcgaggcg 3840
atgaagctgg aactcggtgg accccaaggc cagactttga ccgcggaatc gatccgtcag 3900
ccaccggtgt ctgagcctgc tgtaccgacc tcatcgtcaa gcagtattgc taatgtttcg 3960
tcagcacgcc tcgctgaagc tgaagcggcg gtactgagcg ttctcgcaga caagacaggc 4020
tacgacagct caatgatcga gatggacatg gacctggaga gcgagcttgg cgtcgacagc 4080
atcaaacgcg tggagatcat gagcgaggtt caaacgctgc tcagcgtgga agtctccgac 4140
gttgacgctc tgtcaagaac caagactgtt ggcgacgtca tcgaggcgat gaagctggaa 4200
ctcggtggac cccaaggcca gactttgacc gcggaatcga tccgtcagcc accggtgtcc 4260
gagcctgctg taccgacctc atcgtcaagc agtattgcta atgttttgtc agcacgcctc 4320
gctgaagctg aagccgcggt actgagcgtt ctcgcagaca agacaggcta cgacagctca 4380
atgatcgaga tggacatgga cctggagagc gagcttggcg ttgatagcat caaacgcgtg 4440
gagatcatga gcgaggttca aacgttgctc agcgtggaag tctccgacgt tgacgctctg 4500
tcaagaacca agactgttgg cgacgtcatc gaggcgatga agctggaact cggtggaccc 4560
caaggccaga ctttgaccgc ggaatcgatc cgtcagccac cggtgtctga gcctgctgta 4620
ccgacctcat cgtcaagcag tattgctaat gtttcgtcag cacgcctcgc tgaagctgaa 4680
gccgcggtac tgagcgttct cgcagacaag acaggctacg acagctcaat gatcgagatg 4740
gacatggacc tggagagtga gcttggcgtc gacagcatca aacgcgtgga gatcatgagc 4800
gaggttcaaa cgctgctcag cgtggaagtc tccgacgttg acgctctgtc aagaaccaag 4860
actgttggcg acgtcatcga ggcgatgaag ctggaactcg gtggacccca aggccagact 4920
ttgacctctg aaccgatcca tcagccacca gtgtccgagc ctgctgtacc gacctcatcg 4980
tcaagcagta ttgctaatgt ttcttcagca cgcctcgctg aagctgaagc cgcggtactg 5040
agcgttctcg cagacaagac aggctacgac agctcaatga tcgagatgga catggacctg 5100
gagagcgagc ttggcgttga tagcatcaaa cgcgtggaaa tcatgagcga ggttcaaacg 5160
ctgctcagcg tggaagtctc cgacgttgac gctctgtcaa gaaccaagac tgttggcgac 5220
gtcatcgagg cgatgaagat ggaactcggt ggaccccaag gccagacttt gaccgcggaa 5280
tcgatccgtc agccaccggt gtctgagcct gctgtaccga cctcatcgtc aagcagtatt 5340
gctaatgttt cgtcagcacg cctcgctgaa gctgaagcgg cggtactgag cgttctcgca 5400
gacaagacag gctacgacag ctcaatgatc gagatggaca tggacctgga gagcgagctt 5460
ggcgttgata gcatcaaacg cgtggagatc atgagcgagg ttcaagcgct gctcagcgtg 5520
gaagtctccg acgttgacgc tctgtcaaga accaagactg ttggcgacgt catcgaggcg 5580
atgaagatgg aactcggtgg accccaaggc cagactttga ccgcagaatc gatccgtgag 5640
ccaccggtgt ctgagcctgc tgtaccgacc tcatcgtcaa gtagtatcgc taatgtttct 5700
tcagctcgcc tcgctgaagc tgaagccgcg gtactgagcg ttctcgcaga caagacaggc 5760
tacgacagct caatgatcga gatggacatg gacctggaga gtgagcttgg cgtcgacagc 5820
atcaaacgcg tggagatcat gagcgaggtt caaacgttgc tcagcgtgga agtctccgac 5880
gttgacgctc tgtcaagaac caagactgtt ggcgacgtca tcgaggcgat gaagctggaa 5940
cttggggaat catcaagtat tgagactctc aattgtaccg aggttgagca cacgagctac 6000
aaaagtgtca aggcttcagg gtgtgagaat gtagataccc gtttcgctaa ggttgtacaa 6060
atctcgcttc ctagcaagct gaaatccact gtgtcgcacg atcgacctgt aattgttgta 6120
gatgatggaa cgcccttaac cacggagctt tgtaaaattc ttgggggtaa tattgtggtt 6180
ctctcttatc aagggaagcc cgctggtcca cggggagtcg aggtgccaga tctttccgag 6240
gaagccctaa ttcaagctct tgcattgatt cggtctacat atggagttcc aattggtttt 6300
atttgtcagc aagtgtctaa tgtgagcacc aaggcacagc tttgttgggc actcctcgca 6360
gcgaagcatc tcaagaagga tttgaatgct gtcttacccg attcaagatc cttcttcgtc 6420
ggagttgtac gcttgaacgg gaaacttgga actttcgaaa acatcagcga cttctctaaa 6480
tttgatttga cgaaagccct agattacgga cagcgtggtt ctctcttagg cctgtgcaag 6540
tcactagact tagaatggga acaggtgttt tgccgtggaa tagatcttgc gtgtgatctt 6600
atgccactcc aggccgcaag gatactcaga aatgagcttc agtgtcccaa tatgcgcctt 6660
cgcgaggttg ggtacgatat ttctggcgcc aggtacacca tttcaaccga tgacctgcta 6720
tgtggaccct cgaaggctaa agtagaggcc gcagacttgt ttcttgtgac aggtggcgca 6780
cgaggtatta cacctcattg tgttcgtgag attgcaagtc gatcccccgg aaccacattt 6840
gtgctggttg gaagaagcga aatgtccgac gagcctgact gggctgttgg ccactacaat 6900
aaagacctgg accaaagcac aatgaaacac ttgaaagcaa cgcatgctgc tggaggggta 6960
aaacctacgc ctaaagcaca tcgtgcactt gtgaacaggg tcactggctc acgggaggta 7020
cgagaatctc ttagagcaat ccaggaggca ggggcaaatg tcgaatatat cgcctgtgat 7080
gtttcggatg aaaacaaggt ccgccaactt gtgcaaagag tggagcaaaa gtatggctgt 7140
gaaataactg ggatttggca tgcaagcggg gttcttcgtg acaaacttgt cgagcaaaag 7200
actacagacg actttgaggc agtttttggg accaaggtga ctggccttgt aaacatcgtg 7260
tcacaagtca atatgtctaa gctacgacac ttcatcctct tcagttcttt ggctggattt 7320
catgggaaca agggccaaac ggattatgca attgctaatg aagccttgaa caaaatcgcg 7380
catactctct cagcgttttt gcccaaactg aatgcaaagg tgctagactt cggtccgtgg 7440
gtaggttcag gaatggtaac cgaaacactt gagaagcatt ttaaagctat gggggttcag 7500
actattcctc tcgagccagg agcacggact gttgcgcaaa tcattttggc aagttcgcca 7560
ccgcaatcgc ttttggggaa ctggggcttt ccagccacca aaccgctaca acgctctaat 7620
gtagtcacgg gcacactctc tccggaagag atagaattca tcgcagacca caaaattcaa 7680
ggccgcaagg tgcttcccat gatggctgca atcgggttca tggcctctat tgcggaagga 7740
ctctacccgg ggtacaatct gcaaggcgtg gaaaatgctc agctctttca aggcttgact 7800
atcaaccaag agacaaaatt tcaaatcact ctcattgagg agcacaactc tgaggaaaac 7860
ctggatgtcc tgacatccct tggtgtaatg ttggaaagcg ggaaggtgct tcccgcttac 7920
cgatgtgttg tatgcttgaa tacaacccag cagcagccca agctatctcc aaaaattctt 7980
aacttggaag ttgaccctgc atgcgaggtt aacccctatg atggaaagtc gttgttccac 8040
ggtccgcttt tgcaattcgt tcaacaagtg ttgcactcaa gtaccaaagg cctcgttgcc 8100
aagtgccgcg cgcttccaat caaagaagcc atccgagggc catttatcaa gcaaacactc 8160
catgatccaa ttctagacga cgtcattttt cagctaatgc tcgtgtggtg tcgtaatgct 8220
ctaggaagtg catcgctacc caacagaatt gaaaagatgt catactttgg gaatgtctca 8280
gaaggtagca ctttctttgc ctcagttaca cctgtgggac caagagtacc aaaggatccc 8340
gtgatcaaaa tgcagtttct tctccaagat gaatccggca acacattttc atcgggggag 8400
ggctcggttg tgcttagtga cgaactcgtc ttttga 8436
<210> 20
<211> 2811
<212> PRT
<213> Thraustochytrium sp.
<400> 20
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1 5 10 15
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
20 25 30
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
35 40 45
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
50 55 60
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65 70 75 80
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
85 90 95
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
100 105 110
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
115 120 125
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
130 135 140
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145 150 155 160
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
165 170 175
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
180 185 190
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
195 200 205
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
210 215 220
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225 230 235 240
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
245 250 255
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
260 265 270
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
275 280 285
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
290 295 300
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305 310 315 320
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
325 330 335
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
340 345 350
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
355 360 365
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
370 375 380
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385 390 395 400
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
405 410 415
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
420 425 430
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
435 440 445
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
450 455 460
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465 470 475 480
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
485 490 495
Cys Asn Asp Gln Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys
500 505 510
Thr His Lys Asn Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu
515 520 525
Phe Gln Leu Gln Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe
530 535 540
Leu Ala Thr Leu Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile
545 550 555 560
Leu Ala Gln Leu Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro
565 570 575
His Lys Lys Ala Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly
580 585 590
Ser Val Ala Ala Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met
595 600 605
Phe Ser Asp Val Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val
610 615 620
Ala Met Glu Glu Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro
625 630 635 640
Ile Ser Lys Val Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu
645 650 655
Gln Gly Asn Glu Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr
660 665 670
Ile Ala Ala Ala Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe
675 680 685
Lys Pro Asp Met Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu
690 695 700
Tyr Ala Ala Gly Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys
705 710 715 720
Lys Arg Ala Lys Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala
725 730 735
Val Ile Gly Pro Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val
740 745 750
Tyr Val Ala Asn Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr
755 760 765
Val Gln Gly Val Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe
770 775 780
Arg Val Leu Pro Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met
785 790 795 800
Gly Pro Ser Glu Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile
805 810 815
Ser Pro Pro Lys Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu
820 825 830
Ser Pro Asn Pro Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val
835 840 845
Gln Phe Glu Glu Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val
850 855 860
Phe Leu Glu Phe Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu
865 870 875 880
Met Phe Pro Ser Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly
885 890 895
Asp Ser Asp Val Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser
900 905 910
Gly Ala Ala Leu Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln
915 920 925
Asp Leu Leu Ile Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala
930 935 940
Ala Thr Tyr Val Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met
945 950 955 960
Glu Asp Ile Lys Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser
965 970 975
Ile Gly Lys Ile Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu
980 985 990
Thr Glu Ile Arg Arg Leu Asn Lys Glu Leu Glu His Leu Lys Arg Glu
995 1000 1005
Leu Ala Ala Ala Lys Ala Ser Val Lys Ser Ala Ser Lys Ser Ser
1010 1015 1020
Lys Glu Arg Ser Val Leu Ser Lys His Arg Ala Leu Leu Gln Asn
1025 1030 1035
Ile Leu Gln Asp Tyr Asp Asp Leu Arg Val Val Pro Phe Ala Val
1040 1045 1050
Arg Ser Val Ala Val Asp Asn Thr Ala Pro Tyr Ala Asp Gln Val
1055 1060 1065
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys
1070 1075 1080
Arg Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala
1085 1090 1095
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met
1100 1105 1110
Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
1115 1120 1125
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser
1130 1135 1140
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val
1145 1150 1155
Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln
1160 1165 1170
Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
1175 1180 1185
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val
1190 1195 1200
Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val
1205 1210 1215
Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp
1220 1225 1230
Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
1235 1240 1245
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser
1250 1255 1260
Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile
1265 1270 1275
Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu
1280 1285 1290
Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
1295 1300 1305
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg
1310 1315 1320
Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys
1325 1330 1335
Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu
1340 1345 1350
Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
1355 1360 1365
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala
1370 1375 1380
Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys
1385 1390 1395
Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser
1400 1405 1410
Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
1415 1420 1425
Ser Ser Ser Ile Ala Asn Val Leu Ser Ala Arg Leu Ala Glu Ala
1430 1435 1440
Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp
1445 1450 1455
Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly
1460 1465 1470
Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
1475 1480 1485
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr
1490 1495 1500
Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly
1505 1510 1515
Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro
1520 1525 1530
Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
1535 1540 1545
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val
1550 1555 1560
Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile
1565 1570 1575
Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile
1580 1585 1590
Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
1595 1600 1605
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly
1610 1615 1620
Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly
1625 1630 1635
Gln Thr Leu Thr Ser Glu Pro Ile His Gln Pro Pro Val Ser Glu
1640 1645 1650
Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
1655 1660 1665
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu
1670 1675 1680
Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met
1685 1690 1695
Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu
1700 1705 1710
Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
1715 1720 1725
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu
1730 1735 1740
Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr
1745 1750 1755
Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro
1760 1765 1770
Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
1775 1780 1785
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr
1790 1795 1800
Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser
1805 1810 1815
Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu
1820 1825 1830
Val Gln Ala Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
1835 1840 1845
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Met
1850 1855 1860
Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile
1865 1870 1875
Arg Glu Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser
1880 1885 1890
Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
1895 1900 1905
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser
1910 1915 1920
Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val
1925 1930 1935
Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu
1940 1945 1950
Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
1955 1960 1965
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Glu
1970 1975 1980
Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu His Thr
1985 1990 1995
Ser Tyr Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr
2000 2005 2010
Arg Phe Ala Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys
2015 2020 2025
Ser Thr Val Ser His Asp Arg Pro Val Ile Val Val Asp Asp Gly
2030 2035 2040
Thr Pro Leu Thr Thr Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile
2045 2050 2055
Val Val Leu Ser Tyr Gln Gly Lys Pro Ala Gly Pro Arg Gly Val
2060 2065 2070
Glu Val Pro Asp Leu Ser Glu Glu Ala Leu Ile Gln Ala Leu Ala
2075 2080 2085
Leu Ile Arg Ser Thr Tyr Gly Val Pro Ile Gly Phe Ile Cys Gln
2090 2095 2100
Gln Val Ser Asn Val Ser Thr Lys Ala Gln Leu Cys Trp Ala Leu
2105 2110 2115
Leu Ala Ala Lys His Leu Lys Lys Asp Leu Asn Ala Val Leu Pro
2120 2125 2130
Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg Leu Asn Gly Lys
2135 2140 2145
Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys Phe Asp Leu
2150 2155 2160
Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu Gly Leu
2165 2170 2175
Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg Gly
2180 2185 2190
Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
2195 2200 2205
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val
2210 2215 2220
Gly Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp
2225 2230 2235
Leu Leu Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu
2240 2245 2250
Phe Leu Val Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val
2255 2260 2265
Arg Glu Ile Ala Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val
2270 2275 2280
Gly Arg Ser Glu Met Ser Asp Glu Pro Asp Trp Ala Val Gly His
2285 2290 2295
Tyr Asn Lys Asp Leu Asp Gln Ser Thr Met Lys His Leu Lys Ala
2300 2305 2310
Thr His Ala Ala Gly Gly Val Lys Pro Thr Pro Lys Ala His Arg
2315 2320 2325
Ala Leu Val Asn Arg Val Thr Gly Ser Arg Glu Val Arg Glu Ser
2330 2335 2340
Leu Arg Ala Ile Gln Glu Ala Gly Ala Asn Val Glu Tyr Ile Ala
2345 2350 2355
Cys Asp Val Ser Asp Glu Asn Lys Val Arg Gln Leu Val Gln Arg
2360 2365 2370
Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly Ile Trp His Ala
2375 2380 2385
Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys Thr Thr Asp
2390 2395 2400
Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu Val Asn
2405 2410 2415
Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile Leu
2420 2425 2430
Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
2435 2440 2445
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu
2450 2455 2460
Ser Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly
2465 2470 2475
Pro Trp Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His
2480 2485 2490
Phe Lys Ala Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala
2495 2500 2505
Arg Thr Val Ala Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser
2510 2515 2520
Leu Leu Gly Asn Trp Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg
2525 2530 2535
Ser Asn Val Val Thr Gly Thr Leu Ser Pro Glu Glu Ile Glu Phe
2540 2545 2550
Ile Ala Asp His Lys Ile Gln Gly Arg Lys Val Leu Pro Met Met
2555 2560 2565
Ala Ala Ile Gly Phe Met Ala Ser Ile Ala Glu Gly Leu Tyr Pro
2570 2575 2580
Gly Tyr Asn Leu Gln Gly Val Glu Asn Ala Gln Leu Phe Gln Gly
2585 2590 2595
Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln Ile Thr Leu Ile Glu
2600 2605 2610
Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu Thr Ser Leu Gly
2615 2620 2625
Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr Arg Cys Val
2630 2635 2640
Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser Pro Lys
2645 2650 2655
Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro Tyr
2660 2665 2670
Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
2675 2680 2685
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg
2690 2695 2700
Ala Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln
2705 2710 2715
Thr Leu His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met
2720 2725 2730
Leu Val Trp Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn
2735 2740 2745
Arg Ile Glu Lys Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser
2750 2755 2760
Thr Phe Phe Ala Ser Val Thr Pro Val Gly Pro Arg Val Pro Lys
2765 2770 2775
Asp Pro Val Ile Lys Met Gln Phe Leu Leu Gln Asp Glu Ser Gly
2780 2785 2790
Asn Thr Phe Ser Ser Gly Glu Gly Ser Val Val Leu Ser Asp Glu
2795 2800 2805
Leu Val Phe
2810
<210> 21
<211> 5808
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> misc_feature
<222> (1)..(5808)
<223> n = a, c, t, or g
<400> 21
atgcaacttc ctccagcgca ttctgccgat gagaatcgca tcgcggtcgt gggcatggcc 60
gtcaaatatg cgggctgtga caataaagaa gagttttgga agactttgat gaatggtagt 120
atcaatacca agtcgatttc ggcagcaagg ttgggcagca ataagcgtga cgaacactat 180
gttcctgaac gatcgaaata tgcagatacg ttctgtaacg aaaggtacgg ttgtatccag 240
caaggtacgg ataatgagca tgacctcctc ctaggtcttg ctcaagaagc tctcgctgac 300
gctgccgggc ggatggagaa acaaccttcg gaggcgttcg atctggaaaa tactggcatc 360
gtgagtgggt gcttatcttt tccaatggat aacctgcaag gagagttgtt gaacttgtat 420
caaagccatg tggagaaaca acttccacct agtgccttgg tagaagccgt gaagctttgg 480
tctgagcgac agaaatctac gaaagcacat gcaggggaca agcgccggtt cattgaccca 540
gcttcttttg tagctgataa actgaaccta ggcccactac attatgcgat cgatgcagca 600
tgcgcttctg cattgtacgt gttaaaatta gctcaagacc accttgtttc aggtgccgtt 660
gatatgatgt tatgtggagc gacgtgcttc ccagaaccat tcttcatctt gtctgggttc 720
tcgacttttc aagcgatgcc tgntggggca gatggagtct cactacctct ccataaaacg 780
agtgctgggc tcactccagg tgaagggggg tccattatgg tgctcaagcg actgaaagac 840
gctatcagag atggaaatca catttatggt gtgctccttg aagcaaattt aagtaacgca 900
ggttgtgggc ttccactcag cccgcactta ccgagcgaag aatcatgtat tcgtgatacc 960
taccgccgtg ctggagttgc tgcagatcaa agtattcagt atattgagtg ccacgctacg 1020
ggaacccctc gaggggatgt cgtggaaatt gaggcggttg aaagagtttt caagaaaaac 1080
gttccacgct taggctcgac gaaaggaaat tttggtcact cgttagttgc ggctggtttc 1140
gcaggtatgg caaagcttct tcttgcaatg gaacatggag tgattcctcc cacaccaggt 1200
cttgatgctt cgaaccaggc aagtgagcac gttgtgacaa aggctatcac ttggcctgag 1260
acacatgggg ctccaaaacg agctggcctt tcagcatttg gatttggtgg gactaatgcg 1320
catgcactct tcgaagagtt taatgccgag ggcataagtt atcgccctgg aaagcctcca 1380
gtcgaatcga atacccgtcc ttccgtcgta ataactggga tggactgtac ctttgggagc 1440
cttgaaggga ttgatgcgtt cgagactgcc ctgtacgagg ggcgtgacgc agctcgtgac 1500
ttacccgcca aacgttggag gttcctaggt gaggacttgg agtttctccg agccatcagg 1560
ctcaaggaaa agcctagggg ttgttttgtg gagagtgttg acgttaactt tagacggctg 1620
aaaacgccct tgacaccaga agatatgttg cggccccaac aactcttggc ggtttctacg 1680
atggaccgag caattatcga tgcaggtcta aagaagggcc aacatgtagc agttcttgtt 1740
ggcctaggaa ctgacctgga actttaccgt catcgagcaa gagtcgcgct taaagaggtt 1800
ttgcacccga gcttaaagtc agacactgca attctccaga aaataatgca atatgtgaat 1860
gatgcaggaa cttcgacttc atacacatct tacattggaa acctcgttgc cacgcgtatt 1920
tcgtctcagt ggggattcac agggccgtcc tttactgtca cagaaggaaa taattccgtg 1980
tacagatgtg cacaactagc caaagatatg cttcaggtta accgagttga tgctgtcgtc 2040
atcgcaggcg ttgatctcaa cggaagcgcc gaaagttttt ttgtccgagc aaatcgtcaa 2100
aagatatcca agctaagtca tccatgtgca agcttcgaca gagatgcaga tggatttttc 2160
gcaggtgagg gctgtggtgc cctagttttc aagaggttag aagactgtgc tcctcaggaa 2220
aaaatttatg ctagtataga ctctatcgca atagataaag agcctactag ctcagctgtg 2280
aaagctgtct accaaagtga ttcgagtctc tccgatattg agctgttaga aatcagtgga 2340
gactccaaac ggtttgcagc attcgaaggc gctgtggaaa ttcaatcaag tgtggaagcc 2400
cagctaaaag gactttccaa agtccttgaa cctgcaaaag gccaaggcgt agcggtggga 2460
agtactcgag caaccgttgg ggatataggg tatgctacag gagcggcaag cctgattaaa 2520
actgcactct gcttatataa tcgctacctt ccggcattag caaactggag tggcccatgt 2580
gaacagtccg cctggggctc aaacatgttc gtttgccatg aaacacggcc gtggatgaaa 2640
aaccagaatg aaaagagatg tgccctcatt tctggaacag atccatctca tacatgcttt 2700
tccctcgtac tatcggatac tgggtgttat gaagagcaca atcgaacgtg ctttgatgtg 2760
caagcgccac agctagttct gatacacgga ttcgatggaa aaactattgt gcggcgactt 2820
gaaggatatc tccttgaact tgttgaaggg catgcaagcc cttcagagta tttccacaaa 2880
ctgattggac aaagtctact tgagaactcg aaagaaagta aactcacact ttcgcttgtg 2940
tgcaatccga accagctcca aaaggagctc atgcttgcta tcaaaggagt acaacgaagc 3000
atgttaacag ggaaggattg ggtcagtcca tcaggaagtt gttttgcccc aaatccgtta 3060
tcaagcgcaa aagtggcatt catgtacgga gaaggccgaa gcccgtactg tggtgtaggc 3120
ttgggtctac atcgtttgtg gcccggtctc catgaaaatg tgaacaataa gacagtcgat 3180
ttatggacgg aaggagatgg ttggttatat cctcgaacgt tgacacgaga agagcataca 3240
aaagccatcg aatctttcaa cgcaaatcaa attgaaatgt ttcgcgctgg gattttcatc 3300
tcaatgtgtc agacagacta tgtcatgaat gttctcggtg tccagcctaa ggccggattt 3360
gggctgagct tgggagaaat ttcaatgctc tttgcgatgt caaaggagaa ctgcaggcag 3420
tcacaggaaa tgaccaatcg tttgcgcggt tctccagtgt ggtctaacga gcttgctatc 3480
aacttcaatg caattcgcaa gttatggaaa atcccccgag gagctccctt agaatccttt 3540
tggcaaggat acttggttca cggcacaaga gaagaagtag agcatgctat tggtctttct 3600
gagccttatg tacgtctgct tattgtgaac gattcaagga gtgccttgat tgctggaaaa 3660
ccagacgcct gtcaggcagt aatcagtaga ctaaactcca agttcccttc tctgccggta 3720
aagcaaggaa tgattggtca ttgcccagaa gttcgtgcgt tcatcaaaga tattgggtac 3780
atccatgaaa cactccgaat ttccaatgac tattcggatt gtcagctttt ctcagcggta 3840
accaagggcg cacttgacag ctccacaatg gaaatcaaac actttgtggg agaggtctac 3900
tcccggatcg cagactttcc tcaaatcgtc aacacggtgc attcggctgg ttatgacgta 3960
tttcttgagc ttggctgtga tgcttctaga tctgcagcag ttcaaaacat tcttggtggt 4020
caaggaaagt tcttgtctac agctattgac aaaaaaggac actccgcctg gtcacaagta 4080
cttcgggcta ccgcatcatt agctgcacat cgagtaccgg gaatctcaat tttggatttg 4140
tttcacccaa atttccgaga aatgtgctgt acaatggcaa ccacacctaa agtggaagat 4200
aagttcctgc gcacgattca aatcaatggt cggtttgaaa aagaaatgat tcacctagaa 4260
gatacaacat taagttgctt acccgctcca agtgaagcaa atatcgcagc tattcaatct 4320
cggtcaattc gatctgctgc ggcgcgttct ggacaatccc atgattgtgc atcccatagc 4380
catgaagaaa ataaggattc atgccctgaa aagctgaagc ttgattctgt gtccgtcgcc 4440
ataaatttcg acaatgatga ccgcattcag cttgggcacg cgggttttcg ggagatgtac 4500
aatacaagat atagcttgta cacaggggcg atggcaaagg gaattgcatc tgcagatctt 4560
gtcattgccg ctgggaaaga gggcatccta gcttcctatg gagctggagg actacctctt 4620
gctactgttc gaaagggaat agacaaaatt caacaagcct tgccaagtgg cccatatgct 4680
gtaaatctta ttcactctcc ctttgacggc aacttggagc agggaaacgt cgatttgttc 4740
ttggaaaaga acgtccgcgt ggcggaatgt tccgcgttta caacgctaac agtgccagta 4800
gtacactatc gtgctgcagg gcttgttcgg cgccaagatg gaagcatttt gatcaagaac 4860
cgaatcattg ctaaagtatc taggacagaa ctcgctgaga tgttccttcg tccggcacct 4920
caaatcatcc tcgaaaaact ggtagcagca gaaatcattt catctgacca agcgcgtatg 4980
gcagccaaag ttcccatggc ggacgacatc gcagtcgaag ccgactctgg tgggcacacg 5040
gataatcggc ctatgcacgt cattttgccc ctgataattc aactccgcaa tactatactt 5100
gcagagtatg gctgtgccac ggcttttcgt acccgtatag gcgctggagg aggcattggt 5160
tgtccttcag cggccctcgc agcctttgat atgggtgcga gttttgtcgt gactggaagc 5220
ataaatcaaa tttgccgcga ggcagggact tgcgatactg ttcgggagct acttgccaac 5280
tcaagctact cggacgtgac gatggcgcca gcagcagaca tgtttgacca aggtgtgaaa 5340
ctccaagtct taaaacgagg aacgatgttt ccaagcagag caaataaact ccggaagctc 5400
tttgtgaact acgaatctct agaaacactc ccgtcgaaag agttgaaata cctggaaaac 5460
atcatattca agcaagcagt agaccaggtg tgggaggaaa caaagcgctt ttactgtgaa 5520
aaactgaaca atccagataa aattgcaagg gccatgaaag atcctaaatt gaagatgtcg 5580
ctttgctttc ggtggtatct ctccaagagc tctgggtggg ccaacgcagg aattaaatct 5640
cgtgcactcg actaccagat ctggtgtggc ccggcaatgg gctcgttcaa caatttcgcc 5700
agcggcacat ccctcgattg gaaagtgact ggggttttcc ctggcgttgc ggaagtaaac 5760
atggccattt tagatggcgc gcgagaacta gctgctaaac gaaattaa 5808
<210> 22
<211> 1935
<212> PRT
<213> Thraustochytrium sp.
<220>
<221> misc_feature
<222> (1)..(1935)
<223> Xaa = Asp, Gly, Ala, or Val
<400> 22
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1 5 10 15
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
20 25 30
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
35 40 45
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
50 55 60
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65 70 75 80
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
85 90 95
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
100 105 110
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
115 120 125
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
130 135 140
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145 150 155 160
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
165 170 175
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
180 185 190
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
195 200 205
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
210 215 220
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225 230 235 240
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
245 250 255
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
260 265 270
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
275 280 285
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
290 295 300
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305 310 315 320
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
325 330 335
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
340 345 350
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
355 360 365
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
370 375 380
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385 390 395 400
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
405 410 415
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
420 425 430
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
435 440 445
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
450 455 460
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465 470 475 480
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
485 490 495
Ala Ala Arg Asp Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp
500 505 510
Leu Glu Phe Leu Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys
515 520 525
Phe Val Glu Ser Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu
530 535 540
Thr Pro Glu Asp Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr
545 550 555 560
Met Asp Arg Ala Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val
565 570 575
Ala Val Leu Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg
580 585 590
Ala Arg Val Ala Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp
595 600 605
Thr Ala Ile Leu Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr
610 615 620
Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile
625 630 635 640
Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly
645 650 655
Asn Asn Ser Val Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln
660 665 670
Val Asn Arg Val Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly
675 680 685
Ser Ala Glu Ser Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys
690 695 700
Leu Ser His Pro Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe
705 710 715 720
Ala Gly Glu Gly Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys
725 730 735
Ala Pro Gln Glu Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp
740 745 750
Lys Glu Pro Thr Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser
755 760 765
Ser Leu Ser Asp Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg
770 775 780
Phe Ala Ala Phe Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala
785 790 795 800
Gln Leu Lys Gly Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly
805 810 815
Val Ala Val Gly Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala
820 825 830
Thr Gly Ala Ala Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg
835 840 845
Tyr Leu Pro Ala Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala
850 855 860
Trp Gly Ser Asn Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys
865 870 875 880
Asn Gln Asn Glu Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser
885 890 895
His Thr Cys Phe Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu
900 905 910
His Asn Arg Thr Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile
915 920 925
His Gly Phe Asp Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu
930 935 940
Leu Glu Leu Val Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys
945 950 955 960
Leu Ile Gly Gln Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr
965 970 975
Leu Ser Leu Val Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu
980 985 990
Ala Ile Lys Gly Val Gln Arg Ser Met Leu Thr Gly Lys Asp Trp Val
995 1000 1005
Ser Pro Ser Gly Ser Cys Phe Ala Pro Asn Pro Leu Ser Ser Ala
1010 1015 1020
Lys Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr Cys Gly
1025 1030 1035
Val Gly Leu Gly Leu His Arg Leu Trp Pro Gly Leu His Glu Asn
1040 1045 1050
Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu Gly Asp Gly Trp
1055 1060 1065
Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr Lys Ala Ile
1070 1075 1080
Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala Gly Ile
1085 1090 1095
Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu Gly
1100 1105 1110
Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
1115 1120 1125
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu
1130 1135 1140
Met Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu
1145 1150 1155
Ala Ile Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg
1160 1165 1170
Gly Ala Pro Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly
1175 1180 1185
Thr Arg Glu Glu Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr
1190 1195 1200
Val Arg Leu Leu Ile Val Asn Asp Ser Arg Ser Ala Leu Ile Ala
1205 1210 1215
Gly Lys Pro Asp Ala Cys Gln Ala Val Ile Ser Arg Leu Asn Ser
1220 1225 1230
Lys Phe Pro Ser Leu Pro Val Lys Gln Gly Met Ile Gly His Cys
1235 1240 1245
Pro Glu Val Arg Ala Phe Ile Lys Asp Ile Gly Tyr Ile His Glu
1250 1255 1260
Thr Leu Arg Ile Ser Asn Asp Tyr Ser Asp Cys Gln Leu Phe Ser
1265 1270 1275
Ala Val Thr Lys Gly Ala Leu Asp Ser Ser Thr Met Glu Ile Lys
1280 1285 1290
His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala Asp Phe Pro Gln
1295 1300 1305
Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val Phe Leu Glu
1310 1315 1320
Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn Ile Leu
1325 1330 1335
Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys Gly
1340 1345 1350
His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
1355 1360 1365
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro
1370 1375 1380
Asn Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val
1385 1390 1395
Glu Asp Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu
1400 1405 1410
Lys Glu Met Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro
1415 1420 1425
Ala Pro Ser Glu Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile
1430 1435 1440
Arg Ser Ala Ala Ala Arg Ser Gly Gln Ser His Asp Cys Ala Ser
1445 1450 1455
His Ser His Glu Glu Asn Lys Asp Ser Cys Pro Glu Lys Leu Lys
1460 1465 1470
Leu Asp Ser Val Ser Val Ala Ile Asn Phe Asp Asn Asp Asp Arg
1475 1480 1485
Ile Gln Leu Gly His Ala Gly Phe Arg Glu Met Tyr Asn Thr Arg
1490 1495 1500
Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala
1505 1510 1515
Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser Tyr
1520 1525 1530
Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
1535 1540 1545
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu
1550 1555 1560
Ile His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp
1565 1570 1575
Leu Phe Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe
1580 1585 1590
Thr Thr Leu Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu
1595 1600 1605
Val Arg Arg Gln Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile
1610 1615 1620
Ala Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Leu Arg Pro
1625 1630 1635
Ala Pro Gln Ile Ile Leu Glu Lys Leu Val Ala Ala Glu Ile Ile
1640 1645 1650
Ser Ser Asp Gln Ala Arg Met Ala Ala Lys Val Pro Met Ala Asp
1655 1660 1665
Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
1670 1675 1680
Pro Met His Val Ile Leu Pro Leu Ile Ile Gln Leu Arg Asn Thr
1685 1690 1695
Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala Phe Arg Thr Arg Ile
1700 1705 1710
Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala Ala Leu Ala Ala
1715 1720 1725
Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser Ile Asn Gln
1730 1735 1740
Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu Leu Leu
1745 1750 1755
Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala Asp
1760 1765 1770
Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
1775 1780 1785
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn
1790 1795 1800
Tyr Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu
1805 1810 1815
Glu Asn Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu
1820 1825 1830
Thr Lys Arg Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile
1835 1840 1845
Ala Arg Ala Met Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe
1850 1855 1860
Arg Trp Tyr Leu Ser Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile
1865 1870 1875
Lys Ser Arg Ala Leu Asp Tyr Gln Ile Trp Cys Gly Pro Ala Met
1880 1885 1890
Gly Ser Phe Asn Asn Phe Ala Ser Gly Thr Ser Leu Asp Trp Lys
1895 1900 1905
Val Thr Gly Val Phe Pro Gly Val Ala Glu Val Asn Met Ala Ile
1910 1915 1920
Leu Asp Gly Ala Arg Glu Leu Ala Ala Lys Arg Asn
1925 1930 1935
<210> 23
<211> 4410
<212> DNA
<213> Thraustochytrium sp.
<400> 23
atgggcccgc gagtggcgtc aggcaaggtg ccggcttggg agatgagcaa gtccgagctg 60
tgtgatgacc gcacggtagt ctttgactat gaggagctgc tggagttcgc tgagggcgat 120
atcagtaagg tttttgggcc ggagttcaaa gtggtggacg ggtttaggcg cagggtgagg 180
ttgcccgctc gagagtacct gctggtgacc cgggttacgc tgatggatgc cgaggtgggc 240
aactttcgag tgggagcacg tatggtgaca gagtatgacg tacctgtgaa cggagagctc 300
tcggaagggg gagatgtgcc gtgggctgtg ttggtggaag ccgggcagtg cgacttgctg 360
ctaatttctt acatgggcat cgatttccag tgcaaaggag agcgggtcta ccggctgctg 420
aacaccacct tgacgttttt tggcgtcgcg aaagaagggg aaacgcttgt gtacgatatt 480
cgcgtcacgg gtttcgccaa gaggccggac ggagatatct ccatgttctt tttcgaatat 540
gattgctact gcaatggcaa gcttctcatc gaaatgcgag atggctctgc aggcttcttc 600
acggacgaag agctcgctgc cggcaaagga gtggtcgtca ctcgtgcaca gcaaaacatg 660
cgggacaaaa ttgtacggca gtccattgag ccttttgcac tggcggcttg cacgcacaaa 720
acgactctga acgagagtga catgcagtcc cttgtggagc gaaactgggc aaacgttttt 780
ggcaccagta acaagatggc ggagctcaac tataaaattt gcgccaggaa aatgctcatg 840
atcgacaggg ttacccacat tgaccaccac ggtggggcgt atggcctcgg actacttgtt 900
ggagagaaga tcttggatcg aaaccattgg tactttcctt gtcactttgt caatgatcaa 960
gtcatggcag ggtcactggt cagcgatggt tgcagccagc tcttaaaact ctatatgatc 1020
tggcttggcc tccacctgaa aatggaggaa tttgattttc tcccagttag cggccacaaa 1080
aacaaggtgc gatgcagggg acaaatttca ccgcataaag gcaagcttgt ctacgtcatg 1140
gaaatcaaaa agatgggtta cgatcaagca tctggaagcc catacgccat cgcggacgtt 1200
gatatcattg acgtcaacga agagctgggt caaagttttg acatcaacga ccttgcgagc 1260
tacggaaaag gtgacctgag caaaaaaatc gtggttgact tcaaaggaat tgctttgcag 1320
ctcaaaggcc gcgctttttc acgcatgagt tccagctcgt ccttgaacga aggatggcaa 1380
tgtgttccaa aaccaagcca gagaatggaa cacgaacagc cccctgctca ctgccttgca 1440
agcgaccccg aagccccttc aactgtgacc tggcacccaa tgtcaaagct tcctggcaac 1500
cctacgccgt tcttctcccc ttcatcttac cctccgaggg caatttgctt catccctttc 1560
ccgggcaatc cccttgacaa caactgcaag gctggagaaa tgcccctgaa ctggtacaac 1620
atgtcagagt tcatgtgtgg caaggtttct aactgcttgg gcccagaatt cgcacgcttt 1680
gacaagtcga acaccagccg gagccctgct tttgacttgg ctctggtgac ccgagttgtt 1740
gaagtcacaa acatggaaca cggcaagttt ctaaacgttg attgcaatcc aagcaaaggc 1800
acaatggtgg gggagtttga ctgtccccaa gacgcgtggt tctttgatgg ttcgtgcaac 1860
gacggccata tgccgtattc cattatcatg gaaatcggac tgcaaacctc aggtgttctc 1920
acctcggtgt tgaaggcacc gctgactatg gacaaggatg acattctctt tcgaaacctc 1980
gatgcaagtg ctgaaatggt gcgtccagac gtggatgttc gcggcaaaac gattcgaaac 2040
gtgaccaagt gtaccggcta tgcaatgttg ggaaagatgg ggattcaccg gttcacgttt 2100
gagttgagcg ttgacggcgt ggtattttat aaaggatcca cttcctttgg atggttcact 2160
cccgaggtgt ttgctcagca agctggactc gacaacggga aaaagacgga gccctggtgc 2220
aagactaaca acacctcggt tcgaagagtt gaaatcgcat ccgccaaagg aaaagagcag 2280
ctgactgaga agcttcccga cgcaactaat gctcaagttc ttcggcgttc agagcagtgt 2340
gaatacctcg attacctcaa tattgcccct gactctgggc tgcatgggaa gggctacgcc 2400
cacggacaca aagacgttaa cccgcaagac tggttcttct cttgccactt ttggttcgat 2460
cctgtaatgc caggatcttt aggaattgaa tcaatgttcc agcttatcga ggcctttgcg 2520
gtggaccaaa acattcctgg agagtacaac gtatccaatc cgacctttgc ccatgcacca 2580
ggcaaaacgg cgtggaaata ccgaggccag ctcacaccaa agaaccgtgc gatggactgc 2640
gaggtgcata tcgtttcaat taccgcctcc cccgagaacg ggggctacgt tgacatcgtg 2700
gccgatggag cgctttgggt agatggactt cgcgtgtacg aagccaaaga gcttcgagtt 2760
cgtgtcgttt cggcaaaacc tcaagcaatt ccggatgtac aacaacagcc acctagcgca 2820
aaggcggacc cggggaaaac aggagttgca ctttcgccca ctcagctacg cgacgtcctg 2880
cttgaagtgg acaatccatt gtatcttggt gtagagaact ccaatttggt gcagtttgag 2940
tcgaaacctg caacttcttc acgtatcgtt tcgatcaaac cgtgctcgat tagtgacctt 3000
ggcgataagt cttttatgga aacgtacaac gtgtcagcac ctctgtatac tggagcaatg 3060
gccaagggca ttgcatccgc cgacttggtc attgctgctg ggaaacgcaa gatacttgga 3120
tcgtttggtg cgggagggct gcctatttcc atagtccgtg aagcactgga gaaaattcaa 3180
caacacctgc cccacggccc ctacgctgtt aacctcattc actcgccttt cgacagcaac 3240
ttggaaaagg gcaacgttga cctctttctc gagatgggcg tgacagtggt agaatgcagc 3300
gcgttcatgg aactcacggc ccaggttgtc cggtaccgcg cgtctggtct aagcaaaagt 3360
gcggacggtt cgattcgcat tgctcaccgt attattggca aggtttccag aaccgagctg 3420
gcagaaatgt ttattcgtcc agcaccacag cacctcctcc aaaaactcgt agcctccggc 3480
gagctgacag ctgagcaagc cgagcttgca acacaggttc cggtggcgga tgacattgcg 3540
gtcgaagccg actcgggggg gcataccgac aacaggccta ttcacgtcat tcttcctcta 3600
atcatcaacc tacgcaaccg tttgcataaa gagcttgact acccttcgca tctccgggta 3660
cgtgtgggtg ctggtggtgg tattggatgt cctcaagccg ctcttgcagc atttcaaatg 3720
ggggcagcgt ttttaatcac tggaacggtg aaccagcttg ctcgtgaaag tggcacttgt 3780
gacaacgtcc ggttacagct ctcaaaggcc acgtatagcg acgtgtgtat ggctcctgct 3840
gccgatatgt ttgaccaagg cgtggagctg caagtattga agaaaggcac gctgttccca 3900
agtcgtgcta agaagctgta cgagctgttc tgcaagtatg actcgtttga ggcaatgccg 3960
gctgaagaat tgcaacgggt tgaaaagcgg atttttcaaa agtcgcttgc tgaagtttgg 4020
caggagacca gtgactttta cattcatcgt atcaagaacc ctgagaaaat caatcgtgct 4080
gcaagcgatg gcaaactgaa aatgtcgctt tgctttcgct ggtaccttgg gctttcctca 4140
ttttgggcca actctggggc acaagatcgc gtcatggact atcaaatttg gtgtggccct 4200
gctattggcg ctttcaatga ttttaccaag ggcacgtacc ttgacgtgac tgttgcaaag 4260
agttaccctt gtgtggcaca gatcaatttg caaattttgc aaggagctgc gtatctgaaa 4320
cgccttggtg tcattcgttt tgaccgcatg ctgctgcagg ccgtcgatat cgacgatcct 4380
gtatttactt acgtgccgac ccagccactt 4410
<210> 24
<211> 1470
<212> PRT
<213> Thraustochytrium sp.
<400> 24
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1 5 10 15
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
35 40 45
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65 70 75 80
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
100 105 110
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
180 185 190
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
195 200 205
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
210 215 220
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225 230 235 240
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
245 250 255
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
260 265 270
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
275 280 285
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
290 295 300
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
325 330 335
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
340 345 350
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
370 375 380
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385 390 395 400
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
405 410 415
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
420 425 430
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
435 440 445
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
450 455 460
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465 470 475 480
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
485 490 495
Leu Pro Gly Asn Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro
500 505 510
Arg Ala Ile Cys Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn
515 520 525
Cys Lys Ala Gly Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe
530 535 540
Met Cys Gly Lys Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe
545 550 555 560
Asp Lys Ser Asn Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val
565 570 575
Thr Arg Val Val Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn
580 585 590
Val Asp Cys Asn Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys
595 600 605
Pro Gln Asp Ala Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met
610 615 620
Pro Tyr Ser Ile Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu
625 630 635 640
Thr Ser Val Leu Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu
645 650 655
Phe Arg Asn Leu Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp
660 665 670
Val Arg Gly Lys Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala
675 680 685
Met Leu Gly Lys Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val
690 695 700
Asp Gly Val Val Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr
705 710 715 720
Pro Glu Val Phe Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr
725 730 735
Glu Pro Trp Cys Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile
740 745 750
Ala Ser Ala Lys Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala
755 760 765
Thr Asn Ala Gln Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp
770 775 780
Tyr Leu Asn Ile Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala
785 790 795 800
His Gly His Lys Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His
805 810 815
Phe Trp Phe Asp Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met
820 825 830
Phe Gln Leu Ile Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu
835 840 845
Tyr Asn Val Ser Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala
850 855 860
Trp Lys Tyr Arg Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys
865 870 875 880
Glu Val His Ile Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr
885 890 895
Val Asp Ile Val Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val
900 905 910
Tyr Glu Ala Lys Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln
915 920 925
Ala Ile Pro Asp Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro
930 935 940
Gly Lys Thr Gly Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu
945 950 955 960
Leu Glu Val Asp Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu
965 970 975
Val Gln Phe Glu Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile
980 985 990
Lys Pro Cys Ser Ile Ser Asp Leu Gly Asp Lys Ser Phe Met Glu Thr
995 1000 1005
Tyr Asn Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly
1010 1015 1020
Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Arg Lys Ile
1025 1030 1035
Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Ile Ser Ile Val Arg
1040 1045 1050
Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro His Gly Pro Tyr
1055 1060 1065
Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn Leu Glu Lys
1070 1075 1080
Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val Val Glu
1085 1090 1095
Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr Arg
1100 1105 1110
Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
1115 1120 1125
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met
1130 1135 1140
Phe Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala
1145 1150 1155
Ser Gly Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val
1160 1165 1170
Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
1175 1180 1185
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn
1190 1195 1200
Leu Arg Asn Arg Leu His Lys Glu Leu Asp Tyr Pro Ser His Leu
1205 1210 1215
Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
1220 1225 1230
Ala Leu Ala Ala Phe Gln Met Gly Ala Ala Phe Leu Ile Thr Gly
1235 1240 1245
Thr Val Asn Gln Leu Ala Arg Glu Ser Gly Thr Cys Asp Asn Val
1250 1255 1260
Arg Leu Gln Leu Ser Lys Ala Thr Tyr Ser Asp Val Cys Met Ala
1265 1270 1275
Pro Ala Ala Asp Met Phe Asp Gln Gly Val Glu Leu Gln Val Leu
1280 1285 1290
Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys Lys Leu Tyr Glu
1295 1300 1305
Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro Ala Glu Glu
1310 1315 1320
Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu Ala Glu
1325 1330 1335
Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys Asn
1340 1345 1350
Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
1355 1360 1365
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala
1370 1375 1380
Asn Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys
1385 1390 1395
Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr
1400 1405 1410
Leu Asp Val Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile
1415 1420 1425
Asn Leu Gln Ile Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly
1430 1435 1440
Val Ile Arg Phe Asp Arg Met Leu Leu Gln Ala Val Asp Ile Asp
1445 1450 1455
Asp Pro Val Phe Thr Tyr Val Pro Thr Gln Pro Leu
1460 1465 1470
<210> 25
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 25
ggyatgmtgr ttggtgaagg 20
<210> 26
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 26
trttsasrta ytgygaacct tg 22
<210> 27
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = a, c, t, or g
<400> 27
atgkcngaag gttgtggcca 20
<210> 28
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 28
ccwgaratra agccrttdgg ttg 23
<210> 29
<211> 192
<212> DNA
<213> Schizochytrium sp.
<220>
<221> misc_feature
<222> (1)..(7)
<223> BspHI restriction site
<220>
<221> misc_feature
<222> (188)..(192)
<223> SacII restriction site
<400> 29
tcatgaagcc ggttgctccg aagttctacg cgcgtctcaa cattgacgag caggacgaga 60
cccgtgatcc gatcctcaac aaggacaacg cgccgtcttc cagctctagc tcctcttcca 120
gctcttccag ctcttccagc ccgtcgccag ctccgtccgc cccagtgcaa aagaaggctg 180
ctccggccgc gg 192
<210> 30
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 30
cggggtaccc gggagccgcc ttggctttgt 30
<210> 31
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> primer
<400> 31
aaactgcagc ccgggtccag ctggcaggca ccctg 35
<210> 32
<211> 237
<212> PRT
<213> Nostoc sp.
<400> 32
Leu Leu Gln His Thr Trp Leu Pro Lys Pro Pro Asn Leu Thr Leu Leu
1 5 10 15
Ser Asp Glu Val His Leu Trp Arg Ile Pro Leu Asp Gln Pro Glu Ser
20 25 30
Gln Leu Gln Asp Leu Ala Ala Thr Leu Ser Ser Asp Glu Leu Ala Arg
35 40 45
Ala Asn Arg Phe Tyr Phe Pro Glu His Arg Arg Arg Phe Thr Ala Gly
50 55 60
Arg Gly Ile Leu Arg Ser Ile Leu Gly Gly Tyr Leu Gly Val Glu Pro
65 70 75 80
Gly Gln Val Lys Phe Asp Tyr Glu Ser Arg Gly Lys Pro Ile Leu Gly
85 90 95
Asp Arg Phe Ala Glu Ser Gly Leu Leu Phe Asn Leu Ser His Ser Gln
100 105 110
Asn Leu Ala Leu Cys Ala Val Asn Tyr Thr Arg Gln Ile Gly Ile Asp
115 120 125
Leu Glu Tyr Leu Arg Pro Thr Ser Asp Leu Glu Ser Leu Ala Lys Arg
130 135 140
Phe Phe Leu Pro Arg Glu Tyr Glu Leu Leu Arg Ser Leu Pro Asp Glu
145 150 155 160
Gln Lys Gln Lys Ile Phe Phe Arg Tyr Trp Thr Cys Lys Glu Ala Tyr
165 170 175
Leu Lys Ala Thr Gly Asp Gly Ile Ala Lys Leu Glu Glu Ile Glu Ile
180 185 190
Ala Leu Thr Pro Thr Glu Pro Ala Lys Leu Gln Thr Ala Pro Ala Trp
195 200 205
Ser Leu Leu Glu Leu Val Pro Asp Asp Asn Cys Val Ala Ala Val Ala
210 215 220
Val Ala Gly Phe Gly Trp Gln Pro Lys Phe Trp His Tyr
225 230 235
<210> 33
<211> 23
<212> DNA
<213> Sh. japonica
<400> 33
ctgaacactg gagactcaaa atg 23
<210> 34
<211> 23
<212> DNA
<213> Sh. japonica
<400> 34
gctgacttgc aggagtctgt gtg 23
<210> 35
<211> 23
<212> DNA
<213> Sh. japonica
<400> 35
caattagaag gagaacaatc ttg 23
<210> 36
<211> 23
<212> DNA
<213> Sh. japonica
<400> 36
agaggcataa aggaataata atg 23
<210> 37
<211> 23
<212> DNA
<213> Sh. japonica
<400> 37
gcgacctaga acaagcgaca atg 23
<210> 38
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 38
ctgaacactg gagactcaaa atg 23
<210> 39
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 39
gctgatttgc aggagtctgt gtg 23
<210> 40
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 40
caattagaag gagaacaatc ttg 23
<210> 41
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 41
agaggcataa aggaataata atg 23
<210> 42
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 42
caatttagcc tgagcctagt ttg 23
<210> 43
<211> 23
<212> DNA
<213> Sh. japonica
<400> 43
taaatcgcac tggtattgtc atg 23
<210> 44
<211> 23
<212> DNA
<213> Sh. japonica
<400> 44
aagcactcaa tgatgctggt gtg 23
<210> 45
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 45
taaaccgcac cggtattgtc atg 23
<210> 46
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 46
acccagctga ctatcaaggt gtg 23
<210> 47
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 47
atgaatcgac tgcgtctatt gtg 23
<210> 48
<211> 23
<212> DNA
<213> Sh. olleyana
<400> 48
catctagaga acaaggttta atg 23
<210> 49
<211> 27
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 49
cggtacccgc gaatcaagaa ggtaggc 27
<210> 50
<211> 27
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 50
cggatcccgt ctctgccgct ttttctt 27
<210> 51
<211> 30
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 51
cggatccgaa agtgaacctt gtcctaaccc 30
<210> 52
<211> 27
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 52
ctctagacag atccgcacca tcggccg 27
<210> 53
<211> 19
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 53
cactagtacc gctgcggaa 19
<210> 54
<211> 34
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 54
cactcgcggg cccatcgtct ctgccgcttt ttct 34
<210> 55
<211> 34
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 55
aaagcggcag agacgatggg cccgcgagtg gcgt 34
<210> 56
<211> 28
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 56
gatttaaatc cttctttcgc gacgccaa 28
<210> 57
<211> 33
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 57
cgatttaaat gcatgctgct gcaggccgtc gat 33
<210> 58
<211> 34
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 58
acaaggttca ctttcttaaa gtggctgggt cggc 34
<210> 59
<211> 34
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 59
acccagccac tttaagaaag tgaaccttgt ccta 34
<210> 60
<211> 19
<212> DNA
<213> artificial sequence
<220>
<223> primer
<400> 60
ggtcgacaaa cattttctt 19
<210> 61
<211> 7
<212> PRT
<213> Shewanella sp.
<400> 61
Met Val Arg Gly Tyr Leu Arg
1 5
<210> 62
<211> 54
<212> PRT
<213> Shewanella sp.
<400> 62
Leu Ile Ser Leu Tyr Phe Cys Pro Leu Thr Ile Gln Glu Cys Asp Asn
1 5 10 15
Gln Thr Thr Glu Leu Val Lys Ser Trp Leu Pro Glu Asp Glu Leu Ile
20 25 30
Lys Val Asn Arg Tyr Ile Lys Gln Glu Ala Lys Thr Gln Gly Leu Met
35 40 45
Val Arg Gly Tyr Leu Arg
50
Claims (86)
- (a) 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 아미노산 서열을 코딩하는 핵산 서열,(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편을 코딩하는 핵산 서열,(c) 서열 2 또는 서열 8과 약 65% 이상 동일하며, KS 활성, MAT 활성, KR 활성, ACP 활성 및 비-FabA-유사 데히드라제 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(d) 서열 3 또는 서열 9와 약 60% 이상 동일하며, AT 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(e) 서열 4 또는 서열 10과 약 70% 이상 동일하며, KS 활성, CLF 활성 및 DH 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(f) 서열 6 또는 서열 12와 약 60% 이상 동일하며, PPTase 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열, 및(g) 서열 11과 약 85% 이상 동일하거나 서열 5와 약 95% 이상 동일하며, ER 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열로 구성된 군에서 선택된 핵산 서열을 포함하는 단리된 핵산 분자.
- 제1항에 있어서, 상기 핵산 서열이(a) 서열 2 또는 서열 8과 약 75% 이상 동일하며, KS 활성, MAT 활성, KR 활성, ACP 활성 및 비-FabA-유사 데히드라제 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(b) 서열 3 또는 서열 9와 약 70% 이상 동일하며, AT 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(c) 서열 4 또는 서열 10과 약 80% 이상 동일하며, KS 활성, CLF 활성 및 DH 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(d) 서열 6 또는 서열 12와 약 70% 이상 동일하며, PPTase 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열, 및(e) 서열 11과 약 95% 이상 동일하거나 서열 5와 약 96% 이상 동일하며, ER 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열로 구성된 군에서 선택된 단리된 핵산 분자.
- 제1항에 있어서, 상기 핵산 서열이(a) 서열 2 또는 서열 8과 약 85% 이상 동일하며, KS 활성, MAT 활성, KR 활성, ACP 활성 및 비-FabA-유사 데히드라제 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(b) 서열 3 또는 서열 9와 약 80% 이상 동일하며, AT 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(c) 서열 4 또는 서열 10과 약 90% 이상 동일하며, KS 활성, CLF 활성 및 DH 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(d) 서열 6 또는 서열 12와 약 80% 이상 동일하며, PPTase 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열, 및(e) 서열 11과 약 96% 이상 동일하거나 서열 5와 약 97% 이상 동일하며, ER 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열로 구성된 군에서 선택된 단리된 핵산 분자.
- 제1항에 있어서, 상기 핵산 서열이(a) 서열 2 또는 서열 8과 약 95% 이상 동일하며, KS 활성, MAT 활성, KR 활성, ACP 활성 및 비-FabA-유사 데히드라제 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(b) 서열 3 또는 서열 9와 약 90% 이상 동일하며, AT 생물학적 활성을 보유 하는 아미노산 서열을 코딩하는 핵산 서열,(c) 서열 4 또는 서열 10과 약 95% 이상 동일하며, KS 활성, CLF 활성 및 DH 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열,(d) 서열 6 또는 서열 12와 약 90% 이상 동일하며, PPTase 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열, 및(e) 서열 11과 약 97% 이상 동일하거나 서열 5와 약 98% 이상 동일하며, ER 생물학적 활성을 보유하는 아미노산 서열을 코딩하는 핵산 서열로 구성된 군에서 선택된 단리된 핵산 분자.
- 제1항에 있어서, 상기 핵산 서열이(a) 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 아미노산 서열, 및(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로 구성된 군에서 선택된 아미노산 서열을 코딩하는 단리된 핵산 분자.
- 제1항에 있어서, (b)에 기재한 상기 단편이(a) 서열 2의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(b) 서열 2의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(c) 서열 2의 위치 약 1264 내지 위치 약 1889로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 2의 단편,(d) 서열 2의 위치 약 2264 내지 위치 약 2398로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(e) 서열 2의 위치 약 2504 내지 위치 약 2516을 포함하며, 비-FabA-유사 데히드라제 생물학적 활성을 보유하는 서열 2의 단편,(f) 서열 3의 위치 약 378 내지 위치 약 684로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 3의 단편,(g) 서열 4의 위치 약 5 내지 위치 약 483으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(h) 서열 4의 위치 약 489 내지 위치 약 771로 이루어지며, CLF 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(i) 서열 4의 위치 약 1428 내지 위치 약 1570으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(j) 서열 4의 위치 약 1881 내지 위치 약 2019로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(k) 서열 5의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 5의 단편,(l) 서열 6의 위치 약 40 내지 위치 약 186으로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 6의 단편,(m) 서열 8의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(n) 서열 8의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(o) 서열 8의 위치 약 1275 내지 위치 약 1872로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 8의 단편,(p) 서열 8의 위치 약 2240 내지 위치 약 2374로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(q) 서열 8의 위치 약 2480 내지 2492를 포함하며, 비-FabA-유사 데히드라제 활성을 보유하는 서열 8의 단편,(r) 서열 9의 위치 약 366 내지 위치 약 703으로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 9의 단편,(s) 서열 10의 위치 약 10 내지 위치 약 488로 이루어지며, KS 생물학적 활 성을 보유하는 도메인인 서열 10의 단편,(t) 서열 10의 위치 약 502 내지 위치 약 750으로 이루어지며, CLF 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(u) 서열 10의 위치 약 1431 내지 위치 약 1573으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(v) 서열 10의 위치 약 1882 내지 위치 약 2020으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(w) 서열 11의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 11의 단편, 및(x) 서열 12의 위치 약 29 내지 위치 약 177로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 12의 단편으로 구성된 군에서 선택된 단리된 핵산 분자.
- 제1항에 있어서, 상기 핵산 서열이 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 아미노산 서열을 코딩하는 단리된 핵산 분자.
- 제1항의 핵산 분자에 완전히 상보적인 핵산 서열로 본질적으로 구성된 단리된 핵산 분자.
- 1개 이상의 발현 제어 서열에 작동가능하게 연결된 제1항의 핵산 분자를 포함하는 재조합 핵산 분자.
- 제9항의 재조합 핵산 분자로 형질감염된 재조합 세포.
- 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 생물학적 활성 단백질 또는 그의 도메인을 포함하고 상기 단백질 또는 도메인이 제1항의 핵산 분자에 의해 코딩되는, PKS 시스템을 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서,(a) 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 아미노산 서열, 및(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로 구성된 군에서 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 서열 2, 서열 3, 서열 4, 서열 5 및 서열 6으로 구성된 군에서 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 서열 2, 서열 3, 서열 4, 서열 5 및 서열 6을 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12를 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서,(a) 서열 2의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(b) 서열 2의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(c) 서열 2의 위치 약 1264 내지 위치 약 1889로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 2의 단편,(d) 서열 2의 위치 약 2264 내지 위치 약 2398로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(e) 서열 2의 위치 약 2504 내지 위치 약 2516을 포함하며, 비-FabA-유사 데히드라제 생물학적 활성을 보유하는 서열 2의 단편,(f) 서열 3의 위치 약 378 내지 위치 약 684로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 3의 단편,(g) 서열 4의 위치 약 5 내지 위치 약 483으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(h) 서열 4의 위치 약 489 내지 위치 약 771로 이루어지며, CLF 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(i) 서열 4의 위치 약 1428 내지 위치 약 1570으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(j) 서열 4의 위치 약 1881 내지 위치 약 2019로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(k) 서열 5의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 5의 단편,(l) 서열 6의 위치 약 40 내지 위치 약 186으로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 6의 단편,(m) 서열 8의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(n) 서열 8의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(o) 서열 8의 위치 약 1275 내지 위치 약 1872로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 8의 단편,(p) 서열 8의 위치 약 2240 내지 위치 약 2374로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(q) 서열 8의 위치 약 2480 내지 2492를 포함하며, 비-FabA-유사 데히드라제 활성을 보유하는 서열 8의 단편,(r) 서열 9의 위치 약 366 내지 위치 약 703으로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 9의 단편,(s) 서열 10의 위치 약 10 내지 위치 약 488로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(t) 서열 10의 위치 약 502 내지 위치 약 750으로 이루어지며, CLF 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(u) 서열 10의 위치 약 1431 내지 위치 약 1573으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(v) 서열 10의 위치 약 1882 내지 위치 약 2020으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(w) 서열 11의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 11의 단편, 및(x) 서열 12의 위치 약 29 내지 위치 약 177로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 12의 단편으로 구성된 군에서 선택된 아미노산 서열을 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 트라우스토키트리드(Thraustochytrid)의 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 생물학적 활성 단백질 또는 도메인을 발현하도록 추가로 유전자 변형된 유전자 변형 식물 또는 상기 식물의 일부.
- 제18항에 있어서, 트라우스토키트리드가 쉬조키트리움(Schizochytrium) 및 트라우스토키트리움(Thraustochytrium)으로 구성된 군에서 선택된 유전자 변형 식물 또는 상기 식물의 일부.
- 제18항에 있어서, 상기 단백질 또는 도메인이(a) 서열 14, 서열 16 및 서열 18, 및(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로 구성된 군에서 선택된 아미노산 서열을 포함하는 유전자 변형 식물 또는 상기 식물의 일부.
- 제18항에 있어서, 상기 단백질 또는 도메인이(a) 서열 20, 서열 22 및 서열 24, 및(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로 구성된 군에서 선택된 아미노산 서열을 포함하는 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 유전자 변형의 결과로서 DHA (도코사헥사엔산 (C22:6, ω-3)), ARA (에이코사테트라엔산 또는 아라키돈산 (C20:4, n-6)), DPA (도코사펜타엔산 (C22:5, ω-6 또는 ω-3)) 및 EPA (에이코사펜타엔산 (C20:5, ω-3))로 구성된 군에서 선택된 1종 이상의 다중불포화 지방산을 생산하는 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 유전자 변형의 결과로서 DHA를 생산하는 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 유전자 변형의 결과로서 EPA를 생산하는 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 유전자 변형의 결과로서 EPA 및 DHA를 생산하는 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 유전자 변형의 결과로서 ARA 및 DHA를 생산하는 유전자 변 형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 유전자 변형의 결과로서 ARA 및 EPA를 생산하는 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 작물인 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 쌍떡잎 식물인 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 외떡잎 식물인 유전자 변형 식물 또는 상기 식물의 일부.
- 제11항에 있어서, 캐놀라, 대두, 평지씨, 아마씨, 옥수수, 잇꽃, 해바라기 및 담배로 구성된 군에서 선택된 유전자 변형 식물 또는 상기 식물의 일부.
- 제1항의 단리된 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제32항에 있어서,(a) 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 아미노산 서열, 및(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로 구성된 군에서 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제32항에 있어서, 서열 2, 서열 3, 서열 4, 서열 5 및 서열 6으로 구성된 군에서 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제32항에 있어서, 서열 2, 서열 3, 서열 4, 서열 5 및 서열 6을 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제32항에 있어서, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12로 구성된 군에서 선택된 1종 이상의 아미노산 서열을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제32항에 있어서, 서열 8, 서열 9, 서열 10, 서열 11 및 서열 12를 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제32항에 있어서,(a) 서열 2의 위치 약 32 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(b) 서열 2의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(c) 서열 2의 위치 약 1264 내지 위치 약 1889로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 2의 단편,(d) 서열 2의 위치 약 2264 내지 위치 약 2398로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 2의 단편,(e) 서열 2의 위치 약 2504 내지 위치 약 2516을 포함하며, 비-FabA-유사 데히드라제 생물학적 활성을 보유하는 서열 2의 단편,(f) 서열 3의 위치 약 378 내지 위치 약 684로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 3의 단편,(g) 서열 4의 위치 약 5 내지 위치 약 483으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(h) 서열 4의 위치 약 489 내지 위치 약 771로 이루어지며, CLF 생물학적 활 성을 보유하는 도메인인 서열 4의 단편,(i) 서열 4의 위치 약 1428 내지 위치 약 1570으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(j) 서열 4의 위치 약 1881 내지 위치 약 2019로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 4의 단편,(k) 서열 5의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 5의 단편,(l) 서열 6의 위치 약 40 내지 위치 약 186으로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 6의 단편,(m) 서열 8의 위치 약 29 내지 위치 약 513으로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(n) 서열 8의 위치 약 625 내지 위치 약 943으로 이루어지며, MAT 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(o) 서열 8의 위치 약 1275 내지 위치 약 1872로 이루어지며, ACP 생물학적 활성을 보유하는 도메인 또는 그의 서브도메인인 서열 8의 단편,(p) 서열 8의 위치 약 2240 내지 위치 약 2374로 이루어지며, KR 생물학적 활성을 보유하는 도메인인 서열 8의 단편,(q) 서열 8의 위치 약 2480 내지 2492를 포함하며, 비-FabA-유사 데히드라제 활성을 보유하는 서열 8의 단편,(r) 서열 9의 위치 약 366 내지 위치 약 703으로 이루어지며, AT 생물학적 활성을 보유하는 도메인인 서열 9의 단편,(s) 서열 10의 위치 약 10 내지 위치 약 488로 이루어지며, KS 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(t) 서열 10의 위치 약 502 내지 위치 약 750으로 이루어지며, CLF 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(u) 서열 10의 위치 약 1431 내지 위치 약 1573으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(v) 서열 10의 위치 약 1882 내지 위치 약 2020으로 이루어지며, DH 생물학적 활성을 보유하는 도메인인 서열 10의 단편,(w) 서열 11의 위치 약 84 내지 위치 약 497로 이루어지며, ER 생물학적 활성을 보유하는 도메인인 서열 11의 단편, 및(x) 서열 12의 위치 약 29 내지 위치 약 177로 이루어지며, PPTase 생물학적 활성을 보유하는 도메인인 서열 12의 단편으로 구성된 군에서 선택된 아미노산 서열을 코딩하는 1종 이상의 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제32항에 있어서, 트라우스토키트리드의 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 생물학적 활성 단백질 또는 도메인을 발현하도록 추가로 유전자 변형된 유전자 변형 미생물.
- 제39항에 있어서, 트라우스토키트리드가 쉬조키트리움 및 트라우스토키트리움으로 구성된 군에서 선택된 유전자 변형 미생물.
- 제39항에 있어서, 상기 단백질 또는 도메인이(a) 서열 14, 서열 16 및 서열 18, 및(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로 구성된 군에서 선택된 아미노산 서열을 포함하는 유전자 변형 미생물.
- 제39항에 있어서, 상기 단백질 또는 도메인이(a) 서열 20, 서열 22 및 서열 24, 및(b) 에노일-ACP 리덕타제 (ER) 활성, 아실 운반체 단백질 (ACP) 활성, β-케토아실-ACP 신타제 (KS) 활성, 아실트랜스퍼라제 (AT) 활성, β-케토아실-ACP 리덕타제 (KR) 활성, FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 활성, 비-FabA-유사 데히드라제 활성, 쇄 길이 인자 (CLF) 활성, 말로닐-CoA:ACP 아실트랜스퍼라 제 (MAT) 활성 및 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 활성으로 구성된 군에서 선택된 1종 이상의 생물학적 활성을 보유하는, 상기 (a)의 임의의 아미노산 서열의 단편으로 구성된 군에서 선택된 아미노산 서열을 포함하는 유전자 변형 미생물.
- 제32항에 있어서, 유전자 변형의 결과로서 DHA (도코사헥사엔산 (C22:6, ω-3)), ARA (에이코사테트라엔산 또는 아라키돈산 (C20:4, n-6)), DPA (도코사펜타엔산 (C22:5, ω-6 또는 ω-3)) 및 EPA (에이코사펜타엔산 (C20:5, ω-3))로 구성된 군에서 선택된 다중불포화 지방산을 생산하는 유전자 변형 미생물.
- 제32항에 있어서, 유전자 변형의 결과로서 DHA를 생산하는 유전자 변형 미생물.
- 제32항에 있어서, 유전자 변형의 결과로서 EPA를 생산하는 유전자 변형 미생물.
- 제32항에 있어서, 유전자 변형의 결과로서 EPA 및 DHA를 생산하는 유전자 변형 미생물.
- 제32항에 있어서, 유전자 변형의 결과로서 ARA 및 DHA를 생산하는 유전자 변 형 미생물.
- 제32항에 있어서, 유전자 변형의 결과로서 ARA 및 EPA를 생산하는 유전자 변형 미생물.
- 제32항에 있어서, 내인성 PUFA PKS 시스템을 포함하는 유전자 변형 미생물.
- 제49항에 있어서, 상기 내인성 PUFA PKS 시스템이, 그의 하나 이상의 도메인을 코딩하는 핵산 서열을, 상이한 PKS 시스템의 하나 이상의 도메인을 코딩하는 또다른 단리된 핵산 분자로 치환하여 변형된 것인 유전자 변형 미생물.
- 제50항에 있어서, 상기 상이한 PKS 시스템이 비-박테리아 PUFA PKS 시스템, 박테리아 PUFA PKS 시스템, 제I형 모듈형(modular) PKS 시스템, 제I형 반복형(iterative) PKS 시스템, 제II형 PKS 시스템 및 제III형 PKS 시스템으로 구성된 군에서 선택된 유전자 변형 미생물.
- 제49항에 있어서, 상기 내인성 PUFA PKS 시스템이, 그의 하나 이상의 도메인을 코딩하는 핵산 서열을, 제1항의 단리된 핵산 분자로 치환하여 유전자 변형된 것인 유전자 변형 미생물.
- 제49항에 있어서, C20 단위의 합성을 지시하는 쇄 길이 인자 또는 쇄 길이 인자와 β-케토아실-ACP 신타제 (KS) 도메인을 코딩하는 핵산 분자를 재조합 발현하도록 유전자 변형된 유전자 변형 미생물.
- 제49항에 있어서, 상기 내인성 PUFA PKS 시스템이 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인을 코딩하는 도메인 및 β-케토아실-ACP 신타제 (KS)를 코딩하는 도메인으로 구성된 군에서 선택된 도메인(들)에서 변형된 것이고, 이때 상기 변형이 변형되지 않은 경우에 비하여 PUFA PKS 시스템에 의해 생산되는 장쇄 지방산의 비율을 변경하는 유전자 변형 미생물.
- 제54항에 있어서, 상기 변형이 내인성 PUFA PKS 시스템의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH)를 이성질체화 활성을 보유하지 않는 DH 도메인으로 치환하는 것을 포함하는 유전자 변형 미생물.
- 제54항에 있어서, 상기 변형이 상기 도메인의 전부 또는 일부의 결실, 상이한 유기체로부터의 상동성 도메인에 의한 상기 도메인의 치환, 및 상기 도메인의 돌연변이로 구성된 군에서 선택된 유전자 변형 미생물.
- 제49항에 있어서, 상기 내인성 PUFA PKS 시스템이 에노일-ACP 리덕타제 (ER) 도메인에서 변형된 것이고, 이때 상기 변형이 변형되지 않은 경우에 비하여 상이한 화합물을 생산하게 하는 유전자 변형 미생물.
- 제57항에 있어서, 상기 변형이 ER 도메인의 전부 또는 일부의 결실, 상이한 유기체로부터의 ER 도메인에 의한 상기 ER 도메인의 치환, 및 상기 ER 도메인의 돌연변이로 구성된 군에서 선택된 유전자 변형 미생물.
- 제32항에 있어서, 트라우스토키트리드인 유전자 변형 미생물.
- 제59항에 있어서, 트라우스토키트리드가 쉬조키트리움 및 트라우스토키트리움으로 구성된 군에서 선택된 속인 유전자 변형 미생물.
- 제32항에 있어서, 박테리아인 유전자 변형 미생물.
- 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산에 효과적인 조건하에 제12항의 유전자 변형 식물을 성장시키는 것을 포함하는, 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산 방법.
- 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산에 효과적인 조건하에 제29항의 유전자 변형 미생물을 배양하는 것을 포함하는, 폴리케티드 신타제 시스템에 의해 생산되는 생물활성 분자의 생산 방법.
- 제63항에 있어서, 상기 유전자 변형이 내인성 PKS 시스템에 의해 생산되는 1종 이상의 생성물을 야생형 유기체에 비해 변화시키는 것인 방법.
- 제63항에 있어서, 상기 유기체가 유전자 변형이 없는 천연 발생 유기체와는 상이한 다중불포화 지방산 (PUFA) 프로파일을 생성하는 것인 방법.
- 제63항에 있어서, 상기 생물활성 분자가 소염 제제, 화학요법제, 활성 부형제, 골다공증 약물, 항-우울제, 항-경련제, 항-헬리오박터 파일로리(Heliobactor pylori) 약물, 신경변성 질환 치료용 약물, 퇴행성 간 질환의 치료용 약물, 항생제 및 콜레스테롤 저하 제제로부터 선택되는 것인 방법.
- 제63항에 있어서, 상기 생물활성 분자가 항생제인 방법.
- 제63항에 있어서, 상기 생물활성 분자가 다중불포화 지방산 (PUFA)인 방법.
- 제63항에 있어서, 상기 생물활성 분자가 시스 배위의 탄소-탄소 이중 결합을 포함하는 분자인 방법.
- 제63항에 있어서, 상기 생물활성 분자가 매 3번째 탄소마다 이중 결합을 포 함하는 분자인 방법.
- 제9항의 1종 이상의 재조합 핵산 분자를 포함하는 PKS 시스템을 발현하도록 식물 세포를 유전자 변형하는 것을 포함하는, 천연 발생 식물과는 상이한 다중불포화 지방산 (PUFA) 프로파일을 갖는 식물의 생성 방법.
- 제9항의 1종 이상의 재조합 핵산 분자를 발현하도록 미생물 세포를 유전자 변형하는 것을 포함하는, 재조합 미생물의 생성 방법.
- 최종 생성물에 제9항의 1종 이상의 재조합 핵산 분자를 발현하는 재조합 숙주 세포에 의해 생산된 오일을 첨가하는 것을 포함하는, 최종 생성물이 1종 이상의 지방산을 함유하도록 하는 최종 생성물의 변형 방법.
- 제73항에 있어서, 최종 생성물이 식이보조제, 식품, 제약 제제, 인간화된 동물 유즙(乳汁) 및 분유(infant formula)로 구성된 군에서 선택된 것인 방법.
- 제9항의 1종 이상의 재조합 핵산 분자를 사용하여 유즙-생산 동물의 유즙-생산 세포를 유전자 변형하는 것을 포함하는, 인간화된 동물 유즙의 생산 방법.
- 재조합 박테리아 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템 을 발현하도록 변형되고, 이때 상기 PUFA PKS가 반복형 효소 반응과 비-반복형 효소 반응 모두를 촉매하고 상기 PUFA PKS 시스템이(a) 1개 이상의 에노일 ACP-리덕타제 (ER) 도메인,(b) 6개 이상의 아실 운반체 단백질 (ACP) 도메인,(c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인,(d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인,(e) 1개 이상의 케토리덕타제 (KR) 도메인,(f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,(g) 1개 이상의 쇄 길이 인자 (CLF) 도메인,(h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및(i) 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인을 포함하며 약 25℃ 이상의 온도에서 PUFA를 생산하는 것인 재조합 숙주 세포.
- 제76항에 있어서, 상기 PUFA PKS 시스템이(a) 1개의 에노일 ACP-리덕타제 (ER) 도메인,(b) 6개의 아실 운반체 단백질 (ACP) 도메인,(c) 2개의 β-케토아실-ACP 신타제 (KS) 도메인,(d) 1개의 아실트랜스퍼라제 (AT) 도메인,(e) 1개의 케토리덕타제 (KR) 도메인,(f) 2개의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,(g) 1개의 쇄 길이 인자 (CLF) 도메인,(h) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및(i) 1개의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인을 포함하는 재조합 숙주 세포.
- 제76항에 있어서, 상기 PUFA PKS 시스템이 쉐바넬라 자포니카(Shewanella japonica) 또는 쉐바넬라 올레야나(Shewanella olleyana)로 구성된 군에서 선택된 해양 박테리아의 PUFA PKS 시스템인 재조합 숙주 세포.
- 박테리아 다중불포화 지방산 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 단백질 또는 도메인을 포함하며, 이때 상기 박테리아 PUFA PKS 시스템이 반복형 효소 반응과 비-반복형 효소 반응 모두를 촉매하고 약 25℃ 이상의 온도에서 PUFA를 생산하고(a) 1개 이상의 에노일 ACP-리덕타제 (ER) 도메인,(b) 6개 이상의 아실 운반체 단백질 (ACP) 도메인,(c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인,(d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인,(e) 1개 이상의 케토리덕타제 (KR) 도메인,(f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,(g) 1개 이상의 쇄 길이 인자 (CLF) 도메인,(h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및(i) 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인을 포함하며, 상기 유전자 변형이 PUFA PKS 시스템의 활성에 영향을 주는 것인 유전자 변형 유기체.
- 제79항에 있어서, 박테리아 PUFA PKS 시스템의 1종 이상의 단백질 또는 도메인을 재조합 발현하도록 변형된 유전자 변형 유기체.
- 제79항에 있어서, 박테리아 PUFA PKS 시스템을 재조합 발현하도록 변형된 유전자 변형 유기체.
- 제79항에 있어서, 식물인 유전자 변형 유기체.
- 제79항에 있어서, 미생물인 유전자 변형 유기체.
- 제79항에 있어서, 박테리아 PUFA PKS 시스템이 쉐바넬라 자포니카 및 쉐바넬라 올레야나로 구성된 군에서 선택된 해양 박테리아의 PUFA PKS 시스템인 유전자 변형 유기체.
- 제79항에 있어서, 제2의 상이한 PKS 시스템의 1종 이상의 추가의 단백질 또는 도메인을 발현하는 유전자 변형 유기체.
- 박테리아 (PUFA) 폴리케티드 신타제 (PKS) 시스템의 1종 이상의 단백질 또는 기능적 도메인을 코딩하며, 이때 상기 박테리아 PUFA PKS 시스템이 반복형 효소 반응과 비-반복형 효소 반응 모두를 촉매하고 약 25℃ 이상의 온도에서 PUFA를 생산하고(a) 1개 이상의 에노일 ACP-리덕타제 (ER) 도메인,(b) 6개 이상의 아실 운반체 단백질 (ACP) 도메인,(c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인,(d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인,(e) 1개 이상의 케토리덕타제 (KR) 도메인,(f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인,(g) 1개 이상의 쇄 길이 인자 (CLF) 도메인,(h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인, 및(i) 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인을 포함하는 것인 단리된 재조합 핵산 분자.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/965,017 | 2004-10-13 | ||
US10/965,017 US7217856B2 (en) | 1999-01-14 | 2004-10-13 | PUFA polyketide synthase systems and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070084187A true KR20070084187A (ko) | 2007-08-24 |
Family
ID=36203549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077010711A KR20070084187A (ko) | 2004-10-13 | 2005-10-13 | Pufa 폴리케티드 신타제 시스템 및 그의 용도 |
Country Status (11)
Country | Link |
---|---|
US (15) | US7217856B2 (ko) |
EP (1) | EP1805315A4 (ko) |
JP (1) | JP2008515461A (ko) |
KR (1) | KR20070084187A (ko) |
CN (1) | CN101437950A (ko) |
AU (1) | AU2005295598A1 (ko) |
BR (1) | BRPI0516327A (ko) |
CA (1) | CA2584004A1 (ko) |
IL (1) | IL182548A0 (ko) |
MX (1) | MX2007004502A (ko) |
WO (1) | WO2006044646A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190099397A (ko) * | 2016-10-28 | 2019-08-27 | 징코 바이오웍스, 인크. | 화합물의 생산을 위한 조성물 및 방법 |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6566583B1 (en) * | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
US7271315B2 (en) * | 1999-01-14 | 2007-09-18 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US7211418B2 (en) * | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US7217856B2 (en) * | 1999-01-14 | 2007-05-15 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US8003772B2 (en) * | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
US7247461B2 (en) * | 1999-01-14 | 2007-07-24 | Martek Biosciences Corporation | Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof |
US20070244192A1 (en) * | 1999-01-14 | 2007-10-18 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
US7208590B2 (en) * | 2003-07-15 | 2007-04-24 | Abbott Laboratories | Genes involved in polyketide synthase pathways and uses thereof |
CN102559364B (zh) | 2004-04-22 | 2016-08-17 | 联邦科学技术研究组织 | 用重组细胞合成长链多不饱和脂肪酸 |
US7834250B2 (en) | 2004-04-22 | 2010-11-16 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
WO2007005725A2 (en) | 2005-07-01 | 2007-01-11 | Martek Biosciences Corporation | Polyunsaturated fatty acid-containing oil product and uses and production thereof |
WO2007106905A2 (en) * | 2006-03-15 | 2007-09-20 | Martek Biosciences Corporation | Polyunsaturated fatty acid production in heterologous organisms using pufa polyketide synthase systems |
CN101573451B (zh) * | 2006-03-15 | 2014-04-30 | Dsmip资产公司 | 利用pufa聚酮化合物合成酶系统在异源的生物体中产生多不饱和脂肪酸的方法 |
WO2007121273A2 (en) * | 2006-04-11 | 2007-10-25 | Martek Biosciences Corporation | Food products comprising long chain polyunsaturated fatty acids and methods for preparing the same |
PL2034973T5 (pl) | 2006-06-22 | 2023-02-20 | Dsm Ip Assets B.V. | Kapsułkowane kompozycje nietrwałych związków i sposoby ich wytwarzania |
CA2661697A1 (en) | 2006-08-29 | 2008-03-06 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of fatty acids |
KR20140084349A (ko) * | 2006-08-29 | 2014-07-04 | 디에스엠 아이피 어셋츠 비.브이. | 유아용 조제유에서 DPA(n-6) 오일의 용도 |
US20080233628A1 (en) * | 2006-09-14 | 2008-09-25 | The Salk Institute For Biological Studies | Incorporation of type III polyketide synthases into multidomain proteins of the type I and III polyketide synthase and fatty acid synthase families |
CA2692355C (en) * | 2007-06-29 | 2018-09-11 | Martek Biosciences Corporation | Production and purification of esters of polyunsaturated fatty acids |
JP5110511B2 (ja) * | 2007-09-05 | 2012-12-26 | 独立行政法人産業技術総合研究所 | 微生物を用いた高度不飽和脂肪酸及び高度不飽和脂質の製造方法 |
US20110076379A1 (en) * | 2008-06-13 | 2011-03-31 | Means Michael M | High omega saturated fat free meat products |
EP2358882B1 (en) | 2008-11-18 | 2017-07-26 | Commonwealth Scientific and Industrial Research Organisation | Enzymes and methods for producing omega-3 fatty acids |
CA2754409A1 (en) * | 2009-03-04 | 2010-09-10 | University Of Miyazaki | Method for determining fatty acid synthetic pathway of microorganism, and pcr primer set for use in the method |
TWI504749B (zh) | 2009-03-16 | 2015-10-21 | Dsm Ip Assets Bv | 於網黏菌門微生物中生產蛋白質之技術 |
CA3012998C (en) | 2009-03-19 | 2021-09-07 | Dsm Ip Assets B.V. | Polyunsaturated fatty acid synthase nucleic acid molecules and polypeptides, compositions, and methods of making and uses thereof |
EP2519642B1 (en) * | 2009-12-28 | 2017-10-25 | DSM IP Assets B.V. | Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof |
TW201144442A (en) | 2010-05-17 | 2011-12-16 | Dow Agrosciences Llc | Production of DHA and other LC-PUFAs in plants |
US20120040076A1 (en) | 2010-08-11 | 2012-02-16 | E. I. Du Pont De Nemours And Company | Aquaculture feed compositions |
CA2805882A1 (en) | 2010-08-11 | 2012-02-16 | E. I. Dupont De Nemours And Company | Improved aquaculture meat products |
WO2012021703A1 (en) | 2010-08-11 | 2012-02-16 | E. I. Du Pont De Nemours And Company | A sustainable aquaculture feeding strategy |
WO2012043826A1 (ja) * | 2010-10-01 | 2012-04-05 | 国立大学法人九州大学 | ストラメノパイルの形質転換方法 |
US20140024555A1 (en) * | 2011-03-31 | 2014-01-23 | Los Alamos National Security, Llc | Method of identifying soluble proteins and soluble protein complexes |
TW201307553A (zh) | 2011-07-26 | 2013-02-16 | Dow Agrosciences Llc | 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術 |
US10385327B2 (en) * | 2012-01-05 | 2019-08-20 | University Of Puerto Rico | Enhanced E. coli for the production of fatty acids and method of producing the same |
US8946460B2 (en) | 2012-06-15 | 2015-02-03 | Commonwealth Scientific And Industrial Research Organisation | Process for producing polyunsaturated fatty acids in an esterified form |
US20140051136A1 (en) | 2012-08-10 | 2014-02-20 | Opx Biotechnologies, Inc. | Micoorganisms and Methods for the Production of Fatty Acids and Fatty Acid Derived Products |
US9809804B2 (en) | 2013-01-23 | 2017-11-07 | Iowa State University Research Foundation, Inc. | Materials and methods for characterizing and using KASIII for production of bi-functional fatty acids |
US10184140B2 (en) | 2013-01-23 | 2019-01-22 | Iowa State University Research Foundation, Inc. | Materials and methods for production of bi-functional fatty acids in recombinant bacteria |
US10047383B2 (en) | 2013-03-15 | 2018-08-14 | Cargill, Incorporated | Bioproduction of chemicals |
US10337038B2 (en) | 2013-07-19 | 2019-07-02 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
US11408013B2 (en) | 2013-07-19 | 2022-08-09 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
EP2843043A1 (en) * | 2013-08-27 | 2015-03-04 | Evonik Industries AG | A method for producing acyl amino acids |
US9580758B2 (en) | 2013-11-12 | 2017-02-28 | Luc Montagnier | System and method for the detection and treatment of infection by a microbial agent associated with HIV infection |
TW201525136A (zh) | 2013-11-26 | 2015-07-01 | Dow Agrosciences Llc | 利用破囊壺菌PUFA合成酶於油籽作物中生成ω-3長鏈多不飽和脂肪酸 |
SG11201604871VA (en) | 2013-12-18 | 2016-07-28 | Commw Scient Ind Res Org | Lipid comprising long chain polyunsaturated fatty acids |
US10087430B2 (en) | 2014-01-28 | 2018-10-02 | Dsm Ip Assets B.V. | Factors for the production and accumulation of polyunsaturated fatty acids (PUFAS) derived from PUFA synthases |
US10131897B2 (en) | 2014-03-03 | 2018-11-20 | Synthetics Genomics, Inc. | Molecules associated with fatty acid biosynthetic pathways and uses thereof |
EP3140408A4 (en) * | 2014-05-08 | 2018-01-03 | Scfm Ventures, LLC | Method for optimizing production of eicosapentaenoic acid (epa) ina recombinant host |
KR102527795B1 (ko) | 2014-06-27 | 2023-05-02 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 도코사펜타에노산을 포함하는 지질 |
EP2993228B1 (en) | 2014-09-02 | 2019-10-09 | Cargill, Incorporated | Production of fatty acid esters |
CN105567715B (zh) * | 2014-10-17 | 2021-06-29 | 丰益(上海)生物技术研发中心有限公司 | 裂殖壶菌α-微管蛋白相关序列及其应用 |
US9932599B2 (en) | 2015-03-02 | 2018-04-03 | Synthetic Genomics, Inc. | Regulatory elements from labyrinthulomycetes microorganisms |
CN105176942A (zh) * | 2015-08-04 | 2015-12-23 | 北京农学院 | 来源于树莓的聚酮合酶RinPKS1及其相关生物材料与应用 |
AU2016333440A1 (en) | 2015-10-01 | 2017-06-15 | Dsm Ip Assets B.V. | Supplement material for use in pet food |
WO2017161005A1 (en) | 2016-03-16 | 2017-09-21 | Synthetic Genomics, Inc. | Production of proteins in labyrinthulomycetes |
CN109477079A (zh) | 2016-05-12 | 2019-03-15 | 帝斯曼知识产权资产管理有限公司 | 增加微藻中ω-3多不饱和脂肪酸产量的方法 |
CN106591388A (zh) * | 2016-10-13 | 2017-04-26 | 中国农业科学院生物技术研究所 | 具有聚酮类化合物合成功能的基因Dr2091 |
US10633454B2 (en) | 2016-11-01 | 2020-04-28 | Conagen Inc. | Expression of modified glycoproteins and glycopeptides |
JP2020506702A (ja) | 2017-02-02 | 2020-03-05 | カーギル インコーポレイテッド | C6−c10脂肪酸誘導体を生成する遺伝子組み換え細胞 |
CN108753810B (zh) * | 2018-05-22 | 2021-06-18 | 昆明理工大学 | 一种转录调节蛋白基因orf2的用途 |
US20210309987A1 (en) * | 2018-08-10 | 2021-10-07 | Kyowa Hakko Bio Co., Ltd. | Microorganism producing polyunsaturated fatty acid and method for producing polyunsaturated fatty acid |
US11613728B2 (en) | 2018-08-10 | 2023-03-28 | Kyowa Hakko Bio Co., Ltd. | Microorganism producing eicosapentaenoic acid and method for producing eicosapentaenoic acid |
WO2023070027A2 (en) * | 2021-10-20 | 2023-04-27 | University Of Puerto Rico | Fatty acid production in escherichia coli |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US674574A (en) * | 1900-08-01 | 1901-05-21 | Charles Decrette | Metal-bending machine. |
US781861A (en) * | 1903-11-07 | 1905-02-07 | Alonzo W Allen | Thread or yarn tension device. |
US778594A (en) * | 1904-06-29 | 1904-12-27 | Pancrazio M Megaro | Shaving composition. |
US777277A (en) * | 1904-09-07 | 1904-12-13 | American Clay Working Machinery Company | Tile-press. |
US781882A (en) * | 1904-11-22 | 1905-02-07 | William Hinckle Smith | Compressed product from bone. |
US5246841A (en) | 1986-12-26 | 1993-09-21 | Sagami Chemical Research Center | Microbial process for production of eicosapentaenoic acid |
US5340742A (en) | 1988-09-07 | 1994-08-23 | Omegatech Inc. | Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids |
US5130242A (en) | 1988-09-07 | 1992-07-14 | Phycotech, Inc. | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
US5639790A (en) | 1991-05-21 | 1997-06-17 | Calgene, Inc. | Plant medium-chain thioesterases |
CA2113557A1 (en) | 1992-05-15 | 1993-11-25 | Kazunaga Yazawa | Gene which codes for eicosapentaenoic acid synthetase group and process for producing eicosapentaenoic acid |
US5798259A (en) * | 1992-05-15 | 1998-08-25 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
US5683898A (en) | 1992-05-15 | 1997-11-04 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
US5310242A (en) | 1992-09-28 | 1994-05-10 | Golder Kimberly A | Portable infant seat |
DE4323727A1 (de) | 1993-07-15 | 1995-03-09 | Boehringer Mannheim Gmbh | Verfahren zur Identifizierung von menschlichen und tierischen Zellen mit der Fähigkeit zu unbegrenzter Proliferation oder zur Tumorbildung |
US5672491A (en) | 1993-09-20 | 1997-09-30 | The Leland Stanford Junior University | Recombinant production of novel polyketides |
CA2209987A1 (en) | 1995-01-13 | 1996-07-18 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
EP0823475B1 (en) | 1995-04-17 | 2009-06-17 | National Institute of Advanced Industrial Science and Technology | Novel microorganisms capable of producing highly unsaturated fatty acids and process for producing highly unsaturated fatty acids by using the microorganisms |
AU727694B2 (en) | 1996-07-10 | 2000-12-21 | Sagami Chemical Research Center | Process for producing icosapentaenoic acid by genetic recombination |
US6033883A (en) | 1996-12-18 | 2000-03-07 | Kosan Biosciences, Inc. | Production of polyketides in bacteria and yeast |
CA2283529A1 (en) * | 1997-03-14 | 1998-09-24 | Basf Aktiengesellschaft | Cycloalkylalkanecarboxamides and the production and use thereof |
CN1253588A (zh) | 1997-04-11 | 2000-05-17 | 艾博特公司 | 在植物中合成长链多不饱和脂肪酸的方法和组合物 |
US6566583B1 (en) | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
US6140486A (en) | 1997-06-04 | 2000-10-31 | Calgene Llc | Production of polyunsaturated fatty acids by expression of polyketide-like synthesis genes in plants |
US6626260B2 (en) * | 1998-04-09 | 2003-09-30 | Bombardier Inc. | All terrain vehicle |
US6677145B2 (en) * | 1998-09-02 | 2004-01-13 | Abbott Laboratories | Elongase genes and uses thereof |
US8003772B2 (en) * | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
US7271315B2 (en) * | 1999-01-14 | 2007-09-18 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US20070244192A1 (en) | 1999-01-14 | 2007-10-18 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
US7247461B2 (en) | 1999-01-14 | 2007-07-24 | Martek Biosciences Corporation | Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof |
US7217856B2 (en) * | 1999-01-14 | 2007-05-15 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US7211418B2 (en) * | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US6246841B1 (en) * | 2000-05-10 | 2001-06-12 | Lexmark International, Inc. | Removable toner cartridge |
AU2001268296B2 (en) | 2000-06-08 | 2006-05-25 | Miami University | Fatty acid elongase 3-ketoacyl coa synthase polypeptides |
US20040010817A1 (en) | 2000-07-21 | 2004-01-15 | Washington State University Research Foundation | Plant acyl-CoA synthetases |
DK1911837T3 (da) | 2000-09-28 | 2011-08-29 | Bioriginal Food & Science Corp | FAD5-2 fedtsyredesaturasefamiliemedlem og anvendelser deraf |
TWI337619B (en) | 2001-04-16 | 2011-02-21 | Martek Biosciences Corp | Pufa polyketide synthase systems and uses thereof |
TWI350854B (en) * | 2001-04-16 | 2011-10-21 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
US20040005672A1 (en) | 2002-02-22 | 2004-01-08 | Santi Daniel V. | Heterologous production of polyketides |
GB2385852A (en) | 2002-02-27 | 2003-09-03 | Rothamsted Ex Station | Delta 6-desaturases from Primulaceae |
CA2519169C (en) | 2002-03-16 | 2013-04-30 | The University Of York | Transgenic plants expressing enzymes involved in fatty acid biosynthesis |
US7089432B2 (en) * | 2002-12-27 | 2006-08-08 | Matsushita Electric Industrial Co., Ltd. | Method for operating a processor at first and second rates depending upon whether the processor is executing code to control predetermined hard drive operations |
US20040172682A1 (en) | 2003-02-12 | 2004-09-02 | Kinney Anthony J. | Production of very long chain polyunsaturated fatty acids in oilseed plants |
KR101234200B1 (ko) | 2003-03-26 | 2013-02-19 | 마텍 바이오싸이언스스 코포레이션 | Pufa 폴리케타이드 신타제 시스템 및 이의 용도 |
EP1613746B1 (de) | 2003-03-31 | 2013-03-06 | University Of Bristol | Neue pflanzliche acyltransferasen spezifisch für langkettige, mehrfach ungesättigte fettsäuren |
US7125672B2 (en) | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7208590B2 (en) | 2003-07-15 | 2007-04-24 | Abbott Laboratories | Genes involved in polyketide synthase pathways and uses thereof |
WO2005078010A1 (ja) * | 2004-02-17 | 2005-08-25 | Toray Industries, Inc. | 二軸配向ポリエステルフィルム |
DE102004060340A1 (de) | 2004-07-16 | 2006-02-09 | Basf Plant Science Gmbh | Verfahren zur Erhöhung des Gehalts an mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen |
US8362319B2 (en) | 2004-09-20 | 2013-01-29 | Basf Plant Science Gmbh | Arabidopsis genes encoding proteins involved in sugar and lipid metabolism and methods of use |
WO2007106905A2 (en) | 2006-03-15 | 2007-09-20 | Martek Biosciences Corporation | Polyunsaturated fatty acid production in heterologous organisms using pufa polyketide synthase systems |
US20080044784A1 (en) * | 2006-08-15 | 2008-02-21 | Park Keith K | Multi-component lighter |
US7669708B2 (en) * | 2006-08-31 | 2010-03-02 | Martin Engineering Company | Bulk material handling system and control |
-
2004
- 2004-10-13 US US10/965,017 patent/US7217856B2/en not_active Expired - Lifetime
-
2005
- 2005-10-13 WO PCT/US2005/036998 patent/WO2006044646A2/en active Application Filing
- 2005-10-13 MX MX2007004502A patent/MX2007004502A/es not_active Application Discontinuation
- 2005-10-13 EP EP05816098A patent/EP1805315A4/en not_active Withdrawn
- 2005-10-13 JP JP2007536936A patent/JP2008515461A/ja active Pending
- 2005-10-13 AU AU2005295598A patent/AU2005295598A1/en not_active Abandoned
- 2005-10-13 KR KR1020077010711A patent/KR20070084187A/ko not_active Application Discontinuation
- 2005-10-13 CA CA002584004A patent/CA2584004A1/en not_active Abandoned
- 2005-10-13 CN CNA2005800428032A patent/CN101437950A/zh active Pending
- 2005-10-13 BR BRPI0516327-7A patent/BRPI0516327A/pt not_active Application Discontinuation
-
2007
- 2007-03-21 US US11/689,459 patent/US7626009B2/en not_active Expired - Fee Related
- 2007-03-21 US US11/689,439 patent/US7902427B2/en not_active Expired - Fee Related
- 2007-03-21 US US11/689,443 patent/US7939716B2/en not_active Expired - Fee Related
- 2007-03-21 US US11/689,453 patent/US7803620B2/en not_active Expired - Fee Related
- 2007-03-21 US US11/689,450 patent/US7906706B2/en not_active Expired - Fee Related
- 2007-03-21 US US11/689,451 patent/US7601522B2/en not_active Expired - Fee Related
- 2007-04-12 IL IL182548A patent/IL182548A0/en unknown
- 2007-07-23 US US11/781,877 patent/US7799564B2/en not_active Expired - Fee Related
- 2007-07-23 US US11/781,867 patent/US7897391B2/en not_active Expired - Fee Related
- 2007-07-23 US US11/781,875 patent/US7897392B2/en not_active Expired - Fee Related
- 2007-07-23 US US11/781,874 patent/US7560539B2/en not_active Expired - Fee Related
- 2007-07-23 US US11/781,880 patent/US7897393B2/en not_active Expired - Fee Related
- 2007-07-23 US US11/781,871 patent/US7718431B2/en not_active Expired - Fee Related
- 2007-07-23 US US11/781,870 patent/US7629450B2/en not_active Expired - Fee Related
- 2007-07-23 US US11/781,879 patent/US7879608B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190099397A (ko) * | 2016-10-28 | 2019-08-27 | 징코 바이오웍스, 인크. | 화합물의 생산을 위한 조성물 및 방법 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20070084187A (ko) | Pufa 폴리케티드 신타제 시스템 및 그의 용도 | |
KR101506347B1 (ko) | 다불포화 지방산을 함유하는 식물 종자 오일 | |
KR101539470B1 (ko) | 키메라 pufa 폴리케타이드 신테이즈 시스템 및 이의 용도 | |
US7919320B2 (en) | PUFA polyketide synthase systems and uses thereof | |
AU2002303394B2 (en) | PUFA polyketide synthase systems and uses thereof | |
KR101234198B1 (ko) | Pufa 폴리케타이드 신타제 시스템 및 이의 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |