KR20130103832A - Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조 - Google Patents
Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조 Download PDFInfo
- Publication number
- KR20130103832A KR20130103832A KR1020137023972A KR20137023972A KR20130103832A KR 20130103832 A KR20130103832 A KR 20130103832A KR 1020137023972 A KR1020137023972 A KR 1020137023972A KR 20137023972 A KR20137023972 A KR 20137023972A KR 20130103832 A KR20130103832 A KR 20130103832A
- Authority
- KR
- South Korea
- Prior art keywords
- pufa
- seq
- organism
- coa
- acyl
- Prior art date
Links
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 title claims abstract description 861
- 238000004519 manufacturing process Methods 0.000 title abstract description 89
- 108010030975 Polyketide Synthases Proteins 0.000 title description 309
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 155
- 102000005870 Coenzyme A Ligases Human genes 0.000 claims abstract description 151
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 claims abstract description 151
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 79
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 79
- 108090000623 proteins and genes Proteins 0.000 claims description 359
- 102000004169 proteins and genes Human genes 0.000 claims description 277
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 96
- 235000021588 free fatty acids Nutrition 0.000 claims description 87
- 150000003904 phospholipids Chemical class 0.000 claims description 81
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 72
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 claims description 71
- 150000001413 amino acids Chemical class 0.000 claims description 63
- 239000000758 substrate Substances 0.000 claims description 60
- 238000006243 chemical reaction Methods 0.000 claims description 57
- 235000020978 long-chain polyunsaturated fatty acids Nutrition 0.000 claims description 55
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 abstract description 135
- 108010039731 Fatty Acid Synthases Proteins 0.000 abstract description 134
- 108700016155 Acyl transferases Proteins 0.000 abstract description 98
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 abstract description 96
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 abstract description 96
- 102000057234 Acyl transferases Human genes 0.000 abstract description 82
- 238000000034 method Methods 0.000 abstract description 68
- 235000003869 genetically modified organism Nutrition 0.000 abstract description 62
- 244000005700 microbiome Species 0.000 abstract description 62
- 239000003921 oil Substances 0.000 abstract description 45
- 230000004048 modification Effects 0.000 abstract description 20
- 238000012986 modification Methods 0.000 abstract description 20
- 108700014220 acyltransferase activity proteins Proteins 0.000 abstract description 17
- 241000196324 Embryophyta Species 0.000 description 354
- 235000018102 proteins Nutrition 0.000 description 272
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 description 165
- 238000012239 gene modification Methods 0.000 description 140
- 230000005017 genetic modification Effects 0.000 description 140
- 235000013617 genetically modified food Nutrition 0.000 description 140
- 230000014509 gene expression Effects 0.000 description 115
- 210000004027 cell Anatomy 0.000 description 109
- 239000002773 nucleotide Substances 0.000 description 101
- 102000004190 Enzymes Human genes 0.000 description 100
- 125000003729 nucleotide group Chemical group 0.000 description 100
- 108090000790 Enzymes Proteins 0.000 description 99
- 150000004665 fatty acids Chemical class 0.000 description 95
- 239000000194 fatty acid Substances 0.000 description 90
- 235000014113 dietary fatty acids Nutrition 0.000 description 89
- 229930195729 fatty acid Natural products 0.000 description 89
- MBMBGCFOFBJSGT-KUBAVDMBSA-N all-cis-docosa-4,7,10,13,16,19-hexaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 description 81
- 101710146995 Acyl carrier protein Proteins 0.000 description 80
- 230000000694 effects Effects 0.000 description 73
- 239000000047 product Substances 0.000 description 71
- 235000001014 amino acid Nutrition 0.000 description 68
- 229940024606 amino acid Drugs 0.000 description 63
- 108050002233 Beta-ketoacyl synthases Proteins 0.000 description 45
- 230000037361 pathway Effects 0.000 description 45
- 102000011802 Beta-ketoacyl synthases Human genes 0.000 description 44
- 238000009825 accumulation Methods 0.000 description 43
- 230000005764 inhibitory process Effects 0.000 description 43
- 235000019198 oils Nutrition 0.000 description 43
- 235000020669 docosahexaenoic acid Nutrition 0.000 description 41
- 229940090949 docosahexaenoic acid Drugs 0.000 description 40
- 241000894007 species Species 0.000 description 38
- 101001014220 Monascus pilosus Dehydrogenase mokE Proteins 0.000 description 37
- 101000573542 Penicillium citrinum Compactin nonaketide synthase, enoyl reductase component Proteins 0.000 description 37
- 125000002252 acyl group Chemical group 0.000 description 37
- 210000002706 plastid Anatomy 0.000 description 33
- YUFFSWGQGVEMMI-JLNKQSITSA-N (7Z,10Z,13Z,16Z,19Z)-docosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCCCC(O)=O YUFFSWGQGVEMMI-JLNKQSITSA-N 0.000 description 32
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 description 30
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 30
- 102000000157 3-oxoacyl-(acyl-carrier-protein) reductase Human genes 0.000 description 28
- 108010055468 3-oxoacyl-(acyl-carrier-protein) reductase Proteins 0.000 description 28
- 230000006870 function Effects 0.000 description 28
- 230000008685 targeting Effects 0.000 description 28
- 230000015572 biosynthetic process Effects 0.000 description 26
- 241000588724 Escherichia coli Species 0.000 description 25
- 210000003763 chloroplast Anatomy 0.000 description 24
- 230000001965 increasing effect Effects 0.000 description 23
- 235000020664 gamma-linolenic acid Nutrition 0.000 description 22
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 22
- 101001136034 Homo sapiens Phosphoribosylformylglycinamidine synthase Proteins 0.000 description 20
- 150000005857 PFAS Chemical class 0.000 description 20
- 102100036473 Phosphoribosylformylglycinamidine synthase Human genes 0.000 description 20
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 20
- 230000009368 gene silencing by RNA Effects 0.000 description 20
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 19
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 19
- 241000894006 Bacteria Species 0.000 description 18
- 108700026244 Open Reading Frames Proteins 0.000 description 18
- 230000002401 inhibitory effect Effects 0.000 description 18
- 239000000543 intermediate Substances 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 18
- 108090000765 processed proteins & peptides Proteins 0.000 description 18
- 108020004705 Codon Proteins 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 102000045404 acyltransferase activity proteins Human genes 0.000 description 16
- 230000000692 anti-sense effect Effects 0.000 description 16
- 239000006227 byproduct Substances 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 16
- 108010019608 3-Oxoacyl-(Acyl-Carrier-Protein) Synthase Proteins 0.000 description 15
- 102100037149 3-oxoacyl-[acyl-carrier-protein] synthase, mitochondrial Human genes 0.000 description 15
- 235000021294 Docosapentaenoic acid Nutrition 0.000 description 15
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 14
- 108010001348 Diacylglycerol O-acyltransferase Proteins 0.000 description 14
- 102000004867 Hydro-Lyases Human genes 0.000 description 14
- 108090001042 Hydro-Lyases Proteins 0.000 description 14
- 210000000805 cytoplasm Anatomy 0.000 description 14
- 102000002148 Diacylglycerol O-acyltransferase Human genes 0.000 description 13
- 230000007423 decrease Effects 0.000 description 13
- 108010078791 Carrier Proteins Proteins 0.000 description 12
- 101710198510 Enoyl-[acyl-carrier-protein] reductase [NADH] Proteins 0.000 description 12
- 150000002632 lipids Chemical class 0.000 description 12
- 230000001131 transforming effect Effects 0.000 description 12
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 11
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- 230000004071 biological effect Effects 0.000 description 11
- 230000002708 enhancing effect Effects 0.000 description 11
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 11
- 230000007246 mechanism Effects 0.000 description 11
- 102000004196 processed proteins & peptides Human genes 0.000 description 11
- 230000002829 reductive effect Effects 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- 102100031251 1-acylglycerol-3-phosphate O-acyltransferase PNPLA3 Human genes 0.000 description 10
- 108010054662 2-acylglycerophosphate acyltransferase Proteins 0.000 description 10
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 10
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 10
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 description 10
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 10
- 239000005516 coenzyme A Substances 0.000 description 10
- 229940093530 coenzyme a Drugs 0.000 description 10
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 10
- -1 n-6) Chemical compound 0.000 description 10
- 210000003463 organelle Anatomy 0.000 description 10
- 102000014914 Carrier Proteins Human genes 0.000 description 9
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 9
- 241000206602 Eukaryota Species 0.000 description 9
- 241000233671 Schizochytrium Species 0.000 description 9
- 241001491678 Ulkenia Species 0.000 description 9
- HOBAELRKJCKHQD-QNEBEIHSSA-N dihomo-γ-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HOBAELRKJCKHQD-QNEBEIHSSA-N 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 239000012071 phase Substances 0.000 description 9
- HOBAELRKJCKHQD-UHFFFAOYSA-N (8Z,11Z,14Z)-8,11,14-eicosatrienoic acid Natural products CCCCCC=CCC=CCC=CCCCCCCC(O)=O HOBAELRKJCKHQD-UHFFFAOYSA-N 0.000 description 8
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 8
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 8
- 108700010070 Codon Usage Proteins 0.000 description 8
- 102000003960 Ligases Human genes 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 230000000975 bioactive effect Effects 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- VZCCETWTMQHEPK-UHFFFAOYSA-N gamma-Linolensaeure Natural products CCCCCC=CCC=CCC=CCCCCC(O)=O VZCCETWTMQHEPK-UHFFFAOYSA-N 0.000 description 8
- 229960002733 gamolenic acid Drugs 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 210000002837 heart atrium Anatomy 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 239000013600 plasmid vector Substances 0.000 description 8
- 230000032258 transport Effects 0.000 description 8
- 150000003626 triacylglycerols Chemical class 0.000 description 8
- 108050003185 3-oxoacyl-[acyl-carrier-protein] synthase 2 Proteins 0.000 description 7
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 7
- 235000006008 Brassica napus var napus Nutrition 0.000 description 7
- 240000000385 Brassica napus var. napus Species 0.000 description 7
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 7
- 102100026384 L-aminoadipate-semialdehyde dehydrogenase-phosphopantetheinyl transferase Human genes 0.000 description 7
- 241000192656 Nostoc Species 0.000 description 7
- 241000592344 Spermatophyta Species 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000002779 inactivation Effects 0.000 description 7
- 230000003252 repetitive effect Effects 0.000 description 7
- 101150105694 ACS1 gene Proteins 0.000 description 6
- 241000219194 Arabidopsis Species 0.000 description 6
- 101100330294 Arabidopsis thaliana OASC gene Proteins 0.000 description 6
- 244000020518 Carthamus tinctorius Species 0.000 description 6
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- IWBBKLMHAILHAR-UHFFFAOYSA-N chembl402341 Chemical compound C1=CC(O)=CC=C1C1=CC(=S)SS1 IWBBKLMHAILHAR-UHFFFAOYSA-N 0.000 description 6
- 238000010353 genetic engineering Methods 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 239000013067 intermediate product Substances 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 240000002791 Brassica napus Species 0.000 description 5
- 241001462977 Elina Species 0.000 description 5
- 241001491670 Labyrinthula Species 0.000 description 5
- 241001491672 Labyrinthulaceae Species 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- 102000004316 Oxidoreductases Human genes 0.000 description 5
- 108090000854 Oxidoreductases Proteins 0.000 description 5
- 244000184734 Pyrus japonica Species 0.000 description 5
- 240000008042 Zea mays Species 0.000 description 5
- 230000002860 competitive effect Effects 0.000 description 5
- 230000004136 fatty acid synthesis Effects 0.000 description 5
- 150000002185 fatty acyl-CoAs Chemical class 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 5
- 229930001119 polyketide Natural products 0.000 description 5
- 150000003881 polyketide derivatives Chemical class 0.000 description 5
- 235000003441 saturated fatty acids Nutrition 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 235000004400 serine Nutrition 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 235000015112 vegetable and seed oil Nutrition 0.000 description 5
- 101710168866 3-oxoacyl-[acyl-carrier-protein] synthase 3 Proteins 0.000 description 4
- 101710130360 3-oxoacyl-[acyl-carrier-protein] synthase III, chloroplastic Proteins 0.000 description 4
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 4
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 4
- 108010018763 Biotin carboxylase Proteins 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 244000068988 Glycine max Species 0.000 description 4
- 244000020551 Helianthus annuus Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- 241001467308 Labyrinthuloides Species 0.000 description 4
- 240000006240 Linum usitatissimum Species 0.000 description 4
- 235000004431 Linum usitatissimum Nutrition 0.000 description 4
- 244000061176 Nicotiana tabacum Species 0.000 description 4
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 4
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 241001467333 Thraustochytriaceae Species 0.000 description 4
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 125000004432 carbon atom Chemical group C* 0.000 description 4
- 108010031100 chloroplast transit peptides Proteins 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 description 4
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 235000004426 flaxseed Nutrition 0.000 description 4
- 208000015707 frontal fibrosing alopecia Diseases 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- ZNXZGRMVNNHPCA-UHFFFAOYSA-N pantetheine Chemical compound OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS ZNXZGRMVNNHPCA-UHFFFAOYSA-N 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000006722 reduction reaction Methods 0.000 description 4
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000009261 transgenic effect Effects 0.000 description 4
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 241000003610 Aplanochytrium Species 0.000 description 3
- 241000219198 Brassica Species 0.000 description 3
- 235000021298 Dihomo-γ-linolenic acid Nutrition 0.000 description 3
- 101100536194 Escherichia coli prrB gene Proteins 0.000 description 3
- 101100275987 Halothiobacillus neapolitanus (strain ATCC 23641 / c2) csoS4B gene Proteins 0.000 description 3
- 241000003482 Japonochytrium Species 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 241001491708 Macrocystis Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 241000333170 Shewanella japonica Species 0.000 description 3
- 241000947863 Shewanella olleyana Species 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 241000193998 Streptococcus pneumoniae Species 0.000 description 3
- 101100406376 Streptomyces antibioticus orfB gene Proteins 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- KNGQILZSJUUYIK-VIFPVBQESA-N [(2R)-4-hydroxy-3,3-dimethyl-1-oxo-1-[[3-oxo-3-(2-sulfanylethylamino)propyl]amino]butan-2-yl] dihydrogen phosphate Chemical compound OCC(C)(C)[C@@H](OP(O)(O)=O)C(=O)NCCC(=O)NCCS KNGQILZSJUUYIK-VIFPVBQESA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 108700021044 acyl-ACP thioesterase Proteins 0.000 description 3
- HQPCSDADVLFHHO-LTKCOYKYSA-N all-cis-8,11,14,17-icosatetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HQPCSDADVLFHHO-LTKCOYKYSA-N 0.000 description 3
- 235000021342 arachidonic acid Nutrition 0.000 description 3
- 229940114079 arachidonic acid Drugs 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 238000006482 condensation reaction Methods 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 244000038559 crop plants Species 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000003828 downregulation Effects 0.000 description 3
- 101150089204 easF gene Proteins 0.000 description 3
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 125000001924 fatty-acyl group Chemical group 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 239000012467 final product Substances 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 3
- 238000006317 isomerization reaction Methods 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 3
- 229930014626 natural product Natural products 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000000825 pharmaceutical preparation Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 230000008117 seed development Effects 0.000 description 3
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000011426 transformation method Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- MENFZXMQSYYVRK-CRCGJGBYSA-N (4Z,7Z,10Z,13Z,16Z,19Z)-docosahexaenoyl-CoA Chemical group O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MENFZXMQSYYVRK-CRCGJGBYSA-N 0.000 description 2
- 101710168795 3-oxoacyl-[acyl-carrier-protein] synthase 1 Proteins 0.000 description 2
- 101710158551 3-oxoacyl-[acyl-carrier-protein] synthase I, chloroplastic Proteins 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical group CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 2
- 102100036426 Acid phosphatase type 7 Human genes 0.000 description 2
- 102100022734 Acyl carrier protein, mitochondrial Human genes 0.000 description 2
- 101000935487 Agrobacterium fabrum (strain C58 / ATCC 33970) 3-oxopimeloyl-[acyl-carrier-protein] synthase Proteins 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 101710190411 Chalcone synthase A Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 244000018436 Coriandrum sativum Species 0.000 description 2
- 235000002787 Coriandrum sativum Nutrition 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 235000009852 Cucurbita pepo Nutrition 0.000 description 2
- 108010028143 Dioxygenases Proteins 0.000 description 2
- 102000016680 Dioxygenases Human genes 0.000 description 2
- 102000036181 Fatty Acid Elongases Human genes 0.000 description 2
- 108010058732 Fatty Acid Elongases Proteins 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- 101000928881 Homo sapiens Acid phosphatase type 7 Proteins 0.000 description 2
- 101000678845 Homo sapiens Acyl carrier protein, mitochondrial Proteins 0.000 description 2
- 101000611240 Homo sapiens Low molecular weight phosphotyrosine protein phosphatase Proteins 0.000 description 2
- 101000620894 Homo sapiens Lysophosphatidic acid phosphatase type 6 Proteins 0.000 description 2
- 101000620880 Homo sapiens Tartrate-resistant acid phosphatase type 5 Proteins 0.000 description 2
- 101001122914 Homo sapiens Testicular acid phosphatase Proteins 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 241001491666 Labyrinthulomycetes Species 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 102100022916 Lysophosphatidic acid phosphatase type 6 Human genes 0.000 description 2
- 241000592260 Moritella Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241000208133 Nicotiana plumbaginifolia Species 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 108030002650 Phospholipid:diacylglycerol acyltransferases Proteins 0.000 description 2
- 241000607568 Photobacterium Species 0.000 description 2
- 241000863430 Shewanella Species 0.000 description 2
- 102000009105 Short Chain Dehydrogenase-Reductases Human genes 0.000 description 2
- 108010048287 Short Chain Dehydrogenase-Reductases Proteins 0.000 description 2
- 244000044822 Simmondsia californica Species 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- 102100022919 Tartrate-resistant acid phosphatase type 5 Human genes 0.000 description 2
- 102100028526 Testicular acid phosphatase Human genes 0.000 description 2
- 241000144181 Thraustochytrium aureum Species 0.000 description 2
- 239000000370 acceptor Substances 0.000 description 2
- AHANXAKGNAKFSK-PDBXOOCHSA-N all-cis-icosa-11,14,17-trienoic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCCCC(O)=O AHANXAKGNAKFSK-PDBXOOCHSA-N 0.000 description 2
- JIWBIWFOSCKQMA-LTKCOYKYSA-N all-cis-octadeca-6,9,12,15-tetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/CCCCC(O)=O JIWBIWFOSCKQMA-LTKCOYKYSA-N 0.000 description 2
- 235000020661 alpha-linolenic acid Nutrition 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 125000004063 butyryl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 125000001721 carboxyacetyl group Chemical group 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000009833 condensation Methods 0.000 description 2
- 230000005494 condensation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000006297 dehydration reaction Methods 0.000 description 2
- PRHHYVQTPBEDFE-UHFFFAOYSA-N eicosatrienoic acid Natural products CCCCCC=CCC=CCCCCC=CCCCC(O)=O PRHHYVQTPBEDFE-UHFFFAOYSA-N 0.000 description 2
- 125000004050 enoyl group Chemical group 0.000 description 2
- 230000009483 enzymatic pathway Effects 0.000 description 2
- 241001233957 eudicotyledons Species 0.000 description 2
- 150000002190 fatty acyls Chemical group 0.000 description 2
- 210000003495 flagella Anatomy 0.000 description 2
- 108010060641 flavanone synthetase Proteins 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229960004488 linolenic acid Drugs 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000011278 mitosis Effects 0.000 description 2
- 210000001577 neostriatum Anatomy 0.000 description 2
- 108020003068 nitronate monooxygenase Proteins 0.000 description 2
- 210000000633 nuclear envelope Anatomy 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 229940127557 pharmaceutical product Drugs 0.000 description 2
- 239000010773 plant oil Substances 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 150000004671 saturated fatty acids Chemical class 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000012134 supernatant fraction Substances 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 229910052727 yttrium Inorganic materials 0.000 description 2
- VWQVUPCCIRVNHF-UHFFFAOYSA-N yttrium atom Chemical compound [Y] VWQVUPCCIRVNHF-UHFFFAOYSA-N 0.000 description 2
- DVSZKTAMJJTWFG-SKCDLICFSA-N (2e,4e,6e,8e,10e,12e)-docosa-2,4,6,8,10,12-hexaenoic acid Chemical compound CCCCCCCCC\C=C\C=C\C=C\C=C\C=C\C=C\C(O)=O DVSZKTAMJJTWFG-SKCDLICFSA-N 0.000 description 1
- MJYQFWSXKFLTAY-OVEQLNGDSA-N (2r,3r)-2,3-bis[(4-hydroxy-3-methoxyphenyl)methyl]butane-1,4-diol;(2r,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O.C1=C(O)C(OC)=CC(C[C@@H](CO)[C@H](CO)CC=2C=C(OC)C(O)=CC=2)=C1 MJYQFWSXKFLTAY-OVEQLNGDSA-N 0.000 description 1
- UNSRRHDPHVZAHH-YOILPLPUSA-N (5Z,8Z,11Z)-icosatrienoic acid Chemical compound CCCCCCCC\C=C/C\C=C/C\C=C/CCCC(O)=O UNSRRHDPHVZAHH-YOILPLPUSA-N 0.000 description 1
- 239000001195 (9Z,12Z,15Z)-octadeca-9,12,15-trienoic acid Substances 0.000 description 1
- GVEZIHKRYBHEFX-MNOVXSKESA-N 13C-Cerulenin Natural products CC=CCC=CCCC(=O)[C@H]1O[C@@H]1C(N)=O GVEZIHKRYBHEFX-MNOVXSKESA-N 0.000 description 1
- QWENRTYMTSOGBR-UHFFFAOYSA-N 1H-1,2,3-Triazole Chemical compound C=1C=NNN=1 QWENRTYMTSOGBR-UHFFFAOYSA-N 0.000 description 1
- GZJLLYHBALOKEX-UHFFFAOYSA-N 6-Ketone, O18-Me-Ussuriedine Natural products CC=CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O GZJLLYHBALOKEX-UHFFFAOYSA-N 0.000 description 1
- UNSRRHDPHVZAHH-UHFFFAOYSA-N 6beta,11alpha-Dihydroxy-3alpha,5alpha-cyclopregnan-20-on Natural products CCCCCCCCC=CCC=CCC=CCCCC(O)=O UNSRRHDPHVZAHH-UHFFFAOYSA-N 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- 101000774529 Alkalihalobacillus pseudofirmus (strain ATCC BAA-2126 / JCM 17055 / OF4) Uncharacterized protein BpOF4_21049 Proteins 0.000 description 1
- 241000192542 Anabaena Species 0.000 description 1
- 101000768857 Arabidopsis thaliana 3-phosphoshikimate 1-carboxyvinyltransferase, chloroplastic Proteins 0.000 description 1
- 241000209524 Araceae Species 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 229930091051 Arenine Natural products 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000003595 Aurantiochytrium limacinum Species 0.000 description 1
- 101100214869 Autographa californica nuclear polyhedrosis virus Ac66 gene Proteins 0.000 description 1
- 101000780391 Bacillus licheniformis Uncharacterized protein in ansA 5'region Proteins 0.000 description 1
- 101001074429 Bacillus subtilis (strain 168) Polyketide biosynthesis acyltransferase homolog PksD Proteins 0.000 description 1
- 101000818144 Bacillus subtilis (strain 168) Uncharacterized oxidoreductase YusZ Proteins 0.000 description 1
- 101000936617 Bacillus velezensis (strain DSM 23117 / BGSC 10A6 / FZB42) Polyketide biosynthesis acyltransferase homolog BaeD Proteins 0.000 description 1
- 235000006463 Brassica alba Nutrition 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 244000140786 Brassica hirta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000011292 Brassica rapa Nutrition 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 102100025518 Carbonic anhydrase 1 Human genes 0.000 description 1
- 101000790711 Chlamydomonas reinhardtii Uncharacterized membrane protein ycf78 Proteins 0.000 description 1
- 241001655287 Chlamydomyxa Species 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 102000003813 Cis-trans-isomerases Human genes 0.000 description 1
- 108090000175 Cis-trans-isomerases Proteins 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 241001633026 Coenocystis Species 0.000 description 1
- 101800004637 Communis Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000199912 Crypthecodinium cohnii Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- JDMUPRLRUUMCTL-VIFPVBQESA-N D-pantetheine 4'-phosphate Chemical compound OP(=O)(O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS JDMUPRLRUUMCTL-VIFPVBQESA-N 0.000 description 1
- 108050004099 Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 1
- 101000827225 Dichelobacter nodosus Uncharacterized protein in lpsA 5'region Proteins 0.000 description 1
- 241000989765 Diplophrys Species 0.000 description 1
- 108700033863 EC 2.3.1.85 Proteins 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 101000599641 Escherichia coli (strain K12) Insertion element IS150 protein InsJ Proteins 0.000 description 1
- 101000819098 Escherichia coli Insertion element IS1397 uncharacterized 20.1 kDa protein Proteins 0.000 description 1
- 101000763543 Escherichia coli Uncharacterized endonuclease Proteins 0.000 description 1
- 101000758678 Escherichia phage P1 Uncharacterized 36.0 kDa protein in doc-Gp10 intergenic region Proteins 0.000 description 1
- 101150071111 FADD gene Proteins 0.000 description 1
- 108010087894 Fatty acid desaturases Proteins 0.000 description 1
- 102000009114 Fatty acid desaturases Human genes 0.000 description 1
- OPGOLNDOMSBSCW-CLNHMMGSSA-N Fursultiamine hydrochloride Chemical compound Cl.C1CCOC1CSSC(\CCO)=C(/C)N(C=O)CC1=CN=C(C)N=C1N OPGOLNDOMSBSCW-CLNHMMGSSA-N 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- 101000828374 Lactobacillus johnsonii Insertion element IS1223 uncharacterized 20.7 kDa protein Proteins 0.000 description 1
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 1
- 101000750781 Listeria monocytogenes serovar 1/2a (strain ATCC BAA-679 / EGD-e) Uncharacterized oxidoreductase Lmo0432 Proteins 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 241000294598 Moritella marina Species 0.000 description 1
- 101001111653 Mus musculus Retinol dehydrogenase 11 Proteins 0.000 description 1
- 101000861628 Mycoplasma capricolum subsp. capricolum (strain California kid / ATCC 27343 / NCTC 10154) Uncharacterized lipoprotein MCAP_0231 Proteins 0.000 description 1
- 101000707209 Mycoplasma mycoides subsp. mycoides SC Insertion element IS1296 uncharacterized 21.4 kDa protein Proteins 0.000 description 1
- 241000795633 Olea <sea slug> Species 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 235000019482 Palm oil Nutrition 0.000 description 1
- 102100031252 Patatin-like phospholipase domain-containing protein 4 Human genes 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 108010076039 Polyproteins Proteins 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 101150041925 RBCS gene Proteins 0.000 description 1
- 101000770286 Rhizobium meliloti Uncharacterized protein ORF8 in nfe locus Proteins 0.000 description 1
- 101000791677 Rhizobium meliloti Uncharacterized protein in ackA 5'region Proteins 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000233673 Schizochytrium aggregatum Species 0.000 description 1
- 241000598397 Schizochytrium sp. Species 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 101000803172 Solanum lycopersicum 1-aminocyclopropane-1-carboxylate synthase 2 Proteins 0.000 description 1
- 241000864178 Sorodiplophrys Species 0.000 description 1
- 241001466451 Stramenopiles Species 0.000 description 1
- 241001491687 Thalassiosira pseudonana Species 0.000 description 1
- 101000759701 Thermus thermophilus Uncharacterized protein in scsB 5'region Proteins 0.000 description 1
- 241000233675 Thraustochytrium Species 0.000 description 1
- 241000817756 Thraustochytrium roseum Species 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 101000623306 Trypanosoma brucei brucei Uncharacterized 1.9 kDa protein in aldolase locus Proteins 0.000 description 1
- 108010089879 Type I Fatty Acid Synthase Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 101000679337 Zea mays Putative AC transposase Proteins 0.000 description 1
- WREBYPQOSZWUKP-UHFFFAOYSA-N [4-(5-sulfanylidenedithiol-3-yl)phenyl] 2-propylpentanoate Chemical compound C1=CC(OC(=O)C(CCC)CCC)=CC=C1C1=CC(=S)SS1 WREBYPQOSZWUKP-UHFFFAOYSA-N 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- GVEZIHKRYBHEFX-UHFFFAOYSA-N caerulein A Natural products CC=CCC=CCCC(=O)C1OC1C(N)=O GVEZIHKRYBHEFX-UHFFFAOYSA-N 0.000 description 1
- 150000001721 carbon Chemical class 0.000 description 1
- 239000007833 carbon precursor Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- GVEZIHKRYBHEFX-NQQPLRFYSA-N cerulenin Chemical compound C\C=C\C\C=C\CCC(=O)[C@H]1O[C@H]1C(N)=O GVEZIHKRYBHEFX-NQQPLRFYSA-N 0.000 description 1
- 229950005984 cerulenin Drugs 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 101150047356 dec-1 gene Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- BIRYUMUXPVBNBH-UHFFFAOYSA-N docosa-1,3,5,7-tetraene Chemical compound CCCCCCCCCCCCCCC=CC=CC=CC=C BIRYUMUXPVBNBH-UHFFFAOYSA-N 0.000 description 1
- KAUVQQXNCKESLC-UHFFFAOYSA-N docosahexaenoic acid (DHA) Natural products COC(=O)C(C)NOCC1=CC=CC=C1 KAUVQQXNCKESLC-UHFFFAOYSA-N 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- IQLUYYHUNSSHIY-HZUMYPAESA-N eicosatetraenoic acid Chemical compound CCCCCCCCCCC\C=C\C=C\C=C\C=C\C(O)=O IQLUYYHUNSSHIY-HZUMYPAESA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 108010064739 ent-kaurene synthetase B Proteins 0.000 description 1
- UKFXDFUAPNAMPJ-UHFFFAOYSA-N ethylmalonic acid Chemical compound CCC(C(O)=O)C(O)=O UKFXDFUAPNAMPJ-UHFFFAOYSA-N 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 101150045265 fadD28 gene Proteins 0.000 description 1
- 230000003176 fibrotic effect Effects 0.000 description 1
- 235000021323 fish oil Nutrition 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 235000013376 functional food Nutrition 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerol group Chemical group OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 235000013402 health food Nutrition 0.000 description 1
- 210000001990 heterocyst Anatomy 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000003501 hydroponics Substances 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- OOYGSFOGFJDDHP-KMCOLRRFSA-N kanamycin A sulfate Chemical group OS(O)(=O)=O.O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N OOYGSFOGFJDDHP-KMCOLRRFSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 235000020778 linoleic acid Nutrition 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 150000004668 long chain fatty acids Chemical class 0.000 description 1
- 125000000346 malonyl group Chemical group C(CC(=O)*)(=O)* 0.000 description 1
- LTYOQGRJFJAKNA-VFLPNFFSSA-N malonyl-coa Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-VFLPNFFSSA-N 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- ZIYVHBGGAOATLY-UHFFFAOYSA-N methylmalonic acid Chemical group OC(=O)C(C)C(O)=O ZIYVHBGGAOATLY-UHFFFAOYSA-N 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000003541 multi-stage reaction Methods 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 125000001419 myristoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 239000002540 palm oil Substances 0.000 description 1
- 125000001312 palmitoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000010451 perlite Substances 0.000 description 1
- 235000019362 perlite Nutrition 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 229930001118 polyketide hybrid Natural products 0.000 description 1
- 125000003308 polyketide hybrid group Chemical group 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 108010055896 polyornithine Proteins 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000002407 reforming Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000002786 root growth Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical class [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- JIWBIWFOSCKQMA-UHFFFAOYSA-N stearidonic acid Natural products CCC=CCC=CCC=CCC=CCCCCC(O)=O JIWBIWFOSCKQMA-UHFFFAOYSA-N 0.000 description 1
- 125000003696 stearoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 230000006032 tissue transformation Effects 0.000 description 1
- 238000006276 transfer reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 239000010455 vermiculite Substances 0.000 description 1
- 229910052902 vermiculite Inorganic materials 0.000 description 1
- 235000019354 vermiculite Nutrition 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/04—Plant cells or tissues
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/04—Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
- A61P15/06—Antiabortive agents; Labour repressants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
- A61P19/10—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/08—Antiepileptics; Anticonvulsants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/24—Antidepressants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/02—Nutrients, e.g. vitamins, minerals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/06—Antihyperlipidemics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/06—Immunosuppressants, e.g. drugs for graft rejection
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8247—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6432—Eicosapentaenoic acids [EPA]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6434—Docosahexenoic acids [DHA]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6472—Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Molecular Biology (AREA)
- Physical Education & Sports Medicine (AREA)
- Rheumatology (AREA)
- Cell Biology (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Immunology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Nutrition Science (AREA)
- Pain & Pain Management (AREA)
- Hematology (AREA)
- Diabetes (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Psychiatry (AREA)
Abstract
본 발명은 신규 아실-CoA 신테타제 및 신규 아실트랜스퍼라제, 이를 코딩하는 핵산 분자, 재조합 핵산 분자 및 상기 핵산 분자를 포함하는 재조합 숙주 세포, 상기 핵산 분자를 포함하는 유전적으로 개질된 생물체 (미생물 및 식물), 및 이들의 제조 및 사용 방법을 개시한다. 또한, 본 발명은 PUFA의 제조를 위한 PKS-유사 시스템 (PUFA PKS 시스템 또는 PUFA 신타제)를 발현시키도록 유전적으로 개질된 생물체이며, 이 생물체는 아실-CoA 신테타제를 발현시키거나, 아실 트랜스퍼라제를 발현시키거나, 생물체에 의해 발현된 지방산 신타제 (FAS)를 결실시키거나 또는 불활성화하거나, 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나, 또는 생물체에서 말로닐 CoA의 수준을 증가시키도록 개질되었으며, 한 측면에서 KASII 또는 KASIII을 억제하도록 개질시킨 것인, 유전적으로 개질된 생물체 (예, 식물, 미생물)을 개시한다. 상기 생물체로부터 얻어진 PUFA 및 오일 이외에도 추가의 개질 및 상기 생물체의 생성 및 사용 방법이 그러한 PUFA 및 오일을 포함하는 다양한 생성물과 함께 개시된다.
<색인어>
아실-CoA 신테타제, 아실트랜스퍼라제, PUFA PKS 시스템, PUFA 신타제.
<색인어>
아실-CoA 신테타제, 아실트랜스퍼라제, PUFA PKS 시스템, PUFA 신타제.
Description
본 발명은 일반적으로, 다불포화 지방산 (PUFA)의 제조를 위한 PKS-유사 시스템 (즉, PUFA PKS 시스템 또는 PUFA 신타제)으로 유전적으로 개질된 숙주 생물체에서 다불포화 지방산 (PUFA), 특히 장쇄 PUFA (LCPUFA)의 제조를 향상시키는 부속(accessory) 단백질 및 표적의 용도에 관한 것이다. 본 발명은 또한 이러한 부속 단백질을 발현시키도록 유전적으로 개질되었거나 또는 그러한 표적에 대하여 개질된 생물체 및 이 생물체의 제조 및 사용 방법에 관한 것이다.
다불포화 지방산 (PUFA)은 영양학적 용도, 제약학적 용도, 산업적 용도 및 다른 목적에 유용한 것으로 고려된다. 그러나, 현재 천연 공급원 및 화학적 합성으로부터의 PUFA 공급은 상업적 요구에 있어서 충분치 않다. 오일 종자 작물 유래의 식물성 오일은 상대적으로 저렴하며 어유(fish oil)와 관련된 오염 문제를 갖지 않는다. 그러나, 상업적으로 개발된 식물 오일 중에 존재하는 PUFA는 전형적으로 리놀레산 (탄소수는 18이며 델타 9 및 12 위치에 2개의 이중 결합을 가짐 (18:2 델타 9,12)) 및 리놀렌산 (18:3 델타 9,12,15)으로 한정된다. 리놀레인산 및 리놀렌산으로부터 포화도가 더 높고 쇄 길이가 더 긴 PUFA를 제조하는 지방산 합성에서는 다수의 별도의 데새투라제(desaturase) 및 엘론가제(elongase) 효소가 필요하다. 따라서, PUFA, 예를 들면 EPA 및 도코사헥사엔산 (DHA)의 발현을 위한 식물 숙주 세포의 조작에서는 합성을 달성하기 위해 여러 별도의 효소를 발현시키는 것이 필요할 수 있다. 추가로, 상기 PUFA를 사용가능한 양으로 제조하기 위해서는 추가의 조작 수행이 필요할 수 있다. 따라서, PUFA의 제조를 위한 대안적인 시스템인 폴리케티드 신타제-유사 시스템의 발견은 "전형적" 또는 "표준" 지방산 합성 경로의 데새투라제 및 엘론가제를 사용해서 식물 또는 다른 생물체 (예, 미생물)를 유전적으로 조작하는 것에 대해 주목할만한 대안을 제공해 왔다.
오일-종자 작물 식물에서 내생적으로-제조된 지방산을 개질시켜 PUFA를 제조하기 위한 많은 노력이 있어 왔다. 지방산 엘론가제 및 데새투라제에 대한 다양한 개별적인 유전자들을 사용해서 상기 식물을 유전적으로 개질시킴으로써 유의한 수준의 PUFA, 예를 들면 EPA를 함유하며 또한 쇄 길이가 더 짧고 포화도가 더 낮은 유의한 수준의 혼합 PUFA를 함유하는 잎(leave) 또는 종자를 생산해 왔다 [Qi et al., Nature Biotech. 22:739 (2004); PCT 공개 제WO 04/071467호; Abbadi et al., Plant Cell 16:1 (2004)); Napier and Sayanova, Proceedings of the Nutrition Society (2005), 64:387?393; Robert et al., Functional Plant Biology (2005) 32:473-479; 또는 미국 특허 출원 공개 제2004/0172682호].
따라서, 오일-종자 식물에서 목적하는 PUFA 중 풍부화된 지질 (예, 트리아실글리세롤 (TAG) 및 인지질 (PL))의 양을 효율적이고 효과적으로 제조하는 방법에 대한 당업계의 요구가 존재한다.
폴리케티드 신타제 (PKS) 시스템은 일반적으로 지방산 신타제 (FAS) 시스템과 관련된 효소 복합체로서 당업계에 공지되어 있지만, 흔히 이를 고도로 개질함으로써 전형적으로는 지방산과 거의 유사하지 않은 특화된 생성물을 제조한다. 그러나, 본 발명에 이르러 폴리케티드 신타제 시스템은 아세틸-CoA 및 말로닐-CoA로부터 다불포화 지방산 (PUFA)을 합성할 수 있는 해양 세균 및 특정 미세조류에 존재하는 것으로 밝혀졌다. 이들 시스템은 본원에서 PUFA PKS 시스템, PUFA의 제조의 제조를 위한 PKS-유사 시스템, 또는 PUFA 신타제 시스템으로 지칭되며, 이들 모두는 본원에서 상호교환가능하게 사용된다.
쉬바넬라(Shewanella) 및 다른 해양 세균, 비브리오 마리누스(Vibrio marinus)에서의 PUFA 합성을 위한 PUFA PKS 경로는 미국 특허 제6,140,486호에 상세히 기재되어 있다. 진핵생물 트라우스토키트리드(Thraustochytrid), 쉬조키트리움(Schizochytrium)에서의 PUFA 합성을 위한 PUFA PKS 경로는 미국 특허 제6,566,583호에 상세히 기재되어 있다. 쉬조키트리움에서의 PUFA PKS 시스템에 대한 추가의 기재 및 트라우스토키트리움(Thraustochytrium)에서의 PUFA PKS 시스템의 동정 (이들 시스템의 사용에 대한 세부사항을 포함함)을 비롯해서 트라우스토키트리알레스(Thraustochytriales)의 구성원과 같은 진핵생물에서의 PUFA 합성을 위한 PUFA PKS 경로는 2002년 12월 19일 공개된 미국 특허 출원 공개 제20020194641호, 2006년 12월 21일 공개된 PCT 공개 제WO 2006/135866호에 상세히 기재되어 있다. 2004년 11월 25일 공개된 미국 특허 출원 공개 제20040235127호는 트라우스토키트리움에서의 PUFA PKS 시스템에 대한 상세한 구조적 설명, 및 추가로 에이코사펜타엔산 (C20:5, ω-3) (EPA)의 제조 및 상기 시스템을 사용한 다른 PUFA의 제조에 대한 추가의 세부사항을 개시한다. 2005년 5월 12일 공개된 미국 특허 출원 공개 제20050100995호는 쉬바넬라 올레야나(Shewanella olleyana) 및 쉬바넬라 야포니카(Shewanella japonica)에서의 PUFA PKS 시스템의 구조적 및 기능적 설명과 이 시스템의 사용을 개시한다. 상기 간행물들은 또한 PUFA PKS 경로를 포함하는 유전자들을 사용해서 미생물 및 식물을 비롯한 생물체를 유전적으로 개질시키는 것과 이러한 생물체에 의해 PUFA를 제조하는 것에 대하여 개시한다. 또한, PCT 특허 공개 제WO 05/097982호는 울케니아(Ulkenia)에서의 PUFA PKS 시스템을 기재하며, 미국 특허 출원 공개 제20050014231호는 트라우스토키트리움 아우레움(Thraustochytrium aureum) 유래의 PUFA PKS 유전자들 및 단백질을 기재한다. 상기 각각의 간행물은 그 전체 내용이 본원에 참고로 도입된다.
따라서, PUFA 신타제 패밀리 효소의 기본적인 도메인 구조 및 서열 특징들이 기술되어 왔으며, PUFA 신타제 효소는 다양한 PUFA (예, 에이코사펜타엔산 (EPA; C20:5n-3), 도코사헥사엔산 (DHA; 22:6n-3) 및 도코사펜타엔산 (DPAn-6; C22:5n-6)을 드노보(de novo) 합성할 수 있는 것으로 입증되어 왔다. 또한, PUFA 생성물은 숙주 생물체의 인지질 (PL) 중에 축적될 수 있으며, 어떤 경우에는 중성 지질 (예, 트리아실글리세롤 (TAG)) 중에 축적될 수 있는 것으로 입증되어 왔다. 그러나, 본 발명자들이 잘 알고 있는 바와 같이, 상기 효소로부터 표적으로 PUFA를 전달하는 정확한 메카니즘은 본 발명 이전에는 규명된 바 없었다.
생물체에서 PUFA를 표적 목적지로 전달하는 메카니즘은 PUFA를 제조하도록 유전적으로 개질된 생물체에서 PUFA의 제조 효율을 증가시키고/시키거나 상기 제조를 개선하기 위한 것과 관련될 수 있기 때문에, 이러한 메카니즘에 대한 정보에 관하여 당업계의 요구가 존재한다. 따라서, 상기 메카니즘에 대한 지식을 이용해서 PUFA를 제조하도록 유전적으로 개질된 식물 및 미생물에서의 PUFA의 제조를 비롯해서 PUFA를 제조하는 개선된 방법에 대한 당업계의 요구가 또한 존재한다.
본 발명의 한 실시양태는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 아실-CoA 신테타제(ACoAS)를 코딩하는 핵산 서열을 포함하며, 상기 핵산 서열은 서열 83, 서열 85, 서열 87, 서열 89, 서열 91, 서열 93, 서열 95, 서열 97 및 서열 99로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 ACoAS와 60% 이상 동일한 아실-CoA 신테타제(ACoAS)를 코딩하는 것인, 단리된 핵산 분자에 관한 것이다. 한 측면에서, 핵산 서열은 서열 83, 서열 85, 서열 87, 서열 89, 서열 91, 서열 93, 서열 95, 서열 97 및 서열 99로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 아실-CoA 신테타제(ACoAS)를 코딩한다. 한 측면에서, 핵산 서열은 서열 83, 서열 85 및 서열 97로 이루어진 군으로부터 선택된 아미노산 서열을 코딩한다. 한 측면에서, 핵산 서열은 서열 82, 서열 84, 서열 86, 서열 88, 서열 90, 서열 92, 서열 94, 서열 96 및 서열 98로 이루어진 군으로부터 선택된다.
본 발명의 또 다른 실시양태는 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 단백질을 코딩하는 핵산 서열을 포함하며, 상기 단백질은 서열 102, 서열 104, 서열 107, 서열 110 및 서열 113으로 이루어진 군으로부터 선택된 아미노산 서열과 60% 이상 동일한 아미노산 서열을 포함하는 것인, 단리된 핵산 분자에 관한 것이다. 한 측면에서, 핵산 서열은 서열 102, 서열 104, 서열 107, 서열 110 및 서열 113으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 단백질을 코딩한다. 한 측면에서, 핵산 서열은 서열 102 및 서열 104로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 단백질을 코딩한다. 한 측면에서, 핵산 서열은 서열 100, 서열 102, 서열 103, 서열 105, 서열 106, 서열 108, 서열 109, 서열 111 및 서열 112로 이루어진 군으로부터 선택된다.
본 발명의 다른 실시양태는 상기 기재된 임의의 핵산 분자에 의해 코딩된 단리된 단백질에 관한 것이다.
본 발명의 다른 실시양태는 발현 조절 서열에 작동적으로 연결된 상기 기재된 임의의 핵산 분자를 포함하는 재조합 핵산 분자에 관한 것이다.
본 발명의 또 다른 실시양태는 상기 기재된 임의의 재조합 핵산 분자를 포함하는 재조합 숙주 세포에 관한 것이다. 한 측면에서, 숙주 세포는 미생물이다. 다른 측면에서, 숙주 세포는 식물 세포이다.
본 발명의 다른 실시양태는 상기 기재된 임의의 핵산 분자 또는 이들의 임의의 조합물을 발현시키도록 유전적으로 개질된 것인 유전적으로 개질된 생물체에 관한 것이다. 한 측면에서, 생물체는 PUFA 신타제 및 포스포판테테이닐 트랜스퍼라제 (PPTase)를 발현시킨다. 한 측면에서, 생물체는 신타제 및 PPTase를 발현시키도록 유전적으로 개질된 것이다. 한 측면에서, 생물체는 그에 의해 발현된 지방산 신타제 (FAS)를 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 함유한다. 한 측면에서, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체에서의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 함유한다.
다른 실시양태는 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)를 발현시키며, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체에 관한 것이다. 한 측면에서, 생물체는 PUFA 신타제를 내생적으로 발현시키는 생물체로부터 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 한 측면에서, 생물체는 크립테코디니움 코니(Crypthecodinium cohnii) 유래의 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 코딩하는 핵산 서열을 포함하며, ACoAS 또는 그의 상동체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 것인, 핵산 분자로 형질전환시킨다. 한 측면에서, 생물체는 트라우스토키트리알레스 미생물 유래의 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 코딩하는 핵산 서열을 포함하며, ACoAS 또는 그의 상동체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 것인, 핵산 분자로 형질전환시킨다. 한 측면에서, 생물체는 쉬조키트리움 유래의 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 코딩하는 핵산 서열을 포함하며, ACoAS 또는 그의 상동체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 것인, 핵산 분자로 형질전환시킨다. 한 측면에서, 생물체는 그에 의해 발현된 지방산 신타제 (FAS)를 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 함유한다. 한 측면에서, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체에서의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 함유한다. 한 측면에서, 생물체는 PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용한다.
다른 실시양태는 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)를 발현시키는 생물체이며, 이 생물체는 그에 의해 발현된 지방산 신타제 (FAS)를 결실시키거나 또는 불활성화하는 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체에 관한 것이다. 한 측면에서, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체에서의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 함유한다.
다른 실시양태는 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)를 발현시키는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체에서의 말로닐 CoA의 수준을 증가시키는 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체에 관한 것이다. 한 측면에서, 생물체는 그에 의해 발현된 지방산 신타제 (FAS)를 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 함유한다.
또 다른 실시양태는 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)를 발현시키는 생물체이며, 이 생물체는 PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 유전적 개질을 함유하고, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체에 관한 것이다. 한 측면에서, 단백질은 DAGAT 또는 LPAAT이다. 한 측면에서, 생물체는 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 트라우스토키트리드 또는 라비린툴리드(Labyrinthulid) 유래의 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 한 측면에서, 생물체는 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 쉬조키트리움 유래의 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 한 측면에서, 생물체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 개질물을 포함한다. 한 측면에서, 생물체는 그에 의해 발현된 지방산 신타제 (FAS)를 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 함유한다. 한 측면에서, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체에서의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 함유한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었으며, KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결된 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
추가의 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하며, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 추가의 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있거나, 또는 생물체가 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하며, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하는 생물체이며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
또 다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하며, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하는 생물체이며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하며, 생물체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하고, 생물체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다. 다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81로 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81로 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하며, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81로 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81로 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다. 한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하며, 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
한 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질되었고, 단백질, 예를 들어 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체이며, 이 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하며, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하며, 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하며, 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다.
다른 실시양태에서, 본 발명은 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 PUFA 신타제, 및 포스포판테테이닐 트랜스퍼라제 (PPTase)로 유전적으로 개질된 생물체이며, PUFA 신타제 또는 PPTase를 코딩하는 하나 이상의 핵산 분자가 서열 81에 나타낸 것을 포함하지만 이에 한정되지 않는 색소체-표적화 서열을 코딩하는 핵산 서열에 작동적으로 연결되어 있고, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체내의 말로닐 CoA의 수준을 증가시키는 추가의 유전적 개질을 포함하고, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하고, PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며, 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하고, 생물체는 내생성 지방산 신타제 (FAS) 또는 생물체에 의해 발현된 FAS와 관련된 단백질을 결실시키거나 또는 불활성화하는 추가의 유전적 개질을 포함하는 것인, 유전적으로 개질된 생물체 (미생물, 식물, 식물의 부분 또는 식물 세포를 포함함)를 제공한다. 일부 실시양태에서, 생물체는 단백질 KASII 또는 KASIII 중 어느 하나의 발현 또는 활성을 억제하는 유전적 개질을 함유한다.
다른 실시양태에서, 생물체는 상기 KASII 또는 KASIII 억제의 부재하에서와 비교해서 상기 한가지 이상의 PUFA를 증가된 수준으로 제조한다.
유전적 개질은 KASII의 발현 또는 활성을 억제하는 RNAi 구조물 또는 KASIII의 발현 또는 활성을 억제하는 RNAi 구조물을 사용해서 생물체를 형질전환시키는 것을 포함할 수 있다. RNAi 구조물은 서열 122 또는 서열 124로 나타낸 핵산 서열을 포함할 수 있다.
다른 실시양태에서, 유전적 개질은 KASII의 발현 또는 활성을 억제하는 안티센스 핵산 분자 또는 KASIII의 발현 또는 활성을 억제하는 안티센스 핵산 분자를 사용해서 생물체를 형질전환시키는 것을 포함한다. 안티센스 핵산 분자는 본원에서 서열 123 또는 서열 125에 나타낸 핵산 서열을 포함할 수 있다.
생물체가, 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 하나 이상의 이종 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 발현시키는 추가의 유전적 개질을 함유하는 것인 실시양태에서, 생물체는 크립테코디니움 코니 유래의 아실-CoA 신테타제(ACoAS) 또는 그의 상동체를 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킬 수 있으며, ACoAS 또는 그의 상동체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매한다. 다른 실시양태에서, 생물체는 쉬조키트리움 유래의 아실-CoA 신테타제(ACoAS) 또는 쉬조키트리움 유래의 ACoAS를 코딩하는 아미노산 서열과 60% 이상 동일한 상동체를 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시키며, ACoAS 또는 그의 상동체는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매한다. 또 다른 실시양태에서, 생물체는 서열 83, 서열 85, 서열 87, 서열 89, 서열 91, 서열 93, 서열 95, 서열 97 및 서열 99로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 ACoAS와 60% 이상 동일한 아실-CoA 신테타제(ACoAS)를 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 또 다른 실시양태에서, 생물체는 서열 83, 서열 85, 서열 87, 서열 89, 서열 91, 서열 93, 서열 95, 서열 97 및 서열 99로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 아실-CoA 신테타제(ACoAS)를 코딩하는 핵산 서열, 더 바람직하게는 서열 83, 서열 85 및 서열 97로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 아실-CoA 신테타제(ACoAS)를 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 또 다른 실시양태에서, 생물체는 서열 83 또는 서열 85의 아미노산 서열을 갖는 아실-CoA 신테타제(ACoAS)를 코딩하는 핵산 서열을 포함하는 핵산 분자, 및 서열 97의 아미노산 서열을 갖는 아실-CoA 신테타제(ACoAS)를 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 또 다른 실시양태에서, 생물체는 서열 82, 서열 84, 서열 86, 서열 88, 서열 90, 서열 92, 서열 94, 서열 96 및 서열 98로 이루어진 군으로부터 선택된 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다.
생물체가 PUFA를 내생적으로 제조하는 생물체 유래의 한가지 이상의 이종 단백질을 발현시키는 추가의 유전적 개질을 함유하며 상기 단백질은 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 것인 일부 실시양태에서, 생물체는 PUFA 신타제를 내생적으로 발현시킨다. 다른 실시양태에서, 단백질은 DAGAT 또는 LPAAT이다. 다른 실시양태에서, 생물체는 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 트라우스토키트리드 또는 라비린툴리드 유래의 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 또 다른 실시양태에서, 생물체는 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 쉬조키트리움 유래의 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 일부 실시양태에서, 핵산 서열은 서열 102, 서열 104, 서열 107, 서열 110 및 서열 113으로 이루어진 군으로부터 선택된 아미노산 서열과 60% 이상 동일한 아미노산 서열을 포함하는 단백질을 코딩한다. 다른 실시양태에서, 생물체는 서열 102, 서열 104, 서열 107, 서열 110 및 서열 113으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자, 더 바람직하게는 서열 서열 102 및 서열 104로 이루어진 군으로부터 선택된 아미노산을 포함하는 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 또 다른 실시양태에서, 생물체는 서열 102의 아미노산 서열을 포함하는 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자, 및 서열 104의 아미노산 서열을 포함하는 단백질을 코딩하는 핵산 서열을 사용해서 형질전환시킨다. 다른 실시양태에서, 생물체는 서열 100, 서열 102, 서열 103, 서열 105, 서열 106, 서열 108, 서열 109, 서열 111 및 서열 112로 이루어진 군으로부터 선택된 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 여기서, 생물체는 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 크립테코디니움 코니 유래의 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다. 어떤 실시양태에서, 생물체는 서열 114, 서열 115, 서열 116, 서열 117, 서열 118, 서열 119, 서열 120 및 서열 121로 이루어진 군으로부터 선택된 핵산 서열과 90% 이상 동일한 핵산 서열을 포함하는 핵산 분자로 형질전환시킨다.
상기 임의의 실시양태들의 일부 실시양태에서, PUFA 신타제는 트라우스토키트리드 또는 라비린툴리드 유래의 PUFA 신타제로부터의 하나 이상의 기능성 도메인을 포함한다. 일부 실시양태에서, PUFA 신타제는 트라우스토키트리알레스 미생물 유래의 PUFA 신타제로부터의 하나 이상의 기능성 도메인을 포함한다. 다른 실시양태에서, PUFA 신타제는 쉬조키트리움, 트라우스토키트리움, 울케니아 및 라비린툴라(Labyrinthula)로 이루어진 군으로부터 선택된 생물체 유래의 PUFA 신타제로부터의 하나 이상의 기능성 도메인을 포함한다. 또 다른 실시양태에서, PUFA 신타제는 쉬조키트리움 종(Schizochytrium sp .) 아메리칸 타입 컬쳐 콜렉션 (ATCC) 번호 20888, 트라우스토키트리움 23B ATCC 번호 20892, 및 이들 미생물 중 어느 것의 돌연변이체로 이루어진 군으로부터 선택된 생물체 유래의 PUFA 신타제의 하나 이상의 기능성 도메인을 포함한다. 일부 실시양태에서, PUFA 신타제는 해양 세균 유래의 PUFA 신타제의 하나 이상의 기능성 도메인을 포함한다. 다른 실시양태에서, PUFA 신타제는 쉬바넬라, 모리텔라(Moritella) 및 포토박테리움(Photobacterium)으로 이루어진 군으로부터 선택된 생물체 유래의 PUFA 신타제의 하나 이상의 기능성 도메인을 포함한다. 또 다른 실시양태에서, PUFA 신타제는
1개 이상의 에노일-ACP 리덕타제 (ER) 도메인;
4개 이상의 아실 운반 단백질 (ACP) 도메인;
2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인;
1개 이상의 아실트랜스퍼라제 (AT) 도메인;
1개 이상의 β-케토아실-ACP 리덕타제 (KR) 도메인;
2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인; 및
1개 이상의 쇄 길이 인자 (CLF) 도메인;
1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인
을 포함하는 하나 이상의 단백질로 구성된다.
추가의 실시양태에서, PUFA 신타제는
2개의 에노일 ACP-리덕타제 (ER) 도메인;
8개 또는 9개의 아실 운반 단백질 (ACP) 도메인;
2개의 β-케토 아실-ACP 신타제 (KS) 도메인;
1개의 아실트랜스퍼라제 (AT) 도메인;
1개의 케토리덕타제 (KR) 도메인;
2개의 FabA-유사 β-히드록시 아실-ACP 데히드라제 (DH) 도메인;
1개의 쇄 길이 인자 (CLF) 도메인; 및
1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인
을 포함하는 하나 이상의 단백질로 구성된다.
또 다른 실시양태에서, PUFA 신타제는 약 25℃의 온도에서 PUFA를 제조하는 세균성 PUFA 신타제이며, 상기 PUFA 신타제는
1개 이상의 에노일 ACP-리덕타제 (ER) 도메인;
6개 이상의 아실 운반 단백질 (ACP) 도메인;
2개 이상의 β-케토 아실-ACP 신타제 (KS) 도메인;
1개 이상의 아실트랜스퍼라제 (AT) 도메인;
1개 이상의 케토리덕타제 (KR) 도메인;
2개 이상의 FabA-유사 β-히드록시 아실-ACP 데히드라제 (DH) 도메인;
1개 이상의 쇄 길이 인자 (CLF) 도메인;
1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인; 및
1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인
을 포함하는 하나 이상의 단백질로 구성된다.
일부 실시양태에서, PUFA 신타제는 서열 1-32 중 어느 하나 및 서열 35-80 중 어느 하나로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함한다.
일부 실시양태에서, PUFA 신타제를 코딩하는 하나 이상의 핵산 서열은 식물 또는 식물 세포에서 PUFA 신타제의 발현을 향상시키도록 최적화되었다. 다른 실시양태에서, PUFA 신타제 및 PPTase의 발현은 식물 또는 식물 세포의 색소체로 표적화된다.
일부 실시양태에서, 유전적으로 개질된 생물체는 식물이며, 식물은 오일 종자 식물이다. 다른 실시양태에서, 식물은 쌍자엽 식물이다. 또 다른 실시양태에서, 식물은 카놀라, 대두, 평지씨, 아마인, 옥수수, 잇꽃, 해바라기 및 담배로 이루어진 군으로부터 선택되지만 이에 한정되지 않는다.
또 다른 실시양태에서, 유전적으로 개질된 생물체는 EPA (C20:5, n-3), DHA (C22:6, n-3), DPA (C22:5, n-6 또는 n-3), ARA (C20:4, n-6), GLA (C18:3, n-6), 및/또는 SDA (C18:4, n-3), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 한가지 이상의 다불포화 지방산 (PUFA)을 제조한다. 일부 실시양태에서, 유전적으로 개질된 생물체는 DHA, EPA 및 DPAn-6으로 이루어진 군으로부터 선택된 한가지 이상의 다불포화 지방산 (PUFA)을 제조한다. 다른 실시양태에서, 유전적으로 개질된 생물체는 DHA 및 DPAn-6을 제조한다. 또 다른 실시양태에서, 유전적으로 개질된 생물체는 ARA를 제조한다.
일부 실시양태에서, 유전적으로 개질된 생물체는 상기 한가지 이상의 PUFA를 0.5 중량% 이상 포함한다. 다른 실시양태에서, 상기 한가지 이상의 PUFA 이외에 상기 PUFA 신타제에 의해 제조된 총 지방산은 상기 생물체에 의해 제조된 총 지방산의 약 10 중량% 미만을 차지한다. 또 다른 실시양태에서, 상기 한가지 이상의 PUFA 이외에 상기 PUFA 신타제에 의해 제조된 총 지방산은 상기 생물체에 의해 제조된 총 지방산의 약 5 중량% 미만을 차지한다.
또 다른 실시양태에서, 식물, 식물의 부분 또는 식물 세포의 총 지방산 프로필은 20개 이상의 탄소 및 4개 이상의 탄소-탄소 이중 결합을 갖는 한가지 이상의 다불포화 지방산 (PUFA)을 약 0.5 중량% 이상 포함하며, 식물 또는 식물의 일부의 총 지방산 프로필은 하기 PUFA의 모두를 총 5% 미만으로 함유한다: 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA.
또 다른 실시양태에서, 식물, 식물의 부분 또는 식물 세포의 총 지방산 프로필은 20개 이상의 탄소 및 4개 이상의 탄소-탄소 이중 결합을 갖는 한가지 이상의 다불포화 지방산 (PUFA)을 약 0.5 중량% 이상 포함하며, 식물 또는 식물의 일부의 총 지방산 프로필은 하기 PUFA의 각각을 1% 미만 함유한다: 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA.
또 다른 실시양태에서, 식물, 식물의 부분 또는 식물 세포의 총 지방산 프로필은 20개 이상의 탄소 및 4개 이상의 탄소-탄소 이중 결합을 갖는 한가지 이상의 다불포화 지방산 (PUFA)을 약 0.5 중량% 이상 포함하며, 식물 또는 식물의 일부의 총 지방산 프로필은 감마-리놀렌산 (GLA; 18:3, n-6) 및 디호모-감마-리놀렌산 (DGLA 또는 HGLA; 20:3, n-6)을 2% 미만 함유한다.
다른 실시양태에서, 유전적으로 개질된 생물체의 총 지방산 프로필은 감마-리놀렌산 (GLA; 18:3, n-6) 및 디호모-감마-리놀렌산 (DGLA 또는 HGLA; 20:3, n-6)을 1 중량% 미만 함유한다.
다른 실시양태에서, 유전적으로 개질된 생물체의 총 지방산 프로필은 20개 이상의 탄소 및 4개 이상의 탄소-탄소 이중 결합을 갖는 한가지 이상의 다불포화 지방산 (PUFA)을 약 0.5 중량% 이상 포함하며, 식물 또는 식물의 일부의 총 지방산 프로필은 감마-리놀렌산 (GLA; 18:3, n-6)을 1% 미만 함유한다.
다른 실시양태에서, 유전적으로 개질된 생물체의 총 지방산 프로필은 감마-리놀렌산 (GLA; 18:3, n-6)을 0.5 중량% 미만 함유한다.
본 발명은 또한 본 발명의 유전적으로 개질된 임의의 생물체로부터 얻어진 오일을 제공한다. 한 실시양태에서, 본 발명은 검출가능한 양의 DHA (도코사헥사엔산 (C22:6, n-3)) 및 DPA (도코사펜타엔산 (C22:5, n-6)를 포함하는 오일을 제공하며, DPAn-6 대 DHA의 비율은 1:1이거나 또는 1:1보다 더 크고, 식물 오일은 본 발명의 유전적으로 개질된 임의의 생물체로부터 얻어진다.
유전적으로 개질된 생물체가 식물인 경우, 본 발명은 식물로부터 얻어진 종자를 제공한다.
본 발명은 또한 본 발명의 임의의 오일 또는 종자를 포함하는 식품 생성물을 제공한다.
본 발명은 또한 본 발명의 오일을 함유하는 제약 생성물을 제공한다.
본 발명은 또한 본 발명의 종자로부터 오일을 회수하는 것을 포함하는, 한가지 이상의 PUFA를 포함하는 오일을 제조하는 방법을 제공한다.
본 발명은 또한 본 발명의 유전적으로 개질된 임의의 생물체로부터 오일을 회수하는 것을 포함하는, 한가지 이상의 PUFA를 포함하는 오일을 제조하는 방법을 제공한다.
본 발명은 또한 본 발명의 유전적으로 개질된 임의의 식물 또는 미생물을 성장시키는 것을 포함하는, 한가지 이상의 다불포화 지방산 (PUFA)을 제조하는 방법을 제공한다.
추가로, 본 발명은 개체에게 본 발명의 유전적으로 개질된 생물체, 본 발명의 종자, 본 발명의 오일, 본 발명의 식품 생성물 또는 본 발명의 제약 생성물을 제공하는 것을 포함하는, 개체에게 한가지 이상의 PUFA를 함유하는 보충 또는 치료 생성물을 제공하는 방법을 제공한다.
본 발명은 또한 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하는 유전적 개질을 함유하는 생물체를, PUFA 신타제 및 PPTase를 코딩하는 하나 이상의 핵산 분자로 형질전환시키는 것을 포함하는, 상기 유전적으로 개질된 생물체를 생성하는 방법을 제공한다.
본 발명은 또한 PUFA 신타제 및 PPTase를 코딩하는 하나 이상의 핵산 분자를 사용해서 생물체를 형질전환시키고, 이 생물체가 KASII 및 KASIII으로 이루어진 군으로부터 선택된 단백질의 발현 또는 활성을 억제하도록 추가로 유전적으로 개질시키는 것을 포함하는, 상기 유전적으로 개질된 생물체를 생성하는 방법을 제공한다.
본 발명은 또한 PUFA 신타제를 코딩하는 핵산 분자, 포스포판테테이닐 트랜스퍼라제 (PPTase)를 코딩하는 핵산 분자, 및 본원에 기재된 임의의 아실-CoA 신테타제 또는 아실트랜스퍼라제를 코딩하는 핵산 분자를 사용해서 생물체를 형질전환시키는 것을 포함하는, 생물체가 PUFA를 발현하도록 형질전환시키는 방법을 제공한다. 한 측면에서, 생물체는 생물체에 의해 발현된 지방산 신타제 (FAS)를 결실시키거나 또는 불활성화하는 유전적 개질을 함유한다. 한 측면에서, 생물체는 말로닐 CoA에 대해 PUFA 신타제와 경쟁하는 것을 감소시키거나 또는 생물체에서 말로닐 CoA의 수준을 증가시키는 유전적 개질을 함유한다. 생물체는 예를 들어 식물 또는 미생물을 포함한다.
본 발명에 따르면, 다불포화 지방산 (PUFA)의 제조를 위한 PKS-유사 시스템 (즉, PUFA PKS 시스템 또는 PUFA 신타제)으로 유전적으로 개질된 숙주 생물체에서 다불포화 지방산 (PUFA), 특히 장쇄 PUFA (LCPUFA)의 제조를 향상시키는 부속 단백질 및 표적의 용도를 제공할 수 있다. 본 발명은 또한 이러한 부속 단백질을 발현시키도록 유전적으로 개질되었거나 또는 그러한 표적에 대하여 개질된 생물체 및 이 생물체의 제조 및 사용 방법을 제공할 수 있다.
도 1은 쉬조키트리움 균주 Ac66 및PUFA-S KO 및 이 균주로부터 유도된 FAS KO 돌연변이체의 세포 무함유 균질물의 시험관내 활성 검정에 대한 포스포르이미지(phosphorimage) 분석을 나타내는 디지털화 영상이다.
도 2는 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상(normal phase) TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 반응을 표시된 시간 동안 수행하였다.
도 3은 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상 상 TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 표준 검정 성분들을 사용하였지만, NADH, NADPH 및 아세틸-CoA 성분들은 달라졌다 (레인 1- NADH/NADPH/아세틸-CoA, 레인 2 - NADPH/아세틸-CoA, 레인 3 - NADH/아세틸-CoA, 레인 4 - NADH/NADPH, 레인 5 - 없음).
도 4는 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상 상 TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 반응을 10분 동안 수행한 다음, ATP 및 Mg+2를 첨가하였다. 반응은 하단에 나타낸 시간에서 중단시켰다 (" = 초, ' = 분).
도 5는 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상 상 TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 반응을 10분 동안 수행하고, ATP 및 Mg+2를 첨가하고 (샘플 1에서는 제외됨), 인큐베이션을 추가로 20분 동안 지속하였다 (레인 3 - 2 uL DMSO, 레인 4 - 4 uL DMSO, 레인 5 - 25 uM 트리아스신(Triascin) C, 레인 6 - 100 uM 트리아스신 C, 레인 7 - 200 uM 트리아스신 C).
도 6A는 쉬조키트리움 OrfA, OrfB*, OrfC 및 HetI을 발현시키는 이. 콜라이(E. coli)의 FAME 분석을 나타내는 디지털 영상이다. 균질물, 고속 펠릿 분획 (P2), 상등액 분획 (S1) 및 고속 상등액 분획 (S2) 중의 표적 PUFA를 나타낸다.
도 6B는, TLC에 의한 분리에 앞서 (FAMES로 전환되는 것보다는 오히려) HIP로 지질 생성물을 간단히 추출한 것을 제외하면, 도 6A에서 사용된 동일한 이. 콜라이 균주 샘플의 검정 결과를 나타내는 디지털 영상이다.
도 7은 쉬조키트리움 OrfsA, OrfsB, OrfC 및 HetI을 발현시키는 효모 및 대조군 효모의 FAME 프로필이다.
도 8은 표적 PUFA의 제조를 예시하도록 확대된, 도 1로부터의 효모에 대한 FAME 프로필이다.
도 9는 쉬조키트리움 PUFA 신타제 (sOrfA, sOrfB, OrfC) 및 HetI을 단독으로 또는 아실 CoA 신테타제와의 조합으로 발현시키는 효모의 DHA 프로필에 대한 FAS 활성의 억제 효과를 (총 FAME의 백분율로서) 나타내는 그래프이다.
도 10은 쉬조키트리움 PUFA 신타제 (sOrfA, sOrfB, OrfC) 및 HetI을 단독으로 또는 아실 CoA 신테타제와의 조합으로 발현시키는 효모의 DHA 및 DPAn6 프로필에 대한 FAS 활성의 억제 효과를 (총 FAME의 백분율로서) 나타내는 그래프이다.
도 11은 효모에서의 DHA 및 DPAn6 생성에 대하여, (세룰레닌에 의한) FAS 활성의 억제, 쉬조키트리움 PUFA 신타제 (sOrfA, sOrfB, OrfC) 및 HetI의 발현, 및 아실 CoA 신테타제의 발현의 조합된 효과를 나타내는 FAME 프로필이다.
도 12는 DAGAT 유전자가 녹아웃된(knocked out) 쉬조키트리움으로부터의 지질 프로필을 나타낸다.
도 13은 종자 발생 동안 쉬조키트리움 Orfs A, B*, C 및 HetI을 발현시키는, 야생형 아라비돕시스(Arabidopsis) 및 아라비돕시스 라인(Line) 263 (색소체 표적화됨)의 FAME 프로필이다.
도 14는 종자 발생 동안 FAS 억제 (KAS III 안티센스)와 조합된 색소체로 표적화된 쉬조키트리움 Orfs A, B*, C 및 HetI을 발현시키는, 라인 1087-7 (색소체 표적화됨)로부터의 아라비돕시스 종자의 FAME 프로필이다.
도 15는 종자 발생 동안 FAS 억제 (KAS II RNAi) 및 ACS-1과 조합된 색소체로 표적화된 쉬조키트리움 Orfs A, B*, C 및 HetI을 발현시키는 라인 1366으로부터의 푸울링된 아라비돕시스 종자의 FAME 프로필이다.
도 2는 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상(normal phase) TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 반응을 표시된 시간 동안 수행하였다.
도 3은 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상 상 TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 표준 검정 성분들을 사용하였지만, NADH, NADPH 및 아세틸-CoA 성분들은 달라졌다 (레인 1- NADH/NADPH/아세틸-CoA, 레인 2 - NADPH/아세틸-CoA, 레인 3 - NADH/아세틸-CoA, 레인 4 - NADH/NADPH, 레인 5 - 없음).
도 4는 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상 상 TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 반응을 10분 동안 수행한 다음, ATP 및 Mg+2를 첨가하였다. 반응은 하단에 나타낸 시간에서 중단시켰다 (" = 초, ' = 분).
도 5는 쉬조키트리움 FAS-KO 균주의 시험관내 활성 검정의 정상 상 TLC 분리의 포스포르이미지 분석을 나타내는 디지털화 영상이다. 반응을 10분 동안 수행하고, ATP 및 Mg+2를 첨가하고 (샘플 1에서는 제외됨), 인큐베이션을 추가로 20분 동안 지속하였다 (레인 3 - 2 uL DMSO, 레인 4 - 4 uL DMSO, 레인 5 - 25 uM 트리아스신(Triascin) C, 레인 6 - 100 uM 트리아스신 C, 레인 7 - 200 uM 트리아스신 C).
도 6A는 쉬조키트리움 OrfA, OrfB*, OrfC 및 HetI을 발현시키는 이. 콜라이(E. coli)의 FAME 분석을 나타내는 디지털 영상이다. 균질물, 고속 펠릿 분획 (P2), 상등액 분획 (S1) 및 고속 상등액 분획 (S2) 중의 표적 PUFA를 나타낸다.
도 6B는, TLC에 의한 분리에 앞서 (FAMES로 전환되는 것보다는 오히려) HIP로 지질 생성물을 간단히 추출한 것을 제외하면, 도 6A에서 사용된 동일한 이. 콜라이 균주 샘플의 검정 결과를 나타내는 디지털 영상이다.
도 7은 쉬조키트리움 OrfsA, OrfsB, OrfC 및 HetI을 발현시키는 효모 및 대조군 효모의 FAME 프로필이다.
도 8은 표적 PUFA의 제조를 예시하도록 확대된, 도 1로부터의 효모에 대한 FAME 프로필이다.
도 9는 쉬조키트리움 PUFA 신타제 (sOrfA, sOrfB, OrfC) 및 HetI을 단독으로 또는 아실 CoA 신테타제와의 조합으로 발현시키는 효모의 DHA 프로필에 대한 FAS 활성의 억제 효과를 (총 FAME의 백분율로서) 나타내는 그래프이다.
도 10은 쉬조키트리움 PUFA 신타제 (sOrfA, sOrfB, OrfC) 및 HetI을 단독으로 또는 아실 CoA 신테타제와의 조합으로 발현시키는 효모의 DHA 및 DPAn6 프로필에 대한 FAS 활성의 억제 효과를 (총 FAME의 백분율로서) 나타내는 그래프이다.
도 11은 효모에서의 DHA 및 DPAn6 생성에 대하여, (세룰레닌에 의한) FAS 활성의 억제, 쉬조키트리움 PUFA 신타제 (sOrfA, sOrfB, OrfC) 및 HetI의 발현, 및 아실 CoA 신테타제의 발현의 조합된 효과를 나타내는 FAME 프로필이다.
도 12는 DAGAT 유전자가 녹아웃된(knocked out) 쉬조키트리움으로부터의 지질 프로필을 나타낸다.
도 13은 종자 발생 동안 쉬조키트리움 Orfs A, B*, C 및 HetI을 발현시키는, 야생형 아라비돕시스(Arabidopsis) 및 아라비돕시스 라인(Line) 263 (색소체 표적화됨)의 FAME 프로필이다.
도 14는 종자 발생 동안 FAS 억제 (KAS III 안티센스)와 조합된 색소체로 표적화된 쉬조키트리움 Orfs A, B*, C 및 HetI을 발현시키는, 라인 1087-7 (색소체 표적화됨)로부터의 아라비돕시스 종자의 FAME 프로필이다.
도 15는 종자 발생 동안 FAS 억제 (KAS II RNAi) 및 ACS-1과 조합된 색소체로 표적화된 쉬조키트리움 Orfs A, B*, C 및 HetI을 발현시키는 라인 1366으로부터의 푸울링된 아라비돕시스 종자의 FAME 프로필이다.
본 발명은 일반적으로, 다불포화 지방산 (PUFA)을 제조하도록 유전적으로 개질된 숙주 생물체에서 다불포화 지방산 (PUFA), 특히 장쇄 PUFA (LCPUFA)의 제조를 향상시키기 위해 (본원에서 일반적으로 "부속 단백질" 또는 "부속 표적"으로 지칭되는) 단백질 또는 표적 및 이러한 단백질을 코딩하는 핵산 분자를 제공하는 것에 관한 것이다. 본 발명은 또한 이러한 특정 단백질을 발현시키도록 유전적으로 개질된 생물체, 및 상기 단백질 및 생물체를 사용 및 제조하는 방법에 관한 것이다. 본 발명은 또한 생물체내 특정 유전자들 또는 표적의 결실 또는 불활성화를 포함할 수 있는, PUFA를 제조하는 생물체에 대한 추가의 유전적 개질 (유전적 개질에 의해 PUFA를 제조하는 것을 포함함)에 관한 것이다. 특히, 본 발명은 (내생적으로 또는 유전적 조작에 의해) PUFA PKS 시스템을 발현시키는 생물체를 유전적으로 개질시켜 이 생물체에 의한 PUFA 제조 및/또는 축적을 향상 또는 증진시키는 것에 관한 것이다. 예를 들어, 본 발명은 또한 기질에 대해 경쟁하는 효소의 하향 조절(down regulation)을 조작하는 것과, 예를 들어 세포질 뿐만 아니라 색소체 세포소기관에 대한 효소의 표적화 또는 돌연변이유발에 의해 더 높은 효소 활성을 조작하는 것에 관한 것이다.
본 발명에 따라, PUFA PKS 시스템 (또한 PUFA 신타제 시스템이라고도 알려져 있으며, 이는 PUFA의 제조에 있어서 PUFA PKS 시스템 또는 PKS-유사 시스템과 상호교환가능하게 사용됨) 또는 적어도 그러한 PUFA PKS 시스템 또는 그의 일부를 발현시키도록 유전적으로 개질된 생물체 (상기 시스템을 자연적으로 (내생적으로, 유전적 개질 없이) 발현시키지 않음)는, 본원에서 생물체를 PUFA PKS 시스템 또는 이 생물체에 의해 내생적으로 발현되지 않는 다른 단백질을 사용해서 개질시키는 것과 관련하여 "이종" 숙주 생물체로 지칭될 수 있다. 또한 본 발명의 유전적 개질은 PUFA PKS 시스템을 내생적으로 발현시키며 다른 PUFA PKS 시스템 또는 그의 일부로 추가로 개질되지 않은 숙주 생물체에서 PUFA 제조를 향상시키기 위해 이용될 수 있다.
보다 구체적으로, 본 발명자들은 쉬조키트리움 PUFA 신타제의 지방산 생성물 (주로 DHA 및 DPAn-6)이 상기 효소로부터 유리 지방산 (FFA)으로서 방출되며 이 방출 메카니즘은 효소에 필수적이라는 사실을 본 발명에 이르러 최초로 밝혀내고 이를 본원에 개시하였다. 이러한 생성물 방출 메카니즘은 모든 트라우스토키트리드 PUFA PKS (PUFA 신타제) 효소 시스템의 특징인 것으로 여겨지며, 라비린툴리드 시스템을 비롯해서 모든 진핵생물 PUFA PKS 시스템의 특징일 수 있다. 추가로, 본 발명자들은 쉬조키트리움을 모델로 이용해서 DHA 및 DPA FFA가 추후에 내생성 아실-CoA 신테타제(ACoAS 또는 ACS) 또는 신테타제의 작용에 의해 조효소 A (CoA)로 에스테르화됨을 보여준다. 이후, 상기 활성화된 형태의 지방산 (아실-CoA)은 PL 및 TAG 형성 효소를 위한 기질로서 작용할 수 있다.
쉬조키트리움의 내생성 효소는 그의 PUFA 신타제의 FFA 생성물을 아실-CoA로 전환시킨 다음, 이를 PL 및 TAG의 합성을 위해 사용하는데 있어서 매우 효과적이다. 이는 쉬조키트리움 오일 및 PL 분획 중에 DHA 및 DPA가 높은 수준으로 축적되는 것에 의해 입증된다. 그러나, 이론에 얽매이고자 하는 것은 아니지만, 본 발명자들은 PUFA 신타제 시스템으로 형질전환시킬 수 있는 이종 숙주내에 존재하는 ACoAS 효소가 상기 반응을 PUFA 신타제 공여자 생물체 유래의 ACoAS 만큼 효율적으로 수행할 수는 없는 것으로 이해하고 있다. 추가로, 상기 신규 숙수 생물체내에서 PL 및 TAG를 형성하는 내생성 아실-트랜스퍼라제 효소는, 특히 PUFA 신타제가 유도된 생물체에 비해, 기질로서 PUFA-CoA를 효율적으로 이용할 수 없다. 본 발명자들은 또한 특정 생물체 유래의 아실트랜스퍼라제가 다른 생물체 유래의 유사한 효소보다 숙주 생물체의 오일 및 오일 분획 중 PUFA, 특히 특정 PUFA의 축적에 대하여 일반적으로 더 우수한 효소일 수 있음을 제안한다 (예, 한 생물체 유래의 아실트랜스퍼라제는 다른 생물체 유래의 아실트랜스퍼라제보다 더 많은 DHA-CoA 단위를 TAG로 전달할 수 있음). 따라서, 본 발명자들은 본원에서 쉬조키트리움과 유사하지만 쉬조키트리움에 한정되지 않는 생물체 (예, 트라우스토키트리드 또는 다른 생물체, 특히 다른 진핵 생물체)가 PUFA 신타제 효소 (PUFA PKS 시스템)에 의해 또는 다른 아실 쇄 생합성 시스템을 통해 그의 PUFA를 제조하고 그의 PL 및 TAG 중에 고수준의 PUFA를 축적하여 상기 효소를 코딩하는 유전자들의 우수한 공급원 역할을 하게 될 것이라고 개시하고 있다.
PUFA 생성물이 PUFA 신타제로부터 FFA로서 방출된다는 본 발명자들의 발견은 상기 시스템을 이종 숙주로 전달하는 측면에서 도전이자 기회가 되며 이종 숙주 생물체에서 PUFA의 제조 효율을 조절 및 향상시키는 실질적인 기회를 제공한다.
설명하자면, 장쇄 PUFA (LCPUFA)는 "표준" 또는 "전형적" PUFA 생합성 경로 (하기 정의됨)의 부분으로서 FFA로 생성되지 않는다. 실제로, 생물체에서 일반적으로 FFA로서 PUFA를 직면하게 되는 것은 단지 그가 외생적으로 제공되는 경우에서 이다. 예를 들어, 대부분의 세균과 유사한 이. 콜라이는 PUFA를 합성하지 않는다. 이 생물체에 의해 제조된 16개 및 18개의 탄소 포화 또는 단일-불포화 지방산은 제II형 FAS 시스템에 의해 아실 운반 단백질 (ACP) 상에서 합성된다. 아실-ACP는 PL 형성 효소를 위한 기질로서 작용한다. 이. 콜라이는 외생성 탄소 공급원으로서 다양한 FFA를 이용할 수 있다. 이러한 FFA는 PL 또는 분해 사이클로 진입하기에 앞서 아실-CoA로 전환된다. FadD 유전자는 이. 콜라이에서 유일하게 공지된 ACoAS 효소를 코딩하며, 이 유전자에서의 돌연변이는 유일한 탄소 공급원으로서 FFAd에 대한 성장 불능을 나타낸다.
진핵 생물체는 전형적으로 제I형 지방산 신타제 (FAS) (또는 고등 식물의 경우에는 제II형 FAS)를 사용해서 포화 지방산 (16개 및 18개의 탄소)을 제조한다. FAS 시스템의 생성물은 FFA (예, 동물 FAS) 또는 아실-CoA (예, 진균 FAS)로서 방출될 수 있다. 식물의 경우, 제II형 FAS는 색소체 내에 국소화된다. 이 경우, 탄소수 16 또는 18의 지방산이 제II형 FAS에 의해 제조되고, 흔히 단일 이중 결합이 형성되며, 지방산은 ACP에 부착된다. 아실-ACP는 색소체 PL의 형성을 위한 기질 역할을 할 수 있다. (세포질 PL에서의 사용 또는 TAG 합성을 위해) 색소체로부터 배출될 예정인 지방산의 경우, 아실-ACP 티오에스테라제는 티오에스테르 결합을 가수분해하여 FFA를 방출시킨다. 이어서, FFA는 색소체로부터 배출되며, 세포질 ACoAS에 의해 아실-CoA로 전환된다. 이들 아실-CoA는 PL 및 TAG 합성 효소를 위한 기질로서 작용한다.
진핵 생물체에서의 장쇄 PUFA (LCPUFA)의 합성을 위한 "표준" 또는 "전형적" 경로는 중간 쇄-길이 포화 또는 단일-불포화 지방산 (예, 상기 기재된 FAS 시스템의 생성물)의 개질을 포함한다. 이러한 개질은 연장 단계 및 탈포화(desaturation) 단계로 이루어진다. 연장 반응을 위한 기질은 지방 아실-CoA (연장될 지방산 쇄) 및 말로닐-CoA (각 연장 반응 동안 첨가될 탄소 2개의 공급원)이다. 엘론가제 반응의 생성물은 선형 쇄 내에 2개의 추가의 탄소를 갖는 지방 아실-CoA이다. 유리 지방산 (FFA)은 통상적으로 상기 반응 사이클에서 생성되지 않는다. 데새투라제는 산소-의존적 반응에서 2개의 수소를 추출함으로써 기존의 지방산 쇄 내에 시스 이중 결합을 생성시킨다. 데새투라제를 위한 기질은 PL (예, 포스포티딜콜린)의 글리세롤 주쇄로 에스테르화되는 지방산 또는 아실-CoA (일부 동물의 경우)이다. 또한, FFA는 이러한 반응 메카니즘에서 생성되지 않는다. 따라서, FFA가 "표준" 또는 "전형적" LCPUFA 합성 경로에서 생성되는 유일한 시기는 일부 FAS 시스템으로부터 지방산이 방출되는 동안이다. 상기 논의된 바와 같이, 이는 전형적으로 탄소수 16 또는 18의 지방산, 일반적으로 포화 또는 단일불포화 지방산이며, 더 긴 쇄 길이의 PUFA, 예를 들어 EPA 또는 DHA는 아니다. 장쇄 PUFA 제조를 위한 이러한 방안의 한 결과는 중간체들이 흔히 경로내에 축적됨으로써 이 시스템에 의해 제조된 신규 지방산의 대부분에 해당한다는 것이다.
따라서, 본 발명에 따라, PUFA의 제조를 위한 "표준" 또는 "전형적" 경로라는 언급은 중간 쇄-길이의 포화 지방산 (예, 지방산 신타제 (FAS) 시스템의 생성물)이 일련의 연장 및 탈포화 반응에 의해 개질되는 것인 지방산 합성 경로를 지칭한다. 연장 반응을 위한 기질은 지방 아실-CoA (연장될 지방산 쇄) 및 말로닐-CoA (각 연장 반응 동안 첨가된 2개의 탄소의 공급원)이다. 엘론가제 반응의 생성물은 선형 쇄내에 2개의 추가의 탄소를 갖는 지방 아실-CoA이다. 데새투라제는 산소-의존적 반응에서 2개의 수소를 추출함으로써 기존의 지방산 쇄 내에 시스 이중 결합을 생성시킨다. 이러한 경로 및 이 경로와 관련된 유전자들은 문헌에 잘 알려져 있다 (예, 상기 배경기술 참조).
PUFA PKS (PUFA 신타제) 효소에 의한 장쇄 PUFA의 합성을 위한 경로 (이하에 상세히 기재됨)는 상기 기재된 "표준" 경로와는 매우 다르다. PUFA 신타제는 탄소 공급원으로서 말로닐-CoA를 이용하며, 임의의 유의한 양의 중간체를 방출하지 않으면서 최종 PUFA를 제조한다. 산소를 필요로 하지 않는 메카니즘을 이용해서 합성하는 동안 적절한 시스 이중 결합이 부가된다. NADPH는 합성 사이클 동안 환원제로서 사용된다. 적어도 트라우스토키트리드 PUFA PKS 시스템에서, 효소는 본 발명자들에 의해 본원에서 최초로 개시된 바와 같이 FFA로서 PUFA 생성물을 방출시킨다. 이러한 방출 메카니즘은 효소 자체의 일부이다. 따라서, PUFA 효소 시스템으로부터 FFA로서 LCPUFA의 방출은 쉬조키트리움의 PUFA PKS 시스템의 고유한 특징이며, 모든 진핵생물 PUFA 신타제 시스템, 예를 들면 트라우스토키트리드에서의 상기 시스템의 특징일 수 있다.
따라서, 본 발명자들은 이종 숙주 (예, 내생적으로 특정 PUFA PKS 시스템을 발현시키지 않는 숙주 생물체)에서 PUFA PKS 시스템 (PUFA 신타제 시스템)을 발현시키는 경우, 원하는 구획 또는 지질 분획 내에서 PUFA 제조 및 축적을 최적화하는 것에 대하여 고려할 인자는 도입된 시스템의 FFA 생성물을 상응하는 아실-CoA로의 전환을 위한 기질로서 인식하는 숙주의 내생성 아실-CoA 신테타제(ACoAS) 효소(들)의 능력이라는 것을 제안한다. 상기 논의된 바와 같이 일반적으로 PUFA PKS 시스템이 도입될 수 있는 대부분의 이종 숙주 생물체에서 FFA로서 PUFA를 직면하게 되는 것은 단지 그가 외생적으로 제공되는 경우이기 때문에, 숙주 생물체는 FFA 취급에 적절한 최적의 부속 단백질을 갖지 않을 수 있으며, 이는 숙주 생물체가 원하는 지질 분획 또는 구획에서 PUFA를 최적으로 제조 및 축적하는데 있어서 억제 요인이 될 수 있다. 예를 들어, ACoAS 활성을 갖는 여러 단백질 군이 존재하며 이러한 효소의 바람직한 FFA 기질은 상당히 특이적이라는 사실은 잘 알려져 있다. 따라서, 일부 잠재적인 숙주에 존재하는 ACoAS는 특히 그러한 숙주에 FFA 형태의 PUFA가 통상적으로 존재하지 않는 경우에는 장쇄 PUFA FFA를 아실-CoA로 효율적으로 전환시키지 않을 수 있다. 또한, 숙주 생물체는 PL 및 TAG를 형성하며 기질로서 PUFA-CoA를 이용할 수 있는 최적의 아실트랜스퍼라제를 갖지 않을 수 있다. 마지막으로, PUFA PKS 시스템을 내생적으로 발현시키는 숙주 생물체의 경우에도, 본 발명자들은 생물체에서 오일 및 오일 분획 중 PUFA의 축적을 향상시키기 위해 본원에 논의된 개질을 이용해서 생물체를 유전적으로 개질시키는 것이 가능하다고 믿는다.
상기 기재된 본 발명자들에 의한 발견 및 경로는 이종 (또는 천연) 숙주에서 PUFA 신타제의 발현에 의해 PUFA를 제조하기 위한 여러 가이드라인 또는 전략을 제공한다:
1. 유전자 최적화 유전자 서열을 이종 숙주의 것에 매치시키는 것은 단백질을 발현시키기 위해 필요할 수 있다. 이는 하기 기재된 실시예들에 예시되어 있으며, 쉬조키트리움 유래의 PUFA PKS 시스템으로부터의 단백질을 코딩하는 유전자들을 세균 숙주 및 효모에서의 코돈 용법을 위해 최적화한다. 세균에서의 사용을 위해 최적화된 유전자는 또한 식물에서 쉬조키트리움 PUFA PKS의 발현에 유용한 것으로 나타났다. 이들 최적화된 유전자들에 대한 세부사항은 하기에 기재되어 있다.
2. PPTase 발현 본 발명자들은 이. 콜라이, 효모 및 식물에 존재하는 내생성 PPTase가 PUFA 신타제 ACP 도메인을 활성화할 수 없다고 결정하였다. 본 발명자들은 Nostoc으로부터 적합한 다른 PPTase, HetI을 이미 확인하였으며 (미국 특허 출원 공개 제20020194641호에 기재됨), 이는 내생성 PPTase가 PUFA 신타제 ACP 도메인을 활성화하지 않는 숙주에서 사용될 수 있다. 다른 적합한 PPTase가 또한 기재되어 있으며, 쉽게 얻을 수 있다. 다양한 이종 숙주 세포에서의 PPTase의 사용은 하기에 기재 및 예시되어 있다.
3. 기질 흐름( flux ) 변경/ FAS 억제 PUFA 신타제는 연장 반응을 위한 탄소의 공급원으로서 말로닐-CoA를 이용한다. 말로닐-CoA는 또한 FAS, 세포질 지방산 연장 반응 및 다른 효소 (예, 칼콘 신타제)에 의해 사용된다. PUFA 신타제는 말로닐-CoA에 대해 상기 다른 효소 시스템과 경쟁한다. 이는 PUFA 신타제 경로를 통해 흐름을 증가시키는 한가지 방법이 말로닐-CoA 푸울(들)에 대해 경쟁하는 그의 능력을 증진시키게 됨을 암시한다. 이러한 기질에 대해 경쟁하는 증진된 능력을 달성하기 위한 가능한 방법이 많이 있다. 이들 방법으로는 1) FAS 경로에서 임의의 요소들을 억제하는 것을 비롯해서 경쟁 경로를 억제하는 방법, 예를 들어 상기 경로에 관련된 효소 또는 서브유닛의 발현 수준을 (예를 들어, 안티센스 RNA, RNAi, 공동억제(co-suppression), 또는 돌연변이를 이용함으로써) 감소시키는 방법, 2) 경쟁 경로가 감소되거나 차단된 이종 숙주 (예를 들어, 카놀라의 경우 세포질에서 지방산을 연장시키는 능력이 차단됨)에서 PUFA 신타제를 발현시키는 방법, 및/또는 3) (예를 들어, 아세틸-CoA 카르복실라제를 발현시킴으로써) 말로닐-CoA의 푸울을 증가시키는 방법을 들 수 있지만 이에 한정되지 않는다.
이러한 전략의 예는 이하에 보다 상세히 기재되어 있으며 실시예에 예시되어 있다.
4. 아실- CoA 신테타제의 발현 쉬조키트리움에 존재하는 효소는 PUFA 신타제의 유리 지방산 생성물을 아실-CoA로 효율적으로 전환시킨다. 이종 숙주에 존재하는 효소는 이러한 반응을 유사한 효율로 수행하지 않을 수 있는데, 이는 상기 생물체가 전형적으로는 그러한 유리 지방산과 마주치지 않을 수 있기 때문이다. 예를 들어, 상기 이종 숙주에서 다양한 PUFA 신타제의 유리 지방산 생성물 (예, DHA, DPAn-6, EPA, 또는 다른 생성물)을 아실-CoA로 효율적으로 전환시키는 아실-CoA 신테타제효소의 발현은 상기 생성물을 축적하는 증가된 능력을 나타낼 수 있다. 이와 관련해서, 쉬조키트리움, 또는 PUFA 신타제 경로에 의해 PUFA를 제조하는 다른 생물체는 이들 효소를 코딩하는 유전자들의 우수한 공급원으로서의 역할을 하게 될 것이다 (하기 기술내용 및 실시예 참조).
5. 아실트랜스퍼라제 및 관련 효소의 발현 쉬조키트리움에 존재하는 효소는 PUFA 신타제의 아실-CoA 형태의 생성물을 효율적으로 이용해서 PL 및 TAG 분자를 합성한다. 이종 숙주에 존재하는 효소는 이러한 반응을 유사한 효율로 수행하지 않을 수 있는데, 이는 상기 생물체가 전형적으로는 그러한 PUFA-CoA와 직면하지 않을 수 있기 때문이다. 예를 들어, 상기 이종 숙주에서 다양한 PUFA 신타제의 아실-CoA 생성물 (예, DHA-CoA, DPAn-6-CoA, EPA-CoA, 또는 다른)을 PL 또는 TAG 분자로 효율적으로 통합하는 PL 또는 TAG 합성 효소의 발현은 상기 생성물을 축적하는 증가된 능력을 나타낼 수 있다. 이와 관련해서, 쉬조키트리움, 또는 PUFA 신타제 경로에 의해 PUFA를 제조하는 다른 생물체는 이들 효소를 코딩하는 유전자들의 우수한 공급원으로서의 역할을 하게 될 것이다 (하기 기술내용 및 실시예 참조).
6. 세포소기관 -특이적 발현 이종 숙주에서 축적되는 PUFA의 양을 증가시키거나 또는 프로필을 변화시키기 위해 이용할 수 있는 다른 방법들이 본원에서 고려된다. 한 예로서, 당업자라면 숙주내 별도의 구획에서 PUFA 신타제 시스템을 발현시킴으로써 (예를 들어, 식물 세포의 색소체 및 세포질에서) 축적량 증가를 나타낼 수 있는 별도의 말로닐-CoA 푸울에 도달할 수 있다. 이러한 전략은 또한 하기 실시예에 예시되어 있다.
따라서, 본 발명은 이종 숙주 생물체에서 PUFA 제조 및/또는 축적을 잠재적으로 억제하는 것에 대한 해결책을 제시하며, 또한 PUFA PKS 시스템을 이용해서 (유전적 개질에 의해 또는 내생적으로) PUFA를 제조하는 임의의 생물체에서 PUFA의 제조를 조절 및 증진시키는 독특한 기회를 제공한다. 특히, 본 발명은 PUFA PKS 시스템을 발현시키도록 유전적으로 개질된 생물체에서 발현시킬 수 있는 단백질 및 이를 코딩하는 핵산 분자 형태의 다양한 표적, 및 본원에 기재된 다른 유전적 개질 및 전략을 제공함으로써, 특히 생물체내의 바람직한 구획 또는 지질 분획에서 생물체에 의한 PUFA의 제조 및/또는 축적을 증진 또는 증가시킨다. 이러한 표적은 본원에서 일반적으로 PUFA PKS 시스템에 대한 "부속" 표적으로 지칭될 수 있다. 본원에 사용된 바와 같이, 표적은 본원에 기재된 바와 같은 숙주 생물체에서 발현 또는 과발현되는 것이 바람직한 핵산 분자 및/또는 그의 코딩된 단백질일 수 있으며, 결실 또는 불활성화에 관한 표적일 수 있거나, 또는 표적 세포소기관 (예, 식물의 색소체로의 표적화)이기도 하다. 달리 말하면, 표적은 PUFA의 제조를 위한 효소 시스템, 특히 PUFA PKS 시스템에 부가된 요소이거나 또는 이러한 시스템의 임의의 개질물일 수 있으며, 이 표적은 숙주 생물체내 지방산의 제조 및/또는 축적에 있어서 유용한 것으로 확인된다.
PUFA
PKS
시스템 (
PUFA
신타제
)
따라서, 본 발명은 PUFA PKS 시스템과 관련하여 사용하기 위한 부속 단백질 및 다른 표적을 제공하는 것에 관한 것이다. 본원에 사용된 바와 같이, PUFA PKS 시스템 (PUFA 신타제 시스템 또는 PUFA 신타제이라고 지칭할 수도 있음)은 일반적으로 하기 식별 특징을 갖는다: (1) 상기 시스템은 그의 천연 생성물로서 PUFA, 특히 장쇄 PUFA를 제조함; 및 (2) 상기 시스템은 선택된 사이클에서의 트랜스-시스 이성질체화 및 에노일 환원 반응을 비롯해서 지방산 쇄의 반복적 프로세싱 및 비-반복적 프로세싱을 둘 다 수행하는 복합체로 어셈블리된 여러 다기능성 단백질을 포함한다. 또한, PUFA 신타제 효소에 존재하는 ACP 도메인은 보조인자(cofactor) (4-포스포판테테인)의 부착에 의한 활성화를 필요로 한다. 이러한 보조인자의 부착은 포스포판테테이닐 트랜스퍼라제 (PPTase)에 의해 수행된다. 숙주 생물체의 내생성 PPTase가 PUFA 신타제 ACP 도메인을 활성화할 수 없다면, 이후에는 이 기능을 수행할 수 있는 PPTase를 제공하는 것이 필요하다. 본 발명자들은 PUFA 신타제 ACP 도메인을 활성화하기 위한 예시적인 적합한 PPTase로서 Nostoc 종의 HetI 효소를 동정하였다. PUFA PKS 시스템 또는 PUFA 신타제에 대한 언급은 생물체에서 PUFA를 제조하는 복합체에서 작용하는 모든 유전자들 및 이들의 코딩된 생성물을 총칭해서 지칭한다. 따라서, PUFA PKS 시스템은 특히 천연 생성물이 PUFA인 PKS 시스템을 지칭한다.
보다 구체적으로, 본원에 언급된 PUFA PKS 시스템은 생성물로서 다불포화 지방산 (PUFA), 특히 장쇄 PUFA (LCPUFA)를 제조한다. 예를 들어, 내생적으로 (천연적으로) PUFA PKS 시스템을 함유하는 생물체는 상기 시스템을 이용해서 PUFA를 제조한다. 본 발명에 따라, PUFA는 16개 이상의 탄소, 바람직하게는 18개 이상의 탄소, 더 바람직하게는 20개 이상의 탄소, 훨씬 더 바람직하게는 22개 이상의 탄소로 된 탄소 쇄 길이를 갖고 적어도 3개 이상의 이중 결합, 바람직하게는 4개 이상, 더 바람직하게는 5개 이상, 훨씬 더 바람직하게는 6개 이상의 이중 결합을 함유하는 지방산이며, 모든 이중 결합는 시스 배치로 존재한다. 본원에서 장쇄 다불포화 지방산 (LCPUFA)에 대한 언급은 보다 구체적으로 18개 이상의 탄소 쇄 길이, 바람직하게는 20개 이상의 탄소 쇄 길이를 갖고 3개 이상의 이중 결합을 함유하는 지방산을 지칭한다. 오메가-6 시리즈의 LCPUFA로는 감마-리놀렌산 (C18:3), 디-호모-감마-리놀렌산 (C20:3n-6), 아라키돈산 (C20:4n-6), 아드렌산 (또한, 도코사테트라엔산 또는 DTA라고 부름) (C22:4n-6), 및 도코사펜타엔산 (C22:5n-6)을 들 수 있다. 오메가-3의 LCPUFA로는 알파-리놀렌산 (C18:3), 에이코사트리엔산 (C20:3n-3), 에이코사테트라엔산 (C20:4n-3), 에이코사펜타엔산 (C20:5n-3), 도코사펜타엔산 (C22:5n-3), 및 도코사헥사엔산 (C22:6n-3)을 들 수 있다. LCPUFA로는 또한 22개 초과의 탄소 및 4개 이상의 이중 결합을 갖는 지방산을 들 수 있으며, 이에는 C28:8(n-3)가 포함되지만 이에 한정되지 않는다.
또한 본 발명에 따른 PUFA PKS 시스템은 선택된 사이클에서의 트랜스-시스 이성질체화 및 에노일 환원 반응을 비롯해서 지방산 쇄의 반복적 프로세싱 및 비-반복적 프로세싱을 둘 다 수행하는 복합체로 어셈블리되는 여러 다기능성 단백질을 포함한다 (단일 기능 단백질, 특히 해양 세균 유래의 PUFA PKS 시스템을 포함할 수 있음). 이러한 단백질은 또한 본원에서 코어 PUFA PKS 효소 복합체 또는 코어 PUFA PKS 시스템으로 지칭될 수 있다. 이 단백질내에 함유된 도메인 및 모티프의 일반적인 기능은 각각 당업계에 공지되어 있으며, 해양 세균 및 진핵 생물체 유래의 다양한 PUFA PKS 시스템에 대하여 상세히 기재되어 왔다 (예, 미국 특허 제6,140,486호; 미국 특허 제6,566,583호; 문헌 [Metz et al., Science 293:290-293 (2001)]; 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 미국 특허 출원 공개 제20050100995호, 및 PCT 공개 제WO 2006/135866호 참조). 도메인은 상기 언급한 바와 같이 단일 단백질 (즉, 도메인 및 단백질은 동의어임)로서 또는 단일 단백질내 2개 이상의 (다중) 도메인의 하나로 존재할 수 있다.
해양 세균 및 트라우스토키트리움 구성원 유래의 다양한 PUFA PKS 시스템의 도메인 구축, 및 이러한 PUFA PKS 시스템을 구성하는 유전자들 및 단백질의 구조적 및 기능적 특징이 상세히 기술되어 왔다(예, 미국 특허 제6,140,486호; 미국 특허 제6,566,583호; 문헌 [Metz et al., Science 293:290-293 (2001)]; 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 미국 특허 출원 공개 제20050100995호 및 PCT 공개 제WO 2006/135866호 참조).
본 발명에 유용한 PUFA PKS 시스템 및 그의 단백질 또는 도메인은 세균성 및 비-세균성 PUFA PKS 시스템을 둘 다 포함한다. 비-세균성 PUFA PKS 시스템은 세균이 아닌, 예를 들면 진핵생물 또는 고세균인 생물체로부터 얻어지거나 또는 그로부터 유도된 PUFA PKS 시스템이다. 진핵생물은 세포의 분화 정도를 기준으로 원핵생물로부터 분리되는데, 진핵생물이 원핵생물보다 더 분화된 것이다. 일반적으로, 원핵생물은 핵막을 보유하지 않고, 세포 분열 동안 유사분열을 나타내지 않고, 염색체를 1개만 갖고, 세포질내에 70S 리보솜을 함유하고, 미토콘드리아, 소포체, 엽록체, 리소좀 또는 골지체를 보유하지 않으며, 존재하는 경우 단일 원섬유(fibril)를 함유하는 편모를 가질 수 있다. 대조적으로, 진핵생물은 핵막을 갖고, 세포 분열 동안 유사분열을 나타내고, 다수의 염색체를 갖고, 세포질 내에 80S 리보솜을 함유하고, 미토콘드리아, 소포체, (조류에서) 엽록체, 리소좀 및 골지체를 보유하며, 존재하는 경우 다수의 원섬유를 함유하는 편모를 가질 수 있다. 일반적으로, 세균은 원핵생물이지만, 조류, 진균, 원생생물(protist), 원생동물 및 고등 식물은 진핵생물이다. 본 발명에 따라, 다른 PKS 시스템 (제I형 반복적 또는 모듈성, 제II형, 또는 제III형) 또는 FAS 시스템으로부터의 PKS 기능성 도메인 또는 단백질 뿐만 아니라 세균성 PUFA PKS 기능성 도메인과 함께 비-세균성 PUFA PKS 기능성 도메인을 혼입하는 유전적으로 개질된 식물을 제조할 수 있다.
바람직하게는, 본 발명의 PUFA PKS 시스템은 전형적으로 3종 이상의 단백질 상에 함유되는 하기의 생물학적 활성 도메인을 적어도 포함한다: (a) 1개 이상의 에노일-ACP 리덕타제 (ER) 도메인; (b) 다중 아실 운반 단백질 (ACP) 도메인(들) (예, 적어도 1개 내지 4개, 바람직하게는 5개 이상의 ACP 도메인, 및 일부 실시양태에서는 6개, 7개, 8개, 9개, 10개 이하, 또는 10개 초과의 ACP 도메인); (c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인; (d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인; (e) 1개 이상의 β-케토아실-ACP 리덕타제 (KR) 도메인; (f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인; (g) 1개 이상의 쇄 길이 인자 (CLF) 도메인; (h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인. 한 실시양태에서, 본 발명에 따른 PUFA PKS 시스템은 또한 데히드라타제 (DH) 보존된 활성 부위 모티프를 함유하는 1개 이상의 영역을 포함한다.
바람직한 실시양태에서, PUFA PKS 시스템은 적어도 하기 생물학적 활성 도메인을 포함한다: (a) 1개 이상의 에노일-ACP 리덕타제 (ER) 도메인; (b) 5개 이상의 아실 운반 단백질 (ACP) 도메인; (c) 2개 이상의 β-케토아실-ACP 신타제 (KS) 도메인; (d) 1개 이상의 아실트랜스퍼라제 (AT) 도메인; (e) 1개 이상의 β-케토아실-ACP 리덕타제 (KR) 도메인; (f) 2개 이상의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인; (g) 1개 이상의 쇄 길이 인자 (CLF) 도메인; 및 (h) 1개 이상의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인. 한 실시양태에서, 본 발명에 따른 PUFA PKS 시스템은 또한 FabA-유사 DH 도메인의 부분이 아닌 데히드라타제 (DH) 보존된 활성 부위 모티프를 함유하는 1개 이상의 영역 또는 도메인을 포함한다. 이들 도메인 각각의 구조적 및 기능적 특징은 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 미국 특허 출원 공개 제20050100995호; 및 PCT 공개 제WO 2006/135866호에 상세히 기재되어 있다.
본 발명에 따라, 3-케토 아실-ACP 신타제 (KS) 생물학적 활성 (기능)을 갖는 도메인 또는 단백질은 FAS (및 PKS) 연장 반응 사이클의 초기 단계를 수행하는 효소를 특징으로 한다. "β-케토아실-ACP 신타제"라는 용어는 "3-케토 아실-ACP 신타제", "β-케토 아실-ACP 신타제" 및 "케토-아실 ACP 신타제"라는 용어들 및 유사한 용어들과 함께 상호교환가능하게 사용될 수 있다. 연장용으로 예정된 아실기는 효소의 활성 부위에서 티오에스테르 결합에 의해 시스테인 잔기에 연결된다. 다단계 반응에서, 아실-효소는 말로닐-ACP와 축합반응을 수행하여 -케토 아실-ACP, CO2 및 유리 효소를 형성시킨다. KS는 연장 사이클에서 중요한 역할을 수행하며, 다수의 시스템에서 반응 사이클의 다른 효소보다 더 큰 기질 특이성을 보유하는 것으로 알려져 왔다. 예를 들어, 이. 콜라이는 3가지 상이한 KS 효소를 가지며, 이들 각각은 생물체의 생리학에서 그 자신의 특별한 역할을 수행한다 [Magnuson et al., Microbiol. Rev. 57, 522 (1993)]. 본원에 기재된 해양 세균 및 트라우스토키트리드에서 기술된 PUFA-PKS 시스템의 2개의 KS 도메인은 PUFA 생합성 반응 서열에서 상이한 역할을 수행할 수 있다. 효소의 분류에서, KS는 잘 특성화되었다. 다수의 확인된 KS 유전자들의 서열은 공지되어 있고, 활성 부위 모티프들이 확인되었으며, 여러 결정 구조가 결정되었다. 단백질 (또는 단백질의 도메인)은 공지된 KS 서열에 대한 상동성에 의해 KS 효소 패밀리에 속하는 것으로 쉽게 확인될 수 있다.
본 발명에 따라, 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 생물학적 활성 (기능)을 갖는 도메인 또는 단백질은 말로닐-CoA로부터의 말로닐 잔기를 ACP에 전달하는 것으로 특성화된다. "말로닐-CoA:ACP 아실트랜스퍼라제"라는 용어는 "말로닐 아실트랜스퍼라제" 및 유사한 용어들과 함께 상호교환가능하게 사용될 수 있다. 활성 부위 모티프 (GxSxG) 이외에, 이들 효소는 주요 위치에서 R 및 Q 아미노산의 연장된 모티프를 보유하며, 이 모티프에 의해 상기 효소가 (예를 들어, 하기 기재된 AT 도메인과 달리) MAT 효소로서 확인된다. 일부 PKS 시스템에서 (단, PUFA PKS 도메인은 아님), MAT 도메인은 (상응하는 CoA 에스테르로부터) ACP 기 상으로 메틸- 또는 에틸-말로네이트를 선택적으로 로딩함으로써 선형 탄소 쇄에 분지를 도입하게 될 것이다. MAT 도메인은 공지된 MAT 서열에 대한 그의 상동성에 의해, 그리고 그의 연장된 모티프 구조에 의해 인식될 수 있다.
본 발명에 따라, 아실 운반 단백질 (ACP) 생물학적 활성 (기능)을 갖는 도메인 또는 단백질은 이 단백질의 공유 결합된 보조인자에 대한 티오에스테르 결합에 의해 지방 아실 쇄를 성장시키기 위한 운반자로서 기능하는 작은 폴리펩티드 (전형적으로, 아미노산 80 내지 100개 길이)인 것을 특징으로 한다. 상기 폴리펩티드는 별도의 단위로 또는 더 큰 단백질 내의 도메인으로 존재한다. ACP는 CoA의 포스포판테테이닐 잔기가 ACP의 고도로 보존된 세린 잔기로 전달됨으로써 불활성 아포(apo)-형태로부터 기능적 홀로(holo)-형태로 전환된다. 아실기는 포스포판테테이닐 잔기의 유리 말단에서 티오에스테르 결합에 의해 ACP에 부착된다. ACP는 방사활성 판테테인으로 표지함으로써, 그리고 공지된 ACP에 대한 서열 상동성에 의해 확인될 수 있다. 상기 언급된 모티프 (LGIDS*)의 개질물의 존재는 또한 ACP의 표시(signature)이다.
본 발명에 따라, 3-케토아실-ACP 리덕타제 (KR) 생물학적 활성 (기능)이라고도 불리우는 케토리덕타제 활성을 갖는 도메인 또는 단백질은 3-케토 아실 형태의 ACP의 피리딘-뉴클레오티드-의존성 환원을 촉매하는 것으로 특성화된다. 이는 드노보 지방산 생합성 연장 사이클에서 첫번째 환원 단계이며, 폴리케티드 생합성에서 흔히 수행되는 반응이다. "β-케토아실-ACP 리덕타제"라는 용어는 "케토리덕타제", "3-케토아실-ACP 리덕타제", "케토-아실 ACP 리덕타제"라는 용어들, 및 상기 용어와 유사한 용어들과 상호교환가능하게 사용될 수 있다. FAS의 다른 리덕타제인 에노일 ACP 리덕타제 (ER)의 한 패밀리 (단, PUFA PKS 시스템에 존재하는 ER 패밀리는 아님)와 단쇄 알콜 데히드로게나제 패밀리 사이에 유의한 서열 유사성이 관찰된다. 상기 나타낸 PUFA PKS 영역의 Pfam 분석은 코어 영역에서 단쇄 알콜 데히드로게나제 패밀리에 대한 상동성을 나타낸다. 동일한 영역에 대한 Blast 분석은 코어 영역에서 공지된 KR 효소에 대한 대응 및 다른 특성화된 PUFA PKS 시스템으로부터의 도메인에 대한 연장된 영역의 상동성을 나타낸다.
본 발명에 따라, 도메인 또는 단백질은 하기 이론적 설명을 기초로 쇄 길이 인자 (CLF)라고 지칭된다. CLF는 본래 제II형 (해리된 효소) PKS 시스템의 특징으로 기술되었으며, 연장 사이클의 횟수, 따라서 최종 생성물의 쇄 길이를 결정하는데 있어서 역할을 수행한다는 가설이 세워졌다. CLF 아미노산 서열은 KS 도메인에 대한 상동성을 나타내지만 (KS 단백질과 헤테로이량체를 형성하는 것으로 생각됨), 상기 서열은 활성 부위 시스테인이 결여되어 있다. PKS 시스템에서의 CLF의 역할은 논쟁의 여지가 있어 왔다. 새로운 증거 [C. Bisang et al., Nature 401, 502 (1999)]는 PKS 시스템을 개시 (연장될 초기 아실기를 제공)하는 데 있어서의 역할을 제안한다. 이 역할에서, CLF 도메인은 말로네이트를 (말로닐-ACP로서) 탈카르복실화함으로써, KS 활성 부위로 전달될 수 있는 아세테이트기를 형성하는 것으로 생각된다. 따라서, 이 아세테이트는 초기 연장(축합) 반응을 수행할 수 있는 "개시" 분자로서 작용한다. 제II형 CLF의 상동체가 일부 모듈성 PKS 시스템에서 '로딩' 도메인으로서 확인되었다. CLF의 서열 특징을 갖는 도메인은 현재 확인된 모든 PUFA PKS 시스템에 존재하며, 각 경우에서 다중단백질의 부분으로서 존재한다.
"아실트랜스퍼라제" 또는 "AT"는 다수의 상이한 아실 전달 반응을 수행할 수 있는 일반적인 효소 군으로서 지칭된다. "아실트랜스퍼라제"라는 용어는 "아실 트랜스퍼라제"라는 용어와 상호교환가능하게 사용될 수 있다. 본원에 기재된 바와 같은 PUFA PKS 시스템에서 확인된 AT 도메인은 현재 조사된 다른 PUFA PKS 시스템의 모두에 존재하는 도메인에 대해 서로 양호한 상동성을 나타내며, 특정 기능이 확인된 일부 아실트랜스퍼라제 (예, 말로닐-CoA:ACP 아실트랜스퍼라제, MAT)에 대해 매우 약한 상동성을 나타낸다. MAT에 대한 약한 상동성에도 불구하고, 상기 AT 도메인은 그러한 효소의 연장된 모티프 구조 특징을 보유하지 않기 때문에 MAT로서 기능하는 것으로 여겨지지 않는다 (MAT 도메인에 대한 상기 설명 참조). 이에 대한 개시 목적으로, PUFA PKS 시스템에서의 AT 도메인의 가능한 기능들로는 하기 것들을 들 수 있지만 이에 한정되지 않는다: ORFA ACP 도메인(들)로부터 물로 지방 아실기를 전달함 (즉, 티오에스테라제 - 지방 아실기를 유리 지방산으로서 방출함), 지방 아실기를 CoA와 같은 어셉터(acceptor)로 전달함, 아실기를 다양한 ACP 도메인 중에 전달함, 또는 지방 아실기를 친지질성 어셉터 분자 (예, 리소포스파드산(lysophosphadic acid))에 전달함.
본 발명에 따라, 상기 도메인은 에노일 리덕타제 (ER) 생물학적 활성을 갖는다. ER 효소는 지방 아실-ACP에서 (DH 활성에 의해 도입된) 트랜스-이중 결합을 감소시켜 완전히 포화된 상기 탄소를 생성시킨다. PUFA-PKS에서의 ER 도메인은 새로 특성화된 ER 효소 패밀리에 대한 상동성을 나타낸다 [Heath et al., Nature 406, 145 (2000)]. 히쓰(Heath)와 록(Rock)은 스트렙토코커스 뉴모니애(Streptococcus pneumoniae)로부터 대상 유전자를 클로닝하고, 이 유전자로부터 발현된 단백질을 정제하고, 그가 시험관내 검정에서 ER 활성을 나타냈음을 보여줌으로써 이러한 새로운 종류의 ER 효소를 확인하였다. 현재 조사된 모든 PUFA PKS 시스템은 쉬조키트리움 ER 도메인에 대해 매우 높은 서열 상동성을 갖는 하나 이상의 도메인을 함유하는데, 이는 에스. 뉴모니애(S. pneumoniae) ER 단백질에 대해 상동성을 나타낸다.
본 발명에 따라, 데히드라제 또는 데히드라타제 (DH) 활성을 갖는 단백질 또는 도메인은 탈수 반응을 촉매한다. 본원에서 일반적으로 사용된 바와 같이, DH 활성에 대한 언급은 전형적으로 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 생물학적 활성을 지칭한다. FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 생물학적 활성은 β-케토아실-ACP로부터 HOH를 제거하며, 탄소 쇄에서 초기에 트랜스 이중 결합을 생성시킨다. "FabA-유사 β-히드록시아실-ACP 데히드라제"라는 용어는 "FabA-유사 β-히드록시 아실-ACP 데히드라제", "β-히드록시아실-ACP 데히드라제", "데히드라제"라는 용어들 및 이와 유사한 용어들과 상호교환가능하게 사용될 수 있다. PUFA PKS 시스템의 DH 도메인은 (다른 PKS 시스템의 DH 도메인에 대해서 보다는) 그의 FAS 시스템과 관련된 세균성 DH 효소에 대해 상동성을 나타낸다. 세균성 DH의 하위세트인 FabA-유사 DH는 시스-트랜스 이소머라제 활성을 보유한다 [Heath et al., J. Biol. Chem., 271, 27795 (1996)]. FabA-유사 DH 단백질에 대한 상동성은 본원에 기재된 하나 또는 모든 DH 도메인이 PUFA PKS 생성물에서 시스 이중 결합의 삽입을 담당한다는 것을 암시한다.
본 발명의 유용한 PUFA PKS 단백질은 또한, 일반적으로 본원에서 비-FabA-유사 DH 활성, 또는 비-FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 생물학적 활성으로 지칭되는 FabA-유사로 특성화되지 않은 데히드라타제 활성을 가질 수 있다 (예를 들어, 상기 기술된 시스-트랜스 활성은 FabA-유사 활성과 관련이 있다). 보다 구체적으로, 보존된 활성 부위 모티프 (아미노산 약 13개 길이: L*xxHxxxGxxxxP; 예를 들어, 서열 70의 아미노산 2504-2516에 의해 예시됨; *모티프에서, L은 또한 I일 수 있음)는 PKS 시스템에서 데히드라타제 도메인내에 존재한다 [Donadio S, Katz L. Gene. 1992 Feb 1;111(1):51-60]. 본원에서 데히드라타제 (DH) 보존된 활성 부위 모티프 또는 DH 모티프라고도 지칭되는 이러한 보존된 모티프는 최근까지 기술된 모든 공지된 PUFA-PKS 서열의 유사한 영역내 및 본원에 기재된 바와 같은 PUFA PKS 서열내에 존재하지만, his 모티프는 단지 최근에 검출된 것으로 여겨진다. 이러한 보존된 모티프는 PUFA-PKS 서열에서 높은 상동성을 갖는 특성화되지 않은 영역내에 존재한다. PUFA-PKS에 의한 PUFA의 제안된 생합성은 비-FabA 유사 탈수를 필요로 하며, 이러한 모티프는 반응을 담당할 수 있다.
예시 목적으로, 여러 PUFA PKS 시스템의 구조는 하기에 상세히 기재되어 있다. 그러나, 본 발명은 이러한 PUFA PKS 시스템의 사용으로 제한되지 않는 것으로 이해된다.
쉬조키트리움
PUFA
PKS
시스템
한 실시양태에서, 쉬조키트리움 유래의 PUFA PKS 시스템은 적어도 하기 생물학적 활성 도메인을 포함한다: (a) 2개의 에노일-ACP 리덕타제 (ER) 도메인; (b) 5개 내지 10개 이상의 아실 운반 단백질 (ACP) 도메인, 및 한 측면에서 9개의 ACP 도메인; (c) 2개의 β-케토아실-ACP 신타제 (KS) 도메인; (d) 1개의 아실트랜스퍼라제 (AT) 도메인; (e) 1개의 β-케토아실-ACP 리덕타제 (KR) 도메인; (f) 2개의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인; (g) 1개의 쇄 길이 인자 (CLF) 도메인; 및 (h) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인. 한 실시양태에서, 본 발명에 따른 쉬조키트리움 PUFA PKS 시스템은 또한 FabA-유사 DH 도메인의 부분이 아닌 데히드라타제 (DH) 보존된 활성 부위 모티프를 함유하는 하나 이상의 영역 또는 도메인을 포함한다. 이들 도메인의 구조적 및 기능적 특징은 일반적으로 각각 당업계에 공지되어 있다 (예를 들어, 미국 특허 제6,566,583호; 문헌 [Metz et al., Science 293:290-293 (2001)]; 미국 특허 출원 공개 제20020194641호; 및 PCT 공개 제WO 2006/135866호 참조).
상기 기재된 코어 쉬조키트리움 PUFA PKS 시스템을 형성하는 3개의 오픈 리딩 프레임이 존재한다. 각 오픈 리딩 프레임의 도메인 구조는 다음과 같다.
쉬조키트리움 오픈 리딩 프레임 A ( OrfA ):
OrfA의 완전한 뉴클레오티드 서열은 본원에서 서열 1로 나타낸다. OrfA는 본원에서 서열 2로 나타낸, 2910개의 아미노산 서열을 코딩하는 8730개의 뉴클레오티드 서열 (종결 코돈은 포함하지 않음)이다. OrfA 내에는 다음과 같은 12개의 도메인이 존재한다: (a) 1개의 β-케토 아실-ACP 신타제 (KS) 도메인; (b) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인; (c) 9개의 아실 운반 단백질 (ACP) 도메인; 및 (d) 1개의 케토리덕타제 (KR) 도메인. 쉬조키트리움 종(Schizochytrium sp .) ATCC 20888, 및 쉬조키트리움 종, 균주 N230D로 명명된 ATCC 20888의 자손 균주 둘 다로부터의 OrfA를 코딩하는 게놈 DNA 클론 (플라스미드)을 단리 및 서열화하였다.
쉬조키트리움 종 ATCC 20888로부터 단리된, 본원에서 JK1126으로 기재된 게놈 클론은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 1의 위치 1 내지 8730에 걸쳐있는 뉴클레오티드 서열을 포함하며, 서열 2의 상응하는 아미노산 서열을 코딩한다. 게놈 클론 pJK1126 (쉬조키트리움 ATCC 20888로부터의 "OrfA" 유전자를 함유하는 이. 콜라이 플라스미드 벡터 형태의 pJK1126 OrfA 게놈 클론으로 표시됨)은 2006년 6월 8일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-7648을 배정받았다. pJK1126 OrfA 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩된 아미노산 서열은 본 발명에 포함된다.
쉬조키트리움 종 N230D으로부터 함께 단리되며 본원에 pJK306 OrfA 게놈 클론 및 pJK320 OrfA 게놈 클론으로 기재된 2개의 게놈 클론 (중복 클론)은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 1의 뉴클레오티드 서열을 포함하며 서열 2의 아미노산 서열을 코딩한다. 게놈 클론 pJK306 (쉬조키트리움 종 N230D (pJK320과 2.2kB 중복됨)으로부터의 OrfA 유전자의 5' 부분을 함유하는 이. 콜라이 플라스미드 형태의 pJK306 OrfA 게놈 클론으로 표시됨)은 2006년 6월 8일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-7641을 배정받았다. pJK306 OrfA 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다. 게놈 클론 pJK320 (쉬조키트리움 종 N230D (pJK306과 2.2kB 중복됨)으로부터의 OrfA 유전자의 3' 부분을 함유하는 이. 콜라이 플라스미드 형태의 pJK320 OrfA 게놈 클론으로 표시됨)은 2006년 6월 8일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-7644를 배정받았다. pJK320 OrfA 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
OrfA의 제1 도메인은 본원에서 ORFA-KS라고도 지칭되는 KS 도메인이며, ORFA-KS 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 7 (서열 1의 위치 1-1500)로 나타낸다. ORFA-KS 도메인을 함유하는 아미노산 서열은 본원에서 서열 8 (서열 2의 위치 1-500)로 나타낸다. ORFA-KS 도메인이 활성 부위 모티프: DXAC* (*아실 결합 부위 C215)를 함유한다는 것을 유의한다. 또한, 쉬조키트리움 KS 영역의 말단에 있는 특징적인 모티프인 GFGG는 서열 2내의 상기 도메인, 즉 서열 8 내에 존재한다.
OrfA의 제2 도메인은 본원에서 ORFA-MAT라고도 지칭되는 MAT 도메인이며, ORFA-MAT 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 9 (서열 1의 위치 1723-3000)로 나타낸다. ORFA-MAT 도메인을 함유하는 아미노산 서열은 본원에서 서열 10 (서열 2의 위치 575-1000)으로 나타낸다. MAT 도메인은 위치 93에서 아스파르테이트 및 서열 94에서 히스티딘을 포함한다 (각각 서열 2의 위치 667 및 668에 상응함). ORFA-MAT 도메인은 본원에서 서열 11로 나타낸 활성 부위 모티프: GHS*XG (*아실 결합 부위 S706)를 함유한다는 것을 유의한다.
OrfA의 도메인 3-11은 본원에서 ORFA-ACP라고도 지칭되는 9개의 탄뎀(tandem) ACP 도메인이다 (예컨대, 이 서열의 제1 도메인은 ORFA-ACP1이고, 제2 도메인은 ORFA-ACP2이고, 제3 도메인은 ORFA-ACP3임). 제1 ACP 도메인인 ORFA-ACP1은 서열 1 (OrfA)의 위치 약 3343 내지 위치 약 3600에 걸쳐있는 뉴클레오티드내에 함유되어 있다. ORFA-ACP1 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 12 (서열 1의 위치 3343-3600)로 나타낸다. 제1 ACP 도메인을 함유하는 아미노산 서열은 서열 2의 위치 약 1115 내지 위치 약 1200에 걸쳐있다. ORFA-ACP1 도메인을 함유하는 아미노산 서열은 본원에서 서열 13 (서열 2의 위치 1115-1200)으로 나타낸다. ORFA-ACP1 도메인은 본원에서 서열 14로 나타낸 활성 부위 모티프: LGIDS* (*판테테인 결합 모티프 S1157)를 함유한다는 것을 유의한다.
9개의 ACP 도메인 모두의 뉴클레오티드 및 아미노산 서열은 고도로 보존되어 있으며, 따라서 각 도메인의 서열은 본원에서 개별 서열 식별자(identifier)로 나타내지 않는다. 그러나, 본원에 개시된 정보를 기초로, 당업자라면 다른 8개의 ACP 도메인의 각각을 함유하는 서열을 용이하게 결정할 수 있을 것이다. 9개의 ACP 도메인 모두는 함께 서열 1의 위치 약 3283 내지 위치 약 6288의 OrfA의 영역에 걸쳐있으며, 이는 서열 2의 약 1095 내지 약 2096의 아미노산 위치에 상응한다. 9개의 도메인 모두를 함유하는 전체 ACP 영역에 대한 뉴클레오티드 서열은 본원에서 서열 16으로 나타낸다. 서열 16으로 나타낸 영역은 개별 ACP 도메인 사이의 링커 세그먼트를 포함한다. 9개의 도메인에 대한 반복 간격은 서열 16의 뉴클레오티드 대략 330개 마다이다 (인접한 활성 부위 세린 사이에서 측정된 아미노산의 실제 수는 아미노산 104개 내지 116개의 범위임). 9개의 ACP 도메인의 각각은 (본원에서 서열 14로 나타낸) 판테테인 결합 모티프 LGIDS*를 함유하며, 여기서 S*는 판테테인 결합 부위 세린 (S)이다. 판테테인 결합 부위 세린 (S)은 각각의 ACP 도메인 서열의 중심 근처에 위치한다. ACP 도메인 영역의 각 말단에서 및 각 ACP 도메인 사이에는 프롤린 (P) 및 알라닌 (A)이 고도로 풍부한 영역이 존재하며, 이는 링커 영역인 것으로 여겨진다. 예를 들어, ACP 도메인 1과 2 사이에는 본원에서 서열 15로 나타낸 서열 APAPVKAAAPAAPVASAPAPA이 있다. 서열 2의 아미노산 서열에 대하여 9개의 ACP 도메인 각각에 있어서의 활성 부위 세린 잔기 (즉, 판테테인 결합 부위)의 위치는 다음과 같다: ACP1 = S1157; ACP2 = S1266; ACP3 = S1377; ACP4 = S1488; ACP5 = S1604; ACP6 = S1715; ACP7 = S1819; ACP8 = S1930; 및 ACP9 = S2034. ACP 도메인의 평균 크기가 링커를 제외하고 아미노산 약 85개이고, 링커를 포함하면 아미노산 약 110개이며, 활성 부위 세린이 대략 도메인 중심에 있음을 고려하면, 당업자는 OrfA에서 9개의 ACP 도메인 각각의 위치를 용이하게 결정할 수 있을 것이다.
OrfA의 도메인 12는 본원에서 ORFA-KR이라고도 지칭되는 KR 도메인이며, ORFA-KR 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 17 (서열 1의 위치 6598-8730)로 나타낸다. ORFA-KR 도메인을 함유하는 아미노산 서열은 본원에서 서열 18 (서열 2의 위치 2200-2910)로 나타낸다. KR 도메인 내에는 단쇄 알데히드-데히드로게나제에 대해 상동성을 갖는 코어 영역이 존재한다 (KR은 이 패밀리의 구성원임). 이 코어 영역은 서열 1의 위치 약 7198 내지 위치 약 7500에 걸쳐있으며, 이는 서열 2의 아미노산 위치 2400-2500에 상응한다.
쉬조키트리움 오픈 리딩 프레임 B ( OrfB ):
OrfB에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 3으로 나타낸다. OrfB는 본원에서 서열 4로 나타낸 2059개의 아미노산 서열을 코딩하는 6177개의 뉴클레오티드 서열 (종결 코돈은 포함하지 않음)이다. OrfB 내에는 다음과 같은 4개의 도메인이 존재한다: (a) 1개의-케토 아실-ACP 신타제 (KS) 도메인; (b) 1개의 쇄 길이 인자 (CLF) 도메인; (c) 1개의 아실 트랜스퍼라제 (AT) 도메인; 및 (d) 1개의 에노일 ACP-리덕타제 (ER) 도메인.
쉬조키트리움 종 ATCC 20888, 및 쉬조키트리움 종, 균주 N230D로 명명된 ATCC 20888의 자손 균주 둘 다로부터의 OrfB를 코딩하는 게놈 DNA 클론 (플라스미드)이 단리 및 서열화되었다.
쉬조키트리움 종 ATCC 20888로부터 단리된, 본원에서 pJK1129로 기재된 게놈 클론은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 3의 뉴클레오티드 서열을 포함하며 서열 4의 아미노산 서열을 코딩한다. 게놈 클론 pJK1129 (쉬조키트리움 ATCC 20888로부터의 "OrfB" 유전자를 함유하는 이. 콜라이 플라스미드 벡터 형태의 pJK1129 OrfB 게놈 클론이라 표시됨)은 2006년 6월 8일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-7649를 배정받았다. pJK1126 OrfB 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
쉬조키트리움 종 N230D로부터 단리된, 본원에서 pJK324 OrfB 게놈 클론으로 기재된 게놈 클론은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 3의 뉴클레오티드 서열을 포함하며 서열 4의 아미노산 서열을 코딩한다. 게놈 클론 pJK324 (쉬조키트리움 종 N230D로부터의 OrfB 유전자 서열을 함유하는 이. 콜라이 플라스미드 형태의 pJK324 OrfB 게놈 클론으로 표시됨)는 2006년 6월 8일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-7643을 배정받았다. pJK324 OrfB 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
OrfB의 제1 도메인은 본원에서 ORFB-KS라고도 지칭되는 KS 도메인이며, ORFB-KS 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 19 (서열 3의 위치 1-1350)로 나타낸다. ORFB-KS 도메인을 함유하는 아미노산 서열은 본원에서 서열 20 (서열 4의 위치 1-450)으로 나타낸다. 이 KS 도메인은 서열 20의 위치 371의 발린 (또한 서열 20의 위치 371)을 포함한다. ORFB-KS 도메인이 활성 부위 모티프: DXAC* (*아실 결합 부위 C196)을 함유한다는 것을 유의한다. 또한, 상기 KS 영역의 말단에 있는 특징적인 모티프인 GFGG는 서열 4의 상기 도메인내, 따라서 서열 20내에 존재한다.
OrfB의 제2 도메인은 본원에서 ORFB-CLF라고도 지칭되는 CLF 도메인이며, ORFB-CLF 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 21 (서열 3의 위치 1378-2700)로 나타낸다. ORFB-CLF 도메인을 함유하는 아미노산 서열은 본원에서 서열 22 (서열 4의 위치 460-900)로 나타낸다. ORFB-CLF 도메인이 아실-결합 시스테인이 없는 KS 활성 부위 모티프를 함유한다는 것을 유의한다.
OrfB의 제3 도메인은 본원에서 ORFB-AT라고도 지칭되는 AT 도메인이며, ORFB-AT 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 23 (서열 3의 위치 2701-4200)으로 나타낸다. ORFB-AT 도메인을 함유하는 아미노산 서열은 본원에서 서열 24 (서열 4의 위치 901-1400)로 나타낸다. ORFB-AT 도메인은 아실트랜스퍼라제 (AT) 단백질의 특징인 GxS*xG (*아실 결합 부위 S1140)의 활성 부위 모티프를 함유한다는 것을 유의한다.
OrfB의 제4 도메인은 본원에서 ORFB-ER이라고도 지칭되는 ER 도메인이며, ORFB-ER 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 25 (서열 3의 위치 4648-6177)로 나타낸다. ORFB-ER 도메인을 함유하는 아미노산 서열은 본원에서 서열 26 (서열 4의 위치 1550-2059)으로 나타낸다.
쉬조키트리움 오픈 리딩 프레임 C ( OrfC ):
OrfC에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 5로 나타낸다. OrfC는 본원에서 서열 6으로 나타내는 1502개의 아미노산 서열을 코딩하는 4506개의 뉴클레오티드 서열 (종결 코돈은 포함하지 않음)이다. OrfC 내에는 다음과 같은 3개의 도메인이 존재한다: (a) 2개의 FabA-유사-히드록시 아실-ACP 데히드라제 (DH) 도메인; 및 (b) 1개의 에노일 ACP-리덕타제 (ER) 도메인.
쉬조키트리움 종 ATCC 20888, 및 쉬조키트리움 종, 균주 N230D로 명명된 ATCC 20888의 자손 균주 둘 다로부터의 OrfC를 코딩하는 게놈 DNA 클론 (플라스미드)을 단리 및 서열화하였다.
쉬조키트리움 종 ATCC 20888로부터 단리된, 본원에서 pJK1131로 기재된 게놈 클론은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 5의 뉴클레오티드 서열을 포함하며 서열 6의 아미노산 서열을 코딩한다. 게놈 클론 pJK1131 (쉬조키트리움 ATCC 20888로부터의 "OrfC" 유전자를 함유하는 이. 콜라이 플라스미드 벡터 형태의 pJK1131 OrfC 게놈 클론으로 표시됨)은 2006년 6월 8일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-7650을 배정받았다. pJK1131 OrfC 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
쉬조키트리움 종 N230D으로부터 단리된, 본원에서 pBR002 OrfC 게놈 클론으로 기재된 게놈 클론은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 5의 뉴클레오티드 서열을 포함하며 서열 6의 아미노산 서열을 코딩한다. 게놈 클론 pBR002 (쉬조키트리움 종 N230D로부터의 OrfC 유전자 서열을 함유하는 이. 콜라이 플라스미드 벡터 형태의 pBR002 OrfC 게놈 클론으로 표시됨)은 2006년 6월 8일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-7642를 배정받았다. pBR002 OrfC 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
OrfC의 제1 도메인은 본원에서 ORFC-DH1이라고도 지칭되는 DH 도메인이다. 이는 OrfC의 2개의 DH 도메인의 하나이며, 따라서 DH1로 표시된다. ORFC-DH1 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 27 (서열 5의 위치 1-1350)로 나타낸다. ORFC-DH1 도메인을 함유하는 아미노산 서열은 본원에서 서열 28 (서열 6의 위치 1-450)로 나타낸다.
OrfC의 제2 도메인은 본원에서 ORFC-DH2라고도 지칭되는 DH 도메인이다. 이는 OrfC의 2개의 DH 도메인 중 두번째 것이며, 따라서 DH2로 나타낸다. ORFC-DH2 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 29 (서열 5의 위치 1351-2847)로 나타낸다. ORFC-DH2 도메인을 함유하는 아미노산 서열은 본원에서 서열 30 (서열 6의 위치 451-949)으로 나타낸다. 이 DH 도메인은 서열 30의 위치 426-440에서 아미노산 H-G-I-A-N-P-T-F-V-H-A-P-G-K-I (서열 6의 위치 876-890)를 포함한다.
OrfC의 제3 도메인은 본원에서 ORFC-ER이라고도 지칭되는 ER 도메인이며, ORFC-ER 도메인을 코딩하는 서열을 함유하는 뉴클레오티드 서열은 본원에서 서열 31 (서열 5의 위치 2995-4506)로 나타낸다. ORFC-ER 도메인을 함유하는 아미노산 서열은 본원에서 서열 32 (서열 6의 위치 999-1502)로 나타낸다.
트라우스토키트리움
PUFA
PKS
시스템
한 실시양태에서, 트라우스토키트리움 PUFA PKS 시스템은 적어도 하기 생물학적 활성 도메인을 포함한다: (a) 2개의 에노일-ACP 리덕타제 (ER) 도메인; (b) 5개 내지 10개 또는 그보다 많은 아실 운반 단백질 (ACP) 도메인, 및 한 측면에서 8개의 ACP 도메인; (c) 2개의 β-케토아실-ACP 신타제 (KS) 도메인; (d) 1개의 아실트랜스퍼라제 (AT) 도메인; (e) 1개의 β-케토아실-ACP 리덕타제 (KR) 도메인; (f) 2개의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인; (g) 1개의 쇄 길이 인자 (CLF) 도메인; 및 (h) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인. 한 실시양태에서, 본 발명에 따른 트라우스토키트리움 PUFA PKS 시스템은 또한 FabA-유사 DH 도메인의 부분이 아닌 데히드라타제 (DH) 보존된 활성 부위 모티프를 함유하는 하나 이상의 영역 또는 도메인을 포함한다. 이들 도메인의 구조적 및 기능적 특징은 일반적으로 각각 당업계에 공지되어 있다 (예를 들어, 미국 특허 공개 제2004035127호, 상기 참조).
상기 기재된 코어 트라우스토키트리움 23B PUFA PKS 시스템을 형성하는 3개의 오픈 리딩 프레임이 존재한다. 각 오픈 리딩 프레임의 도메인 구조는 다음과 같다.
트라우스토키트리움 23B 오픈 리딩 프레임 A ( OrfA ):
Th. 23B OrfA에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 38로 나타낸다. Th. 23B OrfA는 본원에서 서열 39로 나태낸, 2811개의 아미노산 서열을 코딩하는 8433개의 뉴클레오티드 서열 (종결 코돈은 포함하지 않음)이다. 서열 38은 Th. 23B OrfA에서 하기 도메인을 코딩한다: (a) 1개의 β-케토아실-ACP 신타제 (KS) 도메인; (b) 1개의 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) 도메인; (c) 8개의 아실 운반 단백질 (ACP) 도메인; 및 (d) 1개의 β-케토아실-ACP 리덕타제 (KR) 도메인.
트라우스토키트리움 23B로부터 함께 단리된, 본원에서 Th23BOrfA_pBR812.1 및 Th23BOrfA_pBR811 (OrfA 게놈 클론)로 기재된 2개의 게놈 클론 (중복 클론)은, 본 발명자들이 가장 잘 알고있는 바와 같이, 서열 38의 뉴클레오티드 서열을 포함하며, 서열 39의 아미노산 서열을 코딩한다. 게놈 클론 Th23BOrfA_pBR812.1 (트라우스토키트리움 23B로부터의 OrfA 유전자 서열을 함유하는 이. 콜라이 플라스미드 벡터 형태의 Th23BOrfA_pBR812.1 게놈 클론으로 표시됨)은 2007년 3월 1일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-8232를 배정받았다. Th23BOrfA_pBR812.1, OrfA 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다. 게놈 클론 Th23BOrfA_pBR811 (트라우스토키트리움 23B로부터의 OrfA 유전자 서열을 함유하는 이. 콜라이 플라스미드 벡터 형태의 Th23BOrfA_pBR811 게놈 클론으로 표시됨)은 2007년 3월 1일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-8231을 배정받았다. Th23BOrfA_pBR811, OrfA 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
Th. 23B OrfA의 제1 도메인은 본원에서 Th. 23B OrfA-KS라고도 지칭되는 KS 도메인이며, 본원에서 서열 40로 나타낸, 서열 38의 위치 약 1 내지 위치 약 1500에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B KS 도메인을 함유하는 아미노산 서열은 본원에서 서열 41로 나타낸, 서열 39의 위치 약 1 내지 위치 약 500에 걸쳐있는 서열 39의 영역이다. 서열 39의 이 영역은 서열 39의 위치 1 내지 위치 약 450 (또한 서열 41의 위치 1 내지 약 450)에 걸쳐있는 FabB (β-케토아실-ACP 신타제)에 대한 Pfam 대응(match)을 갖는다. Th. 23B OrfA-KS 도메인이 활성 부위 모티프: DXAC* (*아실 결합 부위 C207)를 함유한다는 것을 유의한다. 또한, Th. 23B KS 영역의 말단에 있는 특징적인 모티프인 GFGG는 서열 39의 위치 453-456 (또한 서열 41의 위치 453-456)에 존재한다.
Th. 23B OrfA의 제2 도메인은 본원에서 Th. 23B OrfA-MAT라고도 지칭되는 MAT 도메인이며, 본원에서 서열 42로 나타낸, 서열 38의 위치 약 1503 내지 위치 약 3000에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B MAT 도메인을 함유하는 아미노산 서열은 본원에서 서열 43으로 나타낸, 위치 약 501 내지 위치 약 1000에 걸쳐있는 서열 39의 영역이다. 서열 39의 이 영역은 서열 39의 위치 약 580 내지 위치 약 900 (서열 43의 위치 80-400)에 걸쳐있는 FabD (말로닐-CoA:ACP 아실트랜스퍼라제)에 대한 Pfam 대응을 갖는다. Th. 23B OrfA-MAT 도메인은 서열 39의 위치 695-699로 나타낸, 활성 부위 모티프: GHS*XG (*아실 결합 부위 S697)를 함유한다는 것을 유의한다.
Th. 23B OrfA의 도메인 3-10은 본원에서 Th. 23B OrfA-ACP라고도 지칭되는 8개의 탄뎀 ACP 도메인이다 (예를 들어, 상기 서열의 제1 도메인은 OrfA-ACP1이고, 제2 도메인은 OrfA-ACP2이며, 제3 도메인은 OrfA-ACP3임). 제1 Th. 23B ACP 도메인인 Th. 23B OrfA-ACP1은 본원에서 서열 44로 나타낸, 서열 38 (OrfA)의 위치 약 3205 내지 위치 약 3555에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. 제1 Th. 23B ACP 도메인을 함유하는 아미노산 서열은 본원에서 서열 45로 나타낸, 서열 39의 위치 약 1069 내지 위치 약 1185에 걸쳐있는 서열 39의 영역이다.
Th. 23B OrfA의 8개의 ACP 도메인은 서로 인접해 있으며, 포스포판테테인 결합 부위 모티프, LGXDS* (서열 46으로 나타냄)(여기서, S*는 포스포판테테인 부착 부위임)의 존재에 의해 확인될 수 있다. 서열 39와 관련하여 8개의 S* 부위의 각각의 아미노산 위치는 1128 (ACP1), 1244 (ACP2), 1360 (ACP3), 1476 (ACP4), 1592 (ACP5), 1708 (ACP6), 1824 (ACP7) 및 1940 (ACP8)이다. 8개의 Th. 23B ACP 도메인 모두의 뉴클레오티드 및 아미노산 서열은 고도로 보존되어 있으며, 따라서 각 도메인의 서열은 본원에서 개별 서열 확인자에 의해 나타내지 않는다. 그러나, 본원에 개시된 정보를 기초로, 당업자라면 서열 38 및 서열 39에서 다른 7개의 ACP 도메인의 각각을 함유하는 서열을 용이하게 결정할 수 있을 것이다.
8개의 Th. 23B ACP 도메인 모두는 함께 서열 38의 위치 약 3205 내지 위치 약 5994의 Th. 23B OrfA의 영역에 걸쳐있으며, 이는 서열 39의 약 1069 내지 약 1998의 아미노산 위치에 상응한다. 8개의 도메인 모두를 함유하는 전체 ACP 영역에 대한 뉴클레오티드 서열은 본원에서 서열 47로 나타낸다. 서열 47은 본원에서 서열 48로 나타낸 아미노산 서열을 코딩한다. 서열 48은 개별 ACP 도메인 사이의 링커 세그먼트를 포함한다. 8개의 도메인에 대한 반복 간격은 서열 48에서 대략 116개의 아미노산 마다이며, 각 도메인은 (상기 기재된) 활성 부위 모티프 상에 중심이 있는 약 116개의 아미노산으로 구성되는 것으로 고려될 수 있다.
Th. 23B OrfA의 마지막 도메인은 본원에서 Th. 23B OrfA-KR이라고도 지칭되는 KR 도메인이며, 이는 본원에서 서열 49로 나타낸, 서열 38의 위치 약 6001 내지 위치 약 8433에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B KR 도메인을 함유하는 아미노산 서열은 본원에서 서열 50으로 나타낸, 서열 39의 위치 약 2001 내지 위치 약 2811에 걸쳐있는 서열 39의 영역이다. 서열 39의 상기 영역은 서열 39의 위치 약 2300 내지 약 2550 (서열 50의 위치 300-550)에 걸쳐있는 FabG (β-케토아실-ACP 리덕타제)에 대한 Pfam 대응을 갖는다.
트라우스토키트리움 . 23B 오픈 리딩 프레임 B ( OrfB ):
Th. 23B OrfB에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 51로 나타내며, 이는 본원에서 서열 52로 나타낸, 1935개의 아미노산 서열을 코딩하는 5805개의 뉴클레오티드 서열 (종결 코돈은 포함하지 않음)이다. 서열 51은 Th. 23B OrfB의 하기 도메인을 코딩한다: (a) 1개의 β-케토아실-ACP 신타제 (KS) 도메인; (b) 1개의 쇄 길이 인자 (CLF) 도메인; (c) 1개의 아실트랜스퍼라제 (AT) 도메인; 및 (d) 1개의 에노일-ACP 리덕타제 (ER) 도메인.
트라우스토키트리움 23B로부터 단리된, 본원에서 Th23BOrfB_pBR800 (OrfB 게놈 클론)으로 기재된 게놈 클론은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 51의 뉴클레오티드 서열을 포함하며 서열 52의 아미노산 서열을 코딩한다. 게놈 클론 Th23BOrfB_pBR800 (트라우스토키트리움 23B로부터의 OrfB 유전자 서열을 함유하는 이. 콜라이 플라스미드 벡터 형태의 Th23BOrfB_pBR800 게놈 클론으로 표시됨)은 2007년 3월 1일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-8227을 배정받았다. Th23BOrfB_pBR800, OrfB 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
Th. 23B OrfB의 제1 도메인은 본원에서 Th. 23B OrfB-KS라고도 지칭되는 KS 도메인이며, 이는 본원에서 서열 53으로 나타낸, 서열 51 (Th. 23B OrfB)의 위치 약 1 내지 위치 약 1500에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B KS 도메인을 함유하는 아미노산 서열은 본원에서 서열 54로 나타낸, 서열 52의 위치 약 1 내지 위치 약 500에 걸쳐있는 서열 52의 영역이다. 서열 52의 상기 영역은 위치 약 1 내지 위치 약 450 (서열 54의 위치 1-450)에 걸쳐있는 FabB (β-케토아실-ACP 신타제)에 대한 Pfam 대응을 갖는다. Th. 23B OrfB-KS 도메인이 활성 부위 모티프: DXAC* (C*는 아실기 부착 부위이며, C*는 서열 52의 위치 201에 있음)를 함유한다는 것을 유의한다. 또한, KS 영역의 말단에 있는 특징적인 모티프인 GFGG는 서열 52의 아미노산 위치 434-437에 존재한다.
Th. 23B OrfB의 제2 도메인은 본원에서 Th. 23B OrfB-CLF라고도 지칭되는 CLF 도메인이며, 이는 본원에서 서열 55로 나타낸, 서열 51 (OrfB)의 위치 약 1501 내지 위치 약 3000에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. CLF 도메인을 함유하는 아미노산 서열은 본원에서 서열 56으로 나타낸, 서열 52의 위치 약 501 내지 위치 약 1000에 걸쳐있는 서열 52의 영역이다. 서열 52의 상기 영역은 위치 약 550 내지 위치 약 910 (서열 56의 위치 50-410)에 걸쳐있는 FabB (β-케토아실-ACP 신타제)에 대한 Pfam 대응을 갖는다. CLF가 KS 단백질에 대해 상동성을 갖지만, CLF는 KS 단백질에서 아실기가 부착되는 활성 부위 시스테인이 결여되어 있다.
Th. 23B OrfB의 제3 도메인은 본원에서 Th. 23B OrfB-AT라고도 지칭되는 AT 도메인이며, 이는 본원에서 서열 58로 나타낸, 서열 51 (Th. 23B OrfB)의 위치 약 3001 내지 위치 약 4500에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B AT 도메인을 함유하는 아미노산 서열은 본원에서 서열 58로 나타낸, 서열 52의 위치 약 1001 내지 위치 약 1500에 걸쳐있는 서열 52의 영역이다. 서열 52의 상기 영역은 위치 약 1100 내지 위치 약 1375 (서열 58의 위치 100-375)에 걸쳐있는 FabD (말로닐-CoA:ACP 아실트랜스퍼라제)에 대한 Pfam 대응을 갖는다. PUFA 신타제의 이러한 AT 도메인은 MAT 단백질에 대해 상동성을 갖지만, 상기 도메인은 MAT의 연장된 모티프 (주요 아르기닌 및 글루타민 잔기)가 결여되어 있으며, 말로닐-CoA 전달에 관여하는 것으로 생각되지 않는다. 아실트랜스퍼라제의 GXS*XG 모티프가 존재하는데, 여기서 S*는 아실 부착 부위이며 서열 52에 대하여 위치 1123에 위치한다.
Th. 23B OrfB의 제4 도메인은 본원에서 Th. 23B OrfB-ER라고도 지칭되는 ER 도메인이며, 이는 본원에서 서열 59로 나타낸, 서열 51 (OrfB)의 위치 약 4501 내지 위치 약 5805에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B ER 도메인을 함유하는 아미노산 서열은 본원에서 서열 60으로 나타낸, 서열 52의 위치 약 1501 내지 위치 약 1935에 걸쳐있는 서열 52의 영역이다. 서열 52의 상기 영역은 위치 약 1501 내지 위치 약 1810 (서열 60의 위치 1-310)에 걸쳐있는 2-니트로프로판 디옥시게나제(dioxygenase)와 관련된 디옥시게나제 패밀리에 대한 Pfam 대응을 갖는다. 이 도메인이 ER로서 기능하는 것은 추가로, 스트렙토코커스 뉴모니애로부터의 새로 특성화된 ER 효소와의 상동성으로 인해 예상될 수 있다.
트라우스토키트리움 . 23B 오픈 리딩 프레임 C ( OrfC ):
Th. 23B OrfC에 대한 완전한 뉴클레오티드 서열은 본원에서 서열 61로 나타내며, 이는 본원에서 서열 62로 나타낸, 1470개의 아미노산 서열을 코딩하는 4410개의 뉴클레오티드 서열 (종결 코돈은 포함하지 않음)이다. 서열 61은 Th. 23B OrfC의 하기 도메인을 코딩한다: (a) 2개의 FabA-유사 β-히드록시아실-ACP 데히드라제 (DH) 도메인, 이들은 둘 다 FabA 단백질 (트랜스-2-데스에노일-ACP의 합성 및 이 생성물의 시스-3-데스에노일-ACP로의 가역적 이성질체화를 촉매하는 효소)에 대해 상동성을 가짐; 및 (b) 쉬조키트리움 OrfB의 ER 도메인에 대해 높은 상동성을 갖는 1개의 에노일-ACP 리덕타제 (ER) 도메인.
트라우스토키트리움 23B로부터 단리된, 본원에서 Th23BOrfC_pBR709A (OrfC 게놈 클론)로 기재된 게놈 클론은 본 발명자들이 가장 잘 알고있는 바와 같이 서열 61의 뉴클레오티드 서열을 포함하며 서열 62의 아미노산 서열을 코딩한다. 게놈 클론 Th23BOrfC_pBR709A (트라우스토키트리움 23B로부터의 OrfC 유전자 서열을 함유하는 이. 콜라이 플라스미드 벡터 형태의 Th23BOrfC_pBR709A 게놈 클론으로 표시됨)는 2007년 3월 1일자로 미국 20110-2209 버지니아주 마나사스 유니버시티 불러바드 10801에 소재하는 아메리칸 타입 컬쳐 콜렉션 (ATCC)에 기탁되었으며, ATCC 기탁 번호 PTA-8228을 배정받았다. Th23BOrfC_pBR709A, OrfC 게놈 클론의 뉴클레오티드 서열 및 이 플라스미드에 의해 코딩되는 아미노산 서열은 본 발명에 포함된다.
Th. 23B OrfC의 제1 도메인은 본원에서 Th. 23B OrfC-DH1이라고도 지칭되는 DH 도메인이며, 이는 본원에서 서열 63으로 나타낸, 서열 61 (OrfC)의 위치 약 1 내지 위치 약 1500에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B DH1 도메인을 함유하는 아미노산 서열은 본원에서 서열 64로 나타낸, 서열 62의 위치 약 1 to 위치 약 500에 걸쳐있는 서열 62의 영역이다. 서열 62의 상기 영역은 상기 언급한 바와 같이 위치 약 275 내지 위치 약 400 (서열 64의 위치 275-400)에 걸쳐있는 FabA에 대한 Pfam 대응을 갖는다.
Th. 23B OrfC의 제2 도메인은 또한 본원에서 Th. 23B OrfC-DH2라고도 지칭되는 DH 도메인이며, 이는 본원에서 서열 65로 나타낸, 서열 61 (OrfC)의 위치 약 1501 내지 약 3000에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B DH2 도메인을 함유하는 아미노산 서열은 본원에서 서열 66으로 나타낸, 서열 62의 위치 약 501 내지 위치 약 1000에 걸쳐있는 서열 62의 영역이다. 서열 62의 상기 영역은 상기 언급한 바와 같이 위치 약 800 내지 위치 약 925 (서열 66의 위치 300-425)에 걸쳐있는 FabA에 대한 Pfam 대응을 갖는다.
Th. 23B OrfC의 제3 도메인은 본원에서 Th. 23B OrfC-ER이라고도 지칭되는 ER 도메인이며, 이는 본원에서 서열 67로 나타낸, 서열 61 (OrfC)의 위치 약 3001 내지 위치 약 4410에 걸쳐있는 뉴클레오티드 서열내에 함유되어 있다. Th. 23B ER 도메인을 함유하는 아미노산 서열은 본원에서 서열 68로 나타낸, 서열 62의 위치 약 1001 내지 위치 약 1470에 걸쳐있는 서열 62의 영역이다. 서열 62의 상기 영역은 상기 언급한 바와 같이 위치 약 1025 내지 위치 약 1320 (서열 68의 위치 25-320)에 걸쳐있는 2-니트로프로판 디옥시게나제와 관련된 디옥시게나제에 대한 Pfam 대응을 갖는다. ER로서의 상기 도메인 기능은 또한 스트렙토코커스 뉴모니애 유래의 새로 특성화된 ER 효소와의 상동성으로 인해 예상될 수 있다.
쉬바넬라
야포니카
(
Shewanella
japonica
)
PUFA
PKS
쉬바넬라 야포니카 코어 PUFA PKS 시스템 및 상기 기재된 그의 PPTase를 형성하는 5개의 오픈 리딩 프레임이 존재한다. 각 오픈 리딩 프레임의 도메인 구조는 다음과 같다.
서열 69는 쉬바넬라 야포니카 코스미드 3F3에 대한 뉴클레오티드 서열이며, 15개의 ORF를 함유하는 것으로 나타나 있다. 이 미생물에서 PUFA PKS 시스템과 관련된 ORF는 다음과 같은 특징이 있다.
pfaA (서열 69의 뉴클레오티드 10491-18854)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS A (서열 70)를 코딩한다: β-케토아실-신타제 (KS) (서열 69의 뉴클레오티드 10575-12029, 서열 70의 아미노산 29-513); 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) (서열 69의 뉴클레오티드 12366-13319, 서열 70의 아미노산 625-943); 6개의 탄뎀 아실-운반자 단백질 (ACP) 도메인 (서열 69의 뉴클레오티드 14280-16157, 서열 70의 아미노산 1264-1889); β-케토아실-ACP 리덕타제 (KR) (서열 69의 뉴클레오티드 17280-17684, 서열 70의 아미노산 2264-2398); 및 본원에서 DH-모티프 영역으로 지칭된, 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 70의 아미노산 2504-2516)를 함유하는 서열 70의 아미노산 2399 내지 2787의 PFAS A 단백질의 영역.
PFAS A에서, KS 활성 부위 DXAC*는 서열 70의 아미노산 226-229에 위치하며, 여기서 C*는 아실 부착 부위이다. MAT 활성 부위, GHS*XG는 서열 70의 아미노산 721-725에 위치하며, 여기서 S*는 아실 결합 부위이다. LGXDS*의 ACP 활성 부위는 다음과 같은 위치에 위치한다: 서열 70에서 아미노산 1296-1300, 아미노산 1402-1406, 아미노산 1513-1517, 아미노산 1614-1618, 아미노산 1728-1732, 및 아미노산 1843-1847, 여기서 S*는 포스포판테테인 부착 부위이다. 서열 70의 아미노산 2399 내지 2787에서, PFAS A는 또한 상기 언급한 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 70의 아미노산 2504-2516)를 함유한다.
pfaB (서열 69의 뉴클레오티드 18851-21130)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS B (서열 71)를 코딩한다: 아실트랜스퍼라제 (AT) (서열 69의 뉴클레오티드 19982-20902, 서열 71의 아미노산 378-684).
PFAS B에서, 활성 부위 GXS*XG 모티프는 서열 71의 아미노산 463-467에 위치하며, 여기서 S*는 아실 부착 부위이다.
pfaC (서열 69의 뉴클레오티드 21127-27186)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS C (서열 72)를 코딩한다: KS (서열 69의 뉴클레오티드 21139-22575, 서열 72의 아미노산 5-483); 쇄 길이 인자 (CLF) (서열 69의 뉴클레오티드 22591-23439, 서열 72의 아미노산 489-771); 및 2개의 FabA 3-히드록시아실-ACP 데히드라타제, DH1 (서열 69의 뉴클레오티드 25408-25836, 서열 72의 아미노산 1428-1570) 및 DH2 (서열 69의 뉴클레오티드 26767-27183, 서열 72의 아미노산 1881-2019)로 지칭됨.
PFAS C에서, KS 활성 부위 DXAC*는 서열 72의 아미노산 211-214에 위치하며, 여기서 C*는 아실 부착 부위이다.
pfaD (서열 69의 뉴클레오티드 27197-28825)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS D (서열 73)를 코딩한다: 에노일 리덕타제 (ER) (서열 69의 뉴클레오티드 27446-28687, 서열 73의 아미노산 84-497).
pfaE (역 상보성 가닥 상의 서열 69의 뉴클레오티드 6150-7061)는 확인된 도메인 (서열 69의 뉴클레오티드 6504-6944, 서열 74의 아미노산 40-186)을 갖는 4'-포스포판테테이닐 트랜스퍼라제 (PPTase)인 PFAS E (서열 74)를 코딩한다.
쉬바넬라
올레야나
(
Shewanella
olleyana
)
PUFA
PKS
쉬바넬라 올레야나 코어 PUFA PKS 시스템 및 상기 기재된 그의 PPTase를 형성하는 5개의 오픈 리딩 프레임이 존재한다. 각 오픈 리딩 프레임의 도메인 구조는 다음과 같다.
서열 75는 쉬바넬라 올레야나 코스미드 9A10에 대한 뉴클레오티드 서열이며, 17개의 ORF를 함유하는 것으로 나타났다. 이 미생물에서 PUFA PKS 시스템과 관련된 ORF는 다음과 같이 특성화된다.
pfaA (서열 75의 뉴클레오티드 17437-25743)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS A (서열 76)를 코딩한다: β-케토아실-신타제 (KS) (서열 75의 뉴클레오티드 17521-18975, 서열 76의 아미노산 29-513); 말로닐-CoA:ACP 아실트랜스퍼라제 (MAT) (서열 75의 뉴클레오티드 19309-20265, 서열 76의 아미노산 625-943); 6개의 탄뎀 아실-운반자 단백질 (ACP) 도메인 (서열 75의 뉴클레오티드 21259-23052, 서열 76의 아미노산 1275-1872); β-케토아실-ACP 리덕타제 (KR) (서열 75의 뉴클레오티드 24154-24558, 서열 76의 아미노산 2240-2374); 및 본원에서 DH-모티프 영역으로 지칭되는, 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 76의 아미노산 2480-2492)를 함유하는 서열 76의 아미노산 2241 내지 2768의 PFAS A 단백질의 영역.
PFAS A에서, KS 활성 부위 DXAC*는 서열 76의 AA 226-229에 위치하며, 여기서 C*는 아실 부착 부위이다. MAT 활성 부위, GHS*XG는 서열 76의 아미노산 721-725에 위치하며, 여기서 S*는 아실 결합 부위이다. LGXDS*의 ACP 활성 부위는 서열 76에서 아미노산 1307-1311, 아미노산 1408-1412, 아미노산 1509-1513, 아미노산 1617-1621, 아미노산 1721-1725, 및 아미노산 1826-1830에 위치하며, 여기서 S*는 포스포판테테인 부착 부위이다. 서열 76의 아미노산 2241 내지 2768에서, PFAS A는 또한 상기 언급한 데히드라타제 (DH) 보존된 활성 부위 모티프 LxxHxxxGxxxxP (서열 76의 아미노산 2480-2492)를 함유한다.
pfaB (뉴클레오티드s 25740-27971 of 서열 75)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS B (서열 77)를 코딩한다: 아실트랜스퍼라제 (AT) (서열 75의 뉴클레오티드 26837-27848, 서열 77의 아미노산 366-703).
PFAS B에서, 활성 부위 GXS*XG 모티프는 서열 77의 아미노산 451-455에 위치하며, 여기서 S*는 아실 부착 부위이다.
pfaC (서열 75의 뉴클레오티드 27968-34030)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS C (서열 78)를 코딩한다: KS (서열 75의 뉴클레오티드 27995-29431, 서열 78이 아미노산 10-488); 쇄 길이 인자 (CLF) (서열 75의 뉴클레오티드 29471-30217, 서열 78의 아미노산 502-750); 및 2개의 FabA 3-히드록시아실-ACP 데히드라타제, DH1 (서열 75의 뉴클레오티드 32258-32686, 서열 78의 아미노산 1431-1573), 및 DH2 (서열 75의 뉴클레오티드 33611-34027, 서열 78의 아미노산 1882-2020)로 지칭됨.
PFAS C에서, KS 활성 부위 DXAC*는 서열 78의 아미노산 216-219에 위치하며, 여기서 C*는 아실 부착 부위이다.
pfaD (서열 75의 뉴클레오티드 34041-35669)는 하기 도메인을 보유하는 PUFA PKS 단백질인 PFAS D (서열 79)를 코딩한다: 에노일 리덕타제 (ER) (서열 75의 뉴클레오티드 34290-35531, 서열 79의 아미노산 84-497).
pfaE (역 상보성 가닥 상의 서열 75의 뉴클레오티드 13027-13899)는 확인된 도메인 (서열 75의 뉴클레오티드 13369-13815, 서열 80의 아미노산 29-177)을 갖는 4'-포스포판테테이닐 트랜스퍼라제 (PPTase)인 PFAS E (서열 80)를 코딩한다.
최적화된
PUFA
PKS
서열을 비롯한 다른
PUFA
PKS
서열
본 발명은 이종 숙주에서 PUFA PKS 시스템의 발현에 사용하기 위한 다양한 최적화된 서열을 포함하며, 그의 예가 이하에서 제공된다. 당업자라면 최적화된 서열, 특히 이종 숙주에서 바람직한 코돈 용법 또는 우수한 발현 및 기능에 대해 최적화된 서열을 제조할 수 있을 것이다.
sOrfA
sOrfA로 표시된 서열 35는 효모에서의 최적화된 코돈 용법을 위해 재합성된 쉬조키트리움으로부터의 OrfA를 코딩하는 핵산 서열 (서열 1)을 나타낸다. 서열 1 및 서열 35는 각각 서열 2를 코딩한다.
sOrfB
sOrfB로 표시된 서열 36은 효모에서의 최적화된 코돈 용법을 위해 재합성된 쉬조키트리움으로부터의 OrfB를 코딩하는 핵산 서열 (서열 3)을 나타낸다. 서열 3 및 서열 36은 각각 서열 4를 코딩한다.
OrfB
*
OrfB*로 표시된 서열 37은, 식물 세포에서의 사용을 위해 서열 3의 일부 내에서 재합성되었으며 OrfB*라고도 지칭되는 이. 콜라이에서의 최적화된 코돈 용법을 위해 먼저 개발된 매우 유사한 서열로부터 유도된 쉬조키트리움으로부터의 OrfB를 코딩하는 핵산 서열 (서열 3)을 나타낸다. (이. 콜라이 및 식물에 대한) 두 가지 형태의 OrfB*는 SacII 단편 (서열 3내의 특이적 부위)에 대한 재합성된 BspHI (서열 3의 뉴클레오티드 4415)를 제외하면 서열 3과 동일하다. 두 가지 형태 (이. 콜라이 및 식물)는 orfB (서열 3)의 본래의 게놈 서열에 비해 유전자 출발점 근처에서 2개의 상이한 코돈 변경을 갖는다. 먼저, 제4 코돈인 아르기닌 (R)은 게놈 서열에서의 CGG로부터 orfB*에서의 CGC로 변경되었다. 다음으로, 제5 코돈인 아스파라긴 (N)은 게놈 서열에서의 AAT로부터 orf B*에서의 AAC로 변경되었다. 상기 유전자를 식물 벡터내에 클로닝시켜 서열 37을 생성하는 것을 촉진시키기 위해, PstI 부위 (CTGCAG)를 또한 조작해서 상기 유전자의 출발점으로부터 염기 20개 만큼 떨어진 이. 콜라이 orfB*내에 넣었다. 이러한 변화는 코딩된 단백질의 아미노산 서열을 변화시키지 않았다. 서열 37 및 서열 3 (및 이. 콜라이에 대한 OrfB* 형태)은 둘 다 서열 4를 코딩한다.
개선된
PUFA
제조 및 축적을 위한 부속 단백질 및 추가의 표적 및 전략
본 발명에 따라, 이종 숙주에서의 PUFA의 제조 및/또는 축적 또는 내생성 숙주에서의 PUFA의 개선된 제조 및/또는 축적을 위한 PUFA PKS 시스템은 바람직하게는 PUFA의 제조를 위해 상기 기재된 다양한 표적 또는 전략 중 한가지 이상을 이용한다 (상기 기재된 6 가지 가이드라인 및 전략 참조). 이러한 전략으로는 특히, 본원에서 상기 기재된 바와 같은 코어 PUFA PKS 시스템의 부분인 것으로 고려되지 않는 (즉, UFA 신타제 효소 복합체 자체의 부분이 아닌) 단백질로서 정의되지만 본 발명의 코어 PUFA 신타제 효소 복합체를 사용해서 PUFA를 제조하거나 적어도 효과적으로 PUFA를 제조하기 위해 필요하거나 필요할 수 있는 다양한 부속 단백질의 사용을 들 수 있다. 이러한 전략은 또한 말로닐-CoA 푸울(들)에 대해 경쟁하는 능력을 증진시킴으로써 PUFA 신타제 경로를 통한 기질, 말로닐 CoA의 흐름을 증가시키는 다양한 유전적 개질을 포함한다. 본 발명의 이러한 실시양태의 변형은 이하에 기재되어 있다.
포스포판테테이닐
트랜스퍼라제
(
PPTase
)
상기 이종 숙주에서 PUFA의 제조를 위한 일반적인 가이드라인 및 전략 하에 논의된 바와 같이, PUFA를 제조하기 위해, PUFA PKS 시스템은 4'-포스포판테테이닐 잔기를 조효소 A로부터 아실 운반 단백질 (ACP) 도메인(들)로 전달하는 부속 단백질과 함께 작동해야만 한다. 따라서, PUFA PKS 시스템은 1개 이상의 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 도메인을 포함하는 것으로 고려될 수 있으며, 이러한 도메인은 PUFA PKS 시스템에 대한 부속 도메인 또는 단백질인 것으로 고려될 수 있다. PPTase의 구조적 및 기능적 특징은 예를 들어 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 및 미국 특허 출원 공개 제20050100995호에 상세히 기재되어 있다.
본 발명에 따라, 4'-포스포판테테이닐 트랜스퍼라제 (PPTase) 생물학적 활성 (기능)을 갖는 도메인 또는 단백질은 4'-포스포판테테이닐 잔기를 조효소 A로부터 아실 운반 단백질 (ACP)로 전달하는 효소를 특징으로 한다. ACP의 불변체(invariant) 세린로의 이러한 전달은 불활성 아포-형태를 홀로-형태로 활성화한다. 폴리케티드 및 지방산 합성 둘 다에서, 포스포판테테인 기는 성장하는 아실 쇄와 티오에스테르를 형성한다. PPTase는 지방산 합성, 폴리케티드 합성, 및 비-리보좀성 펩티드 합성에서 잘 특성화된 효소 패밀리이다. 다수의 PPTase의 서열이 공지되어 있으며, 활성에 중요한 아미노산 잔기에 대한 돌연변이 분석 [Mofid MR, Finking R, Essen LO, Marahiel MA. Structure-based mutational analysis of the 4'-phosphopantetheinyl transferases Sfp from Bacillus subtilis: carrier protein recognition and reaction mechanism Biochemistry. 2004 Apr 13;43(14):4128-36]이 수행되고, 결정 구조 (예, 문헌 [Reuter K, Mofid MR, Marahiel MA, Ficner R. "Crystal structure of the surfactin synthetase-activating enzyme sfp: a prototype of the 4'-phosphopantetheinyl transferase superfamily" EMBO J. 1999 Dec 1;18(23):6823-31])가 정해졌다. PPTase에서 고도로 보존된 아미노산 및 상기 불변체는 상기 기재된 두 쉬바넬라 균주로부터의 pfaE ORF 내에 함유되어 있다.
본원에 기재된 OrfA ACP 도메인을 기질로 인식하는 것으로서 이전에 입증된 한가지 이종 PPTase는 Nostoc 종 PCC 7120 (이전에는 아나배나(Anabaena) 종 PCC 7120이라고 불림)의 HetI 단백질이다. HetI은 이 생물체의 이형세포(heterocyst)에 존재하는 당-지질 층의 성분인 장쇄 히드록시-지방산의 합성을 담당하는 것으로 알려진 Nostoc의 유전자 클러스터내에 존재한다 [Black and Wolk, 1994, J. Bacteriol. 176, 2282-2292; Campbell et al., 1997, Arch. Microbiol. 167, 251-258]. HetI은 상기 클러스터에 존재하는 단백질, Hgl E의 ACP 도메인을 활성화할 가능성이 있다. Hgl E의 2개의 ACP 도메인은 쉬조키트리움 Orf A에 존재하는 ACP 도메인에 대해 고도의 서열 상동성을 갖는다. 서열 34는 Nostoc HetI 단백질의 아미노산 서열을 나타내며, 쉬조키트리움 및 트라우스토키트리움 유래의 PUFA PKS 시스템을 비롯해서 본원에 기재된 바와 같은 PUFA PKS 시스템과 함께 사용될 수 있는 기능적 PPTase이다. 서열 34는 서열 33에 의해 코딩된다. HetI의 내생성 개시 코돈은 확인된 바 없다 (추정의 단백질내에 존재하는 메티오닌은 없음). 오픈 리딩 프레임의 5' 말단 근처에는 여러 잠재적인 다른 개시 코돈들 (예, TTG 및 ATT)이 존재한다. 메티오닌 코돈 (ATG)은 서열내에 존재하지 않는다. 그러나, PCR을 이용해서 가장 먼 5'의 잠재적인 다른 개시 코돈 (TTG)을 메티오닌 코돈 (NdeI 제한 효소 인식 부위의 일부로서의 ATG)으로 대체하고 코딩 서열의 3' 말단에 XhoI 부위를 도입함으로써 HetI 발현 구조물의 구성을 완료하였으며, 코딩된 PPTase (서열 34)는 기능성인 것으로 나타났다.
본원에 기재된 OrfA ACP 도메인을 기질로서 인식하는 것으로 이전에 입증된 다른 이종 PPTase는 바실러스 서브틸리스(Bacillus subtilis)로부터 유래된 sfp이다. Sfp는 잘 특성화되었으며, 광범위한 기질을 인식하는 그의 능력으로 인해 널리 사용된다. 공개된 서열 정보 [Nakana, et al., 1992, Molecular and General Genetics 232: 313-321]를 기초로, 발현 벡터는 sfp에 대하여 코딩 영역을 정해진 상류 및 하류 플랭킹(flanking) DNA 서열과 함께 pACYC-184 클로닝 벡터내에 클로닝함으로써 이전에 제조되었다. 이러한 구조물은 이. 콜라이에서 쉬조키트리움 Orfs A, B*, 및 C와 함께 공동발현되는 능력에 의해 입증된 바와 같이 기능적 PPTase를 코딩하며, 이는 적절한 조건하에 상기 세포내에 DHA를 축적시켰다 (미국 특허 출원 공개 제20040235127호 참조).
본 발명에 따른 PUFA PKS 시스템을 발현하도록 유전적으로 개질된 생물체 (예, 미생물 또는 식물)의 경우, 일부 숙주 생물체는 PUFA를 제조하는 PUFA PKS (예, PPTase)와 함께 작용할 필요가 있는 부속 단백질을 내생적으로 발현시킬 수 있다. 그러나 일부 생물체는 이 생물체가 상동성 부속 단백질을 내생적으로 제조하는 경우라도 본원에서 이 생물체에 의해 PUFA를 제조하고/하거나 상기 생물체에 의한 PUFA의 제조를 증진시키는 것으로 기재된 하나 이상의 부속 단백질을 코딩하는 핵산 분자로 형질전환시킬 수 있다 (즉, 일부 이종 부속 단백질은 숙주 세포의 내생성 부속 단백질보다는 형질전환된 PUFA 신타제 단백질과 함께 더 효과적이거나 또는 더 효율적으로 작용할 수 있음). 본 발명은 부속 PPTase를 포함하는 본 발명의 PUFA PKS 시스템으로 유전적으로 개질된 세균, 효모 및 식물의 예를 제공한다.
따라서, 본 발명의 한 실시양태는 본원에 기재된 바와 같은 코어 PUFA PKS 시스템 및 또한 본원에 기재된 바와 같은 PPTase를 발현시키도록 유전적으로 개질된 숙주 세포 또는 생물체인 유전적으로 개질된 숙주 세포 또는 생물체 (예, 미생물 또는 식물, 또는 이들의 세포)에 관한 것이다. 적합한 PPTase는 상기 기재되어 있으며, 또한 당업계에 기술되어 있다. PPTase는 동일 또는 상이한 구조물 상에서 코어 PUFA PKS 단백질 또는 단백질들을 코딩하는 하나 이상의 핵산 분자로서 발현될 수 있다. 두 가지 실시양태가 실시예에 예시되어 있다 (실시예 12 및 13 참조). 한 측면에서, PPTase는 Nostoc HetI (본원에서 서열 33 및 34로 나타냄)이다.
본 발명의 한 실시양태에서, PUFA 제조 및 축적은 숙주 세포 또는 숙주 생물체에 의해 발현된 내생성 PPTase의 발현 또는 활성을 감소 (억제, 하향조절, 감쇠)시킴으로써 (예를 들어, 이 실시양태에 따른 PUFA PKS 효소와 함께 도입된 PPTase와의 경쟁을 회피함으로써) 증진된다. 내생성 PPTase 활성의 억제는 안티센스 RNA, RNAi, 공동억제의 이용 또는 돌연변이의 도입을 포함하지만 이에 한정되지 않는 유전자의 결실 또는 불활성화의 임의의 적합한 방법에 의해 달성될 수 있다.
본 발명은 본원에 기재된 바와 같은 PUFA 신타제의 발현과 함께 외생성 PPTase의 발현을 (단독으로 또는 내생성 PPTase 억제와의 조합으로) 포함하며, 이를 단독으로 또는 본원에 기재된 임의의 하나 이상의 전략 (예를 들어, 코돈 최적화, 세포소기관-표적화, (예를 들어, FAS의 억제에 의한) 말로닐 CoA에 대한 PUFA 신타제 경쟁의 증진, 아실 CoA 신테타제의 발현, 및/또는 하나 이상의 아실트랜스퍼라제 또는 관련 효소의 발현 중 임의의 한가지, 두가지, 세가지, 네가지 또는 다섯가지)과 조합하여 이용함으로써 이종 숙주에서 PUFA 제조 및/또는 축적을 증가시킨다.
말로닐
CoA
흐름 변경/
FAS
억제
상기 논의된 바와 같이, PUFA PKS 시스템 (PUFA 신타제), 말로닐-CoA에 대한 기질은 또한 지방산 신타제 시스템 (FAS), 세포질 지방산 연장 반응 및 다른 효소 (예, 칼콘 신타제)에 의해 사용된다. 따라서, PUFA 신타제는 말로닐-CoA에 대하여 상기 다른 효소 시스템과 경쟁한다. 따라서, 본 발명의 한 실시양태는 말로닐-CoA 푸울(들)에 대해 경쟁하는 PUFA 신타제 효소의 능력을 증진시킴으로써 PUFA 신타제 경로를 통한 말로닐 CoA의 흐름을 증가시키는 방법 및 유전적 개질에 관한 것이다. 본원에 제안된 방법으로는 1) FAS 경로에서 임의의 요소를 억제하는 것을 비롯해서 경쟁 경로를 억제하는 방법, 예를 들어 상기 경로에 관여하는 효소 또는 서브유닛의 발현 수준을 감소시킴으로써 경쟁 경로를 억제하는 방법 (예컨대, 안티센스 RNA, RNAi, 공동억제 또는 돌연변이의 사용에 의함), 2) 경쟁 경로가 감소 또는 차단된 이종 숙주에서 PUFA 신타제를 발현시키는 방법 (예를 들어, 카놀라에서는 세포질에서 지방산을 연장시키는 능력이 차단됨), 및/또는 3) (예를 들어, 아세틸-CoA 카르복실라제의 발현에 의해) 말로닐-CoA 푸울을 증가시키는 방법을 들 수 있으나 이에 한정되지 않는다.
보다 구체적으로, 본 발명의 한 측면은 또한 PUFA를 제조하는 숙주 생물체, 특히 이종 PUFA PKS 시스템을 발현시키는 숙주 생물체를 유전적으로 개질시킴으로써 PUFA PKS 시스템에 의한 PUFA 제조 및/또는 축적과 경쟁할 수 있거나 또는 이를 방해할 수 있는 유전자(들)을 결실시키거나 불활성화하거나, 또는 이 유전자들에 의해 코딩되는 효소의 활성 수준을 감소시키는 것을 포함한다. 예를 들어, 본 발명자들은 PUFA PKS 시스템으로 형질전환된 숙주 생물체에서 FAS 활성을 감소시킴으로써 PUFA 제조 및 축적이 정상 수준의 FAS 활성을 보유하는 숙주 생물체에 비해 향상된다는 사실을 밝혀냈다 (실시예에서 효모 및 식물에 대해 상세화된 실험뿐만 아니라 쉬조키트리움에서의 예시적인 실험 참조).
한 실시양태에서, FAS 경로를 통해 지방산의 제조를 억제하는 다양한 효소가 예견되었다. 다수의 효소는 본 발명의 이러한 실시양태에 대해 적합한 표적일 수 있으며, 두 가지 특히 유용한 표적이 하기에 상세히 예시 및 기재되어 있다. 본 발명자들은 쉬조키트리움에서 FAS 효소를 녹아웃시키는 능력을 입증하였으며 (실시예 참조), 이러한 전략은 이종 숙주에 적용될 수 있다. 다른 실시양태에서, 본 발명자들은 효모 숙주에서 생화학적 방법에 의해 FAS 시스템을 억제함으로써 PUFA 신타제 및 PPTase를 발현시키는 효모에서 FAS 시스템의 생화학적 표적의 부재하에서와 비교해서 PUFA 제조를 개선시키는 능력을 입증하였다. 여러 다른 숙주들이 유사한 전략을 따를 수 있다.
마지막으로, 식물에서 본 발명자들은 안티센스 또는 RNAi 기술을 이용해서 KASII 또는 KASIII을 억제함으로써 FAS 경로를 억제하는 것이 PUFA 신타제 및PPTase를 발현시키는 이종 숙주에서 PUFA 제조를 향상시킨다는 것을 입증하였다. 본 발명을 이러한 특정 표적으로 제한하고자 하는 것은 아니지만, 본 발명의 한 측면은 억제에 있어서 상기 효소의 하나 또는 둘 다를 본원에 기재된 바와 같은 PUFA 신타제 및 PPTase의 발현과 함께, 단독으로 또는 본원에 기재된 다른 전략 (예를 들어, 코돈 최적화, 세포소기관-표적화, 아실 CoA 신테타제의 발현, 및/또는 하나 이상의 아실트랜스퍼라제 또는 관련 효소의 발현)과 조합하여 표적화함으로써 이종 숙주에서 PUFA 제조 및/또는 축적을 증가시키는 것에 관한 것이다.
종자에서, 주로 트리아실글리세롤 (TAG)의 형태인 지질은 정교한 효소 경로를 통해 동화물(assimilates)로부터 유도된다. 일반적으로, 환원된 탄소는 식물의 다른 부분으로부터의 체관부(phloem)를 통해 종자로 전달된다. 식물 종자에서, TAG의 생합성은 여러 세포소기관 내에서 세포내적으로 수행된다 [Ohrolgge and Browse, 1995, Plant Cell 7: 957-970]. 색소체 내에서, 짧은 탄소 전구체는 지방 아실 쇄에 C2-단위를 반복적으로 부가하고 다음 연장 라운드를 위해 상기 쇄를 준비시키는 제II형 가용성 지방산 신타제 (FAS) 복합체 [Slabas and Fawcett, 1992, Plant Molecular Biology 19: 169-191]에 의해 장쇄 지방산으로 전환된다. 8 또는 9 라운드의 C2-단위 축합반응에 의해 막 지질을 특징으로 하는 C16 및 C18 지방산이 생성된다. 초기 FAS 활성은 핵에 의해 코딩된, 색소체 표적화 효소 말로닐-CoA:ACP 트랜스아실라제 (MCAT)에 의해 수행되며, 이는 말로닐기를 말로닐-CoA로부터 아실 운반 단백질 (ACP)로 전달한다 [Yasuno et al., 2004, Journal of Biological Chemistry 292: 8242-8251]. 이는 후속 연장을 위해 C2-단위를 제공하는 기질, 말로닐-ACP를 형성시킨다. 합성의 다음 단계는 핵에 의해 코딩된, 색소체 표적화 β-케토아실-아실 운반자 단백질 신테타제III (KAS III)의 촉매 활성을 통해 달성되며, 여기서 말로닐-CoA와 공여자, 말로닐-ACP의 축합반응으로 부티릴 (C4)-ACP가 생성된다. ACP-활성화된 아실 쇄의 모든 후속 연장은 핵에 의해 코딩된, 색소체 표적화 3-케토아실-아실 운반자 단백질 신테타제I (KAS I) 및 β-케토아실-아실 운반자 단백질 신테타제II (KAS II) 이소자임에 의해 수행된다. KAS I은 부티릴 (C4)- 내지 미리스토일 (C14)-ACP를 기질로 사용함으로써 C4-ACP를 C16-ACP로 전환시키는 축합반응을 촉매하며, KAS II는 팔미토일 (C16)-ACP를 이용함으로써 스테아로일 (C18)-ACP를 생성시키는 마지막 단계를 수행한다 [Carlsson et al., 2002, Plant Journal 29: 761-770]. 따라서, KasIII 또는 KasII의 발현을 억제하거나 또는 약화시킴으로써 종자 발생 동안 지방산 생합성의 억제를 달성할 수 있다.
한 실시양태에서, 본 발명은 숙주 세포에서 KASII 또는 KASIII 중 어느 하나를 표적화하는 RNAi를 포함하는 핵산 분자를 사용해서 이종 숙주 생물체 또는 세포를 형질전환시키는 것을 포함한다. 한 실시양태에서, 숙주 세포는 식물 세포이다. 한 실시양태에서, 본 발명은 숙주 세포에서 KASII 또는 KASIII 중 어느 하나를 표적화하는 안티센스를 포함하는 핵산 분자를 사용해서 이종 숙주 생물체 또는 세포를 형질전환시키는 것을 포함한다. 바람직한 실시양태에서, 숙주 세포는 식물 세포이다.
한 실시양태에서, 본 발명은 실시예 13에 기재된 CHSA 인트론을 갖는 KAS II RNAi인 서열 122로 나타낸 핵산 서열을 포함하는 핵산 분자를 사용해서 이종 숙주 생물체 또는 세포를 형질전환시키는 것을 포함한다. 한 실시양태에서, 본 발명은 실시예 13에 기재된 CHSA 인트론을 갖는 KAS III RNAi인 서열 124로 나타낸 핵산 서열을 포함하는 핵산 분자를 사용해서 이종 숙주 생물체 또는 세포를 형질전환시키는 것을 포함한다. 한 실시양태에서, 본 발명은 실시예 13에 기재된 바와 같은 KAS II 안티센스 핵산 서열인 서열 123으로 나타낸 핵산 서열을 포함하는 핵산 분자를 사용해서 이종 숙주 생물체 또는 세포를 형질전환시키는 것을 포함한다. 한 실시양태에서, 본 발명은 실시예 13에 기재된 바와 같은 KAS III 안티센스 핵산 서열인 서열 125로 나타낸 핵산 서열을 포함하는 핵산 분자를 사용해서 이종 숙주 생물체 또는 세포를 형질전환시키는 것을 포함한다.
말로닐-CoA 푸울(들)에 대해 경쟁하는 PUFA 신타제 효소의 능력을 증진시키기 위한 추가의 방법은 경쟁 경로가 감소되거나 차단된 이종 숙주에서 PUFA 신타제의 발현을 포함한다 (예를 들어, 카놀라에서는 세포질에서 지방산을 연장시키는 능력이 차단됨). 다른 적합한 이종 숙주 (선별, 무작위 돌연변이 및 스크리닝, 및/또는 지정된 돌연변이에 의해 확인된 천연 발생 생물체 및/또는 돌연변이체)는 감소 또는 차단된 경쟁 경로, 예를 들면 FAS 경로 등에 있어서 틸링(tilling), 브리딩(breeding), 마커 보조 선별 등과 같은 기술에 의해 선별할 수 있다.
다른 효소, 예를 들면 아세틸-CoA 카르복실라제의 발현은 또한 모든 효소 시스템에 대하여 이용가능한 말로닐 CoA 푸울을 증가시키며, 따라서 PUFA PKS 시스템을 통한 흐름을 향상시킨다.
본 발명은 본원에 기재된 바와 같은 PUFA 신타제의 발현과 함께 외생성 PPTase의 발현 (단독으로 또는 내생성 PPTase의 억제와 조합됨)과 말로닐 CoA를 이용하는 PUFA PKS 시스템의 능력을 개선시키는 것을 포함하며, 이를 단독으로 또는 본원에 기재된 임의의 하나 이상의 전략 (예를 들어, 코돈 최적화, 세포소기관-표적화, 아실 CoA 신테타제의 발현, 및/또는 하나 이상의 아실트랜스퍼라제 또는 관련 효소의 발현 중 임의의 한가지, 두가지, 세가지 또는 네가지)과 조합하여 이용함으로써 이종 숙주에서 PUFA 제조 및/또는 축적을 증가시키는 임의의 실시양태의 수행을 포함한다.
아실-
CoA
신테타제
본 발명의 다른 실시양태는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 아실-CoA 신테타제(ACoAS) 단백질을 제공한다.
본 발명자들은 PUFA PKS 시스템에 의한 PUFA의 내생성 생산자인 쉬조키트리움이 그의 PUFA PKS 시스템의 FFA 생성물을 아실-CoA로 전환시킬 수 있는 하나 이상의 ACoAS를 보유한다고 결정하였다. 이러한 결정은 고수준의 PUFA가 상기 생물체내의 그러한 분획내에 축적된다는 사실로부터 명백하다. 따라서, 쉬조키트리움, 및 PUFA PKS 시스템을 내생적으로 함유하는 다른 생물체 (예, 다른 트라우스토키트리드) 또는 PUFA를 제조하는 다른 진핵생물 (예를 들면, 탈라시오시라 슈도나나(Thalassiosira pseudonana) 또는 크립테코디니움 코니)은 이종 숙주에서 발현된 PUFA PKS 시스템의 생성물의 축적을 허용하거나 증가시키는데 있어서 유용한 효소를 코딩하는 유전자들에 대한 우수한 공급원을 나타낸다.
본 발명자들은 공지된 또는 추정된 아실-CoA 신테타제(ACoAS) 활성을 갖는 단백질에 대해 상동성을 갖는 단백질을 코딩하는 쉬조키트리움의 9개의 핵산 서열을 확인하였다. 본 발명자들은 이들 서열의 하나 또는 여러개가 쉬조키트리움 PUFA 신타제의 FFA 생성물을 아실-CoA로 전환시킬 수 있는 ACoAS를 코딩하는 유전자와 관련이 있는 것으로 믿고 있으며, 이들 여러 서열을 사용해서 숙주 생물체에서 PUFA 제조 및/또는 축적을 증가시키는 능력을 입증하였다. 이와 같이, 이들은 쉬조키트리움 PUFA 신타제 또는 다른 PUFA 신타제가 내부에서 발현되는 이종 숙주에서 PUFA의 축적을 증가시키는데 있어서 큰 유용성을 가질 것이다. 이론에 얽매이고자 하는 것은 아니지만, 본 발명자들은 본 발명자들에 의해 발견된 ACoAS가 쉬조키트리움의 것과 유사한 생성물 프로필을 갖는 PUFA 신타제를 발현시키는 숙주 및 쉬조키트리움 PUFA 신타제의 것과 상이한 생성물 프로필을 갖는 PUFA 신타제를 발현시키는 숙주에서 PUFA 축적을 증가시키는데 유용하다고 믿는다. 실제로, 본원에 제시된 실시예는 쉬조키트리움 유래의 여러 ACoAS가 쉬조키트리움 PUFA PKS 시스템으로 유전적으로 개질된 효모 균주에서, 또한 유사하게 유전적으로 개질된 식물에서 PUFA의 축적을 증가시킨다는 것을 입증한다. 또한, 쉬조키트리움 ACoAS는 EPA가 FFA로서 존재하는 경우 다른 생물체 유래의 PUFA 신타제에 의해 제조된 EPA를 인식하는데 있어서 효과적인 것으로 예상된다. 게다가, 본 발명에 의해 제공된 개시내용을 고려해서, 다른 생물체 유래의 ACoAS를 코딩하는 유전자들을 그러한 PUFA 신타제를 발현시키는 이종 숙주 생물체에서 사용하기 위해 동정 및 수득할 수 있다. 상기 ACoAS 단백질과 이를 코딩하는 핵산의 각각, 및 이들의 상동체 및 생물학적 활성 단편은 본 발명에 포함된다. 이들 단백질 및 핵산 분자는 하기 기술내용과 실시예에서 상세히 논의될 것이다.
본 발명의 한 실시양태는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 단리된 아실-CoA 신테타제(ACoAS)에 관한 것이다. 본 발명의 한 측면에서, 단리된 ACoAS는 PUFA PKS 시스템 (PUFA 신타제)을 내생적으로 발현시키는 생물체로부터 유도된다. 이러한 생물체로는 트라우스토키트리드를 들 수 있지만 이에 한정되지 않는다. 한 측면에서, 단리된 ACoAS는 쉬조키트리움, 트라우스토키트리움, 또는 울케니아로부터 유도된다. 다른 측면에서, 단리된 ACoAS는 쉬조키트리움 ATCC 20888 또는 쉬조키트리움 종 균주 N230D로부터 유도되는데, 이는 개선된 오일 제조를 위한 돌연변이유발 및 선별에 의해 쉬조키트리움 ATCC 20888로부터 유도된 균주이다. 다른 측면에서, 임의의 PUFA PKS 시스템과 함께 기능해서 숙주 세포 또는 생물체에서 PUFA의 제조 및/또는 축적을 증가시키는 임의의 ACoAS가 본 발명에서 사용될 수 있다. 본 발명은 본원에 기재된 그러한 특정 실시예들로 제한되지 않는다.
다른 측면에서, 단리된 ACoAS는 서열 82, 84, 86, 88, 90, 92, 94, 96 또는 98 중 어느 하나로부터 선택된 뉴클레오티드 서열에 의해 코딩된다. 다른 측면에서, 단리된 ACoAS는 서열 82, 84, 86, 88, 90, 92, 94, 96 또는 98 중 어느 하나로부터 선택된 뉴클레오티드 서열에 의해 코딩되는 단백질을 코딩하는 축퇴성(degenerate) 핵산 서열에 의해 코딩된다. 또 다른 측면에서, 단리된 ACoAS는 서열 83, 85, 87, 89, 91, 93, 95, 97 또는 99 중 어느 하나로부터 선택된 아미노산 서열 또는 이러한 아미노산 서열 중 어느 하나의 상동체 (하기 기재됨)를 포함한다 (상기 서열의 임의의 생물학적 활성 단편 또는 도메인을 포함함). 바람직한 실시양태에서, 단리된 ACoAS는 본원에서 서열 83, 85, 87, 89, 91, 93, 95, 97 또는 99로 나타낸 아미노산 서열 또는 이러한 아미노산 서열의 상동체를 포함한다. 더 바람직한 실시양태에서, 단리된 ACoAS는 본원에서 서열 83, 85, 87, 91 또는 97로 나타낸 아미노산 서열 또는 이러한 서열의 상동체를 포함하며, 서열 83, 85 또는 97이 특히 바람직하다. 또한 임의의 하나 이상의 아실-CoA 신테타제의 조합이 본 발명에 포함된다.
본 발명은 본원에 기재된 바와 같은 PUFA 신타제 및 외생성 PPTase와 함께 본원에 기재 및 예시된 하나 이상의 아실-CoA 신테타제의 발현을 (단독으로 또는 내생성 PPTase 억제와의 조합으로) 포함하며, 이를 단독으로 또는 본원에 기재된 임의의 하나 이상의 전략 (예를 들어, 코돈 최적화, 세포소기관-표적화, (예를 들어, FAS의 억제에 의한) 말로닐 CoA에 대한 PUFA 신타제 경쟁의 증진, 및/또는 하나 이상의 아실트랜스퍼라제 또는 관련 효소의 발현 중 임의의 한가지, 두가지, 세가지 또는 네가지)과 조합하여 이용함으로써 이종 숙주에서 PUFA 제조 및/또는 축적을 증가시킨다.
아실트랜스퍼라제
상기 기재된 이종 숙주에서 PUFA의 제조 및/또는 축적을 증가시키기 위한 다른 전략과 관련해서, 본 발명의 다른 실시양태는 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 추가의 아실트랜스퍼라제 단백질 (예, 3-글리세롤-포스페이트 아실트랜스퍼라제 (GPAT), 리소포스파티드산 아실트랜스퍼라제 (LPAAT) 및 디아실글리세롤 아실트랜스퍼라제 (DAGAT)), 또는 PL 또는 TAG 중 PUFA를 풍부화할 수 있는 다른 아실트랜스퍼라제 (예, 인지질:디아실글리세롤 아실트랜스퍼라제 (PDAT))를 제공한다. 본 발명은 이러한 단리된 단백질 및 그의 상동체, 이러한 단백질을 코딩하는 핵산 분자, 이러한 단백질을 발현시키는 유전적으로 개질된 생물체, 및 상기 단백질을 사용해서 특히 생물체에서 PUFA 제조 및 축적을 증진시키는 다양한 방법을 포함한다.
또한, 본원에서 본 발명자들은 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 이용할 수 있는 효소를 개시하며, 따라서 PUFA 신타제에 의해 제조된 PUFA의 축적을 증진시키는 PUFA 신타제를 발현시키는 이종 숙주 생물체에서 사용될 수 있는 추가의 부속 단백질을 나타낸다. 후보 효소로는 3-글리세롤-포스페이트 아실트랜스퍼라제 (GPAT), 리소포스파티드산 아실트랜스퍼라제 (LPAAT) 및 디아실글리세롤 아실트랜스퍼라제 (DAGAT)를 들 수 있지만 이에 한정되지 않는다. 이들 아실-CoA-이용 단백질의 각각 및 이를 코딩하는 핵산은 본 발명에 포함된다. 예를 들어, DAGAT 활성 (예를 들어, ScDAGAT 참조)을 보유하는 효소를 코딩하는 것으로 여겨지는 쉬조키트리움 핵산 서열이 확인되었다. 또한, 하기에도 기재되어 있는, LPAAT 또는 DAGAT 활성을 보유하는 효소를 코딩하는 것으로 여겨지는 크립테코디니움 코니 서열이 확인되었다. 이들 단백질, 그의 생물학적 활성 상동체, 및 핵산 분자, 및 다른 아실트랜스퍼라제 단백질, 그의 상동체, 및 핵산 분자는 본 발명에 포함되며, 구체적인 실시예는 이하에서 상세히 논의될 것이다.
본 발명의 다른 실시양태는 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 사용하는 단리된 단백질 (예, 3-글리세롤-포스페이트 아실트랜스퍼라제 (GPAT), 리소포스파티드산 아실트랜스퍼라제 (LPAAT) 및 디아실글리세롤 아실트랜스퍼라제 (DAGAT))에 관한 것이다. 바람직한 단백질로는 GPAT, LPAAT 및 DAGAT로부터 선택된 임의의 아실트랜스퍼라제를 들 수 있다. 한 측면에서, 단리된 단백질은 PUFA PKS 시스템 (PKS 신타제) 또는 적어도 PUFA의 제조를 위한 생합성 경로를 내생적으로 발현시키는 생물체로부터 유도된다. 이러한 생물체로는 트라우스토키트리드 또는 크립테코디니움 코니를 들 수 있지만 이에 한정되지 않는다. 한 측면에서, 단리된 아실트랜스퍼라제는 쉬조키트리움, 트라우스토키트리움 또는 울케니아로부터 유도된다. 다른 측면에서, 단리된 아실트랜스퍼라제는 쉬조키트리움 ATCC 20888 또는 쉬조키트리움 종 균주 N230D로부터 유도된다. 다른 측면에서, 아실트랜스퍼라제는 크립테코디니움 코니로부터 유도된다. 다른 측면에서, 숙주 세포 또는 생물체에서 PUFA의 제조 및/또는 축적을 증가시키는 임의의 PUFA PKS 시스템과 함께 기능하는 임의의 아실트랜스퍼라제가 본 발명에서 사용될 수 있다. 본 발명은 본원에 기재된 이러한 특정 실시예들로 제한되지 않는다.
다른 측면에서, 단리된 아실 트랜스퍼라제는 서열 100, 102, 103, 105, 106, 108, 109, 111, 112, 또는 114-121 중 어느 하나로부터 선택된 뉴클레오티드 서열에 의해 코딩된다. 다른 측면에서, 단리된 아실트랜스퍼라제는 서열 100, 102, 103, 105, 106, 108, 109, 111, 112, 또는 114-121 중 어느 하나로부터 선택된 뉴클레오티드 서열에 의해 코딩되는 단백질을 코딩하는 축퇴성 핵산 서열에 의해 코딩된다. 또 다른 측면에서, 단리된 아실트랜스퍼라제는 서열 101, 104, 107, 110 또는 113 중 어느 하나로부터 선택된 아미노산 서열 또는 이러한 아미노산 서열 중 어느 것의 상동체 (하기 기재됨)를 포함한다 (상기 서열의 임의의 생물학적 활성 단편 또는 도메인을 포함함). 바람직한 실시양태에서, 단리된 아실트랜스퍼라제는 본원에서 서열 101, 104, 107, 110 또는 113으로 나타낸 아미노산 서열 또는 이 아미노산 서열의 상동체를 포함한다. 더 바람직한 실시양태에서, 단리된 아실트랜스퍼라제는 본원에서 본원에서 서열 101 또는 104로 나타낸 아미노산 서열 또는 이 서열의 상동체를 포함하며, 서열 101이 특히 바람직하다. 본원에 기재된 아실트랜스퍼라제의 조합물은 또한 본 발명에 사용하는 것으로 포함된다.
또 다른 측면에서, 단리된 아실트랜스퍼라제는 임의의 한 서열로부터 선택된 아미노산 서열 또는 상기 임의의 아미노산 서열의 상동체 (하기 기재됨)를 포함한다 (상기 서열의 임의의 생물학적 활성 단편 또는 도메인을 포함함).
본 발명은 본원에 기재된 바와 같은 PUFA 신타제 및 외생성 PPTase (단독으로 또는 내생성 PPTase의 억제와의 조합으로)와 함께 본원에 기재 및 예시된 바와 같은 하나 이상의 아실-CoA 신테타제의 발현을 포함하며, 이를 단독으로 또는 본원에 기재된 임의의 하나 이상의 전략 (예를 들어, 코돈 최적화, 세포소기관-표적화, (예를 들어 FAS의 억제에 의한) 말로닐 CoA에 대한 PUFA 신타제 경쟁의 증진, 및/또는 아실 CoA 신테타제의 발현 중 어느 한가지, 두가지, 세가지 또는 네가지)과 조합하여 이용함으로써 이종 숙주에서 PUFA 제조 및/또는 축적을 증가시키는 것을 포함한다.
세포소기관
-특이적 발현
상기 기재된 다른 전략과 관련해서, 본 발명의 한 실시양태는 PUFA 신타제 효소, PPTase, 및/또는 임의의 하나 이상의 부속 단백질의 발현의 표적화 및/또는 숙주의 하나 이상의 세포소기관에 대한 표적화된 유전적 개질에 관한 것이다. 예를 들어, 한 실시양태에서 PUFA 신타제 시스템 및 PPTase의 발현은 식물의 색소체로 표적화된다. 다른 실시양태에서, PUFA 신타제 시스템 및 PPTase의 발현은 세포질로 표적화된다. 다른 실시양태에서, PUFA 신타제 시스템 및 PPTase의 발현은 식물의 색소체와 세포질 둘 다로 표적화된다. 이들 실시양태들 중 어느 하나에서, 다른 표적이 색소체 또는 세포질로 지시될 수 있다. 한 측면에서 아실-CoA 신테타제의 발현은 세포질로 표적화되며, 다른 실시양태에서 이러한 발현은 색소체로 표적화된다. 한 실시양태에서, 하나의 아실-CoA 신테타제는 세포질로 표적화되며, 다른 아실-CoA 신테타제는 색소체로 표적화된다. 바람직하게는, 아실-CoA 신테타제는 세포질에서 발현되어 DHA 및/또는 DPA 유리 지방산을 아실-CoA로 전환시키며, 이는 다시 아실트랜스퍼라제에 의해 이용될 수 있다. 아실트랜스퍼라제는 일반적으로 동시번역적으로 소포체로 표적화된다. 예를 들어 유전적 개질에 의해 FAS 시스템을 억제하는 것에 의한 하나 이상의 숙주 효소의 억제는 PUFA 신타제가 발현되는 동일한 세포소기관(들)로 지시될 수 있다.
하나의 예시적인 색소체 표적화 서열은 브라시카 나푸스(Brassica napus) 아실-ACP 티오에스테라제로부터 유도되며, 코딩된 표적화 펩티드의 아미노산 서열을 본원에서 서열 81로 나타낸다. 다양한 다른 색소체 표적화 서열은 당업계에 공지되어 있으며, 이종 숙주가 식물 또는 식물 세포이며 색소체로의 표적화가 바람직한 것인 실시양태에서 사용될 수 있다.
본 발명은 본원에 기재된 바와 같은 PUFA 신타제의 발현 및 외생성 PPTase (단독으로 또는 내생성 PPTase의 억제와의 조합으로)와 함께 세포소기관 표적화 (예를 들어, 식물에서 색소체 또는 엽록체로의 표적화)의 사용을 포함하며, 이를 단독으로 또는 본원에 기재된 임의의 하나 이상의 전략 (예를 들어, 코돈 최적화, (예를 들어 FAS의 억제에 의한) 말로닐 CoA에 대한 PUFA 신타제 경쟁의 증진, 하나 이상의 아실-CoA 신테타제의 발현, 및/또는 하나 이상의 아실트랜스퍼라제 또는 관련 효소의 발현 중 어느 한가지, 두가지, 세가지 또는 네가지)과 조합하여 이용함으로써 이종 숙주에서 PUFA 제조 및/또는 축적을 증가시키는 것을 포함한다.
유전자 생성물의 색소체 또는 엽록체로의 표적화는 다양한 단백질의 아미노 말단에 존재하며 임포트(import) 동안 절단되어 성숙 단백질을 형성하는 신호 서열에 의해 조절된다 (예를 들어, 엽록체 표적화에 대해서는 예컨대 문헌 [Comai et al., J. Biol. Chem. 263: 15104-15109 (1988)]을 참조한다). 이들 신호 서열을 이종 유전자 생성물에 융합시켜 이종 생성물을 엽록체로 임포트할 수 있다 [van den Broeck et al. Nature 313: 358-363 (1985)]. 적절한 신호 서열을 코딩하는 DNA는 RUBISCO 단백질, CAB 단백질, EPSP 신타제 효소, GS2 단백질, 및 국소화된 엽록체인 것으로 공지된 다수의 다른 단백질을 코딩하는 cDNA로부터 단리될 수 있다.
본 발명의 다양한 실시양태에서, 본 발명에 이용된 단백질이 세포내 구획, 예를 들어 색소체 또는 엽록체로 국소화되도록 지시하는 것이 특히 유리할 수 있다. 단백질은 그의 아미노-말단에 엽록체 수송(transit) 펩티드 (CTP)를 포함시킴으로써 엽록체로 지시될 수 있다. 유사하게, 단백질은 그의 N-말단에 색소체 수송 또는 신호화 펩티드를 포함시킴으로써 색소체로 지시될 수 있다.
아미노-말단의 엽록체 표적화 펩티드를 함유하는 큰 전구체 단백질로서 합성된 천연 발생 엽록체 표적화 단백질은 당업계에 잘 알려져 있으며, 상기 펩티드는 전구체를 엽록체 임포트 기구로 지시한다. 엽록체 표적화 펩티드는 일반적으로 엽록체 세포소기관내에 위치하는 특정 엔도프로테아제에 의해 절단되며, 따라서 표적화 성숙된, 바람직하게는 활성 효소를 전구체로부터 엽록체 환경으로 방출시킨다. 유전자 또는 유전자 생성물을 식물 세포의 엽록체 또는 색소체로 표적화하는 것을 지시하는데 적합한 펩티드를 코딩하는 서열의 예는 피튜니아(petunia) EPSPS CTP, 아라비돕시스 EPSPS CTP2 및 인트론, 및 당업계에 숙련자에게 공지된 다른 것들을 포함한다. 이러한 표적화 서열은 목적하는 발현된 단백질이 그가 가장 효과적으로 기능하는 세포 구조로 전달되도록 준비하거나 또는 목적하는 발현된 단백질을 목적하는 표현형 기능에 필요한 세포 프로세스가 집중되어 있는 세포 영역에 전달한다. 엽록체 표적화 펩티드의 특정 예는 당업계에 잘 알려져 있으며, 아라비돕시스 탈리아나 리불로스 비스포스페이트 카르복실라제의 작은 서브유닛 ats1A 수송 펩티드, 아라비돕시스 탈리아나 EPSPS 수송 펩티드, 및 옥수수(Zea maize) 리불로스 비스포스페이트 카르복실라제의 작은 서브유닛 수송 펩티드를 들 수 있다.
최적화된 수송 펩티드는 예를 들어 문헌 [Van den Broeck et al., "Targeting of a foreign protein to chloroplasts by fusion to the transit peptide from the small subunit of ribulose 1,5-biphosphate carboxylase", Nature, 313:358-363 (1985)]에 기재되어 있다. 원핵생물 및 진핵생물 신호 서열은 예를 들어 문헌 [Michaelis et al. (1982) Ann. Rev. Microbiol. 36, 425]에 개시되어 있다. 본 발명에 사용될 수 있는 수송 펩티드의 추가의 예로는 문헌 [Von Heijne et al., Plant Mol. Biol. Rep. 9:104-126(1991); Mazur et al., Plant Physiol. 85: 1110 (1987); Vorst et al., Gene 65: 59 (1988)]에 기재된 것들과 같은 엽록체 수송 펩티드를 들 수 있다. 첸(Chen) 및 야겐도르프(Jagendorf)는 문헌 [J. Biol. Chem. 268: 2363-2367 (1993)]에서 이종 트랜스유전자의 임포트를 위한 엽록체 수송 펩티드의 사용을 기재하였다. 상기 사용된 펩티드는 니코티아나 플럼바기니폴리아(Nicotiana plumbaginifolia) 유래의 rbcS 유전자로부터의 수송 펩티드이다 [Poulsen et al. Mol. Gen. Genet. 205: 193-200 (1986)]. 본원에서 이종 단백질을 엽록체로 국소화하는 기능을 하는 하나의 CTP는 브라시카 나푸스 아실-ACP 티오에스테라제로부터 유도되었다.
유전자들을 엽록체 또는 색소체로 국소화하기 위한 다른 수단으로는 엽록체 또는 색소체 형질전환을 들 수 있다. 엽록체 DNA만이 이 출원에서 고려되는 분자를 혼입하도록 개질된 재조합 식물을 제조할 수 있다. 엽록체에서 기능하는 프로모터는 당업계에 공지되어 있다 [Hanley-Bowden et al., Trends in Biochemical Sciences 12:67-70, 1987]. 이종 DNA가 삽입된 엽록체를 함유하는 세포를 얻기 위한 방법 및 조성물은 예를 들어 문헌 [Daniell et al. (미국 특허 제5,693,507호; 1997) 및 Maliga et al. (미국 특허 제5,451,513호; 1995)]에 기재되어 있다.
전략들의 조합
본 발명에 따라, 하나 이상의 표적 PUFA의 제조 및 축적을 위한 이종 숙주의 생성에서, 숙주에서 PUFA의 제조 및/또는 축적을 향상시키기 위해 본원에 기재된 임의의 하나 이상의 전략 (전략들의 임의의 조합)을 이용할 수 있다. 실제로, 전략들의 다양한 조합들은 상가적 또는 상승적이며 한가지 이상의 이러한 전략의 부재하에서와 비교해서 PUFA의 향상된 제조 및/또는 축적을 제공할 것으로 예상된다. 실제로, 실시예는 숙주 생물체 (PUFA PKS 시스템을 자연적으로 발현시키는 생물체 및 이종 숙주인 것들)에서 PUFA의 제조를 위한 전략들의 다양한 조합들을 비롯해서 다수의 예시적인 전략을 제공한다.
본 발명에 따른 PUFA의 제조를 위한 적합한 유전적으로 개질된 숙주 세포 또는 생물체는 하기의 기본 특질을 갖는다. 숙주 세포 또는 생물체는 PUFA PKS 시스템을 발현시키는데, 이는 본원에 기재된 코어 PUFA PKS 효소, 및 코어 PUFA PKS 효소와 함께 사용하는 경우 PUFA를 제조하는데 효과적인 PPTase를 포함한다. PUFA PKS 시스템 및/또는 PPTase는 숙주 세포 또는 생물체에 의해 내생적으로 제조되거나 또는 숙주에서 (예를 들어, 재조합 기술에 의해) 이종 단백질로서 발현될 수 있다. 코어 PUFA PKS 효소 및/또는 PPTase를 코딩하는 핵산 분자는 숙주 세포 또는 생물체에서 코돈 용법 또는 우수한 발현을 위해 최적화될 수 있다. 숙주 세포 또는 생물체는 또한 본원에 기재되거나 그렇지 않다면 당업계에 공지된 것들 중 임의의 것을 비롯해서 하나, 둘, 셋, 또는 그보다 많은 종류의 아실-Co 신테타제를 발현하도록 개질될 수 있다. 숙주 세포 또는 생물체는 본원에 기재되거나 그렇지 않다면 당업계에 공지된 것들 중 임의의 것을 비롯해서 하나, 둘, 셋, 또는 그보다 많은 종류의 아실트랜스퍼라제를 발현하도록 추가로 개질될 수 있다. 숙주 세포 또는 생물체는 기질인 말로닐 CoA에 대해 경쟁하는 PUFA PKS 시스템의 능력을 증진시키도록 추가로 유전적으로 개질 (또는 그렇지 않다면 선별 또는 제조)될 수 있다. 한 측면에서, 이는 자연적으로 또는 천연, 선택된 또는 지정된 돌연변이로 인해 또는 브리딩 또는 다른 기술에 의해 상기한 특징을 갖는 생물체의 선별에 의해 달성된다. 다른 측면에서, 이는 말로닐 CoA에 대해 PUFA PKS, 예를 들면 FAS 시스템과 경쟁하는 경로(들)에서 하나 이상의 효소를 선택적으로 억제함으로써 달성된다. 어떤 실시양태에서, PUFA PKS 또는 부속 단백질의 표적화 또는 개질은 예를 들면 식물의 색소체에 대해 세포소기관-특이적일 수 있다.
코어 PUFA PKS 시스템 및 PPTase와 관련해서 사용하기 위한 일부 바람직한 조합들로는 다음과 같은 것들을 들 수 있지만 이에 한정되지 않는다: (1) 한가지, 두가지, 또는 그보다 많은 아실-CoA 신테타제의 발현; (2) (예를 들어, KASII 또는 KASIII의 억제에 의한) FAS 억제; (3) (예를 들어, KASII 또는 KASIII의 억제에 의한) FAS 억제와 한가지, 두가지, 또는 그보다 많은 아실-CoA 신테타제의 발현과의 조합; (4) 한가지, 두가지, 또는 그보다 많은 아실 트랜스퍼라제의 발현; (5) 한가지, 두가지, 또는 그보다 많은 아실-CoA 신테타제의 발현; (예를 들어, KASII 또는 KASIII의 억제에 의한) FAS 억제; 및 한가지, 두가지, 또는 그보다 많은 아실 트랜스퍼라제의 발현의 조합.
식물에서 본원에 예시된 개질들의 일부 예시적인 조합들 (실시예 13 참조)은
(a) 아실-CoA 신테타제 (ACS-1 및 ACS-2가 예시됨)의 발현;
(b) FAS 억제 (KASII RNAi, KAS II 안티센스, KASIII RNAi, 및 KASIII 안티센스에 의한 억제가 예시됨);
(c) 아실-CoA 신테타제의 발현과 FAS 억제의 조합 (KASII RNAi, KAS II 안티센스, KASIII RNAi, 및 KASIII 안티센스의 각각에 의한 FAS 억제와 ACS-1의 발현이 예시됨);
(d) 아실트랜스퍼라제의 발현 (LPAAT-1이 예시됨);
(e) 아실트랜스퍼라제의 발현과, 아실-CoA 신테타제의 발현 및 FAS 억제와의 조합 (KASII RNAi 또는 KASIII 안티센스에 의한 FAS의 억제와 각각 조합된, ACS-1의 발현과 함께 DAGAT-1의 발현이 예시됨);
(f) 아실트랜스퍼라제의 발현과, 두가지 아실-CoA 신테타제의 발현 및 FAS 억제와의 조합 (KASII RNAi 또는 KASIII 안티센스에 의한 FAS의 억제와 각각 조합된, ACS-8의 발현, ACS-1의 발현과 함께 DAGAT-1의 발현이 예시됨);
(g) 두가지 아실트랜스퍼라제의 발현과, 아실-CoA 신테타제의 발현 및 FAS 억제와의 조합 (KASII RNAi 또는 KASIII 안티센스에 의한 FAS의 억제와 각각 조합된, ACS-1의 발현과 함께 DAGAT-1 및 LPAAT-1의 발현이 예시됨); 및
(h) 두가지 아실트랜스퍼라제의 발현과, 두가지 아실-CoA 신테타제의 발현 및 FAS 억제와의 조합 (KASII RNAi 또는 KASIII 안티센스에 의한 FAS의 억제와 각각 조합된, ACS-1 및 ACS-8의 발현과 함께 DAGAT-1 및 LPAAT-1의 발현이 예시됨)
과 함께 PUFA PKS (예, 쉬조키트리움 유래의 것) 및 이종 PPTase (예, Nostoc 유래의 HetI)의 발현을 포함한다.
이러한 개질의 조합들 또는 본원에 기재된 개질의 임의의 다른 개질 또는 조합을 이용하는 임의의 식물 또는 식물 세포가 본 발명에 포함된다. 또한, 본원에 기재된 임의의 개질 또는 개질의 조합을 이용하는 임의의 숙주 세포 또는 생물체가 본 발명에 포함되며, 표적 PUFA를 포함하는 오일을 비롯해서 이러한 세포 또는 생물체로부터 유도된 임의의 생성물도 본 발명에 포함된다. 본 발명의 이들 실시양태의 모두는 유전적으로 개질된 임의의 생물체 및 본원에 기재된 상기 생물체를 생성 및 이용하는 방법에 대한 논의로 적용된다.
유전적으로
개질된
세포, 생물체, 및 이의 생성 및 이용 방법
한가지 이상의 목적하는 다불포화 지방산 또는 다른 생활성 분자를 유의하게 높은 수율로 제조하기 위해, 생물체, 바람직하게는 미생물 또는 식물을 유전적으로 개질시킴으로써 미생물 또는 식물에서 PUFA PKS 시스템의 활성, 특히 최종 생성물을 변화시키거나 또는 PUFA PKS 시스템을 미생물 또는 식물에 도입한다. 본 발명은 이러한 유전적 개질의 효과를 향상시키거나 증진시키는, 특히 PUFA PKS 시스템의 최종 생성물, 바람직하게는 PUFA(들)의 제조 및/또는 축적을 향상시키거나 증진시키는 방법에 관한 것이다.
따라서, 본 발명의 한 실시양태는 PUFA PKS 시스템을 발현시키며, 숙주에 의한 PUFA (또는 PUFA PKS 시스템의 다른 생활성 생성물)의 제조 및/또는 축적을 향상시키기 위한 본원에 기재된 바와 같은 부속 단백질을 발현시키도록 유전적으로 개질되었고/되었거나 자연 선택 및 돌연변이를 비롯한 임의의 방법에 의해 숙주내의 기질에 대해 (예를 들어, FAS 경로 및 본원에 기재된 다른 경쟁 경로의 억제에 의해) 경쟁하는 PUFA PKS의 능력을 증진시키도록 유전적으로 개질된 것인, 유전적으로 개질된 생물체에 관한 것이다. PUFA PKS 시스템이 숙주에 대해 이종인 경우, 생물체는 또한 바람직하게는 PUFA PKS 부속 단백질로서 PPTase를 발현시키도록 유전적으로 개질되며, 이는 상기에 상세히 기재되어 있다. 한 실시양태에서, 생물체는 본원에 기재된 ACoAS, 바람직하게는 PUFA PKS 시스템이 유도된 생물체와 동일한 속, 종 또는 특정 생물체로부터 유도되거나 또는 PUFA PKS 시스템에 의해 제조된 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매할 수 있는 ACoAS를 발현시키도록 유전적으로 개질되었다. 다른 실시양태에서, 생물체는 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 단백질을 발현시키도록 유전적으로 개질되었다. 또 다른 실시양태에서, 생물체는 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 단백질 및 상기 기재된 ACoAS를 둘 다 발현시키도록 유전적으로 개질되었다. 한 실시양태에서, PUFA PKS 시스템이 숙주에 대해 내생성인 경우, 생물체는 숙주 생물체에서 PUFA (또는 PUFA PKS 시스템의 다른 생활성 생성물)의 제조 및/또는 축적을 향상시키거나 증진시키는 상기 기재된 바와 같은 이종 부속 단백질을 발현시키도록 유전적으로 개질될 수 있고/있거나 생물체는 (예를 들어, 숙주에서 내생성 PUFA PKS 시스템과 함께 작용하는 내생성 ACoAS의 발현 또는 활성을 향상시키기 위해) 생물체에 의해 내생적으로 발현되는 상기 부속 단백질의 발현 및/또는 생물학적 활성을 증가, 최적화 또는 증진시키도록 유전적으로 개질될 수 있다. 한 실시양태에서, 생물체는 자연 선택 및 돌연변이, 지시된 돌연변이, 또는 무작위 돌연변이 및 스크리닝 등을 비롯한 임의의 방법에 의해 유전적으로 개질되어 (예를 들어, 본원에 기재된 FAS 경로 및 다른 경쟁 경로를 억제하여) 숙주 내에서 기질에 대해 경쟁하는 PUFA PKS의 능력을 증진시킨다. 한 실시양태에서, 생물체내의 FAS 경로가 억제된다. 한 실시양태에서, 생물체내의 KASII 및/또는 KASIII이 억제된다. 본 발명의 이러한 실시양태들은 상기에 상세히 기재되어 있다. 바람직한 유전적으로 개질된 생물체로는 유전적으로 개질된 미생물 및 유전적으로 개질된 식물을 들 수 있다.
생물체가 PUFA PKS 시스템을 내생적으로 발현시킬 수 있지만, 본 발명은 PUFA PKS 시스템 (이종 숙주)을 발현시키도록 유전적으로 개질된 생물체에서 PUFA의 제조 및/또는 축적을 증진시키는데 특히 유용하다. 생물체에 의해 발현된 PUFA PKS 시스템은 임의의 PUFA PKS 시스템, 예를 들어 특정 생물체로부터 전적으로 유래하는 PUFA PKS 시스템 (예, 쉬조키트리움 PUFA PKS 시스템), 및 상이한 PUFA PKS 시스템 및/또는 상이한 비-PUFA PKS 시스템 (예, 제I형 모듈성, 제I형 반복적, 제II형 또는 제III형 PKS 시스템)으로부터의 단백질 및/또는 도메인을 코딩하는 핵산 서열을 "혼합 및 대응"시킴으로써 (예를 들어, 예, 트라우스토키트리움, 울케니아, 쉬바넬라, 모리텔라, 및/또는 포토박테리움 등 유래의 PUFA PKS 단백질 및/또는 도메인과 쉬조키트리움 PUFA PKS 단백질 및/또는 도메인을 혼합함으로써) 제조되는 PUFA PKS 시스템을 포함할 수 있으며, 여기서 상이한 생물체로부터의 단백질 및/또는 도메인을 조합하여 완전한 기능적 PUFA PKS 시스템을 형성시킨다. 상이한 생물체 유래의 PUFA PKS 유전자들 또는 단백질을 조합하는 것을 포함하는 PUFA PKS 시스템은 미국 특허 제6,140,486호; 미국 특허 제6,566,583호; 문헌 [Metz et al., Science 293:290-293 (2001)]; 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 미국 특허 출원 공개 제20050100995호; 및 PCT 공개 제WO 2006/135866호; 상기 참조)에 상세히 기재되어 있다. PUFA PKS 유전자들 및 단백질은 또한 PCT 특허 공개 제WO 05/097982호; 및 미국 특허 출원 공개 제20050014231호에 개시되어 있다. 상기 확인된 각각의 개시물 및 여기에 기재된 유전자들 및 단백질은 본원에 참고로 포함된다.
따라서, 본원에 구체적으로 기재된 임의의 PUFA PKS 시스템을 포함하지만 이에 한정되지 않는 PUFA PKS 시스템의 하나 이상의 기능성 도메인 또는 단백질 (또는 그의 생물학적 활성 단편 또는 상동체)을 코딩하는 생물체내의 하나 이상의 핵산 서열을 유전적으로 개질하고/하거나 이러한 도메인 또는 단백질을 코딩하는 핵산 서열을 포함하는 하나 이상의 재조합 핵산 분자를 발현시킴으로써 생물체를 유전적으로 개질시키는 방법이 본 발명에 포함된다. 또한, 이러한 방법은 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 ACoAS 및/또는 단백질 또는 하나 이상의 기능성 도메인 또는 단백질을 코딩하는 생물체내의 하나 이상의 핵산 서열을 유전적으로 개질시키고/시키거나 이러한 단백질(들)을 코딩하는 핵산 서열을 포함하는 하나 이상의 재조합 핵산 분자를 발현시킴으로써 생물체를 유전적으로 개질시키는 것을 포함한다. 이 방법은 생물체를 유전적으로 개질시킴으로써, 생물체내의 KASII 또는 KASIII의 억제를 포함하지만 이에 한정되지 않는, FAS 시스템과 같이 기질에 대해 PUFA PKS와 경쟁하는 경로를 억제하는 것을 추가로 포함할 수 있다. 한 실시양태에서, 외생적으로 도입된 임의의 핵산 서열을 숙주에서의 코돈 용법 또는 향상된 발현을 위해 최적화할 수 있다. 한 실시양태에서, 도입된 임의의 핵산 서열을 생물체내의 하나 이상의 세포소기관으로 표적화할 수 있다. 이러한 서열, 생물체를 유전적으로 개질시키는 방법, 특정 개질물, 및 이들의 조합에 대한 다양한 실시양태가 상기에 상세히 기재되어 있으며, 본 발명에 포함된다. 전형적으로, 상기 방법을 이용해서 특정 생활성 분자 또는 분자들을 제조하는 유전적으로 개질된 특정 생물체를 제공한다. 바람직하게는 유전적으로 개질된 생물체는 유전적으로 개질된 미생물 또는 유전적으로 개질된 식물이다.
바람직하게는, 본 발명의 유전적으로 개질된 생물체는 EPA (C20:5, n-3), DHA (C22:6, n-3), DPA (C22:5, n-6 또는 n-3), ARA (C20:4, n-6), GLA (C18:3, n-6), ALA (C18:3, n-3), 및/또는 SDA (C18:4, n-3)를 포함하지만 이에 한정되지 않는 한가지 이상의 다불포화 지방산, 더 바람직하게는 EPA (C20:5, n-3), DHA (C22:6, n-3), DPA (C22:5, n-6 또는 n-3), 또는 DTA (C22:4, n-6), 또는 이들의 임의의 조합을 포함하지만 이에 한정되지 않는 한가지 이상의 장쇄 PUFA를 제조한다. 특히 바람직한 실시양태에서, 본 발명의 유전적으로 개질된 식물은 EPA (C20:5, n-3), DHA (C22:6, n-3), 및/또는 DPA (C22:5, n-6 또는 n-3), 또는 이들의 임의의 조합을 포함하지만 이에 한정되지 않는 한가지 이상의 다불포화 지방산을 제조한다.
본 발명에 따라, 유전적으로 개질된 생물체는 재조합 기술을 이용하거나 또는 전형적 돌연변이유발 및 스크리닝 기술에 의해 개질된 생물체를 포함한다. 본원에 사용된 바와 같이, 유전자 발현, 유전자 기능 또는 유전자 생성물 (즉, 유전자에 의해 코딩된 단백질) 기능에서의 저하를 일으키는 유전적 개질은 유전자의 불활성화 (완전한 또는 부분적인 불활성화), 결실, 중단(interruption), 차단 또는 하향조절로서 지칭될 수 있다. 예를 들어, 상기 유전자에 의해 코딩되는 단백질의 기능의 저하를 일으키는 유전자내 유전적 개질은 유전자의 완전한 결실 (즉, 유전자가 존재하지 않으며, 따라서 단백질도 존재하지 않음), 단백질을 불완전하게 번역하거나 전혀 번역하지 않는 (예를 들어, 단백질이 발현되지 않는) 유전자내 돌연변이, 또는 단백질의 천연 기능을 감소시키거나 폐지하는 유전자내 돌연변이 (예를 들어, 감소된 효소 활성 또는 작용을 갖거나 그러한 활성 또는 작용을 전혀 갖지 않는 단백질이 발현됨)의 결과일 수 있다. 유전자 발현 또는 기능의 증가를 일으키는 유전적 개질은 유전자의 증폭, 과제조, 과발현, 활성화, 증진, 부가, 또는 상향조절로서 지칭될 수 있다.
본 발명에 따른 생물체의 유전적 개질은, PUFA PKS 시스템이 내생성이며 유전적으로 개질된 것인지, 생물체로 도입된 재조합 핵산 분자에 의해 내생성이 된 것인지 (이 옵션에서는 내생성 시스템을 개질시키거나 개질시키지 않음), 또는 재조합 기술에 의해 완전하게 제공된 것인지의 여부에 상관없이, 바람직하게는 생물체에 의해 발현된 PUFA PKS 시스템의 활성에 영향을 준다. PUFA PKS 시스템 또는 이러한 시스템을 발현시키는 생물체의 PUFA 제조 프로필을 변화시키는 것은, 유전적 개질의 부재시와 비교해서 (즉, 비개질, 야생형 생물체, 또는 적어도 PUFA 합성에 대하여 개질되지 않은 생물체 - 즉, PUFA 합성과 관련되지 않은 다른 개질을 가질 수 있는 생물체와 비교해서) 숙주 생물체에 의한 한가지 이상의 임의의 PUFA (또는 PUFA PKS 시스템에 의해 제조된 다른 생활성 분자)의 제조에서 임의의 검출가능한 또는 측정가능한 변화를 일으키는 것을 포함한다. PUFA PKS 시스템의 활성에 영향을 주는 것은 유전적 개질의 부재시와 비교해서 생물체에 의해 발현된 PUFA PKS 시스템에서의 임의의 검출가능한 또는 측정가능한 변화 또는 개질을 유발하는 임의의 유전적 개질을 포함한다. PUFA PKS 시스템에서의 검출가능한 변화 또는 개질은 유전적 개질의 부재하의 내생성 PUFA PKS 시스템과 비교해서 개질된 PUFA PKS 시스템에서의 하나 이상의 임의의 도메인의 발현 및/또는 생물학적 활성을 변화 또는 개질시키는 것 (상기 발현 또는 활성을 도입하거나, 이를 증가시키거나 또는 감소시키는 것), PUFA PKS 시스템 활성 (즉, 생물체는 유전적 개질에 앞서 PKS 시스템 또는 PUFA PKS 시스템을 함유하지 않았음)을 생물체로 도입하여 생물체가 측정가능한/검출가능한 PUFA PKS 시스템 활성을 갖도록 하는 것을 포함하지만 이에 한정되지 않을 수 있다.
PUFA PKS 시스템에 대한 부속 단백질에서의 것들을 비롯해서 PUFA PKS 시스템에서의 기능성 도메인 또는 단백질의 활성을 증가시키는 것에 대한 언급은, 상기 도메인 또는 단백질을 함유하는 (또는 도메인 또는 단백질이 도입될) 생물체에서 도메인 또는 단백질 또는 시스템의 기능성 증가를 나타내며, 더 높은 활성의 도메인 또는 단백질 또는 시스템 (예, 비(specific) 활성 또는 생체내 효소 활성), 억제 또는 분해가 감소된 도메인 또는 단백질 또는 시스템, 및 과발현된 도메인 또는 단백질 또는 시스템을 포함할 수 있는 임의의 유전적 개질을 지칭한다는 것을 유의해야 한다. 예를 들어, 유전자 카피수를 증가시킬 수 있거나, 천연 프로모터의 것보다 더 높은 발현 수준을 제공하는 프로모터를 사용해서 발현 수준을 증가시킬 수 있거나, 또는 유전자에 의해 코딩되는 도메인 또는 단백질의 활성을 증가시키는 유전적 조작 또는 전형적 돌연변이유발에 의해 유전자를 변화시킬 수 있다.
유사하게, PUFA PKS 시스템에 대한 부속 단백질에서의 것들을 비롯해서 PUFA PKS 시스템에서의 기능성 도메인 또는 단백질의 활성을 감소시키는 것에 대한 언급은, 이러한 도메인 또는 단백질을 함유하는 (또는 도메인 또는 단백질이 도입될) 생물체에서 상기 도메인 또는 단백질의 기능성 감소를 나타내며, 감소된 활성의 도메인 또는 단백질, 억제 또는 분해가 증가된 도메인 또는 단백질, 및 발현이 감소 또는 제거된 도메인 또는 단백질을 포함하는 임의의 유전적 개질을 지칭한다. 예를 들어, 본 발명의 도메인 또는 단백질의 작용은 상기 도메인 또는 단백질의 제조를 차단 또는 감소시키거나, 도메인 또는 단백질을 코딩하는 유전자 또는 그의 일부를 "녹아웃시키거나," 도메인 또는 단백질 활성을 감소시키거나, 또는 도메인 또는 단백질 활성을 억제함으로써 감소시킬 수 있다. 도메인 또는 단백질의 제조를 차단하거나 감소시키는 것은 상기 도메인 또는 단백질을 코딩하는 유전자를, 배양 배지 중 유도성 화합물의 존재를 필요로 하는 프로모터의 조절하에 놓는 것을 포함할 수 있다. 인듀서가 배지로부터 고갈되도록 하는 조건을 확립함으로써, 상기 도메인 또는 단백질을 코딩하는 유전자의 발현 (따라서, 단백질 합성의 발현)을 종료시킬 수 있다. 본 발명자들은 실시예 부분에서 트라우스토키트리드 미생물내의 표적화된 유전자들을 결실 (녹아웃)시키는 능력을 입증한다. 상기 도메인 또는 단백질의 활성을 차단하거나 감소시키는 것은 또한 본원에 참고로 도입되는 미국 특허 제4,743,546호에 기재된 것과 유사한 제거(excision) 기술 방법을 이용하는 것을 포함할 수 있다. 이러한 방법을 이용하기 위해, 대상 단백질을 코딩하는 유전자를 게놈으로부터 유전자가 특이적으로 조절 제거될 수 있도록 하는 특이적 유전자 서열들 사이에 클로닝한다. 예를 들어 미국 특허 제4,743,546호에서와 같은 배양물의 배양 온도의 변화에 의해 또는 일부 다른 물리적 또는 영양적인 신호에 의해 절단을 촉진시킬 수 있다.
유전적으로
개질된
미생물
본원에 사용된 바와 같이, 유전적으로 개질된 미생물로는 유전적으로 개질된 세균, 원생생물, 미세조류, 조류, 진균, 또는 다른 미생물을 들 수 있다. 상기 유전적으로 개질된 미생물은 원하는 결과가 달성되게끔 정상 (즉, 야생형 또는 천연 발생) 형태로부터 개질된 (즉, 돌연변이되거나 또는 변화된) 게놈을 갖는다 (즉, 증가 또는 변화된 PUFA PKS 활성 및/또는 PUFA PKS 시스템을 이용한 원하는 생성물의 제조 및 축적). 미생물의 유전적 개질은 전형적인 균주 개발 및/또는 분자 유전적 기술을 이용해서 달성할 수 있다. 이러한 기술은 당업계에 공지되어 있으며, 일반적으로는 예를 들어 문헌 [Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press]의 미생물에 대하여 개시되어 있다. 문헌 [Sambrook et al., 동일 문헌]은 그의 전체 개시내용이 본원에 참고로 도입된다. 유전적으로 개질된 미생물은 미생물 내에 원하는 효과를 제공하는 방식으로 핵산 분자가 삽입, 결실 또는 개질 (즉, 예를 들어 뉴클레오티드의 삽입, 결실, 치환 및/또는 역위(inversion))된 미생물을 포함할 수 있다.
유전적 개질을 위한 적합한 숙주 미생물의 예로는 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 사카로마이세스 카를스베르겐시스(Saccharomyces carlsbergensis)를 비롯한 효모, 또는 칸디다(Candida), 클루이베로마이세스(Kluyveromyces)와 같은 다른 효모, 또는 다른 진균, 예를 들어 섬유상 진균, 예컨대 아스페르길루스(Aspergillus), 뉴로스포라(Neurospora), 페니실리움(Penicillium) 등을 들 수 있다. 세균성 세포가 또한 숙주로 사용될 수 있다. 이들의 예로는 발효 프로세스에서 유용할 수 있는 에세리키아 콜라이(Escherichia coli)를 들 수 있지만 이에 한정되지 않는다. 또는, 단지 예를 들자면, 락토바실러스(Lactobacillus) 종 또는 바실러스(Bacillus) 종과 같은 숙주를 숙주로 사용할 수 있다.
본 발명에 사용하기 위한 다른 숙주는 트라우스토키트리아세애(Thraustochytriaceae) 내의 트라우스토키트리움, 야포노키트리움(Japonochytrium), 아플라노키트리움(Aplanochytrium), 엘리나(Elina) 및 쉬조키트리움, 및 라비린툴라세애(Labyrinthulaceae) 내의 라비린툴라(Labyrinthula), 라비린툴로이데스(Labyrinthuloides), 및 라비린토믹사(Labyrinthomyxa)를 포함하지만 이에 한정되지 않는 속으로부터의 미생물을 포함한다. 이러한 속 내의 바람직한 종으로는 하기 기재된 임의의 종을 들 수 있지만 이에 한정되지 않는다. 특히 바람직한 트라우스토키트리알레스 균주로는 쉬조키트리움 종 (S31)(ATCC 20888); 쉬조키트리움 종 (S8)(ATCC 20889); 쉬조키트리움 종 (LC-RM)(ATCC 18915); 쉬조키트리움 종 (SR21); 쉬조키트리움 종 N230D, 쉬조키트리움 아그레가툼(Schizochytrium aggregatum)(Goldstein et Belsky)(ATCC 28209); 쉬조키트리움 리마시눔(Schizochytrium limacinum)(Honda et Yokochi)(IFO 32693); 트라우스토키트리움 종 (23B)(ATCC 20891); 트라우스토키트리움 스트리아툼(Schizochytrium striatum)(Schneider)(ATCC 24473); 트라우스토키트리움 아우레움(Thraustochytrium aureum)(Goldstein)(ATCC 34304); 트라우스토키트리움 로세움(Thraustochytrium roseum)(Goldstein)(ATCC 28210); 및 야포노키트리움(Japonochytrium) 종 (L1)(ATCC 28207)을 들 수 있지만 이에 한정되지 않는다.
본 발명에 따라, "트라우스토키트리드"라는 용어는 트라우스토키트리아세애 과(family)를 포함하는 트라우스토키트리알레스 목(order)의 임의의 구성원을 지칭하며, "라비린툴리드"라는 용어는 라비린툴라세애(Labyrinthulaceae) 과를 포함하는 라비린툴라레스(Labyrinthulales) 목의 임의의 구성원을 포함한다. 라비린툴라세애 과의 구성원은 한때 트라우스토키트리알레스 목의 구성원인 것으로 고려되었지만, 이 생물체의 분류에 대한 보다 최근의 개정에서는 상기 과가 라비린툴라레스 목의 구성원인 것으로 고려되며, 라비린툴라레스와 트라우스토키트리알레스는 둘 다 라비린툴로미코타(Labyrinthulomycota) 문(phylum)의 구성원인 것으로 고려된다. 이 분야의 발전에 따라 트라우스토키트리드 및 라비린툴리드의 분류는 빈번하게 개정되어 왔다. 그러나, 분류 이론가들은 이러한 두가지 미생물 군을 조류 또는 조류-유사 원생생물과 함께 스트라메노필(Stramenopile) 계보내에 위치시킨다. 트라우스토키트리드 및 라비린툴리드의 현재의 분류학적 위치는 다음과 같이 요약될 수 있다:
계(Realm): 스트라메노필라(Stramenopila) (크로미스타(Chromista))
문(Phylum): 라비린툴로미코타
강(Class): 라비린툴로미세테스(Labyrinthulomycetes)
목: 라비린툴라레스
과: 라비린툴라세애
목: 트라우스토키트리알레스
과: 트라우스토키트리아세애
그러나, 잔존하는 분류학적 불확실성으로 인해, 본 발명에 있어서는 본 발명에서 트라우스토키트리드로서 기재된 균주들이 하기 생물체들을 포함하도록 하는 것이 최선책일 것이다: 목: 트라우스토키트리알레스; 과: 트라우스토키트리아세애; 속: 트라우스토키트리움 (종(Species): 종(sp.), 아루디멘탈(arudimentale ), 아우레움(aureum), 벤티콜라(benthicola), 글로보섬(globosum), 키네이(kinnei), 모티붐(motivum), 멀티루디멘탈(multirudimentale), 파키데르뭄(pachydermum), 프롤리페룸(proliferum), 로세움(roseum), 스트리아툼(striatum)), 울케니아 (종(Species): 종(sp.), 아모에보이데아(amoeboidea), 케르구엘렌시스(kerguelensis), 미누타(minuta), 프로펀다(profunda), 라디아타(radiata), 사일렌스(sailens), 사르카리아나(sarkariana), 쉬조키트롭스(schizochytrops), 비수르겐시스(visurgensis), 요르켄시스(yorkensis)), 쉬조키트리움 (종(Species): 종(sp.), 아그레가툼(aggregatum), 림나세움(limnaceum), 만그로베이(mangrovei), 미누툼(minutum), 옥토스포룸(octosporum)), 야포노키트리움(Japonochytrium) (종(Species): 종(sp.), 마리눔(marinum)), 아플라노키트리움(Aplanochytrium) (종(Species): 종(sp.), 할리오티디스(haliotidis), 케르구엘렌시스(kerguelensis), 프로펀다(profunda), 스토키노이(stocchinoi)), 알토르니아(Althornia) (종(Species): 종(sp.), 크로우키(crouchii)), 또는 엘리나(Elina) (종(Species): 종(sp.), 마리살바(marisalba), 시노리피카(sinorifica)). 울케니아 속에 대한 최초의 기술은 논문 심사를 거친 저널에는 공개되지 않았으며 그래서 이 속 및 그 내부에 위치하는 종의 유효성에 대해 여전히 의문의 여지가 남아 있다는 것을 유의한다. 본 발명에 있어서, 울케니아 내에 속하는 것으로 기재된 종은 트라우스토키트리움 속의 구성원인 것으로 고려될 것이다.
본 발명에서 라비린툴리드로서 기재된 균주는 하기 생물체들을 포함한다: 목: 라비린툴라레스, 과: 라비린툴라세애, 속: 라비린툴라 (종(Species): 종(sp.), 알게리엔시스(algeriensis), 코에노시스티스(coenocystis), 카토니(chattonii), 마크로시스티스(macrocystis), 마크로시스티스 아틀란티카(macrocystis atlantica), 마크로시스티스 마크로시스티스(macrocystis macrocystis), 마리나(marina), 미누타(minuta), 로스코펜시스(roscoffensis), 발카노비(valkanovii), 비텔리나(vitellina), 비텔리나 파시피카(vitellina pacifica), 비텔리나 비텔리나(vitellina vitellina), 조프피(zopfii)), 라비린툴로이데스(Labyrinthuloides) (종(Species): 종(sp.), 할리오티디스(haliotidis), 요르켄시스(yorkensis)), 라비린토믹사(Labyrinthomyxa) (종(Species): 종(sp.), 마리나(marina)), 디플로프리스(Diplophrys) (종(Species): 종(sp.), 아르케리(archeri)), 피르호소루스(Pyrrhosorus) (종(Species): 종(sp.), 마리누스(marinus)), 소로디플로프리스(Sorodiplophrys) (종(Species): 종(sp.), 스테르코레아(stercorea)) 또는 클라미도믹사(Chlamydomyxa) (종(Species): 종(sp.), 라비린툴로이데스(labyrinthuloides), 몬타나(montana)) (그렇지만, 현재 피르호소루스, 소로디플로프리스 또는 클라미도믹사의 정확한 분류학적 위치는 일치하지 않고 있다).
본 발명의 한 실시양태에서, 미생물의 내생성 PUFA PKS 시스템 및/또는 내생성 PUFA PKS 부속 단백질 (예, ACoAS)은 예를 들어 전형적인 돌연변이유발 및 선별 기술 및/또는 분자 유전적 기술 (유전 공학 기술 포함)에 의해 유전적으로 개질된다. 유전 공학 기술은 예를 들어 표적화 재조합 벡터를 사용해서 내생성 유전자의 일부를 결실시키거나 또는 내생성 유전자의 일부를 이종 서열로 대체하는 것을 포함할 수 있다. 숙주 게놈으로 도입될 수 있는 이종 서열의 예로는 다른 PKS 시스템으로부터의 하나 이상의 기능적 PUFA PKS 도메인 또는 단백질 또는 심지어 전체 PUFA PKS 시스템 (예, PUFA PKS 시스템과 관련된 모든 유전자들)을 코딩하는 서열을 들 수 있다. 이종 서열은 또한 PUFA PKS 시스템으로부터의 천연 도메인의 개질된 기능성 도메인 (상동체)를 코딩하는 서열을 포함할 수 있다. 숙주 게놈으로 도입될 수 있는 다른 이종 서열로는 내생성 PUFA PKS 시스템의 활성에 영향을주는 단백질, 예를 들면 본원에 개시된 부속 단백질을 코딩하는 핵산 분자를 들 수 있다. 예를 들어, 당업자라면 ACoAS, 특히 PUFA PKS 시스템과 함께 작용하는 내생성 ACoAS과 비교해서 숙주에서 PUFA의 제조 및/또는 축적을 증진시키는 ACoAS를 코딩하는 핵산 분자를 숙주 게놈으로 도입할 수 있을 것이다.
유전적으로
개질된
식물
본 발명의 다른 실시양태는 본원에 기재된 바와 같은 PPTase를 비롯한 PUFA PKS 시스템을 재조합적으로 발현시키도록 유전적으로 개질되었으며, 숙주에 의한 PUFA (또는 PUFA PKS 시스템의 다른 생활성 생성물)의 제조 및/또는 축적을 향상시키기 위한 본원에 기재된 바와 같은 부속 단백질을 발현시키고/시키거나 PUFA PKS 시스템과 경쟁하는 경로를 억제 (예, FAS 시스템을 억제)하도록 추가로 유전적으로 개질된 것인 유전적으로 개질된 식물에 관한 것이다. 바람직하게는, 이러한 부속 단백질은 PL 또는 TAG (예, GPAT, LFAAT, 또는 DAGAT)를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 단백질 및/또는 ACoAS이다.
본원에 사용된 바와 같이, 유전적으로 개질된 식물은 고등 식물, 특히 본 발명의 생활성 분자 (예, PUFA)를 제조하는데 유용한 임의의 소비가능한 식물 또는 식물들을 비롯한 임의의 유전적으로 개질된 식물을 포함할 수 있다. "식물 부분"은, 본원에 사용된 바와 같이, 종자 (성숙 종자 및 미성숙 종자 포함), 화분, 배아, 꽃, 과실, 새싹, 잎, 뿌리, 줄기, 이식체 등을 포함하지만 이에 한정되지 않는 식물의 임의의 일부를 포함한다. 유전적으로 개질된 식물은 목적하는 결과 (즉, 증가 또는 변경된 PUFA PKS 활성 및/또는 PUFA PKS 시스템을 이용한 목적 생성물의 제조 및/또는 축적)가 달성되도록 정상 (즉, 야생형 또는 천연 발생) 형태로부터 개질된 (즉, 돌연변이되거나 변화된) 게놈을 갖는다. 식물의 유전적 개질은 전형적인 균주 개발 및/또는 분자 유전적 기술을 이용해서 달성할 수 있다. 목적하는 아미노산 서열을 코딩하는 재조합 핵산 분자가 게놈내로 도입된 트랜스제닉 식물을 생성시키는 방법은 당업계에 공지되어 있다. 본 발명에 따라 유전적으로 개질시키는데 바람직한 식물은 바람직하게는 인간을 비롯한 동물이 소비하기에 적합한 식물이다.
본 발명에 따라 유전적으로 개질시키는데 바람직한 식물 (즉, 식물 숙주 세포)로는 쌍자엽 및 단자엽 식물을 비롯한 임의의 고등 식물, 특히 작물 식물을 비롯한 소비가능한 식물, 보다 특히는 오일용으로 사용되는 식물을 들 수 있지만 이에 한정되지 않는다. 이러한 식물로는 예를 들어 다음과 같은 것들이 포함될 수 있지만 이에 한정되지 않는다: 카놀라, 대두, 평지씨, 아마인, 옥수수, 잇꽃, 해바라기 및 담배. 따라서, 임의의 식물 종 또는 식물 세포를 선택할 수 있다. 본원에 사용된 특정 세포 및 그로부터 성장 또는 유래된 식물로는 카놀라 (Brassica rapa L.); 대두 (Glycine max); 평지씨 (Brassica spp .); 아마인/아마 (Linum usitatissimum); 옥수수 (corn) (Zea mays); 잇꽃 (Carthamus tinctorius); 해바라기 (Helianthus annuus); 담배 (Nicotiana tabacum); 아라비돕시스 탈리아나 (Arabidopsis thaliana), 브라질 견과 (Betholettia excelsa); 아주까리 종자 (Riccinus communis); 코코넛 (Cocus nucifera); 고수풀 (Coriandrum sativum); 면화 (Gossypium spp .); 땅콩 (Arachis hypogaea); 호호바 (Simmondsia chinensis); 머스타드 (Brassica spp . 및 Sinapis alba); 야자유 (Elaeis guineeis); 올리브 (Olea eurpaea); 벼 (Oryza sativa); 스쿼시 (Cucurbita maxima); 보리 (Hordeum vulgare); 밀 (Traeticum aestivum); 및 좀개구리밥 (Lemnaceae sp .)으로부터 얻을 수 있는 세포를 들 수 있지만 이에 한정되지 않는다. 이와 함께 식물 종 내부의 유전적 배경이 달라질 수 있음을 유의해야 한다.
특히 바람직한 특징, 예를 들어 질병 내성, 식물 형질전환 용이성, 오일 함량 또는 프로필 등에 대해 최적화된, 상기 식물로부터의 식물 세포주를 본원에 따라 제조, 선별 또는 확인할 수 있다. 바람직한 식물 세포주는 식물 브리딩에 의해 또는 마커 보조 브리딩 및 틸링과 같은 방법에 의해 선별할 수 있다. 본원에 언급된 부속 단백질, 표적화된 경로 억제, 및/또는 PUFA PKS 시스템 (PUFA 신타제)에 대해 조절된 활성을 나타내는 식물 세포주가 특히 유용하다는 것을 유의해야 한다.
추가의 실시양태에서 식물 세포 배양물은 본원에 따라 사용할 수 있다. 이러한 실시양태에서, 식물 세포는 통상의 농업 실무를 이용해서는 분화된 식물로 성장 및 재배되지 않으며, 대신 액상 배지 중에서 성장 및 유지시킨다.
다른 바람직한 식물로는 제약 제제, 향미제, 건강식 제제, 기능성 식품 성분 또는 화장용 활성제로서 사용되는 화합물을 제조하는 것으로 알려진 식물 또는 이들 화합물/물질들을 제조하도록 유전적으로 조작된 식물을 들 수 있다.
상기 논의된 바와 같이, 본 발명의 PUFA PKS 신타제는 FAS 시스템의 지방산 생성물을 이용하지 않는다. 대신, 상기 신타제는 FAS 및 엘론가제 (말로닐-CoA)에 의해 이용되는 동일한 작은 전구체 분자로부터 최종 PUFA 생성물 (주요 PUFA 생성물)을 제조한다. 따라서, 합성 사이클에서의 중간체는 임의의 유의한 양으로 방출되지 않으며, PUFA 생성물 (본원에서 주요 PUFA 생성물이라고도 지칭함)은 인지질 (PL) 및 이 지질의 트리아실글리세롤 (TAG) 분획으로 효율적으로 전달된다. 실제로, PUFA PKS 시스템은 두가지 표적 또는 주요 PUFA 생성물을 제조할 수 있지만 (예를 들어, 쉬조키트리움 유래의 PUFA PKS 시스템은 주요 생성물로서 DHA 및 DPAn-6을 둘 다 제조함), DPA는 DHA를 제조하는 경로에서 중간체가 아니다. 오히려, 각각은 동일한 PUFA PKS 시스템의 별도의 생성물이다. 따라서, PUFA PKS 유전자들은 식물과 같은 이종 숙주에서 PUFA, 특히 장쇄 PUFA (LCPUFA)를 함유하는 오일을 제조하는 훌륭한 수단이며, 상기 오일은 "표준" PUFA 경로 (하기에서도 정의됨)에 의해 제조된 오일을 오염시키는 부(side) 생성물 및 중간체를 실질적으로 함유하지 않는다 (하기에서 정의됨).
따라서, 본 발명의 목적은 본원에 기재된 바와 같은 식물의 유전적 조작을 통해 원하는 수의 이중 결합을 갖는 목적하는 쇄 길이의 다불포화 지방산을 제조하고, 연장에 의해 이러한 식물로부터 얻어진 (즉, 이러한 식물의 오일 종자로부터 얻어진) PUFA를 포함하는 오일 및 오일 종자를 제조하는 것이다. 본 발명에 의해 제조될 수 있는 PUFA의 예로는 DHA (도코사헥사엔산 (C22:6, n-3)), ARA (에이코사테트라엔산 또는 아라키돈산 (C20:4, n-6)), DPA (도코사펜타엔산 (C22:5, n-6 또는 n-3)) 및 EPA (에이코사펜타엔산 (C20:5, n-3)), 및 이들의 임의의 조합을 들 수 있지만 이에 한정되지 않는다. 본 발명에 따르면, PUFA를 제조하는 폴리케티드 신타제-유사 시스템(본 발명자들에 의해 개발됨)을 사용함으로써 한가지 이상의 목적하는 (표적 또는 주요) PUFA 중 풍부화된 상업적으로 가치있는 지질을 제조할 수 있다.
본 발명에 따라, "주요 PUFA", "표적 PUFA", "의도된 PUFA", 또는 "목적하는 PUFA"에 대한 언급는 PUFA(들)을 제조하는데 사용되는 효소 경로의 의도된 또는 표적화된 생성물인 특정 PUFA 또는 PUFA들을 지칭한다. 예를 들어, 엘론가제 및 데새투라제를 사용해서 FAS 시스템의 생성물을 개질시키는 경우, 당업자라면 함께 사용하는 경우에 표적 또는 목적하는 PUFA (예, DHA 또는 EPA)를 제조하는 엘론가제 및 데새투라제의 특정 조합을 선별할 수 있다. 상기 논의된 바와 같이, 표준 경로에 의해 제조된 이러한 표적 또는 목적하는 PUFA는, 이 시스템에 의해 제조된 생성물의 대부분을 실제로 나타낼 수 있는 부 생성물 및 중간체의 형성으로 인해, 상기 시스템에 의해 제조된 총 지방산의 비율로는 PUFA의 양 측면에서 사실상 "주요" PUFA가 아닐 수 있다. 그러나, 당업자라면 상기 시스템에서 사용된 엘론가제 또는 데새투라제에 의해 제조되는 표적 또는 의도된 PUFA 생성물을 지칭하는 경우에도 "주요 PUFA"라는 용어를 사용할 수 있다.
본 발명에서 바람직한 것으로 PUFA PKS 시스템을 사용하는 경우, 특정 생물체로부터 유래된 주어진 PUFA PKS 시스템에 의해 특정 PUFA(들)이 제조될 것이며, 그 결과 특정 생물체로부터 PUFA PKS 시스템의 선별로 특정의 표적 또는 주요 PUFA가 제조될 것이다. 예를 들어, 쉬조키트리움 유래의 PUFA PKS 시스템의 사용에 의해 표적 또는 주요 PUFA로서 DHA 및 DPAn-6이 제조될 것이다. 한편, 다양한 쉬바넬라 종 유래의 PUFA PKS 시스템의 사용에 의해 표적 또는 주요 PUFA로서 EPA가 제조될 것이다. 주요 또는 표적 PUFA의 비율은 특정 PUFA PKS 시스템의 선택 및 이 시스템이 그가 발현되는 특정 조건에 대해 반응하는 방식에 따라 차이가 있을 수 있음을 유의한다. 예를 들어, 트라우스토키트리움 23B (ATCC 번호 20892) 유래의 PUFA PKS 시스템의 사용에 의해 표적 또는 주요 PUFA로서 DHA 및 DPAn-6이 제조될 것이다. 그러나, 트라우스토키트리움 23B의 경우에는 DHA 대 DPAn-6의 비율이 약 10:1이지만 (약 8:1 내지 약 40:1의 범위일 수 있음), 쉬조키트리움에서는 상기 비율이 전형적으로 약 2.5:1이다. 따라서, 표적 PUFA가 동일한 경우에도, 트라우스토키트리움 PUFA PKS 시스템 또는 단백질 또는 도메인을 사용하면 쉬조키트리움에 비해 생물체에 의해 제조되는 PUFA의 비율을 변화시킬 수 있다. 또한, 하기 논의된 바와 같이, 당업자라면 여러 PUFA PKS 시스템 또는 PUFA PKS 및 PKS 시스템으로부터의 단백질 및 도메인을 상호혼합함으로써 주어진 PUFA PKS 시스템을 개질시킬 수 있거나 또는 주어진 PUFA PKS 시스템의 도메인 또는 단백질을 개질시켜 표적 PUFA 생성물 및/또는 비율을 변화시킬 수 있다.
본 발명에 따라, PUFA를 제조하는 효소 시스템의 "중간체 생성물" 또는 "부 생성물"에 대한 언급은 이 시스템의 표적 또는 주요 PUFA(들)의 제조 결과로서 효소 시스템에 의해 제조되지만 주요 또는 표적 PUFA(들)은 아닌 임의의 생성물, 특히 지방산 생성물을 지칭한다. 한 실시양태에서, 중간체 및 부 생성물은, 야생형 식물에 의해 또는 지시된 유전적 개질에 대한 수령자(recipient)로서 사용된 모체 식물에 의해 천연적으로 제조되지만 유전적 개질의 결과로 야생형 식물에 의해 또는 지시된 유전적 개질에 대한 수령자로서 사용된 모체 식물에 의해 제조되는 수준에 비해 더 높은 수준으로 제조되기 때문에 중간체 또는 부 생성물로서 분류되는 비-표적 지방산을 포함할 수 있다. 상기 논의된 바와 같이, 중간체 및 부 생성물은 PUFA 합성을 위한 표준 경로에서 특히 중요하지만 PUFA PKS 경로에서는 사실상 덜 중요하다. 하나의 효소 시스템의 주요 또는 표적 PUFA는 주요 또는 표적 생성물이 상이한 PUFA인 경우에 상이한 효소 시스템의 중간체일 수 있으며, 이는 PUFA PKS 시스템에서 중간체가 실질적으로 생성되지 않기 때문에 PUFA 제조를 위한 표준 경로의 생성물의 경우에 특히 그러하다는 것을 유의한다. 예를 들어, 표준 경로를 이용해서 EPA를 제조하는 경우, 지방산, 예를 들면 GLA, DGLA 및 SDA는 중간체 생성물로서 유의한 양으로 제조된다 (예를 들어, 미국 특허 출원 공개 제2004/0172682호는 이러한 점을 예시한다). 유사하게는 미국 특허 출원 공개 제2004/0172682호에도 예시된 바와 같이, 표준 경로를 이용해서 DHA를 제조하는 경우, 상기 언급한 지방산 이외에, ETA 및 EPA (특히, 상기 첫번째 예의 표적 PUFA임)가 유의한 양으로 제조되며, 실제로는 표적 PUFA 자체보다 총 지방산 생성물에 대해 상당히 더 많은 양으로 존재할 수 있다. 후자의 사실은 미국 특허 출원 공개 제2004/0172682호에서도 밝히고 있으며, 여기서 표준 경로에 의해 DHA를 제조하도록 조작된 식물은 표적화된 DHA보다 총 지방산의 비율로서 더 많은 EPA를 제조하는 것으로 되어 있다.
한가지 이상의 목적하는 다불포화 지방산을 상당히 높은 수율로 제조하기 위해, 식물을 유전적으로 개질시켜 식물에 PUFA PKS 시스템을 도입할 수 있다. 식물은 PUFA PKS 시스템을 내생적으로 함유하지 않는 것으로 알려져 있으며, 따라서 본 발명의 PUFA PKS 시스템은 특이적인 지방산 제조 능력을 갖는 식물을 제조하는 기회를 제공한다. 본 발명의 특히 바람직한 실시양태는 동일 식물에서 EPA, DHA, DPA (n3 또는 n6), ARA, GLA, SDA 등 (이들의 임의의 조합 포함)을 비롯한 한가지 이상의 PUFA를 제조하도록 유전적으로 조작된 식물에 관한 것이다. 본 발명은 다수의 "디자이너(designer) 오일" 중 어느 하나를 다양한 비율 및 형태로 생성시키는 능력을 부여한다. 게다가, 본원에 기재된 특정 해양 생물체 유래의 PUFA PKS 유전자들의 개시내용은 PUFA 제조 범위를 보다 용이하게 확장시켜 대부분의 작물 식물을 성장시키는데 사용되는 온도 범위내에서 상기 PUFA를 성공적으로 제조하도록 하는 기회를 부여한다.
따라서, 본 발명의 한 실시양태는 본원에 기재된 바와 같은 코어 PUFA PKS 효소 복합체 및 PPTase를 포함하며, 숙주에 의한 PUFA (또는 PUFA PKS 시스템의 다른 생활성 생성물)의 제조 및/또는 축적을 향상시키기 위한 본원에 기재된 바와 같은 부속 단백질을 발현시키도록 추가로 유전적으로 개질되고/되거나 본원에 기재된 바와 같은 PUFA PKS 시스템과 경쟁하는 경로를 억제 (예를 들어, FAS 시스템을 억제)하도록 유전적으로 개질된 것인 유전적으로 개질된 식물 또는 식물의 일부 (예를 들어, 본원에 기재된 바와 같은 PUFA PKS 시스템을 발현시키도록 유전적으로 개질된 식물)에 관한 것이다. 바람직하게는, 이러한 부속 단백질은 식물이 PUFA를 제조하도록 PL 또는 TAG (예, GPAT, LFAAT, 또는 DAGAT)를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 단백질 및/또는 ACoAS이다.
바람직하게는, 이러한 추가의 유전적 개질은 말로닐-CoA 푸울(들)에 대한 경쟁을 감소시킴으로써 PUFA 신타제 경로를 통한 흐름을 증가시키는 (천연 발생, 선별된, 또는 합성된) 임의의 조합이다. 상기 기질과 경쟁하는 능력을 증진시키기 위한 가능한 방법이 다수 존재한다. 이러한 방법으로는 1) FAS 경로에서의 임의의 요소의 억제를 비롯한 경쟁 경로를, 예를 들어 상기 경로에 관여하는 효소 또는 서브유닛의 발현 수준을 감소시킴으로써 억제하는 방법 (예를 들어, 안티센스 RNA, RNAi, 공동억제 또는 돌연변이를 이용함), 2) 경쟁 경로가 감소 또는 차단된 이종 숙주 (예를 들어, 세포질에서 지방산을 연장시키는 능력이 차단된 카놀라)에서 PUFA 신타제를 발현시키는 방법, 및/또는 3) (예를 들어, 아세틸-CoA 카르복실라제의 발현에 의해) 말로닐-CoA의 푸울을 증가시키는 방법을 들 수 있지만 이에 한정되지 않는다. 한 실시양태에서, KASII 및/또는 KASIII은 (예를 들어, RNAi 또는 안티센스에 의해) 식물에서 억제된다.
상기 언급된 바와 같이, 본 발명에 유용한 유전적으로 개질된 식물은 PUFA PKS 시스템을 발현시키도록 유전적으로 개질된 것이다. PUFA PKS 시스템은 예를 들어 미국 특허 제6,566,583호; 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 미국 특허 출원 공개 제20050100995호; 및 PCT 공개 제WO 2006/135866호에 기재된 임의의 PUFA PKS 시스템과 같은 임의의 PUFA PKS 시스템을 포함할 수 있다. PUFA PKS 시스템은 상기 특허 및 특허 간행물들에서 확인 및 특성화된 특정 PUFA PKS 시스템들 중 어떤 것, 예를 들면 쉬조키트리움 종 아메리칸 타입 컬쳐 콜렉션 (ATCC) 번호 20888 및 그로부터 유래된 돌연변이체 균주 (예, 균주 N230D); 트라우스토키트리움 23B ATCC 번호 20892 및 그로부터 유래된 돌연변이체 균주; 쉬바넬라 올레야나(Shewanella olleyana) 오스트랠리언 콜렉션 오브 앤타크틱 마이크로오르가니즘스 (Australian Collection of Antarctic Microorganism; ACAM) 균주 번호 644 및 그로부터 유래된 돌연변이체 균주; 또는 쉬바넬라 야포니카 ATCC 균주 번호 BAA-316 및 그로부터 유래된 돌연변이체 균주 유래의 PUFA PKS 시스템으로부터 선택될 수 있지만 이에 한정되지 않는다.
한 실시양태에서, PUFA PKS 시스템은 조합 (혼합 및 대응)에 의해 상기 논의된 바와 같은 최소 요건을 충족시키는 완전한 PUFA PKS 시스템을 형성시키는, 상기 PUFA PKS 시스템 중 어떤 것으로부터 얻어진 도메인들을 포함한다. 또한, 식물은 제I형 PKS 시스템 (반복적 또는 모듈성), 제II형 PKS 시스템, 및/또는 제III형 PKS 시스템을 포함하지만 이에 한정되지 않는 다른 PKS 시스템의 하나 이상의 도메인 또는 그의 생물학적 활성 단편으로 추가로 개질시킬 수 있으며, 이는 PUFA PKS 시스템내의 어떤 도메인을 대체할 수 있다. 마지막으로, PUFA PKS 시스템의 도메인 중 어떤 도메인은 그의 천연 구조를 개질시켜 PUFA PKS 시스템내의 상기 도메인의 기능을 변경 또는 개질시킬 수 있다 (예를 들어, 상기 시스템에 의해 제조된 PUFA 유형 또는 그의 비율을 변화시킬 수 있음). 이와 같이 도메인을 혼합해서 키메라 PUFA PKS 단백질을 제조하는 것은 상기 언급된 특허 및 특허 간행물들에 기재되어 있다.
바람직하게는, 상기 확인된 특징들 중 어느 것을 갖는 식물은 본원에 상세히 기재된 바와 같은 PUFA PKS 시스템 (PUFA 신타제)를 발현시키도록 유전적으로 개질된 식물이다 (즉, PUFA PKS 시스템은 식물에서 표적 PUFA(들)을 제조하는 효소 시스템임). 한 실시양태에서, 식물은 쉬조키트리움, 트라우스토키트리움, 울케니아, 야포노키트리움, 아플라노키트리움, 알토르니아 또는 엘리나를 포함하지만 이에 한정되지 않는 트라우스토키트리드 유래의 PUFA PKS 단백질/도메인으로 구성된 PUFA PKS 시스템을 발현시키도록 유전적으로 개질되었다. 한 실시양태에서, 식물은 라브린툴리드(labrynthulid) 유래의 PUFA PKS 단백질/도메인로 구성된 PUFA PKS 시스템을 발현시키도록 유전적으로 개질되었다. 다른 실시양태에서, 식물은 쉬바넬라 야포니카 또는 쉬바넬라 올레야나를 포함하지만 이에 한정되지 않는 해양 세균 유래의 PUFA PKS 단백질/도메인으로 이루어진 PUFA PKS 시스템을 발현시키도록 유전적으로 개질되었다. 한 실시양태에서, 식물은 상기 기재된 바와 같은 쉬조키트리움 OrfA, B 및 C (이들의 상동체 또는 합성 형태를 포함함), 및 PPTase (예, HetI)로 이루어진 PUFA PKS 시스템을 발현시키도록 유전적으로 개질되었다 (예를 들어, 서열 1-32 및 서열 33, 및 상기 쉬조키트리움 PUFA PKS 시스템에 대한 논의를 참조한다). 다른 실시양태에서, 식물은 상기 기재된 바와 같은 트라우스토키트리움 OrfA, B 및 C (이들의 상동체 또는 합성 형태를 포함함), 및 PPTase (예, HetI)로 이루어진 PUFA PKS 시스템을 발현시키도록 유전적으로 개질되었다 (예를 들어, 서열 38-68 및 서열 33, 및 상기 트라우스토키트리움 PUFA PKS 시스템에 대한 논의를 참조한다; 또한 미국 특허 출원 공개 제20050014231호를 참조한다). 다른 실시양태에서, 식물은 다른 트라우스토키트리드 OrfA, B 및 C (이들의 상동체 또는 합성 형태를 포함함), 및 PPTase (예, HetI)로 이루어진 PUFA PKS 시스템을 발현시키도록 유전적으로 개질되었다 (예를 들어, PCT 특허 공개 제WO 05/097982호를 참조한다). 다른 실시양태에서, 식물은 쉬바넬라와 같은 해양 세균 유래의 PUFA PKS Orf (이들의 상동체 또는 합성 형태를 포함함), 및 상기 기재된 바와 같은 PPTase (예, 내생성 쉬바넬라 PPTase)로 이루어진 PUFA PKS 시스템을 발현시키도록 유전적으로 개질되었다 (예를 들어, 쉬바넬라 야포니카에 대한 서열 1-6, 및 쉬바넬라 올레야나에 대한 서열 7-12를 참조한다). 다른 실시양태에서, 식물은 상기 PUFA PKS 시스템 (예, 키메라 PUFA PKS 시스템) 유래의 도메인 및 단백질의 임의의 조합을 발현시키도록 유전적으로 개질되었다.
마지막으로, 상기 논의된 바와 같이, 식물의 유전적 개질은 코어 PUFA PKS 효소 복합체와 함께 작용해서 식물에 의한 PUFA 제조를 가능케하거나, 촉진시키거나 또는 증진시키는 한가지 이상의 부속 단백질의 도입, 및/또는 예를 들어 본원에 기재된 FAS 시스템의 임의의 억제에 의한 것과 같이 PUFA PKS 시스템을 통한 말로닐 CoA 기질의 흐름을 증대시키는 유전적 개질, 또는 상기 기재된 바와 같은 것과 동일한 결과를 달성하기 위한 다른 전략의 이용을 포함할 수 있다. 또한 식물의 유전적 개질은 바람직한 숙주 코돈 용법을 위한 유전자들의 최적화, 및 PUFA 신타제 효소의 특정 세포소기관 (예, 색소체)으로의 표적화를 포함할 수 있다.
바람직하게는, 식물은 오일 종자 식물이며, 오일 종자 및/또는 오일 종자 중의 오일은 PUFA PKS 시스템에 의해 제조된 PUFA를 함유한다. 이러한 오일은 PUFA PKS 시스템의 생성물인 검출가능한 양의 하나 이상의 표적 또는 주요 PUFA를 함유한다. 추가로, 이러한 오일은 표적 또는 주요 PUFA 생성물이 아니며 야생형 식물내의 내생성 FAS 시스템에 의해 천연적으로 제조되지 않는 중간체 또는 부 생성물을 실질적으로 함유하지 않는다 (즉, 야생형 식물은 FAS 시스템에 의해 짧은 길이 또는 중간 길이의 쇄를 갖는 일부 PUFA, 예를 들면 탄소수 18의 PUFA를 제조하지만, PUFA PKS 시스템을 이용한 유전적 개질의 결과로서 식물에서 신규 또는 추가의 지방산이 제조될 것임). 달리 말하면, 지시된 유전적 개질의 수령자로서 사용된 모체 식물 또는 야생형 식물 (유전적으로 개질되지 않음)로부터의 총 지방산의 프로필과 비교해서, PUFA PKS 시스템을 이용해서 유전적으로 개질시킨 식물에 의해 제조된 총 지방산의 프로필 중 대부분의 추가의 지방산 (유전적 개질으로부터 얻어진 증가된 지방산 또는 신규 지방산)은 PUFA PKS 시스템의 표적 또는 의도된 PUFA 생성물을 포함한다 (즉, 유전적으로 개질된 식물에 의해 제조되는 총 지방산 중 대부분의 추가의 또는 신규 지방산은 표적 PUFA(들)임).
또한, PUFA를 합성하기 위한 시스템의 중간체 또는 부 생성물을 "실질적으로 함유하지 않는" 것 또는 중간체 또는 부 생성물이 실질적인 양으로 존재하지 않는 것은, PUFA를 제조하기 위한 효소 시스템의 도입 또는 존재의 결과로서 유전적으로 개질된 식물 (및/또는 식물의 부분 및/또는 종자 오일 분획)에서 제조되는 (즉, 지시된 유전적 개질에 대한 수령자로서 사용되는 모체 식물 또는 야생형 식물에 의해 제조되지 않는) 임의의 중간체 또는 부 생성물 지방산 (비-표적 PUFA)이 식물에 의해 제조된 총 지방산의 약 10 중량% 미만, 더 바람직하게는 식물에 의해 제조된 총 지방산의 약 9 중량% 미만, 더 바람직하게는 약 8 중량% 미만, 더 바람직하게는 약 7 중량% 미만, 더 바람직하게는 약 6 중량% 미만, 더 바람직하게는 약 5 중량% 미만, 더 바람직하게는 약 4 중량% 미만, 더 바람직하게는 약 3 중량% 미만, 더 바람직하게는 약 2 중량% 미만, 더 바람직하게는 약 1 중량% 미만인 양으로 존재한다는 것을 의미한다.
바람직한 실시양태에서, PUFA를 합성하기 위한 시스템의 중간체 또는 부 생성물을 "실질적으로 함유하지 않는" 것 또는 중간체 또는 부 생성물이 실질적인 양으로 존재하지 않는 것은, PUFA를 제조하기 위한 효소 시스템의 결과로서 유전적으로 개질된 식물 (및/또는 식물의 부분 및/또는 종자 오일 분획)에 존재하는 임의의 중간체 또는 부 생성물 지방산이 식물에 의해 제조된 추가의 지방산 (추가의 지방산은 표적 PUFA의 제조를 위한 지시된 유전적 개질에 대한 수령자로서 사용되는 모체 식물 또는 야생형 식물에 의해 천연적으로 제조되지 않는 지방산 또는 지방산 수준으로 정의됨) 전체의 약 10 중량% 미만, 더 바람직하게는 식물에 의해 제조된 추가의 지방산 전체의 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1% 미만인 양으로 존재한다는 것을 의미한다. 따라서, 표준 경로에 의해 PUFA를 제조하도록 유전적으로 개질된 식물의 지방산 프로필과는 달리, PUFA PKS 시스템을 이용한 유전적 개질으로부터 생성된 대부분의 지방산 생성물은 표적 또는 의도된 지방산 생성물일 것이다.
PUFA PKS 시스템의 표적 생성물이 장쇄 PUFA, 예를 들면 DHA, DPA (n-6 또는 n-3), 또는 EPA인 경우, 그러한 PUFA PKS를 사용해서 유전적으로 개질된 식물의 총 지질 중에 실질적인 양으로 존재하지 않는 중간체 생성물 및 부 생성물은 감마-리놀렌산 (GLA; 18:3, n-6); 스테아리돈산 (STA 또는 SDA; 18:4, n-3); 디호모-감마-리놀렌산 (DGLA 또는 HGLA; 20:3, n-6), 아라키돈산 (ARA, C20:4, n-6); 에이코사트리엔산 (ETA; 20:3, n-9) 및 다양한 다른 중간체 또는 부 생성물, 예를 들면 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); 미드산(mead acid) (20:3; Δ5,8,11); 또는 20:4 (Δ5,1,14,17)를 포함할 수 있지만 이에 한정되지 않는다. 또한, 표적 생성물이 특정 PUFA, 예를 들면 DHA인 경우, 유전적으로 개질된 식물의 총 지질 중에 실질적인 양으로 존재하지 않는 중간체 생성물 및 부 생성물은 상기 예에서 EPA와 같은, PUFA PKS 시스템의 천연 생성물인 다른 PUFA를 비롯한 다른 PUFA를 포함한다. 본 발명의 PUFA PKS 시스템은 또한 원한다면 표적 PUFA로서 GLA, SDA 또는 DGLA를 포함할 수 있는 PUFA를 제조하는데 사용될 수 있음을 유의한다.
본원에 기재된 바와 같은 PUFA PKS 시스템의 도메인 구조 및 유전적 기초에 대한 지식을 이용해서, 본 발명자들은 상기 PUFA PKS 시스템을 코딩하는 구조물을 설계 및 제조하고, 이러한 PUFA PKS 시스템을 발현시키는 트랜스제닉 식물을 성공적으로 생성시켰다. 트랜스제닉 식물은 PUFA를 함유하는 오일을 제조하며, 오일은 표준 PUFA 경로에서 축적되는 중간체 생성물을 실질적으로 함유하지 않는다. 본 발명자들은 또한 트랜스제닉 식물의 생성에 앞서서 개념증명(proof-of-concept) 실험으로서 다른 진핵생물인 효모에서 상기 구조물을 사용해서 PUFA를 제조하는 것을 입증하였다. 상기 예는 표적 PUFA로서 DHA 및 DPAn-6을 제조하는 PUFA PKS 시스템을 사용해서 효모 및 식물을 형질전환시킴으로써 상기 PUFA의 둘 다가 식물에서는 총 지방산 중 주요 추가의 지방산으로서 (즉, 야생형 식물에서 제조되는 지방산은 제외함) 제조되고 효모에서도 제조되며, 추가로 야생형 식물 또는 모체 식물의 지방산 중에 존재하지 않는 임의의 다른 지방산은 사실상 검출가능하지 않다는 것을 입증한다. 본 발명의 유전적으로 개질된 식물 및 그의 부분 및 오일의 구체적인 특징은 하기에 상세히 기재되어 있다.
본 발명에 따라, 유전적으로 개질된 식물로는 전형적인 돌연변이유발 및 스크리닝 기술과 조합될 수 있는 재조합 기술을 이용해서 개질시킨 식물을 들 수 있다. 본원에 사용된 바와 같이, 유전자 발현, 유전자 기능 또는 유전자 생성물 (즉, 유전자에 의해 코딩된 단백질)의 기능에서의 감소를 일으키는 유전적 개질은 유전자의 불활성화 (완전한 또는 부분적인 불활성화), 결실, 중단, 차단 또는 하향조절로서 지칭될 수 있다. 예를 들어, 유전자에 의해 코딩된 단백질의 기능 감소를 일으키는 유전자의 유전적 개질은 유전자의 완전한 결실 (즉, 유전자는 존재하지 않으며, 따라서 단백질도 존재하지 않음), 단백질이 불완전하게 번역되거나 또는 전혀 번역되지 않는 (예를 들어, 단백질이 발현되지 않음) 유전자 돌연변이, 또는 단백질의 천연 기능을 감소시키거나 또는 폐지하는 유전자 돌연변이 (예를 들어, 효소 활성 또는 작용이 감소되거나 또는 전혀 존재하지 않는 단백질이 발현됨)의 결과일 수 있다. 유전자 발현 또는 기능의 증가를 나타내는 유전적 개질은 유전자의 증폭, 과제조, 과발현, 활성화, 증진, 부가 또는 상향조절로서 지칭될 수 있다.
본 발명에 따른 식물의 유전적 개질에 따라 이 식물에 의해 한가지 이상의 PUFA가 제조된다. 식물에 의해 제조된 PUFA의 비율 및 PUFA 프로필은 PUFA PKS 시스템이 유래된 생물체에 의해 제조된 PUFA의 비율 또는 PUFA 프로필과 반드시 동일하지는 않다.
유전적으로 개질된 식물의 제조에 있어서, 식물의 유전적 조작을 위한 방법은 또한 당업계에 잘 알려져 있다. 예를 들어, 쌍자엽 식물 및 단자엽 식물을 위한 생물학적 및 물리적 형질전환 프로토콜을 비롯한 다수의 식물 형질전환 방법이 개발되어 왔다 (예, 문헌 [Goto-Fumiyuki et al., 1999, Nature Biotech 17: 282-286]). 예를 들어, 문헌 [Miki et al., "Procedures for Introducing Foreign DNA into Plants" in Methods in Plant Molecular Biology and Biotechnology, Glick, B.R. and Thompson, J.E. Eds. (CRC Press, Inc., Boca Raton, 1993) pp. 67-88]을 참조한다. 또한, 식물 세포 또는 조직 형질전환 및 식물 재생을 위한 벡터 및 시험관내 배양 방법이 이용가능하다. 예를 들어, 문헌 [Gruber et al., "Vectors for Plant Transformation" in Methods in Plant Molecular Biology and Biotechnology, Glick, B.R. and Thompson, J.E. Eds. (CRC Press, Inc., Boca Raton, 1993) pp. 89-119]을 참조한다.
발현 벡터를 식물로 도입하기 위해 가장 널리 이용되는 방법은 아그로박테리움의 천연 형질전환 시스템을 기초로 한다. 예를 들어, 문헌 [Horsch et al., Science 227:1229 (1985)]을 참조한다. 에이. 투메파시엔스(A. tumefaciens) 및 에이. 리조게네스(A. rhizogenes)는 식물 세포를 유전적으로 형질전환시키는 식물 병원성 토양 세균이다. 에이. 투메파시엔스 및 에이. 리조게네스의 Ti 및 Ri 플라스미드는 각각 식물의 유전적 형질전환을 담당하는 유전자들을 보유한다. 예를 들어, 문헌 [Kado, C.I., Crit. Rev. Plant. Sci. 10:1 (1991)]을 참조한다. 아그로박테리움 벡터 시스템 및 아그로박테리움-매개된 유전자 전달 방법에 대한 설명은 문헌 [Gruber et al., 상기 문헌, Miki et al., 상기 문헌, Moloney et al., Plant Cell Reports 8:238 (1989)], 및 미국 특허 제4,940,838호 및 동 제5,464,763호를 비롯한 다수의 문헌들에 제시되어 있다.
일반적으로 적용가능한 다른 식물 형질전환 방법으로는 미세발사체(microprojectile)-매개된 형질전환이 있으며, 여기서 DNA는 미세발사체의 표면상에 보유된다. 식물 세포벽 및 세포막을 통과하기에 충분한 속도로 미세발사체를 가속시키는 바이오리스틱(biolistic) 장치를 사용해서 발현 벡터를 식물 조직내에 도입한다 [Sanford et al., Part. Sci. Technol. 5:27 (1987), Sanford, J.C., Trends Biotech. 6:299 (1988), Sanford, J.C., Physiol. Plant 79:206 (1990), Klein et al., Biotechnology 10:268 (1992)].
DNA를 식물로 물리적으로 전달하기 위한 다른 방법으로는 표적 세포의 초음파처리가 있다 [Zhang et al., Bio/Technology 9:996 (1991)]. 별법으로, 리포좀 또는 스페로플라스트(spheroplast) 융합을 이용해서 발현 벡터를 식물에 도입한다 [Deshayes et al., EMBO J., 4:2731 (1985), Christou et al., Proc Natl. Acad. Sci. USA 84:3962 (1987)]. CaCl2 침전, 폴리비닐 알콜 또는 폴리-L-오르니틴을 사용해서 DNA를 원형질체(protoplast)에 직접 수용시키는 것이 또한 보고되었다 [Hain et al., Mol. Gen. Genet. 199:161 (1985) and Draper et al., Plant Cell Physiol. 23:451 (1982)]. 원형질체 및 전체 세포 및 조직의 전기천공이 또한 기재되었다 [Donn et al., In Abstracts of VIIth International Congress on Plant Cell and Tissue Culture IAPTC, A2-38, p. 53 (1990); D'Halluin et al., Plant Cell 4:1495-1505 (1992) and Spencer et al., Plant Mol. Biol. 24:51-61 (1994)]. 추가로, 실리콘 카바이드 휘스커(whisker) [Kaepler et al., 1990, Plant Cell Reports] 및 예를 들어 플라워(flower) 침지 방법을 이용한 식물 형질전환 [Clough and Bent, 1998, Plant J. 16: 735 - 743]이 이용될 수 있다.
정확한 식물 형질전환 방법은 선택된 식물 종 및 형질전환을 위해 선택된 식물 세포 유형 (예, 실생식물(seedling) 유래의 세포 유형, 예를 들면 배축(hypocotyl) 및 자엽(cotelydon) 또는 배아 조직)에 따라 다소 달라질 수 있다.
상기 한 실시양태에서 언급된 바와 같이, 선택된 식물은 잇꽃이다. 잇꽃 형질전환체를 얻는 방법은 문헌 [Baker and Dyer (Plant Cell Reports, 1996, 16: 106 -110)]에 기재되었다.
유전적 구조물을 식물 세포로 도입한 다음, 식물 세포를 성장시키고, 새싹 및 뿌리와 같은 분화된 조직이 나오게 되면 성숙한 식물이 생성된다. 전형적으로, 다수의 식물을 발생시킨다. 식물을 재생시키는 방법은 일반적으로 당업자에게 공지되어 있으며, 예를 들어 문헌 [Plant Cell and Tissue Culture, 1994, Vasil and Thorpe Eds. Kluwer Academic Publishers and in: Plant Cell Culture 프로토콜s (Methods in Molecular Biology 111, 1999 Hall Eds Humana Press)]에서 찾을 수 있다.
따라서, 본 발명은 특정 해양 세균성 및 임의의 트라우스토키트리드 유래의 유전자들 또는 다른 진핵생물 PUFA PKS 시스템을 이용해서 식물 세포를 유전적으로 개질시키는 방법을 포함하며, 추가로 유전자 혼합을 이용해서 PUFA 생성물의 범위가 EPA, DHA, DPA (n-3 또는 n-6), ARA, GLA, SDA 및 다른 것들을 포함하도록 연장시키고/시키거나 변화시킬 수 있다. 상기 변화된 PUFA 제조 프로필을 얻는 방법은 다양한 생물체 유래의 유전자들을 트라우스토키트리드 PUFA PKS 유전자로 혼합하는 것 뿐만 아니라 본원에 개시된 내생성 트라우스토키트리드 PUFA PKS 유전자들을 유전적으로 개질시키는 다양한 방법을 또한 포함한다. 트라우스토키트리드 PUFA PKS 시스템 및 해양 세균성 PUFA PKS 시스템의 유전적 기초 및 도메인 구조에 대한 지식은 다양한 PUFA 프로필을 제조하는 신규한 유전적으로 개질된 생물체를 설계하기 위한 기초를 제공한다. 트라우스토키트리드와 같은 미생물에서 또는 이. 콜라이에서 제조되는 신규 PUFA PKS 구조물을 단리할 수 있으며, 이 구조물을 사용해서 식물을 형질전환시킴으로써 식물에 대해 유사한 PUFA 제조 특성을 부여할 수 있다. 본 발명에 포함되는 PUFA PKS 시스템의 특정 개질물에 대한 상세한 논의는 예를 들어 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 및 미국 특허 출원 공개 제20050100995호에 기재되어 있다.
유전적으로 개질된 식물은 바람직하게는 발효 배지 중에서 배양하거나 또는 토양과 같은 적합한 배지에서 성장시킨다. 적절한 또는 효과적인 발효 배지는 상기에서 상세히 논의되어 왔다. 고등 식물을 위한 적합한 배양 배지는 토양, 모래, 뿌리 성장을 뒷받침하는 임의의 다른 미립자 배지 (예, 질석, 진주암 등) 또는 수경법 배양, 및 고등 식물의 성장을 최적화하는 적합한 광, 물 및 영양 보충물을 포함하지만 이에 한정되지 않는, 식물용 임의의 성장 배지를 포함한다. 본 발명의 유전적으로 개질된 식물은 PUFA PKS 시스템의 활성에 의해 PUFA를 제조하도록 조작된다. PUFA는 식물로부터 화합물을 추출하는 정제 과정을 통해 회수될 수 있다. 바람직한 실시양태에서, PUFA는 식물을 수확함으로써 회수된다. 특히 바람직한 실시양태에서, PUFA는 식물로부터 (예, 오일 종자로부터) 오일을 수확함으로써 회수된다. 식물은 또한 그의 천연 상태로 소비될 수 있거나 또는 소비가능한 생성물로 추가로 가공될 수 있다.
바람직하게는, 본 발명의 유전적으로 개질된 식물은 EPA (C20:5, n-3), DHA (C22:6, n-3), DPA (C22:5, n-6 또는 n-3), ARA (C20:4, n-6), GLA (C18:3, n-6), ALA (C18:3, n-3), 및/또는 SDA (C18:4, n-3)를 포함하지만 이에 한정되지 않는 한가지 이상의 다불포화 지방산, 더 바람직하게는 EPA (C20:5, n-3), DHA (C22:6, n-3), DPA (C22:5, n-6 또는 n-3), 또는 DTA (C22:4, n-6)를 포함하지만 이에 한정되지 않는 한가지 이상의 장쇄 지방산 (LCPUFA)을 제조한다. 특히 바람직한 실시양태에서, 본 발명의 유전적으로 개질된 식물은 EPA (C20:5, n-3), DHA (C22:6, n-3), 및/또는 DPA (C22:5, n-6 또는 n-3)를 포함하지만 이에 한정되지 않는 한가지 이상의 다불포화 지방산을 제조한다.
따라서, 본 발명의 한 실시양태는 (예를 들어, 그의 성숙한 종자에서 (오일 종자 식물의 경우) 또는 오일 종자 식물의 종자의 오일에서) 한가지 이상의 PUFA (표적 PUFA)를 제조하는 식물이며, 식물 또는 PUFA를 축적하는 식물의 일부 (예, 성숙한 종자(식물이 오일 종자 식물인 경우), 또는 오일 종자 식물의 종자의 오일)에서의 총 지방산 프로필이 검출가능한 양의 상기 PUFA 또는 PUFA들을 포함하는 것인, 식물, 바람직하게는 오일 종자 식물에 관한 것이다. 바람직하게는, 표적 PUFA는 20개 이상의 탄소의 PUFA이며, 3개 이상의 이중 결합, 더 바람직하게는 4개 이상의 이중 결합, 훨씬 더 바람직하게는, 5개 이상의 이중 결합을 포함한다. 또한, 표적 PUFA는 바람직하게는 식물 (즉, 유전적 개질의 부재하의 야생형 식물 또는 지시된 유전적 개질에 대한 수령자로서 사용되는 모체 식물)에 의해 천연적으로 제조되지 않는 PUFA이다. 바람직하게는, PUFA (식물의 종자 오일을 포함함)를 축적하는 식물의 일부 또는 식물에서의 총 지방산 프로필은 식물에 의해 제조된 총 지방산의 중량을 기준으로 표적 PUFA(들)을 0.1% 이상, 더 바람직하게는 약 0.2% 이상, 더 바람직하게는 약 0.3% 이상, 더 바람직하게는 약 0.4% 이상, 더 바람직하게는 약 0.5% 이상, 더 바람직하게는 약 1% 이상, 더 바람직하게는 약 1.5% 이상, 더 바람직하게는 약 2% 이상, 더 바람직하게는 약 2.5% 이상, 더 바람직하게는 약 3% 이상, 더 바람직하게는 약 3.5% 이상, 더 바람직하게는 약 4% 이상, 더 바람직하게는 약 4.5% 이상, 더 바람직하게는 약 5% 이상, 더 바람직하게는 약 5.5% 이상, 더 바람직하게는 약 10% 이상, 더 바람직하게는 약 15% 이상, 더 바람직하게는 약 20% 이상, 더 바람직하게는 약 25% 이상, 더 바람직하게는 약 30% 이상, 더 바람직하게는 약 35% 이상, 더 바람직하게는 약 40% 이상, 더 바람직하게는 약 45% 이상, 더 바람직하게는 약 50% 이상, 더 바람직하게는 약 55% 이상, 더 바람직하게는 약 60% 이상, 더 바람직하게는 약 65% 이상, 더 바람직하게는 약 70% 이상, 더 바람직하게는 약 75% 이상 포함하거나, 더 바람직하게는 식물에 의해 제조된 총 지방산의 중량을 기준으로 한가지 이상의 다불포화 지방산 (표적 PUFA 또는 PUFA)을 75% 넘게 포함하거나, 또는 표적 PUFA(들)을 0.1% 내지 75%, 또는 75% 초과 (100% 이하 또는 약 100%)(0.1%씩 증분됨)의 임의의 비율로 포함한다. 본원에서 일반적으로 사용된 바와 같이, PUFA 제조의 백분율 양에 대한 언급은 달리 언급하지 않는다면 생물체 (식물)에 의해 제조된 총 지방산의 중량을 기준으로 한다 (예를 들어 어떤 경우에는, 중량 백분율은 효소 복합체, 예를 들면 PUFA PKS 시스템에 의해 제조된 총 지방산에 대해 상대적임). 한 실시양태에서, 식물에 의해 제조된 총 지방산은 지방산 메틸 에스테르 (FAME) 제제의 가스 크로마토그래피 (GC) 분석에 의해 결정되는 바와 같이 중량 퍼센트로 제시되지만, 총 지방산의 결정은 이러한 방법으로 제한되지 않는다.
상기 기재된 바와 같이, 상기 기재된 식물 (및/또는 식물의 부분 또는 종자 오일 분획)에 의해 제조된 총 지방산의 추가의 특징은, 식물에 의해 제조된 상기 총 지방산이 표적 PUFA(들)을 제조하는 효소 복합체에 의해 제조되는 표적 PUFA(들) 이외의 임의의 지방산을 약 10 중량% 미만으로 포함 (또는 이보다 더 많은 임의의 양을 함유하지 않음)한다는 것이다. 바람직하게는, 표적 PUFA(들) 이외에, (예를 들어, 표적 PUFA(들)을 제조하는 효소 또는 효소 복합체를 이용해서 식물을 유전적으로 개질시킨 결과로서) 표적 PUFA(들)을 제조하는 효소 복합체에 의해 제조되는 임의의 지방산은 식물에 의해 제조된 총 지방산의 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1 중량% 미만으로 존재한다.
다른 실시양태에서, 표적 PUFA(들) 이외의 표적 PUFA(들)을 제조하는 효소 복합체에 의해 제조되는 임의의 지방산은 식물에서 표적 PUFA(들)을 제조하는 효소 복합체에 의해 제조되는 총 지방산의 약 10 중량% 미만으로 (이보다 더 많은 임의의 양을 함유하지 않음) (즉, 이 측정치는 표적 PUFA를 제조하는 효소 복합체에 의해 제조되는 총 지방산들로 한정됨), 더 바람직하게는 식물에서 표적 PUFA(들)을 제조하는 효소 복합체에 의해 제조되는 총 지방산의 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1 중량% 미만, 더 바람직하게는 약 0.5 중량% 미만으로 존재한다.
본 발명의 상기 실시양태의 다른 측면에서, 식물 (및/또는 식물의 부분 또는 종자 오일 분획)에 의해 제조된 총 지방산은 야생형 식물 (유전적으로 개질되지 않음)에 존재하거나 또는 지시된 유전적 개질에 대한 수령자로서 사용된 모체 식물에 존재하는 PUFA들 또는 표적 PUFA(들) 이외에, 식물에 의해 제조된 총 지방산의 중량을 기준으로 탄소수 18 이상의 PUFA를 10% 미만으로 함유한다 (또는 이보다 더 많은 양을 함유하지 않음). 추가의 측면에서, 식물 (및/또는 식물의 부분 또는 종자 오일 분획)에 의해 제조된 총 지방산은 야생형 식물 (유전적으로 개질되지 않음)에 존재하거나 또는 지시된 유전적 개질에 대한 수령자로서 사용된 모체 식물에 존재하는 PUFA들 또는 표적 PUFA(들) 이외에, 식물에 의해 제조된 총 지방산의 중량을 기준으로 18개 이상의 탄소를 갖는 PUFA를 9% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 8% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 7% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 6% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 5% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 4% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 3% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 2% 미만, 또는 18개 이상의 탄소를 갖는 PUFA를 1% 미만으로 함유한다.
본 발명의 상기 실시양태의 다른 측면에서, 식물 (및/또는 식물의 부분 또는 종자 오일 분획)에 의해 제조된 총 지방산은 야생형 식물 (유전적으로 개질되지 않음)에 존재하거나 또는 지시된 유전적 개질에 대한 수령자로서 사용된 모체 식물에 존재하는 PUFA들 또는 표적 PUFA(들) 이외에, 식물에 의해 제조된 총 지방산의 중량을 기준으로 20개 이상의 탄소를 갖는 PUFA를 10% 미만으로 함유한다 (또는 이보다 많은 임의의 양을 함유하지 않음). 추가의 측면에서, 식물 (및/또는 식물의 부분 또는 종자 오일 분획)에 의해 제조된 총 지방산은 야생형 식물 (유전적으로 개질되지 않음)에 존재하거나 또는 지시된 유전적 개질에 대한 수령자로서 사용된 모체 식물에 존재하는 PUFA들 또는 표적 PUFA(들) 이외에, 식물에 의해 제조된 총 지방산의 중량을 기준으로 20개 이상의 탄소를 갖는 PUFA를 9% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 8% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 7% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 6% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 5% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 4% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 3% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 2% 미만, 또는 20개 이상의 탄소를 갖는 PUFA를 1% 미만으로 함유한다.
한 실시양태에서, 식물 (및/또는 식물의 부분 또는 종자 오일 분획)의 총 지방산은 식물에 의해 제조된 총 지방산을 약 10 중량% 미만 함유하며, 더 바람직하게는 감마-리놀렌산 (GLA; 18:3, n-6); 스테아리돈산 (STA 또는 SDA; 18:4, n-3); 디호모-감마-리놀렌산 (DGLA 또는 HGLA; 20:3, n-6), 아라키돈산 (ARA, C20:4, n-6); 에이코사트리엔산 (ETA; 20:3, n-9) 및 다양한 다른 지방산, 예를 들면 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); 미드산 (20:3; Δ5,8,11); 또는 20:4 (Δ5,1,14,17) 중 임의의 한가지 이상으로부터 선택된 지방산을 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1% 미만으로 함유한다.
다른 실시양태에서, 식물에서 장쇄 PUFA를 제조하는 효소 시스템에 의해 제조되는 지방산은 감마-리놀렌산 (GLA; 18:3, n-6); 스테아리돈산 (STA 또는 SDA; 18:4, n-3); 디호모-감마-리놀렌산 (DGLA 또는 HGLA; 20:3, n-6), 아라키돈산 (ARA, C20:4, n-6); 에이코사트리엔산 (ETA; 20:3, n-9) 및 다양한 다른 지방산, 예를 들면 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); 미드산 (20:3; Δ5,8,11); 또는 20:4 (Δ5,1,14,17)로부터 선택되는 지방산을 식물에 의해 제조된 총 지방산의 비율로서 약 10 중량% 미만으로 함유하며, 더 바람직하게는 감마-리놀렌산 (GLA; 18:3, n-6); 스테아리돈산 (STA 또는 SDA; 18:4, n-3); 디호모-감마-리놀렌산 (DGLA 또는 HGLA; 20:3, n-6), 아라키돈산 (ARA, C20:4, n-6); 에이코사트리엔산 (ETA; 20:3, n-9) 및 다양한 다른 지방산, 예를 들면 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); 미드산 (20:3; Δ5,8,11); 또는 20:4 (Δ5,1,14,17)로부터 선택된 지방산을 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1% 미만으로 함유한다.
다른 실시양태에서, 식물에서 장쇄 PUFA를 제조하는 효소 시스템에 의해 제조되는 지방산은 PUFA로서 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA 의 모두를 식물에 의해 제조된 총 지방산의 비율로서 약 10 중량% 미만으로 함유하며, 더 바람직하게는 PUFA로서 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA의 모두를 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1% 미만으로 함유한다.
다른 실시양태에서, 식물에서 장쇄 PUFA를 제조하는 효소 시스템에 의해 제조되는 지방산은 PUFA로서 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA의 각각을 식물에 의해 제조된 총 지방산의 비율로서 약 10 중량% 미만으로 함유하며, 더 바람직하게는 PUFA로서 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA의 각각을 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1% 미만으로 함유한다.
다른 실시양태에서, 식물에서 장쇄 PUFA를 제조하는 효소 시스템에 의해 제조되는 지방산은 PUFA로서 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA 중 임의의 한가지 이상을 식물에 의해 제조된 총 지방산의 비율로서 약 10 중량% 미만으로 함유하며, 더 바람직하게는 PUFA로서 감마-리놀렌산 (GLA; 18:3, n-6), 18개의 탄소 및 4개의 탄소-탄소 이중 결합을 갖는 PUFA, 20개의 탄소 및 3개의 탄소-탄소 이중 결합을 갖는 PUFA, 및 22개의 탄소 및 2개 또는 3개의 탄소-탄소 이중 결합을 갖는 PUFA 중 임의의 한가지 이상을 약 9% 미만, 더 바람직하게는 약 8% 미만, 더 바람직하게는 약 7% 미만, 더 바람직하게는 약 6% 미만, 더 바람직하게는 약 5% 미만, 더 바람직하게는 약 4% 미만, 더 바람직하게는 약 3% 미만, 더 바람직하게는 약 2% 미만, 더 바람직하게는 약 1% 미만으로 함유한다.
본 발명의 상기 실시양태의 한 측면에서, 식물은 두가지 이상의 표적 PUFA를 제조하며, (오일 종자 유래의 오일을 비롯한) PUFA를 축적하는 식물의 일부 또는 식물의 총 지방산 프로필은 검출가능한 양의 상기 PUFA를 포함한다. 이 실시양태에서, PUFA는 바람직하게는 각각 20개 이상의 탄소의 PUFA이며, 3개 이상의 이중 결합, 더 바람직하게는 4개 이상의 이중 결합, 훨씬 더 바람직하게는 5개 이상의 이중 결합을 포함한다. 이러한 PUFA는 가장 바람직하게는 DHA, DPAn-6 및 EPA로부터 선택된다. 한 측면에서, 식물은 DHA 및 DPAn-6을 제조하며, DHA 대 DPAn-6의 비율은 약 1:10 내지 약 10:1 (이들 사이의 임의의 비율을 포함함)이다. 한 실시양태에서, DHA 대 DPA의 비율은 약 1:1 내지 약 3:1이며, 다른 실시양태에서 약 2.5:1이다. 한 실시양태에서, 식물은 DHA 및 EPA를 제조한다.
본 발명의 상기 실시양태의 다른 측면에서, 식물은 도 13 또는 도 14에 나타낸 총 지방산 프로필을 생성한다.
추가로, 본 발명은 본원에 기재된 식물에 의해 생산된 임의의 종자, 및 본원에 기재된 식물 또는 종자에 의해 생성된 임의의 오일을 포함한다. 본 발명은 또한 본원에 기재된 식물, 종자 또는 오일을 이용해서 제조한 임의의 생성물을 포함한다.
본 발명의 유전적으로
개질된
생물체의 용도
본 발명의 한 실시양태는 본 발명의 유전적으로 개질된 생물체 (예, 미생물 또는 식물)을 성장시키거나 배양함으로써 목적하는 생활성 분자 (생성물 또는 화합물로 지칭되기도 함)을 제조하는 방법에 관한 것이다 (상기에 상세히 기재됨). 바람직하게는, 생활성 분자는 PUFA, 가장 바람직하게는 LCPUFA이다. 바람직하게는, 유전적으로 개질된 생물체는 유전적으로 개질된 미생물 또는 유전적으로 개질된 식물이다. 이러한 방법은 예를 들어 본원의 상기에 기재되어 있는 본 발명에 따른 유전적 개질을 갖는 미생물 또는 식물을 발효 배지에서 배양하거나 또는 적합한 환경, 예를 들면 토양에서 성장시키는 단계를 포함한다. 본 발명의 PUFA PKS 시스템과 관련된 유전적 개질을 위한 바람직한 숙주 세포 및 생물체는 상기에 기재되어 있다.
본 발명의 한 실시양태는 본 발명의 유전적으로 개질된 미생물을 배양함으로써 목적하는 PUFA를 제조하는 방법에 관한 것이다 (상기에 상세히 기재됨). 이러한 방법은 PUFA(들)을 제조하기에 효과적인 조건하에 발효 배지에서 본원의 상기에 기재되어 있는 본 발명에 따른 유전적 개질을 갖는 미생물을 배양하는 단계를 포함한다. 적절한 또는 효과적인 배지는, 본 발명의 유전적으로 개질된 미생물이 배양되는 경우 목적하는 PUFA 생성물(들)을 제조할 수 있는 임의의 배지를 지칭한다. 이러한 배지는 전형적으로는 동화가능한 탄소, 질소 및 포스페이트 공급원을 포함하는 수성 배지이다. 상기 배지는 또한 적절한 염, 미네랄, 금속 및 다른 영양소를 포함할 수 있다. 본 발명의 임의의 미생물은 통상의 발효 생물반응기(bioreactor)에서 배양할 수 있다. 미생물은 배치, 공급-배치(fed-batch), 셀 리사이클(cell recycle), 및 연속 발효를 포함하지만 이에 한정되지 않는 임의의 발효 공정에 의해 배양할 수 있다. 본 발명에 따른 트라우스토키트리드 미생물에 대한 바람직한 성장 조건은 당업계에 잘 알려져 있으며, 예를 들어 각각 전체 개시내용이 본원에 참고로 포함되는 미국 특허 제5,130,242호, 미국 특허 제5,340,742호, 및 미국 특허 제5,698,244호에 상세히 기재되어 있다.
유전적으로 개질된 미생물에 의해 제조된 목적하는 PUFA(들) 및/또는 다른 생활성 분자는 통상의 분리 및 정제 기술을 이용해서 발효 배지로부터 회수할 수 있다. 예를 들어, 발효 배지를 여과 또는 원심분리해서 미생물, 세포 잔해(debris) 및 다른 미립자 물질을 제거할 수 있으며, 생성물은 예를 들어 이온 교환, 크로마토그래피, 추출, 용매 추출, 상 분리, 막 분리, 전기투석(electrodialysis), 역 삼투, 증류, 화학적 유도체화 및 결정화와 같은 통상의 방법에 의해 세포-무함유 상등액으로부터 회수할 수 있다. 또는, PUFA(들) 또는 그의 추출물 및 다양한 분획을 제조하는 미생물은 생성물로부터 미생물 성분들을 제거하지 않고 사용할 수 있다.
바람직하게는, PUFA는 미생물의 건조 중량을 기준으로 약 5% 초과의 양, 한 측면에서 6% 초과의 양, 다른 측면에서 7% 초과의 양, 다른 측면에서 8% 초과의 양, 다른 측면에서 9% 초과의 양, 다른 측면에서 10% 초과의 양 등으로, 전체 정수 퍼센트에서 미생물 건조 중량의 최대 90% 초과 (예, 15%, 20%, 30%, 40%, 50%, 및 상기 비율 사이의 임의의 비율)까지의 양으로 제조된다.
바람직하게는, 대상 생활성 화합물은 유전적으로 개질된 미생물에 의해 미생물의 건조 중량을 기준으로 약 0.05% 초과, 바람직하게는 약 0.1% 초과, 더 바람직하게는 약 0.25% 초과, 더 바람직하게는 약 0.5% 초과, 더 바람직하게는 약 0.75% 초과, 더 바람직하게는 약 1% 초과, 더 바람직하게는 약 2.5% 초과, 더 바람직하게는 약 5% 초과, 더 바람직하게는 약 10% 초과, 더 바람직하게는 약 15% 초과, 더 바람직하게는 약 20% 초과의 양으로 제조된다. 지질 화합물의 경우, 바람직하게는 상기 화합물은 미생물의 건조 중량의 약 5% 초과의 양으로 제조된다. 다른 생활성 화합물, 예를 들면 소량으로 합성되는 항생제 또는 화합물의 경우, 이러한 화합물을 미생물의 건조 중량으로 보유하는 균주는 예상가능하게는 상기 재된 유형의 신규 PKS 시스템을 함유하는 것으로 확인된다. 일부 실시양태에서, 특정 생활성 분자 (화합물)은 축적되기보다는 미생물에 의해 분비된다. 따라서, 이러한 생활성 분자는 일반적으로 배양 배지로부터 회수되며, 제조된 분자의 농도는 미생물 및 배양 크기에 따라 달라질 것이다.
본 발명의 목적하는 생활성 화합물의 제조 방법에서, 유전적으로 개질된 식물을 발효 배지 중에서 배양하거나 또는 토양과 같은 적합한 배지에서 성장시킨다. 적절한 또는 효과적인 발효 배지는 상기에 상세히 논의되어 있다. 고등 식물에 대한 적합한 배양 배지는 토양, 모래, 뿌리 성장을 뒷받침하는 임의의 다른 미립자 배지 (예, 질석, 진주암 등) 또는 수경법 배양, 및 고등 식물의 성장을 최적화하는 적합한 광, 물 및 영양 보충물을 포함하지만 이에 한정되지 않는, 식물용 임의의 성장 배지를 포함한다. 본 발명의 유전적으로 개질된 식물은 본 발명에 따른 PUFA PKS 시스템 및 다른 이종 단백질 (PUFA PKS 시스템에 대한 부속 단백질)의 활성을 통해 목적하는 생성물을 상당한 양으로 제조하도록 조작된다. 이러한 화합물은 식물로부터 화합물을 추출하는 정제 공정에 의해 회수할 수 있다. 바람직한 실시양태에서, 화합물은 식물을 수확함으로써 회수된다. 상기 실시양태에서, 식물은 천연 상태로 소비될 수 있거나 또는 소비가능한 생성물로 추가로 가공될 수 있다.
본 발명은 본원에 기재된 임의의 생물체 또는 그의 부분 (예, 미생물 및 그의 제제 또는 분획 또는 식물, 식물의 부분 (예, 오일 종자), 또는 이들의 제제 또는 분획), 및 본원에 기재된 생물체에 의해 제조되는 임의의 오일을 추가로 포함한다. 본 발명은 또한 상기 생물체를 사용해서 제조된 임의의 생성물, 그의 부분, 또는 본원에 기재된 오일을 포함한다.
본 발명의 한 실시양태는 생물체, 그의 부분, 또는 본 발명에 따라 본원에 기재된 바와 같이 유전적으로 개질된 생물체 (예, PUFA PKS 시스템을 사용해서 유전적으로 개질키고, 본원에 기재된 바와 같은 PUFA의 제조 및/또는 축적을 향상시키기 위한 임의의 전략을 이용하며, 본원에 기재된 지방산 프로필을 갖는 식물 또는 미생물)에 의해 제조되는 오일을 상기 생성물에 부가하는 것을 포함하는, 한가지 이상의 지방산을 함유하는 생성물을 개질시키는 방법에 관한 것이다. 상기 방법에 의해 제조되거나 또는 일반적으로 임의의 생물체, 그의 부분, 본원에 기재된 생물체로부터의 오일을 함유하는 임의의 생성물이 또한 본 발명에 포함된다.
바람직하게는, 생성물은 식품, 식이 보충물, 제약 제제, 인간화된 동물의 밀크, 및 유아용 조제식(infant formula)으로 이루어진 군으로부터 선택된다. 적합한 제약 제제로는 항염증성 제제, 화학치료제, 활성 부형제, 골다공증 약물, 항우울제, 항경련제, 항-헬레코박터 파이로리(Heliobactor pylori) 약물, 신경퇴행성 질환 치료용 약물, 퇴행성 간 질환 치료용 약물, 항생제, 및 콜레스테롤 저하용 제제를 들 수 있지만 이에 한정되지 않는다. 한 실시양태에서, 생성물은 만성 염증, 급성 염증, 위장관 장애, 암, 악액질, 심장 재협착증, 신경퇴행성 장애, 간의 퇴행성 장애, 혈액 지질 장애, 골다공증, 골관절염, 자가면역 질환, 자간전증, 조산(preterm birth), 연령 관련 황반병증, 폐 장애, 및 페록시좀성(peroxisomal) 장애로 이루어진 군으로부터 선택된 증상을 치료하는데 사용된다.
적합한 식품으로는 고급 베이커리 제품, 식빵 및 롤빵(bread and rolls), 아침용 시리얼, 가공 및 비가공 치즈, 조미료 (케첩, 마요네즈 등), 낙농 제품 (우유, 요거트), 푸딩 및 젤라틴 디저트, 탄산 음료, 차, 분말화된 음료용 믹스, 가공된 어류 제품, 과일-기재 음료, 츄잉검, 경질 과자, 동결 낙농 제품, 가공된 육류 제품, 견과 및 견과-기재 스프레드, 파스타, 가공된 가금류 제품, 육즙 및 소스, 감자 칩 및 다른 칩 또는 튀김(crisp), 초콜렛 및 다른 과자, 수프 및 수프 믹스, 콩(soya) 기재 생성물 (밀크, 드링크, 크림, 표백제), 식물성오일-기재 스프레드, 및 식물성-기재 드링크를 들 수 있지만 이에 한정되지 않는다.
일반적인 정의 및 안내
본 발명에 따라, 단리된 단백질은 천연 환경으로부터 제거된 (즉, 인간에 의해 조작처리된) 단백질 또는 그의 단편 (폴리펩티드 또는 펩티드 포함)이며, 예를 들어 정제된 단백질, 부분 정제된 단백질, 재조합에 의해 제조된 단백질, 및 합성에 의해 제조된 단백질을 포함할 수 있다. 이와 같이, "단리된"은 단백질이 정제된 정도를 반영하지 않는다. 바람직하게는, 본 발명의 단리된 단백질은 재조합적으로 제조된다. 단리된 펩티드는 합성에 의해 (예를 들어, 펩티드 합성과 같이 화학적으로) 또는 재조합적으로 제조될 수 있다.
본원에 사용된 바와 같이, "지질"이라는 용어는 인지질; 유리 지방산; 지방산의 에스테르; 트리아실글리세롤; 디아실글리세라이드; 모노아실글리세라이드; 라이소(lyso)인지질; 비누; 포스파티드; 왁스 (알콜과 지방산의 에스테르); 스테롤 및 스테롤 에스테르; 카로테노이드; 크산토필 (예, 옥시카로테노이드); 탄화수소; 및 당업자에게 공지된 다른 지질을 포함한다. "다불포화 지방산" 및 "PUFA"라는 용어들은 유리 지방산 형태 뿐만 아니라 다른 형태, 예를 들면 TAG 형태 및 PL 형태를 포함한다.
특정 생물체 유래의 특정 단백질 또는 특정 생물체로부터 유도된 특정 단백질에 대한 언급, 예를 들어 "쉬조키트리움 ACoAS" 또는 "쉬조키트리움으로부터 유도된 ACoAS"는 쉬조키트리움 유래의 ACoAS (천연 발생 ACoAS의 상동체를 포함함) 또는 다르게는 쉬조키트리움 유래의 천연 발생 ACoAS의 구조 (예, 서열)에 대한 지식으로부터 제조된 ACoAS를 지칭한다. 달리 말하면, 쉬조키트리움 ACoAS는 쉬조키트리움 유래의 천연 발생 ACoAS의 구조 및 기능을 갖거나 또는 ACoAS가 쉬조키트리움 유래의 천연 발생 ACoAS의 생물학적 활성 (즉, 생물학적 활성을 갖는) 상동체가 되도록 쉬조키트리움 ACoAS와 충분히 유사한 구조 및 기능을 갖는 임의의 ACoAS를 포함한다. 이와 같이, 쉬조키트리움 ACoAS는 정제, 부분 정제, 재조합, 돌연변이/개질 및 합성 단백질을 포함할 수 있다.
본 발명에 따라, "개질" 및 "돌연변이"라는 용어들은 특히 본원에 기재된 단백질 또는 펩티드의 주요 아미노산 서열 (또는 핵산 서열)에 대한 개질/돌연변이와 관련하여 상호교환가능하게 사용될 수 있다. "개질"이라는 용어는 또한 메틸화, 파르네실화(farnesylation), 카르복시메틸화, 게라닐(geranyl) 게라닐화, 글리코실화, 인산화, 아세틸화, 미리스토일화, 프레닐화, 팔미테이트화, 및/또는 아미드화를 포함하지만 이에 한정되지 않는, 단백질 또는 펩티드에 대한 번역후 개질을 기술하는 것으로 사용될 수 있다. 또한 개질은 예를 들어 단백질 또는 펩티드와 다른 화합물의 복합체화를 포함할 수 있다. 이러한 개질은, 예를 들어 개질이 천연, 야생형 단백질 또는 펩티드에서 발생하는 번역후 개질과 상이한 경우, 돌연변이인 것으로 고려될 수 있다.
본원에 사용된 바와 같이, "상동체"라는 용어는 천연 발생 단백질 또는 펩티드 (즉, "원형(prototype)" 또는 "야생형" 단백질)에 대해 하나 이상의 사소한 개질 또는 돌연변이만큼 천연 발생 단백질 또는 펩티드와 상이하지만 천연 발생 형태의 전체 기본 단백질 및 측쇄 구조를 유지하는 (즉, 상동체가 야생형 단백질과 관련되는 것으로 확인될 수 있는) 단백질 또는 펩티드를 지칭하는데 사용된다. 이러한 변화는 하나 또는 몇몇 (예, 1% 이하) 아미노산 측쇄에서의 변화; 결실 (예, 단백질 또는 펩티드의 말단절단된 형태), 삽입 및/또는 치환을 비롯해서 하나 또는 몇몇 (예, 1% 이하) 아미노산에서의 변화; 하나 또는 몇몇 (예, 1% 이하) 원자의 입체화학에서의 변화; 및/또는 메틸화, 파르네실화, 게라닐 게라닐화, 글리코실화, 카르복시메틸화, 인산화, 아세틸화, 미리스토일화, 프레닐화, 팔미테이트화, 및/또는 아미드화를 포함하지만 이에 한정되지 않는 사소한 유도체화를 포함하지만 이에 한정되지 않는다. 상동체는 천연 발생 단백질 또는 펩티드와 비교해서 증진된, 감소된, 또는 실질적으로 유사한 특성을 가질 수 있다. 단백질의 바람직한 상동체는 하기에 상세히 기재되어 있다. 상동체는 합성에 의해 제조된 상동체, 주어진 단백질 또는 그의 도메인의 천연 발생 대립유전자 변이체, 또는 관련 서열이 유도된 생물체 이외의 생물체로부터의 상동성 서열을 포함할 수 있음을 유의한다.
보존적 치환은 전형적으로는 하기 군 내에서의 치환을 포함한다: 글리신 및 알라닌; 발린, 이소루이신 및 루이신; 아스파르트산, 글루탐산, 아스파라긴 및 글루타민; 세린 및 트레오닌; 리신 및 아르기닌; 및 페닐알라닌 및 티로신. 치환은 또한 보존된 소수성 또는 친수성을 기초로 [Kyte and Doolittle, J. Mol. Biol. 157:105 (1982)], 또는 유사한 폴리펩티드 2차 구조를 추정하는 능력을 기초로 [Chou and Fasman, Adv. Enzymol. 47: 45 (1978)] 수행될 수 있다.
상동체는 천연 대립유전자 변화 또는 천연 돌연변이의 결과일 수 있다. 단백질을 코딩하는 핵산의 천연 발생 대립유전자 변이체는, 이러한 단백질을 코딩하지만 예를 들어 돌연변이 또는 재조합에 의해 생성된 천연 변화로 인해 유사하되 동일하지는 않은 서열을 갖는 유전자와 본질적으로 동일한 게놈내 유전자좌 (또는 유전자좌들)에서 발생하는 유전자이다. 대립유전자 변이체는 전형적으로는 비교되는 유전자에 의해 코딩되는 단백질의 활성과 유사한 활성을 갖는 단백질을 코딩한다. 한가지 종류의 대립유전자 변이체는 동일한 단백질을 코딩할 수 있지만, 유전자 코드의 축퇴성으로 인해 상이한 핵산 서열을 가질 수 있다. 대립유전자 변이체는 또한 유전자의 5' 또는 3' 비번역 영역 (예를 들어, 조절성 제어 영역)에서의 변화를 포함할 수 있다. 대립유전자 변이체는 당업자에게 잘 알려져 있다.
상동체는 단리된 천연 발생 단백질에 대한 직접적인 개질, 직접적인 단백질 합성, 또는 예를 들어 무작위 또는 표적 돌연변이유발을 수행하는 전통적인 또는 재조합 DNA 기술에 의해 단백질을 코딩하는 핵산 서열을 개질시키는 방법을 포함하지만 이에 한정되지 않는, 당업계에 공지된 단백질 제조 기술을 이용해서 제조할 수 있다.
야생형 단백질에 비해 단백질 상동체를 개질 또는 돌연변이시키면 상동체의 기본적인 생물학적 활성이 천연 발생 (야생형) 단백질에 비해 증가하거나, 감소되거나, 또는 실질적으로 변하지 않는다. 일반적으로, 단백질의 생물학적 활성 또는 생물학적 작용은 생체내 (즉, 단백질의 천연 생리학적 환경) 또는 시험관내 (즉, 실험실 조건하)에서 측정 또는 관찰되는 바와 같은 단백질의 천연 발생 형태로 인해 단백질에 의해 발현 또는 수행되는 임의의 기능(들)을 지칭한다. PUFA PKS 시스템의 생물학적 활성 및 PUFA PKS 시스템을 구성하는 개별 단백질/도메인은 본원 및 참조된 특허 및 간행물들에 상세히 기재되어 있다. ACoAS의 생물학적 활성은 본 발명의 경우 바람직하게는 PUFA의 유리 지방산 (FFA)을 기질에 결합시키고 FFA의 아실-CoA PUFA로의 전환을 촉매하는 것을 포함한다.
상동체에서와 같은 단백질의 개질은 천연 발생 단백질과 동일한 생물학적 활성을 갖는 단백질 또는 천연 발생 단백질에 비해 감소 또는 증가된 생물학적 활성을 갖는 단백질을 생성시킬 수 있다. 단백질 발현의 증가 또는 단백질 활성의 감소를 일으키는 개질은 단백질의 불활성화 (완전한 또는 부분적인 불활성화), 하향조절, 또는 감소된 작용 (또는 활성)으로 지칭될 수 있다. 유사하게, 단백질 발현 증가 또는 단백질 활성 감소를 일으키는 개질은 단백질의 증폭, 과제조, 활성화, 증진, 상향조절, 또는 증가된 작용 (또는 활성)으로 지칭될 수 있다. 야생형 단백질의 생물학적 활성을 갖는 상동체에 대한 일반적인 언급은 상동체가 특히 생물학적 활성의 수준과 관련하여 반드시 야생형 단백질과 동일한 생물학적 활성을 갖는다는 것을 의미하지는 않음을 유의한다. 오히려, 상동체는 야생형 단백질과 동일한 생물학적 활성을 수행하지만 이 활성은 야생형 단백질에 비해 증가 또는 감소된 것일 수 있다. 단백질의 기능성 도메인은 생물학적 활성을 수행할 수 있는 (즉, 생물학적 활성을 갖는) 도메인이다 (즉, 도메인은 단백질의 일부일 수 있음).
단백질을 검출하거나 또는 단백질의 활성을 측정하는 방법으로는 단백질의 전사를 측정하는 방법, 단백질의 번역을 측정하는 방법, 단백질의 번역후 개질을 측정하는 방법, 단백질의 효소 활성을 측정하는 방법, 및/또는 단백질의 활성으로부터 얻어진 한가지 이상의 생성물을 제조 (예, PUFA를 제조)하는 방법을 들 수 있지만 이에 한정되지 않는다. 본 발명의 단리된 단백질 (상동체를 포함함)이 반드시 야생형 단백질의 생물학적 활성을 가져야 할 필요는 없음을 유의한다. 예를 들어, 단백질은 말단절단된, 돌연변이된 또는 불활성 단백질일 수 있다. 이러한 단백질은 예를 들어 스크리닝 검정, 또는 항체 제조와 같은 다른 목적에 유용하다. 바람직한 실시양태에서, 본 발명의 단리된 단백질은 야생형 단백질의 활성과 유사한 (상기 논의된 바와 같이 반드시 등가는 아님) 생물학적 활성을 갖는다.
단백질 발현 수준을 측정하는 방법으로는 일반적으로 웨스턴 블롯, 이뮤노블롯, 효소-연결 면역흡착 검정 (ELISA), 방사성면역검정 (RIA), 면역침전, 표면 플라즈몬 공명, 화학발광, 형광 편광(fluorescent polarization), 인광(phosphorescence), 면역조직화학 분석, 매트릭스-보조 레이져 탈착/이온화 비행시간 (MALDI-TOF) 질량 분광법, 미세세포측정(microcytometry), 마이크로어레이, 현미경검사, 형광 활성화된 세포 분류 (FACS), 및 유동세포분석, 및 효소 활성을 포함하지만 이에 한정되지 않는, 단백질의 특성 또는 다른 단백질 대응물(partner)과의 상호작용을 기초로 한 검정법을 들 수 있지만 이에 한정되지 않는다. 결합 검정은 또한 당업계에 잘 알려져 있다. 예를 들어, BIA코어 기계를 사용해서 두 단백질 사이의 복합체의 결합 상수를 결정할 수 있다. 복합체에 대한 해리 상수는 완충액이 칩상에 지나가는 시간에 대하여 굴절률의 변화를 모니터링함으로써 결정될 수 있다 [O'Shannessy et al. Anal. Biochem. 212:457 (1993); Schuster et al., Nature 365:343 (1993)]. 한 단백질과 다른 단백질의 결합을 측정하기 위한 다른 적합한 검정법으로는 예를 들어 면역검정법, 예를 들면 효소 연결 면역흡착 검정법 (ELISA) 및 방사성 면역검정법 (RIA); 또는 형광, UV 흡수, 원형 광이색성(circular dichroism), 또는 핵 자기 공명(NMR)을 통해 단백질의 분광(spectroscopic) 또는 광학 특성의 변화를 모니터링함으로써 결합을 측정하는 방법을 들 수 있다.
본 발명의 한 측면에서, 본원에 기재된 특정 단백질의 상동체를 비롯해서 본 발명에 포함되는 단백질은 기준(reference) 단백질로부터의 아미노산 서열의 약 100개 이상의 연속적인 아미노산을 포함하는 아미노산 서열을 포함하며, 여기서 상동체의 아미노산 서열은 본원에 기재된 바와 같은 단백질의 생물학적 활성을 갖는다. 추가의 측면에서, 단백질의 아미노산 서열은 기준 단백질의 약 200개 이상의 연속적인 아미노산, 더 바람직하게는 약 300개 이상의 연속적인 아미노산, 더 바람직하게는 약 400개 이상의 연속적인 아미노산을 포함하며, 전체 정수에서의 임의의 증분을 비롯해서 (예, 200, 201, 202, 203 등) 기준 단백질의 500개의 연속적인 아미노산 또는 그보다 많은 아미노산 서열, 최대로는 이 단백질의 전체 길이를 포함할 수 있다.
본 발명에 따라, 본원에 기재된 핵산 또는 아미노산 서열에 대해 "인접하는(contiguous)" 또는 "연속적인(consecutive)"이라는 용어는 파괴되지 않은 서열에 연결되는 것을 의미한다. 예를 들어, 제1 서열이 제2 서열의 30개의 인접하는 (또는 연속적인) 아미노산을 포함한다는 것은, 제1 서열이 제2 서열에서 30개의 아미노산 잔기로 된 파괴되지 않은 서열과 100% 동일한 것인 30개의 아미노산 잔기로 된 파괴되지 않은 서열을 포함한다는 것을 의미한다. 유사하게, 제1 서열이 제2 서열과 "100% 동일성"을 갖는다는 것은, 제1 서열이 뉴클레오티드 또는 아미노산 사이에 갭(gap)이 없는 제2 서열과 정확하게 대응한다는 것을 의미한다.
전형적으로, 기준 단백질의 상동체, 예를 들면 본원에 기재된 ACoAS 단백질의 상동체는 기준 단백질 (예를 들어, ACoAS 단백질)의 아미노산 서열과 약 50% 이상, 더 바람직하게는 약 55% 이상, 더 바람직하게는 약 60% 이상, 더 바람직하게는 약 65% 이상, 더 바람직하게는 약 70% 이상, 더 바람직하게는 약 75% 이상, 더 바람직하게는 약 80% 이상, 더 바람직하게는 약 85% 이상, 더 바람직하게는 약 90% 이상, 더 바람직하게는 약 95% 이상, 더 바람직하게는 약 96% 이상, 더 바람직하게는 약 97% 이상, 더 바람직하게는 약 98% 이상, 더 바람직하게는 약 99% 이상 (또는 60% 내지 99%의 전체에서 1%씩 증분시킨 임의의 비율만큼) 동일한 아미노산 서열을 갖는다. 상동체는 바람직하게는 그가 유도되거나 관련되는 단백질 또는 도메인 (즉, 기준 아미노산 서열을 갖는 단백질 또는 도메인)의 생물학적 활성을 갖는다. ACoAS 상동체와 관련해서, 상동체는 바람직하게는 ACoAS 효소 활성, 보다 구체적으로는 장쇄 PUFA 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 능력을 갖는다. 본원에 기재된 다른 부속 단백질과 관련해서, 이러한 단백질은 예를 들어 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 생물학적 활성을 가질 수 있다.
본원에 사용된 바와 같이, 달리 명시하지 않는다면, 서열 (%) 동일성에 대한 언급은 (1) 아미노산 검색을 위한 blastp, 핵산 검색을 위한 blastn, 및 핵산 검색 및 번역된 아미노산의 검색을 위한 blastX (6개의 오픈 리딩 프레임 모두에서임)를 이용한 BLAST 2.0 Basic BLAST 상동성 검색 (이들 모두 표준 디폴트(default) 매개변수를 가지며, 문의(query) 서열은 덜 복잡한 영역에 대하여 디폴트로 필터링됨) (전체 개시내용이 본원에 참고로 도입되는 문헌 [Altschul, S.F., Madden, T.L., Schaeaeffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389]에 기재됨); (2) BLAST 2 정렬 (하기 기재된 매개변수를 이용함); (3) 및/또는 표준 디폴트 매개변수를 갖는 PSI-BLAST (위치-특이적 반복 BLAST)를 이용해서 수행한 상동성 평가결과를 지칭한다. BLAST 2.0 Basic BLAST와 BLAST 2 사이에서 표준 매개변수에서의 일부 차이로 인해, 두 특이적 서열은 BLAST 2를 이용하는 경우 유의한 상동성을 갖는 것으로 인식될 수 있지만 서열들 중 하나를 문의 서열로 이용하는 BLAST 2.0 Basic BLAST에서 수행된 검색에서는 탑 매치(top match)에서 제 2 서열이 확인되지 않을 수 있음을 유의한다. 또한, PSI-BLAST는 사용이 편리한 자동화된 형태의 "프로필" 검색을 제공하며, 이는 서열 상동성을 조사하는 민감한 방법이다. 프로그램은 먼저 갭이 존재하는 BLAST 데이터베이스 검색을 수행한다. PSI-BLAST 프로그램은 위치 특이적 스코어 매트릭스를 구성하도록 리턴된 임의의 유의한 정렬들로부터의 정보를 이용하며, 이는 다음 회차의 데이터베이스 검색에서 문의 서열을 대체한다. 따라서, 퍼센트 동일성은 이들 프로그램 중 어느 한가지를 이용해서 결정할 수 있는 것으로 이해된다.
전체 개시내용이 본원에 참고로 도입되는 문헌 [Tatusova and Madden, "Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247 (1999)]에 기재된 BLAST 2 서열을 이용해서 2개의 특이적 서열을 서로 정렬시킬 수 있다. 생성된 정렬에서 갭 (결실 또는 삽입)이 도입될 수 있도록 두 서열 사이에서 갭 형성(Gapped) BLAST 검색 (BLAST 2.0)을 수행하는 BLAST 2.0 알고리즘을 이용해서 blastp 또는 blastn에서 BLAST 2 서열 정렬을 수행한다. 본원에서 명확히 하고자, 하기 표준 디폴트 매개변수를 이용해서 BLAST 2 서열 정렬을 수행한다.
blastn의 경우, 0 BLOSUM62 매트릭스를 이용한다:
Reward for match = 1
Penalty for mismatch = -2
Open gap (5) and extension gap (2) penalties
gap x_dropoff (50) expect (10) word size (11) filter (on)
blastp의 경우, 0 BLOSUM62 매트릭스를 이용한다:
Open gap (11) and extension gap (1) penalties
gap x_dropoff (50) expect (10) word size (3) filter (on).
본 발명의 한 실시양태에서, 본 발명의 단리된 단백질 또는 도메인은 미국 특허 제6,566,583호; 문헌 [Metz et al., Science 293:290-293 (2001)]; 미국 특허 출원 공개 제20020194641호; 미국 특허 출원 공개 제20040235127호; 미국 특허 출원 공개 제20050100995호; 및 미국 가출원 제60/689,167호 (출원일: 2005년 6월 10일) 중 어느 문헌에 기재된 임의의 아미노산 서열 또는 그의 임의의 생물학적 활성 단편 또는 도메인을 포함하거나, 이러한 단편 또는 도메인으로 본질적으로 이루어지거나, 또는 상기 단편 또는 도메인으로 이루어진다. 상기 단백질은 PUFA PKS 시스템의 단백질이며, 본원에 기재된 임의의 부속 단백질과 관련하여 사용될 수 있다.
본 발명의 다른 실시양태에서, 본원에 기재된 단백질(예, ACoAS 단백질)의 생물학적 활성을 갖는 아미노산 서열은 본원에 구체적으로 기재된 천연 발생 단백질 또는 폴리펩티드와 충분히 유사한 아미노산 서열을 포함하며, 이 아미노산 서열을 코딩하는 핵산 서열은 중간, 높은, 또는 매우 높은 엄격 조건 (하기에 기재됨)하에 천연 발생 단백질 또는 폴리펩티드를 코딩하는 핵산 분자 (천연 발생 단백질 또는 폴리펩티드를 코딩하는 핵산 스트랜드의 상보체)에(와) 혼성화할 수 있다. 바람직하게는, 본원에 기재된 단백질의 생물학적 활성을 갖는 아미노산 서열은 중간, 높은 또는 매우 높은 엄격 조건하에 본원에 기재된 임의의 아미노산 서열을 코딩하는 핵산 서열의 상보체와 혼성화하는 핵산 서열에 의해 코딩된다. 상보성 서열을 추론하는 방법은 당업자에게 공지되어 있다. 아미노산 서열화 및 핵산 서열화 기술에 오류가 완전히 없는 것은 아니기 때문에 본원에 제시된 서열은 본 발명에 포함되는 단백질의 자명한 서열을 나타내는 것에 불과하다는 것을 유의해야 한다.
본원에 사용된 바와 같이, 혼성화 조건은 핵산 분자를 사용해서 유사한 핵산 분자를 확인하는 표준 혼성화 조건을 지칭한다. 이러한 표준 조건은 예를 들어 전체 개시내용이 본원에 참곡로 도입되는 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press (1989). Sambrook et al., ibid.](특히, 9.31-9.62 페이지 참조)에 개시되어 있다. 또한, 다양한 정도의 뉴클레오티드 미스매치를 허용하는 혼성화를 달성하기 위해 적절한 혼성화 및 세척 조건을 계산하는 공식은 예를 들어 전체 개시내용이 본원에 참고로 도입되는 문헌 [Meinkoth et al., Anal. Biochem. 138, 267 (1984); Meinkoth et al., ibid.]에 개시되어 있다.
보다 구체적으로, 본원에 언급된 바와 같은 중간 엄격 혼성화 및 세척 조건은 혼성화 반응에서 프로브로 사용되는 핵산 분자와 약 70% 이상의 핵산 서열 동일성을 갖는 핵산 분자의 단리를 허용하는 조건 (즉, 약 30% 이하의 뉴클레오티드 미스매치를 허용하는 조건)을 지칭한다. 본원에 언급된 바와 같은 높은 엄격 혼성화 및 세척 조건은 혼성화 반응에서 프로브로 사용되는 핵산 분자와 약 80% 이상의 핵산 서열 동일성을 갖는 핵산 분자의 단리를 허용하는 조건 (즉, 약 20% 이하의 뉴클레오티드 미스매치를 허용하는 조건)을 지칭한다. 본원에 언급된 바와 같은 매우 높은 엄격 혼성화 및 세척 조건은 혼성화 반응에서 프로브로 사용되는 핵산 분자와 약 90% 이상의 핵산 서열 동일성을 갖는 핵산 분자의 단리를 허용하는 조건 (즉, 약 10% 이하의 뉴클레오티드 미스매치를 허용하는 조건)을 지칭한다. 상기 논의된 바와 같이, 당업자라면 문헌 [Meinkoth et al., ibid.]의 공식을 이용해서 상기 특정 수준의 뉴클레오티드 미스매치를 달성하기 위한 적절한 혼성화 및 세척 조건을 계산할 수 있을 것이다. 이러한 조건은 DNA:RNA 또는 DNA:DNA 하이브리드 형성 여부에 따라 달라질 것이다. DNA:DNA 하이브리드에 대해 계산된 융점은 DNA:RNA 하이브리드에 대한 융점보다 10℃ 더 낮다. 특정 실시양태에서, DNA:DNA 하이브리드에 대한 엄격 혼성화 조건은 적절한 세척 조건과 함께 6X SSC (0.9 M Na+)의 이온 농도하에 약 20℃ 내지 약 35℃의 온도 (낮은 엄격도), 더 바람직하게는 약 28℃ 내지 약 40℃ (보다 높은 엄격도), 훨씬 더 바람직하게는 약 35℃ 내지 약 45℃ (훨씬 더 높은 엄격도)의 온도에서의 혼성화를 포함한다. 특정 실시양태에서, DNA:RNA 하이브리드에 대한 엄격 혼성화 조건은 유사한 엄격 세척 조건과 함께 6X SSC (0.9 M Na+)의 이온 농도하에 약 30℃ 내지 약 45℃, 더 바람직하게는 약 38℃ 내지 약 50℃, 훨씬 더 바람직하게는 약 45℃ 내지 약 55℃의 온도에서의 혼성화를 포함한다. 이러한 수치는 뉴클레오티드 약 100개보다 더 많은 분자에 대한 융점, 0% 포름아미드 및 약 40%의 G + C 함량의 계산을 기초로 한다. 별법으로, Tm은 문헌 [Sambrook et al., 상기 문헌, 9.31 내지 9.62 페이지]에 기재된 바와 같이 경험적으로 계산될 수 있다. 일반적으로, 세척 조건은 가능한 엄격해야하며, 선택된 혼성화 조건에 대해 적절해야 한다. 예를 들어, 혼성화 조건은 염의 형성 및 특정 하이브리드의 계산된 Tm보다 대략 20-25℃ 낮은 온도 조건을 포함할 수 있으며, 세척 조건은 전형적으로는 특정 하이브리드의 계산된 Tm보다 대략 12-20℃ 낮은 온도 조건과 염의 조합을 포함한다. DNA:DNA 하이브리드와 함께 사용하기에 적합한 혼성화 조건의 한 예는 약 42℃에서 6X SSC (50% 포름아미드) 중 2 내지 24시간의 혼성화에 이어서 실온에서 약 2X SSC로 1회 이상 세척하는 것을 포함하는 세척 단계, 및 이후 더 높은 온도 및 더 낮은 이온 농도에서의 추가의 세척 (예를 들어, 약 37℃에서 약 0.1X-0.5X SSC로 1회 이상 세척한 다음, 약 68℃에서 약 0.1X-0.5X SSC로 1회 이상 세척함)을 포함한다.
본 발명은 또한 하나 이상의 융합 세그먼트에 부착된 본 발명의 임의의 단백질 또는 임의의 상동체 또는 그의 단편을 포함하는 융합 단백질을 포함한다. 본 발명과 함께 사용하기에 적합한 융합 세그먼트로는 단백질의 안정성을 증가시킬 수 있고/있거나; 다른 바람직한 생물학적 활성을 제공할 수 있고/있거나 (예. 친화성 크로마토그래피에 의해) 단백질의 정제를 보조할 수 있는 세그먼트를 포함하지만 이에 한정되지 않는다. 적합한 융합 세그먼트는 목적하는 기능을 갖는 (예를 들어, 증가된 안정성, 용해도, 생물학적 활성을 부여하고/하거나 단백질 정제를 단순화하는) 임의의 크기의 도메인일 수 있다. 융합 세그먼트는 단백질의 아미노 및/또는 카르복실 말단에 연결될 수 있으며, 목적 단백질을 직접 회수하기 위해 절단될 수 있다. 융합 단백질은 바람직하게는 상기 논의된 바와 같은 본 발명의 단백질의 카르복실 및/또는 아미노 말단에 부착된 융합 세그먼트를 포함하는 단백질을 코딩하는 융합 핵산 분자로 트랜스펙션된 재조합 세포를 배양함으로써 제조될 수 있다.
본 발명의 한 실시양태에서, 본원에 기재된 임의의 아미노산 서열 및 이러한 서열의 상동체는, 주어진 아미노산 서열의 C- 및/또는 N-말단 각각을 플랭킹하는 1개 이상 약 20 이하의 추가의 이종 아미노산을 갖도록 제조할 수 있다. 생성된 단백질 또는 폴리펩티드는 주어진 아미노산 서열로 "본질적으로 이루어지는" 것으로 언급될 수 있다. 본 발명에 따라, 이종 아미노산은 천연에서 주어진 아미노산 서열을 플랭킹하는 것으로 발견되지 않거나 (즉, 자연, 생체내에 존재하지 않음) 또는 유전자내에 존재할 때 주어진 아미노산 서열을 코딩하는 천연 발생 핵산 서열을 플랭킹하는 뉴클레오티드에 의해 코딩되지 않는 아미노산의 서열이며, 이는 천연 발생 서열내의 이러한 뉴클레오티드가 주어진 아미노산 서열이 유도되는 생물체에서 표준 코돈 용법을 이용해서 번역된 경우에 그러하다. 유사하게, 본원에서 핵산 서열과 관련하여 사용되는 경우 "~로 본질적으로 이루어지는"이라는 구절은 주어진 아미노산 서열을 코딩하는 핵산서열의 5' 및/또는 3' 말단의 각각에서 1개 이상 최대 약 60개 만큼 많은 추가의 이종 뉴클레오티드에 의해 플랭킹될 수 있는 주어진 아미노산 서열을 코딩하는 핵산 서열을 지칭한다. 이종 뉴클레오티드는 천연 유전자내에 존재할 때 주어진 아미노산 서열을 코딩하는 핵산 서열을 플랭킹하는 것으로 천연에서는 발견되지 않는다 (즉, 자연, 생채내에 존재하지 않음).
한 측면에서, 본 발명의 단백질 또는 도메인 및/또는 그의 상동체 또는 단편의 최소 크기는 필요한 생물학적 활성을 나타내는데 충분하거나 또는 시험관내 검정에서 표적으로 또는 항체 발생을 위한 항원으로 작용하기에 충분한 크기이다. 한 실시양태에서, 본 발명의 단백질은 본 발명의 단백질 또는 도메인의 아미노산 8개 길이 내지 전체 길이 사이의 임의의 길이로서 약 8개 이상의 아미노산 길이 (예를 들어, 항체 에피토프의 경우 또는 검정에서 검출가능한 펩티드로서 적합함), 또는 약 25개 이상의 아미노산 길이, 또는 약 50개 이상의 아미노산 길이, 또는 약 100개 이상의 아미노산 길이, 또는 약 150개 이상의 아미노산 길이, 또는 약 200개 이상의 아미노산 길이, 또는 약 250개 이상의 아미노산 길이, 또는 약 300개 이상의 아미노산 길이, 또는 약 350개 이상의 아미노산 길이, 또는 약 400개 이상의 아미노산 길이, 또는 약 450개 이상의 아미노산 길이, 또는 약 500개 이상의 아미노산 길이 등이거나 또는 전체 정수에서 그보다 더 긴 길이 (예, 8, 9, 10,...25, 26,...500, 501,...)이다. 단백질은 단백질의 일부, 도메인, 또는 그의 생물학적으로 활성인 또는 유용한 단편, 또는 전장 단백질 또는 도메인에 더하여 필요하다면 추가의 서열 (예, 융합 단백질 서열)을 포함할 수 있다는 점에서, 실제적인 제한 이외에 상기 단백질의 최대 크기에 대한 제한은 없다.
본 발명의 다른 실시양태는 본원에 기재된 임의의 단백질 (이러한 임의의 단백질의 상동체 또는 단편을 포함함)을 코딩하는 핵산 서열 및 이 서열과 완전히 상보적인 핵산 서열을 포함하거나, 이들 서열로 본질적으로 이루어지거나, 또는 상기 서열들로 이루어지는 단리된 핵산 분자에 관한 것이다. 본 발명에 따라, 단리된 핵산 분자는 천연에 존재하는 핵산 분자가 있는 게놈 또는 염색체인 천연 환경으로부터 제거된 (즉, 인간에 의해 조작처리된) 핵산 분자이다. 이와 같이, "단리된"은 핵산 분자가 정제되는 정도를 반드시 반영하는 것은 아니지만, 상기 핵산 분자가 천연에서 발견되는 핵산 분자가 있는 전체 게놈 또는 전체 염색체를 포함하지 않는다는 것을 나타낸다. 단리된 핵산 분자는 유전자를 포함할 수 있다. 유전자를 포함하는 단리된 핵산 분자는 이러한 유전자를 포함하는 염색체의 단편이 아니라, 오히려 유전자와 관련된 조절 영역 및 코딩 영역을 포함하되 천연에서 동일 염색체 상에 존재하는 추가의 유전자들을 포함하지 않으며, 단 핵산 분자가 코어 PUFA PKS 단백질을 코딩하는 경우, 본원에 기재된 바와 같은 PUFA PKS 시스템의 다른 단백질을 코딩하는 다른 유전자들은 제외한다. 단리된 핵산 분자는 또한 천연에서 특정 핵산 서열을 정상적으로 플랭킹하지 않는 추가의 핵산에 의해 (즉, 이 서열의 5' 및/또는 3'에서) 플랭킹된 특정 핵산 서열 (즉, 이종 서열)을 포함한다. 단리된 핵산 분자는 DNA, RNA (예, mRNA), 또는 DNA 또는 RNA의 유도체 (예, cDNA)를 포함할 수 있다. "핵산 분자"라는 구절이 주로 물리적인 핵산 분자를 지칭하며 "핵산 서열"이라는 구절은 주로 핵산 분자상의 뉴클레오티드의 서열을 지칭하지만, 이들 두 구절은 특히 단백질 또는 단백질의 도메인을 코딩할 수 있는 핵산 분자 또는 핵산 서열에 관하여 상호교환가능하게 사용될 수 있다.
바람직하게는, 재조합 DNA 기술 (예, 폴리머라제 연쇄 반응 (PCR) 증폭, 클로닝) 또는 화학적 합성을 이용해서 본 발명의 단리된 핵산 분자를 제조한다. 단리된 핵산 분자는, 목적하는 효과 (예를 들어, 단백질의 활성을 보유, 향상 또는 감소시킴)를 제공하는 방식으로 뉴클레오티드가 삽입, 결실, 치환 및/또는 역위된 천연 대립유전자 변이체 및 개질된 핵산 분자를 포함하지만 이에 한정되지 않는 천연 핵산 분자 및 그의 상동체를 포함한다. 단백질 상동체 (예, 핵산 상동체에 의해 코딩된 단백질)은 상기에 상세히 논의되어 있다.
핵산 분자 상동체는 당업자에게 공지된 다수의 방법을 이용해서 제조할 수 있다 (예를 들어, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press (1989)] 참조). 예를 들어, 핵산 분자는 전형적인 돌연변이유발 기술 및 재조합 DNA 기술, 예를 들면 부위-지시된 돌연변이유발, 핵산 분자를 화학적으로 처리해서 돌연변이를 유도하는 기술, 핵산 단편의 제한 효소 절단, 핵산 단편의 라이게이션, 핵산 서열의 선택된 영역의 PCR 증폭 및/또는 돌연변이유발, 올리고뉴클레오티드 혼합물의 합성 및 혼합물 군을 라이게이션하여 핵산 분자의 혼합물 및 그의 조합물을 "형성하는(build)" 기술을 포함하지만 이에 한정되지 않는 다양한 기술을 이용해서 개질시킬 수 있다. 핵산 분자 상동체는 핵산에 의해 코딩된 단백질의 기능에 대한 스크리닝에 의해 및/또는 야생형 유전자와의 혼성화에 의해 개질된 핵산의 혼합물로부터 선별될 수 있다.
본 발명의 핵산 분자의 최소 크기는 (예를 들어, 중간, 높은 또는 매우 높은 엄격도 조건하에) 본 발명의 핵산 분자의 상보적 서열과 안정한 하이브리드를 형성할 수 있는 프로브 또는 올리고뉴클레오티드 프라이머를 형성하기에 충분한 크기이거나 또는 본 발명에 따른 단백질의 생물학적 활성을 갖는 아미노산 서열을 코딩하기에 충분한 크기이다. 이와 같이, 상기 단백질을 코딩하는 핵산 분자의 크기는 핵산 조성 및 핵산 분자와 상보적 서열 사이의 퍼센트 상동성 또는 동일성, 및 혼성화 조건 그 자체 (예, 온도, 염 농도, 및 포름아미드 농도)에 따라 달라질 수 있다. 올리고뉴클레오티드 프라이머 또는 프로브로서 사용되는 핵산 분자의 최소 크기는 전형적으로는, 핵산 분자가 GC-풍부한 경우 적어도 약 12개 내지 약 15개의 뉴클레오티드 길이이며 핵산 분자가 AT-풍부한 경우 적어도 약 15개 내지 약 18개의 염기 길이이다. 본 발명의 핵산 분자가 단백질 또는 전장 단백질의 생물학적 활성 단편을 코딩하기에 충분한 서열을 포함할 수 있다는 점에서, 실제적인 제한 이외에 본 발명의 핵산 분자의 최대 크기에 대한 제한은 없다.
본 발명의 다른 실시양태는 재조합 벡터를 포함하는 재조합 핵산 분자 및 본원에 기재된 임의의 단백질의 생물학적 활성을 갖는 단백질 또는 펩티드를 코딩하는 핵산 서열을 포함한다. 이러한 핵산 서열은 상기에 상세히 기재되어 있다. 본 발명에 따라, 재조합 벡터는 선택된 핵산 서열을 조작하고 이러한 핵산 서열을 숙주 세포에 도입하기 위한 수단으로서 사용되는 조작된 (즉, 인공적으로 제조된) 핵산 분자이다. 따라서 재조합 벡터는, 예를 들어 선택된 핵산 서열을 숙주 세포로 발현 및/또는 전달하여 재조합 세포를 형성함으로써 선택된 핵산 서열을 클로닝, 서열화, 및/또는 다르게는 조작에 사용하기에 적합하다. 이러한 벡터는 전형적으로 천연에서 클로닝 또는 전달될 핵산 서열에 인접하여 존재하지 않는 핵산 서열인 이종 핵산 서열을 함유하지만, 상기 벡터는 또한 천연에서 본 발명의 핵산 분자에 인접하여 존재하거나 또는 본 발명의 핵산 분자의 발현에 유용한 조절성 핵산 서열 (예, 프로모터, 비번역 영역)을 함유할 수 있다 (하기에서 상세히 논의됨). 벡터는 RNA 또는 DNA, 원핵 또는 진핵일 수 있으며, 전형적으로는 플라스미드이다. 벡터는 염색체외 요소 (예, 플라스미드)로서 유지될 수 있거나 또는 재조합 생물체 (예, 미생물 또는 식물)의 염색체에 통합될 수 있다. 전체 벡터는 숙주 세포내에 잔류할 수 있거나, 또는 특정 조건하에서 플라스미드 DNA가 결실되어 본 발명의 핵산 분자를 남겨둘 수 있다. 통합된 핵산 분자는 염색체 프로모터 조절하에, 천연 또는 플라스미드 프로모터 조절하에, 또는 조합된 여러 프로모터 조절하에 있을 수 있다. 단일 카피 또는 여러 카피수의 핵산 분자가 염색체로 통합될 수 있다. 본 발명의 재조합 벡터는 하나 이상의 선택가능한 마커를 함유할 수 있다.
한 실시양태에서, 본 발명의 재조합 핵산 분자에서 사용된 재조합 벡터는 발현 벡터이다. 본원에 사용된 바와 같이, "발현 벡터"라는 구절은 코딩된 생성물 (예, 대상 단백질)의 제조에 적합한 벡터를 지칭하는데 사용된다. 상기 실시양태에서, 제조될 생성물 (예, PUFA PKS 도메인 또는 단백질)을 코딩하는 핵산 서열을 재조합 벡터에 삽입해서 재조합 핵산 분자를 제조한다. 제조될 단백질을 코딩하는 핵산 서열은, 재조합 숙주 세포내에서의 상기 핵산 서열의 전사 및 번역을 가능케하는 벡터에서 상기 핵산 서열을 조절 서열에 작동적으로 연결시키는 방식으로 벡터에 삽입한다.
다른 실시양태에서, 본 발명의 재조합 핵산 분자에 사용된 재조합 벡터는 표적화 벡터이다. 본원에 사용된 바와 같이, "표적화 벡터"라는 구절은, 특정 핵산 분자가 숙주 세포 또는 미생물내의 내생성 유전자 또는 유전자의 일부를 결실, 불활성화 또는 대체하는데 사용 (즉, 표적화된 유전자 파괴 또는 녹아웃 기술에 사용)되는 것인 상기 핵산 분자를 재조합 숙주 세포로 전달하는데 사용되는 벡터를 지칭하는데 사용된다. 이러한 벡터는 또한 당업계에서 "녹아웃" 벡터로 공지되어 있을 수 있다. 상기 실시양태의 한 측면에서, 벡터의 일부, 보다 전형적으로 말하자면 벡터에 삽입된 핵산 분자 (즉, 삽입물)은 숙주 세포내의 표적 유전자 (즉, 결실 또는 불활성화되도록 표적화된 유전자)의 핵산 서열과 상동성인 핵산 서열을 갖는다. 벡터 삽입물의 핵산 서열은, 표적 유전자 및 삽입물이 상동성 재조합을 수행하여 내생성 표적 유전자가 결실, 불활성화, 약화 (즉, 돌연변이 또는 결실되는 내생성 표적 유전자의 적어도 일부에 의해), 또는 대체될 수 있도록, 상기 표적 유전자와 관련되도록 설계된다. 이러한 유형의 재조합 벡터를 사용해서 예를 들어 내생성 쉬조키트리움 유전자를 재조합 유전자로 대체하는 것은 본 발명자들에 의해 앞서 기술되었으며, 트라우스토키트리드의 유전적 형질전환에 대한 일반적인 기술은 미국 특허 출원 공개 제20030166207호 (공개일: 2003년 9월 4일)로서 공개된 미국 특허 출원 제10/124,807호에 상세히 기재되어 있다. 식물에 대한 유전적 형질전환 기술은 당업계에 잘 알려져 있다.
전형적으로, 재조합 핵산 분자는 하나 이상의 발현 조절 서열에 작동적으로 연결된 본 발명의 하나 이상의 핵산 분자를 포함한다. 본원에 사용된 바와 같이, "재조합 분자" 또는 "재조합 핵산 분자"라는 구절은 주로 발현 조절 서열에 작동적으로 연결된 핵산 분자 또는 핵산 서열을 지칭하지만, 본원에 논의된 바와 같은 재조합 핵산 분자인 "핵산 분자"와 상호교환가능하게 사용될 수 있다. 본 발명에 따라, "작동적으로 연결된"이라는 구절은 핵산 분자가 숙주 세포에 트랜스펙션된 (즉, 형질전환된, 형질도입된(transduced), 트랜스펙션된, 컨쥬게이션된 또는 컨 Z선된(conduced)) 경우 발현될 수 있도록 하는 방식으로 상기 핵산 분자를 발현 조절 서열 (예, 전사 조절 서열 및/또는 번역 조절 서열)에 연결하는 것을 지칭한다. 전사 조절 서열은 전사의 개시, 연장 또는 종결을 조절하는 서열이다. 특히 중요한 전사 조절 서열은 전사 개시를 조절하는 서열, 예를 들면 프로모터, 인핸서, 오퍼레이터 및 리프레서 서열이다. 적합한 전사 조절 서열은 재조합 핵산 분자가 도입되는 숙주 세포 또는 생물체에서 기능할 수 있는 임의의 전사 조절 서열을 포함한다.
본 발명의 재조합 핵산 분자는 또한 추가의 조절 서열, 예를 들면 번역 조절 서열, 복제 기점, 및 재조합 세포에 적합한 다른 조절 서열을 함유할 수 있다. 한 실시양태에서, 숙주 세포 염색체에 통합되는 것들을 비롯한 본 발명의 재조합 분자는 또한 발현된 단백질이 단백질을 제조하는 세포로부터 분비될 수 있도록 하는 분비 신호 (즉, 신호 세그먼트 핵산 서열)을 함유한다. 적합한 신호 세그먼트는 본 발명에 따른 단백질의 분비를 지시할 수 있는 임의의 이종 신호 세그먼트 또는 발현될 단백질과 본래 관련이 있는 신호 세그먼트를 포함한다. 다른 실시양태에서, 본 발명의 재조합 분자는 발현된 단백질이 숙주 세포막으로 전달 및 삽입되도록 하는 리더 서열을 포함한다. 적합한 리더 서열은 단백질과 본래 관련이 있는 리더 서열 또는 단백질이 세포막으로 전달 및 삽입되도록 지시할 수 있는 임의의 이종 리더 서열을 포함한다.
본 발명의 한가지 이상의 재조합 분자를 사용해서 본 발명의 코딩된 생성물 (예, ACoAS)을 제조할 수 있다. 한 실시양태에서, 코딩된 생성물은 본원에 기재된 바와 같은 핵산 분자를 단백질 제조에 효과적인 조건하에서 발현시킴으로써 제조된다. 코딩된 단백질을 제조하는 바람직한 방법은 숙주 세포를 하나 이상의 재조합 분자로 트랜스펙션시켜 재조합 세포를 형성시키는 것이다. 트랜스펙션에 적합한 숙주 세포로는 트랜스펙션시킬 임의의 세균성, 진균 (예, 효모), 원생생물, 미세조류, 조류, 곤충, 식물 또는 동물 세포를 들 수 있지만 이에 한정되지 않는다. 본 발명의 한 실시양태에서, 바람직한 숙주 세포는 식물 숙주 세포이다. 숙주 세포는 트랜스펙션되지 않은 세포이거나 또는 하나 이상의 다른 재조합 핵산 분자로 이미 트랜스펙션된 세포일 수 있다.
본 발명에 따라, "트랜스펙션"이라는 용어는 외생성 핵산 분자 (즉, 재조합 핵산 분자)가 세포로 삽입될 수 있는 임의의 방법을 지칭하는데 사용된다. "형질전환"이라는 용어는 이 용어가 핵산 분자의 미생물 세포, 예를 들면 조류, 세균 및 효모로의 또는 식물 세포로의 도입을 지칭하는데 사용되는 경우 "트랜스펙션"이라는 용어와 상호교환가능하게 사용될 수 있다. 미생물 및 식물 시스템에서, "형질전환"이라는 용어는 미생물 또는 생물이 외생성 핵산을 획득됨으로 인해 발생되는 고유한 변화를 기술하는데 사용되며, 본질적으로는 "트랜스펙션"이라는 용어와 동의어이다. 그러나, 동물 세포에서, 형질전환은 예를 들어 배양물 중의 세포가 암성으로 된 후에 상기 세포의 성장 특성 변화를 지칭할 수 있는 다른 의미를 갖는다. 따라서, 혼동을 피하기 위해, "트랜스펙션"이라는 용어는 바람직하게는 외생성 핵산의 동물 세포로의 도입과 관련하여 사용되며, 본원에서는 "트랜스펙션"이라는 용어가 일반적으로 동물 세포의 트랜스펙션, 및 미생물 세포 또는 식물 세포의 형질전환을 (이들 용어가 외생성 핵산의 세포로의 도입과 관련되는 정도로) 포함하도록 사용될 것이다. 따라서, 트랜스펙션 기술로는 형질전환, 입자 충격(particle bombardment), 확산, 능동 수송, 조 초음파처리, 전기천공, 미세주입, 리포펙션, 흡착(adsorption), 감염 및 원형질체 융합을 들 수 있지만 이에 한정되지 않는다.
당업자라면 재조합 DNA 기술을 이용해서 예를 들어 숙주 세포내의 핵산 분자의 카피수, 핵산 분자가 전사되는 효율, 생성된 전사체가 번역되는 효율 및 번역후 개질 효율을 조작함으로써 트랜스펙션된 핵산 분자의 발현 조절을 향상시킬 수 있음을 이해할 것이다. 추가로, 프로모터 서열을 유전적으로 조작하여 천연 프로모터에 비해 발현 수준을 향상시킬 수 있다. 핵산 분자의 발현을 조절하는데 유용한 재조합 기술로는 핵산 분자의 하나 이상의 숙주 세포 염색체로의 통합, 벡터 안정성 서열의 플라스미드로의 부가, 전사 조절 신호 (예, 프로모터, 오퍼레이터, 인핸서)의 치환 또는 개질, 번역 조절 신호 (예, 리보좀 결합 부위, 샤인-달가노(Shine-Dalgarno) 서열)의 치환 또는 개질, 숙주 세포의 코돈 용법에 상응하는 핵산 분자의 개질, 및 전사체를 불안정화하는 서열의 결실을 들 수 있지만 이에 한정되지 않는다.
본원의 개시내용을 고려하면 생활성 분자의 제조에 유용한 다수의 유전적 개질은 당업자에게 자명할 것이며, 본원에서는 다양한 다른 변형들이 앞서 논의되었다. 본 발명은 목적하는 생활성 분자를 제조하는 본원에 기재된 바와 같은 PUFA PKS 시스템 및/또는 부속 단백질에 관련된 임의의 유전적 개질을 고려한다.
본 발명에 따른 생활성 분자는 생물학적 활성을 가지며 PUFA PKS 시스템에 의해 제조될 수 있는 임의의 분자 (화합물, 생성물 등)를 포함한다. 이러한 생활성 분자는 다불포화 지방산 (PUFA), 항염증성 제제, 화학치료제, 활성 부형제, 골다공증 약물, 항우울제, 항경련제, 항-헬레코박터 파이로리 약물, 신경퇴행성 질환 치료용 약물, 퇴행성 간 질환 치료용 약물, 항생제, 및 콜레스테롤 저하용 제제를 포함할 수 있지만 이에 한정되지 않는다. 본 발명의 PUFA PKS 시스템의 한가지 이점은 이러한 시스템이 시스 배치의 탄소-탄소 이중 결합 및 3개의 탄소마다 이중 결합을 포함하는 분자를 도입하는 능력이다. 이러한 능력은 다양한 화합물을 제조하는데 이용될 수 있다.
본원에 언급된 각 간행물, 특허 또는 특허 출원은 그 전체 개시내용이 본원에 참고로 도입된다.
하기 실시예는 예시를 목적으로 제공된 것이며 본 발명의 범위를 제한하고자 하는 것은 아니다.
[실시예]
실시예에 대한 일반적인 도입. PUFA 신타제를 코딩하는 유전자들은 해양 세균 및 트라우스토키트리드 종에서 확인되었다. 이들 유전자의 여러 세트가 이. 콜라이에서 발현되었으며, 적절한 PPTase와 함께 공급되는 경우에는 이들 효소의 특정 PUFA 생성물이 상기 세포내에 축적될 수 있다. 그러나, 본 발명자들이 알고있는 바로는, 상기 효소로부터 PUFA를 방출시키는 방법은 기존에는 기술된 바 없었다. 방출 메카니즘은 이종 숙주 생물체에서 PUFA 신타제 시스템의 발현과 관련된 용도를 갖는다. 상기 메카니즘은 또한 상기 시스템을 통한 탄소의 흐름 및 이종 또는 천연 숙주 생물체 중에 축적되는 PUFA의 최종적인 양을 조절하는데 목적이 있는 연구들에 대하여 방향성을 제공할 수 있다. 여기서 본 발명자들은 쉬조키트리움 PUFA 신타제 (및 이론에 얽매이고자 하는 것은 아니지만 모든 트라우스토키트리드 PUFA PKS 시스템을 비롯한 모든 진핵생물 PUFA 신타제 시스템일 수 있음)의 생성물이 유리 지방산이며, 유리 지방산의 방출은 효소 복합체 자체에 대해 필수적이라는 것을 보여준다. 추가로, 쉬조키트리움에서 PUFA FFA는 인지질 (PL) 및 트리아실글리세롤 (TAG)로 진입하기에 앞서 CoA로 에스테르화된다. 하기 실시예에 기재된 데이터는 이종 숙주 생물체에서의 발현을 위한 전략 및 천연 숙주 생물체에서의 PUFA 축적의 변경을 위한 전략을 나타낸다.
실시예
1
본 실시예는 생화학적 연구를 위한 쉬조키트리움 FAS 녹아웃 균주의 생성을 기술한다.
쉬조키트리움은 단쇄 포화 지방산의 제조를 담당하는 FAS 효소를 코딩하는 단일 거대 유전자를 함유한다 (미국 특허 출원 공개 제20050191679 A1호에 기재됨). 쉬조키트리움 FAS 녹아웃 (FAS-KO) 구조물은 미국 특허 제7,001,772호에 기재된 절차를 이용해서 제조하였다. FAS Orf의 대부분을 함유하는 게놈 DNA의 약 10.0 kB EcoRV 단편 (추정된 ATG 개시 코돈의 하류 약 728 bp로부터 종결 코돈의 하류 약 680 bp까지임)을 스트라타진 블루스크립트(Stratagene bluescript) 벡터 (pBSK)내의 다중 클로닝 영역의 EcoRV 부위에 클로닝하였다. 약 3.5 kB의 내부 BglII 단편을 클로닝된 쉬조키트리움 DNA로부터 제거하고, Zeocin 내성 카세트를 함유하는 pTubZeo11-2로부터의 약 1.1 kB BamHI 단편으로 대체하였다 (미국 특허 제7,001,772호, 상기 문헌 참조). 이 플라스미드 (pJK878)를 입자 폭격에 의해 쉬조키트리움의 세포 벽 결핍 균주 (Ac66으로 표시됨)에 도입하였다. Zeocin을 함유하며 팔미트산이 보충된 배지상에 플레이팅함으로써 형질전환체를 1차 선별하였다. 팔미트산이 보충되지 않은 플레이트에서의 성장 실패에 의해 선별하는 제2 선별을 이용해서, FAS 게놈 영역의 일부가 Zeocin 내성 카세트에 의해 대체된 것인 잠재적인 이중 교차 반응을 확인하였다. PCR 및 서던 블롯 분석을 이용해서 형질전환체 (표지된 FAS-KO) 중 하나가 예상된 게놈 구조를 가짐을 확인하였다. 이 균주는 500 uM 팔미트산이 보충된 배지 중에서 성장시킴으로써 유지하였다. 유사한 전략, 즉 쉬조키트리움 PUFA 신타제의 서브유닛을 코딩하는 유전자들의 하나에 Zeocin 내성 카세트를 삽입하는 전략을 이용해서 쉬조키트리움 Ac66 균주내의 효소를 불활성화할 수 있었다. 이 경우, 배지에 500 uM DHA를 보충하였다. 이들 균주의 전체 세포 및 세포 무함유 추출물을 이후의 생화학적 연구에 사용하였다 (하기 실시예 참조).
실시예
2
하기 실시예는 쉬조키트리움 Ac66의 세포 무함유 추출물 및 쉬조키트리움 Ac66으로부터 유도된 PUFA 신타제 KO 및 FAS-KO 균주의 제조에 대한 일반적인 프로토콜을 기술한다.
쉬조키트리움의 세포벽 결핍 균주로부터의 세포 무함유 균질물 (CFH)의 제조를 위한 프로토콜의 예는 다음과 같다. 세포를 A50-3 배지에서 성장시킨 다음, M2B 배지 중으로 희석시켰다. KO 균주를 성장시키는데 사용된 배지에 적절한 지방산을 보충하였다. 세포를 M2B 배지 중에서 OD600nm 약 2.5 초과 약 5 미만으로 성장시켰다. 배양 배지 50 mL 중의 세포를 50 mL 플라스틱 튜브에서 원심분리 (테이블 탑 원심분리 - 약 1200 rpm x 4 분)에 의해 수집하였다. 상등액을 따라내고, 세포를 5 mL 완충액 A (100 mM 포스페이트 pH 7.2, 10% (w/v) 글리세롤, 1 mM EDTA 및 2 mM DTT) 중에 재현탁시키고, 상기와 같이 원심분리하였다. 상등액을 따라내고, 세포를 빙냉 5 mL 완충액 A 중에 재현탁시켰다. 현탁액을 초음파처리 (마이크로팁을 갖는 울트라소닉 프로세서 모델(Ultrasonic Processor Model) GE130, 펄스 간격 2초, 전력 설정 약 1 와트(Watt))하고, 얼음상 튜브에 1.5분 동안 두었다. 샘플을 현미경으로 조사해서 모든 세포가 파괴되었음을 확인하였다. CFH를 200 uL 분액씩 분취하여 마개가 있는 0.5 mL PCR 튜브에 넣고, 액체 N2에 넣어 동결시켰다. 샘플을 필요시까지 -74℃에서 보관하였다.
실시예
3
본 실시예는 시험관내 FAS 및 PUFA 신타제 활성 검정에 대한 일반적인 조건을 기술한다.
FAS 및 PUFA 신타제 활성 둘 다의 시험관내 활성 검정에 대한 프로토콜의 예는 다음과 같다. 100 uL의 최종 부피로, 효소 제제 및 완충액 A (이들 두 성분의 부피 = 90 uL)에 더하여 (10 uL의) 혼합물로서 첨가된 하기 성분들을 혼합하여 괄호안에 표시된 최종 농도를 얻는다: 말로닐-CoA (50 uM - 냉각 및 말로닐-2-14C-CoA의 혼합물, 방사성표지의 최종 농도는 0.65 μCi/mL임), NADH (1 mM), NADPH (1 mM) 및 아세틸-CoA (10 uM). 이들 성분들 및 추가의 성분들은 특정 실험 요건에 따라 조정될 수 있다. 검정 반응은 실온 (약 21℃) 수조내의 유리 튜브 중에서 수행된다. 인큐베이션 시간은 실험 요건에 따라 달라진다. 처리(work-up) 프로토콜에 따라 상기 두 방법들 중 하나를 이용해서 반응을 중지시킨다. 산성 방법을 이용해서 지방산을 지방산 메틸-에스테르 (FAME)로 전환시키는 경우, 반응은 FAME 시약을 첨가하여 중단시킨다 (하기 참조). 유도체화 없이 지질을 추출하는 경우, 이소프로판올/아세트산 (4:1 v/v) 125 uL를 가하여 반응을 중단시킨다 (하기 참조).
산성 FAME 프로토콜: 메탄올 중 4% HCl 2.0 mL에 더하여 톨루엔 50 uL를 가하여 반응을 종결시키고, 테플론(Teflon) 라이닝된 마개가 있는 유리 튜브를 밀봉하고, 100℃에서 1 시간 동안 가열한다. 실온으로 냉각시키고, 헥산 1.0 mL 및 물 0.5 mL를 가하고, 볼텍싱한 다음, 분리되도록 한다. 필요하다면, 액체 섬광 계수 (LSC)를 위해 일부를 제거한다. 유기상 약 600 uL를 새로운 튜브에 전달하고, N2하에 용매를 제거한다. 잔류물을 헥산 50 uL 중에 용해시키고, 실리카게 겔 60 A TLC 플레이트 (헥산:디에틸-에테르:아세트산 - 70:30:2로 전개시킴) 또는 10% AgNO3/90% 아세토니트릴 중에 함침된 실리카 겔 G 플레이트 (사용에 앞서 100℃에서 30분 동안 활성화됨) (w/ 헥산:디에틸-에테르/아세트산 - 70:20:2로 전개시킴) 상에 스폿팅한다. 플레이트가 공기 건조되도록 하고, 포스포르이미지화 기술을 이용해서 방사활성 면적을 검출한다.
HIP 프로토콜 - 유도체화되지 않은 지질의 추출: 상기 나타낸 바와 같이, 이소프로판올:아세트산 (4:1 v/v) 125 uL를 가한 다음 헥산:이소프로판올 (3:2, v/v) 2 mL를 가하여 반응을 중단시키고, 볼텍싱한 다음, 6.7 % (w/v) 황산나트륨 1 mL를 가하고, 다시 볼텍싱한다. 상이 분리되도록 한다. 필요하다면, LSC를 위해 (상부) 유기 상의 일부를 제거한 다음, 나머지 (약 1.0 mL)를 새로운 튜브에 전달한다. 용매를 N2로 제거하고, 잔류물을 헥산 50 uL 중에 용해시킨다. 샘플을 실리카 겔 60 A TLC 플레이트 상에 스폿팅하고, 헥산:디에틸-에테르:아세트산 (70:30:2)으로 전개시킨다. 플레이트가 공기 건조되도록 하고, 포스포르이미지화 기술을 이용해서 방사활성 면적을 검출한다.
실시예
4
하기 실시예는 FAS 및 PUFA 신타제 활성의 시험관내 검정 결과를 기술한다.
쉬조키트리움 Ac66 및 쉬조키트리움 Ac66으로부터 유도된 PUFA 신타제 KO 및 FAS-KO 균주의 CFH를 제조하고, 상기 기재된 바와 같이 산성 FAME 및 은 TLC 프로토콜을 이용해서 FAS 및 PUFA 신타제 활성에 대해 검정하였다. 도 1은 이러한 검정의 결과를 나타낸다. TLC 플레이트의 영상에서 표지된 밴드는 FAME에 혼입된 방사활성을 나타낸다 (표준물을 이용한 공동이동(co-migration) 및 HPLC 분리에 의해 확인됨). 레인 1 및 2는 Ac66 모체(parental) 균주로부터의 추출물을 이용해서 얻어진 프로필을 나타낸다. FAS (14:0 및 16:0 FAME) 및 PUFA 신타제 (DHA 및 DPAn-6)의 생성물은 상기 레인에서 관찰될 수 있다. PUFA 신타제 효소가 불활성화된 경우에 얻어진 프로필은 레인 3 및 4에 나타나 있다. 이 경우, DHA 및 DPAn-6 FAME는 존재하지 않는다. FAS가 불활성화된 경우에 얻어진 프로필은 레인 5 및 6에 나타나 있다. 이 경우, FAS로부터 유도된 지방산, 즉 14:0 및 16:0 및 이들 지방산의 유도체는 소실되어 있다. 이러한 데이터는 상기 FAS-KO 균주에서 FAS 활성이 극심하게 또는 완전히 손상되었음을 나타낸다. FAS-KO 균주는 쉬조키트리움 PUFA 합성 및 축적 경로의 추가의 특성화를 위해 사용되었다.
실시예
5
하기 실시예는 쉬조키트리움에서 PUFA 합성의 추가의 특성화를 기술하며, 쉬조키트리움 PUFA 신타제의 초기 생성물이 유리 지방산 (FFA)이라는 증거를 제시한다.
산성 방법을 이용해서 시험관내 검정 반응 생성물을 FAME로 전환시키는 것은 말로닐-CoA로부터 지방산 잔기로 혼입된 방사활성을 결정하는데 있어서 유용하지만 그러한 유도체화에 앞서 상기 지방산의 분자 형태를 나타내지 않는다. 도 2는 FAS-KO 균주의 시험관내 검정의 시간 과정의 결과를 나타내며, 여기서 상기 기재된 HIP 프로토콜을 이용해서 (즉, 지방 아실 잔기의 메틸 에스테르로의 전환 없이) 지질을 추출한 다음, 정상 상 TLC를 사용해서 분리하였다. TAG 및 유리 지방산 (FFA) 표준물이 이동하는 플레이트상의 위치는 좌측에 나타나 있다. 이 TLC 시스템에서, 상이한 쇄 길이 및 불포화도의 FFA는 충분히 분리되지 않는다. 그러나, 이용된 균주는 FAS 활성 FFA가 거의 없거나 전혀 없기 때문에, 이 대역에서의 FFA는 PUFA 신타제 시스템으로부터 유도될 수 있다. 이러한 사실을 뒷받침하는 추가의 증거는 도 3에 나타나 있다. 여기서 시험관내 검정 동안 FFA 밴드에서의 방사활성의 출현은 NADPH의 첨가에 의존하는 것으로 나타난다. 대조적으로, NADH는 이러한 반응을 뒷받침하지 않는다. 환원제로서 NADPH에 대한 이러한 엄격한 의존성은 쉬바넬라 SCRC2738로부터 유도된 PUFA 신타제의 특징이기도 하다 (문헌 [Metz et al., Science 293:290-293 (2001)]의 도 2C). 도 2 및 3의 둘 다에서, FFA 밴드보다 약간 더 빠르게 이동하는 방사성표지된 밴드가 뚜렷하다 ('미지의 것'으로서 표지됨). 밴드의 출현은 환원제 (NADH 또는 NADPH - 레인 5, 도 3 참조)의 첨가와는 독립적이기 때문에, 이는 PUFA 신타제 활성과 관련되지 않을 수 있다. 추가로 이 밴드는 PUFA 신타제가 불활성화된 유사한 균주 분석 동안 검출될 수 있다 (데이터는 나타내지 않음). 도 2 및 3에서의 데이터는 쉬조키트리움 PUFA 신타제의 초기 생성물이 FFA임을 제안한다. 생성물로서 FFA를 방출하는 FAS 시스템 (예, 포유동물 FAS)에서, 그러한 FFA는 PL 또는 TAG로의 진입에 앞서 CoA로 에스테르화된다. FFA의 활성화는 ATP 및 Mg+2를 필요로 하는 반응에서 아실-CoA 신테타제에 의해 수행된다. 시험관내 반응의 시간 과정에서 늦은 TAG 분획 중 일부 방사활성의 출현은 (샘플 중의 잔류 ATP로 인해) 쉬조키트리움에서의 상기 경로와 일치한다. 이러한 개념을 추가로 시험하였다 (하기 참조).
실시예
6
하기 실시예는 쉬조키트리움의 PUFA 축적 경로에서 아실-CoA 신테타제 반응이 관여함을 뒷받침하는 증거를 제시한다.
쉬조키트리움 FAS-KO 유래의 샘플 중 시험관내 검정 생성물에 대한 ATP (2.5 mM) 및 Mg+2 (10 mM)의 첨가 효과는 도 4에 나타나 있다. 샘플을 표준 반응 혼합물 중에서 10분 동안 인큐베이션한 다음, ATP 및 Mg+2를 첨가하였다. ATP 및 Mg+2를 첨가한 후 다양한 시점 (즉, 0 = 첨가 없음, 10 및 30 초, 및 1, 3, 10 및 30 분)에서 반응을 중단시켰다. 이 시간 과정 동안 FFA 밴드와 관련된 방사성표지는 감소하며 TAG 밴드와 관련된 방사성표지 증가한다는 것을 알 수 있다. '미지의 것'으로 표지된 밴드와 관련된 방사성표지는 ATP의 첨가에 의해 영향을 받지 않는다. 상기 데이터는 표지된 FFA가 TAG 분획으로 이동하는데 있어서의 ATP 필요 반응의 관련성과 일치한다.
트리아스신 C는 장쇄 PUFA를 활성화하는 아실-CoA 신테타제의 특이적 억제제로서 특성화되었다 [Knoll et al., 1995]. FAS-KO 샘플의 시험관내 검정 동안 생성물 프로필에 대한 트리아스신 C의 효과를 시험하였다. 다양한 농도의 트리아스신 C를 함유하는 표준 혼합물 중에서 10분 동안 샘플을 인큐베이션한 다음, ATP 및 Mg+2를 첨가하였다. 반응을 추가의 20분 동안 진행시킨 다음 중단시키고, 지질을 추출하여 HIP 프로토콜을 이용한 TLC에 의해 분리하였다. 결과는 도 5에 나타나 있다. 더 높은 농도의 트리아스신 C의 첨가는 FFA 밴드로부터 방사성표지의 손실을 차단하였다. 이러한 결과는 상기 경로에서의 아실-CoA 신테타제의 관련성과 일치한다.
실시예
7
하기 실시예는 쉬조키트리움 Orf A, OrfBss (OrfB*), OrfC 및 Nostoc HetI을 발현시키는 이. 콜라이로부터의 추출물의 시험관내 검정을 기술한다.
상기 실시예에 나타낸 데이터는 쉬조키트리움에서의 PUFA가 TAG 및 PL로의 진입에 앞서 유리 지방산 형태로 전환된다는 것을 나타낸다. 유리 지방산으로서 PUFA의 방출이 PUFA 신타제 효소의 필수적인 부분이라는 것을 나타내는 데이터가 이 실시예에 제시되어 있다. 쉬조키트리움 천연 OrfA (서열 1로 나타낸 핵산 서열), OrfBss (또한 OrfB*로 표시됨; 서열 37로 나타낸 핵산 서열) 및 천연 OrfC (서열 5로 나타낸 핵산 서열)를 미국 특허 출원 공개 제20050100995호 (상기 문헌)에 기재된 바와 같이 pET 벡터내에 인공 오페론으로서 클로닝하고 이. 콜라이에서 발현시켰다. HetI을 pACYC 기재의 벡터내에 클로닝하고 상기 동일한 세포에서 발현시켰다. 세포를 O.D. 약 1로 성장시키고, IPTG를 (최종 농도 1 mM로) 첨가하여 T7 폴리머라제의 제조를 유도하였다. 대략 4 시간 인큐베이션한 다음, 세포를 수획하고, 완충액 A로 세척하고, 프렌치(French) 압력 셀에 2회 통과시켜 파열시켰다. 균질물의 분취액을 따로 두고, 나머지를 원심분리 (5k x g x 5분)시켜 상등액 1 (S1)을 얻었다. 또한, 분취액을 따로 두고, 나머지 물질을 100,000 x g에서 1 시간 동안 원심분리하여 고속 펠릿 (P2) 및 고속 상등액 (S2) 분획을 얻었다. 펠릿 분획을 완충액 A 중에서 최초 원심분리 튜브에 놓인 부피로 재현탁시켰다. 산성 FAME는 상 TLC 처리 또는 지질의 HIP 추출에 이어서 정상 상 TLC에서의 분리를 이용하는 상기 기재된 일반적인 방법을 이용해서 상기 분획 모두를 검정하였다. 도 6은 이들 검정의 결과를 나타낸다.
산성 FAME 분석 (도 6A)은 시험관내 검정의 주요 생성물이 DHA 및 DPAn-6임을 나타낸다. 가장 높은 활성을 갖는 분획은 S1 및 P2 분획에서 훨씬 적은 활성을 갖는 균질물이다. S2 분획에서 매우 적은 활성이 검출되었다. CFH 및 S1 분획의 경우에서도 FAS 시스템의 생성물의 매우 적은 증거가 검출될 수 있다는 것 (도 6A에서 16:0으로 표지된 화살표로 나타냄)은 관심의 대상이 된다. 이는 T7 시스템을 사용하는 경우에 높은 수준으로 발현되는 PUFA 신타제 효소 성분들로 인한 것일 수 있다. 대조적으로, 쉬바넬라 유래의 EPA 신타제를 코딩하는 코스미드를 함유하는 이. 콜라이로부터의 추출물 (CFH 및 S1)에 대해 유사한 검정을 수행한 경우, TLC 플레이트상의 방사활성의 대부분은 FAS 생성물과 관련이 있었다 [Metz et al., Science 293:290-293 (2001), 도 2B]. 또한, 내생성 이. 콜라이 FAS 시스템은 여러 개별적인 가용성 단백질로 이루어지며, FAS 활성은 고속 원심분리 후에 상등액 분획 중에 잔존한다 [Metz et al., Science 293:290-293 (2001), 도 2B]. 대조적으로, 도 6A에 나타낸 PUFA 신타제 활성은 고속 원심분리 후에 펠릿 분획으로 분배된다.
도 6B의 데이터는, 지질 생성물이 TLC에 의한 분리에 앞서 (FAMES로 전환되기보다는) HIP로 추출되었다는 점을 제외하면, 도 6A에서 사용된 동일한 이. 콜라이 균주 샘플의 검정 결과를 나타낸다. CFH (도면의 좌측) 및 P2 (우측)의 두가지 분획을 사용하였다. 검정에 사용된 추출물의 양은, 상기 두 경우에서 대략 동일한 양의 방사활성이 지질로 혼입되도록 조정되었다. 또한 검정 혼합물의 환원제 성분 (NADH 및/또는 NADPH)이 다음과 같이 달라진 경우에 대한 결과가 나타나 있다: 레인 1 - NADPH 단독, 레인 2 - NADPH 단독, 레인 3 - NADH 및 NADPH 둘 다, 및 레인 4 - 각 성분을 함유하는 스톡 용액 대신 물을 첨가함. 도 6B의 데이터는 TLC 플레이트 상에서 이동하는 방사성표지의 대부분이 유리 지방산 표준물과 함께 이동한다는 것을 보여준다. 또한, 주요 (FFA) 밴드의 출현은 검정 혼합물로 첨가되는 NADPH에 의존한다. NADPH에 대한 요구 및 상기 분획 (특히 P2 분획)에서 유의한 FAS 활성의 결여는 FFA가 PUFA 신타제 효소의 생성물임을 나타낸다. 쉬조키트리움 (Orf A, B 및 C를 코딩함) 유래의 세가지 유전자들만이 (HetI과 함께) 상기 이. 콜라이 균주에서 발현되었기 때문에, 데이터는 신타제로부터의 PUFA 방출이 상기 효소의 고유한 특징이며 별도의 티오에스테라제 효소로 인한 것이 아님을 나타낸다.
상기 실시예에 중요한 측면이 제시되어 있는 다양한 데이터는 쉬조키트리움에서 다음과 같은 PUFA 합성 및 축적의 특징을 나타낸다. DPAn-6 및 DHA 둘 다를 담당하는 PUFA 신타제는 미국 특허 6,566,583호, 문헌 [Metz et al., Science 293:290-293 (2001)], 미국 특허 출원 공개 제20020194641호, 및 PCT 공개 제WO 2006/135866호에 기재된 바와 같은 Orf A, B 및 C에 의해 코딩된다. 서브유닛 A의 ACP 도메인은 내생성 PPTase에 의해 활성화된다. 합성 반응은 탄소 공급원으로서 말로닐-CoA를 이용하고 (아세틸-CoA는 필요하거나 필요하지 않을 수 있음), 환원제로서 NADPH를 이용한다. PUFA 생성물은 효소로부터 FFA로서 방출되며, 이러한 방출은 상기 효소 자체의 고유한 특징이다. FFA는 하나 이상의 내생성 아실-CoA 신테타제에 의해 촉매되는 ATP 의존적 반응에서 CoA로 에스테르화된다. 이후, PUFA-CoA는 PL 및 TAG 합성 효소를 위한 기질로서 작용한다.
실시예
8
하기 실시예는 제빵용 효모에서 HetI과 함께 쉬조키트리움 PUFA 신타제 (sOrf A, sOrfB 및 천연 OrfC, 하기 참조)를 코딩하는 유전자들의 발현을 나타낸다.
인비트로젠(Invitrogen)사로부터 얻은 물질을 사용해서 효모에서 쉬조키트리움 PUFA 신타제 유전자들 및 HetI을 발현시켰다. 사카로마이세스 세레비지애의 INVsc1 균주를 하기 형질전환 벡터와 함께 사용하였다: pYESLeu (sOrfA, 서열 35, 이는 서열 2를 코딩함), pYES3/CT (sOrfB, 서열 36, 이는 서열 4를 코딩함), pYES2/CT (OrfC, 서열 5, 이는 서열 6을 코딩함) 및 pYESHis (HetI, 서열 33, 이는 서열 34를 코딩함). 일부 벡터가 특정 클로닝 요건을 수용하도록 개질시켰다. 특정 실험에 따라 적절한 선별 배지를 사용하였다. 각 경우에서 GAL1 프로모터 뒤쪽에 유전자들을 클로닝하였으며, 세척된 세포를 인비트로젠사에 의해 제공된 가이드라인에 따라 갈락토스를 함유하는 배지 중에 재현탁시켜 발현을 유도하였다. 세포를 30℃에서 성장시키고, 유도 배지로 전달한 다음 표시된 시간에서 (원심분리에 의해) 수획하였다. 세포 펠릿을 동결 건조시키고, 산성 메탄올을 사용해서 FAME를 제조하고, 헥산 중으로 추출하고, GC에 의해 분석하였다.
예비 실험에서는 천연 형태의 OrfA (서열 1) 및 약간 변경된 천연 형태의 OrfB (OrfB*, 서열 37) (효모에서)가 예상된 크기의 단백질을 제조하지 않은 것으로 나타났다 (또한 정확한 mRNA가 검출되지 않았음). 대조적으로, 예상된 크기의 단백질은 천연 형태의 OrfC (서열 5)가 발현된 세포에서 검출되었다. OrfA 및 B를 코딩하는 유전자들은 이들의 코돈 용법이 효모에 의해 관용되는 것들과 보다 일치하도록 재합성되었다 (재합성은 블루 헤론, 인크.(Blue Heron, Inc.)사에 의해 수행되었음). 이 합성 유전자들을 본원에서 sOrfA (서열 35) 및 sOrfB (서열 36)로 나타낸다. 효모에서 상기 유전자들의 발현은 각각 Orf A 및 B의 예상 크기에 상응하는 단백질을 축적시켰다.
도 7은 쉬조키트리움 PUFA 신타제 시스템 (sOrfA, sOrfB, OrfC 및 HetI)을 발현시키는 효모 세포로부터의 지방산 프로필과 대조군 세포 (sOrfA 유전자가 결여됨)로부터 얻어진 지방산 프로필의 비교를 나타낸다. 유도 후 약 20시간의 시점에서 세포를 수획하였다. 나타난 2개의 신규 FAME 피크는 완전한 PUFA 신타제 시스템을 발현시키는 균주의 프로필임을 알 수 있다. 이들 2개의 피크는 진정(authentic) 표준물과의 용출 시간의 비교 및 이후의 MS 분석에 의해 DPAn-6 및 DHA로서 확인되었다. 본 발명자들에 의한 쉬조키트리움 PUFA 신타제의 특성화로부터 예상된 바와 같이, 프로필에서 DHA 및 DPAn-6 이외에 다른 신규 피크는 분명하지 않았다.
도 8은 PUFA FAME를 함유하는 도 7의 GC 크로마토그램의 영역을 나타낸다. 대조군 세포 및 PUFA 신타제를 함유하는 세포는 둘 다 DHA FAME 근처에서 용출하는 피크를 함유한다. 이 피크는 C26:0 FAME로서 확인되었으며, (참고문헌을 토대로) 스핑고지질로부터 유래한다. 이는 DHA 피크 가까이에서 용출되지만, DHA의 정량화를 방해하지 않게끔 해상도가 충분하다. DPAn-6 피크는 FAME 프로필에서 다른 내생성 효모 지질로부터 충분히 분리된다. 이러한 특정 예에서, 쉬조키트리움 PUFA 신타제 시스템을 발현시키는 세포는 (총 FAME의 비율로서) 2.4% DHA 및 2.0% DPAn-6를 축적시켰다. DHA 및 DPAn-6의 합계 = 세포내에서 측정된 지방산의 4.4%. 세포에서 관찰된 DHA 대 DPAn-6의 비율은 약 1.2:1이었다.
효모에서 쉬조키트리움 PUFA 신타제의 발현을 나타내는 상기 제시된 결과는 상기 경우들에서 제안된 경로, 및 효모 및 또한 식물에서 예상될 수 있는 지방산 프로필에 대한 변화 측면에서의 예상을 제공한다.
실시예
9
하기 실시예는 쉬조키트리움 PUFA 신타제를 발현시키는 효모에서 특이적 아실-CoA 신테타제를 공동발현시킴으로써 PUFA의 축적을 증가시키는 것에 대하여 기술한다.
본 발명자들은 쉬조키트리움에서 PUFA 신타제의 FFA 생성물이 내생성 아실-CoA 신테타제(ACoAS)에 의해 아실-CoA로 효율적으로 전환됨을 보여주었다 (상기 실시예 참조). EST 데이터베이스를 조사함으로써, 본 발명자들은 PUFA의 상응하는 아실-CoA로의 전환에 관여할 수 있는 9가지 추정의 ACoAS를 확인하였다.
요컨대, 본 발명자들은 공지된 (또는 예상된) ACoAS 활성을 갖는 단백질에 대해 상동성을 나타내는 EST에 대한 다양한 cDNA 라이브러리로부터 채집된 콜로니로부터 단리된 약 20,000개의 플라스미드로부터 얻어진 서열로 이루어진 쉬조키트리움 EST 데이터베이스를 조사하였다. 본 발명자들은 벡터NTI 프로그램, 콘티그 익스프레스(Express)를 사용해서 이들을 콘티그로 조립하고 (둘 이상의 중복되는 서열이 이용가능한 경우) 개별적인 서열정보의 양을 기초로 편집하였다. 이러한 연구의 결과는 다음과 같이 요약된다. 8개의 상이한 콘티그 및 1개의 콘티그 (데이터베이스내 중복되는 서열이 없음)가, PUFA 신타제를 상응하는 아실-CoA로 효율적으로 전환시킬 수 있는 ACoAS 효소와 관련되는 후보인 것으로 확인되었다. EST 데이터 세트를 가이드로 사용해서, 각 후보에 대한 완전한 코딩 영역의 서열을 얻고, 다양한 표준 방법 (예, 게놈 DNA의 서브클론 및 게놈 DNA로부터 유도된 PCR 생성물의 서열화)을 이용해서 확인하였다.
쉬조키트리움 아실- CoA 신테타제 ( ACS ) 코딩 서열 및 추론된 번역물:
1. 길이 = 뉴클레오티드 2004개 (종결 코돈을 포함하지 않음) (서열 82). 이는 668개의 아미노산 (서열 83), 73.5 kDa, 단백질을 코딩하는 것으로 예상된다. 단백질 서열은 공지된 ACS와 양호한 상동성을 갖는다. 최적의 블라스트 대응은 특성화되었으며 DHA와 높은 활성을 갖는 것으로 나타난 탈라시오시라 슈도난나(Thalassiosira pseudonanna) ACS (TplacA, 기탁 번호: AAW58006)에 대한 것이다 [Tonon et al., Plant Physiol. 2005 May;138(1):402-8). 서열 83의 C-말단의 3개의 아미노산은 SKL (단백질을 페록시좀으로 표적화하는 것과 관련된 모티프)이다. 이러한 C-말단의 모티프는 또한 상기 언급된 탈라시오시라 슈도난나 ACS에 존재한다.
2. ScACS -2 (또한 ScACoAS -2 또는 ACS -2로 표시됨): 길이 = 2340개 (종결 코돈을 포함하지 않음)의 뉴클레오티드 (서열 84). 이는 780개의 아미노산 (서열 85), 84.7 kDa 단백질을 코딩하는 것으로 예상된다. 추정의 단백질의 대부분에 대하여 인간의 예, 리피도신(Lipidosin) 및 버블 검(Bubble Gum)을 비롯한 공지된 ACS와 양호한 상동성이 존재한다.
3. ScACS -3 (또한 ScACoAS -3 또는 ACS -3으로 표시됨): 길이 = 2526개 (종결 코돈을 포함하지 않음)의 뉴클레오티드 (서열 86). 이는 842개의 아미노산 (서열 87), 90.6 kDa 단백질을 코딩하는 것으로 예상된다. 추정의 단백질 (특히 중심의 약 700개의 아미노산)의 대부분에 대하여 버블 검 유형 ACS 단백질과 양호한 상동성이 존재한다.
4. ScACS -4 (또한 ScACoAS -4 또는 ACS -4로 표시됨): 길이 = 2037개 (종결 코돈을 포함하지 않음)의 뉴클레오티드 (서열 88). 이는 679개의 아미노산 (서열 89), 74.7 kDa 단백질을 코딩하는 것으로 예상된다. 이 단백질의 대부분에 대하여 인간 및 다른 포유동물 유래의 예를 비롯한 공지된 ACS 단백질과 양호한 상동성이 존재한다.
5. ScACS -5 (또한 ScACoAS -5 또는 ACS -5로 표시됨): 길이 = 1734개의 뉴클레오티드 (종결 코돈을 포함하지 않음) (서열 90). 이는 578개의 아미노산 (서열 91), 63.1 kDa 단백질을 코딩하는 것으로 예상된다. 이 단백질의 대부분에 대하여 공지된 ACS 단백질과 양호한 상동성이 존재한다. 최적의 블라스트 대응은 세균성 ACS에 대한 것이다. 서열 91의 C-말단의 3개의 아미노산은 SKL (단백질을 페록시좀으로 표적화하는 것과 관련된 모티프)이다.
6. ScACS -6 (또한 ScACoAS -6 또는 ACS -6으로 표시됨): 길이 = 1806개 (종결 코돈을 포함하지 않음)의 뉴클레오티드 (서열 92). 이는 602개의 아미노산 (서열 93), 66.0 kDa 단백질을 코딩하는 것으로 예상된다. 이 단백질의 대부분에 대하여 공지된 ACS 단백질과 양호한 상동성이 존재한다. 최적의 블라스트 대응은 세균성 ACS에 관한 것이다. 서열 93의 C-말단의 3개의 아미노산은 SKL (단백질을 페록시좀으로 표적화하는 것과 관련된 모티프)이다.
7. ScACS -7 (또한 ScACoAS -7 또는 ACS -7로 표시됨): 길이 = 1920개 (종결 코돈을 포함하지 않음)의 뉴클레오티드 (서열 94). 이는 640개의 아미노산 단백질 (서열 95), 70.4 kDa을 코딩하는 것으로 예상된다. 이 단백질의 대부분에 대하여 공지된 ACS 단백질과 양호한 상동성이 존재한다. 최적의 블라스트 대응은 세균성 ACS에 관한 것이다.
8. ScACS -8 (또한 ScACoAS -8 또는 ACS -8로 표시됨): 길이 = 1893 (종결 코돈을 포함하지 않음)개의 뉴클레오티드 (서열 96). 이는 631개의 아미노산 (서열 97), 70.7 kDa 단백질을 코딩하는 것으로 예상된다. 최적의 블라스트 대응은 ACoAS 활성을 또한 가질 수 있는 지방산 운반 단백질 패밀리의 구성원에 관한 것이다.
9. ScACS -9 (또한 ScACoAS -9 또는 ACS -9로 표시됨): 길이 = 2950개 (종결 코돈을 포함하지 않음)의 뉴클레오티드 (서열 98). 이는 766개의 아미노산 (서열 99), 84.1 kDa 단백질을 코딩하는 것으로 예상된다. 이 단백질의 대부분에 대하여 공지된 ACS 단백질과 양호한 상동성이 존재한다. 최적의 블라스트 대응은 동물 ACS에 관한 것이다.
본 발명자들은 PUFA 신타제의 이종 숙주에 존재하는 효소가 신규 (이 생물체의 경우) PUFA 유리 지방산 (FFA)을 효율적으로 프로세싱할 수 없으며 적절한 ACoAS(들)의 공동발현이 상기 숙주에서 PUFA의 축적을 증가시킨다고 믿었다. 상기 기재된 두가지 쉬조키트리움 후보 ACoAS (ScACS-1, 서열 82/83 및 ScACS-2, 서열 84/85)는 쉬조키트리움 PUFA 신타제 시스템 (예, sOrfA, sOrfB 및 nOrfC, 및 HetI)을 코딩하는 유전자들을 함유한 효모에서 개별적으로 발현되었다.
보다 구제척으로, 상기 실시예에 기재된 효모 발현 시스템은 4개의 벡터를 사용해서 제5 ACoAS 유전자의 도입을 수용하도록 개질되었다 (즉, 효모는 또한 쉬조키트리움 PUFA 신타제 시스템의 Orf A, B 및 C, 및 PPTase (Nostoc 유래의 HetI)를 함유하였다). 두 유전자들이 클로닝될 수 있는 효모 발현 벡터 (pESC 벡터)는 스트라타진(Stratagene)사로부터 입수하였다. 이들 벡터는 상기 기재된 pYES 벡터와 유사하며 이 벡터와 상용성이다. 두 유전자, 즉 천연 OrfC (nOrfC, 서열 5) 및 HetI (서열 33)을 하나의 pESC 벡터에 클로닝하였으며, sOrfA (서열 35, sOrfB (서열 36) 및 제5 유전자 (ScACS-1 (서열 82) 또는 ScACS-2 (서열 84))를 pYES 벡터에 클로닝하였다. 4개의 벡터를 효모에 도입하고, 상기 기재된 갈락토스-함유 배지 중에 세포를 현탁시킴으로써 유전자들을 유도하였다. 세포를 30℃에서 성장시키고, 유도 후 18시간의 시점에서 수획하였다. 이들 세포의 FAME 분석의 요약은 표 1에 나타나 있다. 대조군 세포는 4개의 벡터 모두를 함유하였지만, Orf A를 코딩하는 유전자는 결여되었다. ScACOAS들 중 어느 하나의 공동발현은 DHA 및 DPAn-6의 축적을 (대조군 세포에서의 양의 대략 2배로) 증가시켰다. 이로써 이종 숙주에서 PUFA 신타제의 생성물의 축적이 이 생성물의 이용에 있어서 보다 효율적일 수 있는 효소의 공동발현에 의해 증가될 수 있음이 확인되었다.
후속 실험에서, 상기 기재된 바와 같은 유사한 방법을 이용해서 쉬조키트리움 PUFA 신타제 시스템 (예, sOrfA, sOrfB 및 nOrfC, 및 HetI)을 코딩하는 유전자들을 함유한 효모에서 ScACS-3, ScACS-5, ScACS-6 및 ScACS-8을 또한 시험하였다. ScACS-3, ScACS-5 또는 ScACS-8의 각각의 발현은 첨가된 아실-CoA 신테타제 유전자의 부재하에서와 비교해서 효모에서 DHA의 제조를 증가시켰다 (데이터는 나타내지 않음).
상기 나타낸 바와 같이, ScACS-8은 ACS 활성을 또한 가질 수 있는 지방산 운반 단백질 패밀리의 구성원과 상동성을 나타낸다. 이들 단백질은 원형질막과 관련이 있으며 유리 지방산의 세포로의 임포트를 촉진시키고 또한 이들을 아실-CoA 유도체로 전환시키는 것으로 여겨진다. 상기 효소 패밀리는 식물 세포의 색소체에서 생성물을 유리 지방산으로 방출시키는 PUFA 신타제 시스템을 발현시키는 경우 특히 유용할 수 있다. 색소체의 외부 엔벨로프(envelope)는 원형질막으로부터 유도되는 것으로 생각되며, 원형질막으로 표적화된 단백질 (예, ScACS-8)은 또한 색소체 외부 엔벨로프로 표적화될 수 있다. 이러한 경우, 상기 지방산 운반 단백질 (예, ScAC-8)은 색소체로부터 PUFA 신타제의 유리 지방산 생성물의 배출을 촉진시킬 수 있으며, 또한 상기 생성물을 아실-CoA 유도체로 전환시킬 수 있다. 쉬조키트리움 PUFA PKS 시스템을 발현시키는 식물에서 이러한 아실-CoA 신테타제를 제공하는 실험은 하기 기재되어 있다.
실시예
10
하기 실시예는 ScACoAS-1이 있거나 또는 없이 쉬조키트리움 PUFA 신타제를 발현시키는 효모에서, FAS 경로를 억제하는 세룰레닌의 존재하에서의 성장에 의해 PUFA의 수준이 증가함을 입증한다.
PUFA 신타제와 FAS는 둘 다 이들의 지방산 생성물의 합성을 위한 탄소 공급원으로서 말로닐-CoA를 이용한다. 또한, 상기 두 시스템으로부터의 지방산의 아실-CoA 형태는 PL 및 TAG를 합성하는 효소에 대한 기질로서 작용할 수 있다. 상기 논의된 바와 같이, PUFA 신타제 및 FAS가 둘 다 한 생물체내에 존재하는 경우, FAS 시스템의 하향조절 또는 억제는 PUFA의 축적에 유리할 것으로 예상된다. 세룰레닌은 지방산 합성의 축합반응에 대한 잘 연구된 억제제이다. 선행 연구는 PUFA 신타제가 FAS 시스템보다 세룰레닌에 의한 억제에 대해 상대적으로 덜 민감하다는 것을 나타냈다.
본 발명자들은 FAS 활성 감소 개념의 모델로서 실시예 8에 기재된 효모 균주의 지방산 프로필에 대한 세룰레닌의 효과를 시험하였다. 아실 CoA-신테타제를 또한 함유한 실시예 9에 기재된 효모를 상기 시스템에서 추가로 시험해서 두가지 전략의 효과가 PUFA 제조를 상가적으로 또는 상승적으로 증가시키는지를 결정하였다.
초기 실험은 4 uM 세룰레닌의 농도에서 (총 지방산 프로필의 퍼센트인 PUFA 증가로서) 최대 효과가 얻어졌음을 나타냈다. 갈락토스 유도 배지로 전달한 다음 4시간 후에 세룰레닌을 첨가하였다. 유도 배지로 전달한 다음 19시간의 시점에서 세포를 수획하고, 동결 건조하고, FAMES 제조하고, GC에 의해 분석하였다.
시험된 효모 균주는 다음과 같았다:
ㆍ 균주 5.5는 상기 실시예 8에 기재된 바와 같은 PUFA 신타제 유전자들 (sOrfA, sOrfB, OrfC 및 HetI)을 함유하였고;
ㆍ 균주 5.6은 상기 실시예 9에 기재된 바와 같이 균주 5.5의 PUFA 신타제 유전자 세트에 더하여 ScACoAS-1 (서열 82)을 함유하였다.
표 2를 언급하면, "0 Cer"은 세룰레닌이 첨가되지 않았음을 나타내며, "4 uM Cer"은 유도 배지로 전달한 다음 4시간 후에 배지에 4 uM 세룰레닌을 넣었음을 나타낸다. 세룰레닌의 존재 및 부재하에 각 균주를 지방산 제조에 대하여 평가해서 PUFA 제조에 대한 FAS 경로 억제의 효과를 평가하였다. 표 2는 GC 프로필에서 검출된 주요 지방산을 나타낸다 (또한 도 11 참조). 수치는 검출된 총 지방산의 퍼센트로서 제시되어 있다. 쉬조키트리움 PUFA PKS 시스템의 생성물인 DHA 및 DPAn-6은 프로필 중에 존재하는 유일한 PUFA이었다. DHA와 DPAn-6의 합은 또한 표 2에 나타나 있다. 도 9 및 10은 효모에 의해 제조된 DHA (도 9) 또는 DHA 및 DPAn-6 (도 10; 백색 막대는 DHA이고; 흑색 막대는 DHA + DPAn-6임)의 양을 총 FAME의 백분율로서 예시한다.
PUFA 신타제 유전자들이 없는 효모 세포는 임의의 검출가능한 PUFA를 만들지 않는다. 이 실험에서 효모에서의 PUFA 신타제 시스템의 발현은 1.2% DHA를 축적하였다. ScACoA-1 유전자 (서열 82)를 포함시키자 DHA 수준이 4.1%로 증가하였다. 4 uM 세룰레닌의 존재하에서 (FAS 시스템의 억제) PUFA 신타제 시스템만을 갖는 세포의 성장은 DHA 수준을 3.7%로 증가시켰다. PUFA 신타제 및 ScACoAS-1 유전자를 둘 다 발현시키는 세포를 4 uM 세룰레닌 중에서 성장시킨 경우 (즉, FAS 시스템의 억제 및 아실-CoA 신테타제의 조합 발현), DHA 수준은 총 지방산의 8.2%로 증가하였다. 모든 샘플에서, DPAn-6 축적에서의 상응하는 증가가 존재하였다. 샘플 중 DHA와 DPAn-6의 합은 또한 표 2에 나타나 있으며, 가장 많은 양 (총 지방산의 14.5%)은 4 uM 세룰레닌에서 성장시킨 균주 5.6에 존재한다. 세룰레닌 존재하에서의 성장 및 ACoA 신테타제 유전자 발현의 효과는 상가적임을 알 수 있다. 이들 데이터는 이종 숙주에서 PUFA의 축적을 증가시키기 위해 본원에 제안된 본 발명을 뒷받침한다.
실시예
11
하기 실시예는 이종 숙주에서 PUFA 제조 및/또는 축적을 증가시키는데 있어서 사용하기 위한 추가의 부속 단백질 또는 표적의 동정을 기술한다.
쉬조키트리움에 존재하는 효소는 PUFA 신타제의 생성물의 아실-CoA 형태를 효율적으로 이용해서 인지질 (PL) 및 트리아실글리세롤 (TAG) 분자를 합성한다. 그러나, 이종 숙주에 존재하는 효소는 상기 반응을 유사한 효율로 수행하지 않을 수 있는데, 이는 상기 생물체가 전형적으로 상기 PUFA-CoA와 직면하지 않을 수 있기 때문이다. 예를 들어, 상기 이종 숙주에서 다양한 PUFA 신타제의 아실-CoA 생성물 (예, DHA-CoA, DPAn-6-CoA 또는 EPA-CoA 등)을 PL 또는 TAG 분자로 효율적으로 통합하는 PL 또는 TAG 합성 효소의 발현은 상기 생성물을 축적시키는 증가된 능력을 나타낼 수 있다. 이와 관련해서, 쉬조키트리움 또는 PUFA 신타제 경로를 통해 PUFA를 제조하는 다른 생물체는 상기 효소를 코딩하는 유전자들의 우수한 공급원으로서 작용할 수 있다. 따라서, 본 발명자들은 PL 또는 TAG를 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 여러 아실트랜스퍼라제 단백질 (예, 3-글리세롤-포스페이트 아실트랜스퍼라제 (GPAT), 리소포스파티드산 아실트랜스퍼라제 (LPAAT) 및 디아실글리세롤 아실트랜스퍼라제 (DAGAT)) 또는 PL 또는 TAG 중 PUFA를 풍부화할 수 있는 다른 아실트랜스퍼라제 (예, 인지질:디아실글리세롤 아실트랜스퍼라제 (PDAT))의 사용을 제안한다. 이러한 여러 아실트랜스퍼라제의 동정은 하기 기재되어 있다. 몇몇 후보를 효모에서 시험하고 식물에서 시험하였다.
DAGAT
효소
본 발명자들은 공지된 (또는 추정된) DAGAT 활성을 갖는 단백질에 대해 상동성을 나타내는 EST에 대한 쉬조키트리움 EST 데이터베이스를 조사하였다. 본 발명자들은 PUFA PKS 시스템과 함께 사용하기 위한 가능한 DAGAT 효소로서 세가지 후보를 확인하였으며, 이중 하나가 하기 기재되어 있고 이는 쉬조키트리움에서 유리 지방산의 TAG 분자로의 축적에 관여하는 것으로 나타났다.
쉬조키트리움 DAGAT (또한 DAGAT -1 또는 ScDAGAT -1로서 지칭됨) - 코딩 영역의 길이 = 1518개의 뉴클레오티드 (종결 코돈을 포함하지 않음) (서열 100). 이는 506개의 아미노산 (서열 101), 57.4 kDa 단백질을 코딩하는 것으로 예상된다. 이 단백질의 2/3 (아미노산 약 170번에서 시작해서 C-말단으로 계속됨)에 대하여 DAGAT 유형 2B 효소로서 확인된 단백질과 양호한 상동성이 존재한다. 단백질 서열의 처음 1/3 (아미노산 1 내지 170)의 Blast 분석에서는 임의의 단백질과 유의한 상동성이 나타나지 않았으며, 임의의 Pfam 대응이 검출되지 않았다.
쉬조키트리움에서 FAS에 대하여 상기 실시예 1에 기재된 녹아웃 기술을 이용해서, 본 발명자들은 B73-8로 표시된 쉬조키트리움 균주에서 DAGAT 유전자 (서열 100을 포함함)를 유사하게 놋아웃시켰다. 도 13에 나타낸 바와 같이, 쉬조키트리움에서 DAGAT 유전자의 불활성화는 TAG에서 지방산의 축적을 유의하게 억제하였다. 구체적으로, DAGAT의 불활성화는 mg FAME/gm 생물량(biomass)에서 대략 80% 감소 및 TAG에서 대략 90% 감소를 나타냈다. 따라서, 본 발명자들은 상기 DAGAT가 쉬조키트리움에서 TAG 합성을 담당하는 주요 효소라고 결론지었다.
따라서, 본원에 기재된 바와 같은 PUFA PKS 시스템을 발현시키는 숙주 (예, 효모, 식물)에서의 상기 핵산 분자의 발현은 유리 지방산의 PL 또는 TAG로의 축적을 증가시킬 것으로 예상된다. 트랜스제닉 식물에서 상기 유전자를 발현시키는 대표적인 실험은 하기 기재되어 있다.
LPAAT
효소
본 발명자들은 또한 공지된 (또는 추정된) LPAAT 활성을 갖는 단백질에 대해 상동성을 나타내는 EST에 대한 쉬조키트리움 EST 데이터베이스를 조사하였다. 본 발명자들은 이를 콘티그로 어셈블리하고 (둘 이상의 중복되는 서열이 이용가능한 경우), 상기 콘티그를 상기 기재된 바와 같은 개별적인 서열정보의 품질을 기준으로 편집하였다. 이러한 연구의 결과는 하기 요약되어 있다. 세가지 상이한 콘티그 및 하나의 싱글렛(singlet) (데이터베이스내 중복되는 서열 없음)이 확인되었으며, 이들은 LPAAT 효소와 관련해서 특히 우수한 후보이었다. 이들 서열에 의해 코딩되는 효소는 추정의 LPAAT 활성과 관련이 있지만 이 활성과 상이한 활성을 가질 수 있는 것으로 인식된다. 네가지 경우 모두에서, 추정의 Orf (개시 및 종결 코돈을 포함함)가 확인되었다. 더 많은 데이터가 얻어짐에 따라 내생성 개시 코돈의 확인을 비롯한 정확한 서열 표시는 달라질 수 있는 것으로 인식된다.
EST 데이터베이스의 분석에 의해 확인된 쉬조키트리움 LPAAT 후보:
1. ScLPAAT -1 콘티그: 길이 = 1478개의 뉴클레오티드 (서열 102). 이는 927 nt의 전장 Orf (종결 코돈을 포함함, ScLPAAT-1 CDS, 서열 103)를 포함하는 것으로 보인다. CDS (서열 104)의 번역을 이용한 Blast 검색은 코딩된 단백질의 대부분에 대하여 공지된 및 추정의 아실트랜스퍼라제 단백질과 양호한 상동성이 존재한다는 것을 보여준다. 최적의 대응은 아라비돕시스 유래의 단백질에 대한 것이다. Pfam 분석은 PlsC (1-아실-sn-글리세롤-3-포스페이트 아실트랜스퍼라제, 즉, LPAAT) 패밀리와 관련된 거대한 보존된 중심 도메인을 나타낸다.
2. ScLPAAT -2 콘티그: 길이 = 2112개의 뉴클레오티드 (서열 105). 이는 1140 nt의 전장 Orf (종결 코돈을 포함함, ScLPAAT-2 CDS, 서열 106)를 포함하는 것으로 보인다. CDS (서열 107)의 번역을 이용한 Blast 검색은 코딩된 단백질의 대부분에 대하여 공지된 및 추정의 아실트랜스퍼라제 단백질과 양호한 상동성이 존재한다는 것을 보여준다. 최적의 대응은 아라비돕시스 유래의 단백질에 대한 것이다. Pfam 분석은 PlsC (1-아실-sn-글리세롤-3-포스페이트 아실트랜스퍼라제, 즉, LPAAT) 패밀리와 관련된 거대한 보존된 중심 도메인을 나타낸다.
3. ScLPAAT -3 콘티그: 길이 = 1862개의 뉴클레오티드 (서열 108). 이는 1323 nt의 전장 Orf (종결 코돈을 포함함, ScLPAAT-3 CDS, 서열 109)를 포함하는 것으로 보인다. CDS (서열 110)의 번역을 이용한 Blast 검색은 코딩된 단백질의 중심 부분에 대하여 공지된 및 추정의 아실트랜스퍼라제 단백질과 양호한 상동성이 존재한다는 것을 보여준다. 최적의 대응은 포유동물 유래의 단백질에 대한 것이다. Pfam 분석은 PlsC (1-아실-sn-글리세롤-3-포스페이트 아실트랜스퍼라제, 즉, LPAAT) 패밀리와 관련된 거대한 보존된 중심 도메인을 나타낸다.
4. ScLPAAT -4 싱글렛: 길이 = 794개의 뉴클레오티드 (서열 111). 이는 756 nt의 전장 Orf (종결 코돈을 포함함, ScLPAAT-4 CDS, 서열 112)를 포함하는 것으로 보인다. CDS (서열 113)의 번역을 이용한 Blast 검색은 코딩된 단백질의 많은 부분에 대하여 공지된 및 추정의 아실트랜스퍼라제와 양호한 상동성이 존재한다는 것을 보여준다. 최적의 대응은 조류 및 포유동물 유래의 단백질에 대한 것이다. Pfam 분석은 PlsC (1-아실-sn-글리세롤-3-포스페이트 아실트랜스퍼라제, 즉, LPAAT) 패밀리와 관련된 거대한 보존된 중심 도메인을 나타낸다.
ScLPAAT-1은 효모 및 식물에서 클로닝 및 발현되었다.
추가의
DAGAT
또는
LPAAT
효소
본 발명자들은 또한 공지된 또는 추정의 DAGAT 또는 LPAAT 활성을 갖는 단백질에 대해 상동성을 나타내는 EST에 대하여 크립테코디니움 코니 EST 데이터베이스를 조사하였다. 이러한 연구의 결과는 하기에 요약되어 있다.
A) EST 데이터베이스의 분석에 의해 확인된 크립테코디니움 코니 DAGAT 후보:
1. CA5 _ PTA .838.C: 길이 = 817개의 뉴클레오티드 (서열 114). 이 서열의 마지막 274개의 뉴클레오티드에 대하여 PCT 공개 제WO 2004/087902호에 기재된 크립테코디니움 아실트랜스퍼라제 서열과 양호한 상동성이 존재한다.
2. CA5 _ PTA .131. C1: 길이 = 850개의 뉴클레오티드 (서열 115)
3. CA12 _ cot10 _003a_ h10: 길이 = 663개의 뉴클레오티드 (서열 116)
4. CA12 _ cot10 _001a_ h02: 길이 = 807개의 뉴클레오티드 (서열 117)
5. CA12 _ cot10 _005b_ g12: 길이 = 765개의 뉴클레오티드 (서열 118)
6. CA12 _ cot50 _005c_ d07: 길이 = 782개의 뉴클레오티드 (서열 119)
B) EST 데이터베이스의 분석에 의해 확인된 크립테코디니움 코니 LPAAT 후보:
1. CA12 _ cot10 _003a_ e11: 길이 = 793개의 뉴클레오티드 (서열 120)
2. CA12 _ PTA .739. C1: 길이 = 744개의 뉴클레오티드 (서열 121)
이 실시예에 기재된 임의의 하나 이상의 핵산 분자를 사용해서 본원에 기재된 유전적으로 개질된 임의의 생물체 (예, 식물 또는 미생물)를 제조하는 것을 비롯해서 임의의 숙주 세포를 형질전환시킴으로써 생물체, 특히 PUFA PKS 시스템을 발현시키는 생물체에서 PUFA 축적을 추가로 증진시킬 수 있다. 이러한 효소는 또한, 전형적 또는 표준 지방산 신타제 경로에 의해 PUFA를 제조하는 숙주 생물체에서 발현되는 경우 유용성을 가질 수 있다. 이러한 구조물은 PUFA PKS 시스템과 함께 단독으로 또는 본원에 기재된 바와 같은 숙주 생물체에서 PUFA 제조 및 축적을 증진시키기 위한 다른 전략과 조합하여 (예를 들어, 아실-CoA 신테타제의 발현과 함께 또는 FAS 경로의 억제와 함께) 이용될 수 있다. PCT 공개 제WO 2004/087902호에 기재된 추가의 아실트랜스퍼라제 서열은 또한 본 발명에 잠재적으로 유용한 것으로 고려되며 본원에 참고로 포함된다.
실시예
12
하기 실시예는 아라비돕시스에서 HetI과 함께 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 코딩하는 유전자들의 발현 및 임의의 검출가능한 중간체 또는 부 생성물의 실질적인 부재하에 표적 PUFA, DHA 및 DPAn-6의 제조를 기술한다.
HetI (서열 33으로 나타낸 뉴클레오티드 서열)과 함께 쉬조키트리움 OrfA (서열 1로 나타낸 뉴클레오티드 서열), OrfB* (서열 37로 나타낸 뉴클레오티드 서열) 및 OrfC (서열 5로 나타낸 뉴클레오티드 서열)를, (별도로 또는 하나의 슈퍼구조물(superconstruct)상에 네가지 유전자들을 모두 포함하는 다양한 조합으로) 유전자들을 식물로 도입하기 위한 적절한 바이너리 벡터에 클로닝하였다. 이러한 구조물 및 벡터의 예는 하기 (세가지 발현 구조물) 및 실시예 13 (4127에 대한 한가지 "슈퍼구조물")에 기재되어 있다.
5720의 작제: Orf B* (색소체 발현)
Orf B* (서열 4를 코딩함)는 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호)의 조절하에 발현 카세트에 제한 클로닝하였다. 리닌 프로모터는 종자 발생 동안 트랜스유전자(들)의 특정-시간적 및 조직-특이적 발현을 조절한다. 쉬조키트리움 Orf B*의 직접 상류 및 인-프레임은 브라시카 나푸스(Brassica napus) 아실-ACP 티오에스테라제 (PT-신호 펩티드)로부터 유도된, Orf B*를 색소체로 표적화하는 색소체 표적화 서열이었다. 식물 바이너리 벡터는 또한 양성(positive) 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품(Petroselinum crispum) 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 기존의 이. 콜라이 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하였다.
4107의 작제: HetI 및 Orf C (색소체 발현)
쉬조키트리움 Orf C (서열 5로 표시된 뉴클레오티드 서열)는 HetI (서열 33으로 표시된 뉴클레오티드 서열)과 함께 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호)의 조절하에 발현 카세트에 클로닝하였다. 리닌 프로모터는 종자 발생 동안 트랜스유전자(들)의 특정-시간적 및 조직-특이적 발현을 조절한다. 쉬조키트리움 Orf C 및 HetI의 직접 상류 및 인-프레임은 브라시카 나푸스 아실-ACP 티오에스테라제 (PT-신호 펩티드)로부터 유도된, PUFA 신타제 및 PPTase를 색소체로 표적화하는 색소체 표적화 서열이었다. 이어서, 상기 두 발현 카세트를, 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 숙주 식물 포스피노트리신 내성 부여 pat 유전자 [Wohlleben et al., 1988, Gene 70:25-37]를 함유하는 하나의 식물 바이너리 벡터내에 어셈블리하였다.
4757의 작제: Orf A (색소체 발현)
쉬조키트리움 Orf A (서열 1로 나타낸 뉴클레오티드 서열)를 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호)의 조절하에 발현 카세트에 클로닝하였다. 리닌 프로모터는 종자 발생 동안 트랜스유전자(들)의 특정-시간적 및 조직-특이적 발현을 조절한다. 쉬조키트리움 Orf A의 직접 상류 및 인-프레임은 브라시카 나푸스 아실-ACP 티오에스테라제 (PT-신호 펩티드)로부터 유도된, PUFA 신타제 및 PPTase를 색소체로 표적화하는 색소체 표적화 서열이었다. 발현 카세트는, 좌측 및 우측 경계 서열 사이에 MAS 프로모터/터미네이터에 의해 구동되는 숙주 식물 카나마이신 내성 부여 nptII 유전자를 함유하는 식물 바이너리 벡터내에 함유되었다.
한 예에서, 트랜스유전자를 다음과 같은 세가지 별도의 발현 카세트에 클로닝하였다: 상기 기재된 바와 같은 5720으로 표시된 구조물 (OrfB*를 함유, 서열 4를 코딩), 4107로 표시된 구조물 (OrfC를 함유, 서열 6 및 HetI을 코딩, 서열 34를 코딩) 및 4757로 표시된 구조물 (OrfA를 함유, 서열 2를 함유). 각 구조물에서, 유전자를 클로닝하였다. 단백질을 색소체로 지시하기 위해, 브라시카 나푸스 아실-ACP 티오에스테라제로부터 유도된 색소체 표적화 서열을 코딩하는 추가의 5' 서열을 Orfs A, B*,C 및 HetI의 직접 상류에 위치시켰다. 코딩된 표적화 펩티드의 아미노산 서열은 MLKLSCNVTNHLHTFSFFSDSSLFIPVNRRTLAVS (서열 81)이다. 이 펩티드를 코딩하는 뉴클레오티드 서열을, 각각의 PUFA 신타제 Orf의 출발 메티오닌 코돈 및 HetI의 조작된 개시 코돈 (ATG)과 인-프레임으로 두었다. 다른 구조물에서, PUFA 신타제의 배치를 식물 세포의 세포질로 표적화한 경우, Orf의 5' 말단에 어떤 추가의 단백질 코딩 서열도 부가되지 않았다.
표준 방법을 이용해서 유전자들을 아라비돕시스에 도입하였다 (문헌 [Clough et al., 1998, Plant J. 16: 735-743]에 기재된 바와 같이, 적절한 벡터를 함유하는 아그로박테리움 균주의 현탁액으로의 플라워 침지법). 이 방법의 세부사항은 하기 실시예 13에 기재되어 있다. 상기 식물로부터 얻은 종자를 선별 배지상에 플레이팅하고, 발아시켰다. 성장한 식물의 일부를 성숙시키고, PUFA 함량에 대하여 종자를 분석하였다. PUFA 함량을 기초로 상기 종자의 일부를 다음 세대로 진행시켰다. 이들 식물로부터 얻은 푸울링된 종자를 지방산 함량에 대하여 분석하였다. 상기 트랜스제닉 식물로부터 예상된 표적 PUFA는 도코사헥사엔산 (DHA) 및 도코사펜타엔산 (DPAn-6)이었으며, 이들은 식물을 형질전환시키는데 사용되는 유전자들이 유래하는 쉬조키트리움 PUFA PKS 시스템에 의해 제조된 주요 PUFA이다.
예시적인 트랜스제닉 식물 세포주들 중 하나에서의 한가지 예시적인 지방산 분석으로부터 얻어진 결과가 도 13에 나타나 있다. 도 13의 상부 패널은 푸울링된 종자 샘플로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 나타낸 바와 같은 야생형 아라비돕시스 종자의 전형적인 지방산 프로필을 나타낸다. 우세한 지방산은16:0, 18:0, 16:1, 18:1, 20:1, 20:2 및 22:1이다. 야생형 종자 유래의 샘플에는 DHA 또는 DPAn-6이 존재하지 않는다.
도 13의 하부 패널은 상기 기재된 바와 같이 색소체로 표적화된 세가지 별도의 발현 카세트 (5720, 4107 및 4757)로부터 도입된 쉬조키트리움 PUFA 신타제 유전자들 및 HetI 유전자를 발현시키는 예시적인 트랜스제닉 아라비돕시스 세포주들 중 하나 (세포주 263)로부터의 푸울링된 종자 샘플의 지방산 프로필을 나타낸다. 세포주 263의 지방산 프로필을 언급하면, 2개의 FAME 피크가 야생형 종자로부터의 프로필에 존재하지 않는 트랜스제닉 식물 종자로부터의 프로필에 존재한다는 것이 쉽게 관찰된다. 이들 두 피크의 용출 패턴은 진정 DHA 및 DPAn-6의 용출에 정확하게 상응한다 (표준물로서 쉬조키트리움 오일로부터 제조된 FAME, 및 뉴체크 프렙(NuCheck Prep)사로부터 시판되는 DHA 표준물을 구입해서 이용함). 이러한 특정 예에서, DHA 피크는 계산된 총 FAME의 0.8%를 나타내지만 DPAn-6 피크는 1.7%를 나타낸다. 신규 PUFA의 합은 총 FAME의 2.5%이다.
다른 트랜스제닉 식물 세포주를 사용한 실험은 유사한 결과를 나타냈다. 예를 들어, 263 세포주와 동일한 구조물을 사용해서 동일한 방식으로 형질전환시킨 269로 표시된 다른 트랜스제닉 세포주는 계산된 총 FAME의 대략 0.75% DHA 및 계산된 총 FAME의 1.41% DPAn-6을 제조하였다 (데이터는 나타내지 않음).
게다가, 상기 기재된 동일한 핵산 분자를 사용해서 제조된 여러 다른 트랜스제닉 아라비돕시스 식물은 또한 이들이 별도의 구조물, 조합 구조물 또는 단일 슈퍼구조물 상에서 PUFA PKS 유전자들 및 HetI PPTase를 제공하는 구조물을 사용해서 제조되었는지의 여부와는 무관하게 표적 PUFA를 제조하였다 (데이터는 하기 실시예 13에 나타냄).
또한, PUFA PKS 유전자들을 세포질로 표적화하는 트랜스제닉 식물은 모두 표적 PUFA를 발현시켰다 (데이터는 상세히 나타내지 않음). 예를 들어, 상기 기재된 바와 같은 (색소체 표적화 서열이 없는) 세가지 별도의 발현 카세트상에 도입된 세포질내의 쉬조키트리움 PUFA PKS에 더하여 HetI을 발현시키는 식물 세포주는 총 FAME의 백분율로서 대략 0.45% DHA 및 대략 0.8% DPA를 제조하였다. 다른 예에서, 단일 슈퍼구조물 (하기 실시예 13에 기재된 것과 유사함)상에 도입된 세포질내의 쉬조키트리움 PUFA PKS에 더하여 HetI을 발현시키는 식물 세포주는 총 FAME의 백분율로서 대략 0.2-0.3% DHA 및 대략 0.5% DPA를 제조하였다.
도 13에 나타낸 종자 지방산 프로필 중 DHA 및 DPAn-6이 출현 (다른 트랜스제닉 세포주에서 관찰되는 바와 같으며, 이의 일부가 상기 기재되어 있음)은 도입된 쉬조키트리움 PUFA 신타제 시스템이 식물 세포에서 발현되는 경우에 기능한다는 것과 단백질이 섹소체로 표적화될 수 있다는 것을 입증한다. 또한, 본 발명자들은 단백질이 또한 세포질로 표적화될 수 있거나 또는 색소체와 세포질이 PUFA를 제조한다는 것을 확인하였다. 다른 숙주 (예, 이. 콜라이 및 효모)에서의 생화학적 및 이종 발현 데이터로부터 예상된 바와 같이, 트랜스제닉 식물 유래의 종자의 프로필 중에서 검출된 유일한 신규 지방산은 DHA 및 DPAn-6이며 (즉, 지방산 프로필은 PUFA 제조 효소 시스템으로부터 얻어지는 오염성 중간체 또는 부 생성물을 실질적으로 함유하지 않음), 이는 식물에서 PUFA를 제조하는데 있어서 PUFA PKS 시스템이 표준 경로 효소에 비해 유리하다는 것을 추가로 예시한다.
실시예
13(a) - 13(j)
하기 실시예는 식물에서 PUFA의 제조 및/또는 축적을 증가시키기 위한 본원에 기재된 다양한 전략 (전략들의 조합을 포함함)의 이용을 기술한다.
구체적으로, 하기 실시예는 아라비돕시스 종자에서 HetI과 함께 쉬조키트리움 PUFA 신타제 (nOrfA, Orf B* 및 nOrfC)를 코딩하는 유전자들을 단독으로 또는 다른 부속 단백질 및/또는 유전적 개질 전략과 조합하여 발현시킴으로써 PUFA 제조 및 축적을 증진시키는 것에 대하여 기술한다. 특히, 쉬조키트리움 PUFA 신타제 및 HetI은 식물에서 단독으로 또는 (1) 아실-CoA 신테타제(ACS)를 코딩하는 유전자, 또는 (2) 내생성 FAS 활성을 억제하도록 의도된 유전적 요소와 조합하여 발현된다. 또한, 쉬조키트리움 PUFA 신타제와 HetI의 조합을, 내생성 FAS 활성을 억제하도록 의도된 유전적 요소 및 ACS 유전자의 발현과의 조합으로 사용하는 예가 나타나 있다. 마지막으로, DAGAT 및/또는 LPAAT를 비롯한 아실트랜스퍼라제를 단독으로 또는 내생성 FAS 활성을 억제하도록 의도된 하나 이상의 아실-CoA 신테타제 및 유전적 요소의 발현과의 조합으로 발현시키는 것에 대하여 하기에 기술되어 있다. 여기에 요약된 전략은 식물에서 앞선 실시예에 기재된 임의의 개념을 규정하는 능력을 예시한다.
실시예
13(a)-(j)에 대한 재료 및 방법
(1)
구조물
구조물 4127의 작제: PT-신호 펩티드:nORFA, PT-신호 펩티드:nORFB*, PT-신호 펩티드:HetI, PT-신호 펩티드:nORFC (HetI과 쉬조키트리움 PUFA 신타제의 색소체 표적화 발현)
쉬조키트리움 천연 OrfA (nOrfA, 서열 1로 나타냄, 이는 서열 2를 코딩함), 합성 (재합성된) OrfB* (OrfB*, 서열 37로 나타냄, 이는 서열 4를 코딩함) 및 천연 OrfC (nOrfC, 서열 5로 나타냄, 이는 서열 6을 코딩함)를 Nostoc 유래의 HetI (서열 33으로 나타냄, 이는 서열 34를 코딩함)과 함께 flax 리닌 프로모터/터미네이터의 조절하의 발현 카세트에 클로닝하였다 (프로모터/터미네이터에 대해서는 미국 특허 제6,777,591호를 참조). 리닌 프로모터는 종자 발생 동안 트랜스유전자(들)의 특정-시간적 및 조직-특이적 발현을 조절한다. 쉬조키트리움 Orfs A, B*, C 및 HetI의 직접 상류 및 인-프레임은 또한 실시예 12에 기재된 바와 같이 브라시카 나푸스 아실-ACP 티오에스테라제 (본원에서 PT-신호 펩티드로 지칭되며, 그의 아미노산 서열은 서열 81로 나타냄)로부터 유도된, PUFA 신타제 및 PPTase를 색소체로 표적화하는 색소체 표적화 서열이었다. 이어서, 상기 네가지 발현 카세트를, 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 숙주 식물 포스피노트리신 내성 부여 pat 유전자 [Wohlleben et al., 1988, Gene 70:25-37]를 함유하는 하나의 식물 바이너리 벡터내에 어셈블리하였다.
5723의 작제: ACS-1 (세포질 발현)
아실-CoA 신테타제의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 쉬조키트리움 ACS-1에 대한 핵산 서열 (서열 82, 이는 서열 83을 코딩함)을 발현시켰다. 5' 및 3' 말단에서 조작된 적절한 제한 부위를 갖는 ACS-1을 서브클로닝 및 서열화하였다. 이어서, ACS-1을 flax 리닌 프로모터/터미네이터의조절하에 있는 발현 카세트 (미국 특허 제6,777,591호)에 제한 클로닝하고, 양성 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 이. 콜라이 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하는 식물 바이너리 벡터에 넣었다.
본원에서 각각 ACS-2 (서열 84/85) 및 ACS-8 (서열 96/97), 5724 및 5730으로 지칭되는 아실-CoA 신테타제의 발현을 위해 유사한 구조물을 제조하였다. 한 측면에서, 아실-CoA 신테타제서열을 하기 기재된 바와 같이 DAGAT (서열 100/101) 및/또는 LPAAT (서열 102/103/104)를 코딩하는 핵산 분자와 조합하였다.
5727의 작제: CHSA 인트론을 갖는 KAS II RNAi (인트론을 갖는 RNAi의 세포질 발현)
FAS 억제를 위해, 별도의 식물 바이너리 벡터를 작제하여 KAS II의 발현을 약화시켰다. 이 경우, 피튜니아 칼콘 신타제 A (CHSA) 유전자 [McGinnis et al., 2005, Methods in Enzymology 392:1-24; Koes et al., 1989, Gene 81: 245-257]로부터 유도된 개입성(intervening) 인트론을 갖는 RNA 간섭 (RNAi)에 의해, At1g74960 로커스 [Carlsson et al., 2002, Plant J. 29: 761-770]에 의해 코딩된 핵 코딩 KAS II 전사체의 499 bp 영역을 표적화하였다. CHSA 인트론을 갖는 KAS II RNAi (서열 122로 나타냄)를 식물 바이너리 벡터내의 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호) 사이, 양성 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 이. 콜라이 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하는 식물 바이너리 벡터에 클로닝하였다.
5729의 작제: KAS III 안티센스 RNA (KAS III 안티센스 RNA의 세포질 발현)
FAS 억제를 위해, 별도의 식물 바이너리 벡터를 작제하여 KAS III의 발현을 약화시켰다. 이 경우, At1g62640 로커스 [Yamada et al., 2002, GenBank Accession AY091275]에 의해 코딩된 핵 코딩 전사체로부터 유도된 1210 bp 크기의 안티센스 KAS III 서열을 표적화하였다. KAS III 안티센스 서열 (본원에서 서열 125로 나타냄)을 식물 바이너리 벡터내의 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호) 사이, 양성 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하는 식물 바이너리 벡터에 클로닝하였다.
5731의 작제: ACS-1, 및 인트론을 갖는 KAS II RNAi (세포질 발현)
FAS 억제와 조합된 아실-CoA 신테타제의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 KAS II의 발현을 약화시키고 쉬조키트리움 ACS-1에 대한 핵산 서열 (서열 82, 이는 서열 83을 코딩함)을 발현시켰다. 이 구조물의 경우, ACS-1, 및 인트론을 갖는 KAS II RNAi의 이중 발현 카세트를, 양성 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 이. 콜라이 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하는 식물 바이너리 벡터내에서 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호)의 조절하에 발현시켰다.
5732의 작제: ACS-1 및 안티센스 KAS II (세포질 발현)
FAS 억제와 조합된 아실-CoA 신테타제의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 KAS II의 발현을 약화시키고 쉬조키트리움 ACS-1에 대한 핵산 서열 (서열 82, 이는 서열 83을 코딩함)을 발현시켰다. 이 구조물의 경우, ACS-1, 및 인트론을 갖는 KAS II 안티센스 (본원에서 서열 123으로 나타낸 KASII 안티센스 서열)의 이중 발현 카세트를, 양성 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 이. 콜라이 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하는 식물 바이너리 벡터내에서 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호)의 조절하에 발현시켰다.
5733의 작제: ACS-1 및 KAS III RNAi (세포질 발현)
FAS 억제와 조합된 아실-CoA 신테타제의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 KAS III의 발현을 약화시키고 쉬조키트리움 ACS-1에 대한 핵산 서열 (서열 82, 이는 서열 83을 코딩함)을 발현시켰다. 이 구조물의 경우, ACS-1 및 KAS III RNAi (본원에서 서열 124로 나타낸 KASIII RNAi 서열)의 이중 발현 카세트를, 양성 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 이. 콜라이 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하는 식물 바이너리 벡터내에서 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호)의 조절하에 발현시켰다.
5734의 작제: ACS-1 및 KAS III 안티센스 RNA (세포질 발현)
FAS 억제와 조합된 아실-CoA 신테타제의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 KAS III의 발현을 약화시키고 쉬조키트리움 ACS-1에 대한 핵산 서열 (서열 82, 이는 서열 83을 코딩함)을 발현시켰다. 이 구조물의 경우, ACS-1 및 KAS III 안티센스의 이중 발현 카세트를, 양성 선별 [Haldrup et al., 1998, Plant Mol. Biol. 37:287-296]을 위해 좌측 및 우측 경계 서열 사이에 피트로셀리눔 크리스품 유래의 유비퀴틴 프로모터/터미네이터 [Kawalleck et al., 1993, Plant Mol. Bio., 21:673-684]에 의해 구동되는 이. 콜라이 포스포만노스 이소머라제 유전자 [Miles and Guest, 1984, Gene 32: 41-48]를 함유하는 식물 바이너리 벡터내에서 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호)의 조절하에 발현시켰다.
4793의 작제: DAGAT
DAGAT의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 쉬조키트리움 DAGAT-1에 대한 핵산 서열 (서열 100, 이는 서열 101을 코딩함)을 발현시켰다. 쉬조키트리움 DAGAT (서열 100으로 나타낸 뉴클레오티드 서열)를 flax 리닌 프로모터/터미네이터 (미국 특허 제6,777,591호) 조절하의 발현 카세트에 클로닝시켰다. 리닌 프로모터는 종자 발생 동안 트랜스유전자(들)의 특정-시간적 및 조직-특이적 발현을 조절한다. 발현 카세트는, 좌측 및 우측 경계 서열 사이에 MAS 프로모터/터미네이터에 의해 구동되는 숙주 식물 카나마이신 내성 부여 nptII 유전자를 함유하는 식물 바이너리 벡터내에 함유되었다.
4794의 작제: DAGAT 및 ACS-8
DAGAT 및 아실-CoA 신테타제의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 (1) 쉬조키트리움 DAGAT에 대한 핵산 서열 (서열 100, 이는 서열 101을 코딩함) 및 (2) 쉬조키트리움 ACS-8에 대한 핵산 서열 (서열 96, 이는 서열 97을 코딩함)을 발현시켰다. 이 구조물의 경우, ACS-8 및 DAGAT의 이중 발현 카세트를, 좌측 및 우측 경계 서열 사이에 MAS 프로모터/터미네이터에 의해 구동되는 숙주 식물 카나마이신 내성 부여 nptII 유전자를 함유하는 식물 바이너리 벡터내에서 flax 리닌 프로모터/터미네이터(미국 특허 제6,777,591호)의 조절하에 발현시켰다.
4795의 작제: LPAAT 및 DAGAT
LPAAT 및 DAGAT의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 (1) 쉬조키트리움 LPAAT에 대한 핵산 서열 (서열 103, 이는 서열 104를 코딩함) 및 (2) 쉬조키트리움 DAGAT-1에 대한 핵산 서열 (서열 100, 이는 서열 101을 코딩함)을 발현시켰다. 이 구조물의 경우, LPAAT 및 DAGAT의 이중 발현 카세트를, 좌측 및 우측 경계 서열 사이에 MAS 프로모터/터미네이터에 의해 구동되는 숙주 식물 카나마이신 내성 부여 nptII 유전자를 함유하는 식물 바이너리 벡터내에서 flax 리닌 프로모터/터미네이터(미국 특허 제6,777,591호)의 조절하에 발현시켰다.
4796의 작제: ACS-8, LPAAT 및 DAGAT
아실-CoA 신테타제, LPAAT 및 DAGAT의 발현을 위해, 별도의 식물 바이너리 벡터를 작제하여 (1) 쉬조키트리움 LPAAT에 대한 핵산 서열 (서열 103, 이는 서열 104를 코딩함), (2) 쉬조키트리움 DAGAT-1에 대한 핵산 서열 (서열 100, 이는 서열 101을 코딩함), 및 (3) 쉬조키트리움 ACS-8에 대한 핵산 서열 (서열 96, 이는 서열 97을 코딩함)을 발현시켰다. 이 구조물의 경우, ACS-8, LPAAT 및 DAGAT의 삼중 발현 카세트를, 좌측 및 우측 경계 서열 사이에 MAS 프로모터/터미네이터에 의해 구동되는 숙주 식물 카나마이신 내성 부여 nptII 유전자를 함유하는 식물 바이너리 벡터내에서 flax 리닌 프로모터/터미네이터(미국 특허 제6,777,591호)의 조절하에 발현시켰다.
(2)
아라비돕시스의
형질전환
모든 식물 바이너리 벡터의 온전함(integrity)을 진단적 제한 절단 및 서열 분석에 의해 확인하였다. 이어서, 단리된 플라스미드를 사용해서 전기천공 (25 μF, 2.5 kV, 200 Ω)에 의해 수용성(competent) 아그로박테리움 균주 EH101 [Hood et al., 1986, J. Bacteriol. 144: 732-743]을 형질전환시켰다. 재조합 아그로박테리움을 AB-스펙티노마이신/카나마이신 (20x AB 염, 2 M 글루코스, 0.25 mg/ml FeSO4ㆍ7H2O, 1 M MgSO4, 1 M CaCl2) 상에 플레이팅하고, 단일 콜로니를 이용해서 5 ml의 AB-스펙티노마이신/카나마이신 브로쓰를 접종시켰다. 이들 배양물을 28 ℃에서 밤새 성장시켰다. 이후, 4127 플라스미드를 함유하는 재조합 아그로박테리움을 사용해서 플라워 침지 방법 [Clough et al., 1998, Plant J. 16: 735-743]에 의해 야생형 C24 아라비돕시스 탈리아나 식물을 형질전환시켰다. 상기 식물로부터 얻은 종자를 포스피노트리신의 존재하에 선별 배지상에 플레이팅하고 발아되도록 하였다. 양성으로 확인된 실생식물을 토양으로 옮기고, 성숙시킨 다음, PUFA 함량에 대하여 종자를 분석하였다.
다른 플라스미드 (5723, 5724, 5730, 5727, 5729, 5731, 5732, 5733, 5734, 4793, 4794, 4795, 및/또는 4796)를 함유하는 재조합 아그로박테리움의 경우, 트랜스제닉 4127-라인 150 아라비돕시스 탈리아나 식물을 플라워 침지 방법 [Clough et al., 1998, Plant J. 16: 735-743]에 의해 다시 형질전환시켰다. 이들 식물로부터 얻은 종자를, 포스피노트리신 및 만노스 (이중 선별의 경우) 또는 포스피노트리신, 만노스 및 카나마이신 또는 포스피노트리신 및 카나마이신 (삼중 선별의 경우)의 존재하에 선별 배지상에 플레이팅하고, 경우에 따라, 발아되도록 하였다. 양성으로 확인된 실생식물을 토양으로 옮기고, 성숙시킨 다음, PUFA 함량에 대하여 종자를 분석하였다.
실시예
13a
이 실시예는 슈퍼구조물 (4127) 상에서 HetI과 함께 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서의 DHA 및 DPAn-6의 제조를 기술한다.
HetI과 함께 쉬조키트리움 PUFA 신타제를 발현시키는 (구조물 4127) 아라비돕시스 식물 유래의 푸울링된 종자에 대한 GC-FAME 분석 결과, 지방산 함량에서 유의한 수준의 표적 PUFA, DHAn-3 및 DPAn-6이 확인되었다. 표 3에 나타낸 바와 같이, 특히 하나의 라인 (4127-라인 150)은 조합된 1.3% 쉬조키트리움-유형 PUFA 함량에서 0.6% DHAn-3 및 0.7% DPAn-6을 나타냈다. 예상된 바와 같이, 야생형 (C24) 백그라운드(background)로부터의 대조군 종자는 임의의 검출가능한 수준의 DHAn-3 또는 DPAn-6을 함유하지 않는다. SDS-PAGE 및 웨스턴 블롯팅에 의해 수행된 4127-라인 150에 대한 추후의 발현 분석 결과, 재조합 종자가 색소체로 정확하게 표적화된 OrfA, OrfB*, OrfC 및 HetI을 발현시킨 것으로 나타났다 (데이터는 나타내지 않음). 또한, 이러한 표현형은 T2 세대의 분석으로부터 T4 세대의 분석에 이르기까지 안정하였으며, 이는 본원에 기재된 다양한 전략 (전략들의 조합을 포함함)이 식물에서 PUFA의 제조 및/또는 축적을 증가시키는 것으로 평가된 경우에 DHA 및 쉬조키트리움 PUFA 수준을 결정하는데 있어서 양성 대조군으로서 작용하였다.
포스피노트리신 양성 식물로부터 선택된 T2 및 T4 푸울링된 종자 집단에서 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화됨)과 함께 발현시키는 트랜스제닉 종자와 비교된, 성숙한 야생형 아라비돕시스 종자에서의 DHA 및 DPA 수준. % DHAn-3 및 % DPAn-6은 총 계산된 FAME에 대한 후속 GC 분리 및 FID 검출에 의해 결정하였다. | ||||||
전략 |
유전자형 |
라인 |
세대 |
표현형 | ||
%DHA (C22:6 n-3) |
%DPA (C22:5 n-6) |
%DHA + DPA | ||||
음성 대조군 | 야생형 (푸울링된 종자) |
C24 생태형 (ecotype) |
N/A | 0 | 0 | 0 |
PUFA 신타제 + HetI |
OrfA, OrfB*, OrfC, HetI (푸울링된 종자) |
4127-라인 150 |
T2 | 0.6 | 0.7 | 1.3 |
T4 | 0.6 | 0.6 | 1.2 |
실시예
13b
이 실시예는 쉬조키트리움 PUFA 신타제 (Orf A, Orf B* 및 Orf C)와 HetI (4127)을 쉬조키트리움 ScACS-1 유전자 (5723) 또는 ScACS-2 유전자 (5724)와의 조합으로 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서의 DHAn-3 및 DPAn-6의 제조를 기술한다.
4127-라인 150 (실시예 13a 참조)으로부터 유래된 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 ScACS-1 구조물 (5723) 또는 ScACS-2 구조물 (5724)을 도입하기 위해 사용되었다. 포스피노트리신 및 만노스 둘다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
예로서, 특히 쉬조키트리움 PKS를 HetI과 함께 ACS-1과 조합하여 발현시키는 하나의 라인 (4127/5723-라인 514)은 총 지방산 프로필 중 조합된 2.4% 쉬조키트리움 PUFA 함량에 있어서 1.5% DHA 및 0.9% DPAn-6을 나타냈다 (표 4). 이러한 결과는 4127-라인 150 양성 대조군에 비해 DHAn-3 함량이 2.5배 증가한 것이었다. 양성 대조군에 비해 DHAn-3 함량에서 1.8배 증가를 나타낸 ACS-2 (4127/5724-라인 552)과의 조합으로 쉬조키트리움 PKS를 HetI과 함께 발현시킨 라인에서 유사한 결과가 관찰되었다. 또한, DHA 대 DPA의 비율은 4127-라인 150의 T2 세대에서의 대략 0.85:1.0 또는 T4 세대에서의 대략 1.0:1.0으로부터 ACS-1 라인에서의 대략 1.7:1.0 및 ACS-2 라인에서의 대략 1.2:1.0에 이르기까지 변화된 것으로 관찰되었다. 분석된 모든 트랜스제닉 종자에서, 프로필 중 검출된 유일한 신규 지방산은 DHA n-3 또는 DPAn-6이었다.
푸울링된 종자에서, 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화됨) 발현과 함께 쉬조키트리움 ACS-1 또는 ACS-2의 발현과 조합하는 트랜스제닉 종자와 비교된, 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화됨)과 함께 발현시키는 성숙한 야생형 및 트랜스제닉 아라비돕시스 종자에서의 DHAn-3 및 DPAn-6 수준. % DHA n-3 및 % DPAn-6은 총 계산된 FAME에 대한 후속 GC 분리 및 FID 검출에 의해 결정하였다. | ||||||
전략 |
유전자형 |
라인 |
세대 |
표현형 | ||
%DHA (C22:6 n-3) |
%DPA (C22:5 n-6) |
%DHA + DPA | ||||
음성 대조군 | 야생형 (푸울링된 종자) |
C24 생태형 | N/A | 0 | 0 | 0 |
양성 대조군 |
OrfA, OrfB*, OrfC, HetI (푸울링된 종자) |
4127-라인 150 |
T2 | 0.6 | 0.7 | 1.3 |
T4 | 0.6 | 0.6 | 1.2 | |||
아실CoAS 발현 |
OrfA, OrfB*, OrfC, HetI, ACS-1 (푸울링된 종자) |
4127/5723-라인 514 | T4/T2 |
1.5 | 0.9 | 2.4 |
OrfA, OrfB*, OrfC, HetI, ACS-2 (푸울링된 종자) |
4127/5724-라인 552 | 1.1 | 0.9 | 2.0 |
실시예
13c
이 실시예는 RNA 간섭 (RNAi)을 이용해서 KAS II를 약화시킴으로써 FAS를 억제하는 것과 조합하여, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서 DHA 및 DPAn-6을 제조하는 것을 기술한다.
4127-라인 150으로부터 유래된 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 인트론을 갖는 KAS II RNAi (구조물 5727)를 도입하기 위해 사용되었다. 포스피노트리신 및 만노스 둘다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
예로서, 특히 하나의 라인 (4127/5727-라인 1097)은 총 지방산 프로필 중 조합된 2.5% 쉬조키트리움 PUFA 함량에 있어서 1.3% DHA n-3 및 1.2% DPAn-6을 나타냈다 (표 5). 이러한 결과는 4127-라인 150 양성 대조군에 비해 DHA 함량이 2.1배 넘게 증가한 것이었다. 이후, 4127/5727-라인 1097로부터의 단일-종자를 GC 분리 및 FID 검출에 의해 총 계산된 FAME에 대하여 개별적으로 분석하였다.
상기 분석 후, 이 집단내의 종자가 총 지방산 프로필 중 조합된 3.6% 쉬조키트리움 PUFA 함량에 있어서 2.0% DHAn-3 및 1.6% DPAn-6을 나타냈다 (표 5). 이러한 결과는 4127-라인 150 양성 대조군에 비해 DHA 함량에서 3.3배 증가 및 쉬조키트리움 PUFA 함량에서 3배 증가를 나타낸다. 또한, DHA 대 DPA 비율은 4127-라인 150의 T2 세대에서의 0.85:1.0 또는 T4 세대에서의 1.0:1.0으로부터 FAS 억제 라인에서의 1.25:1.0 또는 그보다 큰 비율에 이르기까지 변화된 것으로 관찰되었다. 단일 종자 평균은 %DHA n-3, %DPAn-6 및 총 % (DHA + DPA)에 대하여 푸울링된 샘플과 일치하였으며, 이 집단내의 차이는 공동형질전환된 종자에서의 재조합 4127 및 5727 유전자좌의 분리로 인한 것일 수 있다. 분석된 모든 트랜스제닉 종자에서, 프로필 중 검출된 유일한 신규 지방산은 DHA n-3 또는 DPAn-6이었다.
푸울링 및 단일 종자에서 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화된) 발현과 함께 KAS II 약화와 조합하는 트랜스제닉 종자와 비교된, 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화됨)과 함께 발현시키는 성숙한 야생형 및 트랜스제닉 아라비돕시스 종자에서의 DHA 및 DPA 수준. % DHA n-3 및 % DPAn-6은 총 계산된 FAME에 대한 후속 GC 분리 및 FID 검출에 의해 결정하였다. | ||||||
전략 |
유전자형 |
라인 |
세대 |
표현형 | ||
%DHA (C22:6 n-3) |
%DPA (C22:5 n-6) |
%DHA + DPA | ||||
음성 대조군 | 야생형 (푸울링된 종자) |
C24 생태형 | N/A | 0 | 0 | 0 |
양성 대조군 |
OrfA, OrfB*, OrfC, HetI (푸울링된 종자) |
4127-라인 150 | T2 | 0.6 | 0.7 | 1.3 |
T4 | 0.6 | 0.6 | 1.2 | |||
FAS 억제 |
OrfA, OrfB*, OrfC, HetI, 인트론을 갖는 KAS II RNAi (푸울링된 종자) |
4127/5727-라인 1097 | T4/T2 |
1.3 | 1.2 | 2.5 |
OrfA, OrfB*, OrfC, HetI, 인트론을 갖는 KAS II RNAi (단일 종자) |
1097-7 | 0.7 | 0.7 | 1.4 | ||
1097-9 | 0.7 | 0.8 | 1.5 | |||
1097-2 | 0.9 | 0.9 | 1.8 | |||
1097-5 | 1.0 | 0.9 | 1.9 | |||
1097-6 | 1.0 | 1.1 | 2.1 | |||
1097-1 | 1.2 | 1.3 | 2.5 | |||
1097-8 | 1.3 | 1.3 | 2.6 | |||
1097-4 | 1.4 | 0.8 | 2.2 | |||
1097-10 | 1.4 | 1.2 | 2.6 | |||
1097-3 | 2.0 | 1.6 | 3.6 | |||
단일 종자 평균 |
T4/T2 | 1.2 | 1.0 | 2.2 |
실시예
13d
이 실시예는 안티센스 RNA를 이용해서 KAS III을 약화시킴으로써 FAS를 억제하는 것과 조합하여, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서 DHA 및 DPAn-6을 제조하는 것을 기술한다.
4127-라인 150으로부터 유래된 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 KAS III 안티센스 구조물 (5129)을 도입하기 위해 사용되었다. 포스피노트리신 및 만노스 둘 다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
예로서, 특히 하나의 라인 (4127/5729-라인 1087)은 총 지방산 프로필 중 조합된 2.5% 쉬조키트리움 PUFA 함량에 있어서 1.7% DHA n-3 및 1.2% DPAn-6을 나타냈다 (표 6). 이러한 결과는 4127-라인 150 양성 대조군에 비해 DHA 함량이 2.1배 넘게 증가한 것이었다. 이후, 4127/5727-라인 1097로부터의 단일-종자를 GC 분리 및 FID 검출에 의해 총 계산된 FAME에 대하여 개별적으로 분석하였다. 이러한 결과는 4127-라인 150 양성 대조군에 비해 DHA 함량에서의 2.8배 증가를 나타냈다.
이후, 4127/5729-라인 1087 유래의 단일-종자를 GC 분리 및 FID 검출에 의해 총 계산된 FAME에 대하여 개별적으로 분석하였다. 이 분석 후, 상기 집단내의 종자는 지방산 프로필에서 조합된 4.2% 쉬조키트리움 PUFA 함량에 있어서 최대 2.4%의 DHA n-3 및 1.8%의 DPAn-6을 나타낸 것으로 관찰되었다 (표 6). 이러한 결과는 4127-라인 150 양성 대조군에 비해 DHA 함량에서의 4배 증가 및 쉬조키트리움 PUFA 함량에서의 3.2배 증가를 나타낸다. 또한, DHA 대 DPA의 비율은 4127-라인 150의 T2 세대에서의 0.85:1.0 또는 T4 세대에서의 1.0:1.0으로부터 FAS 억제 라인에서의 1.33:1.0 또는 그보다 높은 비율로 변화된 것으로 관찰되었다. 단일 종자 평균은 %DHA n-3, %DPAn-6 및 총 % (DHA + DPA)에 대하여 푸울링된 샘플과 일치하였으며, 이 집단내의 차이는 공동형질전환된 종자에서 재조합 4127 및 5729 유전자좌의 분리로 인한 것일 수 있다. 분석된 모든 트랜스제닉 종자에서, 프로필 중 검출된 유일한 신규 지방산은 이. 콜라이 및 효모에서 관찰된 기존의 생화학적 및 이종 발현 데이터로부터 예상된 바와 같이 DHA n-3 또는 DPAn-6이었다. 종자 샘플 1087-7의 분석에서 얻어진 GC-FAME 크로마토그램은 도 14에 나타나있다.
푸울링 및 단일 종자에서 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화된) 발현과 함께 KAS III 약화와 조합하는 트랜스제닉 종자와 비교된, 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화됨)과 함께 발현시키는 성숙한 야생형 및 트랜스제닉 아라비돕시스 종자에서의 DHA 및 DPA 수준. % DHA n-3 및 % DPAn-6은 총 계산된 FAME에 대한 후속 GC 분리 및 FID 검출에 의해 결정하였다. | ||||||
전략 |
유전자형 |
라인 |
세대 |
표현형 | ||
%DHA (C22:6 n-3) |
%DPA (C22:5 n-6) |
%DHA + DPA | ||||
음성 대조군 | 야생형 (푸울링된 종자) |
C24 생태형 | N/A | 0 | 0 | 0 |
양성 대조군 |
OrfA, OrfB*, OrfC, HetI (푸울링된 종자) |
4127-라인 150 | T2 | 0.6 | 0.7 | 1.3 |
T4 | 0.6 | 0.6 | 1.2 | |||
FAS 억제 |
OrfA, OrfB*, OrfC, HetI, 인트론을 갖는 KAS III 안티센스 RNA (푸울링된 종자) |
4127/5729-라인 1087 | T4/T2 |
1.7 | 1.2 | 2.9 |
OrfA, OrfB*, OrfC, HetI, KAS III 안티센스 RNA (단일 종자) |
1087-9 | 0.9 | 1.0 | 1.9 | ||
1087-4 | 1.0 | 1.1 | 2.1 | |||
1087-2 | 1.1 | 0.9 | 2.0 | |||
1087-6 | 1.2 | 0.6 | 1.8 | |||
1087-1 | 1.3 | 1.1 | 2.4 | |||
1087-8 | 1.4 | 1.5 | 2.9 | |||
1087-3 | 1.7 | 1.1 | 2.8 | |||
1087-10 | 1.8 | 1.6 | 3.4 | |||
1087-5 | 2.0 | 1.6 | 3.6 | |||
1087-7 | 2.4 | 1.8 | 4.2 | |||
단일 종자 평균 |
T4/T2 | 1.5 | 1.2 | 2.7 |
실시예
13e
이 실시예는 안티센스 RNA를 이용해서 KAS III을 약화시킴으로써 ScACS-1 유전자를 발현시키면서 동시에 FAS를 억제하는 것과 조합하여, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서 DHA 및 DPAn-6을 제조하는 것을 기술한다.
4127-라인 150으로부터 유래된 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 구조물 5731을 사용해서 ScACS-1에 더하여 KAS II RNAi를 도입하기 위해 사용되었다. 포스피노트리신 및 만노스 둘 다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
예로서, 하나의 라인 (4127/5731-라인 1366)은 총 지방산 프로필 중 조합된 3.8% 쉬조키트리움 PUFA 함량에 있어서 1.9% DHA 및 1.9% DPAn-6을 나타냈다 (표 7). 이러한 결과는, 각각 실시예 13b 및 13c (표 4 및 5)에 기재된 바와 같은 푸울링된 종자 집단으로부터의 DHA 함량을 비교했을 때, 4127-라인 150 양성 대조군에 비해 3.2배 증가, 4127/5723-라인 514에서 관찰된 바와 같은 ACS-1 전략 단독에 비해 1.3배 증가 및 4127/5727-라인 1097에서 관찰된 바와 같은 KAS II RNAi 약화 전략 단독에 비해 1.5배 증가를 나타냈다.
당업자라면 푸울링된 종자 중의 4127 및 5731 유전자좌의 분리를 반영하는 것으로서 상기 집단내의 단일 종자에서 관찰되는 DHA 함량이 더 높은 수준이라는 것을 예상할 것이다. 분석된 모든 트랜스제닉 종자에서, 프로필 중 검출된 유일한 신규 지방산은 이. 콜라이 및 효모에서 간찰된 기존의 생화학적 및 이종 발현 데이터로부터 예상된 바와 같은 DHA n-3 또는 DPAn-6이었다. 푸울링된 종자 샘플 4127/5731-라인 1366의 분석에서 얻어진 GC-FAME 크로마토그램은 도 15에 나타나 있다.
푸울링된 종자에서, 쉬조키트리움 ACS-1 발현 및 FAS 억제와 함께 조합된 HetI (색소체 표적화됨)과 함께 쉬조키트리움 PUFA 신타제를 조합하는 트랜스제닉 종자와 비교된, 쉬조키트리움 PUFA 신타제를 HetI (색소체 표적화됨)과 함께 발현시키는 성숙한 야생형 및 트랜스제닉 아라비돕시스 종자에서의 DHAn-3 및 DPAn-6 수준. % DHA n-3 및 % DPAn-6은 총 계산된 FAME에 대한 후속 GC 분리 및 FID 검출에 의해 결정하였다. | ||||||
전략 |
유전자형 |
라인 |
세대 |
표현형 | ||
%DHA (C22:6 n-3) |
%DPA (C22:5 n-6) |
%DHA + DPA | ||||
음성 대조군 | 야생형 (푸울링된 종자) |
C24 생태형 | N/A | 0 | 0 | 0 |
양성 대조군 |
OrfA, OrfB*, OrfC, HetI (푸울링된 종자) |
4127-라인 150 | T2 | 0.6 | 0.7 | 1.3 |
T4 | 0.6 | 0.6 | 1.2 | |||
아실CoAS 발현 및 FAS 억제 |
OrfA, OrfB*, OrfC, HetI, ACS-1, KAS II RNAi (푸울링된 종자) |
4127/5731-라인 1366 | T4/T2 | 1.9 | 1.9 | 3.8 |
실시예
13f
이 실시예는 쉬조키트리움 LPAAT의 발현과 조합된, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서의 DHA 및 DPAn-6의 제조를 기술한다.
4127-라인 150으로부터 유래된 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 LPAAT 구조물 (5725)을 도입하기 위해 사용되었다. 포스피노트리신 및 만노스 둘 다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
상기 식물 유래의 종자는 표적 PUFA (DHA 및 DPAn-6)를 제조하는 것으로 예상된다. 또한 DHA 및/또는 DPAn-6의 제조 수준은 첨가된 LPAAT 구조물의 부재하에서의 PUFA PKS-발현 식물과 비교해서 증가되는 것으로 예상된다.
실시예
13g
이 실시예는 RNAi를 이용해서 KAS II를 약화시키거나 또는 안티센스를 이용해서 KAS III을 약화시킴으로써 FAS를 억제하는 것 및 쉬조키트리움 DAGAT 및 ACS-1을 발현시키는 것과 조합하여, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서 DHA 및 DPAn-6을 제조하는 것을 기술한다.
5731 (KASII RNAi에 의한 FAS 억제 및 ACS-1 발현의 조합)로부터 유래된 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 DAGAT 구조물 (4793)을 도입하기 위해 사용되었다. 유사한 식물이 또한 5734 백그라운드 (KASIII 안티센스에 의한 FAS 억제 및 ACS-1 발현의 조합) 상에서 생성되었다. 포스피노트리신 및 만노스 둘 다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
상기 식물 유래의 종자는 표적 PUFA (DHA 및 DPAn-6)를 제조하는 것으로 예상된다. 또한 DHA 및/또는 DPAn-6의 제조 수준은 첨가된 DAGAT 구조물 및 FAS 억제의 부재하에 PUFA PKS-발현 식물에 비해 증가하는 것으로 예상된다.
실시예
13h
이 실시예는 쉬조키트리움 DAGAT 및 ACS-8의 발현과 함께 조합되고, 추가로 RNAi를 사용해서 KAS II를 약화시키거나 또는 안티센스를 사용해서 KAS III을 약화시킴으로써 FAS를 억제하고 동시에 쉬조키트리움 ACS-1을 발현시키는 것과 조합하여, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서의 DHA 및 DPAn-6의 제조를 기술한다.
5731 (KASII RNAi에 의한 FAS 억제 및 ACS-1 발현의 조합) 유래의 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 DAGAT/ACS-8 구조물 (4794)을 도입하기 위해 사용되었다. 유사한 식물이 또한 5734 백그라운드 (KASIII 안티센스에 의한 FAS 억제 및 ACS-1 발현의 조합) 상에서 생성되었다. 포스피노트리신 및 만노스 둘 다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
상기 식물 유래의 종자는 표적 PUFA (DHA 및 DPAn-6)를 제조하는 것으로 예상된다. 또한 DHA 및/또는 DPAn-6의 제조 수준은 첨가된 DAGAT/ACS-8 구조물, ACS-1 구조물, 및 FAS 억제의 부재하에 PUFA PKS-발현 식물에 비해 증가하는 것으로 예상된다.
실시예
13i
이 실시예는 쉬조키트리움 LPAAT 및 쉬조키트리움 DAGAT의 발현과 함께 조합되고, 추가로 RNAi를 사용해서 KAS II를 약화시키거나 또는 안티센스를 사용해서 KAS III을 약화시킴으로써 FAS를 억제하고 동시에 쉬조키트리움 ACS-1을 발현시키는 것과 조합하여, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서의 DHA 및 DPAn-6의 제조를 기술한다.
5731 (KASII RNAi에 의한 FAS 억제 및 ACS-1 발현의 조합) 유래의 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 DAGAT/LPAAT 구조물 (4795)을 도입하기 위해 사용되었다. 유사한 식물이 또한 5734 백그라운드 (KASIII 안티센스에 의한 FAS 억제 및 ACS-1 발현의 조합) 상에서 생성되었다. 포스피노트리신 및 만노스 둘 다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
상기 식물 유래의 종자는 표적 PUFA (DHA 및 DPAn-6)를 제조하는 것으로 예상된다. 또한 DHA 및/또는 DPAn-6의 제조 수준은 첨가된 DAGAT/LPAAT 구조물, ACS-1 구조물, 및 FAS 억제의 부재하에 PUFA PKS-발현 식물에 비해 증가하는 것으로 예상된다.
실시예
13j
이 실시예는 쉬조키트리움 LPAAT, 쉬조키트리움 DAGAT, 및 쉬조키트리움 ACS-8의 발현과 함께 조합되고, 추가로 RNAi를 사용해서 KAS II를 약화시키거나 또는 안티센스를 사용해서 KAS III을 약화시킴으로써 FAS를 억제하고 동시에 쉬조키트리움 ACS-1을 발현시키는 것과 조합하여, 쉬조키트리움 PUFA 신타제 (OrfA, OrfB* 및 OrfC)를 HetI과 함께 발현시키는 트랜스제닉 아라비돕시스 탈리아나 종자에서의 DHA 및 DPAn-6의 제조를 기술한다.
5731 (KASII RNAi에 의한 FAS 억제 및 ACS-1 발현의 조합) 유래의 식물은 상기 기재된 바와 같은 아그로박테리움-매개 형질전환에 의해 DAGAT/LPAAT/ACS-8 구조물 (4796)을 도입하기 위해 사용되었다. 유사한 식물이 또한 5734 백그라운드 (KASIII 안티센스에 의한 FAS 억제 및 ACS-1 발현의 조합) 상에서 생성되었다. 포스피노트리신 및 만노스 둘 다의 존재하에 재조합 식물을 선별한 다음, 종자를 수확하고, 푸울링된 종자로부터 제조된 FAME의 GC 분리 및 FID 검출에 의해 지방산 프로필에 대하여 분석하였다.
상기 식물 유래의 종자는 표적 PUFA (DHA 및 DPAn-6)를 제조하는 것으로 예상된다. 또한 DHA 및/또는 DPAn-6의 제조 수준은 첨가된 DAGAT/LPAAT/ACS-8 구조물, ACS-1 구조물, 및 FAS 억제의 부재하에 PUFA PKS-발현 식물에 비해 증가하는 것으로 예상된다.
2006년 3월 15일에 출원된 미국 가출원 일련번호 제60/783,205호 및 미국 가출원 일련번호 제60/784,616호 각각의 전체 개시내용은 본원에 참고로 도입된다.
본 발명의 다양한 실시양태를 상세히 기술하였지만, 이러한 실시양태의 변형 및 개질은 당업자에게는 자명한 것이다. 그러나, 상기 변형 및 개질은 본 발명의 범위내에 포함되는 것으로 명확하게 이해된다.
SEQUENCE LISTING
<110> Martek Biosciences Corporation
Metz, James G
Kuner, Jerry M
Lippmeier, James Casey
<120> Polyunsaturated Fatty Acid Production in Heterologous Organisms
Using PUFA Polyketide Synthase Systems
<130> 2997-114
<150> 60/783,205
<151> 2006-03-15
<150> 60/784,616
<151> 2006-03-21
<160> 125
<170> PatentIn version 3.4
<210> 1
<211> 8733
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(8733)
<400> 1
atg gcg gcc cgt ctg cag gag caa aag gga ggc gag atg gat acc cgc 48
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1 5 10 15
att gcc atc atc ggc atg tcg gcc atc ctc ccc tgc ggc acg acc gtg 96
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
20 25 30
cgc gag tcg tgg gag acc atc cgc gcc ggc atc gac tgc ctg tcg gat 144
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
35 40 45
ctc ccc gag gac cgc gtc gac gtg acg gcg tac ttt gac ccc gtc aag 192
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
50 55 60
acc acc aag gac aag atc tac tgc aag cgc ggt ggc ttc att ccc gag 240
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65 70 75 80
tac gac ttt gac gcc cgc gag ttc gga ctc aac atg ttc cag atg gag 288
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
85 90 95
gac tcg gac gca aac cag acc atc tcg ctt ctc aag gtc aag gag gcc 336
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
100 105 110
ctc cag gac gcc ggc atc gac gcc ctc ggc aag gaa aag aag aac atc 384
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
115 120 125
ggc tgc gtg ctc ggc att ggc ggc ggc caa aag tcc agc cac gag ttc 432
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
130 135 140
tac tcg cgc ctt aat tat gtt gtc gtg gag aag gtc ctc cgc aag atg 480
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145 150 155 160
ggc atg ccc gag gag gac gtc aag gtc gcc gtc gaa aag tac aag gcc 528
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
165 170 175
aac ttc ccc gag tgg cgc ctc gac tcc ttc cct ggc ttc ctc ggc aac 576
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
180 185 190
gtc acc gcc ggt cgc tgc acc aac acc ttc aac ctc gac ggc atg aac 624
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
195 200 205
tgc gtt gtc gac gcc gca tgc gcc tcg tcc ctc atc gcc gtc aag gtc 672
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
210 215 220
gcc atc gac gag ctg ctc tac ggt gac tgc gac atg atg gtc acc ggt 720
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225 230 235 240
gcc acc tgc acg gat aac tcc atc ggc atg tac atg gcc ttc tcc aag 768
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
245 250 255
acc ccc gtg ttc tcc acg gac ccc agc gtg cgc gcc tac gac gaa aag 816
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
260 265 270
aca aag ggc atg ctc atc ggc gag ggc tcc gcc atg ctc gtc ctc aag 864
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
275 280 285
cgc tac gcc gac gcc gtc cgc gac ggc gat gag atc cac gct gtt att 912
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
290 295 300
cgc ggc tgc gcc tcc tcc agt gat ggc aag gcc gcc ggc atc tac acg 960
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305 310 315 320
ccc acc att tcg ggc cag gag gag gcc ctc cgc cgc gcc tac aac cgc 1008
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
325 330 335
gcc tgt gtc gac ccg gcc acc gtc act ctc gtc gag ggt cac ggc acc 1056
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
340 345 350
ggt act ccc gtt ggc gac cgc atc gag ctc acc gcc ttg cgc aac ctc 1104
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
355 360 365
ttt gac aag gcc tac ggc gag ggc aac acc gaa aag gtc gct gtg ggc 1152
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
370 375 380
agc atc aag tcc agc atc ggc cat ctc aag gcc gtc gcc ggt ctc gcc 1200
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385 390 395 400
ggt atg atc aag gtc atc atg gcg ctc aag cac aag act ctc ccg ggc 1248
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
405 410 415
acc atc aac gtc gac aac cca ccc aac ctc tac gac aac acg ccc atc 1296
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
420 425 430
aac gag tcc tcg ctc tac att aac acc atg aac cgc ccc tgg ttc ccg 1344
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
435 440 445
ccc cct ggt gtg ccc cgc cgc gcc ggc att tcg agc ttt ggc ttt ggt 1392
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
450 455 460
ggc gcc aac tac cac gcc gtc ctc gag gag gcc gag ccc gag cac acg 1440
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465 470 475 480
acc gcg tac cgc ctc aac aag cgc ccg cag ccc gtg ctc atg atg gcc 1488
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
485 490 495
gcc acg ccc gcg gcc ctc cag tcg ctc tgc gag gcc cag ctc aag gag 1536
Ala Thr Pro Ala Ala Leu Gln Ser Leu Cys Glu Ala Gln Leu Lys Glu
500 505 510
ttc gag gcc gcc atc aag gag aac gag acc gtc aag aac acc gcc tac 1584
Phe Glu Ala Ala Ile Lys Glu Asn Glu Thr Val Lys Asn Thr Ala Tyr
515 520 525
atc aag tgc gtc aag ttc ggc gag cag ttc aaa ttc cct ggc tcc atc 1632
Ile Lys Cys Val Lys Phe Gly Glu Gln Phe Lys Phe Pro Gly Ser Ile
530 535 540
ccg gcc aca aac gcg cgc ctc ggc ttc ctc gtc aag gat gct gag gat 1680
Pro Ala Thr Asn Ala Arg Leu Gly Phe Leu Val Lys Asp Ala Glu Asp
545 550 555 560
gcc tgc tcc acc ctc cgt gcc atc tgc gcc caa ttc gcc aag gat gtc 1728
Ala Cys Ser Thr Leu Arg Ala Ile Cys Ala Gln Phe Ala Lys Asp Val
565 570 575
acc aag gag gcc tgg cgc ctc ccc cgc gag ggc gtc agc ttc cgc gcc 1776
Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe Arg Ala
580 585 590
aag ggc atc gcc acc aac ggc gct gtc gcc gcg ctc ttc tcc ggc cag 1824
Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser Gly Gln
595 600 605
ggc gcg cag tac acg cac atg ttt agc gag gtg gcc atg aac tgg ccc 1872
Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn Trp Pro
610 615 620
cag ttc cgc cag agc att gcc gcc atg gac gcc gcc cag tcc aag gtc 1920
Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser Lys Val
625 630 635 640
gct gga agc gac aag gac ttt gag cgc gtc tcc cag gtc ctc tac ccg 1968
Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu Tyr Pro
645 650 655
cgc aag ccg tac gag cgt gag ccc gag cag gac cac aag aag atc tcc 2016
Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys Ile Ser
660 665 670
ctc acc gcc tac tcg cag ccc tcg acc ctg gcc tgc gct ctc ggt gcc 2064
Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu Gly Ala
675 680 685
ttt gag atc ttc aag gag gcc ggc ttc acc ccg gac ttt gcc gcc ggc 2112
Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala Ala Gly
690 695 700
cat tcg ctc ggt gag ttc gcc gcc ctc tac gcc gcg ggc tgc gtc gac 2160
His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys Val Asp
705 710 715 720
cgc gac gag ctc ttt gag ctt gtc tgc cgc cgc gcc cgc atc atg ggc 2208
Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile Met Gly
725 730 735
ggc aag gac gca ccg gcc acc ccc aag ggc tgc atg gcc gcc gtc att 2256
Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala Val Ile
740 745 750
ggc ccc aac gcc gag aac atc aag gtc cag gcc gcc aac gtc tgg ctc 2304
Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val Trp Leu
755 760 765
ggc aac tcc aac tcg cct tcg cag acc gtc atc acc ggc tcc gtc gaa 2352
Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser Val Glu
770 775 780
ggt atc cag gcc gag agc gcc cgc ctc cag aag gag ggc ttc cgc gtc 2400
Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe Arg Val
785 790 795 800
gtg cct ctt gcc tgc gag agc gcc ttc cac tcg ccc cag atg gag aac 2448
Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met Glu Asn
805 810 815
gcc tcg tcg gcc ttc aag gac gtc atc tcc aag gtc tcc ttc cgc acc 2496
Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe Arg Thr
820 825 830
ccc aag gcc gag acc aag ctc ttc agc aac gtc tct ggc gag acc tac 2544
Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu Thr Tyr
835 840 845
ccc acg gac gcc cgc gag atg ctt acg cag cac atg acc agc agc gtc 2592
Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser Ser Val
850 855 860
aag ttc ctc acc cag gtc cgc aac atg cac cag gcc ggt gcg cgc atc 2640
Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala Arg Ile
865 870 875 880
ttt gtc gag ttc gga ccc aag cag gtg ctc tcc aag ctt gtc tcc gag 2688
Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val Ser Glu
885 890 895
acc ctc aag gat gac ccc tcg gtt gtc acc gtc tct gtc aac ccg gcc 2736
Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn Pro Ala
900 905 910
tcg ggc acg gat tcg gac atc cag ctc cgc gac gcg gcc gtc cag ctc 2784
Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val Gln Leu
915 920 925
gtt gtc gct ggc gtc aac ctt cag ggc ttt gac aag tgg gac gcc ccc 2832
Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp Ala Pro
930 935 940
gat gcc acc cgc atg cag gcc atc aag aag aag cgc act acc ctc cgc 2880
Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr Leu Arg
945 950 955 960
ctt tcg gcc gcc acc tac gtc tcg gac aag acc aag aag gtc cgc gac 2928
Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val Arg Asp
965 970 975
gcc gcc atg aac gat ggc cgc tgc gtc acc tac ctc aag ggc gcc gca 2976
Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly Ala Ala
980 985 990
ccg ctc atc aag gcc ccg gag ccc gtt gtc gac gag gcc gcc aag cgc 3024
Pro Leu Ile Lys Ala Pro Glu Pro Val Val Asp Glu Ala Ala Lys Arg
995 1000 1005
gag gcc gag cgt ctc cag aag gag ctt cag gat gcc cag cgc cag 3069
Glu Ala Glu Arg Leu Gln Lys Glu Leu Gln Asp Ala Gln Arg Gln
1010 1015 1020
ctc gac gac gcc aag cgc gcc gcc gcc gag gcc aac tcc aag ctc 3114
Leu Asp Asp Ala Lys Arg Ala Ala Ala Glu Ala Asn Ser Lys Leu
1025 1030 1035
gcc gct gcc aag gag gag gcc aag acc gcc gct gct tcg gcc aag 3159
Ala Ala Ala Lys Glu Glu Ala Lys Thr Ala Ala Ala Ser Ala Lys
1040 1045 1050
ccc gca gtt gac act gct gtt gtc gaa aag cat cgt gcc atc ctc 3204
Pro Ala Val Asp Thr Ala Val Val Glu Lys His Arg Ala Ile Leu
1055 1060 1065
aag tcc atg ctc gcg gag ctc gat ggc tac gga tcg gtc gac gct 3249
Lys Ser Met Leu Ala Glu Leu Asp Gly Tyr Gly Ser Val Asp Ala
1070 1075 1080
tct tcc ctc cag cag cag cag cag cag cag acg gcc ccc gcc ccg 3294
Ser Ser Leu Gln Gln Gln Gln Gln Gln Gln Thr Ala Pro Ala Pro
1085 1090 1095
gtc aag gct gct gcg cct gcc gcc ccc gtt gcc tcg gcc cct gcc 3339
Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser Ala Pro Ala
1100 1105 1110
ccg gct gtc tcg aac gag ctt ctt gag aag gcc gag act gtc gtc 3384
Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val
1115 1120 1125
atg gag gtc ctc gcc gcc aag acc ggc tac gag acc gac atg atc 3429
Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile
1130 1135 1140
gag gct gac atg gag ctc gag acc gag ctc ggc att gac tcc atc 3474
Glu Ala Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile
1145 1150 1155
aag cgt gtc gag atc ctc tcc gag gtc cag gcc atg ctc aat gtc 3519
Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val
1160 1165 1170
gag gcc aag gat gtc gat gcc ctc agc cgc act cgc act gtt ggt 3564
Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly
1175 1180 1185
gag gtt gtc aac gcc atg aag gcc gag atc gct ggc agc tct gcc 3609
Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala
1190 1195 1200
ccg gcg cct gct gcc gct gct ccg gct ccg gcc aag gct gcc cct 3654
Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Lys Ala Ala Pro
1205 1210 1215
gcc gcc gct gcg cct gct gtc tcg aac gag ctt ctc gag aag gcc 3699
Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala
1220 1225 1230
gag acc gtc gtc atg gag gtc ctc gcc gcc aag act ggc tac gag 3744
Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu
1235 1240 1245
act gac atg atc gag tcc gac atg gag ctc gag act gag ctc ggc 3789
Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly
1250 1255 1260
att gac tcc atc aag cgt gtc gag atc ctc tcc gag gtt cag gcc 3834
Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala
1265 1270 1275
atg ctc aac gtc gag gcc aag gac gtc gac gct ctc agc cgc act 3879
Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr
1280 1285 1290
cgc act gtg ggt gag gtc gtc aac gcc atg aag gct gag atc gct 3924
Arg Thr Val Gly Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala
1295 1300 1305
ggt ggc tct gcc ccg gcg cct gcc gcc gct gcc cca ggt ccg gct 3969
Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Gly Pro Ala
1310 1315 1320
gct gcc gcc cct gcg cct gcc gcc gcc gcc cct gct gtc tcg aac 4014
Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn
1325 1330 1335
gag ctt ctt gag aag gcc gag acc gtc gtc atg gag gtc ctc gcc 4059
Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala
1340 1345 1350
gcc aag act ggc tac gag act gac atg atc gag tcc gac atg gag 4104
Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu
1355 1360 1365
ctc gag acc gag ctc ggc att gac tcc atc aag cgt gtc gag att 4149
Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile
1370 1375 1380
ctc tcc gag gtc cag gcc atg ctc aac gtc gag gcc aag gac gtc 4194
Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
1385 1390 1395
gac gct ctc agc cgc acc cgc act gtt ggc gag gtc gtc gat gcc 4239
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala
1400 1405 1410
atg aag gcc gag atc gct ggt ggc tct gcc ccg gcg cct gcc gcc 4284
Met Lys Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala
1415 1420 1425
gct gct cct gct ccg gct gct gcc gcc cct gcg cct gcc gcc cct 4329
Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Pro
1430 1435 1440
gcg cct gct gtc tcg agc gag ctt ctc gag aag gcc gag act gtc 4374
Ala Pro Ala Val Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val
1445 1450 1455
gtc atg gag gtc ctc gcc gcc aag act ggc tac gag act gac atg 4419
Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met
1460 1465 1470
atc gag tcc gac atg gag ctc gag acc gag ctc ggc att gac tcc 4464
Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser
1475 1480 1485
atc aag cgt gtc gag att ctc tcc gag gtc cag gcc atg ctc aac 4509
Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn
1490 1495 1500
gtc gag gcc aag gac gtc gac gct ctc agc cgc acc cgc act gtt 4554
Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val
1505 1510 1515
ggc gag gtc gtc gat gcc atg aag gcc gag atc gct ggt ggc tct 4599
Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Gly Ser
1520 1525 1530
gcc ccg gcg cct gcc gcc gct gct cct gct ccg gct gct gcc gcc 4644
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala
1535 1540 1545
cct gcg cct gcc gcc cct gcg cct gcc gcc cct gcg cct gct gtc 4689
Pro Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Pro Ala Val
1550 1555 1560
tcg agc gag ctt ctc gag aag gcc gag act gtc gtc atg gag gtc 4734
Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val
1565 1570 1575
ctc gcc gcc aag act ggc tac gag act gac atg att gag tcc gac 4779
Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp
1580 1585 1590
atg gag ctc gag acc gag ctc ggc att gac tcc atc aag cgt gtc 4824
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val
1595 1600 1605
gag att ctc tcc gag gtt cag gcc atg ctc aac gtc gag gcc aag 4869
Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys
1610 1615 1620
gac gtc gac gct ctc agc cgc act cgc act gtt ggt gag gtc gtc 4914
Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val
1625 1630 1635
gat gcc atg aag gct gag atc gct ggc agc tcc gcc tcg gcg cct 4959
Asp Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala Ser Ala Pro
1640 1645 1650
gcc gcc gct gct cct gct ccg gct gct gcc gct cct gcg ccc gct 5004
Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala
1655 1660 1665
gcc gcc gcc cct gct gtc tcg aac gag ctt ctc gag aaa gcc gag 5049
Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu
1670 1675 1680
act gtc gtc atg gag gtc ctc gcc gcc aag act ggc tac gag act 5094
Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr
1685 1690 1695
gac atg atc gag tcc gac atg gag ctc gag act gag ctc ggc att 5139
Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile
1700 1705 1710
gac tcc atc aag cgt gtc gag atc ctc tcc gag gtt cag gcc atg 5184
Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met
1715 1720 1725
ctc aac gtc gag gcc aag gac gtc gat gcc ctc agc cgc acc cgc 5229
Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg
1730 1735 1740
act gtt ggc gag gtt gtc gat gcc atg aag gcc gag atc gct ggt 5274
Thr Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly
1745 1750 1755
ggc tct gcc ccg gcg cct gcc gcc gct gcc cct gct ccg gct gcc 5319
Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala
1760 1765 1770
gcc gcc cct gct gtc tcg aac gag ctt ctc gag aag gcc gag act 5364
Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr
1775 1780 1785
gtc gtc atg gag gtc ctc gcc gcc aag act ggc tac gag acc gac 5409
Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp
1790 1795 1800
atg atc gag tcc gac atg gag ctc gag acc gag ctc ggc att gac 5454
Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp
1805 1810 1815
tcc atc aag cgt gtc gag att ctc tcc gag gtt cag gcc atg ctc 5499
Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu
1820 1825 1830
aac gtc gag gcc aag gac gtc gat gct ctc agc cgc act cgc act 5544
Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr
1835 1840 1845
gtt ggc gag gtc gtc gat gcc atg aag gct gag atc gcc ggc agc 5589
Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Ser
1850 1855 1860
tcc gcc ccg gcg cct gcc gcc gct gct cct gct ccg gct gct gcc 5634
Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala
1865 1870 1875
gct cct gcg ccc gct gcc gct gcc cct gct gtc tcg agc gag ctt 5679
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Ser Glu Leu
1880 1885 1890
ctc gag aag gcc gag acc gtc gtc atg gag gtc ctc gcc gcc aag 5724
Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys
1895 1900 1905
act ggc tac gag act gac atg att gag tcc gac atg gag ctc gag 5769
Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu
1910 1915 1920
act gag ctc ggc att gac tcc atc aag cgt gtc gag atc ctc tcc 5814
Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser
1925 1930 1935
gag gtt cag gcc atg ctc aac gtc gag gcc aag gac gtc gat gcc 5859
Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala
1940 1945 1950
ctc agc cgc acc cgc act gtt ggc gag gtt gtc gat gcc atg aag 5904
Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys
1955 1960 1965
gcc gag atc gct ggt ggc tct gcc ccg gcg cct gcc gcc gct gcc 5949
Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala
1970 1975 1980
cct gct ccg gct gcc gcc gcc cct gct gtc tcg aac gag ctt ctt 5994
Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu
1985 1990 1995
gag aag gcc gag acc gtc gtc atg gag gtc ctc gcc gcc aag act 6039
Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr
2000 2005 2010
ggc tac gag acc gac atg atc gag tcc gac atg gag ctc gag acc 6084
Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr
2015 2020 2025
gag ctc ggc att gac tcc atc aag cgt gtc gag att ctc tcc gag 6129
Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu
2030 2035 2040
gtt cag gcc atg ctc aac gtc gag gcc aag gac gtc gac gct ctc 6174
Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu
2045 2050 2055
agc cgc act cgc act gtt ggc gag gtc gtc gat gcc atg aag gct 6219
Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys Ala
2060 2065 2070
gag atc gct ggt ggc tct gcc ccg gcg cct gcc gcc gct gct cct 6264
Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro
2075 2080 2085
gcc tcg gct ggc gcc gcg cct gcg gtc aag att gac tcg gtc cac 6309
Ala Ser Ala Gly Ala Ala Pro Ala Val Lys Ile Asp Ser Val His
2090 2095 2100
ggc gct gac tgt gat gat ctt tcc ctg atg cac gcc aag gtg gtt 6354
Gly Ala Asp Cys Asp Asp Leu Ser Leu Met His Ala Lys Val Val
2105 2110 2115
gac atc cgc cgc ccg gac gag ctc atc ctg gag cgc ccc gag aac 6399
Asp Ile Arg Arg Pro Asp Glu Leu Ile Leu Glu Arg Pro Glu Asn
2120 2125 2130
cgc ccc gtt ctc gtt gtc gat gac ggc agc gag ctc acc ctc gcc 6444
Arg Pro Val Leu Val Val Asp Asp Gly Ser Glu Leu Thr Leu Ala
2135 2140 2145
ctg gtc cgc gtc ctc ggc gcc tgc gcc gtt gtc ctg acc ttt gag 6489
Leu Val Arg Val Leu Gly Ala Cys Ala Val Val Leu Thr Phe Glu
2150 2155 2160
ggt ctc cag ctc gct cag cgc gct ggt gcc gct gcc atc cgc cac 6534
Gly Leu Gln Leu Ala Gln Arg Ala Gly Ala Ala Ala Ile Arg His
2165 2170 2175
gtg ctc gcc aag gat ctt tcc gcg gag agc gcc gag aag gcc atc 6579
Val Leu Ala Lys Asp Leu Ser Ala Glu Ser Ala Glu Lys Ala Ile
2180 2185 2190
aag gag gcc gag cag cgc ttt ggc gct ctc ggc ggc ttc atc tcg 6624
Lys Glu Ala Glu Gln Arg Phe Gly Ala Leu Gly Gly Phe Ile Ser
2195 2200 2205
cag cag gcg gag cgc ttc gag ccc gcc gaa atc ctc ggc ttc acg 6669
Gln Gln Ala Glu Arg Phe Glu Pro Ala Glu Ile Leu Gly Phe Thr
2210 2215 2220
ctc atg tgc gcc aag ttc gcc aag gct tcc ctc tgc acg gct gtg 6714
Leu Met Cys Ala Lys Phe Ala Lys Ala Ser Leu Cys Thr Ala Val
2225 2230 2235
gct ggc ggc cgc ccg gcc ttt atc ggt gtg gcg cgc ctt gac ggc 6759
Ala Gly Gly Arg Pro Ala Phe Ile Gly Val Ala Arg Leu Asp Gly
2240 2245 2250
cgc ctc gga ttc act tcg cag ggc act tct gac gcg ctc aag cgt 6804
Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser Asp Ala Leu Lys Arg
2255 2260 2265
gcc cag cgt ggt gcc atc ttt ggc ctc tgc aag acc atc ggc ctc 6849
Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys Thr Ile Gly Leu
2270 2275 2280
gag tgg tcc gag tct gac gtc ttt tcc cgc ggc gtg gac att gct 6894
Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val Asp Ile Ala
2285 2290 2295
cag ggc atg cac ccc gag gat gcc gcc gtg gcg att gtg cgc gag 6939
Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val Arg Glu
2300 2305 2310
atg gcg tgc gct gac att cgc att cgc gag gtc ggc att ggc gca 6984
Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly Ala
2315 2320 2325
aac cag cag cgc tgc acg atc cgt gcc gcc aag ctc gag acc ggc 7029
Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
2330 2335 2340
aac ccg cag cgc cag atc gcc aag gac gac gtg ctg ctc gtt tct 7074
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser
2345 2350 2355
ggc ggc gct cgc ggc atc acg cct ctt tgc atc cgg gag atc acg 7119
Gly Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr
2360 2365 2370
cgc cag atc gcg ggc ggc aag tac att ctg ctt ggc cgc agc aag 7164
Arg Gln Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys
2375 2380 2385
gtc tct gcg agc gaa ccg gca tgg tgc gct ggc atc act gac gag 7209
Val Ser Ala Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu
2390 2395 2400
aag gct gtg caa aag gct gct acc cag gag ctc aag cgc gcc ttt 7254
Lys Ala Val Gln Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe
2405 2410 2415
agc gct ggc gag ggc ccc aag ccc acg ccc cgc gct gtc act aag 7299
Ser Ala Gly Glu Gly Pro Lys Pro Thr Pro Arg Ala Val Thr Lys
2420 2425 2430
ctt gtg ggc tct gtt ctt ggc gct cgc gag gtg cgc agc tct att 7344
Leu Val Gly Ser Val Leu Gly Ala Arg Glu Val Arg Ser Ser Ile
2435 2440 2445
gct gcg att gaa gcg ctc ggc ggc aag gcc atc tac tcg tcg tgc 7389
Ala Ala Ile Glu Ala Leu Gly Gly Lys Ala Ile Tyr Ser Ser Cys
2450 2455 2460
gac gtg aac tct gcc gcc gac gtg gcc aag gcc gtg cgc gat gcc 7434
Asp Val Asn Ser Ala Ala Asp Val Ala Lys Ala Val Arg Asp Ala
2465 2470 2475
gag tcc cag ctc ggt gcc cgc gtc tcg ggc atc gtt cat gcc tcg 7479
Glu Ser Gln Leu Gly Ala Arg Val Ser Gly Ile Val His Ala Ser
2480 2485 2490
ggc gtg ctc cgc gac cgt ctc atc gag aag aag ctc ccc gac gag 7524
Gly Val Leu Arg Asp Arg Leu Ile Glu Lys Lys Leu Pro Asp Glu
2495 2500 2505
ttc gac gcc gtc ttt ggc acc aag gtc acc ggt ctc gag aac ctc 7569
Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly Leu Glu Asn Leu
2510 2515 2520
ctc gcc gcc gtc gac cgc gcc aac ctc aag cac atg gtc ctc ttc 7614
Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met Val Leu Phe
2525 2530 2535
agc tcg ctc gcc ggc ttc cac ggc aac gtc ggc cag tct gac tac 7659
Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser Asp Tyr
2540 2545 2550
gcc atg gcc aac gag gcc ctt aac aag atg ggc ctc gag ctc gcc 7704
Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu Ala
2555 2560 2565
aag gac gtc tcg gtc aag tcg atc tgc ttc ggt ccc tgg gac ggt 7749
Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
2570 2575 2580
ggc atg gtg acg ccg cag ctc aag aag cag ttc cag gag atg ggc 7794
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly
2585 2590 2595
gtg cag atc atc ccc cgc gag ggc ggc gct gat acc gtg gcg cgc 7839
Val Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg
2600 2605 2610
atc gtg ctc ggc tcc tcg ccg gct gag atc ctt gtc ggc aac tgg 7884
Ile Val Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp
2615 2620 2625
cgc acc ccg tcc aag aag gtc ggc tcg gac acc atc acc ctg cac 7929
Arg Thr Pro Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His
2630 2635 2640
cgc aag att tcc gcc aag tcc aac ccc ttc ctc gag gac cac gtc 7974
Arg Lys Ile Ser Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val
2645 2650 2655
atc cag ggc cgc cgc gtg ctg ccc atg acg ctg gcc att ggc tcg 8019
Ile Gln Gly Arg Arg Val Leu Pro Met Thr Leu Ala Ile Gly Ser
2660 2665 2670
ctc gcg gag acc tgc ctc ggc ctc ttc ccc ggc tac tcg ctc tgg 8064
Leu Ala Glu Thr Cys Leu Gly Leu Phe Pro Gly Tyr Ser Leu Trp
2675 2680 2685
gcc att gac gac gcc cag ctc ttc aag ggt gtc act gtc gac ggc 8109
Ala Ile Asp Asp Ala Gln Leu Phe Lys Gly Val Thr Val Asp Gly
2690 2695 2700
gac gtc aac tgc gag gtg acc ctc acc ccg tcg acg gcg ccc tcg 8154
Asp Val Asn Cys Glu Val Thr Leu Thr Pro Ser Thr Ala Pro Ser
2705 2710 2715
ggc cgc gtc aac gtc cag gcc acg ctc aag acc ttt tcc agc ggc 8199
Gly Arg Val Asn Val Gln Ala Thr Leu Lys Thr Phe Ser Ser Gly
2720 2725 2730
aag ctg gtc ccg gcc tac cgc gcc gtc atc gtg ctc tcc aac cag 8244
Lys Leu Val Pro Ala Tyr Arg Ala Val Ile Val Leu Ser Asn Gln
2735 2740 2745
ggc gcg ccc ccg gcc aac gcc acc atg cag ccg ccc tcg ctc gat 8289
Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro Pro Ser Leu Asp
2750 2755 2760
gcc gat ccg gcg ctc cag ggc tcc gtc tac gac ggc aag acc ctc 8334
Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly Lys Thr Leu
2765 2770 2775
ttc cac ggc ccg gcc ttc cgc ggc atc gat gac gtg ctc tcg tgc 8379
Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu Ser Cys
2780 2785 2790
acc aag agc cag ctt gtg gcc aag tgc agc gct gtc ccc ggc tcc 8424
Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly Ser
2795 2800 2805
gac gcc gct cgc ggc gag ttt gcc acg gac act gac gcc cat gac 8469
Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
2810 2815 2820
ccc ttc gtg aac gac ctg gcc ttt cag gcc atg ctc gtc tgg gtg 8514
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val
2825 2830 2835
cgc cgc acg ctc ggc cag gct gcg ctc ccc aac tcg atc cag cgc 8559
Arg Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg
2840 2845 2850
atc gtc cag cac cgc ccg gtc ccg cag gac aag ccc ttc tac att 8604
Ile Val Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile
2855 2860 2865
acc ctc cgc tcc aac cag tcg ggc ggt cac tcc cag cac aag cac 8649
Thr Leu Arg Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His
2870 2875 2880
gcc ctt cag ttc cac aac gag cag ggc gat ctc ttc att gat gtc 8694
Ala Leu Gln Phe His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val
2885 2890 2895
cag gct tcg gtc atc gcc acg gac agc ctt gcc ttc taa 8733
Gln Ala Ser Val Ile Ala Thr Asp Ser Leu Ala Phe
2900 2905 2910
<210> 2
<211> 2910
<212> PRT
<213> Schizochytrium sp.
<400> 2
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1 5 10 15
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
20 25 30
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
35 40 45
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
50 55 60
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65 70 75 80
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
85 90 95
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
100 105 110
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
115 120 125
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
130 135 140
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145 150 155 160
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
165 170 175
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
180 185 190
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
195 200 205
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
210 215 220
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225 230 235 240
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
245 250 255
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
260 265 270
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
275 280 285
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
290 295 300
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305 310 315 320
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
325 330 335
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
340 345 350
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
355 360 365
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
370 375 380
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385 390 395 400
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
405 410 415
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
420 425 430
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
435 440 445
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
450 455 460
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465 470 475 480
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
485 490 495
Ala Thr Pro Ala Ala Leu Gln Ser Leu Cys Glu Ala Gln Leu Lys Glu
500 505 510
Phe Glu Ala Ala Ile Lys Glu Asn Glu Thr Val Lys Asn Thr Ala Tyr
515 520 525
Ile Lys Cys Val Lys Phe Gly Glu Gln Phe Lys Phe Pro Gly Ser Ile
530 535 540
Pro Ala Thr Asn Ala Arg Leu Gly Phe Leu Val Lys Asp Ala Glu Asp
545 550 555 560
Ala Cys Ser Thr Leu Arg Ala Ile Cys Ala Gln Phe Ala Lys Asp Val
565 570 575
Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe Arg Ala
580 585 590
Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser Gly Gln
595 600 605
Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn Trp Pro
610 615 620
Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser Lys Val
625 630 635 640
Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu Tyr Pro
645 650 655
Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys Ile Ser
660 665 670
Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu Gly Ala
675 680 685
Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala Ala Gly
690 695 700
His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys Val Asp
705 710 715 720
Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile Met Gly
725 730 735
Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala Val Ile
740 745 750
Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val Trp Leu
755 760 765
Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser Val Glu
770 775 780
Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe Arg Val
785 790 795 800
Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met Glu Asn
805 810 815
Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe Arg Thr
820 825 830
Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu Thr Tyr
835 840 845
Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser Ser Val
850 855 860
Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala Arg Ile
865 870 875 880
Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val Ser Glu
885 890 895
Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn Pro Ala
900 905 910
Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val Gln Leu
915 920 925
Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp Ala Pro
930 935 940
Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr Leu Arg
945 950 955 960
Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val Arg Asp
965 970 975
Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly Ala Ala
980 985 990
Pro Leu Ile Lys Ala Pro Glu Pro Val Val Asp Glu Ala Ala Lys Arg
995 1000 1005
Glu Ala Glu Arg Leu Gln Lys Glu Leu Gln Asp Ala Gln Arg Gln
1010 1015 1020
Leu Asp Asp Ala Lys Arg Ala Ala Ala Glu Ala Asn Ser Lys Leu
1025 1030 1035
Ala Ala Ala Lys Glu Glu Ala Lys Thr Ala Ala Ala Ser Ala Lys
1040 1045 1050
Pro Ala Val Asp Thr Ala Val Val Glu Lys His Arg Ala Ile Leu
1055 1060 1065
Lys Ser Met Leu Ala Glu Leu Asp Gly Tyr Gly Ser Val Asp Ala
1070 1075 1080
Ser Ser Leu Gln Gln Gln Gln Gln Gln Gln Thr Ala Pro Ala Pro
1085 1090 1095
Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser Ala Pro Ala
1100 1105 1110
Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val
1115 1120 1125
Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile
1130 1135 1140
Glu Ala Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile
1145 1150 1155
Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val
1160 1165 1170
Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly
1175 1180 1185
Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala
1190 1195 1200
Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Lys Ala Ala Pro
1205 1210 1215
Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala
1220 1225 1230
Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu
1235 1240 1245
Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly
1250 1255 1260
Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala
1265 1270 1275
Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr
1280 1285 1290
Arg Thr Val Gly Glu Val Val Asn Ala Met Lys Ala Glu Ile Ala
1295 1300 1305
Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Gly Pro Ala
1310 1315 1320
Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn
1325 1330 1335
Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala
1340 1345 1350
Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu
1355 1360 1365
Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile
1370 1375 1380
Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
1385 1390 1395
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala
1400 1405 1410
Met Lys Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala
1415 1420 1425
Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Pro
1430 1435 1440
Ala Pro Ala Val Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val
1445 1450 1455
Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met
1460 1465 1470
Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser
1475 1480 1485
Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn
1490 1495 1500
Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val
1505 1510 1515
Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Gly Ser
1520 1525 1530
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala
1535 1540 1545
Pro Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Pro Ala Val
1550 1555 1560
Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val
1565 1570 1575
Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp
1580 1585 1590
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val
1595 1600 1605
Glu Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys
1610 1615 1620
Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val
1625 1630 1635
Asp Ala Met Lys Ala Glu Ile Ala Gly Ser Ser Ala Ser Ala Pro
1640 1645 1650
Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala
1655 1660 1665
Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu
1670 1675 1680
Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr
1685 1690 1695
Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile
1700 1705 1710
Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met
1715 1720 1725
Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg
1730 1735 1740
Thr Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly
1745 1750 1755
Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala
1760 1765 1770
Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr
1775 1780 1785
Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp
1790 1795 1800
Met Ile Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly Ile Asp
1805 1810 1815
Ser Ile Lys Arg Val Glu Ile Leu Ser Glu Val Gln Ala Met Leu
1820 1825 1830
Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr
1835 1840 1845
Val Gly Glu Val Val Asp Ala Met Lys Ala Glu Ile Ala Gly Ser
1850 1855 1860
Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala
1865 1870 1875
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Ser Glu Leu
1880 1885 1890
Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys
1895 1900 1905
Thr Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu
1910 1915 1920
Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser
1925 1930 1935
Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala
1940 1945 1950
Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys
1955 1960 1965
Ala Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala
1970 1975 1980
Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu
1985 1990 1995
Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr
2000 2005 2010
Gly Tyr Glu Thr Asp Met Ile Glu Ser Asp Met Glu Leu Glu Thr
2015 2020 2025
Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Ser Glu
2030 2035 2040
Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu
2045 2050 2055
Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys Ala
2060 2065 2070
Glu Ile Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro
2075 2080 2085
Ala Ser Ala Gly Ala Ala Pro Ala Val Lys Ile Asp Ser Val His
2090 2095 2100
Gly Ala Asp Cys Asp Asp Leu Ser Leu Met His Ala Lys Val Val
2105 2110 2115
Asp Ile Arg Arg Pro Asp Glu Leu Ile Leu Glu Arg Pro Glu Asn
2120 2125 2130
Arg Pro Val Leu Val Val Asp Asp Gly Ser Glu Leu Thr Leu Ala
2135 2140 2145
Leu Val Arg Val Leu Gly Ala Cys Ala Val Val Leu Thr Phe Glu
2150 2155 2160
Gly Leu Gln Leu Ala Gln Arg Ala Gly Ala Ala Ala Ile Arg His
2165 2170 2175
Val Leu Ala Lys Asp Leu Ser Ala Glu Ser Ala Glu Lys Ala Ile
2180 2185 2190
Lys Glu Ala Glu Gln Arg Phe Gly Ala Leu Gly Gly Phe Ile Ser
2195 2200 2205
Gln Gln Ala Glu Arg Phe Glu Pro Ala Glu Ile Leu Gly Phe Thr
2210 2215 2220
Leu Met Cys Ala Lys Phe Ala Lys Ala Ser Leu Cys Thr Ala Val
2225 2230 2235
Ala Gly Gly Arg Pro Ala Phe Ile Gly Val Ala Arg Leu Asp Gly
2240 2245 2250
Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser Asp Ala Leu Lys Arg
2255 2260 2265
Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys Thr Ile Gly Leu
2270 2275 2280
Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val Asp Ile Ala
2285 2290 2295
Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val Arg Glu
2300 2305 2310
Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly Ala
2315 2320 2325
Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
2330 2335 2340
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser
2345 2350 2355
Gly Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr
2360 2365 2370
Arg Gln Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys
2375 2380 2385
Val Ser Ala Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu
2390 2395 2400
Lys Ala Val Gln Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe
2405 2410 2415
Ser Ala Gly Glu Gly Pro Lys Pro Thr Pro Arg Ala Val Thr Lys
2420 2425 2430
Leu Val Gly Ser Val Leu Gly Ala Arg Glu Val Arg Ser Ser Ile
2435 2440 2445
Ala Ala Ile Glu Ala Leu Gly Gly Lys Ala Ile Tyr Ser Ser Cys
2450 2455 2460
Asp Val Asn Ser Ala Ala Asp Val Ala Lys Ala Val Arg Asp Ala
2465 2470 2475
Glu Ser Gln Leu Gly Ala Arg Val Ser Gly Ile Val His Ala Ser
2480 2485 2490
Gly Val Leu Arg Asp Arg Leu Ile Glu Lys Lys Leu Pro Asp Glu
2495 2500 2505
Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly Leu Glu Asn Leu
2510 2515 2520
Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met Val Leu Phe
2525 2530 2535
Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser Asp Tyr
2540 2545 2550
Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu Ala
2555 2560 2565
Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
2570 2575 2580
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly
2585 2590 2595
Val Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg
2600 2605 2610
Ile Val Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp
2615 2620 2625
Arg Thr Pro Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His
2630 2635 2640
Arg Lys Ile Ser Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val
2645 2650 2655
Ile Gln Gly Arg Arg Val Leu Pro Met Thr Leu Ala Ile Gly Ser
2660 2665 2670
Leu Ala Glu Thr Cys Leu Gly Leu Phe Pro Gly Tyr Ser Leu Trp
2675 2680 2685
Ala Ile Asp Asp Ala Gln Leu Phe Lys Gly Val Thr Val Asp Gly
2690 2695 2700
Asp Val Asn Cys Glu Val Thr Leu Thr Pro Ser Thr Ala Pro Ser
2705 2710 2715
Gly Arg Val Asn Val Gln Ala Thr Leu Lys Thr Phe Ser Ser Gly
2720 2725 2730
Lys Leu Val Pro Ala Tyr Arg Ala Val Ile Val Leu Ser Asn Gln
2735 2740 2745
Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro Pro Ser Leu Asp
2750 2755 2760
Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly Lys Thr Leu
2765 2770 2775
Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu Ser Cys
2780 2785 2790
Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly Ser
2795 2800 2805
Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
2810 2815 2820
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val
2825 2830 2835
Arg Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg
2840 2845 2850
Ile Val Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile
2855 2860 2865
Thr Leu Arg Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His
2870 2875 2880
Ala Leu Gln Phe His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val
2885 2890 2895
Gln Ala Ser Val Ile Ala Thr Asp Ser Leu Ala Phe
2900 2905 2910
<210> 3
<211> 6180
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(6180)
<400> 3
atg gcc gct cgg aat gtg agc gcc gcg cat gag atg cac gat gaa aag 48
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1 5 10 15
cgc atc gcc gtc gtc ggc atg gcc gtc cag tac gcc gga tgc aaa acc 96
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
20 25 30
aag gac gag ttc tgg gag gtg ctc atg aac ggc aag gtc gag tcc aag 144
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
35 40 45
gtg atc agc gac aaa cga ctc ggc tcc aac tac cgc gcc gag cac tac 192
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
50 55 60
aaa gca gag cgc agc aag tat gcc gac acc ttt tgc aac gaa acg tac 240
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65 70 75 80
ggc acc ctt gac gag aac gag atc gac aac gag cac gaa ctc ctc ctc 288
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
85 90 95
aac ctc gcc aag cag gca ctc gca gag aca tcc gtc aaa gac tcg aca 336
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
100 105 110
cgc tgc ggc atc gtc agc ggc tgc ctc tcg ttc ccc atg gac aac ctc 384
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
115 120 125
cag ggt gaa ctc ctc aac gtg tac caa aac cat gtc gag aaa aag ctc 432
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
130 135 140
ggg gcc cgc gtc ttc aag gac gcc tcc cat tgg tcc gaa cgc gag cag 480
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145 150 155 160
tcc aac aaa ccc gag gcc ggt gac cgc cgc atc ttc atg gac ccg gcc 528
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
165 170 175
tcc ttc gtc gcc gaa gaa ctc aac ctc ggc gcc ctt cac tac tcc gtc 576
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
180 185 190
gac gca gca tgc gcc acg gcg ctc tac gtg ctc cgc ctc gcg cag gat 624
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
195 200 205
cat ctc gtc tcc ggc gcc gcc gac gtc atg ctc tgc ggt gcc acc tgc 672
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
210 215 220
ctg ccg gag ccc ttt ttc atc ctt tcg ggc ttt tcc acc ttc cag gcc 720
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225 230 235 240
atg ccc gtc ggc acg ggc cag aac gtg tcc atg ccg ctg cac aag gac 768
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
245 250 255
agc cag ggc ctc acc ccg ggt gag ggc ggc tcc atc atg gtc ctc aag 816
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
260 265 270
cgt ctc gat gat gcc atc cgc gac ggc gac cac atc tac ggc acc ctt 864
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
275 280 285
ctc ggc gcc aat gtc agc aac tcc ggc aca ggt ctg ccc ctc aag ccc 912
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
290 295 300
ctt ctc ccc agc gag aaa aag tgc ctc atg gac acc tac acg cgc att 960
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305 310 315 320
aac gtg cac ccg cac aag att cag tac gtc gag tgc cac gcc acc ggc 1008
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
325 330 335
acg ccc cag ggt gat cgt gtg gaa atc gac gcc gtc aag gcc tgc ttt 1056
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
340 345 350
gaa ggc aag gtc ccc cgt ttc ggt acc aca aag ggc aac ttt gga cac 1104
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
355 360 365
acc ctc gtc gca gcc ggc ttt gcc ggt atg tgc aag gtc ctc ctc tcc 1152
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
370 375 380
atg aag cat ggc atc atc ccg ccc acc ccg ggt atc gat gac gag acc 1200
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385 390 395 400
aag atg gac cct ctc gtc gtc tcc ggt gag gcc atc cca tgg cca gag 1248
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
405 410 415
acc aac ggc gag ccc aag cgc gcc ggt ctc tcg gcc ttt ggc ttt ggt 1296
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
420 425 430
ggc acc aac gcc cat gcc gtc ttt gag gag cat gac ccc tcc aac gcc 1344
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
435 440 445
gcc tgc acg ggc cac gac tcc att tct gcg ctc tcg gcc cgc tgc ggc 1392
Ala Cys Thr Gly His Asp Ser Ile Ser Ala Leu Ser Ala Arg Cys Gly
450 455 460
ggt gaa agc aac atg cgc atc gcc atc act ggt atg gac gcc acc ttt 1440
Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly Met Asp Ala Thr Phe
465 470 475 480
ggc gct ctc aag gga ctc gac gcc ttc gag cgc gcc att tac acc ggc 1488
Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg Ala Ile Tyr Thr Gly
485 490 495
gct cac ggt gcc atc cca ctc cca gaa aag cgc tgg cgc ttt ctc ggc 1536
Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg Trp Arg Phe Leu Gly
500 505 510
aag gac aag gac ttt ctt gac ctc tgc ggc gtc aag gcc acc ccg cac 1584
Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val Lys Ala Thr Pro His
515 520 525
ggc tgc tac att gaa gat gtt gag gtc gac ttc cag cgc ctc cgc acg 1632
Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe Gln Arg Leu Arg Thr
530 535 540
ccc atg acc cct gaa gac atg ctc ctc cct cag cag ctt ctg gcc gtc 1680
Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln Gln Leu Leu Ala Val
545 550 555 560
acc acc att gac cgc gcc atc ctc gac tcg gga atg aaa aag ggt ggc 1728
Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly Met Lys Lys Gly Gly
565 570 575
aat gtc gcc gtc ttt gtc ggc ctc ggc acc gac ctc gag ctc tac cgt 1776
Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg
580 585 590
cac cgt gct cgc gtc gct ctc aag gag cgc gtc cgc cct gaa gcc tcc 1824
His Arg Ala Arg Val Ala Leu Lys Glu Arg Val Arg Pro Glu Ala Ser
595 600 605
aag aag ctc aat gac atg atg cag tac att aac gac tgc ggc aca tcc 1872
Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn Asp Cys Gly Thr Ser
610 615 620
aca tcg tac acc tcg tac att ggc aac ctc gtc gcc acg cgc gtc tcg 1920
Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Val Ser
625 630 635 640
tcg cag tgg ggc ttc acg ggc ccc tcc ttt acg atc acc gag ggc aac 1968
Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Ile Thr Glu Gly Asn
645 650 655
aac tcc gtc tac cgc tgc gcc gag ctc ggc aag tac ctc ctc gag acc 2016
Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys Tyr Leu Leu Glu Thr
660 665 670
ggc gag gtc gat ggc gtc gtc gtt gcg ggt gtc gat ctc tgc ggc agt 2064
Gly Glu Val Asp Gly Val Val Val Ala Gly Val Asp Leu Cys Gly Ser
675 680 685
gcc gaa aac ctt tac gtc aag tct cgc cgc ttc aag gtg tcc acc tcc 2112
Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe Lys Val Ser Thr Ser
690 695 700
gat acc ccg cgc gcc agc ttt gac gcc gcc gcc gat ggc tac ttt gtc 2160
Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala Asp Gly Tyr Phe Val
705 710 715 720
ggc gag ggc tgc ggt gcc ttt gtg ctc aag cgt gag act agc tgc acc 2208
Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg Glu Thr Ser Cys Thr
725 730 735
aag gac gac cgt atc tac gct tgc atg gat gcc atc gtc cct ggc aac 2256
Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala Ile Val Pro Gly Asn
740 745 750
gtc cct agc gcc tgc ttg cgc gag gcc ctc gac cag gcg cgc gtc aag 2304
Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp Gln Ala Arg Val Lys
755 760 765
ccg ggc gat atc gag atg ctc gag ctc agc gcc gac tcc gcc cgc cac 2352
Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala Asp Ser Ala Arg His
770 775 780
ctc aag gac ccg tcc gtc ctg ccc aag gag ctc act gcc gag gag gaa 2400
Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu Thr Ala Glu Glu Glu
785 790 795 800
atc ggc ggc ctt cag acg atc ctt cgt gac gat gac aag ctc ccg cgc 2448
Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp Asp Lys Leu Pro Arg
805 810 815
aac gtc gca acg ggc agt gtc aag gcc acc gtc ggt gac acc ggt tat 2496
Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val Gly Asp Thr Gly Tyr
820 825 830
gcc tct ggt gct gcc agc ctc atc aag gct gcg ctt tgc atc tac aac 2544
Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala Leu Cys Ile Tyr Asn
835 840 845
cgc tac ctg ccc agc aac ggc gac gac tgg gat gaa ccc gcc cct gag 2592
Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp Glu Pro Ala Pro Glu
850 855 860
gcg ccc tgg gac agc acc ctc ttt gcg tgc cag acc tcg cgc gct tgg 2640
Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln Thr Ser Arg Ala Trp
865 870 875 880
ctc aag aac cct ggc gag cgt cgc tat gcg gcc gtc tcg ggc gtc tcc 2688
Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala Val Ser Gly Val Ser
885 890 895
gag acg cgc tcg tgc tat tcc gtg ctc ctc tcc gaa gcc gag ggc cac 2736
Glu Thr Arg Ser Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His
900 905 910
tac gag cgc gag aac cgc atc tcg ctc gac gag gag gcg ccc aag ctc 2784
Tyr Glu Arg Glu Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu
915 920 925
att gtg ctt cgc gcc gac tcc cac gag gag atc ctt ggt cgc ctc gac 2832
Ile Val Leu Arg Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp
930 935 940
aag atc cgc gag cgc ttc ttg cag ccc acg ggc gcc gcc ccg cgc gag 2880
Lys Ile Arg Glu Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu
945 950 955 960
tcc gag ctc aag gcg cag gcc cgc cgc atc ttc ctc gag ctc ctc ggc 2928
Ser Glu Leu Lys Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly
965 970 975
gag acc ctt gcc cag gat gcc gct tct tca ggc tcg caa aag ccc ctc 2976
Glu Thr Leu Ala Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu
980 985 990
gct ctc agc ctc gtc tcc acg ccc tcc aag ctc cag cgc gag gtc gag 3024
Ala Leu Ser Leu Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu
995 1000 1005
ctc gcg gcc aag ggt atc ccg cgc tgc ctc aag atg cgc cgc gat 3069
Leu Ala Ala Lys Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp
1010 1015 1020
tgg agc tcc cct gct ggc agc cgc tac gcg cct gag ccg ctc gcc 3114
Trp Ser Ser Pro Ala Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala
1025 1030 1035
agc gac cgc gtc gcc ttc atg tac ggc gaa ggt cgc agc cct tac 3159
Ser Asp Arg Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr
1040 1045 1050
tac ggc atc acc caa gac att cac cgc att tgg ccc gaa ctc cac 3204
Tyr Gly Ile Thr Gln Asp Ile His Arg Ile Trp Pro Glu Leu His
1055 1060 1065
gag gtc atc aac gaa aag acg aac cgt ctc tgg gcc gaa ggc gac 3249
Glu Val Ile Asn Glu Lys Thr Asn Arg Leu Trp Ala Glu Gly Asp
1070 1075 1080
cgc tgg gtc atg ccg cgc gcc agc ttc aag tcg gag ctc gag agc 3294
Arg Trp Val Met Pro Arg Ala Ser Phe Lys Ser Glu Leu Glu Ser
1085 1090 1095
cag cag caa gag ttt gat cgc aac atg att gaa atg ttc cgt ctt 3339
Gln Gln Gln Glu Phe Asp Arg Asn Met Ile Glu Met Phe Arg Leu
1100 1105 1110
gga atc ctc acc tca att gcc ttc acc aat ctg gcg cgc gac gtt 3384
Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu Ala Arg Asp Val
1115 1120 1125
ctc aac atc acg ccc aag gcc gcc ttt ggc ctc agt ctt ggc gag 3429
Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser Leu Gly Glu
1130 1135 1140
att tcc atg att ttt gcc ttt tcc aag aag aac ggt ctc atc tcc 3474
Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu Ile Ser
1145 1150 1155
gac cag ctc acc aag gat ctt cgc gag tcc gac gtg tgg aac aag 3519
Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn Lys
1160 1165 1170
gct ctg gcc gtt gaa ttt aat gcg ctg cgc gag gcc tgg ggc att 3564
Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
1175 1180 1185
cca cag agt gtc ccc aag gac gag ttc tgg caa ggc tac att gtg 3609
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val
1190 1195 1200
cgc ggc acc aag cag gat atc gag gcg gcc atc gcc ccg gac agc 3654
Arg Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser
1205 1210 1215
aag tac gtg cgc ctc acc atc atc aat gat gcc aac acc gcc ctc 3699
Lys Tyr Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu
1220 1225 1230
att agc ggc aag ccc gac gcc tgc aag gct gcg atc gcg cgt ctc 3744
Ile Ser Gly Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu
1235 1240 1245
ggt ggc aac att cct gcg ctt ccc gtg acc cag ggc atg tgc ggc 3789
Gly Gly Asn Ile Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly
1250 1255 1260
cac tgc ccc gag gtg gga cct tat acc aag gat atc gcc aag atc 3834
His Cys Pro Glu Val Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile
1265 1270 1275
cat gcc aac ctt gag ttc ccc gtt gtc gac ggc ctt gac ctc tgg 3879
His Ala Asn Leu Glu Phe Pro Val Val Asp Gly Leu Asp Leu Trp
1280 1285 1290
acc aca atc aac cag aag cgc ctc gtg cca cgc gcc acg ggc gcc 3924
Thr Thr Ile Asn Gln Lys Arg Leu Val Pro Arg Ala Thr Gly Ala
1295 1300 1305
aag gac gaa tgg gcc cct tct tcc ttt ggc gag tac gcc ggc cag 3969
Lys Asp Glu Trp Ala Pro Ser Ser Phe Gly Glu Tyr Ala Gly Gln
1310 1315 1320
ctc tac gag aag cag gct aac ttc ccc caa atc gtc gag acc att 4014
Leu Tyr Glu Lys Gln Ala Asn Phe Pro Gln Ile Val Glu Thr Ile
1325 1330 1335
tac aag caa aac tac gac gtc ttt gtc gag gtt ggg ccc aac aac 4059
Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu Val Gly Pro Asn Asn
1340 1345 1350
cac cgt agc acc gca gtg cgc acc acg ctt ggt ccc cag cgc aac 4104
His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly Pro Gln Arg Asn
1355 1360 1365
cac ctt gct ggc gcc atc gac aag cag aac gag gat gct tgg acg 4149
His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp Ala Trp Thr
1370 1375 1380
acc atc gtc aag ctt gtg gct tcg ctc aag gcc cac ctt gtt cct 4194
Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu Val Pro
1385 1390 1395
ggc gtc acg atc tcg ccg ctg tac cac tcc aag ctt gtg gcg gag 4239
Gly Val Thr Ile Ser Pro Leu Tyr His Ser Lys Leu Val Ala Glu
1400 1405 1410
gct gag gct tgc tac gct gcg ctc tgc aag ggt gaa aag ccc aag 4284
Ala Glu Ala Cys Tyr Ala Ala Leu Cys Lys Gly Glu Lys Pro Lys
1415 1420 1425
aag aac aag ttt gtg cgc aag att cag ctc aac ggt cgc ttc aac 4329
Lys Asn Lys Phe Val Arg Lys Ile Gln Leu Asn Gly Arg Phe Asn
1430 1435 1440
agc aag gcg gac ccc atc tcc tcg gcc gat ctt gcc agc ttt ccg 4374
Ser Lys Ala Asp Pro Ile Ser Ser Ala Asp Leu Ala Ser Phe Pro
1445 1450 1455
cct gcg gac cct gcc att gaa gcc gcc atc tcg agc cgc atc atg 4419
Pro Ala Asp Pro Ala Ile Glu Ala Ala Ile Ser Ser Arg Ile Met
1460 1465 1470
aag cct gtc gct ccc aag ttc tac gcg cgt ctc aac att gac gag 4464
Lys Pro Val Ala Pro Lys Phe Tyr Ala Arg Leu Asn Ile Asp Glu
1475 1480 1485
cag gac gag acc cga gat ccg atc ctc aac aag gac aac gcg ccg 4509
Gln Asp Glu Thr Arg Asp Pro Ile Leu Asn Lys Asp Asn Ala Pro
1490 1495 1500
tct tct tct tct tct tct tct tct tct tct tct tct tct tct tct 4554
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
1505 1510 1515
ccg tcg cct gct cct tcg gcc ccc gtg caa aag aag gct gct ccc 4599
Pro Ser Pro Ala Pro Ser Ala Pro Val Gln Lys Lys Ala Ala Pro
1520 1525 1530
gcc gcg gag acc aag gct gtt gct tcg gct gac gca ctt cgc agt 4644
Ala Ala Glu Thr Lys Ala Val Ala Ser Ala Asp Ala Leu Arg Ser
1535 1540 1545
gcc ctg ctc gat ctc gac agt atg ctt gcg ctg agc tct gcc agt 4689
Ala Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser
1550 1555 1560
gcc tcc ggc aac ctt gtt gag act gcg cct agc gac gcc tcg gtc 4734
Ala Ser Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val
1565 1570 1575
att gtg ccg ccc tgc aac att gcg gat ctc ggc agc cgc gcc ttc 4779
Ile Val Pro Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe
1580 1585 1590
atg aaa acg tac ggt gtt tcg gcg cct ctg tac acg ggc gcc atg 4824
Met Lys Thr Tyr Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met
1595 1600 1605
gcc aag ggc att gcc tct gcg gac ctc gtc att gcc gcc ggc cgc 4869
Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Arg
1610 1615 1620
cag ggc atc ctt gcg tcc ttt ggc gcc ggc gga ctt ccc atg cag 4914
Gln Gly Ile Leu Ala Ser Phe Gly Ala Gly Gly Leu Pro Met Gln
1625 1630 1635
gtt gtg cgt gag tcc atc gaa aag att cag gcc gcc ctg ccc aat 4959
Val Val Arg Glu Ser Ile Glu Lys Ile Gln Ala Ala Leu Pro Asn
1640 1645 1650
ggc ccg tac gct gtc aac ctt atc cat tct ccc ttt gac agc aac 5004
Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
1655 1660 1665
ctc gaa aag ggc aat gtc gat ctc ttc ctc gag aag ggt gtc acc 5049
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val Thr
1670 1675 1680
ttt gtc gag gcc tcg gcc ttt atg acg ctc acc ccg cag gtc gtg 5094
Phe Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val Val
1685 1690 1695
cgg tac cgc gcg gct ggc ctc acg cgc aac gcc gac ggc tcg gtc 5139
Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala Asp Gly Ser Val
1700 1705 1710
aac atc cgc aac cgt atc att ggc aag gtc tcg cgc acc gag ctc 5184
Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
1715 1720 1725
gcc gag atg ttc atg cgt cct gcg ccc gag cac ctt ctt cag aag 5229
Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu Gln Lys
1730 1735 1740
ctc att gct tcc ggc gag atc aac cag gag cag gcc gag ctc gcc 5274
Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu Ala
1745 1750 1755
cgc cgt gtt ccc gtc gct gac gac atc gcg gtc gaa gct gac tcg 5319
Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
1760 1765 1770
ggt ggc cac acc gac aac cgc ccc atc cac gtc att ctg ccc ctc 5364
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu
1775 1780 1785
atc atc aac ctt cgc gac cgc ctt cac cgc gag tgc ggc tac ccg 5409
Ile Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro
1790 1795 1800
gcc aac ctt cgc gtc cgt gtg ggc gcc ggc ggt ggc att ggg tgc 5454
Ala Asn Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys
1805 1810 1815
ccc cag gcg gcg ctg gcc acc ttc aac atg ggt gcc tcc ttt att 5499
Pro Gln Ala Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile
1820 1825 1830
gtc acc ggc acc gtg aac cag gtc gcc aag cag tcg ggc acg tgc 5544
Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys
1835 1840 1845
gac aat gtg cgc aag cag ctc gcg aag gcc act tac tcg gac gta 5589
Asp Asn Val Arg Lys Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val
1850 1855 1860
tgc atg gcc ccg gct gcc gac atg ttc gag gaa ggc gtc aag ctt 5634
Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys Leu
1865 1870 1875
cag gtc ctc aag aag gga acc atg ttt ccc tcg cgc gcc aac aag 5679
Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn Lys
1880 1885 1890
ctc tac gag ctc ttt tgc aag tac gac tcg ttc gag tcc atg ccc 5724
Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ser Met Pro
1895 1900 1905
ccc gca gag ctt gcg cgc gtc gag aag cgc atc ttc agc cgc gcg 5769
Pro Ala Glu Leu Ala Arg Val Glu Lys Arg Ile Phe Ser Arg Ala
1910 1915 1920
ctc gaa gag gtc tgg gac gag acc aaa aac ttt tac att aac cgt 5814
Leu Glu Glu Val Trp Asp Glu Thr Lys Asn Phe Tyr Ile Asn Arg
1925 1930 1935
ctt cac aac ccg gag aag atc cag cgc gcc gag cgc gac ccc aag 5859
Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu Arg Asp Pro Lys
1940 1945 1950
ctc aag atg tcg ctg tgc ttt cgc tgg tac ctg agc ctg gcg agc 5904
Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser Leu Ala Ser
1955 1960 1965
cgc tgg gcc aac act gga gct tcc gat cgc gtc atg gac tac cag 5949
Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp Tyr Gln
1970 1975 1980
gtc tgg tgc ggt cct gcc att ggt tcc ttc aac gat ttc atc aag 5994
Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile Lys
1985 1990 1995
gga act tac ctt gat ccg gcc gtc gca aac gag tac ccg tgc gtc 6039
Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
2000 2005 2010
gtt cag att aac aag cag atc ctt cgt gga gcg tgc ttc ttg cgc 6084
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg
2015 2020 2025
cgt ctc gaa att ctg cgc aac gca cgc ctt tcc gat ggc gct gcc 6129
Arg Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala
2030 2035 2040
gct ctt gtg gcc agc atc gat gac aca tac gtc ccg gcc gag aag 6174
Ala Leu Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys
2045 2050 2055
ctg taa 6180
Leu
<210> 4
<211> 2059
<212> PRT
<213> Schizochytrium sp.
<400> 4
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1 5 10 15
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
20 25 30
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
35 40 45
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
50 55 60
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65 70 75 80
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
85 90 95
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
100 105 110
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
115 120 125
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
130 135 140
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145 150 155 160
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
165 170 175
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
180 185 190
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
195 200 205
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
210 215 220
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225 230 235 240
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
245 250 255
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
260 265 270
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
275 280 285
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
290 295 300
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305 310 315 320
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
325 330 335
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
340 345 350
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
355 360 365
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
370 375 380
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385 390 395 400
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
405 410 415
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
420 425 430
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
435 440 445
Ala Cys Thr Gly His Asp Ser Ile Ser Ala Leu Ser Ala Arg Cys Gly
450 455 460
Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly Met Asp Ala Thr Phe
465 470 475 480
Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg Ala Ile Tyr Thr Gly
485 490 495
Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg Trp Arg Phe Leu Gly
500 505 510
Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val Lys Ala Thr Pro His
515 520 525
Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe Gln Arg Leu Arg Thr
530 535 540
Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln Gln Leu Leu Ala Val
545 550 555 560
Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly Met Lys Lys Gly Gly
565 570 575
Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg
580 585 590
His Arg Ala Arg Val Ala Leu Lys Glu Arg Val Arg Pro Glu Ala Ser
595 600 605
Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn Asp Cys Gly Thr Ser
610 615 620
Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Val Ser
625 630 635 640
Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Ile Thr Glu Gly Asn
645 650 655
Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys Tyr Leu Leu Glu Thr
660 665 670
Gly Glu Val Asp Gly Val Val Val Ala Gly Val Asp Leu Cys Gly Ser
675 680 685
Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe Lys Val Ser Thr Ser
690 695 700
Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala Asp Gly Tyr Phe Val
705 710 715 720
Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg Glu Thr Ser Cys Thr
725 730 735
Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala Ile Val Pro Gly Asn
740 745 750
Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp Gln Ala Arg Val Lys
755 760 765
Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala Asp Ser Ala Arg His
770 775 780
Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu Thr Ala Glu Glu Glu
785 790 795 800
Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp Asp Lys Leu Pro Arg
805 810 815
Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val Gly Asp Thr Gly Tyr
820 825 830
Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala Leu Cys Ile Tyr Asn
835 840 845
Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp Glu Pro Ala Pro Glu
850 855 860
Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln Thr Ser Arg Ala Trp
865 870 875 880
Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala Val Ser Gly Val Ser
885 890 895
Glu Thr Arg Ser Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His
900 905 910
Tyr Glu Arg Glu Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu
915 920 925
Ile Val Leu Arg Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp
930 935 940
Lys Ile Arg Glu Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu
945 950 955 960
Ser Glu Leu Lys Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly
965 970 975
Glu Thr Leu Ala Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu
980 985 990
Ala Leu Ser Leu Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu
995 1000 1005
Leu Ala Ala Lys Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp
1010 1015 1020
Trp Ser Ser Pro Ala Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala
1025 1030 1035
Ser Asp Arg Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr
1040 1045 1050
Tyr Gly Ile Thr Gln Asp Ile His Arg Ile Trp Pro Glu Leu His
1055 1060 1065
Glu Val Ile Asn Glu Lys Thr Asn Arg Leu Trp Ala Glu Gly Asp
1070 1075 1080
Arg Trp Val Met Pro Arg Ala Ser Phe Lys Ser Glu Leu Glu Ser
1085 1090 1095
Gln Gln Gln Glu Phe Asp Arg Asn Met Ile Glu Met Phe Arg Leu
1100 1105 1110
Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu Ala Arg Asp Val
1115 1120 1125
Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser Leu Gly Glu
1130 1135 1140
Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu Ile Ser
1145 1150 1155
Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn Lys
1160 1165 1170
Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
1175 1180 1185
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val
1190 1195 1200
Arg Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser
1205 1210 1215
Lys Tyr Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu
1220 1225 1230
Ile Ser Gly Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu
1235 1240 1245
Gly Gly Asn Ile Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly
1250 1255 1260
His Cys Pro Glu Val Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile
1265 1270 1275
His Ala Asn Leu Glu Phe Pro Val Val Asp Gly Leu Asp Leu Trp
1280 1285 1290
Thr Thr Ile Asn Gln Lys Arg Leu Val Pro Arg Ala Thr Gly Ala
1295 1300 1305
Lys Asp Glu Trp Ala Pro Ser Ser Phe Gly Glu Tyr Ala Gly Gln
1310 1315 1320
Leu Tyr Glu Lys Gln Ala Asn Phe Pro Gln Ile Val Glu Thr Ile
1325 1330 1335
Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu Val Gly Pro Asn Asn
1340 1345 1350
His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly Pro Gln Arg Asn
1355 1360 1365
His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp Ala Trp Thr
1370 1375 1380
Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu Val Pro
1385 1390 1395
Gly Val Thr Ile Ser Pro Leu Tyr His Ser Lys Leu Val Ala Glu
1400 1405 1410
Ala Glu Ala Cys Tyr Ala Ala Leu Cys Lys Gly Glu Lys Pro Lys
1415 1420 1425
Lys Asn Lys Phe Val Arg Lys Ile Gln Leu Asn Gly Arg Phe Asn
1430 1435 1440
Ser Lys Ala Asp Pro Ile Ser Ser Ala Asp Leu Ala Ser Phe Pro
1445 1450 1455
Pro Ala Asp Pro Ala Ile Glu Ala Ala Ile Ser Ser Arg Ile Met
1460 1465 1470
Lys Pro Val Ala Pro Lys Phe Tyr Ala Arg Leu Asn Ile Asp Glu
1475 1480 1485
Gln Asp Glu Thr Arg Asp Pro Ile Leu Asn Lys Asp Asn Ala Pro
1490 1495 1500
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
1505 1510 1515
Pro Ser Pro Ala Pro Ser Ala Pro Val Gln Lys Lys Ala Ala Pro
1520 1525 1530
Ala Ala Glu Thr Lys Ala Val Ala Ser Ala Asp Ala Leu Arg Ser
1535 1540 1545
Ala Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser
1550 1555 1560
Ala Ser Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val
1565 1570 1575
Ile Val Pro Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe
1580 1585 1590
Met Lys Thr Tyr Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met
1595 1600 1605
Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Arg
1610 1615 1620
Gln Gly Ile Leu Ala Ser Phe Gly Ala Gly Gly Leu Pro Met Gln
1625 1630 1635
Val Val Arg Glu Ser Ile Glu Lys Ile Gln Ala Ala Leu Pro Asn
1640 1645 1650
Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
1655 1660 1665
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val Thr
1670 1675 1680
Phe Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val Val
1685 1690 1695
Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala Asp Gly Ser Val
1700 1705 1710
Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
1715 1720 1725
Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu Gln Lys
1730 1735 1740
Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu Ala
1745 1750 1755
Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
1760 1765 1770
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu
1775 1780 1785
Ile Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro
1790 1795 1800
Ala Asn Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys
1805 1810 1815
Pro Gln Ala Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile
1820 1825 1830
Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys
1835 1840 1845
Asp Asn Val Arg Lys Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val
1850 1855 1860
Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys Leu
1865 1870 1875
Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn Lys
1880 1885 1890
Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ser Met Pro
1895 1900 1905
Pro Ala Glu Leu Ala Arg Val Glu Lys Arg Ile Phe Ser Arg Ala
1910 1915 1920
Leu Glu Glu Val Trp Asp Glu Thr Lys Asn Phe Tyr Ile Asn Arg
1925 1930 1935
Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu Arg Asp Pro Lys
1940 1945 1950
Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser Leu Ala Ser
1955 1960 1965
Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp Tyr Gln
1970 1975 1980
Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile Lys
1985 1990 1995
Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
2000 2005 2010
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg
2015 2020 2025
Arg Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala
2030 2035 2040
Ala Leu Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys
2045 2050 2055
Leu
<210> 5
<211> 4509
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(4509)
<400> 5
atg gcg ctc cgt gtc aag acg aac aag aag cca tgc tgg gag atg acc 48
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1 5 10 15
aag gag gag ctg acc agc ggc aag acc gag gtg ttc aac tat gag gaa 96
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
20 25 30
ctc ctc gag ttc gca gag ggc gac atc gcc aag gtc ttc gga ccc gag 144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
35 40 45
ttc gcc gtc atc gac aag tac ccg cgc cgc gtg cgc ctg ccc gcc cgc 192
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
gag tac ctg ctc gtg acc cgc gtc acc ctc atg gac gcc gag gtc aac 240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65 70 75 80
aac tac cgc gtc ggc gcc cgc atg gtc acc gag tac gat ctc ccc gtc 288
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
85 90 95
aac gga gag ctc tcc gag ggc gga gac tgc ccc tgg gcc gtc ctg gtc 336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
100 105 110
gag agt ggc cag tgc gat ctc atg ctc atc tcc tac atg ggc att gac 384
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
ttc cag aac cag ggc gac cgc gtc tac cgc ctg ctc aac acc acg ctc 432
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
acc ttt tac ggc gtg gcc cac gag ggc gag acc ctc gag tac gac att 480
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145 150 155 160
cgc gtc acc ggc ttc gcc aag cgt ctc gac ggc ggc atc tcc atg ttc 528
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
165 170 175
ttc ttc gag tac gac tgc tac gtc aac ggc cgc ctc ctc atc gag atg 576
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
180 185 190
cgc gat ggc tgc gcc ggc ttc ttc acc aac gag gag ctc gac gcc ggc 624
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
195 200 205
aag ggc gtc gtc ttc acc cgc ggc gac ctc gcc gcc cgc gcc aag atc 672
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
210 215 220
cca aag cag gac gtc tcc ccc tac gcc gtc gcc ccc tgc ctc cac aag 720
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225 230 235 240
acc aag ctc aac gaa aag gag atg cag acc ctc gtc gac aag gac tgg 768
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
245 250 255
gca tcc gtc ttt ggc tcc aag aac ggc atg ccg gaa atc aac tac aaa 816
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
260 265 270
ctc tgc gcg cgt aag atg ctc atg att gac cgc gtc acc agc att gac 864
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
275 280 285
cac aag ggc ggt gtc tac ggc ctc ggt cag ctc gtc ggt gaa aag atc 912
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
290 295 300
ctc gag cgc gac cac tgg tac ttt ccc tgc cac ttt gtc aag gat cag 960
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305 310 315 320
gtc atg gcc gga tcc ctc gtc tcc gac ggc tgc agc cag atg ctc aag 1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
325 330 335
atg tac atg atc tgg ctc ggc ctc cac ctc acc acc gga ccc ttt gac 1056
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
340 345 350
ttc cgc ccg gtc aac ggc cac ccc aac aag gtc cgc tgc cgc ggc caa 1104
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
atc tcc ccg cac aag ggc aag ctc gtc tac gtc atg gag atc aag gag 1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
370 375 380
atg ggc ttc gac gag gac aac gac ccg tac gcc att gcc gac gtc aac 1200
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385 390 395 400
atc att gat gtc gac ttc gaa aag ggc cag gac ttt agc ctc gac cgc 1248
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
405 410 415
atc agc gac tac ggc aag ggc gac ctc aac aag aag atc gtc gtc gac 1296
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
420 425 430
ttt aag ggc atc gct ctc aag atg cag aag cgc tcc acc aac aag aac 1344
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
435 440 445
ccc tcc aag gtt cag ccc gtc ttt gcc aac ggc gcc gcc act gtc ggc 1392
Pro Ser Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly
450 455 460
ccc gag gcc tcc aag gct tcc tcc ggc gcc agc gcc agc gcc agc gcc 1440
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala
465 470 475 480
gcc ccg gcc aag cct gcc ttc agc gcc gat gtt ctt gcg ccc aag ccc 1488
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro
485 490 495
gtt gcc ctt ccc gag cac atc ctc aag ggc gac gcc ctc gcc ccc aag 1536
Val Ala Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys
500 505 510
gag atg tcc tgg cac ccc atg gcc cgc atc ccg ggc aac ccg acg ccc 1584
Glu Met Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro
515 520 525
tct ttt gcg ccc tcg gcc tac aag ccg cgc aac atc gcc ttt acg ccc 1632
Ser Phe Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro
530 535 540
ttc ccc ggc aac ccc aac gat aac gac cac acc ccg ggc aag atg ccg 1680
Phe Pro Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro
545 550 555 560
ctc acc tgg ttc aac atg gcc gag ttc atg gcc ggc aag gtc agc atg 1728
Leu Thr Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met
565 570 575
tgc ctc ggc ccc gag ttc gcc aag ttc gac gac tcg aac acc agc cgc 1776
Cys Leu Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg
580 585 590
agc ccc gct tgg gac ctc gct ctc gtc acc cgc gcc gtg tct gtg tct 1824
Ser Pro Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser
595 600 605
gac ctc aag cac gtc aac tac cgc aac atc gac ctc gac ccc tcc aag 1872
Asp Leu Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys
610 615 620
ggt acc atg gtc ggc gag ttc gac tgc ccc gcg gac gcc tgg ttc tac 1920
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr
625 630 635 640
aag ggc gcc tgc aac gat gcc cac atg ccg tac tcg atc ctc atg gag 1968
Lys Gly Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu
645 650 655
atc gcc ctc cag acc tcg ggt gtg ctc acc tcg gtg ctc aag gcg ccc 2016
Ile Ala Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro
660 665 670
ctg acc atg gag aag gac gac atc ctc ttc cgc aac ctc gac gcc aac 2064
Leu Thr Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn
675 680 685
gcc gag ttc gtg cgc gcc gac ctc gac tac cgc ggc aag act atc cgc 2112
Ala Glu Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg
690 695 700
aac gtc acc aag tgc act ggc tac agc atg ctc ggc gag atg ggc gtc 2160
Asn Val Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val
705 710 715 720
cac cgc ttc acc ttt gag ctc tac gtc gat gat gtg ctc ttt tac aag 2208
His Arg Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys
725 730 735
ggc tcg acc tcg ttc ggc tgg ttc gtg ccc gag gtc ttt gcc gcc cag 2256
Gly Ser Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln
740 745 750
gcc ggc ctc gac aac ggc cgc aag tcg gag ccc tgg ttc att gag aac 2304
Ala Gly Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn
755 760 765
aag gtt ccg gcc tcg cag gtc tcc tcc ttt gac gtg cgc ccc aac ggc 2352
Lys Val Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly
770 775 780
agc ggc cgc acc gcc atc ttc gcc aac gcc ccc agc ggc gcc cag ctc 2400
Ser Gly Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu
785 790 795 800
aac cgc cgc acg gac cag ggc cag tac ctc gac gcc gtc gac att gtc 2448
Asn Arg Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val
805 810 815
tcc ggc agc ggc aag aag agc ctc ggc tac gcc cac ggt tcc aag acg 2496
Ser Gly Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr
820 825 830
gtc aac ccg aac gac tgg ttc ttc tcg tgc cac ttt tgg ttt gac tcg 2544
Val Asn Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser
835 840 845
gtc atg ccc gga agt ctc ggt gtc gag tcc atg ttc cag ctc gtc gag 2592
Val Met Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu
850 855 860
gcc atc gcc gcc cac gag gat ctc gct ggc aag cac ggc att gcc aac 2640
Ala Ile Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn
865 870 875 880
ccc acc ttt gtg cac gcc ccg ggc aag atc agc tgg aag tac cgc ggc 2688
Pro Thr Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly
885 890 895
cag ctc acg ccc aag agc aag aag atg gac tcg gag gtc cac atc gtg 2736
Gln Leu Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val
900 905 910
tcc gtg gac gcc cac gac ggc gtt gtc gac ctc gtc gcc gac ggc ttc 2784
Ser Val Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe
915 920 925
ctc tgg gcc gac agc ctc cgc gtc tac tcg gtg agc aac att cgc gtg 2832
Leu Trp Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val
930 935 940
cgc atc gcc tcc ggt gag gcc cct gcc gcc gcc tcc tcc gcc gcc tct 2880
Arg Ile Ala Ser Gly Glu Ala Pro Ala Ala Ala Ser Ser Ala Ala Ser
945 950 955 960
gtg ggc tcc tcg gct tcg tcc gtc gag cgc acg cgc tcg agc ccc gct 2928
Val Gly Ser Ser Ala Ser Ser Val Glu Arg Thr Arg Ser Ser Pro Ala
965 970 975
gtc gcc tcc ggc ccg gcc cag acc atc gac ctc aag cag ctc aag acc 2976
Val Ala Ser Gly Pro Ala Gln Thr Ile Asp Leu Lys Gln Leu Lys Thr
980 985 990
gag ctc ctc gag ctc gat gcc ccg ctc tac ctc tcg cag gac ccg acc 3024
Glu Leu Leu Glu Leu Asp Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr
995 1000 1005
agc ggc cag ctc aag aag cac acc gac gtg gcc tcc ggc cag gcc 3069
Ser Gly Gln Leu Lys Lys His Thr Asp Val Ala Ser Gly Gln Ala
1010 1015 1020
acc atc gtg cag ccc tgc acg ctc ggc gac ctc ggt gac cgc tcc 3114
Thr Ile Val Gln Pro Cys Thr Leu Gly Asp Leu Gly Asp Arg Ser
1025 1030 1035
ttc atg gag acc tac ggc gtc gtc gcc ccg ctg tac acg ggc gcc 3159
Phe Met Glu Thr Tyr Gly Val Val Ala Pro Leu Tyr Thr Gly Ala
1040 1045 1050
atg gcc aag ggc att gcc tcg gcg gac ctc gtc atc gcc gcc ggc 3204
Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly
1055 1060 1065
aag cgc aag atc ctc ggc tcc ttt ggc gcc ggc ggc ctc ccc atg 3249
Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Met
1070 1075 1080
cac cac gtg cgc gcc gcc ctc gag aag atc cag gcc gcc ctg cct 3294
His His Val Arg Ala Ala Leu Glu Lys Ile Gln Ala Ala Leu Pro
1085 1090 1095
cag ggc ccc tac gcc gtc aac ctc atc cac tcg cct ttt gac agc 3339
Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser
1100 1105 1110
aac ctc gag aag ggc aac gtc gat ctc ttc ctc gag aag ggc gtc 3384
Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val
1115 1120 1125
act gtg gtg gag gcc tcg gca ttc atg acc ctc acc ccg cag gtc 3429
Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val
1130 1135 1140
gtg cgc tac cgc gcc gcc ggc ctc tcg cgc aac gcc gac ggt tcg 3474
Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
1145 1150 1155
gtc aac atc cgc aac cgc atc atc ggc aag gtc tcg cgc acc gag 3519
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu
1160 1165 1170
ctc gcc gag atg ttc atc cgc ccg gcc ccg gag cac ctc ctc gag 3564
Leu Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu
1175 1180 1185
aag ctc atc gcc tcg ggc gag atc acc cag gag cag gcc gag ctc 3609
Lys Leu Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu
1190 1195 1200
gcg cgc cgc gtt ccc gtc gcc gac gat atc gct gtc gag gct gac 3654
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp
1205 1210 1215
tcg ggc ggc cac acc gac aac cgc ccc atc cac gtc atc ctc ccg 3699
Ser Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro
1220 1225 1230
ctc atc atc aac ctc cgc aac cgc ctg cac cgc gag tgc ggc tac 3744
Leu Ile Ile Asn Leu Arg Asn Arg Leu His Arg Glu Cys Gly Tyr
1235 1240 1245
ccc gcg cac ctc cgc gtc cgc gtt ggc gcc ggc ggt ggc gtc ggc 3789
Pro Ala His Leu Arg Val Arg Val Gly Ala Gly Gly Gly Val Gly
1250 1255 1260
tgc ccg cag gcc gcc gcc gcc gcg ctc acc atg ggc gcc gcc ttc 3834
Cys Pro Gln Ala Ala Ala Ala Ala Leu Thr Met Gly Ala Ala Phe
1265 1270 1275
atc gtc acc ggc act gtc aac cag gtc gcc aag cag tcc ggc acc 3879
Ile Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr
1280 1285 1290
tgc gac aac gtg cgc aag cag ctc tcg cag gcc acc tac tcg gat 3924
Cys Asp Asn Val Arg Lys Gln Leu Ser Gln Ala Thr Tyr Ser Asp
1295 1300 1305
atc tgc atg gcc ccg gcc gcc gac atg ttc gag gag ggc gtc aag 3969
Ile Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys
1310 1315 1320
ctc cag gtc ctc aag aag gga acc atg ttc ccc tcg cgc gcc aac 4014
Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn
1325 1330 1335
aag ctc tac gag ctc ttt tgc aag tac gac tcc ttc gac tcc atg 4059
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Asp Ser Met
1340 1345 1350
cct cct gcc gag ctc gag cgc atc gag aag cgt atc ttc aag cgc 4104
Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe Lys Arg
1355 1360 1365
gca ctc cag gag gtc tgg gag gag acc aag gac ttt tac att aac 4149
Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile Asn
1370 1375 1380
ggt ctc aag aac ccg gag aag atc cag cgc gcc gag cac gac ccc 4194
Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
1385 1390 1395
aag ctc aag atg tcg ctc tgc ttc cgc tgg tac ctt ggt ctt gcc 4239
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala
1400 1405 1410
agc cgc tgg gcc aac atg ggc gcc ccg gac cgc gtc atg gac tac 4284
Ser Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr
1415 1420 1425
cag gtc tgg tgt ggc ccg gcc att ggc gcc ttc aac gac ttc atc 4329
Gln Val Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile
1430 1435 1440
aag ggc acc tac ctc gac ccc gct gtc tcc aac gag tac ccc tgt 4374
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys
1445 1450 1455
gtc gtc cag atc aac ctg caa atc ctc cgt ggt gcc tgc tac ctg 4419
Val Val Gln Ile Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu
1460 1465 1470
cgc cgt ctc aac gcc ctg cgc aac gac ccg cgc att gac ctc gag 4464
Arg Arg Leu Asn Ala Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu
1475 1480 1485
acc gag gat gct gcc ttt gtc tac gag ccc acc aac gcg ctc taa 4509
Thr Glu Asp Ala Ala Phe Val Tyr Glu Pro Thr Asn Ala Leu
1490 1495 1500
<210> 6
<211> 1502
<212> PRT
<213> Schizochytrium sp.
<400> 6
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1 5 10 15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
35 40 45
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65 70 75 80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
100 105 110
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
180 185 190
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
195 200 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
210 215 220
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225 230 235 240
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
245 250 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
260 265 270
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
275 280 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
290 295 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
325 330 335
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
340 345 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
370 375 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385 390 395 400
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
405 410 415
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
420 425 430
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
435 440 445
Pro Ser Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly
450 455 460
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala
465 470 475 480
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro
485 490 495
Val Ala Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys
500 505 510
Glu Met Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro
515 520 525
Ser Phe Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro
530 535 540
Phe Pro Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro
545 550 555 560
Leu Thr Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met
565 570 575
Cys Leu Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg
580 585 590
Ser Pro Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser
595 600 605
Asp Leu Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys
610 615 620
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr
625 630 635 640
Lys Gly Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu
645 650 655
Ile Ala Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro
660 665 670
Leu Thr Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn
675 680 685
Ala Glu Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg
690 695 700
Asn Val Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val
705 710 715 720
His Arg Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys
725 730 735
Gly Ser Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln
740 745 750
Ala Gly Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn
755 760 765
Lys Val Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly
770 775 780
Ser Gly Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu
785 790 795 800
Asn Arg Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val
805 810 815
Ser Gly Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr
820 825 830
Val Asn Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser
835 840 845
Val Met Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu
850 855 860
Ala Ile Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn
865 870 875 880
Pro Thr Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly
885 890 895
Gln Leu Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val
900 905 910
Ser Val Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe
915 920 925
Leu Trp Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val
930 935 940
Arg Ile Ala Ser Gly Glu Ala Pro Ala Ala Ala Ser Ser Ala Ala Ser
945 950 955 960
Val Gly Ser Ser Ala Ser Ser Val Glu Arg Thr Arg Ser Ser Pro Ala
965 970 975
Val Ala Ser Gly Pro Ala Gln Thr Ile Asp Leu Lys Gln Leu Lys Thr
980 985 990
Glu Leu Leu Glu Leu Asp Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr
995 1000 1005
Ser Gly Gln Leu Lys Lys His Thr Asp Val Ala Ser Gly Gln Ala
1010 1015 1020
Thr Ile Val Gln Pro Cys Thr Leu Gly Asp Leu Gly Asp Arg Ser
1025 1030 1035
Phe Met Glu Thr Tyr Gly Val Val Ala Pro Leu Tyr Thr Gly Ala
1040 1045 1050
Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly
1055 1060 1065
Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Met
1070 1075 1080
His His Val Arg Ala Ala Leu Glu Lys Ile Gln Ala Ala Leu Pro
1085 1090 1095
Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser
1100 1105 1110
Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val
1115 1120 1125
Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln Val
1130 1135 1140
Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
1145 1150 1155
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu
1160 1165 1170
Leu Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu
1175 1180 1185
Lys Leu Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu
1190 1195 1200
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp
1205 1210 1215
Ser Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro
1220 1225 1230
Leu Ile Ile Asn Leu Arg Asn Arg Leu His Arg Glu Cys Gly Tyr
1235 1240 1245
Pro Ala His Leu Arg Val Arg Val Gly Ala Gly Gly Gly Val Gly
1250 1255 1260
Cys Pro Gln Ala Ala Ala Ala Ala Leu Thr Met Gly Ala Ala Phe
1265 1270 1275
Ile Val Thr Gly Thr Val Asn Gln Val Ala Lys Gln Ser Gly Thr
1280 1285 1290
Cys Asp Asn Val Arg Lys Gln Leu Ser Gln Ala Thr Tyr Ser Asp
1295 1300 1305
Ile Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys
1310 1315 1320
Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn
1325 1330 1335
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Asp Ser Met
1340 1345 1350
Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe Lys Arg
1355 1360 1365
Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile Asn
1370 1375 1380
Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
1385 1390 1395
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala
1400 1405 1410
Ser Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr
1415 1420 1425
Gln Val Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile
1430 1435 1440
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys
1445 1450 1455
Val Val Gln Ile Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu
1460 1465 1470
Arg Arg Leu Asn Ala Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu
1475 1480 1485
Thr Glu Asp Ala Ala Phe Val Tyr Glu Pro Thr Asn Ala Leu
1490 1495 1500
<210> 7
<211> 1500
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 7
atg gcg gcc cgt ctg cag gag caa aag gga ggc gag atg gat acc cgc 48
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1 5 10 15
att gcc atc atc ggc atg tcg gcc atc ctc ccc tgc ggc acg acc gtg 96
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
20 25 30
cgc gag tcg tgg gag acc atc cgc gcc ggc atc gac tgc ctg tcg gat 144
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
35 40 45
ctc ccc gag gac cgc gtc gac gtg acg gcg tac ttt gac ccc gtc aag 192
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
50 55 60
acc acc aag gac aag atc tac tgc aag cgc ggt ggc ttc att ccc gag 240
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65 70 75 80
tac gac ttt gac gcc cgc gag ttc gga ctc aac atg ttc cag atg gag 288
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
85 90 95
gac tcg gac gca aac cag acc atc tcg ctt ctc aag gtc aag gag gcc 336
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
100 105 110
ctc cag gac gcc ggc atc gac gcc ctc ggc aag gaa aag aag aac atc 384
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
115 120 125
ggc tgc gtg ctc ggc att ggc ggc ggc caa aag tcc agc cac gag ttc 432
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
130 135 140
tac tcg cgc ctt aat tat gtt gtc gtg gag aag gtc ctc cgc aag atg 480
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145 150 155 160
ggc atg ccc gag gag gac gtc aag gtc gcc gtc gaa aag tac aag gcc 528
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
165 170 175
aac ttc ccc gag tgg cgc ctc gac tcc ttc cct ggc ttc ctc ggc aac 576
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
180 185 190
gtc acc gcc ggt cgc tgc acc aac acc ttc aac ctc gac ggc atg aac 624
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
195 200 205
tgc gtt gtc gac gcc gca tgc gcc tcg tcc ctc atc gcc gtc aag gtc 672
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
210 215 220
gcc atc gac gag ctg ctc tac ggt gac tgc gac atg atg gtc acc ggt 720
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225 230 235 240
gcc acc tgc acg gat aac tcc atc ggc atg tac atg gcc ttc tcc aag 768
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
245 250 255
acc ccc gtg ttc tcc acg gac ccc agc gtg cgc gcc tac gac gaa aag 816
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
260 265 270
aca aag ggc atg ctc atc ggc gag ggc tcc gcc atg ctc gtc ctc aag 864
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
275 280 285
cgc tac gcc gac gcc gtc cgc gac ggc gat gag atc cac gct gtt att 912
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
290 295 300
cgc ggc tgc gcc tcc tcc agt gat ggc aag gcc gcc ggc atc tac acg 960
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305 310 315 320
ccc acc att tcg ggc cag gag gag gcc ctc cgc cgc gcc tac aac cgc 1008
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
325 330 335
gcc tgt gtc gac ccg gcc acc gtc act ctc gtc gag ggt cac ggc acc 1056
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
340 345 350
ggt act ccc gtt ggc gac cgc atc gag ctc acc gcc ttg cgc aac ctc 1104
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
355 360 365
ttt gac aag gcc tac ggc gag ggc aac acc gaa aag gtc gct gtg ggc 1152
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
370 375 380
agc atc aag tcc agc atc ggc cat ctc aag gcc gtc gcc ggt ctc gcc 1200
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385 390 395 400
ggt atg atc aag gtc atc atg gcg ctc aag cac aag act ctc ccg ggc 1248
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
405 410 415
acc atc aac gtc gac aac cca ccc aac ctc tac gac aac acg ccc atc 1296
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
420 425 430
aac gag tcc tcg ctc tac att aac acc atg aac cgc ccc tgg ttc ccg 1344
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
435 440 445
ccc cct ggt gtg ccc cgc cgc gcc ggc att tcg agc ttt ggc ttt ggt 1392
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
450 455 460
ggc gcc aac tac cac gcc gtc ctc gag gag gcc gag ccc gag cac acg 1440
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465 470 475 480
acc gcg tac cgc ctc aac aag cgc ccg cag ccc gtg ctc atg atg gcc 1488
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
485 490 495
gcc acg ccc gcg 1500
Ala Thr Pro Ala
500
<210> 8
<211> 500
<212> PRT
<213> Schizochytrium sp.
<400> 8
Met Ala Ala Arg Leu Gln Glu Gln Lys Gly Gly Glu Met Asp Thr Arg
1 5 10 15
Ile Ala Ile Ile Gly Met Ser Ala Ile Leu Pro Cys Gly Thr Thr Val
20 25 30
Arg Glu Ser Trp Glu Thr Ile Arg Ala Gly Ile Asp Cys Leu Ser Asp
35 40 45
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys
50 55 60
Thr Thr Lys Asp Lys Ile Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu
65 70 75 80
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gln Met Glu
85 90 95
Asp Ser Asp Ala Asn Gln Thr Ile Ser Leu Leu Lys Val Lys Glu Ala
100 105 110
Leu Gln Asp Ala Gly Ile Asp Ala Leu Gly Lys Glu Lys Lys Asn Ile
115 120 125
Gly Cys Val Leu Gly Ile Gly Gly Gly Gln Lys Ser Ser His Glu Phe
130 135 140
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met
145 150 155 160
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala
165 170 175
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn
180 185 190
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn
195 200 205
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu Ile Ala Val Lys Val
210 215 220
Ala Ile Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly
225 230 235 240
Ala Thr Cys Thr Asp Asn Ser Ile Gly Met Tyr Met Ala Phe Ser Lys
245 250 255
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys
260 265 270
Thr Lys Gly Met Leu Ile Gly Glu Gly Ser Ala Met Leu Val Leu Lys
275 280 285
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu Ile His Ala Val Ile
290 295 300
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly Ile Tyr Thr
305 310 315 320
Pro Thr Ile Ser Gly Gln Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg
325 330 335
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr
340 345 350
Gly Thr Pro Val Gly Asp Arg Ile Glu Leu Thr Ala Leu Arg Asn Leu
355 360 365
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly
370 375 380
Ser Ile Lys Ser Ser Ile Gly His Leu Lys Ala Val Ala Gly Leu Ala
385 390 395 400
Gly Met Ile Lys Val Ile Met Ala Leu Lys His Lys Thr Leu Pro Gly
405 410 415
Thr Ile Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro Ile
420 425 430
Asn Glu Ser Ser Leu Tyr Ile Asn Thr Met Asn Arg Pro Trp Phe Pro
435 440 445
Pro Pro Gly Val Pro Arg Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly
450 455 460
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr
465 470 475 480
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gln Pro Val Leu Met Met Ala
485 490 495
Ala Thr Pro Ala
500
<210> 9
<211> 1278
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1278)
<400> 9
gat gtc acc aag gag gcc tgg cgc ctc ccc cgc gag ggc gtc agc ttc 48
Asp Val Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe
1 5 10 15
cgc gcc aag ggc atc gcc acc aac ggc gct gtc gcc gcg ctc ttc tcc 96
Arg Ala Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser
20 25 30
ggc cag ggc gcg cag tac acg cac atg ttt agc gag gtg gcc atg aac 144
Gly Gln Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn
35 40 45
tgg ccc cag ttc cgc cag agc att gcc gcc atg gac gcc gcc cag tcc 192
Trp Pro Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser
50 55 60
aag gtc gct gga agc gac aag gac ttt gag cgc gtc tcc cag gtc ctc 240
Lys Val Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu
65 70 75 80
tac ccg cgc aag ccg tac gag cgt gag ccc gag cag gac cac aag aag 288
Tyr Pro Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys
85 90 95
atc tcc ctc acc gcc tac tcg cag ccc tcg acc ctg gcc tgc gct ctc 336
Ile Ser Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu
100 105 110
ggt gcc ttt gag atc ttc aag gag gcc ggc ttc acc ccg gac ttt gcc 384
Gly Ala Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala
115 120 125
gcc ggc cat tcg ctc ggt gag ttc gcc gcc ctc tac gcc gcg ggc tgc 432
Ala Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys
130 135 140
gtc gac cgc gac gag ctc ttt gag ctt gtc tgc cgc cgc gcc cgc atc 480
Val Asp Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile
145 150 155 160
atg ggc ggc aag gac gca ccg gcc acc ccc aag ggc tgc atg gcc gcc 528
Met Gly Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala
165 170 175
gtc att ggc ccc aac gcc gag aac atc aag gtc cag gcc gcc aac gtc 576
Val Ile Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val
180 185 190
tgg ctc ggc aac tcc aac tcg cct tcg cag acc gtc atc acc ggc tcc 624
Trp Leu Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser
195 200 205
gtc gaa ggt atc cag gcc gag agc gcc cgc ctc cag aag gag ggc ttc 672
Val Glu Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe
210 215 220
cgc gtc gtg cct ctt gcc tgc gag agc gcc ttc cac tcg ccc cag atg 720
Arg Val Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met
225 230 235 240
gag aac gcc tcg tcg gcc ttc aag gac gtc atc tcc aag gtc tcc ttc 768
Glu Asn Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe
245 250 255
cgc acc ccc aag gcc gag acc aag ctc ttc agc aac gtc tct ggc gag 816
Arg Thr Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu
260 265 270
acc tac ccc acg gac gcc cgc gag atg ctt acg cag cac atg acc agc 864
Thr Tyr Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser
275 280 285
agc gtc aag ttc ctc acc cag gtc cgc aac atg cac cag gcc ggt gcg 912
Ser Val Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala
290 295 300
cgc atc ttt gtc gag ttc gga ccc aag cag gtg ctc tcc aag ctt gtc 960
Arg Ile Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val
305 310 315 320
tcc gag acc ctc aag gat gac ccc tcg gtt gtc acc gtc tct gtc aac 1008
Ser Glu Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn
325 330 335
ccg gcc tcg ggc acg gat tcg gac atc cag ctc cgc gac gcg gcc gtc 1056
Pro Ala Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val
340 345 350
cag ctc gtt gtc gct ggc gtc aac ctt cag ggc ttt gac aag tgg gac 1104
Gln Leu Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp
355 360 365
gcc ccc gat gcc acc cgc atg cag gcc atc aag aag aag cgc act acc 1152
Ala Pro Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr
370 375 380
ctc cgc ctt tcg gcc gcc acc tac gtc tcg gac aag acc aag aag gtc 1200
Leu Arg Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val
385 390 395 400
cgc gac gcc gcc atg aac gat ggc cgc tgc gtc acc tac ctc aag ggc 1248
Arg Asp Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly
405 410 415
gcc gca ccg ctc atc aag gcc ccg gag ccc 1278
Ala Ala Pro Leu Ile Lys Ala Pro Glu Pro
420 425
<210> 10
<211> 426
<212> PRT
<213> Schizochytrium sp.
<400> 10
Asp Val Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe
1 5 10 15
Arg Ala Lys Gly Ile Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser
20 25 30
Gly Gln Gly Ala Gln Tyr Thr His Met Phe Ser Glu Val Ala Met Asn
35 40 45
Trp Pro Gln Phe Arg Gln Ser Ile Ala Ala Met Asp Ala Ala Gln Ser
50 55 60
Lys Val Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gln Val Leu
65 70 75 80
Tyr Pro Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gln Asp His Lys Lys
85 90 95
Ile Ser Leu Thr Ala Tyr Ser Gln Pro Ser Thr Leu Ala Cys Ala Leu
100 105 110
Gly Ala Phe Glu Ile Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala
115 120 125
Ala Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys
130 135 140
Val Asp Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg Ile
145 150 155 160
Met Gly Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala
165 170 175
Val Ile Gly Pro Asn Ala Glu Asn Ile Lys Val Gln Ala Ala Asn Val
180 185 190
Trp Leu Gly Asn Ser Asn Ser Pro Ser Gln Thr Val Ile Thr Gly Ser
195 200 205
Val Glu Gly Ile Gln Ala Glu Ser Ala Arg Leu Gln Lys Glu Gly Phe
210 215 220
Arg Val Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gln Met
225 230 235 240
Glu Asn Ala Ser Ser Ala Phe Lys Asp Val Ile Ser Lys Val Ser Phe
245 250 255
Arg Thr Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu
260 265 270
Thr Tyr Pro Thr Asp Ala Arg Glu Met Leu Thr Gln His Met Thr Ser
275 280 285
Ser Val Lys Phe Leu Thr Gln Val Arg Asn Met His Gln Ala Gly Ala
290 295 300
Arg Ile Phe Val Glu Phe Gly Pro Lys Gln Val Leu Ser Lys Leu Val
305 310 315 320
Ser Glu Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn
325 330 335
Pro Ala Ser Gly Thr Asp Ser Asp Ile Gln Leu Arg Asp Ala Ala Val
340 345 350
Gln Leu Val Val Ala Gly Val Asn Leu Gln Gly Phe Asp Lys Trp Asp
355 360 365
Ala Pro Asp Ala Thr Arg Met Gln Ala Ile Lys Lys Lys Arg Thr Thr
370 375 380
Leu Arg Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val
385 390 395 400
Arg Asp Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly
405 410 415
Ala Ala Pro Leu Ile Lys Ala Pro Glu Pro
420 425
<210> 11
<211> 5
<212> PRT
<213> Schizochytrium sp.
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> X = any amino acid
<400> 11
Gly His Ser Xaa Gly
1 5
<210> 12
<211> 258
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(258)
<400> 12
gct gtc tcg aac gag ctt ctt gag aag gcc gag act gtc gtc atg gag 48
Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu
1 5 10 15
gtc ctc gcc gcc aag acc ggc tac gag acc gac atg atc gag gct gac 96
Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ala Asp
20 25 30
atg gag ctc gag acc gag ctc ggc att gac tcc atc aag cgt gtc gag 144
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
35 40 45
atc ctc tcc gag gtc cag gcc atg ctc aat gtc gag gcc aag gat gtc 192
Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
50 55 60
gat gcc ctc agc cgc act cgc act gtt ggt gag gtt gtc aac gcc atg 240
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asn Ala Met
65 70 75 80
aag gcc gag atc gct ggc 258
Lys Ala Glu Ile Ala Gly
85
<210> 13
<211> 86
<212> PRT
<213> Schizochytrium sp.
<400> 13
Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu
1 5 10 15
Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met Ile Glu Ala Asp
20 25 30
Met Glu Leu Glu Thr Glu Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
35 40 45
Ile Leu Ser Glu Val Gln Ala Met Leu Asn Val Glu Ala Lys Asp Val
50 55 60
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asn Ala Met
65 70 75 80
Lys Ala Glu Ile Ala Gly
85
<210> 14
<211> 5
<212> PRT
<213> Schizochytrium sp.
<400> 14
Leu Gly Ile Asp Ser
1 5
<210> 15
<211> 21
<212> PRT
<213> Schizochytrium sp.
<400> 15
Ala Pro Ala Pro Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser
1 5 10 15
Ala Pro Ala Pro Ala
20
<210> 16
<211> 3006
<212> DNA
<213> Schizochytrium sp.
<400> 16
gcccccgccc cggtcaaggc tgctgcgcct gccgcccccg ttgcctcggc ccctgccccg 60
gctgtctcga acgagcttct tgagaaggcc gagactgtcg tcatggaggt cctcgccgcc 120
aagaccggct acgagaccga catgatcgag gctgacatgg agctcgagac cgagctcggc 180
attgactcca tcaagcgtgt cgagatcctc tccgaggtcc aggccatgct caatgtcgag 240
gccaaggatg tcgatgccct cagccgcact cgcactgttg gtgaggttgt caacgccatg 300
aaggccgaga tcgctggcag ctctgccccg gcgcctgctg ccgctgctcc ggctccggcc 360
aaggctgccc ctgccgccgc tgcgcctgct gtctcgaacg agcttctcga gaaggccgag 420
accgtcgtca tggaggtcct cgccgccaag actggctacg agactgacat gatcgagtcc 480
gacatggagc tcgagactga gctcggcatt gactccatca agcgtgtcga gatcctctcc 540
gaggttcagg ccatgctcaa cgtcgaggcc aaggacgtcg acgctctcag ccgcactcgc 600
actgtgggtg aggtcgtcaa cgccatgaag gctgagatcg ctggtggctc tgccccggcg 660
cctgccgccg ctgccccagg tccggctgct gccgcccctg cgcctgccgc cgccgcccct 720
gctgtctcga acgagcttct tgagaaggcc gagaccgtcg tcatggaggt cctcgccgcc 780
aagactggct acgagactga catgatcgag tccgacatgg agctcgagac cgagctcggc 840
attgactcca tcaagcgtgt cgagattctc tccgaggtcc aggccatgct caacgtcgag 900
gccaaggacg tcgacgctct cagccgcacc cgcactgttg gcgaggtcgt cgatgccatg 960
aaggccgaga tcgctggtgg ctctgccccg gcgcctgccg ccgctgctcc tgctccggct 1020
gctgccgccc ctgcgcctgc cgcccctgcg cctgctgtct cgagcgagct tctcgagaag 1080
gccgagactg tcgtcatgga ggtcctcgcc gccaagactg gctacgagac tgacatgatc 1140
gagtccgaca tggagctcga gaccgagctc ggcattgact ccatcaagcg tgtcgagatt 1200
ctctccgagg tccaggccat gctcaacgtc gaggccaagg acgtcgacgc tctcagccgc 1260
acccgcactg ttggcgaggt cgtcgatgcc atgaaggccg agatcgctgg tggctctgcc 1320
ccggcgcctg ccgccgctgc tcctgctccg gctgctgccg cccctgcgcc tgccgcccct 1380
gcgcctgccg cccctgcgcc tgctgtctcg agcgagcttc tcgagaaggc cgagactgtc 1440
gtcatggagg tcctcgccgc caagactggc tacgagactg acatgattga gtccgacatg 1500
gagctcgaga ccgagctcgg cattgactcc atcaagcgtg tcgagattct ctccgaggtt 1560
caggccatgc tcaacgtcga ggccaaggac gtcgacgctc tcagccgcac tcgcactgtt 1620
ggtgaggtcg tcgatgccat gaaggctgag atcgctggca gctccgcctc ggcgcctgcc 1680
gccgctgctc ctgctccggc tgctgccgct cctgcgcccg ctgccgccgc ccctgctgtc 1740
tcgaacgagc ttctcgagaa agccgagact gtcgtcatgg aggtcctcgc cgccaagact 1800
ggctacgaga ctgacatgat cgagtccgac atggagctcg agactgagct cggcattgac 1860
tccatcaagc gtgtcgagat cctctccgag gttcaggcca tgctcaacgt cgaggccaag 1920
gacgtcgatg ccctcagccg cacccgcact gttggcgagg ttgtcgatgc catgaaggcc 1980
gagatcgctg gtggctctgc cccggcgcct gccgccgctg cccctgctcc ggctgccgcc 2040
gcccctgctg tctcgaacga gcttctcgag aaggccgaga ctgtcgtcat ggaggtcctc 2100
gccgccaaga ctggctacga gaccgacatg atcgagtccg acatggagct cgagaccgag 2160
ctcggcattg actccatcaa gcgtgtcgag attctctccg aggttcaggc catgctcaac 2220
gtcgaggcca aggacgtcga tgctctcagc cgcactcgca ctgttggcga ggtcgtcgat 2280
gccatgaagg ctgagatcgc cggcagctcc gccccggcgc ctgccgccgc tgctcctgct 2340
ccggctgctg ccgctcctgc gcccgctgcc gctgcccctg ctgtctcgag cgagcttctc 2400
gagaaggccg agaccgtcgt catggaggtc ctcgccgcca agactggcta cgagactgac 2460
atgattgagt ccgacatgga gctcgagact gagctcggca ttgactccat caagcgtgtc 2520
gagatcctct ccgaggttca ggccatgctc aacgtcgagg ccaaggacgt cgatgccctc 2580
agccgcaccc gcactgttgg cgaggttgtc gatgccatga aggccgagat cgctggtggc 2640
tctgccccgg cgcctgccgc cgctgcccct gctccggctg ccgccgcccc tgctgtctcg 2700
aacgagcttc ttgagaaggc cgagaccgtc gtcatggagg tcctcgccgc caagactggc 2760
tacgagaccg acatgatcga gtccgacatg gagctcgaga ccgagctcgg cattgactcc 2820
atcaagcgtg tcgagattct ctccgaggtt caggccatgc tcaacgtcga ggccaaggac 2880
gtcgacgctc tcagccgcac tcgcactgtt ggcgaggtcg tcgatgccat gaaggctgag 2940
atcgctggtg gctctgcccc ggcgcctgcc gccgctgctc ctgcctcggc tggcgccgcg 3000
cctgcg 3006
<210> 17
<211> 2133
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(2133)
<400> 17
ttt ggc gct ctc ggc ggc ttc atc tcg cag cag gcg gag cgc ttc gag 48
Phe Gly Ala Leu Gly Gly Phe Ile Ser Gln Gln Ala Glu Arg Phe Glu
1 5 10 15
ccc gcc gaa atc ctc ggc ttc acg ctc atg tgc gcc aag ttc gcc aag 96
Pro Ala Glu Ile Leu Gly Phe Thr Leu Met Cys Ala Lys Phe Ala Lys
20 25 30
gct tcc ctc tgc acg gct gtg gct ggc ggc cgc ccg gcc ttt atc ggt 144
Ala Ser Leu Cys Thr Ala Val Ala Gly Gly Arg Pro Ala Phe Ile Gly
35 40 45
gtg gcg cgc ctt gac ggc cgc ctc gga ttc act tcg cag ggc act tct 192
Val Ala Arg Leu Asp Gly Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser
50 55 60
gac gcg ctc aag cgt gcc cag cgt ggt gcc atc ttt ggc ctc tgc aag 240
Asp Ala Leu Lys Arg Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys
65 70 75 80
acc atc ggc ctc gag tgg tcc gag tct gac gtc ttt tcc cgc ggc gtg 288
Thr Ile Gly Leu Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val
85 90 95
gac att gct cag ggc atg cac ccc gag gat gcc gcc gtg gcg att gtg 336
Asp Ile Ala Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val
100 105 110
cgc gag atg gcg tgc gct gac att cgc att cgc gag gtc ggc att ggc 384
Arg Glu Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly
115 120 125
gca aac cag cag cgc tgc acg atc cgt gcc gcc aag ctc gag acc ggc 432
Ala Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
130 135 140
aac ccg cag cgc cag atc gcc aag gac gac gtg ctg ctc gtt tct ggc 480
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser Gly
145 150 155 160
ggc gct cgc ggc atc acg cct ctt tgc atc cgg gag atc acg cgc cag 528
Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr Arg Gln
165 170 175
atc gcg ggc ggc aag tac att ctg ctt ggc cgc agc aag gtc tct gcg 576
Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys Val Ser Ala
180 185 190
agc gaa ccg gca tgg tgc gct ggc atc act gac gag aag gct gtg caa 624
Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu Lys Ala Val Gln
195 200 205
aag gct gct acc cag gag ctc aag cgc gcc ttt agc gct ggc gag ggc 672
Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe Ser Ala Gly Glu Gly
210 215 220
ccc aag ccc acg ccc cgc gct gtc act aag ctt gtg ggc tct gtt ctt 720
Pro Lys Pro Thr Pro Arg Ala Val Thr Lys Leu Val Gly Ser Val Leu
225 230 235 240
ggc gct cgc gag gtg cgc agc tct att gct gcg att gaa gcg ctc ggc 768
Gly Ala Arg Glu Val Arg Ser Ser Ile Ala Ala Ile Glu Ala Leu Gly
245 250 255
ggc aag gcc atc tac tcg tcg tgc gac gtg aac tct gcc gcc gac gtg 816
Gly Lys Ala Ile Tyr Ser Ser Cys Asp Val Asn Ser Ala Ala Asp Val
260 265 270
gcc aag gcc gtg cgc gat gcc gag tcc cag ctc ggt gcc cgc gtc tcg 864
Ala Lys Ala Val Arg Asp Ala Glu Ser Gln Leu Gly Ala Arg Val Ser
275 280 285
ggc atc gtt cat gcc tcg ggc gtg ctc cgc gac cgt ctc atc gag aag 912
Gly Ile Val His Ala Ser Gly Val Leu Arg Asp Arg Leu Ile Glu Lys
290 295 300
aag ctc ccc gac gag ttc gac gcc gtc ttt ggc acc aag gtc acc ggt 960
Lys Leu Pro Asp Glu Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly
305 310 315 320
ctc gag aac ctc ctc gcc gcc gtc gac cgc gcc aac ctc aag cac atg 1008
Leu Glu Asn Leu Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met
325 330 335
gtc ctc ttc agc tcg ctc gcc ggc ttc cac ggc aac gtc ggc cag tct 1056
Val Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser
340 345 350
gac tac gcc atg gcc aac gag gcc ctt aac aag atg ggc ctc gag ctc 1104
Asp Tyr Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu
355 360 365
gcc aag gac gtc tcg gtc aag tcg atc tgc ttc ggt ccc tgg gac ggt 1152
Ala Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
370 375 380
ggc atg gtg acg ccg cag ctc aag aag cag ttc cag gag atg ggc gtg 1200
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly Val
385 390 395 400
cag atc atc ccc cgc gag ggc ggc gct gat acc gtg gcg cgc atc gtg 1248
Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg Ile Val
405 410 415
ctc ggc tcc tcg ccg gct gag atc ctt gtc ggc aac tgg cgc acc ccg 1296
Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp Arg Thr Pro
420 425 430
tcc aag aag gtc ggc tcg gac acc atc acc ctg cac cgc aag att tcc 1344
Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His Arg Lys Ile Ser
435 440 445
gcc aag tcc aac ccc ttc ctc gag gac cac gtc atc cag ggc cgc cgc 1392
Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val Ile Gln Gly Arg Arg
450 455 460
gtg ctg ccc atg acg ctg gcc att ggc tcg ctc gcg gag acc tgc ctc 1440
Val Leu Pro Met Thr Leu Ala Ile Gly Ser Leu Ala Glu Thr Cys Leu
465 470 475 480
ggc ctc ttc ccc ggc tac tcg ctc tgg gcc att gac gac gcc cag ctc 1488
Gly Leu Phe Pro Gly Tyr Ser Leu Trp Ala Ile Asp Asp Ala Gln Leu
485 490 495
ttc aag ggt gtc act gtc gac ggc gac gtc aac tgc gag gtg acc ctc 1536
Phe Lys Gly Val Thr Val Asp Gly Asp Val Asn Cys Glu Val Thr Leu
500 505 510
acc ccg tcg acg gcg ccc tcg ggc cgc gtc aac gtc cag gcc acg ctc 1584
Thr Pro Ser Thr Ala Pro Ser Gly Arg Val Asn Val Gln Ala Thr Leu
515 520 525
aag acc ttt tcc agc ggc aag ctg gtc ccg gcc tac cgc gcc gtc atc 1632
Lys Thr Phe Ser Ser Gly Lys Leu Val Pro Ala Tyr Arg Ala Val Ile
530 535 540
gtg ctc tcc aac cag ggc gcg ccc ccg gcc aac gcc acc atg cag ccg 1680
Val Leu Ser Asn Gln Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro
545 550 555 560
ccc tcg ctc gat gcc gat ccg gcg ctc cag ggc tcc gtc tac gac ggc 1728
Pro Ser Leu Asp Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly
565 570 575
aag acc ctc ttc cac ggc ccg gcc ttc cgc ggc atc gat gac gtg ctc 1776
Lys Thr Leu Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu
580 585 590
tcg tgc acc aag agc cag ctt gtg gcc aag tgc agc gct gtc ccc ggc 1824
Ser Cys Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly
595 600 605
tcc gac gcc gct cgc ggc gag ttt gcc acg gac act gac gcc cat gac 1872
Ser Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
610 615 620
ccc ttc gtg aac gac ctg gcc ttt cag gcc atg ctc gtc tgg gtg cgc 1920
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val Arg
625 630 635 640
cgc acg ctc ggc cag gct gcg ctc ccc aac tcg atc cag cgc atc gtc 1968
Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg Ile Val
645 650 655
cag cac cgc ccg gtc ccg cag gac aag ccc ttc tac att acc ctc cgc 2016
Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile Thr Leu Arg
660 665 670
tcc aac cag tcg ggc ggt cac tcc cag cac aag cac gcc ctt cag ttc 2064
Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His Ala Leu Gln Phe
675 680 685
cac aac gag cag ggc gat ctc ttc att gat gtc cag gct tcg gtc atc 2112
His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val Gln Ala Ser Val Ile
690 695 700
gcc acg gac agc ctt gcc ttc 2133
Ala Thr Asp Ser Leu Ala Phe
705 710
<210> 18
<211> 711
<212> PRT
<213> Schizochytrium sp.
<400> 18
Phe Gly Ala Leu Gly Gly Phe Ile Ser Gln Gln Ala Glu Arg Phe Glu
1 5 10 15
Pro Ala Glu Ile Leu Gly Phe Thr Leu Met Cys Ala Lys Phe Ala Lys
20 25 30
Ala Ser Leu Cys Thr Ala Val Ala Gly Gly Arg Pro Ala Phe Ile Gly
35 40 45
Val Ala Arg Leu Asp Gly Arg Leu Gly Phe Thr Ser Gln Gly Thr Ser
50 55 60
Asp Ala Leu Lys Arg Ala Gln Arg Gly Ala Ile Phe Gly Leu Cys Lys
65 70 75 80
Thr Ile Gly Leu Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val
85 90 95
Asp Ile Ala Gln Gly Met His Pro Glu Asp Ala Ala Val Ala Ile Val
100 105 110
Arg Glu Met Ala Cys Ala Asp Ile Arg Ile Arg Glu Val Gly Ile Gly
115 120 125
Ala Asn Gln Gln Arg Cys Thr Ile Arg Ala Ala Lys Leu Glu Thr Gly
130 135 140
Asn Pro Gln Arg Gln Ile Ala Lys Asp Asp Val Leu Leu Val Ser Gly
145 150 155 160
Gly Ala Arg Gly Ile Thr Pro Leu Cys Ile Arg Glu Ile Thr Arg Gln
165 170 175
Ile Ala Gly Gly Lys Tyr Ile Leu Leu Gly Arg Ser Lys Val Ser Ala
180 185 190
Ser Glu Pro Ala Trp Cys Ala Gly Ile Thr Asp Glu Lys Ala Val Gln
195 200 205
Lys Ala Ala Thr Gln Glu Leu Lys Arg Ala Phe Ser Ala Gly Glu Gly
210 215 220
Pro Lys Pro Thr Pro Arg Ala Val Thr Lys Leu Val Gly Ser Val Leu
225 230 235 240
Gly Ala Arg Glu Val Arg Ser Ser Ile Ala Ala Ile Glu Ala Leu Gly
245 250 255
Gly Lys Ala Ile Tyr Ser Ser Cys Asp Val Asn Ser Ala Ala Asp Val
260 265 270
Ala Lys Ala Val Arg Asp Ala Glu Ser Gln Leu Gly Ala Arg Val Ser
275 280 285
Gly Ile Val His Ala Ser Gly Val Leu Arg Asp Arg Leu Ile Glu Lys
290 295 300
Lys Leu Pro Asp Glu Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly
305 310 315 320
Leu Glu Asn Leu Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met
325 330 335
Val Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gln Ser
340 345 350
Asp Tyr Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu
355 360 365
Ala Lys Asp Val Ser Val Lys Ser Ile Cys Phe Gly Pro Trp Asp Gly
370 375 380
Gly Met Val Thr Pro Gln Leu Lys Lys Gln Phe Gln Glu Met Gly Val
385 390 395 400
Gln Ile Ile Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg Ile Val
405 410 415
Leu Gly Ser Ser Pro Ala Glu Ile Leu Val Gly Asn Trp Arg Thr Pro
420 425 430
Ser Lys Lys Val Gly Ser Asp Thr Ile Thr Leu His Arg Lys Ile Ser
435 440 445
Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val Ile Gln Gly Arg Arg
450 455 460
Val Leu Pro Met Thr Leu Ala Ile Gly Ser Leu Ala Glu Thr Cys Leu
465 470 475 480
Gly Leu Phe Pro Gly Tyr Ser Leu Trp Ala Ile Asp Asp Ala Gln Leu
485 490 495
Phe Lys Gly Val Thr Val Asp Gly Asp Val Asn Cys Glu Val Thr Leu
500 505 510
Thr Pro Ser Thr Ala Pro Ser Gly Arg Val Asn Val Gln Ala Thr Leu
515 520 525
Lys Thr Phe Ser Ser Gly Lys Leu Val Pro Ala Tyr Arg Ala Val Ile
530 535 540
Val Leu Ser Asn Gln Gly Ala Pro Pro Ala Asn Ala Thr Met Gln Pro
545 550 555 560
Pro Ser Leu Asp Ala Asp Pro Ala Leu Gln Gly Ser Val Tyr Asp Gly
565 570 575
Lys Thr Leu Phe His Gly Pro Ala Phe Arg Gly Ile Asp Asp Val Leu
580 585 590
Ser Cys Thr Lys Ser Gln Leu Val Ala Lys Cys Ser Ala Val Pro Gly
595 600 605
Ser Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp
610 615 620
Pro Phe Val Asn Asp Leu Ala Phe Gln Ala Met Leu Val Trp Val Arg
625 630 635 640
Arg Thr Leu Gly Gln Ala Ala Leu Pro Asn Ser Ile Gln Arg Ile Val
645 650 655
Gln His Arg Pro Val Pro Gln Asp Lys Pro Phe Tyr Ile Thr Leu Arg
660 665 670
Ser Asn Gln Ser Gly Gly His Ser Gln His Lys His Ala Leu Gln Phe
675 680 685
His Asn Glu Gln Gly Asp Leu Phe Ile Asp Val Gln Ala Ser Val Ile
690 695 700
Ala Thr Asp Ser Leu Ala Phe
705 710
<210> 19
<211> 1350
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1350)
<400> 19
atg gcc gct cgg aat gtg agc gcc gcg cat gag atg cac gat gaa aag 48
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1 5 10 15
cgc atc gcc gtc gtc ggc atg gcc gtc cag tac gcc gga tgc aaa acc 96
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
20 25 30
aag gac gag ttc tgg gag gtg ctc atg aac ggc aag gtc gag tcc aag 144
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
35 40 45
gtg atc agc gac aaa cga ctc ggc tcc aac tac cgc gcc gag cac tac 192
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
50 55 60
aaa gca gag cgc agc aag tat gcc gac acc ttt tgc aac gaa acg tac 240
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65 70 75 80
ggc acc ctt gac gag aac gag atc gac aac gag cac gaa ctc ctc ctc 288
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
85 90 95
aac ctc gcc aag cag gca ctc gca gag aca tcc gtc aaa gac tcg aca 336
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
100 105 110
cgc tgc ggc atc gtc agc ggc tgc ctc tcg ttc ccc atg gac aac ctc 384
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
115 120 125
cag ggt gaa ctc ctc aac gtg tac caa aac cat gtc gag aaa aag ctc 432
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
130 135 140
ggg gcc cgc gtc ttc aag gac gcc tcc cat tgg tcc gaa cgc gag cag 480
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145 150 155 160
tcc aac aaa ccc gag gcc ggt gac cgc cgc atc ttc atg gac ccg gcc 528
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
165 170 175
tcc ttc gtc gcc gaa gaa ctc aac ctc ggc gcc ctt cac tac tcc gtc 576
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
180 185 190
gac gca gca tgc gcc acg gcg ctc tac gtg ctc cgc ctc gcg cag gat 624
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
195 200 205
cat ctc gtc tcc ggc gcc gcc gac gtc atg ctc tgc ggt gcc acc tgc 672
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
210 215 220
ctg ccg gag ccc ttt ttc atc ctt tcg ggc ttt tcc acc ttc cag gcc 720
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225 230 235 240
atg ccc gtc ggc acg ggc cag aac gtg tcc atg ccg ctg cac aag gac 768
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
245 250 255
agc cag ggc ctc acc ccg ggt gag ggc ggc tcc atc atg gtc ctc aag 816
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
260 265 270
cgt ctc gat gat gcc atc cgc gac ggc gac cac atc tac ggc acc ctt 864
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
275 280 285
ctc ggc gcc aat gtc agc aac tcc ggc aca ggt ctg ccc ctc aag ccc 912
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
290 295 300
ctt ctc ccc agc gag aaa aag tgc ctc atg gac acc tac acg cgc att 960
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305 310 315 320
aac gtg cac ccg cac aag att cag tac gtc gag tgc cac gcc acc ggc 1008
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
325 330 335
acg ccc cag ggt gat cgt gtg gaa atc gac gcc gtc aag gcc tgc ttt 1056
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
340 345 350
gaa ggc aag gtc ccc cgt ttc ggt acc aca aag ggc aac ttt gga cac 1104
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
355 360 365
acc ctc gtc gca gcc ggc ttt gcc ggt atg tgc aag gtc ctc ctc tcc 1152
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
370 375 380
atg aag cat ggc atc atc ccg ccc acc ccg ggt atc gat gac gag acc 1200
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385 390 395 400
aag atg gac cct ctc gtc gtc tcc ggt gag gcc atc cca tgg cca gag 1248
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
405 410 415
acc aac ggc gag ccc aag cgc gcc ggt ctc tcg gcc ttt ggc ttt ggt 1296
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
420 425 430
ggc acc aac gcc cat gcc gtc ttt gag gag cat gac ccc tcc aac gcc 1344
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
435 440 445
gcc tgc 1350
Ala Cys
450
<210> 20
<211> 450
<212> PRT
<213> Schizochytrium sp.
<400> 20
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys
1 5 10 15
Arg Ile Ala Val Val Gly Met Ala Val Gln Tyr Ala Gly Cys Lys Thr
20 25 30
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys
35 40 45
Val Ile Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr
50 55 60
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr
65 70 75 80
Gly Thr Leu Asp Glu Asn Glu Ile Asp Asn Glu His Glu Leu Leu Leu
85 90 95
Asn Leu Ala Lys Gln Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr
100 105 110
Arg Cys Gly Ile Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu
115 120 125
Gln Gly Glu Leu Leu Asn Val Tyr Gln Asn His Val Glu Lys Lys Leu
130 135 140
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gln
145 150 155 160
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg Ile Phe Met Asp Pro Ala
165 170 175
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val
180 185 190
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gln Asp
195 200 205
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys
210 215 220
Leu Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe Ser Thr Phe Gln Ala
225 230 235 240
Met Pro Val Gly Thr Gly Gln Asn Val Ser Met Pro Leu His Lys Asp
245 250 255
Ser Gln Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile Met Val Leu Lys
260 265 270
Arg Leu Asp Asp Ala Ile Arg Asp Gly Asp His Ile Tyr Gly Thr Leu
275 280 285
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro
290 295 300
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg Ile
305 310 315 320
Asn Val His Pro His Lys Ile Gln Tyr Val Glu Cys His Ala Thr Gly
325 330 335
Thr Pro Gln Gly Asp Arg Val Glu Ile Asp Ala Val Lys Ala Cys Phe
340 345 350
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His
355 360 365
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser
370 375 380
Met Lys His Gly Ile Ile Pro Pro Thr Pro Gly Ile Asp Asp Glu Thr
385 390 395 400
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala Ile Pro Trp Pro Glu
405 410 415
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly
420 425 430
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala
435 440 445
Ala Cys
450
<210> 21
<211> 1323
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1323)
<400> 21
tcg gcc cgc tgc ggc ggt gaa agc aac atg cgc atc gcc atc act ggt 48
Ser Ala Arg Cys Gly Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly
1 5 10 15
atg gac gcc acc ttt ggc gct ctc aag gga ctc gac gcc ttc gag cgc 96
Met Asp Ala Thr Phe Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg
20 25 30
gcc att tac acc ggc gct cac ggt gcc atc cca ctc cca gaa aag cgc 144
Ala Ile Tyr Thr Gly Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg
35 40 45
tgg cgc ttt ctc ggc aag gac aag gac ttt ctt gac ctc tgc ggc gtc 192
Trp Arg Phe Leu Gly Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val
50 55 60
aag gcc acc ccg cac ggc tgc tac att gaa gat gtt gag gtc gac ttc 240
Lys Ala Thr Pro His Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe
65 70 75 80
cag cgc ctc cgc acg ccc atg acc cct gaa gac atg ctc ctc cct cag 288
Gln Arg Leu Arg Thr Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln
85 90 95
cag ctt ctg gcc gtc acc acc att gac cgc gcc atc ctc gac tcg gga 336
Gln Leu Leu Ala Val Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly
100 105 110
atg aaa aag ggt ggc aat gtc gcc gtc ttt gtc ggc ctc ggc acc gac 384
Met Lys Lys Gly Gly Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp
115 120 125
ctc gag ctc tac cgt cac cgt gct cgc gtc gct ctc aag gag cgc gtc 432
Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala Leu Lys Glu Arg Val
130 135 140
cgc cct gaa gcc tcc aag aag ctc aat gac atg atg cag tac att aac 480
Arg Pro Glu Ala Ser Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn
145 150 155 160
gac tgc ggc aca tcc aca tcg tac acc tcg tac att ggc aac ctc gtc 528
Asp Cys Gly Thr Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val
165 170 175
gcc acg cgc gtc tcg tcg cag tgg ggc ttc acg ggc ccc tcc ttt acg 576
Ala Thr Arg Val Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr
180 185 190
atc acc gag ggc aac aac tcc gtc tac cgc tgc gcc gag ctc ggc aag 624
Ile Thr Glu Gly Asn Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys
195 200 205
tac ctc ctc gag acc ggc gag gtc gat ggc gtc gtc gtt gcg ggt gtc 672
Tyr Leu Leu Glu Thr Gly Glu Val Asp Gly Val Val Val Ala Gly Val
210 215 220
gat ctc tgc ggc agt gcc gaa aac ctt tac gtc aag tct cgc cgc ttc 720
Asp Leu Cys Gly Ser Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe
225 230 235 240
aag gtg tcc acc tcc gat acc ccg cgc gcc agc ttt gac gcc gcc gcc 768
Lys Val Ser Thr Ser Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala
245 250 255
gat ggc tac ttt gtc ggc gag ggc tgc ggt gcc ttt gtg ctc aag cgt 816
Asp Gly Tyr Phe Val Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg
260 265 270
gag act agc tgc acc aag gac gac cgt atc tac gct tgc atg gat gcc 864
Glu Thr Ser Cys Thr Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala
275 280 285
atc gtc cct ggc aac gtc cct agc gcc tgc ttg cgc gag gcc ctc gac 912
Ile Val Pro Gly Asn Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp
290 295 300
cag gcg cgc gtc aag ccg ggc gat atc gag atg ctc gag ctc agc gcc 960
Gln Ala Arg Val Lys Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala
305 310 315 320
gac tcc gcc cgc cac ctc aag gac ccg tcc gtc ctg ccc aag gag ctc 1008
Asp Ser Ala Arg His Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu
325 330 335
act gcc gag gag gaa atc ggc ggc ctt cag acg atc ctt cgt gac gat 1056
Thr Ala Glu Glu Glu Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp
340 345 350
gac aag ctc ccg cgc aac gtc gca acg ggc agt gtc aag gcc acc gtc 1104
Asp Lys Leu Pro Arg Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val
355 360 365
ggt gac acc ggt tat gcc tct ggt gct gcc agc ctc atc aag gct gcg 1152
Gly Asp Thr Gly Tyr Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala
370 375 380
ctt tgc atc tac aac cgc tac ctg ccc agc aac ggc gac gac tgg gat 1200
Leu Cys Ile Tyr Asn Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp
385 390 395 400
gaa ccc gcc cct gag gcg ccc tgg gac agc acc ctc ttt gcg tgc cag 1248
Glu Pro Ala Pro Glu Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln
405 410 415
acc tcg cgc gct tgg ctc aag aac cct ggc gag cgt cgc tat gcg gcc 1296
Thr Ser Arg Ala Trp Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala
420 425 430
gtc tcg ggc gtc tcc gag acg cgc tcg 1323
Val Ser Gly Val Ser Glu Thr Arg Ser
435 440
<210> 22
<211> 441
<212> PRT
<213> Schizochytrium sp.
<400> 22
Ser Ala Arg Cys Gly Gly Glu Ser Asn Met Arg Ile Ala Ile Thr Gly
1 5 10 15
Met Asp Ala Thr Phe Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg
20 25 30
Ala Ile Tyr Thr Gly Ala His Gly Ala Ile Pro Leu Pro Glu Lys Arg
35 40 45
Trp Arg Phe Leu Gly Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val
50 55 60
Lys Ala Thr Pro His Gly Cys Tyr Ile Glu Asp Val Glu Val Asp Phe
65 70 75 80
Gln Arg Leu Arg Thr Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gln
85 90 95
Gln Leu Leu Ala Val Thr Thr Ile Asp Arg Ala Ile Leu Asp Ser Gly
100 105 110
Met Lys Lys Gly Gly Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp
115 120 125
Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala Leu Lys Glu Arg Val
130 135 140
Arg Pro Glu Ala Ser Lys Lys Leu Asn Asp Met Met Gln Tyr Ile Asn
145 150 155 160
Asp Cys Gly Thr Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val
165 170 175
Ala Thr Arg Val Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr
180 185 190
Ile Thr Glu Gly Asn Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys
195 200 205
Tyr Leu Leu Glu Thr Gly Glu Val Asp Gly Val Val Val Ala Gly Val
210 215 220
Asp Leu Cys Gly Ser Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe
225 230 235 240
Lys Val Ser Thr Ser Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala
245 250 255
Asp Gly Tyr Phe Val Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg
260 265 270
Glu Thr Ser Cys Thr Lys Asp Asp Arg Ile Tyr Ala Cys Met Asp Ala
275 280 285
Ile Val Pro Gly Asn Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp
290 295 300
Gln Ala Arg Val Lys Pro Gly Asp Ile Glu Met Leu Glu Leu Ser Ala
305 310 315 320
Asp Ser Ala Arg His Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu
325 330 335
Thr Ala Glu Glu Glu Ile Gly Gly Leu Gln Thr Ile Leu Arg Asp Asp
340 345 350
Asp Lys Leu Pro Arg Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val
355 360 365
Gly Asp Thr Gly Tyr Ala Ser Gly Ala Ala Ser Leu Ile Lys Ala Ala
370 375 380
Leu Cys Ile Tyr Asn Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp
385 390 395 400
Glu Pro Ala Pro Glu Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gln
405 410 415
Thr Ser Arg Ala Trp Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala
420 425 430
Val Ser Gly Val Ser Glu Thr Arg Ser
435 440
<210> 23
<211> 1500
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 23
tgc tat tcc gtg ctc ctc tcc gaa gcc gag ggc cac tac gag cgc gag 48
Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His Tyr Glu Arg Glu
1 5 10 15
aac cgc atc tcg ctc gac gag gag gcg ccc aag ctc att gtg ctt cgc 96
Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu Ile Val Leu Arg
20 25 30
gcc gac tcc cac gag gag atc ctt ggt cgc ctc gac aag atc cgc gag 144
Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp Lys Ile Arg Glu
35 40 45
cgc ttc ttg cag ccc acg ggc gcc gcc ccg cgc gag tcc gag ctc aag 192
Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu Ser Glu Leu Lys
50 55 60
gcg cag gcc cgc cgc atc ttc ctc gag ctc ctc ggc gag acc ctt gcc 240
Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly Glu Thr Leu Ala
65 70 75 80
cag gat gcc gct tct tca ggc tcg caa aag ccc ctc gct ctc agc ctc 288
Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu Ala Leu Ser Leu
85 90 95
gtc tcc acg ccc tcc aag ctc cag cgc gag gtc gag ctc gcg gcc aag 336
Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu Leu Ala Ala Lys
100 105 110
ggt atc ccg cgc tgc ctc aag atg cgc cgc gat tgg agc tcc cct gct 384
Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp Trp Ser Ser Pro Ala
115 120 125
ggc agc cgc tac gcg cct gag ccg ctc gcc agc gac cgc gtc gcc ttc 432
Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala Ser Asp Arg Val Ala Phe
130 135 140
atg tac ggc gaa ggt cgc agc cct tac tac ggc atc acc caa gac att 480
Met Tyr Gly Glu Gly Arg Ser Pro Tyr Tyr Gly Ile Thr Gln Asp Ile
145 150 155 160
cac cgc att tgg ccc gaa ctc cac gag gtc atc aac gaa aag acg aac 528
His Arg Ile Trp Pro Glu Leu His Glu Val Ile Asn Glu Lys Thr Asn
165 170 175
cgt ctc tgg gcc gaa ggc gac cgc tgg gtc atg ccg cgc gcc agc ttc 576
Arg Leu Trp Ala Glu Gly Asp Arg Trp Val Met Pro Arg Ala Ser Phe
180 185 190
aag tcg gag ctc gag agc cag cag caa gag ttt gat cgc aac atg att 624
Lys Ser Glu Leu Glu Ser Gln Gln Gln Glu Phe Asp Arg Asn Met Ile
195 200 205
gaa atg ttc cgt ctt gga atc ctc acc tca att gcc ttc acc aat ctg 672
Glu Met Phe Arg Leu Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu
210 215 220
gcg cgc gac gtt ctc aac atc acg ccc aag gcc gcc ttt ggc ctc agt 720
Ala Arg Asp Val Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser
225 230 235 240
ctt ggc gag att tcc atg att ttt gcc ttt tcc aag aag aac ggt ctc 768
Leu Gly Glu Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu
245 250 255
atc tcc gac cag ctc acc aag gat ctt cgc gag tcc gac gtg tgg aac 816
Ile Ser Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn
260 265 270
aag gct ctg gcc gtt gaa ttt aat gcg ctg cgc gag gcc tgg ggc att 864
Lys Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
275 280 285
cca cag agt gtc ccc aag gac gag ttc tgg caa ggc tac att gtg cgc 912
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val Arg
290 295 300
ggc acc aag cag gat atc gag gcg gcc atc gcc ccg gac agc aag tac 960
Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser Lys Tyr
305 310 315 320
gtg cgc ctc acc atc atc aat gat gcc aac acc gcc ctc att agc ggc 1008
Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu Ile Ser Gly
325 330 335
aag ccc gac gcc tgc aag gct gcg atc gcg cgt ctc ggt ggc aac att 1056
Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu Gly Gly Asn Ile
340 345 350
cct gcg ctt ccc gtg acc cag ggc atg tgc ggc cac tgc ccc gag gtg 1104
Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly His Cys Pro Glu Val
355 360 365
gga cct tat acc aag gat atc gcc aag atc cat gcc aac ctt gag ttc 1152
Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile His Ala Asn Leu Glu Phe
370 375 380
ccc gtt gtc gac ggc ctt gac ctc tgg acc aca atc aac cag aag cgc 1200
Pro Val Val Asp Gly Leu Asp Leu Trp Thr Thr Ile Asn Gln Lys Arg
385 390 395 400
ctc gtg cca cgc gcc acg ggc gcc aag gac gaa tgg gcc cct tct tcc 1248
Leu Val Pro Arg Ala Thr Gly Ala Lys Asp Glu Trp Ala Pro Ser Ser
405 410 415
ttt ggc gag tac gcc ggc cag ctc tac gag aag cag gct aac ttc ccc 1296
Phe Gly Glu Tyr Ala Gly Gln Leu Tyr Glu Lys Gln Ala Asn Phe Pro
420 425 430
caa atc gtc gag acc att tac aag caa aac tac gac gtc ttt gtc gag 1344
Gln Ile Val Glu Thr Ile Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu
435 440 445
gtt ggg ccc aac aac cac cgt agc acc gca gtg cgc acc acg ctt ggt 1392
Val Gly Pro Asn Asn His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly
450 455 460
ccc cag cgc aac cac ctt gct ggc gcc atc gac aag cag aac gag gat 1440
Pro Gln Arg Asn His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp
465 470 475 480
gct tgg acg acc atc gtc aag ctt gtg gct tcg ctc aag gcc cac ctt 1488
Ala Trp Thr Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu
485 490 495
gtt cct ggc gtc 1500
Val Pro Gly Val
500
<210> 24
<211> 500
<212> PRT
<213> Schizochytrium sp.
<400> 24
Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His Tyr Glu Arg Glu
1 5 10 15
Asn Arg Ile Ser Leu Asp Glu Glu Ala Pro Lys Leu Ile Val Leu Arg
20 25 30
Ala Asp Ser His Glu Glu Ile Leu Gly Arg Leu Asp Lys Ile Arg Glu
35 40 45
Arg Phe Leu Gln Pro Thr Gly Ala Ala Pro Arg Glu Ser Glu Leu Lys
50 55 60
Ala Gln Ala Arg Arg Ile Phe Leu Glu Leu Leu Gly Glu Thr Leu Ala
65 70 75 80
Gln Asp Ala Ala Ser Ser Gly Ser Gln Lys Pro Leu Ala Leu Ser Leu
85 90 95
Val Ser Thr Pro Ser Lys Leu Gln Arg Glu Val Glu Leu Ala Ala Lys
100 105 110
Gly Ile Pro Arg Cys Leu Lys Met Arg Arg Asp Trp Ser Ser Pro Ala
115 120 125
Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala Ser Asp Arg Val Ala Phe
130 135 140
Met Tyr Gly Glu Gly Arg Ser Pro Tyr Tyr Gly Ile Thr Gln Asp Ile
145 150 155 160
His Arg Ile Trp Pro Glu Leu His Glu Val Ile Asn Glu Lys Thr Asn
165 170 175
Arg Leu Trp Ala Glu Gly Asp Arg Trp Val Met Pro Arg Ala Ser Phe
180 185 190
Lys Ser Glu Leu Glu Ser Gln Gln Gln Glu Phe Asp Arg Asn Met Ile
195 200 205
Glu Met Phe Arg Leu Gly Ile Leu Thr Ser Ile Ala Phe Thr Asn Leu
210 215 220
Ala Arg Asp Val Leu Asn Ile Thr Pro Lys Ala Ala Phe Gly Leu Ser
225 230 235 240
Leu Gly Glu Ile Ser Met Ile Phe Ala Phe Ser Lys Lys Asn Gly Leu
245 250 255
Ile Ser Asp Gln Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn
260 265 270
Lys Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly Ile
275 280 285
Pro Gln Ser Val Pro Lys Asp Glu Phe Trp Gln Gly Tyr Ile Val Arg
290 295 300
Gly Thr Lys Gln Asp Ile Glu Ala Ala Ile Ala Pro Asp Ser Lys Tyr
305 310 315 320
Val Arg Leu Thr Ile Ile Asn Asp Ala Asn Thr Ala Leu Ile Ser Gly
325 330 335
Lys Pro Asp Ala Cys Lys Ala Ala Ile Ala Arg Leu Gly Gly Asn Ile
340 345 350
Pro Ala Leu Pro Val Thr Gln Gly Met Cys Gly His Cys Pro Glu Val
355 360 365
Gly Pro Tyr Thr Lys Asp Ile Ala Lys Ile His Ala Asn Leu Glu Phe
370 375 380
Pro Val Val Asp Gly Leu Asp Leu Trp Thr Thr Ile Asn Gln Lys Arg
385 390 395 400
Leu Val Pro Arg Ala Thr Gly Ala Lys Asp Glu Trp Ala Pro Ser Ser
405 410 415
Phe Gly Glu Tyr Ala Gly Gln Leu Tyr Glu Lys Gln Ala Asn Phe Pro
420 425 430
Gln Ile Val Glu Thr Ile Tyr Lys Gln Asn Tyr Asp Val Phe Val Glu
435 440 445
Val Gly Pro Asn Asn His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly
450 455 460
Pro Gln Arg Asn His Leu Ala Gly Ala Ile Asp Lys Gln Asn Glu Asp
465 470 475 480
Ala Trp Thr Thr Ile Val Lys Leu Val Ala Ser Leu Lys Ala His Leu
485 490 495
Val Pro Gly Val
500
<210> 25
<211> 1530
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1530)
<400> 25
ctg ctc gat ctc gac agt atg ctt gcg ctg agc tct gcc agt gcc tcc 48
Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser Ala Ser
1 5 10 15
ggc aac ctt gtt gag act gcg cct agc gac gcc tcg gtc att gtg ccg 96
Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val Ile Val Pro
20 25 30
ccc tgc aac att gcg gat ctc ggc agc cgc gcc ttc atg aaa acg tac 144
Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe Met Lys Thr Tyr
35 40 45
ggt gtt tcg gcg cct ctg tac acg ggc gcc atg gcc aag ggc att gcc 192
Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
50 55 60
tct gcg gac ctc gtc att gcc gcc ggc cgc cag ggc atc ctt gcg tcc 240
Ser Ala Asp Leu Val Ile Ala Ala Gly Arg Gln Gly Ile Leu Ala Ser
65 70 75 80
ttt ggc gcc ggc gga ctt ccc atg cag gtt gtg cgt gag tcc atc gaa 288
Phe Gly Ala Gly Gly Leu Pro Met Gln Val Val Arg Glu Ser Ile Glu
85 90 95
aag att cag gcc gcc ctg ccc aat ggc ccg tac gct gtc aac ctt atc 336
Lys Ile Gln Ala Ala Leu Pro Asn Gly Pro Tyr Ala Val Asn Leu Ile
100 105 110
cat tct ccc ttt gac agc aac ctc gaa aag ggc aat gtc gat ctc ttc 384
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe
115 120 125
ctc gag aag ggt gtc acc ttt gtc gag gcc tcg gcc ttt atg acg ctc 432
Leu Glu Lys Gly Val Thr Phe Val Glu Ala Ser Ala Phe Met Thr Leu
130 135 140
acc ccg cag gtc gtg cgg tac cgc gcg gct ggc ctc acg cgc aac gcc 480
Thr Pro Gln Val Val Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala
145 150 155 160
gac ggc tcg gtc aac atc cgc aac cgt atc att ggc aag gtc tcg cgc 528
Asp Gly Ser Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg
165 170 175
acc gag ctc gcc gag atg ttc atg cgt cct gcg ccc gag cac ctt ctt 576
Thr Glu Leu Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu
180 185 190
cag aag ctc att gct tcc ggc gag atc aac cag gag cag gcc gag ctc 624
Gln Lys Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu
195 200 205
gcc cgc cgt gtt ccc gtc gct gac gac atc gcg gtc gaa gct gac tcg 672
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
210 215 220
ggt ggc cac acc gac aac cgc ccc atc cac gtc att ctg ccc ctc atc 720
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile
225 230 235 240
atc aac ctt cgc gac cgc ctt cac cgc gag tgc ggc tac ccg gcc aac 768
Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro Ala Asn
245 250 255
ctt cgc gtc cgt gtg ggc gcc ggc ggt ggc att ggg tgc ccc cag gcg 816
Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
260 265 270
gcg ctg gcc acc ttc aac atg ggt gcc tcc ttt att gtc acc ggc acc 864
Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile Val Thr Gly Thr
275 280 285
gtg aac cag gtc gcc aag cag tcg ggc acg tgc gac aat gtg cgc aag 912
Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys
290 295 300
cag ctc gcg aag gcc act tac tcg gac gta tgc atg gcc ccg gct gcc 960
Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val Cys Met Ala Pro Ala Ala
305 310 315 320
gac atg ttc gag gaa ggc gtc aag ctt cag gtc ctc aag aag gga acc 1008
Asp Met Phe Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr
325 330 335
atg ttt ccc tcg cgc gcc aac aag ctc tac gag ctc ttt tgc aag tac 1056
Met Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr
340 345 350
gac tcg ttc gag tcc atg ccc ccc gca gag ctt gcg cgc gtc gag aag 1104
Asp Ser Phe Glu Ser Met Pro Pro Ala Glu Leu Ala Arg Val Glu Lys
355 360 365
cgc atc ttc agc cgc gcg ctc gaa gag gtc tgg gac gag acc aaa aac 1152
Arg Ile Phe Ser Arg Ala Leu Glu Glu Val Trp Asp Glu Thr Lys Asn
370 375 380
ttt tac att aac cgt ctt cac aac ccg gag aag atc cag cgc gcc gag 1200
Phe Tyr Ile Asn Arg Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu
385 390 395 400
cgc gac ccc aag ctc aag atg tcg ctg tgc ttt cgc tgg tac ctg agc 1248
Arg Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
405 410 415
ctg gcg agc cgc tgg gcc aac act gga gct tcc gat cgc gtc atg gac 1296
Leu Ala Ser Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp
420 425 430
tac cag gtc tgg tgc ggt cct gcc att ggt tcc ttc aac gat ttc atc 1344
Tyr Gln Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile
435 440 445
aag gga act tac ctt gat ccg gcc gtc gca aac gag tac ccg tgc gtc 1392
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
450 455 460
gtt cag att aac aag cag atc ctt cgt gga gcg tgc ttc ttg cgc cgt 1440
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg Arg
465 470 475 480
ctc gaa att ctg cgc aac gca cgc ctt tcc gat ggc gct gcc gct ctt 1488
Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala Ala Leu
485 490 495
gtg gcc agc atc gat gac aca tac gtc ccg gcc gag aag ctg 1530
Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys Leu
500 505 510
<210> 26
<211> 510
<212> PRT
<213> Schizochytrium sp.
<400> 26
Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser Ala Ser
1 5 10 15
Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val Ile Val Pro
20 25 30
Pro Cys Asn Ile Ala Asp Leu Gly Ser Arg Ala Phe Met Lys Thr Tyr
35 40 45
Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
50 55 60
Ser Ala Asp Leu Val Ile Ala Ala Gly Arg Gln Gly Ile Leu Ala Ser
65 70 75 80
Phe Gly Ala Gly Gly Leu Pro Met Gln Val Val Arg Glu Ser Ile Glu
85 90 95
Lys Ile Gln Ala Ala Leu Pro Asn Gly Pro Tyr Ala Val Asn Leu Ile
100 105 110
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe
115 120 125
Leu Glu Lys Gly Val Thr Phe Val Glu Ala Ser Ala Phe Met Thr Leu
130 135 140
Thr Pro Gln Val Val Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala
145 150 155 160
Asp Gly Ser Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg
165 170 175
Thr Glu Leu Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu
180 185 190
Gln Lys Leu Ile Ala Ser Gly Glu Ile Asn Gln Glu Gln Ala Glu Leu
195 200 205
Ala Arg Arg Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
210 215 220
Gly Gly His Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile
225 230 235 240
Ile Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro Ala Asn
245 250 255
Leu Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
260 265 270
Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe Ile Val Thr Gly Thr
275 280 285
Val Asn Gln Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys
290 295 300
Gln Leu Ala Lys Ala Thr Tyr Ser Asp Val Cys Met Ala Pro Ala Ala
305 310 315 320
Asp Met Phe Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr
325 330 335
Met Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr
340 345 350
Asp Ser Phe Glu Ser Met Pro Pro Ala Glu Leu Ala Arg Val Glu Lys
355 360 365
Arg Ile Phe Ser Arg Ala Leu Glu Glu Val Trp Asp Glu Thr Lys Asn
370 375 380
Phe Tyr Ile Asn Arg Leu His Asn Pro Glu Lys Ile Gln Arg Ala Glu
385 390 395 400
Arg Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
405 410 415
Leu Ala Ser Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp
420 425 430
Tyr Gln Val Trp Cys Gly Pro Ala Ile Gly Ser Phe Asn Asp Phe Ile
435 440 445
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val
450 455 460
Val Gln Ile Asn Lys Gln Ile Leu Arg Gly Ala Cys Phe Leu Arg Arg
465 470 475 480
Leu Glu Ile Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala Ala Leu
485 490 495
Val Ala Ser Ile Asp Asp Thr Tyr Val Pro Ala Glu Lys Leu
500 505 510
<210> 27
<211> 1350
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1350)
<400> 27
atg gcg ctc cgt gtc aag acg aac aag aag cca tgc tgg gag atg acc 48
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1 5 10 15
aag gag gag ctg acc agc ggc aag acc gag gtg ttc aac tat gag gaa 96
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
20 25 30
ctc ctc gag ttc gca gag ggc gac atc gcc aag gtc ttc gga ccc gag 144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
35 40 45
ttc gcc gtc atc gac aag tac ccg cgc cgc gtg cgc ctg ccc gcc cgc 192
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
gag tac ctg ctc gtg acc cgc gtc acc ctc atg gac gcc gag gtc aac 240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65 70 75 80
aac tac cgc gtc ggc gcc cgc atg gtc acc gag tac gat ctc ccc gtc 288
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
85 90 95
aac gga gag ctc tcc gag ggc gga gac tgc ccc tgg gcc gtc ctg gtc 336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
100 105 110
gag agt ggc cag tgc gat ctc atg ctc atc tcc tac atg ggc att gac 384
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
ttc cag aac cag ggc gac cgc gtc tac cgc ctg ctc aac acc acg ctc 432
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
acc ttt tac ggc gtg gcc cac gag ggc gag acc ctc gag tac gac att 480
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145 150 155 160
cgc gtc acc ggc ttc gcc aag cgt ctc gac ggc ggc atc tcc atg ttc 528
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
165 170 175
ttc ttc gag tac gac tgc tac gtc aac ggc cgc ctc ctc atc gag atg 576
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
180 185 190
cgc gat ggc tgc gcc ggc ttc ttc acc aac gag gag ctc gac gcc ggc 624
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
195 200 205
aag ggc gtc gtc ttc acc cgc ggc gac ctc gcc gcc cgc gcc aag atc 672
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
210 215 220
cca aag cag gac gtc tcc ccc tac gcc gtc gcc ccc tgc ctc cac aag 720
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225 230 235 240
acc aag ctc aac gaa aag gag atg cag acc ctc gtc gac aag gac tgg 768
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
245 250 255
gca tcc gtc ttt ggc tcc aag aac ggc atg ccg gaa atc aac tac aaa 816
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
260 265 270
ctc tgc gcg cgt aag atg ctc atg att gac cgc gtc acc agc att gac 864
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
275 280 285
cac aag ggc ggt gtc tac ggc ctc ggt cag ctc gtc ggt gaa aag atc 912
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
290 295 300
ctc gag cgc gac cac tgg tac ttt ccc tgc cac ttt gtc aag gat cag 960
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305 310 315 320
gtc atg gcc gga tcc ctc gtc tcc gac ggc tgc agc cag atg ctc aag 1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
325 330 335
atg tac atg atc tgg ctc ggc ctc cac ctc acc acc gga ccc ttt gac 1056
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
340 345 350
ttc cgc ccg gtc aac ggc cac ccc aac aag gtc cgc tgc cgc ggc caa 1104
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
atc tcc ccg cac aag ggc aag ctc gtc tac gtc atg gag atc aag gag 1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
370 375 380
atg ggc ttc gac gag gac aac gac ccg tac gcc att gcc gac gtc aac 1200
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385 390 395 400
atc att gat gtc gac ttc gaa aag ggc cag gac ttt agc ctc gac cgc 1248
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
405 410 415
atc agc gac tac ggc aag ggc gac ctc aac aag aag atc gtc gtc gac 1296
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
420 425 430
ttt aag ggc atc gct ctc aag atg cag aag cgc tcc acc aac aag aac 1344
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
435 440 445
ccc tcc 1350
Pro Ser
450
<210> 28
<211> 450
<212> PRT
<213> Schizochytrium sp.
<400> 28
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr
1 5 10 15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu
20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ala Lys Val Phe Gly Pro Glu
35 40 45
Phe Ala Val Ile Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn
65 70 75 80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val
85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val
100 105 110
Glu Ser Gly Gln Cys Asp Leu Met Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
Phe Gln Asn Gln Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp Ile
145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly Ile Ser Met Phe
165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu Ile Glu Met
180 185 190
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly
195 200 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys Ile
210 215 220
Pro Lys Gln Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys
225 230 235 240
Thr Lys Leu Asn Glu Lys Glu Met Gln Thr Leu Val Asp Lys Asp Trp
245 250 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu Ile Asn Tyr Lys
260 265 270
Leu Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr Ser Ile Asp
275 280 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gln Leu Val Gly Glu Lys Ile
290 295 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gln
305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Met Leu Lys
325 330 335
Met Tyr Met Ile Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp
340 345 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Glu
370 375 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala Ile Ala Asp Val Asn
385 390 395 400
Ile Ile Asp Val Asp Phe Glu Lys Gly Gln Asp Phe Ser Leu Asp Arg
405 410 415
Ile Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys Ile Val Val Asp
420 425 430
Phe Lys Gly Ile Ala Leu Lys Met Gln Lys Arg Ser Thr Asn Lys Asn
435 440 445
Pro Ser
450
<210> 29
<211> 1497
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1497)
<400> 29
aag gtt cag ccc gtc ttt gcc aac ggc gcc gcc act gtc ggc ccc gag 48
Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly Pro Glu
1 5 10 15
gcc tcc aag gct tcc tcc ggc gcc agc gcc agc gcc agc gcc gcc ccg 96
Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala Ala Pro
20 25 30
gcc aag cct gcc ttc agc gcc gat gtt ctt gcg ccc aag ccc gtt gcc 144
Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro Val Ala
35 40 45
ctt ccc gag cac atc ctc aag ggc gac gcc ctc gcc ccc aag gag atg 192
Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys Glu Met
50 55 60
tcc tgg cac ccc atg gcc cgc atc ccg ggc aac ccg acg ccc tct ttt 240
Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro Ser Phe
65 70 75 80
gcg ccc tcg gcc tac aag ccg cgc aac atc gcc ttt acg ccc ttc ccc 288
Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro Phe Pro
85 90 95
ggc aac ccc aac gat aac gac cac acc ccg ggc aag atg ccg ctc acc 336
Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro Leu Thr
100 105 110
tgg ttc aac atg gcc gag ttc atg gcc ggc aag gtc agc atg tgc ctc 384
Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met Cys Leu
115 120 125
ggc ccc gag ttc gcc aag ttc gac gac tcg aac acc agc cgc agc ccc 432
Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg Ser Pro
130 135 140
gct tgg gac ctc gct ctc gtc acc cgc gcc gtg tct gtg tct gac ctc 480
Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser Asp Leu
145 150 155 160
aag cac gtc aac tac cgc aac atc gac ctc gac ccc tcc aag ggt acc 528
Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys Gly Thr
165 170 175
atg gtc ggc gag ttc gac tgc ccc gcg gac gcc tgg ttc tac aag ggc 576
Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr Lys Gly
180 185 190
gcc tgc aac gat gcc cac atg ccg tac tcg atc ctc atg gag atc gcc 624
Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu Ile Ala
195 200 205
ctc cag acc tcg ggt gtg ctc acc tcg gtg ctc aag gcg ccc ctg acc 672
Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro Leu Thr
210 215 220
atg gag aag gac gac atc ctc ttc cgc aac ctc gac gcc aac gcc gag 720
Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn Ala Glu
225 230 235 240
ttc gtg cgc gcc gac ctc gac tac cgc ggc aag act atc cgc aac gtc 768
Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg Asn Val
245 250 255
acc aag tgc act ggc tac agc atg ctc ggc gag atg ggc gtc cac cgc 816
Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val His Arg
260 265 270
ttc acc ttt gag ctc tac gtc gat gat gtg ctc ttt tac aag ggc tcg 864
Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys Gly Ser
275 280 285
acc tcg ttc ggc tgg ttc gtg ccc gag gtc ttt gcc gcc cag gcc ggc 912
Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln Ala Gly
290 295 300
ctc gac aac ggc cgc aag tcg gag ccc tgg ttc att gag aac aag gtt 960
Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn Lys Val
305 310 315 320
ccg gcc tcg cag gtc tcc tcc ttt gac gtg cgc ccc aac ggc agc ggc 1008
Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly Ser Gly
325 330 335
cgc acc gcc atc ttc gcc aac gcc ccc agc ggc gcc cag ctc aac cgc 1056
Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu Asn Arg
340 345 350
cgc acg gac cag ggc cag tac ctc gac gcc gtc gac att gtc tcc ggc 1104
Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val Ser Gly
355 360 365
agc ggc aag aag agc ctc ggc tac gcc cac ggt tcc aag acg gtc aac 1152
Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr Val Asn
370 375 380
ccg aac gac tgg ttc ttc tcg tgc cac ttt tgg ttt gac tcg gtc atg 1200
Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser Val Met
385 390 395 400
ccc gga agt ctc ggt gtc gag tcc atg ttc cag ctc gtc gag gcc atc 1248
Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu Ala Ile
405 410 415
gcc gcc cac gag gat ctc gct ggc aag cac ggc att gcc aac ccc acc 1296
Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn Pro Thr
420 425 430
ttt gtg cac gcc ccg ggc aag atc agc tgg aag tac cgc ggc cag ctc 1344
Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly Gln Leu
435 440 445
acg ccc aag agc aag aag atg gac tcg gag gtc cac atc gtg tcc gtg 1392
Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val Ser Val
450 455 460
gac gcc cac gac ggc gtt gtc gac ctc gtc gcc gac ggc ttc ctc tgg 1440
Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe Leu Trp
465 470 475 480
gcc gac agc ctc cgc gtc tac tcg gtg agc aac att cgc gtg cgc atc 1488
Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val Arg Ile
485 490 495
gcc tcc ggt 1497
Ala Ser Gly
<210> 30
<211> 499
<212> PRT
<213> Schizochytrium sp.
<400> 30
Lys Val Gln Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly Pro Glu
1 5 10 15
Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala Ala Pro
20 25 30
Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro Val Ala
35 40 45
Leu Pro Glu His Ile Leu Lys Gly Asp Ala Leu Ala Pro Lys Glu Met
50 55 60
Ser Trp His Pro Met Ala Arg Ile Pro Gly Asn Pro Thr Pro Ser Phe
65 70 75 80
Ala Pro Ser Ala Tyr Lys Pro Arg Asn Ile Ala Phe Thr Pro Phe Pro
85 90 95
Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro Leu Thr
100 105 110
Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met Cys Leu
115 120 125
Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg Ser Pro
130 135 140
Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser Asp Leu
145 150 155 160
Lys His Val Asn Tyr Arg Asn Ile Asp Leu Asp Pro Ser Lys Gly Thr
165 170 175
Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr Lys Gly
180 185 190
Ala Cys Asn Asp Ala His Met Pro Tyr Ser Ile Leu Met Glu Ile Ala
195 200 205
Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro Leu Thr
210 215 220
Met Glu Lys Asp Asp Ile Leu Phe Arg Asn Leu Asp Ala Asn Ala Glu
225 230 235 240
Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr Ile Arg Asn Val
245 250 255
Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val His Arg
260 265 270
Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys Gly Ser
275 280 285
Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gln Ala Gly
290 295 300
Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe Ile Glu Asn Lys Val
305 310 315 320
Pro Ala Ser Gln Val Ser Ser Phe Asp Val Arg Pro Asn Gly Ser Gly
325 330 335
Arg Thr Ala Ile Phe Ala Asn Ala Pro Ser Gly Ala Gln Leu Asn Arg
340 345 350
Arg Thr Asp Gln Gly Gln Tyr Leu Asp Ala Val Asp Ile Val Ser Gly
355 360 365
Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr Val Asn
370 375 380
Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser Val Met
385 390 395 400
Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gln Leu Val Glu Ala Ile
405 410 415
Ala Ala His Glu Asp Leu Ala Gly Lys His Gly Ile Ala Asn Pro Thr
420 425 430
Phe Val His Ala Pro Gly Lys Ile Ser Trp Lys Tyr Arg Gly Gln Leu
435 440 445
Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His Ile Val Ser Val
450 455 460
Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe Leu Trp
465 470 475 480
Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn Ile Arg Val Arg Ile
485 490 495
Ala Ser Gly
<210> 31
<211> 1512
<212> DNA
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1512)
<400> 31
gcc ccg ctc tac ctc tcg cag gac ccg acc agc ggc cag ctc aag aag 48
Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr Ser Gly Gln Leu Lys Lys
1 5 10 15
cac acc gac gtg gcc tcc ggc cag gcc acc atc gtg cag ccc tgc acg 96
His Thr Asp Val Ala Ser Gly Gln Ala Thr Ile Val Gln Pro Cys Thr
20 25 30
ctc ggc gac ctc ggt gac cgc tcc ttc atg gag acc tac ggc gtc gtc 144
Leu Gly Asp Leu Gly Asp Arg Ser Phe Met Glu Thr Tyr Gly Val Val
35 40 45
gcc ccg ctg tac acg ggc gcc atg gcc aag ggc att gcc tcg gcg gac 192
Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp
50 55 60
ctc gtc atc gcc gcc ggc aag cgc aag atc ctc ggc tcc ttt ggc gcc 240
Leu Val Ile Ala Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala
65 70 75 80
ggc ggc ctc ccc atg cac cac gtg cgc gcc gcc ctc gag aag atc cag 288
Gly Gly Leu Pro Met His His Val Arg Ala Ala Leu Glu Lys Ile Gln
85 90 95
gcc gcc ctg cct cag ggc ccc tac gcc gtc aac ctc atc cac tcg cct 336
Ala Ala Leu Pro Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro
100 105 110
ttt gac agc aac ctc gag aag ggc aac gtc gat ctc ttc ctc gag aag 384
Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys
115 120 125
ggc gtc act gtg gtg gag gcc tcg gca ttc atg acc ctc acc ccg cag 432
Gly Val Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln
130 135 140
gtc gtg cgc tac cgc gcc gcc ggc ctc tcg cgc aac gcc gac ggt tcg 480
Val Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
145 150 155 160
gtc aac atc cgc aac cgc atc atc ggc aag gtc tcg cgc acc gag ctc 528
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
165 170 175
gcc gag atg ttc atc cgc ccg gcc ccg gag cac ctc ctc gag aag ctc 576
Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu Lys Leu
180 185 190
atc gcc tcg ggc gag atc acc cag gag cag gcc gag ctc gcg cgc cgc 624
Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu Ala Arg Arg
195 200 205
gtt ccc gtc gcc gac gat atc gct gtc gag gct gac tcg ggc ggc cac 672
Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
210 215 220
acc gac aac cgc ccc atc cac gtc atc ctc ccg ctc atc atc aac ctc 720
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu
225 230 235 240
cgc aac cgc ctg cac cgc gag tgc ggc tac ccc gcg cac ctc cgc gtc 768
Arg Asn Arg Leu His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val
245 250 255
cgc gtt ggc gcc ggc ggt ggc gtc ggc tgc ccg cag gcc gcc gcc gcc 816
Arg Val Gly Ala Gly Gly Gly Val Gly Cys Pro Gln Ala Ala Ala Ala
260 265 270
gcg ctc acc atg ggc gcc gcc ttc atc gtc acc ggc act gtc aac cag 864
Ala Leu Thr Met Gly Ala Ala Phe Ile Val Thr Gly Thr Val Asn Gln
275 280 285
gtc gcc aag cag tcc ggc acc tgc gac aac gtg cgc aag cag ctc tcg 912
Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys Gln Leu Ser
290 295 300
cag gcc acc tac tcg gat atc tgc atg gcc ccg gcc gcc gac atg ttc 960
Gln Ala Thr Tyr Ser Asp Ile Cys Met Ala Pro Ala Ala Asp Met Phe
305 310 315 320
gag gag ggc gtc aag ctc cag gtc ctc aag aag gga acc atg ttc ccc 1008
Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro
325 330 335
tcg cgc gcc aac aag ctc tac gag ctc ttt tgc aag tac gac tcc ttc 1056
Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe
340 345 350
gac tcc atg cct cct gcc gag ctc gag cgc atc gag aag cgt atc ttc 1104
Asp Ser Met Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe
355 360 365
aag cgc gca ctc cag gag gtc tgg gag gag acc aag gac ttt tac att 1152
Lys Arg Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile
370 375 380
aac ggt ctc aag aac ccg gag aag atc cag cgc gcc gag cac gac ccc 1200
Asn Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
385 390 395 400
aag ctc aag atg tcg ctc tgc ttc cgc tgg tac ctt ggt ctt gcc agc 1248
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala Ser
405 410 415
cgc tgg gcc aac atg ggc gcc ccg gac cgc gtc atg gac tac cag gtc 1296
Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr Gln Val
420 425 430
tgg tgt ggc ccg gcc att ggc gcc ttc aac gac ttc atc aag ggc acc 1344
Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile Lys Gly Thr
435 440 445
tac ctc gac ccc gct gtc tcc aac gag tac ccc tgt gtc gtc cag atc 1392
Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys Val Val Gln Ile
450 455 460
aac ctg caa atc ctc cgt ggt gcc tgc tac ctg cgc cgt ctc aac gcc 1440
Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala
465 470 475 480
ctg cgc aac gac ccg cgc att gac ctc gag acc gag gat gct gcc ttt 1488
Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu Thr Glu Asp Ala Ala Phe
485 490 495
gtc tac gag ccc acc aac gcg ctc 1512
Val Tyr Glu Pro Thr Asn Ala Leu
500
<210> 32
<211> 504
<212> PRT
<213> Schizochytrium sp.
<400> 32
Ala Pro Leu Tyr Leu Ser Gln Asp Pro Thr Ser Gly Gln Leu Lys Lys
1 5 10 15
His Thr Asp Val Ala Ser Gly Gln Ala Thr Ile Val Gln Pro Cys Thr
20 25 30
Leu Gly Asp Leu Gly Asp Arg Ser Phe Met Glu Thr Tyr Gly Val Val
35 40 45
Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp
50 55 60
Leu Val Ile Ala Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala
65 70 75 80
Gly Gly Leu Pro Met His His Val Arg Ala Ala Leu Glu Lys Ile Gln
85 90 95
Ala Ala Leu Pro Gln Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro
100 105 110
Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys
115 120 125
Gly Val Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gln
130 135 140
Val Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser
145 150 155 160
Val Asn Ile Arg Asn Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu
165 170 175
Ala Glu Met Phe Ile Arg Pro Ala Pro Glu His Leu Leu Glu Lys Leu
180 185 190
Ile Ala Ser Gly Glu Ile Thr Gln Glu Gln Ala Glu Leu Ala Arg Arg
195 200 205
Val Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
210 215 220
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu
225 230 235 240
Arg Asn Arg Leu His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val
245 250 255
Arg Val Gly Ala Gly Gly Gly Val Gly Cys Pro Gln Ala Ala Ala Ala
260 265 270
Ala Leu Thr Met Gly Ala Ala Phe Ile Val Thr Gly Thr Val Asn Gln
275 280 285
Val Ala Lys Gln Ser Gly Thr Cys Asp Asn Val Arg Lys Gln Leu Ser
290 295 300
Gln Ala Thr Tyr Ser Asp Ile Cys Met Ala Pro Ala Ala Asp Met Phe
305 310 315 320
Glu Glu Gly Val Lys Leu Gln Val Leu Lys Lys Gly Thr Met Phe Pro
325 330 335
Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe
340 345 350
Asp Ser Met Pro Pro Ala Glu Leu Glu Arg Ile Glu Lys Arg Ile Phe
355 360 365
Lys Arg Ala Leu Gln Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr Ile
370 375 380
Asn Gly Leu Lys Asn Pro Glu Lys Ile Gln Arg Ala Glu His Asp Pro
385 390 395 400
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala Ser
405 410 415
Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr Gln Val
420 425 430
Trp Cys Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Ile Lys Gly Thr
435 440 445
Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys Val Val Gln Ile
450 455 460
Asn Leu Gln Ile Leu Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala
465 470 475 480
Leu Arg Asn Asp Pro Arg Ile Asp Leu Glu Thr Glu Asp Ala Ala Phe
485 490 495
Val Tyr Glu Pro Thr Asn Ala Leu
500
<210> 33
<211> 714
<212> DNA
<213> Nostoc sp.
<400> 33
atgttgcagc atacttggct accaaaaccc ccaaatttaa ccttattgtc agatgaagtt 60
catctctggc gcattcccct tgaccaacca gaatcacagc tacaggattt agccgctacc 120
ttatctagtg acgaattagc ccgtgcaaac agattttatt ttcccgaaca tcgccggcgt 180
tttactgctg gtcgtggtat tctccgcagt atcttggggg gctatttggg tgtggaacca 240
gggcaagtta aatttgatta tgaatcccgt ggtaaaccaa tattaggcga tcgctttgcc 300
gagagtggtt tattatttaa cttgtcacac tcccagaact tggccttgtg tgcagtcaat 360
tacacgcgcc aaatcggcat cgatttagaa tatctccgcc ccacatctga tttagaatcc 420
cttgccaaaa ggttcttttt accgcgagaa tatgaattat tgcgatcgct acccgatgag 480
caaaaacaaa aaattttctt tcgttactgg acttgtaaag aggcttatct taaagcaacg 540
ggtgacggca tcgctaaatt agaggaaatt gaaatagcac taactcccac agaaccagct 600
aagttacaga cagctccagc gtggagtctc ctagagctag tgccagatga taattgtgtt 660
gctgctgttg ccgtggcggg ttttggctgg cagccaaaat tctggcatta ttga 714
<210> 34
<211> 237
<212> PRT
<213> Nostoc sp.
<400> 34
Met Leu Gln His Thr Trp Leu Pro Lys Pro Pro Asn Leu Thr Leu Leu
1 5 10 15
Ser Asp Glu Val His Leu Trp Arg Ile Pro Leu Asp Gln Pro Glu Ser
20 25 30
Gln Leu Gln Asp Leu Ala Ala Thr Leu Ser Ser Asp Glu Leu Ala Arg
35 40 45
Ala Asn Arg Phe Tyr Phe Pro Glu His Arg Arg Arg Phe Thr Ala Gly
50 55 60
Arg Gly Ile Leu Arg Ser Ile Leu Gly Gly Tyr Leu Gly Val Glu Pro
65 70 75 80
Gly Gln Val Lys Phe Asp Tyr Glu Ser Arg Gly Lys Pro Ile Leu Gly
85 90 95
Asp Arg Phe Ala Glu Ser Gly Leu Leu Phe Asn Leu Ser His Ser Gln
100 105 110
Asn Leu Ala Leu Cys Ala Val Asn Tyr Thr Arg Gln Ile Gly Ile Asp
115 120 125
Leu Glu Tyr Leu Arg Pro Thr Ser Asp Leu Glu Ser Leu Ala Lys Arg
130 135 140
Phe Phe Leu Pro Arg Glu Tyr Glu Leu Leu Arg Ser Leu Pro Asp Glu
145 150 155 160
Gln Lys Gln Lys Ile Phe Phe Arg Tyr Trp Thr Cys Lys Glu Ala Tyr
165 170 175
Leu Lys Ala Thr Gly Asp Gly Ile Ala Lys Leu Glu Glu Ile Glu Ile
180 185 190
Ala Leu Thr Pro Thr Glu Pro Ala Lys Leu Gln Thr Ala Pro Ala Trp
195 200 205
Ser Leu Leu Glu Leu Val Pro Asp Asp Asn Cys Val Ala Ala Val Ala
210 215 220
Val Ala Gly Phe Gly Trp Gln Pro Lys Phe Trp His Tyr
225 230 235
<210> 35
<211> 8733
<212> DNA
<213> Artificial
<220>
<223> synthetic
<400> 35
atggctgcta ggttgcaaga acaaaaaggt ggtgagatgg atactagaat tgctatcatt 60
ggaatgtctg ctattttgcc atgtggtact actgttagag aatcttggga aactattaga 120
gctggtattg attgtttgtc tgatttgcct gaagatagag ttgatgttac tgcttacttt 180
gatccagtta aaactactaa agataaaatc tattgtaaga gaggtggttt cattccagaa 240
tatgattttg atgctagaga atttggtttg aatatgtttc agatggaaga ttctgatgct 300
aatcaaacta tttctttgtt gaaagttaaa gaagcattgc aagatgctgg catcgatgct 360
ttgggtaaag agaagaagaa tattggttgt gttttgggta ttggtggtgg tcaaaaatct 420
tctcatgaat tttactcaag attgaattat gttgttgttg agaaggtatt gagaaaaatg 480
ggtatgccag aagaagatgt taaagttgct gttgaaaaat acaaagctaa ttttccagag 540
tggagattgg attcttttcc aggtttcttg ggaaatgtta ctgcaggaag atgtactaat 600
acttttaatc ttgatggcat gaattgtgtt gttgatgctg cttgtgcttc ttctttgatt 660
gctgttaaag ttgctattga tgaattgttg tacggtgatt gtgatatgat ggttactggt 720
gctacttgta ctgataattc tattggaatg tacatggctt tttctaaaac tccagttttc 780
tctactgatc catctgttag agcttatgat gaaaaaacta aaggaatgtt gattggtgaa 840
ggttctgcta tgttggtttt gaaaagatat gctgatgctg ttagagatgg tgatgaaatt 900
catgctgtta ttagaggttg tgcttcttct tctgatggta aagctgctgg tatctatact 960
ccaactattt ctggtcaaga agaagcattg agaagagctt ataatagagc ttgtgttgat 1020
ccagctactg ttactttggt tgaaggtcat ggtactggta ctccagttgg tgatagaatt 1080
gaattgactg ctttgagaaa tttgtttgat aaagcatatg gtgaaggtaa tactgaaaaa 1140
gttgctgttg gttctattaa atcttctatt ggtcatttga aagctgttgc tggtttggct 1200
ggaatgatta aagttatcat ggctttgaaa cataaaactt tgccaggaac tattaatgtt 1260
gataatccac caaacttgta cgataatact ccaattaacg aatcttcttt gtacattaat 1320
actatgaata gaccttggtt tccaccacca ggtgttccaa gaagagctgg tatttcttct 1380
tttggttttg gtggtgctaa ttatcatgct gttttggaag aagctgaacc agaacatact 1440
actgcttata ggttgaacaa aagaccacaa ccagttttga tgatggctgc tactccagct 1500
gctttgcaat ctttgtgtga agctcaattg aaagaatttg aagctgctat taaagaaaac 1560
gaaactgtta aaaatactgc ttatattaaa tgtgttaaat ttggtgaaca attcaaattc 1620
cctggtagta ttccagctac taatgctagg ttgggtttct tggttaaaga tgctgaagat 1680
gcttgttcta ctttgagagc tatttgtgct caatttgcta aagatgttac taaagaagca 1740
tggagattgc caagagaagg tgtttctttt agagctaaag gtattgctac taatggtgct 1800
gttgctgctt tgttttctgg tcaaggtgct caatatactc atatgttttc tgaagttgct 1860
atgaattggc cacaattcag acaatctatt gctgctatgg atgctgctca atctaaagtt 1920
gctggttctg ataaagattt tgaaagagtt tctcaagttt tgtatccaag aaaaccatac 1980
gagagagaac cagagcaaga tcataagaag atttctttga ctgcttattc tcaaccatct 2040
actttggctt gtgctttggg tgcttttgaa atttttaaag aagctggttt tactccagat 2100
tttgctgctg gtcattcttt gggtgaattt gctgctttgt acgctgctgg ttgtgttgat 2160
agagatgaat tgtttgaatt ggtttgtaga agagctagaa ttatgggtgg taaagatgct 2220
ccagctactc caaaaggttg catggctgct gttattggtc caaatgctga aaatattaaa 2280
gttcaagctg ctaatgtttg gttaggaaat tctaattctc catctcaaac tgttattact 2340
ggttctgttg aaggtattca agctgaatct gctaggttgc aaaaagaagg ttttagagtt 2400
gttccattgg cttgtgaatc tgcttttcat tctccacaga tggaaaatgc ttcttctgct 2460
tttaaagatg ttatctctaa agtttctttt agaactccaa aagctgaaac taaattgttt 2520
tctaatgttt ctggtgaaac ttatccaact gatgctagag aaatgttgac tcaacatatg 2580
acttcttctg ttaaattttt gactcaagtt agaaatatgc atcaagctgg tgctagaatt 2640
tttgttgaat tcggtccaaa acaagttttg tctaaattgg tttctgaaac tttgaaagat 2700
gatccatctg ttgttactgt ttctgttaat ccagcttctg gtactgattc tgatattcaa 2760
ttgagagatg ctgctgttca attggttgtt gctggtgtta atttgcaagg ttttgataaa 2820
tgggatgctc cagatgctac tagaatgcaa gctattaaaa aaaaaagaac tactttgaga 2880
ttgtctgctg ctacttatgt ttctgataaa actaagaaag ttagagatgc tgctatgaat 2940
gatggtagat gtgttactta cttgaaaggt gctgctccat tgattaaagc tccagaacca 3000
gttgttgatg aagctgctaa aagagaagct gaaagattgc aaaaagaatt gcaagatgct 3060
caaagacaat tggatgatgc taaaagagct gctgctgaag ctaattctaa attggctgct 3120
gctaaagaag aagctaaaac tgctgctgct tctgctaaac cagctgttga tactgctgtt 3180
gttgaaaaac atagagctat tttgaaatct atgttggctg aattggatgg ttatggttct 3240
gttgatgctt cttctttgca acaacaacaa caacaacaaa ctgctccagc tccagttaaa 3300
gctgctgctc cagctgctcc agttgcttct gctccagcac ccgcagttag caacgaactc 3360
ttagaaaaag ccgagacagt agtgatggaa gttcttgcag ctaaaacggg gtacgaaaca 3420
gatatgattg aagcagatat ggaacttgaa actgaactgg gcattgattc gattaaacgc 3480
gtggaaattc tgtcagaagt gcaagctatg ttaaatgttg aagcgaaaga tgttgatgca 3540
ctgtcacgca cacgcaccgt gggcgaagta gtgaacgcca tgaaagcaga aattgcaggc 3600
tcctcagcac ccgcgccggc cgcagcagca ccagcccccg caaaagccgc ccccgcagcg 3660
gcggctccag ccgtttcaaa cgaattactc gaaaaagcag aaaccgtagt gatggaagtc 3720
cttgccgcca aaacgggtta tgagaccgat atgatcgaaa gcgatatgga attagaaacc 3780
gaattaggga ttgatagtat taaacgcgta gaaattctgt ccgaagtaca agctatgctg 3840
aatgtagaag caaaagatgt agatgcgtta agccgcacac gcactgttgg tgaagttgtg 3900
aatgctatga aagctgaaat tgcaggaggt tcagcaccgg ccccagcagc cgcagcccca 3960
ggtccagcag cagccgcacc ggcccccgcc gccgccgcac cggcagtatc aaacgagttg 4020
ttagagaaag cggaaaccgt tgtgatggaa gtacttgccg cgaagacagg ttacgagacc 4080
gatatgatcg aaagtgacat ggaattagaa accgaattgg gcattgatag cattaaacgc 4140
gtagaaattt tatccgaagt tcaagccatg ttaaatgttg aagccaaaga tgtggatgcg 4200
ttatcccgca cgcgtaccgt cggagaagta gtggacgcta tgaaagcaga gattgcagga 4260
ggaagtgcac cggctccagc agcagcagca cccgccccag cggcagcggc gccggcaccg 4320
gccgctccgg ccccagccgt tagttcagaa ctcctcgaaa aagcagaaac tgttgtcatg 4380
gaagtattag ctgcaaaaac aggttacgag acggatatga ttgaaagcga tatggaatta 4440
gaaaccgaat taggcattga ttcaattaaa cgtgttgaaa tcttaagtga agtccaagcc 4500
atgcttaatg ttgaagccaa agatgtagat gcattatctc gcacgcgtac agtgggtgaa 4560
gttgtcgatg cgatgaaagc agaaatcgcg ggaggatcag cgccagcccc ggcagcagca 4620
gcccccgcgc ccgccgcggc cgcacctgcg ccggccgccc cagcccctgc agcaccggcc 4680
ccagcagtgt cgtcggaatt actcgaaaaa gctgaaacgg tcgttatgga agtacttgct 4740
gcaaagacgg gctatgaaac ggatatgatt gaatcggata tggaattaga aacagaactt 4800
ggtattgact ctattaaacg cgtggaaatt ctgagcgaag tacaggcaat gttaaacgta 4860
gaagccaaag atgtagacgc tttgtcacgc acacggacgg taggagaagt tgtggatgcg 4920
atgaaagctg aaattgccgg ttcaagtgct agcgcccctg ctgccgccgc ccctgcccct 4980
gccgccgcag caccggcccc ggcagccgca gctccagcag ttagtaacga attactcgaa 5040
aaagcagaaa cggtggtcat ggaagtgtta gcagcaaaaa ctggatatga aacggacatg 5100
attgaaagcg atatggaatt agaaacagaa ctgggaattg atagtattaa acgtgttgag 5160
attttatctg aggttcaagc tatgctgaat gttgaagcga aagatgtaga cgcactgtct 5220
cggacccgca cagtaggtga agtggtggac gcgatgaaag cagaaatcgc aggtggaagt 5280
gctccggccc cggcggcagc cgcacccgcg cccgcggccg cagccccagc agttagcaac 5340
gaattactcg agaaagcaga aactgtagtg atggaagtgt tagccgcaaa aacgggttat 5400
gaaacggata tgattgaaag cgatatggaa ctggaaaccg aactgggcat tgattctatt 5460
aaacgtgtcg aaatcttatc ggaagtccaa gcaatgctga acgtagaggc aaaggatgtt 5520
gatgccctgt cacgtacccg taccgtaggt gaagttgtag atgccatgaa agctgaaatc 5580
gcaggcagta gcgccccggc accagccgcc gccgcccccg cgccggcagc cgccgcaccc 5640
gcgccagccg cagctgctcc agctgtatct agtgagctgc tcgaaaaagc agaaaccgtg 5700
gttatggaag tgctcgccgc taaaacagga tatgaaaccg atatgattga aagcgatatg 5760
gaattagaaa ccgaactggg tattgatagt attaagcgtg ttgaaatttt gtcagaagtt 5820
caagctatgt tgaatgtaga agccaaagat gtagacgctt taagtcggac gcgtactgtt 5880
ggagaagtcg tagacgccat gaaagcagag attgcaggcg gaagtgcacc ggccccggca 5940
gcagcagccc cagcaccagc ggccgccgct cctgcagtgt caaacgaact tctggaaaaa 6000
gctgaaaccg tcgtcatgga agtgctggct gcaaaaactg gatatgaaac agacatgatt 6060
gaatcagata tggaactcga aaccgaactg gggattgata gcattaaacg tgtggaaatt 6120
ttatcggagg tacaagcaat gttaaatgtg gaagcaaaag atgtggatgc actgagccgt 6180
actcgtactg ttggtgaggt cgtggatgcg atgaaagcag aaattgctgg agggagtgcg 6240
cctgccccgg ccgccgccgc acccgcgtct gccggtgctg cccccgctgt caaaattgat 6300
tctgttcatg gtgctgattg tgatgatttg tctttgatgc atgctaaagt tgttgatatt 6360
agaagaccag atgaattgat tttggaaaga ccagaaaata gaccagtttt ggttgttgat 6420
gatggttctg aattgacttt ggctttggtt agagttttgg gtgcttgtgc tgttgttttg 6480
acttttgaag gtttgcaatt ggctcaaaga gctggtgctg ctgctattag acatgttttg 6540
gctaaagatt tgtctgctga atctgctgaa aaagctatta aagaagctga acaaagattt 6600
ggtgctttgg gtggttttat ctctcaacaa gctgaaagat ttgaaccagc tgaaattttg 6660
ggttttactt tgatgtgtgc taaatttgct aaagcatctt tgtgcactgc tgttgctggt 6720
ggtagaccag ctttcattgg tgttgctagg ttggatggta ggttgggttt tacttctcaa 6780
ggaacttctg atgctttgaa aagagctcaa agaggtgcta tttttggttt gtgcaagact 6840
attggtttgg aatggtctga atctgatgtt ttctcaagag gtgttgatat tgctcaaggt 6900
atgcatccag aagatgctgc tgttgctatt gttagagaaa tggcttgtgc tgatattaga 6960
attagagaag ttggtattgg tgctaatcaa caaagatgta ctattagagc tgctaaattg 7020
gaaactggaa atccacaaag acaaattgct aaagatgatg ttttgttggt ttctggtggt 7080
gctagaggaa ttactccatt gtgcattaga gaaattacta gacaaattgc tggtggaaag 7140
tatattttgt tgggtaggtc taaagtttct gcttctgaac cagcttggtg tgctggtatt 7200
actgatgaaa aagctgttca aaaagctgct actcaagaat tgaaaagagc tttttctgct 7260
ggtgaaggtc caaaaccaac tccaagagct gttactaaat tggttggttc tgttttgggt 7320
gctagagaag ttaggtcttc tattgctgct attgaagcat tgggtggaaa agctatctat 7380
tcttcttgtg atgttaattc tgctgctgat gttgctaaag ctgttagaga tgctgaatct 7440
caattgggtg ctagagtttc tggtattgtt catgcttctg gtgttttgag agataggttg 7500
attgaaaaaa aattgccaga tgaatttgat gctgtttttg gtactaaagt tactggtttg 7560
gaaaatttgt tggctgctgt tgatagagct aatttgaaac atatggtttt gttttcttct 7620
ttggctggtt ttcatggtaa tgttggtcaa tctgattatg ctatggctaa cgaagcattg 7680
aacaaaatgg gtttggaatt ggctaaagat gtttctgtta aatctatttg ttttggtcct 7740
tgggatggtg gtatggttac tccacaattg aaaaaacaat ttcaagaaat gggtgttcaa 7800
attattccaa gagaaggtgg tgctgatact gttgctagaa ttgttttggg ttcttctcca 7860
gctgaaattt tggttggtaa ttggagaact ccatctaaaa aagttggttc tgatactatt 7920
actttgcaca gaaaaatttc tgctaaatct aatccatttt tggaagatca tgtcattcaa 7980
ggtagaagag ttttgccaat gactttggct attggttctt tggctgaaac ttgtttgggt 8040
ttgtttcctg gatattcttt gtgggctatt gatgatgctc aattgtttaa aggtgttact 8100
gttgatggtg atgttaattg tgaagttact ttgactccat ctactgctcc ttctggtaga 8160
gttaatgttc aagctacttt gaaaactttt tcttctggta aattggttcc agcttataga 8220
gctgttattg ttttgtctaa tcaaggtgct ccaccagcta atgctactat gcaaccacca 8280
tctttggatg ctgatccagc tttgcaaggt tctgtttatg atggaaagac tttgtttcat 8340
ggtccagctt ttagaggtat tgatgatgtt ttgtcttgta ctaaatctca attggttgct 8400
aaatgttctg ctgttccagg ttctgatgct gctagaggtg aatttgctac tgatactgat 8460
gctcatgatc catttgttaa tgatttggct tttcaagcta tgttggtttg ggttagaaga 8520
actttgggtc aagctgcttt gccaaattct attcaaagaa ttgttcaaca cagaccagtt 8580
ccacaagata aaccatttta tattactttg agatctaatc aatctggtgg tcattctcaa 8640
cataaacatg ctttgcaatt tcataacgaa caaggtgatt tgttcattga tgttcaagca 8700
tctgttattg ctactgattc tttggctttt taa 8733
<210> 36
<211> 6180
<212> DNA
<213> Artificial
<220>
<223> synthetic
<400> 36
atggctgcta gaaatgtttc tgctgctcat gaaatgcatg atgaaaaaag aattgctgtt 60
gttggtatgg ctgttcaata tgctggttgt aagactaaag atgaattttg ggaagttttg 120
atgaatggta aagttgaatc taaagttatc tctgataaaa gattgggttc taattaccga 180
gctgaacatt acaaggctga aagatccaaa tacgctgata ctttttgtaa cgaaacttat 240
ggtactttgg atgaaaacga aattgataac gaacatgaat tgttgttgaa tttggctaaa 300
caagcattgg ctgaaacttc tgttaaagat tctactagat gtggtattgt ttctggttgt 360
ttgtcttttc ctatggataa tttgcaaggt gaattgttga atgtctatca aaatcatgtt 420
gagaagaaat tgggtgctag agtttttaaa gatgcttctc attggtctga aagagaacaa 480
tctaacaaac cagaagctgg tgatagaaga attttcatgg acccagcttc ttttgttgct 540
gaagaattga atttgggtgc tttgcattat tctgttgatg ctgcttgtgc tactgcttta 600
tacgttttga gattggctca agatcatttg gtttctggtg ctgctgatgt tatgttgtgt 660
ggtgctactt gtttgccaga accattcttt atcttgtctg gtttttctac ttttcaagct 720
atgccagttg gtactggtca aaatgtttct atgccattgc ataaagattc tcaaggtttg 780
actccaggtg aaggtggttc tatcatggtt ttgaaaagat tggatgatgc tattagagat 840
ggtgatcata tctatggtac tttgttgggt gctaatgttt ctaattctgg cactggtttg 900
ccattgaaac cattgttgcc atctgaaaaa aaatgtttga tggatactta tactagaatt 960
aatgttcatc cacataaaat tcaatatgtt gaatgtcatg ctactggtac tccacaaggt 1020
gatagggttg aaattgatgc tgttaaagca tgttttgaag gaaaagttcc aagatttggt 1080
actactaaag gaaactttgg tcatactttg gttgctgctg gttttgctgg aatgtgcaaa 1140
gttttgttgt ctatgaaaca tggtatcatt ccaccaactc caggtattga tgatgaaact 1200
aagatggacc cattggttgt ttctggtgaa gctattcctt ggccagaaac taatggtgaa 1260
ccaaaaagag ctggtttgtc tgcttttggt tttggtggta ctaatgctca tgctgttttt 1320
gaagaacatg atccatctaa tgctgcttgt actggtcatg attctatttc tgctttgtct 1380
gctagatgtg gtggtgaatc taatatgaga attgctatta ctggtatgga tgctactttt 1440
ggtgctttga aaggtttgga tgcttttgaa agagccatct acactggtgc tcatggtgct 1500
attccattgc cagaaaagag atggagattt ttgggcaaag ataaagattt cttggatttg 1560
tgtggtgtta aagctactcc acatggttgt tatattgaag atgttgaagt tgattttcaa 1620
agattgagaa ctccaatgac tccagaagat atgttgttgc cacaacaatt gttggctgtt 1680
actactattg atagagctat tttggattct ggtatgaaaa aaggtggtaa tgttgctgtt 1740
tttgttggtt tgggtaccga tttggaattg tacagacata gagctagagt tgctttgaaa 1800
gaaagagtta gaccagaagc atctaaaaaa ttgaatgata tgatgcagta cattaatgat 1860
tgtggcacct ctacttctta tacttcttat attggtaatt tggttgctac tagagtttct 1920
tctcaatggg gttttactgg tccatctttt actattactg aagggaataa ctctgtttat 1980
agatgtgctg aattgggaaa gtatttgttg gaaactggtg aagttgatgg tgttgttgtt 2040
gctggtgttg atttgtgtgg ttctgctgaa aacttatacg ttaaatcaag aagattcaaa 2100
gtttctactt ctgatactcc aagagcttct tttgatgctg ctgctgatgg ttactttgtt 2160
ggtgaaggtt gtggtgcttt tgttttgaaa agagaaactt cttgtactaa agatgataga 2220
atctatgctt gcatggatgc tattgttcca ggtaatgttc catctgcttg tttgagagaa 2280
gcattggatc aagctagagt taaaccaggt gatattgaaa tgttggaatt gtctgctgat 2340
tctgctagac atttgaaaga tccatctgtt ttgccaaaag aattgactgc tgaagaagaa 2400
attggtggtt tgcaaactat tttgagagat gatgataaat tgccaagaaa tgttgctact 2460
ggttctgtta aagctactgt tggtgatact ggttatgctt ctggtgctgc ttctttgatt 2520
aaagctgctt tgtgcatcta taataggtat ttgccatcta atggtgatga ttgggatgaa 2580
ccagctccag aagctccttg ggattctact ttgtttgctt gtcaaacttc aagagcttgg 2640
ttgaaaaatc ctggagagag aagatatgct gctgtttctg gtgtttctga aactaggtct 2700
tgttattctg ttttgttgtc tgaagctgaa ggtcattatg aaagagaaaa tagaatttct 2760
ttggatgaag aagctccaaa attgattgtt ttgagagctg attctcatga agaaattttg 2820
ggtaggttgg ataaaattag agaaagattt ttgcaaccaa ctggtgctgc tccaagagaa 2880
tctgaattga aagctcaagc tagaagaatt ttcttggaat tgttgggtga aactttggct 2940
caagatgctg cttcttctgg ttctcaaaaa ccattggctt tgtctttggt ttctactcca 3000
tctaaattgc aaagagaagt tgaattggct gctaaaggta ttccaagatg tttgaaaatg 3060
agaagagatt ggtcttctcc agctggttca agatatgctc cagaaccatt ggcttctgat 3120
agagttgctt tcatgtacgg tgaaggaagg tctccatact atggaatcac tcaagatatt 3180
catagaattt ggccagaatt gcatgaagtt attaacgaaa aaactaatag gttgtgggct 3240
gaaggtgata gatgggttat gccaagagct tcttttaaat ctgaattgga atctcaacaa 3300
caagaatttg atagaaatat gattgaaatg tttaggttgg gtattttgac ttctattgct 3360
tttactaatt tggctagaga tgttttgaat attactccaa aagctgcttt tggtttgtct 3420
ttgggtgaaa tttctatgat ttttgctttt tctaaaaaaa atggtttgat ttctgatcaa 3480
ttgactaaag atttgagaga atctgatgtt tggaacaaag cattggctgt tgaattcaat 3540
gctttgagag aagcatgggg tattccacaa tctgttccaa aagatgaatt ttggcaaggt 3600
tatattgtta gaggtactaa acaagatatt gaagctgcta ttgctccaga ttccaaatac 3660
gttaggttga ctatcattaa tgatgctaat actgctttga tttctggtaa accagatgct 3720
tgtaaagctg ctattgctag gttgggtggt aatattccag ctttgccagt tactcaagga 3780
atgtgtggtc attgtccaga agttggtcca tatactaaag atattgctaa aattcatgct 3840
aatttggaat ttccagttgt tgatggtttg gatttgtgga ctactattaa tcaaaaaaga 3900
ttggttccaa gagctactgg tgctaaagat gaatgggctc catcttcttt tggtgaatat 3960
gctggtcaac tttacgaaaa acaagctaat tttccacaaa ttgttgaaac tatctacaaa 4020
caaaattatg atgtttttgt tgaggttggt ccaaacaacc ataggtctac tgctgttaga 4080
actactttgg gtccacaaag aaatcatttg gctggtgcta ttgataaaca aaacgaagat 4140
gcttggacta ctattgttaa attggttgct tctttgaaag ctcatttggt tccaggtgtt 4200
actatttctc cattgtatca ttctaaattg gttgctgaag ctgaagcatg ttatgctgct 4260
ctgtgcaaag gagaaaaacc taagaagaac aaatttgtta gaaaaattca attgaatggt 4320
aggttcaatt ctaaagctga tccaatttct tctgctgatt tggcttcttt tccaccagct 4380
gatccagcta ttgaagctgc tatttcttca agaattatga aaccagttgc tccaaaattt 4440
tatgctaggt tgaatattga tgaacaagac gaaacaagag atccaatttt gaacaaagat 4500
aatgctccat ctagttcatc tagttcctct tcatctagtt cttcatctag ttctccatct 4560
ccagctcctt ctgctccagt tcaaaaaaaa gctgctccag ctgctgaaac taaagctgtt 4620
gcttctgctg atgctttgag atctgctttg ttggatttgg attctatgtt ggctttgtct 4680
tctgcttctg cttctggtaa tttggttgaa actgctccat ctgatgcttc tgttattgtt 4740
ccaccatgta atattgctga tttgggttca agagctttta tgaaaactta tggtgtttct 4800
gctccattgt acactggtgc tatggctaaa ggtattgctt ctgctgattt ggttattgct 4860
gctggtagac aaggcatttt ggcttctttt ggtgctggtg gtttgccaat gcaagttgtt 4920
agagaatcta ttgaaaaaat tcaagctgct ttgccaaatg gtccatatgc tgttaatttg 4980
attcattctc catttgattc taatttggaa aaaggtaatg ttgatttgtt tttggaaaaa 5040
ggtgttactt ttgttgaagc atctgctttt atgactttga ctccacaagt tgttaggtac 5100
agagctgctg gtttgactag aaatgctgat ggttctgtta atattagaaa tagaattatc 5160
ggaaaggttt caagaactga attggctgaa atgtttatga gacctgcccc agaacacttg 5220
ttgcaaaaat tgattgcttc tggtgaaatt aatcaagaac aagctgaatt ggctagaaga 5280
gttccagttg ctgatgatat tgctgttgaa gctgattctg gtggtcatac tgataataga 5340
ccaattcatg ttatcttgcc attgattatt aatttgagag acagattgca tagagaatgt 5400
ggttatccag ctaatttgag agttagagtt ggtgctggtg gtggtattgg ttgtccacaa 5460
gctgctttgg ctacttttaa tatgggtgct tctttcattg ttactggcac tgttaatcaa 5520
gttgctaaac aatctggtac ttgtgataat gttagaaaac aattggctaa agctacttat 5580
tctgatgttt gcatggctcc agctgctgat atgtttgaag aaggtgttaa attgcaagtt 5640
ttgaagaaag ggacaatgtt tccatcaaga gctaataagt tatacgaatt gttttgcaag 5700
tatgattctt ttgaatctat gccaccagct gaattggcta gagttgaaaa aagaattttc 5760
tcaagagctt tggaagaagt ttgggatgaa actaaaaatt tttacattaa taggttgcac 5820
aatccagaaa aaattcaaag agctgaaaga gatccaaaat tgaaaatgtc tttgtgtttt 5880
agatggtatt tgtctttggc ttcaagatgg gctaatactg gtgcttctga tagagttatg 5940
gattatcaag tttggtgtgg tccagctatt ggttctttta atgatttcat taaaggcacc 6000
tacttggacc cagctgttgc taacgaatat ccatgcgttg ttcaaattaa caaacaaatt 6060
ttgagaggtg cttgtttcct cagaagattg gaaattttga gaaatgctag gttgtctgat 6120
ggtgctgctg ctttggttgc ttctattgat gatacttatg ttccagctga aaaattgtaa 6180
<210> 37
<211> 6180
<212> DNA
<213> Artificial
<220>
<223> synthetic
<400> 37
atggccgctc gcaacgtgtc tgcagcgcat gagatgcacg atgaaaagcg catcgccgtc 60
gtcggcatgg ccgtccagta cgccggatgc aaaaccaagg acgagttctg ggaggtgctc 120
atgaacggca aggtcgagtc caaggtgatc agcgacaaac gactcggctc caactaccgc 180
gccgagcact acaaagcaga gcgcagcaag tatgccgaca ccttttgcaa cgaaacgtac 240
ggcacccttg acgagaacga gatcgacaac gagcacgaac tcctcctcaa cctcgccaag 300
caggcactcg cagagacatc cgtcaaagac tcgacacgct gcggcatcgt cagcggctgc 360
ctctcgttcc ccatggacaa cctccagggt gaactcctca acgtgtacca aaaccatgtc 420
gagaaaaagc tcggggcccg cgtcttcaag gacgcctccc attggtccga acgcgagcag 480
tccaacaaac ccgaggccgg tgaccgccgc atcttcatgg acccggcctc cttcgtcgcc 540
gaagaactca acctcggcgc ccttcactac tccgtcgacg cagcatgcgc cacggcgctc 600
tacgtgctcc gcctcgcgca ggatcatctc gtctccggcg ccgccgacgt catgctctgc 660
ggtgccacct gcctgccgga gccctttttc atcctttcgg gcttttccac cttccaggcc 720
atgcccgtcg gcacgggcca gaacgtgtcc atgccgctgc acaaggacag ccagggcctc 780
accccgggtg agggcggctc catcatggtc ctcaagcgtc tcgatgatgc catccgcgac 840
ggcgaccaca tctacggcac ccttctcggc gccaatgtca gcaactccgg cacaggtctg 900
cccctcaagc cccttctccc cagcgagaaa aagtgcctca tggacaccta cacgcgcatt 960
aacgtgcacc cgcacaagat tcagtacgtc gagtgccacg ccaccggcac gccccagggt 1020
gatcgtgtgg aaatcgacgc cgtcaaggcc tgctttgaag gcaaggtccc ccgtttcggt 1080
accacaaagg gcaactttgg acacaccctc gtcgcagccg gctttgccgg tatgtgcaag 1140
gtcctcctct ccatgaagca tggcatcatc ccgcccaccc cgggtatcga tgacgagacc 1200
aagatggacc ctctcgtcgt ctccggtgag gccatcccat ggccagagac caacggcgag 1260
cccaagcgcg ccggtctctc ggcctttggc tttggtggca ccaacgccca tgccgtcttt 1320
gaggagcatg acccctccaa cgccgcctgc acgggccacg actccatttc tgcgctctcg 1380
gcccgctgcg gcggtgaaag caacatgcgc atcgccatca ctggtatgga cgccaccttt 1440
ggcgctctca agggactcga cgccttcgag cgcgccattt acaccggcgc tcacggtgcc 1500
atcccactcc cagaaaagcg ctggcgcttt ctcggcaagg acaaggactt tcttgacctc 1560
tgcggcgtca aggccacccc gcacggctgc tacattgaag atgttgaggt cgacttccag 1620
cgcctccgca cgcccatgac ccctgaagac atgctcctcc ctcagcagct tctggccgtc 1680
accaccattg accgcgccat cctcgactcg ggaatgaaaa agggtggcaa tgtcgccgtc 1740
tttgtcggcc tcggcaccga cctcgagctc taccgtcacc gtgctcgcgt cgctctcaag 1800
gagcgcgtcc gccctgaagc ctccaagaag ctcaatgaca tgatgcagta cattaacgac 1860
tgcggcacat ccacatcgta cacctcgtac attggcaacc tcgtcgccac gcgcgtctcg 1920
tcgcagtggg gcttcacggg cccctccttt acgatcaccg agggcaacaa ctccgtctac 1980
cgctgcgccg agctcggcaa gtacctcctc gagaccggcg aggtcgatgg cgtcgtcgtt 2040
gcgggtgtcg atctctgcgg cagtgccgaa aacctttacg tcaagtctcg ccgcttcaag 2100
gtgtccacct ccgatacccc gcgcgccagc tttgacgccg ccgccgatgg ctactttgtc 2160
ggcgagggct gcggtgcctt tgtgctcaag cgtgagacta gctgcaccaa ggacgaccgt 2220
atctacgctt gcatggatgc catcgtccct ggcaacgtcc ctagcgcctg cttgcgcgag 2280
gccctcgacc aggcgcgcgt caagccgggc gatatcgaga tgctcgagct cagcgccgac 2340
tccgcccgcc acctcaagga cccgtccgtc ctgcccaagg agctcactgc cgaggaggaa 2400
atcggcggcc ttcagacgat ccttcgtgac gatgacaagc tcccgcgcaa cgtcgcaacg 2460
ggcagtgtca aggccaccgt cggtgacacc ggttatgcct ctggtgctgc cagcctcatc 2520
aaggctgcgc tttgcatcta caaccgctac ctgcccagca acggcgacga ctgggatgaa 2580
cccgcccctg aggcgccctg ggacagcacc ctctttgcgt gccagacctc gcgcgcttgg 2640
ctcaagaacc ctggcgagcg tcgctatgcg gccgtctcgg gcgtctccga gacgcgctcg 2700
tgctattccg tgctcctctc cgaagccgag ggccactacg agcgcgagaa ccgcatctcg 2760
ctcgacgagg aggcgcccaa gctcattgtg cttcgcgccg actcccacga ggagatcctt 2820
ggtcgcctcg acaagatccg cgagcgcttc ttgcagccca cgggcgccgc cccgcgcgag 2880
tccgagctca aggcgcaggc ccgccgcatc ttcctcgagc tcctcggcga gacccttgcc 2940
caggatgccg cttcttcagg ctcgcaaaag cccctcgctc tcagcctcgt ctccacgccc 3000
tccaagctcc agcgcgaggt cgagctcgcg gccaagggta tcccgcgctg cctcaagatg 3060
cgccgcgatt ggagctcccc tgctggcagc cgctacgcgc ctgagccgct cgccagcgac 3120
cgcgtcgcct tcatgtacgg cgaaggtcgc agcccttact acggcatcac ccaagacatt 3180
caccgcattt ggcccgaact ccacgaggtc atcaacgaaa agacgaaccg tctctgggcc 3240
gaaggcgacc gctgggtcat gccgcgcgcc agcttcaagt cggagctcga gagccagcag 3300
caagagtttg atcgcaacat gattgaaatg ttccgtcttg gaatcctcac ctcaattgcc 3360
ttcaccaatc tggcgcgcga cgttctcaac atcacgccca aggccgcctt tggcctcagt 3420
cttggcgaga tttccatgat ttttgccttt tccaagaaga acggtctcat ctccgaccag 3480
ctcaccaagg atcttcgcga gtccgacgtg tggaacaagg ctctggccgt tgaatttaat 3540
gcgctgcgcg aggcctgggg cattccacag agtgtcccca aggacgagtt ctggcaaggc 3600
tacattgtgc gcggcaccaa gcaggatatc gaggcggcca tcgccccgga cagcaagtac 3660
gtgcgcctca ccatcatcaa tgatgccaac accgccctca ttagcggcaa gcccgacgcc 3720
tgcaaggctg cgatcgcgcg tctcggtggc aacattcctg cgcttcccgt gacccagggc 3780
atgtgcggcc actgccccga ggtgggacct tataccaagg atatcgccaa gatccatgcc 3840
aaccttgagt tccccgttgt cgacggcctt gacctctgga ccacaatcaa ccagaagcgc 3900
ctcgtgccac gcgccacggg cgccaaggac gaatgggccc cttcttcctt tggcgagtac 3960
gccggccagc tctacgagaa gcaggctaac ttcccccaaa tcgtcgagac catttacaag 4020
caaaactacg acgtctttgt cgaggttggg cccaacaacc accgtagcac cgcagtgcgc 4080
accacgcttg gtccccagcg caaccacctt gctggcgcca tcgacaagca gaacgaggat 4140
gcttggacga ccatcgtcaa gcttgtggct tcgctcaagg cccaccttgt tcctggcgtc 4200
acgatctcgc cgctgtacca ctccaagctt gtggcggagg ctgaggcttg ctacgctgcg 4260
ctctgcaagg gtgaaaagcc caagaagaac aagtttgtgc gcaagattca gctcaacggt 4320
cgcttcaaca gcaaggcgga ccccatctcc tcggccgatc ttgccagctt tccgcctgcg 4380
gaccctgcca ttgaagccgc catctcgagc cgcatcatga agccggttgc tccgaagttc 4440
tacgcgcgtc tcaacattga cgagcaggac gagacccgtg atccgatcct caacaaggac 4500
aacgcgccgt cttccagctc tagctcctct tccagctctt ccagctcttc cagcccgtcg 4560
ccagctccgt ccgccccagt gcaaaagaag gctgctccgg ccgcggagac caaggctgtt 4620
gcttcggctg acgcacttcg cagtgccctg ctcgatctcg acagtatgct tgcgctgagc 4680
tctgccagtg cctccggcaa ccttgttgag actgcgccta gcgacgcctc ggtcattgtg 4740
ccgccctgca acattgcgga tctcggcagc cgcgccttca tgaaaacgta cggtgtttcg 4800
gcgcctctgt acacgggcgc catggccaag ggcattgcct ctgcggacct cgtcattgcc 4860
gccggccgcc agggcatcct tgcgtccttt ggcgccggcg gacttcccat gcaggttgtg 4920
cgtgagtcca tcgaaaagat tcaggccgcc ctgcccaatg gcccgtacgc tgtcaacctt 4980
atccattctc cctttgacag caacctcgaa aagggcaatg tcgatctctt cctcgagaag 5040
ggtgtcacct ttgtcgaggc ctcggccttt atgacgctca ccccgcaggt cgtgcggtac 5100
cgcgcggctg gcctcacgcg caacgccgac ggctcggtca acatccgcaa ccgtatcatt 5160
ggcaaggtct cgcgcaccga gctcgccgag atgttcatgc gtcctgcgcc cgagcacctt 5220
cttcagaagc tcattgcttc cggcgagatc aaccaggagc aggccgagct cgcccgccgt 5280
gttcccgtcg ctgacgacat cgcggtcgaa gctgactcgg gtggccacac cgacaaccgc 5340
cccatccacg tcattctgcc cctcatcatc aaccttcgcg accgccttca ccgcgagtgc 5400
ggctacccgg ccaaccttcg cgtccgtgtg ggcgccggcg gtggcattgg gtgcccccag 5460
gcggcgctgg ccaccttcaa catgggtgcc tcctttattg tcaccggcac cgtgaaccag 5520
gtcgccaagc agtcgggcac gtgcgacaat gtgcgcaagc agctcgcgaa ggccacttac 5580
tcggacgtat gcatggcccc ggctgccgac atgttcgagg aaggcgtcaa gcttcaggtc 5640
ctcaagaagg gaaccatgtt tccctcgcgc gccaacaagc tctacgagct cttttgcaag 5700
tacgactcgt tcgagtccat gccccccgca gagcttgcgc gcgtcgagaa gcgcatcttc 5760
agccgcgcgc tcgaagaggt ctgggacgag accaaaaact tttacattaa ccgtcttcac 5820
aacccggaga agatccagcg cgccgagcgc gaccccaagc tcaagatgtc gctgtgcttt 5880
cgctggtacc tgagcctggc gagccgctgg gccaacactg gagcttccga tcgcgtcatg 5940
gactaccagg tctggtgcgg tcctgccatt ggttccttca acgatttcat caagggaact 6000
taccttgatc cggccgtcgc aaacgagtac ccgtgcgtcg ttcagattaa caagcagatc 6060
cttcgtggag cgtgcttctt gcgccgtctc gaaattctgc gcaacgcacg cctttccgat 6120
ggcgctgccg ctcttgtggc cagcatcgat gacacatacg tcccggccga gaagctgtaa 6180
<210> 38
<211> 8436
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(8433)
<400> 38
atg aag gac atg gaa gat aga cgg gtc gct att gtg ggc atg tca gct 48
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1 5 10 15
cac ttg cct tgt ggg aca gat gtg aag gaa tca tgg cag gct att cgc 96
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
20 25 30
gat gga atc gac tgt cta agt gac cta ccc gcg gat cgt ctc gac gtt 144
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
35 40 45
aca gct tac tac aat ccc aac aaa gcc acg aaa gac aag atc tac tgc 192
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
50 55 60
aaa cgg ggt ggc ttc atc ccg aac tat gac ttc gac ccc cgc gaa ttt 240
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65 70 75 80
ggg ctc aac atg ttt caa atg gaa gac tct gat gcg aat cag aca ctt 288
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
85 90 95
acc ttg ctc aaa gtc aaa caa gct ctc gaa gat gca agc ata gag cct 336
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
100 105 110
ttc acc aag gag aag aag aac att gga tgt gtt tta ggt att ggt ggg 384
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
115 120 125
ggc caa aag gcg agt cat gag ttc tac tct cgt ctc aac tac gtt gtc 432
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
130 135 140
gtt gaa aag gta ctt cgg aaa atg ggt tta cca gat gct gat gtt gaa 480
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145 150 155 160
gaa gct gtg gag aaa tac aag gca aat ttt ccc gag tgg cgc cta gac 528
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
165 170 175
tct ttc cct ggg ttt ctt ggg aat gta acg gct ggt cgg tgc agt aac 576
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
180 185 190
acc ttc aac atg gaa ggt atg aac tgc gtt gtg gat gct gca tgt gcc 624
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
195 200 205
agt tct cta att gca atc aag gtt gca gtt gaa gag cta ctc ttt ggt 672
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
210 215 220
gac tgt gac acc atg att gca ggt gcc acc tgc acg gac aat tca ctt 720
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225 230 235 240
ggc atg tac atg gcc ttc tct aaa acg cca gtt ttt tct act gac cca 768
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
245 250 255
agt gtc cgc gcg tat gat gag aaa aca aaa ggg atg cta att gga gaa 816
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
260 265 270
ggt tca gca atg ttc gtt ctt aaa cgc tat gcg gat gcc gta cgt gat 864
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
275 280 285
ggc gac aca att cac gcg gtt ctg cgt tct tgc tct tcg tct agt gat 912
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
290 295 300
gga aaa gcg gca gga att tat act cct act ata tct gga caa gaa gaa 960
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305 310 315 320
gct ttg cgt cga gcg tat gcc cgt gcg ggg gta tgt cca tct acg atc 1008
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
325 330 335
ggg ctt gtt gag ggt cac ggg aca ggg acc cct gtt gga gat cgc att 1056
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
340 345 350
gag tta aca gct ctg cgg aac ttg ttt gac aaa gct ttt ggt agc aag 1104
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
355 360 365
aag gaa caa ata gca gtt ggc agc ata aag tct cag ata ggt cac ctg 1152
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
370 375 380
aaa tct gtt gcc ggc ttt gcc ggc ttg gtc aaa gct gtg ctt gcg ctt 1200
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385 390 395 400
aaa cac aaa acg ctc cca ggt tcg att aat gtc gac cag cca cct ttg 1248
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
405 410 415
ttg tat gac ggt act caa att caa gac tct tct tta tat atc aac aag 1296
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
420 425 430
aca aat aga cca tgg ttt acg caa aac aag ctt ccg cgt cgg gct ggt 1344
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
435 440 445
gtc tca agt ttt gga ttt gga ggt gca aac tac cac gcg gtt ctg gaa 1392
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
450 455 460
gaa ttc gag ccc gag cat gaa aaa cca tac cgc ctc aat act gtt gga 1440
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465 470 475 480
cat cct gtc ctc ttg tac gct ccg tct gtg gaa gcc ctc aaa gta ctt 1488
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
485 490 495
tgc aac gac cag ctt gcg gag ctc aca att gca ttg gaa gag gca aaa 1536
Cys Asn Asp Gln Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys
500 505 510
aca cat aaa aat gtt gac aaa gtt tgt ggc tac aag ttt att gac gaa 1584
Thr His Lys Asn Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu
515 520 525
ttt cag ctc caa gga agc tgt cct cca gaa aat ccg aga gta gga ttt 1632
Phe Gln Leu Gln Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe
530 535 540
tta gca aca ctg cct act tca aat atc att gtc gcg ctt aag gca att 1680
Leu Ala Thr Leu Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile
545 550 555 560
ctc gcg cag ctt gat gca aaa cca gat gcg aag aaa tgg gat ttg cct 1728
Leu Ala Gln Leu Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro
565 570 575
cat aaa aag gct ttt ggg gct acc ttc gca tcg tct tca gtg aaa ggc 1776
His Lys Lys Ala Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly
580 585 590
tct gtt gct gcg ctc ttc gca gga cag ggt acc cag tac tta aac atg 1824
Ser Val Ala Ala Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met
595 600 605
ttc tct gat gtg gca atg aac tgg cca ccg ttc cgt gac agc att gtc 1872
Phe Ser Asp Val Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val
610 615 620
gca atg gaa gaa gct caa act gag gta ttt gag ggc caa gtt gaa cca 1920
Ala Met Glu Glu Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro
625 630 635 640
att agc aaa gtt ctg ttt cca cga gag cgc tat gca tcc gaa agt gaa 1968
Ile Ser Lys Val Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu
645 650 655
cag ggg aat gaa ctt ctt tgc tta aca gag tac tct cag cca act acg 2016
Gln Gly Asn Glu Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr
660 665 670
ata gca gcc gca gta ggg gcc ttc gat att ttc aaa gcg gct ggc ttt 2064
Ile Ala Ala Ala Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe
675 680 685
aag cca gac atg gtt gga ggg cat tca ctt ggc gaa ttt gct gct ttg 2112
Lys Pro Asp Met Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu
690 695 700
tac gcg gct ggg tcc att tcg cgt gac gac ctg tac aag ctt gtg tgc 2160
Tyr Ala Ala Gly Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys
705 710 715 720
aaa cgg gca aag gca atg gcg aac gct agt gac gga gct atg gca gca 2208
Lys Arg Ala Lys Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala
725 730 735
gtg att ggc cca gat gca cgt cta gtt acg cca caa aat agt gac gtt 2256
Val Ile Gly Pro Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val
740 745 750
tat gtc gca aac ttc aac tcc gca act caa gta gtc atc agt ggc act 2304
Tyr Val Ala Asn Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr
755 760 765
gtt caa ggt gtg aaa gaa gag tcg aaa ttg ctc att tca aag ggg ttc 2352
Val Gln Gly Val Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe
770 775 780
cgc gta ctg cca ctt aaa tgc cag ggc gcc ttc cat tct cct ttg atg 2400
Arg Val Leu Pro Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met
785 790 795 800
ggg cct tct gag gat agt ttc aaa tca ctt gtg gag act tgt acc atc 2448
Gly Pro Ser Glu Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile
805 810 815
tcg ccg cca aaa aat gtg aaa ttc ttt tgc aat gtt agt ggc aag gaa 2496
Ser Pro Pro Lys Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu
820 825 830
agc cca aac cca aaa cag acc ctc aag tca cac atg acg tct agc gtt 2544
Ser Pro Asn Pro Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val
835 840 845
cag ttc gag gag cag att cgt aac atg tac gat gcc gga gca cgt gtt 2592
Gln Phe Glu Glu Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val
850 855 860
ttt ctg gag ttt gga ccc cgc caa gtc ctt gca aag ctt atc gcg gaa 2640
Phe Leu Glu Phe Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu
865 870 875 880
atg ttt ccc tcg tgt aca gct atc agc gtt aac ccc gcg agc agt ggt 2688
Met Phe Pro Ser Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly
885 890 895
gac agt gac gtg caa ctc cgc ctc gcc gcc gta aaa ttc gcg gtc tcg 2736
Asp Ser Asp Val Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser
900 905 910
ggt gca gcc ctt agc acc ttt gat cca tgg gag tat cgc aag cca caa 2784
Gly Ala Ala Leu Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln
915 920 925
gat ctt ctt att cga aaa cca cga aaa act gcc ctt gtt cta tca gca 2832
Asp Leu Leu Ile Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala
930 935 940
gca aca tat gtt tcc cca aag act ctt gca gaa cgt aaa aag gct atg 2880
Ala Thr Tyr Val Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met
945 950 955 960
gaa gat atc aag cta gta tcc att aca cca aga gat agt atg gta tca 2928
Glu Asp Ile Lys Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser
965 970 975
att gga aaa atc gcg caa gaa gta cgg aca gct aaa cag cct tta gaa 2976
Ile Gly Lys Ile Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu
980 985 990
acc gaa att cga aga ctc aac aaa gaa tta gaa cat ctc aag aga gag 3024
Thr Glu Ile Arg Arg Leu Asn Lys Glu Leu Glu His Leu Lys Arg Glu
995 1000 1005
cta gca gca gcc aaa gcg agt gtc aag tct gca tca aaa agc tct 3069
Leu Ala Ala Ala Lys Ala Ser Val Lys Ser Ala Ser Lys Ser Ser
1010 1015 1020
aaa gag cga tct gtc cta tca aag cac cgc gct ttg ctt caa aac 3114
Lys Glu Arg Ser Val Leu Ser Lys His Arg Ala Leu Leu Gln Asn
1025 1030 1035
att ttg caa gac tac gat gat ctt cgt gtg gtg cca ttc gct gtt 3159
Ile Leu Gln Asp Tyr Asp Asp Leu Arg Val Val Pro Phe Ala Val
1040 1045 1050
cgt tct gtt gca gtg gac aac acc gcg ccg tat gct gac caa gtt 3204
Arg Ser Val Ala Val Asp Asn Thr Ala Pro Tyr Ala Asp Gln Val
1055 1060 1065
tcg acc cca gcg tca gag cgg tcg gct tca ccg ctt ttc gag aaa 3249
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys
1070 1075 1080
cgc agt tcg gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg 3294
Arg Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala
1085 1090 1095
gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca atg 3339
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met
1100 1105 1110
atc gag atg gac atg gac ctg gag agt gag ctt ggc gtt gat agc 3384
Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
1115 1120 1125
atc aaa cgc gtg gag atc atg agc gag gtt caa acg ctg ctc agc 3429
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser
1130 1135 1140
gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag act gtt 3474
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val
1145 1150 1155
ggc gac gtc atc gag gcg atg aag ctg gaa ctc ggt gga ccc caa 3519
Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln
1160 1165 1170
ggc cag act ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tcc 3564
Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
1175 1180 1185
gag cct gct gta ccg acc tca tcg tca agc agt att gct aat gtt 3609
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val
1190 1195 1200
tcg tca gca cgc ctc gct gaa gct gaa gct gcg gta ctg agc gtt 3654
Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val
1205 1210 1215
ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg gac 3699
Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp
1220 1225 1230
atg gac ctg gag agc gag ctt ggc gtt gat agc atc aaa cgc gtg 3744
Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
1235 1240 1245
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc 3789
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser
1250 1255 1260
gac gtt gac gct ctg tca aga act aag act gtt ggc gac gtc atc 3834
Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile
1265 1270 1275
gag gcg atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg 3879
Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu
1280 1285 1290
acc gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta 3924
Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
1295 1300 1305
ccg acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc 3969
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg
1310 1315 1320
ctc gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag 4014
Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys
1325 1330 1335
aca ggc tac gac agc tca atg atc gag atg gac atg gac ctg gag 4059
Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu
1340 1345 1350
agc gag ctt ggc gtc gac agc atc aaa cgc gtg gag atc atg agc 4104
Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
1355 1360 1365
gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac gtt gac gct 4149
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala
1370 1375 1380
ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag 4194
Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys
1385 1390 1395
ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa tcg 4239
Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser
1400 1405 1410
atc cgt cag cca ccg gtg tcc gag cct gct gta ccg acc tca tcg 4284
Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
1415 1420 1425
tca agc agt att gct aat gtt ttg tca gca cgc ctc gct gaa gct 4329
Ser Ser Ser Ile Ala Asn Val Leu Ser Ala Arg Leu Ala Glu Ala
1430 1435 1440
gaa gcc gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac 4374
Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp
1445 1450 1455
agc tca atg atc gag atg gac atg gac ctg gag agc gag ctt ggc 4419
Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly
1460 1465 1470
gtt gat agc atc aaa cgc gtg gag atc atg agc gag gtt caa acg 4464
Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
1475 1480 1485
ttg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc 4509
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr
1490 1495 1500
aag act gtt ggc gac gtc atc gag gcg atg aag ctg gaa ctc ggt 4554
Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly
1505 1510 1515
gga ccc caa ggc cag act ttg acc gcg gaa tcg atc cgt cag cca 4599
Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro
1520 1525 1530
ccg gtg tct gag cct gct gta ccg acc tca tcg tca agc agt att 4644
Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
1535 1540 1545
gct aat gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta 4689
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val
1550 1555 1560
ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc 4734
Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile
1565 1570 1575
gag atg gac atg gac ctg gag agt gag ctt ggc gtc gac agc atc 4779
Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile
1580 1585 1590
aaa cgc gtg gag atc atg agc gag gtt caa acg ctg ctc agc gtg 4824
Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
1595 1600 1605
gaa gtc tcc gac gtt gac gct ctg tca aga acc aag act gtt ggc 4869
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly
1610 1615 1620
gac gtc atc gag gcg atg aag ctg gaa ctc ggt gga ccc caa ggc 4914
Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly
1625 1630 1635
cag act ttg acc tct gaa ccg atc cat cag cca cca gtg tcc gag 4959
Gln Thr Leu Thr Ser Glu Pro Ile His Gln Pro Pro Val Ser Glu
1640 1645 1650
cct gct gta ccg acc tca tcg tca agc agt att gct aat gtt tct 5004
Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
1655 1660 1665
tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg agc gtt ctc 5049
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu
1670 1675 1680
gca gac aag aca ggc tac gac agc tca atg atc gag atg gac atg 5094
Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met
1685 1690 1695
gac ctg gag agc gag ctt ggc gtt gat agc atc aaa cgc gtg gaa 5139
Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu
1700 1705 1710
atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac 5184
Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
1715 1720 1725
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag 5229
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu
1730 1735 1740
gcg atg aag atg gaa ctc ggt gga ccc caa ggc cag act ttg acc 5274
Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr
1745 1750 1755
gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta ccg 5319
Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro
1760 1765 1770
acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc ctc 5364
Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
1775 1780 1785
gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag aca 5409
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr
1790 1795 1800
ggc tac gac agc tca atg atc gag atg gac atg gac ctg gag agc 5454
Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser
1805 1810 1815
gag ctt ggc gtt gat agc atc aaa cgc gtg gag atc atg agc gag 5499
Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu
1820 1825 1830
gtt caa gcg ctg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg 5544
Val Gln Ala Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
1835 1840 1845
tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag atg 5589
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Met
1850 1855 1860
gaa ctc ggt gga ccc caa ggc cag act ttg acc gca gaa tcg atc 5634
Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile
1865 1870 1875
cgt gag cca ccg gtg tct gag cct gct gta ccg acc tca tcg tca 5679
Arg Glu Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser
1880 1885 1890
agt agt atc gct aat gtt tct tca gct cgc ctc gct gaa gct gaa 5724
Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
1895 1900 1905
gcc gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc 5769
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser
1910 1915 1920
tca atg atc gag atg gac atg gac ctg gag agt gag ctt ggc gtc 5814
Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val
1925 1930 1935
gac agc atc aaa cgc gtg gag atc atg agc gag gtt caa acg ttg 5859
Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu
1940 1945 1950
ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag 5904
Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
1955 1960 1965
act gtt ggc gac gtc atc gag gcg atg aag ctg gaa ctt ggg gaa 5949
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Glu
1970 1975 1980
tca tca agt att gag act ctc aat tgt acc gag gtt gag cac acg 5994
Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu His Thr
1985 1990 1995
agc tac aaa agt gtc aag gct tca ggg tgt gag aat gta gat acc 6039
Ser Tyr Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr
2000 2005 2010
cgt ttc gct aag gtt gta caa atc tcg ctt cct agc aag ctg aaa 6084
Arg Phe Ala Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys
2015 2020 2025
tcc act gtg tcg cac gat cga cct gta att gtt gta gat gat gga 6129
Ser Thr Val Ser His Asp Arg Pro Val Ile Val Val Asp Asp Gly
2030 2035 2040
acg ccc tta acc acg gag ctt tgt aaa att ctt ggg ggt aat att 6174
Thr Pro Leu Thr Thr Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile
2045 2050 2055
gtg gtt ctc tct tat caa ggg aag ccc gct ggt cca cgg gga gtc 6219
Val Val Leu Ser Tyr Gln Gly Lys Pro Ala Gly Pro Arg Gly Val
2060 2065 2070
gag gtg cca gat ctt tcc gag gaa gcc cta att caa gct ctt gca 6264
Glu Val Pro Asp Leu Ser Glu Glu Ala Leu Ile Gln Ala Leu Ala
2075 2080 2085
ttg att cgg tct aca tat gga gtt cca att ggt ttt att tgt cag 6309
Leu Ile Arg Ser Thr Tyr Gly Val Pro Ile Gly Phe Ile Cys Gln
2090 2095 2100
caa gtg tct aat gtg agc acc aag gca cag ctt tgt tgg gca ctc 6354
Gln Val Ser Asn Val Ser Thr Lys Ala Gln Leu Cys Trp Ala Leu
2105 2110 2115
ctc gca gcg aag cat ctc aag aag gat ttg aat gct gtc tta ccc 6399
Leu Ala Ala Lys His Leu Lys Lys Asp Leu Asn Ala Val Leu Pro
2120 2125 2130
gat tca aga tcc ttc ttc gtc gga gtt gta cgc ttg aac ggg aaa 6444
Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg Leu Asn Gly Lys
2135 2140 2145
ctt gga act ttc gaa aac atc agc gac ttc tct aaa ttt gat ttg 6489
Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys Phe Asp Leu
2150 2155 2160
acg aaa gcc cta gat tac gga cag cgt ggt tct ctc tta ggc ctg 6534
Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu Gly Leu
2165 2170 2175
tgc aag tca cta gac tta gaa tgg gaa cag gtg ttt tgc cgt gga 6579
Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg Gly
2180 2185 2190
ata gat ctt gcg tgt gat ctt atg cca ctc cag gcc gca agg ata 6624
Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
2195 2200 2205
ctc aga aat gag ctt cag tgt ccc aat atg cgc ctt cgc gag gtt 6669
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val
2210 2215 2220
ggg tac gat att tct ggc gcc agg tac acc att tca acc gat gac 6714
Gly Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp
2225 2230 2235
ctg cta tgt gga ccc tcg aag gct aaa gta gag gcc gca gac ttg 6759
Leu Leu Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu
2240 2245 2250
ttt ctt gtg aca ggt ggc gca cga ggt att aca cct cat tgt gtt 6804
Phe Leu Val Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val
2255 2260 2265
cgt gag att gca agt cga tcc ccc gga acc aca ttt gtg ctg gtt 6849
Arg Glu Ile Ala Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val
2270 2275 2280
gga aga agc gaa atg tcc gac gag cct gac tgg gct gtt ggc cac 6894
Gly Arg Ser Glu Met Ser Asp Glu Pro Asp Trp Ala Val Gly His
2285 2290 2295
tac aat aaa gac ctg gac caa agc aca atg aaa cac ttg aaa gca 6939
Tyr Asn Lys Asp Leu Asp Gln Ser Thr Met Lys His Leu Lys Ala
2300 2305 2310
acg cat gct gct gga ggg gta aaa cct acg cct aaa gca cat cgt 6984
Thr His Ala Ala Gly Gly Val Lys Pro Thr Pro Lys Ala His Arg
2315 2320 2325
gca ctt gtg aac agg gtc act ggc tca cgg gag gta cga gaa tct 7029
Ala Leu Val Asn Arg Val Thr Gly Ser Arg Glu Val Arg Glu Ser
2330 2335 2340
ctt aga gca atc cag gag gca ggg gca aat gtc gaa tat atc gcc 7074
Leu Arg Ala Ile Gln Glu Ala Gly Ala Asn Val Glu Tyr Ile Ala
2345 2350 2355
tgt gat gtt tcg gat gaa aac aag gtc cgc caa ctt gtg caa aga 7119
Cys Asp Val Ser Asp Glu Asn Lys Val Arg Gln Leu Val Gln Arg
2360 2365 2370
gtg gag caa aag tat ggc tgt gaa ata act ggg att tgg cat gca 7164
Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly Ile Trp His Ala
2375 2380 2385
agc ggg gtt ctt cgt gac aaa ctt gtc gag caa aag act aca gac 7209
Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys Thr Thr Asp
2390 2395 2400
gac ttt gag gca gtt ttt ggg acc aag gtg act ggc ctt gta aac 7254
Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu Val Asn
2405 2410 2415
atc gtg tca caa gtc aat atg tct aag cta cga cac ttc atc ctc 7299
Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile Leu
2420 2425 2430
ttc agt tct ttg gct gga ttt cat ggg aac aag ggc caa acg gat 7344
Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
2435 2440 2445
tat gca att gct aat gaa gcc ttg aac aaa atc gcg cat act ctc 7389
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu
2450 2455 2460
tca gcg ttt ttg ccc aaa ctg aat gca aag gtg cta gac ttc ggt 7434
Ser Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly
2465 2470 2475
ccg tgg gta ggt tca gga atg gta acc gaa aca ctt gag aag cat 7479
Pro Trp Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His
2480 2485 2490
ttt aaa gct atg ggg gtt cag act att cct ctc gag cca gga gca 7524
Phe Lys Ala Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala
2495 2500 2505
cgg act gtt gcg caa atc att ttg gca agt tcg cca ccg caa tcg 7569
Arg Thr Val Ala Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser
2510 2515 2520
ctt ttg ggg aac tgg ggc ttt cca gcc acc aaa ccg cta caa cgc 7614
Leu Leu Gly Asn Trp Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg
2525 2530 2535
tct aat gta gtc acg ggc aca ctc tct ccg gaa gag ata gaa ttc 7659
Ser Asn Val Val Thr Gly Thr Leu Ser Pro Glu Glu Ile Glu Phe
2540 2545 2550
atc gca gac cac aaa att caa ggc cgc aag gtg ctt ccc atg atg 7704
Ile Ala Asp His Lys Ile Gln Gly Arg Lys Val Leu Pro Met Met
2555 2560 2565
gct gca atc ggg ttc atg gcc tct att gcg gaa gga ctc tac ccg 7749
Ala Ala Ile Gly Phe Met Ala Ser Ile Ala Glu Gly Leu Tyr Pro
2570 2575 2580
ggg tac aat ctg caa ggc gtg gaa aat gct cag ctc ttt caa ggc 7794
Gly Tyr Asn Leu Gln Gly Val Glu Asn Ala Gln Leu Phe Gln Gly
2585 2590 2595
ttg act atc aac caa gag aca aaa ttt caa atc act ctc att gag 7839
Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln Ile Thr Leu Ile Glu
2600 2605 2610
gag cac aac tct gag gaa aac ctg gat gtc ctg aca tcc ctt ggt 7884
Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu Thr Ser Leu Gly
2615 2620 2625
gta atg ttg gaa agc ggg aag gtg ctt ccc gct tac cga tgt gtt 7929
Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr Arg Cys Val
2630 2635 2640
gta tgc ttg aat aca acc cag cag cag ccc aag cta tct cca aaa 7974
Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser Pro Lys
2645 2650 2655
att ctt aac ttg gaa gtt gac cct gca tgc gag gtt aac ccc tat 8019
Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro Tyr
2660 2665 2670
gat gga aag tcg ttg ttc cac ggt ccg ctt ttg caa ttc gtt caa 8064
Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
2675 2680 2685
caa gtg ttg cac tca agt acc aaa ggc ctc gtt gcc aag tgc cgc 8109
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg
2690 2695 2700
gcg ctt cca atc aaa gaa gcc atc cga ggg cca ttt atc aag caa 8154
Ala Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln
2705 2710 2715
aca ctc cat gat cca att cta gac gac gtc att ttt cag cta atg 8199
Thr Leu His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met
2720 2725 2730
ctc gtg tgg tgt cgt aat gct cta gga agt gca tcg cta ccc aac 8244
Leu Val Trp Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn
2735 2740 2745
aga att gaa aag atg tca tac ttt ggg aat gtc tca gaa ggt agc 8289
Arg Ile Glu Lys Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser
2750 2755 2760
act ttc ttt gcc tca gtt aca cct gtg gga cca aga gta cca aag 8334
Thr Phe Phe Ala Ser Val Thr Pro Val Gly Pro Arg Val Pro Lys
2765 2770 2775
gat ccc gtg atc aaa atg cag ttt ctt ctc caa gat gaa tcc ggc 8379
Asp Pro Val Ile Lys Met Gln Phe Leu Leu Gln Asp Glu Ser Gly
2780 2785 2790
aac aca ttt tca tcg ggg gag ggc tcg gtt gtg ctt agt gac gaa 8424
Asn Thr Phe Ser Ser Gly Glu Gly Ser Val Val Leu Ser Asp Glu
2795 2800 2805
ctc gtc ttt tga 8436
Leu Val Phe
2810
<210> 39
<211> 2811
<212> PRT
<213> Thraustochytrium sp.
<400> 39
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1 5 10 15
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
20 25 30
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
35 40 45
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
50 55 60
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65 70 75 80
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
85 90 95
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
100 105 110
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
115 120 125
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
130 135 140
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145 150 155 160
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
165 170 175
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
180 185 190
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
195 200 205
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
210 215 220
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225 230 235 240
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
245 250 255
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
260 265 270
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
275 280 285
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
290 295 300
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305 310 315 320
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
325 330 335
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
340 345 350
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
355 360 365
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
370 375 380
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385 390 395 400
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
405 410 415
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
420 425 430
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
435 440 445
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
450 455 460
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465 470 475 480
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
485 490 495
Cys Asn Asp Gln Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys
500 505 510
Thr His Lys Asn Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu
515 520 525
Phe Gln Leu Gln Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe
530 535 540
Leu Ala Thr Leu Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile
545 550 555 560
Leu Ala Gln Leu Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro
565 570 575
His Lys Lys Ala Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly
580 585 590
Ser Val Ala Ala Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met
595 600 605
Phe Ser Asp Val Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val
610 615 620
Ala Met Glu Glu Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro
625 630 635 640
Ile Ser Lys Val Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu
645 650 655
Gln Gly Asn Glu Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr
660 665 670
Ile Ala Ala Ala Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe
675 680 685
Lys Pro Asp Met Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu
690 695 700
Tyr Ala Ala Gly Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys
705 710 715 720
Lys Arg Ala Lys Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala
725 730 735
Val Ile Gly Pro Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val
740 745 750
Tyr Val Ala Asn Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr
755 760 765
Val Gln Gly Val Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe
770 775 780
Arg Val Leu Pro Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met
785 790 795 800
Gly Pro Ser Glu Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile
805 810 815
Ser Pro Pro Lys Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu
820 825 830
Ser Pro Asn Pro Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val
835 840 845
Gln Phe Glu Glu Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val
850 855 860
Phe Leu Glu Phe Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu
865 870 875 880
Met Phe Pro Ser Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly
885 890 895
Asp Ser Asp Val Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser
900 905 910
Gly Ala Ala Leu Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln
915 920 925
Asp Leu Leu Ile Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala
930 935 940
Ala Thr Tyr Val Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met
945 950 955 960
Glu Asp Ile Lys Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser
965 970 975
Ile Gly Lys Ile Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu
980 985 990
Thr Glu Ile Arg Arg Leu Asn Lys Glu Leu Glu His Leu Lys Arg Glu
995 1000 1005
Leu Ala Ala Ala Lys Ala Ser Val Lys Ser Ala Ser Lys Ser Ser
1010 1015 1020
Lys Glu Arg Ser Val Leu Ser Lys His Arg Ala Leu Leu Gln Asn
1025 1030 1035
Ile Leu Gln Asp Tyr Asp Asp Leu Arg Val Val Pro Phe Ala Val
1040 1045 1050
Arg Ser Val Ala Val Asp Asn Thr Ala Pro Tyr Ala Asp Gln Val
1055 1060 1065
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys
1070 1075 1080
Arg Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala
1085 1090 1095
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met
1100 1105 1110
Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
1115 1120 1125
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser
1130 1135 1140
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val
1145 1150 1155
Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln
1160 1165 1170
Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
1175 1180 1185
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val
1190 1195 1200
Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val
1205 1210 1215
Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp
1220 1225 1230
Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
1235 1240 1245
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser
1250 1255 1260
Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile
1265 1270 1275
Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu
1280 1285 1290
Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
1295 1300 1305
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg
1310 1315 1320
Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys
1325 1330 1335
Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu
1340 1345 1350
Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
1355 1360 1365
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala
1370 1375 1380
Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys
1385 1390 1395
Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser
1400 1405 1410
Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
1415 1420 1425
Ser Ser Ser Ile Ala Asn Val Leu Ser Ala Arg Leu Ala Glu Ala
1430 1435 1440
Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp
1445 1450 1455
Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly
1460 1465 1470
Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
1475 1480 1485
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr
1490 1495 1500
Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly
1505 1510 1515
Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro
1520 1525 1530
Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
1535 1540 1545
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val
1550 1555 1560
Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile
1565 1570 1575
Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile
1580 1585 1590
Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
1595 1600 1605
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly
1610 1615 1620
Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly
1625 1630 1635
Gln Thr Leu Thr Ser Glu Pro Ile His Gln Pro Pro Val Ser Glu
1640 1645 1650
Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
1655 1660 1665
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu
1670 1675 1680
Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met
1685 1690 1695
Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu
1700 1705 1710
Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
1715 1720 1725
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu
1730 1735 1740
Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr
1745 1750 1755
Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro
1760 1765 1770
Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
1775 1780 1785
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr
1790 1795 1800
Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser
1805 1810 1815
Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu
1820 1825 1830
Val Gln Ala Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
1835 1840 1845
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Met
1850 1855 1860
Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile
1865 1870 1875
Arg Glu Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser
1880 1885 1890
Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
1895 1900 1905
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser
1910 1915 1920
Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val
1925 1930 1935
Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu
1940 1945 1950
Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
1955 1960 1965
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Glu
1970 1975 1980
Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu His Thr
1985 1990 1995
Ser Tyr Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr
2000 2005 2010
Arg Phe Ala Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys
2015 2020 2025
Ser Thr Val Ser His Asp Arg Pro Val Ile Val Val Asp Asp Gly
2030 2035 2040
Thr Pro Leu Thr Thr Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile
2045 2050 2055
Val Val Leu Ser Tyr Gln Gly Lys Pro Ala Gly Pro Arg Gly Val
2060 2065 2070
Glu Val Pro Asp Leu Ser Glu Glu Ala Leu Ile Gln Ala Leu Ala
2075 2080 2085
Leu Ile Arg Ser Thr Tyr Gly Val Pro Ile Gly Phe Ile Cys Gln
2090 2095 2100
Gln Val Ser Asn Val Ser Thr Lys Ala Gln Leu Cys Trp Ala Leu
2105 2110 2115
Leu Ala Ala Lys His Leu Lys Lys Asp Leu Asn Ala Val Leu Pro
2120 2125 2130
Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg Leu Asn Gly Lys
2135 2140 2145
Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys Phe Asp Leu
2150 2155 2160
Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu Gly Leu
2165 2170 2175
Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg Gly
2180 2185 2190
Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
2195 2200 2205
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val
2210 2215 2220
Gly Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp
2225 2230 2235
Leu Leu Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu
2240 2245 2250
Phe Leu Val Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val
2255 2260 2265
Arg Glu Ile Ala Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val
2270 2275 2280
Gly Arg Ser Glu Met Ser Asp Glu Pro Asp Trp Ala Val Gly His
2285 2290 2295
Tyr Asn Lys Asp Leu Asp Gln Ser Thr Met Lys His Leu Lys Ala
2300 2305 2310
Thr His Ala Ala Gly Gly Val Lys Pro Thr Pro Lys Ala His Arg
2315 2320 2325
Ala Leu Val Asn Arg Val Thr Gly Ser Arg Glu Val Arg Glu Ser
2330 2335 2340
Leu Arg Ala Ile Gln Glu Ala Gly Ala Asn Val Glu Tyr Ile Ala
2345 2350 2355
Cys Asp Val Ser Asp Glu Asn Lys Val Arg Gln Leu Val Gln Arg
2360 2365 2370
Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly Ile Trp His Ala
2375 2380 2385
Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys Thr Thr Asp
2390 2395 2400
Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu Val Asn
2405 2410 2415
Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile Leu
2420 2425 2430
Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
2435 2440 2445
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu
2450 2455 2460
Ser Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly
2465 2470 2475
Pro Trp Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His
2480 2485 2490
Phe Lys Ala Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala
2495 2500 2505
Arg Thr Val Ala Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser
2510 2515 2520
Leu Leu Gly Asn Trp Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg
2525 2530 2535
Ser Asn Val Val Thr Gly Thr Leu Ser Pro Glu Glu Ile Glu Phe
2540 2545 2550
Ile Ala Asp His Lys Ile Gln Gly Arg Lys Val Leu Pro Met Met
2555 2560 2565
Ala Ala Ile Gly Phe Met Ala Ser Ile Ala Glu Gly Leu Tyr Pro
2570 2575 2580
Gly Tyr Asn Leu Gln Gly Val Glu Asn Ala Gln Leu Phe Gln Gly
2585 2590 2595
Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln Ile Thr Leu Ile Glu
2600 2605 2610
Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu Thr Ser Leu Gly
2615 2620 2625
Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr Arg Cys Val
2630 2635 2640
Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser Pro Lys
2645 2650 2655
Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro Tyr
2660 2665 2670
Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
2675 2680 2685
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg
2690 2695 2700
Ala Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln
2705 2710 2715
Thr Leu His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met
2720 2725 2730
Leu Val Trp Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn
2735 2740 2745
Arg Ile Glu Lys Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser
2750 2755 2760
Thr Phe Phe Ala Ser Val Thr Pro Val Gly Pro Arg Val Pro Lys
2765 2770 2775
Asp Pro Val Ile Lys Met Gln Phe Leu Leu Gln Asp Glu Ser Gly
2780 2785 2790
Asn Thr Phe Ser Ser Gly Glu Gly Ser Val Val Leu Ser Asp Glu
2795 2800 2805
Leu Val Phe
2810
<210> 40
<211> 1500
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 40
atg aag gac atg gaa gat aga cgg gtc gct att gtg ggc atg tca gct 48
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1 5 10 15
cac ttg cct tgt ggg aca gat gtg aag gaa tca tgg cag gct att cgc 96
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
20 25 30
gat gga atc gac tgt cta agt gac cta ccc gcg gat cgt ctc gac gtt 144
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
35 40 45
aca gct tac tac aat ccc aac aaa gcc acg aaa gac aag atc tac tgc 192
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
50 55 60
aaa cgg ggt ggc ttc atc ccg aac tat gac ttc gac ccc cgc gaa ttt 240
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65 70 75 80
ggg ctc aac atg ttt caa atg gaa gac tct gat gcg aat cag aca ctt 288
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
85 90 95
acc ttg ctc aaa gtc aaa caa gct ctc gaa gat gca agc ata gag cct 336
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
100 105 110
ttc acc aag gag aag aag aac att gga tgt gtt tta ggt att ggt ggg 384
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
115 120 125
ggc caa aag gcg agt cat gag ttc tac tct cgt ctc aac tac gtt gtc 432
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
130 135 140
gtt gaa aag gta ctt cgg aaa atg ggt tta cca gat gct gat gtt gaa 480
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145 150 155 160
gaa gct gtg gag aaa tac aag gca aat ttt ccc gag tgg cgc cta gac 528
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
165 170 175
tct ttc cct ggg ttt ctt ggg aat gta acg gct ggt cgg tgc agt aac 576
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
180 185 190
acc ttc aac atg gaa ggt atg aac tgc gtt gtg gat gct gca tgt gcc 624
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
195 200 205
agt tct cta att gca atc aag gtt gca gtt gaa gag cta ctc ttt ggt 672
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
210 215 220
gac tgt gac acc atg att gca ggt gcc acc tgc acg gac aat tca ctt 720
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225 230 235 240
ggc atg tac atg gcc ttc tct aaa acg cca gtt ttt tct act gac cca 768
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
245 250 255
agt gtc cgc gcg tat gat gag aaa aca aaa ggg atg cta att gga gaa 816
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
260 265 270
ggt tca gca atg ttc gtt ctt aaa cgc tat gcg gat gcc gta cgt gat 864
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
275 280 285
ggc gac aca att cac gcg gtt ctg cgt tct tgc tct tcg tct agt gat 912
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
290 295 300
gga aaa gcg gca gga att tat act cct act ata tct gga caa gaa gaa 960
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305 310 315 320
gct ttg cgt cga gcg tat gcc cgt gcg ggg gta tgt cca tct acg atc 1008
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
325 330 335
ggg ctt gtt gag ggt cac ggg aca ggg acc cct gtt gga gat cgc att 1056
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
340 345 350
gag tta aca gct ctg cgg aac ttg ttt gac aaa gct ttt ggt agc aag 1104
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
355 360 365
aag gaa caa ata gca gtt ggc agc ata aag tct cag ata ggt cac ctg 1152
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
370 375 380
aaa tct gtt gcc ggc ttt gcc ggc ttg gtc aaa gct gtg ctt gcg ctt 1200
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385 390 395 400
aaa cac aaa acg ctc cca ggt tcg att aat gtc gac cag cca cct ttg 1248
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
405 410 415
ttg tat gac ggt act caa att caa gac tct tct tta tat atc aac aag 1296
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
420 425 430
aca aat aga cca tgg ttt acg caa aac aag ctt ccg cgt cgg gct ggt 1344
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
435 440 445
gtc tca agt ttt gga ttt gga ggt gca aac tac cac gcg gtt ctg gaa 1392
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
450 455 460
gaa ttc gag ccc gag cat gaa aaa cca tac cgc ctc aat act gtt gga 1440
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465 470 475 480
cat cct gtc ctc ttg tac gct ccg tct gtg gaa gcc ctc aaa gta ctt 1488
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
485 490 495
tgc aac gac cag 1500
Cys Asn Asp Gln
500
<210> 41
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<400> 41
Met Lys Asp Met Glu Asp Arg Arg Val Ala Ile Val Gly Met Ser Ala
1 5 10 15
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gln Ala Ile Arg
20 25 30
Asp Gly Ile Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val
35 40 45
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys Ile Tyr Cys
50 55 60
Lys Arg Gly Gly Phe Ile Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe
65 70 75 80
Gly Leu Asn Met Phe Gln Met Glu Asp Ser Asp Ala Asn Gln Thr Leu
85 90 95
Thr Leu Leu Lys Val Lys Gln Ala Leu Glu Asp Ala Ser Ile Glu Pro
100 105 110
Phe Thr Lys Glu Lys Lys Asn Ile Gly Cys Val Leu Gly Ile Gly Gly
115 120 125
Gly Gln Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val
130 135 140
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu
145 150 155 160
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp
165 170 175
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn
180 185 190
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala
195 200 205
Ser Ser Leu Ile Ala Ile Lys Val Ala Val Glu Glu Leu Leu Phe Gly
210 215 220
Asp Cys Asp Thr Met Ile Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu
225 230 235 240
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro
245 250 255
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu Ile Gly Glu
260 265 270
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp
275 280 285
Gly Asp Thr Ile His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp
290 295 300
Gly Lys Ala Ala Gly Ile Tyr Thr Pro Thr Ile Ser Gly Gln Glu Glu
305 310 315 320
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr Ile
325 330 335
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg Ile
340 345 350
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys
355 360 365
Lys Glu Gln Ile Ala Val Gly Ser Ile Lys Ser Gln Ile Gly His Leu
370 375 380
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu
385 390 395 400
Lys His Lys Thr Leu Pro Gly Ser Ile Asn Val Asp Gln Pro Pro Leu
405 410 415
Leu Tyr Asp Gly Thr Gln Ile Gln Asp Ser Ser Leu Tyr Ile Asn Lys
420 425 430
Thr Asn Arg Pro Trp Phe Thr Gln Asn Lys Leu Pro Arg Arg Ala Gly
435 440 445
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu
450 455 460
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly
465 470 475 480
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu
485 490 495
Cys Asn Asp Gln
500
<210> 42
<211> 1500
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 42
ctt gcg gag ctc aca att gca ttg gaa gag gca aaa aca cat aaa aat 48
Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys Thr His Lys Asn
1 5 10 15
gtt gac aaa gtt tgt ggc tac aag ttt att gac gaa ttt cag ctc caa 96
Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu Phe Gln Leu Gln
20 25 30
gga agc tgt cct cca gaa aat ccg aga gta gga ttt tta gca aca ctg 144
Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe Leu Ala Thr Leu
35 40 45
cct act tca aat atc att gtc gcg ctt aag gca att ctc gcg cag ctt 192
Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile Leu Ala Gln Leu
50 55 60
gat gca aaa cca gat gcg aag aaa tgg gat ttg cct cat aaa aag gct 240
Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro His Lys Lys Ala
65 70 75 80
ttt ggg gct acc ttc gca tcg tct tca gtg aaa ggc tct gtt gct gcg 288
Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly Ser Val Ala Ala
85 90 95
ctc ttc gca gga cag ggt acc cag tac tta aac atg ttc tct gat gtg 336
Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met Phe Ser Asp Val
100 105 110
gca atg aac tgg cca ccg ttc cgt gac agc att gtc gca atg gaa gaa 384
Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val Ala Met Glu Glu
115 120 125
gct caa act gag gta ttt gag ggc caa gtt gaa cca att agc aaa gtt 432
Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro Ile Ser Lys Val
130 135 140
ctg ttt cca cga gag cgc tat gca tcc gaa agt gaa cag ggg aat gaa 480
Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu Gln Gly Asn Glu
145 150 155 160
ctt ctt tgc tta aca gag tac tct cag cca act acg ata gca gcc gca 528
Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr Ile Ala Ala Ala
165 170 175
gta ggg gcc ttc gat att ttc aaa gcg gct ggc ttt aag cca gac atg 576
Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe Lys Pro Asp Met
180 185 190
gtt gga ggg cat tca ctt ggc gaa ttt gct gct ttg tac gcg gct ggg 624
Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly
195 200 205
tcc att tcg cgt gac gac ctg tac aag ctt gtg tgc aaa cgg gca aag 672
Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys Lys Arg Ala Lys
210 215 220
gca atg gcg aac gct agt gac gga gct atg gca gca gtg att ggc cca 720
Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala Val Ile Gly Pro
225 230 235 240
gat gca cgt cta gtt acg cca caa aat agt gac gtt tat gtc gca aac 768
Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val Tyr Val Ala Asn
245 250 255
ttc aac tcc gca act caa gta gtc atc agt ggc act gtt caa ggt gtg 816
Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr Val Gln Gly Val
260 265 270
aaa gaa gag tcg aaa ttg ctc att tca aag ggg ttc cgc gta ctg cca 864
Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe Arg Val Leu Pro
275 280 285
ctt aaa tgc cag ggc gcc ttc cat tct cct ttg atg ggg cct tct gag 912
Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met Gly Pro Ser Glu
290 295 300
gat agt ttc aaa tca ctt gtg gag act tgt acc atc tcg ccg cca aaa 960
Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile Ser Pro Pro Lys
305 310 315 320
aat gtg aaa ttc ttt tgc aat gtt agt ggc aag gaa agc cca aac cca 1008
Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu Ser Pro Asn Pro
325 330 335
aaa cag acc ctc aag tca cac atg acg tct agc gtt cag ttc gag gag 1056
Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val Gln Phe Glu Glu
340 345 350
cag att cgt aac atg tac gat gcc gga gca cgt gtt ttt ctg gag ttt 1104
Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val Phe Leu Glu Phe
355 360 365
gga ccc cgc caa gtc ctt gca aag ctt atc gcg gaa atg ttt ccc tcg 1152
Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu Met Phe Pro Ser
370 375 380
tgt aca gct atc agc gtt aac ccc gcg agc agt ggt gac agt gac gtg 1200
Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly Asp Ser Asp Val
385 390 395 400
caa ctc cgc ctc gcc gcc gta aaa ttc gcg gtc tcg ggt gca gcc ctt 1248
Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser Gly Ala Ala Leu
405 410 415
agc acc ttt gat cca tgg gag tat cgc aag cca caa gat ctt ctt att 1296
Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln Asp Leu Leu Ile
420 425 430
cga aaa cca cga aaa act gcc ctt gtt cta tca gca gca aca tat gtt 1344
Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala Ala Thr Tyr Val
435 440 445
tcc cca aag act ctt gca gaa cgt aaa aag gct atg gaa gat atc aag 1392
Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met Glu Asp Ile Lys
450 455 460
cta gta tcc att aca cca aga gat agt atg gta tca att gga aaa atc 1440
Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser Ile Gly Lys Ile
465 470 475 480
gcg caa gaa gta cgg aca gct aaa cag cct tta gaa acc gaa att cga 1488
Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu Thr Glu Ile Arg
485 490 495
aga ctc aac aaa 1500
Arg Leu Asn Lys
500
<210> 43
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<400> 43
Leu Ala Glu Leu Thr Ile Ala Leu Glu Glu Ala Lys Thr His Lys Asn
1 5 10 15
Val Asp Lys Val Cys Gly Tyr Lys Phe Ile Asp Glu Phe Gln Leu Gln
20 25 30
Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe Leu Ala Thr Leu
35 40 45
Pro Thr Ser Asn Ile Ile Val Ala Leu Lys Ala Ile Leu Ala Gln Leu
50 55 60
Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro His Lys Lys Ala
65 70 75 80
Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly Ser Val Ala Ala
85 90 95
Leu Phe Ala Gly Gln Gly Thr Gln Tyr Leu Asn Met Phe Ser Asp Val
100 105 110
Ala Met Asn Trp Pro Pro Phe Arg Asp Ser Ile Val Ala Met Glu Glu
115 120 125
Ala Gln Thr Glu Val Phe Glu Gly Gln Val Glu Pro Ile Ser Lys Val
130 135 140
Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu Gln Gly Asn Glu
145 150 155 160
Leu Leu Cys Leu Thr Glu Tyr Ser Gln Pro Thr Thr Ile Ala Ala Ala
165 170 175
Val Gly Ala Phe Asp Ile Phe Lys Ala Ala Gly Phe Lys Pro Asp Met
180 185 190
Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly
195 200 205
Ser Ile Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys Lys Arg Ala Lys
210 215 220
Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala Val Ile Gly Pro
225 230 235 240
Asp Ala Arg Leu Val Thr Pro Gln Asn Ser Asp Val Tyr Val Ala Asn
245 250 255
Phe Asn Ser Ala Thr Gln Val Val Ile Ser Gly Thr Val Gln Gly Val
260 265 270
Lys Glu Glu Ser Lys Leu Leu Ile Ser Lys Gly Phe Arg Val Leu Pro
275 280 285
Leu Lys Cys Gln Gly Ala Phe His Ser Pro Leu Met Gly Pro Ser Glu
290 295 300
Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr Ile Ser Pro Pro Lys
305 310 315 320
Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu Ser Pro Asn Pro
325 330 335
Lys Gln Thr Leu Lys Ser His Met Thr Ser Ser Val Gln Phe Glu Glu
340 345 350
Gln Ile Arg Asn Met Tyr Asp Ala Gly Ala Arg Val Phe Leu Glu Phe
355 360 365
Gly Pro Arg Gln Val Leu Ala Lys Leu Ile Ala Glu Met Phe Pro Ser
370 375 380
Cys Thr Ala Ile Ser Val Asn Pro Ala Ser Ser Gly Asp Ser Asp Val
385 390 395 400
Gln Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser Gly Ala Ala Leu
405 410 415
Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gln Asp Leu Leu Ile
420 425 430
Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala Ala Thr Tyr Val
435 440 445
Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met Glu Asp Ile Lys
450 455 460
Leu Val Ser Ile Thr Pro Arg Asp Ser Met Val Ser Ile Gly Lys Ile
465 470 475 480
Ala Gln Glu Val Arg Thr Ala Lys Gln Pro Leu Glu Thr Glu Ile Arg
485 490 495
Arg Leu Asn Lys
500
<210> 44
<211> 351
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(351)
<400> 44
tcg acc cca gcg tca gag cgg tcg gct tca ccg ctt ttc gag aaa cgc 48
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1 5 10 15
agt tcg gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg 96
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
20 25 30
agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg 144
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
35 40 45
gac atg gac ctg gag agt gag ctt ggc gtt gat agc atc aaa cgc gtg 192
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
50 55 60
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac 240
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65 70 75 80
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg 288
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
85 90 95
atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa 336
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
100 105 110
tcg atc cgt cag cca 351
Ser Ile Arg Gln Pro
115
<210> 45
<211> 117
<212> PRT
<213> Thraustochytrium sp.
<400> 45
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1 5 10 15
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
20 25 30
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
35 40 45
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
50 55 60
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65 70 75 80
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
85 90 95
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
100 105 110
Ser Ile Arg Gln Pro
115
<210> 46
<211> 5
<212> PRT
<213> Thraustochytrium sp.
<220>
<221> MISC_FEATURE
<222> (1)..(5)
<223> Xaa = any amino acid
<400> 46
Leu Gly Xaa Asp Ser
1 5
<210> 47
<211> 2790
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(2790)
<400> 47
tcg acc cca gcg tca gag cgg tcg gct tca ccg ctt ttc gag aaa cgc 48
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1 5 10 15
agt tcg gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg 96
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
20 25 30
agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg 144
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
35 40 45
gac atg gac ctg gag agt gag ctt ggc gtt gat agc atc aaa cgc gtg 192
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
50 55 60
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac 240
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65 70 75 80
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg 288
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
85 90 95
atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa 336
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
100 105 110
tcg atc cgt cag cca ccg gtg tcc gag cct gct gta ccg acc tca tcg 384
Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
115 120 125
tca agc agt att gct aat gtt tcg tca gca cgc ctc gct gaa gct gaa 432
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
130 135 140
gct gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca 480
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
145 150 155 160
atg atc gag atg gac atg gac ctg gag agc gag ctt ggc gtt gat agc 528
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
165 170 175
atc aaa cgc gtg gag atc atg agc gag gtt caa acg ctg ctc agc gtg 576
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
180 185 190
gaa gtc tcc gac gtt gac gct ctg tca aga act aag act gtt ggc gac 624
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
195 200 205
gtc atc gag gcg atg aag ctg gaa ctc ggt gga ccc caa ggc cag act 672
Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr
210 215 220
ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta 720
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
225 230 235 240
ccg acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc ctc 768
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
245 250 255
gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag aca ggc 816
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
260 265 270
tac gac agc tca atg atc gag atg gac atg gac ctg gag agc gag ctt 864
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
275 280 285
ggc gtc gac agc atc aaa cgc gtg gag atc atg agc gag gtt caa acg 912
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
290 295 300
ctg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag 960
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
305 310 315 320
act gtt ggc gac gtc atc gag gcg atg aag ctg gaa ctc ggt gga ccc 1008
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro
325 330 335
caa ggc cag act ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tcc 1056
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
340 345 350
gag cct gct gta ccg acc tca tcg tca agc agt att gct aat gtt ttg 1104
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Leu
355 360 365
tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg agc gtt ctc gca 1152
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
370 375 380
gac aag aca ggc tac gac agc tca atg atc gag atg gac atg gac ctg 1200
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
385 390 395 400
gag agc gag ctt ggc gtt gat agc atc aaa cgc gtg gag atc atg agc 1248
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
405 410 415
gag gtt caa acg ttg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg 1296
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
420 425 430
tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag ctg gaa 1344
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
435 440 445
ctc ggt gga ccc caa ggc cag act ttg acc gcg gaa tcg atc cgt cag 1392
Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln
450 455 460
cca ccg gtg tct gag cct gct gta ccg acc tca tcg tca agc agt att 1440
Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
465 470 475 480
gct aat gtt tcg tca gca cgc ctc gct gaa gct gaa gcc gcg gta ctg 1488
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
485 490 495
agc gtt ctc gca gac aag aca ggc tac gac agc tca atg atc gag atg 1536
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
500 505 510
gac atg gac ctg gag agt gag ctt ggc gtc gac agc atc aaa cgc gtg 1584
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
515 520 525
gag atc atg agc gag gtt caa acg ctg ctc agc gtg gaa gtc tcc gac 1632
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
530 535 540
gtt gac gct ctg tca aga acc aag act gtt ggc gac gtc atc gag gcg 1680
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
545 550 555 560
atg aag ctg gaa ctc ggt gga ccc caa ggc cag act ttg acc tct gaa 1728
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ser Glu
565 570 575
ccg atc cat cag cca cca gtg tcc gag cct gct gta ccg acc tca tcg 1776
Pro Ile His Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
580 585 590
tca agc agt att gct aat gtt tct tca gca cgc ctc gct gaa gct gaa 1824
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
595 600 605
gcc gcg gta ctg agc gtt ctc gca gac aag aca ggc tac gac agc tca 1872
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
610 615 620
atg atc gag atg gac atg gac ctg gag agc gag ctt ggc gtt gat agc 1920
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
625 630 635 640
atc aaa cgc gtg gaa atc atg agc gag gtt caa acg ctg ctc agc gtg 1968
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
645 650 655
gaa gtc tcc gac gtt gac gct ctg tca aga acc aag act gtt ggc gac 2016
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
660 665 670
gtc atc gag gcg atg aag atg gaa ctc ggt gga ccc caa ggc cag act 2064
Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr
675 680 685
ttg acc gcg gaa tcg atc cgt cag cca ccg gtg tct gag cct gct gta 2112
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
690 695 700
ccg acc tca tcg tca agc agt att gct aat gtt tcg tca gca cgc ctc 2160
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
705 710 715 720
gct gaa gct gaa gcg gcg gta ctg agc gtt ctc gca gac aag aca ggc 2208
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
725 730 735
tac gac agc tca atg atc gag atg gac atg gac ctg gag agc gag ctt 2256
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
740 745 750
ggc gtt gat agc atc aaa cgc gtg gag atc atg agc gag gtt caa gcg 2304
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Ala
755 760 765
ctg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg tca aga acc aag 2352
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
770 775 780
act gtt ggc gac gtc atc gag gcg atg aag atg gaa ctc ggt gga ccc 2400
Thr Val Gly Asp Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro
785 790 795 800
caa ggc cag act ttg acc gca gaa tcg atc cgt gag cca ccg gtg tct 2448
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Glu Pro Pro Val Ser
805 810 815
gag cct gct gta ccg acc tca tcg tca agt agt atc gct aat gtt tct 2496
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
820 825 830
tca gct cgc ctc gct gaa gct gaa gcc gcg gta ctg agc gtt ctc gca 2544
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
835 840 845
gac aag aca ggc tac gac agc tca atg atc gag atg gac atg gac ctg 2592
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
850 855 860
gag agt gag ctt ggc gtc gac agc atc aaa cgc gtg gag atc atg agc 2640
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
865 870 875 880
gag gtt caa acg ttg ctc agc gtg gaa gtc tcc gac gtt gac gct ctg 2688
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
885 890 895
tca aga acc aag act gtt ggc gac gtc atc gag gcg atg aag ctg gaa 2736
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
900 905 910
ctt ggg gaa tca tca agt att gag act ctc aat tgt acc gag gtt gag 2784
Leu Gly Glu Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu
915 920 925
cac acg 2790
His Thr
930
<210> 48
<211> 930
<212> PRT
<213> Thraustochytrium sp.
<400> 48
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg
1 5 10 15
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
20 25 30
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
35 40 45
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
50 55 60
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
65 70 75 80
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
85 90 95
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu
100 105 110
Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
115 120 125
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
130 135 140
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
145 150 155 160
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
165 170 175
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
180 185 190
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
195 200 205
Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr
210 215 220
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
225 230 235 240
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
245 250 255
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
260 265 270
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
275 280 285
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr
290 295 300
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
305 310 315 320
Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu Leu Gly Gly Pro
325 330 335
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser
340 345 350
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Leu
355 360 365
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
370 375 380
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
385 390 395 400
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
405 410 415
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
420 425 430
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
435 440 445
Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Gln
450 455 460
Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile
465 470 475 480
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu
485 490 495
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met
500 505 510
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val
515 520 525
Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp
530 535 540
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala
545 550 555 560
Met Lys Leu Glu Leu Gly Gly Pro Gln Gly Gln Thr Leu Thr Ser Glu
565 570 575
Pro Ile His Gln Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser
580 585 590
Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu
595 600 605
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser
610 615 620
Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser
625 630 635 640
Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Thr Leu Leu Ser Val
645 650 655
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp
660 665 670
Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro Gln Gly Gln Thr
675 680 685
Leu Thr Ala Glu Ser Ile Arg Gln Pro Pro Val Ser Glu Pro Ala Val
690 695 700
Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser Ser Ala Arg Leu
705 710 715 720
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly
725 730 735
Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu Glu Ser Glu Leu
740 745 750
Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser Glu Val Gln Ala
755 760 765
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys
770 775 780
Thr Val Gly Asp Val Ile Glu Ala Met Lys Met Glu Leu Gly Gly Pro
785 790 795 800
Gln Gly Gln Thr Leu Thr Ala Glu Ser Ile Arg Glu Pro Pro Val Ser
805 810 815
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser Ile Ala Asn Val Ser
820 825 830
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala
835 840 845
Asp Lys Thr Gly Tyr Asp Ser Ser Met Ile Glu Met Asp Met Asp Leu
850 855 860
Glu Ser Glu Leu Gly Val Asp Ser Ile Lys Arg Val Glu Ile Met Ser
865 870 875 880
Glu Val Gln Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu
885 890 895
Ser Arg Thr Lys Thr Val Gly Asp Val Ile Glu Ala Met Lys Leu Glu
900 905 910
Leu Gly Glu Ser Ser Ser Ile Glu Thr Leu Asn Cys Thr Glu Val Glu
915 920 925
His Thr
930
<210> 49
<211> 2433
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(2433)
<400> 49
aaa agt gtc aag gct tca ggg tgt gag aat gta gat acc cgt ttc gct 48
Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr Arg Phe Ala
1 5 10 15
aag gtt gta caa atc tcg ctt cct agc aag ctg aaa tcc act gtg tcg 96
Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys Ser Thr Val Ser
20 25 30
cac gat cga cct gta att gtt gta gat gat gga acg ccc tta acc acg 144
His Asp Arg Pro Val Ile Val Val Asp Asp Gly Thr Pro Leu Thr Thr
35 40 45
gag ctt tgt aaa att ctt ggg ggt aat att gtg gtt ctc tct tat caa 192
Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile Val Val Leu Ser Tyr Gln
50 55 60
ggg aag ccc gct ggt cca cgg gga gtc gag gtg cca gat ctt tcc gag 240
Gly Lys Pro Ala Gly Pro Arg Gly Val Glu Val Pro Asp Leu Ser Glu
65 70 75 80
gaa gcc cta att caa gct ctt gca ttg att cgg tct aca tat gga gtt 288
Glu Ala Leu Ile Gln Ala Leu Ala Leu Ile Arg Ser Thr Tyr Gly Val
85 90 95
cca att ggt ttt att tgt cag caa gtg tct aat gtg agc acc aag gca 336
Pro Ile Gly Phe Ile Cys Gln Gln Val Ser Asn Val Ser Thr Lys Ala
100 105 110
cag ctt tgt tgg gca ctc ctc gca gcg aag cat ctc aag aag gat ttg 384
Gln Leu Cys Trp Ala Leu Leu Ala Ala Lys His Leu Lys Lys Asp Leu
115 120 125
aat gct gtc tta ccc gat tca aga tcc ttc ttc gtc gga gtt gta cgc 432
Asn Ala Val Leu Pro Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg
130 135 140
ttg aac ggg aaa ctt gga act ttc gaa aac atc agc gac ttc tct aaa 480
Leu Asn Gly Lys Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys
145 150 155 160
ttt gat ttg acg aaa gcc cta gat tac gga cag cgt ggt tct ctc tta 528
Phe Asp Leu Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu
165 170 175
ggc ctg tgc aag tca cta gac tta gaa tgg gaa cag gtg ttt tgc cgt 576
Gly Leu Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg
180 185 190
gga ata gat ctt gcg tgt gat ctt atg cca ctc cag gcc gca agg ata 624
Gly Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
195 200 205
ctc aga aat gag ctt cag tgt ccc aat atg cgc ctt cgc gag gtt ggg 672
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val Gly
210 215 220
tac gat att tct ggc gcc agg tac acc att tca acc gat gac ctg cta 720
Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp Leu Leu
225 230 235 240
tgt gga ccc tcg aag gct aaa gta gag gcc gca gac ttg ttt ctt gtg 768
Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu Phe Leu Val
245 250 255
aca ggt ggc gca cga ggt att aca cct cat tgt gtt cgt gag att gca 816
Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val Arg Glu Ile Ala
260 265 270
agt cga tcc ccc gga acc aca ttt gtg ctg gtt gga aga agc gaa atg 864
Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val Gly Arg Ser Glu Met
275 280 285
tcc gac gag cct gac tgg gct gtt ggc cac tac aat aaa gac ctg gac 912
Ser Asp Glu Pro Asp Trp Ala Val Gly His Tyr Asn Lys Asp Leu Asp
290 295 300
caa agc aca atg aaa cac ttg aaa gca acg cat gct gct gga ggg gta 960
Gln Ser Thr Met Lys His Leu Lys Ala Thr His Ala Ala Gly Gly Val
305 310 315 320
aaa cct acg cct aaa gca cat cgt gca ctt gtg aac agg gtc act ggc 1008
Lys Pro Thr Pro Lys Ala His Arg Ala Leu Val Asn Arg Val Thr Gly
325 330 335
tca cgg gag gta cga gaa tct ctt aga gca atc cag gag gca ggg gca 1056
Ser Arg Glu Val Arg Glu Ser Leu Arg Ala Ile Gln Glu Ala Gly Ala
340 345 350
aat gtc gaa tat atc gcc tgt gat gtt tcg gat gaa aac aag gtc cgc 1104
Asn Val Glu Tyr Ile Ala Cys Asp Val Ser Asp Glu Asn Lys Val Arg
355 360 365
caa ctt gtg caa aga gtg gag caa aag tat ggc tgt gaa ata act ggg 1152
Gln Leu Val Gln Arg Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly
370 375 380
att tgg cat gca agc ggg gtt ctt cgt gac aaa ctt gtc gag caa aag 1200
Ile Trp His Ala Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys
385 390 395 400
act aca gac gac ttt gag gca gtt ttt ggg acc aag gtg act ggc ctt 1248
Thr Thr Asp Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu
405 410 415
gta aac atc gtg tca caa gtc aat atg tct aag cta cga cac ttc atc 1296
Val Asn Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile
420 425 430
ctc ttc agt tct ttg gct gga ttt cat ggg aac aag ggc caa acg gat 1344
Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
435 440 445
tat gca att gct aat gaa gcc ttg aac aaa atc gcg cat act ctc tca 1392
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu Ser
450 455 460
gcg ttt ttg ccc aaa ctg aat gca aag gtg cta gac ttc ggt ccg tgg 1440
Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly Pro Trp
465 470 475 480
gta ggt tca gga atg gta acc gaa aca ctt gag aag cat ttt aaa gct 1488
Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His Phe Lys Ala
485 490 495
atg ggg gtt cag act att cct ctc gag cca gga gca cgg act gtt gcg 1536
Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala Arg Thr Val Ala
500 505 510
caa atc att ttg gca agt tcg cca ccg caa tcg ctt ttg ggg aac tgg 1584
Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser Leu Leu Gly Asn Trp
515 520 525
ggc ttt cca gcc acc aaa ccg cta caa cgc tct aat gta gtc acg ggc 1632
Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg Ser Asn Val Val Thr Gly
530 535 540
aca ctc tct ccg gaa gag ata gaa ttc atc gca gac cac aaa att caa 1680
Thr Leu Ser Pro Glu Glu Ile Glu Phe Ile Ala Asp His Lys Ile Gln
545 550 555 560
ggc cgc aag gtg ctt ccc atg atg gct gca atc ggg ttc atg gcc tct 1728
Gly Arg Lys Val Leu Pro Met Met Ala Ala Ile Gly Phe Met Ala Ser
565 570 575
att gcg gaa gga ctc tac ccg ggg tac aat ctg caa ggc gtg gaa aat 1776
Ile Ala Glu Gly Leu Tyr Pro Gly Tyr Asn Leu Gln Gly Val Glu Asn
580 585 590
gct cag ctc ttt caa ggc ttg act atc aac caa gag aca aaa ttt caa 1824
Ala Gln Leu Phe Gln Gly Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln
595 600 605
atc act ctc att gag gag cac aac tct gag gaa aac ctg gat gtc ctg 1872
Ile Thr Leu Ile Glu Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu
610 615 620
aca tcc ctt ggt gta atg ttg gaa agc ggg aag gtg ctt ccc gct tac 1920
Thr Ser Leu Gly Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr
625 630 635 640
cga tgt gtt gta tgc ttg aat aca acc cag cag cag ccc aag cta tct 1968
Arg Cys Val Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser
645 650 655
cca aaa att ctt aac ttg gaa gtt gac cct gca tgc gag gtt aac ccc 2016
Pro Lys Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro
660 665 670
tat gat gga aag tcg ttg ttc cac ggt ccg ctt ttg caa ttc gtt caa 2064
Tyr Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
675 680 685
caa gtg ttg cac tca agt acc aaa ggc ctc gtt gcc aag tgc cgc gcg 2112
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg Ala
690 695 700
ctt cca atc aaa gaa gcc atc cga ggg cca ttt atc aag caa aca ctc 2160
Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln Thr Leu
705 710 715 720
cat gat cca att cta gac gac gtc att ttt cag cta atg ctc gtg tgg 2208
His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met Leu Val Trp
725 730 735
tgt cgt aat gct cta gga agt gca tcg cta ccc aac aga att gaa aag 2256
Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn Arg Ile Glu Lys
740 745 750
atg tca tac ttt ggg aat gtc tca gaa ggt agc act ttc ttt gcc tca 2304
Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser Thr Phe Phe Ala Ser
755 760 765
gtt aca cct gtg gga cca aga gta cca aag gat ccc gtg atc aaa atg 2352
Val Thr Pro Val Gly Pro Arg Val Pro Lys Asp Pro Val Ile Lys Met
770 775 780
cag ttt ctt ctc caa gat gaa tcc ggc aac aca ttt tca tcg ggg gag 2400
Gln Phe Leu Leu Gln Asp Glu Ser Gly Asn Thr Phe Ser Ser Gly Glu
785 790 795 800
ggc tcg gtt gtg ctt agt gac gaa ctc gtc ttt 2433
Gly Ser Val Val Leu Ser Asp Glu Leu Val Phe
805 810
<210> 50
<211> 811
<212> PRT
<213> Thraustochytrium sp.
<400> 50
Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr Arg Phe Ala
1 5 10 15
Lys Val Val Gln Ile Ser Leu Pro Ser Lys Leu Lys Ser Thr Val Ser
20 25 30
His Asp Arg Pro Val Ile Val Val Asp Asp Gly Thr Pro Leu Thr Thr
35 40 45
Glu Leu Cys Lys Ile Leu Gly Gly Asn Ile Val Val Leu Ser Tyr Gln
50 55 60
Gly Lys Pro Ala Gly Pro Arg Gly Val Glu Val Pro Asp Leu Ser Glu
65 70 75 80
Glu Ala Leu Ile Gln Ala Leu Ala Leu Ile Arg Ser Thr Tyr Gly Val
85 90 95
Pro Ile Gly Phe Ile Cys Gln Gln Val Ser Asn Val Ser Thr Lys Ala
100 105 110
Gln Leu Cys Trp Ala Leu Leu Ala Ala Lys His Leu Lys Lys Asp Leu
115 120 125
Asn Ala Val Leu Pro Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg
130 135 140
Leu Asn Gly Lys Leu Gly Thr Phe Glu Asn Ile Ser Asp Phe Ser Lys
145 150 155 160
Phe Asp Leu Thr Lys Ala Leu Asp Tyr Gly Gln Arg Gly Ser Leu Leu
165 170 175
Gly Leu Cys Lys Ser Leu Asp Leu Glu Trp Glu Gln Val Phe Cys Arg
180 185 190
Gly Ile Asp Leu Ala Cys Asp Leu Met Pro Leu Gln Ala Ala Arg Ile
195 200 205
Leu Arg Asn Glu Leu Gln Cys Pro Asn Met Arg Leu Arg Glu Val Gly
210 215 220
Tyr Asp Ile Ser Gly Ala Arg Tyr Thr Ile Ser Thr Asp Asp Leu Leu
225 230 235 240
Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu Phe Leu Val
245 250 255
Thr Gly Gly Ala Arg Gly Ile Thr Pro His Cys Val Arg Glu Ile Ala
260 265 270
Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val Gly Arg Ser Glu Met
275 280 285
Ser Asp Glu Pro Asp Trp Ala Val Gly His Tyr Asn Lys Asp Leu Asp
290 295 300
Gln Ser Thr Met Lys His Leu Lys Ala Thr His Ala Ala Gly Gly Val
305 310 315 320
Lys Pro Thr Pro Lys Ala His Arg Ala Leu Val Asn Arg Val Thr Gly
325 330 335
Ser Arg Glu Val Arg Glu Ser Leu Arg Ala Ile Gln Glu Ala Gly Ala
340 345 350
Asn Val Glu Tyr Ile Ala Cys Asp Val Ser Asp Glu Asn Lys Val Arg
355 360 365
Gln Leu Val Gln Arg Val Glu Gln Lys Tyr Gly Cys Glu Ile Thr Gly
370 375 380
Ile Trp His Ala Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gln Lys
385 390 395 400
Thr Thr Asp Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu
405 410 415
Val Asn Ile Val Ser Gln Val Asn Met Ser Lys Leu Arg His Phe Ile
420 425 430
Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gln Thr Asp
435 440 445
Tyr Ala Ile Ala Asn Glu Ala Leu Asn Lys Ile Ala His Thr Leu Ser
450 455 460
Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly Pro Trp
465 470 475 480
Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His Phe Lys Ala
485 490 495
Met Gly Val Gln Thr Ile Pro Leu Glu Pro Gly Ala Arg Thr Val Ala
500 505 510
Gln Ile Ile Leu Ala Ser Ser Pro Pro Gln Ser Leu Leu Gly Asn Trp
515 520 525
Gly Phe Pro Ala Thr Lys Pro Leu Gln Arg Ser Asn Val Val Thr Gly
530 535 540
Thr Leu Ser Pro Glu Glu Ile Glu Phe Ile Ala Asp His Lys Ile Gln
545 550 555 560
Gly Arg Lys Val Leu Pro Met Met Ala Ala Ile Gly Phe Met Ala Ser
565 570 575
Ile Ala Glu Gly Leu Tyr Pro Gly Tyr Asn Leu Gln Gly Val Glu Asn
580 585 590
Ala Gln Leu Phe Gln Gly Leu Thr Ile Asn Gln Glu Thr Lys Phe Gln
595 600 605
Ile Thr Leu Ile Glu Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu
610 615 620
Thr Ser Leu Gly Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr
625 630 635 640
Arg Cys Val Val Cys Leu Asn Thr Thr Gln Gln Gln Pro Lys Leu Ser
645 650 655
Pro Lys Ile Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro
660 665 670
Tyr Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gln Phe Val Gln
675 680 685
Gln Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg Ala
690 695 700
Leu Pro Ile Lys Glu Ala Ile Arg Gly Pro Phe Ile Lys Gln Thr Leu
705 710 715 720
His Asp Pro Ile Leu Asp Asp Val Ile Phe Gln Leu Met Leu Val Trp
725 730 735
Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn Arg Ile Glu Lys
740 745 750
Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser Thr Phe Phe Ala Ser
755 760 765
Val Thr Pro Val Gly Pro Arg Val Pro Lys Asp Pro Val Ile Lys Met
770 775 780
Gln Phe Leu Leu Gln Asp Glu Ser Gly Asn Thr Phe Ser Ser Gly Glu
785 790 795 800
Gly Ser Val Val Leu Ser Asp Glu Leu Val Phe
805 810
<210> 51
<211> 5808
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(5805)
<220>
<221> misc_feature
<222> (1)..(5808)
<223> n = a c t or g
<400> 51
atg caa ctt cct cca gcg cat tct gcc gat gag aat cgc atc gcg gtc 48
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1 5 10 15
gtg ggc atg gcc gtc aaa tat gcg ggc tgt gac aat aaa gaa gag ttt 96
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
20 25 30
tgg aag act ttg atg aat ggt agt atc aat acc aag tcg att tcg gca 144
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
35 40 45
gca agg ttg ggc agc aat aag cgt gac gaa cac tat gtt cct gaa cga 192
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
50 55 60
tcg aaa tat gca gat acg ttc tgt aac gaa agg tac ggt tgt atc cag 240
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65 70 75 80
caa ggt acg gat aat gag cat gac ctc ctc cta ggt ctt gct caa gaa 288
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
85 90 95
gct ctc gct gac gct gcc ggg cgg atg gag aaa caa cct tcg gag gcg 336
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
100 105 110
ttc gat ctg gaa aat act ggc atc gtg agt ggg tgc tta tct ttt cca 384
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
115 120 125
atg gat aac ctg caa gga gag ttg ttg aac ttg tat caa agc cat gtg 432
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
130 135 140
gag aaa caa ctt cca cct agt gcc ttg gta gaa gcc gtg aag ctt tgg 480
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145 150 155 160
tct gag cga cag aaa tct acg aaa gca cat gca ggg gac aag cgc cgg 528
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
165 170 175
ttc att gac cca gct tct ttt gta gct gat aaa ctg aac cta ggc cca 576
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
180 185 190
cta cat tat gcg atc gat gca gca tgc gct tct gca ttg tac gtg tta 624
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
195 200 205
aaa tta gct caa gac cac ctt gtt tca ggt gcc gtt gat atg atg tta 672
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
210 215 220
tgt gga gcg acg tgc ttc cca gaa cca ttc ttc atc ttg tct ggg ttc 720
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225 230 235 240
tcg act ttt caa gcg atg cct gnt ggg gca gat gga gtc tca cta cct 768
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
245 250 255
ctc cat aaa acg agt gct ggg ctc act cca ggt gaa ggg ggg tcc att 816
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
260 265 270
atg gtg ctc aag cga ctg aaa gac gct atc aga gat gga aat cac att 864
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
275 280 285
tat ggt gtg ctc ctt gaa gca aat tta agt aac gca ggt tgt ggg ctt 912
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
290 295 300
cca ctc agc ccg cac tta ccg agc gaa gaa tca tgt att cgt gat acc 960
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305 310 315 320
tac cgc cgt gct gga gtt gct gca gat caa agt att cag tat att gag 1008
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
325 330 335
tgc cac gct acg gga acc cct cga ggg gat gtc gtg gaa att gag gcg 1056
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
340 345 350
gtt gaa aga gtt ttc aag aaa aac gtt cca cgc tta ggc tcg acg aaa 1104
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
355 360 365
gga aat ttt ggt cac tcg tta gtt gcg gct ggt ttc gca ggt atg gca 1152
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
370 375 380
aag ctt ctt ctt gca atg gaa cat gga gtg att cct ccc aca cca ggt 1200
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385 390 395 400
ctt gat gct tcg aac cag gca agt gag cac gtt gtg aca aag gct atc 1248
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
405 410 415
act tgg cct gag aca cat ggg gct cca aaa cga gct ggc ctt tca gca 1296
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
420 425 430
ttt gga ttt ggt ggg act aat gcg cat gca ctc ttc gaa gag ttt aat 1344
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
435 440 445
gcc gag ggc ata agt tat cgc cct gga aag cct cca gtc gaa tcg aat 1392
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
450 455 460
acc cgt cct tcc gtc gta ata act ggg atg gac tgt acc ttt ggg agc 1440
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465 470 475 480
ctt gaa ggg att gat gcg ttc gag act gcc ctg tac gag ggg cgt gac 1488
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
485 490 495
gca gct cgt gac tta ccc gcc aaa cgt tgg agg ttc cta ggt gag gac 1536
Ala Ala Arg Asp Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp
500 505 510
ttg gag ttt ctc cga gcc atc agg ctc aag gaa aag cct agg ggt tgt 1584
Leu Glu Phe Leu Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys
515 520 525
ttt gtg gag agt gtt gac gtt aac ttt aga cgg ctg aaa acg ccc ttg 1632
Phe Val Glu Ser Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu
530 535 540
aca cca gaa gat atg ttg cgg ccc caa caa ctc ttg gcg gtt tct acg 1680
Thr Pro Glu Asp Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr
545 550 555 560
atg gac cga gca att atc gat gca ggt cta aag aag ggc caa cat gta 1728
Met Asp Arg Ala Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val
565 570 575
gca gtt ctt gtt ggc cta gga act gac ctg gaa ctt tac cgt cat cga 1776
Ala Val Leu Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg
580 585 590
gca aga gtc gcg ctt aaa gag gtt ttg cac ccg agc tta aag tca gac 1824
Ala Arg Val Ala Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp
595 600 605
act gca att ctc cag aaa ata atg caa tat gtg aat gat gca gga act 1872
Thr Ala Ile Leu Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr
610 615 620
tcg act tca tac aca tct tac att gga aac ctc gtt gcc acg cgt att 1920
Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile
625 630 635 640
tcg tct cag tgg gga ttc aca ggg ccg tcc ttt act gtc aca gaa gga 1968
Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly
645 650 655
aat aat tcc gtg tac aga tgt gca caa cta gcc aaa gat atg ctt cag 2016
Asn Asn Ser Val Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln
660 665 670
gtt aac cga gtt gat gct gtc gtc atc gca ggc gtt gat ctc aac gga 2064
Val Asn Arg Val Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly
675 680 685
agc gcc gaa agt ttt ttt gtc cga gca aat cgt caa aag ata tcc aag 2112
Ser Ala Glu Ser Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys
690 695 700
cta agt cat cca tgt gca agc ttc gac aga gat gca gat gga ttt ttc 2160
Leu Ser His Pro Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe
705 710 715 720
gca ggt gag ggc tgt ggt gcc cta gtt ttc aag agg tta gaa gac tgt 2208
Ala Gly Glu Gly Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys
725 730 735
gct cct cag gaa aaa att tat gct agt ata gac tct atc gca ata gat 2256
Ala Pro Gln Glu Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp
740 745 750
aaa gag cct act agc tca gct gtg aaa gct gtc tac caa agt gat tcg 2304
Lys Glu Pro Thr Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser
755 760 765
agt ctc tcc gat att gag ctg tta gaa atc agt gga gac tcc aaa cgg 2352
Ser Leu Ser Asp Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg
770 775 780
ttt gca gca ttc gaa ggc gct gtg gaa att caa tca agt gtg gaa gcc 2400
Phe Ala Ala Phe Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala
785 790 795 800
cag cta aaa gga ctt tcc aaa gtc ctt gaa cct gca aaa ggc caa ggc 2448
Gln Leu Lys Gly Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly
805 810 815
gta gcg gtg gga agt act cga gca acc gtt ggg gat ata ggg tat gct 2496
Val Ala Val Gly Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala
820 825 830
aca gga gcg gca agc ctg att aaa act gca ctc tgc tta tat aat cgc 2544
Thr Gly Ala Ala Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg
835 840 845
tac ctt ccg gca tta gca aac tgg agt ggc cca tgt gaa cag tcc gcc 2592
Tyr Leu Pro Ala Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala
850 855 860
tgg ggc tca aac atg ttc gtt tgc cat gaa aca cgg ccg tgg atg aaa 2640
Trp Gly Ser Asn Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys
865 870 875 880
aac cag aat gaa aag aga tgt gcc ctc att tct gga aca gat cca tct 2688
Asn Gln Asn Glu Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser
885 890 895
cat aca tgc ttt tcc ctc gta cta tcg gat act ggg tgt tat gaa gag 2736
His Thr Cys Phe Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu
900 905 910
cac aat cga acg tgc ttt gat gtg caa gcg cca cag cta gtt ctg ata 2784
His Asn Arg Thr Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile
915 920 925
cac gga ttc gat gga aaa act att gtg cgg cga ctt gaa gga tat ctc 2832
His Gly Phe Asp Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu
930 935 940
ctt gaa ctt gtt gaa ggg cat gca agc cct tca gag tat ttc cac aaa 2880
Leu Glu Leu Val Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys
945 950 955 960
ctg att gga caa agt cta ctt gag aac tcg aaa gaa agt aaa ctc aca 2928
Leu Ile Gly Gln Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr
965 970 975
ctt tcg ctt gtg tgc aat ccg aac cag ctc caa aag gag ctc atg ctt 2976
Leu Ser Leu Val Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu
980 985 990
gct atc aaa gga gta caa cga agc atg tta aca ggg aag gat tgg gtc 3024
Ala Ile Lys Gly Val Gln Arg Ser Met Leu Thr Gly Lys Asp Trp Val
995 1000 1005
agt cca tca gga agt tgt ttt gcc cca aat ccg tta tca agc gca 3069
Ser Pro Ser Gly Ser Cys Phe Ala Pro Asn Pro Leu Ser Ser Ala
1010 1015 1020
aaa gtg gca ttc atg tac gga gaa ggc cga agc ccg tac tgt ggt 3114
Lys Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr Cys Gly
1025 1030 1035
gta ggc ttg ggt cta cat cgt ttg tgg ccc ggt ctc cat gaa aat 3159
Val Gly Leu Gly Leu His Arg Leu Trp Pro Gly Leu His Glu Asn
1040 1045 1050
gtg aac aat aag aca gtc gat tta tgg acg gaa gga gat ggt tgg 3204
Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu Gly Asp Gly Trp
1055 1060 1065
tta tat cct cga acg ttg aca cga gaa gag cat aca aaa gcc atc 3249
Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr Lys Ala Ile
1070 1075 1080
gaa tct ttc aac gca aat caa att gaa atg ttt cgc gct ggg att 3294
Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala Gly Ile
1085 1090 1095
ttc atc tca atg tgt cag aca gac tat gtc atg aat gtt ctc ggt 3339
Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu Gly
1100 1105 1110
gtc cag cct aag gcc gga ttt ggg ctg agc ttg gga gaa att tca 3384
Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
1115 1120 1125
atg ctc ttt gcg atg tca aag gag aac tgc agg cag tca cag gaa 3429
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu
1130 1135 1140
atg acc aat cgt ttg cgc ggt tct cca gtg tgg tct aac gag ctt 3474
Met Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu
1145 1150 1155
gct atc aac ttc aat gca att cgc aag tta tgg aaa atc ccc cga 3519
Ala Ile Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg
1160 1165 1170
gga gct ccc tta gaa tcc ttt tgg caa gga tac ttg gtt cac ggc 3564
Gly Ala Pro Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly
1175 1180 1185
aca aga gaa gaa gta gag cat gct att ggt ctt tct gag cct tat 3609
Thr Arg Glu Glu Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr
1190 1195 1200
gta cgt ctg ctt att gtg aac gat tca agg agt gcc ttg att gct 3654
Val Arg Leu Leu Ile Val Asn Asp Ser Arg Ser Ala Leu Ile Ala
1205 1210 1215
gga aaa cca gac gcc tgt cag gca gta atc agt aga cta aac tcc 3699
Gly Lys Pro Asp Ala Cys Gln Ala Val Ile Ser Arg Leu Asn Ser
1220 1225 1230
aag ttc cct tct ctg ccg gta aag caa gga atg att ggt cat tgc 3744
Lys Phe Pro Ser Leu Pro Val Lys Gln Gly Met Ile Gly His Cys
1235 1240 1245
cca gaa gtt cgt gcg ttc atc aaa gat att ggg tac atc cat gaa 3789
Pro Glu Val Arg Ala Phe Ile Lys Asp Ile Gly Tyr Ile His Glu
1250 1255 1260
aca ctc cga att tcc aat gac tat tcg gat tgt cag ctt ttc tca 3834
Thr Leu Arg Ile Ser Asn Asp Tyr Ser Asp Cys Gln Leu Phe Ser
1265 1270 1275
gcg gta acc aag ggc gca ctt gac agc tcc aca atg gaa atc aaa 3879
Ala Val Thr Lys Gly Ala Leu Asp Ser Ser Thr Met Glu Ile Lys
1280 1285 1290
cac ttt gtg gga gag gtc tac tcc cgg atc gca gac ttt cct caa 3924
His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala Asp Phe Pro Gln
1295 1300 1305
atc gtc aac acg gtg cat tcg gct ggt tat gac gta ttt ctt gag 3969
Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val Phe Leu Glu
1310 1315 1320
ctt ggc tgt gat gct tct aga tct gca gca gtt caa aac att ctt 4014
Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn Ile Leu
1325 1330 1335
ggt ggt caa gga aag ttc ttg tct aca gct att gac aaa aaa gga 4059
Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys Gly
1340 1345 1350
cac tcc gcc tgg tca caa gta ctt cgg gct acc gca tca tta gct 4104
His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
1355 1360 1365
gca cat cga gta ccg gga atc tca att ttg gat ttg ttt cac cca 4149
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro
1370 1375 1380
aat ttc cga gaa atg tgc tgt aca atg gca acc aca cct aaa gtg 4194
Asn Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val
1385 1390 1395
gaa gat aag ttc ctg cgc acg att caa atc aat ggt cgg ttt gaa 4239
Glu Asp Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu
1400 1405 1410
aaa gaa atg att cac cta gaa gat aca aca tta agt tgc tta ccc 4284
Lys Glu Met Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro
1415 1420 1425
gct cca agt gaa gca aat atc gca gct att caa tct cgg tca att 4329
Ala Pro Ser Glu Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile
1430 1435 1440
cga tct gct gcg gcg cgt tct gga caa tcc cat gat tgt gca tcc 4374
Arg Ser Ala Ala Ala Arg Ser Gly Gln Ser His Asp Cys Ala Ser
1445 1450 1455
cat agc cat gaa gaa aat aag gat tca tgc cct gaa aag ctg aag 4419
His Ser His Glu Glu Asn Lys Asp Ser Cys Pro Glu Lys Leu Lys
1460 1465 1470
ctt gat tct gtg tcc gtc gcc ata aat ttc gac aat gat gac cgc 4464
Leu Asp Ser Val Ser Val Ala Ile Asn Phe Asp Asn Asp Asp Arg
1475 1480 1485
att cag ctt ggg cac gcg ggt ttt cgg gag atg tac aat aca aga 4509
Ile Gln Leu Gly His Ala Gly Phe Arg Glu Met Tyr Asn Thr Arg
1490 1495 1500
tat agc ttg tac aca ggg gcg atg gca aag gga att gca tct gca 4554
Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala
1505 1510 1515
gat ctt gtc att gcc gct ggg aaa gag ggc atc cta gct tcc tat 4599
Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser Tyr
1520 1525 1530
gga gct gga gga cta cct ctt gct act gtt cga aag gga ata gac 4644
Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
1535 1540 1545
aaa att caa caa gcc ttg cca agt ggc cca tat gct gta aat ctt 4689
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu
1550 1555 1560
att cac tct ccc ttt gac ggc aac ttg gag cag gga aac gtc gat 4734
Ile His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp
1565 1570 1575
ttg ttc ttg gaa aag aac gtc cgc gtg gcg gaa tgt tcc gcg ttt 4779
Leu Phe Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe
1580 1585 1590
aca acg cta aca gtg cca gta gta cac tat cgt gct gca ggg ctt 4824
Thr Thr Leu Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu
1595 1600 1605
gtt cgg cgc caa gat gga agc att ttg atc aag aac cga atc att 4869
Val Arg Arg Gln Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile
1610 1615 1620
gct aaa gta tct agg aca gaa ctc gct gag atg ttc ctt cgt ccg 4914
Ala Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Leu Arg Pro
1625 1630 1635
gca cct caa atc atc ctc gaa aaa ctg gta gca gca gaa atc att 4959
Ala Pro Gln Ile Ile Leu Glu Lys Leu Val Ala Ala Glu Ile Ile
1640 1645 1650
tca tct gac caa gcg cgt atg gca gcc aaa gtt ccc atg gcg gac 5004
Ser Ser Asp Gln Ala Arg Met Ala Ala Lys Val Pro Met Ala Asp
1655 1660 1665
gac atc gca gtc gaa gcc gac tct ggt ggg cac acg gat aat cgg 5049
Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
1670 1675 1680
cct atg cac gtc att ttg ccc ctg ata att caa ctc cgc aat act 5094
Pro Met His Val Ile Leu Pro Leu Ile Ile Gln Leu Arg Asn Thr
1685 1690 1695
ata ctt gca gag tat ggc tgt gcc acg gct ttt cgt acc cgt ata 5139
Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala Phe Arg Thr Arg Ile
1700 1705 1710
ggc gct gga gga ggc att ggt tgt cct tca gcg gcc ctc gca gcc 5184
Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala Ala Leu Ala Ala
1715 1720 1725
ttt gat atg ggt gcg agt ttt gtc gtg act gga agc ata aat caa 5229
Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser Ile Asn Gln
1730 1735 1740
att tgc cgc gag gca ggg act tgc gat act gtt cgg gag cta ctt 5274
Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu Leu Leu
1745 1750 1755
gcc aac tca agc tac tcg gac gtg acg atg gcg cca gca gca gac 5319
Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala Asp
1760 1765 1770
atg ttt gac caa ggt gtg aaa ctc caa gtc tta aaa cga gga acg 5364
Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
1775 1780 1785
atg ttt cca agc aga gca aat aaa ctc cgg aag ctc ttt gtg aac 5409
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn
1790 1795 1800
tac gaa tct cta gaa aca ctc ccg tcg aaa gag ttg aaa tac ctg 5454
Tyr Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu
1805 1810 1815
gaa aac atc ata ttc aag caa gca gta gac cag gtg tgg gag gaa 5499
Glu Asn Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu
1820 1825 1830
aca aag cgc ttt tac tgt gaa aaa ctg aac aat cca gat aaa att 5544
Thr Lys Arg Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile
1835 1840 1845
gca agg gcc atg aaa gat cct aaa ttg aag atg tcg ctt tgc ttt 5589
Ala Arg Ala Met Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe
1850 1855 1860
cgg tgg tat ctc tcc aag agc tct ggg tgg gcc aac gca gga att 5634
Arg Trp Tyr Leu Ser Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile
1865 1870 1875
aaa tct cgt gca ctc gac tac cag atc tgg tgt ggc ccg gca atg 5679
Lys Ser Arg Ala Leu Asp Tyr Gln Ile Trp Cys Gly Pro Ala Met
1880 1885 1890
ggc tcg ttc aac aat ttc gcc agc ggc aca tcc ctc gat tgg aaa 5724
Gly Ser Phe Asn Asn Phe Ala Ser Gly Thr Ser Leu Asp Trp Lys
1895 1900 1905
gtg act ggg gtt ttc cct ggc gtt gcg gaa gta aac atg gcc att 5769
Val Thr Gly Val Phe Pro Gly Val Ala Glu Val Asn Met Ala Ile
1910 1915 1920
tta gat ggc gcg cga gaa cta gct gct aaa cga aat taa 5808
Leu Asp Gly Ala Arg Glu Leu Ala Ala Lys Arg Asn
1925 1930 1935
<210> 52
<211> 1935
<212> PRT
<213> Thraustochytrium sp.
<220>
<221> misc_feature
<222> (248)..(248)
<223> The 'Xaa' at location 248 stands for Asp, Gly, Ala, or Val.
<400> 52
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1 5 10 15
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
20 25 30
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
35 40 45
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
50 55 60
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65 70 75 80
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
85 90 95
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
100 105 110
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
115 120 125
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
130 135 140
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145 150 155 160
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
165 170 175
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
180 185 190
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
195 200 205
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
210 215 220
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225 230 235 240
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
245 250 255
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
260 265 270
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
275 280 285
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
290 295 300
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305 310 315 320
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
325 330 335
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
340 345 350
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
355 360 365
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
370 375 380
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385 390 395 400
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
405 410 415
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
420 425 430
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
435 440 445
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
450 455 460
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465 470 475 480
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
485 490 495
Ala Ala Arg Asp Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp
500 505 510
Leu Glu Phe Leu Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys
515 520 525
Phe Val Glu Ser Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu
530 535 540
Thr Pro Glu Asp Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr
545 550 555 560
Met Asp Arg Ala Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val
565 570 575
Ala Val Leu Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg
580 585 590
Ala Arg Val Ala Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp
595 600 605
Thr Ala Ile Leu Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr
610 615 620
Ser Thr Ser Tyr Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile
625 630 635 640
Ser Ser Gln Trp Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly
645 650 655
Asn Asn Ser Val Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln
660 665 670
Val Asn Arg Val Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly
675 680 685
Ser Ala Glu Ser Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys
690 695 700
Leu Ser His Pro Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe
705 710 715 720
Ala Gly Glu Gly Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys
725 730 735
Ala Pro Gln Glu Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp
740 745 750
Lys Glu Pro Thr Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser
755 760 765
Ser Leu Ser Asp Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg
770 775 780
Phe Ala Ala Phe Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala
785 790 795 800
Gln Leu Lys Gly Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly
805 810 815
Val Ala Val Gly Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala
820 825 830
Thr Gly Ala Ala Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg
835 840 845
Tyr Leu Pro Ala Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala
850 855 860
Trp Gly Ser Asn Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys
865 870 875 880
Asn Gln Asn Glu Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser
885 890 895
His Thr Cys Phe Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu
900 905 910
His Asn Arg Thr Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile
915 920 925
His Gly Phe Asp Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu
930 935 940
Leu Glu Leu Val Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys
945 950 955 960
Leu Ile Gly Gln Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr
965 970 975
Leu Ser Leu Val Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu
980 985 990
Ala Ile Lys Gly Val Gln Arg Ser Met Leu Thr Gly Lys Asp Trp Val
995 1000 1005
Ser Pro Ser Gly Ser Cys Phe Ala Pro Asn Pro Leu Ser Ser Ala
1010 1015 1020
Lys Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr Cys Gly
1025 1030 1035
Val Gly Leu Gly Leu His Arg Leu Trp Pro Gly Leu His Glu Asn
1040 1045 1050
Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu Gly Asp Gly Trp
1055 1060 1065
Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr Lys Ala Ile
1070 1075 1080
Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala Gly Ile
1085 1090 1095
Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu Gly
1100 1105 1110
Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
1115 1120 1125
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu
1130 1135 1140
Met Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu
1145 1150 1155
Ala Ile Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg
1160 1165 1170
Gly Ala Pro Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly
1175 1180 1185
Thr Arg Glu Glu Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr
1190 1195 1200
Val Arg Leu Leu Ile Val Asn Asp Ser Arg Ser Ala Leu Ile Ala
1205 1210 1215
Gly Lys Pro Asp Ala Cys Gln Ala Val Ile Ser Arg Leu Asn Ser
1220 1225 1230
Lys Phe Pro Ser Leu Pro Val Lys Gln Gly Met Ile Gly His Cys
1235 1240 1245
Pro Glu Val Arg Ala Phe Ile Lys Asp Ile Gly Tyr Ile His Glu
1250 1255 1260
Thr Leu Arg Ile Ser Asn Asp Tyr Ser Asp Cys Gln Leu Phe Ser
1265 1270 1275
Ala Val Thr Lys Gly Ala Leu Asp Ser Ser Thr Met Glu Ile Lys
1280 1285 1290
His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala Asp Phe Pro Gln
1295 1300 1305
Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val Phe Leu Glu
1310 1315 1320
Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn Ile Leu
1325 1330 1335
Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys Gly
1340 1345 1350
His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
1355 1360 1365
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro
1370 1375 1380
Asn Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val
1385 1390 1395
Glu Asp Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu
1400 1405 1410
Lys Glu Met Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro
1415 1420 1425
Ala Pro Ser Glu Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile
1430 1435 1440
Arg Ser Ala Ala Ala Arg Ser Gly Gln Ser His Asp Cys Ala Ser
1445 1450 1455
His Ser His Glu Glu Asn Lys Asp Ser Cys Pro Glu Lys Leu Lys
1460 1465 1470
Leu Asp Ser Val Ser Val Ala Ile Asn Phe Asp Asn Asp Asp Arg
1475 1480 1485
Ile Gln Leu Gly His Ala Gly Phe Arg Glu Met Tyr Asn Thr Arg
1490 1495 1500
Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala
1505 1510 1515
Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser Tyr
1520 1525 1530
Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
1535 1540 1545
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu
1550 1555 1560
Ile His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp
1565 1570 1575
Leu Phe Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe
1580 1585 1590
Thr Thr Leu Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu
1595 1600 1605
Val Arg Arg Gln Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile
1610 1615 1620
Ala Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Leu Arg Pro
1625 1630 1635
Ala Pro Gln Ile Ile Leu Glu Lys Leu Val Ala Ala Glu Ile Ile
1640 1645 1650
Ser Ser Asp Gln Ala Arg Met Ala Ala Lys Val Pro Met Ala Asp
1655 1660 1665
Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
1670 1675 1680
Pro Met His Val Ile Leu Pro Leu Ile Ile Gln Leu Arg Asn Thr
1685 1690 1695
Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala Phe Arg Thr Arg Ile
1700 1705 1710
Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala Ala Leu Ala Ala
1715 1720 1725
Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser Ile Asn Gln
1730 1735 1740
Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu Leu Leu
1745 1750 1755
Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala Asp
1760 1765 1770
Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
1775 1780 1785
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn
1790 1795 1800
Tyr Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu
1805 1810 1815
Glu Asn Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu
1820 1825 1830
Thr Lys Arg Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile
1835 1840 1845
Ala Arg Ala Met Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe
1850 1855 1860
Arg Trp Tyr Leu Ser Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile
1865 1870 1875
Lys Ser Arg Ala Leu Asp Tyr Gln Ile Trp Cys Gly Pro Ala Met
1880 1885 1890
Gly Ser Phe Asn Asn Phe Ala Ser Gly Thr Ser Leu Asp Trp Lys
1895 1900 1905
Val Thr Gly Val Phe Pro Gly Val Ala Glu Val Asn Met Ala Ile
1910 1915 1920
Leu Asp Gly Ala Arg Glu Leu Ala Ala Lys Arg Asn
1925 1930 1935
<210> 53
<211> 1500
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<220>
<221> misc_feature
<222> (1)..(1500)
<223> n = a c t or g
<400> 53
atg caa ctt cct cca gcg cat tct gcc gat gag aat cgc atc gcg gtc 48
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1 5 10 15
gtg ggc atg gcc gtc aaa tat gcg ggc tgt gac aat aaa gaa gag ttt 96
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
20 25 30
tgg aag act ttg atg aat ggt agt atc aat acc aag tcg att tcg gca 144
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
35 40 45
gca agg ttg ggc agc aat aag cgt gac gaa cac tat gtt cct gaa cga 192
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
50 55 60
tcg aaa tat gca gat acg ttc tgt aac gaa agg tac ggt tgt atc cag 240
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65 70 75 80
caa ggt acg gat aat gag cat gac ctc ctc cta ggt ctt gct caa gaa 288
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
85 90 95
gct ctc gct gac gct gcc ggg cgg atg gag aaa caa cct tcg gag gcg 336
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
100 105 110
ttc gat ctg gaa aat act ggc atc gtg agt ggg tgc tta tct ttt cca 384
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
115 120 125
atg gat aac ctg caa gga gag ttg ttg aac ttg tat caa agc cat gtg 432
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
130 135 140
gag aaa caa ctt cca cct agt gcc ttg gta gaa gcc gtg aag ctt tgg 480
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145 150 155 160
tct gag cga cag aaa tct acg aaa gca cat gca ggg gac aag cgc cgg 528
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
165 170 175
ttc att gac cca gct tct ttt gta gct gat aaa ctg aac cta ggc cca 576
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
180 185 190
cta cat tat gcg atc gat gca gca tgc gct tct gca ttg tac gtg tta 624
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
195 200 205
aaa tta gct caa gac cac ctt gtt tca ggt gcc gtt gat atg atg tta 672
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
210 215 220
tgt gga gcg acg tgc ttc cca gaa cca ttc ttc atc ttg tct ggg ttc 720
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225 230 235 240
tcg act ttt caa gcg atg cct gnt ggg gca gat gga gtc tca cta cct 768
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
245 250 255
ctc cat aaa acg agt gct ggg ctc act cca ggt gaa ggg ggg tcc att 816
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
260 265 270
atg gtg ctc aag cga ctg aaa gac gct atc aga gat gga aat cac att 864
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
275 280 285
tat ggt gtg ctc ctt gaa gca aat tta agt aac gca ggt tgt ggg ctt 912
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
290 295 300
cca ctc agc ccg cac tta ccg agc gaa gaa tca tgt att cgt gat acc 960
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305 310 315 320
tac cgc cgt gct gga gtt gct gca gat caa agt att cag tat att gag 1008
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
325 330 335
tgc cac gct acg gga acc cct cga ggg gat gtc gtg gaa att gag gcg 1056
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
340 345 350
gtt gaa aga gtt ttc aag aaa aac gtt cca cgc tta ggc tcg acg aaa 1104
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
355 360 365
gga aat ttt ggt cac tcg tta gtt gcg gct ggt ttc gca ggt atg gca 1152
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
370 375 380
aag ctt ctt ctt gca atg gaa cat gga gtg att cct ccc aca cca ggt 1200
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385 390 395 400
ctt gat gct tcg aac cag gca agt gag cac gtt gtg aca aag gct atc 1248
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
405 410 415
act tgg cct gag aca cat ggg gct cca aaa cga gct ggc ctt tca gca 1296
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
420 425 430
ttt gga ttt ggt ggg act aat gcg cat gca ctc ttc gaa gag ttt aat 1344
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
435 440 445
gcc gag ggc ata agt tat cgc cct gga aag cct cca gtc gaa tcg aat 1392
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
450 455 460
acc cgt cct tcc gtc gta ata act ggg atg gac tgt acc ttt ggg agc 1440
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465 470 475 480
ctt gaa ggg att gat gcg ttc gag act gcc ctg tac gag ggg cgt gac 1488
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
485 490 495
gca gct cgt gac 1500
Ala Ala Arg Asp
500
<210> 54
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<220>
<221> misc_feature
<222> (248)..(248)
<223> The 'Xaa' at location 248 stands for Asp, Gly, Ala, or Val.
<400> 54
Met Gln Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg Ile Ala Val
1 5 10 15
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe
20 25 30
Trp Lys Thr Leu Met Asn Gly Ser Ile Asn Thr Lys Ser Ile Ser Ala
35 40 45
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg
50 55 60
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys Ile Gln
65 70 75 80
Gln Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gln Glu
85 90 95
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gln Pro Ser Glu Ala
100 105 110
Phe Asp Leu Glu Asn Thr Gly Ile Val Ser Gly Cys Leu Ser Phe Pro
115 120 125
Met Asp Asn Leu Gln Gly Glu Leu Leu Asn Leu Tyr Gln Ser His Val
130 135 140
Glu Lys Gln Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp
145 150 155 160
Ser Glu Arg Gln Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg
165 170 175
Phe Ile Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro
180 185 190
Leu His Tyr Ala Ile Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu
195 200 205
Lys Leu Ala Gln Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu
210 215 220
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe Ile Leu Ser Gly Phe
225 230 235 240
Ser Thr Phe Gln Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro
245 250 255
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser Ile
260 265 270
Met Val Leu Lys Arg Leu Lys Asp Ala Ile Arg Asp Gly Asn His Ile
275 280 285
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu
290 295 300
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys Ile Arg Asp Thr
305 310 315 320
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gln Ser Ile Gln Tyr Ile Glu
325 330 335
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu Ile Glu Ala
340 345 350
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys
355 360 365
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala
370 375 380
Lys Leu Leu Leu Ala Met Glu His Gly Val Ile Pro Pro Thr Pro Gly
385 390 395 400
Leu Asp Ala Ser Asn Gln Ala Ser Glu His Val Val Thr Lys Ala Ile
405 410 415
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala
420 425 430
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn
435 440 445
Ala Glu Gly Ile Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn
450 455 460
Thr Arg Pro Ser Val Val Ile Thr Gly Met Asp Cys Thr Phe Gly Ser
465 470 475 480
Leu Glu Gly Ile Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp
485 490 495
Ala Ala Arg Asp
500
<210> 55
<211> 1500
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 55
tta ccc gcc aaa cgt tgg agg ttc cta ggt gag gac ttg gag ttt ctc 48
Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp Leu Glu Phe Leu
1 5 10 15
cga gcc atc agg ctc aag gaa aag cct agg ggt tgt ttt gtg gag agt 96
Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys Phe Val Glu Ser
20 25 30
gtt gac gtt aac ttt aga cgg ctg aaa acg ccc ttg aca cca gaa gat 144
Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu Thr Pro Glu Asp
35 40 45
atg ttg cgg ccc caa caa ctc ttg gcg gtt tct acg atg gac cga gca 192
Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr Met Asp Arg Ala
50 55 60
att atc gat gca ggt cta aag aag ggc caa cat gta gca gtt ctt gtt 240
Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val Ala Val Leu Val
65 70 75 80
ggc cta gga act gac ctg gaa ctt tac cgt cat cga gca aga gtc gcg 288
Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala
85 90 95
ctt aaa gag gtt ttg cac ccg agc tta aag tca gac act gca att ctc 336
Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp Thr Ala Ile Leu
100 105 110
cag aaa ata atg caa tat gtg aat gat gca gga act tcg act tca tac 384
Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr Ser Thr Ser Tyr
115 120 125
aca tct tac att gga aac ctc gtt gcc acg cgt att tcg tct cag tgg 432
Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile Ser Ser Gln Trp
130 135 140
gga ttc aca ggg ccg tcc ttt act gtc aca gaa gga aat aat tcc gtg 480
Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly Asn Asn Ser Val
145 150 155 160
tac aga tgt gca caa cta gcc aaa gat atg ctt cag gtt aac cga gtt 528
Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln Val Asn Arg Val
165 170 175
gat gct gtc gtc atc gca ggc gtt gat ctc aac gga agc gcc gaa agt 576
Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly Ser Ala Glu Ser
180 185 190
ttt ttt gtc cga gca aat cgt caa aag ata tcc aag cta agt cat cca 624
Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys Leu Ser His Pro
195 200 205
tgt gca agc ttc gac aga gat gca gat gga ttt ttc gca ggt gag ggc 672
Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe Ala Gly Glu Gly
210 215 220
tgt ggt gcc cta gtt ttc aag agg tta gaa gac tgt gct cct cag gaa 720
Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys Ala Pro Gln Glu
225 230 235 240
aaa att tat gct agt ata gac tct atc gca ata gat aaa gag cct act 768
Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp Lys Glu Pro Thr
245 250 255
agc tca gct gtg aaa gct gtc tac caa agt gat tcg agt ctc tcc gat 816
Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser Ser Leu Ser Asp
260 265 270
att gag ctg tta gaa atc agt gga gac tcc aaa cgg ttt gca gca ttc 864
Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg Phe Ala Ala Phe
275 280 285
gaa ggc gct gtg gaa att caa tca agt gtg gaa gcc cag cta aaa gga 912
Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala Gln Leu Lys Gly
290 295 300
ctt tcc aaa gtc ctt gaa cct gca aaa ggc caa ggc gta gcg gtg gga 960
Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly Val Ala Val Gly
305 310 315 320
agt act cga gca acc gtt ggg gat ata ggg tat gct aca gga gcg gca 1008
Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala Thr Gly Ala Ala
325 330 335
agc ctg att aaa act gca ctc tgc tta tat aat cgc tac ctt ccg gca 1056
Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg Tyr Leu Pro Ala
340 345 350
tta gca aac tgg agt ggc cca tgt gaa cag tcc gcc tgg ggc tca aac 1104
Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala Trp Gly Ser Asn
355 360 365
atg ttc gtt tgc cat gaa aca cgg ccg tgg atg aaa aac cag aat gaa 1152
Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys Asn Gln Asn Glu
370 375 380
aag aga tgt gcc ctc att tct gga aca gat cca tct cat aca tgc ttt 1200
Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser His Thr Cys Phe
385 390 395 400
tcc ctc gta cta tcg gat act ggg tgt tat gaa gag cac aat cga acg 1248
Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu His Asn Arg Thr
405 410 415
tgc ttt gat gtg caa gcg cca cag cta gtt ctg ata cac gga ttc gat 1296
Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile His Gly Phe Asp
420 425 430
gga aaa act att gtg cgg cga ctt gaa gga tat ctc ctt gaa ctt gtt 1344
Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu Leu Glu Leu Val
435 440 445
gaa ggg cat gca agc cct tca gag tat ttc cac aaa ctg att gga caa 1392
Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys Leu Ile Gly Gln
450 455 460
agt cta ctt gag aac tcg aaa gaa agt aaa ctc aca ctt tcg ctt gtg 1440
Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr Leu Ser Leu Val
465 470 475 480
tgc aat ccg aac cag ctc caa aag gag ctc atg ctt gct atc aaa gga 1488
Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu Ala Ile Lys Gly
485 490 495
gta caa cga agc 1500
Val Gln Arg Ser
500
<210> 56
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<400> 56
Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp Leu Glu Phe Leu
1 5 10 15
Arg Ala Ile Arg Leu Lys Glu Lys Pro Arg Gly Cys Phe Val Glu Ser
20 25 30
Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu Thr Pro Glu Asp
35 40 45
Met Leu Arg Pro Gln Gln Leu Leu Ala Val Ser Thr Met Asp Arg Ala
50 55 60
Ile Ile Asp Ala Gly Leu Lys Lys Gly Gln His Val Ala Val Leu Val
65 70 75 80
Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala
85 90 95
Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp Thr Ala Ile Leu
100 105 110
Gln Lys Ile Met Gln Tyr Val Asn Asp Ala Gly Thr Ser Thr Ser Tyr
115 120 125
Thr Ser Tyr Ile Gly Asn Leu Val Ala Thr Arg Ile Ser Ser Gln Trp
130 135 140
Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly Asn Asn Ser Val
145 150 155 160
Tyr Arg Cys Ala Gln Leu Ala Lys Asp Met Leu Gln Val Asn Arg Val
165 170 175
Asp Ala Val Val Ile Ala Gly Val Asp Leu Asn Gly Ser Ala Glu Ser
180 185 190
Phe Phe Val Arg Ala Asn Arg Gln Lys Ile Ser Lys Leu Ser His Pro
195 200 205
Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe Ala Gly Glu Gly
210 215 220
Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys Ala Pro Gln Glu
225 230 235 240
Lys Ile Tyr Ala Ser Ile Asp Ser Ile Ala Ile Asp Lys Glu Pro Thr
245 250 255
Ser Ser Ala Val Lys Ala Val Tyr Gln Ser Asp Ser Ser Leu Ser Asp
260 265 270
Ile Glu Leu Leu Glu Ile Ser Gly Asp Ser Lys Arg Phe Ala Ala Phe
275 280 285
Glu Gly Ala Val Glu Ile Gln Ser Ser Val Glu Ala Gln Leu Lys Gly
290 295 300
Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gln Gly Val Ala Val Gly
305 310 315 320
Ser Thr Arg Ala Thr Val Gly Asp Ile Gly Tyr Ala Thr Gly Ala Ala
325 330 335
Ser Leu Ile Lys Thr Ala Leu Cys Leu Tyr Asn Arg Tyr Leu Pro Ala
340 345 350
Leu Ala Asn Trp Ser Gly Pro Cys Glu Gln Ser Ala Trp Gly Ser Asn
355 360 365
Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys Asn Gln Asn Glu
370 375 380
Lys Arg Cys Ala Leu Ile Ser Gly Thr Asp Pro Ser His Thr Cys Phe
385 390 395 400
Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu His Asn Arg Thr
405 410 415
Cys Phe Asp Val Gln Ala Pro Gln Leu Val Leu Ile His Gly Phe Asp
420 425 430
Gly Lys Thr Ile Val Arg Arg Leu Glu Gly Tyr Leu Leu Glu Leu Val
435 440 445
Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys Leu Ile Gly Gln
450 455 460
Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr Leu Ser Leu Val
465 470 475 480
Cys Asn Pro Asn Gln Leu Gln Lys Glu Leu Met Leu Ala Ile Lys Gly
485 490 495
Val Gln Arg Ser
500
<210> 57
<211> 1500
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 57
atg tta aca ggg aag gat tgg gtc agt cca tca gga agt tgt ttt gcc 48
Met Leu Thr Gly Lys Asp Trp Val Ser Pro Ser Gly Ser Cys Phe Ala
1 5 10 15
cca aat ccg tta tca agc gca aaa gtg gca ttc atg tac gga gaa ggc 96
Pro Asn Pro Leu Ser Ser Ala Lys Val Ala Phe Met Tyr Gly Glu Gly
20 25 30
cga agc ccg tac tgt ggt gta ggc ttg ggt cta cat cgt ttg tgg ccc 144
Arg Ser Pro Tyr Cys Gly Val Gly Leu Gly Leu His Arg Leu Trp Pro
35 40 45
ggt ctc cat gaa aat gtg aac aat aag aca gtc gat tta tgg acg gaa 192
Gly Leu His Glu Asn Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu
50 55 60
gga gat ggt tgg tta tat cct cga acg ttg aca cga gaa gag cat aca 240
Gly Asp Gly Trp Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr
65 70 75 80
aaa gcc atc gaa tct ttc aac gca aat caa att gaa atg ttt cgc gct 288
Lys Ala Ile Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala
85 90 95
ggg att ttc atc tca atg tgt cag aca gac tat gtc atg aat gtt ctc 336
Gly Ile Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu
100 105 110
ggt gtc cag cct aag gcc gga ttt ggg ctg agc ttg gga gaa att tca 384
Gly Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
115 120 125
atg ctc ttt gcg atg tca aag gag aac tgc agg cag tca cag gaa atg 432
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu Met
130 135 140
acc aat cgt ttg cgc ggt tct cca gtg tgg tct aac gag ctt gct atc 480
Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu Ala Ile
145 150 155 160
aac ttc aat gca att cgc aag tta tgg aaa atc ccc cga gga gct ccc 528
Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg Gly Ala Pro
165 170 175
tta gaa tcc ttt tgg caa gga tac ttg gtt cac ggc aca aga gaa gaa 576
Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly Thr Arg Glu Glu
180 185 190
gta gag cat gct att ggt ctt tct gag cct tat gta cgt ctg ctt att 624
Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr Val Arg Leu Leu Ile
195 200 205
gtg aac gat tca agg agt gcc ttg att gct gga aaa cca gac gcc tgt 672
Val Asn Asp Ser Arg Ser Ala Leu Ile Ala Gly Lys Pro Asp Ala Cys
210 215 220
cag gca gta atc agt aga cta aac tcc aag ttc cct tct ctg ccg gta 720
Gln Ala Val Ile Ser Arg Leu Asn Ser Lys Phe Pro Ser Leu Pro Val
225 230 235 240
aag caa gga atg att ggt cat tgc cca gaa gtt cgt gcg ttc atc aaa 768
Lys Gln Gly Met Ile Gly His Cys Pro Glu Val Arg Ala Phe Ile Lys
245 250 255
gat att ggg tac atc cat gaa aca ctc cga att tcc aat gac tat tcg 816
Asp Ile Gly Tyr Ile His Glu Thr Leu Arg Ile Ser Asn Asp Tyr Ser
260 265 270
gat tgt cag ctt ttc tca gcg gta acc aag ggc gca ctt gac agc tcc 864
Asp Cys Gln Leu Phe Ser Ala Val Thr Lys Gly Ala Leu Asp Ser Ser
275 280 285
aca atg gaa atc aaa cac ttt gtg gga gag gtc tac tcc cgg atc gca 912
Thr Met Glu Ile Lys His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala
290 295 300
gac ttt cct caa atc gtc aac acg gtg cat tcg gct ggt tat gac gta 960
Asp Phe Pro Gln Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val
305 310 315 320
ttt ctt gag ctt ggc tgt gat gct tct aga tct gca gca gtt caa aac 1008
Phe Leu Glu Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn
325 330 335
att ctt ggt ggt caa gga aag ttc ttg tct aca gct att gac aaa aaa 1056
Ile Leu Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys
340 345 350
gga cac tcc gcc tgg tca caa gta ctt cgg gct acc gca tca tta gct 1104
Gly His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
355 360 365
gca cat cga gta ccg gga atc tca att ttg gat ttg ttt cac cca aat 1152
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro Asn
370 375 380
ttc cga gaa atg tgc tgt aca atg gca acc aca cct aaa gtg gaa gat 1200
Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val Glu Asp
385 390 395 400
aag ttc ctg cgc acg att caa atc aat ggt cgg ttt gaa aaa gaa atg 1248
Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu Lys Glu Met
405 410 415
att cac cta gaa gat aca aca tta agt tgc tta ccc gct cca agt gaa 1296
Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro Ala Pro Ser Glu
420 425 430
gca aat atc gca gct att caa tct cgg tca att cga tct gct gcg gcg 1344
Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile Arg Ser Ala Ala Ala
435 440 445
cgt tct gga caa tcc cat gat tgt gca tcc cat agc cat gaa gaa aat 1392
Arg Ser Gly Gln Ser His Asp Cys Ala Ser His Ser His Glu Glu Asn
450 455 460
aag gat tca tgc cct gaa aag ctg aag ctt gat tct gtg tcc gtc gcc 1440
Lys Asp Ser Cys Pro Glu Lys Leu Lys Leu Asp Ser Val Ser Val Ala
465 470 475 480
ata aat ttc gac aat gat gac cgc att cag ctt ggg cac gcg ggt ttt 1488
Ile Asn Phe Asp Asn Asp Asp Arg Ile Gln Leu Gly His Ala Gly Phe
485 490 495
cgg gag atg tac 1500
Arg Glu Met Tyr
500
<210> 58
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<400> 58
Met Leu Thr Gly Lys Asp Trp Val Ser Pro Ser Gly Ser Cys Phe Ala
1 5 10 15
Pro Asn Pro Leu Ser Ser Ala Lys Val Ala Phe Met Tyr Gly Glu Gly
20 25 30
Arg Ser Pro Tyr Cys Gly Val Gly Leu Gly Leu His Arg Leu Trp Pro
35 40 45
Gly Leu His Glu Asn Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu
50 55 60
Gly Asp Gly Trp Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr
65 70 75 80
Lys Ala Ile Glu Ser Phe Asn Ala Asn Gln Ile Glu Met Phe Arg Ala
85 90 95
Gly Ile Phe Ile Ser Met Cys Gln Thr Asp Tyr Val Met Asn Val Leu
100 105 110
Gly Val Gln Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu Ile Ser
115 120 125
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gln Ser Gln Glu Met
130 135 140
Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu Ala Ile
145 150 155 160
Asn Phe Asn Ala Ile Arg Lys Leu Trp Lys Ile Pro Arg Gly Ala Pro
165 170 175
Leu Glu Ser Phe Trp Gln Gly Tyr Leu Val His Gly Thr Arg Glu Glu
180 185 190
Val Glu His Ala Ile Gly Leu Ser Glu Pro Tyr Val Arg Leu Leu Ile
195 200 205
Val Asn Asp Ser Arg Ser Ala Leu Ile Ala Gly Lys Pro Asp Ala Cys
210 215 220
Gln Ala Val Ile Ser Arg Leu Asn Ser Lys Phe Pro Ser Leu Pro Val
225 230 235 240
Lys Gln Gly Met Ile Gly His Cys Pro Glu Val Arg Ala Phe Ile Lys
245 250 255
Asp Ile Gly Tyr Ile His Glu Thr Leu Arg Ile Ser Asn Asp Tyr Ser
260 265 270
Asp Cys Gln Leu Phe Ser Ala Val Thr Lys Gly Ala Leu Asp Ser Ser
275 280 285
Thr Met Glu Ile Lys His Phe Val Gly Glu Val Tyr Ser Arg Ile Ala
290 295 300
Asp Phe Pro Gln Ile Val Asn Thr Val His Ser Ala Gly Tyr Asp Val
305 310 315 320
Phe Leu Glu Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gln Asn
325 330 335
Ile Leu Gly Gly Gln Gly Lys Phe Leu Ser Thr Ala Ile Asp Lys Lys
340 345 350
Gly His Ser Ala Trp Ser Gln Val Leu Arg Ala Thr Ala Ser Leu Ala
355 360 365
Ala His Arg Val Pro Gly Ile Ser Ile Leu Asp Leu Phe His Pro Asn
370 375 380
Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val Glu Asp
385 390 395 400
Lys Phe Leu Arg Thr Ile Gln Ile Asn Gly Arg Phe Glu Lys Glu Met
405 410 415
Ile His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro Ala Pro Ser Glu
420 425 430
Ala Asn Ile Ala Ala Ile Gln Ser Arg Ser Ile Arg Ser Ala Ala Ala
435 440 445
Arg Ser Gly Gln Ser His Asp Cys Ala Ser His Ser His Glu Glu Asn
450 455 460
Lys Asp Ser Cys Pro Glu Lys Leu Lys Leu Asp Ser Val Ser Val Ala
465 470 475 480
Ile Asn Phe Asp Asn Asp Asp Arg Ile Gln Leu Gly His Ala Gly Phe
485 490 495
Arg Glu Met Tyr
500
<210> 59
<211> 1305
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1305)
<400> 59
aat aca aga tat agc ttg tac aca ggg gcg atg gca aag gga att gca 48
Asn Thr Arg Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
1 5 10 15
tct gca gat ctt gtc att gcc gct ggg aaa gag ggc atc cta gct tcc 96
Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser
20 25 30
tat gga gct gga gga cta cct ctt gct act gtt cga aag gga ata gac 144
Tyr Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
35 40 45
aaa att caa caa gcc ttg cca agt ggc cca tat gct gta aat ctt att 192
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu Ile
50 55 60
cac tct ccc ttt gac ggc aac ttg gag cag gga aac gtc gat ttg ttc 240
His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp Leu Phe
65 70 75 80
ttg gaa aag aac gtc cgc gtg gcg gaa tgt tcc gcg ttt aca acg cta 288
Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe Thr Thr Leu
85 90 95
aca gtg cca gta gta cac tat cgt gct gca ggg ctt gtt cgg cgc caa 336
Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu Val Arg Arg Gln
100 105 110
gat gga agc att ttg atc aag aac cga atc att gct aaa gta tct agg 384
Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile Ala Lys Val Ser Arg
115 120 125
aca gaa ctc gct gag atg ttc ctt cgt ccg gca cct caa atc atc ctc 432
Thr Glu Leu Ala Glu Met Phe Leu Arg Pro Ala Pro Gln Ile Ile Leu
130 135 140
gaa aaa ctg gta gca gca gaa atc att tca tct gac caa gcg cgt atg 480
Glu Lys Leu Val Ala Ala Glu Ile Ile Ser Ser Asp Gln Ala Arg Met
145 150 155 160
gca gcc aaa gtt ccc atg gcg gac gac atc gca gtc gaa gcc gac tct 528
Ala Ala Lys Val Pro Met Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
165 170 175
ggt ggg cac acg gat aat cgg cct atg cac gtc att ttg ccc ctg ata 576
Gly Gly His Thr Asp Asn Arg Pro Met His Val Ile Leu Pro Leu Ile
180 185 190
att caa ctc cgc aat act ata ctt gca gag tat ggc tgt gcc acg gct 624
Ile Gln Leu Arg Asn Thr Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala
195 200 205
ttt cgt acc cgt ata ggc gct gga gga ggc att ggt tgt cct tca gcg 672
Phe Arg Thr Arg Ile Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala
210 215 220
gcc ctc gca gcc ttt gat atg ggt gcg agt ttt gtc gtg act gga agc 720
Ala Leu Ala Ala Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser
225 230 235 240
ata aat caa att tgc cgc gag gca ggg act tgc gat act gtt cgg gag 768
Ile Asn Gln Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu
245 250 255
cta ctt gcc aac tca agc tac tcg gac gtg acg atg gcg cca gca gca 816
Leu Leu Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala
260 265 270
gac atg ttt gac caa ggt gtg aaa ctc caa gtc tta aaa cga gga acg 864
Asp Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
275 280 285
atg ttt cca agc aga gca aat aaa ctc cgg aag ctc ttt gtg aac tac 912
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn Tyr
290 295 300
gaa tct cta gaa aca ctc ccg tcg aaa gag ttg aaa tac ctg gaa aac 960
Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu Glu Asn
305 310 315 320
atc ata ttc aag caa gca gta gac cag gtg tgg gag gaa aca aag cgc 1008
Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu Thr Lys Arg
325 330 335
ttt tac tgt gaa aaa ctg aac aat cca gat aaa att gca agg gcc atg 1056
Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile Ala Arg Ala Met
340 345 350
aaa gat cct aaa ttg aag atg tcg ctt tgc ttt cgg tgg tat ctc tcc 1104
Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
355 360 365
aag agc tct ggg tgg gcc aac gca gga att aaa tct cgt gca ctc gac 1152
Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile Lys Ser Arg Ala Leu Asp
370 375 380
tac cag atc tgg tgt ggc ccg gca atg ggc tcg ttc aac aat ttc gcc 1200
Tyr Gln Ile Trp Cys Gly Pro Ala Met Gly Ser Phe Asn Asn Phe Ala
385 390 395 400
agc ggc aca tcc ctc gat tgg aaa gtg act ggg gtt ttc cct ggc gtt 1248
Ser Gly Thr Ser Leu Asp Trp Lys Val Thr Gly Val Phe Pro Gly Val
405 410 415
gcg gaa gta aac atg gcc att tta gat ggc gcg cga gaa cta gct gct 1296
Ala Glu Val Asn Met Ala Ile Leu Asp Gly Ala Arg Glu Leu Ala Ala
420 425 430
aaa cga aat 1305
Lys Arg Asn
435
<210> 60
<211> 435
<212> PRT
<213> Thraustochytrium sp.
<400> 60
Asn Thr Arg Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly Ile Ala
1 5 10 15
Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Glu Gly Ile Leu Ala Ser
20 25 30
Tyr Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly Ile Asp
35 40 45
Lys Ile Gln Gln Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu Ile
50 55 60
His Ser Pro Phe Asp Gly Asn Leu Glu Gln Gly Asn Val Asp Leu Phe
65 70 75 80
Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe Thr Thr Leu
85 90 95
Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu Val Arg Arg Gln
100 105 110
Asp Gly Ser Ile Leu Ile Lys Asn Arg Ile Ile Ala Lys Val Ser Arg
115 120 125
Thr Glu Leu Ala Glu Met Phe Leu Arg Pro Ala Pro Gln Ile Ile Leu
130 135 140
Glu Lys Leu Val Ala Ala Glu Ile Ile Ser Ser Asp Gln Ala Arg Met
145 150 155 160
Ala Ala Lys Val Pro Met Ala Asp Asp Ile Ala Val Glu Ala Asp Ser
165 170 175
Gly Gly His Thr Asp Asn Arg Pro Met His Val Ile Leu Pro Leu Ile
180 185 190
Ile Gln Leu Arg Asn Thr Ile Leu Ala Glu Tyr Gly Cys Ala Thr Ala
195 200 205
Phe Arg Thr Arg Ile Gly Ala Gly Gly Gly Ile Gly Cys Pro Ser Ala
210 215 220
Ala Leu Ala Ala Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser
225 230 235 240
Ile Asn Gln Ile Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu
245 250 255
Leu Leu Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala
260 265 270
Asp Met Phe Asp Gln Gly Val Lys Leu Gln Val Leu Lys Arg Gly Thr
275 280 285
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn Tyr
290 295 300
Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu Glu Asn
305 310 315 320
Ile Ile Phe Lys Gln Ala Val Asp Gln Val Trp Glu Glu Thr Lys Arg
325 330 335
Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys Ile Ala Arg Ala Met
340 345 350
Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser
355 360 365
Lys Ser Ser Gly Trp Ala Asn Ala Gly Ile Lys Ser Arg Ala Leu Asp
370 375 380
Tyr Gln Ile Trp Cys Gly Pro Ala Met Gly Ser Phe Asn Asn Phe Ala
385 390 395 400
Ser Gly Thr Ser Leu Asp Trp Lys Val Thr Gly Val Phe Pro Gly Val
405 410 415
Ala Glu Val Asn Met Ala Ile Leu Asp Gly Ala Arg Glu Leu Ala Ala
420 425 430
Lys Arg Asn
435
<210> 61
<211> 4410
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(4410)
<400> 61
atg ggc ccg cga gtg gcg tca ggc aag gtg ccg gct tgg gag atg agc 48
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1 5 10 15
aag tcc gag ctg tgt gat gac cgc acg gta gtc ttt gac tat gag gag 96
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
20 25 30
ctg ctg gag ttc gct gag ggc gat atc agt aag gtt ttt ggg ccg gag 144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
35 40 45
ttc aaa gtg gtg gac ggg ttt agg cgc agg gtg agg ttg ccc gct cga 192
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
gag tac ctg ctg gtg acc cgg gtt acg ctg atg gat gcc gag gtg ggc 240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65 70 75 80
aac ttt cga gtg gga gca cgt atg gtg aca gag tat gac gta cct gtg 288
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
85 90 95
aac gga gag ctc tcg gaa ggg gga gat gtg ccg tgg gct gtg ttg gtg 336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
100 105 110
gaa gcc ggg cag tgc gac ttg ctg cta att tct tac atg ggc atc gat 384
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
ttc cag tgc aaa gga gag cgg gtc tac cgg ctg ctg aac acc acc ttg 432
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
acg ttt ttt ggc gtc gcg aaa gaa ggg gaa acg ctt gtg tac gat att 480
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145 150 155 160
cgc gtc acg ggt ttc gcc aag agg ccg gac gga gat atc tcc atg ttc 528
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
165 170 175
ttt ttc gaa tat gat tgc tac tgc aat ggc aag ctt ctc atc gaa atg 576
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
180 185 190
cga gat ggc tct gca ggc ttc ttc acg gac gaa gag ctc gct gcc ggc 624
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
195 200 205
aaa gga gtg gtc gtc act cgt gca cag caa aac atg cgg gac aaa att 672
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
210 215 220
gta cgg cag tcc att gag cct ttt gca ctg gcg gct tgc acg cac aaa 720
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225 230 235 240
acg act ctg aac gag agt gac atg cag tcc ctt gtg gag cga aac tgg 768
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
245 250 255
gca aac gtt ttt ggc acc agt aac aag atg gcg gag ctc aac tat aaa 816
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
260 265 270
att tgc gcc agg aaa atg ctc atg atc gac agg gtt acc cac att gac 864
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
275 280 285
cac cac ggt ggg gcg tat ggc ctc gga cta ctt gtt gga gag aag atc 912
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
290 295 300
ttg gat cga aac cat tgg tac ttt cct tgt cac ttt gtc aat gat caa 960
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305 310 315 320
gtc atg gca ggg tca ctg gtc agc gat ggt tgc agc cag ctc tta aaa 1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
325 330 335
ctc tat atg atc tgg ctt ggc ctc cac ctg aaa atg gag gaa ttt gat 1056
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
340 345 350
ttt ctc cca gtt agc ggc cac aaa aac aag gtg cga tgc agg gga caa 1104
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
att tca ccg cat aaa ggc aag ctt gtc tac gtc atg gaa atc aaa aag 1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
370 375 380
atg ggt tac gat caa gca tct gga agc cca tac gcc atc gcg gac gtt 1200
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385 390 395 400
gat atc att gac gtc aac gaa gag ctg ggt caa agt ttt gac atc aac 1248
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
405 410 415
gac ctt gcg agc tac gga aaa ggt gac ctg agc aaa aaa atc gtg gtt 1296
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
420 425 430
gac ttc aaa gga att gct ttg cag ctc aaa ggc cgc gct ttt tca cgc 1344
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
435 440 445
atg agt tcc agc tcg tcc ttg aac gaa gga tgg caa tgt gtt cca aaa 1392
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
450 455 460
cca agc cag aga atg gaa cac gaa cag ccc cct gct cac tgc ctt gca 1440
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465 470 475 480
agc gac ccc gaa gcc cct tca act gtg acc tgg cac cca atg tca aag 1488
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
485 490 495
ctt cct ggc aac cct acg ccg ttc ttc tcc cct tca tct tac cct ccg 1536
Leu Pro Gly Asn Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro
500 505 510
agg gca att tgc ttc atc cct ttc ccg ggc aat ccc ctt gac aac aac 1584
Arg Ala Ile Cys Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn
515 520 525
tgc aag gct gga gaa atg ccc ctg aac tgg tac aac atg tca gag ttc 1632
Cys Lys Ala Gly Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe
530 535 540
atg tgt ggc aag gtt tct aac tgc ttg ggc cca gaa ttc gca cgc ttt 1680
Met Cys Gly Lys Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe
545 550 555 560
gac aag tcg aac acc agc cgg agc cct gct ttt gac ttg gct ctg gtg 1728
Asp Lys Ser Asn Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val
565 570 575
acc cga gtt gtt gaa gtc aca aac atg gaa cac ggc aag ttt cta aac 1776
Thr Arg Val Val Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn
580 585 590
gtt gat tgc aat cca agc aaa ggc aca atg gtg ggg gag ttt gac tgt 1824
Val Asp Cys Asn Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys
595 600 605
ccc caa gac gcg tgg ttc ttt gat ggt tcg tgc aac gac ggc cat atg 1872
Pro Gln Asp Ala Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met
610 615 620
ccg tat tcc att atc atg gaa atc gga ctg caa acc tca ggt gtt ctc 1920
Pro Tyr Ser Ile Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu
625 630 635 640
acc tcg gtg ttg aag gca ccg ctg act atg gac aag gat gac att ctc 1968
Thr Ser Val Leu Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu
645 650 655
ttt cga aac ctc gat gca agt gct gaa atg gtg cgt cca gac gtg gat 2016
Phe Arg Asn Leu Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp
660 665 670
gtt cgc ggc aaa acg att cga aac gtg acc aag tgt acc ggc tat gca 2064
Val Arg Gly Lys Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala
675 680 685
atg ttg gga aag atg ggg att cac cgg ttc acg ttt gag ttg agc gtt 2112
Met Leu Gly Lys Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val
690 695 700
gac ggc gtg gta ttt tat aaa gga tcc act tcc ttt gga tgg ttc act 2160
Asp Gly Val Val Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr
705 710 715 720
ccc gag gtg ttt gct cag caa gct gga ctc gac aac ggg aaa aag acg 2208
Pro Glu Val Phe Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr
725 730 735
gag ccc tgg tgc aag act aac aac acc tcg gtt cga aga gtt gaa atc 2256
Glu Pro Trp Cys Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile
740 745 750
gca tcc gcc aaa gga aaa gag cag ctg act gag aag ctt ccc gac gca 2304
Ala Ser Ala Lys Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala
755 760 765
act aat gct caa gtt ctt cgg cgt tca gag cag tgt gaa tac ctc gat 2352
Thr Asn Ala Gln Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp
770 775 780
tac ctc aat att gcc cct gac tct ggg ctg cat ggg aag ggc tac gcc 2400
Tyr Leu Asn Ile Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala
785 790 795 800
cac gga cac aaa gac gtt aac ccg caa gac tgg ttc ttc tct tgc cac 2448
His Gly His Lys Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His
805 810 815
ttt tgg ttc gat cct gta atg cca gga tct tta gga att gaa tca atg 2496
Phe Trp Phe Asp Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met
820 825 830
ttc cag ctt atc gag gcc ttt gcg gtg gac caa aac att cct gga gag 2544
Phe Gln Leu Ile Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu
835 840 845
tac aac gta tcc aat ccg acc ttt gcc cat gca cca ggc aaa acg gcg 2592
Tyr Asn Val Ser Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala
850 855 860
tgg aaa tac cga ggc cag ctc aca cca aag aac cgt gcg atg gac tgc 2640
Trp Lys Tyr Arg Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys
865 870 875 880
gag gtg cat atc gtt tca att acc gcc tcc ccc gag aac ggg ggc tac 2688
Glu Val His Ile Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr
885 890 895
gtt gac atc gtg gcc gat gga gcg ctt tgg gta gat gga ctt cgc gtg 2736
Val Asp Ile Val Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val
900 905 910
tac gaa gcc aaa gag ctt cga gtt cgt gtc gtt tcg gca aaa cct caa 2784
Tyr Glu Ala Lys Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln
915 920 925
gca att ccg gat gta caa caa cag cca cct agc gca aag gcg gac ccg 2832
Ala Ile Pro Asp Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro
930 935 940
ggg aaa aca gga gtt gca ctt tcg ccc act cag cta cgc gac gtc ctg 2880
Gly Lys Thr Gly Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu
945 950 955 960
ctt gaa gtg gac aat cca ttg tat ctt ggt gta gag aac tcc aat ttg 2928
Leu Glu Val Asp Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu
965 970 975
gtg cag ttt gag tcg aaa cct gca act tct tca cgt atc gtt tcg atc 2976
Val Gln Phe Glu Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile
980 985 990
aaa ccg tgc tcg att agt gac ctt ggc gat aag tct ttt atg gaa acg 3024
Lys Pro Cys Ser Ile Ser Asp Leu Gly Asp Lys Ser Phe Met Glu Thr
995 1000 1005
tac aac gtg tca gca cct ctg tat act gga gca atg gcc aag ggc 3069
Tyr Asn Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly
1010 1015 1020
att gca tcc gcc gac ttg gtc att gct gct ggg aaa cgc aag ata 3114
Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Arg Lys Ile
1025 1030 1035
ctt gga tcg ttt ggt gcg gga ggg ctg cct att tcc ata gtc cgt 3159
Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Ile Ser Ile Val Arg
1040 1045 1050
gaa gca ctg gag aaa att caa caa cac ctg ccc cac ggc ccc tac 3204
Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro His Gly Pro Tyr
1055 1060 1065
gct gtt aac ctc att cac tcg cct ttc gac agc aac ttg gaa aag 3249
Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn Leu Glu Lys
1070 1075 1080
ggc aac gtt gac ctc ttt ctc gag atg ggc gtg aca gtg gta gaa 3294
Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val Val Glu
1085 1090 1095
tgc agc gcg ttc atg gaa ctc acg gcc cag gtt gtc cgg tac cgc 3339
Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr Arg
1100 1105 1110
gcg tct ggt cta agc aaa agt gcg gac ggt tcg att cgc att gct 3384
Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
1115 1120 1125
cac cgt att att ggc aag gtt tcc aga acc gag ctg gca gaa atg 3429
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met
1130 1135 1140
ttt att cgt cca gca cca cag cac ctc ctc caa aaa ctc gta gcc 3474
Phe Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala
1145 1150 1155
tcc ggc gag ctg aca gct gag caa gcc gag ctt gca aca cag gtt 3519
Ser Gly Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val
1160 1165 1170
ccg gtg gcg gat gac att gcg gtc gaa gcc gac tcg ggg ggg cat 3564
Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
1175 1180 1185
acc gac aac agg cct att cac gtc att ctt cct cta atc atc aac 3609
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn
1190 1195 1200
cta cgc aac cgt ttg cat aaa gag ctt gac tac cct tcg cat ctc 3654
Leu Arg Asn Arg Leu His Lys Glu Leu Asp Tyr Pro Ser His Leu
1205 1210 1215
cgg gta cgt gtg ggt gct ggt ggt ggt att gga tgt cct caa gcc 3699
Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
1220 1225 1230
gct ctt gca gca ttt caa atg ggg gca gcg ttt tta atc act gga 3744
Ala Leu Ala Ala Phe Gln Met Gly Ala Ala Phe Leu Ile Thr Gly
1235 1240 1245
acg gtg aac cag ctt gct cgt gaa agt ggc act tgt gac aac gtc 3789
Thr Val Asn Gln Leu Ala Arg Glu Ser Gly Thr Cys Asp Asn Val
1250 1255 1260
cgg tta cag ctc tca aag gcc acg tat agc gac gtg tgt atg gct 3834
Arg Leu Gln Leu Ser Lys Ala Thr Tyr Ser Asp Val Cys Met Ala
1265 1270 1275
cct gct gcc gat atg ttt gac caa ggc gtg gag ctg caa gta ttg 3879
Pro Ala Ala Asp Met Phe Asp Gln Gly Val Glu Leu Gln Val Leu
1280 1285 1290
aag aaa ggc acg ctg ttc cca agt cgt gct aag aag ctg tac gag 3924
Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys Lys Leu Tyr Glu
1295 1300 1305
ctg ttc tgc aag tat gac tcg ttt gag gca atg ccg gct gaa gaa 3969
Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro Ala Glu Glu
1310 1315 1320
ttg caa cgg gtt gaa aag cgg att ttt caa aag tcg ctt gct gaa 4014
Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu Ala Glu
1325 1330 1335
gtt tgg cag gag acc agt gac ttt tac att cat cgt atc aag aac 4059
Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys Asn
1340 1345 1350
cct gag aaa atc aat cgt gct gca agc gat ggc aaa ctg aaa atg 4104
Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
1355 1360 1365
tcg ctt tgc ttt cgc tgg tac ctt ggg ctt tcc tca ttt tgg gcc 4149
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala
1370 1375 1380
aac tct ggg gca caa gat cgc gtc atg gac tat caa att tgg tgt 4194
Asn Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys
1385 1390 1395
ggc cct gct att ggc gct ttc aat gat ttt acc aag ggc acg tac 4239
Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr
1400 1405 1410
ctt gac gtg act gtt gca aag agt tac cct tgt gtg gca cag atc 4284
Leu Asp Val Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile
1415 1420 1425
aat ttg caa att ttg caa gga gct gcg tat ctg aaa cgc ctt ggt 4329
Asn Leu Gln Ile Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly
1430 1435 1440
gtc att cgt ttt gac cgc atg ctg ctg cag gcc gtc gat atc gac 4374
Val Ile Arg Phe Asp Arg Met Leu Leu Gln Ala Val Asp Ile Asp
1445 1450 1455
gat cct gta ttt act tac gtg ccg acc cag cca ctt 4410
Asp Pro Val Phe Thr Tyr Val Pro Thr Gln Pro Leu
1460 1465 1470
<210> 62
<211> 1470
<212> PRT
<213> Thraustochytrium sp.
<400> 62
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1 5 10 15
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
35 40 45
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65 70 75 80
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
100 105 110
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
180 185 190
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
195 200 205
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
210 215 220
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225 230 235 240
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
245 250 255
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
260 265 270
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
275 280 285
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
290 295 300
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
325 330 335
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
340 345 350
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
370 375 380
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385 390 395 400
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
405 410 415
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
420 425 430
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
435 440 445
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
450 455 460
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465 470 475 480
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
485 490 495
Leu Pro Gly Asn Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro
500 505 510
Arg Ala Ile Cys Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn
515 520 525
Cys Lys Ala Gly Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe
530 535 540
Met Cys Gly Lys Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe
545 550 555 560
Asp Lys Ser Asn Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val
565 570 575
Thr Arg Val Val Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn
580 585 590
Val Asp Cys Asn Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys
595 600 605
Pro Gln Asp Ala Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met
610 615 620
Pro Tyr Ser Ile Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu
625 630 635 640
Thr Ser Val Leu Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu
645 650 655
Phe Arg Asn Leu Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp
660 665 670
Val Arg Gly Lys Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala
675 680 685
Met Leu Gly Lys Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val
690 695 700
Asp Gly Val Val Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr
705 710 715 720
Pro Glu Val Phe Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr
725 730 735
Glu Pro Trp Cys Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile
740 745 750
Ala Ser Ala Lys Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala
755 760 765
Thr Asn Ala Gln Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp
770 775 780
Tyr Leu Asn Ile Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala
785 790 795 800
His Gly His Lys Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His
805 810 815
Phe Trp Phe Asp Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met
820 825 830
Phe Gln Leu Ile Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu
835 840 845
Tyr Asn Val Ser Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala
850 855 860
Trp Lys Tyr Arg Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys
865 870 875 880
Glu Val His Ile Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr
885 890 895
Val Asp Ile Val Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val
900 905 910
Tyr Glu Ala Lys Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln
915 920 925
Ala Ile Pro Asp Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro
930 935 940
Gly Lys Thr Gly Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu
945 950 955 960
Leu Glu Val Asp Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu
965 970 975
Val Gln Phe Glu Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile
980 985 990
Lys Pro Cys Ser Ile Ser Asp Leu Gly Asp Lys Ser Phe Met Glu Thr
995 1000 1005
Tyr Asn Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly
1010 1015 1020
Ile Ala Ser Ala Asp Leu Val Ile Ala Ala Gly Lys Arg Lys Ile
1025 1030 1035
Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Ile Ser Ile Val Arg
1040 1045 1050
Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro His Gly Pro Tyr
1055 1060 1065
Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn Leu Glu Lys
1070 1075 1080
Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val Val Glu
1085 1090 1095
Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr Arg
1100 1105 1110
Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
1115 1120 1125
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met
1130 1135 1140
Phe Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala
1145 1150 1155
Ser Gly Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val
1160 1165 1170
Pro Val Ala Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His
1175 1180 1185
Thr Asp Asn Arg Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn
1190 1195 1200
Leu Arg Asn Arg Leu His Lys Glu Leu Asp Tyr Pro Ser His Leu
1205 1210 1215
Arg Val Arg Val Gly Ala Gly Gly Gly Ile Gly Cys Pro Gln Ala
1220 1225 1230
Ala Leu Ala Ala Phe Gln Met Gly Ala Ala Phe Leu Ile Thr Gly
1235 1240 1245
Thr Val Asn Gln Leu Ala Arg Glu Ser Gly Thr Cys Asp Asn Val
1250 1255 1260
Arg Leu Gln Leu Ser Lys Ala Thr Tyr Ser Asp Val Cys Met Ala
1265 1270 1275
Pro Ala Ala Asp Met Phe Asp Gln Gly Val Glu Leu Gln Val Leu
1280 1285 1290
Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys Lys Leu Tyr Glu
1295 1300 1305
Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro Ala Glu Glu
1310 1315 1320
Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu Ala Glu
1325 1330 1335
Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys Asn
1340 1345 1350
Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
1355 1360 1365
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala
1370 1375 1380
Asn Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys
1385 1390 1395
Gly Pro Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr
1400 1405 1410
Leu Asp Val Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile
1415 1420 1425
Asn Leu Gln Ile Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly
1430 1435 1440
Val Ile Arg Phe Asp Arg Met Leu Leu Gln Ala Val Asp Ile Asp
1445 1450 1455
Asp Pro Val Phe Thr Tyr Val Pro Thr Gln Pro Leu
1460 1465 1470
<210> 63
<211> 1500
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 63
atg ggc ccg cga gtg gcg tca ggc aag gtg ccg gct tgg gag atg agc 48
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1 5 10 15
aag tcc gag ctg tgt gat gac cgc acg gta gtc ttt gac tat gag gag 96
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
20 25 30
ctg ctg gag ttc gct gag ggc gat atc agt aag gtt ttt ggg ccg gag 144
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
35 40 45
ttc aaa gtg gtg gac ggg ttt agg cgc agg gtg agg ttg ccc gct cga 192
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
gag tac ctg ctg gtg acc cgg gtt acg ctg atg gat gcc gag gtg ggc 240
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65 70 75 80
aac ttt cga gtg gga gca cgt atg gtg aca gag tat gac gta cct gtg 288
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
85 90 95
aac gga gag ctc tcg gaa ggg gga gat gtg ccg tgg gct gtg ttg gtg 336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
100 105 110
gaa gcc ggg cag tgc gac ttg ctg cta att tct tac atg ggc atc gat 384
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
ttc cag tgc aaa gga gag cgg gtc tac cgg ctg ctg aac acc acc ttg 432
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
acg ttt ttt ggc gtc gcg aaa gaa ggg gaa acg ctt gtg tac gat att 480
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145 150 155 160
cgc gtc acg ggt ttc gcc aag agg ccg gac gga gat atc tcc atg ttc 528
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
165 170 175
ttt ttc gaa tat gat tgc tac tgc aat ggc aag ctt ctc atc gaa atg 576
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
180 185 190
cga gat ggc tct gca ggc ttc ttc acg gac gaa gag ctc gct gcc ggc 624
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
195 200 205
aaa gga gtg gtc gtc act cgt gca cag caa aac atg cgg gac aaa att 672
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
210 215 220
gta cgg cag tcc att gag cct ttt gca ctg gcg gct tgc acg cac aaa 720
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225 230 235 240
acg act ctg aac gag agt gac atg cag tcc ctt gtg gag cga aac tgg 768
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
245 250 255
gca aac gtt ttt ggc acc agt aac aag atg gcg gag ctc aac tat aaa 816
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
260 265 270
att tgc gcc agg aaa atg ctc atg atc gac agg gtt acc cac att gac 864
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
275 280 285
cac cac ggt ggg gcg tat ggc ctc gga cta ctt gtt gga gag aag atc 912
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
290 295 300
ttg gat cga aac cat tgg tac ttt cct tgt cac ttt gtc aat gat caa 960
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305 310 315 320
gtc atg gca ggg tca ctg gtc agc gat ggt tgc agc cag ctc tta aaa 1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
325 330 335
ctc tat atg atc tgg ctt ggc ctc cac ctg aaa atg gag gaa ttt gat 1056
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
340 345 350
ttt ctc cca gtt agc ggc cac aaa aac aag gtg cga tgc agg gga caa 1104
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
att tca ccg cat aaa ggc aag ctt gtc tac gtc atg gaa atc aaa aag 1152
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
370 375 380
atg ggt tac gat caa gca tct gga agc cca tac gcc atc gcg gac gtt 1200
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385 390 395 400
gat atc att gac gtc aac gaa gag ctg ggt caa agt ttt gac atc aac 1248
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
405 410 415
gac ctt gcg agc tac gga aaa ggt gac ctg agc aaa aaa atc gtg gtt 1296
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
420 425 430
gac ttc aaa gga att gct ttg cag ctc aaa ggc cgc gct ttt tca cgc 1344
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
435 440 445
atg agt tcc agc tcg tcc ttg aac gaa gga tgg caa tgt gtt cca aaa 1392
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
450 455 460
cca agc cag aga atg gaa cac gaa cag ccc cct gct cac tgc ctt gca 1440
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465 470 475 480
agc gac ccc gaa gcc cct tca act gtg acc tgg cac cca atg tca aag 1488
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
485 490 495
ctt cct ggc aac 1500
Leu Pro Gly Asn
500
<210> 64
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<400> 64
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser
1 5 10 15
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu
20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp Ile Ser Lys Val Phe Gly Pro Glu
35 40 45
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg
50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly
65 70 75 80
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val
85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val
100 105 110
Glu Ala Gly Gln Cys Asp Leu Leu Leu Ile Ser Tyr Met Gly Ile Asp
115 120 125
Phe Gln Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu
130 135 140
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp Ile
145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp Ile Ser Met Phe
165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu Ile Glu Met
180 185 190
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly
195 200 205
Lys Gly Val Val Val Thr Arg Ala Gln Gln Asn Met Arg Asp Lys Ile
210 215 220
Val Arg Gln Ser Ile Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys
225 230 235 240
Thr Thr Leu Asn Glu Ser Asp Met Gln Ser Leu Val Glu Arg Asn Trp
245 250 255
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys
260 265 270
Ile Cys Ala Arg Lys Met Leu Met Ile Asp Arg Val Thr His Ile Asp
275 280 285
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys Ile
290 295 300
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gln
305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gln Leu Leu Lys
325 330 335
Leu Tyr Met Ile Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp
340 345 350
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gln
355 360 365
Ile Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu Ile Lys Lys
370 375 380
Met Gly Tyr Asp Gln Ala Ser Gly Ser Pro Tyr Ala Ile Ala Asp Val
385 390 395 400
Asp Ile Ile Asp Val Asn Glu Glu Leu Gly Gln Ser Phe Asp Ile Asn
405 410 415
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys Ile Val Val
420 425 430
Asp Phe Lys Gly Ile Ala Leu Gln Leu Lys Gly Arg Ala Phe Ser Arg
435 440 445
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gln Cys Val Pro Lys
450 455 460
Pro Ser Gln Arg Met Glu His Glu Gln Pro Pro Ala His Cys Leu Ala
465 470 475 480
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys
485 490 495
Leu Pro Gly Asn
500
<210> 65
<211> 1500
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1500)
<400> 65
cct acg ccg ttc ttc tcc cct tca tct tac cct ccg agg gca att tgc 48
Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala Ile Cys
1 5 10 15
ttc atc cct ttc ccg ggc aat ccc ctt gac aac aac tgc aag gct gga 96
Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly
20 25 30
gaa atg ccc ctg aac tgg tac aac atg tca gag ttc atg tgt ggc aag 144
Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys
35 40 45
gtt tct aac tgc ttg ggc cca gaa ttc gca cgc ttt gac aag tcg aac 192
Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn
50 55 60
acc agc cgg agc cct gct ttt gac ttg gct ctg gtg acc cga gtt gtt 240
Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val Thr Arg Val Val
65 70 75 80
gaa gtc aca aac atg gaa cac ggc aag ttt cta aac gtt gat tgc aat 288
Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn
85 90 95
cca agc aaa ggc aca atg gtg ggg gag ttt gac tgt ccc caa gac gcg 336
Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gln Asp Ala
100 105 110
tgg ttc ttt gat ggt tcg tgc aac gac ggc cat atg ccg tat tcc att 384
Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser Ile
115 120 125
atc atg gaa atc gga ctg caa acc tca ggt gtt ctc acc tcg gtg ttg 432
Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu
130 135 140
aag gca ccg ctg act atg gac aag gat gac att ctc ttt cga aac ctc 480
Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu Phe Arg Asn Leu
145 150 155 160
gat gca agt gct gaa atg gtg cgt cca gac gtg gat gtt cgc ggc aaa 528
Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys
165 170 175
acg att cga aac gtg acc aag tgt acc ggc tat gca atg ttg gga aag 576
Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys
180 185 190
atg ggg att cac cgg ttc acg ttt gag ttg agc gtt gac ggc gtg gta 624
Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val
195 200 205
ttt tat aaa gga tcc act tcc ttt gga tgg ttc act ccc gag gtg ttt 672
Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe
210 215 220
gct cag caa gct gga ctc gac aac ggg aaa aag acg gag ccc tgg tgc 720
Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys
225 230 235 240
aag act aac aac acc tcg gtt cga aga gtt gaa atc gca tcc gcc aaa 768
Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile Ala Ser Ala Lys
245 250 255
gga aaa gag cag ctg act gag aag ctt ccc gac gca act aat gct caa 816
Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gln
260 265 270
gtt ctt cgg cgt tca gag cag tgt gaa tac ctc gat tac ctc aat att 864
Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp Tyr Leu Asn Ile
275 280 285
gcc cct gac tct ggg ctg cat ggg aag ggc tac gcc cac gga cac aaa 912
Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys
290 295 300
gac gtt aac ccg caa gac tgg ttc ttc tct tgc cac ttt tgg ttc gat 960
Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp
305 310 315 320
cct gta atg cca gga tct tta gga att gaa tca atg ttc cag ctt atc 1008
Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met Phe Gln Leu Ile
325 330 335
gag gcc ttt gcg gtg gac caa aac att cct gga gag tac aac gta tcc 1056
Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu Tyr Asn Val Ser
340 345 350
aat ccg acc ttt gcc cat gca cca ggc aaa acg gcg tgg aaa tac cga 1104
Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg
355 360 365
ggc cag ctc aca cca aag aac cgt gcg atg gac tgc gag gtg cat atc 1152
Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His Ile
370 375 380
gtt tca att acc gcc tcc ccc gag aac ggg ggc tac gtt gac atc gtg 1200
Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp Ile Val
385 390 395 400
gcc gat gga gcg ctt tgg gta gat gga ctt cgc gtg tac gaa gcc aaa 1248
Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys
405 410 415
gag ctt cga gtt cgt gtc gtt tcg gca aaa cct caa gca att ccg gat 1296
Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln Ala Ile Pro Asp
420 425 430
gta caa caa cag cca cct agc gca aag gcg gac ccg ggg aaa aca gga 1344
Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly
435 440 445
gtt gca ctt tcg ccc act cag cta cgc gac gtc ctg ctt gaa gtg gac 1392
Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu Leu Glu Val Asp
450 455 460
aat cca ttg tat ctt ggt gta gag aac tcc aat ttg gtg cag ttt gag 1440
Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gln Phe Glu
465 470 475 480
tcg aaa cct gca act tct tca cgt atc gtt tcg atc aaa ccg tgc tcg 1488
Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile Lys Pro Cys Ser
485 490 495
att agt gac ctt 1500
Ile Ser Asp Leu
500
<210> 66
<211> 500
<212> PRT
<213> Thraustochytrium sp.
<400> 66
Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala Ile Cys
1 5 10 15
Phe Ile Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly
20 25 30
Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys
35 40 45
Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn
50 55 60
Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val Thr Arg Val Val
65 70 75 80
Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn
85 90 95
Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gln Asp Ala
100 105 110
Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser Ile
115 120 125
Ile Met Glu Ile Gly Leu Gln Thr Ser Gly Val Leu Thr Ser Val Leu
130 135 140
Lys Ala Pro Leu Thr Met Asp Lys Asp Asp Ile Leu Phe Arg Asn Leu
145 150 155 160
Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys
165 170 175
Thr Ile Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys
180 185 190
Met Gly Ile His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val
195 200 205
Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe
210 215 220
Ala Gln Gln Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys
225 230 235 240
Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu Ile Ala Ser Ala Lys
245 250 255
Gly Lys Glu Gln Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gln
260 265 270
Val Leu Arg Arg Ser Glu Gln Cys Glu Tyr Leu Asp Tyr Leu Asn Ile
275 280 285
Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys
290 295 300
Asp Val Asn Pro Gln Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp
305 310 315 320
Pro Val Met Pro Gly Ser Leu Gly Ile Glu Ser Met Phe Gln Leu Ile
325 330 335
Glu Ala Phe Ala Val Asp Gln Asn Ile Pro Gly Glu Tyr Asn Val Ser
340 345 350
Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg
355 360 365
Gly Gln Leu Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His Ile
370 375 380
Val Ser Ile Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp Ile Val
385 390 395 400
Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys
405 410 415
Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gln Ala Ile Pro Asp
420 425 430
Val Gln Gln Gln Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly
435 440 445
Val Ala Leu Ser Pro Thr Gln Leu Arg Asp Val Leu Leu Glu Val Asp
450 455 460
Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gln Phe Glu
465 470 475 480
Ser Lys Pro Ala Thr Ser Ser Arg Ile Val Ser Ile Lys Pro Cys Ser
485 490 495
Ile Ser Asp Leu
500
<210> 67
<211> 1410
<212> DNA
<213> Thraustochytrium sp.
<220>
<221> CDS
<222> (1)..(1410)
<400> 67
ggc gat aag tct ttt atg gaa acg tac aac gtg tca gca cct ctg tat 48
Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala Pro Leu Tyr
1 5 10 15
act gga gca atg gcc aag ggc att gca tcc gcc gac ttg gtc att gct 96
Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala
20 25 30
gct ggg aaa cgc aag ata ctt gga tcg ttt ggt gcg gga ggg ctg cct 144
Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro
35 40 45
att tcc ata gtc cgt gaa gca ctg gag aaa att caa caa cac ctg ccc 192
Ile Ser Ile Val Arg Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro
50 55 60
cac ggc ccc tac gct gtt aac ctc att cac tcg cct ttc gac agc aac 240
His Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
65 70 75 80
ttg gaa aag ggc aac gtt gac ctc ttt ctc gag atg ggc gtg aca gtg 288
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val
85 90 95
gta gaa tgc agc gcg ttc atg gaa ctc acg gcc cag gtt gtc cgg tac 336
Val Glu Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr
100 105 110
cgc gcg tct ggt cta agc aaa agt gcg gac ggt tcg att cgc att gct 384
Arg Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
115 120 125
cac cgt att att ggc aag gtt tcc aga acc gag ctg gca gaa atg ttt 432
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe
130 135 140
att cgt cca gca cca cag cac ctc ctc caa aaa ctc gta gcc tcc ggc 480
Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala Ser Gly
145 150 155 160
gag ctg aca gct gag caa gcc gag ctt gca aca cag gtt ccg gtg gcg 528
Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val Pro Val Ala
165 170 175
gat gac att gcg gtc gaa gcc gac tcg ggg ggg cat acc gac aac agg 576
Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
180 185 190
cct att cac gtc att ctt cct cta atc atc aac cta cgc aac cgt ttg 624
Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu Arg Asn Arg Leu
195 200 205
cat aaa gag ctt gac tac cct tcg cat ctc cgg gta cgt gtg ggt gct 672
His Lys Glu Leu Asp Tyr Pro Ser His Leu Arg Val Arg Val Gly Ala
210 215 220
ggt ggt ggt att gga tgt cct caa gcc gct ctt gca gca ttt caa atg 720
Gly Gly Gly Ile Gly Cys Pro Gln Ala Ala Leu Ala Ala Phe Gln Met
225 230 235 240
ggg gca gcg ttt tta atc act gga acg gtg aac cag ctt gct cgt gaa 768
Gly Ala Ala Phe Leu Ile Thr Gly Thr Val Asn Gln Leu Ala Arg Glu
245 250 255
agt ggc act tgt gac aac gtc cgg tta cag ctc tca aag gcc acg tat 816
Ser Gly Thr Cys Asp Asn Val Arg Leu Gln Leu Ser Lys Ala Thr Tyr
260 265 270
agc gac gtg tgt atg gct cct gct gcc gat atg ttt gac caa ggc gtg 864
Ser Asp Val Cys Met Ala Pro Ala Ala Asp Met Phe Asp Gln Gly Val
275 280 285
gag ctg caa gta ttg aag aaa ggc acg ctg ttc cca agt cgt gct aag 912
Glu Leu Gln Val Leu Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys
290 295 300
aag ctg tac gag ctg ttc tgc aag tat gac tcg ttt gag gca atg ccg 960
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro
305 310 315 320
gct gaa gaa ttg caa cgg gtt gaa aag cgg att ttt caa aag tcg ctt 1008
Ala Glu Glu Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu
325 330 335
gct gaa gtt tgg cag gag acc agt gac ttt tac att cat cgt atc aag 1056
Ala Glu Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys
340 345 350
aac cct gag aaa atc aat cgt gct gca agc gat ggc aaa ctg aaa atg 1104
Asn Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
355 360 365
tcg ctt tgc ttt cgc tgg tac ctt ggg ctt tcc tca ttt tgg gcc aac 1152
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala Asn
370 375 380
tct ggg gca caa gat cgc gtc atg gac tat caa att tgg tgt ggc cct 1200
Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys Gly Pro
385 390 395 400
gct att ggc gct ttc aat gat ttt acc aag ggc acg tac ctt gac gtg 1248
Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr Leu Asp Val
405 410 415
act gtt gca aag agt tac cct tgt gtg gca cag atc aat ttg caa att 1296
Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile Asn Leu Gln Ile
420 425 430
ttg caa gga gct gcg tat ctg aaa cgc ctt ggt gtc att cgt ttt gac 1344
Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly Val Ile Arg Phe Asp
435 440 445
cgc atg ctg ctg cag gcc gtc gat atc gac gat cct gta ttt act tac 1392
Arg Met Leu Leu Gln Ala Val Asp Ile Asp Asp Pro Val Phe Thr Tyr
450 455 460
gtg ccg acc cag cca ctt 1410
Val Pro Thr Gln Pro Leu
465 470
<210> 68
<211> 470
<212> PRT
<213> Thraustochytrium sp.
<400> 68
Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala Pro Leu Tyr
1 5 10 15
Thr Gly Ala Met Ala Lys Gly Ile Ala Ser Ala Asp Leu Val Ile Ala
20 25 30
Ala Gly Lys Arg Lys Ile Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro
35 40 45
Ile Ser Ile Val Arg Glu Ala Leu Glu Lys Ile Gln Gln His Leu Pro
50 55 60
His Gly Pro Tyr Ala Val Asn Leu Ile His Ser Pro Phe Asp Ser Asn
65 70 75 80
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val
85 90 95
Val Glu Cys Ser Ala Phe Met Glu Leu Thr Ala Gln Val Val Arg Tyr
100 105 110
Arg Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser Ile Arg Ile Ala
115 120 125
His Arg Ile Ile Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe
130 135 140
Ile Arg Pro Ala Pro Gln His Leu Leu Gln Lys Leu Val Ala Ser Gly
145 150 155 160
Glu Leu Thr Ala Glu Gln Ala Glu Leu Ala Thr Gln Val Pro Val Ala
165 170 175
Asp Asp Ile Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg
180 185 190
Pro Ile His Val Ile Leu Pro Leu Ile Ile Asn Leu Arg Asn Arg Leu
195 200 205
His Lys Glu Leu Asp Tyr Pro Ser His Leu Arg Val Arg Val Gly Ala
210 215 220
Gly Gly Gly Ile Gly Cys Pro Gln Ala Ala Leu Ala Ala Phe Gln Met
225 230 235 240
Gly Ala Ala Phe Leu Ile Thr Gly Thr Val Asn Gln Leu Ala Arg Glu
245 250 255
Ser Gly Thr Cys Asp Asn Val Arg Leu Gln Leu Ser Lys Ala Thr Tyr
260 265 270
Ser Asp Val Cys Met Ala Pro Ala Ala Asp Met Phe Asp Gln Gly Val
275 280 285
Glu Leu Gln Val Leu Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys
290 295 300
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro
305 310 315 320
Ala Glu Glu Leu Gln Arg Val Glu Lys Arg Ile Phe Gln Lys Ser Leu
325 330 335
Ala Glu Val Trp Gln Glu Thr Ser Asp Phe Tyr Ile His Arg Ile Lys
340 345 350
Asn Pro Glu Lys Ile Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met
355 360 365
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala Asn
370 375 380
Ser Gly Ala Gln Asp Arg Val Met Asp Tyr Gln Ile Trp Cys Gly Pro
385 390 395 400
Ala Ile Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr Leu Asp Val
405 410 415
Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gln Ile Asn Leu Gln Ile
420 425 430
Leu Gln Gly Ala Ala Tyr Leu Lys Arg Leu Gly Val Ile Arg Phe Asp
435 440 445
Arg Met Leu Leu Gln Ala Val Asp Ile Asp Asp Pro Val Phe Thr Tyr
450 455 460
Val Pro Thr Gln Pro Leu
465 470
<210> 69
<211> 39669
<212> DNA
<213> Sh. japonica
<400> 69
gatctggcga taacttactc cccattccac tgtatcagct gcctgcaacc tttaacggcg 60
atcataaacg cgtcattcgc tggcagacag agtggcaagc ctgtgatgaa ttacaaatgg 120
cagcggccac aaaggctgaa tttgcagcat tagaagaaat taccagtcat caaagtgatt 180
tatttagacg gggctgggat atcaggggcg gagttgagta tttaactaaa atcccaactt 240
attattattt ataccgtgtc ggtggcgaaa accttgccag tgaaaaaaac cgagcttgtc 300
cacgttgcgg ctcaaaagcg tggcgtttag atgagccatt attagacatg ttccacttta 360
ggtgcgagcc atgtcgaatt gtatcgaata tctcatggga tcatcagtaa aattatcttc 420
tcgtcaatag atactaatac aacgagttag ctgataacgc attatcggtt cattcaataa 480
aaaagccaga ccgcatctat agcctgatct atagcctggc ttttttattt tatgtccgaa 540
taagcaatta tttcttgcct ttaatcaaat cattccacat cattttcatt cgctgccaaa 600
tacctggatg agcaacatat tcctctacaa tcggctctac cggcggcgtt actcgtggtg 660
ttagcgcatc aataaattcc gcaagactat cggctaattt atctttgggc ctatcacctg 720
gaatttcaat ccacacactg ccatcttcat tatcgacagt aatcatctgt tcgccatcac 780
ctaaaacgcc aacaaaccaa gttggtgctt gtttaagctt tttcttcatc attaagtggc 840
caattacatt ttgttgcaaa gattcaaaat cttgctggtt ccaaacctgc agtaactccc 900
cttcgcccca tttagaatcg aaaaaaagtg gcgcagaaaa aaactcacca taaaaggcat 960
taatgtcttg atgaagcttg atgtctaatg catgttctac attactgaaa tctgaattac 1020
tttttcgttt taccgctttc caaaaaaccg caccgtcaga ttcaagatca tacttgcctt 1080
caatacaagc ggatccttgc ccaagtggga aataacgggg taactcgtct aatacatcct 1140
gataagcttg tatataacgg ctagaaaaat gttccaatga agttgaacaa gacacttaag 1200
atgctccagt tttgggttat aataaaagtc tattttgaca cggaaacaga ctagatgaca 1260
cacaatcacg acccctatag tgatgcagat gcacttaaag gactcacttt aggtcaatcg 1320
acgcaatatc aagcagaata tgatgcttca ctgctgcaag gggttcctcg taaacttaat 1380
cgcgacgcta ttgaattaac tgatactctg ccgtttcaag gggcagatat ttggactggc 1440
tacgagttat cttggttgaa cgccaaaggt aaacctatgg tcgcaatgat tgaagtttac 1500
cttgctatcg aaagtgataa tttaatcgaa tcaaaatcgt tcaagttgta tttaaacagc 1560
tttaaccaaa cacgttttga cagtgtagac cacgttcagc aaaccttaac cactgactta 1620
agccaatgcg ctaatggtaa ggtaacagtg aaagtgattg agcctaagca tttcaatact 1680
caacgtattg ttgaactacc tggcaattgt atcgatgagc tagatattga agtcaatgat 1740
tatgaattta accctgagta cttgcaagac agcactgaag agaaaaatgt tgtcgaaaca 1800
ctcacatcaa acttattaaa atctaactgt ttaatcactt cacagcctga ttggggaagt 1860
gtgatgatcc gttatcaagg cccaaagatt aatcatgaaa agctattgcg ctatttaatc 1920
tcattccgcc aacataatga atttcatgag caatgtgtag agcgtatttt taccgaccta 1980
aaacgatact gtcattgtac taagctcact gtttatgcac gttatactcg ccgcggtgga 2040
ttggatatca acccattcag aagcgacctt gagcaacctc cagagacgca ccgtttagca 2100
agacaataaa tagcttattc atcaatcagc ttaatgaata aagcctaatc cctaggcttt 2160
attcatttat tttctgtcgt aataccgagc ccttcatgcc tacagacaat gttacttgtt 2220
taacaccaac aactgacgat attcagtccc ataagcattt caaaatattt aaaccctttg 2280
gttttttaag tcagtttgtg cctgaaactc gaaagaaaaa acacttattg ggcgagttat 2340
gtcagtttcc agataaaacc atggcaattg gtcgattaga ccatgattct gaaggcttat 2400
tactgctaac aactgacggc atgatgagcc ataaagtgag aagtaaaggc atcgaaaaag 2460
aatattatgt tcaagtggat ggcgatatcg atgacaaggc gatgtcacaa ctacaaaacg 2520
gagttgaaat tggcattaat agcacgaaat atctcactca gccctgtaaa gcagtcaagc 2580
taaacgcaga gccaatactt ccctcacgcg gtaaaaaaat ccgcgatcca agacatggcc 2640
ccaccagctg ggtttcaatc acattaactg aaggtaaaaa ccgtcaaatc agaaaaatga 2700
ccgctgccgt tggctttgcc acattaaggc ttgttagggt cagaattggt aatatacata 2760
ttgatgatat gcgagctggc gacgttattg aactcaataa cttagattca gtaataaacc 2820
ctaaccttag ctaacccata aaacggggct attcatttat cggcttacct tactagttat 2880
tggttaaata cactttctcc atcgcagact ccaccagctc ccgtaaccac tttatcgcag 2940
ggtcttgatg attacgtgtt ggccaaatac tgtaaatcga aatcacttgg ctttcaaaag 3000
gcaagtccat caaaattaaa ttaaaaatag attgatagtt tttcgcgtag gtataaggcg 3060
caatacatat ggcatcggat ttactcacgc cagataacat cgtcagtaaa gaggattttt 3120
caccatacat atctcgttca ggtaaatggt ctgttgaaat catctctgca actcgctggt 3180
tatgacgatg aagtcgataa aacagatgct tagcagcgaa gtacgacact tcatctattc 3240
catgtttaaa ttgcgggtgc tcagccctag caacacaaac aagcttttcg gtggcaattt 3300
gcttactggt aaagctcgct tcagttggcg caacaatatc tagcgctaaa tcaatttgct 3360
gatttttaag ggcttgatat aaattaccct catctaaaat cgcttctgta aaaatgattt 3420
caacgccttt atccgtcagt gacttttcga tatctgcttc aatcaaatca ataattgatt 3480
cattagcgct gacatgaaat atccgttttg acaacgaagg gtcaaaggct ttaacgctat 3540
taatgcattg ttcgatttcg atgagtggca aacttaactg tcggtgcaag tgctgaccta 3600
tcgcagtgag agctatccct cttccttgcc taataaatag ttcaacaccc acaaccgctt 3660
taaaccgatt gatagcatta ctgactgacg actgagttaa tgcaaggtgc tccgctgcaa 3720
gcgtaataga ttgataatca catacacagc aaaaaactct aataaggtta agatccaact 3780
taagtaattg ttgttgcata agagcatcag actctaagtt ctcttgcttc atcacttctc 3840
ccataacaca tatcgccaaa tacattcaca cggtaaatgt attaaccatt tttagccata 3900
gttatatttg ggctttttat tgttaactta tctttaacaa taaaaagtac ccgaggccta 3960
catgagaaaa acacgagttg ctttagtcat cagtttatca tttaccaatg cagtggctgc 4020
tgcgcagcac gaacatgacc acatcagtct tgattaccag ggtaagcctg cgacgcccat 4080
taccgcagag cacaacaaag ccatagcaca aaagttaccg ttcgaagata aatccgcttt 4140
tgagcgcttt agtcgacata aaattgcctc ttttgatgaa gccaccgcca agatactgcg 4200
tgcagaattt aactttatca gtgacacgct tcctgattca gtcaaccctt cgttatatcg 4260
ccaagctcaa cttaatatgg taccagacgg gctctataaa gtgactgatg gcatttacca 4320
agtacgaggc actgacttat ctaacttaac ccttattcga ggtaaaacgg gttggattgt 4380
atatgacgtt ttattaacta aagaagctgt tcagcaatca ttaacatttg cttttgctca 4440
cttgcctgag ggcaaagatt tacctgttgt ggcaatgatt tactctcaca gccatgcaga 4500
tcatttcggt ggtgcccgtg gcgttcagga acgctaccct gatgtcaaag tgtatggttc 4560
atataatatt acccaagaga tagtggatga aaatgtactc gcgggtaatg tcatgagccg 4620
gcgagctgct taccaatacg gcgttacact cgataaacac aatcacggaa ttgtcgatgc 4680
agcgttagca aaaggtttat caaaaggcga aatcacttac gtcaaacctg attatgaact 4740
tcatcatcaa ggcaaatggg aaaccttgac cattgatggt cttgaaatgg tctttatgga 4800
tgcatctggc actgaagctg ccagtgaaat gatcacatat ataccatcta tgaaggcgct 4860
atggtcaggc gaattaacat atgatggtat gcacaatatt tataccttac gaggcgctaa 4920
agttcgcgac gcattaaaat ggtctaaaga cattaacgag atgattaatg catttggcga 4980
aaatgttcag gtactatttg cttcacattc tgcgccggta tggggaaata aagaaattaa 5040
tcattacctt cgcatgcagc gagataatta tggcctcgtt cataatcaat ctttacgttt 5100
agccaatgaa ggtgtggtaa tacaagatat tggtgatgca atcatggaaa ccattccaca 5160
aaatgtccaa gacgaatggt acaccaatgg ttatcacggt acatacagcc ataacgctaa 5220
agctgtgtac aacatgtatt taggctattt tgatatgaat ccagccaact taaacccctt 5280
acctacaaag gctgaagcaa ttaagtttgt agaatatatg ggcggcgcca acaatgtagt 5340
atcaaaagcg caagcagact tcaatcaagg cgagtatcgg tttgtcgcca ctgcattaaa 5400
taaggtggtc atggccgaac cacaacaccc ccaagcccga gaattacttg ccgataccta 5460
tgagcaactt ggctaccaag ccgaaggagc tggttggcga aatatttact taacaggtgc 5520
gcaagagtta cgtattggca ttaaacctgg cgcacctaaa tccgcatccg ctgatgttat 5580
cagcgaaatg gacatgtcca ctttatttga ctttctcgcg gttaaagttg acagcattaa 5640
cgccgccaag cttggcaata tcactttaaa tgtggtgaca caaagcggcg ataaaactga 5700
cacgctcttt gtagagttaa gtaacggaaa cttgagtaat atcaaagtag acgaggctaa 5760
aaaagccgat gccacactga caattaataa gtctgatgtc gttgcaatat tattaggtaa 5820
agcagatatg aaagcgttaa tgcaatcagg agctgcgagt atgcaaggtg acaaattagc 5880
atttgccaaa attgcatcaa cactggtgca atttaatcct gattttgaaa tcgtaccgct 5940
acagcatact cattagctca taacttaacg aaattcggct gcgaagtttt tcactctgct 6000
tctttgctta tattcactag tttaccaaga gtaatggcat gagagtttaa agcaaaaatg 6060
accgactaag acaagtgagg gaagattgtt ctgataagcc gtttttgatt agcagttaaa 6120
catccaaaaa accttaacag ttcgataaat cagttggttt ttatgaacat ttttatttgt 6180
tcatgccagc tgattttttt tgcctttaat tgaagtgtta atggcttttc gccaaaagcg 6240
aactcgccca cactcacagc aaatcgatat gaattattaa gcttacctaa acaacattgc 6300
cataaaggtg agacttcata aaaagactca acatcattag tctgttcaag ctcatcaacg 6360
tctgtaggct tcaataagct aagtgaaata tcatgctgaa ttggcaacaa ctgatcatct 6420
attgttaagt tagctaagct cggtgcagat aagtcaaatg caaacgattt aagcgacaag 6480
gccagtccca gtccctttgc tttaatataa gattctttca gtgcccataa atcgaaaaat 6540
cgctcacgct gctgactttc aggtaacgcc aataatgcag tttcttctgg ttttgaaaaa 6600
tagtgatgta aaattgaatg gatattcgtg ctttctcggc gacgttcaat atcgaccccc 6660
aattgaatgg gcattgaagc gtcctctttg gagtgaatga caccaataag caaccagtta 6720
ccactgtgac ttaaattaaa ctgtaagccc gtttgtttat attgcacagc cgatagccta 6780
ggtttgccct tctcaccata ctcaaattgc caatcgtctg gttcgatatt tgcaaagttc 6840
gataatacgc tgcgcaaata cccacgcacc attaaccctt gctgttgagc agcctgttga 6900
ataaaacgat ccactttatt tatctcagca tcagataacc atgaacgcac tgtagagacg 6960
gttttctcat ctaataaatt ggtatctaaa ggacaaaaaa ataattgaat agtgggtaaa 7020
gggctcaaac caaactcgca tttataatag caataagaca ttgtcgcttg ttctaggtcg 7080
ctaattcaac acataaacaa tcttgattga aaatgtcgtc taaggtttaa acaaataaag 7140
gaaggtttag acaaataaaa aagggttaag ccatccttaa ccctttgcat atcatctgtt 7200
atttcaataa gtattagcca atcaatctac cagtgctttt accgcctttt taggtaaaac 7260
atcataacgg ctaaactgca ttgaaaactg accttctcca cctgtcatag atttaagctt 7320
tgaagagtag ctactgacat tggcaagtgg cacttcaacg ctgacttcaa caagtccatt 7380
ggcatttgcc tgcgttccac aaataatgcc tctagatgca ctaatgtcac ctgtcacttc 7440
gccgacatgc tcttgcccaa ctaaaatgct catatcaact aatggttcta acattacagg 7500
ttttgctaac gatactgctt ctataaaagc ttttttaccc gccatcacaa aagcaatttc 7560
tttagagtct acactgtggt gtttgccatc caataacgtg acttttatgt cttgtaatgg 7620
atagccacct aactcaccgg ctagcatggc ttctcgcacg cctttctcta ctgctggaat 7680
atattgactt ggcactgagc caccaaccac cttcgaaata aactcaaagc cttcaccacg 7740
ctcaagtggc tcaatggcta attcaacttc accaaattgg ccagatccgc ctgattgttt 7800
tttatggcga taacggcatt gtgctttctc ggtgatggtt tctcgataag ccaccgccgg 7860
cgtatcagta tccatgtcga ggtggaacat attttgcgct ttttcaagcg caatttttaa 7920
atgcaaatcc ccttgacctt gcaatacggt ttgcccttca acctcacttc gagtgatgtg 7980
taaacttgga tcttcagcga ccagtttatt gagaacatcg gagatctttt gttcatcacc 8040
acgacgcttg gctgatacag ccaaaccaaa aataggttgc ggcacttcca gttctggtaa 8100
atgaaattca tcttcatcat ggctatcatg cagtacagaa ccaacactta atgcatccaa 8160
ttttgcaata gcgcaaatat cgccaggaaa cgcttgggat acattaattt gtttatcgcc 8220
ttgaagcttc attaagtgag agactttgaa aggtttgcgg ccttggccaa taagcagctt 8280
catgccaaca ttcagcgtcc cttggtacaa cctaaatacg cccagtcttc ctaaaaatgg 8340
gtcaattgaa acgctaaaca catgggctaa aacatgatct gttgcctttt gtgtcactgt 8400
tactggtgtc gactgttcac caaatccttt cataaattgt ggtgcattgg cttcaagtgg 8460
acttggcatg agtttgatca acatttctaa caatgaacta atcccaatat cttgttctgc 8520
acttgtaaag cagactggca ctaagtgccc cattctgagt gctttttcta gcggagcatg 8580
aagctgctga ggcgttaacg actcaccttg ctctaaatac aaggtcatta acgcttcatc 8640
ttcttcaagt accgtatcaa ctagctcatc tctagcacta gcaggttgac taaataatgt 8700
ctctgcactt tcatcacaat gtaaataaca atcaacaacg gcttttccat cggcactggg 8760
caagttaacc ggtaaacatc ggtgtccaaa ttgatgctga atgtcgatca tcacatctga 8820
cactcgcgtg agattactgt cgaggtggtt aatggcaata atcaccgctt taccttgcgc 8880
tcttgcagct tcaaaagcac gtttagtcac agactctata ccaacggcgg cattaataac 8940
caacagtact gactcaacgg caggcaaagg taataaggct cgcccgaaaa agtcaggtaa 9000
acctggcgtg tcgataaaat tgatatgatg ctgttgatac tgaaggtgta aaaatgaagg 9060
ctctaaactg tgacggtggg atttttcttg ggcagtgaaa tcagcatgat ttgtgccctt 9120
gtcgaccctg ccttttaacg atattgcctt agctctatac agcaatgctt caagcaagga 9180
tgatttgcct gctccaacat gtccgagcac agccaaatta cgggtttgct cagtagtaaa 9240
ctcagccata atggcctcct gttttcacat tattaaactt tccatattct tgtctaactt 9300
tgtttacgtt tggctattta ttgcgcataa aaatagcata cggggctaac aactcagatg 9360
aattgaccta gatcagtgtt tacatcggca acgtttttta taacaaaatc acccattcgg 9420
cttacaagtg ttagctaatt ctggtcgtat cagtgattaa ttagtttcgg gtgattgtat 9480
cgacccgaaa cctcaggtac tctgcatgct cgattgtgct aaaacgctaa ttttgaagat 9540
gaacaaacgt taatcttcac gtttttatac cgagtcccaa cagattgtac ggagtattca 9600
tcgaactatg gcagtcctta aatgaccgca aatagaaaag ctcacgctgt aactcaaaca 9660
gccgctaaga aagccacatc agaaaccgat gttgcgatgg cccctgttcg ccatagcaat 9720
gcaacaacga ctcctgaaat gcgtcaattt attcagactt ctgatttcag tgttagtcaa 9780
ttggctaaga ttcttaatat ctcggaagcc actgtcagaa agtggcgcaa gcgcgactca 9840
atcagtgata cgcccaatac tccacatcat ttgaaaacca cgctttcacc aatggaagaa 9900
tacgtggttg tgggacttcg ttatcaatta aaaatgtcac tggatagatt gcttcacgtc 9960
acacaacaat ttatcaaccc taacgtctct cgctctggtt tagcccgatg tttaaagcgc 10020
tacggcatat caaaactaga tgaatttgaa agccctcatg tgcctgagtg ttattttaat 10080
cagctgccta ttgttcaggg tacagatgta gcgacttata cactgaaccc tgaaacgctc 10140
gctaaaaccc ttgcattacc tgaagcgaca ccagataacg ttgtacaggt tgtatcgtta 10200
acgattccac ctcaactcac tcaagcggac agttattcca ttttgctcgg tgtcgacttt 10260
gcaaccgact gggtgtatct cgacatatat caagacaatc acacacaagc gacaaatcgt 10320
tatatcgctt atgtgttaaa gcacggcccg tttcatttac gtaagttatt agtcaaaaat 10380
taccacacct ttttagcccg ctttcctggc gcaacagttt tacaatccac ggaagcggca 10440
aaccaaaaaa ataaatcagc taaggatcag ctgaacactg gagactcaaa atgagccaag 10500
cccctacaaa tcctgagaca agctctcaag ataataacga gtcgcaagat acaagactga 10560
ataaacgtct taaagacatg cccattgcca ttgtcggcat ggccagtatc tttgccaact 10620
ctcgttacct gaataagttt tgggacttaa tcagcgaaaa aattgatgct attaccgaag 10680
tacctgatac ccactggcgc gctgaagatt actttgatgc tgacaagagc accccagata 10740
agagctactg taaacgcggt ggttttatcc ctgaagtgga ctttaaccca atggaatttg 10800
gcctgccgcc aaatatccta gaactgaccg atacttcgca attattgtca ttagtgattg 10860
ccaaagaagt gctagcagat gctggtgtca cttctgaata tgacactgat aaaatcggta 10920
ttactttagg tgtgggcggt ggccaaaaaa ttaatgccag cctaacagca cgtctgcaat 10980
accctgtgct taaaaaagta tttaaaagca gcggcctaag cgatgccgac agcgacatgc 11040
ttatcaaaaa attccaagac caatacattc actgggaaga aaactcgttc ccaggatcgc 11100
ttggtaatgt tattgctggt cgtattgcta accgctttga cttaggcggc atgaactgtg 11160
tggttgatgc ggcatgtgca ggttcacttg cggcaatgcg tatggcgtta accgaactgg 11220
ttgaaggccg cagcgaaatg atgatcactg gtggcgtatg taccgataac tcgccatcga 11280
tgtacatgag tttttcaaaa accccagcgt ttaccaccaa tgaaacgatt cagccatttg 11340
atatcgactc aaaaggcatg atgattggtg aaggcattgg catggtggca ttaaaacgtc 11400
ttgaagatgc tgagcgtgac ggtgaccgta tttactcagt cattaaaggg gtcggcgctt 11460
catctgatgg taagttcaaa tcaatttatg cacctcgacc tgaaggccaa gctaaagcgc 11520
tgaagcgtgc ttatgatgac gccggctttg cacctgaaac cgttggctta attgaagctc 11580
acggaacagg cactgcagcg ggtgatgtgg cagaatttaa tggtcttaaa tctgtatttg 11640
gtgagaatga ctcaacaaag caacacattg ctttaggttc agttaagtca caagtgggcc 11700
atactaaatc aactgcggga accgcgggtg tgattaaagc ggcgttagca ctgcatcata 11760
aagtgctgcc gccaaccatc aacgtctcta agcctaaccc taagcttaat gttgaggatt 11820
caccgttttt cattaacact gaaactcgcc cttggatgcc tcgccctgat ggcacaccac 11880
gccgagctgg tataagttcg ttcggttttg gtggcacaaa cttccactta gtactagaag 11940
aatacagccc agagcacagc cgtgatgaga aatatcgtca gcgccaagta gcacaaagct 12000
tattgattag cgctgacaat aaagctgagc tcattgcaga aatcaacaag cttaacgctg 12060
acatcagcgc gcttaaaggc acagataaca gcagcatcga acaagctgaa cttgcccgca 12120
ttgctaaact atatgctgtt cgcactttag atacttcagc agcccgtttg ggtcttgtgg 12180
tctcaagcct taatgaatta accactcaac ttggtttagc gttaaagcag ctaagtaacg 12240
acgctgaagc atggcaatta ccatcaggta cgagctatcg ctcatctgcg ctcatcacga 12300
ttaatgccaa ccaaaagacg actaaaggta aaaaagcagc taacacaccg aaagtagcag 12360
cattatttgc aggtcaaggt tctcagtacg tcaacatggg gattgatgtt gcttgtcact 12420
tccctgaaat gcgccagcaa ttaatcaaag ccgacaaggt atttgcaagc tttgataaaa 12480
cgccattatc gcaagtgatg ttcccaattc cagcctttga aaaagcagat aaagatgcgc 12540
aagcagcttt actcaccagc actgataacg cgcaaagcgc cattggtgta atgagcatga 12600
gccaatacca actgtttact caatcaggtt ttagcgcaga tatgtttgca ggtcacagct 12660
ttggtgagct ttcagctctt tgcgctgctg gcgttatttc taatgacgac tactaccaat 12720
tatcctatgc tcgcggcgct tcaatggccg catcagcagt tgataaagat ggcaatgaat 12780
tagataaagg cacgatgtac gccattatct tgccagctaa tgaaaatgat gcagcaaata 12840
gcgataacat cgctaaatta gaaagctgca ttagcgagtt tgaaggcgtt aaggtggcta 12900
actacaactc agccactcag ctagttattg caggcccaac acaaagctgc gccgatgcag 12960
ctaaagccat tgccgcttta ggctttaaag ctatcgcgct acctgtttct ggcgccttcc 13020
acacaccact tgtggggcat gcgcaaaagc catttgctaa agccattgat aaagctaagt 13080
tcacggcgag caaagtcgac ctgttctcaa atgccactgg tgacaaacac ccaagtgacg 13140
ctaaatcaat taaagccgct ttcaagcaac atatgctgca atcagttcgt tttactgatc 13200
agctgaacaa tatgtacgat gcgggagcgc gcgtatttgt cgagttcggc cctaagaaca 13260
ttctgcaaaa actggttgaa gcgaccctag gtaataaagc tgaagcggta tccgttatca 13320
gtatcaatcc aaaccctaag ggcaacagtg atgtgcaact tcgtgttgca gctatgcaac 13380
ttagcgtttt aggtgcgcca ctctcaagca ttgaccctta tcaagctgaa atcgcagctc 13440
ctgcggtacc aaaaggcatg aacgttaaac tcaatgcaac caaccacatc agtgcaccta 13500
ctcgtgccaa gatggaaaaa tcattagcaa caggccaagt aacctctcaa gttgtcgaaa 13560
caattgttga gaaagttatc gaaaaacctg ttgaaaaagt agtagagaag atcgtggaaa 13620
aagaagtcat taaaactgaa tatgttgaag ttgccacatc tggcgcaaca acagtgtcta 13680
acgttgcgcc tcaagcaata gcacctcatg catcagctca ggctgctcct gcttctggca 13740
gtttagaagc gttctttaat gcacaacagc aagccgctga tctgcatcag caattcttag 13800
cgattccgca gcaatatggt gacaccttta ctcacttgat ggcagagcaa agtaaaatgg 13860
ttgctgcagg ccaagccatt cctgaaagct tgcaacgctc gattgagtta ttccatcagc 13920
atcaagcgca aacgctacaa agtcacaccc tgtttttaga acaacaagct caggcaagcc 13980
aaaatgcatt aaacatgcta acgggtcaaa cacctgttac tgctcctgtt gttaacgcac 14040
caattgttaa ttcaccagta gttgaagcgg tgaaagtagc acctcctgta caaactcctg 14100
tcgtaaacac gccagtagta ccagcagtaa aggccacacc tgtagctcaa cctgctgcga 14160
tggccgctcc aaccccacct gttgaaccaa ttaaagcacc tgctcctgta gccgctcctg 14220
tagtaagtgc acctgtagtt cctacccctg ctggcttaag cgcacaaaca gccctgagct 14280
cacaaaaagt tctggatact atgttagaag tggttgcaga aaaaaccggt tacccaactg 14340
aaatgcttga acttagcatg gacatggaag cagacttagg catcgattca attaaacgtg 14400
ttgaaatatt aggtactgtt caagacgaac taccaacact gccagaactc agtcctgaag 14460
atttagctga gtgtcgtaca ttgggcgaaa tcgttgacta tatgggtagt aaactaccgg 14520
ccgcaggcgc tatgaacagc gacactgcaa atgcaactca cacagccgtt tccgcccctg 14580
ccgcttcagg tcttagcgca gaaacagtac tcaacactat gcttgaagtg gttgcagaaa 14640
aaacaggtta tccaactgaa atgcttgaac taagcatgga catggaagcc gatttaggca 14700
tcgattcaat taaacgtgtt gaaatattag gtactgttca agacgaactg ccaacaccgc 14760
cagagctaag ccctgaagat ttagctgagt gtcgtacact gggtgaaatc gtatcttata 14820
tgggtagtaa actacccgcc gcaggcgcta tgaactctaa acttcctgca agtgccgctg 14880
aagtagctca accccaaacc gcgccagttc aagctgcatc tggccttagc gctgaaacag 14940
ttctgaatac catgctagaa gtcgttgcag aaaaaaccgg ttacccaact gaaatgcttg 15000
aactcagcat ggacatggaa gccgatttag gcatcgattc aattaaacgt gttgaaatat 15060
taggtactgt tcaagacgaa ctgccaacac tgccagagct aagccctgaa gatttagctg 15120
agtgtcgtac tcttggtgaa atcgttgact acatgaactc taagctaccc gctgctggtt 15180
ctgccccagt tgcatcacca gttcagtctg cgactccggt atctggtctt agcgctgaaa 15240
cagttttgaa taccatgcta gaagtcgttg ctgaaaagac tggttatccg actgatatgc 15300
ttgaattaag catggatatg gaagccgatt taggcatcga ttcaatcaag cgtgttgaga 15360
tattaggtac tgttcaagac gagctgccaa cactacctga actcagccct gaagatttag 15420
ctgagtgtcg tactcttggc gagatcgttg actatatggg tagtaaacta cccgccgcag 15480
gcgctatgaa cactaagctt cctgctgaag gcgctaatac acaggccgcc gcaggcgctg 15540
ctcaagtagc agctactcaa acatcaggtt taagtgcgga acaagttcaa agcactatga 15600
tgacagtggt tgctgagaag accggttacc cgactgaaat gcttgaatta agcatggata 15660
tggaagcgga tttaggcatc gattcaatca agcgagttga gatcttaggt acagttcaag 15720
atgaacttcc gacgctacca gaacttaacc ctgaagattt agctgagtgt cgtacacttg 15780
gtgagatcgt ttcgtacatg ggtggtaaac tacccgccgc aggcgctatg aacactaagc 15840
tacctgctga aggcgctaat acacaggccg cagcaggcgc ttctcaagta gctgcctcaa 15900
ccgcagaaac agccctgagc gctgagcaag ttcaaagcac catgatgact gtggttgctg 15960
aaaaaaccgg ttacccaact gaaatgcttg aattgagcat ggatatggaa gcggatttag 16020
gcatcgattc aatcaagcgt gttgaaattt tagggacggt tcaagacgag cttccgggct 16080
tacctgaatt aaatcctgaa gatttagcag agtgtcgcac cctaggcgaa atcgtatctt 16140
atatgggcgc taaactgcca gccgcaggcg ctatgaacaa aaagcaagcg agcgttgaaa 16200
ctcaatctgc acccgcagca gagttagcaa ctgacttacc tcctcatcag gaagttgcgc 16260
taaaaaagct accagcggcg gataagttag ttgacggttt ttcaaaagac gcctgtatcg 16320
ttatcaatga tgacggccat aacgcaggtg ttttagctga aaaattagta gcaacaggcc 16380
taaccgtcgc cgttattcgt agccctgagt cagtgacatc tgcgcaatca ccgcttagca 16440
gtgatattgc cagcttcact ttatctgcgg tcaatgacga cgcgattagc gatgtcattg 16500
ctcaaattag caagcagcat aagatcgccg gttttgttca cctacaacct caactaacag 16560
cacaaggagc tttgccttta agtgatgctg gttttgtagc agtagagcaa gctttcttga 16620
tggctaaaca cctacagaaa ccatttgctg agctagcaaa aactgagcgt gtcagcttta 16680
tgactgtcag ccgcatcgat ggtggctttg gttacttaaa cacggctgaa cttgccaaag 16740
cagagctaaa ccaagctgca ttatcaggtt taactaaaac attaggtcat gagtggccaa 16800
ctgtgttctg tagagcattg gatattaccc caagctttga agctgtcgag ttagcacaag 16860
ccgttattgc agagctattt gatgttgata cagcaacagc tgaagtgggt attagcgacc 16920
aaggtcgtca tactttatca gctacggcaa ctgctcaaac ccgttaccaa accacatctt 16980
taaacagtga agatactgta ttggtgactg gcggtgctaa aggcgtcaca tttgaatgtg 17040
cccttactct tgccaaacaa actcagtcgc actttatttt agcgggtcgc agtgagcatt 17100
tagccggtaa tttaccgact tgggcaaaga gtgtcatagc ggctgcgcct aacgttagtg 17160
aagtaaacac aagtcagtta aaagcagcag caatcggatt tattcaatct caaggtaaca 17220
agccaacacc taagcaaatt gatgccttag tttggccgat taccagcagt ttagaaattg 17280
atcgctcatt agcagcattt aaagctgtcg gtgcaagtgc tgagtacatc agcatggatg 17340
tcagctcaga tgcagccatc aagcaatctc ttgcaggtgt taaaccgatt acaggcatca 17400
ttcatggtgc aggtgtactc gctgataaac atattcaaga caaaacctta gctgagttag 17460
gccgtgtata tggcactaaa gtgtcgggct ttgcaggtat catcaatgcg attgatgcaa 17520
gcaagttaaa actggttgct atgttctcat cagcagccgg cttctatggc aatactggcc 17580
aaagtgacta ctcaatgtct aatgagatcc tcaacaagac agcacttcaa cttgcagcta 17640
actacccgca agctaaagta atgagcttta actggggccc ttgggatggc ggaatggtca 17700
gttcagcatt gaagaaaatg tttgttgagc gcggcgtata cgttattcca ctcgataaag 17760
gcgcaaactt gtttgctcac agcctattgt ctgagtcggg cgtacagtta ttaattggtt 17820
caagcatgca gggctcaagc tcagcagata aaacaggcgc agctgtaaaa aagcttaatg 17880
cggactcttc gcttaatgcc gagggttcgc tgattctttc ttttactact cctgctaacc 17940
gtgttgtcaa caacgcggtt actgttgaac gtgtactaaa cccagtagca atgcccttcc 18000
ttgaagatca ttgcatcgcg ggtaatccag tactaccgac agtgtgcgcc atacaatgga 18060
tgcgtgaaac agcgcaacaa ttgtgtggtc tgcctgtgac tgttcaagat tataaattgc 18120
tgaaaggcat tattttcgag actaaagagc cgcaagtatt aacgctaaca ttgacgcaaa 18180
ctgaatcagg cttaaaagca ctgatcgcga gtcgtatgca tcgcgatcca atggatagct 18240
tgctaagacc tcagtatcaa gcaaaccttg tgatcaatga agccgtcatt aacggtcaaa 18300
ctttaacaac acagccaact atcgttgcgg atgcacaaca gttagcaagt gcaggtaaag 18360
tgattagcac tgacagcgaa ctttattcaa acggtagctt atttcatgga ccacgcctgc 18420
aaggcatcaa gcaagtcttg attgctgatg acacacaact ggtttgcaac gtggaattac 18480
cacatattag ttccgcagat tgcgcaggct ttgcgcctaa tctgtccata ggtggcagcc 18540
aagcatttgc tgaagatttg ctactgcaag ccatgttagt gtgggcacga attaaccatg 18600
atgctgcaag cttaccatcg actattggta agttaacgac ttattcacca tttgcatcag 18660
gcgataaagg ttacttggtg ttatctgtgc ttaagagtac cagccgttcg ttaacagctg 18720
atattgcact ttatcaccaa gatggtcgct tgagttgcac tatgagcagt gcaaaaacaa 18780
caattagcaa aagcttaaat gaggcatttc ttgcccctgc taaagcaatt gctgacttgc 18840
aggagtctgt gtgagcactc aactgactgc aaaaacggct gcaatcaata gtattcgtat 18900
agccttaaaa ctggtcgcga atgatcaaac atcattcgca ccagcacaaa atgctgatga 18960
catattttca gccataaaac cgtgttcatt agcgcaggtc attggcgagt ctgccattga 19020
ccttgaaatt gatgtatcaa gcttagatgc aggcatagat aaccttgcta cagcaagcca 19080
acaaacgctt agctttagtg attattttgc ccaagcgatt gcccatattg agcagcaaca 19140
tactgtgtta ctgagccatc cagcaatacc gtatcgagta ttgatgatgc cagcgattgt 19200
tgcagctaag catcgctgtc atccccatgc ctatttaacg ggtttgggag aagctgatga 19260
tatgcaatgc gctatgcaaa acgctttagc acaagctaaa cgtgagcaca ttactcctac 19320
cttggtcgat gtcactgagt taacttgtta taaagacaag tttactcagc ttgtcatgtt 19380
gataagccgt attgctgcgc gtcgtttacc tgacactaca ttgcctactg tcactagtga 19440
caagcagaac aatagcaatc aagccaatgc caaatattgg tttacccaaa tgcaccaaaa 19500
ccgtgttgct agctttaact ttacagaaaa tggcaagcaa cacgctgccg tttttgttca 19560
aggtactgaa ctggcccagg ccagctcgat gcttgatgaa aacagactat tcttcccctt 19620
agcagccaat acatctgctt gcatgatcca atctttgcat gagctattag tggcgctcaa 19680
taggcttaat cagcaacaaa gcaatccgtt agacagccag cggcttctaa acaagcctag 19740
ccatgttatc tctttaatgc tcaattactt aaaggcattt gatcaaacca aatccttgtc 19800
tgcagttatc atagccaact ctgtagtcac tgcaatcgca gaaattgagg ccatgttagc 19860
caaaatcagt acagcaagtg atgacacctc tggatcgata aatgaacttg agtacaaaac 19920
gccttcgggt agttgtttaa ccatcactca tcatgaagcg cttggtcgca gcggcgtgtg 19980
ttttgtgtat ccgggtgtgg gtacggttta tccgcaaatg tttgcacaac tgccacagta 20040
cttccccgct ctgtttgctc aacttgaacg tgatggcgat gtaaaagcca tgcttcaagc 20100
tgattgtatt tatgcagaaa atgccaaaac ctcagacatg aatttaggcg agcttgctat 20160
tgctggggtt ggcgcaagtt atatattaac taaagtgctt accgaacact ttgccattaa 20220
gcctgatttt gcaatgggct attctatggg tgaagcatca atgtgggcca gccttaatgt 20280
ctggaaaacg cctcacaata tgattgaagc cactcaaact aatagtattt tcacctctga 20340
tatttcaggc cgactcgact gcgtccgtca agcatggcaa ctcgaacagg gtgaagatat 20400
tgtttggaat agctttgttg tgcgtgctgc gccgactgaa atagaagccg tgcttgccga 20460
ttaccctcgc gcatatttag cgattataca aggtgatacc tgtgtattag cgggttgtga 20520
gcaaagctgt aaagccttat tgaaacaaat cggtaaacgt ggcattgcag caaatcgtgt 20580
cacagccatg cacacgcaac ccgccatgct tattcgtgat aatgttcaag cgttttatca 20640
gcaagctttg cacgaccaag atgtgcttga tgcacaagca agtagcatca aattcattag 20700
tgctgcgagt caaataccta tttcattgac cagtcaggac atcgccaatt ccattgcaga 20760
tacattttgt cagccactga acttcactaa actggtgaat aatgctcgtc atttaggtgc 20820
acgtttattt gttgaaattg gcgcagatag gcaaaccagt accttgatag ataaaattgc 20880
ccgcactgca gctaataccg attcacattt aaacgcgcca ctgtcagcca ttgcaatcaa 20940
tgccaaaggt gatgatcaaa cagcgctgct taaatgtatc gctcagctta tctcgcataa 21000
agtgccttta tctctacaat atctaactga gaatttatcc catttgttga ccgctagcat 21060
tactcgcgaa aaccgtcagc aaagccaaac cgctcagtta gctccacaat tagaaggaga 21120
acaatcttga gttctcaatc aaacgttccc aaaattgcca tcgtcggttt agcgactcag 21180
taccccgatg ctgatacgcc agcaaagttc tggcaaaatt tattagataa aaaagactct 21240
cgcagcacca ttagtcagca aaagctcaat gcaaacccag ctgactttca aggtgttcaa 21300
ggccagtctg accgttttta ttgtgacaaa ggtggctaca ttcaagactt tagttttgat 21360
gccaatggtt accgtattcc agctgcgcag tttaatggtc ttgacgacag ttttttatgg 21420
gcaacagaca cggcgcgtaa agcactcaat gatgctggtg tggatatcac taacagtcaa 21480
gataatgcga tattaaatcg cactggtatt gtcatgggta ccttgtcgtt cccaacggca 21540
aaatctaacg aattgtttgt gccgatttat cacagcgccg ttgaaaaagc gctacaagat 21600
aagctgcaac aacccagttt cacattgcag ccttttgata gtgagggata tagcaagcaa 21660
acaacgccag cctctttgtc taatggcgcc attgcacata atgcatcaaa attagtggcc 21720
gatgccctag ggttaggcgc agcacaactc agccttgatg ccgcttgcgc gagctcagtt 21780
tactcattaa agctagcttg tgattacttg catacaggca aagctgacat gatgcttgct 21840
ggtgcggttt caggcgcaga tcccttcttt attaacatgg gtttttctat cttccatgct 21900
tacccagacc atggcatttc agcgcctttt gatagtaatt caaaagggtt atttgcaggt 21960
gaaggtgctg gcgttttagt gctcaaacgt cttgaagatg ctgagcgtga tggcgaccat 22020
atttatgcac tagttagcgg cattggctta tccaacgatg gtaaaggtca atttgtactg 22080
agcccaaaca gtgatggtca agtcaaagcc tttgagcgtg cctatgcaga tgcagccatg 22140
catgatgaac atttcggccc tgataatatt gaggtcatcg agtgtcatgc cactggcaca 22200
ccgctgggtg ataaagttga actgacctcg atggaacgtt tttttaacga caaactcaat 22260
ggtagccata cgccattgat tggctcagct aaatcaaact taggtcattt gctgacggct 22320
gcgggtatgc ctgggatcat gaaaatgatt tttgccatgc gccaaggtat gttgccaccc 22380
agtatcaata ttagttcgcc aattacatca ccaaatcaga tgtttggccc tgctacatta 22440
cctaatgatg tattgccgtg gcctgataaa gcgggcaatc gtgctcgtca tgctggtgtc 22500
tcagtattcg gctttggtgg ttgtaatgcc cacttattga ttgagtcata tcacggacaa 22560
acgtcaacag ctccagctgc taataccatt aatgcacagt tgcctatgca tattacaggc 22620
atggcatcac actttgggcc gctgaataat attaaccgct ttgccaatgc aataaaccag 22680
caacaaacgg cctttactcc gctaccggca aaacgctgga aaggcttaga taaacatcct 22740
gagttattgc agcagcttgg tttggcgcaa acaccgccaa caggggctta tattgatcag 22800
tttgattttg acttcttgcg ttttaaagtg ccaccgaatg aagacgaccg cctgatttcg 22860
cagcagttat tgttgatgaa agttgcagac gaagcgattc atgatgccaa acttgcatct 22920
ggcagcaagg ttgctgtact ggttgcaatg gaaaccgagc ttgaactgca tcaattccgt 22980
gggcgagtta atttgcatac tcaaatcgca gccagcttaa atgcgcacgg tgtcagccta 23040
tctgacgatg agtaccaagc cctcgaaacc cttgcgatgg acagtgtttt agatgcggcc 23100
aagctgaacc aatacactag ctttattggt aatattatgg cgtcgcggat ctcatcgtta 23160
tgggatttta atggcccagc ctttacgatt tcagcaggcg agcagtcggt aaatcgttgt 23220
attgatgtgg cgcaaaacct attggctatg gagtcacgtc aagagccgct agatgccgtg 23280
atcatcgcag cagttgattt atctggcagt attgaaaata tcgtcctgaa aacggcaagt 23340
ctcgctaaaa caggtcaact acttccgctc agtattggtg aaggtgcggg tgcaatagta 23400
ctgcaggttg ccgaccaaac agccacagac tctgagccac tggatttaat tcatcaagca 23460
cttggtgctg tggacacacc atctgcggca atatcaggtt caacagaacg aatcagcagt 23520
gattccctta acagccacgg ggcgttaaac agctacgcta caatcaacag tttatcattt 23580
ggtcacatta gccaacttga agccatcagt gatgaattac tcacccctgc gggcttatct 23640
acaagtgata tcggcaagct agagctaaac caagctccag acttaaccca tattgattca 23700
gcgcaagcgc tatcacaact ttatagtcag tcagcaacaa ctcaagccaa atcatgtatc 23760
ggccatactt ttgccgcttc aggaatggca agcttgctgc acggactgct cattcaaaaa 23820
caagatgcgc attcaaacca aacggttcaa cccttaaata cccttgtcgc cacactcagt 23880
gagaaccagt gttcacagct actgatgagt caaactgctg aacagatctc ggctttaaac 23940
agtcgaatta atactgatat tgggcagcaa accgctaaaa aactgagcct tgttaaacaa 24000
gtgagcttag gtggacatga tatttatcag catattgtcg atacgccact agctgacatt 24060
gacaatattc gcgctaaaac ggcaaatctt atccctgccg taaccaatac aacgacgaac 24120
atgcttgagc gaggtcagtt tgtgtctcca caactaactc ctttagcacc aatgttcgac 24180
aagaataacg ctatgacaac agagacttct atgccgtttt cagatcgttc tacccagttt 24240
aatccagctc ctaaagctgc agcgcttaat gccaaagata gtgccaaagc taatgccaac 24300
gttaaagcta acgtgacgac agcaaacgta acaacagcaa accaagtgcc accagcacat 24360
ttaacggctt tcgagcaaaa tcaatggtta gcccataaag cgcaattagc atttttaaac 24420
agccgtgagc aaggcttaaa agtcgctgat gcgcttttaa agcagcaggt agcacaagca 24480
aatggtcagc cttatgttgc ccaaccgatt gcacaaccta ctgcagctgt acaagcagca 24540
aatgtgttag ccgagcctgt agcatctgct ccaatcttgc gtccggatca tgcaaatgtg 24600
ccaccttaca cagcgccgac tcctgctgat aagccatgta tttggaatta cgctgattta 24660
gttgaatacg ctgaaggcga tatcgctaag gtattcggcc ctgattacgc tgtgattgat 24720
aactactcgc gccgtgttcg cctaccgacc actgattatt tgctggtatc tcgcgtgact 24780
aaactcgatg cgaccatgaa tcaatataag ccgtgcagca tgacaacaga gtacgacatc 24840
cctgaagatg cgccgtacct tgtcgatggt caaattccat gggcggtcgc cgttgaatca 24900
ggccaatgtg atttaatgtt gatcagctac ttagggattg attttgaaaa caaaggtgaa 24960
cgtgtttatc gcttacttga ctgtacctta accttcttag atgacttacc acgcggcggt 25020
gacacactgc gctacgacat caagattaat aacttcgcta agaatggcga caccttacta 25080
ttcttcttct cgtatgagtg ttttgttggc gacaagatga ttctgaaaat ggacggcggt 25140
tgtgcaggct tctttaccga ccaagaattg gatgacggta aaggcgttat tcgcaccgac 25200
gatgagatta agctgcgtga aactgcgcta aacaatccta ataagcctcg ctttgagcca 25260
ttattgcatt gcgcccaaac tgagtttgat tatggtcaaa ttcatcattt gttaaatgca 25320
gatataggtg gctgtttcgc gggcgagcat cacaaccatc aacaagcttc aggtaagcaa 25380
gattcactgt gttttgcttc tgaaaagttc ttgatgattg agcaagtagg caaccttgat 25440
gttcatggcg gcgcatgggg cttaggcttt attgaaggtc ataagcaact ggcacctgat 25500
cattggtatt tcccatgtca ctttaaaggt gaccaagtca tggcggggtc attaatggct 25560
gaaggttgtg gtcaattact gcaattcttt atgctgcaca ttggtatgca cacgctcgtt 25620
gaaaatggcc gtttccaacc acttgaaaat gcttcacaaa aagtgcgttg tcgtggtcaa 25680
gttctgccgc agcacggtga actgacttac cggatggaaa tcactgaaat tggcattcac 25740
cctcgcccat atgccaaagc gaatattgat attttgctta acggtaaagc ggttgtcgac 25800
ttccaaaact taggtgtcat gatcaaagaa gaaagcgaat gtacgcgcta ccttaatgat 25860
acgcccgctg tcgatgcctc agctgatcga attaattcag caaccaataa tattctatac 25920
ccagcggctt caaccaatgc gccactcatg gctcaactgc ctgatttgaa tgccccaacg 25980
aataaaggcg ttatcccact gcaacatgtt gaagcgccga taattccaga ttatccaaat 26040
cgtactcctg ataccctgcc attcacggcg tatcacatgt tcgaatttgc cactggcaat 26100
attgaaaact gctttggacc ggactttagt atttaccgtg gtttcattcc accgcgcaca 26160
ccatgtggcg acttacagct aacgactcgt attgttgata ttcaaggtaa acgtggcgaa 26220
ttgaaaaagc catcatcgtg tatcgcagaa tatgaagtgc caactgatgc atggtatttc 26280
gctaaaaaca gccacgcctc ggtcatacct tattcagtgt tgatggaaat ttcactgcaa 26340
cctaacggct ttatttcagg ctacatgggc accacattag ggttccctgg tgaagagtta 26400
ttcttccgta acttagacgg tagtggtgaa ctattacgtg atgttgattt acgtggcaaa 26460
accatcgtta atgattcaaa gctattatca accgttattg ctggtagcaa catcattcaa 26520
agcttcacat ttgatttaag tgttgacggc gagcccttct acaaaggcag tgcggtattt 26580
ggctacttta aaggcgatgc gcttaaaaac cagttaggta ttgataacgg ccgtatcact 26640
caaccatggc atgttgaaaa taacgtccct gctgatatca ctgttgattt acttgataag 26700
caatctcgcg tgttccatgc tcccgctaat caaccacatt atcgcttagc tggcggtcaa 26760
cttaacttta tcgacaaagc tgaaatagtt gataaaggcg gtaaaaatgg cttaggttac 26820
ttgtcggcat ctcgcaccat tgacccaagt gattggttct tccaattcca tttccatcaa 26880
gatccagtga tgccaggttc attaggcgtt gaagccatta tcgagttaat gcaaacttac 26940
gccattagca aagacctagg taaaggtttc acaaacccga aatttggcca gattttatct 27000
gacatcaaat ggaagtaccg tggccaaatt aacccattga ataagcaaat gtcgttagat 27060
gtgcacatca gtgcagtcaa agatgaaaac ggcaaacgca tcatcgtagg cgacgccaac 27120
ctgagcaaag acgggttacg catttacgaa gtaaaagata tcgctatctg tatcgaagag 27180
gcataaagga ataataatga ctattagcac tcaaaacgaa aagctttctc catggccttg 27240
gcaagttgcg ccaagtgatg ccagctttga cactgccact atcggtaata aattaaaaga 27300
actcactcaa gcttgttatt tagtgagtca ccctgaaaaa ggcttaggta tttcgcaaaa 27360
cgcacaagta atgactgaaa gcataaacag ccaacaggat ttacctgtca gtgcatttgc 27420
ccctgcttta ggcactcaaa gcctaggcga cagtaacttc cgccgcgttc acggtgttaa 27480
atacgcctat tatgctggtg cgatggccaa tggtatttca tctgaagagt tagtgattgc 27540
attaggtcaa gcaggcattt tatgctcgtt cggcgcagct ggcttaattc catcacgcgt 27600
tgaacaagcc attaaccgca ttcaaaccgc acttccaaat ggcccgtaca tgtttaactt 27660
aatccatagt ccaagtgagc cagcactaga acgtggcagt gttgagctgt ttttaaaaca 27720
taaagtgcgc acggtagaag cttctgcatt tttaggctta accccgcaaa ttgtctatta 27780
ccgcgctgca ggtttaagcc gtgatgccca aggtgaagtg gtaattgcca acaaggttat 27840
tgccaaagtg agccgcacag aagtggcgag taagtttatg caaccagctc ctgctaaaat 27900
gctgcaaaaa ctggttgatg aaggcttaat caccccagag caaatggcgc ttgcccaatt 27960
agtgccaatg gctgatgacg tgactgcaga agccgattct ggcggtcata ctgataaccg 28020
tccattagtg acgctattgc caacaatttt ggcacttaaa gataaaatcc aagccgagta 28080
ccaatacaaa acacctattc gtgtcggttg tggcggcggt gtcggcaccc ctgatgcagc 28140
acttgcaacc tttaatatgg gcgcagctta tattgtgaca ggctcaatta accaagcttg 28200
tgttgaagcg ggtgccagtg aacacacgcg taaactactt gctacgactg aaatggccga 28260
tgtcaccatg gcgcctgctg ctgatatgtt cgagatgggc gttaagctac aagtagtaaa 28320
acgtggcacc ttattcccaa tgcgtgctaa taaactttat gaaatttata cccgttatga 28380
gtcgattgaa gccatcccag ccgaagaacg tgaaaagctt gaaaaacaag tcttccgctc 28440
gacccttgat gatatttggg ctggcactgt ggcgcacttt aatgaacgcg atccaaaaca 28500
aatcgagcgc gcagaaggta accctaagcg taaaatggcg cttattttcc gttggtactt 28560
aggtttatca agccgttggt ctaattctgg tgaagctggc cgtgagatgg attatcaaat 28620
ttgggccggt ccagcactgg gcgcgttcaa cgaatgggca aaaggcagct atttagatga 28680
ttatacccag cgaaatgcgg tagacttagc aaaacacttg atgcacggcg cagcttatca 28740
agcgcgtgta aacttactta ccgctcaagg tgtggcactg cctgttgaat tacagcgttg 28800
gagcccgctt gatcaggtta agtaagcctg ccaagcgtca tcaagctaag tcatttggat 28860
ataggtagcg gtaatgagcg aaacacaaaa acttgatttt tcagtggtta atggcacaac 28920
acttgagtcg ttcaaccaac aaaaaaatct gattaaacgc atgctaaaag gcaacagcgc 28980
aacatgtgct gaatgtaaca agccactaac gctgcaatta ccgcctaata ctaaaaatgc 29040
caaacctgcc gaaaaagcac ctgggatata ctgcgcaaaa ggctgcacag atattgaact 29100
ggatatggaa gctgtggcac ttttaaaata atacgatgaa ataacccata gattatttca 29160
tcattaccat ttaaaaaagg catcgaaaga tgccttttta ttgcaattaa ttgaccactt 29220
tatcaagtgg cgacttacct aatcactcac caaaataagt tattcagaat agtgaattta 29280
gaattgagag tttagggaat gctgttactg atacggttca aattaggtaa ttaaaatata 29340
cttcattgct tcacggttcc tgcacggttt ctgcacttta atcacataac attaaaaact 29400
cataatagcc attatcaact acgggttaac ttaggagttt acttatgttc agtccccttc 29460
tctattcgct ttttcaaacg ggatgtaaac catttcggca actattaatt ataccgctta 29520
ctagcttatg cctattaact gcttgtgata gctcagatga taccagcagc gaagagactg 29580
taataacagt acctgacact gaaattgaaa caccggttga ggagtataac gatactgatt 29640
ttgaagcaag cgattggacc gatgacaccc atagcaaaag tgcagatgcc aactttgatg 29700
aagtatttgc tgacaatgaa gtaaaacgcc ttgatgtggt ggtcactgaa gatcgctgga 29760
ccatcatgct taacgatatg actgatactt atggcacttt tggtacaacg actaattcaa 29820
acaaccttgt agatacagat gacaacccca ttatggtgcc agctgatatt tattacgaag 29880
gcaaacagtg gtatcgagtt ggtatccgtt ttaagggaaa ctcgtcactg caaaccagct 29940
ggcaacaagg cgtactcaag ttatctttta agttagattt tgatgagttt gaagactact 30000
acccacaaat cgacaatcaa cgattttatg gctttaaaaa gttaagtctt aaaaataatt 30060
acgatgatga gtcgcagtta cgtgaaaaag ttgccgccga tgtatttaaa gatgcaggtt 30120
tagccgtctc tcacaccgct ttttatactt tatatatcga ccatggtgat ggccctgaat 30180
actttggctt atataccctt gtggaagaag tcgatgacac ggtaattgat actcaattta 30240
gcagtgatga tggtaactta tataagcctg aggatgatgg tgcgaccttt attgaaggat 30300
ctttcagtga agacagtttt gaaaagaaaa ccaatgaaga tgatgaagat tggtcagata 30360
ttttagcttt attcgacgca ttacatgatg atacagcgac ttccgatcct gttacttggc 30420
gtgaaaacct tgaagctata tttgatgttg atgtgttctt gaaatatctc gcagtgaatg 30480
gcgtaattca aaactgggat acttacggat taatgcccca taattattat ctttacaacg 30540
atccagacac aaacaaatta acttggatcc catgggataa taatgaggca ttacaaacgg 30600
gtaaaatggg cggtgcatta gaacttaatt tctctgattt agactcaaat tcttggccat 30660
tgatagccaa aatctatgct gatgacacat accgggaacg ctataaccag tatttatctg 30720
acgttattag cgatagctat gaaaccaata aaatgcaggc aatttatgac agttactcag 30780
cattaataga gccttatgcc acaacagagt taacaggtta ctcattttta gagtctgcaa 30840
atgactttta tcaagcagtt gatgatttat ctgaacatgc tgaaagtcga acagacgccg 30900
taatcgatta cttaaacacg caataggttg tagatttttt ctgtcatttt gcagatacaa 30960
tgaaaacgaa agcagcactg gctactttcg tttttgttgc tatcaattca aaaccgttta 31020
ctagcgcaca ctttcttatt aaaaaataac accttaacaa gtcattgacc taaatcaaac 31080
ataatgtgaa aaagctaagg cactatgcct ctttattttt tagtttggtt atttccaatg 31140
agtgatatca aggcaaacaa tatagagcaa ccgctgacgg acgagtgcat tttactttct 31200
accactgatt tgaatggtaa tatcaaatac gccaatcaag cctttgcaga tatctctgag 31260
ttcacgacag atgaactcca cggaaaacca cacaatattg ttcgtcaccc tgatatgcct 31320
aaagcagctt ttgaatcctt gtggcaacgg gtcaaagacg gaaaaccttg gtttggtatc 31380
gttaaaaata aaagcaaaac aggcaagtat tattgggtta atgcctatat atcgccagtc 31440
tttgaaaacg gcaaaatgca tgaactacag tctgttcgac gtaaaccttg tcgtgaacac 31500
atcaattccg ctgaaaaaat ttacaaacag ttaaatcaag gtaaagcccc cagagaaacc 31560
acagcaccac tgcttagctt tacgggttca ctttgccttt gggcaaccgt tatttctttg 31620
ataggggtag tgtcttcgct cttcatgcca actttggtcg ccgctttttt cattccctta 31680
atggctggat ttgtcatgta ttacttaacg aggccgttaa aagaacttga aaataaggcc 31740
acaaaaatta tcgacgaccc aattgcttgc gggatttttt catcgagtca acatgagttg 31800
ggcaaaattg aattagcctt aaactactta gtcactgaaa tgggtggtgt tgtcggcagg 31860
atggcagatt cagccacctc cattagcgaa gaaagccagc aacttaatca aactatatcg 31920
accactcgtg aacgggttaa agaacaaaca caccaaaccc gtcaggccgc aacagcaatg 31980
gagcaaatga cggcaagctt cactgaagtt aatcaaaata cccgcaatac agcacaagaa 32040
attaccacca gccaagaggc tgctagtaaa ggtcacgata gtatggacaa agtagtcaat 32100
gcaattggcg agcttagaaa agaagtggtt catttctcaa cggtggtcaa tacaattgaa 32160
aaagacagcc aatcaatcgc atcggtccta ggagagatta aaggcatcgc agaacaaact 32220
aatttattag cgttaaatgc tgccattgaa gcggctcgag caggtgaaac tggccgtggg 32280
tttgccgttg tggcggacga agtaaggcaa ttatcaattc gcaccagtga ttccacatca 32340
gaaattgaac acatagtcac gaactttcaa aaaaccacaa aggaagcgac tcaagcaatg 32400
gagtctggtc agttgcaagc cgatttatca gtatccttag cagaagaagc ggatgacacc 32460
tttgctcagc tccttaactc aattaatcgc atacacgaaa tggctgagct taactcttca 32520
gccatgaacc aacaaacagc ggtcgcagaa gaaattagcc aatctatttt acagatagat 32580
gagatttcaa acctgacctt aattcaaacc gatgacaccc aaaacaagtg tgaacaaatg 32640
agccgattag ccaataaaac tcgtcattta tcgagacaat tttggacgca aacaatcgaa 32700
cgcaccaaat aaatacctcc aatattaccc aaagcgtcat aacctacatg ttgattatga 32760
cgcaatcttg ctcaacactg attaacttcc ccatgtttgc agataacgcg agatttagcg 32820
gctgattgac tattgccccc tctttctgat tgtcattttt tcctgttgtg acagtttatt 32880
ttttgataag actttttaat ttaaaaaatg ccctaatatc atatatacag ttaacgttaa 32940
gccatgctta taaagccgtt taaagcgatt caaagtgagg gtacacaatg acaaacgaat 33000
ttattccacc taaaaaatgg gtaatggaag aggaaaatgg cggcaagttt gccagtataa 33060
accgtcctga ctctggtgcg cgctatgata aagatttacc ggttgggaag catgcactgc 33120
agctttactc tatgggcacc ccaaacggcc aaaaagtcac gattatgttg gaagagctgt 33180
tagccgcagg gatcactgac gcagaatatg atgctcactt gattagcatt ggtgatagcg 33240
atcaattctc atcaggtttt gttagcgtta atccaaattc aaaaataccg gcattattag 33300
ataacagtac ctcaacgcct attaatgtat ttgagtcagg cgctatttta ctttacctcg 33360
ctgaaaaatt tggctgcttc ttaccaacag atttagctgc taaaacccaa gtcatgaatt 33420
ggttgttttg gctgcagggc tcggctcctt atttaggtgg cggttttggt cacttttatg 33480
cttacgcccc tgaaaagttt aaatacccta tcgacaggtt ctctatggag gccaagcgtc 33540
aacttgatgt acttgacaag caattagcta aacaccgctt cttgggtggt gatgagtata 33600
gtattgccga tattgcgaca tggccttggt acggaaattt ggtgcttgga aacctatatg 33660
aagcagcaga gtttttagat gttgaaagct accctaacct aatgcgctgg gcaaaagaca 33720
ttgaacaacg tccagctgtc gcgcgtggca gaatcattaa tcgaacctgg ggggaagagt 33780
gggaacaact agcgaatcgt catagcgccg aagatattga taatgtgctt aaacgtcagc 33840
cataacactc acaatttctc aatccattgg tagatcactc aattttgata atgtgagcct 33900
ttacctttga tgtgattcac tctcattggg aatgaagttt gataaagcgg taggcacacc 33960
atcaagtgct tatcgcatta ttgctaacca acaacccctt taccgattaa ccactttcaa 34020
gcttgttcca acaacataag cacgtcggct gtacgtctgg cggtaaagta atgataaaac 34080
cacaatgcgg gcaaaaatcc ccaatattta aacggacata agattgtgtt tgcttataca 34140
tcagcatcgc tcttcttttc gattatattg aggtgaatac atcgccatta gctgtgcttc 34200
tacagcaccc cttacacaaa caggctcacc atttagcgga ctaggtacag ttacgttagt 34260
cgcaatccat agctccatat cacgtattaa ctcctcttta actaacctgc cagccgtacc 34320
atgtgaccaa atacgttttc caagtagacc actctcgccg acatataaaa cctgatctcc 34380
tttcttgaaa aaatacaccc ccgaaatgtc tcttggtaac agagaaaacc agtgctttct 34440
tgttgcatac tcattaccct caaagtcata taagccataa gtttcgctat tacgattaac 34500
aagccatgct tgagatcaac tgatattagc gatatgagta aatgtaatac tgcccatttt 34560
aaaggtattc atctacgacc tcagcgcagt taaacccctg gtacatctgg ccatcaggcc 34620
tcaacttcga acttgttaca gcattatcac taacaaactt ggtataaatt gtatctactc 34680
ttttaacagg cttaccaaat aacactcgag tatttcctcc gatagcagat accagtcgac 34740
tacctagcat ctgatgttct tcagtttcta tctcatctaa tatggccaca acttgataag 34800
ccactggaat tttacggttt gcattgatga cataaaccca atctcctttt gagattgaac 34860
aaaagtcatc ccagccatgt tggccaggtg ctaaatcgaa aaaagcattg ttaccaagcg 34920
atgcatatat ttttcggtgt ggacgatcag ctatatttga tacaagaaat tttcgcataa 34980
tgaacaaagg cacttaatac acatgtgtat atactaatta agtttcccta caaagtaaac 35040
cgtactaagt acctttattg tttatttcaa tatagatcat attcaaataa cgctaatcat 35100
aacgactttt ttattgattt cattgaattt taggcgcaaa gttaactatg taaaccagct 35160
aattagaacg cttaaagagt aaaaagcgca cactagcaac acagataaaa gcaaaattgc 35220
gccagtacta tcagcacctt catatgaggt aaatatgaac aagctactaa tacttagagc 35280
agtgacgagg atttatgaca ccttcaacct ctgcaaaagc acccacttta ataccagcca 35340
actaaacttg ttagcgacag cgaatcacct catcgctgca tgctttaaca gcaaaagtcc 35400
agctaacgct aaaatcaaat cagcaagtat catcatttgt tacttattta acggcattgt 35460
ttttagcgta catgcaacgg atgagcacct taacagtaca aggcatcttc aaacgatttc 35520
cccgcttaaa accgctttgc atttggagac ttatttaggc ggacatagta caaatttagc 35580
taacaaagcc gcactttcgt ttgagttcgg ccagagaaat agtcagcatg tttgccatat 35640
aaccacaaca gaagagcatt taatgcaatc caataattta ctggaaaaca ttaatttaag 35700
tgaaaaacat ttcttctttg actgtcaaat tgataatgat ttttatgtat tatctaacca 35760
ataccgtact tatgcccaag tgataattaa gcaacctgac atcaactttc caatgtcgat 35820
gcatatagag gcgaaacttg tcacaattga tggcaagctg ctcaatgtca ccagtggtga 35880
tatctcactt aaacggaaat agctcacatg gaatttgaca caataagaga ttatttactg 35940
actaaacctt ttgctacaga agactttcca ttcggagaat ctactcacgt ttttaaagtt 36000
cactcgaaga tgtttgcact aatgtcatgg cgaaatgatg ctttgatggt taatgtaaag 36060
tgcgatcctg aagactcatt cgccctaaga gagatattta gcaatattac gacgggatat 36120
catatggaca agaaacattg gatttctatc tatttacagt caactgggag tgataaatct 36180
aaagaatctc gattaattcc agatggtgag gtattgcgca ttattgataa ttcataccta 36240
ttagtcgtcg acaaacttcc taagaagcaa caaacagcca tcaaactgca tttataacaa 36300
acaaatcaaa gcgctttata gggtttgagc aagactattt ttcagaaagc agagctgtgt 36360
gcactatttt ttcgatagta ttgtcttgct cacctaagaa ctgacaacca aactcgacac 36420
cattttcgaa taatttaaca ttacacactc tggctttaat ggtgaggttt tcttgttctg 36480
tagcctctat cacgatttca atctgctctc cctctgttaa ctcatctttt ccaccttcac 36540
taacttcaat atgacaacct gaaagtgaaa catcggtgat tttaacttgc cattggttat 36600
cacctaaagc gatattggcg gttaaatctg tcaacacacg tttggtcgaa cgtaaattgt 36660
gaataaccat attatctggg aaattcaata ccataatacg agatggctga ctcaaggttt 36720
gtttgattgt tgaaataaat gcgattacag atgcctcatg accttccact aaaccacgaa 36780
cagtcacttg tgagccctga gtaatgtact ggctgtagcc tcccaattta tttgcatctg 36840
gaaattgaat tagtatgaat tgttcaggta gataaccgat aaaaatggta cgaaaacgcc 36900
cttttttacc tgcaggagtc acaatatcaa tattgacagg cgtaccagcc aataagtatt 36960
taaattcttt agacaaaccc tctttagtat tgatttgttt tgtggtcatt ttaccttccc 37020
tgaacctttt atttcccaat caaagattag cacaagattt aacatacaca acagtgagtt 37080
aaccttaatt aaatgttatt catgtgcttg cacctcttgt atctagaggt ctatggtgaa 37140
tatcacaagg ttaaggtttt tgatgtaaaa cataaaagac attgcaccaa acctgaatat 37200
tgacggtcgt cagattcagt cgcctcagcc gttgacataa ggtaacggag ttaacatatg 37260
agaaatctag aattattcag cacagcatct atcgatcact tactttggtc taccagcact 37320
gactcaccca gcttagactc tccagcgtta gacgtattta ctgattttga tgtagcacgt 37380
cctattgtcg ttgatgcatc caccagcgca gtggccacag caataatcat ggaacaaacc 37440
catgcattta tgagattagt tgttgataag aataataaat ttttaggggt gataacgctg 37500
caagaattgt ctgaccataa tttatttgtt accgcgaaaa agctagacct tactgtagat 37560
gagcttttag tcacagaagt gatggtgcca agagaagagc tacaagcgtt tgactatcaa 37620
caaatttcaa cagccaaagt cagtgatata gtcaggcttt tgcaacaaaa taatttgcac 37680
cacatgctag tcatcgatca tgaattgcat catatccgag ggctgattgc agcgagtgac 37740
ttagccagaa aactcaatat gccaatagaa atacatcaac ggccttcttt cagccaaatt 37800
ttctctaatg cccattaatg attttgccta aacgatataa atcacggagc cacttacctg 37860
acaaatctca ggtaagtgac gataaacctt attgaatata cgcagaaact agccttgctg 37920
tgttagttgg ctttcttgtt caacaagctg attatcgaaa gcaacacact gatttttacc 37980
ataagtctta gcttgatata gggccaaatc cgctttttga ataatctctt tcgctgaggt 38040
gaagttgcta ggtatgcaag aagtaaaacc taaactcaag gtgacgattt tactttttga 38100
tcttgggtgc gggatgccga gttcggcaat tttcaaacga atatcttcag cgagttgcga 38160
cacactttct tgctgtccgt aacaaataat agcaaactct tcaccgccat aacggcatac 38220
cacatcggtt gaacgcacac atacctcagc tattgcttgc gatacttgta ttaagcattg 38280
atctccttgg tagtggccta agaaatcgtt ataagcttta aaacaatcaa tatcacacat 38340
gattaatgac actaattgtc gctctcttcg tgctagattg ataataaagt ccaattgaga 38400
atcgaactct ctgcgattgt tcagccctgt taatgcatca agctttgaaa gcttaaacaa 38460
tttagcactc gtacgttcac gctcaataat cccaaaaagt aattgtgcat ttccgcaatc 38520
gtctcgaagt attgctctcg ctttactcgt aaagtaaagg atctcacctt ggttagcgtc 38580
ataataagga aaacgattat ggtattcatc gatacgtcct aagcgcaagt cacagtaatc 38640
ttcaaaaatt cgcttagctt tatgggcatc ttttaccgca atatttttat tgtaatcccc 38700
agcgatagga caagtcttac taacagaatg ttgaagggta tttgagtcta aagagaacat 38760
gtcacgcatg ttactgttgc agtaaaaaac attactatta tcttctaagt ctattagcca 38820
ccaggaaaca cctgaaaagc ttaataactc ttgataaagc gtataatatt tttcaattcg 38880
cttatttgga aacgtcataa ttgattagcc actttgttca agctaaccat tagtcactta 38940
cgcaactaac tttcccttta gcaaaatgaa tcagcaaaac tactatgatt atagaccctg 39000
tttacgtaat ttcctgtttg cctctcattt agctcaaaac aatgtcgtta ataaatgccg 39060
ctaataaatg cattaaaccg ctgtccacct atgttcgata cacggcttta tttgggatac 39120
ttgctcagct aactgctctt gtgatgaata atcgacattg gcccaaagct taatctcaaa 39180
caccgcccct aaagcaacct ggccaacgcc tttaggtgta cctgtcatca caatgtcgcc 39240
atccactaac gtcataaatt cattcaccga agctagaata tcgtcagcac tgtacatcat 39300
taaatcgcta tgaccgagtt gcctgacttc accatcgatt gtcaattgaa agcaaaatgt 39360
agctccggca gttaacgaca atgaagataa actgacaaaa tcactaaata gagccgagcc 39420
gtcaaatgcc ttagctcgct cccatggtag ctgttgtgat ttaagtttgg actgcaattc 39480
tctcttggtt aggtctaatc ccacccctac cccatgaaac atcccattac gcactgaaaa 39540
acatagctct gtttcaaaat gaatcggctc ttgatgaaat gagatcagct gcgtggaaat 39600
cgcagagtta ggttttaaaa aaaccaccat atctgaaggc acctcattac ccagctcatg 39660
gatatgatc 39669
<210> 70
<211> 2787
<212> PRT
<213> Sh. japonica
<400> 70
Met Ser Gln Ala Pro Thr Asn Pro Glu Thr Ser Ser Gln Asp Asn Asn
1 5 10 15
Glu Ser Gln Asp Thr Arg Leu Asn Lys Arg Leu Lys Asp Met Pro Ile
20 25 30
Ala Ile Val Gly Met Ala Ser Ile Phe Ala Asn Ser Arg Tyr Leu Asn
35 40 45
Lys Phe Trp Asp Leu Ile Ser Glu Lys Ile Asp Ala Ile Thr Glu Val
50 55 60
Pro Asp Thr His Trp Arg Ala Glu Asp Tyr Phe Asp Ala Asp Lys Ser
65 70 75 80
Thr Pro Asp Lys Ser Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu Val
85 90 95
Asp Phe Asn Pro Met Glu Phe Gly Leu Pro Pro Asn Ile Leu Glu Leu
100 105 110
Thr Asp Thr Ser Gln Leu Leu Ser Leu Val Ile Ala Lys Glu Val Leu
115 120 125
Ala Asp Ala Gly Val Thr Ser Glu Tyr Asp Thr Asp Lys Ile Gly Ile
130 135 140
Thr Leu Gly Val Gly Gly Gly Gln Lys Ile Asn Ala Ser Leu Thr Ala
145 150 155 160
Arg Leu Gln Tyr Pro Val Leu Lys Lys Val Phe Lys Ser Ser Gly Leu
165 170 175
Ser Asp Ala Asp Ser Asp Met Leu Ile Lys Lys Phe Gln Asp Gln Tyr
180 185 190
Ile His Trp Glu Glu Asn Ser Phe Pro Gly Ser Leu Gly Asn Val Ile
195 200 205
Ala Gly Arg Ile Ala Asn Arg Phe Asp Leu Gly Gly Met Asn Cys Val
210 215 220
Val Asp Ala Ala Cys Ala Gly Ser Leu Ala Ala Met Arg Met Ala Leu
225 230 235 240
Thr Glu Leu Val Glu Gly Arg Ser Glu Met Met Ile Thr Gly Gly Val
245 250 255
Cys Thr Asp Asn Ser Pro Ser Met Tyr Met Ser Phe Ser Lys Thr Pro
260 265 270
Ala Phe Thr Thr Asn Glu Thr Ile Gln Pro Phe Asp Ile Asp Ser Lys
275 280 285
Gly Met Met Ile Gly Glu Gly Ile Gly Met Val Ala Leu Lys Arg Leu
290 295 300
Glu Asp Ala Glu Arg Asp Gly Asp Arg Ile Tyr Ser Val Ile Lys Gly
305 310 315 320
Val Gly Ala Ser Ser Asp Gly Lys Phe Lys Ser Ile Tyr Ala Pro Arg
325 330 335
Pro Glu Gly Gln Ala Lys Ala Leu Lys Arg Ala Tyr Asp Asp Ala Gly
340 345 350
Phe Ala Pro Glu Thr Val Gly Leu Ile Glu Ala His Gly Thr Gly Thr
355 360 365
Ala Ala Gly Asp Val Ala Glu Phe Asn Gly Leu Lys Ser Val Phe Gly
370 375 380
Glu Asn Asp Ser Thr Lys Gln His Ile Ala Leu Gly Ser Val Lys Ser
385 390 395 400
Gln Val Gly His Thr Lys Ser Thr Ala Gly Thr Ala Gly Val Ile Lys
405 410 415
Ala Ala Leu Ala Leu His His Lys Val Leu Pro Pro Thr Ile Asn Val
420 425 430
Ser Lys Pro Asn Pro Lys Leu Asn Val Glu Asp Ser Pro Phe Phe Ile
435 440 445
Asn Thr Glu Thr Arg Pro Trp Met Pro Arg Pro Asp Gly Thr Pro Arg
450 455 460
Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly Gly Thr Asn Phe His Leu
465 470 475 480
Val Leu Glu Glu Tyr Ser Pro Glu His Ser Arg Asp Glu Lys Tyr Arg
485 490 495
Gln Arg Gln Val Ala Gln Ser Leu Leu Ile Ser Ala Asp Asn Lys Ala
500 505 510
Glu Leu Ile Ala Glu Ile Asn Lys Leu Asn Ala Asp Ile Ser Ala Leu
515 520 525
Lys Gly Thr Asp Asn Ser Ser Ile Glu Gln Ala Glu Leu Ala Arg Ile
530 535 540
Ala Lys Leu Tyr Ala Val Arg Thr Leu Asp Thr Ser Ala Ala Arg Leu
545 550 555 560
Gly Leu Val Val Ser Ser Leu Asn Glu Leu Thr Thr Gln Leu Gly Leu
565 570 575
Ala Leu Lys Gln Leu Ser Asn Asp Ala Glu Ala Trp Gln Leu Pro Ser
580 585 590
Gly Thr Ser Tyr Arg Ser Ser Ala Leu Ile Thr Ile Asn Ala Asn Gln
595 600 605
Lys Thr Thr Lys Gly Lys Lys Ala Ala Asn Thr Pro Lys Val Ala Ala
610 615 620
Leu Phe Ala Gly Gln Gly Ser Gln Tyr Val Asn Met Gly Ile Asp Val
625 630 635 640
Ala Cys His Phe Pro Glu Met Arg Gln Gln Leu Ile Lys Ala Asp Lys
645 650 655
Val Phe Ala Ser Phe Asp Lys Thr Pro Leu Ser Gln Val Met Phe Pro
660 665 670
Ile Pro Ala Phe Glu Lys Ala Asp Lys Asp Ala Gln Ala Ala Leu Leu
675 680 685
Thr Ser Thr Asp Asn Ala Gln Ser Ala Ile Gly Val Met Ser Met Ser
690 695 700
Gln Tyr Gln Leu Phe Thr Gln Ser Gly Phe Ser Ala Asp Met Phe Ala
705 710 715 720
Gly His Ser Phe Gly Glu Leu Ser Ala Leu Cys Ala Ala Gly Val Ile
725 730 735
Ser Asn Asp Asp Tyr Tyr Gln Leu Ser Tyr Ala Arg Gly Ala Ser Met
740 745 750
Ala Ala Ser Ala Val Asp Lys Asp Gly Asn Glu Leu Asp Lys Gly Thr
755 760 765
Met Tyr Ala Ile Ile Leu Pro Ala Asn Glu Asn Asp Ala Ala Asn Ser
770 775 780
Asp Asn Ile Ala Lys Leu Glu Ser Cys Ile Ser Glu Phe Glu Gly Val
785 790 795 800
Lys Val Ala Asn Tyr Asn Ser Ala Thr Gln Leu Val Ile Ala Gly Pro
805 810 815
Thr Gln Ser Cys Ala Asp Ala Ala Lys Ala Ile Ala Ala Leu Gly Phe
820 825 830
Lys Ala Ile Ala Leu Pro Val Ser Gly Ala Phe His Thr Pro Leu Val
835 840 845
Gly His Ala Gln Lys Pro Phe Ala Lys Ala Ile Asp Lys Ala Lys Phe
850 855 860
Thr Ala Ser Lys Val Asp Leu Phe Ser Asn Ala Thr Gly Asp Lys His
865 870 875 880
Pro Ser Asp Ala Lys Ser Ile Lys Ala Ala Phe Lys Gln His Met Leu
885 890 895
Gln Ser Val Arg Phe Thr Asp Gln Leu Asn Asn Met Tyr Asp Ala Gly
900 905 910
Ala Arg Val Phe Val Glu Phe Gly Pro Lys Asn Ile Leu Gln Lys Leu
915 920 925
Val Glu Ala Thr Leu Gly Asn Lys Ala Glu Ala Val Ser Val Ile Ser
930 935 940
Ile Asn Pro Asn Pro Lys Gly Asn Ser Asp Val Gln Leu Arg Val Ala
945 950 955 960
Ala Met Gln Leu Ser Val Leu Gly Ala Pro Leu Ser Ser Ile Asp Pro
965 970 975
Tyr Gln Ala Glu Ile Ala Ala Pro Ala Val Pro Lys Gly Met Asn Val
980 985 990
Lys Leu Asn Ala Thr Asn His Ile Ser Ala Pro Thr Arg Ala Lys Met
995 1000 1005
Glu Lys Ser Leu Ala Thr Gly Gln Val Thr Ser Gln Val Val Glu
1010 1015 1020
Thr Ile Val Glu Lys Val Ile Glu Lys Pro Val Glu Lys Val Val
1025 1030 1035
Glu Lys Ile Val Glu Lys Glu Val Ile Lys Thr Glu Tyr Val Glu
1040 1045 1050
Val Ala Thr Ser Gly Ala Thr Thr Val Ser Asn Val Ala Pro Gln
1055 1060 1065
Ala Ile Ala Pro His Ala Ser Ala Gln Ala Ala Pro Ala Ser Gly
1070 1075 1080
Ser Leu Glu Ala Phe Phe Asn Ala Gln Gln Gln Ala Ala Asp Leu
1085 1090 1095
His Gln Gln Phe Leu Ala Ile Pro Gln Gln Tyr Gly Asp Thr Phe
1100 1105 1110
Thr His Leu Met Ala Glu Gln Ser Lys Met Val Ala Ala Gly Gln
1115 1120 1125
Ala Ile Pro Glu Ser Leu Gln Arg Ser Ile Glu Leu Phe His Gln
1130 1135 1140
His Gln Ala Gln Thr Leu Gln Ser His Thr Leu Phe Leu Glu Gln
1145 1150 1155
Gln Ala Gln Ala Ser Gln Asn Ala Leu Asn Met Leu Thr Gly Gln
1160 1165 1170
Thr Pro Val Thr Ala Pro Val Val Asn Ala Pro Ile Val Asn Ser
1175 1180 1185
Pro Val Val Glu Ala Val Lys Val Ala Pro Pro Val Gln Thr Pro
1190 1195 1200
Val Val Asn Thr Pro Val Val Pro Ala Val Lys Ala Thr Pro Val
1205 1210 1215
Ala Gln Pro Ala Ala Met Ala Ala Pro Thr Pro Pro Val Glu Pro
1220 1225 1230
Ile Lys Ala Pro Ala Pro Val Ala Ala Pro Val Val Ser Ala Pro
1235 1240 1245
Val Val Pro Thr Pro Ala Gly Leu Ser Ala Gln Thr Ala Leu Ser
1250 1255 1260
Ser Gln Lys Val Leu Asp Thr Met Leu Glu Val Val Ala Glu Lys
1265 1270 1275
Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu
1280 1285 1290
Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Gly
1295 1300 1305
Thr Val Gln Asp Glu Leu Pro Thr Leu Pro Glu Leu Ser Pro Glu
1310 1315 1320
Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val Asp Tyr Met
1325 1330 1335
Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn Ser Asp Thr Ala
1340 1345 1350
Asn Ala Thr His Thr Ala Val Ser Ala Pro Ala Ala Ser Gly Leu
1355 1360 1365
Ser Ala Glu Thr Val Leu Asn Thr Met Leu Glu Val Val Ala Glu
1370 1375 1380
Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser Met Asp Met
1385 1390 1395
Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu
1400 1405 1410
Gly Thr Val Gln Asp Glu Leu Pro Thr Pro Pro Glu Leu Ser Pro
1415 1420 1425
Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val Ser Tyr
1430 1435 1440
Met Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn Ser Lys Leu
1445 1450 1455
Pro Ala Ser Ala Ala Glu Val Ala Gln Pro Gln Thr Ala Pro Val
1460 1465 1470
Gln Ala Ala Ser Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met
1475 1480 1485
Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu
1490 1495 1500
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile
1505 1510 1515
Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr
1520 1525 1530
Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu
1535 1540 1545
Gly Glu Ile Val Asp Tyr Met Asn Ser Lys Leu Pro Ala Ala Gly
1550 1555 1560
Ser Ala Pro Val Ala Ser Pro Val Gln Ser Ala Thr Pro Val Ser
1565 1570 1575
Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met Leu Glu Val Val
1580 1585 1590
Ala Glu Lys Thr Gly Tyr Pro Thr Asp Met Leu Glu Leu Ser Met
1595 1600 1605
Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
1610 1615 1620
Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu Pro Glu Leu
1625 1630 1635
Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val
1640 1645 1650
Asp Tyr Met Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn Thr
1655 1660 1665
Lys Leu Pro Ala Glu Gly Ala Asn Thr Gln Ala Ala Ala Gly Ala
1670 1675 1680
Ala Gln Val Ala Ala Thr Gln Thr Ser Gly Leu Ser Ala Glu Gln
1685 1690 1695
Val Gln Ser Thr Met Met Thr Val Val Ala Glu Lys Thr Gly Tyr
1700 1705 1710
Pro Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu Ala Asp Leu
1715 1720 1725
Gly Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Gly Thr Val Gln
1730 1735 1740
Asp Glu Leu Pro Thr Leu Pro Glu Leu Asn Pro Glu Asp Leu Ala
1745 1750 1755
Glu Cys Arg Thr Leu Gly Glu Ile Val Ser Tyr Met Gly Gly Lys
1760 1765 1770
Leu Pro Ala Ala Gly Ala Met Asn Thr Lys Leu Pro Ala Glu Gly
1775 1780 1785
Ala Asn Thr Gln Ala Ala Ala Gly Ala Ser Gln Val Ala Ala Ser
1790 1795 1800
Thr Ala Glu Thr Ala Leu Ser Ala Glu Gln Val Gln Ser Thr Met
1805 1810 1815
Met Thr Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu
1820 1825 1830
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile
1835 1840 1845
Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Gly
1850 1855 1860
Leu Pro Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu
1865 1870 1875
Gly Glu Ile Val Ser Tyr Met Gly Ala Lys Leu Pro Ala Ala Gly
1880 1885 1890
Ala Met Asn Lys Lys Gln Ala Ser Val Glu Thr Gln Ser Ala Pro
1895 1900 1905
Ala Ala Glu Leu Ala Thr Asp Leu Pro Pro His Gln Glu Val Ala
1910 1915 1920
Leu Lys Lys Leu Pro Ala Ala Asp Lys Leu Val Asp Gly Phe Ser
1925 1930 1935
Lys Asp Ala Cys Ile Val Ile Asn Asp Asp Gly His Asn Ala Gly
1940 1945 1950
Val Leu Ala Glu Lys Leu Val Ala Thr Gly Leu Thr Val Ala Val
1955 1960 1965
Ile Arg Ser Pro Glu Ser Val Thr Ser Ala Gln Ser Pro Leu Ser
1970 1975 1980
Ser Asp Ile Ala Ser Phe Thr Leu Ser Ala Val Asn Asp Asp Ala
1985 1990 1995
Ile Ser Asp Val Ile Ala Gln Ile Ser Lys Gln His Lys Ile Ala
2000 2005 2010
Gly Phe Val His Leu Gln Pro Gln Leu Thr Ala Gln Gly Ala Leu
2015 2020 2025
Pro Leu Ser Asp Ala Gly Phe Val Ala Val Glu Gln Ala Phe Leu
2030 2035 2040
Met Ala Lys His Leu Gln Lys Pro Phe Ala Glu Leu Ala Lys Thr
2045 2050 2055
Glu Arg Val Ser Phe Met Thr Val Ser Arg Ile Asp Gly Gly Phe
2060 2065 2070
Gly Tyr Leu Asn Thr Ala Glu Leu Ala Lys Ala Glu Leu Asn Gln
2075 2080 2085
Ala Ala Leu Ser Gly Leu Thr Lys Thr Leu Gly His Glu Trp Pro
2090 2095 2100
Thr Val Phe Cys Arg Ala Leu Asp Ile Thr Pro Ser Phe Glu Ala
2105 2110 2115
Val Glu Leu Ala Gln Ala Val Ile Ala Glu Leu Phe Asp Val Asp
2120 2125 2130
Thr Ala Thr Ala Glu Val Gly Ile Ser Asp Gln Gly Arg His Thr
2135 2140 2145
Leu Ser Ala Thr Ala Thr Ala Gln Thr Arg Tyr Gln Thr Thr Ser
2150 2155 2160
Leu Asn Ser Glu Asp Thr Val Leu Val Thr Gly Gly Ala Lys Gly
2165 2170 2175
Val Thr Phe Glu Cys Ala Leu Thr Leu Ala Lys Gln Thr Gln Ser
2180 2185 2190
His Phe Ile Leu Ala Gly Arg Ser Glu His Leu Ala Gly Asn Leu
2195 2200 2205
Pro Thr Trp Ala Lys Ser Val Ile Ala Ala Ala Pro Asn Val Ser
2210 2215 2220
Glu Val Asn Thr Ser Gln Leu Lys Ala Ala Ala Ile Gly Phe Ile
2225 2230 2235
Gln Ser Gln Gly Asn Lys Pro Thr Pro Lys Gln Ile Asp Ala Leu
2240 2245 2250
Val Trp Pro Ile Thr Ser Ser Leu Glu Ile Asp Arg Ser Leu Ala
2255 2260 2265
Ala Phe Lys Ala Val Gly Ala Ser Ala Glu Tyr Ile Ser Met Asp
2270 2275 2280
Val Ser Ser Asp Ala Ala Ile Lys Gln Ser Leu Ala Gly Val Lys
2285 2290 2295
Pro Ile Thr Gly Ile Ile His Gly Ala Gly Val Leu Ala Asp Lys
2300 2305 2310
His Ile Gln Asp Lys Thr Leu Ala Glu Leu Gly Arg Val Tyr Gly
2315 2320 2325
Thr Lys Val Ser Gly Phe Ala Gly Ile Ile Asn Ala Ile Asp Ala
2330 2335 2340
Ser Lys Leu Lys Leu Val Ala Met Phe Ser Ser Ala Ala Gly Phe
2345 2350 2355
Tyr Gly Asn Thr Gly Gln Ser Asp Tyr Ser Met Ser Asn Glu Ile
2360 2365 2370
Leu Asn Lys Thr Ala Leu Gln Leu Ala Ala Asn Tyr Pro Gln Ala
2375 2380 2385
Lys Val Met Ser Phe Asn Trp Gly Pro Trp Asp Gly Gly Met Val
2390 2395 2400
Ser Ser Ala Leu Lys Lys Met Phe Val Glu Arg Gly Val Tyr Val
2405 2410 2415
Ile Pro Leu Asp Lys Gly Ala Asn Leu Phe Ala His Ser Leu Leu
2420 2425 2430
Ser Glu Ser Gly Val Gln Leu Leu Ile Gly Ser Ser Met Gln Gly
2435 2440 2445
Ser Ser Ser Ala Asp Lys Thr Gly Ala Ala Val Lys Lys Leu Asn
2450 2455 2460
Ala Asp Ser Ser Leu Asn Ala Glu Gly Ser Leu Ile Leu Ser Phe
2465 2470 2475
Thr Thr Pro Ala Asn Arg Val Val Asn Asn Ala Val Thr Val Glu
2480 2485 2490
Arg Val Leu Asn Pro Val Ala Met Pro Phe Leu Glu Asp His Cys
2495 2500 2505
Ile Ala Gly Asn Pro Val Leu Pro Thr Val Cys Ala Ile Gln Trp
2510 2515 2520
Met Arg Glu Thr Ala Gln Gln Leu Cys Gly Leu Pro Val Thr Val
2525 2530 2535
Gln Asp Tyr Lys Leu Leu Lys Gly Ile Ile Phe Glu Thr Lys Glu
2540 2545 2550
Pro Gln Val Leu Thr Leu Thr Leu Thr Gln Thr Glu Ser Gly Leu
2555 2560 2565
Lys Ala Leu Ile Ala Ser Arg Met His Arg Asp Pro Met Asp Ser
2570 2575 2580
Leu Leu Arg Pro Gln Tyr Gln Ala Asn Leu Val Ile Asn Glu Ala
2585 2590 2595
Val Ile Asn Gly Gln Thr Leu Thr Thr Gln Pro Thr Ile Val Ala
2600 2605 2610
Asp Ala Gln Gln Leu Ala Ser Ala Gly Lys Val Ile Ser Thr Asp
2615 2620 2625
Ser Glu Leu Tyr Ser Asn Gly Ser Leu Phe His Gly Pro Arg Leu
2630 2635 2640
Gln Gly Ile Lys Gln Val Leu Ile Ala Asp Asp Thr Gln Leu Val
2645 2650 2655
Cys Asn Val Glu Leu Pro His Ile Ser Ser Ala Asp Cys Ala Gly
2660 2665 2670
Phe Ala Pro Asn Leu Ser Ile Gly Gly Ser Gln Ala Phe Ala Glu
2675 2680 2685
Asp Leu Leu Leu Gln Ala Met Leu Val Trp Ala Arg Ile Asn His
2690 2695 2700
Asp Ala Ala Ser Leu Pro Ser Thr Ile Gly Lys Leu Thr Thr Tyr
2705 2710 2715
Ser Pro Phe Ala Ser Gly Asp Lys Gly Tyr Leu Val Leu Ser Val
2720 2725 2730
Leu Lys Ser Thr Ser Arg Ser Leu Thr Ala Asp Ile Ala Leu Tyr
2735 2740 2745
His Gln Asp Gly Arg Leu Ser Cys Thr Met Ser Ser Ala Lys Thr
2750 2755 2760
Thr Ile Ser Lys Ser Leu Asn Glu Ala Phe Leu Ala Pro Ala Lys
2765 2770 2775
Ala Ile Ala Asp Leu Gln Glu Ser Val
2780 2785
<210> 71
<211> 759
<212> PRT
<213> Sh. japonica
<400> 71
Val Ser Thr Gln Leu Thr Ala Lys Thr Ala Ala Ile Asn Ser Ile Arg
1 5 10 15
Ile Ala Leu Lys Leu Val Ala Asn Asp Gln Thr Ser Phe Ala Pro Ala
20 25 30
Gln Asn Ala Asp Asp Ile Phe Ser Ala Ile Lys Pro Cys Ser Leu Ala
35 40 45
Gln Val Ile Gly Glu Ser Ala Ile Asp Leu Glu Ile Asp Val Ser Ser
50 55 60
Leu Asp Ala Gly Ile Asp Asn Leu Ala Thr Ala Ser Gln Gln Thr Leu
65 70 75 80
Ser Phe Ser Asp Tyr Phe Ala Gln Ala Ile Ala His Ile Glu Gln Gln
85 90 95
His Thr Val Leu Leu Ser His Pro Ala Ile Pro Tyr Arg Val Leu Met
100 105 110
Met Pro Ala Ile Val Ala Ala Lys His Arg Cys His Pro His Ala Tyr
115 120 125
Leu Thr Gly Leu Gly Glu Ala Asp Asp Met Gln Cys Ala Met Gln Asn
130 135 140
Ala Leu Ala Gln Ala Lys Arg Glu His Ile Thr Pro Thr Leu Val Asp
145 150 155 160
Val Thr Glu Leu Thr Cys Tyr Lys Asp Lys Phe Thr Gln Leu Val Met
165 170 175
Leu Ile Ser Arg Ile Ala Ala Arg Arg Leu Pro Asp Thr Thr Leu Pro
180 185 190
Thr Val Thr Ser Asp Lys Gln Asn Asn Ser Asn Gln Ala Asn Ala Lys
195 200 205
Tyr Trp Phe Thr Gln Met His Gln Asn Arg Val Ala Ser Phe Asn Phe
210 215 220
Thr Glu Asn Gly Lys Gln His Ala Ala Val Phe Val Gln Gly Thr Glu
225 230 235 240
Leu Ala Gln Ala Ser Ser Met Leu Asp Glu Asn Arg Leu Phe Phe Pro
245 250 255
Leu Ala Ala Asn Thr Ser Ala Cys Met Ile Gln Ser Leu His Glu Leu
260 265 270
Leu Val Ala Leu Asn Arg Leu Asn Gln Gln Gln Ser Asn Pro Leu Asp
275 280 285
Ser Gln Arg Leu Leu Asn Lys Pro Ser His Val Ile Ser Leu Met Leu
290 295 300
Asn Tyr Leu Lys Ala Phe Asp Gln Thr Lys Ser Leu Ser Ala Val Ile
305 310 315 320
Ile Ala Asn Ser Val Val Thr Ala Ile Ala Glu Ile Glu Ala Met Leu
325 330 335
Ala Lys Ile Ser Thr Ala Ser Asp Asp Thr Ser Gly Ser Ile Asn Glu
340 345 350
Leu Glu Tyr Lys Thr Pro Ser Gly Ser Cys Leu Thr Ile Thr His His
355 360 365
Glu Ala Leu Gly Arg Ser Gly Val Cys Phe Val Tyr Pro Gly Val Gly
370 375 380
Thr Val Tyr Pro Gln Met Phe Ala Gln Leu Pro Gln Tyr Phe Pro Ala
385 390 395 400
Leu Phe Ala Gln Leu Glu Arg Asp Gly Asp Val Lys Ala Met Leu Gln
405 410 415
Ala Asp Cys Ile Tyr Ala Glu Asn Ala Lys Thr Ser Asp Met Asn Leu
420 425 430
Gly Glu Leu Ala Ile Ala Gly Val Gly Ala Ser Tyr Ile Leu Thr Lys
435 440 445
Val Leu Thr Glu His Phe Ala Ile Lys Pro Asp Phe Ala Met Gly Tyr
450 455 460
Ser Met Gly Glu Ala Ser Met Trp Ala Ser Leu Asn Val Trp Lys Thr
465 470 475 480
Pro His Asn Met Ile Glu Ala Thr Gln Thr Asn Ser Ile Phe Thr Ser
485 490 495
Asp Ile Ser Gly Arg Leu Asp Cys Val Arg Gln Ala Trp Gln Leu Glu
500 505 510
Gln Gly Glu Asp Ile Val Trp Asn Ser Phe Val Val Arg Ala Ala Pro
515 520 525
Thr Glu Ile Glu Ala Val Leu Ala Asp Tyr Pro Arg Ala Tyr Leu Ala
530 535 540
Ile Ile Gln Gly Asp Thr Cys Val Leu Ala Gly Cys Glu Gln Ser Cys
545 550 555 560
Lys Ala Leu Leu Lys Gln Ile Gly Lys Arg Gly Ile Ala Ala Asn Arg
565 570 575
Val Thr Ala Met His Thr Gln Pro Ala Met Leu Ile Arg Asp Asn Val
580 585 590
Gln Ala Phe Tyr Gln Gln Ala Leu His Asp Gln Asp Val Leu Asp Ala
595 600 605
Gln Ala Ser Ser Ile Lys Phe Ile Ser Ala Ala Ser Gln Ile Pro Ile
610 615 620
Ser Leu Thr Ser Gln Asp Ile Ala Asn Ser Ile Ala Asp Thr Phe Cys
625 630 635 640
Gln Pro Leu Asn Phe Thr Lys Leu Val Asn Asn Ala Arg His Leu Gly
645 650 655
Ala Arg Leu Phe Val Glu Ile Gly Ala Asp Arg Gln Thr Ser Thr Leu
660 665 670
Ile Asp Lys Ile Ala Arg Thr Ala Ala Asn Thr Asp Ser His Leu Asn
675 680 685
Ala Pro Leu Ser Ala Ile Ala Ile Asn Ala Lys Gly Asp Asp Gln Thr
690 695 700
Ala Leu Leu Lys Cys Ile Ala Gln Leu Ile Ser His Lys Val Pro Leu
705 710 715 720
Ser Leu Gln Tyr Leu Thr Glu Asn Leu Ser His Leu Leu Thr Ala Ser
725 730 735
Ile Thr Arg Glu Asn Arg Gln Gln Ser Gln Thr Ala Gln Leu Ala Pro
740 745 750
Gln Leu Glu Gly Glu Gln Ser
755
<210> 72
<211> 2019
<212> PRT
<213> Sh. japonica
<400> 72
Leu Ser Ser Gln Ser Asn Val Pro Lys Ile Ala Ile Val Gly Leu Ala
1 5 10 15
Thr Gln Tyr Pro Asp Ala Asp Thr Pro Ala Lys Phe Trp Gln Asn Leu
20 25 30
Leu Asp Lys Lys Asp Ser Arg Ser Thr Ile Ser Gln Gln Lys Leu Asn
35 40 45
Ala Asn Pro Ala Asp Phe Gln Gly Val Gln Gly Gln Ser Asp Arg Phe
50 55 60
Tyr Cys Asp Lys Gly Gly Tyr Ile Gln Asp Phe Ser Phe Asp Ala Asn
65 70 75 80
Gly Tyr Arg Ile Pro Ala Ala Gln Phe Asn Gly Leu Asp Asp Ser Phe
85 90 95
Leu Trp Ala Thr Asp Thr Ala Arg Lys Ala Leu Asn Asp Ala Gly Val
100 105 110
Asp Ile Thr Asn Ser Gln Asp Asn Ala Ile Leu Asn Arg Thr Gly Ile
115 120 125
Val Met Gly Thr Leu Ser Phe Pro Thr Ala Lys Ser Asn Glu Leu Phe
130 135 140
Val Pro Ile Tyr His Ser Ala Val Glu Lys Ala Leu Gln Asp Lys Leu
145 150 155 160
Gln Gln Pro Ser Phe Thr Leu Gln Pro Phe Asp Ser Glu Gly Tyr Ser
165 170 175
Lys Gln Thr Thr Pro Ala Ser Leu Ser Asn Gly Ala Ile Ala His Asn
180 185 190
Ala Ser Lys Leu Val Ala Asp Ala Leu Gly Leu Gly Ala Ala Gln Leu
195 200 205
Ser Leu Asp Ala Ala Cys Ala Ser Ser Val Tyr Ser Leu Lys Leu Ala
210 215 220
Cys Asp Tyr Leu His Thr Gly Lys Ala Asp Met Met Leu Ala Gly Ala
225 230 235 240
Val Ser Gly Ala Asp Pro Phe Phe Ile Asn Met Gly Phe Ser Ile Phe
245 250 255
His Ala Tyr Pro Asp His Gly Ile Ser Ala Pro Phe Asp Ser Asn Ser
260 265 270
Lys Gly Leu Phe Ala Gly Glu Gly Ala Gly Val Leu Val Leu Lys Arg
275 280 285
Leu Glu Asp Ala Glu Arg Asp Gly Asp His Ile Tyr Ala Leu Val Ser
290 295 300
Gly Ile Gly Leu Ser Asn Asp Gly Lys Gly Gln Phe Val Leu Ser Pro
305 310 315 320
Asn Ser Asp Gly Gln Val Lys Ala Phe Glu Arg Ala Tyr Ala Asp Ala
325 330 335
Ala Met His Asp Glu His Phe Gly Pro Asp Asn Ile Glu Val Ile Glu
340 345 350
Cys His Ala Thr Gly Thr Pro Leu Gly Asp Lys Val Glu Leu Thr Ser
355 360 365
Met Glu Arg Phe Phe Asn Asp Lys Leu Asn Gly Ser His Thr Pro Leu
370 375 380
Ile Gly Ser Ala Lys Ser Asn Leu Gly His Leu Leu Thr Ala Ala Gly
385 390 395 400
Met Pro Gly Ile Met Lys Met Ile Phe Ala Met Arg Gln Gly Met Leu
405 410 415
Pro Pro Ser Ile Asn Ile Ser Ser Pro Ile Thr Ser Pro Asn Gln Met
420 425 430
Phe Gly Pro Ala Thr Leu Pro Asn Asp Val Leu Pro Trp Pro Asp Lys
435 440 445
Ala Gly Asn Arg Ala Arg His Ala Gly Val Ser Val Phe Gly Phe Gly
450 455 460
Gly Cys Asn Ala His Leu Leu Ile Glu Ser Tyr His Gly Gln Thr Ser
465 470 475 480
Thr Ala Pro Ala Ala Asn Thr Ile Asn Ala Gln Leu Pro Met His Ile
485 490 495
Thr Gly Met Ala Ser His Phe Gly Pro Leu Asn Asn Ile Asn Arg Phe
500 505 510
Ala Asn Ala Ile Asn Gln Gln Gln Thr Ala Phe Thr Pro Leu Pro Ala
515 520 525
Lys Arg Trp Lys Gly Leu Asp Lys His Pro Glu Leu Leu Gln Gln Leu
530 535 540
Gly Leu Ala Gln Thr Pro Pro Thr Gly Ala Tyr Ile Asp Gln Phe Asp
545 550 555 560
Phe Asp Phe Leu Arg Phe Lys Val Pro Pro Asn Glu Asp Asp Arg Leu
565 570 575
Ile Ser Gln Gln Leu Leu Leu Met Lys Val Ala Asp Glu Ala Ile His
580 585 590
Asp Ala Lys Leu Ala Ser Gly Ser Lys Val Ala Val Leu Val Ala Met
595 600 605
Glu Thr Glu Leu Glu Leu His Gln Phe Arg Gly Arg Val Asn Leu His
610 615 620
Thr Gln Ile Ala Ala Ser Leu Asn Ala His Gly Val Ser Leu Ser Asp
625 630 635 640
Asp Glu Tyr Gln Ala Leu Glu Thr Leu Ala Met Asp Ser Val Leu Asp
645 650 655
Ala Ala Lys Leu Asn Gln Tyr Thr Ser Phe Ile Gly Asn Ile Met Ala
660 665 670
Ser Arg Ile Ser Ser Leu Trp Asp Phe Asn Gly Pro Ala Phe Thr Ile
675 680 685
Ser Ala Gly Glu Gln Ser Val Asn Arg Cys Ile Asp Val Ala Gln Asn
690 695 700
Leu Leu Ala Met Glu Ser Arg Gln Glu Pro Leu Asp Ala Val Ile Ile
705 710 715 720
Ala Ala Val Asp Leu Ser Gly Ser Ile Glu Asn Ile Val Leu Lys Thr
725 730 735
Ala Ser Leu Ala Lys Thr Gly Gln Leu Leu Pro Leu Ser Ile Gly Glu
740 745 750
Gly Ala Gly Ala Ile Val Leu Gln Val Ala Asp Gln Thr Ala Thr Asp
755 760 765
Ser Glu Pro Leu Asp Leu Ile His Gln Ala Leu Gly Ala Val Asp Thr
770 775 780
Pro Ser Ala Ala Ile Ser Gly Ser Thr Glu Arg Ile Ser Ser Asp Ser
785 790 795 800
Leu Asn Ser His Gly Ala Leu Asn Ser Tyr Ala Thr Ile Asn Ser Leu
805 810 815
Ser Phe Gly His Ile Ser Gln Leu Glu Ala Ile Ser Asp Glu Leu Leu
820 825 830
Thr Pro Ala Gly Leu Ser Thr Ser Asp Ile Gly Lys Leu Glu Leu Asn
835 840 845
Gln Ala Pro Asp Leu Thr His Ile Asp Ser Ala Gln Ala Leu Ser Gln
850 855 860
Leu Tyr Ser Gln Ser Ala Thr Thr Gln Ala Lys Ser Cys Ile Gly His
865 870 875 880
Thr Phe Ala Ala Ser Gly Met Ala Ser Leu Leu His Gly Leu Leu Ile
885 890 895
Gln Lys Gln Asp Ala His Ser Asn Gln Thr Val Gln Pro Leu Asn Thr
900 905 910
Leu Val Ala Thr Leu Ser Glu Asn Gln Cys Ser Gln Leu Leu Met Ser
915 920 925
Gln Thr Ala Glu Gln Ile Ser Ala Leu Asn Ser Arg Ile Asn Thr Asp
930 935 940
Ile Gly Gln Gln Thr Ala Lys Lys Leu Ser Leu Val Lys Gln Val Ser
945 950 955 960
Leu Gly Gly His Asp Ile Tyr Gln His Ile Val Asp Thr Pro Leu Ala
965 970 975
Asp Ile Asp Asn Ile Arg Ala Lys Thr Ala Asn Leu Ile Pro Ala Val
980 985 990
Thr Asn Thr Thr Thr Asn Met Leu Glu Arg Gly Gln Phe Val Ser Pro
995 1000 1005
Gln Leu Thr Pro Leu Ala Pro Met Phe Asp Lys Asn Asn Ala Met
1010 1015 1020
Thr Thr Glu Thr Ser Met Pro Phe Ser Asp Arg Ser Thr Gln Phe
1025 1030 1035
Asn Pro Ala Pro Lys Ala Ala Ala Leu Asn Ala Lys Asp Ser Ala
1040 1045 1050
Lys Ala Asn Ala Asn Val Lys Ala Asn Val Thr Thr Ala Asn Val
1055 1060 1065
Thr Thr Ala Asn Gln Val Pro Pro Ala His Leu Thr Ala Phe Glu
1070 1075 1080
Gln Asn Gln Trp Leu Ala His Lys Ala Gln Leu Ala Phe Leu Asn
1085 1090 1095
Ser Arg Glu Gln Gly Leu Lys Val Ala Asp Ala Leu Leu Lys Gln
1100 1105 1110
Gln Val Ala Gln Ala Asn Gly Gln Pro Tyr Val Ala Gln Pro Ile
1115 1120 1125
Ala Gln Pro Thr Ala Ala Val Gln Ala Ala Asn Val Leu Ala Glu
1130 1135 1140
Pro Val Ala Ser Ala Pro Ile Leu Arg Pro Asp His Ala Asn Val
1145 1150 1155
Pro Pro Tyr Thr Ala Pro Thr Pro Ala Asp Lys Pro Cys Ile Trp
1160 1165 1170
Asn Tyr Ala Asp Leu Val Glu Tyr Ala Glu Gly Asp Ile Ala Lys
1175 1180 1185
Val Phe Gly Pro Asp Tyr Ala Val Ile Asp Asn Tyr Ser Arg Arg
1190 1195 1200
Val Arg Leu Pro Thr Thr Asp Tyr Leu Leu Val Ser Arg Val Thr
1205 1210 1215
Lys Leu Asp Ala Thr Met Asn Gln Tyr Lys Pro Cys Ser Met Thr
1220 1225 1230
Thr Glu Tyr Asp Ile Pro Glu Asp Ala Pro Tyr Leu Val Asp Gly
1235 1240 1245
Gln Ile Pro Trp Ala Val Ala Val Glu Ser Gly Gln Cys Asp Leu
1250 1255 1260
Met Leu Ile Ser Tyr Leu Gly Ile Asp Phe Glu Asn Lys Gly Glu
1265 1270 1275
Arg Val Tyr Arg Leu Leu Asp Cys Thr Leu Thr Phe Leu Asp Asp
1280 1285 1290
Leu Pro Arg Gly Gly Asp Thr Leu Arg Tyr Asp Ile Lys Ile Asn
1295 1300 1305
Asn Phe Ala Lys Asn Gly Asp Thr Leu Leu Phe Phe Phe Ser Tyr
1310 1315 1320
Glu Cys Phe Val Gly Asp Lys Met Ile Leu Lys Met Asp Gly Gly
1325 1330 1335
Cys Ala Gly Phe Phe Thr Asp Gln Glu Leu Asp Asp Gly Lys Gly
1340 1345 1350
Val Ile Arg Thr Asp Asp Glu Ile Lys Leu Arg Glu Thr Ala Leu
1355 1360 1365
Asn Asn Pro Asn Lys Pro Arg Phe Glu Pro Leu Leu His Cys Ala
1370 1375 1380
Gln Thr Glu Phe Asp Tyr Gly Gln Ile His His Leu Leu Asn Ala
1385 1390 1395
Asp Ile Gly Gly Cys Phe Ala Gly Glu His His Asn His Gln Gln
1400 1405 1410
Ala Ser Gly Lys Gln Asp Ser Leu Cys Phe Ala Ser Glu Lys Phe
1415 1420 1425
Leu Met Ile Glu Gln Val Gly Asn Leu Asp Val His Gly Gly Ala
1430 1435 1440
Trp Gly Leu Gly Phe Ile Glu Gly His Lys Gln Leu Ala Pro Asp
1445 1450 1455
His Trp Tyr Phe Pro Cys His Phe Lys Gly Asp Gln Val Met Ala
1460 1465 1470
Gly Ser Leu Met Ala Glu Gly Cys Gly Gln Leu Leu Gln Phe Phe
1475 1480 1485
Met Leu His Ile Gly Met His Thr Leu Val Glu Asn Gly Arg Phe
1490 1495 1500
Gln Pro Leu Glu Asn Ala Ser Gln Lys Val Arg Cys Arg Gly Gln
1505 1510 1515
Val Leu Pro Gln His Gly Glu Leu Thr Tyr Arg Met Glu Ile Thr
1520 1525 1530
Glu Ile Gly Ile His Pro Arg Pro Tyr Ala Lys Ala Asn Ile Asp
1535 1540 1545
Ile Leu Leu Asn Gly Lys Ala Val Val Asp Phe Gln Asn Leu Gly
1550 1555 1560
Val Met Ile Lys Glu Glu Ser Glu Cys Thr Arg Tyr Leu Asn Asp
1565 1570 1575
Thr Pro Ala Val Asp Ala Ser Ala Asp Arg Ile Asn Ser Ala Thr
1580 1585 1590
Asn Asn Ile Leu Tyr Pro Ala Ala Ser Thr Asn Ala Pro Leu Met
1595 1600 1605
Ala Gln Leu Pro Asp Leu Asn Ala Pro Thr Asn Lys Gly Val Ile
1610 1615 1620
Pro Leu Gln His Val Glu Ala Pro Ile Ile Pro Asp Tyr Pro Asn
1625 1630 1635
Arg Thr Pro Asp Thr Leu Pro Phe Thr Ala Tyr His Met Phe Glu
1640 1645 1650
Phe Ala Thr Gly Asn Ile Glu Asn Cys Phe Gly Pro Asp Phe Ser
1655 1660 1665
Ile Tyr Arg Gly Phe Ile Pro Pro Arg Thr Pro Cys Gly Asp Leu
1670 1675 1680
Gln Leu Thr Thr Arg Ile Val Asp Ile Gln Gly Lys Arg Gly Glu
1685 1690 1695
Leu Lys Lys Pro Ser Ser Cys Ile Ala Glu Tyr Glu Val Pro Thr
1700 1705 1710
Asp Ala Trp Tyr Phe Ala Lys Asn Ser His Ala Ser Val Ile Pro
1715 1720 1725
Tyr Ser Val Leu Met Glu Ile Ser Leu Gln Pro Asn Gly Phe Ile
1730 1735 1740
Ser Gly Tyr Met Gly Thr Thr Leu Gly Phe Pro Gly Glu Glu Leu
1745 1750 1755
Phe Phe Arg Asn Leu Asp Gly Ser Gly Glu Leu Leu Arg Asp Val
1760 1765 1770
Asp Leu Arg Gly Lys Thr Ile Val Asn Asp Ser Lys Leu Leu Ser
1775 1780 1785
Thr Val Ile Ala Gly Ser Asn Ile Ile Gln Ser Phe Thr Phe Asp
1790 1795 1800
Leu Ser Val Asp Gly Glu Pro Phe Tyr Lys Gly Ser Ala Val Phe
1805 1810 1815
Gly Tyr Phe Lys Gly Asp Ala Leu Lys Asn Gln Leu Gly Ile Asp
1820 1825 1830
Asn Gly Arg Ile Thr Gln Pro Trp His Val Glu Asn Asn Val Pro
1835 1840 1845
Ala Asp Ile Thr Val Asp Leu Leu Asp Lys Gln Ser Arg Val Phe
1850 1855 1860
His Ala Pro Ala Asn Gln Pro His Tyr Arg Leu Ala Gly Gly Gln
1865 1870 1875
Leu Asn Phe Ile Asp Lys Ala Glu Ile Val Asp Lys Gly Gly Lys
1880 1885 1890
Asn Gly Leu Gly Tyr Leu Ser Ala Ser Arg Thr Ile Asp Pro Ser
1895 1900 1905
Asp Trp Phe Phe Gln Phe His Phe His Gln Asp Pro Val Met Pro
1910 1915 1920
Gly Ser Leu Gly Val Glu Ala Ile Ile Glu Leu Met Gln Thr Tyr
1925 1930 1935
Ala Ile Ser Lys Asp Leu Gly Lys Gly Phe Thr Asn Pro Lys Phe
1940 1945 1950
Gly Gln Ile Leu Ser Asp Ile Lys Trp Lys Tyr Arg Gly Gln Ile
1955 1960 1965
Asn Pro Leu Asn Lys Gln Met Ser Leu Asp Val His Ile Ser Ala
1970 1975 1980
Val Lys Asp Glu Asn Gly Lys Arg Ile Ile Val Gly Asp Ala Asn
1985 1990 1995
Leu Ser Lys Asp Gly Leu Arg Ile Tyr Glu Val Lys Asp Ile Ala
2000 2005 2010
Ile Cys Ile Glu Glu Ala
2015
<210> 73
<211> 542
<212> PRT
<213> Sh. japonica
<400> 73
Met Thr Ile Ser Thr Gln Asn Glu Lys Leu Ser Pro Trp Pro Trp Gln
1 5 10 15
Val Ala Pro Ser Asp Ala Ser Phe Asp Thr Ala Thr Ile Gly Asn Lys
20 25 30
Leu Lys Glu Leu Thr Gln Ala Cys Tyr Leu Val Ser His Pro Glu Lys
35 40 45
Gly Leu Gly Ile Ser Gln Asn Ala Gln Val Met Thr Glu Ser Ile Asn
50 55 60
Ser Gln Gln Asp Leu Pro Val Ser Ala Phe Ala Pro Ala Leu Gly Thr
65 70 75 80
Gln Ser Leu Gly Asp Ser Asn Phe Arg Arg Val His Gly Val Lys Tyr
85 90 95
Ala Tyr Tyr Ala Gly Ala Met Ala Asn Gly Ile Ser Ser Glu Glu Leu
100 105 110
Val Ile Ala Leu Gly Gln Ala Gly Ile Leu Cys Ser Phe Gly Ala Ala
115 120 125
Gly Leu Ile Pro Ser Arg Val Glu Gln Ala Ile Asn Arg Ile Gln Thr
130 135 140
Ala Leu Pro Asn Gly Pro Tyr Met Phe Asn Leu Ile His Ser Pro Ser
145 150 155 160
Glu Pro Ala Leu Glu Arg Gly Ser Val Glu Leu Phe Leu Lys His Lys
165 170 175
Val Arg Thr Val Glu Ala Ser Ala Phe Leu Gly Leu Thr Pro Gln Ile
180 185 190
Val Tyr Tyr Arg Ala Ala Gly Leu Ser Arg Asp Ala Gln Gly Glu Val
195 200 205
Val Ile Ala Asn Lys Val Ile Ala Lys Val Ser Arg Thr Glu Val Ala
210 215 220
Ser Lys Phe Met Gln Pro Ala Pro Ala Lys Met Leu Gln Lys Leu Val
225 230 235 240
Asp Glu Gly Leu Ile Thr Pro Glu Gln Met Ala Leu Ala Gln Leu Val
245 250 255
Pro Met Ala Asp Asp Val Thr Ala Glu Ala Asp Ser Gly Gly His Thr
260 265 270
Asp Asn Arg Pro Leu Val Thr Leu Leu Pro Thr Ile Leu Ala Leu Lys
275 280 285
Asp Lys Ile Gln Ala Glu Tyr Gln Tyr Lys Thr Pro Ile Arg Val Gly
290 295 300
Cys Gly Gly Gly Val Gly Thr Pro Asp Ala Ala Leu Ala Thr Phe Asn
305 310 315 320
Met Gly Ala Ala Tyr Ile Val Thr Gly Ser Ile Asn Gln Ala Cys Val
325 330 335
Glu Ala Gly Ala Ser Glu His Thr Arg Lys Leu Leu Ala Thr Thr Glu
340 345 350
Met Ala Asp Val Thr Met Ala Pro Ala Ala Asp Met Phe Glu Met Gly
355 360 365
Val Lys Leu Gln Val Val Lys Arg Gly Thr Leu Phe Pro Met Arg Ala
370 375 380
Asn Lys Leu Tyr Glu Ile Tyr Thr Arg Tyr Glu Ser Ile Glu Ala Ile
385 390 395 400
Pro Ala Glu Glu Arg Glu Lys Leu Glu Lys Gln Val Phe Arg Ser Thr
405 410 415
Leu Asp Asp Ile Trp Ala Gly Thr Val Ala His Phe Asn Glu Arg Asp
420 425 430
Pro Lys Gln Ile Glu Arg Ala Glu Gly Asn Pro Lys Arg Lys Met Ala
435 440 445
Leu Ile Phe Arg Trp Tyr Leu Gly Leu Ser Ser Arg Trp Ser Asn Ser
450 455 460
Gly Glu Ala Gly Arg Glu Met Asp Tyr Gln Ile Trp Ala Gly Pro Ala
465 470 475 480
Leu Gly Ala Phe Asn Glu Trp Ala Lys Gly Ser Tyr Leu Asp Asp Tyr
485 490 495
Thr Gln Arg Asn Ala Val Asp Leu Ala Lys His Leu Met His Gly Ala
500 505 510
Ala Tyr Gln Ala Arg Val Asn Leu Leu Thr Ala Gln Gly Val Ala Leu
515 520 525
Pro Val Glu Leu Gln Arg Trp Ser Pro Leu Asp Gln Val Lys
530 535 540
<210> 74
<211> 303
<212> PRT
<213> Sh. japonica
<400> 74
Met Ser Tyr Cys Tyr Tyr Lys Cys Glu Phe Gly Leu Ser Pro Leu Pro
1 5 10 15
Thr Ile Gln Leu Phe Phe Cys Pro Leu Asp Thr Asn Leu Leu Asp Glu
20 25 30
Lys Thr Val Ser Thr Val Arg Ser Trp Leu Ser Asp Ala Glu Ile Asn
35 40 45
Lys Val Asp Arg Phe Ile Gln Gln Ala Ala Gln Gln Gln Gly Leu Met
50 55 60
Val Arg Gly Tyr Leu Arg Ser Val Leu Ser Asn Phe Ala Asn Ile Glu
65 70 75 80
Pro Asp Asp Trp Gln Phe Glu Tyr Gly Glu Lys Gly Lys Pro Arg Leu
85 90 95
Ser Ala Val Gln Tyr Lys Gln Thr Gly Leu Gln Phe Asn Leu Ser His
100 105 110
Ser Gly Asn Trp Leu Leu Ile Gly Val Ile His Ser Lys Glu Asp Ala
115 120 125
Ser Met Pro Ile Gln Leu Gly Val Asp Ile Glu Arg Arg Arg Glu Ser
130 135 140
Thr Asn Ile His Ser Ile Leu His His Tyr Phe Ser Lys Pro Glu Glu
145 150 155 160
Thr Ala Leu Leu Ala Leu Pro Glu Ser Gln Gln Arg Glu Arg Phe Phe
165 170 175
Asp Leu Trp Ala Leu Lys Glu Ser Tyr Ile Lys Ala Lys Gly Leu Gly
180 185 190
Leu Ala Leu Ser Leu Lys Ser Phe Ala Phe Asp Leu Ser Ala Pro Ser
195 200 205
Leu Ala Asn Leu Thr Ile Asp Asp Gln Leu Leu Pro Ile Gln His Asp
210 215 220
Ile Ser Leu Ser Leu Leu Lys Pro Thr Asp Val Asp Glu Leu Glu Gln
225 230 235 240
Thr Asn Asp Val Glu Ser Phe Tyr Glu Val Ser Pro Leu Trp Gln Cys
245 250 255
Cys Leu Gly Lys Leu Asn Asn Ser Tyr Arg Phe Ala Val Ser Val Gly
260 265 270
Glu Phe Ala Phe Gly Glu Lys Pro Leu Thr Leu Gln Leu Lys Ala Lys
275 280 285
Lys Ile Ser Trp His Glu Gln Ile Lys Met Phe Ile Lys Thr Asn
290 295 300
<210> 75
<211> 38794
<212> DNA
<213> Sh. olleyana
<400> 75
gatccagtgt tattcaacca aattgaagca ttgaatactc cttatccttt tccaattcaa 60
ggccatgctc aattcgccat cgtgttttgg cgagaagatg agataccgtt tatttggttt 120
ttaaagcttc cgcttgatga acaagggtta ttgtctccag ctcaacgtag ccaattcatc 180
aaaatgatcc tcgaagcctt aggccgagat cctaccaaag cgctttctga tgaagaacaa 240
gagcgttatg ctaatcatcc gttcagcttc aaaccgagtc aggagaagct agccttattt 300
aacgcattag taaaaaaaca gttaagccaa caagcctcgg cgcagtacga atatgctgct 360
cagtactttg aaaatttgaa tgaaaaaaac gctcaagatg acagctggca gcaactgggt 420
ttacaaggca tcgccgatgt ctgtgtccgc ttagataagt ttgaccatga taagcatatt 480
aatacggcaa tgaagcttgc tcccttagaa gtacaagccg caatttgcca atgtttagaa 540
catgttgctg tttcaaatac attagctgaa accttatacg ataatttgtc atctgctgaa 600
gtggaacata aacatatcta ccttcgcgct cttgcttcac agcctgaatt gactcaaaaa 660
gcgattcagc aactggttaa tttacagcaa ctcgatgaga atttattaat cactattgca 720
gcaagaagtt ggacggcttt aaaagatgat gcaactcgca aactttatct tgaagtctta 780
gctaaccaac cacaaaactt ctttaatcaa gtttttgctg atatcgtagc tattccaagt 840
ctacggaact cactgctact tgatttaaga agtgctgatc gtagtgaaaa actttcttcc 900
gccatcggcg gattatttag ggccgttagc caatgatgtc agactttatt ttaatcgttg 960
ctgttgtggt tgttgctgca ttcttttggc agttacgcca gatggctgaa atcagtcgcc 1020
gatatgctga gagatcttgt gccaatcaaa aagtacaatt actcgcgatt gcgatggaat 1080
cagctagacc tagtattggc ggttcaacag gtttatgttg gcgagcaaaa tttatgtttg 1140
aattcagcac cgatggtatt aaccaatacc gcggtcatat caacatgcac agcaaaaaaa 1200
tagagaaaat taattggcct attttccctg agcccgaatg gatggatgcg ccaatggcaa 1260
aaggcaaatt cggtggttgt ggcggcgcat cgagctgtaa ctcaggtaag tgtcgttaag 1320
cctcaacaac tgcctaatca gtgagtcatt gtagagttaa tgtcactcgt atttactcaa 1380
aatatagtta caacaaaact gattattatc gtaataaaat aagcgctatt aggagaaatt 1440
cactcttaat ggcgtttttt attggctaag tgattttttg tacgattgtt ggaaaacaca 1500
caagtcaaaa aatacttcac gtatggttat atatttagcc caaaagaaag accgcggcaa 1560
taaattgtcg cggcctcttg tacttttgtt aagccatcca gctatatctg tgctccctgc 1620
accatccatg cgtctaactt gctccgtgcg ctatccttat tctatccttg atgttccatg 1680
tacatttaag tactgtcctt cttactcgat tatcctttga ccgagcctgc tcaaatcctt 1740
aagcgtgtcc tttaattcgt ccgtggtttt cttccatgac atccttgatt caatttactg 1800
catccattgc aatcactgtt ttccttaaca gctcaaatcc attttattga tgtccaattt 1860
ataaaatcca tttaaccata aagtctttca tcatcttcga tgtcagtgtc atccataaac 1920
actatcgttt tccttaacga cgctttatcg tccacttaat taatgtgcct tagtcatcat 1980
cctgatgagc aacaacaata attaaggttc atcctgagca agccagcaca ataatctatt 2040
gtaacgctct gttgtaacaa tctcatgtta caaccacctg caaaaatcct attcagctgc 2100
agtctgaatt caaactgcta aacacttcct gtgcttattt gcttccttgt gattaatttt 2160
aatcgatatg tgagcaaata aatatgcaca aaacacacaa ttaacatcaa cccaacaaac 2220
aagcttggca cccataaaat taaactattt aaatacagta acttaaataa aaacacttca 2280
acatcgttat ggttaaagcg tttaatctca caacttttgt gagatatatc tcacaaagag 2340
tataggaaag acagaaggta agtcttttgg cctattcaca catttaacat ttgttaggta 2400
aaagtgcata aatattgatt tgaactgaac ataaaaaagc ccgaccttat aaataaggtc 2460
aggctcattt tactctttgt tagctatcct gctaaattgt gctccctgct ccatccatgc 2520
gactatatgt gcttcctgct ccatttatcc atttcaactc aatttccttg tattgcccca 2580
aatagagcat tacatgagtt ttcattcctt tgaatcagtc tatccatttg actgaaagtc 2640
ttactcctag atataccatc ctggtatttg cttcctgcaa tccttcatct tcctgatgag 2700
ggtcatcctt gtttcagtta atcattaact gagcttatgc ccattccttg agcgtgtcct 2760
tgtttcatcc tgaattggtt gttactcacc cagcatttac tcgataaata actaaattca 2820
cttaagcagc aatattcact taaaccaaat agttaattaa ctgttcttgt cttgcggcta 2880
cttcctgtaa ctcactaagt taatatattg attgcttaat gagttcattg taataaatgg 2940
atgaaataga gataggtaaa aaacgagcag aaacaaaaac ttcacaaacc tgaaattcag 3000
accaaaaact caagcacttg ttttatatcc acaaattaat aaaaaagtaa gatattgagt 3060
atttgggcta aacgaatacc tacatcaatg tgagataagt ctcacaaacg gaagtaacag 3120
ttagcttgaa taatttccca acttaaactg tttttttaac atttgtgcaa acatcaccca 3180
atcagctaat agactataaa acgggtactc gaatgttgct ggtcggtttt tctcaaacac 3240
aaaatggcca acccacgcaa aaccatagcc aatcacgggt aaaagccaca attgccacca 3300
ctgctgatta atgagcgtta taacaatcaa tattatgatt aatccacttc caacataatg 3360
cagccttcta caagtggcat cttgatgttg tgataaatag aaagggtaaa aagatttaaa 3420
gtcttggtat tttttttcgc tcatcttatc gtctccactt atatattatt gtttttgaga 3480
aagatgctaa acagaactgt agacaacata tggttcacaa aatgacagtt ttatttactt 3540
ggataaatga gaatttcacc atcgacactg ccaattgtta attcagacaa atgattaaag 3600
ccttcacgag caaataattc tgcatgctta gggttattca cgaaaacacc gataccatca 3660
agttctggct gctcatcaca ccaacttaac actgcctgga tcagcttagc gccattacct 3720
ttactttgct caattggcga taaagcaata aattgcaaaa taccatactg cttactcggc 3780
aagctttcta agatactgtg ctcttttttc atgagcgctt gggtcgagtt ccaaccggta 3840
cctaacacca ttttcaaacg ccaatgccaa taacggctct cacctaatgg cacttgatga 3900
gttatgacac aggcgactcc aatgagcctt tcaccatcga accagccaat taaaggttgt 3960
tcttgttgcc aaagttccgt taactcctcg cgaatagagg cacgtagttt ctgctcgtaa 4020
ctagcttggt tagtagtagc aagagcttca ataaagaaag gatcatcatg gtaagcgtta 4080
taaataattg atgcagccac gcgtaaatct tctgcagtta aataaacagc tctgtgttct 4140
tctaacgtgt tttgttccat gtttacactc tttactaaac caagttaata gttacaactt 4200
aacaagttta aaacatattg caattttaat gctgtcacct aggcttaaag atatctcgat 4260
agccaagtac acgataaatt ggggatgaaa atggatacaa cttcagcaac acttgctcac 4320
ttgtttgaac agctaggatt ggattcatca gatgctggaa taagcgtttt tctatcgcaa 4380
cataccatca aagcaagtac aaatttaact gaggctgact tttggaataa tgctcaaaga 4440
gcatttttag aagagagttt aaaagatgac gcccagtggt cagaactggt agaccaactg 4500
gacgttttgt taaggcaata gccacaagct tttaataagg caattgccaa aagcaaaggc 4560
cactctttga aacacattaa aaagtgacag tgcttaatag tttatttaaa ttttttgata 4620
cgcagtgtca ccccaaccca ctagcttatt atcactaatg acaaccggcg tacactcatc 4680
ttttgtggtc ttgccgtcac ctttactcca ttgagtacga taaaagagta cgtttacttc 4740
ttttttcggg ctttcggcgt ctgcctgagt aacgtatgcc tcactaaaat ctgcagttcc 4800
cattaatata gtgacttgat ctctcgccat acccatagtg agttttgata aattggctct 4860
gttagtttgt tgctgtgttt cccaataaga atcactatgg ttaccttcgc tgccaccaac 4920
atgaaataca caaccactta atgtaaggct acttgcagcc attaaaaatg ctaaacccaa 4980
ttttgttttc atgatacttc cttattatta aaatgattct cacgtaattt ctactcaaac 5040
tgcttttgag atacgttata atgttgtcta ttatcattaa gctaaaaaca tgccaaagtt 5100
tatacttttg attttattga atattattta atgaacatta ataagtaagt attttcacta 5160
atccatattg aggattttca ccaattatga gtccaatcga acaagtcctc gctgcagcga 5220
aaaccattgc attgaatggc catacaccga cgatggcatt agttaaaggt aagctcggtg 5280
gcaaagtgcc catgcctttg cttatccaag ggttacaaca atttaaagct attccgaaag 5340
accaatggca aactctgcct gacttaggtg attcacttga atcaaataag cctgcagcca 5400
acacagatac ccaagccata gaacaaaagc tactgactca aatgcagcaa atgaaaaccg 5460
aatttgaaag caaaatttcg ttattagaac aacgtattgc ccaacttgaa aacaaagcgt 5520
aaatacataa ataactgtcg ttagcgctgt taatcattgg cacgattgac tactagtacg 5580
attaaccact gcctaataac gctgacgcat cgcgcttata accccaaagt taaacggaac 5640
cccatgtttg tcacagagct aagatttgaa tgttttgcgg ataccacaat caccgcagcc 5700
gaaaaagcca ttaaccatta cctcgaatct ttgcgagcca acggccaagc cttgggaaga 5760
gaatttgccg tcgcatttaa tgaaggtgag tttaaagtta ggttattaat gccagaaaaa 5820
accagtctat cgactcgtca taatagtcct tggacgaaac aagcgttaaa ccagctcacc 5880
gaagctaaat tacttgcccc tcgtgaaaag tttattggcc aagatatcaa ctctgaagtc 5940
agtaattcag aaacacctag ctggcaggtg ctttatacta gctacgttca tatgtgctcg 6000
cctataagaa gtggcgataa cttgttgcct attccgcttt atcagatccc agccagcttt 6060
aatggcgatc ataaacgggt tatccgctgg caaacagaat ggcaagcttg tgatgaatta 6120
caaatggctg cagccacaaa agccgaattt gccgctttag aagagattac ctcccataaa 6180
agtgacttat tcagacgagg ttgggacata cgcggtagag ttgaattcat cactaagata 6240
ccgacttact attatctata ccgagtaggc ggcgacagtt tagctagtga aaaagagcgt 6300
gcctgccctc gttgtggttc taaagaatgg cgtttagatg aaccattact cgatatgttc 6360
catttcagat gtgagccttg ccgcatagta tctaacatct cttgggatca tcaataagtt 6420
gttatgaaat ccaaataata aagccagaca tttgtctggc tttattataa ttaatcattc 6480
atcaactgat taaattaaga cttcttacct ttaatcaaat cagcccacat cattttcatg 6540
cgttgccaaa tgcctgggtg cgcgacatag ttatcttcaa caataggttc aacaggtggc 6600
atcacgcgcg gggttaatcc atcaataaac tcagctaaac tgtcagcgag tttatcttta 6660
ggcttatcac caggaatttc aatccacaca ctgccatctt cgttatcaac agtaatcatt 6720
tgatcgccat cacctaatac gccaacaaac caagtgggtg cttgtttgag ctttttcttc 6780
ataatcagat gaccaatcac attttgttgc aaagattcaa agtcttgctg attccaaact 6840
tgcaatagct caccttctcc ccaagttgaa tcaaaatata aaggcgcaga aaaatattcg 6900
ccataaaacg catttatatc ttggtgcaac ttaagctcta aagcatgttc tacattactg 6960
aaatttgagc tatttttacg tttaatcgct ttccaaaaaa ccgcatcatc tgaatcaaga 7020
tcatacttac cttcaataca ggcggatcct tgcccaagtg ggaaataacg gggaaactcg 7080
cctaatacat cctgataagc ttgaaaataa cggctagaaa aatgatccaa tgaagttgaa 7140
caagacactt aagatgctcc aattttgggt tataatataa gtctattttg acacggaaac 7200
agactagatg acacacaatc acgatcccta tagtgatgca gatgcactta aaggactgac 7260
tttaggtcaa acgacacaat atcaagcaga atatgatgct tcactgctac aaggggttcc 7320
tcgtaaactc aatcgtgatg ccatagcatt aaccgattcg ctcccttttc agggcgcaga 7380
tatctggacc ggctatgaat tatcttggct aaatgccaaa ggcaaaccaa tggttgccat 7440
tattgaagtt tacctcgcta tcgaaagtga taatttaatc gaatctaaat cgtttaaact 7500
gtatctcaac agctttaacc aaacacgttt tgagtcagtt gagcaggtac agcaaacatt 7560
agtcactgac ttaagccatt gtgctaatgg cgaagtgaca gttaaagtga ttgaacctaa 7620
acattttaat actcaacgta ttgtcgaatt accaggtaat tgtatcgacg aacttgatat 7680
tgaagtggat gactacgagt ttaatcctga ctatctacaa gacagtactg aagataaaaa 7740
cgttgtcgaa acagtcacat ctaacttatt gaaatcaaac tgtcttatta cctctcagcc 7800
agattggggt agtgtcatga tccgttatca agggcctaaa attaatcatg agaagttgct 7860
tcgctacttg atttctttcc gccaacataa cgaattccat gagcagtgtg ttgaacgtat 7920
atttactgac ttaaaacgct actgtaactg cactaaacta acggtatatg cccgttatac 7980
tcgacgtggc ggtttagaca ttaatccttt cagaagtgat tttgaacaac cacctgaaac 8040
ccatcgttta gcaagacagt aatgggtttc taataataaa aagcctgcaa ttgcaggctt 8100
ttatattgtt tatagtcggc actaaaattt ttacgcataa tgcccaataa tagccgctaa 8160
atcatctacc gtattggcaa tatgatcagg tttaacatgc cagctttctg gctctgattg 8220
gctataagct gctgcaacag aaatgacctt ggcatcgctg cctaattcta attgcaaatt 8280
acgggcaaat tgtgcatccg cttcatgatc cccgatgtac atcagtaagt tactatttgc 8340
gtgacccagt attgattcaa cacatttcag gccgccgaat gggtgtggtt tttgattacc 8400
gttaggtaca tcgtcatagc caataatcgc tttaaacggt gcaccaattt cattgctatt 8460
gagaacacgg cgaatattat tttgcgaatt ttgcgaacag atcccgtgat caaaatgaga 8520
aaactgttca acaaccccct taatgccgtc aaatagcatg acttctgttt cattcttttc 8580
ttgaaactca gcccacatgc ttccagcttg aagcatttca ttttcagtta acccatagta 8640
atcaacatag agttgctgcc aatttttagc accatgatta gcttcatggt aattagcttc 8700
gcttagtaag tacttaggca agttttcgcc agttaaatgc ggtgcaacga tagacagtat 8760
tgctttggtg atatcaatat ttttcggtac agaattgact agagttccat cataatccca 8820
aagtattgcg tctaatttca ttgcatcatc tcattgttta ataaacggta ttaaggagta 8880
cactgttggt gtaaaaagtg gctcagatga atctcgttaa atacctttaa attatgtaac 8940
gagaaatctg gcgattaaaa taagcttcat cgtgttaaaa aacaactgtt atcacctcag 9000
tctgagctac ctgttaagtt tttactgctc gcgtcatcat cttaaaaaat tggttaaaac 9060
tgacttcatg agggttcagt gcatctcctg caaatggacc atataataag gaaccgtata 9120
atatagcctc attgaggttt atagattaag agcaataaca ctactcatgc caaaaccaac 9180
ctgtttaacg gaattaaatc aagagtcgct caatgactct caagagcatc agcactttaa 9240
aatatttaaa ccttatggat ttttgagcca gtttgttcct gaaacacgaa agaaaaagca 9300
cttacttgca gagctctcaa acttccccga aaaaaccatg gcgattggtc gcttagatca 9360
cgattccgaa ggcttactct tgctcacaac agacggcatg atgagtcata aagtaagaag 9420
caaaggcata gaaaaagagt attacgtgca agtggatggc gatattaacg atgaggctgt 9480
atctctgtta caaaatgggg ttgaaattgg catcaatggc acaaaatatc ttaccctgcc 9540
ttgtaaagca ttcaagctaa acgcagagcc aatgcttccc tcacgcggta aaaaaattcg 9600
cgatccaagg catgggccaa ccagttgggt atcgatcacc ttatgtgaag gtaaaaatcg 9660
tcaaataaga aagatgacag cagcagtagg ttttgcgacc ttaaggctag taagagtcag 9720
aattggcgat attcatattg atgccatgca agcaggcgat gttatttctc tgagcaattt 9780
tgacgcggct attaatagcg ataattaacg gtcactttct agcaaataca ccttttccat 9840
tgctgtttca actaactcac gtaaccactt cgttgccggg tcttgttgat tacgggtcgg 9900
ccaaatgctg taaattgata tcaattggct ttcgaacggt aaatccatca aggttaaatt 9960
aaaagtagat tgatagtttt tagcataggt atatggcgca atgcagattg catcagattt 10020
gctgactccc gataacatgg tgagcaaaga tgatttttcg ccatacatat ggcgttcagg 10080
taaatgctct gtagaaataa tctctgctac tcgctgatta tgtcgatgta atcggtaaaa 10140
caaatgttta gccgtaaaat acgactgctc atcaatacca tttttaaatt gaggatggtt 10200
cgccctcgcg acacaaacga gcttttcggt agcaatttgt ttgctggaaa atgatgcttc 10260
gctcggcgcc acaatatcta acgctaaatc aatatgctgt ttttgaagcg cttgatataa 10320
attaccttca tcaataatcg cttcagtaaa gatgatttca acgcctttat cagccaccga 10380
tttttcaata tcggcctcaa tcaaatcaat aattgattca tttgcactga catgaaaaac 10440
acgttttgat tgctgcgggt caaacacttt aacgctatta atacactgct ctatatcgat 10500
taaagatggt cctaaggttt ggtgcaaatg ttggcctatt gcggtaagag caatacctcg 10560
accttgcctg acaaataact ccgccccaac aagggtttta aagcggttaa ttgcattgct 10620
gacagaagat tgggttagtg aaaggtgctc tgctgcaagt gtaattgatt gataatcaca 10680
tacactacaa aataccctaa caagattaag atcgagctta tgcagctctt gttggctcct 10740
ttcttgttgc agttgttcta attgcaattg ccctaaacct tgcttcactt ttaccacctt 10800
aatacgtcat ttgaacaaat agatttccaa tacaaatgct cattcaagtc attgattctc 10860
gcctaataca ttcacacagt aaatgtatta actattctta gccatagtta tctttgccaa 10920
ttttgttgtt aacttatatt caacaacaat aaatcctaga ggcttacatg agaaaatcat 10980
tacttggttt agcgattacc ctaacgttta ccacccaagc ttttgcagct caacatgaac 11040
acgaccatat cactgttgat taccatggta agcccgcaac tcctatcact gctgaacata 11100
ataagtcagt agcaaaaacc ttaaactttg atgataaagc cgcttttgag cgatttagca 11160
aaaacaaaat cgcctcattt gatgaagcta cagccaaaat tctacgagca gaatttagct 11220
ttattagtga agagttaccg gactctgtaa acccatcatt atatcgtcaa gcacagctga 11280
atatggtgcc aaacggacta tataaagtca caggtggtat ctaccaagtc cgtggtacag 11340
acttatctaa cctaaccctt atccgaggca aaactggctg gattgcttat gatgtattac 11400
tcaccaaaga agcagcgcag caatcgttaa agtttgcttt tgctaactta ccagaaggtc 11460
aggatttacc tgttgtcgcg atgatttact ctcatagcca tgccgaccac tttggcggtg 11520
cccgtggagt gcaggaacta tatcctgatg tgaaagtcta tggttcaaac aatatcacct 11580
cagaaattgt tgatgagaat gttcttgctg gtaacgtgat gagccgccgc gcagcatatc 11640
aatatggcgc cacactgggt aaacacgacc acggtattgt ggatgcagca cttgccaaag 11700
gtttatcaaa aggtgaaatc acttacgtta aacccgacta tgaacttaat cataaaggta 11760
aatgggaaac cttaaccatt gatggtcttg aaatggtatt tatggatgcc tctggcactg 11820
aagccgccag tgaaatgatc acctacattc cgtcaatgaa agcgctatgg tcaggtgaat 11880
taacttatga tggcatgcac aatgtataca ccttaagagg agctaaagta cgcgactctt 11940
taaaatggtc taaagacatt aatgaaatga ttaacgcctt tggtgaagac gtaaacgtat 12000
tatttgcctc tcattcagcg ccagtttggg gcaataaaga ggttaatcat taccttcgca 12060
tgcagcgtga taactatggt ttagttcata accagtcaat gcgtttagcc aatgacggca 12120
tagttattca agatattggc gacgctatca tggagaccat acctcaaaac gttcaagacg 12180
aatggtacac caatggttat cacggcacct atagtcataa tgccaaagct gtatacaaca 12240
tgtacttagg ctactttgac atgaatccag ccaatttaaa tccattaacc actaaagcag 12300
aagcaacaaa atttgttgaa tatatgggcg gtgcagataa cgtggtgaaa aaatcaaaac 12360
atgattttag ccaaggagag tatcgctttg ttgccacagc acttaataaa gtcgttatgg 12420
cagatccaca acacgatgca gcccgagagt tacttgcaga cacctacgaa cagctaggtt 12480
atcaagctga aggggctggg tggcgtaata tttatctcac tggtgctcaa gagttacgag 12540
tgggtattaa gcctggcgcg ccaaagtcgg cctctgctga tgtgatcagc gaaatggaca 12600
tgtcgacctt atttgatttc ttagcagtaa aagtcgacag cattaaagct gcggcacttg 12660
gtaacattac cttgaatgta gtgacacaag atggaagcca aaccaacacc ttatttgttg 12720
agttaagtaa cggtaactta agcaatattg ctgtcgagtc tccaaaacaa gctgatgcaa 12780
ctctgactgt aaataaagct gatgtggttg gcatactatt aggcaagacg aatatgaaag 12840
cgctgatgca atcaggtgcg gcgacaatgg aaggtgacaa acaggctttc gctaaaatcg 12900
cttcgactct agtgcaattt aatcctgact ttgaaatcgt tccattaaag catgctcatt 12960
aattagggct tgttaaatga tgagagtcta gtggctcaga ataaacagtt ttaaaacgaa 13020
acagttttac ctatcagttg gtttgaaggc gtgatttaca acttcaagcc aactgatttt 13080
ttttgctttc agctccggag gtaactcgtc tgaatttgta gacgcacgac ccacactcac 13140
agcaaaacga tacaaatcat caagctttcc taaataacaa tgccactgcg gggcaatgac 13200
aaaatcctct aataaaccat cagagtcact cgcctttagt aagcttaact tgacattttg 13260
ttggatggtg attgtctcac tgttaacttg tagttcaccc acacttgagg cagataaatc 13320
aaacgcaaaa gattttagcg ataaagctag acctaagcct ttcgctttta tataagactc 13380
cttaagcgcc cataaatcaa aaaagcgttc tctgtgttta tcttcagcta aagccagtaa 13440
tgcactctct tctggttttg aaaaatagtg atttagaatc gaatgaatat tcgttgtttc 13500
acgacggcgt tcaatgtcta caccaagttc tatatctgtt tgttgttgag ctgttccata 13560
tgtgtttgcc accccgatta acaaccagtc accactgtga ctcagattaa actgcaaacc 13620
agtttgcgca aactgctccg ccgttaacct cggcttgccc ttctcaccat attcaaattg 13680
ccattgctgc ggctcaacac tagcaaagcg cgataacaca ctgcgtaaat agcctcgcac 13740
cattaaacct tgttctctag atgattgctg aataaaacga tcaacctttt tgacctcatc 13800
ttcaggcagc catgaacgca caatagacgc agtcgattca tctaataaat cagtattaag 13860
gggacagaaa aataattgaa tgacggttgg cggcttcaaa ctaggctcag gctaaattgg 13920
caatgtacca ttgtcgcttg ttttaggaag cgatttcaac aagcaaggtt acttatcgat 13980
atggttgcgg cgttaatacg ctgatgtgtc aacgccaaaa cgtgggttca ctgaactaaa 14040
acagtcttga actaacttta attaatccaa aacaaactta atttacctga tgaaaaaaag 14100
ggttgagcaa tgctcaaccc tctatgggtt ttatcctata acaggcattt aaaaattact 14160
ctgccagtgc ttttactgcc ttttgaggaa gcacatcgta gcggctgaaa tgcatcgaga 14220
attgcccttc gccacctgtc atcgacttaa gccgagtgga gtaattactc acgttagcca 14280
gtggcgcttc aacactcact tccactaaac cattgctact tgcttgggta ccgcaaacga 14340
tacctcttga agaactaata tcccccgtaa tttcacccac atggttttga gccacatgaa 14400
tttgcatatc aacgataggt tctaaaataa ccggctgagc cagttttacc gcttccataa 14460
aggctttttt gcccgccata acaaaagcaa tctcctttga atcgacactg tgatgcttgc 14520
catcaagcaa agttaccttc acatcctgta atgggtatcc acccatttcg cccgctaaca 14580
tggcttcgcg tacacctttc tcaacggctg gaatgtactg ggttggcaca gaaccgccca 14640
ccacttggga gacaaactca aaaccttgtc cacgcgctaa cggttcaact tttaattcaa 14700
cttcgccaaa ttggccagat ccacctgatt gctttttatg acgatatcga tactctgcct 14760
cagccataat ggtttcacgg taagccacag ccggcgtatc agtttccata tccacattaa 14820
ataaattttg cgctttctct aaggcaattt gaaggtgtaa gtcaccttgt ccttgcagca 14880
cggtttgacc ttcagcttcg ttgcgactga tttgtaaact tggatcttcg gccaccagct 14940
tatttaatac ttccgatatt ttctgctcat caccacggcg tttagctgat actgccagac 15000
caaaaatagg ttgcgggaat ttaagctcgg gtaaatggaa ttcatcttca tcatgactat 15060
cgtgaagcac agctcccaca gataactctt caagcttagc aatggcgcaa atatcaccag 15120
gtaacgcttg attgacatta atttgtttgt cgccttgaag tttcattaag tgagacactt 15180
taaacggctt gcgtccgcta ccaatgaaca atttcattcc cacagaaatc gtaccttgat 15240
acaagcggaa aacccccata cgtccaaaga acggatctat cgccacccta aatacatgcg 15300
ctaaaacatg atcagaggct ttttgagtga catcaatcgg cttagcttca tcaccgtagc 15360
ctttaataaa ttgcggcgga ttcgcttcaa gtggattcgg cattaactta accagaatct 15420
ctaacaacga actgatgcca atatcttgct ctgcgctagt aaaacaaact ggcaccaagt 15480
gccccattct taacgctgtt tccaatggcg catgcagttg ctctggcgta agtgattcgc 15540
cttgttctaa ataaagctcc attaaagctt catcttcttc aagtacggta tcaaccagct 15600
catctcttgc tgtagcggca ttgctaaaca aagtattgaa agtttcatca caatgtaagt 15660
agcagtcaac cacatcatcg accaaaccat cagctgtaac attgggtaaa ttaaccggta 15720
agcatctgtg gccaaattga tgttgaatat ccatcatcac atcaaacacc ttggcttcat 15780
ttccatccat gtgatttatc gcaatgatga ctgctttacc ttggcttcga gcagcttcaa 15840
atgctcgttt tgtcacggat tcaatgccaa cacttgcgtt caccactaac aatacagatt 15900
caacaccagg taatggtaat agcgcacgtc caaagaagtc gggtaatcca ggagtatcga 15960
tgaaattgat gtggtgagat tgataatcga gatttaaaaa tgaaggttct aaactgtgac 16020
gatgagattt ttcttgggca gtgaaatcag catgatttgt acccttatcg accctgcctt 16080
ttaaacttat agcatcagcg ctaaagagta acgcctcaag taacgaggat ttacctgcgc 16140
ctgtgtgtcc gagcactgcc agattgcgga tttgctcagt ggtaaactca gccatgatgg 16200
cctcctttgt tcacattatt aaactatcca tatctttgtc ttactatgtt tacatttgac 16260
gataaaacac ccataaattc agtatagatc ggtaacattg ttgaataatt gacacagatc 16320
actctttaca cccgcaacgt tttttataac aaaatcaccc attcagctta caagtgttag 16380
ctctttctgg tcgtatcagt aattaattag tttcgggtga ttgtatcgac ctgaaacctc 16440
aggtactctg catgctcgat tgtgataaaa cgctaataat gaagatgaac aaacgttaat 16500
cttcagtatt ttttagagag tcccaataga ttgtacggag tgttcattct gctatggccg 16560
tccttaaatg actgcaaacc gacaagctaa atcagccact aaaacagtgg taaaaaaatc 16620
ctcttccgat tgtgatgtag cgagcacacc tgtgcgccat cgtaatgcga caacgacccc 16680
cgaaatgcgt caatttatcc aaacttccga ctttagtgtc agccagttgg ctaaaattct 16740
gaacatatca gaagccacgg taagaaaatg gcgcaaacgt gactccatca gcgatacacc 16800
caatacgcca catcacttaa aaaccaccct ttcacctatg gaagagtatg tggttgttgg 16860
cttacgttat cagctgaaaa tgccgttaga cagattgcta aaagtcactc aacagttcat 16920
caataaagat gtttctcgtt caggacttgc ccgctgctta aaacgctacg gtgtatcgaa 16980
actcgatgaa ttcgaaagcc cctatgttcc agaacgctat ttcaaccaat taccgattgt 17040
tcagggtaca gatgtagcga cttacacact gaaccctgaa actcttgcta aaaccctgtc 17100
attgcctgaa gccacaccag acaatgtggt gcaagtggta tccctaacga ttccacctca 17160
actgactcaa gcagacagct attccatttt actcggtgtc gactttgcaa ccgactgggt 17220
gtatctcgac atttatcaag acaaccacac acaagcaacc aatcgctata tcgcttatgt 17280
gttaaagcac ggaccgttcc atttacgtaa attactcgtc aaaaattatc atactttttt 17340
agcccgtttt cctggtgcaa cagtgttgca ctctgtggaa gcggcgaacc aaaaaaataa 17400
atcagctaag gatcagctga acactggaga ctcaaaatga gccaagcccc tacaaatcct 17460
gagacctcat ctcaagataa caacgagtcg caagatacaa gactgaacaa acgtcttaaa 17520
gacatgccta ttgccatcgt cggcatggca agtatctttg ctaattctcg ttacctgaat 17580
aagttttggg acttaatcag cgagaagatt gatgccatca cagaagtgcc tgatacccat 17640
tggcgcgctg aagattactt tgatgccgat aaaagcaccc cagataaaag ctactgtaaa 17700
cgtggtggat ttatcccaga agttgatttc aacccaatgg aattcggcct gccaccaaat 17760
attttagaac tgactgatac ttcgcaattg ctatcattag tgattgccaa agaagtgctt 17820
gcagatgcgg gcgttacctc tgagtacgat accgacaaaa tcggtattac gctgggtgtg 17880
ggtggcggtc aaaagattaa tgcaagctta accgcgcgcc tacaataccc agtacttaaa 17940
aaagtattta agagcagtgg tctaagtgat gctgacagcg atatgctgat caaaaagttc 18000
caagaccaat acattcactg ggaagaaaat tcattcccag gctcactagg taatgttatt 18060
gctggtcgta ttgctaaccg cttcgatttg ggcggcatga actgtgtagt agatgctgca 18120
tgtgcgggct ctcttgctgc aatgcgtatg gcgttaactg agctagttga aggccgcagt 18180
gaaatgatga tcacaggtgg tgtgtgtacc gataactcac catcaatgta tatgagtttc 18240
tctaaaacgc ctgcgttcac caccaatgaa accattcagc catttgatat cgactcaaaa 18300
ggcatgatga ttggtgaagg tatcggcatg gtagcactta agcgcctaga agatgctgag 18360
cgtgatggcg accgtattta ttctgtgatt aaaggtgtcg gcgcttcatc agacggtaaa 18420
tttaagagta tttatgcacc gcgccctgaa ggccaagcaa aagcattaaa acgagcttat 18480
gatgacgctg gttttgcccc tgaaacagtt ggcttaatcg aagctcacgg tacgggtact 18540
gctgcaggtg atgtagccga atttaacggc cttaaatctg tatttggtga aaacgatcca 18600
actaagcaac acatcgcttt aggttcagtg aaatcacaag tgggtcacac gaaatcaacc 18660
gctggtactg ctggcgtgat taaagctgcc cttgccctgc accataaagt attgccaccg 18720
accattaacg tctctaagcc aaaccctaag cttaatgttg aggattcacc gtttttcgtt 18780
aataccgaaa cacgcccatg gatgcctcgc cctgacggca ctcctcgccg tgctggtatt 18840
agctcgttcg gttttggtgg aactaacttc cacttagtat tagaagaata cacccctgag 18900
cacagccatg atgagaaata ccgtcaacgc caagtggctc aaagcttatt aatgagtgct 18960
gataataaag cagccttgat tgcagaagtg aataagctaa ctgcagacat cagcgcgctt 19020
aaaggcacag ataacagcag cattgaacaa gctgaacttg ctcgcattgc taaactatat 19080
gctgttcgca ccatagatac ttcagcagcc cgtttaggtc ttgtggtatc aagccttaat 19140
gaattaacca ctcagcttgg tttagcgtta aagcagctta ataatgatgt tgatgcatgg 19200
caactgccat cagggactag ctaccgctct tcagcactca tcacgattaa tgcaaaccaa 19260
aaggcgacta aaggtaaaaa agcgactaac gcaccgaaag ttgcagcatt gtttgcaggt 19320
caaggctctc agtacgtcaa catgggtatt gaagtcgctt gtcacttccc tgaaatgcgt 19380
cagcaattaa tcaaggccga taaagtattc gcaagctttg ataaaacccc gctgtctcag 19440
gtgatgttcc cgattccagc ctttgaaaaa gcagataaag atgcacaagc agctttactc 19500
accagcactg ataacgcgca aagcgccatt ggtgtaatga gcatgagcca ataccaattg 19560
tttactcagt ctggtttcag tgcggatatg tttgcaggtc acagctttgg tgaactgtcg 19620
gctttatgtg ctgctggcgt tatctctaat gacgattact accagttatc atttgctcgt 19680
ggtgcagcta tggcttcatc agcagttgat aaagatggca atgagctaga taaaggcacc 19740
atgtacgcca ttatcttgcc agccaatgaa gctgatgctg caaacagcga taacatcgcc 19800
aagctagaaa cctgtatctg tgagtttgat ggcgtgaaag tcgctaacta caactctgcg 19860
actcaattag tgattgctgg cccaacggac tcttgtgcaa atgcagccaa agccattagt 19920
gctttaggct ttaaagccat tgcgcttcct gtatcaggtg ccttccatac tccacttgtt 19980
gggcatgcgc aaaaaccttt tgcaaaggca attgataaag ctaaatttac tgccagcaaa 20040
gttgatttat tctctaatgc gacaggtgaa aagcatcctg ctgatgctaa atcaattaaa 20100
gcggcgttca aacagcacat gttgcaatca gtgcgtttca ctgaccaatt aaacaatatg 20160
tatgatgctg gtgcccgtgt atttgttgag ttcggaccta agaatatttt acaaaagctg 20220
gttgaagcaa cgctaggtaa taaagctgaa gctgtatctg tgattagcat taaccctaat 20280
cctaaaggca atagcgatgt gcaattacgt gtcgctgcta tgcaacttag cgtattaggc 20340
gctccgctta ctgaagttga cccttaccaa gctgaaatcg cagcccctgc tgtaccaaaa 20400
ggtatgaacg tcaagttaac tgcgtcaaac cacatcagcg caccaactcg tgccaagatg 20460
gaaaaatcat tagcaacagg ccaagtcact tcacaaatcg ttgaaacgat tgtagagaaa 20520
gttatcgaaa tgccagttga aaaagtagta gagaaaatcg tggaaaaaga agttatcaaa 20580
actgaatatg ttgaagttgc cgcatctggc gcaacagcag tgcctaacgc cgctgcacca 20640
gtggctcaag cttctcaagt aatagcacct caaatgcaag ttcaggcaac gcctgtagct 20700
ggcagcttag aagcgttctt taatgcacaa cagcaagccg ctgatttaca tcagcaattc 20760
ttagccattc cacaacagta tggtgacacc tttacacacc taatggccga gcaaagtaaa 20820
atggccgctg ctggacatgc tattcctgag agcctacaac gttcaatgga gctattccac 20880
caacatcaag ctcaaacact acaaagtcat actttgttcc ttgagcagca agcacaatca 20940
agccaaaacg cattaagcat gctgactggc caagcaccag ctacaacaac gccagctgtt 21000
aatgctccta gagttaatgc gcctatcact gaaaatccag tagttgctgc gccagtcgtt 21060
gaagctgtta aagtagccgc tacggttcaa actccgacgg cacaagctcc agctgttcaa 21120
gcgtcaatta ctcaaactgc tgccaaacca gccgctatgg ccgctccagc gccacgtatt 21180
gaaccagtaa aagcaactgc cccagttgca gctcctgtcg ttgcgccagc agttgcagca 21240
gcacctgcag gtttaagcgc agaaacagtt ctgaatacta tgttagaagt ggttgcagaa 21300
aaaacaggtt acccaactga aatgcttgaa ttaagcatgg atatggaagc tgatcttggt 21360
attgattcta tcaaacgtgt tgagatctta ggtactgttc aagacgaact gccaacacta 21420
cctgaactaa gccctgaaga tttagccgag tgtcgtacgc ttggtgaaat cgttgactac 21480
atgaactcta aacttcctaa aagtgacgct tcaggaactc aaacgcaagt cgcgccagtt 21540
caagcagcat caggccttag cgctgaaaca gttctgaata ccatgcttga agtggttgct 21600
gaaaagaccg gttacccaac tgaaatgctt gaattaagca tggatatgga ggctgatctt 21660
ggtattgatt ctatcaaacg tgttgagatc ttaggtactg ttcaagacga actgccaaca 21720
ctgccagaac taagccctga agatttagct gaatgtcgta ctcttggcga aatcgttgac 21780
tacatgaaca gcaagcttcc tgctgctggc tctactccag ttgcatcacc agttcagtct 21840
gcggctccgg tatctggcct tagcgctgaa acagttctga ataccatgtt agaagtggtt 21900
gctgaaaaga ctggttaccc aactgaaatg cttgaattaa gcatggatat ggaagccgat 21960
ttaggtatcg attcaatcaa gcgtgttgag attctaggaa ccgttcaaga tgaactgcca 22020
acactgccag agcttagccc tgaagattta gctgagtgtc gtactcttgg tgaaatcgtt 22080
gactacatga actctaagct tcctacaagt tcagccgcag gcgctaatac acaggctgta 22140
gctccagttg ctcaagaatc aggtttaagt gctgaaacag ccttgagcgc gcaagaagtt 22200
caaagcacta tgatgactgt agttgctgaa aaaaccggtt acccaactga aatgcttgaa 22260
ttaagcatgg atatggaagc cgatttaggc atcgattcaa tcaagcgagt tgaaattcta 22320
ggtacagttc aagacgaatt accaacacta cctgagctaa gtcctgaaga tctagctgaa 22380
tgtcgtactc ttggtgaaat cgtatcttat atgaattcta agttacccgc cgcaggcgct 22440
atgaacagca cagccgttgt agctcaagct tctggtttaa gtgctgaaac agccttgagc 22500
gcgcaagaag tacaaagcac catgatgact gtggttgctg aaaaaaccgg ttacccaact 22560
gaaatgcttg agctaagcat ggatatggaa gcggatttag gcatcgattc aatcaaacga 22620
gttgagatct taggtacagt tcaagatgaa ctaccaacgc taccagagct taaccctgaa 22680
gatttagctg agtgtcgtac ccttggcgaa atcgtgagct acatgaacag caagcttcct 22740
gctgtcagtg cgacaactgc cgcagggact caaacacaag cagccgcagg cgctactcaa 22800
gcttctggtt taagtgcaga gcaagtgcaa agcactatga tgacagtcgt tgctgaaaaa 22860
accggttacc caactgaaat gcttgagcta agcatggata tggaagcaga tttaggcatc 22920
gattcaatca aacgtgttga aattttaggg acggttcaag acgagcttcc aggcttacct 22980
gaattaaacc ctgaagattt agcagagtgt cgcaccctag gtgaaatcgt tagctatatg 23040
aacagcaaac tttcaacaag tgcagctgaa ggctctcagc caacgctaag ctcaactgac 23100
acttcaccag caacagccac agctgagtta gcaacagact tacctcctca tcaggaagtt 23160
gctctaaaaa agctaccagc ggcggataag ttagttgacg ttttttcaaa agacgcatgt 23220
atcgttatca atgatgacgg ccataacgca ggtgttttag ctgaaaaatt agtagcaaca 23280
ggcctaaccg tcgccgttat tcgtagccct gagtcagtga catctgcgca atcaccgctt 23340
agcagtgata ttgccagctt cactttatct gcggtcaatg acgacgcgat tagcgatgtc 23400
attgctcaaa ttagcaagca acataagatc gccggctttg ttcacctgca acctcaacta 23460
acagcacaag gtgctttgcc attaagtgat gcaggttttg tagcagtgga gcaagctttc 23520
ttgatggcta aacacctaca gaaaccattt gctgagctag ctaaaactga gcgcgtaagc 23580
tttatgactg ttagccgcat tgatggcgga tttggttact taaacagtaa cgaacttgca 23640
aaggctgagc taaaccaagc tgcattatct ggtttaacta aaacattagg tcatgagtgg 23700
ccaactgtgt tctgtagagc attggatatt accccaagct ttgaggcagt tgagttagca 23760
caagccgtta ttgaagagtt atttgatctt gatactgcaa ctgctgaagt gggtattagc 23820
gaccaaggtc gtcatacctt atctgctacc actgcagctc aaacccgtta ccaaaccaca 23880
tcattaaaca atgaagatac agtgttggtg actggcggag caaaaggcgt cacattcgaa 23940
tgtgccctta cccttgcgaa acaaactcag tcacacttta tcttagcggg tcgcagtgag 24000
catttagccg gtaatttacc gacttgggct caaggcaaac aggctaaaga attgaaagct 24060
gctgcaattg gatttattca atctcaaggt aataagccaa caccaaagca aattgatgcc 24120
ttagtttggc cgattaccag cagtttagaa attgatcgct cattagcagc atttaaagct 24180
gtcggtgcaa gtgctgaata catcagcatg gatgtcagct cagatgcagc catcaagcaa 24240
tcacttgctg gcctcaaacc gattacaggc atcattcatg gtgcgggggt actcgccgat 24300
aaacacattc aagacaaaac attagctgag ttaggccgtg tatatggcac taaagtctcg 24360
ggctttgccg gcatcatcaa tgcgattgat gcaagtaaat tgaagctagt tgctatgttc 24420
tcatcagcag cgggtttcta tggcaacact ggtcaaagtg attactcaat gtcgaatgag 24480
atcctaaaca agacagcact acaacttgca gcgaactacc cgcaagcaaa agtgatgagc 24540
tttaactggg gaccttggga cggcggtatg gtcagttcag cgttaaagaa aatgtttgtt 24600
gagcgcggcg tatacgttat tccactcgat aaaggcgcaa acttgtttgc tcacagccta 24660
ttgtctgaat ctggcgtaca gctattaatt ggttcaagta tgcagggctc aagctcagca 24720
gctaaaacag gcgcagctgt aaaaaagctt aatgcggact cttcgcttaa tgccgagggt 24780
tcgctgattc tttcttttac tgctccagat aaccgtgttg ttaacaacgc ggttactgtt 24840
gaacgagtac taaacccagt tgcaatgccc ttccttgaag atcattgcat cgcgggtaat 24900
ccagtactgc caacagtgtg cgctatacaa tggatgcgtg aaactgcgca aaaactgtgt 24960
ggcctacctg tgacggttca agattataaa ttgctgaaag gcattatttt cgagactaaa 25020
gagccacaag tattaacgct gacattgacg caaacagaat caggcttaaa agcactgatt 25080
gcgagtcgta tgcaaagtga tgccgttgat agcttgctta gacctcagta tcaagcaaac 25140
ctgattgtta acgagaagat tgttaacgag aaggttgcta aagaagcggt ttcaaccacg 25200
ctaccaactg cagcaaaaaa tgcgcagcaa ttagcaagct caggtaaagt cattagcact 25260
gatagcgagc tatatagcaa tggcagctta ttccacggcc ctcgccttca aggaataaag 25320
cagttgttaa ttgccaacga tgagcaattg gtttgctcag ttgagttgcc tcaaattacc 25380
gctgtagatt gcgcaagctt tacaccgcaa acaggtttag gtggtagtca ggctttcgct 25440
gaagacttac ttttacaagc catgttagtg tgggcgcgta tcaaacacga tgcagcgagc 25500
ttaccgtcaa ccattggtga attaaccaca tacgccccat tcgcctcggg tgataaaggt 25560
tacttagtgt taactgtgct taaaagtact agccgttcat tgactgctga tattgcgctt 25620
tatcatcaag atggccgctt aagctgcact atgctaagcg caaaaacgac catcagcaaa 25680
agcttgaatg aggccttttt agccccagcc aaagcattag ctgatttgca ggagtctgtg 25740
tgagtaatca actgcctcct tcaacgtctg ctattaaaag catgcgaata gccttaaaga 25800
tggttgcgaa tgagcaagtc tcattcgcaa catcttcagg caatgatttt agtgccaata 25860
gctttgcagc gattaagcct tgctcattag ctgaggccat tggcgcttca gcaattgatc 25920
ttgaaattga tgtatcaagc ctagatgcga gtttgagtga aaacgctgtt aataaagcac 25980
ttagctttaa tgactatttt gctcaagcca tcatccatat cgagcaacaa catacggttt 26040
tactcagtca ccctgaatta ccgtatcgct tattaatgat gccagcgatt gtggcggcta 26100
aacatcgttg ccatcctcat gcctacttaa ccggtttggg tgaagctgat gatatgccaa 26160
gtgcaataaa tgcggcttta gttcaagcca agcgtgcaca cattaaacct actcatgtcg 26220
atgcgactca attaacttgt tataaagata agtttgccca gttggttatg ctgataggca 26280
gcattgccac tcgcagtgtg ccaaatacag tttcagaaaa tcagtcagct gatgctcaat 26340
actggttcac tgaaatgcac caaaatcgcg ttgccagctt taattttagt gaaggcaata 26400
agcaacacag tgcagtcttt gtccaaggca ctgagcttgc tcaagcaagt tctttggtag 26460
atgacaatcg actatttttg cctgtatcag ccaatgacct tggaatgatg aaacagcagc 26520
tgcaagcatt aagcagtcaa ttggctgcgc tgcctgcaca acatgacaag agtgacagtt 26580
ccgctatctc cttcatgctt agccagctaa agcaatttga tcagacccag cctttatcgg 26640
cagttgttat ggcaaattca gtgactaatg cagtaagtga aatcaatgtc atgcttagca 26700
cgattggtaa agctgaagcc actgcggcaa atgaagttca agctaaaagc aacttaagca 26760
ttgaacacaa aaccccgtca ggaagctgct ttcatctcac ttcagataaa gtacttggca 26820
ataatggcct gtgttttgtt taccctggcg tgggcacggt atacccgcaa atgtttgctc 26880
aactgccgcg ctactttcca gcattatttg cccagctaga gcgcgatggt gatgtcaaag 26940
ccatgctgca agcggatagt atttatgctg aaaatgctaa aaccactgac atgagcttag 27000
gtgaactagc tattgcaggt gtaggcgcaa gttacatcct aaccaaagtg ctcactgagc 27060
atttcggcat taagcctaac tttgccatgg gttactcaat gggcgaggca tcaatgtggg 27120
ccagtcttga tgtgtggaaa acaccccaca atatgattga agcaacgcaa actaacagta 27180
tttttaccac tgacatttcg ggccgcttag actgcgttcg tcaagcatgg cagctagaac 27240
atggcgaaga cattgtttgg aatagctttg tggttcgtgc agcgcctgct gatatcgaaa 27300
aagtattagc tgatttccca cgtgcatacc ttgctatcat ccaaggtgat acttgtgtgc 27360
ttgcaggctg tgaggaaagc tgtaaagcgc tacttaaaca aattggtaaa cgtggcatag 27420
cagcgaatcg agtaaccgca atgcacacta aacctgcgat gcttattcga gacaacgtac 27480
aagcctttta tcagcagcct ttgcatgagc aagatgttat tgcacctttc gcaagccaaa 27540
ttaaatttat cagcgctgca agccaatcgc cgattaattt aaccagtgaa gcgattgcaa 27600
catccattgc tgataccttt tgtcagccgt tagattttac acaattagtc aataatgcac 27660
gtcatttagg cgcctcgctt tttgtcgaaa tcggcgctga cagacaaacg acaacactga 27720
ttgacaaaat ctcgcgtacc tctgaaatgg cgcaaacatg ccaagccatt tcagtgaatg 27780
caaaaggcga tgaccaaact gcgctactta aatgtattgc tcaactgatt actcataaaa 27840
ccccaatttc gctcgattat cttactgaga ccttgtcgag tttactgacg acaacattgg 27900
cggcagaaaa acgaagtaat caccacacag gcaatatgtt ggcccctcaa ttagaaggag 27960
aacaatcttg agttctcaat caactaatct aaatacaaca gtcccaaaga ttgccattgt 28020
aggtttagcg actcaatatc ccgatgcgga tacgcccgct aaattctggc aaaacttatt 28080
agacaaaaaa gactctcgaa gcacgattaa cagccaaaag ctcaatgcaa acccagctga 28140
ctatcaaggt gtgcaaggtg agtctgaccg tttttattgt gataaaggcg gctacattca 28200
aaacttcagt tttgatgcta atggctatcg tattcctgcc gagcaattta gcggccttga 28260
tgacagtttt ttatgggcaa ccgatacagc acgtaaagca ttgaatgatg ctggtgttga 28320
tattacaaac ccacaaaaca atggcgcatt aaaccgcacc ggtattgtca tgggaacact 28380
atcgtttcca acggctaaat ccaatgaact gttcgtaccg atttatcaca gcgcagtaga 28440
aaaagcgttg caagataaac tgcaacaacc aagtttcaca ttgcagccat ttgatagtga 28500
aggatatagt cagcaaacaa cgtcagcttc tttgtctaat ggcgccattg ctcacaatgc 28560
atctaaacta gtcgccgatg cgctaggctt aggtgcagcg caattaagcc ttgatgctgc 28620
ttgtgcaagt tctgtttact cattaaagct tgcctgtgat tatttgcata ctggcaaagc 28680
tgacatgatg ttagctggcg cagtttctgg cgctgaccca ttctttatta acatgggttt 28740
ctccattttc cacgcctacc ctgaccacgg tatttcagcg ccatttgata gtaattcaaa 28800
aggtttgttt gctggtgaag gtgctggtgt tttagtcctt aaacgccttg aagatgctga 28860
gcgcgatggc gaccatattt atgcactcgt tagcggtatc ggtttatcaa atgacggcaa 28920
aggccaattt gtattaagcc caaacagcga cggccaagtt aaagcattcg aacgtgctta 28980
tgctgatgct gctatgcatg atgaaaactt tggcccaaac aacatagaag tgcttgagtg 29040
tcacgcaaca ggtacgccat taggtgacaa agttgagctg acgtcaatgg agcgcttttt 29100
tagcgacaaa ctcaatggca gtaacacgcc gttaattggt tcagctaagt ctaacttagg 29160
ccacttgctg actgctgcag gtatgccagg gatcatgaaa atgatttttg cgatgcgcca 29220
aggtgttctg ccgccaagta ttaatattag cgcaccgatt gcttcaccat cagaaatgtt 29280
tggccctgca accttaccta atgatgttct cccttggcct gataaagctg gcaatacagc 29340
ccgccatgcg ggtgtgtcag tatttggttt tggcggttgt aatgcccatt tattagttga 29400
gtcatacttt gcgaagagtc atggccagcc ttctagcaca gagttagtta aaccagcgac 29460
aacgaccatc aatgcgcaaa tgccaatgca cattaccggt atggcatcac actttggttc 29520
gttgtcgaac gtaaatgact ttgctgatgc ggtaaataac aatcaaaccg catttacctc 29580
attgccagct aaacgctgga aaggtttaga taaacaccca gagttattac aaaaattcgg 29640
actgagtcaa gctgcgccaa caggtgctta tattgatcaa tttgatttcg acttcttacg 29700
ctttaaagtg ccacccaatg aagatgaccg tttaatctcg cagcaattgt tattaatgaa 29760
agtagcagat gaagccattc atgatgccaa acttgagtca ggtagcaaag tggcggtttt 29820
ggttgcaatg gaaacagaac ttgaattaca tcagttccgt ggccgcgtta acttacatac 29880
ccaaatagct gccagcttaa cagcccatgg cgtgagctta tctgatagcg aataccaagc 29940
attagaaacc attgcgatgg acagcgtgtt agatgccgcc aagcttaacc aatacaccag 30000
ctttattggt aatattatgg cgtcacgcat ctcatcatta tgggatttta atggccctgc 30060
ctttacgatt tcagcaggcg agcaatcagt taaccgctgt attgatgtgg cgcaaaacct 30120
actggcgatg gagtctcgtc aagagcctct agatgcagcg attattgccg cagtggattt 30180
atctggcagt attgaaaata tcgtgcttaa aacggcgaac attaataaaa caggctcaac 30240
tgaagcactc aatattggtg aaggggctgg cgcaattgta ttgcaagcag ccgctattga 30300
tagcgagcac tgcgacctaa tacatcaagg tttaggcgcg ttagatacgc tagattcagc 30360
aagcacccac agttatggca ccatcgacag tttggcattt ggtcatacag accagctttc 30420
aaccattagc gatgacgtgt taactcctgt tggattggct gcaactgata ttgatttatt 30480
agagttaaac caagcacctg atttgctcaa tattgataat gcgcaaatgc tatcgcagct 30540
atttaaccaa tcgagcacca gcaaagcgca atcttgtatc gggcacactt ttgccgcttc 30600
cggtattgcc agcttattgc atggcttatt gaaaactcga ttgaatgctt ctgtgcagaa 30660
cgctaactcg gatagcaaac tgagcaataa gcccaaccaa aaggccataa tcgctacttt 30720
gagcgaaaac cagtgttcgc agcttcttat cagccaaaac gctgaacaag caagcgcgat 30780
gagcactcgt attgacactg atatacaagc gcaaacggcc aagaaattga gcctagttaa 30840
gcaagtcagt ttaggtggtc gtgacatcta ccagcatatt gttgatgcgc cactggctaa 30900
cattgacagt attagagcga aagttgccaa gcttaaccct gttgcaccta caactgtgat 30960
gaacttacat gaccgcggcc aatttatcgc gccagctcat gccaattcag cgcctatgtc 31020
cgctaacaat aattcaatga ctacagagac ttctatgccg ttttctgatc gttcaaccca 31080
gtttaaccct acacctaaag tggctacgcc tactgcactt tccactcagg cagctcaggc 31140
aactcagtca gctcaaacgt cttcagtgac gagctctgtc gcagcaatta gccaagtgcc 31200
acctacgcat ttaagcgctt ttgagcaaaa ccaatggtta gcacatcaag cgcaattagc 31260
atttttaaag agccgcgaac aaggcttaaa agtcgctgat gcacttttaa agcaagagat 31320
tgcacaagca aatggtcagc cttatgttgc ccaatcgacg gcacaagctg tagcgcccgt 31380
ccaagcggca aacgtgttag cgcagccaat agcatctgcg tcaatcttgc gtccagatca 31440
tgcaaatgtg ccaccctaca cagcgcctat cccagcgaat aagccatgta tttggaacta 31500
cgctgattta gtagaatatg ccgaaggtga tattgccaaa gtatttggcc cagattacgc 31560
cgtgattgat aactactctc gccgcgtacg ccttcctaca actgattact tattggtatc 31620
tcgcgttact aaactcgatg caacaatgaa ccaatataag ccttgtagca tgaccacaga 31680
gtatgacatc ccagaagatg caccttactt agtcgatggc caaatccctt gggcggtagc 31740
cgttgaatca ggccagtgtg atttaatgct gatcagttat ttaggcattg attttgaaaa 31800
caaaggtgag cgtgtttacc gtttacttga ttgtacgctg accttcttag gcgacttacc 31860
tcgtggcggc gacacattgc gttacgacat taaaatcaat aacttcgcta agaatggcga 31920
gacactatta ttcttcttct cctacgaatg tttcgtcggc gataagatgg tcttaaaaat 31980
ggatggcggc tgtgctggct tctttaccga ccaagagtta gatgacggta aaggggttat 32040
ttacaccgaa gatgaaatca aaacccgtga agcggcgtta aatacgccaa acaaaccgcg 32100
ttttgaaccg ctattacatt gtgctcagac tcaatttgac tatggtcaaa tccatcattt 32160
actcaatgct gatattggca gctgttttgc tggcgaacac cataaccacc agcaagcatc 32220
aggtaagcaa gactcattat gttttgcctc tgaaaagttc ttgatgattg agcaagtggg 32280
caatttagaa gtccatggcg gcgcttgggg cttaggcttt atcgaaggcc ataaacaatt 32340
agcacctgat cattggtact tcccttgtca tttccaaggc gaccaagtaa tggctggctc 32400
attaatggct gaaggttgtg gccaattatt gcagttcttc atgctgcaca ttggtatgca 32460
caccttagtt gaaaacggac gtttccagcc tttagaaaat gcttcacaaa aagtacgttg 32520
tcgtggccaa gtactgccac aacatggtga actgacgtac cgcatggaag tcacagaaat 32580
tggtactcac cctcgcccat acgccaaagc caatattgaa atattgctca atggtaaagc 32640
ggtcgtggac ttccaaaatc ttggggtgat gattaaagaa gaaggtgaat gtactcgtta 32700
cactgccgac tctactgaaa cacatacaac ctcaggcaca gtccaaaaaa acaacagcca 32760
caacacacca gcatcattaa atgcaccgtt aatggcacaa gtgccagact taagtgaacc 32820
agccaataaa ggcgttatcc cgctgcaaca tgttgaagcg cctatgctgc cagactaccc 32880
aaatcgaacc cctgatacgc tgccgttcac cgcgtaccat atgtttgagt ttgcaacagg 32940
tgacatcgaa aactgttttg gacctgactt tagtatttac cggggcttta ttccgccgcg 33000
cacgccatgt ggtgacttac agctaacaac ccgtgttgtt gatattcaag gtaaacgtgg 33060
cgagcttaaa aaaccgtcat cgtgtatcgc tgaatatgaa gtgccaaccg atgcgtggta 33120
ttttgctaaa aacagtcacg cttcagtgat gccttactcg gtattaatgg aaatatcact 33180
gcaaccaaac ggatttattt cgggttacat gggcacaacc cttggtttcc cagggcaaga 33240
gctattcttc cgtaaccttg atggtagcgg tgagttattg tgtgatgtag atttacgcgg 33300
caaaaccatt gtcaatgatt ctaagctatt atctaccgtt attgccggca gtaacatcat 33360
ccaaagtttc agctttgatt taagtgttga tggcgagcct ttctatactg gtagcgctgt 33420
atttggttac tttaaaggtg atgcacttaa aaaccagcta ggtattgata atggccgtat 33480
tactcagcca tggcatgttg aaaataacgt agcggctgat atcaccgttg atttgcttga 33540
taagcagtcc cgcgtattcc atgcaccagc aaaccagcca cattatcgtt tagctggcgg 33600
tcaacttaac tttatcgaca aagctgaaat cgttgataaa ggcggtaaaa atggtttagg 33660
ttacttgtct gcctcacgca ccattgaccc aagtgattgg ttcttccagt tccacttcca 33720
tcaagatcct gtgatgccag gttcattagg cgttgaagca attatcgagt taatgcaaac 33780
ttacgccatc agtaaagacc taggtaaagg tttcactaac ccgaaatttg gtcagatttt 33840
gtctgacatc aaatggaagt accgtggcca aatcaaccca ctaaataagc aaatgtcgct 33900
ggatgtgcac atcagtgcag tcaaagatga aaacggcaaa cgtatcattg tgggtgacgc 33960
aaacctcagc aaagacggtt tacgtattta cgaagtaaaa gacatcgcta tctgtatcga 34020
agaggcataa aggaataata atgactatta gcactcaaaa cgaaaagctt tctccatggc 34080
cttggcaagt agccccaagt gatgccagct ttgagaatgc cgctatcggt aaaaaattaa 34140
aagaactgtc tcaggcgtgt tatttaatta accaccctga aaaaggctta ggtatttcgc 34200
aaaacgcaca agtaatgact gaaagcatga acagccagca agacttacca gttagtgcat 34260
ttgcacctgc tttaggcact caaagcttag gcgacagtaa tttccgccgc gttcacggag 34320
taaaatacgc ctactacgct ggcgcgatgg ccaatggtat ttcatctgaa gagttagtga 34380
ttgcattagg ccaagctggt attttgtgtt catttggcgc agcaggatta attccatctc 34440
gcgtagaaca agccattaat cgcattcaaa cggcgctacc caatggcccg tacatgttta 34500
acttaatcca cagcccaagt gagccagcat tagaacgtgg cagtgttgag ttatttttaa 34560
aacataaagt gcgcacggtt gaagcatcag catttttagg gttaaccccg caaattgtct 34620
attaccgcgc tgcaggttta agccgtgatg ctcaaggtga agtggttata gccaacaagg 34680
ttatcgctaa agtaagccgc acagaagtag cgagtaagtt catgcaacct gcacctgcta 34740
aaatgctgca aaagctggtt gatgaaggct taatcacacc tgagcaaatg gagctcgcac 34800
aattagtccc aatggcagat gatgtgacag cagaggctga ttctggtggt cataccgata 34860
accgtccatt agtgacgcta ttgccaacaa ttttggcgct taaagataaa attcaagccg 34920
agtaccaata caagacgcct attcgtgtcg gttgcggcgg cggcgtggga acacctgatg 34980
cagcattagc gacctttaac atgggcgcag cgtatatcgt taccggctca atcaaccaag 35040
cgtgtgttga agctggtgcc agtgaacata ctcgtaaatt attagcgaca acagaaatgg 35100
ccgatgtcac catggcacct gctgctgata tgtttgaaat gggcgttaaa ctacaagtgg 35160
ttaagcgcgg tacactattc ccaatgcgtg ccaacaagct ttatgagatt tacactcgtt 35220
atgaatcaat tgaagcgatt ccagctgaag aacgtgaaaa actagagaaa caagttttcc 35280
gttcaaccct tgatgatatt tgggcaggca ctgtggctca ctttaacgaa cgcgacccta 35340
agcaaatcga acgcgcagaa ggaaacccta agcgtaaaat ggcactgatt ttccgttggt 35400
acttaggttt atcaagccgc tggtcaaatt cgggcgaagt cggccgtgaa atggattacc 35460
aaatttgggc aggtcctgca cttggtgcgt tcaatgaatg ggcaaaaggc agctatttag 35520
atgattatac ccagcgaaat gcggtagact tggccaaaca cttgatgcat ggcgcagctt 35580
atcaagcccg cgttaactta ttaactgctc aaggcgtggc actgccggtt gaattgcaac 35640
gctggagccc gctagatcag gttaagtaac ggacgttgta gctttataac gtcagcagtg 35700
atactcgcca tattgcgatc aagttaacca ttactattgt gccactcact caacatgagt 35760
ggcacattga tatttagttt gcagttaggt aacagtatga gcgaaaccca aaagttagat 35820
ttttcagcgg taaatggcac aacactagcc tcgtttaatc agcataaaaa cttgatcaaa 35880
cgtatgctaa aaggcaacag cgctgaatgt agcgagtgta aaaaaccact cactttgcaa 35940
ttaccgccta acattaagaa cgctaaacca agtgataaag caccaggcat atattgcgca 36000
aaaggctgta ccgatatcga gctagatatg gaagcagtgg cattaatgaa gtagccgaag 36060
ataagaacac agttctttag gtataagcct ttataagcac aattacgaag caccttatgg 36120
gtgcttttac ttttcctatc ccaccaaaga tattgtttta actaacttaa gaagggttag 36180
tatgtggcat aactaactca gctaaccatt cataatattt ttcattccca tgaatccaat 36240
ccacttgtcc atttgaataa gttattgggc tgataaattc atgaaagtca taaccttctt 36300
cgataaaaat acgagcagca ttgacaaacg ttatatcaaa ttgtgctagt acgtaatcta 36360
tcgcctcaaa atatgcaaaa ataatatttg ccataggttt agcttcttca acaaatttac 36420
taaaaggagg atctgaaaca acaattactt tatggccaat acttttcaat ttgatcaaaa 36480
tagataattg atcctgaatg tcatcatgaa agtaatctac aaattcctta gtctcaatat 36540
tactaatccc ttgtggatat tgacgtttca cccagtctac aaatctagct gcactttgat 36600
gtgtctgtag acccacatta catataactg tagattgact aaccgtttta ttattttcat 36660
gtatagataa gttatttaat acatctttcc aaagtgttct agacgctgca ctttctaaag 36720
gcacgaatat ctcagtatca catatagcaa acttcttttg cgcgaaccct gatccattca 36780
ttatcattcc tcctgtatga ggaatattcc ttaatttcat tgcattagaa agttttccca 36840
tatgactatc accaaatatg gaaatggaat ccccgtcatt cgatagttgt ttagagttca 36900
actttctaga agcttgtaaa aactcttcat cgcaaactac ttcatcactt actgttttat 36960
caactttatc ggtaattgaa atatctttac ttaatgtttc accaaaatgc ttcatgacat 37020
aactgaccat ctctgctgta acagttctta gattttcctt aaatctatag tctgtagaaa 37080
tgggtaatgt aactaattca taagaaggaa aataactaaa tactgcctca tattcactta 37140
gttcacctgc aacagctcgt aatgtcgact tagagtattg gttagcgatt gctatatgat 37200
ttgacgtagc tgtagctgtt aatggtacgg gtgagacagt gagtacaatc tgaatgttag 37260
gatttataca ttctacaact ttagctattt ctttaagatc attttgaatt tcagcgaatg 37320
taaaattatg aaaattataa tttttttgtt tatattctcc ttggataacc ccgggacaac 37380
taggatagca aaccccattt atatcaaacc atgcttctgt taatcccaat gtaaaaatta 37440
acacatcagt cttcgcaatt gtttgcttca tttcatcaac ggcagctttt cttgcctgaa 37500
ttaaagcact ctcggatgag taacctaact cgttatataa aggtcttagc aaatcataga 37560
atcttgtttc attgtgataa attgagtgat ctgtcttgaa gctctgatta tcacaattaa 37620
gccactgtaa aaaacacctt ggcgtataaa catttccaaa agcaaaacta gatacattag 37680
cttcgtctaa ttcactttga ttaaaattaa aattattgtc atttagccac ttaccgacat 37740
gctgagcaaa acatgaacca actgacgata ttctgggcac attagttttg aaatttatat 37800
caaccaaatt agatattgtt tcttcaaaat agttttgaga aacaacgcca gttttccaaa 37860
agtgctggga agctttatgt gtataaggtg tcaatttaaa ctccaaaaat gatatggtta 37920
agctcatagt caaattagtg actttcatta aagtaagcat tatatatgcc atttaaatac 37980
taactataaa actgaaattc gacttgccac tcacccacca aatagccttg ctaaatctat 38040
tcctctcgtc ataaagtctc atttttacca acaaaaataa tgcgttaaca tttttttgac 38100
ctgtatcaat aataagtctt attagctaag gcactatgcc tcattatttt taatgtggtt 38160
atatttttta tgagtcaaat caaggctaac aacaatattg agcaagcgct aactgacaat 38220
tgcattcttt tgtcgaccac agatctgaat ggcaacataa aatacgccaa taaagcattt 38280
gccgatattt cagaatacag cactgaagag ctacatggac agcctcataa tattgttcgt 38340
caccctgata tgcctaaagc tgcatttaaa gcactttggg atcgtgtaaa agatggcaaa 38400
ccatggtgtg gcatcgttaa aaataaaacc aaatctggca aatattactg ggtgaatgcg 38460
tatatttcgc cagtttttga aaatggccgt ttacatgaac ttcaatcaat cagacgtaaa 38520
ccatgtcagg cacatatcaa atcagctgaa agcatctacc aacaacttaa tgaaggtaaa 38580
gaacctgctg cgatatcacc accactcttt agcttcacgg gtgcactctg cctatgggca 38640
gtgtttatct cgttaattgg cgttatttct tcgttattaa tgcctacgct agttgcagca 38700
ttttttatcc cgttactggc aggttttggt atttactttc taacaagacc ccttaaagaa 38760
cttgaaacta aagccaccaa tattattgat gatc 38794
<210> 76
<211> 2768
<212> PRT
<213> Sh. olleyana
<400> 76
Met Ser Gln Ala Pro Thr Asn Pro Glu Thr Ser Ser Gln Asp Asn Asn
1 5 10 15
Glu Ser Gln Asp Thr Arg Leu Asn Lys Arg Leu Lys Asp Met Pro Ile
20 25 30
Ala Ile Val Gly Met Ala Ser Ile Phe Ala Asn Ser Arg Tyr Leu Asn
35 40 45
Lys Phe Trp Asp Leu Ile Ser Glu Lys Ile Asp Ala Ile Thr Glu Val
50 55 60
Pro Asp Thr His Trp Arg Ala Glu Asp Tyr Phe Asp Ala Asp Lys Ser
65 70 75 80
Thr Pro Asp Lys Ser Tyr Cys Lys Arg Gly Gly Phe Ile Pro Glu Val
85 90 95
Asp Phe Asn Pro Met Glu Phe Gly Leu Pro Pro Asn Ile Leu Glu Leu
100 105 110
Thr Asp Thr Ser Gln Leu Leu Ser Leu Val Ile Ala Lys Glu Val Leu
115 120 125
Ala Asp Ala Gly Val Thr Ser Glu Tyr Asp Thr Asp Lys Ile Gly Ile
130 135 140
Thr Leu Gly Val Gly Gly Gly Gln Lys Ile Asn Ala Ser Leu Thr Ala
145 150 155 160
Arg Leu Gln Tyr Pro Val Leu Lys Lys Val Phe Lys Ser Ser Gly Leu
165 170 175
Ser Asp Ala Asp Ser Asp Met Leu Ile Lys Lys Phe Gln Asp Gln Tyr
180 185 190
Ile His Trp Glu Glu Asn Ser Phe Pro Gly Ser Leu Gly Asn Val Ile
195 200 205
Ala Gly Arg Ile Ala Asn Arg Phe Asp Leu Gly Gly Met Asn Cys Val
210 215 220
Val Asp Ala Ala Cys Ala Gly Ser Leu Ala Ala Met Arg Met Ala Leu
225 230 235 240
Thr Glu Leu Val Glu Gly Arg Ser Glu Met Met Ile Thr Gly Gly Val
245 250 255
Cys Thr Asp Asn Ser Pro Ser Met Tyr Met Ser Phe Ser Lys Thr Pro
260 265 270
Ala Phe Thr Thr Asn Glu Thr Ile Gln Pro Phe Asp Ile Asp Ser Lys
275 280 285
Gly Met Met Ile Gly Glu Gly Ile Gly Met Val Ala Leu Lys Arg Leu
290 295 300
Glu Asp Ala Glu Arg Asp Gly Asp Arg Ile Tyr Ser Val Ile Lys Gly
305 310 315 320
Val Gly Ala Ser Ser Asp Gly Lys Phe Lys Ser Ile Tyr Ala Pro Arg
325 330 335
Pro Glu Gly Gln Ala Lys Ala Leu Lys Arg Ala Tyr Asp Asp Ala Gly
340 345 350
Phe Ala Pro Glu Thr Val Gly Leu Ile Glu Ala His Gly Thr Gly Thr
355 360 365
Ala Ala Gly Asp Val Ala Glu Phe Asn Gly Leu Lys Ser Val Phe Gly
370 375 380
Glu Asn Asp Pro Thr Lys Gln His Ile Ala Leu Gly Ser Val Lys Ser
385 390 395 400
Gln Val Gly His Thr Lys Ser Thr Ala Gly Thr Ala Gly Val Ile Lys
405 410 415
Ala Ala Leu Ala Leu His His Lys Val Leu Pro Pro Thr Ile Asn Val
420 425 430
Ser Lys Pro Asn Pro Lys Leu Asn Val Glu Asp Ser Pro Phe Phe Val
435 440 445
Asn Thr Glu Thr Arg Pro Trp Met Pro Arg Pro Asp Gly Thr Pro Arg
450 455 460
Arg Ala Gly Ile Ser Ser Phe Gly Phe Gly Gly Thr Asn Phe His Leu
465 470 475 480
Val Leu Glu Glu Tyr Thr Pro Glu His Ser His Asp Glu Lys Tyr Arg
485 490 495
Gln Arg Gln Val Ala Gln Ser Leu Leu Met Ser Ala Asp Asn Lys Ala
500 505 510
Ala Leu Ile Ala Glu Val Asn Lys Leu Thr Ala Asp Ile Ser Ala Leu
515 520 525
Lys Gly Thr Asp Asn Ser Ser Ile Glu Gln Ala Glu Leu Ala Arg Ile
530 535 540
Ala Lys Leu Tyr Ala Val Arg Thr Ile Asp Thr Ser Ala Ala Arg Leu
545 550 555 560
Gly Leu Val Val Ser Ser Leu Asn Glu Leu Thr Thr Gln Leu Gly Leu
565 570 575
Ala Leu Lys Gln Leu Asn Asn Asp Val Asp Ala Trp Gln Leu Pro Ser
580 585 590
Gly Thr Ser Tyr Arg Ser Ser Ala Leu Ile Thr Ile Asn Ala Asn Gln
595 600 605
Lys Ala Thr Lys Gly Lys Lys Ala Thr Asn Ala Pro Lys Val Ala Ala
610 615 620
Leu Phe Ala Gly Gln Gly Ser Gln Tyr Val Asn Met Gly Ile Glu Val
625 630 635 640
Ala Cys His Phe Pro Glu Met Arg Gln Gln Leu Ile Lys Ala Asp Lys
645 650 655
Val Phe Ala Ser Phe Asp Lys Thr Pro Leu Ser Gln Val Met Phe Pro
660 665 670
Ile Pro Ala Phe Glu Lys Ala Asp Lys Asp Ala Gln Ala Ala Leu Leu
675 680 685
Thr Ser Thr Asp Asn Ala Gln Ser Ala Ile Gly Val Met Ser Met Ser
690 695 700
Gln Tyr Gln Leu Phe Thr Gln Ser Gly Phe Ser Ala Asp Met Phe Ala
705 710 715 720
Gly His Ser Phe Gly Glu Leu Ser Ala Leu Cys Ala Ala Gly Val Ile
725 730 735
Ser Asn Asp Asp Tyr Tyr Gln Leu Ser Phe Ala Arg Gly Ala Ala Met
740 745 750
Ala Ser Ser Ala Val Asp Lys Asp Gly Asn Glu Leu Asp Lys Gly Thr
755 760 765
Met Tyr Ala Ile Ile Leu Pro Ala Asn Glu Ala Asp Ala Ala Asn Ser
770 775 780
Asp Asn Ile Ala Lys Leu Glu Thr Cys Ile Cys Glu Phe Asp Gly Val
785 790 795 800
Lys Val Ala Asn Tyr Asn Ser Ala Thr Gln Leu Val Ile Ala Gly Pro
805 810 815
Thr Asp Ser Cys Ala Asn Ala Ala Lys Ala Ile Ser Ala Leu Gly Phe
820 825 830
Lys Ala Ile Ala Leu Pro Val Ser Gly Ala Phe His Thr Pro Leu Val
835 840 845
Gly His Ala Gln Lys Pro Phe Ala Lys Ala Ile Asp Lys Ala Lys Phe
850 855 860
Thr Ala Ser Lys Val Asp Leu Phe Ser Asn Ala Thr Gly Glu Lys His
865 870 875 880
Pro Ala Asp Ala Lys Ser Ile Lys Ala Ala Phe Lys Gln His Met Leu
885 890 895
Gln Ser Val Arg Phe Thr Asp Gln Leu Asn Asn Met Tyr Asp Ala Gly
900 905 910
Ala Arg Val Phe Val Glu Phe Gly Pro Lys Asn Ile Leu Gln Lys Leu
915 920 925
Val Glu Ala Thr Leu Gly Asn Lys Ala Glu Ala Val Ser Val Ile Ser
930 935 940
Ile Asn Pro Asn Pro Lys Gly Asn Ser Asp Val Gln Leu Arg Val Ala
945 950 955 960
Ala Met Gln Leu Ser Val Leu Gly Ala Pro Leu Thr Glu Val Asp Pro
965 970 975
Tyr Gln Ala Glu Ile Ala Ala Pro Ala Val Pro Lys Gly Met Asn Val
980 985 990
Lys Leu Thr Ala Ser Asn His Ile Ser Ala Pro Thr Arg Ala Lys Met
995 1000 1005
Glu Lys Ser Leu Ala Thr Gly Gln Val Thr Ser Gln Ile Val Glu
1010 1015 1020
Thr Ile Val Glu Lys Val Ile Glu Met Pro Val Glu Lys Val Val
1025 1030 1035
Glu Lys Ile Val Glu Lys Glu Val Ile Lys Thr Glu Tyr Val Glu
1040 1045 1050
Val Ala Ala Ser Gly Ala Thr Ala Val Pro Asn Ala Ala Ala Pro
1055 1060 1065
Val Ala Gln Ala Ser Gln Val Ile Ala Pro Gln Met Gln Val Gln
1070 1075 1080
Ala Thr Pro Val Ala Gly Ser Leu Glu Ala Phe Phe Asn Ala Gln
1085 1090 1095
Gln Gln Ala Ala Asp Leu His Gln Gln Phe Leu Ala Ile Pro Gln
1100 1105 1110
Gln Tyr Gly Asp Thr Phe Thr His Leu Met Ala Glu Gln Ser Lys
1115 1120 1125
Met Ala Ala Ala Gly His Ala Ile Pro Glu Ser Leu Gln Arg Ser
1130 1135 1140
Met Glu Leu Phe His Gln His Gln Ala Gln Thr Leu Gln Ser His
1145 1150 1155
Thr Leu Phe Leu Glu Gln Gln Ala Gln Ser Ser Gln Asn Ala Leu
1160 1165 1170
Ser Met Leu Thr Gly Gln Ala Pro Ala Thr Thr Thr Pro Ala Val
1175 1180 1185
Asn Ala Pro Arg Val Asn Ala Pro Ile Thr Glu Asn Pro Val Val
1190 1195 1200
Ala Ala Pro Val Val Glu Ala Val Lys Val Ala Ala Thr Val Gln
1205 1210 1215
Thr Pro Thr Ala Gln Ala Pro Ala Val Gln Ala Ser Ile Thr Gln
1220 1225 1230
Thr Ala Ala Lys Pro Ala Ala Met Ala Ala Pro Ala Pro Arg Ile
1235 1240 1245
Glu Pro Val Lys Ala Thr Ala Pro Val Ala Ala Pro Val Val Ala
1250 1255 1260
Pro Ala Val Ala Ala Ala Pro Ala Gly Leu Ser Ala Glu Thr Val
1265 1270 1275
Leu Asn Thr Met Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro
1280 1285 1290
Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly
1295 1300 1305
Ile Asp Ser Ile Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp
1310 1315 1320
Glu Leu Pro Thr Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu
1325 1330 1335
Cys Arg Thr Leu Gly Glu Ile Val Asp Tyr Met Asn Ser Lys Leu
1340 1345 1350
Pro Lys Ser Asp Ala Ser Gly Thr Gln Thr Gln Val Ala Pro Val
1355 1360 1365
Gln Ala Ala Ser Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met
1370 1375 1380
Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu
1385 1390 1395
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile
1400 1405 1410
Lys Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr
1415 1420 1425
Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu
1430 1435 1440
Gly Glu Ile Val Asp Tyr Met Asn Ser Lys Leu Pro Ala Ala Gly
1445 1450 1455
Ser Thr Pro Val Ala Ser Pro Val Gln Ser Ala Ala Pro Val Ser
1460 1465 1470
Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met Leu Glu Val Val
1475 1480 1485
Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser Met
1490 1495 1500
Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg Val Glu
1505 1510 1515
Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu Pro Glu Leu
1520 1525 1530
Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu Ile Val
1535 1540 1545
Asp Tyr Met Asn Ser Lys Leu Pro Thr Ser Ser Ala Ala Gly Ala
1550 1555 1560
Asn Thr Gln Ala Val Ala Pro Val Ala Gln Glu Ser Gly Leu Ser
1565 1570 1575
Ala Glu Thr Ala Leu Ser Ala Gln Glu Val Gln Ser Thr Met Met
1580 1585 1590
Thr Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu
1595 1600 1605
Leu Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys
1610 1615 1620
Arg Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu
1625 1630 1635
Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly
1640 1645 1650
Glu Ile Val Ser Tyr Met Asn Ser Lys Leu Pro Ala Ala Gly Ala
1655 1660 1665
Met Asn Ser Thr Ala Val Val Ala Gln Ala Ser Gly Leu Ser Ala
1670 1675 1680
Glu Thr Ala Leu Ser Ala Gln Glu Val Gln Ser Thr Met Met Thr
1685 1690 1695
Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu
1700 1705 1710
Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg
1715 1720 1725
Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Thr Leu Pro
1730 1735 1740
Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu
1745 1750 1755
Ile Val Ser Tyr Met Asn Ser Lys Leu Pro Ala Val Ser Ala Thr
1760 1765 1770
Thr Ala Ala Gly Thr Gln Thr Gln Ala Ala Ala Gly Ala Thr Gln
1775 1780 1785
Ala Ser Gly Leu Ser Ala Glu Gln Val Gln Ser Thr Met Met Thr
1790 1795 1800
Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu
1805 1810 1815
Ser Met Asp Met Glu Ala Asp Leu Gly Ile Asp Ser Ile Lys Arg
1820 1825 1830
Val Glu Ile Leu Gly Thr Val Gln Asp Glu Leu Pro Gly Leu Pro
1835 1840 1845
Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu
1850 1855 1860
Ile Val Ser Tyr Met Asn Ser Lys Leu Ser Thr Ser Ala Ala Glu
1865 1870 1875
Gly Ser Gln Pro Thr Leu Ser Ser Thr Asp Thr Ser Pro Ala Thr
1880 1885 1890
Ala Thr Ala Glu Leu Ala Thr Asp Leu Pro Pro His Gln Glu Val
1895 1900 1905
Ala Leu Lys Lys Leu Pro Ala Ala Asp Lys Leu Val Asp Val Phe
1910 1915 1920
Ser Lys Asp Ala Cys Ile Val Ile Asn Asp Asp Gly His Asn Ala
1925 1930 1935
Gly Val Leu Ala Glu Lys Leu Val Ala Thr Gly Leu Thr Val Ala
1940 1945 1950
Val Ile Arg Ser Pro Glu Ser Val Thr Ser Ala Gln Ser Pro Leu
1955 1960 1965
Ser Ser Asp Ile Ala Ser Phe Thr Leu Ser Ala Val Asn Asp Asp
1970 1975 1980
Ala Ile Ser Asp Val Ile Ala Gln Ile Ser Lys Gln His Lys Ile
1985 1990 1995
Ala Gly Phe Val His Leu Gln Pro Gln Leu Thr Ala Gln Gly Ala
2000 2005 2010
Leu Pro Leu Ser Asp Ala Gly Phe Val Ala Val Glu Gln Ala Phe
2015 2020 2025
Leu Met Ala Lys His Leu Gln Lys Pro Phe Ala Glu Leu Ala Lys
2030 2035 2040
Thr Glu Arg Val Ser Phe Met Thr Val Ser Arg Ile Asp Gly Gly
2045 2050 2055
Phe Gly Tyr Leu Asn Ser Asn Glu Leu Ala Lys Ala Glu Leu Asn
2060 2065 2070
Gln Ala Ala Leu Ser Gly Leu Thr Lys Thr Leu Gly His Glu Trp
2075 2080 2085
Pro Thr Val Phe Cys Arg Ala Leu Asp Ile Thr Pro Ser Phe Glu
2090 2095 2100
Ala Val Glu Leu Ala Gln Ala Val Ile Glu Glu Leu Phe Asp Leu
2105 2110 2115
Asp Thr Ala Thr Ala Glu Val Gly Ile Ser Asp Gln Gly Arg His
2120 2125 2130
Thr Leu Ser Ala Thr Thr Ala Ala Gln Thr Arg Tyr Gln Thr Thr
2135 2140 2145
Ser Leu Asn Asn Glu Asp Thr Val Leu Val Thr Gly Gly Ala Lys
2150 2155 2160
Gly Val Thr Phe Glu Cys Ala Leu Thr Leu Ala Lys Gln Thr Gln
2165 2170 2175
Ser His Phe Ile Leu Ala Gly Arg Ser Glu His Leu Ala Gly Asn
2180 2185 2190
Leu Pro Thr Trp Ala Gln Gly Lys Gln Ala Lys Glu Leu Lys Ala
2195 2200 2205
Ala Ala Ile Gly Phe Ile Gln Ser Gln Gly Asn Lys Pro Thr Pro
2210 2215 2220
Lys Gln Ile Asp Ala Leu Val Trp Pro Ile Thr Ser Ser Leu Glu
2225 2230 2235
Ile Asp Arg Ser Leu Ala Ala Phe Lys Ala Val Gly Ala Ser Ala
2240 2245 2250
Glu Tyr Ile Ser Met Asp Val Ser Ser Asp Ala Ala Ile Lys Gln
2255 2260 2265
Ser Leu Ala Gly Leu Lys Pro Ile Thr Gly Ile Ile His Gly Ala
2270 2275 2280
Gly Val Leu Ala Asp Lys His Ile Gln Asp Lys Thr Leu Ala Glu
2285 2290 2295
Leu Gly Arg Val Tyr Gly Thr Lys Val Ser Gly Phe Ala Gly Ile
2300 2305 2310
Ile Asn Ala Ile Asp Ala Ser Lys Leu Lys Leu Val Ala Met Phe
2315 2320 2325
Ser Ser Ala Ala Gly Phe Tyr Gly Asn Thr Gly Gln Ser Asp Tyr
2330 2335 2340
Ser Met Ser Asn Glu Ile Leu Asn Lys Thr Ala Leu Gln Leu Ala
2345 2350 2355
Ala Asn Tyr Pro Gln Ala Lys Val Met Ser Phe Asn Trp Gly Pro
2360 2365 2370
Trp Asp Gly Gly Met Val Ser Ser Ala Leu Lys Lys Met Phe Val
2375 2380 2385
Glu Arg Gly Val Tyr Val Ile Pro Leu Asp Lys Gly Ala Asn Leu
2390 2395 2400
Phe Ala His Ser Leu Leu Ser Glu Ser Gly Val Gln Leu Leu Ile
2405 2410 2415
Gly Ser Ser Met Gln Gly Ser Ser Ser Ala Ala Lys Thr Gly Ala
2420 2425 2430
Ala Val Lys Lys Leu Asn Ala Asp Ser Ser Leu Asn Ala Glu Gly
2435 2440 2445
Ser Leu Ile Leu Ser Phe Thr Ala Pro Asp Asn Arg Val Val Asn
2450 2455 2460
Asn Ala Val Thr Val Glu Arg Val Leu Asn Pro Val Ala Met Pro
2465 2470 2475
Phe Leu Glu Asp His Cys Ile Ala Gly Asn Pro Val Leu Pro Thr
2480 2485 2490
Val Cys Ala Ile Gln Trp Met Arg Glu Thr Ala Gln Lys Leu Cys
2495 2500 2505
Gly Leu Pro Val Thr Val Gln Asp Tyr Lys Leu Leu Lys Gly Ile
2510 2515 2520
Ile Phe Glu Thr Lys Glu Pro Gln Val Leu Thr Leu Thr Leu Thr
2525 2530 2535
Gln Thr Glu Ser Gly Leu Lys Ala Leu Ile Ala Ser Arg Met Gln
2540 2545 2550
Ser Asp Ala Val Asp Ser Leu Leu Arg Pro Gln Tyr Gln Ala Asn
2555 2560 2565
Leu Ile Val Asn Glu Lys Ile Val Asn Glu Lys Val Ala Lys Glu
2570 2575 2580
Ala Val Ser Thr Thr Leu Pro Thr Ala Ala Lys Asn Ala Gln Gln
2585 2590 2595
Leu Ala Ser Ser Gly Lys Val Ile Ser Thr Asp Ser Glu Leu Tyr
2600 2605 2610
Ser Asn Gly Ser Leu Phe His Gly Pro Arg Leu Gln Gly Ile Lys
2615 2620 2625
Gln Leu Leu Ile Ala Asn Asp Glu Gln Leu Val Cys Ser Val Glu
2630 2635 2640
Leu Pro Gln Ile Thr Ala Val Asp Cys Ala Ser Phe Thr Pro Gln
2645 2650 2655
Thr Gly Leu Gly Gly Ser Gln Ala Phe Ala Glu Asp Leu Leu Leu
2660 2665 2670
Gln Ala Met Leu Val Trp Ala Arg Ile Lys His Asp Ala Ala Ser
2675 2680 2685
Leu Pro Ser Thr Ile Gly Glu Leu Thr Thr Tyr Ala Pro Phe Ala
2690 2695 2700
Ser Gly Asp Lys Gly Tyr Leu Val Leu Thr Val Leu Lys Ser Thr
2705 2710 2715
Ser Arg Ser Leu Thr Ala Asp Ile Ala Leu Tyr His Gln Asp Gly
2720 2725 2730
Arg Leu Ser Cys Thr Met Leu Ser Ala Lys Thr Thr Ile Ser Lys
2735 2740 2745
Ser Leu Asn Glu Ala Phe Leu Ala Pro Ala Lys Ala Leu Ala Asp
2750 2755 2760
Leu Gln Glu Ser Val
2765
<210> 77
<211> 743
<212> PRT
<213> Sh. olleyana
<400> 77
Val Ser Asn Gln Leu Pro Pro Ser Thr Ser Ala Ile Lys Ser Met Arg
1 5 10 15
Ile Ala Leu Lys Met Val Ala Asn Glu Gln Val Ser Phe Ala Thr Ser
20 25 30
Ser Gly Asn Asp Phe Ser Ala Asn Ser Phe Ala Ala Ile Lys Pro Cys
35 40 45
Ser Leu Ala Glu Ala Ile Gly Ala Ser Ala Ile Asp Leu Glu Ile Asp
50 55 60
Val Ser Ser Leu Asp Ala Ser Leu Ser Glu Asn Ala Val Asn Lys Ala
65 70 75 80
Leu Ser Phe Asn Asp Tyr Phe Ala Gln Ala Ile Ile His Ile Glu Gln
85 90 95
Gln His Thr Val Leu Leu Ser His Pro Glu Leu Pro Tyr Arg Leu Leu
100 105 110
Met Met Pro Ala Ile Val Ala Ala Lys His Arg Cys His Pro His Ala
115 120 125
Tyr Leu Thr Gly Leu Gly Glu Ala Asp Asp Met Pro Ser Ala Ile Asn
130 135 140
Ala Ala Leu Val Gln Ala Lys Arg Ala His Ile Lys Pro Thr His Val
145 150 155 160
Asp Ala Thr Gln Leu Thr Cys Tyr Lys Asp Lys Phe Ala Gln Leu Val
165 170 175
Met Leu Ile Gly Ser Ile Ala Thr Arg Ser Val Pro Asn Thr Val Ser
180 185 190
Glu Asn Gln Ser Ala Asp Ala Gln Tyr Trp Phe Thr Glu Met His Gln
195 200 205
Asn Arg Val Ala Ser Phe Asn Phe Ser Glu Gly Asn Lys Gln His Ser
210 215 220
Ala Val Phe Val Gln Gly Thr Glu Leu Ala Gln Ala Ser Ser Leu Val
225 230 235 240
Asp Asp Asn Arg Leu Phe Leu Pro Val Ser Ala Asn Asp Leu Gly Met
245 250 255
Met Lys Gln Gln Leu Gln Ala Leu Ser Ser Gln Leu Ala Ala Leu Pro
260 265 270
Ala Gln His Asp Lys Ser Asp Ser Ser Ala Ile Ser Phe Met Leu Ser
275 280 285
Gln Leu Lys Gln Phe Asp Gln Thr Gln Pro Leu Ser Ala Val Val Met
290 295 300
Ala Asn Ser Val Thr Asn Ala Val Ser Glu Ile Asn Val Met Leu Ser
305 310 315 320
Thr Ile Gly Lys Ala Glu Ala Thr Ala Ala Asn Glu Val Gln Ala Lys
325 330 335
Ser Asn Leu Ser Ile Glu His Lys Thr Pro Ser Gly Ser Cys Phe His
340 345 350
Leu Thr Ser Asp Lys Val Leu Gly Asn Asn Gly Leu Cys Phe Val Tyr
355 360 365
Pro Gly Val Gly Thr Val Tyr Pro Gln Met Phe Ala Gln Leu Pro Arg
370 375 380
Tyr Phe Pro Ala Leu Phe Ala Gln Leu Glu Arg Asp Gly Asp Val Lys
385 390 395 400
Ala Met Leu Gln Ala Asp Ser Ile Tyr Ala Glu Asn Ala Lys Thr Thr
405 410 415
Asp Met Ser Leu Gly Glu Leu Ala Ile Ala Gly Val Gly Ala Ser Tyr
420 425 430
Ile Leu Thr Lys Val Leu Thr Glu His Phe Gly Ile Lys Pro Asn Phe
435 440 445
Ala Met Gly Tyr Ser Met Gly Glu Ala Ser Met Trp Ala Ser Leu Asp
450 455 460
Val Trp Lys Thr Pro His Asn Met Ile Glu Ala Thr Gln Thr Asn Ser
465 470 475 480
Ile Phe Thr Thr Asp Ile Ser Gly Arg Leu Asp Cys Val Arg Gln Ala
485 490 495
Trp Gln Leu Glu His Gly Glu Asp Ile Val Trp Asn Ser Phe Val Val
500 505 510
Arg Ala Ala Pro Ala Asp Ile Glu Lys Val Leu Ala Asp Phe Pro Arg
515 520 525
Ala Tyr Leu Ala Ile Ile Gln Gly Asp Thr Cys Val Leu Ala Gly Cys
530 535 540
Glu Glu Ser Cys Lys Ala Leu Leu Lys Gln Ile Gly Lys Arg Gly Ile
545 550 555 560
Ala Ala Asn Arg Val Thr Ala Met His Thr Lys Pro Ala Met Leu Ile
565 570 575
Arg Asp Asn Val Gln Ala Phe Tyr Gln Gln Pro Leu His Glu Gln Asp
580 585 590
Val Ile Ala Pro Phe Ala Ser Gln Ile Lys Phe Ile Ser Ala Ala Ser
595 600 605
Gln Ser Pro Ile Asn Leu Thr Ser Glu Ala Ile Ala Thr Ser Ile Ala
610 615 620
Asp Thr Phe Cys Gln Pro Leu Asp Phe Thr Gln Leu Val Asn Asn Ala
625 630 635 640
Arg His Leu Gly Ala Ser Leu Phe Val Glu Ile Gly Ala Asp Arg Gln
645 650 655
Thr Thr Thr Leu Ile Asp Lys Ile Ser Arg Thr Ser Glu Met Ala Gln
660 665 670
Thr Cys Gln Ala Ile Ser Val Asn Ala Lys Gly Asp Asp Gln Thr Ala
675 680 685
Leu Leu Lys Cys Ile Ala Gln Leu Ile Thr His Lys Thr Pro Ile Ser
690 695 700
Leu Asp Tyr Leu Thr Glu Thr Leu Ser Ser Leu Leu Thr Thr Thr Leu
705 710 715 720
Ala Ala Glu Lys Arg Ser Asn His His Thr Gly Asn Met Leu Ala Pro
725 730 735
Gln Leu Glu Gly Glu Gln Ser
740
<210> 78
<211> 2020
<212> PRT
<213> Sh. olleyana
<400> 78
Leu Ser Ser Gln Ser Thr Asn Leu Asn Thr Thr Val Pro Lys Ile Ala
1 5 10 15
Ile Val Gly Leu Ala Thr Gln Tyr Pro Asp Ala Asp Thr Pro Ala Lys
20 25 30
Phe Trp Gln Asn Leu Leu Asp Lys Lys Asp Ser Arg Ser Thr Ile Asn
35 40 45
Ser Gln Lys Leu Asn Ala Asn Pro Ala Asp Tyr Gln Gly Val Gln Gly
50 55 60
Glu Ser Asp Arg Phe Tyr Cys Asp Lys Gly Gly Tyr Ile Gln Asn Phe
65 70 75 80
Ser Phe Asp Ala Asn Gly Tyr Arg Ile Pro Ala Glu Gln Phe Ser Gly
85 90 95
Leu Asp Asp Ser Phe Leu Trp Ala Thr Asp Thr Ala Arg Lys Ala Leu
100 105 110
Asn Asp Ala Gly Val Asp Ile Thr Asn Pro Gln Asn Asn Gly Ala Leu
115 120 125
Asn Arg Thr Gly Ile Val Met Gly Thr Leu Ser Phe Pro Thr Ala Lys
130 135 140
Ser Asn Glu Leu Phe Val Pro Ile Tyr His Ser Ala Val Glu Lys Ala
145 150 155 160
Leu Gln Asp Lys Leu Gln Gln Pro Ser Phe Thr Leu Gln Pro Phe Asp
165 170 175
Ser Glu Gly Tyr Ser Gln Gln Thr Thr Ser Ala Ser Leu Ser Asn Gly
180 185 190
Ala Ile Ala His Asn Ala Ser Lys Leu Val Ala Asp Ala Leu Gly Leu
195 200 205
Gly Ala Ala Gln Leu Ser Leu Asp Ala Ala Cys Ala Ser Ser Val Tyr
210 215 220
Ser Leu Lys Leu Ala Cys Asp Tyr Leu His Thr Gly Lys Ala Asp Met
225 230 235 240
Met Leu Ala Gly Ala Val Ser Gly Ala Asp Pro Phe Phe Ile Asn Met
245 250 255
Gly Phe Ser Ile Phe His Ala Tyr Pro Asp His Gly Ile Ser Ala Pro
260 265 270
Phe Asp Ser Asn Ser Lys Gly Leu Phe Ala Gly Glu Gly Ala Gly Val
275 280 285
Leu Val Leu Lys Arg Leu Glu Asp Ala Glu Arg Asp Gly Asp His Ile
290 295 300
Tyr Ala Leu Val Ser Gly Ile Gly Leu Ser Asn Asp Gly Lys Gly Gln
305 310 315 320
Phe Val Leu Ser Pro Asn Ser Asp Gly Gln Val Lys Ala Phe Glu Arg
325 330 335
Ala Tyr Ala Asp Ala Ala Met His Asp Glu Asn Phe Gly Pro Asn Asn
340 345 350
Ile Glu Val Leu Glu Cys His Ala Thr Gly Thr Pro Leu Gly Asp Lys
355 360 365
Val Glu Leu Thr Ser Met Glu Arg Phe Phe Ser Asp Lys Leu Asn Gly
370 375 380
Ser Asn Thr Pro Leu Ile Gly Ser Ala Lys Ser Asn Leu Gly His Leu
385 390 395 400
Leu Thr Ala Ala Gly Met Pro Gly Ile Met Lys Met Ile Phe Ala Met
405 410 415
Arg Gln Gly Val Leu Pro Pro Ser Ile Asn Ile Ser Ala Pro Ile Ala
420 425 430
Ser Pro Ser Glu Met Phe Gly Pro Ala Thr Leu Pro Asn Asp Val Leu
435 440 445
Pro Trp Pro Asp Lys Ala Gly Asn Thr Ala Arg His Ala Gly Val Ser
450 455 460
Val Phe Gly Phe Gly Gly Cys Asn Ala His Leu Leu Val Glu Ser Tyr
465 470 475 480
Phe Ala Lys Ser His Gly Gln Pro Ser Ser Thr Glu Leu Val Lys Pro
485 490 495
Ala Thr Thr Thr Ile Asn Ala Gln Met Pro Met His Ile Thr Gly Met
500 505 510
Ala Ser His Phe Gly Ser Leu Ser Asn Val Asn Asp Phe Ala Asp Ala
515 520 525
Val Asn Asn Asn Gln Thr Ala Phe Thr Ser Leu Pro Ala Lys Arg Trp
530 535 540
Lys Gly Leu Asp Lys His Pro Glu Leu Leu Gln Lys Phe Gly Leu Ser
545 550 555 560
Gln Ala Ala Pro Thr Gly Ala Tyr Ile Asp Gln Phe Asp Phe Asp Phe
565 570 575
Leu Arg Phe Lys Val Pro Pro Asn Glu Asp Asp Arg Leu Ile Ser Gln
580 585 590
Gln Leu Leu Leu Met Lys Val Ala Asp Glu Ala Ile His Asp Ala Lys
595 600 605
Leu Glu Ser Gly Ser Lys Val Ala Val Leu Val Ala Met Glu Thr Glu
610 615 620
Leu Glu Leu His Gln Phe Arg Gly Arg Val Asn Leu His Thr Gln Ile
625 630 635 640
Ala Ala Ser Leu Thr Ala His Gly Val Ser Leu Ser Asp Ser Glu Tyr
645 650 655
Gln Ala Leu Glu Thr Ile Ala Met Asp Ser Val Leu Asp Ala Ala Lys
660 665 670
Leu Asn Gln Tyr Thr Ser Phe Ile Gly Asn Ile Met Ala Ser Arg Ile
675 680 685
Ser Ser Leu Trp Asp Phe Asn Gly Pro Ala Phe Thr Ile Ser Ala Gly
690 695 700
Glu Gln Ser Val Asn Arg Cys Ile Asp Val Ala Gln Asn Leu Leu Ala
705 710 715 720
Met Glu Ser Arg Gln Glu Pro Leu Asp Ala Ala Ile Ile Ala Ala Val
725 730 735
Asp Leu Ser Gly Ser Ile Glu Asn Ile Val Leu Lys Thr Ala Asn Ile
740 745 750
Asn Lys Thr Gly Ser Thr Glu Ala Leu Asn Ile Gly Glu Gly Ala Gly
755 760 765
Ala Ile Val Leu Gln Ala Ala Ala Ile Asp Ser Glu His Cys Asp Leu
770 775 780
Ile His Gln Gly Leu Gly Ala Leu Asp Thr Leu Asp Ser Ala Ser Thr
785 790 795 800
His Ser Tyr Gly Thr Ile Asp Ser Leu Ala Phe Gly His Thr Asp Gln
805 810 815
Leu Ser Thr Ile Ser Asp Asp Val Leu Thr Pro Val Gly Leu Ala Ala
820 825 830
Thr Asp Ile Asp Leu Leu Glu Leu Asn Gln Ala Pro Asp Leu Leu Asn
835 840 845
Ile Asp Asn Ala Gln Met Leu Ser Gln Leu Phe Asn Gln Ser Ser Thr
850 855 860
Ser Lys Ala Gln Ser Cys Ile Gly His Thr Phe Ala Ala Ser Gly Ile
865 870 875 880
Ala Ser Leu Leu His Gly Leu Leu Lys Thr Arg Leu Asn Ala Ser Val
885 890 895
Gln Asn Ala Asn Ser Asp Ser Lys Leu Ser Asn Lys Pro Asn Gln Lys
900 905 910
Ala Ile Ile Ala Thr Leu Ser Glu Asn Gln Cys Ser Gln Leu Leu Ile
915 920 925
Ser Gln Asn Ala Glu Gln Ala Ser Ala Met Ser Thr Arg Ile Asp Thr
930 935 940
Asp Ile Gln Ala Gln Thr Ala Lys Lys Leu Ser Leu Val Lys Gln Val
945 950 955 960
Ser Leu Gly Gly Arg Asp Ile Tyr Gln His Ile Val Asp Ala Pro Leu
965 970 975
Ala Asn Ile Asp Ser Ile Arg Ala Lys Val Ala Lys Leu Asn Pro Val
980 985 990
Ala Pro Thr Thr Val Met Asn Leu His Asp Arg Gly Gln Phe Ile Ala
995 1000 1005
Pro Ala His Ala Asn Ser Ala Pro Met Ser Ala Asn Asn Asn Ser
1010 1015 1020
Met Thr Thr Glu Thr Ser Met Pro Phe Ser Asp Arg Ser Thr Gln
1025 1030 1035
Phe Asn Pro Thr Pro Lys Val Ala Thr Pro Thr Ala Leu Ser Thr
1040 1045 1050
Gln Ala Ala Gln Ala Thr Gln Ser Ala Gln Thr Ser Ser Val Thr
1055 1060 1065
Ser Ser Val Ala Ala Ile Ser Gln Val Pro Pro Thr His Leu Ser
1070 1075 1080
Ala Phe Glu Gln Asn Gln Trp Leu Ala His Gln Ala Gln Leu Ala
1085 1090 1095
Phe Leu Lys Ser Arg Glu Gln Gly Leu Lys Val Ala Asp Ala Leu
1100 1105 1110
Leu Lys Gln Glu Ile Ala Gln Ala Asn Gly Gln Pro Tyr Val Ala
1115 1120 1125
Gln Ser Thr Ala Gln Ala Val Ala Pro Val Gln Ala Ala Asn Val
1130 1135 1140
Leu Ala Gln Pro Ile Ala Ser Ala Ser Ile Leu Arg Pro Asp His
1145 1150 1155
Ala Asn Val Pro Pro Tyr Thr Ala Pro Ile Pro Ala Asn Lys Pro
1160 1165 1170
Cys Ile Trp Asn Tyr Ala Asp Leu Val Glu Tyr Ala Glu Gly Asp
1175 1180 1185
Ile Ala Lys Val Phe Gly Pro Asp Tyr Ala Val Ile Asp Asn Tyr
1190 1195 1200
Ser Arg Arg Val Arg Leu Pro Thr Thr Asp Tyr Leu Leu Val Ser
1205 1210 1215
Arg Val Thr Lys Leu Asp Ala Thr Met Asn Gln Tyr Lys Pro Cys
1220 1225 1230
Ser Met Thr Thr Glu Tyr Asp Ile Pro Glu Asp Ala Pro Tyr Leu
1235 1240 1245
Val Asp Gly Gln Ile Pro Trp Ala Val Ala Val Glu Ser Gly Gln
1250 1255 1260
Cys Asp Leu Met Leu Ile Ser Tyr Leu Gly Ile Asp Phe Glu Asn
1265 1270 1275
Lys Gly Glu Arg Val Tyr Arg Leu Leu Asp Cys Thr Leu Thr Phe
1280 1285 1290
Leu Gly Asp Leu Pro Arg Gly Gly Asp Thr Leu Arg Tyr Asp Ile
1295 1300 1305
Lys Ile Asn Asn Phe Ala Lys Asn Gly Glu Thr Leu Leu Phe Phe
1310 1315 1320
Phe Ser Tyr Glu Cys Phe Val Gly Asp Lys Met Val Leu Lys Met
1325 1330 1335
Asp Gly Gly Cys Ala Gly Phe Phe Thr Asp Gln Glu Leu Asp Asp
1340 1345 1350
Gly Lys Gly Val Ile Tyr Thr Glu Asp Glu Ile Lys Thr Arg Glu
1355 1360 1365
Ala Ala Leu Asn Thr Pro Asn Lys Pro Arg Phe Glu Pro Leu Leu
1370 1375 1380
His Cys Ala Gln Thr Gln Phe Asp Tyr Gly Gln Ile His His Leu
1385 1390 1395
Leu Asn Ala Asp Ile Gly Ser Cys Phe Ala Gly Glu His His Asn
1400 1405 1410
His Gln Gln Ala Ser Gly Lys Gln Asp Ser Leu Cys Phe Ala Ser
1415 1420 1425
Glu Lys Phe Leu Met Ile Glu Gln Val Gly Asn Leu Glu Val His
1430 1435 1440
Gly Gly Ala Trp Gly Leu Gly Phe Ile Glu Gly His Lys Gln Leu
1445 1450 1455
Ala Pro Asp His Trp Tyr Phe Pro Cys His Phe Gln Gly Asp Gln
1460 1465 1470
Val Met Ala Gly Ser Leu Met Ala Glu Gly Cys Gly Gln Leu Leu
1475 1480 1485
Gln Phe Phe Met Leu His Ile Gly Met His Thr Leu Val Glu Asn
1490 1495 1500
Gly Arg Phe Gln Pro Leu Glu Asn Ala Ser Gln Lys Val Arg Cys
1505 1510 1515
Arg Gly Gln Val Leu Pro Gln His Gly Glu Leu Thr Tyr Arg Met
1520 1525 1530
Glu Val Thr Glu Ile Gly Thr His Pro Arg Pro Tyr Ala Lys Ala
1535 1540 1545
Asn Ile Glu Ile Leu Leu Asn Gly Lys Ala Val Val Asp Phe Gln
1550 1555 1560
Asn Leu Gly Val Met Ile Lys Glu Glu Gly Glu Cys Thr Arg Tyr
1565 1570 1575
Thr Ala Asp Ser Thr Glu Thr His Thr Thr Ser Gly Thr Val Gln
1580 1585 1590
Lys Asn Asn Ser His Asn Thr Pro Ala Ser Leu Asn Ala Pro Leu
1595 1600 1605
Met Ala Gln Val Pro Asp Leu Ser Glu Pro Ala Asn Lys Gly Val
1610 1615 1620
Ile Pro Leu Gln His Val Glu Ala Pro Met Leu Pro Asp Tyr Pro
1625 1630 1635
Asn Arg Thr Pro Asp Thr Leu Pro Phe Thr Ala Tyr His Met Phe
1640 1645 1650
Glu Phe Ala Thr Gly Asp Ile Glu Asn Cys Phe Gly Pro Asp Phe
1655 1660 1665
Ser Ile Tyr Arg Gly Phe Ile Pro Pro Arg Thr Pro Cys Gly Asp
1670 1675 1680
Leu Gln Leu Thr Thr Arg Val Val Asp Ile Gln Gly Lys Arg Gly
1685 1690 1695
Glu Leu Lys Lys Pro Ser Ser Cys Ile Ala Glu Tyr Glu Val Pro
1700 1705 1710
Thr Asp Ala Trp Tyr Phe Ala Lys Asn Ser His Ala Ser Val Met
1715 1720 1725
Pro Tyr Ser Val Leu Met Glu Ile Ser Leu Gln Pro Asn Gly Phe
1730 1735 1740
Ile Ser Gly Tyr Met Gly Thr Thr Leu Gly Phe Pro Gly Gln Glu
1745 1750 1755
Leu Phe Phe Arg Asn Leu Asp Gly Ser Gly Glu Leu Leu Cys Asp
1760 1765 1770
Val Asp Leu Arg Gly Lys Thr Ile Val Asn Asp Ser Lys Leu Leu
1775 1780 1785
Ser Thr Val Ile Ala Gly Ser Asn Ile Ile Gln Ser Phe Ser Phe
1790 1795 1800
Asp Leu Ser Val Asp Gly Glu Pro Phe Tyr Thr Gly Ser Ala Val
1805 1810 1815
Phe Gly Tyr Phe Lys Gly Asp Ala Leu Lys Asn Gln Leu Gly Ile
1820 1825 1830
Asp Asn Gly Arg Ile Thr Gln Pro Trp His Val Glu Asn Asn Val
1835 1840 1845
Ala Ala Asp Ile Thr Val Asp Leu Leu Asp Lys Gln Ser Arg Val
1850 1855 1860
Phe His Ala Pro Ala Asn Gln Pro His Tyr Arg Leu Ala Gly Gly
1865 1870 1875
Gln Leu Asn Phe Ile Asp Lys Ala Glu Ile Val Asp Lys Gly Gly
1880 1885 1890
Lys Asn Gly Leu Gly Tyr Leu Ser Ala Ser Arg Thr Ile Asp Pro
1895 1900 1905
Ser Asp Trp Phe Phe Gln Phe His Phe His Gln Asp Pro Val Met
1910 1915 1920
Pro Gly Ser Leu Gly Val Glu Ala Ile Ile Glu Leu Met Gln Thr
1925 1930 1935
Tyr Ala Ile Ser Lys Asp Leu Gly Lys Gly Phe Thr Asn Pro Lys
1940 1945 1950
Phe Gly Gln Ile Leu Ser Asp Ile Lys Trp Lys Tyr Arg Gly Gln
1955 1960 1965
Ile Asn Pro Leu Asn Lys Gln Met Ser Leu Asp Val His Ile Ser
1970 1975 1980
Ala Val Lys Asp Glu Asn Gly Lys Arg Ile Ile Val Gly Asp Ala
1985 1990 1995
Asn Leu Ser Lys Asp Gly Leu Arg Ile Tyr Glu Val Lys Asp Ile
2000 2005 2010
Ala Ile Cys Ile Glu Glu Ala
2015 2020
<210> 79
<211> 542
<212> PRT
<213> Sh. olleyana
<400> 79
Met Thr Ile Ser Thr Gln Asn Glu Lys Leu Ser Pro Trp Pro Trp Gln
1 5 10 15
Val Ala Pro Ser Asp Ala Ser Phe Glu Asn Ala Ala Ile Gly Lys Lys
20 25 30
Leu Lys Glu Leu Ser Gln Ala Cys Tyr Leu Ile Asn His Pro Glu Lys
35 40 45
Gly Leu Gly Ile Ser Gln Asn Ala Gln Val Met Thr Glu Ser Met Asn
50 55 60
Ser Gln Gln Asp Leu Pro Val Ser Ala Phe Ala Pro Ala Leu Gly Thr
65 70 75 80
Gln Ser Leu Gly Asp Ser Asn Phe Arg Arg Val His Gly Val Lys Tyr
85 90 95
Ala Tyr Tyr Ala Gly Ala Met Ala Asn Gly Ile Ser Ser Glu Glu Leu
100 105 110
Val Ile Ala Leu Gly Gln Ala Gly Ile Leu Cys Ser Phe Gly Ala Ala
115 120 125
Gly Leu Ile Pro Ser Arg Val Glu Gln Ala Ile Asn Arg Ile Gln Thr
130 135 140
Ala Leu Pro Asn Gly Pro Tyr Met Phe Asn Leu Ile His Ser Pro Ser
145 150 155 160
Glu Pro Ala Leu Glu Arg Gly Ser Val Glu Leu Phe Leu Lys His Lys
165 170 175
Val Arg Thr Val Glu Ala Ser Ala Phe Leu Gly Leu Thr Pro Gln Ile
180 185 190
Val Tyr Tyr Arg Ala Ala Gly Leu Ser Arg Asp Ala Gln Gly Glu Val
195 200 205
Val Ile Ala Asn Lys Val Ile Ala Lys Val Ser Arg Thr Glu Val Ala
210 215 220
Ser Lys Phe Met Gln Pro Ala Pro Ala Lys Met Leu Gln Lys Leu Val
225 230 235 240
Asp Glu Gly Leu Ile Thr Pro Glu Gln Met Glu Leu Ala Gln Leu Val
245 250 255
Pro Met Ala Asp Asp Val Thr Ala Glu Ala Asp Ser Gly Gly His Thr
260 265 270
Asp Asn Arg Pro Leu Val Thr Leu Leu Pro Thr Ile Leu Ala Leu Lys
275 280 285
Asp Lys Ile Gln Ala Glu Tyr Gln Tyr Lys Thr Pro Ile Arg Val Gly
290 295 300
Cys Gly Gly Gly Val Gly Thr Pro Asp Ala Ala Leu Ala Thr Phe Asn
305 310 315 320
Met Gly Ala Ala Tyr Ile Val Thr Gly Ser Ile Asn Gln Ala Cys Val
325 330 335
Glu Ala Gly Ala Ser Glu His Thr Arg Lys Leu Leu Ala Thr Thr Glu
340 345 350
Met Ala Asp Val Thr Met Ala Pro Ala Ala Asp Met Phe Glu Met Gly
355 360 365
Val Lys Leu Gln Val Val Lys Arg Gly Thr Leu Phe Pro Met Arg Ala
370 375 380
Asn Lys Leu Tyr Glu Ile Tyr Thr Arg Tyr Glu Ser Ile Glu Ala Ile
385 390 395 400
Pro Ala Glu Glu Arg Glu Lys Leu Glu Lys Gln Val Phe Arg Ser Thr
405 410 415
Leu Asp Asp Ile Trp Ala Gly Thr Val Ala His Phe Asn Glu Arg Asp
420 425 430
Pro Lys Gln Ile Glu Arg Ala Glu Gly Asn Pro Lys Arg Lys Met Ala
435 440 445
Leu Ile Phe Arg Trp Tyr Leu Gly Leu Ser Ser Arg Trp Ser Asn Ser
450 455 460
Gly Glu Val Gly Arg Glu Met Asp Tyr Gln Ile Trp Ala Gly Pro Ala
465 470 475 480
Leu Gly Ala Phe Asn Glu Trp Ala Lys Gly Ser Tyr Leu Asp Asp Tyr
485 490 495
Thr Gln Arg Asn Ala Val Asp Leu Ala Lys His Leu Met His Gly Ala
500 505 510
Ala Tyr Gln Ala Arg Val Asn Leu Leu Thr Ala Gln Gly Val Ala Leu
515 520 525
Pro Val Glu Leu Gln Arg Trp Ser Pro Leu Asp Gln Val Lys
530 535 540
<210> 80
<211> 290
<212> PRT
<213> Sh. olleyana
<400> 80
Leu Lys Pro Pro Thr Val Ile Gln Leu Phe Phe Cys Pro Leu Asn Thr
1 5 10 15
Asp Leu Leu Asp Glu Ser Thr Ala Ser Ile Val Arg Ser Trp Leu Pro
20 25 30
Glu Asp Glu Val Lys Lys Val Asp Arg Phe Ile Gln Gln Ser Ser Arg
35 40 45
Glu Gln Gly Leu Met Val Arg Gly Tyr Leu Arg Ser Val Leu Ser Arg
50 55 60
Phe Ala Ser Val Glu Pro Gln Gln Trp Gln Phe Glu Tyr Gly Glu Lys
65 70 75 80
Gly Lys Pro Arg Leu Thr Ala Glu Gln Phe Ala Gln Thr Gly Leu Gln
85 90 95
Phe Asn Leu Ser His Ser Gly Asp Trp Leu Leu Ile Gly Val Ala Asn
100 105 110
Thr Tyr Gly Thr Ala Gln Gln Gln Thr Asp Ile Glu Leu Gly Val Asp
115 120 125
Ile Glu Arg Arg Arg Glu Thr Thr Asn Ile His Ser Ile Leu Asn His
130 135 140
Tyr Phe Ser Lys Pro Glu Glu Ser Ala Leu Leu Ala Leu Ala Glu Asp
145 150 155 160
Lys His Arg Glu Arg Phe Phe Asp Leu Trp Ala Leu Lys Glu Ser Tyr
165 170 175
Ile Lys Ala Lys Gly Leu Gly Leu Ala Leu Ser Leu Lys Ser Phe Ala
180 185 190
Phe Asp Leu Ser Ala Ser Ser Val Gly Glu Leu Gln Val Asn Ser Glu
195 200 205
Thr Ile Thr Ile Gln Gln Asn Val Lys Leu Ser Leu Leu Lys Ala Ser
210 215 220
Asp Ser Asp Gly Leu Leu Glu Asp Phe Val Ile Ala Pro Gln Trp His
225 230 235 240
Cys Tyr Leu Gly Lys Leu Asp Asp Leu Tyr Arg Phe Ala Val Ser Val
245 250 255
Gly Arg Ala Ser Thr Asn Ser Asp Glu Leu Pro Pro Glu Leu Lys Ala
260 265 270
Lys Lys Ile Ser Trp Leu Glu Val Val Asn His Ala Phe Lys Pro Thr
275 280 285
Asp Arg
290
<210> 81
<211> 35
<212> PRT
<213> Brassica napus
<400> 81
Met Leu Lys Leu Ser Cys Asn Val Thr Asn His Leu His Thr Phe Ser
1 5 10 15
Phe Phe Ser Asp Ser Ser Leu Phe Ile Pro Val Asn Arg Arg Thr Leu
20 25 30
Ala Val Ser
35
<210> 82
<211> 2004
<212> DNA
<213> Schizochytrium sp.
<400> 82
atggctaccg gcggcaagat gagcatcgag gtgcccggat cggcacggcc cgacctgggc 60
tttggcgcga tccggagatc gatcatcgag accggcccgc agaccacgtt gaacggacat 120
cgtagcctct acgaggtctt tcgcctggct gcagagacgc acggctcgcg aaagtgtctt 180
ggacgcaggg tcacgctccc gaacggccag ctcggcggct tcgacgagtg gaccacatac 240
ggagaagctc tcgaccgcgc gcacaacttt ggcgccggtc ttaccaacct tgggctgtgc 300
acgcccaaca ccgacggtct ccagctcctt ggctttttcg gcaagaaccg tcccgaatgg 360
gttattggcg acattggctg ctactcgcag ggaattgtcc ccgtgcccat gtacgacacg 420
ctcggcgcag atagcgtcga gtacgtggtg cgccagacgg agctcaagac catgttttgc 480
acgatggaag agctcgagcg cgtctgcgag gtcgcgcaaa aggatctcct tggcgcagcc 540
attctcatgg acggcgaatt tttcgacgag gctgacgtga tgcgcgcacg ccagcaggcc 600
gaggcaagtg gtctcaagct ctacacggta cgcgaggtcg aggccgtcgg caaggagaac 660
ccggcgccct tggtccttcc gcggggcgaa gacgtggcct tcttttgcta cacgagtggc 720
accacgggcg accccaaggg cgccctcatc cggcattcgg gtctcctgag ctgcatggcc 780
tcctttcgcg atgtgggcct catcatgacc catgaggatg tctacctttc gtacctcccg 840
ctcccgcatg tctttgagcg cggatgcctg tacacggcgc tgagtggcgg tgccgcggtc 900
ggcttttacg gcggtgacac gcagctcatc gtcgaggacc tcgtggctct gcgccccacg 960
ctcttcccct cggtaccgcg tctctacaac cgcatctacg acaagcttcg cgccggcgtt 1020
gatgaggccg gcggcgtcaa gaagtggctc tttgagaagg ctctcgctgc caaaaaggag 1080
ggtttgcgcg ctgggcgtta cacgcacccg gtatgggatc gtcttgtctt caactcggtc 1140
aaggccaagg tcggtctcga ccgtgcgcgc atcatgtgca cgggctctgc tccgatctca 1200
agccacgttc tcgagttcct ccgtgccgtc tttggctgcc ccgtcctcga gggctatggg 1260
cagaccgagt cctcgcttct catttcggtg ccccttatga acgatactac actcaaccac 1320
gtcggcattc cggccccctg ctgcgagatt cgtctcgagg atgtcgctga catgggctac 1380
cgcgccactg acaagaagca taatggcgag gcttgcgagg gtcgcggcga aatctgcttt 1440
cgtgggccca acaactttaa ggagtactac cgcatgccgg aaaagacggc cgagaccatt 1500
gacgaggacg gctgggtgca cacgggagac attggtctct ggaccccaga gggtcgactc 1560
cgtatcattg accgcaagaa gaacatcttc aagcttgcgc agggcgagta cgttgctgct 1620
gagaagatcg agaacattat gcttcgctcg ccgctcgccg cccaaatctt tgtctacggc 1680
gactctcttc agagctgcct tgtggccatt gttgttccgg atgcggatgc gcttcaaacg 1740
cgcggcatgg ctgtcgacga tccggccacc aagcaggcca tttttgacag tgtggtcaag 1800
gaggcgcgcg acgccgcgct caatggctac gagatcccca agcgcattca cattagcccg 1860
caggagctga acatgttgcc tgagcgcaac ggcctcacca cgctgcttac gccgaccttt 1920
aagcttgtgc gcaacaaggc caaggactac tttgctccgg agatcgacgc catgtacgcc 1980
gacatcaact ccacttccaa gctc 2004
<210> 83
<211> 668
<212> PRT
<213> Schizochytrium sp.
<400> 83
Met Ala Thr Gly Gly Lys Met Ser Ile Glu Val Pro Gly Ser Ala Arg
1 5 10 15
Pro Asp Leu Gly Phe Gly Ala Ile Arg Arg Ser Ile Ile Glu Thr Gly
20 25 30
Pro Gln Thr Thr Leu Asn Gly His Arg Ser Leu Tyr Glu Val Phe Arg
35 40 45
Leu Ala Ala Glu Thr His Gly Ser Arg Lys Cys Leu Gly Arg Arg Val
50 55 60
Thr Leu Pro Asn Gly Gln Leu Gly Gly Phe Asp Glu Trp Thr Thr Tyr
65 70 75 80
Gly Glu Ala Leu Asp Arg Ala His Asn Phe Gly Ala Gly Leu Thr Asn
85 90 95
Leu Gly Leu Cys Thr Pro Asn Thr Asp Gly Leu Gln Leu Leu Gly Phe
100 105 110
Phe Gly Lys Asn Arg Pro Glu Trp Val Ile Gly Asp Ile Gly Cys Tyr
115 120 125
Ser Gln Gly Ile Val Pro Val Pro Met Tyr Asp Thr Leu Gly Ala Asp
130 135 140
Ser Val Glu Tyr Val Val Arg Gln Thr Glu Leu Lys Thr Met Phe Cys
145 150 155 160
Thr Met Glu Glu Leu Glu Arg Val Cys Glu Val Ala Gln Lys Asp Leu
165 170 175
Leu Gly Ala Ala Ile Leu Met Asp Gly Glu Phe Phe Asp Glu Ala Asp
180 185 190
Val Met Arg Ala Arg Gln Gln Ala Glu Ala Ser Gly Leu Lys Leu Tyr
195 200 205
Thr Val Arg Glu Val Glu Ala Val Gly Lys Glu Asn Pro Ala Pro Leu
210 215 220
Val Leu Pro Arg Gly Glu Asp Val Ala Phe Phe Cys Tyr Thr Ser Gly
225 230 235 240
Thr Thr Gly Asp Pro Lys Gly Ala Leu Ile Arg His Ser Gly Leu Leu
245 250 255
Ser Cys Met Ala Ser Phe Arg Asp Val Gly Leu Ile Met Thr His Glu
260 265 270
Asp Val Tyr Leu Ser Tyr Leu Pro Leu Pro His Val Phe Glu Arg Gly
275 280 285
Cys Leu Tyr Thr Ala Leu Ser Gly Gly Ala Ala Val Gly Phe Tyr Gly
290 295 300
Gly Asp Thr Gln Leu Ile Val Glu Asp Leu Val Ala Leu Arg Pro Thr
305 310 315 320
Leu Phe Pro Ser Val Pro Arg Leu Tyr Asn Arg Ile Tyr Asp Lys Leu
325 330 335
Arg Ala Gly Val Asp Glu Ala Gly Gly Val Lys Lys Trp Leu Phe Glu
340 345 350
Lys Ala Leu Ala Ala Lys Lys Glu Gly Leu Arg Ala Gly Arg Tyr Thr
355 360 365
His Pro Val Trp Asp Arg Leu Val Phe Asn Ser Val Lys Ala Lys Val
370 375 380
Gly Leu Asp Arg Ala Arg Ile Met Cys Thr Gly Ser Ala Pro Ile Ser
385 390 395 400
Ser His Val Leu Glu Phe Leu Arg Ala Val Phe Gly Cys Pro Val Leu
405 410 415
Glu Gly Tyr Gly Gln Thr Glu Ser Ser Leu Leu Ile Ser Val Pro Leu
420 425 430
Met Asn Asp Thr Thr Leu Asn His Val Gly Ile Pro Ala Pro Cys Cys
435 440 445
Glu Ile Arg Leu Glu Asp Val Ala Asp Met Gly Tyr Arg Ala Thr Asp
450 455 460
Lys Lys His Asn Gly Glu Ala Cys Glu Gly Arg Gly Glu Ile Cys Phe
465 470 475 480
Arg Gly Pro Asn Asn Phe Lys Glu Tyr Tyr Arg Met Pro Glu Lys Thr
485 490 495
Ala Glu Thr Ile Asp Glu Asp Gly Trp Val His Thr Gly Asp Ile Gly
500 505 510
Leu Trp Thr Pro Glu Gly Arg Leu Arg Ile Ile Asp Arg Lys Lys Asn
515 520 525
Ile Phe Lys Leu Ala Gln Gly Glu Tyr Val Ala Ala Glu Lys Ile Glu
530 535 540
Asn Ile Met Leu Arg Ser Pro Leu Ala Ala Gln Ile Phe Val Tyr Gly
545 550 555 560
Asp Ser Leu Gln Ser Cys Leu Val Ala Ile Val Val Pro Asp Ala Asp
565 570 575
Ala Leu Gln Thr Arg Gly Met Ala Val Asp Asp Pro Ala Thr Lys Gln
580 585 590
Ala Ile Phe Asp Ser Val Val Lys Glu Ala Arg Asp Ala Ala Leu Asn
595 600 605
Gly Tyr Glu Ile Pro Lys Arg Ile His Ile Ser Pro Gln Glu Leu Asn
610 615 620
Met Leu Pro Glu Arg Asn Gly Leu Thr Thr Leu Leu Thr Pro Thr Phe
625 630 635 640
Lys Leu Val Arg Asn Lys Ala Lys Asp Tyr Phe Ala Pro Glu Ile Asp
645 650 655
Ala Met Tyr Ala Asp Ile Asn Ser Thr Ser Lys Leu
660 665
<210> 84
<211> 2343
<212> DNA
<213> Schizochytrium sp.
<400> 84
atgcccactc ccgacgccac cgcgcctctg aacaagccga gcgactatgc cgtctaccac 60
gaggaagacg gccccttctg gaccgccgat tccagcggcg tctcgcgcgt gaactttagc 120
gagaccggcg tgggatccga gggcgtcatc cctgcgctca cgctcatcga cgtcttcgag 180
agggccgtca agcgcggcgg aaacaggatc gccttccgca cggaaaacat gcccacgctc 240
cgccgcggcg aagaggcccc ggacgcgctg ccgctcaagg actggaagtc ctggtcctgg 300
aaacagtaca aggccgacgt ccaccgcatc gccagggctc tcatggacct cggcgttgag 360
cagcatgacg ccgtctccat ttttggcttt aactcgcccg aatggtttct cagtgccgtc 420
ggcgccgtgc acgcaggtgc caagattgcc ggcatttacc cctcagacac gcccgcccag 480
gtccagtaca aggccttcca cagtgacacc gctgttgccg ttgtcgaaaa cgagcagtgc 540
ttcaagaagt tcgccgaggt cgtcgaggac cttccttacc tcaaggccat tgtttgctgg 600
gactatgaag ccacagacat cacgcgcgag gacggctccg tcgtcgaggt cctcaccttt 660
gccgagttcc tcaagcgcgg cgacaccgtc gaggcggccg cccttgacga gcgcatctcc 720
aagatcgagc ccaccatgtg cgctgccctt atttacacca gcggtactac cggccgcccc 780
aaggccgtta tgatttcgca cgacaacctt gttttcgagg ccagcgccgt cgtccccaac 840
ctcggaggag cctgtacgac cactgctgag gagcgcattc tctcgtacct gcctctctcg 900
cacgtcgctg gtatgatggt tgatattatt gcccccatca ttgccaccgc cttccacaag 960
ggccgcatct gcgtctgctt tgctcgcccg tacgatttgc gcaccggcac gctgggccag 1020
cgcctcaacg ccgtggagcc caccatcttc cttggcgtgc cccgtgtgtg ggaaaagatt 1080
caggaaaagc tcatggccgt cggtgccaaa accaccggcc tcaagaagaa gctctctacg 1140
gccgccaaga agcgtggtct tgaattccag gaggagcagc aaatcggccg ctccggtgcc 1200
aaccctggct ttggccccct tggcatctac aagaagctcc tcggcctcat caagggcaag 1260
ctgggcctca ccaagtgcaa gtttgccttt gctggtgccg cgcccatgac ccgtgagacc 1320
cttcagtact ttggcgcgct gaacatcaac attaacgagg tctacggcat gtccgagtgc 1380
tccggtgccg ccacctggtc cacggacaag gcccacgagt ggggcactgt tggctacgag 1440
atgcccagtt gcgaggtccg cgtcttcaag attgccgagg acggtaccaa gaccgagtgc 1500
ccgcgcgccg ccgacattat gcatgctacc gaggaggagc agggcgaagt ttgcttccgc 1560
ggccgtaaca tcatgatggg ctaccttgcc aaccccaagc ttggcgacga ccacgttgcc 1620
gagatcgagg agaagaacgc tgccgctatc gactccgagg gctggctcca cagtggtgat 1680
aagggcgcca tttctacccg cggcatgctc aagatcacgg gccgctacaa ggagctcatc 1740
atcggcgccg gtggcgagaa cgtggcgccc gtccctattg aggacgccat caaggcgcgc 1800
atgccttttg tttccaacgc catgatggtc ggagataagc gcaagttcat ggctgtcctc 1860
cttaccctca agacggttgg cgccacgggc gagcttcccg gtacgaacaa gctcatgggc 1920
gctgccgccg actatggtga gaccatcgag gacgcctgcg acaacgaggc gctcattgag 1980
gagatcacgc agcagctcaa ggagatcggt gatgatggcg atgtcacgcc ctcgaacgcg 2040
gctcgcatcc aaaagttcac cattctcccg ctcgactttt ccgtctccac ggacgagctc 2100
acggccacgc tcaagctcaa gcgctccgtg gtcgcagaca agtacgaaga catcatcgag 2160
gccttttacg agtccaagag cgtttttgtg ccgtactcga ccgttggcgc ctacgccacg 2220
ggcggcccgg tcgacgactc cgttgtcgat ggctccttca agggcgactt tagcatgatt 2280
ggcgacgatg atccggatct tcaaaacgtc gatgtcctcg aggcgattga cgaggacaat 2340
taa 2343
<210> 85
<211> 780
<212> PRT
<213> Schizochytrium sp.
<400> 85
Met Pro Thr Pro Asp Ala Thr Ala Pro Leu Asn Lys Pro Ser Asp Tyr
1 5 10 15
Ala Val Tyr His Glu Glu Asp Gly Pro Phe Trp Thr Ala Asp Ser Ser
20 25 30
Gly Val Ser Arg Val Asn Phe Ser Glu Thr Gly Val Gly Ser Glu Gly
35 40 45
Val Ile Pro Ala Leu Thr Leu Ile Asp Val Phe Glu Arg Ala Val Lys
50 55 60
Arg Gly Gly Asn Arg Ile Ala Phe Arg Thr Glu Asn Met Pro Thr Leu
65 70 75 80
Arg Arg Gly Glu Glu Ala Pro Asp Ala Leu Pro Leu Lys Asp Trp Lys
85 90 95
Ser Trp Ser Trp Lys Gln Tyr Lys Ala Asp Val His Arg Ile Ala Arg
100 105 110
Ala Leu Met Asp Leu Gly Val Glu Gln His Asp Ala Val Ser Ile Phe
115 120 125
Gly Phe Asn Ser Pro Glu Trp Phe Leu Ser Ala Val Gly Ala Val His
130 135 140
Ala Gly Ala Lys Ile Ala Gly Ile Tyr Pro Ser Asp Thr Pro Ala Gln
145 150 155 160
Val Gln Tyr Lys Ala Phe His Ser Asp Thr Ala Val Ala Val Val Glu
165 170 175
Asn Glu Gln Cys Phe Lys Lys Phe Ala Glu Val Val Glu Asp Leu Pro
180 185 190
Tyr Leu Lys Ala Ile Val Cys Trp Asp Tyr Glu Ala Thr Asp Ile Thr
195 200 205
Arg Glu Asp Gly Ser Val Val Glu Val Leu Thr Phe Ala Glu Phe Leu
210 215 220
Lys Arg Gly Asp Thr Val Glu Ala Ala Ala Leu Asp Glu Arg Ile Ser
225 230 235 240
Lys Ile Glu Pro Thr Met Cys Ala Ala Leu Ile Tyr Thr Ser Gly Thr
245 250 255
Thr Gly Arg Pro Lys Ala Val Met Ile Ser His Asp Asn Leu Val Phe
260 265 270
Glu Ala Ser Ala Val Val Pro Asn Leu Gly Gly Ala Cys Thr Thr Thr
275 280 285
Ala Glu Glu Arg Ile Leu Ser Tyr Leu Pro Leu Ser His Val Ala Gly
290 295 300
Met Met Val Asp Ile Ile Ala Pro Ile Ile Ala Thr Ala Phe His Lys
305 310 315 320
Gly Arg Ile Cys Val Cys Phe Ala Arg Pro Tyr Asp Leu Arg Thr Gly
325 330 335
Thr Leu Gly Gln Arg Leu Asn Ala Val Glu Pro Thr Ile Phe Leu Gly
340 345 350
Val Pro Arg Val Trp Glu Lys Ile Gln Glu Lys Leu Met Ala Val Gly
355 360 365
Ala Lys Thr Thr Gly Leu Lys Lys Lys Leu Ser Thr Ala Ala Lys Lys
370 375 380
Arg Gly Leu Glu Phe Gln Glu Glu Gln Gln Ile Gly Arg Ser Gly Ala
385 390 395 400
Asn Pro Gly Phe Gly Pro Leu Gly Ile Tyr Lys Lys Leu Leu Gly Leu
405 410 415
Ile Lys Gly Lys Leu Gly Leu Thr Lys Cys Lys Phe Ala Phe Ala Gly
420 425 430
Ala Ala Pro Met Thr Arg Glu Thr Leu Gln Tyr Phe Gly Ala Leu Asn
435 440 445
Ile Asn Ile Asn Glu Val Tyr Gly Met Ser Glu Cys Ser Gly Ala Ala
450 455 460
Thr Trp Ser Thr Asp Lys Ala His Glu Trp Gly Thr Val Gly Tyr Glu
465 470 475 480
Met Pro Ser Cys Glu Val Arg Val Phe Lys Ile Ala Glu Asp Gly Thr
485 490 495
Lys Thr Glu Cys Pro Arg Ala Ala Asp Ile Met His Ala Thr Glu Glu
500 505 510
Glu Gln Gly Glu Val Cys Phe Arg Gly Arg Asn Ile Met Met Gly Tyr
515 520 525
Leu Ala Asn Pro Lys Leu Gly Asp Asp His Val Ala Glu Ile Glu Glu
530 535 540
Lys Asn Ala Ala Ala Ile Asp Ser Glu Gly Trp Leu His Ser Gly Asp
545 550 555 560
Lys Gly Ala Ile Ser Thr Arg Gly Met Leu Lys Ile Thr Gly Arg Tyr
565 570 575
Lys Glu Leu Ile Ile Gly Ala Gly Gly Glu Asn Val Ala Pro Val Pro
580 585 590
Ile Glu Asp Ala Ile Lys Ala Arg Met Pro Phe Val Ser Asn Ala Met
595 600 605
Met Val Gly Asp Lys Arg Lys Phe Met Ala Val Leu Leu Thr Leu Lys
610 615 620
Thr Val Gly Ala Thr Gly Glu Leu Pro Gly Thr Asn Lys Leu Met Gly
625 630 635 640
Ala Ala Ala Asp Tyr Gly Glu Thr Ile Glu Asp Ala Cys Asp Asn Glu
645 650 655
Ala Leu Ile Glu Glu Ile Thr Gln Gln Leu Lys Glu Ile Gly Asp Asp
660 665 670
Gly Asp Val Thr Pro Ser Asn Ala Ala Arg Ile Gln Lys Phe Thr Ile
675 680 685
Leu Pro Leu Asp Phe Ser Val Ser Thr Asp Glu Leu Thr Ala Thr Leu
690 695 700
Lys Leu Lys Arg Ser Val Val Ala Asp Lys Tyr Glu Asp Ile Ile Glu
705 710 715 720
Ala Phe Tyr Glu Ser Lys Ser Val Phe Val Pro Tyr Ser Thr Val Gly
725 730 735
Ala Tyr Ala Thr Gly Gly Pro Val Asp Asp Ser Val Val Asp Gly Ser
740 745 750
Phe Lys Gly Asp Phe Ser Met Ile Gly Asp Asp Asp Pro Asp Leu Gln
755 760 765
Asn Val Asp Val Leu Glu Ala Ile Asp Glu Asp Asn
770 775 780
<210> 86
<211> 2529
<212> DNA
<213> Schizochytrium sp.
<400> 86
atggggtgct cggggtcgaa gcccgcggcg ccgggcgagg tcccggccgt gcaggggtac 60
gaggtgacgg aggaggtcgc gcccgggccg tatgacccgg agaaggggcc gtactatgtg 120
agcaacaagg cggagcgcag ggagatcatc ttcgcggcca agggcgtcgc gagcgaagca 180
acgacgcccg ccatgacgct ctcgaaaatg ttccgcaagg ccgccgaggc ctccaaggac 240
gaagtcgcgc tcgccgtcga gtggcccgtg cccgagatcg gcgccgacgg caagatcccc 300
gactccctgc ccctcgacaa gtggcgcacc tggacctttg gccagtacta cgcagactct 360
cacgccatgg cgcgcgccat cgtcgccctc ggcgccgagc gcttcgacgg cgtgaccatc 420
ttcggcttca actctccctt ttggctcatg gcccaaatgg ccgcaacgct ctccacgacc 480
ctccccgccg gcatctaccc cacggacacc gccgagcagg ttcgctacaa gctccgctac 540
acggacactg ccgtggcctt ttgcggcgtg gaaaaggagt tcaccatgct ccgcgccgcc 600
gtcgaggacg ccccggacct caaggccatc gtctgctggg cccacctgcc catggtcaag 660
accatcacgc gcgaggacgg ttccaaggtc aaggtcatgt cctggcagga ggccctcgcg 720
ctcggtgaaa tcacgccccc cgccgaggtc gacgcccgga tcgaggccca gaacccgggc 780
gactgtgccg agctcgtctt taccagtggc accaccgggc ttcccaaggc cgtcatgctc 840
agccatgaca acctctgctt cgcgatcacc agcatcgtca gcaccctcga ggactttggc 900
cgctctggcc cggagagcca cctctcgtat ctcccgctct cccatatcgc gggccaggag 960
atggacgttc tccttcccct cgtcgtgacc gcctttcgcg agagtcacca cgccgtctac 1020
tttgtgcgtc cctacgatct caagaccgga acgctcattg accgtgtcaa gacggtgcag 1080
ccgaccgctt ttctgggcgt tccccgcgtc tacgaaaaga tcatggccaa gatgcgcgcc 1140
aagggagcct ccgtcaaggg cctcaagaag aagatcgttc agtacagcaa aaagaagggc 1200
ctcgaatacc agcgcaacct cgaggtcggc ggctccggcg gtaagccctc caactacggc 1260
tttgccgaga agaaggtcct gagcaaggtc aaggaggccc tcggtttcac ccgtctcaag 1320
tttgccatct ctggcgccgc gcccatgtct cgcgaggtcc aagagtactt tgctggcatc 1380
ggcattgcga tccttgacgt ctacggcgcc agcgagagca cgggaggcgt caccggcaac 1440
tccatcaagg cccaccaatt cggtacggtc ggccacactc tgcccggcat ggacgttcgg 1500
gtcttccaaa aggccgaggg cggcgacagt agtgccgaga cgggtctcgg cgagctccgt 1560
gagccggcgc gggccaagga catcttccat ccctccgagg aggagcaggg cgaagtctgc 1620
ttccgcggac gctccgtcat gctcggctac atggccaatc ccaagcttgg cgaggaacac 1680
gtcgccgagg tcgagcgcaa aaacgcatcg gccatcgatc gccacggatg gtaccattcc 1740
ggtgacaagg gcgcctgttc caagaagaac atgtttgtca tcaccggtcg ctacaaggag 1800
atcattattg gcgccggtgg cgaaaacatt gcgcccctgc ccatggaaga tgccgtcaag 1860
tcccttgccc ccggcgttgc gaacgcaatc atgatcggcg acaagcgcaa gttcaatatt 1920
atgctcatca cgcttcgcgc cgagggcgcc actggcgagt tcccgggctc ggacaacctc 1980
gaccccgatg tgcggagcat tggctccgat tccacgcgca cgattcaaaa ggcaatggcc 2040
gactccaagt ggatcgagca tgtccgtgac gccatctcca agaccaacgc caatggcgac 2100
gcctgccaga gcaacgcctg gaagattggc agattcacca ttctccctta cgacatctcc 2160
atcgttggtg gcgagctcac gccgacgctc aagctcaagc gcaactttgt cgacgaaaag 2220
tacaaggctg tcattgacca tgtctatgcg cacgagggcg acagcaagga tctcacatac 2280
gtcccttgcc ccatcgaccg ggtgccgcgc aagatctctg gcgacgagag cgctgctgga 2340
gctgcgagcc cggaggccaa tgtcgccgag cctgtcacgg ccgagagcgg ttcaccttcg 2400
gaggtaacga ctgaggccaa gcctgccaac gaaaccgacg acgccgagag caaggacgcc 2460
gctgcgcccc ttgcggccaa ggtcgacacg acagttcctg acgtggcgca gcctcaggcc 2520
gccagctag 2529
<210> 87
<211> 842
<212> PRT
<213> Schizochytrium sp.
<400> 87
Met Gly Cys Ser Gly Ser Lys Pro Ala Ala Pro Gly Glu Val Pro Ala
1 5 10 15
Val Gln Gly Tyr Glu Val Thr Glu Glu Val Ala Pro Gly Pro Tyr Asp
20 25 30
Pro Glu Lys Gly Pro Tyr Tyr Val Ser Asn Lys Ala Glu Arg Arg Glu
35 40 45
Ile Ile Phe Ala Ala Lys Gly Val Ala Ser Glu Ala Thr Thr Pro Ala
50 55 60
Met Thr Leu Ser Lys Met Phe Arg Lys Ala Ala Glu Ala Ser Lys Asp
65 70 75 80
Glu Val Ala Leu Ala Val Glu Trp Pro Val Pro Glu Ile Gly Ala Asp
85 90 95
Gly Lys Ile Pro Asp Ser Leu Pro Leu Asp Lys Trp Arg Thr Trp Thr
100 105 110
Phe Gly Gln Tyr Tyr Ala Asp Ser His Ala Met Ala Arg Ala Ile Val
115 120 125
Ala Leu Gly Ala Glu Arg Phe Asp Gly Val Thr Ile Phe Gly Phe Asn
130 135 140
Ser Pro Phe Trp Leu Met Ala Gln Met Ala Ala Thr Leu Ser Thr Thr
145 150 155 160
Leu Pro Ala Gly Ile Tyr Pro Thr Asp Thr Ala Glu Gln Val Arg Tyr
165 170 175
Lys Leu Arg Tyr Thr Asp Thr Ala Val Ala Phe Cys Gly Val Glu Lys
180 185 190
Glu Phe Thr Met Leu Arg Ala Ala Val Glu Asp Ala Pro Asp Leu Lys
195 200 205
Ala Ile Val Cys Trp Ala His Leu Pro Met Val Lys Thr Ile Thr Arg
210 215 220
Glu Asp Gly Ser Lys Val Lys Val Met Ser Trp Gln Glu Ala Leu Ala
225 230 235 240
Leu Gly Glu Ile Thr Pro Pro Ala Glu Val Asp Ala Arg Ile Glu Ala
245 250 255
Gln Asn Pro Gly Asp Cys Ala Glu Leu Val Phe Thr Ser Gly Thr Thr
260 265 270
Gly Leu Pro Lys Ala Val Met Leu Ser His Asp Asn Leu Cys Phe Ala
275 280 285
Ile Thr Ser Ile Val Ser Thr Leu Glu Asp Phe Gly Arg Ser Gly Pro
290 295 300
Glu Ser His Leu Ser Tyr Leu Pro Leu Ser His Ile Ala Gly Gln Glu
305 310 315 320
Met Asp Val Leu Leu Pro Leu Val Val Thr Ala Phe Arg Glu Ser His
325 330 335
His Ala Val Tyr Phe Val Arg Pro Tyr Asp Leu Lys Thr Gly Thr Leu
340 345 350
Ile Asp Arg Val Lys Thr Val Gln Pro Thr Ala Phe Leu Gly Val Pro
355 360 365
Arg Val Tyr Glu Lys Ile Met Ala Lys Met Arg Ala Lys Gly Ala Ser
370 375 380
Val Lys Gly Leu Lys Lys Lys Ile Val Gln Tyr Ser Lys Lys Lys Gly
385 390 395 400
Leu Glu Tyr Gln Arg Asn Leu Glu Val Gly Gly Ser Gly Gly Lys Pro
405 410 415
Ser Asn Tyr Gly Phe Ala Glu Lys Lys Val Leu Ser Lys Val Lys Glu
420 425 430
Ala Leu Gly Phe Thr Arg Leu Lys Phe Ala Ile Ser Gly Ala Ala Pro
435 440 445
Met Ser Arg Glu Val Gln Glu Tyr Phe Ala Gly Ile Gly Ile Ala Ile
450 455 460
Leu Asp Val Tyr Gly Ala Ser Glu Ser Thr Gly Gly Val Thr Gly Asn
465 470 475 480
Ser Ile Lys Ala His Gln Phe Gly Thr Val Gly His Thr Leu Pro Gly
485 490 495
Met Asp Val Arg Val Phe Gln Lys Ala Glu Gly Gly Asp Ser Ser Ala
500 505 510
Glu Thr Gly Leu Gly Glu Leu Arg Glu Pro Ala Arg Ala Lys Asp Ile
515 520 525
Phe His Pro Ser Glu Glu Glu Gln Gly Glu Val Cys Phe Arg Gly Arg
530 535 540
Ser Val Met Leu Gly Tyr Met Ala Asn Pro Lys Leu Gly Glu Glu His
545 550 555 560
Val Ala Glu Val Glu Arg Lys Asn Ala Ser Ala Ile Asp Arg His Gly
565 570 575
Trp Tyr His Ser Gly Asp Lys Gly Ala Cys Ser Lys Lys Asn Met Phe
580 585 590
Val Ile Thr Gly Arg Tyr Lys Glu Ile Ile Ile Gly Ala Gly Gly Glu
595 600 605
Asn Ile Ala Pro Leu Pro Met Glu Asp Ala Val Lys Ser Leu Ala Pro
610 615 620
Gly Val Ala Asn Ala Ile Met Ile Gly Asp Lys Arg Lys Phe Asn Ile
625 630 635 640
Met Leu Ile Thr Leu Arg Ala Glu Gly Ala Thr Gly Glu Phe Pro Gly
645 650 655
Ser Asp Asn Leu Asp Pro Asp Val Arg Ser Ile Gly Ser Asp Ser Thr
660 665 670
Arg Thr Ile Gln Lys Ala Met Ala Asp Ser Lys Trp Ile Glu His Val
675 680 685
Arg Asp Ala Ile Ser Lys Thr Asn Ala Asn Gly Asp Ala Cys Gln Ser
690 695 700
Asn Ala Trp Lys Ile Gly Arg Phe Thr Ile Leu Pro Tyr Asp Ile Ser
705 710 715 720
Ile Val Gly Gly Glu Leu Thr Pro Thr Leu Lys Leu Lys Arg Asn Phe
725 730 735
Val Asp Glu Lys Tyr Lys Ala Val Ile Asp His Val Tyr Ala His Glu
740 745 750
Gly Asp Ser Lys Asp Leu Thr Tyr Val Pro Cys Pro Ile Asp Arg Val
755 760 765
Pro Arg Lys Ile Ser Gly Asp Glu Ser Ala Ala Gly Ala Ala Ser Pro
770 775 780
Glu Ala Asn Val Ala Glu Pro Val Thr Ala Glu Ser Gly Ser Pro Ser
785 790 795 800
Glu Val Thr Thr Glu Ala Lys Pro Ala Asn Glu Thr Asp Asp Ala Glu
805 810 815
Ser Lys Asp Ala Ala Ala Pro Leu Ala Ala Lys Val Asp Thr Thr Val
820 825 830
Pro Asp Val Ala Gln Pro Gln Ala Ala Ser
835 840
<210> 88
<211> 2040
<212> DNA
<213> Schizochytrium sp.
<400> 88
atgcaggccc tgctgggcct cgtcatgaac caggaactcg aaggtggatc catgaagggc 60
tgcatggccg tgcccgtggg caacgacacc taccgcaacg ctcgcgtcaa ggacgagctc 120
tttacccagc cagacccgtc tattcagacc atgggcgaca tctggcgcga tacctgcgaa 180
aaacacgccc agaacaactg catgggctgg cgtgacatcc tcagcatgac caaggacggc 240
aacaaggaaa agtacgtcct tggcggctac aactggatca cctaccgcca ggctcagcgc 300
cgcgcgcgca actttggcgc tggtctcgct gcccttggtg tgaaaaaggg cgaaatggtc 360
aacttctttg ccgatacaaa ggccgagtgg cagctcggct gccagggctg ccttgagcgc 420
ggcatcgtcg tggccaccag ctacgccaat cttggtcccg aggccgtcgc ctacggcctc 480
aagcagacca agtgctcggt tgtctttacc gacgctgacc ttatcccgac gctcaacaag 540
gttctcggcg actgccccga cgtcaagcac gtcgtcttct cgcgcgacaa gcgcccggcg 600
aaccatccgg cccacaactc cgacgagaag gtgcgcgaca tgatcacgca cagcggcatc 660
caggcgcaca gctttgaaga ggttgagcag ctcggcgagg gcgccaccaa ggaggacctt 720
ccttcggtta agcccgatga caccggtgtc atcatgtaca cctcgggctc caccggcaac 780
cccaagggcg tcatcatctc ccaccgcaac cttgttgccg gcattgccgg ttgcgccgat 840
gccatttgcg gcatgagcac cgacgatgtc taccttgcct acctcccgct cgcgcacatt 900
ctcgagctca tcgccgagag ctccctctac tttcgcggtg tcgccgtcgg ctacggctcc 960
accaagacca tcaccgacgc atccgtgtgt atcgaggccg gcaagtgcgt cggtgacgcc 1020
aacgagctcc gccccacgct catggctgcc gtgcccatga ttatggacaa gatccgggcc 1080
ggtgtcatga acaagatcaa ctccactggc ggtatcacca agcagctctt cgagcttggc 1140
tttagccgca aaaaggctgc ccttgccgaa ggcaaagaat ctcccttctg gaacaagatc 1200
ctctttgaca acattcgcgc gcgcctcctt ggcggccgcg tccgctacat gctcagtggt 1260
ggcggcccgc tctccaagga cacgcaggac ttcatgaacg ttgtcttttg ctgccccgtc 1320
ggccagggat ggggtctcac tgagtccgtc ggcgtcgcca ccatttgctg gcccaacgac 1380
cgcaccgctg gccgtgtggg tgcccccatt tgctccatgc aaatcaagct cgaagactgg 1440
gaagagggcg gctactacgc tgaccctgct cgggctccgg aggacaacaa gcacccgcac 1500
ccgcgcggcg agctccttct tggcgggccc cagatcacca tgggctactt tgaggagccg 1560
gaaaagaccg aagaggccta ctttaccgac gaaaacggca cgcgctggct tcgcacgggc 1620
gacatcggcg aggtctaccc agatggcgcc tttgccatca tcgaccgcaa aaaggatctt 1680
gtcaagcttt ctggcggcga atacgtttcc tttggcaagc tcgagcccat gatccgcgac 1740
tcggaccatg ttgataacgc tatggtctac tgtgattctg aaaagtccta ttcggttgcc 1800
gtcattcaag tggcgtccga atccaaggac gtcgatgacg agcgcattca caaggacatc 1860
acttccatcc tcaagcgtgc gggctgcgca aagttcgaga tcccccaaaa catctacgtc 1920
gagcgcgacc tcgtctgggg ccctgataat gacctttgca cggctgctct caagctcaaa 1980
cgccgcaacc ttgtcaaaca ttacgacaag gagctcaagg agctctacaa tgagagctag 2040
<210> 89
<211> 679
<212> PRT
<213> Schizochytrium sp.
<400> 89
Met Gln Ala Leu Leu Gly Leu Val Met Asn Gln Glu Leu Glu Gly Gly
1 5 10 15
Ser Met Lys Gly Cys Met Ala Val Pro Val Gly Asn Asp Thr Tyr Arg
20 25 30
Asn Ala Arg Val Lys Asp Glu Leu Phe Thr Gln Pro Asp Pro Ser Ile
35 40 45
Gln Thr Met Gly Asp Ile Trp Arg Asp Thr Cys Glu Lys His Ala Gln
50 55 60
Asn Asn Cys Met Gly Trp Arg Asp Ile Leu Ser Met Thr Lys Asp Gly
65 70 75 80
Asn Lys Glu Lys Tyr Val Leu Gly Gly Tyr Asn Trp Ile Thr Tyr Arg
85 90 95
Gln Ala Gln Arg Arg Ala Arg Asn Phe Gly Ala Gly Leu Ala Ala Leu
100 105 110
Gly Val Lys Lys Gly Glu Met Val Asn Phe Phe Ala Asp Thr Lys Ala
115 120 125
Glu Trp Gln Leu Gly Cys Gln Gly Cys Leu Glu Arg Gly Ile Val Val
130 135 140
Ala Thr Ser Tyr Ala Asn Leu Gly Pro Glu Ala Val Ala Tyr Gly Leu
145 150 155 160
Lys Gln Thr Lys Cys Ser Val Val Phe Thr Asp Ala Asp Leu Ile Pro
165 170 175
Thr Leu Asn Lys Val Leu Gly Asp Cys Pro Asp Val Lys His Val Val
180 185 190
Phe Ser Arg Asp Lys Arg Pro Ala Asn His Pro Ala His Asn Ser Asp
195 200 205
Glu Lys Val Arg Asp Met Ile Thr His Ser Gly Ile Gln Ala His Ser
210 215 220
Phe Glu Glu Val Glu Gln Leu Gly Glu Gly Ala Thr Lys Glu Asp Leu
225 230 235 240
Pro Ser Val Lys Pro Asp Asp Thr Gly Val Ile Met Tyr Thr Ser Gly
245 250 255
Ser Thr Gly Asn Pro Lys Gly Val Ile Ile Ser His Arg Asn Leu Val
260 265 270
Ala Gly Ile Ala Gly Cys Ala Asp Ala Ile Cys Gly Met Ser Thr Asp
275 280 285
Asp Val Tyr Leu Ala Tyr Leu Pro Leu Ala His Ile Leu Glu Leu Ile
290 295 300
Ala Glu Ser Ser Leu Tyr Phe Arg Gly Val Ala Val Gly Tyr Gly Ser
305 310 315 320
Thr Lys Thr Ile Thr Asp Ala Ser Val Cys Ile Glu Ala Gly Lys Cys
325 330 335
Val Gly Asp Ala Asn Glu Leu Arg Pro Thr Leu Met Ala Ala Val Pro
340 345 350
Met Ile Met Asp Lys Ile Arg Ala Gly Val Met Asn Lys Ile Asn Ser
355 360 365
Thr Gly Gly Ile Thr Lys Gln Leu Phe Glu Leu Gly Phe Ser Arg Lys
370 375 380
Lys Ala Ala Leu Ala Glu Gly Lys Glu Ser Pro Phe Trp Asn Lys Ile
385 390 395 400
Leu Phe Asp Asn Ile Arg Ala Arg Leu Leu Gly Gly Arg Val Arg Tyr
405 410 415
Met Leu Ser Gly Gly Gly Pro Leu Ser Lys Asp Thr Gln Asp Phe Met
420 425 430
Asn Val Val Phe Cys Cys Pro Val Gly Gln Gly Trp Gly Leu Thr Glu
435 440 445
Ser Val Gly Val Ala Thr Ile Cys Trp Pro Asn Asp Arg Thr Ala Gly
450 455 460
Arg Val Gly Ala Pro Ile Cys Ser Met Gln Ile Lys Leu Glu Asp Trp
465 470 475 480
Glu Glu Gly Gly Tyr Tyr Ala Asp Pro Ala Arg Ala Pro Glu Asp Asn
485 490 495
Lys His Pro His Pro Arg Gly Glu Leu Leu Leu Gly Gly Pro Gln Ile
500 505 510
Thr Met Gly Tyr Phe Glu Glu Pro Glu Lys Thr Glu Glu Ala Tyr Phe
515 520 525
Thr Asp Glu Asn Gly Thr Arg Trp Leu Arg Thr Gly Asp Ile Gly Glu
530 535 540
Val Tyr Pro Asp Gly Ala Phe Ala Ile Ile Asp Arg Lys Lys Asp Leu
545 550 555 560
Val Lys Leu Ser Gly Gly Glu Tyr Val Ser Phe Gly Lys Leu Glu Pro
565 570 575
Met Ile Arg Asp Ser Asp His Val Asp Asn Ala Met Val Tyr Cys Asp
580 585 590
Ser Glu Lys Ser Tyr Ser Val Ala Val Ile Gln Val Ala Ser Glu Ser
595 600 605
Lys Asp Val Asp Asp Glu Arg Ile His Lys Asp Ile Thr Ser Ile Leu
610 615 620
Lys Arg Ala Gly Cys Ala Lys Phe Glu Ile Pro Gln Asn Ile Tyr Val
625 630 635 640
Glu Arg Asp Leu Val Trp Gly Pro Asp Asn Asp Leu Cys Thr Ala Ala
645 650 655
Leu Lys Leu Lys Arg Arg Asn Leu Val Lys His Tyr Asp Lys Glu Leu
660 665 670
Lys Glu Leu Tyr Asn Glu Ser
675
<210> 90
<211> 1737
<212> DNA
<213> Schizochytrium sp.
<400> 90
atgctggaga tgcgcgagga ggtggtcaag cacgagggcg aggcggcgca cttcaagggc 60
gtcaagatga aggtgttccc gaacgggttc cagaccatgg tggatatctt caaggtgccc 120
tttgagaagc aggtcatgaa gaacgacttg ctcgtcgacg agaccggacg catgaccttt 180
caggaggtct ttgacaccgc cgccgcgctc ggcgacgccc tcgtcaacga gtacggcgtg 240
gaaaagggcg atcgcgtcgt cgctctctcc aagaaccgca acgagtacat tgtcaccatg 300
atcgcggcga cctcggtcgg cgccatcttt gcacccctca actcgtactg gaagacggag 360
cagctctcgt acggtctcga tgattcgggc gccaaggtcg tcgtctgcga cgccgaccgc 420
tacgtgcagc tcgagcctct cctggacggc cgcgcctccg cactggagcg cgttcttctc 480
ctccgtggcc ccggcactga aaagttccgc cccaacgcca agaccaccgc ctttgacgag 540
gtcattagca agcacgccgg cgccagaatg ccgccctttc cctgccaaaa ggatgaccct 600
gccatgatca tgtacacctc gggaaccacc ggcaacccca agggcgtcgt gctcacgcac 660
cgcagcattg gcgaagccat gacgggcgcc gttgcagcca tgacgtacga gaagacgctt 720
gccgccacca gagctggcga gaccttgccc gagccggaag acccgtcgct gtcggccttc 780
ttgctcgccg tccctctctt ccacgtgacg ggccaccact gcgtcggtct gctctctatc 840
attagctgcc gcaagatcgt gctcatgagc aagtgggatc ccaagcttgc cctggagctc 900
attgagagcg agcgcattac aaactttact ggcgtgccca ccatggctct cgacctgatg 960
acccacccgg actttaagaa gcgggacacg agcacgctca agtctctcgg cggcggtggc 1020
gcagcgcctc cgagcaccat ggtgaacgac attgacaaga actttaaaca agcgtctccg 1080
ctgcaggcct ggggcatgac tgagaccaat ggcatcgcca ccctcaccga aggcgacatg 1140
taccggcgca agccggaaag ctgcggcaag gccatcccca atgtcgagat tgccatctgg 1200
aatgctcgcg atgagcccgt gcccgccggc gccgagggag agcttgtcat tcgtgggtcc 1260
acctgcctca aagagtactg gaacaagccc gaggctacgg ccaagagcat cacggccgag 1320
ggctggttcc gaaccggtga cattggcgtc attgacgagg aaggctttct ccagctcaag 1380
ggtcgtagca aagagatcat cattcgcgga ggcgagaata tttcctgcgt cgttgtcgaa 1440
aacgcagtct acaatcacga tgatatcaat gaagtggcgg ctatcccagt cccccatccc 1500
acgcttggcg aggaggtcgg cattgccgtc tttagccagt ctggcgcgcg accctcgctc 1560
cagagcattc gcgatgtctg cgggaacctc gcgcgctatg aaatgcctac gcatatttat 1620
tattggcccg agcagctccc gcgtggagac acgggcaaga ttcataagcg caccattttg 1680
gccgacatca aggccggcaa ggtcaaggac gaggctgtgc ctgcctccaa gctctga 1737
<210> 91
<211> 578
<212> PRT
<213> Schizochytrium sp.
<400> 91
Met Leu Glu Met Arg Glu Glu Val Val Lys His Glu Gly Glu Ala Ala
1 5 10 15
His Phe Lys Gly Val Lys Met Lys Val Phe Pro Asn Gly Phe Gln Thr
20 25 30
Met Val Asp Ile Phe Lys Val Pro Phe Glu Lys Gln Val Met Lys Asn
35 40 45
Asp Leu Leu Val Asp Glu Thr Gly Arg Met Thr Phe Gln Glu Val Phe
50 55 60
Asp Thr Ala Ala Ala Leu Gly Asp Ala Leu Val Asn Glu Tyr Gly Val
65 70 75 80
Glu Lys Gly Asp Arg Val Val Ala Leu Ser Lys Asn Arg Asn Glu Tyr
85 90 95
Ile Val Thr Met Ile Ala Ala Thr Ser Val Gly Ala Ile Phe Ala Pro
100 105 110
Leu Asn Ser Tyr Trp Lys Thr Glu Gln Leu Ser Tyr Gly Leu Asp Asp
115 120 125
Ser Gly Ala Lys Val Val Val Cys Asp Ala Asp Arg Tyr Val Gln Leu
130 135 140
Glu Pro Leu Leu Asp Gly Arg Ala Ser Ala Leu Glu Arg Val Leu Leu
145 150 155 160
Leu Arg Gly Pro Gly Thr Glu Lys Phe Arg Pro Asn Ala Lys Thr Thr
165 170 175
Ala Phe Asp Glu Val Ile Ser Lys His Ala Gly Ala Arg Met Pro Pro
180 185 190
Phe Pro Cys Gln Lys Asp Asp Pro Ala Met Ile Met Tyr Thr Ser Gly
195 200 205
Thr Thr Gly Asn Pro Lys Gly Val Val Leu Thr His Arg Ser Ile Gly
210 215 220
Glu Ala Met Thr Gly Ala Val Ala Ala Met Thr Tyr Glu Lys Thr Leu
225 230 235 240
Ala Ala Thr Arg Ala Gly Glu Thr Leu Pro Glu Pro Glu Asp Pro Ser
245 250 255
Leu Ser Ala Phe Leu Leu Ala Val Pro Leu Phe His Val Thr Gly His
260 265 270
His Cys Val Gly Leu Leu Ser Ile Ile Ser Cys Arg Lys Ile Val Leu
275 280 285
Met Ser Lys Trp Asp Pro Lys Leu Ala Leu Glu Leu Ile Glu Ser Glu
290 295 300
Arg Ile Thr Asn Phe Thr Gly Val Pro Thr Met Ala Leu Asp Leu Met
305 310 315 320
Thr His Pro Asp Phe Lys Lys Arg Asp Thr Ser Thr Leu Lys Ser Leu
325 330 335
Gly Gly Gly Gly Ala Ala Pro Pro Ser Thr Met Val Asn Asp Ile Asp
340 345 350
Lys Asn Phe Lys Gln Ala Ser Pro Leu Gln Ala Trp Gly Met Thr Glu
355 360 365
Thr Asn Gly Ile Ala Thr Leu Thr Glu Gly Asp Met Tyr Arg Arg Lys
370 375 380
Pro Glu Ser Cys Gly Lys Ala Ile Pro Asn Val Glu Ile Ala Ile Trp
385 390 395 400
Asn Ala Arg Asp Glu Pro Val Pro Ala Gly Ala Glu Gly Glu Leu Val
405 410 415
Ile Arg Gly Ser Thr Cys Leu Lys Glu Tyr Trp Asn Lys Pro Glu Ala
420 425 430
Thr Ala Lys Ser Ile Thr Ala Glu Gly Trp Phe Arg Thr Gly Asp Ile
435 440 445
Gly Val Ile Asp Glu Glu Gly Phe Leu Gln Leu Lys Gly Arg Ser Lys
450 455 460
Glu Ile Ile Ile Arg Gly Gly Glu Asn Ile Ser Cys Val Val Val Glu
465 470 475 480
Asn Ala Val Tyr Asn His Asp Asp Ile Asn Glu Val Ala Ala Ile Pro
485 490 495
Val Pro His Pro Thr Leu Gly Glu Glu Val Gly Ile Ala Val Phe Ser
500 505 510
Gln Ser Gly Ala Arg Pro Ser Leu Gln Ser Ile Arg Asp Val Cys Gly
515 520 525
Asn Leu Ala Arg Tyr Glu Met Pro Thr His Ile Tyr Tyr Trp Pro Glu
530 535 540
Gln Leu Pro Arg Gly Asp Thr Gly Lys Ile His Lys Arg Thr Ile Leu
545 550 555 560
Ala Asp Ile Lys Ala Gly Lys Val Lys Asp Glu Ala Val Pro Ala Ser
565 570 575
Lys Leu
<210> 92
<211> 1809
<212> DNA
<213> Schizochytrium sp.
<400> 92
atgccggcgc tgaccaagga gcaggaagcg gcgatcgacg cggcgctgca cgcgcccggg 60
acgctgctgg agctgcgcga ggaggtcatc gcgtacgagg agaaccatgc cccgcatcac 120
aagggcgtca agtaccaggt gtacccgaac ggcccccaga cgcttgtaga cctcttcagc 180
ttccccaagg cgaccggaaa cctcgacaac ccgttcctca tctacgagga caaacgatac 240
acctttcgcg aggccgacga ggaggcctcc gccctcggat ccgcgctcat taacgatttt 300
ggcgtcaaga ctctcgatcg cgtctgcatc gtctccaaaa accgacccga gtacgccatc 360
ggcgtcatgg cgtccacctc ggtcggagcc acctgcgtgc ccatgaactc gtggtggaag 420
accaaggagc tcgagtacgg cctcgacaac tcgggcacca agatcgtgct ttgcgatctc 480
gaccgctaca agctcctcgt ccccattctc gacaagctca ccaacctcga aaaggtcatc 540
ctcttcgacg acgccaacgc cggaagcgtc gagccccacc ccaagctcct catgtacaag 600
gacgtcgtgt ctaagcgccg cggcgacgcc atgccgcctc ttactgccgg caaggacgac 660
aatgccctca tcatgtacac ctcgggcacg acgggccatc ccaagggtgt cgtgctcacc 720
caccgcagca tctgccacgc catcacttgc gccgtggcgc acagtatccg ccaaaagatg 780
atggctgccg ccaaggccgg gaaaaccttc acgccggagg aggtcgaccc taaacacttt 840
gccgtcctgc tcaacgtacc tcttttccac gccacgggcc tccactcggt cttcttcctc 900
tccttcgtca ttggccgcaa gatggtcatg atggacaagt ggaacatcga gcaggccctc 960
cagctcatcg agcgcgagcg cgttaccaat tttaccggtg tgcccaccat ggtcctcgac 1020
atgatgaacc atcctaactt taaaaagtac gacaccagct ctctcgaggc tgttggcggt 1080
ggtggtgctg cccccccctc gactatggtc aaggacgtgc agagcaactt caagagcgct 1140
gcccctctgc agggttttgg catgaccgag accaacgccc tcacctgcct caacgatggt 1200
gatacgtatg ccgagcgccc caccagctgc ggtcgtgcta ccccgagcat ccagattgcc 1260
gtttgggacg acaacgacaa gcccctgccc gctggccaaa agggtaacgt catggtcaag 1320
ggcgccgcca acctcaagga gtactggcgt aagcccgagg ccaccgcgga taccatgact 1380
gccgatggat ggctgcgcac cggcgatgtt ggccacattg acgagggagg ttacctgcat 1440
ctgggcggcc gcaccaagga gattatcatc cgtggaggtg agaacatttc ttgcgtcgcc 1500
gtcgaggacg gtgtctacca gcattctggt gtcgccgagt gcgccgccat tcccgtcccc 1560
caccccactc tcggcgagga ggtcggtatc gtcgtcttcc ccaagaacgg tgccaagctg 1620
acgctcgagg agatcgttgc caagtgcgag gacctcgcca agttcgagtg ccccacgcac 1680
ttgtacattt ggcccgagca gcttcctcgc ggcgccacag gcaagatcgt caagcgtgat 1740
atccgtcaga tcatcgagga caacaagatc ctctccgagc agcaaaagaa tcccaagtcc 1800
aagctctaa 1809
<210> 93
<211> 602
<212> PRT
<213> Schizochytrium sp.
<400> 93
Met Pro Ala Leu Thr Lys Glu Gln Glu Ala Ala Ile Asp Ala Ala Leu
1 5 10 15
His Ala Pro Gly Thr Leu Leu Glu Leu Arg Glu Glu Val Ile Ala Tyr
20 25 30
Glu Glu Asn His Ala Pro His His Lys Gly Val Lys Tyr Gln Val Tyr
35 40 45
Pro Asn Gly Pro Gln Thr Leu Val Asp Leu Phe Ser Phe Pro Lys Ala
50 55 60
Thr Gly Asn Leu Asp Asn Pro Phe Leu Ile Tyr Glu Asp Lys Arg Tyr
65 70 75 80
Thr Phe Arg Glu Ala Asp Glu Glu Ala Ser Ala Leu Gly Ser Ala Leu
85 90 95
Ile Asn Asp Phe Gly Val Lys Thr Leu Asp Arg Val Cys Ile Val Ser
100 105 110
Lys Asn Arg Pro Glu Tyr Ala Ile Gly Val Met Ala Ser Thr Ser Val
115 120 125
Gly Ala Thr Cys Val Pro Met Asn Ser Trp Trp Lys Thr Lys Glu Leu
130 135 140
Glu Tyr Gly Leu Asp Asn Ser Gly Thr Lys Ile Val Leu Cys Asp Leu
145 150 155 160
Asp Arg Tyr Lys Leu Leu Val Pro Ile Leu Asp Lys Leu Thr Asn Leu
165 170 175
Glu Lys Val Ile Leu Phe Asp Asp Ala Asn Ala Gly Ser Val Glu Pro
180 185 190
His Pro Lys Leu Leu Met Tyr Lys Asp Val Val Ser Lys Arg Arg Gly
195 200 205
Asp Ala Met Pro Pro Leu Thr Ala Gly Lys Asp Asp Asn Ala Leu Ile
210 215 220
Met Tyr Thr Ser Gly Thr Thr Gly His Pro Lys Gly Val Val Leu Thr
225 230 235 240
His Arg Ser Ile Cys His Ala Ile Thr Cys Ala Val Ala His Ser Ile
245 250 255
Arg Gln Lys Met Met Ala Ala Ala Lys Ala Gly Lys Thr Phe Thr Pro
260 265 270
Glu Glu Val Asp Pro Lys His Phe Ala Val Leu Leu Asn Val Pro Leu
275 280 285
Phe His Ala Thr Gly Leu His Ser Val Phe Phe Leu Ser Phe Val Ile
290 295 300
Gly Arg Lys Met Val Met Met Asp Lys Trp Asn Ile Glu Gln Ala Leu
305 310 315 320
Gln Leu Ile Glu Arg Glu Arg Val Thr Asn Phe Thr Gly Val Pro Thr
325 330 335
Met Val Leu Asp Met Met Asn His Pro Asn Phe Lys Lys Tyr Asp Thr
340 345 350
Ser Ser Leu Glu Ala Val Gly Gly Gly Gly Ala Ala Pro Pro Ser Thr
355 360 365
Met Val Lys Asp Val Gln Ser Asn Phe Lys Ser Ala Ala Pro Leu Gln
370 375 380
Gly Phe Gly Met Thr Glu Thr Asn Ala Leu Thr Cys Leu Asn Asp Gly
385 390 395 400
Asp Thr Tyr Ala Glu Arg Pro Thr Ser Cys Gly Arg Ala Thr Pro Ser
405 410 415
Ile Gln Ile Ala Val Trp Asp Asp Asn Asp Lys Pro Leu Pro Ala Gly
420 425 430
Gln Lys Gly Asn Val Met Val Lys Gly Ala Ala Asn Leu Lys Glu Tyr
435 440 445
Trp Arg Lys Pro Glu Ala Thr Ala Asp Thr Met Thr Ala Asp Gly Trp
450 455 460
Leu Arg Thr Gly Asp Val Gly His Ile Asp Glu Gly Gly Tyr Leu His
465 470 475 480
Leu Gly Gly Arg Thr Lys Glu Ile Ile Ile Arg Gly Gly Glu Asn Ile
485 490 495
Ser Cys Val Ala Val Glu Asp Gly Val Tyr Gln His Ser Gly Val Ala
500 505 510
Glu Cys Ala Ala Ile Pro Val Pro His Pro Thr Leu Gly Glu Glu Val
515 520 525
Gly Ile Val Val Phe Pro Lys Asn Gly Ala Lys Leu Thr Leu Glu Glu
530 535 540
Ile Val Ala Lys Cys Glu Asp Leu Ala Lys Phe Glu Cys Pro Thr His
545 550 555 560
Leu Tyr Ile Trp Pro Glu Gln Leu Pro Arg Gly Ala Thr Gly Lys Ile
565 570 575
Val Lys Arg Asp Ile Arg Gln Ile Ile Glu Asp Asn Lys Ile Leu Ser
580 585 590
Glu Gln Gln Lys Asn Pro Lys Ser Lys Leu
595 600
<210> 94
<211> 1923
<212> DNA
<213> Schizochytrium sp.
<400> 94
atgcggcgaa cgagcttcgc actcgcgagc aggcgcctgc ggctgcaaga gagactcagg 60
ctgggcgcga gaagcgcgac ccagcggatg caaagcacgg acgcgcgatt ttaccgagca 120
agcgctgcgt tttcgtccca ggccagcttc cccgacgacc tcggcacgac ctacctcgtc 180
ggggaccagc ggctcgcaca cgccaaaggg ccgaccggac tcacgctgta cgagcgcacc 240
attgatgagc atttccgggc ggcagtcgag gctcgaccgg acaagcaagc agctgtcgtc 300
tgtgacggcg cagaccatgt cgacgcccga cactcatacg cgtctctcga cgccaaggtg 360
gacgatctag ctcgcggact cttgcgactc ggcgtcgagc gcggagaccg cgtcggcgtg 420
tggatgccaa acaatgaggc atggcttttg acgcagcttg cgacggcgcg catcggagcc 480
atccttgtct gtattaatcc gaattacagg cttcgcgagc tgacgcacgc tctcaacctc 540
gtcgaactca gcgtgctcat catgaaccct cacgtttcgc gctcaaacta cattgaaatg 600
cttcacactc tcgttccctc cttgcgcgaa aggacgcaaa gcacgtgccg ggaccccgta 660
caaagtgaca aagtgcctca ccttcgccac gttgtcctgg cagaggcaga cggctccgac 720
ggcgaggaca cctttatccg cttcgaggac cttctcgaaa aggacggagc tgcggccgtt 780
cctacgggcc agggcctttt gcaacccgac gacccaatta acattcagtt cacaagtgga 840
accacaggag ctcctaaggg agctctgctg tcgagccgca atattgtcaa caatggtaac 900
tttgtgggcg cctgcatccg tcttacgcca gacgacatta tcaatgtccc cgtgcccttg 960
taccactgct ttggagtcgt catgggcaac ttggcgtcca tttcgcatgg cgcttctgtg 1020
gtgtatccgg cgcgtgtatt ctccgcgagc aaaacgctca gtgtggtcga gtcggagcgc 1080
tgtactgcgc tttacggagt gcctaccatg ttttctgcca tgcttgcgta ccagcaagag 1140
gccaaacacg acgtttcgac gctgcggacg ggcattatgg caggaagcaa ctgtccgcgt 1200
gaaatgatgc gtcgggttgt tgccgagttg aacatgaccg acacctgcat tggctacggt 1260
cagaccgagt cttctcccgt gagtttcatg tcgcgcatcg tcgatgacga ggatcaccgc 1320
tgcgagaccg tgggtcgcat cactccgcac atagaagcca aggttgtgga tgaggatgga 1380
gagactcttc cggttggtgt tccgggtgag ctttacgtga gaggctatca catctttaag 1440
ggctacataa atgctccgga gcagaccaag gctaccttga cggacgatgg ctggctgcgt 1500
acgggcgacc tcgttgactt ggaccgcgat ggttacctac gcgtagatgg ccgcctcaag 1560
gacgtgatta ttcgaggcgg cgagaatatc gccccgcgcg aatgcgaaga gctcattctc 1620
gagctccccg gcgttcttac cgtggccgtc gtgggtgtgc ccgacgaggt ctttggcgag 1680
caagtctgcg cagtggtggt gccgaacatg gacacatccg aaggcaaggc gctcgatggc 1740
gatgctgtgc gcgattttgt ccgggctgag ctctctcatc aaaaggtgcc aaagttcgtc 1800
ctttttcgcc actcctttga cgaattcatg actgtcactg gcaagctgcg aaagtttcaa 1860
gtgcgagact gggcgaccaa ggagacatct gcgcagaagg aagctgctgc caaagctgct 1920
taa 1923
<210> 95
<211> 640
<212> PRT
<213> Schizochytrium sp.
<400> 95
Met Arg Arg Thr Ser Phe Ala Leu Ala Ser Arg Arg Leu Arg Leu Gln
1 5 10 15
Glu Arg Leu Arg Leu Gly Ala Arg Ser Ala Thr Gln Arg Met Gln Ser
20 25 30
Thr Asp Ala Arg Phe Tyr Arg Ala Ser Ala Ala Phe Ser Ser Gln Ala
35 40 45
Ser Phe Pro Asp Asp Leu Gly Thr Thr Tyr Leu Val Gly Asp Gln Arg
50 55 60
Leu Ala His Ala Lys Gly Pro Thr Gly Leu Thr Leu Tyr Glu Arg Thr
65 70 75 80
Ile Asp Glu His Phe Arg Ala Ala Val Glu Ala Arg Pro Asp Lys Gln
85 90 95
Ala Ala Val Val Cys Asp Gly Ala Asp His Val Asp Ala Arg His Ser
100 105 110
Tyr Ala Ser Leu Asp Ala Lys Val Asp Asp Leu Ala Arg Gly Leu Leu
115 120 125
Arg Leu Gly Val Glu Arg Gly Asp Arg Val Gly Val Trp Met Pro Asn
130 135 140
Asn Glu Ala Trp Leu Leu Thr Gln Leu Ala Thr Ala Arg Ile Gly Ala
145 150 155 160
Ile Leu Val Cys Ile Asn Pro Asn Tyr Arg Leu Arg Glu Leu Thr His
165 170 175
Ala Leu Asn Leu Val Glu Leu Ser Val Leu Ile Met Asn Pro His Val
180 185 190
Ser Arg Ser Asn Tyr Ile Glu Met Leu His Thr Leu Val Pro Ser Leu
195 200 205
Arg Glu Arg Thr Gln Ser Thr Cys Arg Asp Pro Val Gln Ser Asp Lys
210 215 220
Val Pro His Leu Arg His Val Val Leu Ala Glu Ala Asp Gly Ser Asp
225 230 235 240
Gly Glu Asp Thr Phe Ile Arg Phe Glu Asp Leu Leu Glu Lys Asp Gly
245 250 255
Ala Ala Ala Val Pro Thr Gly Gln Gly Leu Leu Gln Pro Asp Asp Pro
260 265 270
Ile Asn Ile Gln Phe Thr Ser Gly Thr Thr Gly Ala Pro Lys Gly Ala
275 280 285
Leu Leu Ser Ser Arg Asn Ile Val Asn Asn Gly Asn Phe Val Gly Ala
290 295 300
Cys Ile Arg Leu Thr Pro Asp Asp Ile Ile Asn Val Pro Val Pro Leu
305 310 315 320
Tyr His Cys Phe Gly Val Val Met Gly Asn Leu Ala Ser Ile Ser His
325 330 335
Gly Ala Ser Val Val Tyr Pro Ala Arg Val Phe Ser Ala Ser Lys Thr
340 345 350
Leu Ser Val Val Glu Ser Glu Arg Cys Thr Ala Leu Tyr Gly Val Pro
355 360 365
Thr Met Phe Ser Ala Met Leu Ala Tyr Gln Gln Glu Ala Lys His Asp
370 375 380
Val Ser Thr Leu Arg Thr Gly Ile Met Ala Gly Ser Asn Cys Pro Arg
385 390 395 400
Glu Met Met Arg Arg Val Val Ala Glu Leu Asn Met Thr Asp Thr Cys
405 410 415
Ile Gly Tyr Gly Gln Thr Glu Ser Ser Pro Val Ser Phe Met Ser Arg
420 425 430
Ile Val Asp Asp Glu Asp His Arg Cys Glu Thr Val Gly Arg Ile Thr
435 440 445
Pro His Ile Glu Ala Lys Val Val Asp Glu Asp Gly Glu Thr Leu Pro
450 455 460
Val Gly Val Pro Gly Glu Leu Tyr Val Arg Gly Tyr His Ile Phe Lys
465 470 475 480
Gly Tyr Ile Asn Ala Pro Glu Gln Thr Lys Ala Thr Leu Thr Asp Asp
485 490 495
Gly Trp Leu Arg Thr Gly Asp Leu Val Asp Leu Asp Arg Asp Gly Tyr
500 505 510
Leu Arg Val Asp Gly Arg Leu Lys Asp Val Ile Ile Arg Gly Gly Glu
515 520 525
Asn Ile Ala Pro Arg Glu Cys Glu Glu Leu Ile Leu Glu Leu Pro Gly
530 535 540
Val Leu Thr Val Ala Val Val Gly Val Pro Asp Glu Val Phe Gly Glu
545 550 555 560
Gln Val Cys Ala Val Val Val Pro Asn Met Asp Thr Ser Glu Gly Lys
565 570 575
Ala Leu Asp Gly Asp Ala Val Arg Asp Phe Val Arg Ala Glu Leu Ser
580 585 590
His Gln Lys Val Pro Lys Phe Val Leu Phe Arg His Ser Phe Asp Glu
595 600 605
Phe Met Thr Val Thr Gly Lys Leu Arg Lys Phe Gln Val Arg Asp Trp
610 615 620
Ala Thr Lys Glu Thr Ser Ala Gln Lys Glu Ala Ala Ala Lys Ala Ala
625 630 635 640
<210> 96
<211> 1893
<212> DNA
<213> Schizochytrium sp.
<400> 96
atggatgcag aaaaggtcat caaggcgggc gccgccgcgg gcgcagcgta cctgggatgg 60
aagtatctcg acgagaagca cggcatcagc cacgacctgg agctggcgcg gcgcctgctc 120
aagctcaaga aagagatcaa cgagcgcaac acgaaacgcg tctttaatgt gaccaacatg 180
tggtacgagg cgtacgccaa gaacccgaaa aagccggcgc tcctctacct cgacgaggtc 240
gtcacgtacc aggacatgga ggaccgctca aaccaggtgg ccaactggct cctgagcaag 300
gggctcaagc gcggcgacac cgtggccctt ctcatggaga accgtcccga gttcgtcatc 360
tcgtggctcg gcatgaccaa gatcggcgtc aaggtcgcgc tcatcaacac gagcatcaaa 420
cagaagcctc tcttgcattg cctgaaaatc tcggggtgca aaatcgttct ctttggaagc 480
gagctcgcgg agcccatcct cgacatcaag gacgagctcg ccgacctcgg catcgagctt 540
gccgccgagg gcgcgcgtga agcctctccc gactggatcg aggtcgtcaa cccggaaatc 600
gaggcctcgc ccaagaccgc gacctcgccc aagcttcgcg aaggcatcgg tatgcaggac 660
gtctttggct tcatttacac ctcgggcacc acgggtctgc ccaaggcggc tgtcattctt 720
caccaaaaaa tgtttagctt tggcgccctc atgaccaacg ccttccagtg cactcaggac 780
gatattgtct acacctgcct tccgctcttc cacagcgcgg gcggcggtct cggcatcggc 840
atcatgctct acaccggagc caccgtggtc atcaagcgca agttcagcgt cacggacttt 900
tggagcgatt gcgtcaagta caagtgcact gtcgtacagt acattggtga actctgccgg 960
tacctcgtca tggccgagtc gcggcccgag gagacccagc acaaggtccg ccttgccatc 1020
ggcaacggcc tgcggcccga gatctgggcc gagtttcagg agcgcttcca gattccgcaa 1080
attggcgagt tctatggcgc caccgagggc aatggcgccc tcgtacagca ctgcaccaag 1140
cccgaagacc gcggtgccgt cgggcgcatg ggttcgctgc tcatgcgcgt tacgggcgtc 1200
aagtttgctc gcttcgatgt cctcgaggag gcaccggtgc gcggcgctga cggcttttgc 1260
atcgaatgtg acgtcgacga gcctggcgag ctcctttttc ctattcgcga caacgacccc 1320
agctctgcct ttgccggcta caacgacccc aaggccacag caaagaagat catcacggac 1380
gcctttacca agggcgacaa gtactttcgc accggcgact tgctcagtcg tgatgcccgc 1440
ggccgcatct actttcgcga ccgcatcggc gacacctttc gctgtaaggg cgaaaacgtt 1500
tccaccagcg aggtcgccga agtcctttct acctatccgg gtatcgagga gctcaacatc 1560
tatggcgttc agatccccaa caatgaagat ggccgctttc cctgtgctgc tcttacgccc 1620
aaggatagcg acctttccaa cgttgatctc aaaggatttt acgagcacgc caagaagaat 1680
cttccgagtt actcgatccc gatgttcatt cgcgtacagc cggtcatgcc tgtgactgcc 1740
acgatgaagc atcaaaaggt gcagcttcgc aaggaaggca tggacattca cgtcatcaag 1800
gaccctatgt actggctcca tgacgtaaag aaggagtatg atcccttgac ggaggaggac 1860
tacgcgcgca tcatcggaca acgcgcgcgt ctt 1893
<210> 97
<211> 631
<212> PRT
<213> Schizochytrium sp.
<400> 97
Met Asp Ala Glu Lys Val Ile Lys Ala Gly Ala Ala Ala Gly Ala Ala
1 5 10 15
Tyr Leu Gly Trp Lys Tyr Leu Asp Glu Lys His Gly Ile Ser His Asp
20 25 30
Leu Glu Leu Ala Arg Arg Leu Leu Lys Leu Lys Lys Glu Ile Asn Glu
35 40 45
Arg Asn Thr Lys Arg Val Phe Asn Val Thr Asn Met Trp Tyr Glu Ala
50 55 60
Tyr Ala Lys Asn Pro Lys Lys Pro Ala Leu Leu Tyr Leu Asp Glu Val
65 70 75 80
Val Thr Tyr Gln Asp Met Glu Asp Arg Ser Asn Gln Val Ala Asn Trp
85 90 95
Leu Leu Ser Lys Gly Leu Lys Arg Gly Asp Thr Val Ala Leu Leu Met
100 105 110
Glu Asn Arg Pro Glu Phe Val Ile Ser Trp Leu Gly Met Thr Lys Ile
115 120 125
Gly Val Lys Val Ala Leu Ile Asn Thr Ser Ile Lys Gln Lys Pro Leu
130 135 140
Leu His Cys Leu Lys Ile Ser Gly Cys Lys Ile Val Leu Phe Gly Ser
145 150 155 160
Glu Leu Ala Glu Pro Ile Leu Asp Ile Lys Asp Glu Leu Ala Asp Leu
165 170 175
Gly Ile Glu Leu Ala Ala Glu Gly Ala Arg Glu Ala Ser Pro Asp Trp
180 185 190
Ile Glu Val Val Asn Pro Glu Ile Glu Ala Ser Pro Lys Thr Ala Thr
195 200 205
Ser Pro Lys Leu Arg Glu Gly Ile Gly Met Gln Asp Val Phe Gly Phe
210 215 220
Ile Tyr Thr Ser Gly Thr Thr Gly Leu Pro Lys Ala Ala Val Ile Leu
225 230 235 240
His Gln Lys Met Phe Ser Phe Gly Ala Leu Met Thr Asn Ala Phe Gln
245 250 255
Cys Thr Gln Asp Asp Ile Val Tyr Thr Cys Leu Pro Leu Phe His Ser
260 265 270
Ala Gly Gly Gly Leu Gly Ile Gly Ile Met Leu Tyr Thr Gly Ala Thr
275 280 285
Val Val Ile Lys Arg Lys Phe Ser Val Thr Asp Phe Trp Ser Asp Cys
290 295 300
Val Lys Tyr Lys Cys Thr Val Val Gln Tyr Ile Gly Glu Leu Cys Arg
305 310 315 320
Tyr Leu Val Met Ala Glu Ser Arg Pro Glu Glu Thr Gln His Lys Val
325 330 335
Arg Leu Ala Ile Gly Asn Gly Leu Arg Pro Glu Ile Trp Ala Glu Phe
340 345 350
Gln Glu Arg Phe Gln Ile Pro Gln Ile Gly Glu Phe Tyr Gly Ala Thr
355 360 365
Glu Gly Asn Gly Ala Leu Val Gln His Cys Thr Lys Pro Glu Asp Arg
370 375 380
Gly Ala Val Gly Arg Met Gly Ser Leu Leu Met Arg Val Thr Gly Val
385 390 395 400
Lys Phe Ala Arg Phe Asp Val Leu Glu Glu Ala Pro Val Arg Gly Ala
405 410 415
Asp Gly Phe Cys Ile Glu Cys Asp Val Asp Glu Pro Gly Glu Leu Leu
420 425 430
Phe Pro Ile Arg Asp Asn Asp Pro Ser Ser Ala Phe Ala Gly Tyr Asn
435 440 445
Asp Pro Lys Ala Thr Ala Lys Lys Ile Ile Thr Asp Ala Phe Thr Lys
450 455 460
Gly Asp Lys Tyr Phe Arg Thr Gly Asp Leu Leu Ser Arg Asp Ala Arg
465 470 475 480
Gly Arg Ile Tyr Phe Arg Asp Arg Ile Gly Asp Thr Phe Arg Cys Lys
485 490 495
Gly Glu Asn Val Ser Thr Ser Glu Val Ala Glu Val Leu Ser Thr Tyr
500 505 510
Pro Gly Ile Glu Glu Leu Asn Ile Tyr Gly Val Gln Ile Pro Asn Asn
515 520 525
Glu Asp Gly Arg Phe Pro Cys Ala Ala Leu Thr Pro Lys Asp Ser Asp
530 535 540
Leu Ser Asn Val Asp Leu Lys Gly Phe Tyr Glu His Ala Lys Lys Asn
545 550 555 560
Leu Pro Ser Tyr Ser Ile Pro Met Phe Ile Arg Val Gln Pro Val Met
565 570 575
Pro Val Thr Ala Thr Met Lys His Gln Lys Val Gln Leu Arg Lys Glu
580 585 590
Gly Met Asp Ile His Val Ile Lys Asp Pro Met Tyr Trp Leu His Asp
595 600 605
Val Lys Lys Glu Tyr Asp Pro Leu Thr Glu Glu Asp Tyr Ala Arg Ile
610 615 620
Ile Gly Gln Arg Ala Arg Leu
625 630
<210> 98
<211> 2950
<212> DNA
<213> Schizochytrium sp.
<400> 98
atgcgatgcg gacgcatctc tacagcctcc tcagcgctag ccggcctttg gaccatcttc 60
catgcaaaca aactgctgcg cttgcttcag cctgctgcag ctgcacgagg ccggcgcgga 120
ccgctcgtct cagttgttct cgagctcgga cttcctcttc cttctttctg cctgcctgct 180
gccattctta cgtgcgtacg catagtatac tactttggca acaactgcaa gtgcagcaaa 240
gcacaatgcc gttctgtaca gaacgggaac gctcggcgcc gacctcgact cggactcgga 300
cgccgagagc ttcaagttca accgcagtgc ggttgcggtg gccgatgaag aggaggccga 360
gagcctcacc gagagcagga cggagaggga agcggtccgg aggggctgca ctgggcaagc 420
aagctgggct aacaggaaga gctgagcaga gccaagctac gctgagcgcc gctcgggcag 480
catgccatcc atggcttcaa ggtggtgagg ctgggccggc aaagcccgaa ctcgagagac 540
agctcgcgag cgcgtgcgtc ccctgggcag gccgagaaga ccgcagcgga gggcaaggat 600
cgaggtatcg tcggagaccg ggaggaccgg gagcgcgcga tgggcagcgg aggcaaggat 660
gacgccggat cgggcgccag ggcagcagca gcagccaaga aggacaaacc ccttgcgacg 720
gttgaggtgc tggattctgg gcggcctgac ctgggtctgg gtccaatccg gcgctgcgcg 780
atgccgttcg ggcctgagct ctctgtcgag gggatgcgca cgctgtttga ggtttttcga 840
cgctcggtcg ataaacacgg ggaccgccca tgcctgggta gccgcccagt tggcgaggat 900
ggcgaacctg ggccgttctc gttcatgacc tacaatgaag tgcacaagca cgccatggcc 960
ttttcgcacg gcctcgtgca ccttgacgtg gtccacgcca acgacgaggg ccacaagctg 1020
cttggcttct ttgcagtaaa ccgccctggc gtcgtcatgt gtgagatcgg cgccatggcc 1080
cagcgcatcg tgcccgtgcc cctgtacgcg accctcggca ccgaggccgt cgagcacatc 1140
atcgaccaga cccagatgga ggtcattgtc tgcacgagca gcgagctcga ggacacgctg 1200
tccaagtccg aggaggtcat gaagcagctc agcactatca ttctcctcga tgaggacctt 1260
ggcgacgccc gccttgatga gctccgcaag atcggcgctg acgccgaggt caaggtgtac 1320
acgattgccg atgtcgagga gcttggcgag gcgcatgaag gcccgcttga tctcccgagc 1380
ggcgacgacc tcgcggtact ctgctacacg agcgggtcca cgggaacacc caagggcgtc 1440
ctcattacgc acagcagcat catctcggcg gtggccagtc tgcgccgctt tggtatcgat 1500
gtgcacgaag acgacgtgca cctttcatac ttgccattgg cgcatatttt cgagcgcgca 1560
ctcatgtacg ccatgctgta cggcggcgcc tccgtggggt ttttccgggg ttcctccaag 1620
gctatcttgg cagacctcaa ggccctgcgg cccaccattt tccccacggt gccccgtctg 1680
ctcaacaaga tgcacgactc gatctggtcc aaggtccggg agacgggcgg cgccaagcag 1740
gtcatctttg agaatgcgct ccaggccaag ttggagaacc ttcacggcgt gacgacgcgc 1800
gacaagctca atgccctgct cgaggactca accgtgacct cgtggctgtt ccagcgcact 1860
gtcaaggaca aggtcgagga cctgcgcacg ggccgcatca tccggcaaat tgctgggggc 1920
agcgacgagg acgtggagcg cgccgggggt ctccaacagt ggctctttga aaaggcgctg 1980
cgcgccaagt cgcaccagga gcccagcgtg gactttagca gctccgaggg ggaggtgact 2040
gcgcgctcca agaagccgct ttcggatcaa gtctttgacc ggatcgtttt cgacgcgctc 2100
aagaagaaga ttggccttga ccgcacgcgc attattgctg tcggatcagc gcccattaca 2160
ggcgaggttc ttgacttttt ccgctgcatg ctgggcattc ccgtgctcaa tgcctttgga 2220
tcgaccgaga gctcatgcgt gatttccctt acccacccgg aagatctttc gagcggccac 2280
gtgggtattc ctgcgccctg caacgaggta cgtctcacca atgtcgacga catgggctac 2340
aaggccaccg acacggagca caatggcgtt ccgtgcctgg gacggggcga gatctgcttc 2400
cggggcccga acgccttcaa ggggtactac aagatgaagg agaagacgga agagactctc 2460
accaaggacg gctggtgtct gacgggcgac attggtatgt ggaccgagga tggaatgctc 2520
aagattattg accgcaagaa gaatcttttc aagctggccc aaggcgagta cgtggcgcct 2580
gaaaaggtcg agaacgctta ctgccgcgcc gatctgctcg agtccatgtt cgtgtacggt 2640
gactctgaaa agtccaacct tgttgccatc attcaccctg acgcggacgt cgtctctgag 2700
gttggattgc agatggagga ctcgaaggag ctccacgacc gcatccagga tgagctcgac 2760
cagcaggctg acgccgcggg tctcaagggc tttgagcgcg tgcgtgcttt tcacattgaa 2820
accacgcctt ttacggaggt tgagggcatc actacggcca cgcagaagat caagcgtgcg 2880
gcagccaagg agcactacga ggacgtcatc gagaagctct acaaggagat cgacgagtaa 2940
atagacaata 2950
<210> 99
<211> 766
<212> PRT
<213> Schizochytrium sp.
<400> 99
Met Gly Ser Gly Gly Lys Asp Asp Ala Gly Ser Gly Ala Arg Ala Ala
1 5 10 15
Ala Ala Ala Lys Lys Asp Lys Pro Leu Ala Thr Val Glu Val Leu Asp
20 25 30
Ser Gly Arg Pro Asp Leu Gly Leu Gly Pro Ile Arg Arg Cys Ala Met
35 40 45
Pro Phe Gly Pro Glu Leu Ser Val Glu Gly Met Arg Thr Leu Phe Glu
50 55 60
Val Phe Arg Arg Ser Val Asp Lys His Gly Asp Arg Pro Cys Leu Gly
65 70 75 80
Ser Arg Pro Val Gly Glu Asp Gly Glu Pro Gly Pro Phe Ser Phe Met
85 90 95
Thr Tyr Asn Glu Val His Lys His Ala Met Ala Phe Ser His Gly Leu
100 105 110
Val His Leu Asp Val Val His Ala Asn Asp Glu Gly His Lys Leu Leu
115 120 125
Gly Phe Phe Ala Val Asn Arg Pro Gly Val Val Met Cys Glu Ile Gly
130 135 140
Ala Met Ala Gln Arg Ile Val Pro Val Pro Leu Tyr Ala Thr Leu Gly
145 150 155 160
Thr Glu Ala Val Glu His Ile Ile Asp Gln Thr Gln Met Glu Val Ile
165 170 175
Val Cys Thr Ser Ser Glu Leu Glu Asp Thr Leu Ser Lys Ser Glu Glu
180 185 190
Val Met Lys Gln Leu Ser Thr Ile Ile Leu Leu Asp Glu Asp Leu Gly
195 200 205
Asp Ala Arg Leu Asp Glu Leu Arg Lys Ile Gly Ala Asp Ala Glu Val
210 215 220
Lys Val Tyr Thr Ile Ala Asp Val Glu Glu Leu Gly Glu Ala His Glu
225 230 235 240
Gly Pro Leu Asp Leu Pro Ser Gly Asp Asp Leu Ala Val Leu Cys Tyr
245 250 255
Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Val Leu Ile Thr His Ser
260 265 270
Ser Ile Ile Ser Ala Val Ala Ser Leu Arg Arg Phe Gly Ile Asp Val
275 280 285
His Glu Asp Asp Val His Leu Ser Tyr Leu Pro Leu Ala His Ile Phe
290 295 300
Glu Arg Ala Leu Met Tyr Ala Met Leu Tyr Gly Gly Ala Ser Val Gly
305 310 315 320
Phe Phe Arg Gly Ser Ser Lys Ala Ile Leu Ala Asp Leu Lys Ala Leu
325 330 335
Arg Pro Thr Ile Phe Pro Thr Val Pro Arg Leu Leu Asn Lys Met His
340 345 350
Asp Ser Ile Trp Ser Lys Val Arg Glu Thr Gly Gly Ala Lys Gln Val
355 360 365
Ile Phe Glu Asn Ala Leu Gln Ala Lys Leu Glu Asn Leu His Gly Val
370 375 380
Thr Thr Arg Asp Lys Leu Asn Ala Leu Leu Glu Asp Ser Thr Val Thr
385 390 395 400
Ser Trp Leu Phe Gln Arg Thr Val Lys Asp Lys Val Glu Asp Leu Arg
405 410 415
Thr Gly Arg Ile Ile Arg Gln Ile Ala Gly Gly Ser Asp Glu Asp Val
420 425 430
Glu Arg Ala Gly Gly Leu Gln Gln Trp Leu Phe Glu Lys Ala Leu Arg
435 440 445
Ala Lys Ser His Gln Glu Pro Ser Val Asp Phe Ser Ser Ser Glu Gly
450 455 460
Glu Val Thr Ala Arg Ser Lys Lys Pro Leu Ser Asp Gln Val Phe Asp
465 470 475 480
Arg Ile Val Phe Asp Ala Leu Lys Lys Lys Ile Gly Leu Asp Arg Thr
485 490 495
Arg Ile Ile Ala Val Gly Ser Ala Pro Ile Thr Gly Glu Val Leu Asp
500 505 510
Phe Phe Arg Cys Met Leu Gly Ile Pro Val Leu Asn Ala Phe Gly Ser
515 520 525
Thr Glu Ser Ser Cys Val Ile Ser Leu Thr His Pro Glu Asp Leu Ser
530 535 540
Ser Gly His Val Gly Ile Pro Ala Pro Cys Asn Glu Val Arg Leu Thr
545 550 555 560
Asn Val Asp Asp Met Gly Tyr Lys Ala Thr Asp Thr Glu His Asn Gly
565 570 575
Val Pro Cys Leu Gly Arg Gly Glu Ile Cys Phe Arg Gly Pro Asn Ala
580 585 590
Phe Lys Gly Tyr Tyr Lys Met Lys Glu Lys Thr Glu Glu Thr Leu Thr
595 600 605
Lys Asp Gly Trp Cys Leu Thr Gly Asp Ile Gly Met Trp Thr Glu Asp
610 615 620
Gly Met Leu Lys Ile Ile Asp Arg Lys Lys Asn Leu Phe Lys Leu Ala
625 630 635 640
Gln Gly Glu Tyr Val Ala Pro Glu Lys Val Glu Asn Ala Tyr Cys Arg
645 650 655
Ala Asp Leu Leu Glu Ser Met Phe Val Tyr Gly Asp Ser Glu Lys Ser
660 665 670
Asn Leu Val Ala Ile Ile His Pro Asp Ala Asp Val Val Ser Glu Val
675 680 685
Gly Leu Gln Met Glu Asp Ser Lys Glu Leu His Asp Arg Ile Gln Asp
690 695 700
Glu Leu Asp Gln Gln Ala Asp Ala Ala Gly Leu Lys Gly Phe Glu Arg
705 710 715 720
Val Arg Ala Phe His Ile Glu Thr Thr Pro Phe Thr Glu Val Glu Gly
725 730 735
Ile Thr Thr Ala Thr Gln Lys Ile Lys Arg Ala Ala Ala Lys Glu His
740 745 750
Tyr Glu Asp Val Ile Glu Lys Leu Tyr Lys Glu Ile Asp Glu
755 760 765
<210> 100
<211> 5341
<212> DNA
<213> Schizochytrium sp.
<400> 100
ttcggctctt cgaacacttc gtcatcttcc accaccgcga ctgcaggaaa taccgctggc 60
agcagtggag gcagcctctt cgggtcttcg ggcgggacaa gcaccggtgg gggcacatcc 120
ggctctcttt tcggcagcag cagcagtagc agcagcaacg gtgcgaccgg gacggccagc 180
tcgagcgccg gggacaattc tagcacgtct ttattttctg gcccatcaac gccgctgcag 240
tctggatcct cagggcttgg cagcaatgca ggtaccactg cccctcgcaa gaagtcgagc 300
aggcgcaact ctcgccgcaa gtaaagaaaa aggtttttac cattatatac cactacacat 360
ttgttccttc gactctcatg tttctacatt tcgctcacat gtcagcttgg ttactcgctc 420
cattttccat cttgctgacg acagcgacgc ccactcttgc tgccacgcac actacactac 480
ctggcagtcg gcactggtac ggcgagcctc cactccatcc agctcgactc ctccctcacc 540
cgaaccgcaa cgcgtatggt ctccgaggcc gtcgtccgtc gcagcatctt cgccagtcaa 600
gatcgccctc gccaaccatg cgcatcctct gcgcatttcc gcgctcgctg ccgttatccg 660
aggcgagctc gcgagtccca accgttcgtt gttgacgccc ccctctgcca gagagcagaa 720
gaagctcacg ggcctccctc gatcgatcga tctcttaacc gcgacgaggg agccgccctg 780
ccgccagagg gcctcgagaa gccccccggc cgcggcggtt ggcggcggag atcggtatct 840
tcctcgcaga aagtagcgca tccgttcatg gcgaactgta aagtacgcat acgtctacgc 900
gcgggcggct gcggctgcga aagtaagagg actggagtgc acacgagccg cgagctgcga 960
aagctcggcc tggccttgcc tggtcctgct ttcaagttct ttcctctcct cgcatttcaa 1020
gttcgcgcag gataggatag gatccaaact gacagacaaa ccgagacaga catgcgtata 1080
aacagacaca gacagcgtct ccctcgtctc tcgggcggca gatcgcgatc gagggagagc 1140
gaggccccgc gaggctgcac gaggcgcgcg accgcgactc gccgcggcag gagcgcggca 1200
gcggcggcgc gcggcgcggg gaggaggcgc ggagcgaggc ggcggcgagg cagggcgagg 1260
cagggcaagg ccccgctcgc atcgcgtcgc atcgcgccgc accgcccgcg gcacgtcgtc 1320
atcgaggggc gcgcgacgac gccgttggcg ccggaggacg cgcagacgca gacgcaaagc 1380
gcgacgcggc gcgcggacag cagcgcagag caaggcggaa agcgcgcgag agcggcgcag 1440
cgggcagcgg cgaggcgagg cgaggtccgg ctcgggcgcg ggcgcgggcg cgagaccggg 1500
agaaggagaa gcgcgaggct caagaagccg cgagatcagc gattcctctc ctaacctctt 1560
tctttcctcc tcggacttga gcggcagaag cgcagctcgg acgcagagcg cagcgcagcg 1620
ccgcgcagcg ccgcgcagcg acacggcaga ggcgacggcg ggcgggcggg cgggcgggcg 1680
ggcgggcaga cgcgcgcaag ctctcggaca gtctcggtcg ctcgcgagcc ccagggcgga 1740
gggcgtggac ccgtgctccg cggaggaagg aagtaaaaaa aaagggcaga acagcatgga 1800
gcggcctcag gcgcaggcct cgcccgcacg gtccgaggcg cggcggcgac gcggcgacag 1860
gtccaagggg ttcgccgacg aggatggaga gaccagcgtg aacaccccga acgggatgca 1920
gacaccgtac agcacgtcga tgggctccgt ctcgagctac tcgtcgtctg gcgactacgc 1980
catgtccgaa gcggagggct ccgaagtgga ccctgccgat gacaggatgg gcgactcaat 2040
cggatcgaaa ccaagctcct cgtccgtgac cggacgccgg cgactcacgc aagaagagcg 2100
cgactacttt ttgcgtcttg aaaaggaatg gcgcgaggag gacgcatggg ctgaccaacc 2160
cgggtcctgg tactcaatgc tggcctggat gccggtcctc attggcctgc gcgtcttcaa 2220
cgtgctgctt tccatcgcct tttggcctgt ctcctttgtg gcgcgggtct tcttcggcaa 2280
aaagattcac acggtcagtt tctgggacgt tccgctttcc cgccgtaaac aaactgccgt 2340
ggtgctcttg ttcgtcatgc tcctgcccat ggtcgtcgtg gtgtactcgt ggacgctcgt 2400
tctgcttctc ttcccgctca cgacctttcc cacactgtgc tacatggtgt ggatcattta 2460
cgtggacaag agtcccgaaa caggctcgcg ccgacccttt ttgcgctatt ggaagatgtg 2520
gcgccatttc gcgaactatt tcccgcttcg actcattcgc accacgccgc tcgactcccg 2580
tcgcaagtac gtcttttgct accatccgca cggaatcatc tcgctcggtg cctttggcaa 2640
ctttgcgacg gactcgaccg gattctcgcg caaattcccc ggtatcgatt tgcgcgtgct 2700
cacgcttgcg ctcaactttt actgccccct tttgcgcgag tttctgcttt acctgggcct 2760
ttgcagcgcc gcaaagaagt cctgcaacca aattttgcag cgcgggcctg gatccgccat 2820
catgctcgtc gttggcggcg ccgccgagtc tctcgactcc cagccaggca cctatcgatt 2880
gacgctcggc cgaaaggggt tcgtgcgcgt tgcccttgac aatggtgccg atctagtgcc 2940
ggtgcttgcc tttggcgaga atgacgtatt tgacaccgtg tacctcccac cgaactcgtg 3000
ggcacgaaac gtgcaagagt ttgtgcgcaa gaagcttggt ttcgccacac caattttcag 3060
tggccgcggt atcttccagt acaacatggg gctcatgcct caccgccgtc ccattattgt 3120
cgttgttgga aaacccatca aaatgcccaa aattcccgat gagctcaagg gccgcgcgct 3180
ttccaccacg gccgagggcg ttgccctcgt tgacaagtac cacgaaaagt atgtcaaggc 3240
gcttcgcgag ctctggaact tgtacaagga gcgctgggcc gtgcaccgtc aaggttcgct 3300
gctcattcaa aagtaaaaaa cctaatgaac aacccaagca acttgcttct tttcttttct 3360
tttcttttca ttttcggcct tgctgtttga ttgtgttgcg cagatgtctg tgtgaatgca 3420
aacaagaaaa ggtcaaaagt ttcaagaagc aaaaaaaacc gaagaaatga atgaatgacc 3480
aaaaagtttt caataaatgc gtatgacacg aggcaacgtg cgtgcgcagg gtcttatttc 3540
ttactactgt tgttgttgtt gttgttgttg tcgttgttgt tgtttgtgga gagcaactac 3600
gttgcaaagt catattgtgt cgcggatgtg gtgccatgtc tgtttctctg tctcttttgt 3660
ctgtatgtct acttgtcgtc gccttcttcg tccgaagcgg attctgcgtc ctcacgttca 3720
gcctcttcag cagcttcttt gagcgcagcc gcagcgtcga gatcatgcac atactctgga 3780
agtctgaaaa tgtgcagcgt gttacggcct ccagactttc gttcccagcg acccaagcgg 3840
tgctcctgac cacagcccgc aaggagaacg cgacccgaag cgccaaaggc cagcgcgttt 3900
acgtatccgg gcactggcag actcatcagc gagggagcct tgatccgacg cacagtcgtg 3960
tccacattcc aaagcttgac gtacccgtcc gcggcgcccg aagctgcaat atctgcgttg 4020
ggcatagcag ccacggagca aatccacgag tcgccatgcg cgcggcgaac aatggagctt 4080
ggcttcttct tcgctgtgct ccacagcgcg agagtgcctt cctgcgaacc actgacaaag 4140
tgcgtctcgt cggccatggc aatcgtgtcg attgacgact tgtgcacacc ttgcaacacg 4200
agctgcgact cctcggggaa tttccaaaag cgcacggaac ggtccatgga gcacgtgact 4260
gcgcgctccc tatacaagca gtcaatgcca agaatcgggg cctggtggcc aaaaagcgac 4320
tctatataag ccatctcgtc cacgttccat gcgcggacac tgcggtcaaa agacgaagag 4380
tacaaggtgt gcttgccatt caaaaaggta aggcctgaga cggcgtcacg atggccggaa 4440
aagctgtcga ccagcgtgtt cgatcgtgca tcccaaatat gaatcacctt gtccttgccg 4500
ccgctcgcaa ggtacctgcc gtcagtgctg accgcaaccg ctaagatctc gtcgtgatga 4560
cctttgatgc tcgaagcagc gatttgcttg gtggcaggcc gccctggaaa ccgcgtgacc 4620
ctttttccag tctccacatc ccagcgcacg attgaacaat cctttgaccc agtgtatgcc 4680
acgtcctccg cgcctgtcag tgcaatgcac gtcacagaca gacgatgcgt tcgaggacac 4740
ttatggtagc taatatcctc ttgcttgaga gccgcggcca caggtcgtcg cagtcggcct 4800
tcggcgcgga gaagatcgtg gtgaagtttt tgcgttacag ggtctaaccc gttgttaagt 4860
ttggccgtgt catcatcgtc gtcctcatcg gagcccgagc cgtcctcatc ggagcccgtc 4920
tcgcctgcgc gtcgttgcga ggcctgcacc ttggcaagaa tttctcgtgc aacacgaagt 4980
cgtttttctg ctggggtctc tgcatgttcc tgagcatcgg caagcgtatc ctcttgtgaa 5040
ttgcgacgat catctacatc ggattcctca tcgttgctgt cgagatccca gtcgacgttg 5100
agttttgctt cgcggcgggg gcgcttcgtc ccgtttgcct gtcgatcaca tcgagagcat 5160
tagttcgtca gtcgatcacc tcctcatttt atccaatcat tccccagcat catgtagaac 5220
aaaaaaagag ggccaatctc gttgagcaat gggctgttca aagtcatgcc tcagttggcg 5280
atcaagccta ggttcggaca gtctcacctt ctcccgagag agaatcggaa acgaggaatt 5340
c 5341
<210> 101
<211> 506
<212> PRT
<213> Schizochytrium sp.
<400> 101
Met Glu Arg Pro Gln Ala Gln Ala Ser Pro Ala Arg Ser Glu Ala Arg
1 5 10 15
Arg Arg Arg Gly Asp Arg Ser Lys Gly Phe Ala Asp Glu Asp Gly Glu
20 25 30
Thr Ser Val Asn Thr Pro Asn Gly Met Gln Thr Pro Tyr Ser Thr Ser
35 40 45
Met Gly Ser Val Ser Ser Tyr Ser Ser Ser Gly Asp Tyr Ala Met Ser
50 55 60
Glu Ala Glu Gly Ser Glu Val Asp Pro Ala Asp Asp Arg Met Gly Asp
65 70 75 80
Ser Ile Gly Ser Lys Pro Ser Ser Ser Ser Val Thr Gly Arg Arg Arg
85 90 95
Leu Thr Gln Glu Glu Arg Asp Tyr Phe Leu Arg Leu Glu Lys Glu Trp
100 105 110
Arg Glu Glu Asp Ala Trp Ala Asp Gln Pro Gly Ser Trp Tyr Ser Met
115 120 125
Leu Ala Trp Met Pro Val Leu Ile Gly Leu Arg Val Phe Asn Val Leu
130 135 140
Leu Ser Ile Ala Phe Trp Pro Val Ser Phe Val Ala Arg Val Phe Phe
145 150 155 160
Gly Lys Lys Ile His Thr Val Ser Phe Trp Asp Val Pro Leu Ser Arg
165 170 175
Arg Lys Gln Thr Ala Val Val Leu Leu Phe Val Met Leu Leu Pro Met
180 185 190
Val Val Val Val Tyr Ser Trp Thr Leu Val Leu Leu Leu Phe Pro Leu
195 200 205
Thr Thr Phe Pro Thr Leu Cys Tyr Met Val Trp Ile Ile Tyr Val Asp
210 215 220
Lys Ser Pro Glu Thr Gly Ser Arg Arg Pro Phe Leu Arg Tyr Trp Lys
225 230 235 240
Met Trp Arg His Phe Ala Asn Tyr Phe Pro Leu Arg Leu Ile Arg Thr
245 250 255
Thr Pro Leu Asp Ser Arg Arg Lys Tyr Val Phe Cys Tyr His Pro His
260 265 270
Gly Ile Ile Ser Leu Gly Ala Phe Gly Asn Phe Ala Thr Asp Ser Thr
275 280 285
Gly Phe Ser Arg Lys Phe Pro Gly Ile Asp Leu Arg Val Leu Thr Leu
290 295 300
Ala Leu Asn Phe Tyr Cys Pro Leu Leu Arg Glu Phe Leu Leu Tyr Leu
305 310 315 320
Gly Leu Cys Ser Ala Ala Lys Lys Ser Cys Asn Gln Ile Leu Gln Arg
325 330 335
Gly Pro Gly Ser Ala Ile Met Leu Val Val Gly Gly Ala Ala Glu Ser
340 345 350
Leu Asp Ser Gln Pro Gly Thr Tyr Arg Leu Thr Leu Gly Arg Lys Gly
355 360 365
Phe Val Arg Val Ala Leu Asp Asn Gly Ala Asp Leu Val Pro Val Leu
370 375 380
Ala Phe Gly Glu Asn Asp Val Phe Asp Thr Val Tyr Leu Pro Pro Asn
385 390 395 400
Ser Trp Ala Arg Asn Val Gln Glu Phe Val Arg Lys Lys Leu Gly Phe
405 410 415
Ala Thr Pro Ile Phe Ser Gly Arg Gly Ile Phe Gln Tyr Asn Met Gly
420 425 430
Leu Met Pro His Arg Arg Pro Ile Ile Val Val Val Gly Lys Pro Ile
435 440 445
Lys Met Pro Lys Ile Pro Asp Glu Leu Lys Gly Arg Ala Leu Ser Thr
450 455 460
Thr Ala Glu Gly Val Ala Leu Val Asp Lys Tyr His Glu Lys Tyr Val
465 470 475 480
Lys Ala Leu Arg Glu Leu Trp Asn Leu Tyr Lys Glu Arg Trp Ala Val
485 490 495
His Arg Gln Gly Ser Leu Leu Ile Gln Lys
500 505
<210> 102
<211> 1478
<212> DNA
<213> Schizochytrium sp.
<400> 102
tgagggtagc taagcgacaa tcgtggagta taagacctga tgtcatgatg atgtgacgaa 60
caacgaacgt aaaaacgcag cacgaggcgc aagaagggac acctgcggca accaagtagg 120
aacggcagac aggagattgc gctcctgtgc cacgggctgc cagctacaaa cgcactcgca 180
gcagcgacgg cagagcaaac acgagtgacc cacggacctc tcttcatgcg tcgacgtggg 240
ggccaagatg agcacggcgc gagtcaagag cgtgaaactc acgagaacga cgacgacact 300
gtagcgtcag agatagctcc tttccagcgt gtggacgcga atatggacgc gtggacgcga 360
ctgaaaactg ccattgcgct cgtgacgctg gtccctgtga ggatcgctct cttgacaacg 420
ctgctcggaa cgtacggctt ggcgctcgca gcgagtgcac gttttggcat tccgcagcgc 480
tacaagctcg ctgtgacccg ccacgtgacg cgctggaccc tatggatcct tggtttttat 540
catattgaag tcgagggcga tgcacaaggc ttgcaagaac gaccgcgtgt gattgttgca 600
aatcacattt cgtatcttga gattttgtac tttatgtcga cagcgcattg cccttcgttc 660
gtcatgaaaa agacctgttt aaaagtcccc ctcgttggct acgtcgccat ggagcttgga 720
ggtctcttgg tagaccgcga gggtggcggt ccgagcgctt cggaggcaat cttctcgagg 780
gtgaagagtc ctcgcaaaga cgagaaacag ccactgcttg tgtttcctga aggaacgact 840
tcaaatggga cgtgtctttt gcagttcaaa acaggagctt ttcgcccggg cgtcccggtt 900
ctccctgtgg ttctcgagtt ccccattgat gcttctcgcg gagatttttc gccagcatat 960
gaatcggtgc acacgccgac acacctttta cgcatgcttg cgcagtggcg acaccgcttg 1020
cgcgtgcgct atcttccact cttcgagccc aatgagatgg agaaagctga tgcggcgctt 1080
tttgcgcgca atgttcgaaa ggagatggca agcgcgcttc atgtgcctac ggtcgagcaa 1140
acctacagcg ataagctcgc atatcatgca gagctcatgc ctcactacaa gcgagctggt 1200
cctggtgcgc tttatctcta tgtgcgtccg gacatcctac cacatgcacg caacacagtg 1260
tcatcatgaa cgtattttgg ttaacggaag tatgcacatg catgggagag aggaaagtat 1320
gctcaaagat gcacttgcac accatttgta ggtaacccga ttcgaagagg ggaaaagggt 1380
tatataaaat gaaagaggat tcatctaaca atctagcatc atttgttctc cttgacatgc 1440
accctccgag aggaagaaaa cctttcactt gggcacta 1478
<210> 103
<211> 927
<212> DNA
<213> Schizochytrium sp.
<400> 103
atggacgcgt ggacgcgact gaaaactgcc attgcgctcg tgacgctggt ccctgtgagg 60
atcgctctct tgacaacgct gctcggaacg tacggcttgg cgctcgcagc gagtgcacgt 120
tttggcattc cgcagcgcta caagctcgct gtgacccgcc acgtgacgcg ctggacccta 180
tggatccttg gtttttatca tattgaagtc gagggcgatg cacaaggctt gcaagaacga 240
ccgcgtgtga ttgttgcaaa tcacatttcg tatcttgaga ttttgtactt tatgtcgaca 300
gcgcattgcc cttcgttcgt catgaaaaag acctgtttaa aagtccccct cgttggctac 360
gtcgccatgg agcttggagg tctcttggta gaccgcgagg gtggcggtcc gagcgcttcg 420
gaggcaatct tctcgagggt gaagagtcct cgcaaagacg agaaacagcc actgcttgtg 480
tttcctgaag gaacgacttc aaatgggacg tgtcttttgc agttcaaaac aggagctttt 540
cgcccgggcg tcccggttct ccctgtggtt ctcgagttcc ccattgatgc ttctcgcgga 600
gatttttcgc cagcatatga atcggtgcac acgccgacac accttttacg catgcttgcg 660
cagtggcgac accgcttgcg cgtgcgctat cttccactct tcgagcccaa tgagatggag 720
aaagctgatg cggcgctttt tgcgcgcaat gttcgaaagg agatggcaag cgcgcttcat 780
gtgcctacgg tcgagcaaac ctacagcgat aagctcgcat atcatgcaga gctcatgcct 840
cactacaagc gagctggtcc tggtgcgctt tatctctatg tgcgtccgga catcctacca 900
catgcacgca acacagtgtc atcatga 927
<210> 104
<211> 308
<212> PRT
<213> Schizochytrium sp.
<400> 104
Met Asp Ala Trp Thr Arg Leu Lys Thr Ala Ile Ala Leu Val Thr Leu
1 5 10 15
Val Pro Val Arg Ile Ala Leu Leu Thr Thr Leu Leu Gly Thr Tyr Gly
20 25 30
Leu Ala Leu Ala Ala Ser Ala Arg Phe Gly Ile Pro Gln Arg Tyr Lys
35 40 45
Leu Ala Val Thr Arg His Val Thr Arg Trp Thr Leu Trp Ile Leu Gly
50 55 60
Phe Tyr His Ile Glu Val Glu Gly Asp Ala Gln Gly Leu Gln Glu Arg
65 70 75 80
Pro Arg Val Ile Val Ala Asn His Ile Ser Tyr Leu Glu Ile Leu Tyr
85 90 95
Phe Met Ser Thr Ala His Cys Pro Ser Phe Val Met Lys Lys Thr Cys
100 105 110
Leu Lys Val Pro Leu Val Gly Tyr Val Ala Met Glu Leu Gly Gly Leu
115 120 125
Leu Val Asp Arg Glu Gly Gly Gly Pro Ser Ala Ser Glu Ala Ile Phe
130 135 140
Ser Arg Val Lys Ser Pro Arg Lys Asp Glu Lys Gln Pro Leu Leu Val
145 150 155 160
Phe Pro Glu Gly Thr Thr Ser Asn Gly Thr Cys Leu Leu Gln Phe Lys
165 170 175
Thr Gly Ala Phe Arg Pro Gly Val Pro Val Leu Pro Val Val Leu Glu
180 185 190
Phe Pro Ile Asp Ala Ser Arg Gly Asp Phe Ser Pro Ala Tyr Glu Ser
195 200 205
Val His Thr Pro Thr His Leu Leu Arg Met Leu Ala Gln Trp Arg His
210 215 220
Arg Leu Arg Val Arg Tyr Leu Pro Leu Phe Glu Pro Asn Glu Met Glu
225 230 235 240
Lys Ala Asp Ala Ala Leu Phe Ala Arg Asn Val Arg Lys Glu Met Ala
245 250 255
Ser Ala Leu His Val Pro Thr Val Glu Gln Thr Tyr Ser Asp Lys Leu
260 265 270
Ala Tyr His Ala Glu Leu Met Pro His Tyr Lys Arg Ala Gly Pro Gly
275 280 285
Ala Leu Tyr Leu Tyr Val Arg Pro Asp Ile Leu Pro His Ala Arg Asn
290 295 300
Thr Val Ser Ser
305
<210> 105
<211> 2111
<212> DNA
<213> Schizochytrium sp.
<400> 105
cccacgcatc cgagacggac gaccgaccga ccgaccgtgc cggcagcgga gcaggcgcac 60
ggcatcgcgc gcgaggcctc gcggggcgaa ggactgactg agagagagag agtcagacag 120
gcagacaggc agacagagag accctaggcg cagaacccga acggggagag ggaccgcgac 180
cgcaagacgg gagaggcccg acgcggctcg acgtggcgtg gcctgcgtag gagtgggcgg 240
gcgagctcgg ccggctggcg ttgttgttgc tgtcgctgtc gttgtcgtcg tcggtgctgc 300
cgtcgtcgtt gttgtggtta ttgacgcggt tgttgggtgg gagaaaaaga gaacaccaca 360
ccatgtgggc gccacagacg gtcgtggagc tgatgcgcag caagctgggc ggcgcggaga 420
ccgacgcgac agtgagcatg cccaagtcga aaagcgccgc gaagtcgacc acggcgagcg 480
tgatctcgca gttctcgcag tatgtggccg caggcagcgc caccatggcg cgcgaggaaa 540
ccgagaaaaa ggcgaaccca ttccagacca tggagcacat caacgtccgc gagtggatca 600
aactcgtcgt cggcgcgctc atcgtcgcgc cactgcgctt cctcatcatt ctcctcgtca 660
tcggcatcgg cacgatcttc atgatgctca ccgtcgcagg ggcggacatc tccaagccgc 720
tctccccgcg aagaggcttt gcgcagcaaa tcatcaccgc catctgcggc tacctcatct 780
gcgcctgcat gggtgtctac cgcatccgca ccaagggcac gcacgcgtcc gccgaggagt 840
gcaagatgat catcgccgcc ccgcactcaa ccgtcatgga cgccgtcatc ctcgcctacg 900
cttgccgcgg accctctact gtgggcaaaa ttgaaatctc caagaccttt ctcggaccct 960
tcatgaacgc cttgcaaacc atctacgtcg accgttccga caagttcaac cgctccagcg 1020
tggcagcgca gatccgcgcg cgtgtgggcg ccgcctcgcc ctggcgtagg caactcatga 1080
tcttccccga aggcacctgc accaaccgga ccagcctcat ctcttttcgc cgcggtgctt 1140
tcgagccttg tgcacctgtg cagccagtcg tgctccattg gtcgtacacc aactttgacc 1200
cgacctggtg cgccggcgcg ccctcgcgca ccctcatcgc cctccgtacg ctctcgcagt 1260
tcttccacga ggtcactgtt gagtttctgc ccgtgtacaa gccctcggaa gaggaacgcg 1320
cggattccgc cctgtacagc gagaatgtgc gcaagcttat ggctgtctcg ctcggcatcc 1380
cgacctcgga ccactcgtac gaggacatgt ttctcgccca aatcgccgcc aaaaacaagc 1440
tcaagcctag cgctgtgctc ccctttacat acgcctccct ccggagcaag cttccgcccg 1500
cagctgcctc gagcccgcgc ctctttgagc gtgtgcgggg cctgctcttg tgctttgcca 1560
aggctcctct catgacaaag gagcgccctc gtctcgatcg tgcccagttt gatgtcgtgt 1620
ctcctgtggc ggccacatcg ctcgacatta agatttcgct tacctggacc caggtcgctt 1680
tggagagctc cgtcgccggt gcgccttcgt cggccgatac cttttccttt tacgagtttg 1740
cactcgccca gctcaaggct gcatcatggg actagcgact ctgctttggc caagttcctt 1800
gcatgttaga ctctacaggc aacaaagacg gacaatcacg gcgcaggacg accgcacgag 1860
ctgtctttgc cttttatata cacacacact tcacccactc acgacgagac tgaacatcat 1920
ctgacccttt tctcacgcat tcatttgcgc gagagcgcac acacacacat ggacatgtga 1980
tggtgttggc ctctttttct ttcttttggc atatttgccc atgcacaaaa agacttttgc 2040
caccaccttt acattgtatt gtagttacta cagttagcca aagtagccta gttgcaactt 2100
ttccccaaaa a 2111
<210> 106
<211> 1140
<212> DNA
<213> Schizochytrium sp.
<400> 106
cgcttcctca tcattctcct cgtcatcggc atcggcacga tcttcatgat gctcaccgtc 60
gcaggggcgg acatctccaa gccgctctcc ccgcgaagag gctttgcgca gcaaatcatc 120
accgccatct gcggctacct catctgcgcc tgcatgggtg tctaccgcat ccgcaccaag 180
ggcacgcacg cgtccgccga ggagtgcaag atgatcatcg ccgccccgca ctcaaccgtc 240
atggacgccg tcatcctcgc ctacgcttgc cgcggaccct ctactgtggg caaaattgaa 300
atctccaaga cctttctcgg acccttcatg aacgccttgc aaaccatcta cgtcgaccgt 360
tccgacaagt tcaaccgctc cagcgtggca gcgcagatcc gcgcgcgtgt gggcgccgcc 420
tcgccctggc gtaggcaact catgatcttc cccgaaggca cctgcaccaa ccggaccagc 480
ctcatctctt ttcgccgcgg tgctttcgag ccttgtgcac ctgtgcagcc agtcgtgctc 540
cattggtcgt acaccaactt tgacccgacc tggtgcgccg gcgcgccctc gcgcaccctc 600
atcgccctcc gtacgctctc gcagttcttc cacgaggtca ctgttgagtt tctgcccgtg 660
tacaagccct cggaagagga acgcgcggat tccgccctgt acagcgagaa tgtgcgcaag 720
cttatggctg tctcgctcgg catcccgacc tcggaccact cgtacgagga catgtttctc 780
gcccaaatcg ccgccaaaaa caagctcaag cctagcgctg tgctcccctt tacatacgcc 840
tccctccgga gcaagcttcc gcccgcagct gcctcgagcc cgcgcctctt tgagcgtgtg 900
cggggcctgc tcttgtgctt tgccaaggct cctctcatga caaaggagcg ccctcgtctc 960
gatcgtgccc agtttgatgt cgtgtctcct gtggcggcca catcgctcga cattaagatt 1020
tcgcttacct ggacccaggt cgctttggag agctccgtcg ccggtgcgcc ttcgtcggcc 1080
gatacctttt ccttttacga gtttgcactc gcccagctca aggctgcatc atgggactag 1140
<210> 107
<211> 379
<212> PRT
<213> Schizochytrium sp.
<400> 107
Arg Phe Leu Ile Ile Leu Leu Val Ile Gly Ile Gly Thr Ile Phe Met
1 5 10 15
Met Leu Thr Val Ala Gly Ala Asp Ile Ser Lys Pro Leu Ser Pro Arg
20 25 30
Arg Gly Phe Ala Gln Gln Ile Ile Thr Ala Ile Cys Gly Tyr Leu Ile
35 40 45
Cys Ala Cys Met Gly Val Tyr Arg Ile Arg Thr Lys Gly Thr His Ala
50 55 60
Ser Ala Glu Glu Cys Lys Met Ile Ile Ala Ala Pro His Ser Thr Val
65 70 75 80
Met Asp Ala Val Ile Leu Ala Tyr Ala Cys Arg Gly Pro Ser Thr Val
85 90 95
Gly Lys Ile Glu Ile Ser Lys Thr Phe Leu Gly Pro Phe Met Asn Ala
100 105 110
Leu Gln Thr Ile Tyr Val Asp Arg Ser Asp Lys Phe Asn Arg Ser Ser
115 120 125
Val Ala Ala Gln Ile Arg Ala Arg Val Gly Ala Ala Ser Pro Trp Arg
130 135 140
Arg Gln Leu Met Ile Phe Pro Glu Gly Thr Cys Thr Asn Arg Thr Ser
145 150 155 160
Leu Ile Ser Phe Arg Arg Gly Ala Phe Glu Pro Cys Ala Pro Val Gln
165 170 175
Pro Val Val Leu His Trp Ser Tyr Thr Asn Phe Asp Pro Thr Trp Cys
180 185 190
Ala Gly Ala Pro Ser Arg Thr Leu Ile Ala Leu Arg Thr Leu Ser Gln
195 200 205
Phe Phe His Glu Val Thr Val Glu Phe Leu Pro Val Tyr Lys Pro Ser
210 215 220
Glu Glu Glu Arg Ala Asp Ser Ala Leu Tyr Ser Glu Asn Val Arg Lys
225 230 235 240
Leu Met Ala Val Ser Leu Gly Ile Pro Thr Ser Asp His Ser Tyr Glu
245 250 255
Asp Met Phe Leu Ala Gln Ile Ala Ala Lys Asn Lys Leu Lys Pro Ser
260 265 270
Ala Val Leu Pro Phe Thr Tyr Ala Ser Leu Arg Ser Lys Leu Pro Pro
275 280 285
Ala Ala Ala Ser Ser Pro Arg Leu Phe Glu Arg Val Arg Gly Leu Leu
290 295 300
Leu Cys Phe Ala Lys Ala Pro Leu Met Thr Lys Glu Arg Pro Arg Leu
305 310 315 320
Asp Arg Ala Gln Phe Asp Val Val Ser Pro Val Ala Ala Thr Ser Leu
325 330 335
Asp Ile Lys Ile Ser Leu Thr Trp Thr Gln Val Ala Leu Glu Ser Ser
340 345 350
Val Ala Gly Ala Pro Ser Ser Ala Asp Thr Phe Ser Phe Tyr Glu Phe
355 360 365
Ala Leu Ala Gln Leu Lys Ala Ala Ser Trp Asp
370 375
<210> 108
<211> 1861
<212> DNA
<213> Schizochytrium sp.
<400> 108
atggcacgct agacagcgta gcgcacagac ggcagacgat accaccgcgc gcatacgcac 60
acacacacag acgcgcgcac gtgcgcgccc ctgcgtctct ttgttagtcg acgcgcgcgc 120
gcgcgcgcac gttggcagac aagcaaacaa gaaggtgagt gagctaacca gcaagcaagc 180
aagcaagcat ggcgaccgag cagccgtctt tgcggcgact ctccgctaaa gagacgcgac 240
gcatcgaacg ccgcctctcc acaacacgca ggagacgcag gtcgcacctc gaactcaaag 300
aggtcaatcc atttcagacg gatgaggcca tggacgcaca agaatgggtc ctcttcgtga 360
ccggcctcgt cgtgcttgcg ccgttccgca ttctcatctt tctcgtcacc attcccgtcg 420
ccactggact cgtcctgctc tccgtcattg gatgcgacgt caacgagcca ctcccagcat 480
ctcgcgctcg cattcaggca catattgttt acgccacggc tcgcatcctc ctctcctgct 540
ttggtgtcta caccgtcgag acggttggca agcttgcgcc tgcaagcaag gcccgcgtcg 600
ccgtcgttgg gcctcactcc actccctttg acgctctcct cgcagccgca ttcatggacg 660
cccccagctt tgttgcaaaa gctgatctca cagagacctt tgtcggaccc gttctcaagg 720
ccatgcagac cattctcgtc gaccgcgaaa atatttccag caggcacctc gctgcggagg 780
ccatcctaca gcgcgccgat cgcacaggaa cttggcgccg acgtcttgcc gtttaccccg 840
aaggcacgtg cacgaatcga accagtctca ttcagttcag acgtggcgcc tttgagcccc 900
tcgcacccgt acagcctgca gttctccagt ggaacgtcgg ggcctttgac cccgcatgga 960
ccgtcggatc cccccgacgt ggactcattg ttctccgctg ccttgctcga ctccagcttc 1020
acgtgaccgt acaatttctg cccgtcatgg agcccctaaa aaatgaggac gccgctgcat 1080
tttgcgaccg cgtgcgcagc gccatggccg acgcgctcgg cgtccccacc accgagtaca 1140
cctatcctga tctctttctt gcaaagattg ccgcaaagcg caaagtcaag cccgcaatcg 1200
tactcccatg gcccttcgtc gatgtccagc gcgcctttcc tgacgttcct ggcatttttg 1260
aaatcacaag agccctcttg cttcgctacc tcgcagctcc tggcgtacaa gccaacaatg 1320
gacgcatgga ccactcggca ttcaaggctg tcgctgtaaa ggcggctcgt gatgccggaa 1380
tcgagggtga gcctcctacc tgggatcagg tcgcgcgtga aacccacacc gacaagaccg 1440
tctcctttac agacttcctt caagctcatc tcgagtgcct cgtttccaat ccaacttcct 1500
catcttcata acgagccatt ttctttccat ctgggatctc acatcgcgca ccaagaaaac 1560
cttgacggac aacactgtgt ccttttttaa acgaacttgc tccaagacca tcccaaaagt 1620
ctcgttttca tgctcatcgt gacgtgcttt attgtttctc aattttgggt ctcatctcag 1680
cccgcacacg aaacccatac ggacaacacc gtctctcttt cttcgtatat actccaagct 1740
catctcgacg tcctcacaag gggacgtgaa tcttcctcct catgaggaaa gaagatggcc 1800
ttgtagcaca acattgaata acatacgaac gtattttcac gcttccccta gaaaaaaaaa 1860
a 1861
<210> 109
<211> 1323
<212> DNA
<213> Schizochytrium sp.
<400> 109
atggcgaccg agcagccgtc tttgcggcga ctctccgcta aagagacgcg acgcatcgaa 60
cgccgcctct ccacaacacg caggagacgc aggtcgcacc tcgaactcaa agaggtcaat 120
ccatttcaga cggatgaggc catggacgca caagaatggg tcctcttcgt gaccggcctc 180
gtcgtgcttg cgccgttccg cattctcatc tttctcgtca ccattcccgt cgccactgga 240
ctcgtcctgc tctccgtcat tggatgcgac gtcaacgagc cactcccagc atctcgcgct 300
cgcattcagg cacatattgt ttacgccacg gctcgcatcc tcctctcctg ctttggtgtc 360
tacaccgtcg agacggttgg caagcttgcg cctgcaagca aggcccgcgt cgccgtcgtt 420
gggcctcact ccactccctt tgacgctctc ctcgcagccg cattcatgga cgcccccagc 480
tttgttgcaa aagctgatct cacagagacc tttgtcggac ccgttctcaa ggccatgcag 540
accattctcg tcgaccgcga aaatatttcc agcaggcacc tcgctgcgga ggccatccta 600
cagcgcgccg atcgcacagg aacttggcgc cgacgtcttg ccgtttaccc cgaaggcacg 660
tgcacgaatc gaaccagtct cattcagttc agacgtggcg cctttgagcc cctcgcaccc 720
gtacagcctg cagttctcca gtggaacgtc ggggcctttg accccgcatg gaccgtcgga 780
tccccccgac gtggactcat tgttctccgc tgccttgctc gactccagct tcacgtgacc 840
gtacaatttc tgcccgtcat ggagccccta aaaaatgagg acgccgctgc attttgcgac 900
cgcgtgcgca gcgccatggc cgacgcgctc ggcgtcccca ccaccgagta cacctatcct 960
gatctctttc ttgcaaagat tgccgcaaag cgcaaagtca agcccgcaat cgtactccca 1020
tggcccttcg tcgatgtcca gcgcgccttt cctgacgttc ctggcatttt tgaaatcaca 1080
agagccctct tgcttcgcta cctcgcagct cctggcgtac aagccaacaa tggacgcatg 1140
gaccactcgg cattcaaggc tgtcgctgta aaggcggctc gtgatgccgg aatcgagggt 1200
gagcctccta cctgggatca ggtcgcgcgt gaaacccaca ccgacaagac cgtctccttt 1260
acagacttcc ttcaagctca tctcgagtgc ctcgtttcca atccaacttc ctcatcttca 1320
taa 1323
<210> 110
<211> 440
<212> PRT
<213> Schizochytrium sp.
<400> 110
Met Ala Thr Glu Gln Pro Ser Leu Arg Arg Leu Ser Ala Lys Glu Thr
1 5 10 15
Arg Arg Ile Glu Arg Arg Leu Ser Thr Thr Arg Arg Arg Arg Arg Ser
20 25 30
His Leu Glu Leu Lys Glu Val Asn Pro Phe Gln Thr Asp Glu Ala Met
35 40 45
Asp Ala Gln Glu Trp Val Leu Phe Val Thr Gly Leu Val Val Leu Ala
50 55 60
Pro Phe Arg Ile Leu Ile Phe Leu Val Thr Ile Pro Val Ala Thr Gly
65 70 75 80
Leu Val Leu Leu Ser Val Ile Gly Cys Asp Val Asn Glu Pro Leu Pro
85 90 95
Ala Ser Arg Ala Arg Ile Gln Ala His Ile Val Tyr Ala Thr Ala Arg
100 105 110
Ile Leu Leu Ser Cys Phe Gly Val Tyr Thr Val Glu Thr Val Gly Lys
115 120 125
Leu Ala Pro Ala Ser Lys Ala Arg Val Ala Val Val Gly Pro His Ser
130 135 140
Thr Pro Phe Asp Ala Leu Leu Ala Ala Ala Phe Met Asp Ala Pro Ser
145 150 155 160
Phe Val Ala Lys Ala Asp Leu Thr Glu Thr Phe Val Gly Pro Val Leu
165 170 175
Lys Ala Met Gln Thr Ile Leu Val Asp Arg Glu Asn Ile Ser Ser Arg
180 185 190
His Leu Ala Ala Glu Ala Ile Leu Gln Arg Ala Asp Arg Thr Gly Thr
195 200 205
Trp Arg Arg Arg Leu Ala Val Tyr Pro Glu Gly Thr Cys Thr Asn Arg
210 215 220
Thr Ser Leu Ile Gln Phe Arg Arg Gly Ala Phe Glu Pro Leu Ala Pro
225 230 235 240
Val Gln Pro Ala Val Leu Gln Trp Asn Val Gly Ala Phe Asp Pro Ala
245 250 255
Trp Thr Val Gly Ser Pro Arg Arg Gly Leu Ile Val Leu Arg Cys Leu
260 265 270
Ala Arg Leu Gln Leu His Val Thr Val Gln Phe Leu Pro Val Met Glu
275 280 285
Pro Leu Lys Asn Glu Asp Ala Ala Ala Phe Cys Asp Arg Val Arg Ser
290 295 300
Ala Met Ala Asp Ala Leu Gly Val Pro Thr Thr Glu Tyr Thr Tyr Pro
305 310 315 320
Asp Leu Phe Leu Ala Lys Ile Ala Ala Lys Arg Lys Val Lys Pro Ala
325 330 335
Ile Val Leu Pro Trp Pro Phe Val Asp Val Gln Arg Ala Phe Pro Asp
340 345 350
Val Pro Gly Ile Phe Glu Ile Thr Arg Ala Leu Leu Leu Arg Tyr Leu
355 360 365
Ala Ala Pro Gly Val Gln Ala Asn Asn Gly Arg Met Asp His Ser Ala
370 375 380
Phe Lys Ala Val Ala Val Lys Ala Ala Arg Asp Ala Gly Ile Glu Gly
385 390 395 400
Glu Pro Pro Thr Trp Asp Gln Val Ala Arg Glu Thr His Thr Asp Lys
405 410 415
Thr Val Ser Phe Thr Asp Phe Leu Gln Ala His Leu Glu Cys Leu Val
420 425 430
Ser Asn Pro Thr Ser Ser Ser Ser
435 440
<210> 111
<211> 794
<212> DNA
<213> Schizochytrium sp.
<400> 111
catgtggcct gtgcggattt tgtgcagact cttcatcttt tgctttggtg tgtactggat 60
ttctgtcaag ggtaaaaagg cgagtcatgc tgaagcagcg gtggccgtgg tggccccgca 120
ttccacattt ctggacacca tgacgtacta tgccgtttat ggccggtggt cgggtttggg 180
taaaaaggaa gtgaccaaga ctccgttttt tggcacgatt ttccgcggtc tgcaaatgat 240
tgcggtggac cgcgagaatc cggagggtcg caaggccgcg ctcgacgagt ttgtgcggcg 300
cgcacaagat aacaaagggt ggcctcagct tgttgtcttt ccagaaggta cttgcaccaa 360
tcggcgtgcc ctcatccaat tcaagcgcgg gcccttcgtc cccggcgttc ccattcagcc 420
tgtcgtgatg cgctggccat attatttctt tgacccggca tggacctcga gcgggccgaa 480
ccggatcgca ctcgtgttcc gtctcatgac acaaatcttt acgcgtgtcg aggtggagtt 540
tctccccgtg tacacgccga gcgacgaaga aaaggaagat ccagagcttt tcgcgcacaa 600
cgtacgcaat accatggccc aggcgcttgg cgtgccaacc acggagcact cttacgagga 660
tacgtttttg agcatggcgg caaagaaggc caagtttaat ccggatgaaa ttgtcgattt 720
cgagttcacc aaggtgaaaa gagctcttgg atattgacct caaggaagcg cgccggcttc 780
tgaagcgatt cggg 794
<210> 112
<211> 756
<212> DNA
<213> Schizochytrium sp.
<400> 112
atgtggcctg tgcggatttt gtgcagactc ttcatctttt gctttggtgt gtactggatt 60
tctgtcaagg gtaaaaaggc gagtcatgct gaagcagcgg tggccgtggt ggccccgcat 120
tccacatttc tggacaccat gacgtactat gccgtttatg gccggtggtc gggtttgggt 180
aaaaaggaag tgaccaagac tccgtttttt ggcacgattt tccgcggtct gcaaatgatt 240
gcggtggacc gcgagaatcc ggagggtcgc aaggccgcgc tcgacgagtt tgtgcggcgc 300
gcacaagata acaaagggtg gcctcagctt gttgtctttc cagaaggtac ttgcaccaat 360
cggcgtgccc tcatccaatt caagcgcggg cccttcgtcc ccggcgttcc cattcagcct 420
gtcgtgatgc gctggccata ttatttcttt gacccggcat ggacctcgag cgggccgaac 480
cggatcgcac tcgtgttccg tctcatgaca caaatcttta cgcgtgtcga ggtggagttt 540
ctccccgtgt acacgccgag cgacgaagaa aaggaagatc cagagctttt cgcgcacaac 600
gtacgcaata ccatggccca ggcgcttggc gtgccaacca cggagcactc ttacgaggat 660
acgtttttga gcatggcggc aaagaaggcc aagtttaatc cggatgaaat tgtcgatttc 720
gagttcacca aggtgaaaag agctcttgga tattga 756
<210> 113
<211> 251
<212> PRT
<213> Schizochytrium sp.
<400> 113
Met Trp Pro Val Arg Ile Leu Cys Arg Leu Phe Ile Phe Cys Phe Gly
1 5 10 15
Val Tyr Trp Ile Ser Val Lys Gly Lys Lys Ala Ser His Ala Glu Ala
20 25 30
Ala Val Ala Val Val Ala Pro His Ser Thr Phe Leu Asp Thr Met Thr
35 40 45
Tyr Tyr Ala Val Tyr Gly Arg Trp Ser Gly Leu Gly Lys Lys Glu Val
50 55 60
Thr Lys Thr Pro Phe Phe Gly Thr Ile Phe Arg Gly Leu Gln Met Ile
65 70 75 80
Ala Val Asp Arg Glu Asn Pro Glu Gly Arg Lys Ala Ala Leu Asp Glu
85 90 95
Phe Val Arg Arg Ala Gln Asp Asn Lys Gly Trp Pro Gln Leu Val Val
100 105 110
Phe Pro Glu Gly Thr Cys Thr Asn Arg Arg Ala Leu Ile Gln Phe Lys
115 120 125
Arg Gly Pro Phe Val Pro Gly Val Pro Ile Gln Pro Val Val Met Arg
130 135 140
Trp Pro Tyr Tyr Phe Phe Asp Pro Ala Trp Thr Ser Ser Gly Pro Asn
145 150 155 160
Arg Ile Ala Leu Val Phe Arg Leu Met Thr Gln Ile Phe Thr Arg Val
165 170 175
Glu Val Glu Phe Leu Pro Val Tyr Thr Pro Ser Asp Glu Glu Lys Glu
180 185 190
Asp Pro Glu Leu Phe Ala His Asn Val Arg Asn Thr Met Ala Gln Ala
195 200 205
Leu Gly Val Pro Thr Thr Glu His Ser Tyr Glu Asp Thr Phe Leu Ser
210 215 220
Met Ala Ala Lys Lys Ala Lys Phe Asn Pro Asp Glu Ile Val Asp Phe
225 230 235 240
Glu Phe Thr Lys Val Lys Arg Ala Leu Gly Tyr
245 250
<210> 114
<211> 817
<212> DNA
<213> Crypthecodinium cohnii
<400> 114
cactccaacg tacgacagct tcctcatatt ctttccaaca tgtcgaacga tgctggaaag 60
actgcagggc ccctgacgaa gcccacacgc agctacttgg agtcgacagc ggtcgagcga 120
ctggcaggat ggctgtcggc ttccatcttt tccatcgtct actttgcggc accgatctac 180
ttgacaggca cagctcttct tctggcacgg gctccccgct cgaagttcac ctggggtttg 240
gctgcgcccg tctgcctcgc agcgcttttg ccctgcgacc tcagcgcgcg cgtcggccca 300
tcgatcttca ggacttggtt catgaagcaa attgtcaagt acttcaagta tgaggaatat 360
cttgagttca cggacaagga tattgcggat tcgcacaaag aggggaagcg cttcatcttc 420
gctagccacc ctcacggtgt cgtgagcttc tgcggcatgt gcgctgctat cagcagtcat 480
agtgctgttg atggcttctc aaccttcggc atcatggatc tgccgacggc agtggcctcg 540
gtgatcaaga tggttccatt cttgaaaaac gttctcggcg ttttcggcct catcgatgcc 600
agcaagcagg tgctcgtgaa gcgattgaag cgcgctggcg gatccgtggt gatctacatc 660
ggaggcatgg tggaactctt catgtccagc ccgaagcagg aggttgtctt cttgaagaag 720
aggaagggct tcatcaggct cgctctgagc acaggtgccg atgttgtgcc aatctacttg 780
ttcggcaaca ccaccgtgct ctcggttttg acttctg 817
<210> 115
<211> 850
<212> DNA
<213> Crypthecodinium cohnii
<400> 115
ctgccagcga gatagcagat atcgtcgtat tgtcgtgcaa tcgagtgatt gagtcaaatc 60
tagcgatatc tgccttgttt tttttggggg ggcgccttgc caatcacccg cagcaaccat 120
ggctacacct gctgcttctc catcggtgaa gaagtcggct ccgaccacat ttggcccaga 180
ttgttgcgag ggtccgacag tgctcatgca gattttggca gttctgctga tatccgcagt 240
ccccttgatc ttcactctgg cactcacaaa cgggtctctg tttgctggcc tccttgtggt 300
cggtgtggtg gcgctgccac ggatcctttg gcagcctgga gggaatgaag gtttcgcttt 360
tcagttcgct ttgggcctct actggaactt ggtcaatgct gcgtgctttg ggtcagtgtt 420
ccttctcgga gctgcttgct attttgctcc cagaacagtt ctgcctttga tggcagtcta 480
cgtgctgtgg atgcaggtca cacacttcga gttgaaggat gggcgagcgt gggcttcttt 540
tgccatgcga gagtggggtt tccaggcatt ccgtcatttc atccaccttc aagttgttct 600
accagaggcg attttgcaga aaccggcaga cgaacctctt tttttcgctg tccatcccca 660
tggtgtggcc agtgattttc gacttctgat ggatggcatg cttcacaagg caatgccctc 720
acgtgaaatt ctcgttctgg ccgcatcggt tctcttcaag ctccccttgg tgcgggagct 780
ctgcctgtgg tctcgatgca tcgatgctag caggccagtg gcagagcgtg ccttgcgccg 840
aggtcatagt 850
<210> 116
<211> 663
<212> DNA
<213> Crypthecodinium cohnii
<400> 116
caggtcagcg gcgtgcaggc gccgatccta ttcaggatac ccatcctaag acaagttttg 60
ctctctttcg gttgcacaat gccagccacc aaggacggaa tgttcaaact cttccgaaaa 120
aagatgccct tcggtataat tgtcgggggg agcgaggatg ttgccatcca aatcaccggt 180
cgcgagcgta tctacctcag acaccgcgct ggttttttga agtacgctct ccagttcggt 240
tacaaagtcg tggtagccta caacttcggt gagagcgatt tgtacaggtc cttcagcatc 300
ttagcgcctc tgaacttgtg gctcgtgaag cgatttggct tcgttttgcc gctgttctac 360
gggcagtggt ggtgtccact cctcccacgt agcgacgtta ccttgaacac cgtctatggg 420
gcggtcttgg agcttcccag aatagatttc cccagcgacg aagaggtcgc ccattggcac 480
ggcaagtaca tcgaggctgt gaccgacgtg ttcgaaacac acaaggagcg attcggcttc 540
gcttcgagaa cgctggagat tttgtaaggt ctcgaagaac aaaaaatcct cgaccgttga 600
agagacacta tcgtcgacga aaggttcgaa gatcaaatct cctcgattgt tgaagacact 660
atg 663
<210> 117
<211> 807
<212> DNA
<213> Crypthecodinium cohnii
<400> 117
tcacactgaa agtcctcact gtttttgctg ctcggtttcc tgaacttgcg aactcctcac 60
tagttcgact tttcctcggg gacaagtgta gcagcacgga tcacgcgcgc gaagctccgc 120
tgtgtgtttt tgcgtatata atcatcgatt caacagagtc tctcctccgc tccactcgac 180
tccactcaac ttcacctgtc tggtttggac tttttcgttc gccccacttg actgggaatg 240
actgtggaga agaacatgga cagcatcaaa ccagtcgatg atgccaagcc acttgacgcc 300
aagcttggcc acaacttgca tgcggcgagt cctgcagctg ctaccgaaag gcctggctcc 360
agagggctcg accgatgtgc cttgatgctt tacttgactt tcccgctggc gaacatcgcc 420
gcggctggct gcctcacctt ctgggctttg cttcgtggcg gactcaaagt gcggtcgggc 480
atgttggcct acctgtgctg gatctgtttc ttcgatcgaa ctccggagcg gggaggctac 540
aacttttgct ggcgaaccgg aatcacccag aaattgcgag catccttctt ctggaaatgg 600
gcagcaagat actttcctgt ccggctacat gcagtggctc ctcttccccc agatcaaggc 660
ccctacattt ttgtgtgcca cccacacggc atcttcggca tctcgccgat gactcacttt 720
gggaccgatg ccacagactt ctccaagata tttccgggaa tccaagtgca ccttctcggc 780
catagtgcga tcttcagaat ccgttct 807
<210> 118
<211> 765
<212> DNA
<213> Crypthecodinium cohnii
<400> 118
gtccttcttc tgtgctcgac tataaattac ttgtttggca gctttcaccc acccacccac 60
ccagccatct ataatagctt ttgatctttt ccttcccatc catacacttc tctacctgtg 120
cttgtactgt gtacgtaatc acgcacgcac gcagtgcgtg cgaccaatgg cttccaaatg 180
gatgctcttc agtggtggtg ctgcagctgc agcattggcg ctcttggagg ctgcccaaca 240
tcgtttgccg acatcggtgc gcgctcggat aatgctagct tcgttggccg catatctgcc 300
catgtatctc gatggaagcg agtaccgggc tgcaccccgg agaagtgagc gagcctcgag 360
ggttcttcgg cagctgttca agatgatggt ggaccgtctc ttcattgtca aaaagccgat 420
tatcgaggcg gccgaagagc taacatcctg cagccagtgc atcttgtcgg ttcatcctca 480
tggggttctg tccctggatc atctcctgac agtcatcgcc tatgaccccg agctggaaag 540
ggtgctgccc cagggccgac gaagtgccct gagtgcaggt gtcctcttca aaatccccat 600
cttgcgagag gtgctgttgt ggaccggttg cgttgatgcc ggggggcgga cagtggattc 660
gtgtctgaag gctggcttaa gcctctctgt ggtgcctggg ggtgagcgcg aacagctcct 720
agcccaacgt ggcaacacag aaacgcttgt gctcaaaaac aggaa 765
<210> 119
<211> 782
<212> DNA
<213> Crypthecodinium cohnii
<400> 119
ttcctgagct ttcatcctct gccggacctc tcggagaccc tctgcgagtc ctggttcacc 60
atcgccctct acaagtactt ctcctaccgc ttcatctgga gcgacgacga caacgagaag 120
gtgcgaacag ctccggcctg gttcggcgca tctcctcccc acggtgtcct gccgctggcc 180
aacttgctgt gtattcccgc gataaacaac tttgggttca gggagttcgt tggggctcct 240
gcctcggtcg tctttcgaac tccctttctc agatacatga cgatgctggg ctgcgtcgat 300
gtcagcggca agtcgatgac caaggcggtc aatgctggtc agtgtgttgg cctcgtgccc 360
gacggcatcg caggcatctt taagacgaag gaaaaggacg aagttgtctt cctcaagaac 420
agaaaaggcc tcgcaaagct ggctctgaag acaggcaccc cactgcttcc tgcctacagc 480
ctgggcaaca cagcagtttt cggcgcctgg ttcgacccct tcggaatcat ggaggctctg 540
tccagaaaag ctcagacatc cgtcttcgtg ttttggggtc gcttctacct cccgcttccc 600
aggcgcgtca acatcacgat ggtctatggc aagcccatca ttgttgagaa ggtggaggat 660
cccagcaccg agcaaatcga ccagctgcat gcggagtacc tccaagagct ggaggccttg 720
ttcaacaggc acaaggcaag tgtttgggtg gggtcacaag aacattcgct tcgtctgagc 780
at 782
<210> 120
<211> 793
<212> DNA
<213> Crypthecodinium cohnii
<400> 120
cgtgcttgaa gctcttgtct gtgtgtgtaa tcaatgtatc tttatcttcc cggtgcagct 60
ccagctagct gcactgcccc ctccaattga tctggcggtg gccctgagct gccgtcttgc 120
atgccgacga ctcgattttc ctctgccaaa gcctgggttt caaagcaagc gatggccgtc 180
acgtcagcgc tctgcagtgg cgtcggcgca gggctcttga tccacacagc tgtcgtggcc 240
tatctgtacc cactcttctt tgcgccagtg ctgctgttgg ttccctcccg cagaacgagg 300
gcgatgttca gatcgtattg tcagttctgg caggacatgt ggatggcttc ttcttgcgtg 360
gtgctggagt acgtgattgg tgtccgcttg ttcatacatt ccccaacagc cttgaagggg 420
ttgcgtggca tcaaaaccat gtgcaacggc cacgatgtga ttctcatcaa gaaccaccgc 480
actcgaattg attggatgtt cacctggggg ctctgtctag ctctcgaccg cctgggtagc 540
ctgaagatag taatgaaaga ctccttgaag aaagttccct ttttcggttg ggcgatgcag 600
cacttcggct ttaccttcct ttccaggaaa aaccgagatc atgacctggc caccctgaag 660
tggtcgagct cctaccagag tcacgagcct ggcagccgca tgacgatgct gatcttccca 720
gagggaacgg acctaagctc atcgaacctg gaaaaaagca aggctttcgc caccaaagca 780
ggactgccgg tct 793
<210> 121
<211> 744
<212> DNA
<213> Crypthecodinium cohnii
<400> 121
cgagccggtc gtagacagat agacagatag atagacacgt agataggttt tgtcgcatct 60
ttcgccaact ctgcccgggg ggccaaacct tcttgctggg gtttctgctc tcttctcttc 120
ttgctggggc ggcatgggga agcaccctcc tgccaattat ggcatcacgg ctgtgatcgc 180
cctcctcctc tccgtgggcc ttatattggc gggcgtcatt cagataatca ctgcgctgct 240
gacactcccc gtactcgcct gcaagggccg caacgccttc cacagcatcc agagcgcggt 300
gtggcgcagc atcgtcacct tcctctccgt ggggctcaac ccgttctggt gcgcacgaat 360
ggtgtgggtg ggtgacaacc ctggccctcc gaagggaaag atggggtcag tcttcttcat 420
caaccatcgc tcaaatgctg acgcctggtt cagcgcctgg ggaatcaccc gaatgtgtca 480
tgaagcgcgg tacgtctaca agagtagcct aaagaagatt cccttcttcg gctggaactt 540
gcagcttgct ggcgacctcg ctgtggagtt cggagacaag tccaagatcg tagcgatgat 600
ggagaacgcg aaagaggcat tgaggcaggg ctacaatgtg gcggtctttc cggaaggtac 660
gagaagtcct agtggtatgt tgcaggaatt caagcctgga ttcttcaaga tcttgtgcag 720
agcttggctg cccagcggtc ccca 744
<210> 122
<211> 2361
<212> DNA
<213> Artificial
<220>
<223> synthetic
<400> 122
gccgggctct ttcacaaagg aataatgatc ccacaaaagc ttcacgtcct tgggatacca 60
atcgagatgg tttcgtgatg ggagagggag ctggagttct acttttggaa gaactcgagc 120
atgctaagaa aagaggtgca actatctacg cagagttcct cggtgggagt ttcacatgtg 180
atgcctatca catgaccgag cctcaccctg atggggctgg tgttattctc tgtattgaga 240
gagcgttagc tagtgctggg atttccaagg aacaaataaa ttacataaat gcacatgcaa 300
cctcaacgca tgctggagat attaaggaat accaagccct tgctcactgt tttggccaaa 360
atcctgagct taaggtaaat tccacaaaat ctatgattgg acacttgctg ggagctgctg 420
gggccgtgga ggctgttgca actgtgcagg cgatacggac cggatgggtt catccaaata 480
tcaacctcga gaatccagac atttaaatgt aagaatttct tatgttacat tattacattc 540
aacgttttat cttaattggc tcttcatttg attgaaattt gacaattatt tcttgttttt 600
tttttgtcac actctttttg ggtttggggt ggccgacgaa ttgtgggaag gtagaaagag 660
gggaggactt tgttatactc cattagattt tactgtttcc gtttcaattt atgtgacata 720
tttccttttt agtcggttcc aaaagaaaat gtcagcatta taaacaattt aattttgaaa 780
ttacaatttt gccattaata aaatgattta caaccacaaa agtatctatg agcctgtttg 840
ggtgggctta taagcagctt attttaagtg gcttataagt caaaaagtga caatttttga 900
gaagttagaa aatcctaact tctcaaaaag tagcttttaa gccacttatg acttataagt 960
ccaaaaattt ttaagttacc aaacatatat taatgggttt ataagcttat aagccacttt 1020
taagctcacc caaacgggtt ctatgtctca ctttagacta caaattttaa aagtcttcat 1080
ttatttctta atctccgtgg cgagtaaaac tataacacat aaagtgaaac gtagggagta 1140
agatggagtc ataaactaat ccaaatctat actctctccg ttaatttgtt ttttagtttg 1200
atttggtaca ttaataaaac agatttttcg aaggttataa acacagacag atgtttccca 1260
gcgagctagc aaaattccaa gatttctgtc gaaaattcgt gtgtttctag ctagtacttg 1320
atgttatctt taacctttta gtaatttttt gtccttttct ttctattttt catcttacaa 1380
tgaattatga gcaagttcct taagtagcat cacacgtgag atgtttttta tgatattgac 1440
taaatccaat ctttaccatt ccttaactag taaaatacaa cacatgttaa ttgatacatt 1500
gcttaacact gaggttagaa aattttagaa attagttgtc caaatgcttt gaaattagaa 1560
atctttaatc ccttattttt ttttaaaatg ttttttctcg ctccaaagaa agagaaactg 1620
acatgaaagc tcaaaagatc atgaatctta ctaactttgt ggaactaaat gtacatcaga 1680
atgtttctga catgtgaaaa tgaaagctct taattttctt cttttattta ttgagggttt 1740
ttgcatgcta tgcattcaat ttgagtactt taaagcacct ataaacactt acttacactt 1800
gccttggagt ttatgtttta gtgttttctt cacatctttt ttggtcaatt tgcagggatc 1860
cgtctggatt ctcgaggttg atatttggat gaacccatcc ggtccgtatc gcctgcacag 1920
ttgcaacagc ctccacggcc ccagcagctc ccagcaagtg tccaatcata gattttgtgg 1980
aatttacctt aagctcagga ttttggccaa aacagtgagc aagggcttgg tattccttaa 2040
tatctccagc atgcgttgag gttgcatgtg catttatgta atttatttgt tccttggaaa 2100
tcccagcact agctaacgct ctctcaatac agagaataac accagcccca tcagggtgag 2160
gctcggtcat gtgataggca tcacatgtga aactcccacc gaggaactct gcgtagatag 2220
ttgcacctct tttcttagca tgctcgagtt cttccaaaag tagaactcca gctccctctc 2280
ccatcacgaa accatctcga ttggtatccc aaggacgtga agcttttgtg ggatcattat 2340
tcctttgtga aagagcccgg c 2361
<210> 123
<211> 1380
<212> DNA
<213> Artificial
<220>
<223> synthetic
<400> 123
cgatagaggc aaagagcaaa gatgcatttg ttcctccaaa gccaaacgaa ttcgacattg 60
ctgtcctaac taacatcttt ttcgaagtgg ttaaaggcat gaacctcttg tcgaagatgg 120
gatctggatt cttgacattc agcgtcatag gagcaacccc gtgatgtata gcaaggatac 180
tgaaaatagc ttccactgct ccagctgctc caagaagatg accagtagcc cccttggtgg 240
aggagaatgc caaggtgcct gaagtagcat gttcagagaa taccgtcttg atagctctcg 300
cttccacggc atcgcctatt ggggttgatg ttgcatgtgc gtttacataa tcaatttggt 360
ttggacacag accagactgt cttaaggcac gcgtcatggc caaaacagct ccttttccat 420
cttcaggagg ttgagtaata tggtgtgcat cgcctgacat cccatatcca caaagctcag 480
cataaatttt tgctcctcgt ctttttgcat gctcatattc ctctaatact ataacccctg 540
aaccttcccc tatcacaaaa ccatcccggt cacaatcaaa aggccgtgaa gcttcttgtg 600
gagaagaatt gaatttagtt gacaaagccc ttgatctaga gaatccagct acggacagag 660
catcaatgct agactcagtt ccaccagcca ccataacatc tgcatctcca aattgaatca 720
tcctagtggc atcgcctata gaatgtgcac cagttgcgca agctgtcaca gcagcatgat 780
ttggcccctg aaatccatac ttcatgctca catgaccaga tgccatgttt accaatattt 840
ttggaatgaa aaacggacta agccgccgca gcctcttttc acaaatcagc tgcgctgcct 900
ccacaatatc acatatactt ccaattccac caccaataga gactcctgtt ctctcttttt 960
cttcttcttc agttggtaac cactctgcat ctctcaaagc ttcatcggca gcacatacag 1020
catatccgat aaaattcgca actgccttag agtttagcca aagggcttca tcaaattcac 1080
cagggtttga tccataaggc acaaaagcag caactttaga agaaagctga tcaaaagtat 1140
ataactttgt ctcttcatca aaagacttca tcttgagatc atcaagagtc aatcctctaa 1200
tcccacattc tccatcaatt aaacgcctcc acgttgtttc aacgcctcta ccaagtggag 1260
tcaccatgcc tagaccagtg acaacaacac ggcgatgtga atgataagaa gaagaagtag 1320
agatgaagcg gtttaagcgg aggcgacttg cgctcaagtg tctacggaga ttagatgtcg 1380
<210> 124
<211> 1052
<212> DNA
<213> Artificial
<220>
<223> synthetic
<400> 124
gcgcgccgat ttctaatgat gatctcgcta aaatagttga tactaatgat gaatggattg 60
ctactcgtac tggtattcgc aaccgtcgag ttgtctcagg caaagatagc ttggttggct 120
tagcagtaga agcagcaacc aaagctcttg aaatggctga ggttgttcct gaagatattg 180
acttagtctt gatgtgtact tccactcctg atgatctatt tggtgctgct ccacagattc 240
aaaaggcact tggttgcaca aagaacccat tggcttatga tatcacagct gcttgtagtg 300
gatttgtttt gggtctagtt tcagctgctt gtcatataag gggaggcggt tttaagaacg 360
ttttagtgat cggagctgat tctttgtctc ggtttgttga ttggacggat agagggactt 420
gcattctatt tggagatgct gctggtgctg tggttgttca ggcttgtgat attgaagatg 480
atggtttgtt cagttttgat gtgcacagca tttaaatgtg tatttggatc cgctgtgcac 540
atcaaaactg aacaaaccat catcttcaat atcacaagcc tgaacaacca cagcaccagc 600
agcatctcca aatagaatgc aagtccctct atccgtccaa tcaacaaacc gagacaaaga 660
atcagctccg atcactaaaa cgttcttaaa accgcctccc cttatatgac aagcagctga 720
aactagaccc aaaacaaatc cactacaagc agctgtgata tcataagcca atgggttctt 780
tgtgcaacca agtgcctttt gaatctgtgg agcagcacca aatagatcat caggagtgga 840
agtacacatc aagactaagt caatatcttc aggaacaacc tcagccattt caagagcttt 900
ggttgctgct tctactgcta agccaaccaa gctatctttg cctgagacaa ctcgacggtt 960
gcgaatacca gtacgagtag caatccattc atcattagta tcaactattt tagcgagatc 1020
atcattagaa atctctagag agttaattaa ga 1052
<210> 125
<211> 1208
<212> DNA
<213> Artificial
<220>
<223> synthetic
<400> 125
cctccatcgc ataattgctg atccccacgt taaaccggct ccaaaaccgg atgtcgctat 60
ggtatgtcct ggtttaactt ttccgcttct cactgcctca tcaagagcca gcggaatcga 120
agcagcgctc gtgttaccat aattagccaa attcgatatg actctctctg gtgggaaatg 180
cagccttgta gccacagagt ctattattct ctggttcgcc tggtggagga ggagccagtc 240
gatggcagaa gcaggaagac cagctttttg taaagcagat tcaatagatt gaggaacaca 300
tttgacagca aagcgaaaga cctcttttcc attcatctga atacaagaat atgaagattg 360
ttttggtgga aagtctccaa acaccgagcc attggagctt gattcaccat cgttttggga 420
ttctttaaca gaagcattca aatgtcttcg accatcccca tcgctgtgca catcaaaact 480
gaacaaacca tcatcttcaa tatcacaagc ctgaacaacc acagcaccag cagcatctcc 540
aaatagaatg caagtccctc tatccgtcca atcaacaaac cgagacaaag aatcagctcc 600
gatcactaaa acgttcttaa aaccgcctcc ccttatatga caagcagctg aaactagacc 660
caaaacaaat ccactacaag cagctgtgat atcataagcc aatgggttct ttgtgcaacc 720
aagtgccttt tgaatctgtg gagcagcacc aaatagatca tcaggagtgg aagtacacat 780
caagactaag tcaatatctt caggaacaac ctcagccatt tcaagagctt tggttgctgc 840
ttctactgct aagccaacca agctatcttt gcctgagaca actcgacggt tgcgaatacc 900
agtacgagta gcaatccatt catcattagt atcaactatt ttagcgagat catcattaga 960
aatcagaaga cttggaactg ctgatccaca tccaatcaat ttgcagccac tcggcactag 1020
cctgggtcgt tgatattgag aaggagaaga cgaagcatcc ttatcgacgg agctgacgct 1080
agagcacaaa accctcttag agaatcgatt ggaaacgcaa aacccagatc cagaaactct 1140
aaccggaaca tggattctgc ttcgcaagtt aggaattgaa ggatgagtga agaacccaga 1200
tgcattag 1208
Claims (1)
- (a) 장쇄 다불포화 지방산 (PUFA) 유리 지방산 (FFA)의 아실-CoA로의 전환을 촉매하는 아실-CoA 신테타제(ACoAS)를 코딩하는 핵산 서열이며, 핵산 서열은 서열 83, 서열 85, 서열 87, 서열 89, 서열 91, 서열 93, 서열 95, 서열 97 및 서열 99로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 ACoAS와 동일성이 60% 이상인 아실-CoA 신테타제(ACoAS)를 코딩하는 것인 핵산 서열을 포함하거나, 또는
(b) 인지질 (PL) 또는 트리아실글리세롤 (TAG)을 형성하는데 있어서 기질로서 PUFA-CoA를 이용하는 단백질이며, 단백질은 서열 102, 서열 104, 서열 107, 서열 110 및 서열 113으로 이루어진 군으로부터 선택된 아미노산 서열과 동일성이 60% 이상인 아미노산 서열을 포함하는 것인 단백질을 코딩하는 핵산 서열을 포함하는 단리된 핵산 분자의 용도.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US78320506P | 2006-03-15 | 2006-03-15 | |
US60/783,205 | 2006-03-15 | ||
US78461606P | 2006-03-21 | 2006-03-21 | |
US60/784,616 | 2006-03-21 | ||
PCT/US2007/064104 WO2007106903A2 (en) | 2006-03-15 | 2007-03-15 | Polyunsaturated fatty acid production in heterologous organisms using pufa polyketide synthase systems |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087025100A Division KR101517243B1 (ko) | 2006-03-15 | 2007-03-15 | Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130103832A true KR20130103832A (ko) | 2013-09-24 |
KR101524398B1 KR101524398B1 (ko) | 2015-06-04 |
Family
ID=38510298
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137023972A KR101524398B1 (ko) | 2006-03-15 | 2007-03-15 | Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조 |
KR1020087025101A KR101506347B1 (ko) | 2006-03-15 | 2007-03-15 | 다불포화 지방산을 함유하는 식물 종자 오일 |
KR1020087025100A KR101517243B1 (ko) | 2006-03-15 | 2007-03-15 | Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087025101A KR101506347B1 (ko) | 2006-03-15 | 2007-03-15 | 다불포화 지방산을 함유하는 식물 종자 오일 |
KR1020087025100A KR101517243B1 (ko) | 2006-03-15 | 2007-03-15 | Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조 |
Country Status (14)
Country | Link |
---|---|
US (5) | US20070220634A1 (ko) |
EP (3) | EP2004835A4 (ko) |
JP (4) | JP5227302B2 (ko) |
KR (3) | KR101524398B1 (ko) |
CN (1) | CN104073505A (ko) |
AU (2) | AU2007226510B2 (ko) |
BR (1) | BRPI0709317A2 (ko) |
CA (2) | CA2646317A1 (ko) |
ES (1) | ES2527875T3 (ko) |
HK (1) | HK1126253A1 (ko) |
IL (2) | IL194078A (ko) |
MX (3) | MX339812B (ko) |
TW (2) | TWI504748B (ko) |
WO (3) | WO2007106904A2 (ko) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6566583B1 (en) * | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
US7217856B2 (en) * | 1999-01-14 | 2007-05-15 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US7211418B2 (en) | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US20070244192A1 (en) * | 1999-01-14 | 2007-10-18 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
US7247461B2 (en) * | 1999-01-14 | 2007-07-24 | Martek Biosciences Corporation | Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof |
US8003772B2 (en) | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
TWI324181B (en) | 2001-04-16 | 2010-05-01 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
PL1756280T3 (pl) | 2004-04-22 | 2015-04-30 | Commw Scient Ind Res Org | Synteza długołańcuchowych wielonienasyconych kwasów tłuszczowych w komórkach rekombinowanych |
CN102559364B (zh) | 2004-04-22 | 2016-08-17 | 联邦科学技术研究组织 | 用重组细胞合成长链多不饱和脂肪酸 |
CN104073505A (zh) * | 2006-03-15 | 2014-10-01 | Dsmip资产公司 | 利用pufa聚酮化合物合成酶系统在异源的生物体中产生多不饱和脂肪酸的方法 |
WO2008025068A1 (en) | 2006-08-29 | 2008-03-06 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of fatty acids |
US20100210017A1 (en) * | 2007-01-12 | 2010-08-19 | Gill Ryan T | Compositions and methods for enhancing tolerance for the production of organic chemicals produced by microorganisms |
EP2152849B1 (en) | 2007-06-01 | 2013-02-20 | Solazyme, Inc. | Production of oil in microorganisms |
US8048624B1 (en) | 2007-12-04 | 2011-11-01 | Opx Biotechnologies, Inc. | Compositions and methods for 3-hydroxypropionate bio-production from biomass |
EP2245166A4 (en) * | 2008-01-28 | 2012-12-05 | Univ Oklahoma | VERY LONG CHAIN POLYUNSATURATED FATTY ACIDS, METHODS OF MAKING THE SAME AND USES THEREOF |
WO2010019813A2 (en) * | 2008-08-13 | 2010-02-18 | Sapphire Energy, Inc. | Production of fatty actds by genetically modified photosynthetic organisms |
WO2010033921A2 (en) * | 2008-09-19 | 2010-03-25 | President And Fellows Of Harvard College | Photoautotrophic adipogenesis technology (phat) |
AU2009317860B2 (en) | 2008-11-18 | 2014-03-27 | Commonwealth Scientific And Industrial Research Organisation | Enzymes and methods for producing omega-3 fatty acids |
EP3098321B1 (en) * | 2008-11-28 | 2018-12-19 | Corbion Biotech, Inc. | Production of tailored oils in heterotrophic microorganisms |
JP2012512655A (ja) * | 2008-12-19 | 2012-06-07 | アルファ−ジェイ リサーチ リミテッド パートナーシップ | 細胞増殖および藻類生成物生成の切り離しを通じた藻類生成物生成の最適化 |
TW201028472A (en) * | 2009-01-13 | 2010-08-01 | Alpha J Res Ltd Partnership | Use of plant growth regulators to enhance algae growth for the production of added value products |
JP2012520676A (ja) * | 2009-03-16 | 2012-09-10 | マーテック バイオサイエンシーズ コーポレーション | ラビリンチュラ菌門の微生物におけるタンパク質作製 |
CN102741267B (zh) | 2009-03-19 | 2020-06-23 | 帝斯曼知识产权资产有限公司 | 多不饱和脂肪酸合酶核酸分子和多肽,及其组合物、制备方法和用途 |
CN102597242B (zh) | 2009-06-08 | 2016-03-02 | 罗特哈姆斯泰德研究有限公司 | 新脂肪酸延伸组合物及其用途 |
US20120107478A1 (en) * | 2009-06-30 | 2012-05-03 | Solae, Llc | Omega-3 Fatty Acid Enriched Baked Foods and Bar Composition |
US8809027B1 (en) | 2009-09-27 | 2014-08-19 | Opx Biotechnologies, Inc. | Genetically modified organisms for increased microbial production of 3-hydroxypropionic acid involving an oxaloacetate alpha-decarboxylase |
CN102695799A (zh) | 2009-09-27 | 2012-09-26 | Opx生物工艺学公司 | 用于制备3-羟基丙酸和其它产物的方法 |
CA2785867C (en) * | 2009-12-28 | 2018-03-27 | Dsm Ip Assets B.V. | Production of hemagglutinin-neuraminidase protein in microalgae |
EP3505632B1 (en) * | 2009-12-28 | 2022-08-03 | Sanofi Vaccine Technologies, S.A.S. | Production of heterologous polypeptides in microalgae, microalgal extracellular bodies, compositions, and methods of making and uses thereof |
CN104974030A (zh) | 2009-12-30 | 2015-10-14 | 巴斯夫制药(卡兰尼什)公司 | 用于纯化多不饱和脂肪酸的模拟移动床色谱分离方法 |
AR079852A1 (es) | 2010-01-07 | 2012-02-22 | Aedenswil Basf Agro B V Arnhem Nl Zweigniederlassung W | Plantas tolerantes a herbicidas |
GB2492256A (en) * | 2010-01-27 | 2012-12-26 | Opx Biotechnologies Inc | Microorganism production of high-valve chemical products, and related compositions, methods and systems |
CN104388439B (zh) | 2010-02-01 | 2018-02-23 | 三得利控股株式会社 | 编码酰基‑CoA合成酶同源物的多核苷酸及其用途 |
US8372465B2 (en) | 2010-02-17 | 2013-02-12 | Bunge Oils, Inc. | Oil compositions of stearidonic acid |
US11236351B2 (en) | 2010-05-17 | 2022-02-01 | Dow Agrosciences Llc | Production of DHA and other LC PUFAs in plants |
TW201144442A (en) * | 2010-05-17 | 2011-12-16 | Dow Agrosciences Llc | Production of DHA and other LC-PUFAs in plants |
SG10201504197SA (en) | 2010-05-28 | 2015-06-29 | Solazyme Inc | Food Compositions Comprising Tailored Oils |
AU2013202057B2 (en) * | 2010-06-25 | 2016-01-28 | Basf Plant Science Company Gmbh | Acyltransferases and uses therof in fatty acid production |
WO2011161093A1 (en) * | 2010-06-25 | 2011-12-29 | Basf Plant Science Company Gmbh | Acyltransferases and uses therof in fatty acid production |
KR101964886B1 (ko) | 2010-11-03 | 2019-04-03 | 테라비아 홀딩스 인코포레이티드 | 유동점이 낮은 미생물 오일, 이 오일로 제조된 유전성 유체 및 관련 방법 |
KR101964965B1 (ko) | 2011-02-02 | 2019-04-03 | 테라비아 홀딩스 인코포레이티드 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
CN102250864B (zh) * | 2011-05-03 | 2013-03-20 | 中国农业大学 | 亚油酸异构酶在脱氢和异构方面的双重用途 |
KR20140033378A (ko) | 2011-05-06 | 2014-03-18 | 솔라짐, 인코포레이티드 | 자일로오스를 대사시키는 유전자 조작된 미생물 |
GB201111595D0 (en) | 2011-07-06 | 2011-08-24 | Equateq Ltd | Improved process |
GB201111594D0 (en) | 2011-07-06 | 2011-08-24 | Equateq Ltd | New improved process |
TW201307553A (zh) * | 2011-07-26 | 2013-02-16 | Dow Agrosciences Llc | 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術 |
US8980591B2 (en) * | 2011-08-04 | 2015-03-17 | Suntory Holdings Limited | Protein having activity to promote fatty acid chain elongation, gene encoding same and use thereof |
WO2013077420A1 (ja) * | 2011-11-25 | 2013-05-30 | 独立行政法人農業生物資源研究所 | 植物の形質転換体、植物の形質転換方法、並びに該方法に用いられるベクター |
US9719114B2 (en) | 2012-04-18 | 2017-08-01 | Terravia Holdings, Inc. | Tailored oils |
JP6499577B2 (ja) | 2012-04-18 | 2019-04-10 | テラヴィア ホールディングス, インコーポレイテッド | 調整油 |
DE102012207921A1 (de) | 2012-05-11 | 2013-11-14 | Evonik Industries Ag | Mehrstufiges Syntheseverfahren mit Synthesegas |
KR102197208B1 (ko) | 2012-06-15 | 2021-01-04 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 식물 세포에서 장쇄 다중불포화 지방산의 생성 |
CN104718282A (zh) | 2012-08-10 | 2015-06-17 | Opx生物工艺学公司 | 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法 |
GB201300354D0 (en) | 2013-01-09 | 2013-02-20 | Basf Pharma Callanish Ltd | Multi-step separation process |
US10184140B2 (en) | 2013-01-23 | 2019-01-22 | Iowa State University Research Foundation, Inc. | Materials and methods for production of bi-functional fatty acids in recombinant bacteria |
WO2014116754A1 (en) | 2013-01-23 | 2014-07-31 | Iowa State University Research Foundation, Inc. | Materials and methods for characterizing and using kasiii for production of bi-functional fatty acids |
US9816079B2 (en) | 2013-01-29 | 2017-11-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
US9567615B2 (en) | 2013-01-29 | 2017-02-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
US9290749B2 (en) | 2013-03-15 | 2016-03-22 | Solazyme, Inc. | Thioesterases and cells for production of tailored oils |
WO2014145096A1 (en) | 2013-03-15 | 2014-09-18 | Cindy Hoppe | Flash evaporation for production purification and recovery |
US9783836B2 (en) | 2013-03-15 | 2017-10-10 | Terravia Holdings, Inc. | Thioesterases and cells for production of tailored oils |
US20150057465A1 (en) | 2013-03-15 | 2015-02-26 | Opx Biotechnologies, Inc. | Control of growth-induction-production phases |
US11408013B2 (en) | 2013-07-19 | 2022-08-09 | Cargill, Incorporated | Microorganisms and methods for the production of fatty acids and fatty acid derived products |
BR112016001026A2 (pt) | 2013-07-19 | 2017-10-24 | Cargill Inc | organismo geneticamente modificado |
US10053715B2 (en) | 2013-10-04 | 2018-08-21 | Corbion Biotech, Inc. | Tailored oils |
MX2016005718A (es) | 2013-11-01 | 2016-12-08 | Conagen Inc | Metodos de uso de acil-coa sintetasa para produccion biosintetica de acil-coas. |
TW201525136A (zh) * | 2013-11-26 | 2015-07-01 | Dow Agrosciences Llc | 利用破囊壺菌PUFA合成酶於油籽作物中生成ω-3長鏈多不飽和脂肪酸 |
EP3077526B8 (en) * | 2013-12-05 | 2020-01-08 | Genomatica, Inc. | Microbial production of fatty amines |
EA037817B1 (ru) | 2013-12-18 | 2021-05-25 | Коммонвелт Сайнтифик Энд Индастриэл Рисерч Организэйшн | Экстрагированный растительный липид, содержащий длинноцепочечные полиненасыщенные жирные кислоты |
EP3099782B1 (en) * | 2014-01-28 | 2019-03-20 | DSM IP Assets B.V. | Factors for the production and accumulation of polyunsaturated fatty acids (pufas) derived from pufa synthases |
KR102527795B1 (ko) | 2014-06-27 | 2023-05-02 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 도코사펜타에노산을 포함하는 지질 |
WO2016007862A2 (en) | 2014-07-10 | 2016-01-14 | Solazyme, Inc. | Novel ketoacyl acp synthase genes and uses thereof |
WO2016014968A1 (en) | 2014-07-24 | 2016-01-28 | Solazyme, Inc. | Variant thioesterases and methods of use |
EP2993228B1 (en) | 2014-09-02 | 2019-10-09 | Cargill, Incorporated | Production of fatty acid esters |
BR112017005370A2 (pt) | 2014-09-18 | 2017-12-12 | Terravia Holdings Inc | acil-acp tioesterases e mutantes das mesmas |
US10570427B2 (en) * | 2014-10-31 | 2020-02-25 | Lanzatech New Zealand Limited | Fermentation process for the production of lipids |
US10851393B2 (en) * | 2015-02-24 | 2020-12-01 | William Marsh Rice University | KAS-III free FA synthesis |
CN107846857B (zh) | 2015-06-06 | 2021-07-02 | 帝斯曼知识产权资产管理有限公司 | 使用新模块二十二碳六烯酸(dha)合酶生成多不饱和脂肪酸(pufas) |
US20170191094A1 (en) * | 2015-12-31 | 2017-07-06 | Synthetic Genomics, Inc. | Expression of type i fatty acid synthase genes in eukaryotic algae |
CN108472279A (zh) | 2016-01-07 | 2018-08-31 | 科纳根公司 | 通过生物合成方法制造辣椒酯类物质的方法 |
WO2018017772A1 (en) | 2016-07-19 | 2018-01-25 | Conagen Inc. | Method for the microbial production of specific natural capsaicinoids |
JP2020506702A (ja) | 2017-02-02 | 2020-03-05 | カーギル インコーポレイテッド | C6−c10脂肪酸誘導体を生成する遺伝子組み換え細胞 |
US11352601B2 (en) | 2017-07-27 | 2022-06-07 | University Of Florida Research Foundation, Incorporated | Cyanobacterial hosts and methods for producing chemicals |
KR102318983B1 (ko) * | 2018-02-21 | 2021-11-01 | 경상북도 | 신규한 1-octen-3-ol을 생산하는 형질전환 효모 및 그 제조방법 |
WO2019164294A1 (ko) * | 2018-02-21 | 2019-08-29 | 경상북도 | 신규한 1-octen-3-ol을 생산하는 형질전환 효모 및 그 제조방법 |
CN112661821B (zh) * | 2021-01-21 | 2022-04-12 | 江南大学 | 一种柠檬酸转运蛋白及其在脂质合成中的应用 |
WO2023076901A2 (en) * | 2021-10-25 | 2023-05-04 | Purdue Research Foundation | Heterodimeric benzaldehyde synthase, methods of producing, and uses thereof |
WO2023144707A1 (en) | 2022-01-25 | 2023-08-03 | Dsm Ip Assets B.V. | Media refinement and nutrient feeding approaches to increase polyunsaturated fatty acid production |
Family Cites Families (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8317248D0 (en) | 1983-06-24 | 1983-07-27 | Wyeth John & Brother Ltd | Fat compositions |
US5246841A (en) | 1986-12-26 | 1993-09-21 | Sagami Chemical Research Center | Microbial process for production of eicosapentaenoic acid |
US5130242A (en) | 1988-09-07 | 1992-07-14 | Phycotech, Inc. | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
US5340742A (en) * | 1988-09-07 | 1994-08-23 | Omegatech Inc. | Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids |
US5601860A (en) | 1990-11-30 | 1997-02-11 | American Home Products Corporation | Corandomized fat compositions for infant formulas |
US5639790A (en) * | 1991-05-21 | 1997-06-17 | Calgene, Inc. | Plant medium-chain thioesterases |
DK0616644T3 (da) | 1991-12-04 | 2003-10-27 | Du Pont | Fedtsyredesaturase-gener fra planter |
WO1993023545A1 (en) | 1992-05-15 | 1993-11-25 | Sagami Chemical Research Center | Gene which codes for eicosapentaenoic acid synthetase group and process for producing eicosapentaenoic acid |
US5798259A (en) | 1992-05-15 | 1998-08-25 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
US5683898A (en) * | 1992-05-15 | 1997-11-04 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
US5310242A (en) | 1992-09-28 | 1994-05-10 | Golder Kimberly A | Portable infant seat |
US6372965B1 (en) | 1992-11-17 | 2002-04-16 | E.I. Du Pont De Nemours And Company | Genes for microsomal delta-12 fatty acid desaturases and hydroxylases from plants |
DE4323727A1 (de) * | 1993-07-15 | 1995-03-09 | Boehringer Mannheim Gmbh | Verfahren zur Identifizierung von menschlichen und tierischen Zellen mit der Fähigkeit zu unbegrenzter Proliferation oder zur Tumorbildung |
US5672491A (en) | 1993-09-20 | 1997-09-30 | The Leland Stanford Junior University | Recombinant production of novel polyketides |
CA2209987A1 (en) | 1995-01-13 | 1996-07-18 | Sagami Chemical Research Center | Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid |
EP0823475B1 (en) | 1995-04-17 | 2009-06-17 | National Institute of Advanced Industrial Science and Technology | Novel microorganisms capable of producing highly unsaturated fatty acids and process for producing highly unsaturated fatty acids by using the microorganisms |
ZA973565B (en) | 1996-04-26 | 1998-10-26 | Du Pont | Soybean oil having high oxidative stability |
WO1998001565A1 (fr) | 1996-07-10 | 1998-01-15 | Sagami Chemical Research Center | Procede de production d'acide icosapentaenoique par recombinaison genetique |
US6033883A (en) * | 1996-12-18 | 2000-03-07 | Kosan Biosciences, Inc. | Production of polyketides in bacteria and yeast |
SA98190002B1 (ar) | 1997-03-28 | 2006-06-20 | ذي يونيفيرسيتي اوف تننيسي ريسيرش كوربوريشن | استخدام أحماض دهنية تحتوي على عدة روابط غير مشبعة polyunsaturated fatty acids لتقليل حدوث الالتهاب المعوي القولوني الناخر incidence of necrotizing enterocolitis |
US6432684B1 (en) | 1997-04-11 | 2002-08-13 | Abbott Laboratories | Human desaturase gene and uses thereof |
ATE297994T1 (de) | 1997-04-11 | 2005-07-15 | Calgene Llc | Verfahren und zusammensetzungen für die synthese von langkettigen, mehrfach ungesättigten fettsäuren in pflanzen. |
US6051754A (en) | 1997-04-11 | 2000-04-18 | Abbott Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants |
US6566583B1 (en) | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
BR9809946A (pt) * | 1997-06-04 | 2000-08-01 | Calgene Llc | Produção de ácidos graxos poliinsaturados por expressão de genes de sìntese semelhantes a policetìdeo em plantas |
US6013665A (en) | 1997-12-16 | 2000-01-11 | Abbott Laboratories | Method for enhancing the absorption and transport of lipid soluble compounds using structured glycerides |
US6677145B2 (en) * | 1998-09-02 | 2004-01-13 | Abbott Laboratories | Elongase genes and uses thereof |
US7247461B2 (en) | 1999-01-14 | 2007-07-24 | Martek Biosciences Corporation | Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof |
US7211418B2 (en) * | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US7217856B2 (en) * | 1999-01-14 | 2007-05-15 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US8003772B2 (en) | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
US7271315B2 (en) | 1999-01-14 | 2007-09-18 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US20070244192A1 (en) | 1999-01-14 | 2007-10-18 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
EP1294898B1 (en) * | 2000-06-08 | 2006-08-30 | Miami University | FATTY ACID ELONGASE 3-KETOACYL CoA SYNTHASE POLYPEPTIDES |
US20040010817A1 (en) * | 2000-07-21 | 2004-01-15 | Washington State University Research Foundation | Plant acyl-CoA synthetases |
EP1322752B2 (en) | 2000-09-28 | 2015-02-11 | Bioriginal Food & Science Corp. | Fad4, fad5, fad5-2, and fad6, fatty acid desaturase family members and uses thereof |
TWI324181B (en) | 2001-04-16 | 2010-05-01 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
TWI337619B (en) | 2001-04-16 | 2011-02-21 | Martek Biosciences Corp | Pufa polyketide synthase systems and uses thereof |
EP1390507A2 (en) | 2001-05-21 | 2004-02-25 | Ecopia Biosciences Inc. | Genes and proteins involved in the biosynthesis of enediyne ring structures |
US20040005672A1 (en) * | 2002-02-22 | 2004-01-08 | Santi Daniel V. | Heterologous production of polyketides |
GB2385852A (en) | 2002-02-27 | 2003-09-03 | Rothamsted Ex Station | Delta 6-desaturases from Primulaceae |
WO2003078639A2 (en) * | 2002-03-16 | 2003-09-25 | The University Of York | Transgenic plants expressing enzymes involved in fatty acid biosynthesis |
US20040172682A1 (en) | 2003-02-12 | 2004-09-02 | Kinney Anthony J. | Production of very long chain polyunsaturated fatty acids in oilseed plants |
JP2007524377A (ja) | 2003-03-26 | 2007-08-30 | マーテック・バイオサイエンシーズ・コーポレーション | Pufaポリケチドシンターゼ系およびこれらの使用 |
WO2004087902A2 (de) | 2003-03-31 | 2004-10-14 | University Of Bristol | Neue pflanzliche acyltransferasen spezifisch für langkettige mehrfach ungesättigte fettsäuren |
US7125672B2 (en) | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7208590B2 (en) * | 2003-07-15 | 2007-04-24 | Abbott Laboratories | Genes involved in polyketide synthase pathways and uses thereof |
DE102004017370A1 (de) | 2004-04-08 | 2005-10-27 | Nutrinova Nutrition Specialties & Food Ingredients Gmbh | PUFA-PKS Gene aus Ulkenia |
DE102004060340A1 (de) | 2004-07-16 | 2006-02-09 | Basf Plant Science Gmbh | Verfahren zur Erhöhung des Gehalts an mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen |
WO2006034228A2 (en) | 2004-09-20 | 2006-03-30 | Basf Plant Science Gmbh | Arabidopsis genes encoding proteins involved in sugar and lipid metabolism and methods of use |
GB0421937D0 (en) * | 2004-10-02 | 2004-11-03 | Univ York | Acyl CoA synthetases |
WO2006135866A2 (en) * | 2005-06-10 | 2006-12-21 | Martek Biosciences Corporation | Pufa polyketide synthase systems and uses thereof |
CN104073505A (zh) * | 2006-03-15 | 2014-10-01 | Dsmip资产公司 | 利用pufa聚酮化合物合成酶系统在异源的生物体中产生多不饱和脂肪酸的方法 |
FR2904328B1 (fr) * | 2006-07-27 | 2008-10-24 | St Microelectronics Sa | Depot par adsorption sous un champ electrique |
-
2007
- 2007-03-15 CN CN201410121112.2A patent/CN104073505A/zh active Pending
- 2007-03-15 US US11/686,872 patent/US20070220634A1/en not_active Abandoned
- 2007-03-15 KR KR1020137023972A patent/KR101524398B1/ko not_active IP Right Cessation
- 2007-03-15 CA CA002646317A patent/CA2646317A1/en not_active Abandoned
- 2007-03-15 US US11/686,856 patent/US7759548B2/en active Active
- 2007-03-15 WO PCT/US2007/064105 patent/WO2007106904A2/en active Application Filing
- 2007-03-15 CA CA002647150A patent/CA2647150A1/en not_active Abandoned
- 2007-03-15 MX MX2012003219A patent/MX339812B/es unknown
- 2007-03-15 KR KR1020087025101A patent/KR101506347B1/ko not_active IP Right Cessation
- 2007-03-15 TW TW096108936A patent/TWI504748B/zh not_active IP Right Cessation
- 2007-03-15 KR KR1020087025100A patent/KR101517243B1/ko not_active IP Right Cessation
- 2007-03-15 ES ES07758640.2T patent/ES2527875T3/es active Active
- 2007-03-15 US US11/686,850 patent/US20070245431A1/en not_active Abandoned
- 2007-03-15 JP JP2009500611A patent/JP5227302B2/ja not_active Expired - Fee Related
- 2007-03-15 MX MX2008011784A patent/MX2008011784A/es active IP Right Grant
- 2007-03-15 EP EP07758641A patent/EP2004835A4/en not_active Withdrawn
- 2007-03-15 AU AU2007226510A patent/AU2007226510B2/en not_active Ceased
- 2007-03-15 EP EP07758640.2A patent/EP2001277B9/en active Active
- 2007-03-15 MX MX2008011783A patent/MX340759B/es active IP Right Grant
- 2007-03-15 TW TW096108937A patent/TW200813222A/zh unknown
- 2007-03-15 WO PCT/US2007/064106 patent/WO2007106905A2/en active Application Filing
- 2007-03-15 WO PCT/US2007/064104 patent/WO2007106903A2/en active Application Filing
- 2007-03-15 EP EP13159107.5A patent/EP2653557A1/en not_active Withdrawn
- 2007-03-15 JP JP2009500612A patent/JP2009529891A/ja active Pending
- 2007-03-15 AU AU2007226511A patent/AU2007226511A1/en not_active Abandoned
- 2007-03-15 BR BRPI0709317-9A2A patent/BRPI0709317A2/pt not_active IP Right Cessation
-
2008
- 2008-09-14 IL IL194078A patent/IL194078A/en not_active IP Right Cessation
- 2008-09-14 IL IL194077A patent/IL194077A/en not_active IP Right Cessation
-
2009
- 2009-05-27 HK HK09104827.2A patent/HK1126253A1/xx not_active IP Right Cessation
-
2010
- 2010-06-08 US US12/796,100 patent/US8426686B2/en active Active
-
2012
- 2012-11-28 JP JP2012259228A patent/JP2013116104A/ja active Pending
-
2013
- 2013-03-21 US US13/848,070 patent/US9382521B2/en active Active - Reinstated
- 2013-10-22 JP JP2013219079A patent/JP2014087338A/ja not_active Withdrawn
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101524398B1 (ko) | Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조 | |
KR101539470B1 (ko) | 키메라 pufa 폴리케타이드 신테이즈 시스템 및 이의 용도 | |
KR102184432B1 (ko) | 식물체에서 dha 및 다른 lc-pufa의 생산 | |
KR20070084187A (ko) | Pufa 폴리케티드 신타제 시스템 및 그의 용도 | |
US20070244192A1 (en) | Plant seed oils containing polyunsaturated fatty acids | |
KR20140063617A (ko) | 식물에서 dha 및 다른 lc-pufas의 생산 | |
RU2728854C2 (ru) | Получение омега 3 длинноцепочечных полиненасыщенных жирных кислот из масличных культур при использовании синтаз pufa траустохидридов | |
AU2013251201A1 (en) | Polyunsaturated fatty acid production in heterologous organisms using pufa polyketide synthase systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
N231 | Notification of change of applicant | ||
E701 | Decision to grant or registration of patent right | ||
FPAY | Annual fee payment |
Payment date: 20180329 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |