KR101964965B1 - 재조합 유지성 미생물로부터 생산된 맞춤 오일 - Google Patents
재조합 유지성 미생물로부터 생산된 맞춤 오일 Download PDFInfo
- Publication number
- KR101964965B1 KR101964965B1 KR1020137023181A KR20137023181A KR101964965B1 KR 101964965 B1 KR101964965 B1 KR 101964965B1 KR 1020137023181 A KR1020137023181 A KR 1020137023181A KR 20137023181 A KR20137023181 A KR 20137023181A KR 101964965 B1 KR101964965 B1 KR 101964965B1
- Authority
- KR
- South Korea
- Prior art keywords
- delete delete
- acp
- cell
- microalgae
- enzyme
- Prior art date
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 140
- 239000003921 oil Substances 0.000 title abstract description 209
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 378
- 108090000790 Enzymes Proteins 0.000 claims abstract description 286
- 102000004190 Enzymes Human genes 0.000 claims abstract description 266
- 238000000034 method Methods 0.000 claims abstract description 127
- 108700021044 acyl-ACP thioesterase Proteins 0.000 claims abstract description 113
- 238000004519 manufacturing process Methods 0.000 claims abstract description 62
- 239000000446 fuel Substances 0.000 claims abstract description 30
- 238000012258 culturing Methods 0.000 claims abstract description 20
- 239000000126 substance Substances 0.000 claims abstract description 20
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 240
- 239000000194 fatty acid Substances 0.000 claims description 240
- 229930195729 fatty acid Natural products 0.000 claims description 240
- 150000004665 fatty acids Chemical class 0.000 claims description 234
- 230000014509 gene expression Effects 0.000 claims description 128
- 150000007523 nucleic acids Chemical class 0.000 claims description 107
- 102000039446 nucleic acids Human genes 0.000 claims description 103
- 108020004707 nucleic acids Proteins 0.000 claims description 103
- 241000195649 Chlorella <Chlorellales> Species 0.000 claims description 82
- 241000196250 Prototheca Species 0.000 claims description 65
- 125000003696 stearoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 30
- 108050003185 3-oxoacyl-[acyl-carrier-protein] synthase 2 Proteins 0.000 claims description 28
- 108010055956 beta-ketoacyl-acyl carrier protein synthase I Proteins 0.000 claims description 24
- 230000000694 effects Effects 0.000 claims description 24
- 101001135788 Pinus taeda (+)-alpha-pinene synthase, chloroplastic Proteins 0.000 claims description 23
- 235000013305 food Nutrition 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 20
- 108010001483 Glycogen Synthase Proteins 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 13
- 150000003626 triacylglycerols Chemical class 0.000 claims description 13
- WBHHMMIMDMUBKC-XLNAKTSKSA-N ricinelaidic acid Chemical compound CCCCCC[C@@H](O)C\C=C\CCCCCCCC(O)=O WBHHMMIMDMUBKC-XLNAKTSKSA-N 0.000 claims description 12
- 229960003656 ricinoleic acid Drugs 0.000 claims description 12
- FEUQNCSVHBHROZ-UHFFFAOYSA-N ricinoleic acid Natural products CCCCCCC(O[Si](C)(C)C)CC=CCCCCCCCC(=O)OC FEUQNCSVHBHROZ-UHFFFAOYSA-N 0.000 claims description 12
- 230000007423 decrease Effects 0.000 claims description 8
- 241000195645 Auxenochlorella protothecoides Species 0.000 claims description 7
- 108010018089 phosphatidylcholine 12-monooxygenase Proteins 0.000 claims description 7
- 241001463014 Chazara briseis Species 0.000 claims description 5
- 241001442242 Heterochlorella luteoviridis Species 0.000 claims description 5
- 102000003960 Ligases Human genes 0.000 claims description 5
- 108090000364 Ligases Proteins 0.000 claims description 5
- 241001597169 Prototheca stagnorum Species 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims 2
- 238000003379 elimination reaction Methods 0.000 claims 2
- 238000006467 substitution reaction Methods 0.000 claims 2
- 230000002862 amidating effect Effects 0.000 claims 1
- 229930006000 Sucrose Natural products 0.000 abstract description 106
- 239000005720 sucrose Substances 0.000 abstract description 106
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 abstract description 100
- 108010051210 beta-Fructofuranosidase Proteins 0.000 abstract description 53
- 235000011073 invertase Nutrition 0.000 abstract description 41
- 239000001573 invertase Substances 0.000 abstract description 39
- 239000000203 mixture Substances 0.000 abstract description 29
- 108010053754 Aldehyde reductase Proteins 0.000 abstract description 19
- 102100027265 Aldo-keto reductase family 1 member B1 Human genes 0.000 abstract description 19
- 150000002192 fatty aldehydes Chemical class 0.000 abstract description 18
- 102000005970 fatty acyl-CoA reductase Human genes 0.000 abstract description 16
- 108090001018 hexadecanal dehydrogenase (acylating) Proteins 0.000 abstract description 16
- 150000001875 compounds Chemical class 0.000 abstract description 11
- 239000003225 biodiesel Substances 0.000 abstract description 9
- 150000004676 glycans Chemical class 0.000 abstract description 9
- 229920001282 polysaccharide Polymers 0.000 abstract description 8
- 239000005017 polysaccharide Substances 0.000 abstract description 8
- 150000002185 fatty acyl-CoAs Chemical class 0.000 abstract description 7
- 108090000156 Fructokinases Proteins 0.000 abstract description 6
- 102000003793 Fructokinases Human genes 0.000 abstract description 6
- 102000004316 Oxidoreductases Human genes 0.000 abstract description 6
- 108090000854 Oxidoreductases Proteins 0.000 abstract description 6
- 239000000314 lubricant Substances 0.000 abstract description 5
- 239000000344 soap Substances 0.000 abstract description 5
- 102100027297 Fatty acid 2-hydroxylase Human genes 0.000 abstract description 4
- 101000937693 Homo sapiens Fatty acid 2-hydroxylase Proteins 0.000 abstract description 4
- 108090001060 Lipase Proteins 0.000 abstract description 4
- 230000000593 degrading effect Effects 0.000 abstract description 4
- 102000004882 Lipase Human genes 0.000 abstract description 3
- 239000004367 Lipase Substances 0.000 abstract description 3
- 235000019421 lipase Nutrition 0.000 abstract description 3
- 230000001172 regenerating effect Effects 0.000 abstract description 3
- 239000012530 fluid Substances 0.000 abstract 1
- 239000004094 surface-active agent Substances 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 383
- 229940088598 enzyme Drugs 0.000 description 253
- 235000019198 oils Nutrition 0.000 description 206
- 150000002632 lipids Chemical class 0.000 description 156
- 239000000047 product Substances 0.000 description 82
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 67
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 62
- 108020002982 thioesterase Proteins 0.000 description 62
- 229910052799 carbon Inorganic materials 0.000 description 61
- 102000004169 proteins and genes Human genes 0.000 description 61
- 235000018102 proteins Nutrition 0.000 description 60
- 241000894007 species Species 0.000 description 58
- 102000005488 Thioesterase Human genes 0.000 description 56
- 239000002028 Biomass Substances 0.000 description 44
- 239000000758 substrate Substances 0.000 description 43
- 230000000813 microbial effect Effects 0.000 description 38
- 108010087894 Fatty acid desaturases Proteins 0.000 description 37
- 235000000346 sugar Nutrition 0.000 description 34
- -1 fatty acid esters Chemical class 0.000 description 33
- 239000000463 material Substances 0.000 description 32
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 30
- 239000008103 glucose Substances 0.000 description 30
- 102000009114 Fatty acid desaturases Human genes 0.000 description 29
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 29
- 239000013598 vector Substances 0.000 description 29
- JZRWCGZRTZMZEH-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 28
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 27
- 108700019146 Transgenes Proteins 0.000 description 27
- 239000001963 growth medium Substances 0.000 description 26
- 235000011187 glycerol Nutrition 0.000 description 24
- 230000037361 pathway Effects 0.000 description 24
- 229920002678 cellulose Polymers 0.000 description 23
- 235000010980 cellulose Nutrition 0.000 description 23
- 239000001913 cellulose Substances 0.000 description 22
- HYBBIBNJHNGZAN-UHFFFAOYSA-N furfural Chemical compound O=CC1=CC=CO1 HYBBIBNJHNGZAN-UHFFFAOYSA-N 0.000 description 22
- 239000007789 gas Substances 0.000 description 22
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 22
- 238000012546 transfer Methods 0.000 description 21
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 20
- 230000012010 growth Effects 0.000 description 19
- 239000002609 medium Substances 0.000 description 18
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 18
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 17
- 238000002744 homologous recombination Methods 0.000 description 17
- 230000006801 homologous recombination Effects 0.000 description 17
- 230000003301 hydrolyzing effect Effects 0.000 description 17
- 150000001299 aldehydes Chemical class 0.000 description 16
- 230000001965 increasing effect Effects 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 15
- 125000002252 acyl group Chemical group 0.000 description 15
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 15
- 230000009368 gene silencing by RNA Effects 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 14
- 235000019157 thiamine Nutrition 0.000 description 14
- 239000011721 thiamine Substances 0.000 description 14
- 240000000111 Saccharum officinarum Species 0.000 description 13
- 235000007201 Saccharum officinarum Nutrition 0.000 description 13
- 108010030291 alpha-Galactosidase Proteins 0.000 description 13
- 230000000692 anti-sense effect Effects 0.000 description 13
- 125000004432 carbon atom Chemical group C* 0.000 description 13
- 150000002430 hydrocarbons Chemical class 0.000 description 13
- 238000006460 hydrolysis reaction Methods 0.000 description 13
- 230000001939 inductive effect Effects 0.000 description 13
- 229910052757 nitrogen Inorganic materials 0.000 description 13
- 235000015097 nutrients Nutrition 0.000 description 13
- 230000008685 targeting Effects 0.000 description 13
- 229960003495 thiamine Drugs 0.000 description 13
- 108091030071 RNAI Proteins 0.000 description 12
- 229930195733 hydrocarbon Natural products 0.000 description 12
- 239000003550 marker Substances 0.000 description 12
- 150000003839 salts Chemical class 0.000 description 12
- 150000008163 sugars Chemical class 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- 150000001335 aliphatic alkanes Chemical class 0.000 description 11
- 102000005840 alpha-Galactosidase Human genes 0.000 description 11
- 150000001413 amino acids Chemical group 0.000 description 11
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 11
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 125000001924 fatty-acyl group Chemical group 0.000 description 11
- 238000000855 fermentation Methods 0.000 description 11
- 230000004151 fermentation Effects 0.000 description 11
- 230000007062 hydrolysis Effects 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 230000009261 transgenic effect Effects 0.000 description 11
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 10
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 10
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 10
- 240000009108 Chlorella vulgaris Species 0.000 description 10
- 235000007089 Chlorella vulgaris Nutrition 0.000 description 10
- 241000195493 Cryptophyta Species 0.000 description 10
- 239000005642 Oleic acid Substances 0.000 description 10
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 10
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 description 10
- 235000020661 alpha-linolenic acid Nutrition 0.000 description 10
- 210000000349 chromosome Anatomy 0.000 description 10
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 10
- 230000000670 limiting effect Effects 0.000 description 10
- 229960004488 linolenic acid Drugs 0.000 description 10
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 description 10
- 239000007787 solid Substances 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 9
- 102000004031 Carboxy-Lyases Human genes 0.000 description 9
- 108090000489 Carboxy-Lyases Proteins 0.000 description 9
- 108020004414 DNA Proteins 0.000 description 9
- 229930091371 Fructose Natural products 0.000 description 9
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 9
- 239000005715 Fructose Substances 0.000 description 9
- 229920002488 Hemicellulose Polymers 0.000 description 9
- 240000006394 Sorghum bicolor Species 0.000 description 9
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 9
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000009826 distribution Methods 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 238000010353 genetic engineering Methods 0.000 description 9
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 9
- 229940049964 oleate Drugs 0.000 description 9
- KBPHJBAIARWVSC-XQIHNALSSA-N trans-lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C KBPHJBAIARWVSC-XQIHNALSSA-N 0.000 description 9
- 239000002699 waste material Substances 0.000 description 9
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 8
- 108010078791 Carrier Proteins Proteins 0.000 description 8
- UQZIYBXSHAGNOE-USOSMYMVSA-N Stachyose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@H](CO[C@@H]2[C@@H](O)[C@@H](O)[C@@H](O)[C@H](CO)O2)O1 UQZIYBXSHAGNOE-USOSMYMVSA-N 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 239000006227 byproduct Substances 0.000 description 8
- 235000021466 carotenoid Nutrition 0.000 description 8
- 150000001747 carotenoids Chemical class 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 230000004136 fatty acid synthesis Effects 0.000 description 8
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 8
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 229920001542 oligosaccharide Polymers 0.000 description 8
- 150000002482 oligosaccharides Chemical class 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- UQZIYBXSHAGNOE-XNSRJBNMSA-N stachyose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO[C@@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)O2)O)O1 UQZIYBXSHAGNOE-XNSRJBNMSA-N 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 241000195634 Dunaliella Species 0.000 description 7
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 7
- UPYKUZBSLRQECL-UKMVMLAPSA-N Lycopene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1C(=C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=C)CCCC2(C)C UPYKUZBSLRQECL-UKMVMLAPSA-N 0.000 description 7
- JEVVKJMRZMXFBT-XWDZUXABSA-N Lycophyll Natural products OC/C(=C/CC/C(=C\C=C\C(=C/C=C/C(=C\C=C\C=C(/C=C/C=C(\C=C\C=C(/CC/C=C(/CO)\C)\C)/C)\C)/C)\C)/C)/C JEVVKJMRZMXFBT-XWDZUXABSA-N 0.000 description 7
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 7
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 7
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 235000013734 beta-carotene Nutrition 0.000 description 7
- 239000011648 beta-carotene Substances 0.000 description 7
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 description 7
- 229960002747 betacarotene Drugs 0.000 description 7
- 150000001720 carbohydrates Chemical class 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- CYQFCXCEBYINGO-IAGOWNOFSA-N delta1-THC Chemical compound C1=C(C)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 CYQFCXCEBYINGO-IAGOWNOFSA-N 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 229910052739 hydrogen Inorganic materials 0.000 description 7
- 239000001257 hydrogen Substances 0.000 description 7
- 230000002401 inhibitory effect Effects 0.000 description 7
- 229920005610 lignin Polymers 0.000 description 7
- 235000012680 lutein Nutrition 0.000 description 7
- KBPHJBAIARWVSC-RGZFRNHPSA-N lutein Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\[C@H]1C(C)=C[C@H](O)CC1(C)C KBPHJBAIARWVSC-RGZFRNHPSA-N 0.000 description 7
- 239000001656 lutein Substances 0.000 description 7
- 229960005375 lutein Drugs 0.000 description 7
- ORAKUVXRZWMARG-WZLJTJAWSA-N lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C ORAKUVXRZWMARG-WZLJTJAWSA-N 0.000 description 7
- 235000012661 lycopene Nutrition 0.000 description 7
- 239000001751 lycopene Substances 0.000 description 7
- 229960004999 lycopene Drugs 0.000 description 7
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 7
- 229940012843 omega-3 fatty acid Drugs 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 230000003248 secreting effect Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 229930003802 tocotrienol Natural products 0.000 description 7
- 239000011731 tocotrienol Substances 0.000 description 7
- 235000019148 tocotrienols Nutrition 0.000 description 7
- ZCIHMQAPACOQHT-ZGMPDRQDSA-N trans-isorenieratene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/c1c(C)ccc(C)c1C)C=CC=C(/C)C=Cc2c(C)ccc(C)c2C ZCIHMQAPACOQHT-ZGMPDRQDSA-N 0.000 description 7
- 230000032258 transport Effects 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- FJHBOVDFOQMZRV-XQIHNALSSA-N xanthophyll Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C=C(C)C(O)CC2(C)C FJHBOVDFOQMZRV-XQIHNALSSA-N 0.000 description 7
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 description 7
- OILXMJHPFNGGTO-UHFFFAOYSA-N (22E)-(24xi)-24-methylcholesta-5,22-dien-3beta-ol Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)C=CC(C)C(C)C)C1(C)CC2 OILXMJHPFNGGTO-UHFFFAOYSA-N 0.000 description 6
- OYHQOLUKZRVURQ-NTGFUMLPSA-N (9Z,12Z)-9,10,12,13-tetratritiooctadeca-9,12-dienoic acid Chemical compound C(CCCCCCC\C(=C(/C\C(=C(/CCCCC)\[3H])\[3H])\[3H])\[3H])(=O)O OYHQOLUKZRVURQ-NTGFUMLPSA-N 0.000 description 6
- NOEGNKMFWQHSLB-UHFFFAOYSA-N 5-hydroxymethylfurfural Chemical compound OCC1=CC=C(C=O)O1 NOEGNKMFWQHSLB-UHFFFAOYSA-N 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 6
- 239000004215 Carbon black (E152) Substances 0.000 description 6
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 6
- 108700010070 Codon Usage Proteins 0.000 description 6
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 6
- LGJMUZUPVCAVPU-UHFFFAOYSA-N beta-Sitostanol Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(C)CCC(CC)C(C)C)C1(C)CC2 LGJMUZUPVCAVPU-UHFFFAOYSA-N 0.000 description 6
- 150000002191 fatty alcohols Chemical class 0.000 description 6
- 238000005984 hydrogenation reaction Methods 0.000 description 6
- 238000005805 hydroxylation reaction Methods 0.000 description 6
- RJGBSYZFOCAGQY-UHFFFAOYSA-N hydroxymethylfurfural Natural products COC1=CC=C(C=O)O1 RJGBSYZFOCAGQY-UHFFFAOYSA-N 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 229920002635 polyurethane Polymers 0.000 description 6
- 239000004814 polyurethane Substances 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 229920006395 saturated elastomer Polymers 0.000 description 6
- 229930003799 tocopherol Natural products 0.000 description 6
- 239000011732 tocopherol Substances 0.000 description 6
- 230000003827 upregulation Effects 0.000 description 6
- 235000015112 vegetable and seed oil Nutrition 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 241000091621 Amphora coffeiformis Species 0.000 description 5
- SGNBVLSWZMBQTH-FGAXOLDCSA-N Campesterol Natural products O[C@@H]1CC=2[C@@](C)([C@@H]3[C@H]([C@H]4[C@@](C)([C@H]([C@H](CC[C@H](C(C)C)C)C)CC4)CC3)CC=2)CC1 SGNBVLSWZMBQTH-FGAXOLDCSA-N 0.000 description 5
- BTEISVKTSQLKST-UHFFFAOYSA-N Haliclonasterol Natural products CC(C=CC(C)C(C)(C)C)C1CCC2C3=CC=C4CC(O)CCC4(C)C3CCC12C BTEISVKTSQLKST-UHFFFAOYSA-N 0.000 description 5
- 241000502321 Navicula Species 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 244000061456 Solanum tuberosum Species 0.000 description 5
- 235000002595 Solanum tuberosum Nutrition 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 150000001298 alcohols Chemical class 0.000 description 5
- 150000001336 alkenes Chemical class 0.000 description 5
- DLRVVLDZNNYCBX-ZZFZYMBESA-N beta-melibiose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)O1 DLRVVLDZNNYCBX-ZZFZYMBESA-N 0.000 description 5
- SGNBVLSWZMBQTH-PODYLUTMSA-N campesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CC[C@@H](C)C(C)C)[C@@]1(C)CC2 SGNBVLSWZMBQTH-PODYLUTMSA-N 0.000 description 5
- 235000000431 campesterol Nutrition 0.000 description 5
- 229940025250 camphora Drugs 0.000 description 5
- 239000010238 camphora Substances 0.000 description 5
- 229930002868 chlorophyll a Natural products 0.000 description 5
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 5
- 238000006392 deoxygenation reaction Methods 0.000 description 5
- 150000002016 disaccharides Chemical class 0.000 description 5
- 239000000835 fiber Substances 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 230000014759 maintenance of location Effects 0.000 description 5
- 235000013379 molasses Nutrition 0.000 description 5
- 235000020665 omega-6 fatty acid Nutrition 0.000 description 5
- 229940033080 omega-6 fatty acid Drugs 0.000 description 5
- 150000002972 pentoses Chemical class 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 235000003441 saturated fatty acids Nutrition 0.000 description 5
- 150000004671 saturated fatty acids Chemical class 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 125000000185 sucrose group Chemical group 0.000 description 5
- 235000010384 tocopherol Nutrition 0.000 description 5
- 229960001295 tocopherol Drugs 0.000 description 5
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 5
- GJJVAFUKOBZPCB-ZGRPYONQSA-N (r)-3,4-dihydro-2-methyl-2-(4,8,12-trimethyl-3,7,11-tridecatrienyl)-2h-1-benzopyran-6-ol Chemical class OC1=CC=C2OC(CC/C=C(C)/CC/C=C(C)/CCC=C(C)C)(C)CCC2=C1 GJJVAFUKOBZPCB-ZGRPYONQSA-N 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- 241000271566 Aves Species 0.000 description 4
- 235000016068 Berberis vulgaris Nutrition 0.000 description 4
- 241000335053 Beta vulgaris Species 0.000 description 4
- 240000002791 Brassica napus Species 0.000 description 4
- OILXMJHPFNGGTO-NRHJOKMGSA-N Brassicasterol Natural products O[C@@H]1CC=2[C@@](C)([C@@H]3[C@H]([C@H]4[C@](C)([C@H]([C@@H](/C=C/[C@H](C(C)C)C)C)CC4)CC3)CC=2)CC1 OILXMJHPFNGGTO-NRHJOKMGSA-N 0.000 description 4
- 241000832151 Chlorella regularis Species 0.000 description 4
- 240000005636 Dryobalanops aromatica Species 0.000 description 4
- 235000017048 Garcinia mangostana Nutrition 0.000 description 4
- 240000006053 Garcinia mangostana Species 0.000 description 4
- 240000000015 Iris germanica Species 0.000 description 4
- 235000002971 Iris x germanica Nutrition 0.000 description 4
- 241000180701 Nitzschia <flatworm> Species 0.000 description 4
- 241000195648 Pseudochlorella pringsheimii Species 0.000 description 4
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 4
- OILXMJHPFNGGTO-ZRUUVFCLSA-N UNPD197407 Natural products C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)C=C[C@H](C)C(C)C)[C@@]1(C)CC2 OILXMJHPFNGGTO-ZRUUVFCLSA-N 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 229940076810 beta sitosterol Drugs 0.000 description 4
- NJKOMDUNNDKEAI-UHFFFAOYSA-N beta-sitosterol Natural products CCC(CCC(C)C1CCC2(C)C3CC=C4CC(O)CCC4C3CCC12C)C(C)C NJKOMDUNNDKEAI-UHFFFAOYSA-N 0.000 description 4
- OILXMJHPFNGGTO-ZAUYPBDWSA-N brassicasterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)/C=C/[C@H](C)C(C)C)[C@@]1(C)CC2 OILXMJHPFNGGTO-ZAUYPBDWSA-N 0.000 description 4
- 235000004420 brassicasterol Nutrition 0.000 description 4
- 235000014633 carbohydrates Nutrition 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 229930002875 chlorophyll Natural products 0.000 description 4
- 235000019804 chlorophyll Nutrition 0.000 description 4
- 238000006482 condensation reaction Methods 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 108010005155 delta-12 fatty acid desaturase Proteins 0.000 description 4
- 229940096118 ella Drugs 0.000 description 4
- 238000004880 explosion Methods 0.000 description 4
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 4
- 235000010382 gamma-tocopherol Nutrition 0.000 description 4
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 244000059217 heterotrophic organism Species 0.000 description 4
- 238000010335 hydrothermal treatment Methods 0.000 description 4
- 230000033444 hydroxylation Effects 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000002085 persistent effect Effects 0.000 description 4
- 239000000049 pigment Substances 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- KZJWDPNRJALLNS-VJSFXXLFSA-N sitosterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CC[C@@H](CC)C(C)C)[C@@]1(C)CC2 KZJWDPNRJALLNS-VJSFXXLFSA-N 0.000 description 4
- 229950005143 sitosterol Drugs 0.000 description 4
- NLQLSVXGSXCXFE-UHFFFAOYSA-N sitosterol Natural products CC=C(/CCC(C)C1CC2C3=CCC4C(C)C(O)CCC4(C)C3CCC2(C)C1)C(C)C NLQLSVXGSXCXFE-UHFFFAOYSA-N 0.000 description 4
- 229940068778 tocotrienols Drugs 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 239000002023 wood Substances 0.000 description 4
- 239000002478 γ-tocopherol Substances 0.000 description 4
- QUEDXNHFTDJVIY-DQCZWYHMSA-N γ-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1 QUEDXNHFTDJVIY-DQCZWYHMSA-N 0.000 description 4
- GJJVAFUKOBZPCB-UHFFFAOYSA-N 2-methyl-2-(4,8,12-trimethyltrideca-3,7,11-trienyl)-3,4-dihydrochromen-6-ol Chemical compound OC1=CC=C2OC(CCC=C(C)CCC=C(C)CCC=C(C)C)(C)CCC2=C1 GJJVAFUKOBZPCB-UHFFFAOYSA-N 0.000 description 3
- 235000011293 Brassica napus Nutrition 0.000 description 3
- 101710184216 Cardioactive peptide Proteins 0.000 description 3
- 235000013162 Cocos nucifera Nutrition 0.000 description 3
- 244000060011 Cocos nucifera Species 0.000 description 3
- 241000219748 Cyamopsis Species 0.000 description 3
- 101710088194 Dehydrogenase Proteins 0.000 description 3
- 241000195633 Dunaliella salina Species 0.000 description 3
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 3
- 108010021582 Glucokinase Proteins 0.000 description 3
- 102000030595 Glucokinase Human genes 0.000 description 3
- 102000005548 Hexokinase Human genes 0.000 description 3
- 108700040460 Hexokinases Proteins 0.000 description 3
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 235000009421 Myristica fragrans Nutrition 0.000 description 3
- 244000270834 Myristica fragrans Species 0.000 description 3
- 241000405774 Nitzschia pusilla Species 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 235000019482 Palm oil Nutrition 0.000 description 3
- 241000195646 Parachlorella kessleri Species 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 241000235070 Saccharomyces Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 3
- 239000002154 agricultural waste Substances 0.000 description 3
- 150000001348 alkyl chlorides Chemical class 0.000 description 3
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 238000004061 bleaching Methods 0.000 description 3
- 239000001569 carbon dioxide Substances 0.000 description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 description 3
- 230000032823 cell division Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 210000003763 chloroplast Anatomy 0.000 description 3
- 238000004040 coloring Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000002283 diesel fuel Substances 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 3
- 230000003828 downregulation Effects 0.000 description 3
- 230000007071 enzymatic hydrolysis Effects 0.000 description 3
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 3
- 239000003925 fat Substances 0.000 description 3
- 235000019197 fats Nutrition 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 239000003205 fragrance Substances 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 239000003502 gasoline Substances 0.000 description 3
- 238000010363 gene targeting Methods 0.000 description 3
- 238000007327 hydrogenolysis reaction Methods 0.000 description 3
- 239000012535 impurity Substances 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 235000020778 linoleic acid Nutrition 0.000 description 3
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000009629 microbiological culture Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 150000002772 monosaccharides Chemical class 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 239000002540 palm oil Substances 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 230000029553 photosynthesis Effects 0.000 description 3
- 238000010672 photosynthesis Methods 0.000 description 3
- 230000000243 photosynthetic effect Effects 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 150000003138 primary alcohols Chemical class 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 239000010936 titanium Substances 0.000 description 3
- 229910052719 titanium Inorganic materials 0.000 description 3
- 239000011573 trace mineral Substances 0.000 description 3
- 235000013619 trace mineral Nutrition 0.000 description 3
- 238000005809 transesterification reaction Methods 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- LKAPTZKZHMOIRE-KVTDHHQDSA-N (2s,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolane-2-carbaldehyde Chemical compound OC[C@H]1O[C@H](C=O)[C@@H](O)[C@@H]1O LKAPTZKZHMOIRE-KVTDHHQDSA-N 0.000 description 2
- JKQXZKUSFCKOGQ-JLGXGRJMSA-N (3R,3'R)-beta,beta-carotene-3,3'-diol Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-JLGXGRJMSA-N 0.000 description 2
- OOCCDEMITAIZTP-QPJJXVBHSA-N (E)-cinnamyl alcohol Chemical compound OC\C=C\C1=CC=CC=C1 OOCCDEMITAIZTP-QPJJXVBHSA-N 0.000 description 2
- 108010019608 3-Oxoacyl-(Acyl-Carrier-Protein) Synthase Proteins 0.000 description 2
- 101710176059 4-amino-5-hydroxymethyl-2-methylpyrimidine phosphate synthase Proteins 0.000 description 2
- OQMZNAMGEHIHNN-UHFFFAOYSA-N 7-Dehydrostigmasterol Natural products C1C(O)CCC2(C)C(CCC3(C(C(C)C=CC(CC)C(C)C)CCC33)C)C3=CC=C21 OQMZNAMGEHIHNN-UHFFFAOYSA-N 0.000 description 2
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 2
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 2
- 241001133760 Acoelorraphe Species 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 241000892894 Amphora delicatissima Species 0.000 description 2
- 241000192542 Anabaena Species 0.000 description 2
- 241000196169 Ankistrodesmus Species 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 108010018763 Biotin carboxylase Proteins 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 241000701489 Cauliflower mosaic virus Species 0.000 description 2
- 108010059892 Cellulase Proteins 0.000 description 2
- 241000091751 Chaetoceros muellerii Species 0.000 description 2
- 241000701248 Chlorella virus Species 0.000 description 2
- 241000195658 Chloroidium saccharophilum Species 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 241000134090 Coccomyxa <Trebouxiophyceae> Species 0.000 description 2
- 241000219992 Cuphea Species 0.000 description 2
- 241001147477 Cyclotella cryptica Species 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- 241001231664 Dunaliella viridis Species 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- 241000195620 Euglena Species 0.000 description 2
- 101710091951 Glycerol-3-phosphate acyltransferase Proteins 0.000 description 2
- 235000009438 Gossypium Nutrition 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- 101150031639 IV gene Proteins 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- OFBQJSOFQDEBGM-UHFFFAOYSA-N Pentane Chemical compound CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 2
- 101710098569 Phosphomethylpyrimidine synthase Proteins 0.000 description 2
- 241000722208 Pleurochrysis Species 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- 241000219000 Populus Species 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 240000000528 Ricinus communis Species 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- 244000185830 Sorbus americana Species 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 102000008078 Sterol Regulatory Element Binding Protein 1 Human genes 0.000 description 2
- 108010074436 Sterol Regulatory Element Binding Protein 1 Proteins 0.000 description 2
- 102000009822 Sterol Regulatory Element Binding Proteins Human genes 0.000 description 2
- 108010020396 Sterol Regulatory Element Binding Proteins Proteins 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 241000196321 Tetraselmis Species 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- HZYXFRGVBOPPNZ-UHFFFAOYSA-N UNPD88870 Natural products C1C=C2CC(O)CCC2(C)C2C1C1CCC(C(C)=CCC(CC)C(C)C)C1(C)CC2 HZYXFRGVBOPPNZ-UHFFFAOYSA-N 0.000 description 2
- 244000025271 Umbellularia californica Species 0.000 description 2
- 235000008674 Umbellularia californica Nutrition 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- JKQXZKUSFCKOGQ-LQFQNGICSA-N Z-zeaxanthin Natural products C([C@H](O)CC=1C)C(C)(C)C=1C=CC(C)=CC=CC(C)=CC=CC=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-LQFQNGICSA-N 0.000 description 2
- QOPRSMDTRDMBNK-RNUUUQFGSA-N Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCC(O)C1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C QOPRSMDTRDMBNK-RNUUUQFGSA-N 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- JKQXZKUSFCKOGQ-LOFNIBRQSA-N all-trans-Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C JKQXZKUSFCKOGQ-LOFNIBRQSA-N 0.000 description 2
- ANVAOWXLWRTKGA-XHGAXZNDSA-N all-trans-alpha-carotene Chemical compound CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1C(C)=CCCC1(C)C ANVAOWXLWRTKGA-XHGAXZNDSA-N 0.000 description 2
- NBZANZVJRKXVBH-ITUXNECMSA-N all-trans-alpha-cryptoxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C(=CCCC2(C)C)C NBZANZVJRKXVBH-ITUXNECMSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- LKAPTZKZHMOIRE-UHFFFAOYSA-N chitose Natural products OCC1OC(C=O)C(O)C1O LKAPTZKZHMOIRE-UHFFFAOYSA-N 0.000 description 2
- 125000001309 chloro group Chemical group Cl* 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 235000020971 citrus fruits Nutrition 0.000 description 2
- 239000003240 coconut oil Substances 0.000 description 2
- 235000019864 coconut oil Nutrition 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000009833 condensation Methods 0.000 description 2
- 230000005494 condensation Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- 238000005336 cracking Methods 0.000 description 2
- 239000010779 crude oil Substances 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- 125000004093 cyano group Chemical group *C#N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000002242 deionisation method Methods 0.000 description 2
- 238000004332 deodorization Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000004821 distillation Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000005886 esterification reaction Methods 0.000 description 2
- 108010093305 exopolygalacturonase Proteins 0.000 description 2
- 239000002803 fossil fuel Substances 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 239000002816 fuel additive Substances 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 150000002313 glycerolipids Chemical class 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 150000002402 hexoses Chemical class 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- IQPQWNKOIGAROB-UHFFFAOYSA-N isocyanate group Chemical group [N-]=C=O IQPQWNKOIGAROB-UHFFFAOYSA-N 0.000 description 2
- 238000006317 isomerization reaction Methods 0.000 description 2
- 239000002029 lignocellulosic biomass Substances 0.000 description 2
- 229940040461 lipase Drugs 0.000 description 2
- 101150102081 mel1 gene Proteins 0.000 description 2
- 238000005649 metathesis reaction Methods 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 235000021084 monounsaturated fats Nutrition 0.000 description 2
- 235000019508 mustard seed Nutrition 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000006386 neutralization reaction Methods 0.000 description 2
- 230000035764 nutrition Effects 0.000 description 2
- 230000003204 osmotic effect Effects 0.000 description 2
- 239000003346 palm kernel oil Substances 0.000 description 2
- 235000019865 palm kernel oil Nutrition 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 231100000614 poison Toxicity 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000011122 softwood Substances 0.000 description 2
- 229940032091 stigmasterol Drugs 0.000 description 2
- HCXVJBMSMIARIN-PHZDYDNGSA-N stigmasterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)/C=C/[C@@H](CC)C(C)C)[C@@]1(C)CC2 HCXVJBMSMIARIN-PHZDYDNGSA-N 0.000 description 2
- 235000016831 stigmasterol Nutrition 0.000 description 2
- BFDNMXAIBMJLBB-UHFFFAOYSA-N stigmasterol Natural products CCC(C=CC(C)C1CCCC2C3CC=C4CC(O)CCC4(C)C3CCC12C)C(C)C BFDNMXAIBMJLBB-UHFFFAOYSA-N 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000010902 straw Substances 0.000 description 2
- 239000003760 tallow Substances 0.000 description 2
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 2
- 150000007970 thio esters Chemical class 0.000 description 2
- 239000003440 toxic substance Substances 0.000 description 2
- 238000006276 transfer reaction Methods 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 238000004073 vulcanization Methods 0.000 description 2
- 239000002916 wood waste Substances 0.000 description 2
- 235000010930 zeaxanthin Nutrition 0.000 description 2
- 239000001775 zeaxanthin Substances 0.000 description 2
- 229940043269 zeaxanthin Drugs 0.000 description 2
- MJYQFWSXKFLTAY-OVEQLNGDSA-N (2r,3r)-2,3-bis[(4-hydroxy-3-methoxyphenyl)methyl]butane-1,4-diol;(2r,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O.C1=C(O)C(OC)=CC(C[C@@H](CO)[C@H](CO)CC=2C=C(OC)C(O)=CC=2)=C1 MJYQFWSXKFLTAY-OVEQLNGDSA-N 0.000 description 1
- DMASLKHVQRHNES-UPOGUZCLSA-N (3R)-beta,beta-caroten-3-ol Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C DMASLKHVQRHNES-UPOGUZCLSA-N 0.000 description 1
- NBZANZVJRKXVBH-DJPRRHJBSA-N (3R,6'R)-beta,epsilon-caroten-3-ol Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=C[C@H]1C(C)=CCCC1(C)C NBZANZVJRKXVBH-DJPRRHJBSA-N 0.000 description 1
- GHOKWGTUZJEAQD-ZETCQYMHSA-N (D)-(+)-Pantothenic acid Chemical compound OCC(C)(C)[C@@H](O)C(=O)NCCC(O)=O GHOKWGTUZJEAQD-ZETCQYMHSA-N 0.000 description 1
- 229910019614 (NH4)6 Mo7 O24.4H2 O Inorganic materials 0.000 description 1
- 108010030844 2-methylcitrate synthase Proteins 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241001607836 Achnanthes Species 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- 241000571821 Amphidinium sp. Species 0.000 description 1
- 241000091673 Amphiprora Species 0.000 description 1
- 241001564049 Amphora sp. Species 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 244000226021 Anacardium occidentale Species 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000016425 Arthrospira platensis Nutrition 0.000 description 1
- 240000002900 Arthrospira platensis Species 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- JEBFVOLFMLUKLF-IFPLVEIFSA-N Astaxanthin Natural products CC(=C/C=C/C(=C/C=C/C1=C(C)C(=O)C(O)CC1(C)C)/C)C=CC=C(/C)C=CC=C(/C)C=CC2=C(C)C(=O)C(O)CC2(C)C JEBFVOLFMLUKLF-IFPLVEIFSA-N 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- 101100481176 Bacillus subtilis (strain 168) thiE gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 235000012284 Bertholletia excelsa Nutrition 0.000 description 1
- 244000205479 Bertholletia excelsa Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 241001536324 Botryococcus Species 0.000 description 1
- 241001014907 Botryosphaerella sudetica Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 241000771208 Buchanania arborescens Species 0.000 description 1
- 244000197813 Camelina sativa Species 0.000 description 1
- 235000014595 Camelina sativa Nutrition 0.000 description 1
- 240000001548 Camellia japonica Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 241001249699 Capitata Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000218459 Carteria Species 0.000 description 1
- 235000009025 Carya illinoensis Nutrition 0.000 description 1
- 244000068645 Carya illinoensis Species 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 241000227752 Chaetoceros Species 0.000 description 1
- 241001086210 Chaetoceros gracilis Species 0.000 description 1
- 241000227757 Chaetoceros sp. Species 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000704942 Chlorella antarctica Species 0.000 description 1
- 241000704925 Chlorella miniata Species 0.000 description 1
- 241000391337 Chlorella parva Species 0.000 description 1
- 241000195654 Chlorella sorokiniana Species 0.000 description 1
- 241000195651 Chlorella sp. Species 0.000 description 1
- 241001287915 Chlorella sp. 'anitrata' Species 0.000 description 1
- 241000760741 Chlorella stigmatophora Species 0.000 description 1
- 241000180279 Chlorococcum Species 0.000 description 1
- 241000144274 Chlorococcum infusionum Species 0.000 description 1
- 241000508318 Chlorogonium Species 0.000 description 1
- 241000894438 Chloroidium ellipsoideum Species 0.000 description 1
- 241001442241 Chromochloris zofingiensis Species 0.000 description 1
- 241000195501 Chroomonas sp. Species 0.000 description 1
- 241000206751 Chrysophyceae Species 0.000 description 1
- 241000391097 Chrysosphaera Species 0.000 description 1
- 241000722206 Chrysotila carterae Species 0.000 description 1
- 241000723347 Cinnamomum Species 0.000 description 1
- 108010071536 Citrate (Si)-synthase Proteins 0.000 description 1
- 102000006732 Citrate synthase Human genes 0.000 description 1
- 241001478806 Closterium Species 0.000 description 1
- 241001478807 Closterium peracerosum-strigosum-littorale complex Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 101800004637 Communis Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 241000723382 Corylus Species 0.000 description 1
- 235000007466 Corylus avellana Nutrition 0.000 description 1
- 241001245609 Cricosphaera Species 0.000 description 1
- 241000195617 Cryptomonas sp. Species 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000219919 Cuphea lanceolata Species 0.000 description 1
- 241000167559 Cuphea palustris Species 0.000 description 1
- 241001147470 Cyclotella meneghiniana Species 0.000 description 1
- 241001491720 Cyclotella sp. Species 0.000 description 1
- 241000206743 Cylindrotheca Species 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 1
- 208000006558 Dental Calculus Diseases 0.000 description 1
- 241001301789 Desmodesmus abundans Species 0.000 description 1
- 101100494344 Desulfobacterium autotrophicum (strain ATCC 43914 / DSM 3382 / HRM2) bzaF gene Proteins 0.000 description 1
- 241000199914 Dinophyceae Species 0.000 description 1
- 208000003164 Diplopia Diseases 0.000 description 1
- 241000720038 Diplosphaera sphaerica Species 0.000 description 1
- 241000195631 Dunaliella parva Species 0.000 description 1
- 241001324819 Dunaliella peircei Species 0.000 description 1
- 241001403474 Dunaliella primolecta Species 0.000 description 1
- 241001560459 Dunaliella sp. Species 0.000 description 1
- 241000195632 Dunaliella tertiolecta Species 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 241000464908 Elliptica Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000354295 Eremosphaera Species 0.000 description 1
- 241000354291 Eremosphaera viridis Species 0.000 description 1
- 244000039154 Erica Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108010022535 Farnesyl-Diphosphate Farnesyltransferase Proteins 0.000 description 1
- 241000692361 Fistulifera saprophila Species 0.000 description 1
- 244000112502 Fragaria collina Species 0.000 description 1
- 241001466505 Fragilaria Species 0.000 description 1
- 241001533489 Fragilaria crotonensis Species 0.000 description 1
- 241000923853 Franceia Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- 102000016901 Glutamate dehydrogenase Human genes 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 241001464829 Gonium pectorale Species 0.000 description 1
- 241000371004 Graesiella emersonii Species 0.000 description 1
- 241000168517 Haematococcus lacustris Species 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 101000601661 Homo sapiens Paired box protein Pax-7 Proteins 0.000 description 1
- 241001037825 Hymenomonas Species 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 241001043303 Isochrysis aff. galbana Species 0.000 description 1
- 241001501873 Isochrysis galbana Species 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical compound C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 1
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241001098499 Lanceolata Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000936931 Lepocinclis Species 0.000 description 1
- 241000408747 Lepomis gibbosus Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241000195660 Lobosphaeropsis lobophora Species 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 241000520876 Merismopedia Species 0.000 description 1
- 241000586743 Micractinium Species 0.000 description 1
- 241000404165 Microcephala Species 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- 241001478792 Monoraphidium Species 0.000 description 1
- 241001535064 Monoraphidium minutum Species 0.000 description 1
- 241000498779 Myristica Species 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- 241000196305 Nannochloris Species 0.000 description 1
- 241000224474 Nannochloropsis Species 0.000 description 1
- 241000509521 Nannochloropsis sp. Species 0.000 description 1
- 241001313972 Navicula sp. Species 0.000 description 1
- 241000195659 Neodesmus pupukensis Species 0.000 description 1
- 241001442227 Nephroselmis Species 0.000 description 1
- 241000405776 Nitzschia alexandrina Species 0.000 description 1
- 241001104995 Nitzschia communis Species 0.000 description 1
- 241000905117 Nitzschia dissipata Species 0.000 description 1
- 241001303192 Nitzschia hantzschiana Species 0.000 description 1
- 241000905115 Nitzschia inconspicua Species 0.000 description 1
- 241000486043 Nitzschia sp. (in: Bacillariophyta) Species 0.000 description 1
- 241001263478 Norovirus Species 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 241000772772 Ochromonas sp. Species 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 241000514008 Oocystis Species 0.000 description 1
- 241000733494 Oocystis parva Species 0.000 description 1
- 241001443840 Oocystis pusilla Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000192520 Oscillatoria sp. Species 0.000 description 1
- 241000682093 Oscillatoria subbrevis Species 0.000 description 1
- 241000492493 Oxymeris Species 0.000 description 1
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 235000008753 Papaver somniferum Nutrition 0.000 description 1
- 240000001090 Papaver somniferum Species 0.000 description 1
- 241000206766 Pavlova Species 0.000 description 1
- 229920002230 Pectic acid Polymers 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 241000206731 Phaeodactylum Species 0.000 description 1
- 241000192608 Phormidium Species 0.000 description 1
- YGYAWVDWMABLBF-UHFFFAOYSA-N Phosgene Chemical compound ClC(Cl)=O YGYAWVDWMABLBF-UHFFFAOYSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000594009 Phoxinus phoxinus Species 0.000 description 1
- 241000196317 Platymonas Species 0.000 description 1
- 241001074118 Prototheca moriformis Species 0.000 description 1
- 241000196249 Prototheca wickerhamii Species 0.000 description 1
- 241000196248 Prototheca zopfii Species 0.000 description 1
- 241000795122 Prototheca zopfii var. portoricensis Species 0.000 description 1
- 241000530613 Pseudanabaena limnetica Species 0.000 description 1
- 241000542943 Pseudochlorella subsphaerica Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241001509149 Pyramimonas sp. Species 0.000 description 1
- 241000195604 Pyrobotrys Species 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 108091007187 Reductases Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241000208422 Rhododendron Species 0.000 description 1
- 235000003846 Ricinus Nutrition 0.000 description 1
- 241000322381 Ricinus <louse> Species 0.000 description 1
- 241001466077 Salina Species 0.000 description 1
- 241000997737 Scenedesmus armatus Species 0.000 description 1
- 241000269821 Scombridae Species 0.000 description 1
- 244000000231 Sesamum indicum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 244000044822 Simmondsia californica Species 0.000 description 1
- 235000004433 Simmondsia californica Nutrition 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 102000013275 Somatomedins Human genes 0.000 description 1
- 244000138286 Sorghum saccharatum Species 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 229920002334 Spandex Polymers 0.000 description 1
- 241000196294 Spirogyra Species 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 241001148697 Stichococcus sp. Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241000200261 Symbiodinium Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 241000192581 Synechocystis sp. Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 235000012308 Tagetes Nutrition 0.000 description 1
- 241000736851 Tagetes Species 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 241000891463 Tetraedron Species 0.000 description 1
- 241001491687 Thalassiosira pseudonana Species 0.000 description 1
- 241000957276 Thalassiosira weissflogii Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241001149163 Ulmus americana Species 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 241001411205 Viridiella Species 0.000 description 1
- 241000195615 Volvox Species 0.000 description 1
- 241000195614 Volvox carteri Species 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 241000195647 [Chlorella] fusca Species 0.000 description 1
- 241000857102 [Chlorella] gloriosa Species 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 238000010306 acid treatment Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- GZCGUPFRVQAUEE-KCDKBNATSA-N aldehydo-D-galactose Chemical group OC[C@@H](O)[C@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-KCDKBNATSA-N 0.000 description 1
- IAJILQKETJEXLJ-QTBDOELSSA-N aldehydo-D-glucuronic acid Chemical compound O=C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C(O)=O IAJILQKETJEXLJ-QTBDOELSSA-N 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- OOCCDEMITAIZTP-UHFFFAOYSA-N allylic benzylic alcohol Natural products OCC=CC1=CC=CC=C1 OOCCDEMITAIZTP-UHFFFAOYSA-N 0.000 description 1
- NBZANZVJRKXVBH-GYDPHNCVSA-N alpha-Cryptoxanthin Natural products O[C@H]1CC(C)(C)C(/C=C/C(=C\C=C\C(=C/C=C/C=C(\C=C\C=C(/C=C/[C@H]2C(C)=CCCC2(C)C)\C)/C)\C)/C)=C(C)C1 NBZANZVJRKXVBH-GYDPHNCVSA-N 0.000 description 1
- 239000011795 alpha-carotene Substances 0.000 description 1
- 235000003903 alpha-carotene Nutrition 0.000 description 1
- ANVAOWXLWRTKGA-HLLMEWEMSA-N alpha-carotene Natural products C(=C\C=C\C=C(/C=C/C=C(\C=C\C=1C(C)(C)CCCC=1C)/C)\C)(\C=C\C=C(/C=C/[C@H]1C(C)=CCCC1(C)C)\C)/C ANVAOWXLWRTKGA-HLLMEWEMSA-N 0.000 description 1
- 235000005861 alpha-cryptoxanthin Nutrition 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 238000005576 amination reaction Methods 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000013793 astaxanthin Nutrition 0.000 description 1
- 239000001168 astaxanthin Substances 0.000 description 1
- MQZIGYBFDRPAKN-ZWAPEEGVSA-N astaxanthin Chemical compound C([C@H](O)C(=O)C=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C(=O)[C@@H](O)CC1(C)C MQZIGYBFDRPAKN-ZWAPEEGVSA-N 0.000 description 1
- 229940022405 astaxanthin Drugs 0.000 description 1
- 244000062766 autotrophic organism Species 0.000 description 1
- FIXLYHHVMHXSCP-UHFFFAOYSA-H azane;dihydroxy(dioxo)molybdenum;trioxomolybdenum;tetrahydrate Chemical compound N.N.N.N.N.N.O.O.O.O.O=[Mo](=O)=O.O=[Mo](=O)=O.O=[Mo](=O)=O.O=[Mo](=O)=O.O[Mo](O)(=O)=O.O[Mo](O)(=O)=O.O[Mo](O)(=O)=O FIXLYHHVMHXSCP-UHFFFAOYSA-H 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 235000002360 beta-cryptoxanthin Nutrition 0.000 description 1
- 239000011774 beta-cryptoxanthin Substances 0.000 description 1
- DMASLKHVQRHNES-ITUXNECMSA-N beta-cryptoxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2=C(C)CCCC2(C)C DMASLKHVQRHNES-ITUXNECMSA-N 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000003570 biosynthesizing effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 101150038738 ble gene Proteins 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 230000035425 carbon utilization Effects 0.000 description 1
- 239000004106 carminic acid Substances 0.000 description 1
- 235000012730 carminic acid Nutrition 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 239000004359 castor oil Substances 0.000 description 1
- 235000019438 castor oil Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- NSMUHPMZFPKNMZ-VBYMZDBQSA-M chlorophyll b Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C=O)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 NSMUHPMZFPKNMZ-VBYMZDBQSA-M 0.000 description 1
- 229930002869 chlorophyll b Natural products 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 229940080423 cochineal Drugs 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 125000000753 cycloalkyl group Chemical group 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 238000006356 dehydrogenation reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 230000000779 depleting effect Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- GOMCKELMLXHYHH-UHFFFAOYSA-L dipotassium;phthalate Chemical class [K+].[K+].[O-]C(=O)C1=CC=CC=C1C([O-])=O GOMCKELMLXHYHH-UHFFFAOYSA-L 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 108020003118 fatty acyl-CoA reductase Proteins 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical compound NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 description 1
- 229960004413 flucytosine Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 235000021588 free fatty acids Nutrition 0.000 description 1
- 239000000295 fuel oil Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- ZXQYGBMAQZUVMI-GCMPRSNUSA-N gamma-cyhalothrin Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-GCMPRSNUSA-N 0.000 description 1
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010448 genetic screening Methods 0.000 description 1
- 239000013050 geological sediment Substances 0.000 description 1
- 229940089161 ginsenoside Drugs 0.000 description 1
- 229930182494 ginsenoside Natural products 0.000 description 1
- 229940097043 glucuronic acid Drugs 0.000 description 1
- 230000036252 glycation Effects 0.000 description 1
- ZEMPKEQAKRGZGQ-XOQCFJPHSA-N glycerol triricinoleate Natural products CCCCCC[C@@H](O)CC=CCCCCCCCC(=O)OC[C@@H](COC(=O)CCCCCCCC=CC[C@@H](O)CCCCCC)OC(=O)CCCCCCCC=CC[C@H](O)CCCCCC ZEMPKEQAKRGZGQ-XOQCFJPHSA-N 0.000 description 1
- 150000002314 glycerols Chemical class 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 230000009569 heterotrophic growth Effects 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 210000004276 hyalin Anatomy 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000003262 industrial enzyme Substances 0.000 description 1
- 239000003317 industrial substance Substances 0.000 description 1
- 239000011261 inert gas Substances 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 239000002054 inoculum Substances 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 239000012978 lignocellulosic material Substances 0.000 description 1
- 230000006372 lipid accumulation Effects 0.000 description 1
- 230000037356 lipid metabolism Effects 0.000 description 1
- AGBQKNBQESQNJD-UHFFFAOYSA-M lipoate Chemical compound [O-]C(=O)CCCCC1CCSS1 AGBQKNBQESQNJD-UHFFFAOYSA-M 0.000 description 1
- 235000019136 lipoic acid Nutrition 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 150000002646 long chain fatty acid esters Chemical class 0.000 description 1
- 239000003879 lubricant additive Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 235000020640 mackerel Nutrition 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 230000029052 metamorphosis Effects 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 101150087123 nat gene Proteins 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- LFLZOWIFJOBEPN-UHFFFAOYSA-N nitrate, nitrate Chemical class O[N+]([O-])=O.O[N+]([O-])=O LFLZOWIFJOBEPN-UHFFFAOYSA-N 0.000 description 1
- 229910017464 nitrogen compound Inorganic materials 0.000 description 1
- 150000002830 nitrogen compounds Chemical class 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 108010033653 omega-3 fatty acid desaturase Proteins 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 238000010979 pH adjustment Methods 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 229940014662 pantothenate Drugs 0.000 description 1
- 235000019161 pantothenic acid Nutrition 0.000 description 1
- 239000011713 pantothenic acid Substances 0.000 description 1
- 235000012162 pavlova Nutrition 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 235000012830 plain croissants Nutrition 0.000 description 1
- 229920001467 poly(styrenesulfonates) Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000010318 polygalacturonic acid Substances 0.000 description 1
- 230000006551 post-translational degradation Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000004537 pulping Methods 0.000 description 1
- 235000020236 pumpkin seed Nutrition 0.000 description 1
- JEXVQSWXXUJEMA-UHFFFAOYSA-N pyrazol-3-one Chemical compound O=C1C=CN=N1 JEXVQSWXXUJEMA-UHFFFAOYSA-N 0.000 description 1
- 239000002510 pyrogen Substances 0.000 description 1
- 230000018612 quorum sensing Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 238000007127 saponification reaction Methods 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 239000004759 spandex Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 125000005504 styryl group Chemical group 0.000 description 1
- 238000006277 sulfonation reaction Methods 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 101150029215 thiC gene Proteins 0.000 description 1
- 229960000344 thiamine hydrochloride Drugs 0.000 description 1
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 1
- 239000011747 thiamine hydrochloride Substances 0.000 description 1
- 229960002663 thioctic acid Drugs 0.000 description 1
- ZCUFMDLYAMJYST-UHFFFAOYSA-N thorium dioxide Chemical compound O=[Th]=O ZCUFMDLYAMJYST-UHFFFAOYSA-N 0.000 description 1
- OGIDPMRJRNCKJF-UHFFFAOYSA-N titanium oxide Inorganic materials [Ti]=O OGIDPMRJRNCKJF-UHFFFAOYSA-N 0.000 description 1
- 235000019149 tocopherols Nutrition 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 150000004043 trisaccharides Chemical class 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 1
- JFALSRSLKYAFGM-UHFFFAOYSA-N uranium(0) Chemical compound [U] JFALSRSLKYAFGM-UHFFFAOYSA-N 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- QUEDXNHFTDJVIY-UHFFFAOYSA-N γ-tocopherol Chemical class OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1 QUEDXNHFTDJVIY-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6463—Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L33/00—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
- A23L33/10—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
- A23L33/115—Fatty acids or derivatives thereof; Fats or oils
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C69/00—Esters of carboxylic acids; Esters of carbonic or haloformic acids
- C07C69/52—Esters of acyclic unsaturated carboxylic acids having the esterified carboxyl group bound to an acyclic carbon atom
-
- C—CHEMISTRY; METALLURGY
- C10—PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
- C10L—FUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
- C10L1/00—Liquid carbonaceous fuels
- C10L1/02—Liquid carbonaceous fuels essentially based on components consisting of carbon, hydrogen, and oxygen only
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23V—INDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
- A23V2002/00—Food compositions, function of food ingredients or processes for food or foodstuffs
-
- C—CHEMISTRY; METALLURGY
- C10—PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
- C10L—FUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
- C10L2200/00—Components of fuel compositions
- C10L2200/04—Organic compounds
- C10L2200/0461—Fractions defined by their origin
- C10L2200/0469—Renewables or materials of biological origin
- C10L2200/0476—Biodiesel, i.e. defined lower alkyl esters of fatty acids first generation biodiesel
-
- C—CHEMISTRY; METALLURGY
- C10—PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
- C10L—FUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
- C10L2290/00—Fuel preparation or upgrading, processes or apparatus therefore, comprising specific process steps or apparatus units
- C10L2290/26—Composting, fermenting or anaerobic digestion fuel components or materials from which fuels are prepared
-
- C—CHEMISTRY; METALLURGY
- C10—PETROLEUM, GAS OR COKE INDUSTRIES; TECHNICAL GASES CONTAINING CARBON MONOXIDE; FUELS; LUBRICANTS; PEAT
- C10L—FUELS NOT OTHERWISE PROVIDED FOR; NATURAL GAS; SYNTHETIC NATURAL GAS OBTAINED BY PROCESSES NOT COVERED BY SUBCLASSES C10G, C10K; LIQUEFIED PETROLEUM GAS; ADDING MATERIALS TO FUELS OR FIRES TO REDUCE SMOKE OR UNDESIRABLE DEPOSITS OR TO FACILITATE SOOT REMOVAL; FIRELIGHTERS
- C10L2290/00—Fuel preparation or upgrading, processes or apparatus therefore, comprising specific process steps or apparatus units
- C10L2290/30—Pressing, compressing or compacting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Polymers & Plastics (AREA)
- Nutrition Science (AREA)
- Food Science & Technology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Liquid Carbonaceous Fuels (AREA)
- Solid Fuels And Fuel-Associated Substances (AREA)
- Edible Oils And Fats (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Fats And Perfumes (AREA)
Abstract
오일, 연료, 함유 화학 제품 및 기타 다른 화합물을 재조합 미생물, 예를 들어 오일 함유 미생물 내에서 생산하기 위한 방법 및 조성물, 그리고 이와 같은 미생물을 저비용으로 배양하는 방법이 제공된다. 예를 들어 리파제, 수크로스 운반체, 수크로스 인버타제, 프럭토키나제, 다당류 분해 효소, 케토 아실-ACP 합성 효소, 지방 아실-ACP 티오에스테라제, 지방 아실-CoA/알데하이드 환원 효소, 지방 아실-CoA 환원 효소, 지방 알데하이드 환원 효소, 지방산 하이드록실라제, 불포화 효소, 지방 알데하이드 탈카보틸화 효소 및/또는 아실기 운반 단백질을 암호화하는 외인성 유전자를 함유하는 미세 조류 세포는, 교통 수단의 연료, 예를 들어 재생 디젤, 바이오디젤 및 재생 제트 연료, 그리고 함유 화학 제품, 예를 들어 기능성 유체, 계면 활성제, 비누 및 윤활제를 제조하는데 유용하다.
Description
관련 출원의 상호 참조
본 출원은 35 U.S.C. 119(e)에 따라서 2011년 2월 2일자로 출원된 미국 가출원 제61/438,969호, 2011년 4월 18일자로 출원된 미국 가출원 제61/476,691호, 2011년 5월 10일자로 출원된 미국 가출원 제61/484,458호, 및 2011년 10월 18일자로 출원된 미국 가출원 제61/548,616호의 이익을 주장한다. 이들 각각의 출원은 모든 목적을 위해 본원에 전체가 참조로 포함되어 있다.
서열목록에 대한 참조
본 출원은 상세한 설명의 마지막에 나타낸 서열 목록을 포함한다.
기술분야
본 발명은 미생물로부터 만들어진 오일, 연료 및 함유 화학 제품의 제조에 관한 것이다. 특히, 본원은 오일 함유 미세 조류; 지질, 지방산 에스테르, 지방산, 알데하이드, 알코올 및 알칸을 포함하는 유용한 화합물의 제조를 위해 상기 미세 조류를 배양하는 방법; 및 상기 미세 조류를 유전적으로 변경시켜 제조 효율을 개선시키고 상기 미세 조류에 의해 생성된 오일의 유형과 조성을 변경시키는 방법 및 시약에 관한 것이다.
화석 연료는 썩은 식물 및 동물로부터 형성되어 수억년 이상 동안 지각에서 열 및 압력에 노출됨에 의해 원유, 석탄, 천연 가스 또는 중유로 전환된, 매장된 유기 물질의 연소성 지질학적 퇴적물에 대한 일반적인 용어이다. 화석 연료는 한정된 재생가능하지 않은 자원이다. 세계 경제의 에너지에 대한 수요 증가는 또한 탄화수소 비용에 대한 가중된 압력을 부여하였다. 에너지외에도 플라스틱 및 화학 물질 제조업체를 포함하는 많은 산업은 이들의 제조 공정을 위한 공급원료로서 탄화수소의 유용성에 크게 의존한다. 현재 공급 자원에 대한 비용 효율이 높은 대용물이 에너지 및 이들의 원료 비용에 대한 상승된 압력을 완화시키는데 일조할 수 있었다.
PCT 공개 제2008/151149호는 오일 제조용의 미세 조류를 배양하기 위한 방법 및 재료를 기술하고 있고 특히 미세 조류 클로렐라 프로토테코이데스(Chlorella protothecoides)에 의해 생성된 오일로부터 디젤 연료의 제조를 예시하고 있다. 연료, 화학 물질, 식품 및 기타 다른 용도를 위한 개선된 오일 제조 방법, 특히 단쇄의 길이 및 더 높은 포화도를 갖고 안료를 포함하지 않는 오일을 보다 높은 수율 및 효율로 제조하는 방법이 여전히 요구되고 있다. 본 발명은 상기 필요성을 충족시킨다.
폴리우레탄은 카바메이트(우레탄) 결합을 포함하는 화합물이다. 통상적으로, 폴리우레탄은 유기 단위들로 이루어진 중합체이다. 이 중합체는 이소시아네이트부를 포함하는 제1 유기 단위(C(O)N-R1-NC(O)) 및 하이드록실기를 포함하는 제2 유기 단위(HO-R2-OH)의 반응에 의해 제조된다. 폴리우레탄은 화학식 -[C(O)NH-R1-NHC(O)-O-R2-O]m-(식 중, 아래 첨자 m은 중합체 중에 함유된 단량체의 수를 나타내는 수임)으로서 표시될 수 있다. R1 및 R2는 동일하거나 상이할 수 있지만, 통상적으로는 상이하다. 폴리우레탄은 다수의 상이한 분야, 예를 들어 가요성 재료 및 경직성 재료에 사용된다. 폴리우레탄은 신발, 자동차, 비행기, 부싱(bushing), 개스킷, 접착제, 양탄자, 스판덱스 섬유 및 전자 제품의 하우징 등에 사용된다.
본 발명의 예시적인 구체예는 변경된 글리세로지질 프로필을 생산하는 유지성 세포와, 이 세포로부터 생산되는 생성물을 제공한다. 유지성 세포의 예로서는 제II형 지질 생합성 경로를 가지는 미생물 세포를 포함한다. 구체예는 또한 이 세포를 사용하여 얻을 수 있는 천연 오일을 특징으로 한다. 구체예는 단백질, 예를 들어 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 발현하는 재조합 세포를 포함한다. 본 발명은 또한 상기 세포로부터 생성되는 지질 및 오일계 생성물, 예를 들어 연료, 예를 들어 바이오디젤, 재생 디젤 및 제트 연료, 식품용 오일 및 화학 물질을 제공한다.
제1 양태에서, 본 발명은 C8:0이 3% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 지질 프로필은 C8:0이 12% 이상이다. 몇몇 구체예에서, 세포는 재조합 세포이다. 몇몇 경우에 있어서, 재조합 세포는 사슬 길이가 C8인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 구체예에서, 외인성 유전자는 쿠페아 팔루스트리스(Cuphea palustris) 아실-ACP 티오에스테라제를 암호화한다. 몇몇 경우에 있어서, 세포는 프로토테카(Prototheca) 세포이다. 몇몇 경우에 있어서, 세포는 표 1에 제시된 미세 조류들로부터 선택되는 미세 조류 속 또는 종에 속하는 것이다.
제2 양태에서, 본 발명은 C10:0이 4% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 지질 프로필은 C10:0이 18% 이상이다. 몇몇 경우에 있어서, 지질 프로필은 C10:0이 20% 이상이다. 몇몇 경우에 있어서, 미세 조류 세포의 지질 내용물은 C12:0을 추가로 포함한다. 몇몇 경우에 있어서, C10:0 대 C12:0의 비율은 3:1 이상이다. 몇몇 경우에 있어서, 미세 조류 세포의 지질 내용물은 C14:0을 추가로 포함한다. 몇몇 경우에 있어서, C10:0 대 C14:0의 비율은 10:1 이상이다. 몇몇 구체예에서, 세포는 재조합 세포이다. 몇몇 경우에 있어서, 재조합 세포는 사슬 길이가 C10인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 구체예에서, 외인성 유전자는 쿠페아 후커리아나(Cuphea hookeriana) 및 얼머스 아메리카나(Ulmus americana)로 이루어진 군으로부터 선택되는 종으로부터 유래하는 지방 아실-ACP 티오에스테라제 단백질을 암호화한다. 몇몇 구체예에서, 지방 아실-ACP 티오에스테라제 단백질은 쿠페아 후커리아나 및 얼머스 아메리카나로 이루어진 군으로부터 선택되는 종으로부터 유래한다. 몇몇 경우에 있어서, 지방 아실-ACP 티오에스테라제 유전자는 사슬 길이가 C10인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 쿠페아 후커리아나 및 얼머스 아메리카나로부터 유래하는 지방 아실-ACP 티오에스테라제 유전자로 이루어진 군으로부터 선택된다.
몇몇 경우에 있어서, 세포는 프로토테카 세포이다. 몇몇 구체예에서, 세포는 표 1에 제시된 미세 조류들로부터 선택되는 미세 조류 속 또는 종에 속하는 것이다.
제3 양태에서, 본 발명은 C12:0이 13% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 세포는 재조합 세포이다. 몇몇 구체예에서, 재조합 세포는 사슬 길이가 C12인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 구체예에서, 지방 아실-ACP 티오에스테라제 단백질은 움벨루라리아 캘리포니카(Umbellularia californica) 및 신나모뮴 캠포라(Cinnamomum camphora)로 이루어진 군으로부터 선택되는 종으로부터 유래한다. 몇몇 경우에 있어서, 지방 아실-ACP 티오에스테라제 유전자는 사슬 길이가 C12인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는, 움벨루라리아 캘리포니카 및 신나모뮴 캠포라로부터 유래하는 지방 아실-ACP 티오에스테라제 유전자로 이루어진 군으로부터 선택된다. 몇몇 구체예에서, 세포는 프로토테카 세포이다.
제4 양태에서, 본 발명은 C14:0이 10% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 지질 프로필은 C14:0이 35% 이상이다. 몇몇 경우에 있어서, 미세 조류 세포의 지질 내용물은 C12:0을 추가로 포함한다. 몇몇 경우에 있어서, C14:0 대 C12:0의 비율은 3:1 이상이다. 몇몇 경우에 있어서, 세포는 재조합 세포이다. 몇몇 구체예에서, 재조합 세포는 사슬 길이가 C14인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 구체예에서, 지방 아실-ACP 티오에스테라제 단백질은 신나모뮴 캠포라 및 얼머스 아메리카나로 이루어진 군으로부터 선택되는 종으로부터 유래한다. 몇몇 경우에 있어서, 지방 아실-ACP 티오에스테라제 유전자는 사슬 길이가 C14인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 신나모뮴 캠포라 및 얼머스 아메리카나로부터 유래하는 지방 아실-ACP 티오에스테라제 유전자로 이루어진 군으로부터 선택된다. 몇몇 경우에 있어서, 세포는 프로토테카 세포이다. 몇몇 구체예에서, 세포는 표 1에 제시된 미세 조류들로부터 선택되는 미세 조류 속 또는 종에 속하는 것이다.
제5 양태에서, 본 발명은 C16:0이 15% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 지질 프로필은 C16:0이 39% 이상이다. 몇몇 경우에 있어서, 지질 프로필은 C16:0이 67% 이상이다. 몇몇 경우에 있어서, 세포는 재조합 세포이다. 몇몇 구체예에서, 재조합 세포는 사슬 길이가 C16인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 구체예에서, 지방 아실-ACP 티오에스테라제 단백질은 쿠페아 후커리아나 및 얼머스 아메리카나로부터 선택되는 종으로부터 유래한다. 몇몇 구체예에서, 재조합 세포는 사슬 길이가 C16인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는, 쿠페아 후커리아나 및 얼머스 아메리카나로 이루어진 군으로부터 선택되는 종으로부터 유래하는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 경우에 있어서, 세포는 프로토테카 세포이다. 몇몇 구체예에서, 미세 조류 세포는 내인성 불포화 효소 유전자를 추가로 포함하는데, 여기서 상기 내인성 불포화 효소 유전자는 돌연 변이되지 않은 불포화 효소보다 활성이 작거나 불활성인 불포화 효소를 암호화하도록 돌연 변이되었거나, 또는 상기 내인성 불포화 효소는 미세 조류 세포 게놈으로부터 결실되었다.
제6 양태에서, 본 발명은 지질 프로필이 포화 지방산 60% 이상인 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 미세 조류 세포는 지질 프로필이 포화 지방산 85% 이상이다. 몇몇 경우에 있어서, 세포는 재조합 세포이다. 몇몇 구체예에서, 재조합 세포는 사슬 길이가 C10 내지 C16인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 경우에 있어서, 세포는 프로토테카 세포이다.
제7 양태에서, 본 발명은 C18:0이 19% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 지질 프로필은 C18:0 27% 이상이다. 몇몇 경우에 있어서, 세포는 재조합 세포이다, 몇몇 구체예에서, 재조합 세포는 사슬 길이가 C18인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다. 몇몇 구체예에서, 지방 아실-ACP 티오에스테라제 단백질은 브라시카 나푸스(Brassica napus)로부터 선택되는 종으로부터 유래한다. 몇몇 구체예에서, 재조합 세포는 사슬 길이가 C16인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가지는 브라시카 나푸스로부터 유래하는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함한다.
제8 양태에서, 본 발명은 쿠페아 후커리아나, 움벨루라리아 캘리포니카, 신나모뮴 캠포라, 쿠페아 팔루스트리스, 쿠페아 란세올라타(Cuphea lanceolata), 아이리스 게르마니카(Iris germanica), 미리스티카 프래그란스(Myristica fragrans), 가르시니아 망고스타나(Garcinia mangostana), 엘라에이스 기니엔시스(Elaeis guiniensis), 브라시카 나푸스, 리시누스 커뮤니스(Ricinus communis) 및 얼머스 아메리카나로 이루어진 군으로부터 유래하는 지방 아실-ACP 티오에스테라제 단백질을 암호화하는 외인성 유전자를 포함하는 미세 조류 세포를 제공한다.
제9 양태에서, 본 발명은 발현 구조물을 포함하는 미세 조류 세포를 제공하는데, 여기서 상기 발현 구조물은, 내인성 유전자가 돌연 변이되지 않은 유전자 생성물보다 활성이 작거나 불활성인 유전자 생성물을 암호화하도록 돌연 변이된 것, 내인성 유전자가 미세 조류 세포 게놈으로부터 결실된 것 및 RNA 유도 기작을 통한 것으로 이루어진 방법으로부터 선택된 내인성 유전자의 발현을 하향 조절한다. 몇몇 경우에 있어서, 상기 방법은 RNA 유도 기작, 예를 들어 RNAi, 안티센스 및/또는 dsRNA이다. 몇몇 경우에 있어서, 내인성 유전자는 불포화 효소 유전자이다. 몇몇 구체예에서, 불포화 효소 유전자는 델타 12 지방산 불포화 효소 유전자이다. 몇몇 경우에 있어서, 세포는 프로토테카 세포이다.
제10 양태에서, 본 발명은 상기 양태들 중 임의의 것에 기술된 미세 조류 세포를 제공하는데, 여기서 상기 미세 조류 세포는 탄소원으로서 스타키오스, 라피노스 또는 멜리비오스를 사용하여 배양된다.
제11 양태에서, 본 발명은 지질 프로필이 C18:2 2% 이하인 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 본 발명은 지질 프로필이 C18:2 7% 이하인 미세 조류 세포를 제공한다.
제12 양태에서, 본 발명은 지질을 제조하는 방법을 제공한다. 하나의 구체예에서, 본 발명의 방법은 (a) 세포가 건조 중량으로 지질이 20% 이상일 때까지 상기 논의한 바와 같은 미세 조류 세포를 배양하는 단계; 및 (b) 수용성 바이오매스 성분들로부터 지질을 분리하는 단계를 포함한다.
제13 양태에서, 본 발명은 지질을 제조하는 다른 방법을 제공한다. 하나의 구체예에서, 본 발명의 방법은 (a) 2개의 상이한 아실-ACP 티오에스테라제를 암호화하는 2개의 상이한 외인성 유전자를 함유하는 미세 조류 세포를 배양하는 단계, 및 (b) 수용성 바이오매스 성분들로부터 지질을 분리하는 단계를 포함한다. 몇몇 경우에 있어서, 외인성 유전자들 중 하나 이상은 표 4에 제시된 티오에스테라제로 이루어진 군으로부터 선택되는 지방 아실-ACP 티오에스테라제를 암호화한다.
제14 양태에서, 본 발명은 오일계 생성물을 제조하는 방법을 제공한다. 하나의 구체예에서, 본 발명의 방법은 (a) 세포가 건조 중량으로 지질이 10% 이상일 때까지 상기 논의한 바와 같은 미세 조류 세포를 배양하는 단계; (b) 미세 조류 세포로부터 지질을 분리하는 단계; (c) 지질을 대상으로, 비누화; 복분해; 산 가수 분해; 알칼리 가수 분해; 효소 가수 분해; 촉매 가수 분해; 고온 응축수 가수 분해; 촉매 가수 분해 반응(이 경우, 지질은 글리세롤과 지방산으로 분할됨); 지방 질소 화합물을 생성하는 아민화 반응; 1 염기산 및 2 염기산을 생성하는 오존 분해 반응; 효소 분할 및 가압 분할로 이루어진 군으로부터 선택되는 트리글리세라이드 분할 반응; 가수 분해 반응 이후의 축합 반응; 수소 가공 반응; 수소 가공 반응 및 탈산소화 반응 및/또는 수소 가공 반응 이전 또는 이와 동시에 진행되는 축합 반응; 가스 제거 반응; 수소화 분해 반응, 수소화, 연속적 수소화-수소화 분해 반응, 연속적 수소화 분해-수소화 반응 및 수소화-수소화 분해 복합 반응으로 이루어진 군으로부터 선택되는 탈산소화 반응; 탈산소화 반응 후 축합 반응; 에스테르화 반응; 에스테르 교환 반응; 에스테르 결합 전이 반응; 하이드록실화 반응; 및 하이드록실화 반응 후 축합 반응으로 이루어진 군으로부터 선택되는 하나 이상의 화학 반응을 진행시키는 단계; 그리고 (d) 임의로 기타 다른 성분들로부터 반응 생성물을 분리하여, 오일계 생성물을 제조하는 단계를 포함한다.
몇몇 경우에 있어서, 오일계 생성물은 비누 또는 연료 생성물로부터 선택된다. 몇몇 구체예에서, 오일계 생성물은 바이오디젤, 재생 디젤 및 제트 연료로 이루어진 군으로부터 선택되는 연료 생성물이다. 몇몇 경우에 있어서, 연료 생성물은, (i) 총 카로티노이드 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.05mcg/g 내지 0.244mcg/g; (ii) 라이코펜 0.005mcg/g 미만, 바람직하게는 0.003mcg/g 미만; (iii) 베타 카로틴 0.005mcg/g 미만, 바람직하게는 0.003mcg/g 미만; (iv) 엽록소 A 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.045mcg/g 내지 0.268mcg/g; (v) 감마 토코페롤 35mcg/g 내지 175mcg/g, 바람직하게는 38.3mcg/g 내지 164mcg/g; (vi) 브라시카스테롤, 캄페스테롤, 스티그나스테롤 또는 베타-시토스테롤 0.25% 미만; (vii) 총 토코트리에놀 225mcg/g 내지 350mcg/g, 바람직하게는 249.6mcg/g 내지 325.3mcg/g; (viii) 루테인 0.0025mcg/g 내지 0.05mcg/g, 바람직하게는 0.003mcg/g 내지 0.039mcg/g; 또는 (ix) 토코페롤 50mcg/g 내지 300mcg/g, 바람직하게는 60.8mcg/g 내지 261.7mcg/g의 속성들 중 하나 이상의 속성을 가지는 바이오디젤이다. 몇몇 경우에 있어서, 연료 생성물은 T10 내지 T90이 20℃, 40℃ 또는 60℃ 이상인 재생 디젤이다. 몇몇 경우에 있어서, 연료 생성물은 HRJ-5 및/또는 ASTM 사양 D1655와 부합하는 제트 연료이다.
제15 양태에서, 본 발명은 (a) 지질 프로필이 C8:0 1% 내지 5% 이상, 바람직하게는 3% 이상, C10:0 2.5% 이상, 바람직하게는 4% 이상, C12:0 10% 이상, 바람직하게는 13% 이상, C14:0 10% 이상 및/또는 포화 지방산 60% 이상이고, (b) (i) 총 카로티노이드 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.05mcg/g 내지 0.244mcg/g; (ii) 라이코펜 0.005mcg/g 미만, 바람직하게는 0.003mcg/g 미만; (iii) 베타 카로틴 0.005mcg/g 미만, 바람직하게는 0.003mcg/g 미만; (iv) 엽록소 A 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.045mcg/g 내지 0.268mcg/g; (v) 감마 토코페롤 35mcg/g 내지 175mcg/g, 바람직하게는 38.3mcg/g 내지 164mcg/g; (vi) 브라시카스테롤, 캄페스테롤, 스티그나스테롤 또는 베타-시토스테롤 0.25% 미만; (vii) 총 토코트리에놀 225mcg/g 내지 350mcg/g, 바람직하게는 249.6mcg/g 내지 325.3mcg/g; (viii) 루테인 0.0025 mcg/g 내지 0.05mcg/g, 바람직하게는 0.003mcg/g 내지 0.039mcg/g; 또는 (ix) 토코페롤 50mcg/g 내지 300mcg/g, 바람직하게는 60.8mcg/g 내지 261.7mcg/g의 속성들 중 하나 이상을 포함하는 트리글리세라이드 오일을 제공한다.
제16 양태에서, 본 발명은 C8:C10 지방산 비율이 5:1 이상인 미세 조류로부터 분리된 트리글리세라이드 오일을 제공한다. 몇몇 구체예에서, 트리글리세라이드 오일은 미세 조류 세포(예를 들어, 프로토테카 속에 속하는 미세 조류 세포)로부터 분리되는데, 여기서 상기 미세 조류 세포는 외인성 유전자를 포함한다. 관련 양태에서, 본 발명은 포화 지방산을 60% 이상 포함하는, 미세 조류로부터 분리되는 트리글리세라이드 오일을 제공한다.
다른 관련 양태에서, 본 발명은 C16:14 지방산 비율이 약 2:1인 지질 프로필을 가지는 미세 조류로부터 분리된 트리글리세라이드 오일을 제공한다. 다른 관련 양태에서, 본 발명은 미세 조류 세포에 의해 생산되는 트리글리세라이드 오일을 제공하는데, 여기서 상기 미세 조류 세포는 외인성 유전자를 포함한다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 속에 속하는 것이다.
또 다른 관련 양태에서, 본 발명은 C12:14 지방산 비율이 약 3:1인 지질 프로필을 가지는 미세 조류로부터 분리된 트리글리세라이드 오일을 제공한다. 다른 관련 양태에서, 본 발명은 미세 조류 세포에 의해 생산되는 트리글리세라이드 오일을 제공하는데, 여기서 상기 미세 조류 세포는 외인성 유전자를 포함한다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 속에 속하는 것이다.
제17 양태에서, 본 발명은 (a) C12 미만 지방산이 1% 미만; C14:0 지방산이 1% 내지 10%, 바람직하게는 2% 내지 7%; C16:0 지방산이 20% 내지 35%, 바람직하게는 23% 내지 30%; C18:0 지방산이 5% 내지 20%, 바람직하게는 7% 내지 15%; C18:1 지방산이 35% 내지 60%, 바람직하게는 40% 내지 55%; 그리고 C18:2 지방산이 1% 내지 20%, 바람직하게는 2% 내지 15%인 지질 프로필; 및 (b)(i) 총 카로티노이드 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.05mcg/g 내지 0.244mcg/g; (ii) 라이코펜 0.005mcg/g 미만, 바람직하게는 0.003mcg/g 미만; (iii) 베타 카로틴 0.005mcg/g 미만, 바람직하게는 0.003mcg/g 미만; (iv) 엽록소 A 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.045mcg/g 내지 0.268mcg/g; (v) 감마 토코페롤 35mcg/g 내지 175mcg/g, 바람직하게는 38.3mcg/g 내지 164mcg/g; (vi) 브라시카스테롤, 캄페스테롤, 스티그나스테롤 또는 베타-시토스테롤 0.25% 미만; (vii) 총 토코트리에놀 225mcg/g 내지 350mcg/g, 바람직하게는 249.6mcg/g 내지 325.3mcg/g; (viii) 루테인 0.0025mcg/g 내지 0.05mcg/g, 바람직하게는 0.003mcg/g 내지 0.039mcg/g; 또는 (ix) 토코페롤 50mcg/g 내지 300mcg/g, 바람직하게는 60.8mcg/g 내지 261.7mcg/g의 속성들 중 하나 이상을 가지는 트리글리세라이드 오일을 제공한다.
몇몇 경우에 있어서, 트리글리세라이드 오일은 하나 이상의 외인성 유전자를 포함하는 미생물로부터 분리된다. 몇몇 구체예에서, 하나 이상의 외인성 유전자는 지방 아실-ACP 티오에스테라제를 암호화한다. 몇몇 경우에 있어서, 지방 아실-ACP 티오에스테라제는 사슬 길이가 C14인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가진다. 몇몇 구체예에서, 미생물은 발현 구조물을 추가로 포함하는데, 여기서 상기 발현 구조물은, 내인성 유전자가 돌연 변이되지 않은 유전자 생성물보다 활성이 작거나 불활성인 유전자 생성물을 암호화하도록 돌연 변이된 것, 내인성 유전자가 미세 조류 세포 게놈으로부터 결실된 것 및 RNA 유도 기작을 통한 것으로 이루어진 방법으로부터 선택된 내인성 유전자의 발현을 하향 조절한다. 몇몇 구체예에서, 내인성 유전자는 불포화 효소를 암호화한다. 몇몇 경우에 있어서, 불포화 효소는 스테아로일-아실기 운반 단백질 불포화 효소(SAD) 또는 지방산 불포화 효소(FAD)이다.
제18 양태에서, 본 발명은 C12 미만 지방산이 1% 미만; C14:0 지방산이 2% 내지 7%; C16:0 지방산이 23% 내지 30%; C18:0 지방산이 7% 내지 15%; C18:1 지방산이 40% 내지 55%; 그리고 C18:2 지방산이 2% 내지 15%인 지질 프로필을 포함하는 트리글리세라이드 오일을 제조하는 방법을 제공하는데, 여기서 상기 트리글리세라이드 오일은 하나 이상의 외인성 유전자를 포함하는 미생물로부터 분리된다. 몇몇 경우에 있어서, 트리글리세라이드 오일은 C14:0이 3% 내지 5%; C16:0이 25% 내지 27%; C18:0이 10% 내지 15%; 그리고 C18:1이 40% 내지 45%인 지질 프로필을 포함한다. 몇몇 구체예에서, 하나 이상의 외인성 유전자는 지방 아실-ACP 티오에스테라제를 암호화한다. 몇몇 경우에 있어서, 지방 아실-ACP 티오에스테라제는 사슬 길이가 C14인 지방 아실-ACP 기질에 대해 가수 분해 활성을 가진다.
제19 양태에서, 본 발명은 리시놀레산을 생산하는 미생물 세포를 제공한다. 몇몇 경우에 있어서, 미생물 세포는 미세 조류 세포이다. 몇몇 경우에 있어서, 미생물 세포와 미세 조류 세포는 지방산 하이드록실라제를 암호화하는 외인성 유전자를 포함한다. 몇몇 구체예에서, 지방산 하이드록실라제는 올리에이트 12-하이드록실라제이다. 몇몇 경우에 있어서, 지방산 하이드록실라제는 리시누스 커뮤니스로부터 유래한다. 몇몇 경우에 있어서, 미생물 세포는 프로토테카 속, 예를 들어 프로토테카 모리포르미스(Prototheca moriformis)에 속하는 것이다.
제20 양태에서, 본 발명은 알파-갈락토시다제를 암호화하는 외인성 유전자를 포함하는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 미세 조류 세포는 알파-갈락토시다제를 암호화하는 외인성 유전자를 포함하는데, 여기서 상기 알파-갈락토시다제는 분비된다. 몇몇 구체예에서, 알파-갈락토시다제를 암호화하는 외인성 유전자는 사카로마이세스(Saccharomyces), 아스퍼질러스(Aspergillus) 및 시아몹시스(Cyamopsis)로 이루어진 군으로부터 선택되는 속으로부터 유래한다.
제21 양태에서, 본 발명은, (a) 종속 영양 조건에서 고정 탄소원의 존재 하에 미세 조류 세포를 배양하는 단계로서, 여기서 상기 미세 조류 세포는 알파-갈락토시다제를 암호화하는 외인성 유전자를 포함하고, 상기 고정 탄소원은 라피노스, 스타키오스 및 멜리비오스로 이루어진 군으로부터 선택되는 단계; (b) 지질이 아닌 성분들로부터 지질을 분리하여, 지질 조성물을 제조하는 단계를 포함하는 지질 조성물을 제조하는 방법을 제공한다. 몇몇 경우에 있어서, 미세 조류 세포는 프로토테카 속에 속하는 것이다.
제22 양태에서, 본 발명은 THIC 효소를 암호화하는 외인성 유전자를 포함하는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, THIC 효소는 코코믹사(Coccomyxa), 아라비돕시스(Arabidopsis) 및 시네코시스티스(Synechocystis)로 이루어진 군으로부터 선택되는 속으로부터 유래한다.
다른 양태에서, 본 발명은 THIC 효소를 암호화하는 외인성 유전자를 발현하는 단계를 포함하는, 티아민의 부재 하에 미세 조류 세포를 배양하는 방법을 제공한다. 몇몇 경우에 있어서, THIC 효소는 코코믹사, 아라비돕시스 및 시네코시스티스로 이루어진 군으로부터 선택되는 속으로부터 유래한다.
다른 양태에서, 본 발명은 본원에 기술된 바와 같이 미세 조류 세포를 제공하는데, 여기서 상기 미세 조류 세포는 수크로스 인버타제, 알파-갈락토시다제 및 THIC 효소로 이루어진 군으로부터 선택되는 다른 외인성 유전자를 추가로 포함한다.
본 발명의 다른 양태는 미생물 세포로부터 분리된 하이드록실화 오일을 제공한다. 하나의 양태에서, 하이드록실화 오일은 미생물 세포로부터 분리되며, 여기서 상기 미생물 세포는 미세 조류 세포(예를 들어, 프로토테카 속에 속하는 미세 조류 세포)이다. 추가의 양태에서, 하이드록실화 오일은 프로토테카 모리포르미스 세포로부터 분리된다. 하나의 구체예에서, 하이드록실화 오일은 하이드록실화 트리글리세라이드이다. 하이드록실화 트리글리세라이드는 피마자유와 화학적으로 유사하거나 동일할 수 있다.
본 발명의 추가의 양태는 하이드록실화 지방산이다. 하이드록실화 지방산의 하나의 구체예는 리시놀레산이다.
또 다른 양태에서, 미생물의 하이드록실화 오일 또는 하이드록실화 지방산은 추가로 하이드록실화된다. 리시놀레산이 하이드록실화될 때, 2개의 하이드록실기를 함유하는 지방산이 제공된다.
본 발명의 또 다른 양태는 하이드록실화 오일 및/또는 하이드록실화 지방산과, 이소시아네이트부를 함유하는 화합물을 반응시켜 폴리우레탄을 형성함으로써 제조되는 조성물을 제공한다.
본 발명의 다른 양태는 C18:2가 20% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 미세 조류 세포는 C18:2가 30% 이상인 지질 프로필을 가진다. 몇몇 경우에 있어서, 미세 조류 세포는 C18:2가 40% 이상인 지질 프로필을 가진다. 몇몇 경우에 있어서, 미세 조류 세포는 C18:2가 50% 이상인 지질 프로필을 가진다.
본 발명의 다른 양태는, (a) 배양 배지 중에서 미세 조류 세포를 배양하고, 당 농도를 모니터하는 단계; (b) 배양 배지의 당 농도가 약 1g/l 미만에 이를 때, 배양 배지에 제1 당 용액을 약 2시간 내지 약 24시간 동안 연속 공급율 약 2g/h/l 내지 약 10g/h/l 로 첨가하는 단계; (c) 배양 배지에 제2 당 용액을 첨가하여, 배양 배지의 당 농도를 약 15g/l 내지 약 20g/l로 유지하는 단계; 및 (d) 미세 조류 바이오매스로부터 지질을 분리하는 단계를 포함하는 지질 제조 방법을 제공한다. 몇몇 경우에 있어서, 제1 당 용액은 배양 배지에 공급율 약 4g 수크로스/h/l 내지 약 6g 수크로스/h/l로 첨가된다. 몇몇 경우에 있어서, 제1 당 용액은 배양 배지에 공급율 약 5.25g 수크로스/h/l로 첨가된다. 몇몇 경우에 있어서, 당은 수크로스 또는 글루코스이다.
본 발명의 다른 양태는 C18:3이 10% 이상인 지질 프로필을 가지는 미세 조류 세포를 제공한다. 몇몇 경우에 있어서, 미세 조류 세포는 C18:3이 20% 이상인 지질 프로필을 가진다. 몇몇 경우에 있어서, 미세 조류 세포는 C18:3이 30% 이상인 지질 프로필을 가진다. 몇몇 경우에 있어서, 미세 조류 세포는 C18:3이 40% 이상인 지질 프로필을 가진다. 몇몇 경우에 있어서, 미세 조류 세포는 C18:3이 50% 이상인 지질 프로필을 가진다.
본 발명의 다른 양태는 리놀레산 또는 리놀렌산을 포함하는 트리글리세라이드를 생산하는 미생물을 제공하는데, 여기서 상기 미생물은 β-케토아실-ACP 합성 효소 II(KAS II) 효소를 암호화하는 재조합 핵산을 포함한다. 몇몇 경우에 있어서, 미생물은 스테아로일 ACP 불포화 효소(SAD) 효소를 암호화하는 재조합 핵산을 추가로 포함한다. 몇몇 경우에 있어서, 미생물은 올리에이트 특이적 티오에스테라제 효소를 암호화하는 재조합 핵산을 추가로 포함한다. 몇몇 경우에 있어서, 미생물은 지방산 불포화 효소(FAD) 효소를 암호화하는 재조합 핵산을 추가로 포함한다. 몇몇 경우에 있어서, 미생물은 글리세로지질 불포화 효소를 암호화하는 재조합 핵산을 추가로 포함한다.
상기 논의한 조작 미생물에 있어서, KAS II 효소는 서열 번호 175, 서열 번호 176, 서열 번호 177, 서열 번호 178 및 서열 번호 179로 이루어진 군으로부터 선택되는 아미노산 서열을 포함할 수 있다. 몇몇 경우에 있어서, SAD 효소는 서열 번호 172, 서열 번호 196, 서열 번호 197, 서열 번호 198, 서열 번호 199, 서열 번호 200 및 서열 번호 201로 이루어진 군으로부터 선택되는 아미노산 서열을 포함할 수 있다. 몇몇 경우에 있어서, 올리에이트 특이적 티오에스테라제 효소는 서열 번호 195, 서열 번호 202, 서열 번호 203, 서열 번호 204, 서열 번호 205 및 서열 번호 206으로 이루어진 군으로부터 선택되는 아미노산 서열을 포함할 수 있다. 몇몇 경우에 있어서, FAD 효소는 서열 번호 181, 서열 번호 182, 서열 번호 183, 서열 번호 184 및 서열 번호 185로 이루어진 군으로부터 선택되는 아미노산 서열을 포함할 수 있다. 몇몇 경우에 있어서, FAD 효소는 서열 번호 207, 서열 번호 208, 서열 번호 209, 서열 번호 210, 서열 번호 211 및 서열 번호 212로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 Δ12 FAD 효소이다. 몇몇 경우에 있어서, FAD 효소는 서열 번호 213, 서열 번호 214, 서열 번호 215, 서열 번호 216, 서열 번호 217, 서열 번호 218, 서열 번호 219, 서열 번호 220 및 서열 번호 221로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 Δ15 FAD 효소이다. 몇몇 경우에 있어서, 글리세로지질 불포화 효소는 ω-6 지방산 불포화 효소, ω-3 지방산 불포화 효소 또는 ω-6 올리에이트 불포화 효소다.
상기 논의한 조작 미생물들 중 임의의 하나는 수크로스 이용 경로 효소를 암호화하는 재조합 핵산을 추가로 포함할 수 있다. 몇몇 경우에 있어서, 수크로스 이용 경로 효소는 수크로스 인버타제이다.
상기 논의한 조작 미생물들 중 임의의 하나에 있어서, 미생물은 기타 다른 지방산에 비하여 리놀레산 또는 리놀렌산의 비율이 증가하도록 추가로 조작될 수 있다.
상기 논의한 조작 미생물들 중 임의의 하나에 있어서, 미생물은 C18 기질에 특이적이거나 이 기질을 선호하는 티오에스테라제를 과발현하도록 추가로 조작될 수 있다.
상기 논의한 조작 미생물들 중 임의의 하나에 있어서, 미생물은 C8 내지 C16 기질에 특이적이거나 이 기질을 선호하는 티오에스테라제의 발현이 감소하도록 추가로 조작될 수 있다.
상기 논의한 조작 미생물들 중 임의의 하나에 있어서, 미생물은 미세 조류 세포일 수 있다. 몇몇 경우에 있어서, 미세 조류 세포는 프로토테카 속에 속하는 것이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 모리포르미스 세포이다.
본 발명의 다른 양태는 상기 논의한 조작 미생물들 중 임의의 하나에 의해 생산된 오일을 제공한다.
본 발명의 다른 양태는 재조합 핵산들 중 하나 이상을 미생물에 도입하여 리놀레산 또는 리놀렌산을 포함하는 트리글리세라이드를 생산하게 함으로써, 상기 논의한 조작 미생물들을 제조하는 방법을 제공한다.
본 발명의 다른 양태는 트리아실글리세라이드를 포함하는 천연 오일 또는 천연 오일로부터 생성되는 생성물을 제조하는 방법을 제공하는데, 여기서 이 방법은 (i)(a) β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않거나(여기서, 세포는 임의로 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 유전자의 복사체 2개의 발현을 감소시키거나 이 복사체 2개를 발현하지 않도록 작동 가능한 재조합 핵산을 포함함); 또는 (b) 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자 생성물을 발현하거나; 또는 (c) β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 또는 이 효소를 발현하지 않고, 활성 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하거나; 또는 (d) 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 또는 이 효소를 발현하지 않고, 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 포함하는 세포인, 재조합 미생물의 세포를 배양하는 단계; 그리고 (ii) 세포로부터 천연 오일을 회수하는 단계를 포함하고, 임의로는 식품, 연료 또는 화학 생성물을 생성하기 위하여 천연 오일을 가공하는 단계로서, 천연 오일은 재조합 핵산으로 인하여 변경된 지방산 프로필을 가지는 단계를 추가로 포함한다.
몇몇 경우에 있어서, 미생물은 제II형 지방산 생합성 경로를 통해 지방산을 합성한다. 몇몇 경우에 있어서, 미생물은 미세 조류이다. 몇몇 경우에 있어서, 미세 조류는 절대 종속 영양 생물이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 또는 클로렐라(Chlorella) 종이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 윅커해미(Prototheca wickerhamii), 프로토테카 스태그노라(Prototheca stagnora), 프로토테카 포르토리센시스(Prototheca portoricensis), 프로토테카 모리포르미스 또는 프로토테카 조프피(Prototheca zopfii)이다. 몇몇 경우에 있어서, 미세 조류는 클로렐라 케슬러리(Chlorella kessleri), 클로렐라 루테오비리디스(Chlorella luteoviridis), 클로렐라 프로토테코이데스(Chlorella protothecoides) 또는 클로렐라 불가리스(Chlorella vulgaris)이다. 몇몇 경우에 있어서, 세포는 활성 수크로스 인버타제를 발현하는 재조합 세포이다. 몇몇 경우에 있어서, 배양은 종속 영양 배양이다. 몇몇 경우에 있어서, 지방산 불포화 효소는 ω-6 지방산 불포화 효소, ω-3 지방산 불포화 효소 또는 ω-6 올리에이트 불포화 효소 또는 델타 12 지방산 불포화 효소 중 하나 이상이다. 몇몇 경우에 있어서, 세포는 건조 세포 중량으로 50% 이상, 60% 이상, 70% 이상 또는 50% 내지 90%의 트리글리세라이드를 포함하도록 배양된다. 몇몇 경우에 있어서, 오일은 발색 분자 500ppm, 50ppm 또는 5ppm 미만을 포함한다. 몇몇 경우에 있어서, 재조합 핵산은 안정적으로 통합된다. 몇몇 경우에 있어서, 재조합 핵산은 미생물의 염색체 내에 안정적으로 통합된다. 몇몇 경우에 있어서, 세포는 하나 이상의 선택가능한 마커를 추가로 포함한다.
몇몇 경우에 있어서, 세포는 효소를 암호화하는 유전자 전사체를 표적화하는 안티센스, RNAi 또는 dsRNA의 발현을 통해 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 재조합 핵산을 포함한다. 몇몇 경우에 있어서, β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않는 것은, 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자로 하나 이상의 유전자를 분할(interrupt) 또는 치환하는 것을 원인으로 한다. 몇몇 경우에 있어서, 재조합 세포는 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자를 추가로 포함하여, 리시놀레산을 합성한다. 몇몇 경우에 있어서, 재조합 세포는 KASII 유전자에 의해 암호화되는 β-케토아실-ACP 합성 효소 II의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능하고, 또한 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 세포는 40%, 50%, 60%, 70% 또는 80% 이상의 C16 지방산을 가지는 것을 특징으로 하는 지방산 프로필을 나타내는 오일을 생산한다. 몇몇 경우에 있어서, 세포는 C16:0이 50% 내지 75% 이상인 것을 특징으로 하는 지방산 프로필을 가지는 오일을 생산한다. 몇몇 경우에 있어서, 세포는 C18:1이 20% 내지 40% 이상인 것을 추가의 특징으로 하는 지방산 프로필을 가지는 오일을 생산한다. 몇몇 경우에 있어서, 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자는 C8 내지 C16 지방 아실 사슬의 가수 분해 활성이 세포의 천연 아실-ACP 티오에스테라제보다 큰 활성 아실-ACP 티오에스테라제를 생산한다. 몇몇 경우에 있어서, 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자는 KASII 유전자를 분할한다. 몇몇 경우에 있어서, 재조합 세포는 β-케토아실-ACP 합성 효소 I을 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 핵산을 포함한다.
몇몇 경우에 있어서, 생산된 오일은 재조합 핵산으로 인하여 평균 지방산 사슬 길이가 더 짧은 것을 특징으로 하는 지방산 프로필을 가진다. 몇몇 경우에 있어서, 재조합 세포는 하나 이상의 FAD 유전자에 의해 암호화되는 지방산 불포화 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능하며, 활성 스테아로일 ACP 불포화 효소를 암호화하는 스테아로일-ACP 불포화 효소 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 핵산은 지방산 불포화 효소 유전자의 복사체 다수 개에 의해 암호화되는 지방산 불포화 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능하다. 몇몇 경우에 있어서, 스테아로일-ACP 불포화 효소 외인성 유전자는 지방산 불포화 효소 유전자의 암호화 영역 내 위치에 재조합된다. 몇몇 경우에 있어서, 생산된 오일은 올레산이 증가한 지방산 프로필을 가진다. 몇몇 경우에 있어서, 올레산은 지방산의 50%, 60%, 70%, 80% 또는 90% 이상을 포함한다. 몇몇 경우에 있어서, 재조합 세포는 활성 β-케토아실-ACP 합성 효소 II를 암호화하는 β-케토아실-ACP 합성 효소 II 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 생산된 오일은 재조합 핵산으로 인하여 C18:1 지방산이 증가하였고, C16 지방산은 감소한 지방산 프로필을 특징으로 한다. 몇몇 경우에 있어서, 재조합 세포는 RNA 간섭에 의해 스테아로일-ACP 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 생산된 오일은 C18:0 지방산이 증가한 것을 특징으로 하는 지방산 프로필을 가진다. 몇몇 경우에 있어서, 생산된 오일은 C18:0이 50%, 60%, 70%, 80% 또는 90% 이상인 지방산 프로필을 특징으로 한다. 몇몇 경우에 있어서, 생산된 오일은 C18:0이 50% 내지 70% 이상인 지방산 프로필을 특징으로 한다. 몇몇 경우에 있어서, 생산된 오일은 C18:1이 20% 내지 40% 이상인 지방산 프로필을 추가의 특징으로 한다. 몇몇 경우에 있어서, 세포는 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 유전자의 복사체 2개의 발현을 감소시키거나 이 복사체 2개를 발현하지 않도록 작동 가능한 재조합 핵산을 포함한다. 몇몇 경우에 있어서, 핵산은 활성 ω-3 지방산 불포화 효소 및/또는 ω-6 올리에이트 불포화 효소를 암호화하는 지방산 불포화 효소 외인성 유전자의 생성물을 발현하도록 작동 가능하다. 몇몇 경우에 있어서, 생산된 오일은 리놀레산, 리놀렌산 또는 이것들 둘 다의 수준이 상승한 것을 특징으로 하는 지방산 프로필을 가진다. 몇몇 경우에 있어서, 오일의 지방산 프로필은 리놀레산, 리놀렌산 또는 이것들 둘 다가 10%, 20%, 30%, 40% 또는 50% 이상인 것을 특징으로 한다. 몇몇 경우에 있어서, 오일의 추가 가공으로서는 정제, 표백, 탈취, 복분해, 에스테르 결합 전이, 수소화, 가수 분해, 수소화, 탈산소화, 수소 크래킹, 이성체화, 하이드록실화, 에스테르 교환, 아미드화, 설폰화 및 가황 처리 중 하나 이상을 포함한다. 몇몇 경우에 있어서, 오일은 식품용 오일, 지방산, 지방 알코올, 윤활제, 비누, 지방산 에스테르, 지방산 에톡실레이트, 지방 아민, 알킬 클로라이드, 지방 알코올 에톡실레이트, 지방 알코올 설페이트, 지방산 알카놀아미드, 설폰화된 오일, 가황 오일, 디젤 연료, 제트 연료, 가솔린, 연료 블렌드스톡(fuel blendstock), 연료 첨가제, 윤활제 첨가제 또는 코팅제를 형성하도록 가공된다.
본 발명의 다른 양태는 상기 논의한 방법에 의해 얻을 수 있는 천연 오일을 제공한다.
본 발명의 다른 양태는 상기 논의한 천연 오일로부터 제조된 생성물을 제공한다. 몇몇 경우에 있어서, 생성물은 식품용 오일, 지방산, 지방 알코올, 윤활제, 비누, 지방산 에스테르, 지방산 에톡실레이트, 지방 아민, 알킬 클로라이드, 지방 알코올 에톡실레이트, 지방 알코올 설페이트, 지방산 알카놀아미드, 설폰화 오일, 가황 오일, 디젤 연료, 제트 연료, 가솔린, 연료 블렌드스톡, 연료 첨가제, 화학 첨가제 또는 코팅제를 포함한다.
본 발명의 다른 양태는 (a) β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않거나(여기서, 세포는 임의로 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 유전자의 복사체 2개의 발현을 감소시키거나 이 복사체 2개를 발현하지 않도록 작동 가능한 재조합 핵산을 포함함); 또는 (b) 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자 생성물을 발현하거나; 또는 (c) β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 또는 이것을 발현하지 않고, 활성 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하거나; 또는 (d) 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않고, 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 포함하는 재조합 세포를 제공한다.
몇몇 경우에 있어서, 미생물은 제II형 지방산 생합성 경로를 통해 지방산을 합성한다. 몇몇 경우에 있어서, 미생물은 미세 조류이다. 몇몇 경우에 있어서, 미세 조류는 절대 종속 영양 생물이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 또는 클로렐라 종이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 윅커해미, 프로토테카 스태그노라, 프로토테카 포르토리센시스, 프로토테카 모리포르미스 또는 프로토테카 조프피이다. 몇몇 경우에 있어서, 미세 조류는 클로렐라 케슬러리, 클로렐라 루테오비리디스, 클로렐라 프로토테코이데스 또는 클로렐라 불가리스이다. 몇몇 경우에 있어서, 세포는 활성 수크로스 인버타제를 발현하는 재조합 세포이다. 몇몇 경우에 있어서, 세포는 종속 영양 생장을 할 수 있다. 몇몇 경우에 있어서, 지방산 불포화 효소는 ω-6 지방산 불포화 효소, ω-3 지방산 불포화 효소 또는 ω-6 올리에이트 불포화 효소 또는 델타 12 지방산 불포화 효소 중 하나 이상이다. 몇몇 경우에 있어서, 세포는 건조 세포 중량을 기준으로 50% 이상, 60% 이상, 70% 이상 또는 50% 내지 90%의 트리글리세라이드를 포함하도록 배양될 수 있다. 몇몇 경우에 있어서, 재조합 핵산은 안정적으로 통합된다. 몇몇 경우에 있어서, 재조합 핵산은 미생물의 염색체 내에 안정적으로 통합된다. 몇몇 경우에 있어서, 세포는 하나 이상의 선택가능한 마커를 추가로 포함한다. 몇몇 경우에 있어서, 세포는 효소를 암호화하는 유전자 전사체를 표적화하는 안티센스, RNAi 또는 dsRNA의 발현을 통해 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 재조합 핵산을 포함한다. 몇몇 경우에 있어서, β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않는 것은, 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자로 하나 이상의 유전자를 분할 또는 치환하는 것을 원인으로 한다.
몇몇 경우에 있어서, 재조합 세포는 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자를 추가로 포함하여, 리시놀레산을 합성한다. 몇몇 경우에 있어서, 재조합 세포는 KASII 유전자에 의해 암호화되는 β-케토아실-ACP 합성 효소 II의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능하고, 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 세포는 C16 지방산이 40%, 50%, 60%, 70% 또는 80% 이상인 것을 특징으로 하는 지방산 프로필을 가지는 오일을 생산한다. 몇몇 경우에 있어서, 세포는 C16:0이 50% 내지 75% 이상인 것을 특징으로 하는 지방산 프로필을 가지는 오일을 생산한다. 몇몇 경우에 있어서, 세포는 C18:1이 20% 내지 40% 이상인 것을 추가의 특징으로 하는 지방산 프로필을 가지는 오일을 생산한다. 몇몇 경우에 있어서, 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자는 C8 내지 C16 지방 아실 사슬의 가수 분해 활성이 세포의 천연 아실-ACP 티오에스테라제보다 큰 활성 아실-ACP 티오에스테라제를 생산한다. 몇몇 경우에 있어서, 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자는 KASII 유전자를 분할한다. 몇몇 경우에 있어서, 재조합 세포는 β-케토아실-ACP 합성 효소 I을 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 생산된 오일은 재조합 핵산으로 인하여 평균 지방산 사슬 길이가 더 짧은 것을 특징으로 하는 지방산 프로필을 가진다. 몇몇 경우에 있어서, 재조합 세포는 하나 이상의 FAD 유전자에 의해 암호화되는 지방산 불포화 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능하며, 활성 스테아로일 ACP 불포화 효소를 암호화하는 스테아로일-ACP 불포화 효소 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 핵산은 지방산 불포화 효소 유전자의 복사체 다수 개에 의해 암호화되는 지방산 불포화 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능하다. 몇몇 경우에 있어서, 스테아로일-ACP 불포화 효소 외인성 유전자는 지방산 불포화 효소 유전자의 암호화 영역 내 위치에 재조합된다.
몇몇 경우에 있어서, 생산된 오일은 올레산이 증가한 지방산 프로필을 가진다. 몇몇 경우에 있어서, 올레산은 지방산의 50%, 60%, 70%, 80% 또는 90% 이상을 포함한다. 몇몇 경우에 있어서, 재조합 세포는 활성 β-케토아실-ACP 합성 효소 II를 암호화하는 β-케토아실-ACP 합성 효소 II 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 생산된 오일은 재조합 핵산으로 인하여 C18:1 지방산이 증가하였고, C16 지방산은 감소한 지방산 프로필을 특징으로 한다. 몇몇 경우에 있어서, 재조합 세포는 RNA 간섭에 의해 스테아로일 ACP 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 핵산을 포함한다. 몇몇 경우에 있어서, 생산된 오일은 C18:0 지방산이 증가한 것을 특징으로 하는 지방산 프로필을 가진다. 몇몇 경우에 있어서, 생산된 오일은 C18:0이 50%, 60%, 70%, 80% 또는 90% 이상인 지방산 프로필을 특징으로 한다. 몇몇 경우에 있어서, 생산된 오일은 C18:0이 50% 내지 75% 이상인 지방산 프로필을 특징으로 한다. 몇몇 경우에 있어서, 생산된 오일은 C18:1이 20% 내지 40% 이상인 지방산 프로필을 추가의 특징으로 한다. 몇몇 경우에 있어서, 세포는 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 유전자의 복사체 2개의 발현을 감소시키거나 이 복사체 2개를 발현하지 않도록 작동 가능한 재조합 핵산을 포함한다. 몇몇 경우에 있어서, 핵산은 활성 ω-3 지방산 불포화 효소 및/또는 ω-6 올리에이트 불포화 효소를 암호화하는 지방산 불포화 효소 외인성 유전자의 생성물을 발현하도록 작동 가능하다. 몇몇 경우에 있어서, 생산된 오일은 리놀레산, 리놀렌산 또는 이것들 둘 다의 수준이 상승한 것을 특징으로 하는 지방산 프로필을 가진다. 몇몇 경우에 있어서, 오일의 지방산 프로필은 리놀레산, 리놀렌산 또는 이것들 둘 다가 10%, 20%, 30%, 40% 또는 50% 이상인 것을 특징으로 한다.
본 발명의 다른 양태는 전술한 세포로부터 생산된 오일 함유 생성물 또는 천연 오일을 제공한다.
본 발명의 다른 양태는 리시놀레산을 포함하는 트리아실글리세라이드를 포함하는 천연 오일, 또는 천연 오일로부터 생산되는 생성물을 제조하는 방법을 제공하는데, 이 방법은 재조합 미생물의 세포를 배양하는 단계를 포함하며, 이 세포는 활성 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자의 생성물을 발현하여 리시놀레산을 합성하도록 작동 가능한 재조합 핵산을 포함한다.
몇몇 경우에 있어서, 미생물은 제II형 지방산 생합성 경로를 가진다. 몇몇 경우에 있어서, 미생물은 미세 조류이다. 몇몇 경우에 있어서, 미세 조류는 절대 종속 영양 생물이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 종이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 윅커해미, 프로토테카 스태그노라, 프로토테카 포르토리센시스, 프로토테카 모리포르미스 또는 프로토테카 조프피이다. 몇몇 경우에 있어서, 미세 조류는 클로렐라 케슬러리, 클로렐라 루테오비리디스, 클로렐라 프로토테코이데스 또는 클로렐라 불가리스이다. 몇몇 경우에 있어서, 세포는 활성 수크로스 인버타제를 발현하는 재조합 세포이다. 몇몇 경우에 있어서, 배양은 종속 영양 배양이다. 몇몇 경우에 있어서, 활성 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 가지지 않는 세포는 올레산을 40%, 50%, 60%, 70%, 80% 또는 90% 이상 생산한다. 몇몇 경우에 있어서, 세포는 올레산 생산을 증강하여 올리에이트 12-하이드록실라제에 대한 기질 수준을 상승시키도록 작동 가능한 재조합 핵산을 추가로 포함한다. 몇몇 경우에 있어서, 세포는 (a) 활성 스테아로일 ACP 불포화 효소를 암호화하는 외인성 유전자의 생성물을 발현하고, 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않거나; 또는 (b) 활성 β-케토아실-ACP 합성 효소 I을 암호화하는 외인성 유전자의 생성물을 발현하고, 활성 아실-ACP 티오에스테라제를 암호하하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 포함한다.
본 발명의 다른 양태는 상기 논의한 방법들 중 임의의 것에 의하여 생산된 생성물을 제공한다.
본 발명의 다른 양태는 활성 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자의 생성물을 발현하여 리시놀레산을 합성하도록 작동 가능한 재조합 핵산을 포함하는 미생물 세포를 제공한다.
몇몇 경우에 있어서, 미생물은 제II형 지방산 생합성 경로를 가진다. 몇몇 경우에 있어서, 미생물은 미세 조류이다. 몇몇 경우에 있어서, 미세 조류는 절대 종속 영양 생물이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 종이다. 몇몇 경우에 있어서, 미세 조류는 프로토테카 윅커해미, 프로토테카 스태그노라, 프로토테카 포르토리센시스, 프로토테카 모리포르미스 또는 프로토테카 조프피이다. 몇몇 경우에 있어서, 미세 조류는 클로렐라 케슬러리, 클로렐라 루테오비리디스, 클로렐라 프로토테코이데스 또는 클로렐라 불가리스이다. 몇몇 경우에 있어서, 세포는 활성 수크로스 인버타제를 발현하는 재조합 세포이다. 몇몇 경우에 있어서, 세포는 종속 영양 생장을 할 수 있다. 몇몇 경우에 있어서, 활성 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 가지지 않는 세포는 올레산을 40%, 50%, 60%, 70%, 80% 또는 90% 이상 생산한다. 몇몇 경우에 있어서, 세포는 올레산 생산을 증강하여 올리에이트 12-하이드록실라제에 대한 기질의 수준을 상승시키도록 작동 가능한 재조합 핵산을 추가로 포함한다. 몇몇 경우에 있어서, 세포는 (a) 활성 스테아로일 ACP 불포화 효소를 암호화하는 외인성 유전자의 생성물을 발현하고, 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않거나; 또는 (b) 활성 β-케토아실-ACP 합성 효소 I을 암호화하는 외인성 유전자의 생성물을 발현하고, 활성 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 포함한다.
본 발명의 다른 양태는 상기 논의한 오일을 포함하는 식품을 제공한다.
본 발명의 이와 같은 양태와 다른 양태, 그리고 구체예는 첨부된 도면, 바로 다음에 기술된 도면의 간단한 설명, 이하 본 발명의 상세한 설명에 기술되어 있으며, 이하 실시예에 예시되어 있다. 상기 및 본원의 명세서 전반에 걸쳐 논의되어 있는 특징들 중 임의의 것 또는 모두는 본 발명의 다양한 구체예에서 조합될 수 있다.
도 1은 프로토테카 트리글리세라이드 오일로부터 생산된 재생 디젤의 크로마토그램을 나타낸다.
도 2는 리시놀레산 표준 및 야생형 대조군과 비교하여, 대표적인 양성 유전자 이식 클론의 GC 정체 시간을 나타낸다.
도 3은 실시예 18에 기술한 바와 같이 표적화 유전자가 파괴된 프로토테카 모리포르미스 FADc 대립 유전자 및 표적화 유전자가 파괴되지 않은 프로토테카 모리포르미스 FADc 대립 유전자의 PstI 제한 맵을 나타낸다.
도 4는 실시예 18에 기술된 서던 블럿의 결과들을 나타낸다.
도 2는 리시놀레산 표준 및 야생형 대조군과 비교하여, 대표적인 양성 유전자 이식 클론의 GC 정체 시간을 나타낸다.
도 3은 실시예 18에 기술한 바와 같이 표적화 유전자가 파괴된 프로토테카 모리포르미스 FADc 대립 유전자 및 표적화 유전자가 파괴되지 않은 프로토테카 모리포르미스 FADc 대립 유전자의 PstI 제한 맵을 나타낸다.
도 4는 실시예 18에 기술된 서던 블럿의 결과들을 나타낸다.
본 발명의 예시적인 구체예는 변경된 글리세로지질 프로필을 생산하는 유지성 세포와, 이 세포로부터 생산되는 생성물을 특징으로 한다. 유지성 세포의 예로서는 제II형 지질 생합성 경로를 가지는 미생물 세포를 포함한다. 구체예는 단백질, 예를 들어 지방 아실-ACP 티오에스테라제, 지방산 불포화 효소, 케토-아실 합성 효소를 암호화하는 하나 이상의 외인성 유전자를 발현하고, 임의로는 유사한 활성을 가지는 단백질을 암호화하는 하나 이상의 내인성 유전자가 녹다운된 재조합 세포를 포함한다. 결과적으로, 몇몇 구체예는 이전에는 결코 얻을 수 없었던 천연 오일을 특징으로 한다. 본 발명은 또한 상기 세포로부터 지질 및 오일계 생성물, 예를 들어 연료, 예를 들어 바이오디젤, 재생 디젤 및 제트 연료, 식품용 오일 및 화학 물질을 제조하는 방법을 제공한다.
본 발명의 구체예에 의하여 생산된 오일은 여러 분야들 중 교통 수단 연료, 함유 화학 제품 및/또는 식품과 화장품 산업에서 사용될 수 있다. 예를 들어 지질의 에스테르 결합 전이 반응으로 바이오디젤로서 유용한 장쇄 지방산 에스테르가 생성될 수 있다. 기타 다른 효소 및 화학 공정은 지방산, 알데하이드, 알코올, 알칸 및 알켄을 생성하도록 조작될 수 있다. 몇몇 분야에 있어서, 재생 디젤, 제트 연료 또는 기타 다른 탄화수소 화합물이 생산된다. 본 발명은 또한 지질 생산성과 수율을 증가시키고/증가시키거나, 본원에 기술된 조성물을 더욱 비용 효율적으로 생산하기 위하여 미세 조류를 배양하는 방법도 제공한다.
본 발명의 하나의 구체예는 트리글리세라이드를 포함하는 천연 오일을 생산하거나, 또는 천연 오일로부터 생산되는 생성물을 생산하는 방법을 제공한다. 천연 오일은 식물성 오일이 아니거나 종자로부터 유래하는 오일이 아닐 수 있다. 본 발명의 방법은 맞춤 오일, 즉 세포 내 재조합 핵산이 존재함으로 인하여 변경된 지방산 프로필을 가지는 오일을 생산하도록 재조합 미생물의 세포를 배양하는 단계를 포함한다. 이후, 천연 오일은 추가로 가공되어, 식품, 연료 또는 화학 생성물로 생산될 수 있다. 세포 내 재조합 핵산은 (a) β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않거나(여기서, 세포는 임의로 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 유전자의 복사체 2개(즉 이배체 유기체의 대립 유전자 2개)의 발현을 감소시키거나 이 복사체 2개를 발현하지 않도록 작동 가능한 재조합 핵산을 포함함); 또는 (b) 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하거나; 또는 (c) β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않고, 활성 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하거나; 또는 (d) 스테아로일 ACP 불호화 효소 또는 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않고, 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II 또는 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능하다.
하나 이상의 지방산 불포화 효소를 암호화하는 재조합 핵산이 세포 내에 존재할 경우, 핵산은 ω-6 지방산 불포화 효소, ω-3 지방산 불포화 효소 또는 ω-6 올리에이트 불포화 효소 또는 델타 12 지방산 불포화 효소 중 하나 이상을 암호화할 수 있다.
세포가 효소의 발현을 감소시키거나 효소를 발현하지 않도록 작동 가능한 재조합 핵산을 포함할 경우, 이와 같이 효소의 발현을 감소시키거나 효소를 발현하지 않도록 하는 것은, 효소를 암호화하는 유전자 전사체를 표적화하는 안티센스, RNAi 또는 dsRNA의 발현을 통해 이루어질 수 있거나, 또는 기타 다른 적당한 수단, 예를 들어 유도적 돌연 변이, 완전 결실 또는 부분 결실에 의해 이루어질 수 있다. 따라서, β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소의 발현을 지지(alimentation)하는 것은, 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자로 하나 이상의 유전자를 분할 또는 치환하는 것을 원인으로 한다.
바람직하게, 재조합 핵산은 세포, 예를 들어 세포 염색체 또는 에피좀 내에 안정적으로 통합된다. 핵산이 안정적으로 통합된 세포의 선택은, 본원에 기술된 바와 같이 선택가능한 마커, 예를 들어 수크로스 인버타제, 항생제 저항성 유전자 또는 티아민 영양 요구성 보완을 이용하여 도움받을 수 있다.
바람직하게, 미생물은 제II형 지방산 생합성 경로를 통해 지방산을 합성하는 것일 수 있다. 예를 들어 미생물은 미세 조류일 수 있으나, 또는 보통 제I형 지방산 생합성 경로를 가지는 것으로서, 유전자 조작 기술을 이용하여 제II형 유전 기구가 도입된 미생물(예를 들어, 오일 생산 효모)일 수도 있다. 미생물은 종속 영양 생물일 수 있으며, 특정 구체예에서 절대 종속 영양 생물일 수 있다. 미세 조류가 사용되는 경우, 이 미세 조류는 프로토테카 또는 클로렐라 종일 수 있다. 예시적 종으로서는 프로토테카 윅커해미, 프로토테카 스태그노라, 프로토테카 포르토리센시스, 프로토테카 모리포르미스, 프로토테카 조프피, 클로렐라 케슬러리, 클로렐라 루테오비리디스, 클로렐라 프로토테코이데스 및 클로렐라 불가리스를 포함한다. 수크로스 공급원료, 예를 들어 사탕수수 즙과 기타 다른 본원에 기술된 것들을 사용할 수 있도록 하기 위해서, 재조합 세포는 수크로스 인버타제 유전자를 포함하여 활성 수크로스 인버타제를 발현하는 재조합 핵산을 포함할 수 있다. 수크로스 인버타제는 미생물에 의해 배지에 분비될 수 있다.
배양은, 예를 들어 고정 탄소원, 예를 들어 글루코스나 수크로스를 사용하는 생물 반응기 내에서 수행되는 종속 영양 배양일 수 있다. 배양은, 세포 중 트리글리세라이드가 건조 세포 중량으로 50% 이상, 60% 이상, 70% 이상, 또는 50% 내지 90%가 될 때까지 지속될 수 있다. 이는 다음에 기술된 바와 같이 질소를 제한하면서 배양하는 것을 수반할 수 있다.
세포에 의해 생산된 오일은 세포로부터 추출될 수 있다. 하나의 구체예에서, 오일은 발색 분자 500ppm, 50ppm 또는 5ppm 미만을 포함한다. 임의로 오일은, 예를 들어 LC-MS에 의해 자체의 지방산 프로필에 대해 분석될 수 있다. 오일은 또한 실시예 19의 표 60 내지 표 63의 오일의 특성들 중 하나 이상을 가질 수도 있다.
특정 구체예에서, 재조합 세포는 KASII 유전자에 의해 암호화되는 β-케토아실-ACP 합성 효소 II의 발현을 감소시키거나 이 효소를 발현하지 않고, 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 결과적으로, 세포는 C16 지방산이 40%, 50%, 60% 또는 70% 이상인 것(예를 들어, 팔미트산)을 특징으로 하는 지방산 프로필을 가지는 오일을 생산할 수 있다. 따라서, 오일은 길이가 더 단쇄 방향으로 옮겨진 지방산 분포를 가질 수 있다. 지방산 분포의 변화는 평균 지방산 길이의 감소 또는 기타 다른 분포와 관련된 통계학적 특징에 의해 특징지어질 수 있다. 예를 들어 평균 지방산 길이를 산정하기 위해서, 트리글리세라이드를 구성하는 각각의 검출 가능 지방산의 백분율은 지방산 내 탄소의 수로 곱하여 지고, 이 곱의 합은 100으로 나누어진다. 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자는 C8 내지 C16 지방 아실 사슬의 가수 분해 활성이 세포의 천연 아실-ACP-티오에스테라제보다 큰 활성 아실-ACP 티오에스테라제를 생산할 수 있다. 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자는 KASII 유전자를 분할할 수 있다. 이러한 방식으로, 아실-ACP 티오에스테라제의 삽입은 또한 β-케토아실-ACP 합성 효소 II의 발현을 하나의 단계로 억제할 수도 있다. 실시예 15 및 16을 참조한다.
다른 특정 구체예에서, 재조합 세포는 β-케토아실-ACP 합성 효소 I을 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 핵산을 포함한다. 결과적으로, 생산된 오일은 재조합 핵산이 결여된 비교 대상 세포보다 짧은 지방산 사슬 길이의 분포를 특징으로 하는 지방산 프로필을 가진다. 이와 같은 특징은 평균 지방산 사슬 길이가 감소한 것으로서 표현될 수 있다. 재조합 세포는 하나 이상의 FAD 유전자에 의해 암호화되는 지방산 불포화 효소의 발현을 감소시키거나 이 효소를 발현하지 않으며, 활성 스테아로일 ACP 불포화 효소를 암호화하는 스테아로일-ACP 불포화 효소 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함할 수 있다. 임의로, 핵산은 지방산 불포화 효소 유전자의 복사체(예를 들어, 대립 유전자) 다수 개에 의해 암호화되는 지방산 불포화 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능하다. 특정 구체예에서, 스테아로일-ACP 불포화 효소 외인성 유전자는 지방산 불포화 효소 유전자의 암호화 영역 내 위치에 재조합된다. 결과적으로, 생산된 오일은 핵산이 결여된 비교 대상 세포에 의해 생산된 오일에 비하여 올레산 수준이 상승할 수 있다. 올레산은 지방산 프로필에 있어서 지방산의 50%, 60%, 70%, 80% 또는 90% 이상을 포함한다. 실시예 10을 참조한다.
다른 특정 구체예에서, 재조합 세포는 활성 β-케토아실-ACP 합성 효소 II를 암호화하는 β-케토아실-ACP 합성 효소 II 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함한다. 결과적으로, 생산된 오일은 재조합 핵산으로 인하여 C18:1 지방산은 상승하고, C16 지방산은 감소하는 지방산 프로필을 특징으로 할 수 있다. KASII 유전자의 과발현으로 비 형질 전환 세포 내 C18 지방산의 백분율이 약 68%에서 약 84%까지 증가된 실시예 13을 참조한다. 관련 구체예에서, 증가율은 70% 이상, 75% 내지 85% 또는 70% 내지 90%이다.
다른 특정 구체예에서, 재조합 세포는 RNA 간섭에 의해 스테아로일 ACP 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않도록 작동 가능한 핵산을 포함한다. 결과적으로, 생산된 오일은 C18:0 지방산이 증가한 것을 특징으로 하는 지방산 프로필을 가질 수 있다. C18:0 지방산은 프로필에 있어서 지방산의 50%, 60%, 70%, 80% 또는 90% 이상일 수 있다. 실시예 12를 참조한다.
다른 특정 구체예에서, 세포는 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소 또는 지방산 불포화 효소를 암호화하는 유전자의 복사체 2개(예를 들어, 2개의 대립 유전자)의 발현을 감소시키거나 이 유전자의 복사체를 발현하지 않도록 작동 가능한 재조합 핵산을 포함한다. 내인성 KASI 대립 유전자가 프로토테카 내에서 녹아웃된 실시예 14를 참조한다. 결과적으로, 증가율은 내인성 KASI의 파괴로 인하여 총 C14 지방산 백분율이 약 35%에서 400%까지이고, C16 지방산 백분율이 약 30%에서 50%까지인 것으로 관찰되었다.
다른 특정 구체예에서, 세포는 활성 ω-3 지방산 불포화 효소 및/또는 ω-6 올리에이트 불포화 효소를 암호화하는 지방산 불포화 효소 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 포함한다. 결과적으로, 리놀레산, 리놀렌산 또는 이것들 둘 다의 수준의 상승은 상기 세포에 의해 생성되고, 세포 지질의 지방산 프로필을 통하여 확인될 수 있다. 예를 들어 세포는 리놀레산, 리놀렌산 또는 이것들 둘 다를 10%, 20%, 30%, 40% 또는 50% 이상 가질 수 있다. 예를 들어 재조합 Δ15 불포화 효소는 실시예 11에서와 같이 발현될 수 있다. 결과적으로, C18:3 지방산(즉 리놀렌산)은 약 2배 내지 17배, 또는 그 이상 증가할 수 있다.
다른 구체예에서, 재조합 미생물의 세포가 배양된다. 세포는 활성 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자의 생성물을 발현하여 리시놀레산을 합성하도록 작동하는 재조합 핵산을 포함한다. 이 유전자는 상기 언급한 구체예들 중 임의의 것에 존재할 수 있다. 실시예 7을 참조한다. 12-하이드록실라제에 바람직한 기질은 올레산이다, 따라서, 바람직한 구체예에서, 올레산 생산을 증가시키도록 작동하는 재조합 핵산을 세포 내에 포함시킴으로써 리시놀레산을 고수율로 얻을 수 있다. 제한하는 것은 아니지만, 세포는 활성 스테아로일 ACP 불포화 효소를 암호화하는 외인성 유전자의 생성물을 발현하고, 지방산 불포화 효소를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현을 감소시키거나 이 효소를 발현하지 않거나; 또는 활성 β-케토아실-ACP 합성 효소 I을 암호화하는 외인성 유전자의 생성물을 발현하고, 활성 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 재조합 핵산을 포함한다.
본 발명의 구체예들 중 임의의 것에 따르면, 오일은 정제, 표백, 탈취, 복분해, 에스테르 결합 전이, 수소화, 가수 분해, 탈산소화, 수소 크래킹, 이성체화, 하이드록실화, 에스테르 교환, 아미드화, 설폰화 및 가황 처리 중 하나 이상에 의해 추출 및 추가 가공될 수 있다. 오일은, 예를 들어 식품용 오일, 지방산, 지방 알코올, 윤활제, 비누, 지방산 에스테르, 지방산 에톡실레이트, 지방 아민, 알킬 클로라이드, 지방 알코올 에톡실레이트, 지방 알코올 설페이트, 지방산 알카놀아미드, 설폰화된 오일, 가황 오일, 디젤, 제트, 가솔린, 블렌드스톡, 첨가제, 윤활제 또는 페인트를 형성하도록 가공될 수 있다.
본원에 언급된 구체예들 중 임의의 것은 식품 또는 식품용 오일로서 유용할 수 있다. 전 유기체가 식품에 혼입될 수 있다. 유기체는 가공되지 않은 것, 일부가 용해된 것, 대부분이 용해된 것 또는 전체적으로 용해된 것일 수 있다. 식품 중 유지성 유기체를 제조 및 사용하는 방법은 WO2011/150411호, WO2010/12093호, WO2011/130578호 및 WO2011/130576호에 교시되어 있다. 대안적으로, 유기체로부터 추출된 오일 및 임의로 정제된 오일은 식품용 오일, 예를 들어 조리 식품, 예를 들어 스프레드, 소스, 당과 제품 및 냉동 당과 제품 중 식품용 오일 성분으로서 사용될 수 있다. 특정 구체예에서, 유지성 세포 또는 식품용 오일은 C18:0 50% 내지 70% 및 C18:1(예를 들어, 올리에이트) 20% 내지 40%를 포함한다. 다른 특정 구체예에서, 유지성 세포 또는 식품용 오일은 C16:0 50% 내지 70% 및 C18:1(예를 들어, 올리에이트) 20% 내지 40%를 포함한다.
본 발명의 상세한 설명은 독자의 편리를 위해 여러 섹션으로 나누어진다. 섹션 I은 본원에 사용되는 용어의 정의를 제공한다. 섹션 II는 본 발명의 방법에 유용한 배양 조건의 설명을 제공한다. 섹션 III은 유전자 조작 방법 및 재료의 설명을 제공한다. 섹션 IV는 수크로스를 이용가능할 수 있게 하는 유전자 조작의 설명을 제공한다. 섹션 V는 지질 생합성을 변형시키기 위한 유전자 조작의 설명을 제공한다. 섹션 VI은 연료 및 화학 물질을 제조하는 방법을 기술한다. 섹션 VII은 발명의 실시예 및 구체예를 개시한다. 본 발명의 상세한 설명에 이어서 발명의 다양한 양태 및 구체예를 예시하는 실시예가 제공된다.
I. 정의
달리 정의되지 않는다면, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 분야의 당업자가 통상적으로 이해하는 의미를 갖는다. 본원에 사용된 바와 같이, 하기의 용어는 달리 특정되지 않는다면 이들 본래의 의미를 갖는다.
“미세 조류에서 활성(active in microalgae)”은 미세 조류에서 기능성인 핵산을 말한다. 예를 들어, 유전자 이식 미세 조류에 항생제 내성을 부여하는 항생제 내성 유전자를 구동하기 위해 사용된 프로모터는 미세 조류에서 활성이다.
“면적 백분율”은 FAME GC/FID 검출 방법을 사용하여 관찰된 피크의 면적을 말하며, 상기 방법에서 샘플 내 모든 지방산은 검출 전에 지방산 메틸 에스테르(FAME)로 전환된다. 예를 들어, 분리 피크는 C14:1과 같은 임의의 기타 다른 지방산과 비교하여 불포화성(C14:0)을 갖지 않는 14개 탄소 원자의 지방산에 대해서 관찰된다. 각각의 부류의 FAME에 대한 피크 면적은 혼합물 내 이의 백분율 조성과 정비례하고 샘플 내 존재하는 모든 피크의 합계를 기준으로 계산된다(즉, [특정 피크하의 면적/모든 측정된 피크의 총 면적] X 100). 본 발명의 오일 및 세포의 지질 프로필을 말하는 경우, “4% 이상의 C8 내지 C14”는 세포 내 또는 추출된 글리세로지질 조성물 내의 총 지방산의 4% 이상이 탄소 원자 8개, 10개, 12개 또는 14개를 포함하는 사슬 길이를 가짐을 의미한다.
“무균성”은 기타 다른 생존 유기체에 의해 오염되지 않은 유기체의 배양물이다.
“바이오디젤”은 디젤 엔진에서 연료로서 사용하기에 적당한 생물학적으로 생산된 지방산 알킬 에스테르이다.
“바이오매스”는 세포의 생장 및/또는 번식에 의해 생산된 물질이다. 바이오매스는 세포에 의해 분비되는 화합물을 포함하지만 이에 제한되지 않는, 세포외 물질뿐만 아니라 세포 및/또는 세포 내 내용물을 함유할 수 있다.
“생물 반응기”는 임의로 현탁된 세포가 배양된 인클로저(enclosure) 또는 부분적 인클로저이다.
“셀룰로스 물질”은 셀룰로스 및 임의로는 헤미셀룰로스를 포함하는 생물학적 물질이다. 이는 당, 예를 들어 글루코스 및 자일로스로 분해될 수 있으므로, 임의로는 부가의 화합물, 예를 들어 이당류, 올리고당, 리그닌, 푸르푸랄 및 기타 다른 화합물을 포함할 수 있다. 셀룰로스 물질의 공급원에 관한 비제한적 예로서는 사탕수수 바가스(sugar cane bagasses), 사탕무 펄프, 옥수수 대, 목재 칩, 톱밥 및 스위치그래스(switchgrass)를 포함한다.
“동시배양”, 및 이의 변형어구, 예를 들어 “공동 배양하다” 및 “공동 발효시키다”는 동일한 생물 반응기에 2가지 이상의 세포 유형을 배양함을 말한다. 2가지 이상의 세포 유형은 둘 다 미세 조류와 같은 미생물일 수 있거나 상이한 세포 유형과 함께 배양되는 미세 조류 세포일 수 있다.
본원에 사용된“발색된 분자” 또는 “발색 불순물”은 추출된 오일에 색을 부여하는 임의의 화합물을 말한다. “발색된 분자” 또는 “발색 불순물”은, 예를 들어 엽록소 a, 엽록소 b, 라이코펜, 토코페롤, 캄페스테롤, 토코트리에놀 및 카로티노이드, 예를 들어 베타 카로틴, 루테인, 제아잔틴, 아스타잔틴을 포함한다. 이와 같은 분자들은 바람직하게 미생물 바이오매스 또는 추출된 오일 중에 500ppm 이하, 250ppm 이하, 100ppm 이하, 75ppm 이하 또는 25ppm 이하의 농도로 존재한다. 다른 구체예에서, 미생물 바이오매스 또는 추출된 오일에 존재하는 엽록소의 양은 500㎎/㎏ 미만, 100㎎/㎏ 미만, 10㎎/㎏ 미만, 1㎎/㎏ 미만, 0.5㎎/㎏ 미만, 0.1㎎/㎏ 미만, 0.05㎎/㎏ 미만 또는 0.01㎎/㎏ 미만이다.
“배양된(cultivated)”, 및 이의 변형어, 예를 들어 “배양되는(cultured)” 및 “발효된”은 선택되고/선택되거나 제어된 조건의 사용에 의한 하나 이상의 세포의 생장의 의도적인 조성(세포 크기, 세포 함량 및/또는 세포 활성의 증가) 및/또는 번식(propagation)(세포 수의 증가)을 말한다. 생장 및 번식 둘 다의 조합은 “증식(proliferation)”이라고 일컬어진다. 선택되고/선택되거나 제어된 조건의 예는 생물 반응기에서 규정된 배지(pH, 이온 강도 및 탄소원과 같은 공지된 특성을 가짐), 특정 온도, 산소분압, 이산화탄소 수준 및 생장의 사용을 포함한다. “배양된”은 자연에서 또는 다르게는 사람 간섭이 없는 미생물의 생장 또는 번식을 말하지 않고, 예를 들어 궁극적으로 화석화되어 지질학적 미정제 오일을 생성하는 유기체의 자연적인 생장은 배양이 아니다.
“불포화 효소”는 지질 합성 경로에서 이중 결합(불포화)을 트리글리세라이드 분자의 지방산 사슬에 도입하는 역할을 담당하는 효소를 말한다. 그 예로서는 스테아로일-아실기 운반 단백질 불포화 효소(SAD) 및 지방산 불포화 효소(FAD)(지방 아실 불포화 효소라고도 알려짐)를 포함하나, 이에 제한되는 것은 아니다.
“발현 벡터” 또는 “발현 구조물” 또는 “플라스미드” 또는 “재조합 DNA 구조물”은 숙주 세포 내에 핵산을 도입하기 위한 비이클이다. 핵산은 특정 핵산의 전사 및/또는 번역을 허용하는 일련의 특정 핵산 요소를 사용하여 사람의 개입을 통하여, 예를 들어 재조합 수단 또는 직접 화학 합성법에 의해 생성된 것일 수 있다. 발현 벡터는 플라스미드, 바이러스 또는 핵산 단편이나 기타 다른 적당한 비이클의 일부일 수 있다. 통상적으로, 발현 벡터는 프로모터에 작동 가능하도록 결합되어 전사될 핵산을 포함한다.
“외인성 유전자”는 (예를 들어, 형질 전환/형질 감염에 의해) 세포 내에 도입된 RNA 및/또는 단백질의 발현을 암호화하는 핵산으로서, 또한 “이식 유전자”라고도 칭하여진다. 외인성 유전자를 포함하는 세포는 부가의 외인성 유전자(들)가 도입될 수 있는 재조합 세포라고도 칭하여질 수 있다. 상기 외인성 유전자는 형질 전환될 세포에 대해 상이한 종(및 따라서 이종성) 또는 동일한 종(따라서 동종성)으로부터 유래한 것일 수 있다. 따라서, 외인성 유전자는 유전자의 내인성 복사체에 비해 세포의 게놈 내에서 상이한 위치를 차지하거나 상이한 제어 하에 있는 동종성 유전자를 포함할 수 있다. 외인성 유전자는 세포 내에서 하나 초과의 복사체에 존재할 수 있다. 외인성 유전자는 게놈(핵 또는 색소체) 내로의 삽입물로서 또는 에피좀 분자로서 세포 내에 유지될 수 있다.
“외인성으로 제공된”은 세포 배양의 배양 배지에 공급된 분자를 말한다.
본 발명의 내용에 따라서, “지방산”은 글리세로지질 중 유리 지방산, 지방산 염 또는 지방 아실부를 의미할 것이다.
“고정 탄소원”은 본원에서 배양된 미생물에 의해 사용될 수 있는 배양 배지 내 고체 또는 액체 형태로 주위 온도 및 압력에서 존재하는 탄소를 함유하는 분자(들), 통상적으로 유기 분자이다. 따라서, 이산화탄소는 고정된 탄소원이 아니다.
배양 조건과 관련된 “종속 영양성”은 실질적으로 빛이 존재하지 않는 조건 하에 고정된 탄소원을 이용하거나 대사하면서 배양하는 것이다.
“파쇄액”은 물리적으로 파괴된 바이오매스다.
“수소:탄소 비율”은 원자 대 원자를 기준으로 분자 내 수소 원자 대 탄소 원자의 비율이다. 상기 비율은 탄화수소 분자 내 탄소 원자 및 수소 원자의 수를 말하는데 사용될 수 있다. 예를 들어, 최고 비율의 탄화수소는 메탄 CH4(4:1)이다.
“유도성 프로모터”는 특정 자극에 응답하여 작동적으로 연결된 유전자의 전사를 매개하는 프로모터이다. 이와 같은 프로모터의 예는 pH 또는 질소 수준이 변하는 조건 하에서 유도되는 프로모터 서열일 수 있다.
“작동 가능한 연결”은 2개의 핵산 서열, 예를 들어 제어 서열(통상적으로 프로모터)과 연결된 서열(통상적으로 단백질을 암호화하는 서열, 또는 암호화 서열이라고 불림) 간의 기능적 연결이다. 프로모터는 이것이 유전자의 전사를 매개할 수 있다면 외인성 유전자와 작동가능하게 연결되어 있다.
“지질 변형 효소”는 지질의 공유 구조를 변경하거나, 아니면 세포 내 지방산 프로필을 변경시킬 수 있는 효소를 말한다. 지질 변형 효소의 예로서는 리파제, 지방 아실-ACP 티오에스테라제, 지방 아실-CoA/알데하이드 환원 효소, 지방 아실-CoA 환원 효소, 지방 알데하이드 환원 효소, 불포화 효소, 예를 들어 스테아로일 아실기 운반 단백질 불포화 효소(SAD) 및 지방 아실 불포화 효소(FAD), 및 지방 알데하이드 탈카보닐화 효소를 포함한다.
“지질 경로 효소”는 지질 대사, 즉 지질 합성, 변형 또는 분해에 역할을 하는 임의의 효소 및 운반 단백질뿐만 아니라 지질을 화학적으로 변형시키는 임의의 단백질이다.
“지질 프로필” 또는 “글리세로지질 프로필”은 사슬 길이 및/또는 포화 패턴의 관점에서, 세포 내 지방산의 분포 또는 세포로부터 유래하는 오일의 지방산의 분포를 말한다. 이와 같은 내용 중, 포화 패턴은 포화된 산 대 불포화된 산의 척도, 또는 세포의 다양한 지방산 내 이중 결합의 위치 분포를 더욱 자세히 분석한 결과를 포함할 수 있다.
“용해(lysis)”는 유기체의 일체성을 손상시키는 흔히, 기계적, 화학 물질, 바이러스 또는 삼투압 기작에 의해 적어도 일부의 세포 내 내용물을 방출하기에 충분한 생물학적 유기체의 세포질 막 및 임의로 세포 벽을 파괴하는 것이다.
“용해(lysing)”은 용해 공정이다.
“미세 조류”는 엽록체 또는 색소체를 함유하고 임의로 광합성을 수행할 수 있는 미생물 유기체, 또는 광합성을 수행할 수 있는 원핵 미생물 유기체이다. 미세 조류는 고정 탄소원으로부터 유일하게 생존할 수 있는 종속 영양 생물뿐만 아니라 에너지로서 고정 탄소원을 대사시킬 수 없는 절대 광합성 독립 영양 생물을 포함한다. 미세 조류는 2개의 독특한 세포 유형의 단순한 다중세포 광합성 미생물인, 예를 들어 볼복스(Volvox)와 같은 미생물뿐만 아니라 세포 분열 후 단시간에 자매 세포로부터 분리되는 단일 세포 유기체, 예를 들어 클라미도모나스(Chlamydomonas)를 포함한다. 미세 조류는 클로렐라, 두날리엘라(Dunaliella), 및 프로토테카와 같은 세포를 포함한다. 미세 조류는 또한 아그메넬룸(Agmenellum), 아나바에나(Anabaena), 및 피로보트리스(Pyrobotrys)와 같은 세포-세포 접착을 나타내는 기타 다른 미생물 광합성 유기체를 포함한다. 미세 조류는 또한 특정 디노플라겔레이트 조류 종 및 프로토테카 속의 종과 같은 광합성을 수행하는 능력을 상실한 절대 종속 영양 미생물을 포함한다.
지방산과 관련된 내용 중 본원에 사용된 “중간쇄”는 C10 내지 C16 지방산을 말한다. 지방산과 관련된 내용 중“단쇄”는 C6 내지 C10 지방산을 말하는 한편, “장쇄”은 C17 이상인 지방산을 말한다. 이와 같은 범위는 달리 지정되지 않는 한 정확히 제한되는 것으로 의도되지 않는다.
“천연 오일”은 트리글리세라이드의 지방산 프로필이 실질적으로 변경되도록, 다른 천연 또는 합성 오일 또는 분획과 오일이 배합되지 않는 경우, 유기체로부터 얻어진 대부분의 트리글리세라이드 오일을 의미할 것이다. 본원에 있어서, “분별”은 오일 자체의 지방산 프로필을 유기체에 의해 생성되지만. 달성된 지방산 프로필과 비교하였을 때 변경하는 방식으로, 오일로부터 물질을 제거하는 것을 의미한다. 오일을 대상으로 하여 자체의 트리글리세라이드 프로필을 실질적으로 변화시키지 않는 최소의 가공, 예를 들어 정제, 표백 및/또는 고무 성질 제거가 행해진 경우, 천연 오일은 유기체로부터 얻어지는 오일을 포함한다. 천연 오일은 또한 “에스테르 교환 반응이 진행되지 않은 천연 오일”일 수 있는데, 이는 천연 오일이 자체의 아실 결합에 지방산이 재분포되어 글리세롤로 가공되는 공정이 진행되지 않게 되고, 본질적으로 유기체로부터 회수되었을 때와 동일한 배열로 유지되는 경우를 의미한다.
2개의 단백질 또는 유전자와 관련하여 “자연적으로 공동 발현된”은 단백질 또는 이들의 유전자가 이들이 유래된 조직 또는 유기체에서 자연적으로 공동 발현됨을 의미하며, 이는 예를 들어 2개의 단백질을 암호화하는 유전자가 공통된 조절 서열의 제어 하에 있기 때문이거나 이들이 동일한 자극에 응답하여 발현되기 때문이다.
“삽투압 쇼크”는 삼투압의 급작스런 감소 후 용액 내 세포의 파열이다. 삽투압 쇼크는 때때로 상기 세포의 세포 성분을 용액 내로 방출하도록 유도된다.
“다당류 분해 효소”는 임의의 다당류의 가수 분해 또는 당화를 촉매할 수 있는 임의의 효소이다. 예를 들어, 셀룰라제는 셀룰로스의 가수 분해를 촉매한다.
“다당류” 또는 “글리칸”은 글리코시드 결합에 의해 서로 함께 연결된 단당류로 구성된 탄수화물이다. 셀룰로스는 특정 식물 세포 벽을 구성하는 다당류다. 셀룰로스는 보다 큰 이당류 및 올리고당뿐만 아니라 자일로스 및 글루코스와 같은 단당류를 생성하도록 효소에 의해 해중합될 수 있다.
“프로모터”는 핵산의 전사를 지시하는 핵산 제어 서열이다. 본원에 사용된 바와 같이, 프로모터는 전사 개시 부위 근처에 필수 핵산 서열, 예를 들어 중합 효소 II형 프로모터의 경우에, TATA 요소를 포함한다. 프로모터는 또한 임의로 전사 개시 부위로부터 수천 염기쌍 정도로 멀리 위치할 수 있는 원거리 인핸서 또는 리프레서 요소를 포함한다.
“재조합체”는 외인성 핵산의 도입 또는 고유 핵산의 변경으로 인해 변형된 세포, 핵산, 단백질 또는 벡터이다. 따라서, 예를 들어 재조합 세포는 천연(비재조합체) 형태의 세포 내에서 발견되지 않는 유전자를 발현할 수 있거나 비재조합 세포에 의해 발현되는 유전자와는 상이하게 천연 유전자를 발현할 수 있다. 재조합 세포는 유전자 생성물 또는 세포 내 활성 유전자 생성물의 수준을 감소시키는 억제 요소, 예를 들어 돌연 변이, 녹아웃, 안티센스, 간섭 RNA(RNAi) 또는 dsRNA를 암호화하는 재조합 핵산(이에 제한되는 것은 아님)을 포함할 수 있다. “재조합 핵산”은 예를 들어, 중합 효소, 리가아제, 엑소뉴클레아제 및 엔도뉴클레아제를 사용하는 핵산의 조작에 의해 일반적으로 시험관내 형성된 본래의 핵산이거나, 다르게는 통상적으로 자연적으로 발견되지 않는 형태로 존재한다. 재조합 핵산은, 예를 들어 2개 이상의 핵산을 작동가능하게 연결시키도록 하여 생성될 수 있다. 따라서, 통상적으로 자연적으로 연결되어 있지 않은 DNA 분자를 연결함에 의해 시험관내 형성된 분리된 핵산 또는 발현 벡터는 둘 다 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 일단 재조합 핵산이 제조되고 숙주 세포 또는 유기체로 도입되면, 이것은 숙주 세포의 생체내 세포 기구를 사용하여 복제할 수 있지만, 일단 재조합적으로 생성되면 당해 핵산은 후속적으로 세포 내에서 복제된다 하더라도 여전히 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 유사하게, “재조합 단백질”은, 즉 재조합 핵산의 발현을 통해 재조합 기술을 사용하여 제조된 단백질이다.
“재생 디젤”은 지질의 수소화 및 탈산소화를 통해 천연 오일로부터 생성된 알칸(예를 들어, C10:0, C12:0, C14:0, C16:0 및 C 18:0)의 혼합물이다.
“당화”는 바이오매스, 통상적으로 셀룰로스 또는 리그노셀룰로스 바이오매스를 글루코스 및 자일로스와 같은 단량체성 당으로 전환시키는 공정이다. “당화된” 또는 “해중합된” 셀룰로스 물질 또는 바이오매스는 당화를 통해 단량체 당으로 전환되는 셀룰로스 물질 또는 바이오매스를 말한다.
“푸르푸랄 종”은 동일한 염기성 구조 특징을 보유한 2-푸란카복스알데하이드 또는 유도체이다.
본원의 구체예에 따르면(반드시 선행 기술에 관해 논의된 사항에 의하지는 않음) 재조합 균주를 형성하기 위한 균주의 형질 전환과 관련하였을 때, “안정적인” 또는 “안정적으로 통합된”은 균주의 세포가 10세대 이상 동안 재조합 핵산을 보유하고 있는 경우를 의미할 것이다. 예를 들어 재조합 균주가 선택압의 존재 하에서 배양을 가능하게 하는 선택가능한 마커를 가지는 경우, 재조합 핵산은 선택압의 부재시 10세대 배양된 후에도 유지된다.
“수크로스 이용 유전자”는 발현되는 경우 에너지원으로서 수크로스를 이용하는 세포의 능력을 도와주는 유전자이다. 수크로스 이용 유전자에 의해 암호화된 단백질은 본원에서 “수크로스 이용 효소”로 지칭되고 수크로스 수송체, 수크로스 인버타제, 및 글루코키나제 및 프럭토키나제와 같은 헥소키나제를 포함한다.
II
. 배양
본 발명은 일반적으로 미생물, 특히 제II형 지방산 생합성 경로를 가지는 유지성 미생물, 예를 들어 트리글리세라이드를 생산하는 미세 조류의 배양에 관한 것이다. 하나의 구체예에서, 미생물은 절대 종속 영양 생물이다. 미생물은 예를 들어 본원에 개시된 유전자 조작 방법을 바탕으로 생산된 재조합 미생물일 수 있다. 독자들의 편의를 위하여, 본 섹션은 하위 섹션들로 세분화된다. 하위 섹션 1은 미생물의 종과 균주를 기술한다. 하위 섹션 2는 배양에 유용한 생물 반응기를 기술한다. 하위 섹션 3은 배양을 위한 배지를 기술한다. 하위 섹션 4는 본 발명의 예시적인 배양 방법에 따른 오일 생성을 기술한다.
1.
미생물 종 및 균주
비록 이하에 제시된 예시적인 구체예들이 다수의 미생물에 적용될 수 있지만, 프로토테카는 지질의 생산에 사용되는 바람직한 미생물이다. 중요한 점은, 예를 들어 프로토테카를 사용하는, 본원에 기술된 유전자 조작 방법은 기타 다른 미생물(예를 들어, 클로렐라 소로키니아나(Chlorella sorokiniana), 클로렐라 불가리스, 클로렐라 엘립소이데아(Chlorella ellipsoidea), 클로렐라 케슬러리, 두날리엘라 터티올렉타(Dunaliella tertiolecta), 볼복스 카르테리(Volvox carteri), 해마토코커스 플루비알리스(Haematococcus pluvialis), 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체(Closterium peracerosum - strigosum - littorale complex), 두날리엘라 비리디스(Dunaliella viridis), 두날리엘라 살리나(Dunaliella salina), 고니움 펙토랄레(Gonium pectorale), 파에오닥틸룸 트리코르누툼(Phaeodactylum tricornutum), 카에토세로스(Chaetoceros), 실린드로테카 푸시포르미스(Cylindrotheca fusiformis), 암피디늄 종(Amphidinium sp.), 심비오디늄 마이크로아드리악티큠(Symbiodinium microadriacticum), 나노클로롭시스(Nannochloropsis), 시클로텔라 크립티카(Cyclotella cryptica), 나비큘라 사프로필라(Navicula saprophila) 또는 탈라시오시라 슈도나나(Thalassiosira pseudonana))에 적용 가능하다는 것이다.
절대 종속 영양 미세 조류, 예를 들어 프로토테카로부터 얻어진 지질 또는 오일은 일반적으로 색소 함량이 낮을 수 있으며(예를 들어, 엽록소 및 임의의 카로티노이드의 수준은 검출이 안 될 정도로 낮을 수 있으며, 예를 들어, 발색 분자, 발색 불순물 또는 엽록소와 카로티노이드 농도의 합이 500ppm, 50ppm 또는 5ppm 미만일 수 있으며), 임의의 경우에는 기타 다른 미세 조류로부터 유래하는 지질보다 색소를 훨씬 적게 함유한다. 더욱이, 본 발명에 의해 제공된 재조합 프로토테카 세포는 기타 다른 미생물로부터 지질을 생산하는 것과 비교하여 보다 큰 수율 및 효율로 저렴하게 지질을 생산하는데 사용될 수 있다. 본 발명의 방법에 사용하기 위한 예시적인 프로토테카 균주가 포함된다. 추가로, 상기 미세 조류는 종속 영양적으로 생장하고 프로토테카 윅커해미, 프로토테카 스태그노라(UTEX 327을 포함함), 프로토테카 포르토리센시스, 프로토테카 모리포르미스(UTEX 균주 1441, 1435를 포함함), 및 프로토테카 조프피로서 유전자 조작될 수 있다. 프로토테카 속의 종은 절대 종속 영양 생물이다.
오일, 연료 및 함유 화학 제품을 생산하는데 적당한 지질 또는 탄화수소를 생산하는 것 이외에, 본 발명의 구체예에 사용될 미생물을 선택하는 것에 영향을 미치는 고려 사항으로서는, (1) 고 지질 함량(세포 중량 백분율); (2) 생장의 용이성; (3) 유전자 조작의 용이성; 및 (4) 바이오매스 가공의 용이성을 포함한다. 특정 구체예에서, 야생형 미생물 또는 유전자 조작된 미생물은 지질이 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상 또는 70% 이상 또는 그 이상인 세포를 생산한다. 기타 특정 구체예에서, 야생형 미생물 또는 유전자 조작된 미생물은 40% 내지 80% 또는 50% 내지 90%의 트리글리세라이드를 포함하는 세포를 생산한다. 바람직한 유기체는 종속 영양 조건 하에서(빛이 부재하고 당이 존재하는 조건 하에서) 생장한다.
본 발명을 실시하는데 사용될 수 있는 조류의 예로서는 이하 표 1에 나열된 조류를 포함하나, 이에 제한되는 것은 아니다.
아크난테스 오리엔탈리스(Achnanthes orientalis), 아그메넬룸, 암피프로라 히알린(Amphiprora hyaline), 암포라 코페이포르미스(Amphora coffeiformis), 암포라 코페이포르미스 리니아(Amphora coffeiformis linea), 암포라 코페이포르미스 펑타타(Amphora coffeiformis punctata), 암포라 코페이포르미스 타일로리(Amphora coffeiformis taylori), 암포라 코페이포르미스 테뉴이스(Amphora coffeiformis tenuis), 암포라 델리카티시마(Amphora delicatissima), 암포라 델리카티시마 카피타타(Amphora delicatissima capitata), 암포라 종(Amphora sp.), 아나바에나, 안키스트로데스무스(Ankistrodesmus), 안키스트로데스무스 팔카투스(Ankistrodesmus falcatus), 보에켈로비아 후글란디(Boekelovia hooglandii), 보로디넬라 종(Borodinella sp.), 보트리오코커스 브라우니(Botryococcus braunii), 보트리오코커스 수데티쿠스(Botryococcus sudeticus), 카르테리아(Carteria), 카에토세로스 그라실리스(Chaetoceros gracilis), 카에토세로스 무엘러리(Chaetoceros muelleri), 카에토세로스 무엘러리 서브살섬(Chaetoceros muelleri subsalsum), 카에토세로스 종(Chaetoceros sp.), 클로렐라 아니트라타(Chlorella anitrata), 클로렐라 안타르크티카(Chlorella Antarctica), 클로렐라 아우레오비리디스(Chlorella aureoviridis), 클로렐라 칸디다(Chlorella candida), 클로렐라 캡슐라테(Chlorella capsulate), 클로렐라 데시카테(Chlorella desiccate), 클로렐라 엘립소이데아(Chlorella ellipsoidea), 클로렐라 에머소니(Chlorella emersonii), 클로렐라 푸스카(Chlorella fusca), 클로렐라 푸스카 변종 바큐올라타(Chlorella fusca var . vacuolata), 클로렐라 글루코트로파(Chlorella glucotropha), 클로렐라 인퓨시오늄(Chlorella infusionum), 클로렐라 인퓨시오늄 변종 악토필라(Chlorella infusionum var . actophila), 클로렐라 인퓨시오늄 변종 옥세노필라(Chlorella infusionum var . auxenophila), 클로렐라 케슬러리, 클로렐라 로보포라(Chlorella lobophora)(균주 SAG 37.88), 클로렐라 루테오비리디스, 클로렐라 루테오비리디스 변종 아우레오비리디스(Chlorella luteoviridis var . aureoviridis), 클로렐라 루테오비리디스 변종 루테센스(Chlorella luteoviridis var. lutescens), 클로렐라 미니아타(Chlorella miniata), 클로렐라 미뉴티시마(Chlorella minutissima), 클로렐라 뮤타빌리스(Chlorella mutabilis), 클로렐라 녹터나(Chlorella nocturna), 클로렐라 파르바(Chlorella parva), 클로렐라 포토필리아(Chlorella photophila), 클로렐라 프링스헤이미(Chlorella pringsheimii), 클로렐라 프로토테코이데스(Chlorella protothecoides)(UTEX 균주 1806, 411, 264, 256, 255, 250, 249, 31, 29, 25, 및CCAP 균주 211/17 및 211/8d 중 임의의 것을 포함함), 클로렐라 프로토테코이데스 변종 아시디콜라(Chlorella protothecoides var . acidicola), 클로렐라 레귤라리스(Chlorella regularis), 클로렐라 레귤라리스 변종 미니마(Chlorella regularis var . minima), 클로렐라 레귤라리스 변종 움브리카타(Chlorella regularis var . umbricata), 클로렐라 레이시글리(Chlorella reisiglii), 클로렐라 사카로필라(Chlorella saccharophila), 클로렐라 사카로필라 변종 엘립소이데아(Chlorella saccharophila var . ellipsoidea), 클로렐라 살리나(Chlorella salina), 클로렐라 심플렉스(Chlorella simplex), 클로렐라 소로키니아나, 클로렐라 종(Chlorella sp.), 클로렐라 스파에리카(Chlorella sphaerica), 클로렐라 스티그마토포라(Chlorella stigmatophora), 클로렐라 바니엘리(Chlorella vanniellii), 클로렐라 불가리스, 클로렐라 불가리스, 클로렐라 불가리스 에프. 테르티아(Chlorella vulgaris f. tertia), 클로렐라 불가리스 변종 오토트로피카(Chlorella vulgaris var . autotrophica), 클로렐라 불가리스 변종 비리디스(Chlorella vulgaris var . viridis), 클로렐라 불가리스 변종 불가리스(Chlorella vulgaris var . vulgaris), 클로렐라 불가리스 변종 불가리스 에프. 테르티아(Chlorella vulgaris var . vulgaris f. tertia), 클로렐라 불가리스 변종 불가리스 에프. 비리디스(Chlorella vulgaris var . vulgaris f. viridis), 클로렐라 잔텔라(Chlorella xanthella), 클로렐라 조핀지엔시스(Chlorella zofingiensis), 클로렐라 트레복시오이데스(Chlorella trebouxioides), 클로렐라 불가리스, 클로로코쿰 인퓨시오늄(Chlorococcum infusionum), 클로로코쿰 종(Chlorococcum sp.), 클로로고늄(Chlorogonium), 크로오모나스 종(Chroomonas sp.), 크리소스파에라 종(Chrysosphaera sp.), 크리코스파에라 종(Cricosphaera sp.), 크립토모나스 종(Cryptomonas sp.), 시클로텔라 크립티카(Cyclotella cryptica), 시클로텔라 메네기니아나(Cyclotella meneghiniana), 시클로텔라 종(Cyclotella sp.), 두날리엘라 종(Dunaliella sp.), 두날리엘라 바르다윌(Dunaliella bardawil), 두날리엘라 비오큘라타(Dunaliella bioculata), 두날리엘라 그라뉼라테(Dunaliella granulate), 두날리엘라 마리타임(Dunaliella maritime), 두날리엘라 미뉴타(Dunaliella minuta), 두날리엘라 파르바(Dunaliella parva), 두날리엘라 페이르세이(Dunaliella peircei), 두날리엘라 프리몰렉타(Dunaliella primolecta), 두날리엘라 살리나(Dunaliella salina), 두날리엘라 테리콜라(Dunaliella terricola), 두날리엘라 터티올렉타(Dunaliella tertiolecta), 두날리엘라 비리디스(Dunaliella viridis), 두날리엘라 터티올렉타, 에레모스파에라 비리디스(Eremosphaera viridis), 에레모스파에라 종(Eremosphaera sp.), 엘립소이돈 종(Ellipsoidon sp.), 유글레나(Euglena), 프란세이아 종(Franceia sp.), 프라길라리아 크로토넨시스(Fragilaria crotonensis), 프라길라리아 종(Fragilaria sp.), 글레오캡사 종(Gleocapsa sp.), 글로에오탐니온 종(Gloeothamnion sp.), 하이메노모나스 종(Hymenomonas sp.), 이소크리시스 에이에프에프. 갈바나(Isochrysis aff . galbana), 이소크리시스 갈바나(Isochrysis galbana), 레포신클리스(Lepocinclis), 마이크락티늄(Micractinium), 마이크락티늄(UTEX LB 2614), 모노라피듐 미뉴텀(Monoraphidium minutum), 모노라피듐 종(Monoraphidium sp.), 나노클로리스 종(Nannochloris sp.), 나노클로롭시스 살리나(Nannochloropsis salina), 나노클로롭시스 종(Nannochloropsis sp.), 나비큘라 아셉타타(Navicula acceptata), 나비큘라 비스칸테라에(Navicula biskanterae), 나비큘라 슈도테넬로이데스(Navicula pseudotenelloides), 나비큘라 펠리큘로사(Navicula pelliculosa), 나비큘라 사프로필라(Navicula saprophila), 나비큘라 종(Navicula sp.), 네프로클로리스 종(Nephrochloris sp.), 네프로셀미스 종(Nephroselmis sp.), 니츠시아 커뮤니스(Nitschia communis), 니츠시아 알렉산드리나(Nitzschia alexandrina), 니츠시아 커뮤니스(Nitzschia communis), 니츠시아 디시파타(Nitzschia dissipata), 니츠시아 프러스튤럼(Nitzschia frustulum), 니츠시아 한츠시아나(Nitzschia hantzschiana), 니츠시아 인컨스피큐아(Nitzschia inconspicua), 니츠시아 인터미디아(Nitzschia intermedia), 니츠시아 마이크로세팔라(Nitzschia microcephala), 니츠시아 푸실라(Nitzschia pusilla), 니츠시아 푸실라 엘립티카(Nitzschia pusilla elliptica), 니츠시아 푸실라 모노엔시스(Nitzschia pusilla monoensis), 니츠시아 쿼드랭귤라(Nitzschia quadrangular), 니츠시아 종(Nitzschia sp.), 오크로모나스 종(Ochromonas sp.), 오오시스티스 파르바(Oocystis parva), 오오시스티스 푸실라(Oocystis pusilla), 오오시스티스 종(Oocystis sp.), 오실라토리아 림네티카(Oscillatoria limnetica), 오실라토리아 종(Oscillatoria sp.), 오실라토리아 수브레비스(Oscillatoria subbrevis), 파셰리아 악시도필라(Pascheria acidophila), 파블로바 종(Pavlova sp.), 파구스(Phagus), 포르미디움(Phormidium), 플라티모나스 종(Platymonas sp.), 플루로크리시스 카르테라에(Pleurochrysis carterae), 플루로크리시스 덴타테(Pleurochrysis dentate), 플루로크리시스 종(Pleurochrysis sp.), 프로토테카 윅커해미, 프로토테카 스태그노라, 프로토테카 포르토리센시스, 프로토테카 모리포르미스, 프로토테카 조프피, 피라미모나스 종(Pyramimonas sp.), 피로보트리스, 사르시노이드 크리소피트(Sarcinoid chrysophyte), 세네데스무스 아르마터스(Scenedesmus armatus), 스피로자이라(Spirogyra), 스피룰리나 플라텐시스(Spirulina platensis), 스티코코커스 종(Stichococcus sp.), 시네코코커스 종(Synechococcus sp.), 테트라에드론(Tetraedron), 테트라셀미스 종(Tetraselmis sp.), 테트라셀미스 수에시카(Tetraselmis suecica), 탈라시오시라 웨이스플로기(Thalassiosira weissflogii) 및 비리디엘라 프리데리시아나(Viridiella fridericiana) |
2.
생물 반응기
미생물은 유전자 조작을 수행하고 탄화수소(예를 들어, 지질, 지방산, 알데하이드, 알코올 및 알칸)를 생성할 2가지 목적을 위해 배양한다. 전자 유형의 배양은 소규모 및 처음에는 적어도 출발 미생물이 생장할 수 있는 조건 하에서 수행한다. 탄화수소를 생산하기 위한 배양은 생물 반응기에서 통상적으로 대규모(예를 들어, 10,000L, 40,000L, 100,000L 또는 보다 대형의 생물 반응기)로 수행한다. 미세 조류, 예를 들어 프로토테카 종은 통상적으로 생물 반응기내 액체 배지 중에서 본 발명의 방법으로 배양한다. 통상적으로, 생물 반응기는 빛이 입사되지 않도록 한다.
생물 반응기 또는 발효기를 사용하여 다양한 단계의 세포의 생리학적 사이클을 통해 미세 조류 세포를 배양한다. 생물 반응기는 종속 영양 생장 및 번식 방법에 사용하기 위한 많은 이점을 제공한다. 바이오매스를 생산하기 위해 미세 조류를 바람직하게 액체 중에서, 예를 들어 현탁 배양으로 대량으로 발효시킨다. 강철 발효기와 같은 생물 반응기는 매우 큰 배양 용적(40,000리터 이상의 용량을 갖는 생물 반응기가 본 발명의 다양한 구체예에서 사용됨)을 수용할 수 있다. 생물 반응기는 또한 통상적으로 온도, pH, 산소분압 및 이산화탄소 수준과 같은 배양 조건의 제어를 허용한다. 예를 들어, 생물 반응기는 통상적으로, 예를 들어 관에 부착된 포트를 사용하여 산소 또는 질소와 같은 가스 성분이 액체 배양물을 통해 기포 주입될 수 있도록 하는 형태를 취할 수 있다. 배양 배지의 pH, 미량 요소의 종류 및 농도 및 기타 다른 배지 성분과 같은 기타 다른 배양 파라미터가 또한 생물 반응기를 사용하여 보다 용이하게 조작될 수 있다.
회전 블레이드 및 임펠러, 진동(rocking) 기구, 교반 막대, 가압 가스 주입용 수단과 같은 장치가 장착된 생물 반응기를 사용하여 배양물이 혼합되도록 할 수 있다. 혼합은 연속적이거나 간헐적일 수 있다. 예를 들어, 몇몇 구체예에서, 상기 세포의 수에 있어서 원하는 증가가 이루어질 때까지 가스 주입 및 배지 주입의 난류 체계는 미세 조류의 번식 동안에 유지되지 않는다.
생물 반응기 포트를 사용하여 가스, 고체, 반고체 및 액체를, 미세 조류를 함유하는 생물 반응기 챔버에 도입하거나 추출할 수 있다. 많은 생물 반응기는 하나 초과의 포트(예를 들어, 배지 주입을 위한 하나 및 샘플링을 위한 또 다른 하나)를 갖는 한편, 단지 하나의 물질이 포트를 출입할 필요는 없다. 예를 들어, 포트를 사용하여 배양 배지가 생물 반응기로 유입될 수 있도록 하고 이후에 샘플링, 가스 주입, 가스 배출 또는 기타 다른 목적을 위해 사용될 수 있다. 바람직하게, 샘플링 포트는 배양물의 무균 특성을 변경, 손상시키지 않고 반복적으로 사용될 수 있다. 샘플링 포트는 샘플의 흐름이 중지되고 개시되거나 연속 샘플링의 수단을 제공하도록 하는 밸브 또는 기타 다른 장치로 구성될 수 있다. 생물 반응기는 통상적으로 배양물의 접종을 가능하게 하는 하나 이상의 포트를 갖고 상기 포트는 또한 배지 또는 가스 주입과 같은 기타 다른 목적을 위해 사용될 수 있다.
생물 반응기 포트는 미세 조류의 배양물의 가스 함량이 조작되도록 할 수 있다. 설명하자면, 생물 반응기 용적의 일부는 액체보다는 가스일 수 있고, 생물 반응기의 가스 주입구는 가스가 생물 반응기로 펌핑될 수 있도록 한다. 생물 반응기 내로 이롭게 펌핑될 수 있는 가스는 공기, 산소, 공기/CO2 혼합물, 비활성 가스(예를 들어, 아르곤) 및 기타 다른 가스를 포함한다. 생물 반응기는 통상적으로 사용자가 생물 반응기로의 가스 주입 속도를 조절할 수 있도록 구성될 수 있다. 상기에 언급된 바와 같이, 생물 반응기로의 가스 주입 증가를 사용하여 배양물의 혼합을 증가시킬 수 있다.
증가된 가스 유입은 또한 배양물의 탁도에 영향을 미친다. 난기류는 수성 배양 배지의 수위 하부에 가스 주입 포트를 위치시켜 생물 반응기로 주입되는 가스가 배양물 표면으로 기포 주입되도록 함으로써 성취할 수 있다. 하나 이상의 가스 배출 포트는 가스가 배출되도록 하여 생물 반응기 내 압력 증강을 차단한다. 바람직하게, 가스 배출 포트는 생물 반응기로 오염 미생물이 들어가는 것을 차단하는 “원-웨이” 밸브와 연결된다.
3.
배지
미생물 배양 배지는 통상적으로 고정 질소원, 고정 탄소원, 미량 요소, 임의로 pH 유지를 위한 완충제 및 포스페이트(통상적으로 포스페이트 염으로서 제공됨)와 같은 성분들을 함유한다. 기타 다른 성분은 특히 해양 미세 조류를 위해 염화나트륨과 같은 염을 포함할 수 있다. 질소원은, 예를 들어 제한 없이 분자 질소, 질산염(nitrate), 질산 염(nitrate salt), 암모니아(순수 형태 또는 염 형태, 예를 들어 (NH4)2SO4 및 NH4OH), 단백질, 대두 밀, 옥수수 침지액, 및 효모 추출물을 포함하는 유기 및 무기 질소원을 함유한다. 미량 요소의 예로서는 아연, 붕소, 코발트, 구리, 망간, 및 몰리브덴을 포함하고, 예를 들어 이의 각각의 형태는 ZnCl2, H3BO3, CoCl2ㆍ6H2O, CuCl2ㆍ2H2O, MnCl2ㆍ4H2O 및 (NH4)6Mo7O24ㆍ4H2O이다.
본 발명의 방법에 따라 유용한 미생물은 전세계적으로 다양한 장소 및 환경에서 발견된다. 기타 다른 종 및 이들의 궁극적인 진화적 분기점으로부터의 분리 결과로서, 최적의 생장 및 지질 및/또는 탄화수소 성분들의 최적의 생산을 위한 특정 생장 배지는 예측하기 어려울 수 있다. 몇몇 경우에, 특정 미생물 균주는 몇몇 억제 성분의 존재 또는 특정 미생물 균주에 의해 요구되는 일부 필수 영양 요구성 물질의 부재 때문에 특정 생장 배지 상에서 생장하지 않을 수 있다.
고체 및 액체 생장 배지는 일반적으로 다양한 공급원으로부터 이용 가능하며, 광범위하게 다양한 미생물 균주에 적합한 특정 배지를 제조하기 위한 지침은, 예를 들어 조류의 배양 수집물을 위하여 택사스 대학교 오스틴 캠퍼스(University of Texas at Austin; 1 University Station A6700, Austin, Texas, 78712-0183, (UTEX))에서 운영하는 온라인 사이트(http://www.utex.org/)에서 찾을 수 있다. 예를 들어, 다양한 담수 및 염수 배지는 본원에 참조로서 포함된 문헌[PCT Pub. No. 2008/151149]에 기재된 것들을 포함한다.
특정 예에서, 프로테오스 배지(Proteose Medium)는 무균 배양에 적합하고, 1L 용적의 배지(pH 약 6.8)는 1리터의 Bristol 배지에 1g의 프로테오스 펩톤을 첨가하여 제조할 수 있다. Bristol 배지는 수용액 중에 2.94mM NaNO3, 0.17mM CaCl2ㆍ2H2O, 0.3mM MgSO4ㆍ7H2O, 0.43mM, 1.29mM KH2PO4, 및 1.43mM NaCl을 포함한다. 1.5% 한천 배지에 대해, 15g의 한천을 1L의 용액에 첨가할 수 있다. 상기 용액을 덮고 오토클레이브 처리하며, 이어서 사용 전에 냉장 온도에 저장한다. 또 다른 예는 프로토테카 분리 배지(PIM)이며, 이는 10g/L의 수소칼륨 프탈레이트(KHP), 0.9g/L의 수산화나트륨, 0.1g/L의 황산마그네슘, 0.2g/L의 인산수소칼륨, 0.3g/L의 염화암모늄, 10g/L의 글루코스, 0.001g/L의 티아민 염산염, 20g/L 한천, 0.25g/L의 5-플루오로사이토신을 pH 범위 5.0 내지 5.2로 포함한다(문헌[Pore, 1973, App. Microbiology, 26: 648-649] 참조). 본 발명의 방법에 사용하기에 적합한 기타 다른 배지는 상기의 URL에 문의하거나 미생물 배양물(예를 들어, SAG, CCAP, 또는 CCALA)을 유지하는 기타 다른 기관에 문의하여 용이하게 확인할 수 있다. SAG는 괴팅겐 대학교(University of ; , Germany)에서의 조류의 배양 수집물을 말하고, CCAP는 스코틀랜드 해양과학협회(Scottish Association for Marine Science; Scotland, United Kingdom)에 의해 관리되는 조류 및 원생동물의 배양 수집물을 말하며, CCALA는 식물연구원(Institute of Botany; , Czech Republic)의 조류 연구소의 배양 수집물을 말한다. 추가로, 미국 특허 제5,900,370호는 프로토테카 종의 종속 영양 발효에 적합한 배지 제형 및 조건을 기술한다.
오일 생산을 위해, 고정 탄소원의 선택이 중요한데, 그 이유는 오일 생산을 경제적으로 하기 위해서는 고정 탄소원의 비용이 충분히 낮아야 하기 때문이다. 따라서, 적합한 탄소원은, 예를 들어 아세테이트, 플로리도사이드, 프럭토스, 갈락토스, 글루쿠론산, 글루코스, 글리세롤, 락토스, 만노스, N-아세틸글루코사민, 람노스, 수크로스, 및/또는 자일로스를 포함할 수 있고, 상기 화합물을 함유하는 공급원료의 선택이 본 발명의 구체예의 방법의 중요한 양태이다. 본 발명의 방법에 따라 유용한 적합한 공급원료는, 예를 들어 흑액, 옥수수 전분, 해중합된 셀룰로스 물질, 유청, 당밀, 감자, 수수, 수크로스, 사탕무, 사탕수수, 쌀 및 밀을 포함할 수 있다. 탄소원은 또한 수크로스와 해중합된 사탕무 펄프의 혼합물과 같은 혼합물로서 제공될 수 있다. 하나 이상의 탄소원(들)은 하나 이상의 외인성으로 제공된 고정 탄소원(들)의 약 50μM 이상, 약 100μM 이상, 약 500μM 이상, 약 5mM 이상, 약 50mM 이상, 및 약 500mM 이상의 농도로 제공될 수 있다. 발효를 위한 공급원료로서 고도로 농축된 탄소원이 바람직하다. 예를 들어 몇몇 구체예에서, 배양 단계 이전 공급원료 중 글루코스의 수준은 300g/L 이상, 400g/L 이상, 500g/L 이상 또는 600g/L 이상, 또는 그 이상의 글루코스 수준으로 유가식 배양(fed batch cultivation)에 첨가되는데, 여기서 고도로 농축된 고정 탄소원은 세포가 생장하고 지질을 축적함에 따라서 시간 경과에 따라 세포에 공급된다. 다른 구체예에서, 배양 이전 수크로스는 500g/L 이상, 600g/L 이상, 700g/L 이상, 800g/L 이상 또는 그 이상의 수크로스 수준으로 유가 배양에 첨가되는데, 여기서 고도로 농축된 고정 탄소원은 세포가 생장하고 지질을 축적함에 따라서 시간 경과에 따라 세포에 공급된다. 고도로 농축된 고정 탄소원, 예를 들어 수크로스의 비제한적인 예로서는 진한 감자 당즙, 사탕수수 즙, 사탕무 즙 및 당밀을 포함한다. 본 발명의 목적을 위해 특히 관심이 있는 탄소원은 셀룰로스(해중합된 형태), 글리세롤, 수크로스 및 수수를 포함하고, 이들 각각은 하기에서 보다 상세히 논의된다.
본 발명에 따라, 미생물은 공급원료로서 해중합된 셀룰로스 바이오매스를 사용하여 배양할 수 있다. 셀룰로스 바이오매스(예를 들어, 여물, 예를 들어 옥수수 대)는 저렴하고 용이하게 입수할 수 있지만, 상기 공급원료는 효모 생장에 억제 작용을 하는 것으로 밝혀졌고, 효모는 셀룰로스 물질로부터 생성된 5탄당(예를 들어, 헤미셀룰로스 유래의 자일로스)을 사용할 수 없다. 대조적으로, 적어도 일부 미세 조류는 가공된 셀룰로스 물질 상에서 생장할 수 있다. 셀룰로스 물질은 일반적으로 약 40% 내지 60%의 셀룰로스, 약 20% 내지 40%의 헤미셀룰로스 및 10% 내지 30%의 리그닌을 포함한다.
셀룰로스 물질은 농작물, 즉, 식물 일부, 1차 식품 또는 섬유 생성물과 함께 야생에서 제거되지 않는 주로 줄기 및 잎뿐만 아니라 초본성 및 목재 에너지 작물로부터의 잔류물을 포함한다. 이의 예로서는 농업 폐기물, 예를 들어 사탕수수 바가스, 쌀겨, 옥수수 섬유(줄기, 잎, 껍질 및 속대를 포함함), 밀짚, 쌀짚, 사탕무 펄프, 감귤 펄프, 감귤 과피; 산림 폐기물, 예를 들어 경목재 및 연목재 간벌, 및 수목 작업으로부터의 경목재 및 연목재 잔류물; 목재 폐기물, 예를 들어 톱 가루 폐기물(목재 칩, 톱밥) 및 펄프 가루 폐기물; 도시 폐기물, 예를 들어 시의 고형 폐기물의 종이 분획물, 도시 목재 폐기물 및 도시 녹색 폐기물, 예를 들어 시의 깎아낸 풀; 및 목재 건축 폐기물을 포함한다. 추가의 셀룰로스는 스위치그래스, 잡종 포플러 목재 및 억제, 섬유 케인(cane) 및 섬유 수수와 같은 전용 셀룰로스 작물을 포한한다. 상기 물질로부터 생성된 5탄당은 자일로스를 포함한다.
셀룰로스 물질은 상기 물질내 함유된 당(들)을 미생물이 이용할 수 있는 효율이 증가되도록 처리될 수 있다. 본 발명의 구체예는 산 폭쇄(acid explosion) 후 셀룰로스 물질을 처리하여 물질이 미생물(예를 들어, 미세 조류 및 유지성 효모)의 종속 영양성 배양에 사용하기에 적합하도록 하는 방법을 제공한다. 상기 논의된 바와 같이, 리그노셀룰로스 바이오매스는 셀룰로스, 베타 1,4 연결된 글루코스(6탄당)의 결정성 중합체, 헤미셀룰로스, 자일로스(5탄당)로 주로 구성된 보다 느슨하게 회합된 중합체 및 보다 적은 정도의 만노스, 갈락토스, 아라비노스, 리그닌, 시나필 알코올 및 이의 유도체로 구성된 복합 방향족 중합체, 및 알파 1,4-연결된 폴리갈락투론산의 선형 사슬인 펙틴을 포함하는, 다양한 분획물로 구성된다. 셀룰로스 및 헤미셀룰로스의 중합체 구조 때문에 이들 내 당(예를 들어, 단량체 글루코스 및 자일로스)은 많은 미생물에 의해 효율적으로 사용(대사)될 수 있는 형태로 존재 하지 않는다. 상기 미생물을 위해 중합체를 구성하는 단량체 당을 생성하도록 셀룰로스 바이오매스를 추가로 가공하면 셀룰로스 물질이 공급원료(탄소원)로서 효율적으로 사용되는 것을 보장하는 데 매우 도움이 될 수 있다.
셀룰로스 또는 셀룰로스 바이오매스는, 바이오매스가 승온 및 승압에서 희석 황산(또는 기타 다른 산)으로 처리되는 “폭쇄(explosion)”로 호칭되는 공정을 거친다. 상기 공정은, 바이오매스가 셀룰로스 및 헤미셀룰로스 분획물의 글루코스 및 자일로스 단량체로의 효소 가수 분해를 효율적으로 거칠 수 있도록 바이오매스에 영향을 미친다. 생성된 단량체 당은 셀룰로스 당으로 호칭된다. 셀룰로스 당은 이어서 미생물에 의해 이용되어 다양한 대사물(예를 들어, 지질)을 생성할 수 있다. 산 폭쇄 단계는 헤미셀룰로스 분획물이 구성 단당류로 부분 가수 분해되도록 한다. 이들 당은 추가의 처리로 바이오매스로부터 완전히 유리될 수 있다. 몇몇 구체예에서, 추가의 처리는 열수 처리이고, 이는 폭쇄된 물질을 고온수로 세척하여 염과 같은 오염물을 제거하는 것을 포함한다. 이러한 단계는 상기 공정에 사용되는 보다 희석된 당 농도로 인해 셀룰로스 에탄올 발효에 대해서는 필요하지 않다. 다른 구체예에서, 추가의 처리는 추가의 산 처리이다. 또 다른 구체예에서, 추가의 처리는 폭쇄된 물질의 효소 가수 분해이다. 이들 처리는 또한 임의의 조합으로 사용될 수 있다. 처리 유형은 유리되는 당의 유형(예를 들어, 5탄당 대 6탄당), 및 이들이 당해 공정에서 유리되는 단계에 영향을 미칠 수 있다. 결과로서, 이들이 주로 5탄당 또는 6탄당이든 상관없이 상이한 당 스트림이 형성될 수 있다. 따라서 이들 농축된 5탄당 또는 6탄당 스트림은 상이한 탄소 이용 능력을 갖는 특이적 미생물에 지시될 수 있다.
본 발명의 방법에서는 통상적으로 에탄올 발효에서 달성되는 것 보다 높은 세포 밀도로 발효가 이루어질 수 있다. 종속 영양성 셀룰로스 오일 생산을 위한 배양물의 보다 높은 밀도 때문에, 고정 탄소원(예를 들어, 셀룰로스 유래 당 스트림(들))은 바람직하게 농축된 형태로 존재한다. 해중합된 셀룰로스 물질의 글루코스 수준은 바람직하게 배양 단계 전에 300g/리터 이상, 400g/리터 이상, 500g/리터 이상 또는 600g/리터 이상이며, 상기 배양 단계는 임의로 유가식 배양이고, 여기서 상기 물질은 세포가 생장하고 지질을 축적함에 따라서 시간 경과에 따라 세포에 공급된다. 따라서, 리그노셀룰로스 오일의 생산 동안에 매우 높은 세포 밀도를 생성하고 유지하기 위해서, 탄소 공급원료(들)가 고농축된 형태로 종속 영양 배양물로 전달될 수 있다. 그러나, 유지성 미생물에 대한 기질이 아니고 유지성 미생물에 의해 대사되지 않는 공급 스트림에서 임의의 성분은 생물 반응기에 축적할 것이며, 이는 성분이 독성을 가지거나 원하는 최종 생성물의 생산을 억제하는 경우 문제점을 유발할 수 있다. 폭쇄 공정 및 후속적인 중화 공정 둘 다에서 셀룰로스 물질의 생성으로부터 유래된 푸르푸랄 및 하이드록시메틸 푸르푸랄 및 염과 같은 리그닌 및 리그닌 유래 부산물, 탄수화물 유래 부산물, 및 심지어 비대사된 펜토스/헥소스 당은 에탄올 발효에서 문제점을 제시할 수 있고, 이들 효과는 초기 공급원료에서 이들의 농도가 높은 공정에서 상당히 증폭된다. 본 발명에 기술된 리그노셀룰로스 오일의 대규모 생산에 사용될 수 있는 6탄당에 대한 300g/L 범위(또는 이보다 높은)의 당 농도를 성취하기 위해, 이들 독성 물질의 농도는 셀룰로스 바이오매스의 에탄올 발효물에 통상적으로 존재하는 농도보다 20배 높을 수 있다.
셀룰로스 물질의 폭쇄 공정 처리는 상당한 양의 황산, 열 및 압력을 사용함으로써 탄수화물의 부산물, 즉 푸르푸랄 및 하이드록시메틸 푸르푸랄을 유리시킨다. 푸르푸랄 및 하이드록시메틸 푸르푸랄은 자일로스의 푸르푸랄 및 물로의 탈수를 통한 헤미셀룰로스의 가수 분해 동안에 생성된다. 본 발명의 몇몇 구체예에서, 이들 부산물(예를 들어, 푸르푸랄 및 하이드록시메틸 푸르푸랄)은 생물 반응기로 도입하기 전에 당화된 리그노셀룰로스 물질로부터 제거된다. 본 발명의 특정 구체예에서, 탄수화물의 부산물의 제거 공정은 폭쇄된 셀룰로스 물질의 열수 처리이다. 추가로, 본 발명은 푸르푸랄 또는 하이드록시메틸 푸르푸랄과 같은 화합물에 내성일 수 있는 균주가 리그노셀룰로스 오일 생산에 사용되는 방법을 제공한다. 다른 구체예에서, 본 발명은 또한 발효 배지에서 푸르푸랄에 내성일 수 있는 것뿐만 아니라 실제로 리그노셀룰로스 오일의 생산 동안에 당해 부산물을 대사시킬 수 있는 미생물 및 방법을 제공한다.
상기 폭쇄 공정은 또한 상당한 수준의 염을 생성한다. 예를 들어, 폭쇄를 위한 통상적인 조건은, 폭쇄된 셀룰로스 바이오매스가 10:1의 물:고체(건조 중량)의 비율로 재현탁되는 경우 5mS/cm 초과의 전도성을 초래할 수 있다. 본 발명의 임의의 구체예에서, 희석된 폭쇄된 바이오매스는 효소 당화를 거치고, 생성된 상청액은 생물 반응기에 사용하기 위해 25배까지 농축된다. 농축된 당 스트림(들)에서 염 수준(전도성에 의해 측정됨)은 허용가능하지 않게 높을 수 있다(1.5M까지의 Na+ 당량). 추가의 염은 또한 후속적인 효소 당화 공정을 위해 폭쇄된 물질의 중화시 생성된다. 본 발명의 구체예는 이들 염을 제거하기 위한 방법을 제공하여 생성된 농축된 셀룰로스 당 스트림(들)이 리그노셀룰로스 오일을 생산하기 위한 종속 영양 공정에 사용될 수 있도록 한다. 몇몇 구체예에서, 상기 염을 제거하는 방법은, 예를 들어 이에 제한되지 않지만 DOWEX Marathon MR3과 같은 수지를 사용한 탈이온화이다. 임의의 구체예에서 수지 단계를 사용하는 탈이온화는 당화 전에, 바이오매스의 당 농축 또는 pH 조정 및 열수 처리 전, 또는 이들의 임의의 조합 전에 일어나며, 다른 구체예에서 상기 단계는 이들 공정 중 하나 이상 후에 수행한다. 다른 구체예에서, 폭쇄 공정 자체는 허용가능하지 않게 높은 수준으로 염이 생성되는 것을 피하도록 변화시킨다. 예를 들어, 셀룰로스 바이오매스의 황산(또는 기타 다른 산) 폭쇄에 대한 대안법은 기계적 펄핑으로 셀룰로스 바이오매스가 효소 가수 분해(당화)에 민감해지도록 하는 것이다. 또 다른 구체예에서, 고수준의 염에 내성인 미생물의 본래의 균주 또는 고수준의 염에 내성을 갖는 유전자 조작된 균주가 사용된다.
유지성 미생물을 사용하는 종속 영양 리그노셀룰로스 오일 생산에 사용하기 위한 폭쇄된 셀룰로스 바이오매스를 제조하는 방법에 대한 바람직한 구체예는 하기에 기술한다. 제1 단계는 재현탁된 폭쇄된 셀룰로스 바이오매스의 pH를 5.0 내지 5.3의 범위로 조정하고 이어서 셀룰로스 바이오매스를 3회 세척하는 것을 포함한다. 이러한 세척 단계는 탈염 및 이온 교환 수지, 역삼투압, 열수 처리(전술한 바와 같음) 또는 단지 반복적인 탈이온수 중의 재현탁 및 원심분리의 사용을 포함하는 다양한 수단에 의해 성취될 수 있다. 이러한 세척 단계는 전도성이 100μS/cm 내지 300μS/cm인 셀룰로스 스트림을 초래하고 상당한 양의 푸르푸랄 및 하이드록시메틸 푸르푸랄을 제거시킨다. 이러한 세척 단계로부터 경사분리(decant)는 헤미셀룰로스 분획물로부터 유리된 5탄당을 농축시키는 단계를 배제할 수 있다. 제2 단계는 세척된 셀룰로스 바이오매스의 효소 당화를 포함한다. 바람직한 구체예에서, 아셀레라제(Genencor)를 사용한다. 제3 단계는 상기 당화된 바이오매스의 원심분리 또는 경사분리 및 세정을 통한 당의 회수를 포함한다. 생성한 바이오매스(고체)는 연료로서 사용될 수 있거나 폐기물로 보내질 수 있는 에너지가 밀접한 리그닌 풍부 성분이다. 원심분리/경사분리 및 세정 공정에서 회수된 당 스트림을 수집한다. 제4 단계는 투과물의 회수와 함께 오염 고체를 제거하기 위한 마이크로여과를 포함한다. 제5 단계는 진공 증발기를 사용하여 성취될 수 있는 농축 단계를 포함한다. 이러한 단계는 P'2000(Sigma/Fluka)과 같은 소포제의 첨가를 임의로 포함할 수 있으며, 이는 생성된 당 공급원료의 단백질 함량으로 인해 때때로 필요하다.
본 발명의 방법의 다른 구체예에서, 탄소원은 글리세롤이며, 이는 바이오디젤 에스테르 결합 전이로부터 산성화 및 비산성화된 글리세롤 부산물을 포함한다. 하나의 구체예에서, 탄소원은 글리세롤 및 하나 이상의 기타 다른 탄소원을 포함한다. 몇몇 경우에, 글리세롤 및 하나 이상의 기타 다른 고정 탄소원 모두는 발효 초기에 미생물에 제공된다. 몇몇 경우에, 글리세롤 및 하나 이상의 기타 다른 고정 탄소원이 소정의 비율로 동시에 미생물에 제공된다. 몇몇 경우에, 글리세롤 및 하나 이상의 기타 다른 고정 탄소원은 발효 과정 동안에 소정의 속도로 미생물에 공급된다.
몇몇 미세 조류는 글루코스의 존재 하에서보다 글리세롤의 존재 하에서 보다 신속하게 세포 분열을 진행한다(PCT 공개 제2008/151149호 참조). 이들 경우에, 처음에 세포에 글리세롤을 공급하여 세포 밀도를 신속하게 증가시키고, 이어서 글루코스를 공급하여 지질을 축적시키는 2단계 생장 공정은 지질이 생산되는 효율을 개선시킬 수 있다. 에스테르 결합 전이 공정의 글리세롤 부산물의 사용은 생산 공정으로 도입되는 경우 상당한 경제적인 이점을 제공할 수 있다. 글리세롤 및 글루코스의 혼합물과 같은 기타 다른 공급 방법이 또한 제공된다. 상기 혼합물의 공급은 또한 동일한 경제적 이득을 취득한다. 추가로, 본 발명은 미세 조류에 글리세롤과의 다양한 조합으로 수크로스와 같은 대안적인 당을 공급하는 방법을 제공한다.
본 발명의 방법의 다른 구체예에서, 탄소원은 전화당이다. 전화당은 수크로스에 비하여 결정화되려는 성향이 약하므로, 저장 및 유가식 발효에 이점을 제공할 수 있으며, 미세 조류를 포함하는 미생물의 종속 영양 배양의 경우, 농축된 탄소원을 필요로 한다. 하나의 구체예에서, 탄소원은 전화당, 바람직하게는 농축된 형태의 전화당이며, 바람직하게는 배양 단계, 임의로는 유가식 배양 단계 이전에 800g/리터 이상, 900g/리터 이상, 1000g/리터 이상 또는 1100g/리터 이상으로 존재한다. 전화당, 바람직하게 농축된 형태의 전화당은 세포가 생장하고 지질을 축적함에 따라서 시간 경과에 따라 세포에 공급된다.
본 발명의 방법의 다른 구체예에서, 탄소원은 수크로스이며, 이는 사탕수수 가공 유래의 진한 감자 당즙과 같이 수크로스를 함유하는 복합 공급원료를 포함한다. 종속 영양 오일 생산용 배양물의 밀도가 더 높기 때문에, 고정된 탄소원(예를 들어, 수크로스, 글루코스 등)은 바람직하게 농축된 형태이며, 바람직하게는 배양 단계, 임의로는 세포가 생장하고 지질을 축적함에 따라서 시간 경과에 따라 물질이 세포에 공급되는 유가식 배양 단계 이전에 500g/리터 이상, 600g/리터 이상, 700g/리터 이상 또는 800g/리터 이상으로 존재한다. 몇몇 경우에 있어서, 탄소원은 진한 감자 당즙의 형태, 바람직하게는 농축된 형태의 수크로스이며, 바람직하게는 배양 단계, 임의로는 유가식 배양 단계 이전에 60% 이상의 고체 또는 약 770g/리터 당, 70% 이상의 고체 또는 약 925g/리터 당, 또는 80% 이상의 고체 또는 약 1125g/리터 당으로 존재한다. 농축된 진한 감자 당즙은 세포가 생장하고 지질을 축적함에 따라서 시간 경과에 따라 세포에 공급된다.
하나의 구체예에서, 배양 배지는 하나 이상의 수크로스 이용 효소를 추가로 포함한다. 몇몇 경우에 있어서, 수크로스 이용 효소는 수크로스 인버타제이다. 수크로스 인버타제 효소는 미생물 군집에 의해 발현되는 외인성 수크로스 인버타제 유전자에 의해 암호화되는 분비성 수크로스 인버타제 효소일 수 있다. 분비성 수크로스 인버타제는 미생물에 의해 배양 배지 중에 분비될 수 있으며, 그 결과 배지 중 수크로스는 미생물에 의해 사용될 글루코스와 프럭토스로 전환된다. 이하에 기술된 바와 같이, 수크로스 인버타제는 재조합될 수 있으며, 이에 의해 순수하거나 복합적인 수크로스 공급 원료를 생장 또는 오일 생산용 고정 탄소원으로서 사용할 수 있는 능력을 미생물에 부여할 수 있다. 몇몇 경우에 하기 섹션 IV에 보다 상세하게 기술된 바와 같이, 미세 조류는 수크로스 수송체, 수크로스 인버타제, 헥소키나제, 글루코키나제 또는 프럭토키나제와 같은 수크로스 이용 효소를 발현하도록 유전자 조작하였다.
수크로스를 함유하는 복합 공급원료는 사탕수수 가공 유래의 폐기 당밀을 포함하며, 사탕수수 가공의 낮은 가치의 폐기물의 사용은 탄화수소 및 기타 다른 오일의 생성에 상당한 비용 절감을 제공할 수 있다. 본 발명의 방법에 유용한 수크로스를 함유하는 다른 복합 공급원료는 수수 시럽 및 순수한 수수를 포함하는 수수이다. 수수 시럽은 달콤한 수수 줄기의 즙으로부터 생산된다. 이의 당 프로필은 주로 글루코스(덱스트로스), 프럭토스 및 수크로스로 이루어진다.
4.
오일 생산
본 발명의 방법에 따른 오일 생산을 위해, 예를 들어 빛이 배양물에 입사할 수 없도록 하는 매우 대용량(40,000리터 이상)의 발효기를 사용하는 경우에서와 같이 암실에서 세포를 배양하는 것이 바람직하다. 종속 영양 종은, 고정 탄소원을 함유하는 배지에서 빛의 부재 하에 오일 생산을 위해 생장되고 번식되며, 상기 생장은 종속 영양 생장으로서 공지되어 있다.
하나의 예로서, 지질 생산 미세 조류 세포의 접종물을 배지에 도입하고, 세포가 번식을 시작하기 전에 지체(lag) 기간(지체 단계)이 있다. 지체 기간 후, 번식률은 일정하게 증가하고 대수기(log) 또는 지수기로 진입한다. 지수기에 이어서 차례로 질소와 같은 영양물의 감소, 및 독성 물질의 증가 및 쿼럼센싱(quorum sensing) 기작으로 번식이 느려진다. 상기와 같이 느려진 후, 번식은 멈추고 세포는 정지기 또는 일정한 생장 상태로 진입하며, 이는 세포에 제공된 특정 환경에 좌우된다. 지질 풍부 바이오매스를 수득하기 위해, 상기 배양물은 통상적으로 질소 또는 다른 주요 영양물(탄소 이외의 다른 영양물)이 고갈되게 함으로써 조기에 종결되어 세포가 과량으로 존재하는 탄소원을 지질로, 특히 트리글리세라이드로 전환하도록 하는 지수기의 말기 후에 잘 수거한다. 배양 조건 파라미터는 총 오일 생산, 생산된 지질 종의 조합 및/또는 특정 오일의 생산을 최적화하도록 조작될 수 있다.
본원에 개시된 세포에 의한 지질 생산은 영양물이 공급되거나 세포 분열의 부재 하에 계속적인 지질 생산을 가능하도록 하기에 여전히 이용가능한 정지기를 포함하는, 대수기 또는 이후 기간 동안에 일어날 수 있다.
바람직하게, 본원에 기술되고/기술되거나 당업계에 공지된 조건을 사용하여 생장한 미생물은 건조 세포 중량으로 약 20% 내지 30%, 30% 내지 40%, 40% 내지 50%, 50% 내지 60%, 60% 내지 70%, 또는 80% 내지 90% 이상의 트리글리세라이드를 포함한다. 가공 조건은 특정 용도에 적합한 지질의 수율을 증가시키고/증가시키거나 생산 비용을 절감시키도록 조정될 수 있다. 예를 들어, 임의의 구체예에서, 고정 탄소 에너지, 예를 들어 글루코스를 과량으로 제공하면서, 미세 조류는 하나 이상의 영양분, 예를 들어 질소, 인 또는 황의 제한 농도의 존재 하에서 배양한다. 질소 제한은 질소가 과량으로 제공된 배양물에서의 미생물 지질 수율 이상으로 미생물 지질 수율(건조 세포 중량의 그램 당 생산된 지질의 양을 측정)을 증가시키는 경향이 있다. 특정 구체예에서, 지질 수율의 증가는 약 10%, 50%, 100%, 200%, 또는 500% 이상이다. 상기 미생물은 전체 배양 기간 중 일부 동안 또는 전체 기간 동안 제한된 양의 영양물의 존재 하에 배양할 수 있다. 특정 구체예에서, 영양물 농도는 총 배양 기간 동안 2회 이상 제한 농도와 비제한 농도 사이에서 순환한다. 세포의 지질 함량은 과량의 탄소를 제공하지만 질소를 제한하거나 제공하지 않으면서 증가된 기간 동안 배양을 계속함으로써 증가시킬 수 있다.
다른 구체예에서, 지질 수율은 지질 경로 효소(예를 들어, 지방산 합성 효소의 조효소 또는 보결 분자단)를 위한 하나 이상의 조인자(들)의 존재 하에 지질 생산 미생물(예를 들어, 미세 조류)을 배양함으로써 증가된다. 일반적으로, 조인자(들)의 농도는 조인자(들)의 부재 하의 미생물 지질 수율 이상으로 미생물 지질(예를 들어, 지방산) 수율을 증가시키기에 충분하다. 특정 구체예에서, 상기 조인자(들)는 배양물에 조인자(들)를 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세 조류)을 포함시킴으로써 배양물에 제공된다. 대안적으로, 조인자(들)는 조인자의 합성에 관여하는 단백질을 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세 조류)를 포함시킴으로써 배양물에 제공될 수 있다. 임의의 구체예에서, 적합한 조인자는 예를 들어, 비오틴 또는 판토테네이트와 같은 지질 경로 효소에 의해 요구되는 임의의 비타민을 포함한다. 본 발명에 사용하기에 적합한 조인자를 암호화하거나 상기 조인자의 합성에 관여하는 유전자는 널리 공지되어 있고 전술한 것들과 같은 기술 및 구조물을 사용하여 미생물(예를 들어, 미세 조류)에 도입될 수 있다.
본원에 기술된 생물 반응기, 배양 조건 및 종속 영양 생장 및 번식 방법의 특정 예를 임의의 적합한 방식으로 조합하여 미생물 생장 및 지질 및/또는 단백질 생산의 효율을 개선시킬 수 있다.
건조 중량으로 높은 백분율의 오일/지질이 축적된 미세 조류 바이오매스는 당업계에 공지된 상이한 배양 방법을 사용하여 생성되었다(PCT 공개 제2008/151149호 참조). 본원에 기술되고 본 발명에 따라 유용한 배양 방법에 의해 생성된 미세 조류 바이오매스는 건조 중량으로 10% 이상의 미세 조류 오일을 포함한다. 몇몇 구체예에서, 미생물 바이오매스는 건조 중량을 기준으로 25%, 50%, 60%, 70% 이상, 또는 80% 이상의 미세 조류 오일을 포함한다. 몇몇 구체예에서, 미세 조류 바이오매스는 건조 중량으로 10% 내지 90%의 미세 조류 오일, 25% 내지 75%의 미세 조류 오일, 40% 내지 75%의 미세 조류 오일, 75% 내지 85% 또는 50% 내지 70%의 미세 조류 오일을 함유한다.
본원에 기술된 바이오매스의 미세 조류 오일, 또는 본 발명의 방법 및 조성물에 사용하기 위한 바이오매스로부터 추출된 오일은 하나 이상의 별개의 지방산 에스테르 측쇄를 갖는 글리세로지질을 포함할 수 있다. 글리세로지질은 다양한 길이 및 다양한 포화도를 가질 수 있는 1개, 2개 또는 3개의 지방산 분자에 에스테르화된 글리세롤 분자로 구성된다. 지방산 분자(및 미세 조류 오일)의 길이 및 포화 특성은 하기 섹션 IV에서 보다 상세하게 기술된 바와 같은 배양 조건을 통해 또는 지질 경로 조작을 통해 본 발명의 구체예의 미세 조류 오일 중 지방산 분자의 특성 또는 비율을 변형시키기 위해 조작될 수 있다. 특성과 비율의 특정 변형은 미생물 트리글리세라이드의 지방산 분포 변화, 예를 들어 지방산의 사슬 길이 프로필, 포화 프로필 및 하이드록실화의 변화를 포함한다. 이와 같이 생산된 오일은 천연 오일을 포함할 수 있다. 대안적으로, 미생물 오일의 특이적 배합물은 2가지 이상의 미세 조류 종으로부터 바이오매스 또는 조류 오일을 함께 혼합함으로써, 또는 대두, 평지씨, 카놀라, 야자, 팜핵, 코코넛, 옥수수, 폐기 식물, 오구나무(Chinese tallow), 올리브, 해바라기, 면화씨, 닭 지방, 우지, 돈지(porcine tallow), 미세 조류, 거대 조류, 미생물, 쿠페아(Cuphea), 아마, 땅콩, 초이스 백색 그리스(choice white grease), 라드, 양구슬냉이(Camelina sativa), 겨자씨, 캐슈 너트, 귀리, 루핀, 양마, 금잔화, 대마, 커피, 아마인(아마), 헤이즐넛, 등대풀속, 호박씨, 고수, 동백나무, 참깨, 홍화, 벼, 유동, 코코아, 코프라, 양귀비, 아주까리씨, 피칸, 호호바, 마카다미아, 브라질 너트, 아보카도, 석유 또는 상기 오일 중 임의의 증류 분획물과 같은 기타 다른 공급원 유래의 오일과 본 발명의 조류 오일을 배합함으로써 조류의 단일 종 내에서 제조할 수 있다.
오일 조성물, 즉 글리세로지질의 지방산 성분의 특성 및 비율은 또한 미생물의 2가지 이상의 별개 종으로부터 유래한 바이오매스 또는 오일을 조합함으로써 조작할 수 있다. 몇몇 구체예에서, 미세 조류의 2가지 이상의 별개 종은 상이한 글리세로지질 프로필을 갖는다. 미세 조류의 별개 종은 바람직하게 종속 영양 조건 하에 본원에 기술된 바와 같이 함께 배양하거나 별도로 배양하여 각각의 오일을 생성할 수 있다. 미세 조류의 상이한 종은 세포의 글리세로지질 내 상이한 백분율의 별개의 지방산 성분을 함유할 수 있다.
일반적으로, 프로토테카 균주는 사슬 길이가 C8 내지 C14인 지방산을 매우 적게 갖거나 또는 전혀 갖지 않는다. 예를 들어, 프로토테카 모리포르미스(UTEX 1435), 프로토테카 크루가니(Prototheca krugani)(UTEX 329), 프로토테카 스태그노라(UTEX 1442) 및 프로토테카 조프피(UTEX 1438)는 C8 지방산을 함유하지 않고(또는 검출가능하지 않은 양으로 함유함) C10 지방산을 0% 내지 0.01%, C12 지방산을 0.03% 내지 2.1%, C14 지방산을 1.0% 내지 1.7%를 함유한다.
몇몇 경우에 있어서, 사슬 길이가 C8 또는 C8 내지 10인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C8인 지방산을 1.5% 이상, 3.0% 이상, 10% 이상, 12% 이상, 또는 그 이상 가진다. 다른 경우에 있어서, 사슬 길이가 C10인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실 ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C10인 지방산을 5.0% 이상, 10.0% 이상, 24% 이상, 29% 이상, 또는 그 이상 가진다. 다른 경우에 있어서, 사슬 길이가 C12인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C12인 지방산을 5% 이상, 15% 이상, 34% 이상, 50% 이상, 또는 그 이상 가진다. 다른 경우에 있어서, 사슬 길이가 C14인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C14인 지방산을 2.0% 이상, 7% 이상, 10% 이상, 15% 이상, 30% 이상, 또는 43% 이상, 또는 그 이상 가진다. 다른 경우에 있어서, 사슬 길이가 C16인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C16인 지방산을 30% 이상, 40% 이상, 66% 이상, 또는 그 이상 가진다. 또 다른 경우에 있어서, 사슬 길이가 C18인 지방 아실-ACP 기질, 특히 C18:0에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 C18:0 지방산 수준이 5% 이상, 10% 이상, 26% 이상, 40% 이상, 또는 그 이상이다. 이와 같은 예들 중 임의의 것에 있어서, 미생물은 미세 조류, 예를 들어 프로토테카일 수 있다.
비제한적인 예에 있어서, 사슬 길이가 C8인 지방 아실-ACP 기질에 대하여 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C8인 지방산을 1% 내지 20%, 바람직하게는 1.8% 내지 13% 가진다. 다른 비제한적인 예에서, 사슬 길이가 C10인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C10인 지방산을 1% 내지 40%, 바람직하게는 1.91% 내지 30% 가진다. 다른 비제한적인 예에서, 사슬 길이가 C12인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C12인 지방산을 10% 내지 60%, 바람직하게는 13.55% 내지 55% 가진다. 기타 비제한적인 예에서, 사슬 길이가 C14인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C14인 지방산을 1% 내지 50%, 바람직하게는 2.59% 내지 43.27% 가진다. 다른 비제한적인 예에서, 탄소 사슬 길이가 다양한 지방 아실-ACP 기질에 대한 특이성이 넓은 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C16인 지방산을 70% 이하 가진다. 다른 경우에서, 사슬 길이가 C16인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 사슬 길이가 C16인 지방산을 75% 이하, 바람직하게는 67.42% 이하 가진다. 몇몇 경우에 있어서, 사슬 길이가 C8 내지 C14인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 (C8 내지 C14) 지방산을 1% 내지 790%, 또는 약 2% 내지 80% 가진다. 몇몇 경우에 있어서, 사슬 길이가 C12 내지 C14인 지방 아실-ACP 기질에 대한 활성을 가지는 지방 아실-ACP 티오에스테라제를 암호화하는 이식 유전자 함유 미생물 균주는 C12 내지 C14 지방산을 50% 이상 또는 60% 이상 가진다. 몇몇 경우에 있어서, 특정 사슬 길이의 원하는 지방산이 증가하게 되므로, 일정하면서 높은 선택압 하에 이식 유전자 함유 미생물 균주가 외인성 유전자를 보유하도록 유지시키는 것은 유리하다. 외인성 유전자 보유의 고수준은 또한 본원에 개시된 방법 및 상동성 재조합 벡터를 사용하여 세포의 핵내 염색체에 외인성 유전자를 삽입함으로써 성취될 수 있다. 핵내 염색체에 통합된 외인성 유전자를 함유하는 재조합 세포는 본 발명의 목적이다. 이와 같은 예들 중 임의의 것에 있어서, 미생물은 미세 조류, 예를 들어 프로토테카일 수 있다.
임의로, 미생물 오일은 또한 미세 조류에 의해 생산되거나, 배양 배지로부터 유래하는 미세 조류 오일에 통합되는 기타 다른 성분들을 포함할 수도 있다. 이러한 기타 다른 구성 성분들은 미세 조류를 배양하는데 사용되는 배양 조건, 미세 조류의 종, 바이오매스로부터 미세 조류 오일을 회수할 때 사용되는 추출 방법, 그리고 미세 조류 오일 조성에 영향을 미칠 수 있는 기타 다른 인자들에 따라서 다양한 양으로 존재할 수 있다. 이와 같은 성분들의 비제한적인 예로서는 카로티노이드(오일 중 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.05mcg/g 내지 0.244mcg/g으로 존재), 엽록소 A(오일 중 0.025mcg/g 내지 0.3mcg/g, 바람직하게는 0.045mcg/g 내지 0.268mcg/g으로 존재); 총 엽록소(오일 중 0.03mcg/g 미만, 바람직하게는 0.025mcg/g 미만으로 존재); 감마 토코페롤(오일 중 35mcg/g 내지 175mcg/g, 바람직하게는 38.3mcg/g 내지 164mcg/g으로 존재); 총 토코페롤(오일 중 50mcg/g 내지 300mcg/g, 바람직하게는 60.8mcg/g 내지 261.7mcg/g으로 존재); 브라시카스테롤, 캄페스테롤, 스티그마스테롤 또는 베타시토스테롤(0.5% 미만, 바람직하게는 0.25% 미만으로 존재); 총 토코트리에놀(오일 중 300mcg/g 미만으로 존재); 그리고 총 토코트리에놀(오일 중 225mcg/g 내지 350mcg/g, 바람직하게는 249.6mcg/g 내지 325.3mcg/g으로 존재)을 포함한다.
기타 다른 성분으로서는 인지질, 토코페롤, 토코트리에놀, 카로티노이드(예를 들어, 알파-카로틴, 베타-카로틴 및 라이코펜 등), 잔토필(예를 들어, 루테인, 제아잔틴, 알파-크립토잔틴 및 베타-크립토잔틴) 및 다양한 유기 또는 무기 화합물을 포함할 수 있으나, 이에 제한되는 것은 아니다. 몇몇 경우에 있어서, 프로토테카 종으로부터 추출된 오일은 오일 1g당 0.001마이크로그램 내지 0.05마이크로그램의 루테인, 바람직하게는 0.003마이크로그램 내지 0.039마이크로그램의 루테인, 오일 1g당 0.005마이크로그램 미만의 라이코펜, 바람직하게는 0.003마이크로그램 미만의 라이코펜; 오일 1g당 0.005마이크로그램 미만의 베타 카로틴, 바람직하게는 0.003마이크로그램 미만의 베타 카로틴을 포함한다.
III
. 유전자 조작 방법 및 재료
본 발명은 프로토테카 세포를 유전자 변형시키기 위한 방법 및 재료 및 본 발명의 방법에 유용한 재조합 숙주 세포를 제공하고, 당해 숙주 세포는 재조합 프로토테카 모리포르미스, 프로토테카 조프피, 프로토테카 크루가니 및 프로토테카 스태그노라 숙주 세포를 포함하지만, 이에 제한되지 않는다. 이들 방법 및 재료의 기재는 독자의 편의를 위해 하위 섹션으로 나눈다. 하위 섹션 1에서, 형질 전환 방법을 기술한다. 하위 섹션 2에서 상동성 재조합을 사용한 유전자 조작 방법을 기술한다. 하위 섹션 3에서 발현 벡터 및 성분을 기술한다.
1.
조작 방법 - 형질 전환
세포는, 예를 들어 유전자 총(biolistics), 전기천공(문헌[Maruyama et al. (2004), Biotechnology Techniques 8:821-826] 참조), 유리 비드 형질 전환 및 탄화규소 휘스커 형질 전환을 포함하는 임의의 적합한 기술에 의해 형질 전환될 수 있다. 사용될 수 있는 다른 방법은 원형질체를 형성하고 CaCl2 및 폴리에틸렌 글리콜(PEG)을 사용하여 재조합 DNA를 미세 조류 세포에 도입하는 것을 수반한다(문헌[Kim et al. (2002), Mar . Biotechnol. 4:63-73] 참조, 상기 문헌은 클로렐라 엘립소이데아의 형질 전환을 위한 상기 방법의 사용을 보고함). 미세 조류의 동시 형질전환을 사용하여 2가지의 별개 벡터 분자를 세포에 동시에 도입할 수 있다(예를 들어, 문헌[Protist 2004 Dec;155(4):381-93] 참조).
또한 유전자 총 방법(예를 들어, 문헌[Sanford, Trends In Biotech. (1988) 6:299 302], 미국 특허 제4,945,050호 참조); 전기천공[문헌[Fromm et al., Proc. Nat'l. Acad. Sci. (USA) (1985) 82:5824 5828]; 레이져 빔, 미세주입 또는 DNA를 미세 조류로 도입할 수 있는 임의의 기타 다른 방법을 프로토테카 세포의 형질 전환에 사용할 수 있다.
2.
조작 방법 -
상동성
재조합
상동성 재조합은 상동성 영역을 정렬하고 교환하는 상보적 DNA 서열의 능력이다. 표적화된 게놈 서열(“주형”)과 상동성인 서열을 함유하는 이식 유전자 DNA(“공여체”)는 유기체에 도입된 다음, 상응하는 게놈 상동성 서열 부위에서 게놈으로 재조합을 진행한다.
숙주 유기체에서 상동성 재조합을 수행하기 위한 능력은 분자 유전학적 수준에서 수행될 수 있는 것에 대한 많은 실제 연관성을 갖고 맞춤 오일을 생성할 수 있는 유지성 미생물의 생성에 유용하다. 이의 매우 자연적인 상동성 재조합이란 정확한 유전자 표적화 사건이고, 따라서 동일한 표적화 서열로 생성된 대부분의 이식 유전자 계열은 표현형의 관점에서 근본적으로 동일하고 극소수의 형질 전환 사건의 스크리닝을 필요로 한다. 상동성 재조합은 또한 숙주 염색체로의 유전자 삽입 사건을 표적화하여, 잠재적으로 심지어 유전자 선별 부재 하에서도 우수한 유전학적 안정성을 가져온다. 상이한 염색체 유전자좌는 심지어 이종성 프로모터/UTR로부터 유전자 발현에 영향을 줄 가능성이 있기 때문에, 상동성 재조합은 잘 모르는 게놈 환경 내에서 유전자좌를 탐색하고 유전자 발현에 대한 이들 환경의 영향을 평가하는 방법일 수 있다.
상동성 재조합을 사용하는 특히 유용한 유전자 조작 접근법은 고도로 특이적인 방식으로 이종성 유전자 발현을 구동시키는 프로모터/UTR과 같은 특이적 숙주 조절 요소를 선택하는 것이다. 예를 들어, 선택 마커를 암호화하는 이종 유전자로 불포화 효소 유전자/유전자 군을 제거 또는 녹아웃하는 것은 숙주 세포 내에서 생산된 포화 지방산의 전체 백분율을 증가시킬 것으로 예상될 수 있다. 실시예 6은 상동성 재조합 표적화 구조물과, (프로토테카 모리포르미스 내에서 발생되는) 이와 같은 불포화 효소 유전자 제거 또는 녹아웃의 작업 실시예를 기술한다. 내인성 유전자의 발현을 감소시키기 위한 다른 접근법으로서는 유전자 발현을 RNA 유도 하향 조절 또는 침묵을 이용하는 접근법, 예를 들어 RNAi 또는 안티센스 접근법, 그리고 dsRNA 접근법(이에 제한되는 것은 아님)이 있다. 안티센스, RNAi, dsRNA 접근법은 당업계에 널리 공지되어 있으며, mRNA로서 발현될 때 헤어핀 RNA를 형성시킬 발현 구조물 또는 안티센스 배향으로 전사될 표적 유전자의 일부를 함유하는 발현 구조물의 도입을 포함한다. 3가지 접근법 모두는 표적 유전자의 발현의 감소를 가져올 것이다. 실시예 6은 또한 발현 구조물과, RNAi 및 안티센스 접근법에 의해 내인성 프로토테카 모리포르미스 델타 12 불포화 효소 유전자(FADc)를 하향 조절하는 작업 실시예를 기술한다.
상동성 재조합은 정확한 유전자 표적화 사건이기 때문에, 충분한 측접(flanking) 영역이 확인되었다면, 관심의 유전자 또는 영역 내 임의의 뉴클레오티드(들)를 정확히 변형시키는데 사용될 수 있다. 따라서, 상동성 재조합은 RNA 및/또는 단백질의 유전자 발현에 영향을 주는 조절 서열을 변형시키기 위한 수단으로서 사용될 수 있다. 이것은 또한 기질 특이성, 친화성 및 Km과 같은 효소 활성을 변형시킴에 따라서 숙주 세포의 대사에서 원하는 변화에 영향을 주고자 단백질 암호화 영역을 변형시키는데 사용될 수 있다. 상동성 재조합은 숙주 게놈을 조작하여 유전자 표적화, 유전자 전환, 유전자 결실, 유전자 복제, 유전자 역위를 가져오고, 프로모터, 인핸서 및 3'UTR과 같은 유전자 발현 조절 요소를 교환하기 위한 강력한 수단을 제공한다.
상동성 재조합은 내인성 숙주 세포 게놈 내에 관심의 유전자 또는 영역을 “표적화”하기 위한 내인성 서열 조각을 함유하는 표적화 구조물을 사용하여 성취될 수 있다. 상기 표적화 서열은 관심의 유전자 또는 영역의 5'에 위치하거나 관심의 유전자/영역의 3'에 위치하거나 심지어 관심의 유전자/영역을 측접할 수 있다. 상기 표적화 구조물은 추가의 벡터 골격과 함께 고차코일화된 플라스미드 DNA로서, 벡터 골격을 갖지 않는 PCR 생성물로서 또는 선형화된 분자로서 숙주 세포로 형질 전환될 수 있다. 몇몇 경우에, 이것은 먼저 제한 효소에 이식 유전자 DNA(공여체 DNA)내의 상동성 서열을 노출시키는 것이 유리할 수 있다. 상기 단계는 재조합 효율을 증가시킬 수 있고 원하지 않는 사건의 발생을 감소시킬 수 있다. 재조합 효율을 증가시키는 기타 다른 방법은 PCR을 사용하여 표적화된 게놈 서열에 상동성인 선형 말단을 함유하는 형질 전환 이식 유전자 DNA를 생성시키는 것을 포함한다.
비제한적 예시를 위하여, 상동성 재조합에 유용한 공여 DNA 서열 영역은 프로토테카 모리포르미스 내 DNA의 KE858 영역을 포함한다. KE858은 단백질의 운반 RNA(tRNA) 군과 상동성을 공유하는 단백질의 암호화 영역의 일부를 포함하는, 1.3kb 크기의 게놈 단편이다. 서던 블럿은, KE858 서열이 프로토테카 모리포르미스(UTEX 1435) 게놈 내 단일 복사체로 존재한다는 것을 보여주었다. 이 영역과, 이 영역을 상동성 재조합 표적화에 이용하는 실시예는 PCT 출원 PCT/US2009/066142호에 기술되어 있다. 유용한 공여체 DNA의 다른 영역은 본원에서 “6S”라고 칭하여지는 게놈 서열(서열 번호 82 및 서열 번호 84의 공여체 서열)이다. 6S 서열은 6S rRNA 서열이 아니라는 것을 주목한다. 이 서열을 프로토테카 모리포르미스 내 상동성 재조합에 사용하는 것은 이하 실시예에 기술되어 있다.
3.
벡터 및 벡터 성분
본 발명에 따라 미생물을 형질 전환시키기 위한 벡터는 본원에 개시된 바를 고려하여 당업자에게 익숙한 공지된 기술에 의해 제조할 수 있다. 벡터는 통상적으로 하나 이상의 유전자를 함유하며, 여기서 각각의 유전자는 원하는 생성물(유전자 생성물)의 발현을 암호화하고 유전자 발현을 조절하거나 유전자 생성물을 재조합 세포 내 특정 위치에 표적화하는 하나 이상의 제어 서열에 작동적으로 연결되어 있다. 독자를 돕기 위해, 본 하위 섹션은 여러 하위 섹션으로 나누어진다. 하위 섹션 A는 통상적으로 벡터 상에 함유된 제어 서열뿐만 아니라 본 발명에 의해 제공된 신규 제어 서열을 기술한다. 하위 섹션 B는 벡터 내에 통상적으로 함유된 유전자뿐만 아니라 신규 코돈의 최적화 방법 및 본 발명에 의해 제공된 것들을 사용하여 제조된 유전자를 기술한다.
A. 제어 서열
제어 서열은 암호화 서열의 발현을 조절하거나 유전자 생성물을 세포 내부 또는 외부의 특정 위치로 지시하는 핵산이다. 발현을 조절하는 제어 서열은, 예를 들어 암호화 서열의 전사를 조절하는 프로모터 및 암호화 서열의 전사를 종결시키는 종결자를 포함한다. 다른 제어 서열은 폴리아데닐화 신호를 암호화하는 암호화 서열의 말단에 위치한 3' 비번역 서열이다. 유전자 생성물을 특정 위치로 지시하는 제어 서열은 단백질이 세포 내부 또는 외부의 특정 위치에 부착되는 위치로 지시하는 신호 펩티드를 암호화하는 것들을 포함한다.
따라서, 미세 조류 내 외인성 유전자의 발현을 위한 예시적인 벡터 설계는 미세 조류내에서 활성인 프로모터에 작동 가능하도록 결합된 원하는 유전자 생성물(예를 들어, 선택가능한 마커, 지질 경로 변형 효소 또는 수크로스 이용 효소)에 대한 암호화 서열을 함유한다. 대안적으로, 벡터가 관심의 암호화 서열과 작동가능하게 연결된 프로모터를 함유하지 않는 경우, 상기 암호화 서열은 이것이 벡터 통합 지점에서 내인성 프로모터와 작동가능하게 연결되도록 세포 내로 형질 전환될 수 있다. 형질 전환의 프로모터 부재 방법은 미세 조류에서 작동하는 것으로 입증되었다(예를 들어, 문헌[Plant Journal 14:4, (1998), pp.441-447] 참조).
많은 프로모터, 예를 들어 형질 전환된 조류에 내인성이 아닌 프로모터(즉, 다른 조류 유래의 프로모터, 고등 식물 유래의 프로모터 및 식물 바이러스 또는 조류 바이러스 유래의 프로모터)뿐만 아니라 형질 전환된 조류에 내인성인 프로모터는 미세 조류 내에서 활성이다. 미세 조류 내에서 활성인 예시적인 외인성 및/또는 내인성 프로모터(또한 미세 조류에서 기능하는 항생제 내성 유전자)는 PCT 공개 제2008/151149호 및 본원에 인용된 참조 문헌에 기술되어 있다.
외인성 유전자를 발현시키는데 사용되는 프로모터는 상기 유전자에 자연적으로 연결되는 프로모터일 수 있거나 이종성 프로모터일 수 있다. 몇몇 프로모터는 하나 초과의 미세 조류 종에서 활성이다. 기타 다른 프로모터는 종 특이적이다. 예시적인 프로모터로서는 하기 실시예에 사용된 클라미도모나스 레인하르드티(Chlamydomonas reinhardtii) 유래의 β-튜불린과 같은 프로모터, 및 다수의 미세 조류 종에서 활성인 것으로 밝혀진 콜리플라워 모자이크 바이러스(CMV) 및 클로렐라 바이러스와 같은 바이러스 프로모터를 포함한다(예를 들어, 문헌[Plant Cell Rep. 2005 Mar;23(10-11):727-35]; [J Microbiol. 2005 Aug;43(4):361-5]; [Mar Biotechnol (NY). 2002 Jan;4(l):63-73] 참조). 프로토테카에서 외인성 유전자의 발현에 사용하기에 적합한 다른 프로모터는 클로렐라 소로키니아나 글루타메이트 탈수소화 효소 프로모터/5 'UTR이다. 임의로, 프로모터를 함유하는 상기 서열중 10개, 20개, 30개, 40개, 50개, 또는 60개 이상의 뉴클레오티드가 사용된다. 프로토테카에서 외인성 유전자의 발현에 유용한 예시적인 프로모터는 본 출원의 서열 목록에 열거되어 있으며, 예를 들어 클로렐라 HUP1 유전자의 프로모터(서열번호 1) 및 클로렐라 엘립소이데아 질산염 환원 효소 프로모터(서열번호 2)가 있다. 클로렐라 바이러스 프로모터는 또한 프로토테카에서 미국 특허 제6,395,965호의 서열번호 1 내지 서열번호 7과 같은 유전자를 발현시키는데 사용될 수 있다. 프로토테카에서 활성인 추가의 프로모터는 예를 들어 문헌[Biochem Biophys Res Commun. 1994 Oct 14;204(l): 187-94]; [Plant Mol Biol. 1994 Oct;26(l):85-93]; [Virology. 2004 Aug 15;326(1): 150-9]; 및 [Virology. 2004 Jan 5;318(l):214-23]에서 찾을 수 있다. 기타 다른 유용한 프로모터는 이하 실시예에 상세히 기술되어 있다.
프로모터는 일반적으로 지속성(constitutive)이거나 유도성인 것으로서 특징지어질 수 있다. 지속성 프로모터는 일반적으로 동일한 수준에서 항상(또는 세포 수명 사이클의 특정 시점에서) 발현을 구동하는데 활성이거나 발현을 구동하도록 작용한다. 역으로, 유도성 프로모터는 활성이거나(또는 불활성화되거나) 단지 자극에 응답하여 상당히 상향 조절되거나 하향 조절된다. 상기 프로모터 유형 둘 다 본 발명의 방법에 적용된다. 본 발명에서 유용한 유도성 프로모터는 외인성으로 제공된 소분자(예를 들어, 서열번호 1에서와 같이 글루코스), 온도(열 또는 냉), 배양 배지 내 질소 부재 등과 같은 자극에 응답하여 작동 가능하도록 결합된 유전자의 전사를 매개하는 것들을 포함한다. 적합한 프로모터는 근본적으로 사일런트 유전자의 전사를 활성화시킬 수 있거나 바람직하게 낮은 수준으로 전사된 작동 가능하도록 결합된 유전자의 전사를 상당히 상향 조절할 수 있다. 이하 실시예에는 프로토테카 세포 내에서 유용한 부가적인 유도성 프로모터를 기술한다.
종결 영역 제어 서열의 내포는 임의적이며, 상기 종결 영역은 비교적 상호교환가능하므로 사용되는 경우 상기 선택은 주로 편의를 위한 것이다. 상기 종결 영역은 전사 개시 영역(프로모터)에 고유한 것일 수 있거나, 관심의 DNA 서열에 고유한 것일 수 있거나, 다른 공급원으로부터 수득할 수 있다. 예를 들어, 문헌[Chen 및 Orozco, Nucleic Acids Res. (1988) 16:8411]를 참조한다.
본 발명은 또한 제어 서열과 재조합 유전자, 그리고 관심의 유전자 생성물을 특정 세포 구획, 예를 들어 엽록체, 색소체, 미토콘드리아 또는 소포체로 보내는 것을 가능하게 하는 유전자를 함유하는 벡터를 제공한다. 뿐만 아니라, 본 발명의 구체예는 제어 서열과 재조합 유전자, 그리고 세포 외부로 단백질의 분비를 가능하게 하는 유전자를 함유하는 벡터를 포함한다.
프로토테카 핵 게놈에서 발현되는 단백질은 색소체 표적화 신호를 사용하여 색소체로 표적화될 수 있다. 클로렐라에 내인성인 색소체 표적화 서열은, 예를 들어 색소체로 표적화되는 단백질을 암호화하는 클로렐라 핵 게놈 내 유전자들은 공지되어 있고, 이는 예를 들어 GenBank 수탁 번호 제AY646197호 및 제AF499684호를 참조하며, 하나의 구체예에서 이러한 제어 서열은 단백질의 발현을 프로토테카 색소체로 표적화하는 본 발명의 벡터 내에 사용된다.
하기 실시예는 숙주 세포 내 올바른 구획으로 이종성 단백질을 표적화하는 조류 색소체 표적화 서열의 용도를 기술한다. cDNA 라이브러리는 프로토테카 모리포르미스 및 클로렐라 프로토테코디에스(Chlorella protothecodies) 세포를 사용하여 제조되었으며 PCT 출원 PCT/US2009/066142호에 기술되어 있다.
본 발명의 다른 구체예에서, 프로토테카 내에서 폴리펩티드의 발현은 소포체로 표적화된다. 발현 벡터 내 적절한 보유 또는 분류 신호의 내포는 단백질이 소포체(ER)에 보유되고 골지체로 하류로 가지 않도록 하는 것을 보장한다. 예를 들어, IMPACTVECTOR 1.3 벡터(Wageningen UR- Plant Research International 제조)는 널리 공지된 KDEL 보유 또는 분류 신호를 포함한다. 상기 벡터와 함께, ER 보유는 이것이 발현 수준을 5배 이상으로 개선시킴이 보고되었다는 점에서 실제 이점을 갖는다. 이에 대한 주요 이유는 ER이 세포질 내 존재하는 것보다 발현된 단백질의 번역 후 분해에 관여하는 보다 낮은 농도이고/농도이거나 상이한 프로테아제를 함유하는 것으로 나타난다. 녹색 미세 조류에서 기능하는 ER 보유 신호는 공지되어 있다. 예를 들어, 문헌[Proc Natl Acad Sci U S A. 2005 Apr 26;102(17):6225-30]을 참조한다.
본 발명의 다른 구체예에서, 폴리펩티드는 배양 배지 내로 세포 외부로의 분비를 위해 표적화된다. 프로토테카에서 본 발명의 방법에 따라 사용될 수 있는 클로렐라 중에서 활성인 분비 신호에 대한 예는 문헌[Hawkins et al., Current Microbiology Vol. 38 (1999), pp. 335-341]을 참조한다.
B. 유전자 및 코돈 최적화
통상적으로, 유전자는 프로모터, 암호화 서열 및 종결 제어 서열을 포함한다. 재조합 DNA 기술에 의해 조립되는 경우, 유전자는 발현 카세트로 호칭될 수 있고, 재조합 유전자를 숙주 세포로 도입하는데 사용되는 벡터로의 편리한 삽입을 위한 제한 부위에 측접할 수 있다. 상기 발현 카세트는 상동성 재조합에 의해 발현 카세트의 게놈으로의 안정적인 통합을 촉진시키는, 게놈 또는 기타 다른 핵산 표적 유래의 DNA 서열에 측접할 수 있다. 대안적으로, 상기 벡터 및 이의 발현 카세트는 통합되지 않은 상태(예를 들어, 에피좀)로 유지될 수 있고, 이 경우에 상기 벡터는 통상적으로, 이종성 벡터 DNA의 복제를 제공할 수 있는 복제 기점을 포함한다.
벡터상에 존재하는 통상의 유전자는 단백질을 암호화하는 유전자이고, 이의 발현은 상기 단백질을 함유하는 재조합 세포가 상기 단백질을 발현하지 않는 세포로부터 구분될 수 있도록 한다. 상기 유전자 및 이의 상응하는 유전자 생성물은 선택가능한 마커 또는 선택 마커로서 호칭된다. 임의의 광범위하게 다양한 선택가능한 마커는 프로토테카를 형질 전환시키는데 유용한 이식 유전자 구조물에 사용될 수 있다. 적합한 선택가능한 마커의 예로서는 G418 내성 유전자, 질산염 환원 효소 유전자(문헌[Dawson et al. (1997), Current Microbiology 35:356-362] 참조), 하이그로마이신 포스포트랜스퍼라제 유전자(HPT; 문헌[Kim et al. (2002), Mar. Biotechnol. 4:63-73] 참조), 네오마이신 포스포트랜스퍼라제 유전자, 및 플레오마이신에 대해 내성을 부여하는 ble 유전자(문헌[Huang et al. (2007), Appl. Microbiol. Biotechnol. 72:197-205] 참조)를 포함한다. 항생제에 대한 미세 조류의 민감성을 측정하는 방법은 널리 공지되어 있다. 예를 들어 문헌[Mol Gen Genet. 1996 Oct 16;252(5):572-9]은 본원에 기술된 바와 같은 수크로스 인버타제 및 또한 본원에 기술된 바와 같은 티아민 영양 요구성 보완을 기술한다.
항생제를 바탕으로 하지 않는 기타 다른 선택가능한 마커도 또한 일반적으로 미세 조류(예를 들어, 프로토테카 종)를 형질 전환하는데 유용한 이식 유전자 구조물 내에 사용될 수 있다. 이전에는 미세 조류에 의해 이용될 수 없었던 임의의 탄소원을 이용하는 능력을 부여하는 유전자도 또한 선택가능한 마커로서 사용될 수 있다. 예를 들어, 프로토테카 모리포르미스 균주는 통상적으로 적어도 수크로스 상에서 잘 생장하지 못한다. 수크로스 인버타제 유전자를 함유하는 구조물의 사용으로 양성 형질 전환체가 탄소 기질인 수크로스 상에서 생장하는 능력을 부여할 수 있다. 기타 다른 선택가능한 마커와 함께 선택가능한 마커로서 수크로스를 활용하는 것에 관한 부연 설명은 이하 섹션 IV에 논의되어 있다.
본 발명의 목적을 위해, 본 발명의 재조합 숙주 세포를 제조하는데 사용되는 발현 벡터는 상기 유전자들 중 하나가 선택가능한 마커인 경우, 2개 이상, 흔히 3개의 유전자를 포함할 것이다. 예를 들어, 본 발명의 유전자 조작된 프로토테카는 선택가능한 마커뿐만 아니라 하나 이상의 외인성 유전자, 예를 들어 수크로스 인버타제 유전자 또는 아실 ACP-티오에스테라제 유전자를 포함하는 본 발명의 벡터로 형질 전환될 수 있다. 하나 또는 2개의 유전자는 지질 수율 및 지방산 에스테르로의 전환을 증진시키기 위해 상기 유전자들의 발현의 상대 타이밍이 제어될 수 있게 하는 유도성 프로모터를 사용하여 발현될 수 있다. 2개 이상의 외인성 유전자의 발현은 동일한 유도성 프로모터의 제어 하에 또는 상이한 유도성(또는 지속성) 프로모터의 제어 하에 있을 수 있다. 후자 상황에서, 제1 외인성 유전자의 발현은 제1 기간 동안 유도될 수 있고(제1 기간 동안에 제2 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있음) 제2 외인성 유전자의 발현은 제2 기간 동안 유도될 수 있다(제2 기간 동안에 제1 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있음).
다른 구체예에서, (임의의 선택가능한 마커에 추가로) 2개 이상의 외인성 유전자는 지방 아실-ACP 티오에스테라제 및 지방 아실-CoA/알데하이드 환원 효소이고, 상기 조합 작용은 알코올 생성물을 생성시킨다. 추가로 제한 없이 알데하이드를 생성하기 위한 지방 아실-ACP 티오에스테라제 및 지방 아실-CoA 환원 효소를 포함하는 외인성 유전자의 기타 다른 조합이 제공된다. 하나의 구체예에서, 벡터는 알칸을 생성하기 위한 지방 아실-ACP 티오에스테라제, 지방 아실-CoA 환원 효소 및 지방 알데하이드 탈카보닐화 효소의 조합을 제공한다. 이들 각각의 구체예에서, 외인성 유전자 중 하나 이상은 유도성 프로모터를 사용하여 발현될 수 있다.
2개 이상의 외인성 유전자를 발현하는 본 발명의 기타 다른 예시적인 벡터는 수크로스 수송체 및 수크로스 인버타제 효소 둘 다를 암호화하는 것들 및 선택가능한 마커 및 분비된 수크로스 인버타제 둘 다를 암호화하는 것들을 포함한다. 벡터중 어느 하나의 유형으로 형질 전환된 재조합 프로토테카는 탄소원으로서 사탕수수(및 사탕수수 유래 당)를 사용하는 조작된 능력으로 인하여 보다 낮은 제조 비용으로 지질을 생산한다. 전술한 2개의 외인성 유전자의 삽입은, 유도적 돌연변이 유발 및/또는 무작위 돌연변이 유발을 통해 다당류 생합성의 파괴와 조합될 수 있으며, 이는 지질 생산으로 훨씬 더 많은 탄소가 유입되게 한다. 개별적으로 및 조합적으로, 영양성 전환, 지질 생산을 변화시키기 위한 조작 및 외인성 효소를 사용한 처리는 미생물에 의해 생산되는 지질의 조성을 변형시킨다. 상기 변형은 미생물 내에서 생산되는 지질의 양, 기타 다른 지질과 비교하여 생산되는 하나 이상의 탄화수소 종의 양, 및/또는 생산되는 지질 종의 유형의 변화일 수 있다. 예를 들어, 미세 조류는 보다 높은 양 및/또는 %의 TAG(트리아실글리세라이드)를 생산하도록 조작될 수 있다.
재조합 단백질의 최적의 발현을 위해, 형질 전환될 숙주 세포에 의해 우선적으로 사용되는 코돈을 가지는 mRNA를 생산하는 암호화 서열을 사용하는 것이 이롭다. 따라서, 이식 유전자의 적절한 발현은, 이식 유전자의 코돈 사용 빈도가 이식 유전자가 발현되는 유기체의 특이적 코돈 편향에 부합하는 것을 필요로 할 수 있다. 상기 효과의 기저를 이루는 정확한 기작은 많지만, 상기 필요성이 충족되는 경우 이식 유전자 전령 RNA(mRNA)의 보다 효율적인 번역과 커플링되는, 세포 내에서 합성되는 단백질과 이용가능하게 아미노아실화된 tRNA 풀의 적당한 균형을 포함한다. 이식 유전자 내 코돈 사용 빈도가 최적화되지 않은 경우, 이용가능한 tRNA 풀은 이식 유전자 mRNA의 가능한 불안정성 및 리보솜 멈춤(stalling) 종결을 초래하는 이종성 mRNA의 효율적인 번역을 가능하게 하기에 충분하지 않다.
본 발명은 프로토테카 내에서 재조합 단백질의 성공적인 발현을 위해 유용한 코돈 최적화된 핵산을 제공한다. 프로토테카 종에서 코돈 사용 빈도는 프로토테카 모리포르미스로부터 분리된 cDNA 서열을 연구함으로써 분석되었다. 상기 분석은 24,000개 코돈에 걸친 탐색을 나타내며, 이의 결과는 하기의 표 2에 나타내었다.
다른 구체예에서, 재조합 벡터 내 유전자는 프로토테카 균주 이외의 다른 미세 조류 균주를 참조하여 코돈 최적화되었다. 예를 들어, 미세 조류 내 발현용 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기재되어 있다. 코돈 최적화를 위한 추가의 정보는, 예를 들어 GenBank의 코돈 사용 빈도 데이타베이스에서 입수할 수 있다.
코돈 최적화 유전자를 가지는 구체예와 관련하여, 최적화된 유전자는 바람직하게 10% 이상, 더욱 바람직하게는 20%, 40%, 60%, 80%, 100% 또는 200% 이상으로 최적화되는 유전자의 유전자 생성물의 발현을 증가시키도록 최적화된다.
본 발명의 방법 및 재료는 임의의 외인성 유전자의 프로토테카로의 도입을 허용하는 한편, 수크로스 이용 및 지질 경로 변형에 관한 유전자는 하기의 섹션에서 논의되는 바와 같이 특히 관심이 있는 것이다.
IV
. 선택가능한
마커
1.
수크로스
이용
하나의 구체예에서, 본 발명의 재조합 세포는 하나 이상의 외인성 수크로스 이용 유전자를 추가로 함유한다. 다양한 구체예에서, 하나 이상의 유전자는 프럭토키나제, 글루코키나제, 헥소키나제, 수크로스 인버타제 및 수크로스 수송체로 이루어진 군으로부터 선택되는 하나 이상의 단백질을 암호화한다. 예를 들어, 수크로스 수송체 및 수크로스 인버타제의 발현은 프로토테카가 수크로스를 배양 배지로부터 세포에 수송하여 수크로스를 가수 분해시켜 글루코스 및 프럭토스를 생성하도록 한다. 임의로, 내인성 헥소키나제 활성이 프럭토스의 최대 인산화에 불충분한 경우에도 또한 프럭토키나제는 발현될 수 있다. 적합한 수크로스 수송체의 예로서는 Genbank 수탁 번호 제CAD91334호, 제CAB92307호, 및 제CAA53390호가 있다. 적합한 프럭토키나제의 예로서는 Genbank 수탁 번호 제P26984호, 제P26420호 및 제CAA43322호가 있다.
하나의 구체예에서, 본 발명은 수크로스 인버타제를 분비하는 숙주 세포를 제공한다. 수크로스 인버타제의 분비는 수크로스를 세포 내로 수송할 수 있는 수송체의 발현에 대한 필요성을 제거한다. 이것은 분비된 인버타제가 수크로스 분자의 글루코스 분자 및 프럭토스 분자로의 전환을 촉매하기 때문이며, 이들 분자 둘 다는 본 발명에 의해 제공된 미생물에 의해 수송되고 이용될 수 있다. 예를 들어, 분비 신호(예를 들어, 서열번호 4(효모 유래), 서열번호 5(고등 식물 유래), 서열번호 6(진핵 공통 분비 신호) 및 서열번호 7(고등 식물 및 진핵 공통 서열 유래의 신호 서열의 조합체))와 함께 수크로스 인버타제(예를 들어, 서열번호 3)의 발현은 세포 외부에서 인버타제 활성을 생성시킨다. 본원에 개시된 유전자 조작 방법에 의해 가능해진 이러한 단백질의 발현은 이미 에너지원으로서 세포외 글루코스를 이용할 수 있는 세포가 세포외 에너지원으로 수크로스를 이용할 수 있게 한다.
수크로스 함유 배지에서 인버타제를 발현하는 프로토테카 종은 오일 생산을 위해 바람직한 미세 조류 종이다. 이러한 완전히 활성인 단백질의 발현 및 세포외 표적화는, 생성된 숙주 세포가 수크로스 상에서 생장할 수 있게 하는 반면에, 이 숙주 세포의 형질 전환되지 않은 대응 세포는 수크로스 상에서 생장할 수 없다. 그러므로, 본 발명의 구체예는 코돈 최적화 인버타제 유전자, 예를 들어 효모 인버타제 유전자(이에 제한되는 것은 아님)가 미세 조류 세포의 게놈에 통합되어 이 인버타제 유전자가 발현되는(이 유전자의 발현 여부는 인버타제 활성과 수크로스 가수 분해에 의해 평가됨) 재조합 미세 조류(예를 들어, 프로토테카) 세포를 제공한다. 인버타제 유전자는 재조합 세포 내 선택가능한 마커로서 유용하므로, 세포는 수크로스 상에서 생장할 수 있는 반면, 이 세포의 형질 전환되지 않은 대응 세포는 수크로스 상에서 생장할 수 없고, 조류 분자 유전학에 대하여 강력한 선택가능한 마커로서 인버타제를 사용하여 재조합 숙주 세포를 선택하는 방법에서도 유용하다.
프로토테카에서 수크로스 인버타제의 성공적인 발현은 또한, 이것이 이종성(재조합) 단백질이 조류 세포에서 발현되고 완전한 활성 및 기능적 형태로서 세포 외부로 및 배양 배지 내로 성공적으로 이동할 수 있음을 입증한다는 점에서 본 발명의 또 다른 양태를 설명한다. 따라서, 본 발명의 구체예는 미세 조류 내 광범위하고 다양한 집합체의 이종성 단백질을 발현하고 이들을 숙주 세포 외부로 분비시키기 위한 방법 및 시약을 제공한다. 상기 단백질은, 예를 들어 산업용 효소, 예를 들어 리파제, 프로테아제, 셀룰라제, 펙티나제, 아밀라제, 에스테라제, 산화 환원 효소, 트랜스퍼라제, 락타제, 이소머라제 및 인버타제, 및 치료학적 단백질, 예를 들어 생장 인자, 사이토킨, 2개의 경쇄 및 2개의 중쇄를 포함하는 전장 항체, Fab, scFv(단일쇄 가변 단편), 카멜리드형 항체, 항체 단편, 항체-단편 융합체, 항체-수용체 융합체, 인슐린, 인터페론 및 인슐린형 생장 인자를 포함한다.
프로토테카 내 수크로스 인버타제의 성공적인 발현은 또한, 이것이 프로토테카 내 단백질의 분비를 지시하기 위한 조류 내 진균류 수송 펩티드의 사용을 위한 방법 및 시약을 제공하고 펩티드가 프로토테카 세포에서 수송 펩티드로서 기능할 수 있는지의 여부 및 펩티드가 기능하는 능력을 결정하기 위한 방법 및 시약을 제공한다는 점에서 본 발명의 다른 양태를 설명한다. 본 발명의 방법 및 시약은 단백질을 세포 외로 성공적으로 수송할 수 있는 기타 다른 수송 펩티드를 확인하기 위한 도구 및 플랫폼으로서 사용될 수 있고, 이때 효모 인버타제가 이들 방법에서 우수한 용도를 갖는다. 본 실시예에서 입증된 바와 같이, 내인성 효모 인버타제 수송 펩티드의 제거, 숙주 조류에 내인성이거나 기타 다른 공급원(진핵, 원핵 및 바이러스)으로부터 유래하는 기타 다른 수송 펩티드에 의한 이의 대체로 관심의 임의의 펩티드가 세포로부터 단백질의 방출을 유도하는 수송 펩티드로서 기능할 수 있는지의 여부를 확인할 수 있다.
적합한 수크로스 인버타제의 예로서는 Genbank 수탁 번호 제CAB95010호, 제NP_012104호 및 제CAA06839호에 의해 확인된 것들을 포함한다. 적합한 인버타제의 비제한적인 예는 하기 표 3에 열거되어 있다. 각각의 열거된 인버타제에 대한 아미노산 서열은 하기의 서열 목록에 포함된다. 몇몇 경우에, 본 발명의 방법 및 벡터에 사용하기에 적합한 외인성 수크로스 이용 유전자는 표 3로부터 선택되는 수크로스 인버타제와 적어도 40%, 50%, 60%, 75%, 또는 90% 이상의 아미노산 동일성을 갖는 수크로스 인버타제를 암호화한다.
프로토테카에 의한 배양 배지로의 인버타제의 분비는 세포가 이들이 순수 시약 등급의 글루코스 상에 생장하는 바와 같이 사탕수수 가공으로부터 비롯된 폐기 당밀 상에서 생장할 수 있게 하고, 사탕수수 가공의 이러한 낮은 가치의 폐기물의 사용은 지질 및 기타 다른 오일의 제조에서 상당한 비용 절감을 제공할 수 있다. 따라서, 본 발명은 (i) 수크로스 및 (ii) 수크로스 인버타제 효소를 포함하는 배양 배지 및 프로토테카 미생물 집단을 함유하는 미생물 배양물을 제공한다. 다양한 구체예에서 배양물 내 수크로스는 수수, 사탕무, 사탕수수, 당밀 또는 해중합된 셀룰로스 물질(이것은 임의로 리그닌을 함유할 수 있음)로부터 유래한다. 다른 양태에서, 본 발명의 방법 및 시약은 재조합 미세 조류 또는 기타 다른 미생물에 의해 사용될 수 있는 공급원료의 수 및 유형을 상당히 증가시킨다. 본원에 예시된 미생물은 이들이 수크로스를 이용할 수 있도록 변형되는 한편, 본 발명의 방법 및 시약이 적용되어 셀룰로스와 같은 공급원료가 셀룰라제, 펙티나제, 이소머라제 등을 분비하는 능력을 갖는 본 발명의 조작된 숙주 미생물에 의해 이용될 수 있도록 하고 효소 반응의 분해 생성물은 더 이상 단순히 내성이 아니고 숙주에 의해 탄소원으로 이용된다. 이에 관한 예는 이하, 및 올리고당 내 α-갈락토실 결합, 예를 들어 라피노스 및 스타키오스(이들 올리고당 2개는 농업 폐기물 스트림에서 발견됨) 내에 함유된 α-갈락토실 결합을 가수 분해하는 능력을 부여하는, 분비성 α-갈락토시다제를 발현하도록 조작된 미생물에 관한 실시예에 기술되어 있다.
2. 알파-
갈락토시다제
발현
전술한 바와 같이, 수크로스 인버타제의 발현으로 프로토테카 세포가 수크로스를 (이당류 수크로스 내 프럭토스 및 글루코스 분자 사이 α-결합을 가수 분해하는 효소를 통해) 탄소원으로서 더욱 효과적으로 이용하는 능력을 부여하는 한편, 올리고당 내 기타 다른 유형의 α-결합을 가수 분해하는 기타 다른 효소의 발현으로 프로토테카 세포가 기타 다른 탄소원을 이용하는 능력을 부여할 수 있다. 이러한 효소의 발현(그리고 결과로 얻어진, 프로토테카 및 기타 다른 미세 조류 세포는 일반적으로 이용할 수 없는 탄소원을 이용하는 능력)은, 이러한 탄소원 상에서 생장할 수 있는 양성 클론을 선택할 수 있게 함으로써, 이러한 유전자 이식 프로토테카 세포에 대한 선택가능한 마커로서 사용될 수 있다.
하나의 구체예에서, 본 발명의 재조합 프로토테카 세포는 다당류 분해 효소를 암호화하는 하나 이상의 외인성 유전자를 추가로 함유한다. 다양한 구체예에서, 다당류 분해 효소를 암호화하는 하나 이상의 유전자는 분비된 α-갈락토시다제를 암호화하는 유전자이다. 프로토테카 세포 내에서 외인성 분비 α-갈락토시다제의 발현으로, 이와 같이 형질 전환된 균주가 D-갈락토실 결합, 예를 들어 갈락토스 및 글루코스 단당류 단위 사이의 α-결합을 함유하는 당(탄소원) 상에서 생장할 수 있는 능력을 부여한다. 외인성 분비 α-갈락토시다제를 발현하는 프로토테카 균주는 이당류, 예를 들어 멜리비오스(α-D-갈락토스-글루코스로 구성된 이당류)를 이용할 수 있을 것이다.
당, 예를 들어 라피노스(α-결합된 갈락토스-글루코스-프럭토스로 이루어진 삼당류) 및 스타키오스(2개의 α-결합 D-갈락토스 단위와, 이어서 α-결합 글루코스 및 프럭토스를 포함하는 사당류)는 농업 폐기물 스트림, 예를 들어 사탕무 펄프(라피노스) 및 대두 밀(스타키오스) 내에 상당한 비율로 존재한다. 이와 같은 농업 잔류물은, 이 잔류물을 이용할 수 있는 미생물(예를 들어, 프로토테카)에 의해 오일로 전환하는데 사용되기 전 상당한 탄소원을 대표한다.
프로토테카 균주는 올리고당, 예를 들어 라피노스 및 스타키오스를 임의의 상당한 양으로 이용할 수 없거나 전혀 이용할 수 없다. 라피노스와 스타키오스의 경우, (전술한 바와 같이) 수크로스 인버타제를 발현하는 유전자 이식 균주는 수크로스의 α-갈락토실 유도체 내 프럭토스와 글루코스 간 α-결합을 가수 분해하는 능력을 가지지만, 상기 수크로스 인버타제는 이와 같은 당 내 잔여 α-결합은 절단하지 않을 것이며, 생성된 이당류는 이용될 수 없으므로, 올리고당의 나머지는 이용되지 않은 상태로 남게 된다. 다른 구체예에서, 본 발명의 재조합 프로토테카 세포는 수크로스 인버타제를 암호화하는 외인성 유전자와 α-갈락토시다제를 암호화하는 외인성 유전자 둘 다를 포함한다. 따라서, 수크로스 인버타제와 α-갈락토시다제 둘 다를 발현하는 균주는 올리고당, 예를 들어 라피노스와 스타키오스를 완전히 가수 분해하여 구성 단량체들을 소모할 수 있을 것이다. 뿐만 아니라, α-갈락토시다제 암호화 유전자도 형질 전환에 있어서 선택가능한 마커로서 사용될 수 있다. 외인성 α-갈락토시다제 유전자를 함유하는 클론은 멜리비오스 상에서 생장하는 능력을 가질 것이다. 프로토테카 균주에 사용하기 적당한 α-갈락토시다제 유전자의 예로서는 사카로마이세스 칼베르젠시스로부터 유래하는 MEL1 유전자와 아스퍼질러스 나이저로부터 유래하는 AglC 유전자를 포함한다. 흥미로운 점은, 유전자가 프로토테카 균주 내 선호 코돈 사용 빈도에 따라서 최적화될지라도, 모든 α-갈락토시다제 유전자가 프로토테카 종 내에서 작용하는 것으로 관찰되지는 않는다는 점이다. 이하 실시예는 에스. 칼베르젠시스로부터 유래하는 코돈 최적화 MEL1 유전자와 에이. 나이저로부터 유래하는 AglC 유전자로 형질 전환되되, 고등 식물인 시아몹시스 테트라고노로바(Cyamopsis tetragonoloba)(구아 콩)로부터 유래하는 α-갈락토시다제 암호화 유전자로는 형질 전환되지 않을 때, 유전자 이식 프로토테카 세포가 멜리비오스 상에서 생장하는 능력을 입증한다.
3. 티아민 영양
요구성
보완
프로토테카 균주, 예를 들어 프로토테카 모리포르미스는 티아민 영양 요구성인 것으로 알려져 있는데(예를 들어, 문헌[Ciferri, O. (1956) Nature, v.178, pp. 1475-1476] 참조), 이는 상기 균주가 생장용 영양 배지 중에 티아민을 필요로 함을 의미한다. 티아민 영양 요구성은 돌연 변이, 또는 티아민 생합성 경로에 관여하는 효소들의 발현 부족의 결과일 수 있다. 이후, 티아민 생합성 경로에서 결여된 효소(들)를 발현하는 보완 유전자 이식 균주는 티아민이 첨가되지 않는 경우에도 생장할 수 있으므로, 영양 배지의 비용을 줄일 수 있을 뿐만 아니라, 생성된 미세 조류 바이오매스를 동물 먹이로서 사용함에 있어서 더욱 바람직하게 만들 수 있다. 티아민 생합성 경로 효소로 보완하는 것은 또한 유전자 이식된 유전자가 티아민을 함유하지 않는 평판/배지 상에서 생장할 수 있는 능력을 부여하므로, 선택가능한 마커로서 사용될 수도 있다.
하나의 구체예에서, 본 발명의 재조합 프로토테카 세포는 티아민 생합성 경로 효소를 암호화하는 하나 이상의 외인성 유전자를 추가로 함유한다. 다른 구체예에서, 본 발명의 재조합 프로토테카 세포는 조류, 식물 또는 시아노박테리아 공급원으로부터 유래하는 하이드록시메틸피리미딘 포스페이트 합성 효소를 암호화하는 외인성 유전자를 포함한다. 또 다른 구체예에서, 하이드록시메틸피리미딘 포스페이트 합성 효소는 THIC 유전자에 의해 암호화된다. 또 다른 구체예에서, THIC 유전자는 코코믹사(Coccomyxa) C-169 THIC, 아라비돕시스 탈리아나(Arabidopsis thaliana) THIC, 또는 시네코시스티스 종(Synechocystis sp .) PCC 6803 thiC이다. 이하 실시예는 티아민 원 영양성이 복구된 프로토테카 모리포르미스 UTEX 1435의 조작에 대해 상세히 기술한다.
V. 지질 경로 조작
수크로스 함유 공급원료와 같은 공급원료를 사용하는 미세 조류 또는 기타 다른 미생물의 능력을 변형시키는 것에 추가로, 본 발명은 또한 생산된 지질의 특성 및/또는 비율을 변화시키도록 변형된 재조합 미세 조류 또는 기타 다른 미생물을 제공한다. 상기 경로는 추가로 또는 대안적으로 지방산 경로에서 지질 및 중간체의 효소 가공을 통해 생성된 다양한 지질 분자의 특성 및/또는 비율을 변화시키도록 변형될 수 있다. 다양한 구체예에서, 본 발명의 재조합 프로토테카 세포는 이들의 형질 전환되지 않은 대응 세포에 비해 단위 용적당 및/또는 단위 시간당 최적화된 지질 수율, 탄소 사슬 길이(예를 들어, 재생 디젤 생산 또는 지질 공급원료를 필요로 하는 산업적 화학 제품), (임의로 0까지) 감소 또는 증가된 수 및/또는 위치의 이중 결합, 지방산의 하이드록실화 및 지질의 특정 종 또는 독특한 지질 집단의 수소:탄소 비율의 증가를 가진다.
특정 구체예에서, 지방산 합성으로의 대사에서 분기점을 제어하는 하나 이상의 주요 효소는 지질 생산을 개선시키기 위해 상향 조절되거나 하향 조절되었다. 상향조절은, 예를 들어 전사를 증가시키는 강한 프로모터 및/또는 인핸서 요소를 사용하여, 관심의 효소를 암호화하는 유전자가 발현되는 발현 구조물로 세포를 형질 전환시킴으로써 성취될 수 있다. 상기 구조물은 선택가능한 마커를 포함하여 상기 형질 전환체는 선택될 수 있고 이에 의해 유전자 유지, 및 가능하게는 구조물의 증폭과 암호화된 효소의 발현 수준의 증가를 가져올 수 있다. 본 발명의 방법에 따른 상향 조절을 위해 적합한 효소의 예는 피루베이트를 아세틸-CoA로 전환시키는 역할을 하는 피루베이트 탈수소화 효소 (예를 들어, 미세 조류 유래의 일부는 Genbank 수탁 번호 제NP_415392호; 제AAA53047호; 제QlXDMl호; 및 제CAF05587호를 포함함)를 포함한다. 피루베이트 탈수소화 효소의 상향조절은 아세틸-CoA의 생산을 증가시킬 수 있고, 이에 의해 지방산 합성을 증가시킬 수 있다. 아세틸-CoA 카복실라제는 지방산 합성에서 초기 단계를 촉매한다. 따라서, 상기 효소는 지방산의 생산을 증가시키기 위해 상향조절될 수 있다(예를 들어, 미세 조류 유래의 일부는 Genbank 수탁 번호 제BAA94752호; 제AAA75528호; 제AAA81471호; 제YP_537052호; 제YP_536879호; 제NP_045833호; 및 제BAA57908호를 포함함). 지방산 생산은 또한 지방산 합성 동안에 성장하는 아실 사슬을 운반하는 아실기 운반 단백질(ACP)의 상향 조절에 의해 증가될 수 있다(예를 들어, 미세 조류 유래의 일부는 Genbank 수탁 번호 제A0T0F8호; 제P51280호; 제NP_849041호; 제YP_874433호를 포함함). 글리세롤-3-포스페이트 아실트랜스퍼라제는 지방산 합성의 속도 제한 단계를 촉매한다. 상기 효소의 상향 조절은 지방산 생산을 증가시킬 수 있다(예를 들어, 미세 조류 유래의 일부는 Genbank 수탁 번호 제AAA74319호; 제AAA33122호; 제AAA37647호; 제P44857호; 및 제ABO94442호를 포함함).
유전자의 상향 조절 및/또는 하향 조절은 지방산 생합성 경로의 유전자의 발현을 제어하는 범용 조절제에 적용될 수 있다. 따라서, 지방산 합성의 하나 이상의 범용 조절제는 적절히 각각 다수의 지방산 합성 유전자의 발현을 억제하거나 증진시키고 궁극적으로 지질 생산을 증가시키도록 상향 또는 하향 조절될 수 있다. 이의 예로서는 스테롤 조절 요소 결합 단백질(SREBP), 예를 들어 SREBP-1a 및 SREBP-1c(예를 들어, Genbank 수탁 번호 제NP_035610호 및 제Q9WTN3호를 참조)를 포함한다.
본 발명은 또한 지질 변형 효소, 예를 들어 지방 아실-ACP 티오에스테라제(표 4 참조), 지방 아실-CoA/알데하이드 환원 효소(표 6 참조), 지방 아실-CoA 환원 효소(표 7 참조), 지방 알데하이드 탈카보닐화 효소(표 8 참조), 지방 알데하이드 환원 효소, 불포화 효소(예를 들어, 스테아로일-ACP 불포화 효소 및 지방 아실 불포화 효소 및 스쿠알렌 합성 효소(GenBank 수탁 번호 제AF205791호를 참조))를 암호화하는 하나 이상의 외인성 유전자를 함유하도록 변형된 재조합 프로토테카 세포를 제공한다. 지방 아실-ACP 티오에스테라제는 통상적으로 지질을 직접 화학 변형시키지는 않지만, 본 발명의 구체예에 따른 조작으로 세포의 지방산 프로필을, 특히 사슬 길이 및 이중 결합 분포 측면에서 변화시킬 수 있다. 몇몇 구체예에서, 지방 아실-ACP 티오에스테라제와 자연적으로 공동 발현되는 아실기 운반 단백질을 암호화하는 유전자는 임의로 기타 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 함께, 프로토테카 또는 기타 다른 미세 조류 세포 또는 미생물 세포로 형질 전환된다. 다른 구체예에서, ACP와 지방 아실-ACP 티오에스테라제는 이것들이 특정 조직이나 유기체 내에서 자연적으로 공동 발현되든지 발현되지 않든지 상관없이, 본 발명의 방법 및 미생물에서 상기 ACP와 지방 아실-ACP 티오에스테라제가 함께 사용될 때 이점을 부여하는 서로에 대한 친화성을 가질 수 있다. 따라서, 본 발명의 구체예는 상기 효소들의 자연적으로 공동 발현되는 쌍들뿐만 아니라, ACP로부터 길이 특이적 탄소 사슬의 절단을 촉진하기 위해 서로 상호 작용하기 위한 친화성을 공유하는 쌍들을 고려한다.
또 다른 구체예에서, 불포화 효소를 암호화하는 외인성 유전자는 지질 포화와 관련하여 변형을 제공하기 위해 기타 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 함께 미세 조류 또는 기타 다른 미생물 세포로 형질 전환된다. 다른 구체예에서, 내인성 불포화 효소 유전자는 (예를 들어, 부가의 유전자 유래 복사체들을 도입함으로써) 미세 조류 세포 또는 기타 다른 미생물 세포 내에서 과발현된다. 스테아로일-ACP 불포화 효소(예를 들어, GenBank 수탁 번호 제AAF15308호; 제ABM45911호; 및 제 AAY86086호 참조)는, 예를 들어 스테아로일-ACP의 올레오일-ACP로의 전환을 촉매한다. 상기 유전자의 상향 조절은 세포에 의해 생산된 단일불포화 지방산의 비율을 증가시킬 수 있는 반면, 하향 조절은 단일 불포화 지방의 비율을 감소시킬 수 있다. 예시적 목적으로, 스테아로일-ACP 불포화 효소(SAD)는 C18:0 전구체로부터 C18:1 지방산을 합성하는데 관여한다. 불포화 효소의 다른 군으로서는 지방 아실 불포화 효소(FAD), 예를 들어 델타 12 지방산 불포화 효소(Δ12 FAD)가 있다. 이러한 불포화 효소는 또한 지질 포화도에 대한 변형을 제공한다. 예시적 목적으로, 델타 12 지방산 불포화 효소는 C18:1 전구체로부터 C18:2 지방산을 합성하는데 관여한다. 유사하게, ω-6 지방산 불포화 효소, ω-3 지방산 불포화 효소, 또는 ω-6-올리에이트 불포화 효소와 같은 하나 이상의 글리세로지질 불포화 효소의 발현은 포화 지방산에 대한 불포화 지방산의 비율을 변화시키기 위해 제어될 수 있다. 몇몇 구체예에서, 불포화 효소는 불포화 효소가 특정 탄소 길이 기질 또는 특정 범위 내 탄소 길이를 갖는 기질 내에서 위치 특이적 변형을 만들 수 있도록 원하는 탄소 사슬 길이와 관련하여 선택될 수 있다. 다른 구체예에서, 만일 원하는 지방산 프로필이 단일 불포화 지방(예를 들어, C16:1 및/또는 C18:1)에 있어서 증가하면, SAD의 과발현 또는 이종 SAD의 발현은 (예를 들어, 돌연 변이, RNAi, 안티센스 또는 내인성 불포화 효소 유전자의 녹아웃 등을 통하여) 지방 아실 불포화 효소(FAD) 또는 다른 불포화 효소 유전자의 침묵 또는 불활성화와 결합될 수 있다.
다른 구체예에서, 미세 조류 세포 또는 기타 다른 미생물 세포는 돌연 변이된 내인성 불포화 효소 유전자를 가지도록 변형되었는데, 이 경우 상기 돌연 변이는 상기 유전자 또는 불포화 효소가 불활성이 되도록 만든다. 몇몇 경우에 있어서, 돌연 변이된 내인성 불포화 효소 유전자는 지방산 불포화 효소(FAD)이다. 다른 경우에 있어서, 돌연 변이된 내인성 불포화 효소 유전자는 스테아로일 아실기 운반 단백질 불포화 효소(SAD)이다. 이하 실시예 6은 프로토테카 내에서 스테아로일-ACP 불포화 효소 및 델타 12 지방산 불포화 효소의 표적화된 제거 또는 녹아웃을 기술한다. 실시예 6은 또한 내인성 불포화 효소 유전자의 발현을 감소시키는 RNAi 또는 안티센스 구조물의 사용을 기술한다.
몇몇 경우에 있어서, 원하는 지질 프로필을 생성하는 유전자 이식된 세포를 획득하기 위하여 유전자 조작 기술들 중 하나 이상을 함께 사용하는 것이 유리할 수 있다. 하나의 구체예에서, 미세 조류 세포 또는 기타 다른 미생물 세포는 돌연 변이된 내인성 불포화 효소 유전자와 하나 이상의 외인성 유전자를 포함한다. 비제한적인 실시예에서, 내인성 불포화 효소 유전자가 돌연 변이된 미세 조류 세포 또는 기타 다른 미생물 세포는 또한 외인성 지방 아실-ACP 티오에스테라제 유전자 및/또는 수크로스 인버타제 유전자를 발현할 수도 있다. 이하 실시예 6은 내인성 SAD가 표적화 제거 또는 녹아웃되었고, 신나모뮴 캠포라 C14 선호 티오에스테라제 및 수크로스 인버타제를 발현하는 유전자 이식 프로토테카 세포를 기술한다. 이와 같은 경우, 유전자 이식 프로토테카 세포는 우지에서 살펴볼 수 있는 지질 프로필과 매우 유사한 지질 프로필을 생성한다. 우지는 통상적으로 녹인 소 또는 양의 지방으로부터 유래하는 것으로서, 실온에서 고체이며, 식품, 화장품 및 화학 산업 분야에서 다양한 용도로 사용된다. 우지의 지방산 프로필은, C14:0 4%; C16:0 26%; C16:1 3%; C18:0 14%; C18:1 41%; C18:2 3%; 및 C18:3 1%이다. 이하 실시예 6에 나타낸 바와 같이, 내인성 SAD가 표적화 제거 또는 녹아웃되었고, 씨. 캠포라 C14 선호 티오에스테라제를 발현하는 유전자 이식 프로토테카 세포의 클론은 지질 프로필이, C12 및 이 보다 짧은 탄소 사슬 길이를 가지는 지방산 1% 미만; C14:0 2.74% 내지 6.13%; C16:0 23.07% 내지 25.69%; C18:0 7.02% 내지 11.08%; C18:1 42.03% 내지 51.21%; 및 C18:2 9.37% 내지 13.45%(면적 %로 표시함)이다. 몇몇 경우에 있어서, 유전자 이식 프로토테카 세포는 지질 프로필이, C14:0 3% 내지 5%; C16:0 25% 내지 27%; C18:0 10% 내지 15%; 및 C18:1 40% 내지 45%이다.
특정 구체예에서, 본 발명의 미생물은 아실-ACP 티오에스테라제, 아실-CoA/알데하이드 환원 효소, 지방 아실-CoA 환원 효소, 지방 알데하이드 환원 효소, 지방 알데하이드 탈카보닐화 효소 또는 자연적으로 공동 발현되는 아실기 운반 단백질로부터 선택되는 하나 이상의 외인성 유전자를 발현하도록 유전자 조작된다. 적합한 발현 방법은 기타 다른 방법 중에서 유도성 발현 및 구분된 발현을 포함하는 리파제 유전자의 발현과 관련하여 상기 기술되어 있다. 지방 아실-ACP 티오에스테라제는 지질 합성동안에 아실기 운반 단백질(ACP)로부터 지방산을 절단한다. 추가의 효소 가공을 통해, 절단된 지방산은 이어서 조효소와 조합되어 아실-CoA 분자를 생성한다. 이러한 아실-CoA는 알코올을 생성하기 위한 지방 아실-CoA/알데하이드 환원 효소에 대한 것뿐만 아니라 알데하이드를 생성하기 위한 지방 아실-CoA 환원 효소의 효소 활성에 대한 기질이다. 상기 확인된 지방 아실-CoA 환원 효소의 작용에 의해 생산된 알데하이드는 알코올을 생성하기 위한 지방 알데하이드 환원 효소 또는 알칸 또는 알켄을 생성하기 위한 지방 알데하이드 탈카보닐화 효소에 의한 추가의 효소 활성에 대한 기질이다.
몇몇 구체예에서, 본원에 기술된 방법에 의해 생성되는 지방산, 글리세로지질, 또는 상응하는 1급 알코올, 알데하이드, 알칸 또는 알켄은 8개, 10개, 12개, 또는 14개의 탄소 원자를 함유한다. 산업적 적용을 위한 디젤, 바이오디젤, 재생 디젤 또는 제트 연료, 또는 상응하는 1급 알코올, 알데하이드, 알칸 및 알켄을 생산하기 위한 바람직한 지방산은 8개 내지 14개의 탄소 원자를 함유한다. 특정 구체예에서, 기타 다른 상응하는 탄화수소 분자뿐만 아니라 상기 지방산은 포화되거나(어떠한 탄소-탄소 이중 결합 또는 삼중 결합을 갖지 않음); 단일 불포화되거나(단일 이중 결합); 다중 불포화되거나(2개 이상의 이중 결합); 선형(환형이 아님)이거나 분지형이다. 연료 생산을 위해 보다 큰 포화도가 바람직하다.
상기 직접 기술된 효소는 특정 수의 탄소 원자를 함유하는 기질의 가수 분해에 대해 우선적인 특이성을 갖는다. 예를 들어, 지방 아실-ACP 티오에스테라제는 ACP로부터 12개의 탄소 원자를 갖는 지방산을 절단하는 것을 선호할 수 있다. 몇몇 구체예에서, ACP 및 길이 특이적 티오에스테라제는 이들이 조합체로서 특히 유용하게 하는 서로에 대해 친화성을 가질 수 있다(예를 들어, 외인성 ACP 및 티오에스테라제 유전자는 이들이 유래하는 특정 조직 또는 유기체에서 자연적으로 공동 발현될 수 있다). 따라서, 다양한 구체예에서, 본 발명의 재조합 프로토테카 세포는 기질 내 함유된 탄소 원자의 수와 관련하여 효소 활성(예를 들어, ACP로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알코올로의 환원, 또는 알데하이드의 알칸으로의 전환)을 촉매하기 위한 특이성을 갖는 단백질을 암호화하는 외인성 유전자를 함유할 수 있다. 다양한 구체예에서 효소 특이성은 8개 내지 34개의 탄소 원자, 바람직하게는 8개 내지 18개의 탄소 원자, 보다 바람직하게는 8개 내지 14개의 탄소 원자를 갖는 기질에 대한 것일 수 있다. 바람직한 특이성은 더 많은 탄소 원자, 즉 18개 탄소 원자보다는 더 적은, 즉 12개 탄소 원자를 갖는 기질에 대한 것이다.
본 발명의 미생물 및 방법과 함께 사용하기에 적합한 기타 다른 지방 아실-ACP 티오에스테라제는 표 4에 열거된 것들을 제한없이 포함한다.
움벨루라리아 캘리포니카 지방 아실-ACP 티오에스테라제(GenBank #AAC49001) 신나모뮴 캠포라 지방 아실-ACP 티오에스테라제(GenBank #Q39473) 움벨루라리아 캘리포니카 지방 아실-ACP 티오에스테라제(GenBank #Q41635) 미리스티카 프래그란스 지방 아실-ACP 티오에스테라제(GenBank #AAB71729) 미리스티카 프래그란스 지방 아실-ACP 티오에스테라제(GenBank #AAB71730) 엘라에이스 기닌시스 지방 아실-ACP 티오에스테라제(GenBank #ABD83939) 엘라에이스 기닌시스 지방 아실-ACP 티오에스테라제(GenBank #AAD42220) 엘라에이스 기닌시스 지방 아실-ACP 티오에스테라제(GenBank#AAD42220.2) 파퓰러스 토멘토사 지방 아실-ACP 티오에스테라제(GenBank #ABC47311) 아라비돕시스 탈리아나 지방 아실-ACP 티오에스테라제(GenBank #NP_172327) 아라비돕시스 탈리아나 지방 아실-ACP 티오에스테라제(GenBank #CAA85387) 아라비돕시스 탈리아나 지방 아실-ACP 티오에스테라제(GenBank #CAA85388) 고시피움 히르서텀 지방 아실-ACP 티오에스테라제(GenBank #Q9SQI3) 쿠페아 란세올라타 지방 아실-ACP 티오에스테라제(GenBank #CAA54060) 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank #AAC72882) 쿠페아 칼로필라 아종 메소스테몬 지방 아실-ACP 티오에스테라제(GenBank #ABB71581) 쿠페아 란세올라타 지방 아실-ACP 티오에스테라제(GenBank #CAC19933) 엘라에이스 기닌시스 지방 아실-ACP 티오에스테라제(GenBank #AAL15645) 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank #Q39513) 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank#Q39513.1) 고시피움 히르서텀 지방 아실-ACP 티오에스테라제(GenBank #AAD01982) 비티스 비니페라 지방 아실-ACP 티오에스테라제(GenBank #CAN81819) 가르시니아 망고스타나 지방 아실-ACP 티오에스테라제(GenBank #AAB51525) 가르시니아 망고스타나 지방 아실-ACP 티오에스테라제(GenBank#AAB51525.1) 브라시카 준세아 지방 아실-ACP 티오에스테라제(GenBank #ABI18986) 마듀카 론지폴리아 지방 아실-ACP 티오에스테라제(GenBank #AAX51637) 브라시카 나푸스 지방 아실-ACP 티오에스테라제(GenBank #ABH11710) 브라시카 나푸스 지방 아실-ACP 티오에스테라제(GenBank#CAA52070.1) 오리자 사티바(인디카 컬티바군) 지방 아실-ACP 티오에스테라제(GenBank #EAY86877) 오리자 사티바(자포니카 컬티바군) 지방 아실-ACP 티오에스테라제(GenBank #NP_001068400) 오리자 사티바(인디카 컬티바군) 지방 아실-ACP 티오에스테라제(GenBank #EAY99617) 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank #AAC49269) 얼머스 아메리카나 지방 아실-ACP 티오에스테라제(GenBank #AAB71731) 쿠페아 란세올라타 지방 아실-ACP 티오에스테라제(GenBank #CAB60830) 쿠페아 팔루스트리스 지방 아실-ACP 티오에스테라제(GenBank #AAC49180) 아이리스 게르마니카 지방 아실-ACP 티오에스테라제(GenBank #AAG43858) 아이리스 게르마니카 지방 아실-ACP 티오에스테라제(GenBank #AAG43858.1) 쿠페아 팔루스트리스 지방 아실-ACP 티오에스테라제(GenBank #AAC49179) 미리스티카 프래그란스 지방 아실-ACP 티오에스테라제(GenBank# AAB71729) 미리스티카 프래그란스 지방 아실-ACP 티오에스테라제(GenBank# AAB717291.1) 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank #U39834) 움벨루라리아 캘리포니카 지방 아실-ACP 티오에스테라제(GenBank # M94159) 신나모뮴 캠포라 지방 아실-ACP 티오에스테라제(GenBank #U31813) 리시누스 커뮤니스 지방 아실-ACP 티오에스테라제(GenBank#ABS30422.1) |
이하 실시예는 프로토테카 종 내에서 쿠페아 후커리아나, 움벨루라리아 캘리포니카, 신나모뮴 캠포라, 쿠페아 팔루스트리스, 쿠페아 란세올라타, 아이리스 게르마니카, 미리스티카 프래그란스, 가르시니아 망고스타나, 엘라에이스 기니엔시스, 브라시카 나푸스, 리시누스 커뮤니스 및 얼머스 아메리카나로부터 유래하는 이종 지방 아실-ACP 티오에스테라제의 성공적인 표적화 및 발현을 기술한다. 추가로, 지방산 프로필의 변경은 이러한 이종 지방 아실-ACP 티오에스테라제를 발현하는 숙주 세포 내에서 확인되었다. 실시예들에서 나타낸 바와 같이, 프로토테카 내에서 이러한 이종 티오에스테라제의 발현은 몇몇 종자 곡물 오일을 배합하더라도 시판중인 종자 곡물로부터 현재는 얻을 수 없는, 진정 독특한 지방산 프로필을 가지는 오일/지질을 생산할 수 있는 유전자 이식 미세 조류를 생성한다. 표 5는 통상의 시판 종자 오일의 지방산 프로필을 나타낸다. 이하 시판 중인 종자 오일 데이터는 모두 문헌[US Pharmacopeias Food and Chemicals Codes, 7th Ed. 2010-2011]에서 수집되었다. 우지 데이터는 문헌[National Research Council: Fat Content and Composition of Animal Products (1976)]으로부터 수집한 것이다.
예를 들어, 이러한 통상의 종자 오일 중 어느 것도 C8 또는 C10 지방산을 고량으로 함유하지 않으며, 코코넛 오일과 팜핵 오일은 가장 큰 공급원이지만, 이것들은 둘 다 (C8:C10 지방산) 비율이 약 1:1이다. 실시예에 나타낸 바와 같이, 쿠페아 팔루스트리스 C:8 선호 티오에스테라제로 형질 전환된 프로토테카는 12% 초과인 C8 지방산 수준을 달성할 수 있었을 뿐만 아니라, C8:C10 지방산의 비율은 약 5:1이었다. 지방산 수준의 변화는, 다양한 상업적 용도로서 맞춤 지방산 프로필을 가지는 오일을 생산하는데 유용하다. 뿐만 아니라, 상이한 지방산 사슬 길이간 비율의 변화는 추가의 고비용 화학 공정(예를 들어, 에스테르화, 증류, 분별 및 재에스테르화)을 수행하지 않은 오일에서는 상업상 얻어질 수 없는 것이다. 다른 예로서, 팜 오일은 C16:0 지방산을 가장 높이(32% 내지 47%)함유하는 오일이지만, 팜 오일은 C14:0 지방산의 함량이 매우 낮다. 유.아메리카나 티오에스테라제를 함유하는 프로토테카는 C16:0 지방산 함유율이 약 33% 내지 38%, C14:0 지방산 함유율이 약 10% 내지 16%인 것으로 획득하였다(C16:0 대 C14:0 비율은 약 2:1). 16:0 지방산을 높은 비율로 포함하는 종자 오일은 일반적으로 14:0 지방산은 그다지 많이 함유하지 않으므로, 기존의 오일을 상업상 수준으로 배합하였을 때 이러한 지방산 프로필은 상업상 비실용적이었다.
이하 실시예는 또한 하나의 클론에서 2개 이상의 지방 아실-ACP 티오에스테라제의 성공적인 표적화 및 발현을 기술한다. 지방산 프로필 변화는 이러한은 클론에서 확인되었고, 2개의 티오에스테라제가 하나의 클론에서 공동 발현되었는지 여부에 의존적이었으며, 지방산 프로필은 상이한 방식으로 영향을 받았다. 예를 들어, 상기 표 5에 의하면, 코코넛 오일과 팜핵 오일 둘 다는 C12:C14 비율이 대략 3:1이다. 이하 실시예에 기술된 바와 같이, 2개의 이종 티오에스테라제 유전자를 함유하는 프로토테카 형질 전환체는 C12:C14 지방산 수준의 비율은 대략 5:1로 생성할 수 있었다. 이러한 종류의 C12:C14 지방산 비율은 (즉, 종자 오일을 배합할 때) 상업상 비실용적이었다.
유전자 이식 미세 조류에 의해 생산된 오일의 다른 신규 양태는 지방산의 포화도이다. 팜 오일은 현재 포화 오일의 가장 큰 공급원으로서 총 포화 오일 대 불포화 오일의 비율은 52% 내지 48%이다. 이하 실시예에 나타낸 바와 같이, 유.아메리카나 및 씨.캠포라로부터 유래하는 이종 티오에스테라제를 가지는 프로토테카는 그것이 생산하는 오일 중 포화 오일의 총 수준을 60% 초과로 획득하였다. 또한 이하 실시예에 나타낸 바와 같이, 유.아메리카나로부터 유래하는 이종 티오에스테라제를 가지는 프로토테카는 그것이 생산하는 오일 중 총 포화 오일 수준을 86% 초과로 획득하였다.
본 발명의 미생물 및 방법과 함께 사용하기에 적합한 지방 아실-CoA/알데하이드 환원 효소는 제한없이 표 6에 열거된 것들을 포함한다.
본 발명의 미생물 및 방법과 함께 사용하기에 적합한 지방 아실-CoA 환원 효소는 제한 없이 표 7에 기재된 것들을 포함한다.
본 발명의 미생물 및 방법과 함께 사용하기에 적합한 지방 알데하이드 탈카보닐화 효소는 제한 없이 표 8에 열거된 것들을 포함한다.
자연적으로 공동 발현된 지방 아실-ACP 티오에스테라제 및 아실기 운반 단백질의 조합은 본 발명의 미생물 및 방법과 사용하기에 적합하다.
탄화수소 또는 지질 변형 효소의 추가의 예는 미국 특허 제6,610,527호; 제6,451,576호; 제6,429,014호; 제6,342,380호; 제6,265,639호; 제6,194,185호; 제6,114,160호; 제6,083,731호; 제6,043,072호; 제5,994,114호; 제5,891,697호; 제5,871,988호; 제6,265,639호 중 어느 하나에 포함되거나 참조되거나, 함유되거나 참조된 핵산 서열에 의해 암호화된 아미노산 서열을 포함하고, 추가로 GenBank 수탁 번호 제AAO18435호; 제ZP_00513891호; 제Q38710호; 제AAK60613호; 제AAK60610호; 제AAK60611호; 제NP_113747호; 제CAB75874호; 제AAK60612호; 제AAF20201호; 제BAAl1024호; 제AF205791호; 및 제CAA03710호에 기술되어 있다.
지질 생합성 경로의 기타 다른 효소들 또한 본 발명의 미생물 및 방법과 함께 사용하기 적당하다. 예를 들어, 케토 아실-ACP 합성 효소(Kas)는 지질 생합성 경로에 있어서 상기 나열된 효소들 중 일부와 함께 작용한다. Kas 효소에는 상이한 군들이 있다: Kas I은 지속적으로 성장하는(ever-growing) 아실 ACP 사슬과 말로닐-ACP 간 연속 축합 단계에 참여한다. Kas II는 통상적으로 C16:0-ACP로부터 C18:0-ACP(예를 들어, 말로닐-ACP)에 이르게 하는 최종 축합 단계에 참여한다. 그러므로, C16 내지 C18:0 지방산(그리고 이의 불포화 유도체)을 주로 합성하는 고등 식물 및 일부 미세 조류 종/균주에 있어서, Kas II 효소는 FatA 유전자(아실-ACP 티오에스테라제)의 생성물과 상호 작용한다.
아실-ACP는 지방산 생합성 동안 성장중인 지방산 사슬을 ACP로부터 유리시키며, 대부분의 식물 종에 있어서 이는 C16:0에서 C18:0 단계로의 연장을 종결시키는 역할을 하는 FatA 유전자 군의 일원에 의해 수행된다. 길이가 더욱 단쇄의 지방산을 합성하는 종(예를 들어, 쿠페아, 엘라에이스, 미리스티카 또는 움벨루라리아)에서, FatB 유전자에 의해 암호화되는 아실-ACP 티오에스테라제의 상이한 군은 상기 종결 단계를 수행한다. Kas II 효소와 아실-ACP 티오에스테라제 간 상호 작용은 지방산 사슬 연장을 올바르게 종결하는데 중요하다. 결과적으로, 길이가 더욱 단쇄의 지질을 생합성할 수 있는 진화 FatB 유전자를 가지는 고등 식물 종(그리고 미세 조류 종)에 있어서, Kas IV 유전자라고 칭하는 Kas 유전자의 부가 군의 상응하는 공동 진화가 있었다. Kas IV 유전자는 길이가 4개 내지 14개 탄소인 특정한 크기 범위의 지방산의 사슬 길이 연장에 관여한다.
본 발명의 미생물 및 방법과 사용하기에 적합한 기타 다른 효소는 표 4, 표 6 내지 표 8에 열거된 단백질 중 하나와 70% 이상의 아미노산 동일성을 갖고 상응하는 원하는 효소 활성(예를 들어, 아실기 운반 단백질로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알코올로의 환원, 또는 알데하이드의 알칸으로의 전환)을 나타내는 것들을 포함한다. 추가의 구체예에서, 효소 활성은 전술된 서열 중 하나와 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 99% 이상의 동일성을 갖는 서열 중에 존재하고 이 모두는 완전히 제시된 것처럼 본원에 참조로 포함된다.
발현되는 외인성 유전자의 원하는 조합을 선택함으로써, 이후에 수성 바이오매스로부터 추출될 수 있는, 미생물에 의해 생성되는 생성물을 조작할 수 있다. 예를 들어, 상기 미생물은 (i) 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자; 및, 임의로, (ii) 자연적으로 공동 발현된 아실기 운반 단백질 또는 다르게는 지방 아실-ACP 티오에스테라제(또는 역으로)에 대해 친화성을 갖는 아실기 운반 단백질; 및, 임의로, (iii) 지방 아실-CoA/알데하이드 환원 효소 또는 지방 아실-CoA 환원 효소를 암호화하는 외인성 유전자; 및, 임의로, (iv) 지방 알데하이드 환원 효소 또는 지방 알데하이드 탈카보닐화 효소를 암호화하는 외인성 유전자 중 하나 이상을 함유할 수 있다. 미생물은 또한 외인성 스테아로일 ACP 불포화 효소, 지방산 불포화 효소, β-케토아실-ACP 합성 효소 I(예를 들어, KASI 유전자에 의해 암호화됨), β-케토아실-ACP 합성 효소 II(예를 들어, KASII 유전자에 의해 암호화됨), 또는 올리에이트-12 하이드록실라제 중 하나 이상을 함유할 수도 있다. 본원에 기재된 배양 조건 하의 미생물은 ACP에 연결된 지방산을 합성하고, 지방 아실-ACP 티오에스테라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 효소 가공을 통해 지방 아실-CoA 분자를 생산한다. 존재하는 경우, 지방 아실-CoA/알데하이드 환원 효소는 아실-CoA의 알코올로의 환원을 촉매한다. 유사하게, 존재하는 경우 지방 아실-CoA 환원 효소는 아실-CoA의 알데하이드로의 환원을 촉매한다. 지방 아실-CoA 환원 효소를 암호화하는 외인성 유전자가 존재 하고 알데하이드 생성물을 생산하기 위해 발현되는 상기 구체예에서, 제3 외인성 유전자에 의해 암호화된 지방 알데하이드 환원 효소는 알데하이드의 알코올로의 환원을 촉매한다. 유사하게, 지방 알데하이드 탈카보닐화 효소는 존재하는 경우 알데하이드의 알칸 또는 알켄으로의 전환을 촉매한다.
다른 구체예에서, 미생물은, (i) 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자; (ii) 임의로, 지방산 아실-ACP 티오에스테라제에 대한 친화성을 가지는 아실기 운반 단백질 또는 자연적으로 공동 발현된 아실기 운반 단백질; (iii) 돌연 변이된 내인성 불포화 효소 유전자(여기서, 상기 돌연 변이는 불포화 효소 유전자 또는 불포화 효소 단백질을 불활성이 되도록 만듦(예를 들어, 상기 불포화 효소 유전자 또는 단백질을 불포화 효소 녹아웃 요소 또는 불포화 효소 억제 요소, 예를 들어 표적화된 RNAi, 안티센스 또는 dsRNA 구조물로 만듦)); (iv) 내인성 스테아로일 아실기 운반 단백질 불포화 효소의 과발현 또는 이종 SAD의 발현; 및 (v) 상기 (i) 내지 (iv)의 임의의 조합을 포함할 수 있다.
상기 효소, 예를 들어 지방 아실 ACP 티오에스테라제를 암호화하는 유전자는 클로렐라 프로토테코이데스와 같이 상당한 지질 생산을 나타내는 것으로 이미 공지된 세포로부터 수득될 수 있다. 지질 생산에 역할을 하는 것으로 이미 공지된 유전자, 예를 들어 이중 결합을 포화시키는 효소를 암호화하는 유전자는 개별적으로 수용 세포로 형질 전환될 수 있다. 그러나, 본 발명을 실시하기 위해 어느 유전자가 필요한지에 관해 우선적으로 추측할 필요는 없다. 미세 조류 내 지질 생산을 변형(개선)시킬 수 있는 유전자를 확인하는 방법은 PCT 공개 제2008/151149호에 기술되어 있다.
따라서, 본 발명은 동일 종의 야생형 세포에 비해 변화된 수준으로 지질 경로 효소를 발현하도록 유전자 조작된 프로토테카 세포를 제공한다. 몇몇 경우에, 상기 세포는 2개 세포가 동일한 조건 하에서 생장하는 경우 야생형 세포에 비해 더 많은 지질을 생산한다. 몇몇 경우에, 상기 세포는 야생형 세포보다 더 높은 수준 또는 더 낮은 수준으로 지질 경로 효소를 발현하도록 유전자 조작되고/조작되거나 선택되었다. 몇몇 경우에, 지질 경로 효소는 피루베이트 탈수소화 효소, 아세틸-CoA 카복실라제, 아실기 운반 단백질 및 글리세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 군으로부터 선택된다. 몇몇 경우에, 상기 세포는 야생형 세포보다 더 낮은 수준으로 지질 경로 효소를 발현하도록 유전자 조작되고/조작되거나 선택되었다. 세포가 더 낮은 수준으로 지질 경로 효소를 발현하는 하나 이상의 구체예에서, 지질 경로 효소는 시트레이트 합성 효소를 포함한다.
몇몇 구체예에서, 상기 세포는 야생형 세포와 비교하여 변화된 수준으로 지방산 합성의 범용 조절제를 발현하도록 유전자 조작되고/조작되거나 선택됨으로써 다수의 지방산 합성 유전자의 발현 수준은 야생형 세포와 비교하여 변화된다. 몇몇 경우에, 지질 경로 효소는 지방산을 변형시키는 효소를 포함한다. 몇몇 경우에, 지질 경로 효소는 스테아로일-ACP 불포화 효소 및 글리세로지질 불포화 효소로부터 선택된다. 몇몇 경우에 있어서, 세포는 지질 경로 효소를 더 낮은 수준으로 발현하거나 특이적 지질 경로 효소를 전혀 발현하지 않도록 유전자 조작되고/조작되거나 선택되었다(즉, 지질 경로 효소가 녹아웃되어 외인성 유전자로 치환되거나, RNAi 또는 안티센스 방법을 이용하여 이 효소의 발현이 감소되었다). 다른 구체예에서, 지질 경로 효소는 불포화 효소 유전자, 예를 들어 스테아로일-ACP 불포화 효소 또는 지방산 불포화 효소(FAD) 유전자(이에 제한되는 것은 아님)의 이종 발현물이다. 실시예 6은 프로토테카 모리포르미스 유전적 배경에서 올레아 유로파에아로부터 이종 스테아로일-ACP의 발현을 기술한다.
다른 구체예에서, 본 발명은 하나 이상의 외인성 유전자를 함유하는 오일 생산 미생물에 관한 것으로서, 여기서 상기 외인성 유전자는 지방 아실-ACP 티오에스테라제, 지방 아실-CoA 환원 효소, 지방 알데하이드 환원 효소, 지방 아실-CoA/알데하이드 환원 효소, 지방 알데하이드 탈카보닐화 효소, 불포화 효소 및 아실기 운반 단백질로 이루어진 군으로부터 선택되는 단백질(들)을 암호화한다. 다른 구체예에서, 내인성 불포화 효소 유전자는 상기 외인성 유전자들 중 하나 이상을 함유하는 미생물 내에서 과발현된다. 하나의 구체예에서, 외인성 유전자는 자극에 응답하여 유도성이거나 억제성인 프로모터에 작동가능하게 연결되어 있다. 몇몇 경우에, 상기 자극은 외부적으로 제공되는 작은 분자, 열, 냉 및 배양 배지에서 제한되거나 부재인 질소로 이루어진 군으로부터 선택된다. 몇몇 경우에, 외인성 유전자는 세포 구획에서 발현된다. 몇몇 구체예에서, 세포 구획은 엽록체, 색소체 및 미토콘드리아로 이루어진 군으로부터 선택된다. 몇몇 구체예에서 미생물은 프로토테카 모리포르미스, 프로토테카 크루가니, 프로토테카 스태그노라 또는 프로토테카 조프피이다.
하나의 구체예에서, 외인성 유전자는 지방산 아실-ACP 티오에스테라제를 암호화한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 티오에스테라제는 아실기 운반 단백질(ACP)로부터 8개 내지 18개의 탄소 지방산의 절단을 촉매한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 10개 내지 14개 탄소 지방산의 절단을 촉매한다. 하나의 구체예에서, 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 12개 탄소 지방산의 절단을 촉매한다.
하나의 구체예에서, 외인성 유전자는 지방 아실-CoA/알데하이드 환원 효소를 암호화한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 환원 효소는 8개 내지 18개의 탄소 지방 아실-CoA의 상응하는 1급 알코올로의 환원을 촉매한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 환원 효소는 10개 내지 14개의 탄소 지방 아실-CoA의 상응하는 1급 알코올로의 환원을 촉매한다. 하나의 구체예에서, 외인성 유전자에 의해 암호화된 환원 효소는 12개 탄소의 지방 아실-CoA의 도데칸올로의 환원을 촉매한다.
본 발명은 또한 2개의 외인성 유전자를 함유하는 재조합 프로토테카 또는 기타 다른 세포를 제공하고, 여기서 제1 외인성 유전자는 지방 아실-ACP 티오에스테라제를 암호화하고 제2 외인성 유전자는 지방 아실-CoA 환원 효소, 지방 아실-CoA/알데하이드 환원 효소, 및 아실기 운반 단백질로 이루어진 군으로부터 선택되는 단백질을 암호화한다. 몇몇 경우에, 2개의 외인성 유전자는 각각 자극에 응답하여 유도성인 프로모터와 작동가능하게 연결되어 있다. 몇몇 경우에, 각각의 프로모터는 배양 배지 내 제한된 질소 또는 질소 부재와 같은 동일한 자극에 응답하여 유도성이다. 배양 배지에서 질소의 제한 또는 완전한 부재는 프로토테카 종과 같은 몇몇 미생물에서 오일 생산을 자극하고, 높은 수준으로 오일 생산을 유도하기 위한 촉발제로서 사용될 수 있다. 본원에 개시된 유전자 조작 방법과 조합하여 사용되는 경우, 건조 세포 중량의 %로서 지질은 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상 및 75% 이상, 80% 이상, 85% 이상 또는 75% 내지 90%와 같은 높은 수준으로 상승될 수 있고, 본원에 개시된 방법은 이러한 수준의 지질을 갖는 세포에 대해 제공하고, 여기서 지질은 C8 내지 C14 4% 이상, C8 0.3% 이상, ClO 2% 이상, C12 2% 이상, 및 C14 2% 이상이다. 몇몇 구체예에서, 상기 세포는 건조 세포 중량을 기준으로 지질이 25% 초과이고, C8 내지 C14 10% 이상, C8 내지 C14 20% 이상, C8 내지 C14 30% 이상, C8 내지 C14 10% 내지 30% 및 C8 내지 C14 20% 내지 30%인 지질을 함유한다.
본원에 개시된 신규 오일은 mid-사슬 지방산(예를 들어, 팜오일, 팜핵 오일 및 코코넛 오일)의 함량이 높은 기타 다른 자연적으로 존재하는 오일과 구분된다. 예를 들어, 카로티노이드와 같은 오염물 수준은 본 발명의 오일에서 보다 팜오일 및 팜핵 오일에서 훨씬 더 높다. 특히 팜오일 및 팜핵 오일은 본 발명의 오일에서 훨씬 더 높은 양으로 알파 및 베타 카로틴 및 라이코펜을 함유한다. 추가로, 20개 초과의 상이한 카로티노이드가 팜오일 및 팜핵 오일에서 발견된 반면 실시예는 본 발명의 오일이 매우 소량의 카로티노이드 종을 매우 낮은 수준으로 함유함을 입증한다. 추가로, 토코트리에놀과 같은 비타민 E 화합물의 수준은 본 발명의 오일에서 보다 팜오일, 팜핵 및 코코넛오일에서 훨씬 더 높다.
하나의 구체예에서, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 8개 내지 18개 탄소 지방산의 절단을 촉매한다. 몇몇 구체예에서, 제2 외인성 유전자는 8개 내지 18개 탄소 지방 아실-CoA의 상응하는 1급 알코올로의 환원을 촉매하는 지방 아실-CoA/알데하이드 환원 효소를 암호화한다. 몇몇 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 10개 내지 14개 탄소 지방산의 절단을 촉매하고, 제2 외인성 유전자에 의해 암호화된 환원 효소는 10개 내지 14개 탄소 지방 아실-CoA의 상응하는 1급 알코올로의 환원을 촉매하며, 여기서 티오에스테라제 및 환원 효소는 동일한 탄소 사슬 길이에 작용한다. 하나의 구체예에서, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 12개 탄소 지방산의 절단을 촉매하고, 제2 외인성 유전자에 의해 암호화된 환원 효소는 12개 탄소 지방 아실-CoA의 도데칸올로의 환원을 촉매한다. 몇몇 구체예에서, 제2 외인성 유전자는 8개 내지 18개 탄소 지방 아실-CoA의 상응하는 알데하이드로의 환원을 촉매하는 지방 아실-CoA 환원 효소를 암호화한다. 몇몇 구체예에서, 제2 외인성 유전자는 자연적으로 지방 아실-ACP 티오에스테라제와 함께 공동 발현되는 아실기 운반 단백질을 암호화한다.
몇몇 구체예에서, 제2 외인성 유전자는 지방 아실-CoA 환원 효소를 암호화하고, 미생물은 지방 알데하이드 탈카보닐화 효소를 암호화하는 제3 외인성 유전자를 추가로 함유한다. 몇몇 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 8개 내지 18개 탄소 지방산의 절단을 촉매하고, 제2 외인성 유전자에 의해 암호화된 환원 효소는 8개 내지 18개 탄소 지방 아실-CoA의 상응하는 지방 알데하이드로의 환원을 촉매하며, 제3 외인성 유전자에 의해 암호화된 탈카보닐화 효소는 8개 내지 18개 탄소 지방 알데하이드의 상응하는 알칸으로의 전환을 촉매하고, 여기서 티오에스테라제, 환원 효소 및 탈카보닐화 효소는 동일한 탄소 사슬 길이에 작용한다.
몇몇 구체예에서, 제2 외인성 유전자는 아실기 운반 단백질을 암호화하고, 미생물은 지방 아실-CoA 환원 효소 및 지방 아실-CoA/알데하이드 환원 효소로 이루어진 군으로부터 선택되는 단백질을 암호화하는 제3 외인성 유전자를 추가로 함유한다. 몇몇 경우에, 제3 외인성 유전자는 지방 아실-CoA 환원 효소를 암호화하고, 미생물은 지방 알데하이드 탈카보닐화 효소를 암호화하는 제4 외인성 유전자를 추가로 함유한다.
본 발명은 또한 배양 배지에서 재조합 프로토테카 세포의 집단을 배양하는 것을 포함하는 알코올을 생산하는 방법을 제공하며, 여기서 상기 세포는 (i) 지방 아실-ACP 티오에스테라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA/알데하이드 환원 효소를 암호화하는 제2 외인성 유전자를 함유하고, 상기 세포는 아실기 운반 단백질(ACP)에 연결된 지방산을 합성하며, 지방 아실-ACP 티오에스테라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 가공을 통해 지방 아실-CoA를 생산하고, 지방 아실-CoA/알데하이드 환원 효소는 아실-CoA의 알코올로의 환원을 촉매한다.
본 발명은 또한 프로토테카 세포에서 지질 분자를 생산하는 방법을 제공한다. 하나의 구체예에서, 상기 방법은 배양 배지에서 프로토테카 세포 집단을 배양하는 것을 포함하며, 상기 세포는 (i) 지방 아실-ACP 티오에스테라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA 환원 효소를 암호화하는 제2 외인성 유전자를 함유하고, 상기 미생물은 아실기 운반 단백질(ACP)에 연결된 지방산을 합성하며, 지방 아실-ACP 티오에스테라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 가공을 통해 지방 아실-CoA를 생산하고, 지방 아실-CoA 환원 효소는 아실-CoA의 알데하이드로의 환원을 촉매한다.
본 발명은 또한 프로토테카 세포에서 특정된 탄소 사슬 길이를 갖는 지방산 분자를 생산하는 방법을 제공한다. 하나의 구체예에서, 상기 방법은 배양 배지에서 지질 생산 프로토테카 세포 집단을 배양하는 것을 포함하며, 여기서 상기 미생물은 8개, 10개, 12개 또는 14개 탄소 원자와 같은 특정 탄소 사슬 길이에 특이적이거나 우선적인 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 함유하고, 상기 미생물은 아실기 운반 단백질(ACP)에 연결된 지방산을 합성하며, 상기 티오에스테라제는 지방산이 특정 탄소 사슬 길이로 합성되는 경우 ACP로부터 지방산의 절단을 촉매한다.
전술한 다양한 구체예에서, 프로토테카 세포는 지질 경로 효소를 암호화하는 하나 이상의 외인성 유전자 또는 유전자 생성물의 발현을 억제하는 억제 요소, 예를 들어 RNA 간섭 요소를 함유할 수 있다. 몇몇 경우에, 지질 경로 효소는 스테아로일-ACP 불포화 효소, 글리세로지질 불포화 효소, 피루베이트 탈수소화 효소, 아세틸-CoA 카복실라제, 아실기 운반 단백질 및 글리세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 군으로부터 선택된다. 다른 경우에, 프로토테카 세포는 지방 아실-ACP 티오에스테라제, 지방 아실-CoA/알데하이드 환원 효소, 지방 아실-CoA 환원 효소, 지방 알데하이드 환원 효소, 지방 알데하이드 탈카보닐화 효소 및/또는 아실기 운반 단백질로 이루어진 군으로부터 선택되는 지질 변형 효소를 함유한다.
본 발명은 또한 하이드록실화된 지방산을 생성하는 하이드록실라제를 암호화하는 이종 유전자를 함유하는 미생물 세포를 제공한다. 미생물 세포는 제II형 지방산 합성 경로를 포함할 수 있다. 예를 들어, 미생물 세포는 미세 조류 세포일 수 있다. 몇몇 구체예에서, 미세 조류 세포는 상기 표 1에 나열된 미세 조류 세포들로부터 선택된다. 다른 구체예에서, 미세 조류 세포는 프로토테카 속에 속하는 것이다. 또 다른 구체예에서, 미세 조류 세포는 프로토테카 모리포르미스이다. 하이드록실라제는 하이드록실기(-OH)를 기질에 부가하는 효소이다. 지방산 하이드록실라제는 일부 고등 식물에서 발견되는 자연적으로 생성되는 효소이다. 고등 식물에서 발견되는 자연적으로 생성되는 하이드록실라제의 비제한적 예로서는 리시놀레산을 생산하는데 관여하는 리시누스 커뮤니스로부터 유래하는 올리에이트 12-하이드록실라제가 있다. 실시예 7은 프로토테카 세포 내에서 하이드록실라제의 이종 발현의 예, 특히 프로토테카 모리포르미스 세포 내에서 리시누스 커뮤니스 올리에이트 12-하이드록실라제의 발현을 기술한다.
VI
. 연료 및 화학 물질 생산
본 발명의 방법에 따른 연료의 생산을 위해, 본 발명의 세포에 의해 생산된 지질을 임의의 편리한 수단에 의해 수거하거나, 다르게는 수집한다. 지질은 전체 세포 추출에 의해 분리될 수 있다. 상기 세포를 우선 파쇄시키고 이어서 세포 내 및 세포막/세포벽 결합 지질 및 세포외 탄화수소를, 예를 들어 전술된 바와 같은 원심분리를 사용하여 세포 덩어리로부터 분리할 수 있다. 미생물내에서 생성된 세포 내 지질은 몇몇 구체예에서 미생물의 세포를 용해시킨 후 추출된다. 일단 추출된 후, 지질을 추가로 정제하여 오일, 연료 또는 함유 화학 제품을 생성한다.
배양을 완료한 후, 미생물을 발효 브로스로부터 분리할 수 있다. 임의로, 상기 분리는 원심분리로 수행하여 농축된 페이스트를 생성한다. 원심분리는 미생물로부터 상당양의 세포 내 물을 제거하지 못하며, 건조 단계가 아니다. 그 다음, 상기 바이오매스는 임의로 세척액(예를 들어, 탈이온수)으로 세척하여 발효 브로스 및 잔해를 제거할 수 있다. 임의로, 세척된 미생물 바이오매스는 또한 세포 파쇄 전에 건조(오븐 건조, 동결 건조 등)될 수 있다. 대안적으로, 세포는 발효가 완료된 경우 발효 브로스의 일부 또는 전부로부터 분리 없이 용해될 수 있다. 예를 들어, 상기 세포는 세포가 용해된 경우 세포외 액체에 대한 세포의 비율이 1:1(v:v) 미만일 수 있다.
지질을 함유하는 미생물은 용해시켜 용해물을 생성할 수 있다. 본원에 상세히 기술된 바와 같이, 미생물 용해시키는 단계(또한 세포 용해로서 언급됨)는 열 유도된 용해, 염기의 첨가, 산의 첨가, 프로테아제와 같은 효소 및 아밀라제와 같은 다당류 분해 효소의 사용, 초음파의 사용, 기계적 용해, 삼투압 충격의 사용, 용균성 바이러스에 의한 감염 및/또는 하나 이상의 용균성 유전자의 발현을 포함하는 임의의 간편한 수단에 의해 성취될 수 있다. 용해를 수행하여 미생물에 의해 생성된 세포 내 분자를 방출시킨다. 미생물을 용해시키기 위한 이들 방법 각각은 단일 방법으로 또는 동시에 또는 연속적으로 조합하여 사용할 수 있다. 세포 파쇄 정도는 현미경 분석에 의해 관찰할 수 있다. 본원에 기술된 방법중 하나 이상을 사용하여, 통상적으로 70% 초과의 세포 파괴가 관찰된다. 바람직하게, 세포 파괴는 80% 초과, 보다 바람직하게는 90% 초과 및 가장 바람직하게는 약 100%이다.
특정 구체예에서, 미생물은, 예를 들어 추출 또는 추가의 가공을 위해 세포 지질 및/또는 탄화수소의 노출을 증가시키기 위해 생장 후 용해시킨다. 리파제 발현(예를 들어, 유도성 프로모터를 통함) 및 세포 용해의 타이밍은 지질 및/또는 탄화수소의 수율을 최적화하기 위해 조정될 수 있다. 다수의 용해 기술은 하기에 기술되어 있다. 이들 기술은 개별적으로 또는 조합하여 사용할 수 있다.
본 발명의 하나의 구체예에서, 미생물을 용해시키는 단계는 미생물을 함유하는 세포 현탁액의 가열을 포함한다. 이러한 구체예에서, 미생물을 함유하는 발효 브로스(또는 발효 브로스로부터 분리된 미생물 현탁액)는 미생물, 즉 미생물의 세포벽 및 막이 분해하거나 파괴될 때까지 가열한다. 통상적으로, 적용되는 온도는 5O℃ 이상이다. 보다 효율적인 세포 용해를 위해, 보다 고온, 예를 들어 30℃ 이상, 6O℃ 이상, 70℃ 이상, 80℃ 이상, 9O℃ 이상, 100℃ 이상, 11O℃ 이상, 12O℃ 이상, 13O℃ 이상 또는 그 이상의 온도가 사용된다. 열 처리에 의한 세포 용해는 미생물을 비등시킴으로써 수행할 수 있다. 대안적으로, 열 처리(비등 없이)는 오토클레이브에서 수행할 수 있다. 열 처리된 용해물은 추가의 처리를 위해 냉각시킬 수 있다. 세포 파쇄는 또한 증기 처리, 즉 가압된 증기의 부가를 통해 수행할 수 있다. 세포 파쇄를 위한 미세 조류의 증기 처리는, 예를 들어 미국 특허 제6,750,048호에 기술되어 있다. 몇몇 구체예에서, 증기 처리는 발효기로 증기를 살포하고 브로스를 약 90분 미만, 바람직하게는 약 60분 미만, 보다 바람직하게는 약 30분 미만 동안 원하는 온도에서 유지시킴으로써 성취할 수 있다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 염기를, 미생물을 함유하는 세포 현탁액에 첨가하는 것을 포함한다. 상기 염기는 사용되는 미생물의 단백질성 화합물의 적어도 일부를 가수 분해하기에 충분히 강해야만 한다. 단백질을 가용화시키는데 유용한 염기는 화학 기술 분야에 공지되어 있다. 본 발명의 방법에 유용한 예시적인 염기로서는 리튬, 나트륨, 칼륨, 칼슘의 수산화물, 탄산염 및 중탄산염, 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다. 바람직한 염기는 KOH이다. 세포 파쇄를 위한 미세 조류의 염기 처리는, 예를 들어 미국 특허 제6,750,048호에 기술되어 있다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 산을, 미생물을 함유하는 세포 현탁액에 첨가하는 것을 포함한다. 산 용해는 10mN 내지 500mN 또는 바람직하게 40nM 내지 160nM의 농도로 산을 사용하여 수행할 수 있다. 산 용해는 바람직하게 실온 초과(예를 들어, 40℃ 내지 160℃, 및 바람직하게 50℃ 내지 130℃의 온도)에서 수행한다. 적당한 온도(예를 들어, 실온 내지 100℃ 및 특히 실온 내지 65℃)에 대해서, 산 처리는 초음파 처리 또는 기타 다른 세포 파쇄 방법과 유용하게 조합할 수 있다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 효소를 사용함으로써 미생물을 용해시키는 것을 포함한다. 미생물을 용해시키기 위해 바람직한 효소로서는 프로테아제 및 다당류 분해 효소, 예를 들어 헤미셀룰라제(예를 들어, 아스퍼질러스 나이저; Sigma Aldrich, 미국 미주리주 세인트루이스 소재; #H2125), 펙티나제(예를 들어, 리조푸스 종 유래의 펙티나제; Sigma Aldrich, 미국 미주리주 세인트루이스 소재; #P2401), 만나웨이(Mannaway) 4.0 L(Novozymes), 셀룰라제(예를 들어, 트리코더마 비리데 유래의 셀룰라제; Sigma Aldrich, 미국 미주리주 세인트루이스 소재; #C9422), 및 드리셀라제(예를 들어, 바시디오마이세테스 종 유래의 드리셀라제; Sigma Aldrich, 미국 미주리주 세인트루이스 소재; #D9515)가 있다.
본 발명의 다른 구체예에서, 용해는, 예를 들어 임의로 클로렐라 또는 클로렐라 바이러스 유래의 다당류 분해 효소와 같은 셀룰라제, 또는 스트렙토마이세스 그리세우스(Streptomyces griseus) 프로테아제, 키모트립신, 프로테이나제 K, 문헌[Degradation of Polylactide by Commercial Proteases, Oda Yet al., Journal of Polymers and the Environment, Volume 8, Number 1, January 2000, pp. 29-32(4)]에 열거된 프로테아제, 알칼라제 2.4 FG(Novozymes), 및 플라보우르짐 100 L(Novozymes)과 같은 프로테아제와 같은 효소를 사용하여 성취한다. 또한 이전의 프로테아제 및 다당류 분해 효소의 임의의 조합을 비롯한 프로테아제 및 다당류 분해 효소의 임의의 조합을 사용할 수 있다.
다른 구체예에서, 용해는 익스펠러 프레스를 사용하여 수행할 수 있다. 이러한 공정에서, 바이오매스는 고압에서 스크류형 장치를 통해 강제 주입하고 세포를 용해시키며, 세포 내 지질이 방출되게 하고 세포 내에서 단백질 및 섬유(및 기타 다른 성분)로부터 분리되도록 한다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 초음파, 즉 초음파 처리를 사용하여 수행한다. 따라서, 세포는 또한 고주파음으로 용해시킬 수 있다. 상기 음은 전자적으로 생성될 수 있고 금속 팁을 통해 적절히 농축된 세포 현탁액으로 운반된다. 상기 초음파 처리(또는 초음파 처리(ultrasonication))는 세포 현탁액 중 공극의 형성을 기준으로 세포 완전성을 붕괴시킨다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 기계적 용해에 의해 수행한다. 세포는 기계적으로 용해시키고, 임의로 균질화하여 탄화수소(예를 들어, 지질) 수집을 촉진시킬 수 있다. 예를 들어, 압력 분쇄기를 사용하여 세포 함유 슬러리를 제한된 오리피스 밸브를 통과하도록 펌핑시킬 수 있다. 고압(1500바 이하)을 적용함에 이어서 출구 노즐을 통해 즉시 확장시킨다. 세포 파쇄는 밸브상에 충돌, 오리피스 내 액체 고전단, 및 방출시 급작스런 압력 강하로 세포 파열의 유도의 3가지 상이한 기작에 의해 성취한다. 상기 방법은 세포 내 분자를 방출시킨다. 대안적으로, 볼 밀을 사용할 수 있다. 볼 밀에서, 세포는 비드와 같은 작은 연마 입자와 함께 현탁 상태로 교반시킨다. 전단력 때문에 세포는 분해되고, 비드 사이에서 분쇄되며 비드와 충돌한다. 상기 비드는 세포를 파쇄하여 세포 내용물을 방출시킨다. 세포는, 예를 들어 블렌딩(예를 들어, 고속 또는 와링 블렌더(Waring blender)), 프렌치 프레스 또는 심지어 약한 세포 벽의 경우에 세포 파쇄를 위한 원심분리의 사용에 의하는 것과 같은 전단력에 의해 파쇄될 수 있다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 삼투압 충격을 적용함으로써 수행한다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 용균성 바이러스로 미생물을 감염시키는 것을 포함한다. 본 발명에 사용하기 위해 적합한 미생물을 용해시키기 위한 광범위하게 다양한 바이러스가 공지되어 있고, 특정 미생물에 대한 특정 용균성 바이러스의 선택 및 용도는 당업계의 기술 수준 내에 있다. 예를 들어, 파라메시움 부르사리아 클로렐라 바이러스(paramecium bursaria chlorella virus; PBCV-l)는 특정 단일 세포 진핵 클로렐라형 녹색 조류 내에서 복제하고 이를 용해시키는 대형의 20면체 플라크 형성 이중가닥의 DNA 바이러스군의 프로토타입이다(피코드나비리대(Phycodnaviridae) 계열, 클로로바이러스(Chlorovirus) 속). 따라서, 임의의 민감성 미세 조류는 적합한 클로렐라 바이러스로 배양물을 감염시킴으로써 용해시킬 수 있다. 클로렐라 바이러스로 클로렐라 종을 감염시키는 방법은 공지되어 있다. 예를 들어, 문헌[Adv . Virus Res. 2006;66:293-336]; [Virology, 1999 Apr 25;257(1): 15-23]; [Virology, 2004 Jan 5;318(l):214-23]; [Nucleic Acids Symp . Ser. 2000;(44): 161-2]; [J. Virol. 2006 Mar;80(5):2437-44]; 및 [Annu . Rev . Microbiol. 1999;53:447-94]을 참조한다.
본 발명의 다른 구체예에서, 미생물을 용해시키는 단계는 자가용해를 포함한다. 이러한 구체예에서, 본 발명에 따른 미생물은 미생물을 용해시킬 용균성 단백질을 생성하도록 유전자 조작된다. 이러한 용균성 유전자는 유도성 프로모터를 사용하여 발현시켜 세포가 처음에 발효기 내에서 바람직한 밀도로 생장한 후 프로모터를 유도하여 용균성 유전자를 발현시킴으로써 세포를 용해시킬 수 있게 할 수 있다. 하나의 구체예에서, 상기 용균성 유전자는 다당류 분해 효소를 암호화한다. 다른 특정 구체예에서, 상기 용균성 유전자는 용균성 바이러스 유래의 유전자이다. 따라서, 예를 들어 클로렐라 바이러스 유래의 용균성 유전자는 조류 세포에서 발현될 수 있고, 문헌[Virology 260, 308-315 (1999)]; [FEMS Microbiology Letters 180 (1999) 45-53]; [Virology 263, 376-387 (1999)]; 및 [Virology 230, 361-368 (1997)]을 참조한다. 용균성 유전자의 발현은 바람직하게 유도성 프로모터, 예를 들어 소분자, 광, 열의 존재와 같은 자극 및 기타 다른 자극에 의해 유도되는 미세 조류에서 활성인 프로모터를 사용하여 수행한다.
상기 방법에 의해 생성된 세포 용해물로부터 지질을 분리하기 위한 다양한 방법이 이용가능하다. 예를 들어, 지방 알데하이드, 지방 알코올 및 탄화수소(예를 들어, 알칸)와 같은 지질 및 지질 유도체는 헥산과 같은 소수성 용매로 추출할 수 있다(문헌[Frenz et al. 1989, Enzyme Microb. Technol., 11:717] 참조). 지질 및 지질 유도체는 또한 액화(예를 들어, 문헌[Sawayama et al. 1999, Biomass and Bioenergy 17:33-39] 및 [Inoue et al. 1993, Biomass Bioenergy 6(4):269-274] 참조); 오일 액화(예를 들어, 문헌[Minowa et al. 1995, Fuel 74(12): 1735-1738] 참조); 및 초임계 CO2 추출(예를 들어, 문헌[Mendes et al. 2003, Inorganica Chimica Acta 356:328-334] 참조)을 사용하여 추출할 수 있다. Miao 및 Wu는 클로렐라 프로토테오코이데스의 배양으로부터 미세 조류 지질 회수의 프로토콜을 기술하며, 여기서 상기 세포는 원심분리에 의해 수거되고 증류수로 세척되며 동결 건조에 의해 건조된다. 생성된 세포 분말을 모르타르에서 분쇄하고 이어서 n-헥산으로 추출하였다(문헌[Miao 및 Wu, Biosource Technology (2006) 97:841-846]).
따라서, 본 발명의 미생물에 의해 생성된 지질, 지질 유도체 및 탄화수소는 유기 용매로 추출하여 회수할 수 있다. 몇몇 경우에, 바람직한 유기 용매는 헥산이다. 통상적으로, 유기 용매는 용해 성분의 사전 분리 없이 용해물에 직접 첨가한다. 하나의 구체예에서, 전술한 방법 중 하나 이상의 방법에 의해 생성된 용해물은 지질 및/또는 탄화수소 성분이 유기 용매와 용액을 형성하도록 하기에 충분한 시간 동안 유기 용매와 접촉시킨다. 몇몇 경우에, 상기 용액을 이어서 추가로 정제하여 특정의 원하는 지질 또는 탄화수소 성분을 회수할 수 있다. 헥산 추출 방법은 당업계에 널리 공지되어 있다.
본원에 기술된 세포에 의해 생성된 지방 알데하이드, 지방 알코올 및 탄화수소(예를 들어, 알칸)와 같은 지질 및 지질 유도체는 전술된 바와 같은 리파제를 포함하여 하나 이상의 효소를 사용함으로써 변형시킬 수 있다. 탄화수소가 세포의 세포외 환경에 존재하는 경우, 효소가 탄화수소를 변형시키거나 탄화수소 전구체로부터 이의 합성을 완성하도록 하는 조건 하에서 하나 이상의 효소를 상기 환경에 첨가할 수 있다. 대안적으로, 상기 탄화수소는 효소와 같은 하나 이상의 촉매의 첨가 전에 세포 물질로부터 부분적으로 또는 완전하게 분리될 수 있다. 상기 촉매는 외인성으로 첨가되고, 이들의 활성은 세포 외부에서 또는 시험관내에서 발생한다.
따라서, 본원에 기술된 바와 같이 생체 내에서 세포에 의해 생성되거나 시험관 내에서 효소로 변형된 지질 및 탄화수소는 임의로 통상적인 수단에 의해 추가로 가공될 수 있다. 상기 가공은 탄화수소 분자의 크기를 감소시키고 따라서 이의 수소:탄소 비율을 증가시키기 위한 “크래킹(cracking)”을 포함할 수 있다. 촉매 및 열 크래킹 방법은 통상적으로 탄화수소 및 트리글리세라이드 오일 가공에 사용한다. 촉매 방법은 고체 산 촉매와 같은 촉매의 사용을 포함한다. 촉매는 실리카-알루미나 또는 제올라이트일 수 있고, 이로써 탄소-탄소 결합을 이종 용해 또는 비대칭 분해시켜 카보양이온(carbocation) 및 수소화물 음이온을 생성할 수 있다. 이들 반응성 중간체를 이어서 다른 탄화수소와 함께 재배열하거나 수소화 전달을 진행시킨다. 따라서 상기 반응은 중간체를 재생성시켜 자가 증폭 사슬 기작을 유도할 수 있다. 또한 탄화수소는 여기서의 탄소-탄소 이중 결합 또는 삼중 결합의 수를 임의로 0까지 감소하도록 가공할 수 있다. 또한 탄화수소를 가공하여 여기서의 고리 또는 환형 구조를 제거할 수 있다. 탄화수소를 또한 가공하여 수소:탄소 비율을 증가시킬 수 있다. 이것은 수소의 첨가(“수소화”) 및/또는 탄화수소의 보다 작은 탄화수소로의 “크래킹”을 포함할 수 있다.
열 방법은 탄화수소 크기를 감소시키기 위한 상승된 온도 및 압력의 사용을 포함한다. 약 800℃의 승온 및 약 700kPa의 압력을 사용할 수 있다. 이들 조건은 때때로 수소 풍부 탄화수소 분자(양성자 플럭스와는 구분됨)를 언급하는데 사용되는 용어 “가벼운” 탄화수소 분자를 생성하는 한편, 또한 응축에 의해 상대적으로 수소가 고갈된 보다 무거운 탄화수소 분자를 생성한다. 상기 방법은 균형 분해 또는 대칭적 분해를 제공하고, 전술된 바와 같이 임의로 효소로 포화될 수 있는 알켄을 생성한다.
촉매 및 열 방법은 탄화수소 가공 및 정유를 위한 식물에서의 표준 방법이다. 따라서, 본원에 기술된 바와 같은 세포에 의해 생성된 탄화수소가 수집될 수 있고, 통상적인 수단에 의해 가공되거나 정제될 수 있다. 미세 조류 생산 탄화수소의 수소크래킹에 대한 보고에 대해 문헌[Hillen et al. (Biotechnology and Bioengineering, Vol. XXIV: 193-205 (1982))]을 참조한다. 대안적인 구체예에서, 상기 분획물은 다른 촉매, 예를 들어 유기 화합물, 열 및/또는 무기 화합물로 처리한다. 지질의 바이오디젤로의 가공을 위해, 에스테르 결합 전이 공정이 본 섹션의 하기에 기술된 바와 같이 사용된다.
본 발명의 방법을 통해 생성되는 탄화수소는 다양한 산업 응용 분야에서 유용하다. 예를 들어, 거의 모든 유형의 세제 및 세정 제조물에서 사용되는 음이온 게면활성제인 선형 알킬벤젠 설포네이트(LAS)의 생산은 일반적으로 10개 내지 14개의 탄소 원자 사슬을 포함하는 탄화수소를 사용한다. 예를 들어, 미국 특허 제6,946,430호; 제5,506,201호; 제6,692,730호; 제6,268,517호; 제6,020,509호; 제6,140,302호; 제5,080,848호; 및 제5,567,359호를 참조한다. LAS와 같은 계면활성제는 퍼스널 케어 조성물 및 세제(예를 들어, 미국 특허 제5,942,479호; 제6,086,903호; 제5,833,999호; 제6,468,955호; 및 제6,407,044호에 기술된 것들)의 제조에 사용할 수 있다.
화석 연료로부터 유래된 출발 물질을 대체할 수 있는 재생가능한 생물학적 출발 물질이 이용가능하고 이의 사용이 바람직할 수 있기 때문에, 바이오디젤, 재생 디젤 및 제트 연료와 같은 연료에서의 생물학적 유래의 탄화수소 성분의 사용에 대한 관심이 증대되고 있다. 생물학적 물질로부터 탄화수소 성분을 생산하기 위한 방법이 시급히 요구되고 있다. 본 발명은 바이오디젤, 재생 디젤 및 제트 연료를 제조하기 위해 생물학적 재료로서 본원에 기술된 방법에 의해 생성된 지질을 사용하여, 바이오디젤, 재생 디젤 및 제트 연료를 생산하는 방법을 제공함으로써 상기 필요성을 충족시킨다.
통상적인 디젤 연료는 파라핀 탄화수소가 풍부한 석유 증류물이다. 이들은 370℉ 내지 78O℉ 정도로 넓은 비등 범위를 가지며, 이는 디젤 엔진 차량과 같은 압축 점화 엔진에서 연소용으로서 적합하다. 미국 재료 시험 협회(American Society of Testing and Materials; ASTM)는 세탄수, 혼탁점, 인화점, 점도, 아닐린 점, 황 함량, 물 함량, 재 함량, 동판 부식 및 잔류 탄소와 같은 허용 가능한 범위의 기타 다른 연료 특성과 함께 비등 범위에 따라 디젤 등급을 확립한다. 기술적으로, 적절한 ASTM 사양을 충족하는 바이오매스 또는 기타 다른 것으로부터 유래된 임의의 탄화수소 증류 재료는 디젤 연료(ASTM D975), 제트 연료(ASTM D1655), 또는 이것이 지방산 메틸 에스테르인 경우 바이오디젤(ASTM D6751)로서 정의될 수 있다.
추출 후, 본원에 기술된 미생물 바이오매스로부터 회수된 지질 및/또는 탄화수소 성분은 디젤 차량 및 제트 엔진에 사용하기 위한 연료를 제조하기 위해 화학 처리될 수 있다.
바이오디젤은 금색 내지 암갈색으로 생산 공급원료에 따라 색상이 다양한 액체이다. 이것은 실제로 수불혼화성이고, 고비등점 및 저증기압을 갖는다. 바이오디젤은 디젤-엔진 차량에 사용하기 위한 디젤 등가의 가공된 연료를 말한다. 바이오디젤은 생분해성이고 비독성이다. 통상적인 디젤 연료에 대한 바이오디젤의 추가의 이득은 보다 낮은 엔진 마모이다. 통상적으로, 바이오디젤은 C14 내지 C18 알킬 에스테르를 포함한다. 다양한 가공은 본원에 기술된 바와 같이 생성되고 분리된 바이오매스 또는 지질을 디젤 연료로 전환시킨다. 바이오디젤을 생산하기 위한 바람직한 방법은 본원에 기술된 바와 같이 지질의 에스테르 결합 전이에 의한 것이다. 바이오디젤로서 사용하기 위한 바람직한 알킬 에스테르는 메틸 에스테르 또는 에틸 에스테르이다.
본원에 기술된 방법에 의해 생성된 바이오디젤은 대부분의 현재 디젤-엔진 차량에서 임의의 농도로 단독으로 사용되거나 통상적인 디젤 연료와 배합하여 사용될 수 있다. 통상적인 디젤 연료(석유 디젤)와 배합되는 경우, 바이오디젤은 약 0.1% 내지 약 99.9%로 존재할 수 있다. 많은 국가에서는 임의의 연료 혼합물에서 바이오디젤의 양을 지칭하기 위해 “B” 인자로서 공지된 시스템을 사용한다. 예를 들어, 20%의 바이오디젤을 함유하는 연료는 B20으로 표시된다. 순수한 바이오디젤은 B1OO으로 언급된다.
바이오디젤은 또한 가정용 및 상업용 보일러에서 가열 연료로서 사용될 수 있다. 기존의 오일 보일러는 고무 부품을 함유할 수 있고 바이오디젤 상에서의 운행을 위해서는 전환을 필요로 할 수 있다. 전환 과정은 일반적으로 비교적 단순하고, 바이오디젤이 강한 용매이기 때문에 고무 부품의 합성 부품으로의 교환을 포함한다. 이의 강한 용해력 때문에, 바이오디젤의 연소는 보일러의 효율을 증가시킬 것이다. 바이오디젤은 순수한 초저황 디젤(ULSD) 연료의 윤활성을 증가시키기 위해 디젤 제형 중에 첨가제로서 사용될 수 있고, 이는 이것이 실제로 황을 내포하지 않기 때문에 유리하다. 바이오디젤은 석유디젤 보다 양호한 용매이고, 이전에 석유디젤 상에서 운행된 차량의 연료관 중에 잔류 침적물을 분해시키는데 사용될 수 있다.
바이오디젤은 오일 풍부 바이오매스 중에 함유된 트리글리세라이드의 에스테르 결합 전이에 의해 생성될 수 있다. 따라서, 본 발명의 다른 양태에서, 바이오디젤을 생산하기 위한 방법이 제공된다. 바람직한 구체예에서, 바이오디젤을 생산하는 방법은 (a) 본원에 개시된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 지질 함유 미생물을 용해시켜 용해물을 생성시키는 단계, (c) 용해된 미생물로부터 지질을 분리하는 단계, 및 (d) 지질 조성물을 에스테르 결합 전이하여 바이오디젤을 생성시키는 단계를 포함한다. 미생물의 생장 방법, 미생물을 용해시켜 용해물을 생성하는 방법, 유기 용매를 포함하는 배지에서 용해물을 처리하여 이종성 혼합물을 형성시키는 방법 및 처리된 용해물을 지질 조성물로 분리하는 방법은 상기 기술되었고 또한 바이오디젤을 생산하는 방법에 사용될 수 있다.
바이오디젤의 지질 프로필은 일반적으로 공급원료 오일의 지질 프로필과 고도로 유사하다. 본 발명의 방법 및 조성물에 의해 제공된 기타 다른 오일은 에스테르 결합 전이시켜 바이오디젤을 생산할 수 있고, 이때 지질 프로필은 (a) C8 내지 C14 4% 이상; (b) C8 0.3% 이상; (c) ClO 2% 이상; (d) C12 2% 이상; 및 (e) C8 내지 C14 30% 이상을 포함한다.
지질 조성물은 에스테르 결합 전이되어 바이오디젤로서 유용한 장쇄의 지방산 에스테르를 생산할 수 있다. 바람직한 에스테르 결합 전이 반응은 하기에 개괄되어 있으며, 염기 촉매된 에스테르 결합 전이 및 재조합 리파제를 사용하는 에스테르 결합 전이를 포함한다. 염기 촉매된 에스테르 결합 전이 공정에서, 트리아실글리세라이드는 알칼리성인 촉매, 통상적으로 수산화칼륨의 존재 하에 메탄올 또는 에탄올과 같은 알코올과 반응시킨다. 상기 반응은 부산물로서 메틸 에스테르 또는 에틸 에스테르 및 글리세린(글리세롤)을 형성한다.
동물 및 식물 오일은 통상적으로 3가 알코올인 글리세롤과 유리된 지방산의 에스테르인 트리글리세라이드로 구성된다. 에스테르 결합 전이에서, 트리글리세라이드(TAG) 중의 글리세롤은 메탄올 또는 에탄올과 같은 단쇄 알코올로 대체된다. 통상적인 반응식은 다음과 같다.
상기 반응에서, 알코올은 염기로 탈양성자화되어 보다 강한 친핵성이 되게 한다. 통상적으로, 에탄올 또는 메탄올은 매우 과량(50배 이하)으로 사용된다. 정상적으로 상기 반응은 상당히 느리게 진행하거나 전혀 진행하지 않을 것이다. 산 또는 염기뿐만 아니라 열을 사용하여 반응의 보다 신속한 진행을 도와줄 수 있다. 산 또는 염기는 에스테르 결합 전이 반응에 의해 소비되지 않으며, 따라서 이들은 반응물이 아니고 촉매이다. 거의 모든 바이오디젤은 이것이 단지 저온 및 저압을 필요로 하고 98% 초과의 전환 수율을 나타내므로(단, 출발 오일은 수분 및 유리된 지방산이 낮음) 염기 촉매된 기술을 사용하여 생산되었다.
에스테르 결합 전이는 또한 상기 개시된 바와 같이 염기 대신 리파제와 같은 효소를 사용하여 수행하였다. 리파제로 촉매된 에스테르 결합 전이는, 예를 들어 실온 내지 80℃의 온도 및 1:1 초과, 바람직하게는 약 3:1인 TAG 대 저급 알코올의 몰비에서 수행할 수 있다. 에스테르 결합 전이에 사용하기에 적합한 리파제는 표 9에 기재된 것들을 포함하지만 이에 제한되지 않는다. 에스테르 결합 전이에 유용한 리파제의 기타 다른 예는, 예를 들어 미국 특허 제4,798,793호; 제4,940,845호; 제5,156,963호; 제5,342,768호; 제5,776,741호 및 WO 89/01032호에서 찾을 수 있다. 상기 리파제로서는 리조푸스(Rhizopus), 아스퍼질러스(Aspergillus), 칸디다(Candida), 무코르(Mucor), 슈도모나스(Pseudomonas), 리조무코르(Rhizomucor), 칸디다 및 휴미콜라(Humicola) 미생물에 의해 생성된 리파제 및 췌장 리파제를 포함하지만 이에 제한되지 않는다.
아스퍼질러스 나이저 리파제 ABG73614, 칸디다 안타크티카(Candida antarctica) 리파제 B (novozym-435) CAA83122, 칸디다 실린드라세아(Candida cylindracea) 리파제 AAR24090, 칸디다 리폴리티카(Candida lipolytica) 리파제(리파제 L; Amano Pharmaceutical Co., Ltd.), 칸디다 루고사(Candida rugosa) 리파제(예를 들어, 리파제-OF; Meito Sangyo Co., Ltd.), 무코르 미에헤이(Mucor miehei) 리파제(Lipozyme IM 20), 슈도모나스 플루오레센스(Pseudomonas fluorescens) 리파제 AAA25882, 리조푸스 자포니카스(Rhizopus japonicas) 리파제(리파제 A-10FG) Q7M4U7_1, 리조무코르 미에헤이(Rhizomucor miehei) 리파제 B34959, 리조푸스 오리재(Rhizopus oryzae) 리파제(리파제 F) AAF32408, 세라티아 마르세센스(Serratia marcescens) 리파제(SM Enzyme) ABI13521, 써모마이세스 라누기노사(Thermomyces lanuginosa) 리파제 CAB58509, 리파제 P(Nagase ChemteX Corporation), 및 리파제 QLM(Meito Sangyo Co., Ltd., Nagoya, Japan) |
바이오디젤용으로 적합한 지방산 에스테르의 제조를 위해 리파제를 사용하는 것에 대한 문제점은 리파제 가격이 강염기 공정에 의해 사용되는 수산화나트륨(NaOH)의 가격보다 훨씬 고가라는 것이다. 상기 문제점은 재순환될 수 있는 고정화된 리파제를 사용함으로써 해결되었다. 그러나, 리파제 기반 공정이 생산 단가의 측면에서 강염기 공정과 경쟁을 하도록 하기 위해서는 최소의 주기 수 동안 재순환된 후 고정화된 리파제의 활성은 유지되어야만 한다. 고정화된 리파제는 에스테르 결합 전이에 통상적으로 사용되는 저급 알코올에 의해 독성이 된다. 미국 특허 제6,398,707호(Wu et al., 2002년 6월 4일자로 등록됨)는 고정화된 리파제의 활성을 증진시키는 방법 및 감소된 활성을 갖는 고정화된 리파제를 재생시키는 방법을 기술한다. 몇몇 적합한 방법은 일정 기간 동안, 바람직하게는 0.5시간 내지 48시간, 보다 바람직하게는 0.5시간 내지 1.5시간 동안 3개 이상의 탄소 원자수를 갖는 알코올 중에 고정화된 리파제를 침지시키는 것을 포함한다. 몇몇 적합한 방법은 또한 불활성화된 고정화된 리파제를 3개 이상의 탄소 원자수를 갖는 알코올로 세척함에 이어서 식물성 오일 중에 0.5시간 내지 48시간 동안 불활성화된 고정화된 리파제를 침지시키는 것을 포함한다.
특정 구체예에서, 재조합 리파제는 리파제가 작용하는 지질을 생산하는 동일한 미생물 내에서 발현된다. 적합한 재조합 리파제는 상기 표 9에 열거되고/열거되거나 표 9에 열거된 GenBank 수탁 번호를 갖는 것들, 또는 상기 표 9에 열거된 리파제 중 하나와 70% 이상의 아미노산 동일성을 갖고 리파제 활성을 나타내는 폴리펩티드를 포함한다. 추가의 구체예에서, 효소 활성은 전술된 서열 중 하나와 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 99% 이상 동일성을 갖는 서열 중에 존재하고 상기 서열 모두는 완전히 제시된 것처럼 본원에 참조로 포함된다. 리파제 및 선택가능한 마커를 암호화하는 DNA는 바람직하게 코돈 최적화된 cDNA이다. 미세 조류 중에서 발현하기 위해 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기술되어 있다.
바이오디젤에 대한 통상의 국제 표준은 EN 14214이다. ASTM D6751은 미국 및 캐나다에서 참조되는 가장 일반적인 바이오디젤 표준이다. 독일은 DIN EN 14214를 사용하고, UK는 BS EN 14214을 준수할 것을 요구한다. 생성물이 이들 표준에 부합하는지의 여부를 결정하기 위한 기본 산업적 시험은 통상적으로 가스 크로마토그래피, HPLC 등을 포함한다. 품질 표준을 충족하는 바이오디젤은 매우 비독성이고, 독성 등급(LD50)은 50mL/kg을 초과한다.
ASTM 표준을 충족하는 바이오디젤이 비독성이어야만 하지만, 결정화하고/결정화하거나 침전하고 용액으로부터 침강물로서 나오는 경향이 있는 오염물이 있을 수 있다. 침강물 형성은 특히 바이오디젤이 보다 저온에서 사용되는 경우 문제가 된다. 침강 또는 침전은 연료 흐름을 감소시키고, 연료관을 막히게 하며, 필터를 막히게 하는 것 등과 같은 문제를 유발할 수 있다. 고품질의 생성물을 제조하기 위해 바이오디젤에서 상기 오염물 및 침강물을 제거하는 것을 다루는 공정들은 당업계에 널리 공지되어 있다. 상기 공정들의 예로서는 인지질 및 유리 지방산과 같은 오염물을 제거하기 위한 오일의 전처리(예를 들어, 고무 성질 제거(degumming), 가성 정제 및 실리카 흡착 여과) 및 냉여과를 포함하지만 이에 제한되지 않는다. 냉여과는 생성 후 바이오디젤에 존재하는 임의의 미립자 및 침강물을 제거하기 위해 특별히 개발된 공정이다. 상기 공정은 바이오디젤을 냉각시키고 연료가 보다 저온에서 사용되는 경우 형성될 수 있는 임의의 침강물 또는 침전물을 여과 제거한다. 상기 공정은 당업계에 널리 공지되어 있고 미국 특허 출원 공개 제2007-0175091호에 기술되어 있다. 적합한 방법은 바이오디젤을 약 38℃ 미만의 온도로 냉각시켜 불순물 및 오염물이 바이오디젤 액체 중에서 미립자로서 침전하도록 하는 것을 포함할 수 있다. 이어서 규조토 또는 기타 다른 여과 재료를 냉각된 바이오디젤에 첨가하여 슬러리를 형성시킬 수 있고, 이것은 이어서 압력 리프(pressure leaf) 또는 기타 다른 유형의 필터를 통해 여과하여 미립자를 제거할 수 있다. 이어서 여과된 바이오디젤은 연마(polish) 필터에 통과시켜 임의의 잔류 침강물 및 규조토를 제거하여 최종 바이오디젤 생성물을 생성할 수 있다.
실시예 9는 프로토테카 모리포르미스로부터 유래한 트리글리세라이드 오일을 사용하는 바이오디젤의 제조법을 기술한다. 실시예 9에서 생산된 바이오디젤의 ASTM D6751 A1 방법에 의한 콜드 소킹 여과능(Cold Soak Filterability)은 300ml의 용적에 대해 120초였다. 상기 시험은 16시간 동안 40℉로 냉각시키고 실온으로 가온되도록 하며, 스테인리스강 지지체를 가진 0.7마이크론 유리 섬유 필터를 사용하여 진공 여과하는, 300ml의 B100의 여과를 포함한다. 본 발명의 오일은 에스테르 결합 전이되어 120초 미만, 100초 미만 및 90초 미만의 콜드 소킹 시간을 가진 바이오디젤을 생성할 수 있다.
후속 공정은 또한 바이오디젤이 특히 냉온에서 사용될 경우 이용될 수 있다. 상기 공정은 윈터리제이션(winterization) 및 분별을 포함한다. 2개 공정은 혼탁점(바이오디젤이 결정화하기 시작하는 온도)을 저하시킴으로써 연료의 냉각 흐름 및 동결 방지 수행능을 개선시키도록 설계된다. 바이오디젤의 동결 방지 처리에는 다수의 접근법이 있다. 한가지 접근법은 바이오디젤을 석유 디젤과 배합하는 것이다. 다른 접근법은 바이오디젤의 혼탁점을 저하시킬 수 있는 첨가제를 사용하는 것이다. 다른 접근법은 첨가제 중에 혼합하고 포화물이 결정화하도록 하며, 이어서 결정을 여과 제거함으로써 무분별하게 포화된 메틸 에스테르를 제거하는 것이다. 분별은 선택적으로 메틸 에스테르를 개별 성분 또는 분획으로 분리하여 특정 메틸 에스테르가 제거 또는 포함될 수 있게 한다. 분별 방법은 우레아 분별, 용매 분별 및 열 증류를 포함한다.
본 발명의 방법에 의해 제공되는 다른 가치있는 연료는 C10:0, C12:0, C14:0, C16:0 및 C18:0과 같은 알칸을 포함하여 바이오디젤과는 구분될 수 있는 재생 디젤이다. 고품질의 재생 디젤은 ASTM D975 표준에 부합한다. 본 발명의 방법에 의해 생성된 지질은 공급원료로서 작용하여 재생 디젤을 생성할 수 있다. 따라서, 본 발명의 또 다른 양태에서, 재생 디젤을 생성하는 방법이 제공된다. 재생 디젤은 열수 가공(수소 처리); 수소화처리; 및 간접적인 액화의 3가지 이상의 공정에 의해 생성될 수 있다. 이들 공정으로 비에스테르 증류물을 생성한다. 이들 공정 동안에, 본원에 기술된 바와 같이 생성되고 분리된 트리아실글리세라이드는 알칸으로 전환된다.
하나의 구체예에서, 재생 디젤을 생성하는 방법은 (a) 본원에 개시된 방법을 사용하여 지질 함유 미생물을 배양하고 (b) 미생물을 용해시켜 용해물을 생성하며, (c) 용해된 미생물로부터 지질을 분리하고 (d) 지질을 탈산소화하고 수소화처리하여 알칸을 생성함으로써 재생 디젤이 생성되도록 하는 것을 포함한다. 재생 디젤을 제조하기에 적합한 지질은 헥산과 같은 유기 용매를 사용하거나 미국 특허 제5,928,696호에 기술된 것들과 같은 기타 다른 방법을 통해 미생물 바이오매스로부터 추출을 통해 수득할 수 있다. 몇몇 적합한 방법으로서는 기계적 프레싱 및 원심분리를 포함할 수 있다.
몇몇 방법에서, 미생물 지질은 먼저 수소화처리와 연계하여 크래킹하여 각각 탄소 사슬 길이를 감소시키고 이중 결합을 포화시킨다. 상기 물질을 또한 이어서 수소화처리와 연계하여 이성체화한다. 이어서 나프타 분획을 증류를 통해 제거하고 이어서 추가 증류하여 디젤 연료에 요구되는 성분을 증발시키고 증류시킴으로써 ASTM D975 표준에 충족하도록 하고 D975 표준을 충족시키기 위해 원하는 것보다 무거운 성분을 잔류시킨다. 트리글리세라이드 오일을 포함하는 오일을 화학적으로 변형시키는 수소 처리, 수소 크래킹, 탈산소화 및 이성체화 방법은 당업계에 널리 공지되어 있다. 예를 들어, 유럽 특허 출원 EP1741768(A1); EP1741767(A1); EP1682466(A1); EP1640437(A1); EP1681337(A1); EP1795576(A1); 및 미국 특허 제7,238,277호; 제6,630,066호; 제6,596,155호; 제6,977,322호; 제7,041,866호; 제6,217,746호; 제5,885,440호; 제6,881,873호를 참조한다.
재생 디젤을 생성하기 위한 방법의 하나의 구체예에서, 알칸을 생성하기 위한 지질의 처리는 지질 조성물의 수소 처리에 의해 수행한다. 열수 가공에서, 통상적으로 바이오매스는 승온 및 승압에서 물 중에서 반응시켜 오일 및 잔류 고체를 형성시킨다. 전환 온도는 통상적으로 300℉ 내지 660℉이고, 이때 압력은 주로 액체로서 물을 유지하기에 충분한 100 표준 대기압 내지 170 표준 대기압(atm)이다. 반응 시간은 대략 15분 내지 30분 정도이다. 반응을 종결한 후 유기물을 물로부터 분리한다. 이로써 디젤에 적합한 증류물이 생성된다.
재생 디젤을 제조하는 몇몇 방법에서, 트리글리세라이드를 처리하는 제1 단계는 이중 결합을 포화시키기 위한 수소 가공에 이어서, 수소 및 촉매의 존재 하에 승온에서 탈산소화시키는 것이다. 몇몇 방법에서, 수소화 및 탈산소화는 동일한 반응에서 발생한다. 기타 다른 방법에서, 탈산소화는 수소화 전에 일어난다. 이어서 이성체화는 임의로 또한 수소 및 촉매의 존재 하에서 수행한다. 나프타 성분은 바람직하게 증류를 통해 제거한다. 예를 들어, 미국 특허 제5,475,160호 (트리글리세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 가스 제거); 제6,391,815호(수소화); 및 제5,888,947호(이성체화)를 참조한다.
트리글리세라이드의 수소화를 위한 하나의 적합한 방법은 구리, 아연, 마그네슘 및 란탄염의 수용액 및 알칼리 금속 또는 바람직하게는 탄산암모늄의 다른 용액을 제조하는 것을 포함한다. 상기 2개의 용액을 약 20℃ 내지 약 85℃의 온도로 가열하고 침전 용기 내 pH가 5.5 내지 7.5로 유지되어 촉매를 형성하도록 하는 비율로 침전 용기 내로 함께 계량하여 부가할 수 있다. 추가의 물은 초기에 침전 용기 내에 사용할 수 있거나 염 용액 및 침전 용액과 동시에 첨가할 수 있다. 이어서 생성된 침전물을 약 300℃에서 완전히 세척하고 건조시키며 하소시키고 약 100℃ 내지 약 400℃의 온도 범위에서 수소 중에서 활성화시킬 수 있다. 이어서 하나 이상의 트리글리세라이드는 반응기 내 전술된 촉매의 존재 하에서 수소와 접촉시키고 반응시킬 수 있다. 상기 반응기는 살수층(trickle bed) 반응기, 고정 상 가스-고체 반응기, 충진된 기포 탑 반응기, 연속 교반 탱크 반응기, 슬러리 상 반응기 또는 당업계에 공지된 임의의 기타 다른 적합한 반응기 유형일 수 있다. 상기 방법은 배치식으로 또는 연속식으로 수행할 수 있다. 반응 온도는 통상적으로 약 170℃ 내지 약 250℃의 범위인 한편, 반응 압력은 통상적으로 약 300psig 내지 약 2000psig 범위이다. 더욱이, 본 발명의 방법에서 수소 대 트리글리세라이드의 몰 비는 통상적으로 약 20:1 내지 약 700:1 범위이다. 상기 방법은 통상적으로 시간당 중량 공간 속도(WHSV)에서 수행하고 이의 범위는 약 0.1hr-1 내지 약 5hr-1이다. 당업자는 반응을 위해 요구되는 시간이 사용되는 온도, 수소 대 트리글리세라이드의 몰비, 및 수소 분압에 따라 다양할 것임을 인지할 것이다. 상기 수소화 공정에 의해 생성되는 생성물은 지방 알코올, 글리세롤, 미량의 파라핀 및 미반응 트리글리세라이드를 포함한다. 이들 생성물은 통상적으로, 예를 들어 증류, 추출, 여과, 결정화 등과 같은 통상적인 수단에 의해 분리한다.
석유 정유업자는 수소화처리를 사용하여 공급물을 수소로 처리함으로써 불순물을 제거한다. 수소화처리 전환 온도는 통상적으로 300℉ 내지 700℉이다. 압력은 통상적으로 40atm 내지 100atm이다. 반응 시간은 통상적으로 대략 10분 내지 60분 정도이다. 고체 촉매를 사용하여 특정 반응 속도를 증가시키고 특정 생성물에 대한 선택성을 개선시키며 수소 소비를 최적화한다.
오일의 탈산소화를 위해 적합한 방법은 오일을 약 350℉ 내지 약 55O℉ 범위의 온도로 가열하고 연속적으로 가열된 오일을 약 5분 이상 동안 적어도 약 대기압 내지 그 이상의 범위 압력 하에서 질소와 접촉시키는 것을 포함한다.
이성체화를 위해 적합한 방법은 알칼리 이성체화 및 당업계에 공지된 기타 다른 오일 이성체화를 사용하는 것을 포함한다.
수소 처리 및 수소 가공은 궁극적으로 트리글리세라이드 공급물의 분자량 감소를 유도한다. 상기 트리글리세라이드 분자는 수소 가공 조건 하에서 4개의 탄화수소 분자, 즉 프로판 분자 및 통상적으로 C8 내지 C18 범위인 3개의 보다 무거운 탄화수소 분자로 감소한다.
따라서, 하나의 구체예에서, 본 발명의 지질 조성물 상에서 수행되는 하나 이상의 화학 반응(들)의 생성물은 ASTM D975 재생 디젤을 포함하는 알칸 혼합물이다. 미생물에 의한 탄화수소의 생성은 문헌[Metzger et al. Appl Microbiol Biotechnol (2005) 66: 486-496] 및 [A Look Back at the U.S. Department of Energy's Aquatic Species Program: Biodiesel from Algae, NREL/TP-580-24190, John Sheehan, Terri Dunahay, John Benemann 및 Paul Roessler (1998)]에 의해 검토되었다.
디젤 연료의 증류 특성은 T10-T90(각각 10% 및 90%의 용적이 증류되는 온도)의 관점에서 기술한다. 재생 디젤은 프로토테카 모리포르미스 트리글리세라이드 오일로부터 생성되었고 실시예 9에 기술된다. 실시예 9에 생성된 물질의 T10-T90은 57.9℃였다. 본원에 개시된 오일의 수소 처리, 이성체화 및 기타 다른 공유 변형 방법, 및 본원에 개시된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여, 본원에 개시된 방법에 따라 생성된 트리글리세라이드 오일을 사용하여 기타 다른 T10-T90 범위가 예를 들어 20℃, 25℃, 30℃, 35℃, 40℃, 45℃, 50℃, 60℃ 및 65℃인 재생 디젤 조성물을 생성할 수 있다.
실시예 9에서 생성된 물질의 T10은 242.1℃이다. 본원에 개시된 오일의 수소 처리, 이성체화 및 기타 다른 공유 변형 방법, 및 본원에 개시된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여 기타 다른 T10 값, 예를 들어 T10이 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 290 이상의 T10인 재생 디젤 조성물을 생성할 수 있다.
실시예 9에서 생성된 물질의 T90은 300℃이다. 본원에 개시된 오일의 수소 처리, 이성체화 및 기타 다른 공유 변형 방법, 및 본원에 개시된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여 기타 다른 T90 값, 예를 들어 T90이 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 및 290 이상인 재생 디젤 조성물을 생성할 수 있다.
실시예 9에서 생성된 물질의 FBP는 300℃이다. 본원에 개시된 오일의 수소 처리, 이성체화 및 기타 다른 공유 변형 방법, 및 본원에 개시된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여 기타 다른 FBP 값, 예를 들어 FBP가 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 및 300 이상인 재생 디젤 조성물을 생성할 수 있다.
본 발명의 방법 및 조성물에 의해 제공된 기타 다른 오일은 수소처리, 이성체화 및 기타 다른 공유 변형의 조합을 거칠 수 있고, (a) C8 내지 C14 4% 이상; (b) C8 0.3% 이상; (c) ClO 2% 이상; (d) C12 2% 이상; 및 (e) C8 내지 C14 30% 이상을 포함하는 지질 프로필을 갖는 오일을 포함한다.
통상적인 초저황 디젤은 2단계 공정에 의해 임의의 형태의 바이오매스로부터 생성될 수 있다. 먼저, 바이오매스를 수소 및 일산화탄소가 풍부한 가스 혼합물인 합성가스로 전환시킨다. 이어서, 합성가스를 촉매적으로 액체로 전환시킨다. 통상적으로, 액체의 생성은 피셔-트로프슈(Fischer-Tropsch)(FT) 합성을 사용하여 성취한다. 상기 기술은 석탄, 천연 가스 및 중유에 적용한다. 따라서, 재생 디젤을 생성하기 위한 방법의 또 다른 바람직한 구체예에서, 알칸을 생성하기 위한 액체 조성물의 처리는 액체 조성물의 간접적인 액화에 의해 수행한다.
본 발명은 또한 제트 연료를 제조하는 방법을 제공한다. 제트 연료는 담황색 색상으로 투명하다. 가장 일반적인 연료는 국제 표준 세트의 사양으로 제조되는 항공기 A-1로서 분류되는 무연/파라핀 오일계 연료이다. 제트 연료는 다수의 상이한, 가능하게는 천 개 이상의 많은 상이한 탄화수소의 혼합물이다. 이들의 크기 범위(분자량 또는 탄소수)는 생성물에 대한 요건, 예를 들어 동결점 또는 발연점에 의해 제한된다. 등유형(Kerosene-type) 항공기 연료(제트 A 및 제트 A-1을 포함함)는 약 8개 내지 16개 탄소수의 탄소수 분포를 갖는다. 와이드-컷 또는 나프타형 항공기 연료(제트 B를 포함함)는 통상적으로 약 5개 내지 15개 탄소의 탄소수 분포를 갖는다.
2개의 항공기(제트 A 및 제트 B)는 다수의 첨가제를 함유할 수 있다. 유용한 첨가제로서는 항산화제, 대전방지제, 부식 억제제, 및 연료 시스템 아이싱 억제제(FSII)를 포함하지만 이에 제한되지 않는다. 항산화제는 검화(gumming)를 방지하고 일반적으로 알킬화된 페놀, 예를 들어 AO-30, AO-31, 또는 AO-37을 기초로 한다. 대전방지제는 정전기를 소멸시켜 스파킹을 차단한다. 활성 성분으로서 디노닐나프틸설폰산(DINNSA)을 갖는 Stadis 450이 하나의 예이다. 부식 억제제, 예를 들어 DCI-4A는 대중 및 군사 연료용으로 사용되고, DCI-6A는 군사 연료용으로 사용된다. FSII 제제는, 예를 들어 Di-EGME를 포함한다.
본 발명의 하나의 구체예에서, 제트 연료는 기존의 제트 연료와 조류 연료를 배합함으로써 생성된다. 본 발명의 방법에 의해 생성된 지질은 공급원료로서 작용하여 제트 연료를 생성할 수 있다. 따라서, 본 발명의 다른 양태에서, 제트 연료를 제조하는 방법이 제공된다. 이와 함께 본 발명의 방법에 의해 생성된 지질로부터 제트 연료를 제조하는 2가지 방법으로서 유동 촉매 크래킹(FCC); 및 수소첨가탈산소화(HDO)가 제공된다.
유동 촉매 크래킹(FCC)은 중질 원유 분획물 유래의 올레핀, 특히 프로필렌을 제조하기 위해 사용되는 하나의 방법이다. 본 발명의 방법에 의해 생성된 지질은 올레핀으로 전환시킬 수 있다. 상기 방법은 FCC 영역을 통해 생성된 지질을 유동시키고 제트 연료로서 유용한 올레핀으로 구성된 생성물 스트림을 수집함을 포함한다. 생성된 지질은 크래킹 조건에서 크래킹 촉매와 접촉시켜 제트 연료로서 유용한 올레핀 및 탄화수소를 포함하는 생성물 스트림을 제공한다.
하나의 구체예에서, 제트 연료를 제조하는 방법은 (a) 본원에 개시된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 지질 함유 미생물을 용해시켜 용해물을 생성하는 단계, (c) 용해물로부터 지질을 분리하는 단계, 및 (d) 지질 조성물을 처리함으로써 제트 연료를 생성하는 단계를 포함한다. 제트 연료를 제조하는 방법의 하나의 구체예에서, 상기 지질 조성물은 유체 촉매 크래킹 영역을 통류할 수 있고 이는 하나의 구체예에서 지질 조성물을 크래킹 조건에서 크래킹 촉매와 접촉시켜 C2 내지 C5 올레핀을 포함하는 생성물 스트림을 제공함을 포함할 수 있다.
상기 방법의 특정 구체예에서, 지질 조성물에 존재할 수 있는 임의의 오염물을 제거하는 것이 바람직할 수 있다. 따라서, 유체 촉매 크래킹 영역을 통해 지질 조성물을 유동시키기 전에, 지질 조성물을 전처리한다. 전처리는 지질 조성물을 이온 교환 수지와 접촉시키는 것을 포함할 수 있다. 이온 교환 수지는 산성 이온 교환 수지, 예를 들어 Amberlyst™-15이고, 지질 조성물이 통류(상향 통류 또는 하향 통류)하는 반응기 내 상으로서 사용될 수 있다. 기타 다른 전처리는 지질 조성물의 산, 예를 들어 황산, 아세트산, 질산 또는 염산과의 접촉에 의한 약산 세척을 포함할 수 있다. 접촉은 일반적으로 주위 온도 및 대기압에서 희석 산 용액으로 수행된다.
임의로 전처리된 지질 조성물은 탄화수소 성분이 올레핀으로 크래킹되는 FCC 영역으로 유동한다. 촉매 크래킹은 반응 영역중의 지질 조성물을 미분된 미립자 물질로 구성된 촉매와 접촉시킴으로써 성취된다. 상기 반응은 수소크래킹이 아닌 촉매 크래킹이고, 부가되는 수소의 부재 또는 수소의 소비 하에서 수행된다. 크래킹 반응이 진행함으로써 상당한 양의 코크가 촉매상에 침적된다. 상기 촉매는 재생 영역에서 촉매 유래의 코크를 연소시킴으로써 고온에서 재생된다. 본원에서, “코크 촉매”로서 언급되는 코크 함유 촉매는 반응 영역으로부터 재생될 재생 영역으로 연속으로 수송되고, 재생 영역 유래의 필수적 코크 부재의 재생된 촉매에 의해 대체된다. 다양한 가스 스트림에 의한 촉매 입자의 유동화는 반응 영역과 재생 영역간에 촉매의 수송을 허용한다. 촉매의 유동화 스트림에서 본원에 기술된 지질 조성물의 탄화수소와 같은 탄화수소를 크래킹하고, 반응 영역 및 재생 영역간에 촉매를 수송하고 재생기 내 코크를 연소시키는 방법은 FCC 방법 기술 분야의 당업자에게 널리 공지되어 있다. C2 내지 C5 올레핀을 제조하기 위해 지질 조성물을 크래킹하는데 유용한 예시적인 FCC 적용 및 촉매는 이의 전체가 본원에 참조로 포함된 미국 특허 제6,538,169호 및 제7,288,685호에 기술되어 있다.
적합한 FCC 촉매는 일반적으로 동일한 매트릭스에 존재할 수 있거나 존재하지 않을 수 있는 2개 이상의 성분을 포함한다. 몇몇 구체예에서, 2개의 성분 둘 다는 전체 반응 용기를 거쳐 순환할 수 있다. 제1 성분은 일반적으로 유동화된 촉매 크래킹의 분야에 사용되는 임의의 널리 공지된 촉매, 예를 들어 활성 무정형 점토형 촉매 및/또는 고활성의 결정 분자체를 포함한다. 분자체 촉매는 원하는 생성물에 대한 이의 매우 개선된 선택성 때문에 무정형 촉매보다 바람직할 수 있다. 몇몇 바람직한 구체예에서, 제올라이트는 FCC 공정에서 분자체로서 사용할 수 있다. 바람직하게, 제1 촉매 성분은 실리카 또는 알루미나 및 카올린과 같은 불활성 충전제를 포함하는, 대형 공극 제올라이트(예를 들어 Y형 제올라이트), 활성 알루미나 물질, 결합제 물질을 포함한다.
하나의 구체예에서, 본 발명의 지질 조성물의 크래킹은 FCC 영역의 라이저(riser) 섹션 또는 대안적으로 리프트 섹션에서 발생한다. 상기 지질 조성물은 노즐에 의해 라이저로 도입되어 지질 조성물의 신속한 증발을 유도한다. 촉매와 접촉시키기 전에, 상기 지질 조성물은 통상적으로 약 149℃ 내지 약 316℃(300℉ 내지 600℉)의 온도를 가질 것이다. 상기 촉매는 블렌딩 용기로부터 라이저로 유동하여 여기서 촉매는 약 2초 이하의 시간 동안 지질 조성물과 접촉한다.
배합된 촉매 및 반응된 지질 조성물 증기는 이어서 출구를 통해 라이저의 최상부로부터 배출되고, 올레핀, 및 상당한 양의 코크로 덮여지고 일반적으로 “코크된 촉매”로 언급되는 촉매 입자의 수집물을 포함하는 크래킹된 생성물 증기 스트림으로 분리된다. 원하는 생성물이 바람직하지 못한 기타 다른 생성물로 추가로 전환되는 것을 촉진시킬 수 있는, 지질 조성물과 촉매의 접촉시간을 최소화하기 위해, 스월 암 배열 장치(swirl arm arrangement)와 같은 임의의 배열된 분리기를 사용하여 생성물 스트림으로부터 신속하게 코크된 촉매를 제거할 수 있다. 분리기, 예를 들어 스월 암 분리기는 챔버의 하한부에 위치한 스트립핑 영역(stripping zone)과 함께 챔버의 챔버의 상한부에 위치한다. 스월 암 배열 장치에 의해 분리된 촉매는 스트립핑 영역으로 떨어진다. 가벼운 올레핀 및 몇몇 촉매를 포함하는 크래킹된 탄화수소를 포함하는 크래킹된 생성물 증기 스트림은 사이클론과 소통하는 도관을 통해 챔버로부터 배출된다. 상기 사이클론은 생성물 증기 스트림으로부터 잔류 촉매 입자를 제거하여 입자 농도를 매우 낮은 수준으로 감소시킨다. 이어서 상기 생성물 증기는 분리 용기의 최상부로부터 배출된다. 사이클론에 의해 분리된 촉매는 분리 용기에 이어서 스트립팅 영역으로 복귀한다. 스트립핑 영역은 증기와의 향류 접촉에 의해 촉매 표면으로터 흡착된 탄화수소를 제거한다.
낮은 탄화수소 분압은 가벼운 올레핀이 우선적으로 생성되도록 작용한다. 따라서, 라이저 압력은 약 172kPa 내지 241kPa(25psia 내지 35psia)로 설정되며, 이 때 탄화수소 분압은 약 35kPa 내지 172kPa(5psia 내지 25psia)이고 바람직한 탄화수소 분압은 약 69kPa 내지 138kPa(10psia 내지 20psia)이다. 탄화수소에 대한 상대적으로 낮은 분압은 희석제가 지질 조성물의 10중량% 내지 55중량% 및 바람직하게는 지질 조성물의 약 15중량% 정도인 희석제로서 증기를 사용함으로써 성취된다. 기타 다른 희석제, 예를 들어 건조 가스를 사용하여 등가의 탄화수소 분압에 도달할 수 있다.
라이저 출구에서 크래킹된 스트림의 온도는 약 510℃ 내지 621℃ (950℉ 내지 1150℉)이다. 그러나, 566℃(1050℉) 초과의 라이저 출구 온도는 보다 많은 건조 가스 및 보다 많은 올레핀을 생성시킨다. 반면에, 566℃(1050℉) 미만의 라이저 출구 온도는 에틸렌 및 프로필렌을 적게 생성시킨다. 따라서, 약 566℃ 내지 약 63O℃의 바람직한 온도, 약 138kPa 내지 약 240kPa(20psia 내지 35psia)의 바람직한 압력에서 FCC 공정을 수행하는 것이 바람직하다. 상기 공정의 다른 조건은 약 5 내지 약 20 및 바람직하게는 약 10 내지 약 15로 다양할 수 있는 지질 조성물에 대한 촉매 비율이다.
제트 연료를 생성하는 방법의 하나의 구체예에서, 상기 지질 조성물은 FCC 반응기의 리프트 섹션으로 도입된다. 리프트 섹션에서 온도는 매우 고온이고 약 700℃(1292℉) 내지 약 760℃(1400℉)의 범위이며, 지질 조성물에 대한 촉매의 비율은 약 100 내지 약 150일 것이다. 이것은 지질 조성물의 리프트 섹션으로의 도입이 상당양의 프로필렌 및 에틸렌을 생성시킬 것으로 예상된다.
본원에 기술된 바와 같이 생성된 지질 조성물 또는 지질을 사용하여 제트 연료를 생성시키는 방법의 또 다른 구체예에서, 지질 조성물 또는 지질의 구조는 수소탈산소화(HDO)로서 언급되는 공정에 의해 파괴된다. HDO는 수소에 의한 산소의 제거를 의미하는데, 즉 산소는 물질의 구조를 파괴시키면서 제거된다. 올레핀 이중 결합을 수소화시키고 임의의 황 및 질소 화합물을 제거한다. 황 제거는 소위 수소탈황화(HDS)로 불린다. 원료(지질 조성물 또는 지질)의 전처리 및 순도는 촉매의 작용 수명에 기여한다.
일반적으로, HDO/HDS 단계에서, 수소는 공급 원료(지질 조성물 또는 지질)와 혼합하고 이어서 상기 혼합물을 단일상 또는 2개상 공급 원료로서 병류로서 촉매 상에 통과시킨다. HDO/HDS 단계 후, 생성물 분획을 분리하고 별도의 이성체화 반응기에 통과시킨다. 생물학적 출발 물질용 이성체화 반응기는 병류 반응기로서 문헌(FI 100 248)에 기술되어 있다.
탄화수소 공급물, 예를 들어 본원에서의 지질 조성물 또는 지질을 수소화시킴에 의한 연료의 제조 방법은 또한 지질 조성물 또는 지질을 병류로서 제1 수소화 영역을 통해 수소 가스와 함께 통과시킴으로써 수행될 수 있고, 이후 탄화수소 유출물은 수소 가스를 탄화수소 유출물에 대하여 향류로서 제2 수소화 영역에 통과시킴으로써 제2 수소화 영역에서 추가로 수소화시킨다. 지질 조성물을 크래킹하여 C2 내지 C5 올레핀을 제조하는데 유용한 예시적인 HDO 적용 및 촉매는 전체가 참조로 포함되어 있는 미국 특허 제7,232,935호에 기술되어 있다.
통상적으로, 수소탈산소화 단계에서, 본원에서의 지질 조성물 또는 지질과 같은 생물학적 성분의 구조는 산소, 질소, 인 및 황 화합물로 분해되고 가스로서의 가벼운 탄화수소는 제거되며, 올레핀 결합은 수소화된다. 상기 방법의 제2 단계에서, 즉 소위 이성체화 단계에서, 이성체화는 낮은 온도에서 탄화수소 사슬을 분지화하고 파라핀의 수행능을 개선시키기 위하여 수행된다.
제1 단계, 즉 크래킹 공정의 HDO 단계에서, 수소 가스, 및 수소화될 본원의 지질 조성물 또는 지질은 HDO 촉매 상 시스템에 병류로서 또는 향류로서 통과시키고, 상기 촉매 상 시스템은 하나 이상의 촉매 상(들), 바람직하게 1개 내지 3개의 촉매 상을 포함한다. HDO 단계는 통상적으로 병류 방식으로 작동한다. 2개 이상의 촉매 상을 포함하는 HDO 촉매 상 시스템의 경우에, 상기 상중 하나 이상은 향류 원리를 사용하여 작동할 수 있다. HDO 단계에서, 압력은 20바 내지 150바, 바람직하게는 50바 내지 100바로 다양하고, 온도는 200℃ 내지 500℃, 바람직하게는 300℃ 내지 400℃의 범위로 다양하다. HDO 단계에서, 원소주기율표의 VII 족 및/또는 VIB족 금속을 함유하는 공지된 수소화 촉매가 사용될 수 있다. 바람직하게, 수소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고, 상기 지지체는 알루미나 및/또는 실리카이다. 통상적으로, NiMo/Al2O3 및 CoMo/Al2O3 촉매가 사용된다.
HDO 단계 전에, 본원에서 지질 조성물 또는 지질은 임의로 보다 온화한 조건 하에서 예비수소화로 처리하여 이중 결합의 부반응을 회피할 수 있다. 상기 예비수소화는 예비수소화 촉매의 존재 하에 50℃ 내지 400℃의 온도 및 1바 내지 200바의 수소 압력, 바람직하게는 150℃ 내지 250℃의 온도 및 10바 내지 100바의 수소 압력에서 수행한다. 상기 촉매는 원소주기율표의 VIII족 및/또는 VIB족 유래의 금속을 함유할 수 있다. 바람직하게, 예비수소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고, 상기 지지체는 알루미나 및/또는 실리카이다.
수소를 함유하는 HDO 단계 유래의 가스 스트림을 냉각시킨 후, 일산화탄소, 이산화탄소, 질소, 인 및 황 화합물, 가벼운 가스 탄화수소 및 기타 다른 불순물을 이로부터 제거한다. 압축시킨 후 정제된 수소 또는 재순환된 수소를 제1 촉매 상으로 및/또는 촉매 상 사이로 복귀시켜 인출된 가스 스트림을 구성하도록 한다. 물은 응축 액체로부터 제거한다. 상기 액체는 제1 촉매 상 또는 촉매 상 사이로 통과시킨다.
HDO 단계 후, 생성물은 이성체화 단계를 거친다. 탄화수소를 이성체화 촉매와 접촉시키기 전에 불순물을 가능한한 완전히 제거하는 것이 공정을 위해 필요하다. 상기 이성체화 단계는 임의의 스트리핑 단계를 포함하고, 이때 HDO 단계 유래의 반응 생성물은 수증기 또는 가벼운 탄화수소, 질소 또는 수소와 같은 적합한 가스를 스트리핑시킴으로써 정제될 수 있다. 임의의 스트리핑 단계는 이성체화 촉매의 상부 유니트에서 향류 방식(여기서, 가스 및 액체는 서로 접촉함)으로 수행하거나, 향류 원리를 사용하는 별도의 스트리핑 유니트에서 실제 이성체화 반응기 전에 수행한다.
스트리핑 단계 후, 수소 가스 및 본원에서의 수소화된 지질 조성물 또는 지질, 및 임의로 n-파라핀 혼합물을 하나 또는 여러 가지의 촉매 상(들)을 포함하는 반응성 이성체화 유니트에 통과시킨다. 이성체화 단계의 촉매 상은 병류 또는 향류 방식으로 작동할 수 있다.
향류 원리가 이성체화 단계에 적용되는 것이 상기 공정을 위해 중요하다. 이성화체 단계에서, 이것은 임의의 스트리핑 단계 또는 이성체화 반응 단계 중 하나 또는 둘 다를 향류 방식으로 진행함에 의해 수행한다. 이성체화 단계에서, 압력은 20바 내지 150바, 바람직하게는 20바 내지 100바의 범위로 다양하고, 온도는 200℃ 내지 500℃, 바람직하게는 300℃ 내지 400℃이다. 이성체화 단계에서, 당업계에 공지된 이성체화 촉매가 사용될 수 있다. 적합한 이성체화 촉매는 분자체 및/또는 VII족 금속 및/또는 담체를 함유한다. 바람직하게, 이성체화 촉매는 SAPO-11 또는 SAPO41 또는 ZSM-22 또는 ZSM-23 또는 페리어라이트(ferrierite) 및 Pt, Pd 또는 Ni 및 Al2O3 또는 SiO2를 함유한다. 통상적인 이성체화 촉매는, 예를 들어 Pt/SAPO-11/Al2O3, Pt/ZSM-22/Al2O3, Pt/ZSM-23/Al2O3 및 Pt/SAPO-11/SiO2이다. 이성체화 단계 및 HDO 단계는 동일한 압력 용기 또는 별도의 압력 용기에서 수행할 수 있다. 임의의 예비수소화는 별도의 압력 용기 또는 HDO 및 이성체화 단계와 동일한 압력 용기에서 수행할 수 있다.
따라서, 하나의 구체예에서, 하나 이상의 화학 반응 생성물은 HRJ-5를 포함하는 알칸 혼합물이다. 다른 구체예에서, 하나 이상의 화학적 반응 생성물은 ASTM D1655 제트 연료를 포함하는 알칸 혼합물이다. 몇몇 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 황 함량이 10ppm 미만이다. 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 205℃ 미만의 증류 곡선의 T10값을 갖는다. 또 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 300℃ 미만의 최종 비점(FBP)을 갖는다. 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 38℃ 이상의 인화점을 갖는다. 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 밀도가 775K/M3 내지 840K/M3이다. 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 동결점이 -47℃ 미만이다. 다른 구체예에서, ASTM 제트 연료의 사양을 준수하는 조성물은 순 연소열(Heat of Combustion)이 42.8MJ/K 이상이다. 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 수소 함량이 13.4질량% 이상이다. 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 Hg의 3mm 미만인, 260℃에서의 정량적 중량 JFTOT에 의하여 시험된 바와 같이, 열 안정성을 갖는다. 다른 구체예에서, ASTM 1655 제트 연료의 사양을 준수하는 조성물은 7mg/dl 미만인 실제 고무를 갖는다.
따라서, 본 발명은 미세 조류 지질의 화학적 변형으로 다양한 산업적 및 기타 다른 적용 분야에 유용한 생성물을 생성하는 다양한 방법을 개시한다. 본원에 개시된 방법에 의해 생성된 오일을 변형시키는 방법의 예로서는 오일 가수 분해, 오일의 수소화처리 및 오일의 에스테르화를 포함하지만 이에 제한되지 않는다. 미세 조류 지질의 기타 다른 화학 변형으로서는 에폭시화, 산화, 가수 분해, 황산화, 설폰화, 에톡시화, 프로폭시화, 아미드화 및 비누화를 포함하나, 이에 제한되는 것은 아니다. 미세 조류 오일의 변형은 기본 함유 화학 제품을 생성하고 이는 추가로 원하는 기능을 위해 선택된 유도체 함유 화학 제품으로 변형시킬 수 있다. 연료 생성 공정과 관련하여 전술된 것과 유사한 방식으로, 이들 화학적 변형은 또한 본원에 기술된 미생물 배양물로부터 생성된 오일 상에서 수행할 수 있다. 염기성 함유 화학 제품의 예로서는 비누, 지방산, 지방 에스테르, 지방 알코올, 지방 질소 화합물, 지방산 메틸 에스테르 및 글리세롤을 포함하나, 이에 제한되는 것은 아니다. 유도성 함유 화학 제품의 예로서는 지방 니트릴, 에스테르, 다이머산, 쿼트(quat), 계면 활성제, 지방 알카놀아미드, 지방 알코올 설페이트, 수지, 유화제, 지방 알코올, 올레핀, 시추 이수, 폴리올, 폴리우레탄, 폴리아크릴레이트, 고무, 양초, 화장품, 금속 비누, 비누, 알파-설폰화 메틸 에스테르, 지방 알코올 설페이트, 지방 알코올 에톡실레이트, 지방 알코올 에테르 설페이트, 이미다졸린, 계면 활성제, 세제, 에스테르, 쿼트, 오존 분해 생성물, 지방 아민, 지방 알카놀아미드, 에톡시설페이트, 모노글리세라이드, 디글리세라이드, 트리글리세라이드(예를 들어, 중간쇄 트리글리세라이드), 윤활제, 유압유, 그리스, 유전성 유체, 이형제, 금속 가공 유체, 열 전달 유체, 기타 다른 기능성 유체, 산업용 화학 물질(예를 들어, 클리너, 직물 가공 보조제, 가소제, 안정화제, 첨가제), 표면 코팅제, 페인트 및 래커, 전기 와이어 절연제 및 고급 알칸을 포함하나, 이에 제한되는 것은 아니다.
본 발명의 방법에 의해 생성된 글리세로지질 유래의 지방산 성분의 가수 분해는 기타 다른 유용한 화학 물질을 생성하도록 유도체화될 수 있는 유리 지방산을 생성시킨다. 가수 분해는 산 또는 염기일 수 있는 촉매 및 물의 존재 하에 일어난다. 유리된 지방산을 유도체화하여 미국 특허 제5,304,664호(고도로 황화된 지방산); 제7,262,158호(세정 조성물); 제7,115,173호(직물 연화 조성물); 제6,342,208호(피부 처리용 에멀젼); 제7,264,886호(방수 조성물); 제6,924,333호 (페인트 첨가제); 제6,596,768호(지질 풍부 반추동물 공급원료); 및 제6,380,410호(세제 및 세정제용 계면활성제)에 보고된 바와 같은 다양한 생성물을 수득할 수 있다.
본 발명의 하나의 구체예에서 가수 분해와 관련하여, 트리글리세라이드 오일은 임의로 먼저 물 또는 수산화나트륨과 같은 액체 매질 중에서 가수 분해하여 글리세롤 및 비누를 수득한다. 다양한 적합한 트리글리세라이드 가수 분해 방법이 있으며, 여기에는 비누화, 산 가수 분해, 알칼리성 가수 분해, 효소 가수 분해(본원에서 분리(splitting)로서 언급됨), 및 고온 압축수를 사용한 가수 분해가 포함되지만 이에 제한되지 않는다. 당업자는 트리글리세라이드 오일이 함유 화학 제품을 생성하기 위해 가수 분해될 필요가 없고, 오히려 상기 오일이 기타 다른 공지된 방법에 의해 원하는 함유 화학 제품으로 직접 전환될 수 있음을 인식할 것이다. 예를 들어, 트리글리세라이드 오일은 에스테르화를 통해 메틸 에스테르 지방산으로 직접 전환될 수 있다.
몇몇 구체예에서, 본원에 개시된 방법에 의해 생성된 오일의 촉매 가수 분해는 오일을 글리세롤 및 지방산으로 분리시킴으로써 일어난다. 상기 논의된 바와 같이, 지방산은 이어서 여러 가지 기타 다른 변형을 통해 수득된 유도체 함유 화학 제품으로 추가로 가공될 수 있다. 예를 들어, 하나의 구체예에서, 지방산은 아민화 반응을 거쳐서 지방 질소 화합물을 생성할 수 있다. 다른 구체예에서, 지방산은 일염기성 산 및 이염기성 산을 생성하도록 오존용해를 거칠 수 있다.
다른 구체예에서, 가수 분해는 본원에서 생성된 오일 분리를 통해 일어나서 함유 화학 제품을 생성할 수 있다. 본 발명의 몇몇 바람직한 구체예에서, 트리글리세라이드 오일은 기타 다른 공정을 수행하기 전에 분리될 수 있다. 당업자는 많은 적합한 트리글리세라이드 분리 방법, 예를 들어 효소 분리 및 압력 분리(이에 제한되지 않음)가 있음을 인식할 것이다.
일반적으로, 오일의 효소 분리 방법은 물/오일 혼합물에 대해 작용하는 생촉매로서 효소인 리파제를 사용한다. 효소 분리는 이어서 오일 또는 지방을 각각 글리세롤 및 유리 지방산으로 분리한다. 이어서 상기 글리세롤은 물상으로 이동하는 반면, 상기 유기상에는 유리 지방산이 풍부해진다.
효소 분리 반응은 일반적으로 유기 및 수성 상간의 상경계에서 일어나며, 여기서 효소는 단지 상경계에 존재한다. 이어서 상경계와 만나는 트리글리세라이드는 분리 반응에 기여하거나 이에 관여한다. 반응이 진행됨에 따라, 유리 지방산과는 대조적으로 글리세라이드로서 여전히 화학적으로 결합되어 있는 지방산의 작업 밀도 또는 농도는 상경계에서 감소하여 반응은 느려진다. 특정 구체예에서, 효소 분리는 실온에서 일어날 수 있다. 당업자는 오일을 원하는 지방산으로 분리시키는데 적합한 조건을 알 것이다.
예를 들어, 반응 속도는 계면 경계 표면을 증가시킴으로써 가속화될 수 있다. 일단 반응이 완료되면, 유리 지방산을 이어서 효소로부터 유리된 유기상으로부터 분리하고, 글리세라이드로서 여전히 화학적으로 결합되어 있는 지방산을 함유하는 잔류물은 역 공급되거나 재순환되고 새로운 오일 또는 지방과 혼합되어 분리를 거친다. 이어서 상기 방식으로, 재순환된 글리세라이드는 추가의 효소 분리를 거친다. 몇몇 구체예에서, 유리 지방산은 상기 방식으로 부분적으로 분리된 오일 또는 지방으로부터 추출된다. 상기 방식으로, 화학적으로 결합된 지방산(트리글리세라이드)이 분리 공정으로 복귀하거나 역 공급되는 경우, 효소 소비는 급격히 감소할 수 있다.
분리 정도는 측정된 산 값을, 소정의 오일 또는 지방에 대해 계산될 수 있는 이론적으로 가능한 산 값으로 나눈 비율로서 결정한다. 바람직하게, 산 값은 표준 일반 방법에 따른 적정을 사용하여 측정한다. 대안적으로, 수성 글리세롤 상의 밀도는 분리 정도에 대한 척도로서 취할 수 있다.
하나의 구체예에서, 본원에 기술된 바와 같은 분리 방법은 또한 생성된 오일의 알칼리 정제 공정 유래의 소위 비누-스톡에 함유된 모노글리세라이드, 디글리세라이드 및 트리글리세라이드에 적합하다. 상기 방식으로, 비누 스톡은 사전 비누화 없이 중성 오일의 지방산으로 정량적으로 전환될 수 있다. 상기 목적을 위해, 비누에 화학적으로 결합된 지방산을 바람직하게는 분리 전에 산의 부가를 통해 방출시킨다. 특정 구체예에서, 분리 공정을 위해 물 및 효소에 추가로 완충액이 사용된다.
하나의 구체예에서, 본 발명의 방법에 따라 생성된 오일은 또한 가수 분해 방법으로서 비누화를 거칠 수 있다. 동물성 및 식물성 오일은 통상적으로 3가 알코올인 글리세롤과 지방산의 에스테르인 트리아실글리세롤(TAG)로 이루어진다. 알칼리성 가수 분해 반응에서, TAG내 글리세롤이 제거되어 나트륨 또는 칼륨과 같은 알칼리 금속 양이온과 연합할 수 있는 3개의 카복실산 음이온을 남겨 두어 지방산 염을 생성한다. 상기 도식에서, 카복실산 성분들은 글리세롤부로부터 절단되고 하이드록실기로 대체된다. 상기 반응에 사용되는 염기(예를 들어, KOH)의 양은 원하는 비누화 정도에 의해 결정된다. 예를 들어, 상기 목적이 본래 TAG 조성물 중에 존재하는 오일의 일부를 포함하는 비누 생성물을 제조하기 위한 것인 경우, 모든 TAG를 지방산 염으로 전환시키기에 불충한 양의 염기가 반응 혼합물로 도입된다. 통상적으로, 상기 반응은 수용액 중에서 수행하여 서서히 진행시키지만 가열에 의해 촉진될 수 있다. 지방산 염의 침전은 수용성 알칼리 금속 할라이드(예를 들어, NaCl 또는 KCl)와 같은 염을 반응 혼합물에 부가하여 촉진될 수 있다. 바람직하게, 상기 염기는 알칼리 금속 수산화물(예를 들어, NaOH 또는 KOH)이다. 대안적으로, 예를 들어 트리에탄올아민 및 아미노메틸프로판올을 포함하는 알칸올아민과 같은 기타 다른 염기를 상기 반응 도식에 사용할 수 있다. 몇몇 경우에, 이들 대안이 투명한 비누 생성물을 제조하는데 바람직할 수 있다. 하나의 구체예에서, 비누화를 거친 지질 조성물은 본원에 기술된 바와 같이 제조된 우지 모의체(즉 우지와 유사한 지질 조성물), 또는 다른 트리글리세라이드 오일과 우지 모의체의 배합물이다.
몇몇 방법에서, 화학적 변형의 제1 단계는 수소 및 촉매의 존재 하에서 승온에서 이중 결합을 포화시키기 위한 수소화처리에 이어서 탈산소화일 수 있다. 다른 방법에서, 수소화 및 탈산소화는 동일한 반응 중에서 일어날 수 있다. 또 다른 방법에서, 탈산소화는 수소화전에 일어난다. 이어서 이성체화는 또한 수소 및 촉매의 존재 하에서 임의로 수행할 수 있다. 최종적으로, 가스 및 나프타 성분은 원한다면 제거할 수 있다. 예를 들어, 미국 특허 5,475,160호(트리글리세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 가스 제거); 제6,391,815호(수소화); 및 제5,888,947호(이성체화)를 참조한다.
본 발명의 몇몇 구체예에서, 트리글리세라이드 오일은 부분적으로 또는 완전히 탈산소화된다. 탈산소화 반응은 지방산, 지방 알코올, 폴리올, 케톤 및 알데하이드(이에 제한되지 않음)를 포함하는 원하는 생성물을 형성시킨다. 일반적으로, 임의의 특정 이론에 구애되지 않고, 탈산소화 반응은 지방산 또는 지방산 에스테르로부터 산소를 적어도 부분적으로 제거하여 추가의 가공에 의해 원하는 화학 물질로 용이하게 전환될 수 있는 지방 알코올과 같은 반응 생성물을 생성시키는 반응으로서, 제한 없이 수소용해, 수소화, 연속 수소화-수소용해, 연속 수소용해-수소화 및 조합된 수소화-수소용해 반응을 포함하는 다양하고 상이한 반응 경로의 조합을 포함한다. 예를 들어, 하나의 구체예에서, 지방 알코올은 FCC 반응을 통해 올레핀으로 또는 응축 반응을 통해 고급 알칸으로 전환될 수 있다.
하나의 상기 화학적 변형은 글리세로지질 또는 유리 지방산의 지방산 성분에서 이중 결합으로 수소를 첨가하는 수소화이다. 수소화 과정으로 액체 오일을 특정 응용에 보다 적합할 수 있는 반고체 또는 고체 지방으로 전환하게 할 수 있다.
본원에 기술된 방법에 의해 생성된 오일의 수소화는 미국 특허 제7,288,278호(식품 첨가제 또는 의약); 제5,346,724호(윤활 생성물); 제5,475,160호(지방 알코올); 제5,091,116호(식용 오일); 제6,808,737호(마가린 및 스프레드용 구조적 지방); 제5,298,637호(감소된 칼로리 지방 대용물); 제6,391,815호(수소화 촉매 및 황 흡착제); 제5,233,099호 및 제5,233,100호(지방 알코올); 제4,584,139호(수소화 촉매); 제6,057,375호(소포제); 및 제7,118,773호(식용 에멀젼 스프레드)에 보고된 바와 같이 본원에 제공된 방법 및/또는 재료 중 하나 이상과 연계하여 수행할 수 있다.
당업자는 탄수화물을 수소화시키기 위해 다양한 방법이 사용될 수 있음을 인지할 것이다. 하나의 적합한 방법은 수소화 반응기에서 수소화된 생성물을 형성하기 위해 충분한 조건 하에서 적합한 가스 및 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시키는 것을 포함한다. 수소화 촉매는 일반적으로 단독으로, 또는 W, Mo, Au, Ag, Cr, Zn, Mn, Sn, B, P, Bi, 및 이의 합금 또는 조합과 같은 프로모터와 함께 Cu, Re, Ni, Fe, Co, Ru, Pd, Rh, Pt, Os, Ir, 및 이의 합금 또는 조합을 포함할 수 있다. 기타 다른 효과적인 수소화 촉매 물질은 지지된 니켈 또는 레늄으로 변형된 루테늄을 포함한다. 하나의 구체예에서, 수소화 촉매는 또한 원하는 촉매의 기능성에 따라, 지지체 중 임의의 하나를 포함한다. 수소화 촉매는 당업자에게 공지된 방법에 의해 제조할 수 있다.
몇몇 구체예에서, 수소화 촉매는 지지된 VIII족 금속 촉매 및 금속 스폰지 물질(예를 들어, 스폰지 니켈 촉매)을 포함한다. 라니 니켈은 본 발명에 사용하기에 적합한 활성화된 스폰지 니켈 촉매의 예를 제공한다. 다른 구체예에서, 본 발명의 수소화 반응은 니켈-레늄 촉매 또는 텅스텐 변형 니켈 촉매를 포함하는 촉매를 사용하여 수행한다. 본 발명의 수소화 반응을 위해 적합한 촉매의 예로서는 탄소 지지된 니켈-레늄 촉매가 있다.
하나의 구체예에서, 적합한 라니 니켈 촉매는, 예를 들어 약 25중량%의 수산화나트륨을 함유하는 알칼리 수용액으로 대략 균등 중량의 니켈 및 알루미늄의 합금을 처리함으로써 제조할 수 있다. 상기 알루미늄은 선택적으로 알칼리 수용액에 의해 용해되어 알루미늄이 최소량인 대부분 니켈을 포함하는 스폰지형 물질을 생성한다. 초기 합금은 약 1중량% 내지 2중량%가 형성된 스폰지 니켈 촉매 중에 잔류하도록 하는 양으로 프로모터 금속(즉, 몰리브덴 또는 크롬)을 포함한다. 다른 구체예에서, 수소화 촉매는 물 중에서 루테늄(III) 니트로실질산염, 루테늄(III) 클로라이드의 용액을 사용하여 적합한 지지체 물질을 침지시키기 위해 제조한다. 이어서 상기 용액을 건조시켜 수분 함량이 약 1중량% 미만인 고체를 형성한다. 상기 고체는 이어서 4시간 동안 회전볼 로내 300℃(하소되지 않음) 또는 400℃(하소됨)에서 수소 스트림 중에 대기압에서 환원될 수 있다. 촉매를 냉각시키고 질소로 촉매가 불활성이도록 한 후, 질소 중에 5용적%의 산소를 2시간 동안 촉매 상에 통과시킨다.
특정 구체예에서, 본원에 기술된 촉매는 촉매 지지체를 포함한다. 상기 촉매 지지체는 촉매를 안정화시키고 지지한다. 사용되는 촉매 지지체의 유형은 선택된 촉매 및 반응 조건에 좌우된다. 본 발명에 적합한 지지체로서는 탄소, 실리카, 실리카-알루미나, 지르코니아, 티타니아, 세리아, 바나디아, 질화물, 질화붕소, 헤테로다중산, 하이드록시애퍼타이트, 산화아연, 크로미아, 제올라이트, 탄소 나노튜브, 탄소 풀러렌, 및 이들의 임의의 조합을 포함하지만 이에 제한되지 않는다.
본 발명에 사용되는 촉매는 당업자에게 공지된 통상적인 방법을 사용하여 제조할 수 있다. 적합한 방법은 초기 습윤화, 증발 침지, 화학적 증착, 세척-피복, 마그네트론 스퍼터링 기술 등을 포함할 수 있지만 이에 제한되지 않는다.
수소화 반응을 수행하기 위한 조건은 출발 물질 및 원하는 생성물의 유형에 따라 다양할 것이다. 본 개시 내용의 이득과 함께 당업자는 적절한 반응 조건을 인지할 것이다. 일반적으로, 수소화 반응은 80℃ 내지 250℃, 바람직하게는 90℃ 내지 200℃, 가장 바람직하게는 100℃ 내지 150℃의 온도에서 수행한다. 몇몇 구체예에서, 수소화 반응은 500KPa 내지 14000Kpa의 압력에서 수행한다.
본 발명의 수소용해 반응에 사용되는 수소는 외부 소수, 재순환된 수소, 동일계 생성 수소 및 이의 임의의 조합을 포함할 수 있다. 본원에 사용된 바와 같이, 용어 “외부 수소”는 바이오매스 반응 자체 기원이 아니며, 오히려 다른 공급원으로부터 시스템에 첨가되는 수소를 언급한다.
본 발명의 몇몇 구체예에서, 출발 탄수화물을, 원하는 고급 탄화수소로 보다 용이하게 전환될 것인 소분자로 전환시키는 것이 바람직하다. 상기 전환을 위해 적합한 하나의 방법은 수소용해 반응을 통한 것이다. 탄수화물의 수소용해를 수행하기 위한 다양한 방법이 공지되어 있다. 하나의 적합한 방법은 소분자 또는 폴리올을 포함하는 반응 생성물을 형성하기에 충분한 조건 하에서 수소용해 반응기 내에서 적합한 가스 및 수소용해 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시키는 것을 포함한다. 본원에서, 용어 “소분자 또는 폴리올”은 출발 탄수화물보다 더 적은 양의 탄소 원자 또는 산소 원자를 포함할 수 있는, 소분자량을 갖는 임의의 분자를 포함한다. 하나의 구체예에서, 반응 생성물은 폴리올 및 알코올을 포함하는 보다 작은 분자를 포함한다. 당업자는 수소용해 반응을 수행하기 위한 적절한 방법을 선택할 수 있을 것이다.
몇몇 구체예에서, 5개 및/또는 6개 탄소 당 또는 당 알코올은 수소용해 촉매를 사용하여 프로필렌 글리콜, 에틸렌 글리콜 및 글리세롤로 전환시킬 수 있다. 수소용해 촉매는 단독으로 또는 Au, Ag, Cr, Zn, Mn, Sn, Bi, B, O, 및 이의 합금 또는 임의의 조합과 같은 프로모터와 함께 Cr, Mo, W, Re, Mn, Cu, Cd, Fe, Co, Ni, Pt, Pd, Rh, Ru, Ir, Os, 및 이의 합금 또는 조합을 포함할 수 있다. 수소용해 촉매는 또한 전이 금속(예를 들어, 크롬, 몰리브덴, 텅스텐, 레늄, 망간, 구리, 카드뮴) 또는 VIII족 금속(예를 들어, 철, 코발트, 니켈, 백금, 팔라듐, 로듐, 루테늄, 이리듐 및 오스뮴)을 함유하는 탄소성 피로중합체 촉매를 포함할 수 있다. 특정 구체예에서, 수소용해 촉매는 알칼리성 토금속 산화물과 조합되거나 촉매 활성 지지체에 부착된 임의의 상기 금속을 포함할 수 있다. 특정 구체예에서, 수소용해 반응에 기술된 촉매는 수소화 반응을 위해 전술된 바와 같은 촉매 지지체를 포함할 수 있다.
수소용해 반응을 수행하기 위한 조건은 출발 물질 및 원하는 생성물의 유형에 따라 다양할 것이다. 당업자는 본 개시 내용의 이득과 함께 반응을 수행하기 위해 사용하는 적절한 조건을 인지할 것이다. 일반적으로, 이들 수소용해 반응은 110℃ 내지 300℃, 바람직하게는 170℃ 내지 220℃, 가장 바람직하게는 200℃ 내지 225℃의 온도에서 수행한다. 몇몇 구체예에서, 수소용해 반응은 염기성 조건 하, 바람직하게는 pH 8 내지 13, 훨씬 더 바람직하게는 pH 10 내지 12에서 수행한다. 몇몇 구체예에서, 수소용해 반응은 60KPa 내지 16500Kpa의 범위, 바람직하게는 1700KPa 내지 14000KPa의 범위, 훨씬 더 바람직하게는 4800KPa 내지 11000KPa의 압력에서 수행한다.
본 발명의 수소용해 반응에 사용되는 수소는 외부 수소, 재순환된 수소, 동일계 생성된 수소 및 이의 임의의 조합을 포함할 수 있다.
몇몇 구체예에서, 상기 논의된 반응 생성물은 응축 반응기에서 응축 반응을 통해 고급 탄화수소로 전환시킬 수 있다. 상기 구체예에서, 반응 생성물의 응축은 고급 탄화수소를 형성할 수 있는 촉매의 존재 하에서 일어난다. 이론에 의해 제한되고자 하는 것은 아니지만, 고급 탄화수소의 생산은 탄소-탄소 또는 탄소-산소 결합의 형성을 포함하는 단계적 부가 반응을 통해 진행하는 것으로 여겨진다. 생성된 반응 생성물은 하기에서 보다 상세하게 기술된 바와 같이 상기 부를 함유하는 임의의 수의 화합물을 포함한다.
특정 구체예에서, 적합한 응축 촉매로서는 산 촉매, 염기 촉매 또는 산/염기 촉매를 포함한다. 본원에 사용된 바와 같이, 용어 “산/염기 촉매”는 산 및 염기 기능 둘 다를 갖는 촉매를 나타낸다. 몇몇 구체예에서, 상기 응축 촉매는 제한없이, 제올라이트, 카바이드, 질화물, 지르코니아, 알루미나, 실리카, 알루미노실리케이트, 포스페이트, 산화티탄, 산화아연, 산화바나듐, 산화란탄, 산화이트륨, 산화스캔듐, 산화마그네슘, 산화세륨, 산화바륨, 산화칼슘, 수산화물, 헤테로다중산, 무기산, 산 변형된 수지, 염기 변형된 수지, 및 이들의 임의의 조합을 포함할 수 있다. 몇몇 구체예에서, 응축 촉매는 또한 변형제를 포함할 수 있다. 적합한 변형제는 La, Y, Sc, P, B, Bi, Li, Na, K, Rb, Cs, Mg, Ca, Sr, Ba, 및 이들의 임의의 조합을 포함한다. 몇몇 구체예에서, 상기 응축 촉매는 또한 금속을 포함할 수 있다. 적합한 금속은 Cu, Ag, Au, Pt, Ni, Fe, Co, Ru, Zn, Cd, Ga, In, Rh, Pd, Ir, Re, Mn, Cr, Mo, W, Sn, Os, 이들의 합금 및 임의의 조합을 포함한다.
특정 구체예에서, 응축 반응에 기술된 촉매는 수소화 반응을 위해 전술된 바와 같은 촉매 지지체를 포함할 수 있다. 특정 구체예에서, 응축 촉매는 자가 지지형이다. 본원에 사용된 바와 같이, 상기 용어 “자가 지지형”은 촉매가 지지체로서 작용하기 위해 다른 물질을 필요로 하지 않음을 의미한다. 다른 구체예에서, 상기 응축 촉매는 촉매를 현탁시키기에 적합한 별도의 지지체와 연계하여 사용된다. 하나의 구체예에서, 응축 촉매 지지체는 실리카이다.
응축 반응이 일어나는 조건은 출발 물질 및 원하는 생성물의 유형에 따라 다양할 것이다. 당업자는 본 개시 내용의 이득과 함께 반응을 수행하는데 사용하는 적절한 조건을 인지할 것이다. 몇몇 구체예에서, 응축 반응은 제안된 반응에 대한 열역학을 유리하게 하는 온도에서 수행한다. 응축 반응을 위한 온도는 특정 출발 폴리올 또는 알코올에 따라 다양할 것이다. 몇몇 구체예에서, 응축 반응을 위한 온도는 80℃ 내지 500℃, 바람직하게는 125℃ 내지 450℃, 가장 바람직하게는 125℃ 내지 250℃의 범위이다. 몇몇 구체예에서, 응축 반응은 0Kpa 내지 9000KPa 범위, 바람직하게는 0KPa 내지 7000KPa 범위, 훨씬 더 바람직하게는 0KPa 내지 5000KPa 범위의 압력에서 수행한다.
본 발명에 의해 형성되는 고급 알칸은 4개 내지 30개의 탄소 원자를 갖는 분지쇄 또는 직쇄 알칸, 4개 내지 30개의 탄소 원자를 갖는 분지쇄 또는 직쇄 알켄, 5개 내지 30개의 탄소 원자를 갖는 사이클로알칸, 5개 내지 30개의 탄소 원자를 갖는 사이클로알켄, 아릴, 융합된 아릴, 알코올 및 케톤을 포함하지만 이에 제한되지 않는다. 적합한 알칸은 부탄, 펜탄, 펜텐, 2-메틸부탄, 헥산, 헥센, 2-메틸펜탄, 3-메틸펜탄, 2,2-디메틸부탄, 2,3-디메틸부탄, 헵탄, 헵텐, 옥탄, 옥텐, 2,2,4-트리메틸펜탄, 2,3-디메틸헥산, 2,3,4-트리메틸펜탄, 2,3-디메틸펜탄, 노난, 노넨, 데칸, 데센, 운데칸, 운데센, 도데칸, 도데센, 트리데칸, 트리데센, 테트라데칸, 테트라데센, 펜타데칸, 펜타데센, 노닐데칸, 노닐데센, 에이코산, 에이코센, 운에이코산, 운에이코센, 도에이코산, 도에이코센, 트리에이코산, 트리에이코센, 테트라에이코산, 테트라에이코센 및 이들의 이성체를 포함하지만 이에 제한되지 않는다. 이들 생성물중 일부는 연료로서 사용하기에 적합할 수 있다.
몇몇 구체예에서, 사이클로알칸 및 사이클로알켄은 비치환된다. 다른 구체예에서, 사이클로알칸 및 사이클로알켄은 1치환된다. 또 다른 구체예에서, 사이클로알칸 및 사이클로알켄은 다치환된다. 치환된 사이클로알칸 및 사이클로알켄을 포함하는 구체예에서, 치환된 기는 제한없이, 1개 내지 12개의 탄소 원자를 갖는 분지쇄 또는 직쇄 알킬, 1개 내지 12개의 탄소 원자를 갖는 분지쇄 또는 직쇄 알킬렌, 페닐 및 이의 임의의 조합을 포함한다. 적합한 사이클로알칸 및 사이클로알켄은 사이클로펜탄, 사이클로펜텐, 사이클로헥산, 사이클로헥센, 메틸-사이클로펜탄, 메틸-사이클로펜텐, 에틸-사이클로펜탄, 에틸-사이클로펜텐, 에틸-사이클로헥산, 에틸-사이클로헥센, 이들의 이성체 및 임의의 조합을 포함하지만 이에 제한되지 않는다.
몇몇 구체예에서, 형성된 아릴은 비치환된다. 다른 구체예에서, 형성된 아릴은 1치환된다. 치환된 아릴을 포함하는 구체예에서, 치환된 기는 제한없이 1개 내지 12개의 탄소 원자를 갖는 분지쇄 또는 직쇄 알킬, 1개 내지 12개의 탄소 원자를 갖는 분지쇄 또는 직쇄의 알킬렌, 페닐, 및 이들의 임의의 조합을 포함한다. 본 발명에 적합한 아릴로서는 벤젠, 톨루엔, 크실렌, 에틸 벤젠, 파라크실렌, 메타크실렌 및 이들의 임의의 조합을 포함한다.
본 발명에서 생성된 알코올은 4개 내지 30개의 탄소 원자를 갖는다. 몇몇 구체예에서, 알코올은 환형이다. 다른 구체예에서, 알코올은 분지형다. 다른 구체예에서, 알코올은 직쇄이다. 본 발명에 적합한 알코올로서는 부탄올, 펜탄올, 헥산올, 헵탄올, 옥탄올, 노난올, 데칸올, 운데칸올, 도데칸올, 트리데칸올, 테트라데칸올, 펜타데칸올, 헥사데칸올, 헵틸데칸올, 옥틸데칸올, 노닐데칸올, 에이코산올, 운에이코산올, 도에이코산올, 트리에이코산올, 테트라에이코산올 및 이들의 이성체를 포함하지만 이에 제한되지 않는다.
본 발명에서 생성된 케톤은 4개 내지 30개의 탄소 원자를 갖는다. 하나의 구체예에서, 케톤은 환형이다. 다른 구체예에서, 케톤은 분지형이다. 다른 구체예에서, 케톤은 직쇄이다. 본 발명에 적합한 케톤은 부탄온, 펜탄온, 헥산온, 헵탄온, 옥탄온, 노난온, 데칸온, 운데칸온, 도데칸온, 트리데칸온, 테트라데칸온, 펜타데칸온, 헥사데칸온, 헵틸데칸온, 옥틸데칸온, 노닐데칸온, 에이코산온, 운에이코산온, 도에이코산온, 트리에이코산온, 테트라에이코산온, 및 이들의 이성체를 포함하지만 이에 제한되지 않는다.
다른 이러한 화학적 변형은 에스테르 교환이다. 자연적으로 생성된 글리세로지질은 지방산 성분의 균일한 분포를 갖지 않는다. 오일과 관련하여, 에스테르 교환은 상이한 글리세로지질의 2개의 에스테르간의 아실 라디칼의 교환을 언급한다. 에스테르 교환 공정은 글리세로지질의 혼합물의 지방산 성분이 재배열되어 분포 패턴을 변형시킬 수 있는 기작을 제공한다. 에스테르 교환은 널리 공지된 화학적 공정이고, 일반적으로 알칼리 금속 또는 알칼리 금속 알킬레이트(예를 들어, 나트륨 메톡사이드)와 같은 촉매의 존재 하에서 일정 시간(예를 들어, 30분) 동안 오일의 혼합물을 가열(약 200℃로)하는 것을 포함한다. 이러한 공정을 사용하여 오일 혼합물의 지방산 성분의 분포 패턴을 무작위화할 수 있거나, 원하는 분포 패턴을 생성하도록 지시될 수 있다. 지질의 화학 변형에 대한 상기 방법은, 지질로서 건조 세포 중량%가 20% 이상인 미생물 바이오매스와 같은 본원에 제공된 물질에 대해 수행할 수 있다.
지방산의 특정 분포 패턴이 요구되는 지시된 에스테르 교환은 일어날 수 있는 몇몇 TAG의 융점 미만의 온도에서 오일 혼합물을 유지시킴으로써 수행할 수 있다. 이것은 이들 TAG를 선택적으로 결정화하며, 이는 이들이 결정화함에 따라 반응 혼합물로부터 이들을 효과적으로 제거한다. 상기 방법은, 예를 들어 오일 중 대부분의 지방산이 침전할 때까지 계속할 수 있다. 지시된 에스테르 교환 방법은 예를 들어 장쇄 지방산의 단쇄 대응물로의 치환을 통해 보다 낮은 칼로리 함량을 갖는 생성물을 제조하기 위해 사용될 수 있다. 지시된 에스테르 교환은 또한 원치않는 트랜스 이성체를 생성시킬 수 있는 수소화에 의지하는 것 없이 식품 부가물 또는 제품(예를 들어, 마가린)에서 요구되는 원하는 용융 특성 및 구조적 특징을 제공할 수 있는 지방 혼합물을 갖는 생성물을 제조하기 위해 사용될 수 있다.
본원에 기술된 방법에 의해 생성된 오일의 에스테르 교환은 미국 특허 제6,080,853호(비분해성 지방 대용물); 제4,288,378호(땅콩 버터 안정화제); 제5,391,383호(식용 스프레이 오일); 제6,022,577호(식품 생성물에 대한 식용 지방); 제5,434,278호(식품 생성물에 대한 식용 지방);제 5,268,192호(저칼로리 너트 생성물); 제5,258,197호(감소된 칼로리의 식용 조성물); 제4,335,156호(식용 지방 생성물); 제7,288,278호(식품 부가물 또는 의약); 제7,115,760호(분별 방법); 제6,808,737호(구조적 지방); 제5,888,947호(엔진 윤활제); 제5,686,131호(식용 오일 혼합물); 및 제4,603,188호(경화성 우레탄 조성물)에 보고된 바와 같이 방법 및/또는 물질 중 하나 이상과 함께 또는 생성물을 생성하기 위해 수행될 수 있다.
본 발명에 따른 하나의 구체예에서, 상기된 바와 같은 오일의 에스테르 결합 전이에 이어서 미국 특허 제6,465,642호에 보고된 바와 같이 에스테르 결합 전이된 생성물을 폴리올과 반응시켜 폴리올 지방산 폴리에스테르를 생성시킨다. 상기 에스테르화 및 분리 공정은, 저급 알킬 에스테르를 비누의 존재 하에 폴리올과 반응시키는 단계; 생성물 혼합물로부터 잔여 비누를 제거하는 단계; 생성물 혼합물을 물 세척 및 건조시켜 불순물을 제거하는 단계; 정제를 위해 생성물 혼합물을 표백시키는 단계; 생성물 혼합물중에 폴리올 지방산 폴리에스테르로부터 미반응된 저급 알킬 에스테르의 적어도 일부를 분리하는 단계; 및 분리된 미반응된 저급 알킬 에스테르를 재순환하는 단계를 포함할 수 있다.
에스테르 결합 전이는 또한 미국 특허 제6,278,006호에 보고된 바와 같은 단쇄 지방산 에스테르를 갖는 미생물 바이오매스 상에서 수행할 수 있다. 일반적으로, 에스테르 결합 전이는 단쇄 지방산 에스테르를 적합한 촉매의 존재 하에서 오일에 부가하고 혼합물을 가열시킴으로써 수행할 수 있다. 몇몇 구체예에서, 상기 오일은 반응 혼합물의 약 5중량% 내지 약 90중량%를 포함한다. 몇몇 구체예에서, 단쇄 지방산 에스테르는 반응 혼합물의 약 10중량% 내지 약 50중량%일 수 있다. 촉매의 비제한적인 예로서는 염기 촉매; 나트륨 메톡사이드; 산 촉매, 예를 들어 무기산(예를 들어, 황산 및 산성화된 점토), 유기산(예를 들어, 메탄 설폰산, 벤젠설폰산 및 톨루엔설폰산), 및 산성 수지(예를 들어, Amberlyst 15)를 포함한다. 나트륨 및 마그네슘과 같은 금속 및 금속 수소화물은 또한 유용한 촉매이다.
다른 당해 화학 변형은 하이드록실화이며, 이는 물을 이중 결합에 부가하여 하이드록실부의 포화 및 혼입을 가져온다. 상기 하이드록실화 공정은 글리세로지질의 하나 이상의 지방산 성분을 하이드록시 지방산으로 전환시키기 위한 기작을 제공한다. 하이드록실화는, 예를 들어 미국 특허 제5,576,027호에 보고된 방법을 통해 수행할 수 있다. 피마자유를 포함하는 하이드록실화된 지방산 및 이의 유도체는 식품 첨가제, 계면활성제, 안료 습윤제, 소포제, 방수 첨가제, 가소화제, 화장품 유화제 및/또는 탈취제를 포함하는 여러 가지의 산업 응용 분야, 및 전자기기, 약제, 페인트, 잉크, 접착제 및 윤활제에서의 성분으로서 유용하다. 글리세라이드의 하이드록실화를 수행할 수 있는 방법의 한가지 예는 다음과 같다: 지방은 바람직하게 헵탄과 조합하여 약 30℃ 내지 50℃로 가열하고 30분 이상 동안 온도에 유지시킬 수 있으며; 이어서 아세트산을 혼합물에 첨가하고 황산 수용액, 그 다음 과산화수소 수용액을 소량의 증분으로 1시간에 걸쳐서 혼합물에 첨가하며; 수성 과산화수소 후에 온도를 이어서 약 60℃ 이상으로 증가시키고 6시간 이상 동안 교반시킬 수 있으며; 교반 후 상기 혼합물이 침강할수 있게 하고 반응에 의해 형성된 저급 수성 층을 제거하는 한편, 반응에 의해 형성된 상부 헵탄층을 약 60℃의 온도를 갖는 고온수로 세척할 수 있고; 세척된 헵탄 층을 이어서 수산화칼륨 수용액을 사용하여 pH 약 5 내지 7로 중화시키고 이어서 진공 증류에 의해 제거할 수 있으며; 반응 생성물을 이어서 100℃에서 진공 건조시킬 수 있고 건조된 생성물을 진공 조건 하에 증기 탈취시키고 규조토를 사용하여 약 50℃ 내지 60℃에서 여과할 수 있다.
본원에 기술된 방법에 의해 생성된 미생물 오일의 하이드록실화는 미국 특허 제6,590,113호(오일계 피복제 및 잉크); 제4,049,724호(하이드록실화 공정); 제6,113,971호(올리브유 버터); 제4,992,189호(윤활제 및 루브 첨가제); 제5,576,027호(하이드록실화된 밀크); 및 제6,869,597호(화장품)에 보고된 바와 같이 방법 및/또는 물질 중 하나 이상과 함께 또는 생성물을 생성하기 위해 수행될 수 있다. 리시놀레산의 하이드록실화는 폴리올을 제공한다.
하이드록실화된 글리세로지질은 에스톨리드로 전환시킬 수 있다. 에스톨리드는 글리세로지질로 이루어지고, 여기서 하이드록실화된 지방산 성분은 다른 지방산 분자에 에스테르화시켰다. 하이드록실화된 글리세로지질의 에스톨리드로의 전환은 글리세로지질 및 지방산의 혼합물을 가온시키고 상기 혼합물을 문헌[Isbell et al., JAOCS 71(2): 169-174 (1994)]에 기술된 바와 같이 무기산과 접촉시킴으로써 수행할 수 있다. 에스톨리드는 미국 특허 제7,196,124호(탄성 물질 및 바닥덮개); 제5,458,795호(고온 응용을 위한 증점 오일); 제5,451,332호(산업적 응용을 위한 유체); 제5,427,704호(연료 첨가제); 및 제5,380,894호(윤활제, 그리스, 가소제 및 인쇄 잉크)(이에 제한되는 것은 아님)에 보고된 것들을 포함하는, 다양한 응용 분야에서 유용하다.
이와 같은 화학 변형의 다른 예로서는 올레핀 복분해가 있다. 올레핀 복분해에서, 촉매는 알켄(올레핀) 내에 있는 알킬리덴 탄소를 분리하며, 이와 같이 분리된 탄소들 각각과 상이한 알킬리덴 탄소들 간 쌍을 이룸으로써 새로운 알켄을 형성한다. 올레핀 복분해 반응은, 에틸렌을 사용한 분해(ethenolysis), 자가 복분해에 의한(알켄 결합을 통한) 지방산의 가교, 및 교차 복분해에 의하여 유도체화된 알켄과 함께 신규 작용기를 지방산에 통합시킴으로써, 알켄에 존재하는 불포화 지방산 알킬 사슬을 절두하는 것과 같은 공정 기작을 제공한다.
기타 다른 반응, 예를 들어 에스테르 결합 전이 및 수소화와 관련하여, 올레핀 복분해는 불포화 글리세로지질을 다양한 최종 생성물로 전환할 수 있다. 이러한 생성물은 왁스용 글리세로지질 올리고머; 윤활제용 단쇄 글리세로지질; 화학 물질 및 중합체용 동종이작용성 및 이종이작용성 알킬 사슬; 생물 연료용 단쇄 에스테르; 및 제트 연료용 단쇄 탄화수소를 포함한다. 올레핀 복분해는, 예를 들어 미국 특허 제7,119,216호, 미국 특허 공개 제2010/0160506호 및 미국 특허 공개 제2010/0145086호에 보고된 방법 및 촉매를 사용하여 트리아실글리세롤과 지방산 유도체 상에서 수행될 수 있다.
바이오오일(bio-oil)의 올레핀 복분해는 일반적으로 기타 다른 알켄의 존재 하(교차 복분해) 또는 부재 하(자가 복분해)에, 불활성 조건 하에서 Ru 촉매 용액을 약 10ppm 내지 250ppm의 로딩율로 불포화 지방산 에스테르에 첨가하는 것을 포함한다. 반응은 통상적으로 수 시간에서 수 일에 이르기까지 진행될 수 있으며, 궁극적으로는 알켄 생성물을 분배한다. 올레핀 복분해가 지방산 유도체 상에서 어떻게 수행될 수 있는지에 관한 일례는 다음과 같다: 톨루엔 중 제1 세대 그럽스 촉매(Grubbs Catalyst)(디클로로[2(1-메틸에톡시-α-O)페닐]메틸렌-α-C)(트리사이클로헥실-포스핀) 용액(촉매 로딩율 = 222ppm)은 탈기 및 무수 메틸 올리에이트가 담긴 용기에 첨가될 수 있다. 그 다음, 상기 용기는 약 60psig의 에틸렌 가스로 가압된 후, 약 30℃ 이하의 온도에서 3시간 동안 유지될 수 있는데, 이로써 대략 수율 50%의 메틸 9-데세노에이트가 생성될 수 있다.
본원에 기술된 방법에 의해 생산된 오일의 올레핀 복분해는 특허 출원 PCT/US07/081427호(α-올레핀 지방산) 및 미국 특허 출원 제12/281,938호(바셀린), 제12/281,931호(페인트볼 건 캡슐), 제12/653,742호(가소제 및 윤활제), 제12/422,096호(이작용성 유기 화합물) 및 제11/795,052호(양초)에 보고된 바와 같은 방법 및/또는 물질 중 하나 이상과 함께 또는 생성물을 생성하기 위해 수행될 수 있다.
미생물 오일상에서 수행될 수 있는 기타 다른 화학적 반응은 미국 특허 제6,051,539호에 보고된 바와 같이 트리아실글리세롤과 사이클로프로판화제를 반응시켜 유동성 및/또는 산화 안정성을 증진시키는는 것; 미국 특허 제6,770,104호에 보고된 바와 같이 트리아실글리세롤로부터 왁스를 제조하는 것; 및 문헌[“The effect of fatty acid composition on the acrylation kinetics of epoxidized triacylglycerols”, Journal of the American Oil Chemists' Society, 79:1, 59-63, (2001)] 및 [Free Radical Biology and Medicine, 37:1, 104-114 (2004)]에 보고된 바와 같이 트리아실글리세롤을 에폭시화시키는 것을 포함한다.
전술된 바와 같이 연료 및 화학적 생성물에 대한 오일 함유 미생물 바이오매스의 생성은 탈지된 바이오매스 밀(meal)을 생성시킨다. 탈지된 밀은 조류 오일을 제조하는데 있어서의 부산물이고, 농장 동물, 예를 들어 반추동물, 가금류, 돼지 및 양식물고기에 대한 동물 사료로서 유용하다. 생성된 밀은 오일 함량이 감소하였지만 여전히 고품질의 단백질, 탄수화물, 섬유, 재, 잔류 오일 및 동물 사료에 적당한 기타 다른 영양물을 함유한다. 세포는 주로 오일 분리 공정에 의해 용해되기 때문에, 탈지된 밀은 상기 동물에 의해 쉽게 소화될 수 있다. 탈지된 밀은 임의로 동물 사료에서 곡물과 같은 기타 다른 성분과 배합될 수 있다. 탈지된 밀은 분말성 점도를 갖기 때문에, 이것은 압출기 또는 확장기 또는 시판되는 다른 유형의 기계를 사용하여 펠렛으로 압축될 수 있다.
피마자 오일은 아주까리로부터 분리되는, 자연적으로 생성되는 오일이다. 피마자 오일의 가수 분해로 리시놀레산이 생성된다. 아주까리는 다량의 리신을 함유하므로, 아주까리로부터의 피마자 오일의 생산은 어렵다. 리신은 화학 무기 금지 협약(Chemical Weapons Convention) 중 스케쥴 1 화합물로서 나열된 매우 위험한 독소이다. 그러므로, 아주까리로부터 피마자유를 생산할 때에는 세심한 주의를 기울여야 한다. 미세 조류 세포로부터 분리된 하이드록실화 오일은 본 발명의 하나의 구체예에 의해 제공된다. 이러한 방식으로, 리시놀레산이 생산될 수 있다. 하나의 구체예에서, 하이드록실화된 오일은 하이드록실화된 트리글리세라이드이다. 본 발명의 하이드록실화된 트리글리세라이드는 피마자 오일과 화학적으로 유사할 수 있다. 실시예 7에 나타낸 바와 같이, 본 발명은 하이드록실화된 미생물 오일을 제공한다. 실시예 7의 오일의 GC/MS 분석 결과는, 본 발명자들이 리시놀레산(12-하이드록시-9-cis-옥타데센산)을 제조하였음을 나타낸다.
본 발명의 하나의 구체예에 따른 지방산은 하이드록실화된 지방산이다. 하이드록실화된 지방산의 하나의 구체예는 리시놀레산이다.
미생물의 하이드록실화 오일 또는 하이드록실화 지방산은 추가로 하이드록실화될 수 있다. 리시놀레산이 추가로 하이드록실화될 때, 2개의 하이드록실기를 함유하는 지방산, 폴리올이 제공된다.
본 발명은 폴리올(예를 들어, 하이드록실화된 오일 및/또는 하이드록실화된 지방산)과, 이소시아네이트부를 함유하는 화합물을 반응시킴으로써 제조된 조성물을 제공한다. 피마자 오일과 이소시아네이트를 사용하여 폴리우레탄이 생산되었다. 폴리우레탄은 오늘날 사용되는 제품에 두루 존재한다. 폴리우레탄은 자동차, 장난감, 운동 기구, 소비자용 전자 제품, 신발, 매트리스, 쿠션, 접착제, 건축 자재 등에서 발견된다. 현재, 피마자유로 제조된 폴리우레탄이 BASF, Itoh Oil 등으로부터 시판되고 있다. 하이드록실화된 대두 오일로 제조된 폴리우레탄은 Cargil, Dow, Bayer 등으로부터 시판되고 있다.
하나의 구체예에서, 미생물 세포에 의해 생산된 리시놀레산은, 당업계에 공지된 방법에 따라서, 함유 화학 제품, 예를 들어 리시놀레 에스테르, 리시놀레 아미드, 폴리우레탄, 폴리우레탄 폼 또는 폴리우레탄 부품으로 추가로 가공될 수 있다. 예를 들어 미국 특허 제6194475호, 제4266617호, 제6403664호 및 제4058492호, 그리고 미국 특허 출원 제20100227151호를 참조한다.
상기에서 상세하게 기술된 본 발명은 하기의 실시예에 예시되지만, 이는 청구된 발명을 설명하기 위해 제공될 뿐 이에 제한되지 않는다.
VII
.
실시예
실시예
1:
프로토테카를
배양하는 방법
프로토테카 균주는 건조 세포 중량을 기준으로 높은 백분율의 오일을 성취하기 위해 배양하였다. 동결보존된 세포를 실온에서 해동시키고 500㎕의 세포를 4.5ml의 배지(4.2g/L K2HPO4, 3.1g/L NaH2PO4, 0.24g/L MgSO4·7H2O, 0.25g/L 시트르산 1수화물, 0.025g/L CaCl2 2H2O, 2g/L 효모 추출물) + 2% 글루코스에 첨가하고 6웰 평판에서 교반(200rpm)하면서 7일 동안 28℃에서 생장시켰다. 건조 세포 중량은 1ml의 배양물을 예비 칭량된 에펜도르프 튜브에서 5분 동안 14,000rpm에서 원심분리하여 측정하였다. 배양 상청액을 버리고 수득한 세포 펠렛을 1ml의 탈이온수로 세척하였다. 배양물을 다시 원심분리하고, 상청액을 버리며, 세포 펠렛을 동결될 때까지 -80℃에 두었다. 이어서 샘플을 24시간 동안 동결건조시키고 건조 세포 중량을 계산하였다. 배양물 중 총 지질을 측정하기 위해, 3ml의 배양물을 제거하고 제조업자의 프로토콜에 따라 Ankom 시스템(Ankom Inc., Macedon, NY)을 사용하여 분석하였다. 샘플은 제조업자의 프로토콜에 따라 Amkom XTlO 추출기로 용매 추출을 하였다. 총 지질은 산 가수 분해된 건조 샘플 및 용매 추출된 건조 샘플간의 질량 차이로서 측정하였다. 오일 건조 세포 중량의 백분율 측정은 표 10에 나타내어져 있다.
종 | 균주 | % 오일 |
프로토테카 스태그노라 | UTEX 327 | 13.14 |
프로토테카 모리포르미스 | UTEX 1441 | 18.02 |
프로토테카 모리포르미스 | UTEX 1435 | 27.17 |
프로토테카 속의 다수의 균주들로부터 얻은 미세 조류 샘플의 유전자형을 분석하였다. 게놈 DNA를 다음과 같이 조류 바이오매스로부터 분리하였다. 세포(대략 200mg)를 14,000 x g에서 5분 동안 액체 배양물로부터 원심분리하였다. 세포를 이어서 멸균 증류수에 재현탁시키며, 14,000 x g에서 5분 동안 원심분리하고 상청액을 버렸다. 직경이 약 2mm인 단일 유리 비드를 바이오매스에 첨가하고 튜브를 15분 이상 동안 -80℃에 두었다. 샘플을 제거하고 150μl의 분쇄 완충액(1% 사르코실(Sarkosyl), 0.25M 수크로스, 50mM NaCl, 20mM EDTA, 100mM Tris-HCl, pH 8.0, RNase A 0.5ug/ul)을 첨가하였다. 펠렛을 간단히 와류시켜 재현탁시키고, 이어서 40㎕의 5M NaCl을 첨가하였다. 샘플을 간단히 와류시키고, 이어서 66μl의 5% CTAB(세틸 트리메틸암모늄 브로마이드)를 첨가하며, 최종적으로 간단히 와류시켰다. 다음에 샘플을 10분 동안 65℃에서 항온처리하고, 이후 이들을 10분 동안 14,000 x g에서 원심분리하였다. 상기 상청액을 새로운 튜브로 옮기고, 300μl의 페놀:클로로포름:이소아밀 알코올 12:12:1로 1회 추출함에 이어서 14,000 x g에서 5분 동안 원심분리하였다. 생성된 수성 상을 0.7용적의 이소프로판올(약 190㎕)을 함유하는 새로운 튜브로 옮기고, 뒤집어서 혼합하며, 30분 동안 실온에서 또는 밤새 4℃에서 항온처리하였다. DNA를 10분 동안 14,000 x g에서 원심분리를 통해 회수하였다. 이어서 생성된 펠렛을 70% 에탄올로 2회 세척함에 이어서 100% 에탄올로 최종 세척하였다. 펠렛을 실온에서 20분 내지 30분 동안 공기 건조시킴에 이어서 50μl의 1OmM TrisCl, 1mM EDTA(pH 8.0) 중에 재현탁시켰다.
상기된 바와 같이 제조된 5μl의 총 조류 DNA를 10mM Tris(pH 8.0) 중에서 1:50으로 희석시켰다. 최종 용적 20㎕의 PCR 반응을 다음과 같이 준비하였다. 10μl의 2 x iProof HF 마스터 믹스(BIO-RAD)를 0.4μl의 프라이머 SZ02613 (10mM 스톡 농도에서 5'-TGTTGAAGAATGAGCCGGCGAC-3'(서열번호 9))에 첨가하였다. 상기 프라이머 서열은 GenBank 수탁 번호 제L43357호에서 567번 내지 588번이고, 고등 식물 및 조류 색소체 게놈에서 고도로 보존되어 있다. 이어서 0.4μl의 프라이머 SZ02615(10mM 스톡 농도에서 5'-CAGTGAGCTATTACGCACTC-3'(서열번호 10))를 첨가하였다. 상기 프라이머 서열은 GenBank 수탁 번호 제L43357호에서 1112번 내지 1093번 위치에 상보적이고, 고등 식물 및 조류 색소체 게놈에서 고도로 보존되어 있다. 다음에, 5μl의 희석된 총 DNA 및 3.2μl의 dH2O를 첨가하였다. PCR 반응을, 35사이클 동안 98℃, 45초; 98℃, 8초; 53℃, 12초; 72℃, 20초에 이어서 1분 동안 72℃에서 수행하며, 25℃에 유지시켜 수행한다. PCR 생성물의 정제를 위해, 20μl의 10mM Tris(pH 8.0)를 각각의 반응에 첨가하고, 이어서 40μl의 페놀:클로로포름:이소아밀 알코올 12:12:1로 추출하며, 와류시키고 5분 동안 14,000 x g에서 원심분리하였다. PCR 반응을 S-400 칼럼(GE Healthcare)에 적용하고 3,000 x g에서 2분 동안 원심분리하였다. 정제된 PCR 생성물을 이어서 PCR8/GW/TOPO로 TOPO 클로닝하고, 양성 클론을 LB/Spec 평판을 위해 선택하였다. 정제된 플라스미드 DNA를 M13 정방향 및 역방향 프라이머를 사용하여 양 방향으로 서열분석하였다. 전체적으로, 12개의 프로토테카 균주는 서열분석된 이들의 23S rRNA DNA를 갖도록 선택하고, 상기 서열을 서열 목록 중에 열거하였다. 균주 및 서열 번호에 대한 요약은 하기에 포함된다. 상기 서열은 UTEX 1435(서열번호 15) 서열로부터 총 분기점에 대해 분석하였다. 2개의 쌍(UTEX 329/UTEX 1533 및 UTEX 329/UTEX 1440)이 가장 분기된 것으로서 나타났다. 양 경우에, 쌍형성 정렬은 75.0% 쌍형성 서열 동일성을 나타내었다. UTEX 1435에 대한 서열 동일성 백분율은 또한 하기에 포함된다.
상기 열거된 균주의 서브세트 유래의 지질 샘플은 HPLC를 사용하여 지질 프로필에 대해 분석하였다. 결과는 하기 표 11에 나타내어져 있다. 대안적으로, 지질 프로필은 실시예 11에 개략적으로 기술된 방법을 이용하여 측정될 수 있다.
(용매 추출을 통해 또는 익스펠러 프레스를 사용하여) 프로토테카 모리포르미스 UTEX 1435로부터 추출된 오일을 대상으로, 카로티노이드, 엽록소, 토코페롤, 기타 다른 스테롤 및 토코트리에놀에 대해 분석하였다. 그 결과는 하기 표 12에 요약되어 있다.
압착된 오일 (mcg/ml) |
용매 추출된 오일(mcg/ml) | |
cis-루테인 | 0.041 | 0.042 |
trans-루테인 | 0.140 | 0.112 |
trans-제아잔틴 | 0.045 | 0.039 |
cis-제아잔틴 | 0.007 | 0.013 |
t-알파-크립토잔틴 | 0.007 | 0.010 |
t-베타-크립토잔틴 | 0.009 | 0.010 |
t-알파-카로틴 | 0.003 | 0.001 |
c-알파-카로틴 | 검출되지 않음 | 검출되지 않음 |
t-베타-카로틴 | 0.010 | 0.009 |
9-cis-베타-카로틴 | 0.004 | 0.002 |
라이코펜 | 검출되지 않음 | 검출되지 않음 |
총 카로티노이드 | 0.267 | 0.238 |
엽록소 | <0.01mg/kg | <0.01mg/kg |
토코페롤 및 스테롤 | ||
압착된 오일 (mg/100g) |
용매추출된 오일(mg/100g) | |
감마 토코페롤 | 0.49 | 0.49 |
캄페스테롤 | 6.09 | 6.05 |
스티그마스테롤 | 47.6 | 47.8 |
베타-시토스테롤 | 11.6 | 11.5 |
기타 다른 스테롤 | 445 | 446 |
토코트리에놀 | ||
프레스된 오일 (mg/g) |
용매추출된 오일(mg/g) | |
알파 토코트리에놀 | 0.26 | 0.26 |
베타 토코트리에놀 | <0.01 | <0.01 |
감마 토코트리에놀 | 0.10 | 0.10 |
델타 토코트리에놀 | <0.01 | <0.01 |
총 토코트리에놀 | 0.36 | 0.36 |
표준 식물성 오일 가공 방법을 이용하여, 프로토테카 모리포르미스(4개의 개별 분획)로부터 추출된 오일을 정제한 후 표백하였다. 간단히 말해서, 프로토테카 모리포르미스로부터 추출된 미정제 오일을 수평 디캔터 내에서 투명하게 만들었는데, 이때 오일로부터 고체가 분리되었다. 그 다음, 투명한 오일을 시트르산과 물이 담긴 탱크로 옮긴 후, 이를 약 24시간 동안 방치하여 침강시켰다. 24시간 경과 후, 탱크 내 혼합물은 2개의 별도 층들을 형성하였다. 아래 층은 물과 고무질로 이루어졌는데, 이후 이것들을 경사분리(decantation)에 의해 제거한 다음, 고무 성질이 제거된 오일을 표백 탱크로 옮겨 담았다. 그 다음, 오일을 일정량의 추가 시트르산과 함께 가열하였다. 이후, 표백 점토를 상기 표백 탱크 내에 첨가하였으며, 이 혼합물을 진공 하에서 추가로 가열하여 잔류하던 물을 전부 증발시켰다. 그 다음, 혼합물을 잎상 필터를 통해 펌핑하여 표백 점토를 제거하였다. 이후, 여과된 오일을 최종 5㎛ 연마 필터(polishing filter)에 통과시킨 다음, 이를 수집하여 사용시까지 보관하여 두었다. 그 다음, 정제 및 표백(RB) 오일을 카로티노이드, 엽록소, 스테롤, 토코트리에놀 및 토코페롤에 대해 분석하였다. 이와 같은 분석 결과는 하기 표 13에 요약되어 있다. “nd”는 검출되지 않았음을 의미하고, 검출 감도는 하기에 나열된 바와 같았다.
검출 감도
카로티노이드(mcg/g) nd = <0.003mcg/g
엽록소(mcg/g) nd = <0.03mcg/g
스테롤(%) nd = 0.25%
토코페롤(mcg/g); nd = 3mcg/g
프로토테카 모리포르미스 오일의 동일한 4개 분획을 또한 미량 원소에 대해 분석하였으며, 그 결과는 하기 표 14에 요약되어 있다.
실시예
2:
프로토테카의
일반적 유전자 총 형질 전환법
씨셸 골드 마이크로캐리어 550(Seashell Gold Microcarriers 550) 나노미터를 제조자 프로토콜에 따라서 제조하였다. 플라스미드(20㎍)를 결합 완충액 50㎕ 및 S550d 골드 캐리어 60㎕(30㎎)와 혼합하고 나서, 이 혼합물을 1분 동안 얼음 속에서 항온 처리하였다. 여기에 침전 완충액(100㎕)을 첨가하고, 이 혼합물을 얼음 속에서 1분 더 항온 처리하였다. 이를 와류시킨 다음, 에펜도르프 5415C 마이크로 원심 분리로 10초 동안 10,000rpm에서 회전시켜 DNA 코팅된 입자를 펠릿화하였다. 골드 펠릿을 냉각 100% 에탄올 500㎕로 1회 세정한 후, 마이크로 원심 분리로 간단히 회전시켜 펠릿화한 다음, 얼음 냉각된 에탄올 50㎕로 재현탁하였다. 간단히 초음파 처리한 후(1초 내지 2초), DNA 코팅된 입자들 10㎕를 즉시 캐리어 막으로 이동시켰다.
프로토테카 균주를 2% 글루코스 함유 프로테오스 배지(2g/L 효모 추출물, 2.94mM NaNO3, 0.17mM CaCl2ㆍ2H2O, 0.3mM MgSO4ㆍ7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl) 중에서, 세포 밀도가 2 x 106세포/㎖가 될 때까지 선회 진탕기에서 생육하였다. 세포를 회수한 후, 멸균 증류수로 1회 세정하고 나서, 배지 50㎕ 중에 재현탁하였다. 1 x 107 세포를 비선택성 프로테오스 배지 평판 중앙 3분의 1에 해당하는 부위에 도말하였다. 세포를 PDS-1000/He 유전자 총 입자 전달 시스템(Bio-Rad)으로 발사하였다. 파열 판(rupture disk)(1350psi)을 사용하였으며, 평판을 스크리닝/매크로캐리어 조립체 6㎝ 아래에 놓았다. 25℃에서 12시간 내지 24시간 동안 세포를 회수하였다. 회수시, 고무 주걱으로 세포를 평판으로부터 긁어내고 나서, 이를 배지 100㎕와 혼합한 다음, 적절하게 선택된 항생제를 함유하는 평판상에 도말하였다. 25℃에서 7일 내지 10일 동안 배양한 다음, 형질 전환된 세포를 나타내는 콜로니들을 평판 상에서 가시적으로 확인하였다. 콜로니들을 골라낸 다음 (항생제 또는 탄소원 함유) 선택 한천 평판 상에 점 찍었다(제2 선택 라운드용).
실시예
3:
프로토테카
내 다양한
티오에스테라제의
발현
프로토테카 종 내 이종 티오에스테라제 유전자를 발현하는 방법과 이에 따른 효과는, 본원에 참조로 포함되어 있는 PCT 출원 PCT/US2009/066142호에 이미 기술되어 있다. 고등 식물 종으로부터 유래하는 기타 다른 티오에스테라제 유전자/유전자 생성물의 효과를 더욱 자세히 관찰하였다. 이러한 티오에스테라제는 다음과 같은 고등 식물로부터 유래하는 티오에스테라제를 포함한다:
GenBank
종
수탁 번호
특이성
서열 번호
신나모뮴 캠포라 Q39473 C14 서열 번호 30 ~ 31
움벨루라리아 캘리포니카 Q41635 C10-C12 서열 번호 34 ~ 35
쿠페아 후커리아나 AAC49269 C8-C10 서열 번호 32 ~ 33
쿠페아 팔루스트리스 AAC49179 C8 서열 번호 36 ~ 37
쿠페아 란세올라타 CAB60830 C10 서열 번호 38 ~ 39
아이리스 게르마니카 AAG43858.1 C14 서열 번호 40 ~ 41
미리스티카 프래그란스 AAB717291.1 C14 서열 번호 42 ~ 43
쿠페아 팔루스트리스 AAC49180 C14 서열 번호 44 ~ 45
얼머스 아메리카나 AAB71731 광범위 서열 번호 46 ~ 47
미리스티카 프래그란스 AAB71729 광범위 서열 번호 145 ~ 146
가르시니아 망고스타나 AAB51525.1 C16 서열 번호 147 ~ 148
쿠페아 후커리아나 Q39513.1 C16 서열 번호 149 ~ 150
엘라에이스 기니엔시스 AAD42220.2 C16 서열 번호 151 ~ 152
브라시카 나푸스 CAA52070.1 C18 서열 번호 153 ~ 154
리시누스 커뮤니스 ABS30422.1 C18:1 서열 번호 155 ~ 156
모든 경우에서, 상기 티오에스테라제 구조물 각각은 유전자 총 입자 발사법을 사용하여 프로토테카 모리포르미스(UTEX 1435)로 형질 전환되었다. 기타 다른 형질 전환법, 예를 들어 PCT 출원 PCT/US2009/066142호에 개시된 상동성 재조합법은 또한 관심의 유전자의 이종 발현에 적당할 것이다. 실시예 2에 기술된 방법을 사용하여 프로토테카 모리포르미스(UTEX 1435)를 상기 티오에스테라제 구조물 각각으로 형질 전환하였다. 구조물 각각은 NeoR 유전자를 함유하였으며, 양성 클론 선택은 100㎍/㎖ G418을 사용하여 수행하였다. 모든 암호화 영역은 프로토테카 모리포르미스 UTEX 1435(표 2 참조) 핵내 유전자에 고유한 코돈 편향 사용(codon bias)을 반영하도록 최적화된 코돈이었다. 사용된 구조물에 대한 아미노산 서열과 cDNA 서열은 둘 다 서열 동일성 목록에 나열되어 있다. 달리 특정하지 않는 한, 고등 식물 티오에스테라제 각각에 대한 운반 펩티드(transit peptide)는 프로토테카 모리포르미스 델타 12 지방산 불포화 효소(서열 번호 48) 또는 클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소(서열 번호 49)로부터 유래하는 조류 코돈 최적화 운반 펩티드로 대체되었다. 모든 티오에스테라제 구조물은 클라미도마나스 레인하르드티 베타-튜불린 프로모터/5'UTR에 의해 작동되었다. 선택된 양성 클론의 생장 및 지질 생산을 야생형(형질 전환되지 않은) 프로토테카 모리포르미스(UTEX 1435)와 비교하였다. 야생형 및 선택된 양성 클론을 2% 글루코스 G418 평판 상에서 생육하였다. 선택된 양성 클론에 대한 각각의 구조물의 지질 프로필 분석 결과는 하기 표 15에 요약되어 있다(면적%로 표시).
상기 결과들은 발현된 티오에스테라제 전부가 지방산 프로필에 어느 정도까지 영향을 주었음을 나타낸다. “총 포화물”행을 살펴보면, 포화도는 티오에스테라제, 예를 들어 유.캘리포니카, 씨.캠포라 및 가장 눈에 띄게는 유.아메리카나로부터 유래하는 티오에스테라제들 중 몇 개의 발현에 의해 깊은 영향을 받았다. 이러한 총 포화물의 백분율 변화는, 고등 식물로부터 유래하는 티오에스테라제의 이종 발현이 지질 사슬 길이에 확실하게 영향을 줄 수 있으며; 또한 미세 조류에 의해 생성되는 지질 프로필의 기타 다른 속성, 즉 지방산의 포화도에도 영향을 줄 수 있다는 점에서 예상하지 못했던 것이다.
씨.팔루스트리스 C8 티오에스테라제, 씨.후커리아나 티오에스테라제, 유.캘리포니카 및 씨.캠포라 티오에스테라제로 형질 전환된 선택 클론을, G418의 양에 변화를 주고(25㎎/L 내지 50㎎/L), 온도에도 변화를 주면서(22℃ 내지 25℃) 추가로 생육하였으며, 이러한 클론을 대상으로 지질 프로필을 측정하였다. 표 16은 각각의 티오에스테라제를 함유하는 대표적인 클론의 지질 프로필(면적%)을 요약한다. 유.아메리카나 티오에스테라제를 함유하는 제2 구조물을 구성하여, 전술한 유전자 총 발사법 이용하여 이를 프로토테카 모리포르미스(UTEX 1435)로 형질 전환되었다. 제2 구조물을 상동성 재조합법을 통해 세포 내에 도입하였다. 프로토테카 종 내에서의 상동성 재조합법은 PCT 출원 PCT/US2009/66142호에 이미 기술되어 있다. 사용된 상동성 DNA는 프로토테카 모리포르미스 UTEX 1435로부터 유래하는 6S 게놈 DNA 서열로부터 유래한 것이었다(서열 번호 92 및 서열 번호 84에 제시된 공여체 서열). 선택 요인은 씨.레인하르드티 베타 튜불린 프로모터에 의해 작동되는, 에스.세레비지아에로부터 유래하는 코돈 최적화 suc2 유전자를 이용하여 수크로스 상에서 생장하는 능력이었다. 천연의 유.아메리카나 운반 펩티드는 클로렐라 프로토테코이데스(UTEX 250) 스테아로일 ACP 불포화 효소 운반 펩티드에 의해 대체되었다. 이 구조물의 cDNA는 서열 목록에 서열 번호 50으로서 나열되어 있다. 양성 클론의 선택은 2% 수크로스 평판 상에서 수행되었으며, 지질 프로필 측정을 위한 생성된 배양물도 또한 2% 수크로스 함유 배지 상에서 생육하였다. 상동적으로 재조합된 이종 유.아메리카나 티오에스테라제를 함유하는 프로토테카 모리포르미스 균주에 대한 대표적인 지질 프로필은 표 16에 요약되어 있다.
전술한 클론을 사용하였을 때, 나타낸 이종 티오에스테라제 유전자를 함유하는 형질 전환체 모두는 지방산 프로필에 어느 정도까지 영향을 미쳤으며, 포화된 지방산의 총 백분율도 야생형(형질 전환되지 않은) 프로토테카 모리포르미스와 비교하였을 때 변하였다. 상동성 재조합법에 의해 도입된 유.아메리카나 티오에스테라제를 함유하는 프로토테카 모리포르미스는 총 포화물이 가장 많이 증가하였다.
뿐만 아니라, 외인성 씨.후커리아나, 씨.캠포라, 유.캘리포니카 또는 유.아메리카나 티오에스테라제를 함유하는 유전자 이식 클론은 신규 지질 프로필에 대해 평가하였다. 씨.후커리아나 티오에스테라제 함유 클론은 22℃에서 2% 글루코스, 25㎎/㎖ G418를 함유하는 배지 중에서 생육되었을 때, C8:0 5.10%; C10:0 18.28%; C12:0 0.41%; C14:0 1.76%; C16:0 16.31%; C18:0 1.40%; C18:1 40.49%; 및 C18:2 13.16%의 지질 프로필을 나타내었다. 씨.캠포라 티오에스테라제 함유 클론(또한 외인성 수크로스 인버타제도 함유함)은 25℃에서 2% 수크로스를 함유하는 배지 중에서 생육되었을 때, C10:0 0.04%; C12:0 6.01%; C14:0 35.98%; C16:0 19.42%; C18:0 1.48%; C18:1 25.44%; 및 C18:2 9.34%의 지질 프로필을 나타내었다. 유.캘리포니카 티오에스테라제 함유 클론은 22℃에서 2% 글루코스와 25㎎/㎖ 내지 100㎎/㎖ G418을 함유하는 배지 중에서 생육되었을 때, C8:0 0%; C10:0 0.11%; C12:0 34.01%; C14:0 5.75%; C16:0 14.02%; C18:0 1.10%; C18:1 28.93%; 및 C18:2 13.01%의 지질 프로필을 나타내었다. 유.아메리카나 티오에스테라제 함유 클론은 28℃에서 2% 글루코스를 함유하는 배지 중에서 생육되었을 때, C10:0 1.54%; C12:0 0.43%; C14:0 7.56%; C16:0 39.45%; C18:0 2.49%; C18:1 38.49%; 및 C18:2 7.88%의 지질 프로필을 나타내었다.
고등 식물로부터 유래하는 부가의 티오에스테라제도 또한 프로토테카 모리포르미스 UTEX 1435 유전적 배경에 도입하였으며, 코돈 최적화 cDNA 서열과 아미노산 서열은 전술한 서열 목록에 나열되어 있다. 이러한 부가의 티오에스테라제는 미리스티카 프래그란스 유래의 광범위한 특이성을 가지는 티오에스테라제(C14:0 내지 C18:0), 가르시니아 망고스타나 유래의 C16:0 선호 티오에스테라제, 쿠페아 후커리아나 유래의 C16:0 선호 티오에스테라제, 엘라에이스 기니엔시스 유래의 C16:0 선호 티오에스테라제, 브라시카 나푸스 유래의 C18:0 선호 티오에스테라제 및 리시누스 커뮤니스 유래의 C18:1 선호 티오에스테라제를 포함한다. 상기 이식 유전자/형질 전환체 각각으로부터 유래하는 생성 유전자 이식 클론과 발현 구조물에 대한 상세한 설명은 이하에 기술되어 있다.
미리스티카 프래그란스로부터 유래하며 광범위한 특이성을 가지는 티오에스테라제(C14:0 내지 C18:0)를, 전술한 방법을 사용하여 프로토테카 모리포르미스 UTEX 1435 유전적 배경에 도입하였다. 2개의 상이한 발현 구조물들을 테스트하였으며, 이 구조물들은 각각 상이한 색소체 표적화 서열을 함유한다. 구조물 2개에 있어서, 에스.세레비지아에 수크로스 인버타제 유전자인 suc2는, 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 생장하는 능력을 양성 형질 전환체에 부여하는 선택가능한 마커로서 사용되었다. 두 개의 발현 구조물, 즉 pSZ1318 및 pSZ1317은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 함유하였는데, 상기 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합 과정에 관여하였다. 이러한 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열되어 있다. pSZ1318은, 프로토테카 모리포르미스 Amt03 프로모터(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는, 프로토테카 모리포르미스 델타 12 FAD 유래 운반 펩티드(서열 번호 48)에 의해 천연 운반 펩티드가 대체된 엠.프래그란스 티오에스테라제 암호화 영역을 함유하였다. 프로토테카 모리포르미스 델타 12 FAD 유래 운반 펩티드를 함유하는, 코돈 최적화 엠.프래그란스 티오에스테라제는 서열 번호 145로서 나열되어 있다. pSZ1317은, 프로토테카 모리포르미스 Amt03 프로모터(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는, 클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 유래 운반 펩티드(서열 번호 49)에 의해 천연 운반 펩티드가 대체된 엠.프래그란스 암호화 영역을 함유하였다. 씨.프로토테코이데스 스테아로일 ACP 불포화 효소 유래 운반 펩티드를 함유하는, 코돈 최적화 엠.프래그란스 티오에스테라제는 서열 번호 158로서 나열되어 있다. 두개의 발현 구조물, 즉 pSZ1318 및 pSZ1317은 프로토테카 세포로 형질 전환되었으며, 선택은 유일한 탄소원으로서 수크로스를 함유하였던 평판 상에서 수행되었다. 각각의 형질 전환 단계로부터 양성 클론을 선택하여, 이 클론은 지질 생산을 위한 질소 제한 조건 하에 유일한 탄소원으로서 수크로스를 함유하는 배지 중에서 생육하였다. 선택된 양성 클론의 하위 세트의 지질 프로필을 전술한 직접 에스테르 결합 전이 방법을 사용하여 측정하였으며, 그 결과는 표 17에 요약되어 있다.
미리스티카 프래그란스 티오에스테라제 이식 유전자를 함유하는 양성 클론은 지질 프로필에 변화가 나타났다. 그러나, 상기 요약된 결과들은 예상외의 결과를 나타내었으며, 고등 식물에서 미리스티카 프래그란스 티오에스테라제는 C16:0 지방 아실-ACP에 대해 상당한 활성을 나타낸 반면에(Voelker et al.,1997), 프로토테카 세포에서 미리스티카 프래그란스 티오에스테라제는 영향력의 크기가 차이가 났었으며(C14:0 > C18:0 > C16:0), 단지 C16:0만에 대해서는 영향이 미치는 범위가 더욱 넓었다.
가르시니아 망고스타나 유래 C16:0 선호 티오에스테라제를 프로토테카 모리포르미스 UTEX 1435 유전적 배경에 도입하였으며, 이 경우 코돈 최적화 cDNA 서열과 아미노산 서열은 전술한 바와 같은 서열 목록 내에 나열되어 있다. 발현 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 포함하였는데, 이 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합 과정에 관여하였다. 이러한 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열되어 있으며, 선택 마커로서 작용하였다. 지.망고스타나 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 상기 지.망고스타나 천연 운반 펩티드는 또한 씨.프로토테코이데스 스테아로일 불포화 효소 유래 운반 펩티드(서열 번호 49)로 대체되었으며, 운반 펩티드로 대체된 상기 티오에스테라제의 cDNA 서열은 서열 번호 147로서 나열되어 있다. 전체 가르시니아 망고스타나 발현 카세트는 pSZ1452로 명명하였으며, 이 발현 카세트는 프로토테카 모리포르미스 유전적 배경으로 형질 전환되었다. 양성 클론을, 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 스크리닝하였다. 양성 클론의 하위 세트를 선택하여, 지질 생산 조건 하에서 생육한 다음, 전술한 바와 같은 직접 에스테르 결합 전이 방법을 사용하여 지질 프로필을 측정하였다. 선택된 클론의 지질 프로필은 하기 표 18에 요약되어 있다.
상기 결과는, 지.망고스타나 티오에스테라제 이식 유전자를 함유하는 형질 전환체가 C16:0 지방산 수준에 상당한 영향을 미쳤으며, 이보다는 그 정도가 약하지만, C14:0 지방산과 C18:0 지방산 수준에도 영향을 미쳤고, 아울러 야생형에 비해서 C18:1 지방산 수준은 극도로 감소하였음을 나타낸다.
쿠페아 후커리아나 유래 C16:0 선호 티오에스테라제를 프로토테카 모리포르미스 UTEX1435 유전적 배경에 도입하였다. 2개의 발현 구조물을 만들었는데, 이것들 중 하나는 천연 쿠페아 후커리아나 C16 선호 티오에스테라제 운반 펩티드 서열을 포함하였고(pSZ1417), 다른 하나는 천연 운반 펩티드 서열이 씨.프로토테코이데스 스테아로일-ACP 불포화 효소 유래 운반 펩티드(서열 번호 49)로 대체된 것이었다(pSZ1462). 천연 운반 펩티드를 함유하는 씨.후커리아나 티오에스테라제의 암호화 서열은 서열 번호 149로서 나열되어 있으며, 운반 펩티드가 대체된 씨.후커리아나 티오에스테라제의 암호화 서열은 서열 번호 160으로서 나열되어 있다. 상기 발현 구조물은 둘 다 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 포함하였는데, 상기 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합 과정에 관여하였다. 이러한 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열되어 있으며, 선택 마커로서 작용하였다. 상기 2개의 구조물에서, 씨.후커리아나 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 상기 구조물은 둘 다 프로토테카 모리포르미스 유전적 배경으로 형질 전환되었으며, 양성 클론은 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 스크리닝하였다. 양성 클론의 하위 세트를 선택하여 지질 생산 조건 하에서 생육하였으며, 지질 프로필은 전술한 직접 에스테르 결합 전이 방법을 사용하여 측정하였다. 선택된 클론의 지질 프로필은 하기 표 19에 요약되어 있다.
상기 결과는, 쿠페아 후커리아나 C16:0 선호 티오에스테라제 구조물들 중 어느 하나를 함유하는 형질 전환체가 C16:0 지방산 수준에 상당한 영향을 미쳤으며, 이보다는 그 정도가 약하지만, C14:0 지방산 수준에도 영향을 미쳤고, 아울러 야생형에 비해서 C18:1 지방산 수준은 극도로 감소하였음을 나타낸다. 2개의 구조물 내 운반 펩티드의 차이는 pSZ1417 형질 전환체와 비교하였을 때, pSZ1462 형질 전환체 내 C16:0 지방산 수준이 증가하였음을 설명해줄 수 있다.
엘라에이스 기니엔시스(아프리카 기름 야자)로부터 유래하는 2개의 C16:0 선호 티오에스테라제(GenBank 수탁 번호 제AAD422220.2호(서열 번호 152) 및 제ABD83939호(서열 번호 162)인 아미노산 서열과 상응하며, 각각 이.기니엔시스 팔미토일-ACP 티오에스테라제 및 이.기니엔시스 팔미토일-ACP 티오에스테라제 PATE라 칭함)를, 프로토테카 모리포르미스 UTEX 1435 유전적 배경에 도입하였다. 코돈 최적화 cDNA 서열과 아미노산 서열은 상기 지정한 바와 같은 서열 목록에 나열되어 있다. 상기 2개의 티오에스테라제는 아미노산 동일성을 상당한 수준으로 공유하지만(94% 초과), 이 테오에스테라제 각각의 아프리카 기름 야자수 내 역할은 여전히 규명되지 않았다. 이.기니엔시스 팔미토일-ACP 티오에스테라제를 암호화하는 구조물은 pSZ1437로, 그리고 이.기니엔시스 팔미토일-ACP 티오에스테라제 PATE를 암호화하는 구조물은 pSZ1436으로 명명하였다. 상기 발현 구조물은 둘 다 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 함유하였는데, 상기 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합 과정에 관여하였다. 이러한 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열되어 있으며, 선택 마커로서 작용하였다. 상기 2개의 구조물에서, 이.기니엔시스 티오에스테라제 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 상기 구조물은 둘 다 프로토테카 모리포르미스 유전적 배경으로 형질 전환되었으며, 양성 클론은 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 스크리닝하였다. 양성 클론의 하위 세트를 선택한 후 지질 생산 조건 하에서 생육하였으며, 지질 프로필은 전술한 직접 에스테르 결합 전이 방법을 사용하여 측정하였다. 선택된 클론의 지질 프로필은 하기 표 20에 요약되어 있다.
pSZ1437에 의해 암호화된 이.기니엔시스 C16:0 선호 티오에스테라제는 C16:0 지방산 수준에 상당한 영향을 미쳤으며, 이보다는 그 정도가 약하지만, C14:0 지방산 수준에도 영향을 미쳤고, 야생형에 비해서 C18:1 지방산 수준은 극도로 감소하였음을 나타낸다. 놀라운 점은, pSZ1436에 의해 암호화된 이.기니엔시스 C16:0 선호 티오에스테라제 PATE는, 이 pSZ1436에 의해 암호화된 티오에스테라제에 대한 아미노산 동일성이 상당한 수준이었음에도 불구하고, C16:0 또는 C14:0 지방산 수준에 대해 비교적 작은 활성을 나타냈다는 점이다.
브라시카 나푸스 유래 C18:0 선호 티오에스테라제를 프로토테카 모리포르미스 UTEX 1435 유전적 배경에 도입하였으며, 코돈 최적화된 cDNA 서열 및 아미노산 서열은 상기 지정된 바와 같은 서열 목록 내에 나열되어 있다. 발현 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 함유하였는데, 이 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합 과정에 관여하였다. 이러한 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열되어 있으며, 선택 마커로서 작용하였다. 비.나푸스 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 전체 브라시카 나푸스 발현 카세트를 pSZ1358로 명명하였으며, 이는 프로토테카 모리포르미스 유전적 배경으로 형질 전환되었다. 양성 클론은 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 스크리닝하였다. 양성 클론의 하위 세트를 선택한 후 지질 생산 조건 하에서 생육하였으며, 지질 프로필을 전술한 직접 에스테르 결합 전이 방법을 사용하여 측정하였다. 선택된 클론의 지질 프로필은 하기 표 21에 요약되어 있다.
상기 결과는, 브라시카 나푸스 C18:0 선호 티오에스테라제 이식 유전자를 함유하는 형질 전환체가 C18:0 지방산 수준에 상당한 영향을 미쳤으며, 이보다는 그 정도가 약하지만, C16:0 지방산 수준에도 영향을 미쳤고, 아울러 야생형에 비해서 C18:1 지방산 수준은 극도로 감소하였음을 나타낸다.
리시누스 커뮤니스 유래 지방 아실-ACP 티오에스테라제를 프로토테카 모리포르미스 UTEX 1435 유전적 배경에 도입하였으며, 코돈 최적화 cDNA 서열 및 아미노산 서열은 상기 지정된 서열 목록에 나열되어 있다. 발현 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 포함하였는데, 상기 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합 과정에 관여하였다. 이러한 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열되어 있으며, 선택 마커로서 작용하였다. 알.커뮤니스 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 리시누스 커뮤니스 천연 운반 펩티드는 또한 씨.프로토테코이데스 스테아로일 불포화 효소 유래 운반 펩티드(서열 번호 49)로 대체되었으며, 운반 펩티드가 대체된 티오에스테라제의 cDNA 서열은 서열 번호 155로서 나열되어 있다. 전체 리시누스 커뮤니스 발현 카세트는 pSZ1375로 명명되었으며, 이는 프로토테카 모리포르미스 유전적 배경으로 형질 전환되었다. 양성 클론은 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 스크리닝하였다. 양성 클론의 하위 세트를 선택한 후 지질 생산 조건 하에서 생육하였으며, 지질 프로필은 전술한 직접 에스테르 결합 전이 방법을 사용하여 측정하였다. 선택된 클론의 지질 프로필은 하기 표 22에 요약되어 있다.
상기 결과는, 리시누스 커뮤니스 티오에스테라제 이식 유전자를 함유하는 형질 전환체가 C16:0 지방산 수준에 상당한 영향을 미쳤으며, 이보다는 그 정도가 약하지만, C18:0 지방산 수준에도 영향을 미쳤음을 나타낸다. 또한, 야생형의 수준에 비해서 C18:1 지방산 수준도 동반하여 증가하였다.
실시예
4: 다수의 외인성 이종
티오에스테라제
유전자를 사용하는
프로토테카의
형질 전환
전술한 방법을 사용하여 미세 조류 균주인 프로토테카 모리포르미스(UTEX1435)를 형질 전환하여 하나의 클론에서 다수의 티오에스테라제가 발현되도록 만들었다. 하나의 클론에서 다수의 티오에스테라제가 발현됨에 따라서, 미세 조류는, 임의의 단일 티오에스테라제만이 단독으로 발현될 때와 지방산 프로필이 완전히 상이한 오일을 생산하게 되었다(이전 실시예에서 입증됨). 프로토테카 모리포르미스(UTEX 1435)는 처음에, 상동성 재조합법을 사용하여 신나모뮴 캠포라 티오에스테라제(C14 선호 티오에스테라제) 유전자와 함께 수크로스 인버타제 유전자, 그리고 에스.세레비지아에 유래 suc2 유전자(선택은 수크로스 상에서 생장하는 능력을 바탕으로 함)로 형질 전환되었다. 이와 같은 상동성 재조합 구조물에 사용된 DNA는 상기 섹션 III에 기술된 바와 같이 프로토테카 모리포르미스 게놈 DNA의 KE858 영역으로부터 유래한 것이다. 이 유전자 구조물의 관련 부분은 서열 목록 중 서열 번호 51로서 나열하였다. 수크로스 함유 평판 상에서 양성 클론을 스크리닝하였다. 그 다음, 양성 클론을 3개의 카세트들 중 하나로 다시 형질 전환하였는데, 이 경우, 카세트들은 각각 항생제 G418에 대한 내성과, (1) 쿠페아 후커리아나 유래 티오에스테라제 유전자(C8-10 선호), 서열 번호 52; (2) 움벨루라리아 캘리포니카 유래 티오에스테라제 유전자(C12 선호), 서열 번호 53; 또는 얼머스 아메리카나 유래 티오에스테라제(광범위; C10-C16 선호), 서열 번호 54의 부가의 티오에스테라제를 암호화하였다. 각각의 구조물의 관련 부분의 서열도 서열 목록에 포함된다. 티오에스테라제 유전자 둘 다를 발현하는 클론을 50㎍/㎖ G418과 수크로스를 함유하는 배지 상에서 스크리닝하였다. 양성 클론을 선택하고 나서, 이의 생장과 지질 프로필을 평가하였다. 표 23은 대표적인 양성 클론의 지질 프로필을 요약한 것이다(면적%로 표시).
추가로, 씨.캠포라 및 유.캘리포니카 티오에스테라제를 함유하는 이중 티오에스테라제 클론을 22℃에서 50mg/L G418과 2% 수크로스를 함유하는 배지 중에서 생육하였다. 이와 같은 생육 조건 하에 있는 상기 균주로부터 얻어진 지방산 프로필은, C8:0(0); C10:0(0.10); C12:0(31.03); C14:0(7.47); C16:0(15.20); C18:0(0.90); C18:1(30.60); C18:2(12.44); 및 C18:3α(1.38)(총 포화물 = 54.7)이었다.
2개의 상동성 재조합 구조물(하나는 6S 영역을 표적화하며, 다른 하나는 KE858 영역을 표적화함)과 씨.캠포라 티오에스테라제를 함유하는 이중 티오에스테라제 클론을 제조하였다. 양성 클론으로서 대표적인 것의 지방산 프로필은, C8:0 0%; C10:0 0.06%; C12:0 5.91%; C14:0 43.27%; C16:0 19.63%; C18:0 0.87%; C18:1 13.96%; 및 C18:2 13.78%(총 포화물 = 69.74%)이었다. 이 클론의 C12 내지 C14 수준은 49% 이상이었는데, 이는 야생형 세포 내 C12 내지 C14 수준의 37배 이상에 해당하는 수준이었다.
상기 데이터는 다수의 티오에스테라제가 미세 조류 내에서 성공적으로 공동 발현될 수 있음을 보여준다. 다수의 티오에스테라제가 공동 발현되면, 지방산 프로필에 변화가 생겼는데, 즉, 지방산 프로필은 야생형 균주의 지방산 프로필과 상당히 상이할 뿐만 아니라, 개별적 티오에스테라제 중 임의의 하나를 발현시킴으로써 얻어지는 지방산 프로필과도 상이하였다. 중첩 사슬 길이가 특이적인 티오에스테라제를 다수 개 발현하면, 이와 같은 특이적 지방산을 누적 증가시킬 수 있었다.
프로토테카 모리포르미스 내에서 이종 티오에스테라제를 발현(어느 하나만을 단독으로 발현하거나 함께 발현)시키면, 숙주 균주의 지방산/지질 프로필을 변화시켰을 뿐만 아니라, 현재 다양한 종자 작물로부터 얻을 수 있는 오일과 비교하였을 때(표 5) 상기 프로필은 현재 이용되고 있는 기타 다른 시스템 내에서 발견되지 않는, 진정으로 유일한 오일의 프로필이었다. 유전자 이식된 균주는 형질 전환되지 않은 야생형 균주와 확연한 차이를 보였을 뿐만 아니라, 이들 유전자 이식 균주는 표 5에 보여준 시판 오일 중 임의의 것의 프로필과는 확연히 상이한 프로필을 나타냈다. 예를 들어, 코코넛 오일과 팜핵 오일의 C8 내지 C10 지방산 수준은 5.5% 내지 17%였다. 씨.팔루스트리스 C8 선호 티오에스테라제 또는 씨.후커리아나 C10 선호 티오에스테라제를 발현하는 유전자 이식 균주는 각각 C8 내지 C10 지방산을 3.66% 내지 8.65%의 범위 내에서 축적하였다. 이와 같은 C8 내지 C10 지방산 수준은 코코넛 오일과 팜핵 오일의 C8 내지 C10 지방산 수준과 비슷하였으나, 유전자 이식 조류 균주는 상당히 더 높은 수준의 C12:0 지방산이 결여되었으며, 이 균주는 또한 C16:0(유전자 이식체 중 23% 대 코코넛 또는 팜핵 오일 중 11% 내지 16%) 및/또는 C18:1(유전자 이식체 중 50% 내지 57% 대 코코넛 또는 팜핵 오일 중 8% 내지 19%) 수준이 매우 높았다.
쿠페아
라이티
(
Cuphea
wrightii
)
티오에스테라제를
발현시켜 균주
UTEX1435
내
라우레이트
및
미리스테이트
풍부 오일 생산
쿠페아 라이티 종자는 C10:0 지방산 25% 이상 및 C12:0 지방산 65% 이상을 함유하는 오일을 축적하는 것으로 보였다. 2개의 FatB 티오에스테라제, CwFatB1(GenBank 수탁 번호 제U56103호) 및 CwFatB2(GenBank 수탁 번호 제U56104호)는 쿠페아 라이티(문헌[Leonard et al,, Plant Mol . Biol . 34(4):669-79 (1997)]에 기술됨)로부터 클로닝하여, 아라비돕시스 탈리아나 내에서 발현하였다(문헌[Leonard et al,, Plant J. 13(5):621-8 (1998)]에 기술됨). CwFatB1 및 CwFatB2를 발현하는 에이.탈리아나 유전자 이식 계열의 지방산 프로필에 있어서는, C12:0 지방산 종이 16% 내지 25% 증가되었음이 확인되었다(Leonard et al, 1998, 상동). 본 발명의 발명자들은, 균주 UTEX1435가 쿠페아 라이티 티오에스테라제, CwFatB1 및 CwFatB2을 발현시킴으로써 라우레이트 및 미리스테이트 풍부 오일을 생산하는 능력을 입증하였다. 본원에 기술된 실시예에서는, CwFatB1 및 CwFatB2를 발현하는 유전자 이식 균주를 전술된 형질 전환법을 사용하여 생산하였다.
CwFatB1 및 CwFatB2의 아미노산 서열을 이하에 보였다(예측 엽록체 표적화 서열에 밑줄을 그어 나타냄). 이와 같은 1차 아미노산 서열을 형질 전환 구조물에 삽입될 해당 유전자를 합성하는데 사용하였다. 2개의 유전자의 뉴클레오티드 서열을 균주 UTEX 1435(전술한 바와 같이 선호 코돈 사용 빈도 이용) 내에서 발현용으로서 최적화하였다.
CwFatB1(U56103):
CwFatB2(U56104):
씨. 라이티 티오에스테라제를 사용하는 UTEX1435 의 형질 전환: 본 실시예에서는, UTEX1435 균주를 씨.라이티 FatB1 및 FatB2 티오에스테라제를 발현하는 카세트가 도입된 수용체 균주로서 사용하였다. 형질 전환 구조물은 티오에스테라제와 함께, 수크로스 상에서 선택될 수 있도록 만드는 카세트(사카로마이세스 세레비지아에 suc2 유전자)를 함유하였다. 세포를, 전술한 바와 같이 유전자 총을 이용하여 형질 전환하였다. 세포를 2% 수크로스 함유 배지 상에서 직접 형질 전환하였다. 형질 전환 구조물을 제조하여, 티오에스테라제 발현이 씨.레인하르드티 B-튜불린 프로모터 또는 내인성 UTEX 1435 Amt3 프로모터에 의해 진행되도록 만들었다.
티오에스테라제 카세트의 부가 버전(천연 고등 식물 운반 펩티드가 조류 운반 펩티드에 의해 치환된 것)을 제조하였다. 이 구조물에 사용된 운반 펩티드는 다음과 같이 명명하였다: TP1은 UTEX250으로부터 유래하는 스테아로일 ACP 불포화 효소에 대한 운반 펩티드를 암호화하는 것이고, TP2는 UTEX1435로부터 유래하는 스테아로일 ACP 불포화 효소에 대한 운반 펩티드를 암호화하는 것이며, TP3은 UTEX1435로부터 유래된 델타 12 지방산 불포화 효소의 운반 펩티드를 암호화하는 것이고, 또한 TP4는 UTEX1435로부터 유래된 이소펜테닐 디포스페이트 합성 효소의 운반 펩티드를 암호화하는 것이다. 본 실시예에 사용된 구조물은 이하 표 24에 나열하였다.
suc2 및 씨. 라이티 FatB1 티오에스테라제를 발현하는 형질 전환 DNA (Const.1): 형질 전환 구조물의 서열, 즉 6S-CrbTub_suc2_nr::CrbTub_CwFatB1_nr-6S(Const.1으로 명명)을 이하에 제시하였다. 관련 제한 위치는 굵은 글씨체의 소문자에 밑줄을 그어 표시하였으며, SapI , KpnI , AscI , MfeI , BamHI , EcoRI , SpeI , AscI, XhoI , SacI 및 SapI를 5'→3' 방향으로 각각 표시하였다. SapI 위치는 형질 전환 DNA의 5' 및 3' 말단을 한정하는 것이었다. 구조물의 5' 및 3' 측접부에 존재하는 밑줄 친 서열은, 상동성 재조합을 통해 형질 전환 DNA를 표적 통합할 수 있는, UTEX1435 유래 게놈 DNA를 나타내는 것이다(6S 영역). 5'→3' 방향으로 진행되는 씨.레인하르드티 B-튜불린 프로모터(에스.세레비지아에 suc2 유전자(수크로스 가수 분해 활성을 암호화하므로, 균주가 수크로스 상에서 생육될 수 있도록 허용)를 발현시킴)는 소문자로 박스 안에 표시하였다. suc2 에 대한 개시 인자 ATG 및 종결 인자 TGA는 이탤릭체의 굵은 대문자로 표시하였으며, 암호화 영역은 소문자 이탤릭체로 표시하였다. 클로렐라 불가리스 질산염 환원 효소 3'UTR은 굵은 글씨체의 소문자로 표시하였으며, 이 뒤에는 스페이서 영역이 존재한다. 씨.라이티 TE(CwFatB1)를 발현시키는 씨.레인하르드티 B-튜불린 프로모터는 글씨에 박스를 쳐서 표시하였다. 티오에스테라제(CwFatB1)의 개시 인자 ATG 또는 종결 인자 TGA는 굵은 이탤릭체 대문자로 표시하였으며, 암호화 영역 나머지 부분은 소문자 이탤릭체로 표시하였다. 티오에스테라제의 예측 색소체 표적화 서열은 서열 내 개시 인자 ATG 및 AscI 위치 사이에 존재한다. 씨.불가리스 질산염 환원 효소 3'UTR은 굵은 글시로 표시하였다.
suc2 및 씨. 라이티 FatB2 티오에스테라제를 발현하는 형질 전환 DNA(Const.2): Const.1 유래 CwFatB1 유전자를 코돈 최적화 CwFatB2 유전자로 치환함으로써, SpeI 및 AscI 제한 위치(굵은 글씨체의 소문자에 밑줄 쳐 표시)를 이용하는 형질 전환 구조물, 6S-CrbTub_suc2_nr::CrbTub_CwFatB2_nr-6S(Const.2로 명명)을 제조하였다. 티오에스테라제(CwFatB2)의 개시 인자 ATG 및 종결 인자 TGA는 굵은 이탤릭체의 대문자로 표시하였으며, 암호화 영역의 나머지 부분은 소문자 이탤릭체로 표시하였다. 티오에스테라제의 예측 색소체 표적화 서열은 서열 내 개시 인자 ATG와 AscI 위치 사이에 존재한다.
amt3 프로모터에 의해 작동되는, suc2 및 씨. 라이티 FatB1 및 FatB2 티오에스테라제를 발현하는 형질 전환 DNA ( Const .3 & 4): Const. 1 및 Const. 2 유래 티오에스테라제를 작동시키는 CrbTub 프로모터를, UTEX1435 유래 Amt3 프로모터(EcoRI 및 SpeI 제한 단편(이하 굵은 글씨체의 소문자에 밑줄 쳐 표시))로 치환하여, 형질 전환 구조물 6S-CrbTub_suc2_nr::Amt3_CwFatB1_nr-6S(Const.3로 명명), 그리고 6S-CrbTub_suc2_nr::Amt3_CwFatB2_nr-6S(Const.4로 명명)를 제조하였다. Amt3 프로모터 영역은 소문자에 박스를 쳐서 표시하였다.
조류 운반 펩티드의 제어 하에 씨. 라이티 FatB1 티오에스테라제를 발현하는 형질 전환 DNA : Const.1 유래 CwFatB1의 천연 운반 펩티드를 이하에 SpeI 및 AscI 제한 단편(굵은 글씨체의 소문자에 밑줄 쳐서 표시)으로서 보인 상응 조류 운반 펩티드로 치환하여, 형질 전환 구조물 6S-CrbTub_suc2_nr::CrbTub_TP1-CwFatB1_nr-6S(Const.5로 명명); 구조물 6S-CrbTub_suc2_nr::CrbTub_TP2-CwFatB1_nr-6S(Const.6로 명명); 구조물 6S-CrbTub_suc2_nr::CrbTub_TP3-CwFatB1_nr-6S(Const.7로 명명) 및 구조물 6S-CrbTub_suc2_nr::CrbTub_TP4-CwFatB1_nr-6S(Const.8로 명명)을 제조하였다. 생성된 조류 운반 펩티드 서열은 이하 서열 내 개시 인자 ATG와 AscI 위치 사이에 존재한다.
조류 운반 펩티드의 제어 하에 씨. 라이티 FatB2 티오에스테라제를 발현하는 형질 전환 DNA : Const.2 유래 CwFatB2의 천연 운반 펩티드를, 상기 SpeI 및 AscI 제한 단편(굵은 글씨체의 소문자에 밑줄 쳐 표시)으로 보인 상응하는 조류 운반 펩티드로 치환하여, 형질 전환 구조물 6S-CrbTub_suc2_nr::CrbTub_TP1-CwFatB2_nr-6S(Const.9로 명명); 구조물 6S-CrbTub_suc2_nr::CrbTub_TP2-CwFatB2_nr-6S (Const.10로 명명); 구조물 6S-CrbTub_suc2_nr::CrbTub_TP3-CwFatB2_nr-6S(Const.11로 명명) 및 구조물 6S-CrbTub_suc2_nr::CrbTub_TP4-CwFatB2_nr-6S(Const.12로 명명)을 제조하였다. 조류 운반 펩티드 서열은 상기 서열 내 개시 인자 ATG와 AscI 위치 사이에 존재한다.
쿠페아 라이티 티오에스테라제를 발현하는 균주의 지방산 프로필: 전술한 구조물로 형질 전환된 균주를, 전술한 바와 같은 오일 생산 가능 조건 하에서 생육하였다. 야생형 UTEX 1435를 글루코스를 바탕으로 생육하였는데, 이때, UTEX 1435의 형질 전환을 통해 생산된 모든 유전자 이식 계열을 수크로스 상에서 생육하였다. 테스트된 각각의 구조물에 있어서, 4개의 형질 전환체를 지방산 프로필에 미치는 영향력에 대해 분석하였다. 유전자 이식 균주의 지방산 프로필을 이하 표 25 내지 표 28에 나타내었다.
CwFatB1 및 CwFatB2를 발현하는 에이.탈리아나의 유전자 이식 계열(표 25)은, C16:0 지방산 축적에 상당히 영향을 받았으며, 아울러 C14:0 및 C12:0 지방산의 축적에도 영향을 받았음이 확인되었다(Leonard et al, 1998, 상동).
표 26에서 볼 수 있는 바와 같이, 유전자 이식 UTEX 1435 계열(천연 고등 식물 운반 펩티드와 함께 CwFatB1(Const.1 & Const.3)을 발현)은, C14:0 지방산 축적에 1차적으로 영향을 받았으며, 이보다 그 정도는 덜하지만 C12:0 지방산 축적에도 영향을 받았다. 유전자 이식 UTEX1435 계열(천연 고등 식물 운반 펩티드와 함께 CwFatB2(Const.2 & Const.4)를 발현)은, C12:0 및 C14:0 지방산 축적에 상당히 영향을 받았으며, 이 경우, C12:0에 대한 영향력은 C14:0에 대한 영향력보다 컸음이 확인되었다. 2개의 프로모터, 즉 CrbTub(Const. 1 & Const.2) 및 Amt3(Const.3 & Const.4)를 비교함으로써, CwFatB1 및 CwFatB2를 발현하는 유전자 이식 계열은, Amt3 프로모터에 의해 작동될 때 C10:0, C12:0, C14:0 및 C16:0 지방산에 대해 상당히 큰 영향을 받았음이 입증되었다.
CwFatB1 티오에스테라제의 발현이 4개의 상이한 조류 엽록체 표적화 서열(Const. 5, 6, 7 및 8)에 의해 작동되는 유전자 이식 계열을 분석한 결과, 조류 운반 펩티드들 중 임의의 것은, 천연 고등 식물 운반 펩티드의 경우보다 티오에스테라제를 색소체에 더욱 효율적으로 표적화하는 것을 확인할 수 있었다(구조물 5 내지 8 내 C12:0 및 C14:0 수준(표 27)과, 구조물 1 내 C12:0 및 C14:0 수준(표 26)을 비교함). 이와 같은 유전자 이식 계열을 추가로 분석한 결과, 4개의 조류 운반 펩티드 TP2(UTEX1435 스테아로일 ACP 불포화 효소 엽록체 표적화 서열) 및 TP3(UTEX 1435 델타 12 지방산 불포화 효소 엽록체 표적화 서열)은, C12:0 및 C14:0 축적에 더욱 큰 영향을 미쳤음이 확인되었다. 이와 같은 2개의 운반 펩티드(TP1 & TP2)는 UTEX 1435 내 CwFatB1을 색소체에 더욱 효율적으로 표적화하는 것으로 보였다.
CwFatB2 티오에스테라제의 발현이 4개의 상이한 조류 엽록체 표적화 서열(Const. 9, 10, 11 및 12)에 의해 작동되는 유전자 이식 계열을 분석한 결과, 조류 운반 펩티드들 중 오로지 하나만이 천연 고등 식물 운반 펩티드(즉 TP-1)에 우수한 성능을 부여하였음이 입증되었다(C12:0 및 C14:0 지방산에 더욱 큰 영향을 미치는 것을 통해 알 수 있음(Const.9 및 Const.2 비교)).
씨.라이티 티오에스테라제가 UTEX 1435 내에서 발현될 때, 이 효소의 영향력은, 아라비돕시스 내에서 발현될 때와 상당히 상이하였다. CwFatB1 및 CwFatB2를 발현하는 에이.탈리아나의 유전자 이식 계열은, C16:0 지방산의 축적과 아울러 C14:0 및 C12:0 지방산의 축적에도 상당히 영향을 받았음을 나타내었다(표 25). 그러나, UTEX 1435 내에서 발현된 CwFatB1 및 CwFatB2의 C16:0 지방산에 대한 영향력 수준은 동일하지 않다. CwFatB1을 발현하는 모든 UTEX 1435 유전자 이식 계열과, CwFatB2를 발현하는 일부 UTEX 1435 유전자 이식 계열(Const. 10, 11, 12) 내 C12:C14 비율은, 이러한 티오에스테라제를 발현하는 에이.탈리아나 유전자 이식 계열 내 C12:C14 비율과 유사하였다(표 29). 그러나, UTEX 1435 유전자 이식 계열의 C14:C16 비율은, 에이.탈리아나 유전자 이식 계열의 C14:C16 비율과 비교하였을 때 상당히 작았다(표 29). Const.2, 4, 9를 사용하여 제조된 UTEX 1435 유전자 이식 계열 내 C12:C14 및 C14:C16 비율은, 동일한 티오에스테라제를 발현하는 에이.탈리아나 유전자 이식 계열 내 C12:C14 및 C14:C16 비율과는 상당히 상이하였다(표 29). 그러므로, UTEX 1435 내에서 CwFatB1 및 CwFatB2이 발현될 때의 오일 프로필은, 동일한 티오에스테라제를 발현하는 아라비돕시스의 유전자 이식 계열 내 오일 프로필과는 상당히 상이하였다. 또한, 이러한 UTEX 1435 유전자 이식 계열 내 오일 프로필은 야생형 UTEX 1435 내 오일 프로필과 확연히 상이하였다.
마지막으로, 본 실시예에 기술된 유전자 이식 계열에 의해 생산된 변형 오일들은 또한, (전술한 바와 같은) 움벨루라리아 캘리포니카 유래 C12:0 특이 티오에스테라제를 발현하는 유전자 이식 UTEX 1435 계열 내 생성되는 라우레이트 풍부 오일들과 상당히 상이하였다.
상기 사항들을 종합하여 보았을 때, 이와 같은 데이터들은, (1) UTEX 1435 내에서 쿠페아 라이티 티오에스테라제가 발현되면, 지방산 프로필에 상당한 영향을 미쳐 독특한 오일이 생산됨; (2) 균주 UTEX 1435 내에서 CwFatB1 티오에스테라제가 발현되면, 미리스테이트가 풍부한 오일이 생산됨; (3) UTEX 1435 내에서 CwFatB2 티오에스테라제가 발현되면, 라우레이트와 미리스테이트 둘 다가 풍부한 오일이 생산됨; (4) 조류 내에서 CwFatB1 및 FatB2가 발현되면, 생산된 중간 길이 사슬의 지방산의 절대 수준과 이 지방산의 상호간 상대 비율의 관점에서, 표준 고등 식물 시스템 내에서 나타나는 프로필과 분명히 구분되는 프로필을 나타냄과 같은 특성들을 나타내었다.
실시예
5: 질소 의존 내인성
프로토테카
프로모터의 동정
A. 내인성 질소 의존 프로모터의 동정 및 특성 규명
cDNA 라이브러리는 표준 기술을 사용하여 프로토테카 모리포르미스(UTEX 1435)로부터 생성하였다. 상기 프로토테카 모리포르미스를 질소 풍부 조건 하에서 48시간 동안 생육시켰다. 이어서 5%의 접종물(v/v)을 낮은 질소로 이동시키고 상기 세포를 7일 동안 24시간 마다 수거하였다. 배양 약 24시간 후, 배지 내 질소 공급은 완전히 고갈되었다. 수집된 샘플은 드라이아이스 및 이소프로판올을 사용하여 즉시 동결시켰다. 후속적으로 총 RNA는 동결된 세포 펠렛 샘플로부터 분리하고 각각의 샘플로부터 유래하는 부분은 RT-PCR 연구를 위해 보존하였다. 상기 샘플로부터 수거된 총 RNA의 나머지는 폴리A 선택을 거쳤다. 이어서 각각의 조건으로부터 동몰량의 폴리A 선택된 RNA를 모으고, 이를 사용하여 벡터 pcDNA 3.0(Invitrogen) 중에서 cDNA 라이브러리를 생성하였다. 대략적으로 1200개 클론을 생성된 모아진 cDNA 라이브러리로부터 무작위로 집어내고, 양쪽 가닥을 서열분석하였다. 대략적으로 68개의 상이한 cDNA는 이들 1200개의 서열로부터 선택하고, 이를 사용하여 실시간 RT-PCR 연구에 사용하기 위한 cDNA 특이적 프라이머를 설계하였다.
보존된 세포 펠렛 샘플로부터 분리된 RNA를 상기 생성된 cDNA 특이적 프라이머 세트를 사용한 실시간 RT-PCR 연구에서 기질로서 사용하였다. 상기 보존된 RNA를 cDNA로 전환시키고, 68개 유전자 특이적인 프라이머 세트 각각에 대한 RT-PCR의 기질로서 사용하였다. 역치 사이클 또는 CT 수를 사용하여 시간 전반에 걸쳐 수집된 각각의 RNA 샘플 내에서 68개 cDNA 각각에 대한 상대적인 전사체 풍부함을 나타내었다. 질소 풍부와 질소 고갈된 조건 간의 상당한 증가(3배 초과)를 나타내는 cDNA는 잠재적인 유전자로서 표시하고 이의 발현은 질소 고갈에 의해 상향조절된다. 명세서에서 논의된 바와 같이, 질소 고갈/제한은 유지성 미생물에서 지질 합성의 공지된 유도인자이다.
질소 고갈/제한 동안에 발현이 상향조절된 cDNA 유래의 추정 프로모터/5'UTR 서열을 확인하기 위해, 총 DNA를 질소 풍부 조건 하에서 생장한 프로토테카 모리포르미스(UTEX 1435)로부터 분리하고, 이어서 454 서열분석 기술(Roche)을 사용하여 서열분석을 거쳤다. 상기 RT-PCR 결과에 의해 상향 조절된 바와 같은 표시된 cDNA는 454 게놈 서열분석 판독으로부터 비롯된 조립된 콘틱에 대한 BLAST를 사용하여 비교하였다. cDNA의 5' 말단은 특이적 콘틱으로 맵핑하고, 가능한 경우 500bp 초과의 5' 측접 DNA를 사용하여 추정적으로 프로모터/UTR을 확인하였다. 이어서 프로모터/5'UTR의 존재는 게놈 DNA의 PCR 증폭을 사용하여 확인하고 클로닝하였다. 개별 cDNA 5' 말단을 사용하여 3' 프라이머를 설계하고 454 콘틱 조립체의 5' 말단을 사용하여 5' 유전자 특이적 프라이머를 설계하였다.
제1 스크리닝으로서, 추정 프로모터 중 하나인 Aat2(암모늄 수송체, 서열번호 63)로부터 분리된 5'UTR/프로모터를 클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드와 함께 신나모뮴 캠포라 C14 티오에스테라제 구조물로 클로닝하여, 씨. 소로키니아나 글루타메이트 탈수소화 효소 프로모터를 대체한다. 상기 구조물은 서열번호 81로서 열거되어 있다. 추정 프로모터를 시험하기 위해, 티오에스테라제 구조물을 프로토테카 모리포르미스 세포로 형질 전환시켜 전술된 방법을 사용하여 낮은/무 질소 조건 하에서 C14/C12 지방산 증가에 대해 스크리닝함으로써 실제 프로모터 활성을 확인하였다. cDNA/게놈 스크리닝으로부터 분리된 추정 질소 조정된 프로모터의 유사한 테스트는 동일한 방법을 사용하여 수행할 수 있다.
cDNA/게놈 스크리닝으로부터 분리된 기타 다른 추정 질소 조절된 프로모터/5' UTR은 다음과 같다.
프로모터/
5'UTR
서열 번호
증가 배수
FatB/A 프로모터/5'UTR 서열 번호 55 n/a
NRAMP 금속 운반체 프로모터/5'UTR 서열 번호 56 9.65
플랩 플라젤라 연관 단백질 프로모터/5'UTR 서열 번호 57 4.92
SulfRed 아황산염 환원 효소 프로모터/5'UTR서열 번호 58 10.91
SugT 당 운반체프로모터/5'UTR 서열 번호 59 17.35
Amt03-암모늄 운반체 03 프로모터/5'UTR 서열 번호 60 10.1
Amt02-암모늄 운반체 02 프로모터/5'UTR 서열 번호 61 10.76
Aat01-아미노산 운반체01 프로모터/5'UTR 서열 번호 62 6.21
Aat02-아미노산 운반체02 프로모터/5'UTR 서열 번호 63 6.5
Aat03-아미노산 운반체03 프로모터/5'UTR 서열 번호 64 7.87
Aat04-아미노산 운반체04 프로모터/5'UTR 서열 번호 65 10.95
Aat05-아미노산 운반체05 프로모터/5'UTR 서열 번호 66 6.71
증가 배수란, 질소 함량이 낮은 배지 중에서 24시간 동안 배양한 후 cDNA 존재량의 증가 배수를 말한다.
이와 같은 추정 프로모터/5'UTR의 잠재적 조절에 대하여 더욱 자세히 관찰하기 위해서, 서열들 중 8개를 선택하여 (1) FatB/A; (2) SulfRed 아황산염 환원 효소; (3) SugT 당 운반체; (4) Amt02-암모늄 운반체 02; (5) Aat01-아미노산 운반체 01; (6) Aat03-아미노산 운반체 03; (7) Aat04-아미노산 운반체 04; 및 (8) Aat05-아미노산 운반체 05에 대해 추가로 테스트하였다. 다양한 시점, 즉 T0(종자); 종자 접종 후 20시간; 32시간; 48시간; 62시간; 및 114시간의 시점에서 프로토테카 모리포르미스 세포로부터 분리된 RNA를 대상으로 일루미나(Illumina) 서열 결정 판독 결과를 이용하는 고 해상도 전사체 분석법을 수행하였다. T0(종자)의 배지에는 질소가 풍부하였으며, 20시간 경과시로부터 그 이후의 배지에는 질소가 약간 함유되었거나 질소를 아예 함유하지 않았다. 그 다음, 각 시점에서 분리된 RNA로부터 조립 생산된 전사체 콘틱(transcript contig)을, 미리 동정한 8개의 전사체 각각과 독립적으로 블라스팅(blasting)하였다. 그 결과는 하기 표 30에 요약되어 있다.
상기 요약된 결과들로부터, 전사체들 중 몇몇은 시간이 경과함에 따라서 축적량이 증가하였음을 알 수 있었으나, 흥미롭게도 아황산염 환원 효소 mRNA는 시간이 경과함에 따라서 mRNA 축적량이 눈에 띄게 감소하였다.
이와 같은 8개의 추정 프로모터/5'UTR 영역들을 자체의 천연 운반 펩티드가 빠지고 클로렐라 프로토테코이데스(UTEX 250) 스테아로일 ACP 불포화 효소 유래 운반 펩티드로 치환된 씨.캠포라 티오에스테라제 암호화 영역의 상류에 클로닝하였다. 각각의 추정 프로모터/5'UTR 영역 구조물을, 6S 게놈 서열 유래 DNA를 사용하는 상동성 재조합을 통하여 프로토테카 모리포르미스 UTEX 1435에 도입하였다. 또한, 이 구조물 내에는 수크로스 함유 배지/평판 상 양성 클론 선택용 에스.세레비지아에 유래 suc2 수크로스 인버타제 유전자가 함유되어 있었다. Aat01에 대한 구조물의 관련 부위들에 대한 cDNA 서열은 서열 목록 중 서열 번호 67로서 나열하였다. 기타 다른 구조물에 있어서, 동일한 골격이 사용되었는데, 단지 추정 프로모터/5'UTR 서열만이 가변적이었다. 씨.레인하르드티 베타 튜불린 프로모터가 씨.캠포라 티오에스테라제 유전자 발현을 작동시키는데 사용된 부가의 제어 유전자 이식 균주를 생산하였다. 이 프로모터는 관심 유전자의 항상적 발현을 작동하는 것으로 보였으므로, 테스트된 다양한 추정 N-조절 프로모터/5'UTR에 의해 작동될 때 동일한 티오에스테라제 메시지 발현을 측정함에 있어서 유용한 제어 수단을 제공하였다.
일단 유전자 이식 클론이 생산되면, 3개의 독립적 실험을 수행하였다. 처음 2개의 실험에서는 배양액 상청액 중 정상 상태 티오에스테라제 mRNA 수준(RT-PCR로 측정), 지방산 프로필 및 암모니아 수준을 측정함으로써 8개의 추정 프로모터 모두의 잠재적 질소 조절 가능성을 평가하였다. 처음에 클론을 28℃에서 교반하면서(200rpm) 질소 풍부 종자 배지(1g/L 질산 암모늄 - 15mM 질소(암모니아), 4g/L 효모 추출물) 중에서 24시간 내지 48시간 동안 생육하였으며, 이때, 질소 저 함유 배지(0.2g/L 황산 암모늄 - 3mM 질소(암모니아), 0.2g/L 효모 추출물) 50㎖를 접종하는데에는 20OD 유닛(A750)을 적용하였다. 총 6일 동안 24시간 마다 세포의 샘플을 취하되, 저 질소 조건에 대해 스위칭(switching)하기 직전에 샘플을 수집하였다. 이후, 각각의 샘플로부터 취한 세포 일부를 총 RNA 추출(트리졸(Trizol) 시약 사용)에 사용하였다(제조자가 제안하는 방법에 따름). 암모니아 분석 결과, 저 질소 배지 중에서 24시간 경과하였을 때 상청액 중 암모니아 수준이 검출 한계(약 100μM) 이하로 강하되었음을 알 수 있었다.
실시간 RT-PCR에 있어서, 모든 RNA 수준을 각 시점에서 프로토테카 모리포르미스(UTEX 1435) 내에서 발현된 내부 제어 RNA의 수준에 대해 정규화하였다. 상기 내부 제어 RNA(cd189라 칭함)는 N-아세틸 오르니틴 아미노기 전이 효소를 암호화하는 ARG9 유전자의 생성물이다. 이 실험에 있어서 실시간 RT-PCR에 사용된 프라이머 세트는 다음과 같았다:
각 시점에서 얻은 형질 전환체 각각의 지질 프로필도 구하여, 이를 RT-PCR 결과와 비교하였다. 암모니아 수준, RT-PCR 결과 및 C12 내지 C14 지방산 수준 변화를 바탕으로 하였을 때, 아미노산 운반체 01(Aat-01), 아미노산 운반체 04(Aat-04) 및 암모늄 운반체 02(Amt-02) 서열은 기능상 질소 조절 가능 프로모터/5'UTR을 함유하였다는 결론을 내릴 수 있었다.
RT-PCR 결과를 통하여 보았을 때, Aat-01은 정상 상태 씨.캠포라 티오에스테라제 mRNA 수준을, 대조군(씨.레인하르드티 베타 튜불린 프로모터)의 경우보다 4배 이하로 높게 만드는 기능이 있음이 입증되었다. mRNA 수준은 또한 질소 제한과, 눈에 띄는 C12 내지 C14 지방산 수준 증가와 상관되었다. 이와 같은 결과들은, Aat-01 프로모터 연관 5'UTR이 지질 생합성시 단백질 합성을, 대조군 씨.레인하르드티 프로모터의 경우보다 효율적으로 작동시킬 수 있다는 것을 입증하였다. Aat-01 프로모터와 같이, Aat-04 프로모터는, 씨.레인하르드티 제어 프로모터의 경우보다 mRNA를 5배 이하 정도로 많이 축적시킬 수 있었다. 그러나, Aat-04 프로모터 구조물은 C12 내지 C14 지방산 수준에 중간 정도로 영향을 미칠 수 있는 능력을 가지게 되었다. 이러한 데이터를 통하여, Aat-04 프로모터는 질소 고갈에 의해 명확히 조절 가능하지만, 프로모터 연관 UTR은 번역 인핸서로서의 기능이 떨어지는 경향이 있음이 입증되었다. 마지막으로, Amt-02 프로모터는, 대조군 프로모터의 경우보다 mRNA를 3배 이하로 많이 축적시킬 수 있다는 점에서 Aat-01 프로모터와 유사하였다. mRNA 수준은 또한 질소 제한, 눈에 띄는 C12 내지 C14 지방산 수준 증가와 상관되었다. 이러한 사실들을 종합하여 보면, 이와 같은 프로모터들 3개는 모두 질소에 의해 조절된다는 것이 입증되었다.
B. 암모늄 운반체 3(
amt03
) 프로모터 및 다양한
티오에스테라제
발현에 관한 추가 특성 규명
전술한 바와 같이, 부분 cDNA(암모늄 운반체 02 및 03(amt02 및 amt03)이라 칭함)를 동정하였다. 상기 2개의 부분 cDNA와 함께, 제3의 부분 cDNA(암모늄 운반체 01(amt01)이라 칭함)도 동정하였다. 부분 cDNA 및 추정 번역 아미노산 서열의 배열을 비교하였다. 그 결과들은, amt01은 상기 3개의 서열들과의 관련성이 더욱 낮았으며, amt02 및 amt03은 단지 하나의 아미노산만이 상이하다는 것을 보여주었다.
전술한 바와 같이, 처음에, 부분 cDNA 서열을 로쉬 454 게놈 DNA 조립체 및 일루미나 전사체 조립체에 대해 블라스팅함으로써 컴퓨터로 프로모터/5'UTR을 구성하였다. amt01, amt02 및 amt03을 암호화하는 cDNA와 상동성을 보이는 전사체 접합체를 동정하였으나, 전사체 접합체들은 상기 3개의 mRNA들에 의해 공유되는 서열을 함유하였으므로, 이 전사체 접합체 3개의 mRNA들간에는 차이가 없었다. 로쉬 454 게놈 DNA 조립체는 amt02 및 amt03 cDNA 서열에 대해 힛트(hit)를 부여하였으며, N-말단 단백질 서열을 함유하였다. PCR을 수행하여 5' 측접 영역을 클로닝하였다. 클론 amt02 및 amt03 프로모터/UTR을 입증하는데 사용된 PCR 프라이머는 다음과 같았다:
Amt03 정방향: 5'-GGAGGAATTCGGCCGACAGGACGCGCGTCA-3'(서열 번호 85)
Amt03 역방향: 5'-GGAGACTAGTGGCTGCGACCGGCCTGTG-3'(서열 번호 86)
Amt02 정방향: 5'-GGAGGAATTCTCACCAGCGGACAAAGCACCG-3'(서열 번호 87)
Amt02 역방향: 5'-GGAGACTAGTGGCTGCGACCGGCCTCTGG-3'(서열 번호 88)
상기 2개의 경우에 있어서, 5' 및 3' 프라이머는, 상기와 같은 프로모터/5'UTR 영역의 기능성을 입증하기 위해 발현 벡터에 예상 클로닝하는데 유용한 제한 위치들을 함유하였다.
이와 같이 컴퓨터와 PCR계 방법을 통하여 합체되어 클로닝된 DNA와, amt02(서열 번호 61) 및 amt03(서열 번호 60)을 암호화하는 원 cDNA 간에 쌍 정렬(pair wise alignment)을 수행하였다. 이 정렬의 결과를 통하여, 원 cDNA와, 클로닝된 게놈 서열들 간 상당한 차이가 확인되었는데, 이는 곧, 암모늄 운반체들은 다양한 유전자 군을 대표할 것이라는 것을 암시하는 것이다. 뿐만 아니라, amt03에 대한 병행법을 바탕으로 제조된 프로모터/5'UTR 클론은, 원 amt03 서열과 상이하였던 반면에, amt02 서열과는 동일하였다. amt03 프로모터/UTR 서열(서열 번호 89)의 특성을 규명하는 추가의 실험이 이하에 기술된 바와 같이 수행되었다.
추정 프로모터/UTR 서열을 클로닝하여, 4개의 상이한 티오에스테라제를 발현시킴으로써, 상기 동정된 amt03 프로모터//UTR 서열(서열 번호 89)을 테스트하였다. 발현 카세트는 게놈의 6S 위치에 상동성인 상류 및 하류 재조합 서열(각각 서열 번호 82 및 84)을 함유하였다. 카세트는 또한 수크로스 함유 배지에서 양성 클론들을 선택할 수 있도록 하는 에스.세레비지아에 SUC2 수크로스 인버타제 cDNA를 함유하였다. 수크로스 인버타제 발현은 씨.레인하르드티 베타 튜불린 프로모터에 의해 작동되었으며, 이는 또한 씨.불가리스 질산염 환원 효소 3'UTR이 관여하였다. 그 다음, amt03 프로모터/UTR 서열은, 수크로스 인버타제 카세트 하류와, 다음과 같은 티오에스테라제 유전자 4개중 하나로부터 유래하는 인프레임 티오에스테라제 cDNA 서열 사이에 클로닝되었으며, 상기 amt03 프로모터/UTR 서열은 또한 씨.불가리스 질산염 환원 효소 3'UTR을 함유하였다: (1) 씨.캠포라 유래 C14 티오에스테라제; (2) 유.캘리포니카 유래 C12 티오에스테라제; (3) 유.아메리카나 유래 C10 내지 C16 티오에스테라제; 또는 (4) 씨.후커리아나 유래 C10 티오에스테라제. C14 씨.캠포라 티오에스테라제, C12 유.캘리포니카 티오에스테라제, 그리고 C10 내지 C16 유.아메리카나는 모두, 클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소로부터 유래하는 운반 펩티드를 함유하였다. C10 씨.후커리아나 티오에스테라제는 프로토테카 모리포르미스 델타 12 지방산 불포화 효소(FAD) 유래 운반 펩티드를 함유하였다. 모든 경우에서, 서열들은 프로토테카 모리포르미스 내 발현에 최적화된 코돈이었다. 상기 티오에스테라제 구조물들의 서열을 이하 서열 목록에 기술하였다:
amt03 프로모터/UTR::씨.캠포라 티오에스테라제 구조물 서열 번호 90
씨.캠포라 티오에스테라제 구조물 서열 번호 91
유.캘리포니카 티오에스테라제 구조물 서열 번호 92
유.아메리카나 티오에스테라제 구조물 서열 번호 93
씨.후커리아나 티오에스테라제 구조물 서열 번호 94
상기 실시예 2에 기술된 바와 같이, 야생형 프로토테카 모리포르미스 세포로의 유전자 총 형질 전환법을 통하여 유전자 이식 계열을 생산하였으며, 이를 수크로스 함유 평판/배지에서 선택하였다. 이후, 양성 계열을, 자체의 지방산 프로필이 변한 정도에 대해 스크리닝하였다. 그 다음, 4개의 계열들(이 계열들 중 하나는 전술한 4개의 구조물 각각으로 형질 전환하여 생산)을 대상으로 추가 분석을 수행하였다. 계열 76은 씨.캠포라 C14 티오에스테라제를 발현하였으며, 계열 37은 유.캘리포니카 C12 티오에스테라제를 발현하였고, 계열 60은 유.아메리카나 C10 내지 C16 티오에스테라제를 발현하였으며, 또한 계열 56은 씨.후커리아나 C10 티오에스테라제를 발현하였다. 각각의 계열을 유일한 탄소원으로서 수크로스를 함유하는 배지 중에서 48시간 동안 생육하였으며, 14시간, 24시간, 36시간 및 48시간 경과시 세포 샘플(종자 배양액)을 취하여, 지방산 메틸 에스테르로의 직접 에스테르 결합 전이 반응을 통해 지방산 프로필을 측정하고 나서, GC-FID(전술한 바와 같음)로 분석하였으며, 또한 총 RNA를 분리하였다. 48시간 경과 시점이 거의 끝나갈 즈음, 이 세포들을 질소를 함유하지 않거나 낮은 수준으로 함유하는 배양액(이때, 이 배양액은 유일한 탄소원으로서 수크로스를 함유하였으며, 또한 pH는 5.0(시트레이트 완충, 최종 농도 = 0.05M) 또는 7.0(HEPES 완충, 최종 농도 = 0.1M)으로 유지됨)에 접종하였다. (지질을 생산함에 있어서) 12시간, 24시간, 72시간 및 108시간 경과시 배양액 샘플을 취하여 지방산 프로파일링을 수행하였으며, 또한 총 RNA를 분리하였다. 상기 배양액의 암모니아 검정법을 통하여, 질소를 낮은 수준으로 함유하는 배지 중에서 24시간 배양하였을 때의 암모니아 수준은 검출 한계(약 100μM) 이하로 떨어졌음을 알 수 있었다.
상기와 같이 샘플을 수집한 각각의 시점에 취한 총 RNA를 대상으로 하여, 티오에스테라제의 mRNA 수준에 대한 실시간 RT-PCR 검정법을 수행하였으며, 이때 구하여진 모든 mRNA 수준은 내부 대조군 RNA(cd189)의 수준에 대해 정규화하였다. 실시간 PCR에 사용된 프라이머 세트를 이하 표 31에 나타내었다.
종자 배양 단계의 각 시점에서의 지방산 프로필 결과들을 통하여, 티오에스테라제의 영향력이 매우 미약함을 알 수 있었다. 지질 생산 단계 개시시, 지방산 프로필은 상당히 영향을 받았는데, 이 경우 이 지방산 프로필은 pH 5.0인 배양액의 경우와 비교하였을 때 pH 7.0로 유지되는 배양액에서는 훨씬 극적으로 증가하였다. pH 7.0 및 5.0 표적 지방산 축적량 간 차이는 테스트된 각각의 티오에스테라제에 따라서 다양하였으나, 전체 효과는 동일하였으며, pH 5.0에서 생육된 세포들은 축적된 표적 지방산 수준이 상당히 낮았으나, 대조군 야생형 세포보다는 상기 축적된 표적 지방산 수준은 더욱 높았다.
티오에스테라제 각각에 대한 정상 상태 mRNA 수준에 대한 배양액 pH의 영향력은 명확하였던 것으로 보아, 이와 같이 매우 밀접하게 상관되어 있는 샘플들로부터 분리된 RNA의 분석 결과는, 지방산 프로필 데이터에 의존적일 것이다. 지방산 축적 데이터와 mRNA 데이터를 종합하였을 때, amt03 프로모터/UTR에 의해 작동되는 티오에스테라제 유전자 발현에 있어서 pH 조절은, 전사 수준 또는 mRNA 안정성중 하나, 또는 이것들 둘 다에 의해 조율되었음을 알 수 있었다. 뿐만 아니라, 유.캘리포니카 mRNA의 정상 상태 수준은, 씨.후커리아나 mRNA의 정상 상태 수준과 비교하였을 때, 4로그만큼 낮았다. 이와 같은 관찰 결과는, 개별 mRNA 서열이 발현을 제어하는 역할을 할 수 있다는 가설과 일치하였다. 이러한 데이터는, 운반체의 amt03 군에 의해 프로토테카 모리포르미스 내에서의 암모늄 흡수가 pH와 직접적으로 상관되어 있음을 암시하는 것이다.
프로토테카 모리포르미스 세포를, 유.아메리카나 C10 내지 C16 티오에스테라제를 발현하는 amt03 프로모터/UTR 구조물로 형질 전환하여 생산된 계열들 12개를 대상으로 부가의 지방산 프로필 분석을 수행하였다. 전술한 계열 60은 다음과 같은 분석법의 일부였다. 이하 표 32는, 야생형 대조군과 함께 분석되었던 12개의 계열들 중 3개의 지질 프로필을 보여주는 것이다.
상기 표에 나타낸 바와 같이, 총 포화물의 수준은 야생형과 비교하였을 때, 계열 40의 경우 야생형의 총 포화물 수준에 비하여 2.6배 이상 극적으로 증가하였다(분석된 12개의 계열들의 총 포화물 수준은 약 63% 내지 86%였음). 뿐만 아니라, 유.아메리카나 티오에스테라제가 상기와 같은 수준으로 발현될 때, 이 효소는 불포화물(특히 C18:1 및 C18:2) 수준을 극적으로 감소시켰는데(계열 40 및 44 참조), 이 경우, 계열 44에서 C18:1 수준은 야생형의 경우와 비교하였을 때 8배 이상 감소하였다. 뿐만 아니라, 유.아메리카나 티오에스테라제(amt03 프로모터에 의해 발현이 촉발됨)는 중간쇄 길이의 지방산 수준을 상당히 증가시켰다. 계열 44는, C10:0 내지 C14:0 수준이 56% 이상(야생형 균주에서 볼 수 있는 수준보다 약 42배 높음)이었으며, C8:0 내지 C14:0 수준은 57% 이상이었다. 유.아메리카나 티오에스테라제를 발현하는 Amt03 프로모터 구조물로 형질 전환된 부가의 균주들의 대표적인 지질 프로필은, C8:0 0.23%; C10:0 9.64%; C12:0 2.62%; C14:0 31.52%; C16:0 37.63%; C18:0 5.34%; C18:1 7.05%; 및 C18:2 5.03%(총 포화물 백분율 = 86.98%)이었다.
프로토테카 모리포르미스 세포를 구조물 amt03 프로모터/UTR(서열 번호 89)(씨.후커리아나 C10 티오에스테라제(서열 번호 94)를 발현시킴)로 형질 전환하여 부가 지질 프로필을 구하였다. 이 구조물을 발현하는 양성 클론을 선택하여 pH 7.0 조건 하에서 생육하였다. 양성 클론으로부터 얻은 대표적인 지질 프로필은, C8:0 9.87%; C10:0 23.97%; C12:0 0.46%; C14:0 1.24%; C16:0 10.24%; C18:0 2.45%; C18:1 42.81%; 및 C18:2 7.32%이었다. 이 클론의 C8 내지 C10 백분율은 33.84%였다.
이와 같은 데이터들을 종합하였을 때, 이 데이터들은, amt03 프로모터/UTR과 기타 다른 유사 프로모터는 조밀하게 조절되는 프로모터(잠재적으로 독성인 화합물을 발현하고, 유전자 발현을 엄격하게 수행해야 할 때 특히 유용할 수 있음)로서 사용될 수 있음을 암시하고 있다. 프로토테카 모리포르미스가 넓은 pH 범위(pH 5.0 이상 내지7.0)에서 생장할 수 있는 능력은, 이 유기체를 조절 요소, 예를 들어 amt03 프로모터/UTR과 함께 사용되기에 특히 유용하게 만든다. 뿐만 아니라, 상기 지질 프로필 데이터는, amt03 프로모터/UTR이 유전자를 발현하는 인상적인 능력을 입증해주는 것이다.
실시예
6: 미세 조류
프로토테카
모리포르미스
내 포화 지방산 수준의 변경
A. 유전자 녹아웃 접근법에 의한,
스테아로일
ACP
불포화 효소 및 델타 12 지방산 불포화 효소 발현의 감소
생물 정보학을 바탕으로 하는 접근법(cDNA 대상)을 사용하는 유전체학적 스크리닝의 일환으로서, 프로토테카 모리포르미스(UTEX 1435) 유래 게놈 DNA의 로쉬 454 서열 결정 및 일루미나 전사체, 지방산 불포화에 관여하는 유전자의 특정 군 2개를 동정하였다: 스테아로일 ACP 불포화 효소(SAD) 및 델타 12 지방산 불포화 효소(Δ12 FAD). 스테아로일 ACP 불포화 효소는 지질을 합성하는 경로, 예를 들어 C18:0 지방산으로부터 C18:1 지방산을 합성하는 경로에 관여하는 일원으로서, 이중 결합을 지방산 사슬에 도입하는 기능을 갖는다. 델타 12 지방산 불포화 효소는 또한 지질을 합성하는 경로, 예를 들어 C18:1 지방산으로부터 C18:2 지방산을 합성하는 경로에 관여하는 일원으로서, 이미 불포화된 지방산에 이중 결합을 도입하는 기능을 갖는다. 생물 정보학적 시도가 행해질 때 동정된 지방산 불포화 효소 유전자 군 2개를 바탕으로 하는 프로브를 사용하는 서던 블럿 분석은, 불포화 효소 유전자 각 군은 다수의 군 일원들로 이루어져 있을 것임을 말해주었다. 뿐만 아니라, 스테아로일 ACP 불포화 효소를 암호화하는 유전자들은 2개의 별도 군들에 속하였다. 이와 같은 결과를 토대로 하여, 3개의 유전자 중단 구조물을, 불포화 효소 각 군에 고도로 보존된 암호화 영역을 표적화함으로써, 잠재적으로 다수의 유전자 군 일원들을 중단하도록 설계하였다.
(1) 델타 12 지방산 불포화 효소(d12FAD) 군 일원의 암호화 서열의 고도로 보존된 부분들과 (2) SAD의 개별 군 2개 각각을 표적화하는 2개의 구조물(상기 구조물은 각각 상기 각 군으로부터 유래하는 암호화 서열의 보존된 영역을 함유함)을 사용하여 3개의 상동성 재조합 표적화 구조물을 설계하였다. 이와 같은 기법은, 통상적인 유전자 치환 기법보다 선택가능한 마커 유전자(에스.세레비지아에로부터 유래하는 suc2 수크로스 인버타제 카세트로서, 수크로스를 가수 분해하는 능력을 부여함)를 고도로 보존된 암호화 영역(다수의 군에 속하는 일원들을 표적화함)에 더욱 효율적으로 삽입할 것이며, 이 경우, 상동성 재조합은 표적화된 유전자에 측접하는 영역들을 표적화할 것이다.
전술한 방법들을 사용하여 유전자 총 형질 전환법에 의해 모든 구조물들을 세포에 도입하였는데 즉, 구조물을 선형화한 다음 세포에 발사하였다. 수크로스 함유 평판/배지에서 형질 전환체를 선택하였으며, 지질 프로필 변화는 전술한 방법을 사용하여 분석하였다. 3개의 표적화 구조물 각각으로부터 유래하는 관련 서열들을 이하에 나열하였다:
설 명
서열 번호
표적 구조물 유래 d12FAD의 암호화 영역 유래 5' 서열 서열 번호 72
표적 구조물 유래 d12FAD의 암호화 영역 유래 3' 서열 서열 번호 73
d12FAD 표적화 구조물cDNA 서열 서열 번호 74
SAD2A의 암호화 영역 유래 5' 서열 서열 번호 75
SAD2A의 암호화 영역 유래 3' 서열 서열 번호 76
SAD2A 표적화 구조물cDNA 서열 서열 번호 77
SAD2B의 암호화 영역 유래 5' 서열 서열 번호 78
SAD2B의 암호화 영역 유래 3' 서열 서열 번호 79
SAD2B 표적화 구조물 cDNA 서열 서열 번호 80
구조물 각각으로 형질 전환하여 얻은, 대표적인 양성 클론들을 골라낸 다음, 이 클론들에 대한 지질 프로필을 측정하여(면적%로 표시) 하기 표 33에 요약하였다.
구조물 각각은 지방산의 원하는 군에 측정 가능한 정도의 영향을 미쳤으며, 3가지 경우 모두에 있어서, 특히 2개의 SAD가 녹아웃되었을 때 C18:0 수준은 눈에 띄게 증가하였다. SAD 녹아웃으로 인하여 생산된 클론들 다수 개를 추가로 비교한 결과, SDA2B 녹아웃 계열들은 C18:1 지방산 수준이, SAD2A 녹아웃 계열들에서 관찰되는 C18:1 지방산 수준보다 상당히 많이 감소되었음이 확인되었다.
부가의 Δ12 지방산 불포화 효소(FAD) 녹아웃은, 전술한 방법을 사용하였을 때 프로토테카 모리포르미스 배경에서 나타났다. Δ12FAD의 잠재적인 상동성을 확인하기 위해서 추정 FAD를 암호화하는 게놈 영역을 증폭시키기 위한, 다음과 같은 프라이머들을 사용하였다.
프라이머 1 5'-TCACTTCATGCCGGCGGTCC-3' 서열 번호 101
프라이머 2 5'- GCGCTCCTGCTTGGCTCGAA-3' 서열 번호 102
프로토테카 모리포르미스 게놈 DNA를, 상기 프라이머들을 사용하여 게놈 증폭 생성한 서열들은 매우 유사하였는데, 이는 프로토테카 내에 Δ12FAD의 유전자 또는 대립 유전자 다수 개가 존재함을 암시하는 것이었다.
이와 같은 결과를 바탕으로 하여, 1개 이상의 Δ12FAD 유전자를 불활성화하고자 하는 2개의 유전자 중단 구조물을 설계하였다. 이때 사용된 기법은, 통상의 유전자 치환 기법이 아니고, 수크로스 인버타제(에스.세레비지아에 유래 suc2) 카세트(선택가능한 마커로서 수크로스를 가수 분해하는 능력 부여)를 고도로 보존된 암호화 영역에 삽입하는 기법이었다. 제1 구조물(pSZ1124로 명명)은 에스.세레비지아에 suc2 유전자와 클로렐라 불가리스 질산염 환원 효소 3'UTR(에스.세레비지아에 suc2 카세트)을 발현하는, 씨.레인하르드티 β-튜불린 프로모터 측접 5' 및 3'게놈표적화 서열을 함유하였다. 제2 구조물(pSZ1125로 명명)은 에스.세레비지아에 suc2 유전자와 클로렐라 불가리스 질산염 환원 효소 3'UTR을 발현하는, 씨.레인하르드티 β-튜불린 프로모터 측접 5' 및 2' 게놈 표적화 서열들을 함유하였다. 이 구조물의 관련 서열을 서열 목록에 나열하였다.
pSZ1124 (FAD2B) 5' 게놈 표적화 서열 서열 번호 103
pSZ1124 (FAD2B) 3' 게놈 표적화 서열 서열 번호 104
에스.세레비지아에 suc2 카세트 서열 번호 105
pSZ1125 (FAD2C) 5' 게놈 표적화 서열 서열 번호 106
pSZ1125 (FAD2C) 3' 게놈 표적화 서열 서열 번호 107
pSZ1124 및 pSZ1125를 각각 프로토테카 모리포르미스 배경에 도입하고, 수크로스를 가수 분해하는 능력을 바탕으로 양성 클론을 선택하였다. 표 34는 pSZ1124 및 pSZ1125 표적화 벡터를 이용한 유전자 이식 계열 2개의 지질 프로필(면적%, 전술한 방법을 사용하여 구함)을 요약한 것이다.
FAD2B(pSZ1124) 구조물을 함유하는 유전자 이식체는 지질 프로필(C18:2 수준)에 있어서 매우 이색적이면서 예상 외의 결과를 보였는데, 즉, 상기 C18:2 수준은 감소하되, 단지 약 1 면적%까지만 감소하는 것으로 예상되었다. 그러나, C18:1 지방산 수준은, 거의 배타적으로 C16:0 수준을 상당히 낮춰가면서 상당히 증가하였다. FAD2C(pSZ1125) 구조물을 함유하는 유전자 이식체는 또한 지질 프로필도 변화하였는데; C18:2의 수준은, C18:1 수준이 증가하였던 것과는 달리, 상당히 감소하였다.
소
우지
모의체
전술한 바와 같은 SAD2B 녹아웃 실험으로부터 생산된 하나의 양성 클론으로서, C14-선호 지방 아실-ACP 티오에스테라제 유전자를 추가로 도입하기 위한 배경으로 사용될 클론을 선택하였다. 씨.캠포라 C14 선호 티오에스테라제를 도입하는데 사용되는 구조물은, 6S 게놈 영역에 대한 표적화 서열(상동성 재조합을 통해 형질 전환 DNA를 표적 통합할 수 있음)을 함유하였으며, 발현 구조물은, neoR 유전자를 발현하는 씨.레인하르드티 β-튜불린 프로모터와 클로렐라 불가리스 질산염 환원 효소 3'UTR, 그리고 이것들 다음에는 코돈 최적화 씨.캠포라 티오에스테라제를 발현하는 제2 씨.레인하르드티 β-튜불린 프로모터와 클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드(제2 클로렐라 불가리스 질산염 환원 효소 3'UTR 함유)를 함유하였다. 5'6S 게놈 공여 서열은 서열 번호 82에 나열하였고; 3'6S 게놈 공여 서열은 서열 번호 84에 나열하였으며; 씨.캠포라 티오에스테라제와 관련된 발현 구조물은 서열 번호 83에 나열하였다.
전술한 바와 같은 유전자 총 방법을 사용하여 형질 전환을 수행하였으며, 이때, 세포를 2% 수크로스 함유 평판 상에서 24시간 동안 회수하였다. 이 시간이 경과한 후, 세포를 재현탁하고 나서, 2% 수크로스와 50㎍/㎖ G418(선택용)을 함유하는 평판 상에 재도말하였다. 생산된 양성 클론들 중 9개의 클론들을 지질 생산 및 지질 프로필 분석용으로 선택하였다. 9개의 유전자 이식 클론(SAD2B KO를 함유하며, 씨.캠포라 C14 선호 티오에스테라제를 발현함)을 전술한 바와 같이 배양한 다음, 지질 프로필에 대해 분석하였다. 그 결과들은 하기 표 35에 요약되어 있다. 우지에 대한 지질 프로필도 이하 표 35에 제시하였다(National Research Council 1976: Fat Content and Composition of Animal Product).
상기 표 35에서 살펴볼 수 있는 바와 같이, 유전자 이식 계열의 지질 프로필은 우지의 지질 프로필과 매우 유사하였다. 종합하여 보면, 상기 데이터는 특이적 유전자 이식 배경을, (이와 같은 경우에는 SAD2B 녹아웃) C14 선호 티오에스테라제(씨.캠포라 유래)와 통합하여, 우지의 지질 프로필과 유사한 지질 프로필을 나타내는 오일을 생산하는 유전자 이식 조류 균주를 생산하는 것의 이점을 입증하였다.
B.
프로토테카
세포 내 델타 12 불포화 효소 유전자(
FADc
)의 하향 조절에 대한 RNAi 접근법
RNAi에 의해 FADc 유전자(델타 12 불포화 효소 유전자) 발현을 하향 조절하는 벡터를 프로토테카 모리포르미스 UTEX 1435 유전적 배경에 도입하였다. 사카로마이세스 세레비지아에 suc2 수크로스 인버타제 유전자를 선택가능한 마커(유일한 탄소원으로서 수크로스를 사용하여 생육할 수 있는 능력을 양성 클론에 부여)로서 사용하였다. 제1 유형의 구조물은, 자체의 제1 인트론에 대해 cis 배열로 결합된 FADc 암호화 영역의 제1 엑손의 일부와, 이것의 다음에 존재하는 제1 엑손의 역방향 반복 단위를 이용하였다. 이와 같은 유형의 구조물은 통상적으로 mRNA로서 발현될 때 이론상 헤어핀 RNA로 형성되었다. 상기 제1 유형의 구조물 2개를 제조하였는데, 이것들 중 하나는 프로토테카 모리포르미스 Amt03 프로모터(서열 번호 89)(pSZ1468로 명명)에 의해 작동되었으며, 제2 구조물은 클라미도모나스 레인하르드티 β-튜불린 프로모터(서열 번호 114)(pSZ1469로 명명)에 의해 작동되었다. 제2 유형의 구조물은, 프로토테카 모리포르미스 Amt03 프로모터(서열 번호 89)(pSZ1470으로 명명)에 의해 작동되거나, 또는 클라미도모나스 레인하르드티 β-튜불린 프로모터(서열 번호 114)(pSZ1471로 명명)에 의해 작동되는, 크기가 큰 FADc 엑손 2(안티센스 배향)를 이용하였다. 4개의 구조물 모두는, 6S 게놈 영역에 대해 상동성인 에스.세레비지아에 suc2 수크로스 인버타제 카세트(서열 번호 159) 및 5'(서열 번호 82) 및 3'(서열 번호 84) 재조합 표적화 서열(구조물에 측접)(핵내 게놈으로의 통합에 사용)을 가졌다. 각 구조물의 관련 부분들과 함께 각 RNAi 구조물의 FADc 부분들의 서열을 다음과 같이 서열 목록으로 나열하였다.
설 명
서열 번호
pSZ1468 FADc RNAi 헤어핀 카세트 서열 번호 163
pSZ1468 구조물의 관련 부분 서열 번호 164
pSZ1469 FADc RNAi 헤어핀 카세트 서열 번호 165
pSZ1469 구조물의 관련 부분 서열 번호 166
pSZ1470 FADc 엑손 2 RNAi 카세트 서열 번호 167
pSZ1470 구조물의 관련 부분 서열 번호 168
pSZ1471 FADc 엑손 2 RNAi 카세트 서열 번호 169
pSZ1471 구조물의 관련 부분 서열 번호 170
4개의 구조물 각각을 프로토테카 모리포르미스 배경에 도입하여 이를 형질 전환하고, 유일한 탄소원으로서 수크로스를 함유하는 평판을 사용하여 양성 클론들을 스크리닝하였다. 각각의 형질 전환체로부터 양성 클론들을 골라낸 다음, 이것들의 하위 세트를 선택하여, pSZ1468, pSZ1469, pSZ1470 및 pSZ1471에 함유된 안티센스 카세트와 헤어핀 구조의 지방산 프로필에 대한 영향력을 분석하였다. 각각의 형질 전환체로부터 선택된 클론들을 지질 생산 조건 하에서 생육하였으며, 이때, 전술한 바와 같이 직접 에스테르 결합 전이 방법을 사용하여 지질 프로필을 분석하였다. 형질 전환체 각각의 대표적인 지질 프로필은 하기 표 36에 요약되어 있다. 야생형 1 및 2 세포들은, 음성 대조군으로서 형질 전환체들 각각과 별도로 생육되는 비형질 전환 프로토테카 모리포르미스 세포였다.
상기 요약된 결과들을 통하여, 헤어핀 구조물인 pSZ1468 및 pSZ1469는 특이적 예상 표현형(즉, 야생형 1 및 야생형 2 각각과 비교하였을 때, C18:2 지방산 수준은 감소하였으며, C18:1 지방산 수준은 증가함)을 보였음을 알 수 있었다. 안티센스 구조물인 pSZ1470 및 pSZ1471은 C18:2 지방산 수준이 감소하지 않았으나, 그 대신, 야생형 1 및 야생형 2와 비교하였을 때 C18:2 지방산 수준은 약간 증가하였고, C16:0 지방산 수준은 약간 감소하였다.
C. 외인성
스테아로일
-
ACP
불포화 효소의 발현
올레아 유로파에아 스테아로일-ACP 불포화 효소(GenBank 수탁 번호 제AAB67840.1호)를 프로토테카 모리포르미스 UTEX1435 유전적 배경에 도입하였다. 발현 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 함유하였는데, 이 재조합 표적화 사슬은 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합에 사용되었다. 이와 같은 에스.세레비지아에 suc2 발현 카세트를 서열 번호 159로서 나열하였으며, 이를 선택 마커로 사용하였다. 올레아 유로파에아 스테아로일-ACP 불포화 효소 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었으며, 천연 운반 펩티드는 클로렐라 프로토테코이데스 스테아로일-ACP 불포화 효소 운반 펩티드(서열 번호 49)로 치환되었다. 코돈 최적화된 cDNA 서열과 아미노산 서열(운반 펩티드가 치환됨)을 서열 목록 중 서열 번호 171 및 서열 번호 172로 각각 나열하였다. 전체 오.유로파에아 SAD 발현 카세트를 pSZ1377이라 명명하고, 이를 프로토테카 모리포르미스 유전적 배경에 도입하여 이 균주를 형질 전환하였다. 양성 클론을, 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 스크리닝하였다. 양성 클론들의 하위 세트를 선택하여, 지질 생산 조건 하에서 생육하였으며, 이때, 지질 프로필은 전술한 바와 같은 직접 에스테르 결합 전이 방법을 통하여 분석하였다. 선택된 클론들의 지질 프로필은 하기 표 37에 요약되어 있다.
상기 요약된 결과들은, 이종 불포화 효소(이 경우에는 올레아 유로파에아 유래 스테아로일-ACP 불포화 효소)를 도입하면 C18:1 지방산 수준은 증가할 수 있으며, 아울러 C18:0 및 C16:0 지방산 수준은 감소할 수 있음을 입증하는 것이다.
실시예
7:
하이드록실화된
지방산을 생산하기 위한
프로토테카
조작
리시누스 커뮤니스 올리에이트 12-하이드록실라제(Rc12hydro)(GenBank 수탁 번호 제AAC49010.1호)를 프로토테카 모리포르미스 UTEX1435 유전적 배경에 도입하였다. 발현 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접)을 함유하였는데, 이 재조합 표적화 서열은 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합에 사용되었다. 이와 같은 에스.세레비지아에 suc2 발현 카세트를 서열 번호 159에 나열하였으며, 이를 선택 마커로 사용하였다. 리시누스 커뮤니스 올리에이트 12-하이드록실라제 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 코돈 최적화 cDNA 서열 및 아미노산 서열을 각각 서열 목록 중 서열 번호 173 및 서열 번호 174에 나열하였다. 전체 Rc12hydro 발현 카세트는 pSZ1419로 명명하였으며, 이를 프로토테카 모리포르미스 유전적 배경에 도입하여 이 균주를 형질 전환하였다. 양성 클론을 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 스크리닝하였다. 이와 같은 양성 클론 하위 세트를 선택하고 나서, 지질 생산 조건 하에 생육하여, 알.커뮤니스 올리에이트 12-하이드록실라제 생성물, 즉 리시놀레산에 대해 스크리닝하였다(GC/MS법 사용).
양성 Rc12hydro 유전자 이식체 내에서 생산되는 임의의 리시놀레산을 검출하는데 사용되는 GC/MS법은 다음과 같았다. 양성 클론 및 야생형 대조군 샘플을 건조한 다음, 이를 메탄올-톨루엔 중 4.5 H2SO4 2.2㎖(10:1(v/v)) 중에 현탁하였다. 이후, 이 혼합물을 70℃ 내지 75℃에서 3.5시간 동안 가열하였는데, 이때 중간 중간 초음파 처리 및 와류 처리를 해 주었다. 실온으로 냉각한 다음, 여기에 6% K2CO3(aq) 2㎖ 및 헵탄 2㎖를 첨가한 다음, 이 혼합물을 격렬하게 와류시킨 후, 층들을 원심 분리(900rpm, 2분)에 의해 급속하게 분리하였다. 상층을 분리하고 나서 농축하여 건조하였다(질소 기류 이용). 생성된 오일에 무수 피리딘 500㎕와 BSTFA/1% TMCS(서모 사이언티픽(Thermo Scientific)) 500㎕를 첨가하였다. 생성된 용액을 70℃ 내지 75℃에서 1.5시간 동안 가열한 후, 농축하여 건조하였다(질소 기류 이용). 그 다음, 잔류물을 헵탄 2㎖ 중에 재현탁하고 나서, 다시 농축하였다. 샘플을 취하여 헵탄 2㎖중에 재현탁한 다음, 서모 트레이스 GC 울트라/DSQII 시스템(Thermo Trace GC Ultra/DSQII system) 상에서 GC/MS에 의해 분석하였다(EI 모드, 리시놀레산 메틸의 TMS 베이스 피크(m/z 187)의 선택적 이온 모니터링법 사용). 지방산 메틸 에스테르를 레스텍 Rxi-5Sil MS 컬럼(Restek Rxi-5Sil MS column)(0.25㎜ ID, 길이 30m 및 필름 두께 0.5㎛) 상에서 분리하였다(캐리어 가스로서 헬륨 사용, 유속 = 1㎖/분). 컬럼의 초기 온도는 4분 동안 130℃로 유지시켰으며, 이후 램프를 사용하여 4℃/분의 속도로 가열하여 최종 온도를 240℃로 만들었다. 샘플 중 리시놀레산의 존재 여부는, 전술한 바와 같이, 정체 시간과 전 스캔 질량 스펙트럼을, 처리된 리시놀레산의 진정한 샘플의 것과 비교함으로써 확인하였다. 도 2는 대표적인 양성 유전자 이식 클론의 GC 정체 시간을, 리시놀레산 표준과 야생형 대조군의 GC 정체 시간과 비교한 결과를 보여주는 것이다. 양성 유전자 이식 클론은 RT:33.22/33.23에서 유도성 피크(리시놀레산 표준에 있어서 유사한 피크와 상응함)를 나타냈는데, 이는 곧, 유전자 이식 클론과 양성 대조군 두가지에 유도성 리시놀레산이 존재한다는 것을 암시한다. 이 피크는 야생형 대조군 샘플에서는 전혀 나타나지 않았다.
실시예
8: 대안적 선택가능한
마커를
사용한
프로토테카
조작
A.
프로토테카
모리포르미스
내 분비 가능한 α-
갈락토시다제의
발현
프로토테카 종 내에서 이종 수크로스 인버타제 유전자를 발현하는 방법과 발현에 따른 효과에 대해서는 이미, 본원에 참조로 포함된 PCT 특허 출원 PCT/US2009/66142에 기술되어 있다. 본 실시예에서는 기타 다른 이종 다당류 분해 효소의 발현을 관찰하였다. MEL1 유전자(사카로마이세스 칼베르겐시스 유래; NCBI 수탁 번호 제P04824호의 서열에 상응하는 아미노산 서열), AglC 유전자(아스퍼질러스 나이저 유래; NCBI 수탁 번호 제Q9UUZ4호의 서열에 상응하는 아미노산 서열), 그리고 고등 식물인 시아몹시스 테트라고노로바(구아 콩) 유래 α-갈락토시다제(NCBI 수탁 번호 제P14749호의 서열에 상응하는 아미노산 서열)와 같은 α-갈락토시다제 암호화 외인성 유전자들 중 하나를 가지는 프로토테카 모리포르미스 UTEX 1435가 멜리비오스(α-D-gal-glu)를 바탕으로 생육할 수 있는 능력을 테스트하였다. 상기 수탁 번호들을 가지는 서열들과 이에 상응하는 아미노산 서열은 본원에 참조로 포함된 것이다. 모든 경우에 있어서, 프로토테카 모리포르미스 내 선호 코돈 사용 빈도에 따라서 유전자를 최적화하였다. 발현 카세트의 관련 부분들을 서열 목록 번호들과 함께 이하에 나열하였다. 모든 발현 카세트들은 안정적인 게놈 통합을 위한 5' 및 3'Clp 상동성 재조합 표적화 서열, 즉 클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR을 사용하였다.
에스.칼베르겐시스 MEL1 아미노산 서열 서열 번호108
에스.칼베르겐시스 MEL1 아미노산 서열 신호 펩티드 서열 번호 109
에스.칼베르겐시스 MEL1 형질 전환 카세트 서열 번호 110
에스.칼베르겐시스 MEL1 서열(최적화된 코돈) 서열 번호 111
5' Clp 상동성 재조합 표적화 서열 서열 번호 112
3' Clp 상동성 재조합 표적화 서열 서열 번호 113
클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR 서열 번호 114
클로렐라 불가리스 질산염 환원 효소 3'UTR 서열 번호 115
에이.나이저 AlgC 아미노산 서열 서열 번호 116
에이.나이저 AlgC 아미노산 서열 신호 펩티드 서열 번호 117
에이.나이저 AlgC 서열(최적화된 코돈) 서열 번호 118
에이.나이저 AlgC 형질 전환 카세트 서열 번호 119
씨.테트라고노볼라 α-갈락토시다제 아미노산 서열 서열 번호 120
씨.테트라고노볼라 α-갈락토시다제 서열(최적화된 코돈)서열 번호 121
씨.테트라고노볼라 α-갈락토시다제 형질 전환 카세트 서열 번호 122
프로토테카 모리포르미스 세포를, 에스.칼베르겐시스 MEL1 , 에이.나이저 AlgC 또는 씨.테트라고노볼라 α-갈락토시다제 유전자를 함유하는 발현 카세트 3개 각각으로 형질 전환하였다(상기 실시예 2에 기술된 바와 같은, 유전자 총 형질 전환법 이용). 유일한 탄소원으로서 2% 멜리비오스를 함유하는 평판을 사용하여 양성 클론을 스크리닝하였다. 씨.테트라고노볼라 발현 카세트 형질 전환체를 함유하는 콜로니들은 평판 상에 출현하지 않았다. 양성 클론을, 에스.칼베르겐시스 MEL1 형질 전환체와 에이.나이저 AlgC 형질 전환체를 함유하는 평판으로부터 골라냈다. 형질 전환 DNA의 통합 여부는 씨.불가리스 3'UTR 및 3'Clp 상동성 재조합 표적화 서열의 일부를 표적화하는 프라이머를 사용하는 PCR을 통해 확인하였다.
5'프라이머 씨.불가리스 3'UTR:하류 Clp 서열(서열 번호 123)
ACTGCAATGCTGATGCACGGGA
3'프라이머 씨.불가리스 3'UTR:하류 Clp 서열(서열 번호 124)
TCCAGGTCCTTTTCGCACT
음성 대조군으로서, 형질 전환되지 않은 프로토테카 모리포르미스 세포 유래 게놈 DNA도 상기 프라이머 세트를 사용하여 증폭하였다. 야생형 세포로부터 유래하는 게놈 DNA로부터는 그 어떤 생성물도 증폭되지 않았다.
에스.칼베르겐시스 MEL1 형질 전환체와 에이.나이저 AlgC 형질 전환체 각각으로부터 유래하는 몇 개의 양성 클론들(PCR로 확인)을 대상으로, 지질 배지 중 유일한 탄소원으로서 멜리비오스 상에서 생육할 수 있는 능력에 대해 테스트하였다. 이와 같이 선택된 클론들을 상기 실시예 1에 기술된 기본 배지(유일한 탄소원으로서 멜리비오스 포함)와 조건 하에서 3일 동안 생육하였다. α-갈락토시다제 암호화 유전자들 중 어느 하나를 함유하는 클론들은 모두 이 시기 동안 튼튼하게 생육되었던 반면에, 사카로마이세스 세레비지아에 SUC2 수크로스 인버타제를 발현하는 프로토테카 모리포르미스와 형질 전환되지 않은 야생형 균주는 둘 다 멜리비오스 배지 상에서는 잘 자라지 못했다. 이러한 결과들은, α-갈락토시다제 암호화 유전자가 형질 전환에 있어서 선택가능한 마커로서 사용될 수 있음을 암시하는 것이다. 또한, 이 데이터들은 에스.칼베르겐시스 MEL1 (서열 번호 109) 또는 에이.나이저 AlgC (서열 번호 117) 내에 존재하는 천연 신호 펩티드가 단백질을 프로토테카 모리포르미스 세포 내 주변 세포질에 표적화하는데 유용함을 암시하는 것이다.
B.
프로토테카
내
THIC
유전자
상보체
티아민 영양
요구성
외인성 THIC 유전자의 발현을 이용하여 프로토테카 모리포르미스 세포 내 티아민 원 영양성을 관찰하였다. 식물과 조류 내 티아민 생합성은 통상적으로 색소체 내에서 수행되므로, 단백질 생산에 관여하는 대부분의 핵내 암호화 단백질은 색소체에 효율적으로 표적화되어야 할 것이다. 프로토테카 모리포르미스 세포의 DNA 서열 결정 및 전사체 서열 결정 결과, 티아민 생합성 효소를 암호화하는 유전자 모두(THIC 제외)는 게놈 내에 존재한다는 것이 규명되었다. 생화학적 수준으로 티아민 영양 요구성에 관여하는 병터를 나누기 위해서, (1) 2μM 티아민 하이드로클로라이드의 존재; (2) 티아민 부재; (3) 티아민은 존재하지 않되, 2μM 하이드록시에틸 티아졸(THZ)은 존재; (4) 티아민은 존재하지 않되, 2μM 2-메틸-4-아미노-5-(아미노메틸)피리미딘(PYR)은 존재; 그리고 (5) 티아민은 존재하지 않되, 2μM THZ 및 2μM PYR은 존재와 같은 5개의 상이한 조건 하에서의 프로토테카 모리포르미스 세포의 생장을 관찰하였다. 상기와 같은 5개의 상이한 조건 하에서 생육 실험을 수행한 결과들은, 프로토테카 모리포르미스 세포가 새로운 방식의 합성을 수행할 수 있지만, 만일 PYR 전구체가 제공되면 오로지 티아민 피로포스페이트(TPP)만을 생산할 수 있음을 암시한다. 이와 같은 결과는 프로토테카 모리포르미스의 티아민 영양 요구성은, (THIC 효소에 의해 촉매화되는 전환 과정인) 아미노이미다졸 리보뉴클레오티드로부터 하이드록시메틸피리미딘 포스페이트(HMP-P)로의 합성 과정을 진행시킬 수 없기 때문에 발생하는 것이라는 가설과 일치한다.
상기 실시예 2에 기술된 유전자 총 형질 전환법을 통하여, 선택 마커로서 코코믹사 C-169 THIC(JGI 단백질 ID 30481에 상응하는 아미노산 서열로서 본원에는 참조로 포함됨) 및 에스.세레비지아에 SUC2 수크로스 인버타제를 발현하는, 프로토테카 모리포르미스 세포를 형질 전환하였다. 상기 발현 구조물은 코코믹사 C-169 THIC 유래 천연 운반 펩티드 서열, 게놈 DNA의 6S 영역에 상동성인 상류 및 하류 재조합 표적화 서열, 씨.레인하르드티 TUB2 프로모터/5'UTR 영역(서열 번호 104) 및 클로렐라 불가리스 질산염 환원 효소 3'UTR(서열 번호 115)을 함유하였다. 상기 에스.세레비지아에 SUC2 발현은 또한 씨.레인하르드티 TUB2 프로모터/5'UTR 영역(서열 번호 114)에 의해 작동되었으며, 클로렐라 불가리스 질산염 환원 효소 3'UTR(서열 번호 115)을 함유하였다. 유전자는 프로토테카 모리포르미스 내 선호 코돈 사용 빈도에 따라서 최적화하였다. 관련 발현 카세트 서열을 이하 서열 목록에 상세히 나열하였다:
코코믹사 C-169 THIC 아미노산 서열 서열 번호 125
코코믹사 C-169 THIC 아미노산 서열 천연 운반 펩티드 서열 번호 126
코코믹사 C-169 THIC 형질 전환 카세트 서열 번호 127
코코믹사 C-169 THIC 서열(최적화된 코돈) 서열 번호 128
에스.세레비지아에 SUC2 서열(최적화된 코돈) 서열 번호 129
5'6S 상동성 재조합 표적화 서열 서열 번호 82
3'6S 상동성 재조합 표적화 서열 서열 번호 84
양성 클론은, 티아민을 함유하지 않고 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 선택되었다. 양성 클론은, 코코믹사 C-169 THIC 유전자 내에서 결합하는 5'프라이머와, 6S 위치 내 형질 전환 DNA의 하류에 어닐링되는 3'프라이머를 사용하는 PCR로써 확인되었다. PCR로 확인된 양성 클론은 또한, 서던 블럿 검정법을 사용하여 확인되기도 하였다.
야생형 프로토테카 모리포르미스 세포의 티아민 영양 요구성을 관찰하기 위하여는 우선, 내부 티아민 보존 세포를 고갈시켜야 했다. 티아민을 함유하지 않는 배지 중에서의 생장을 테스트하기 위해서 우선, 세포를 2μM 티아민을 함유하는 배지 중 고정 상에서 생육한 다음, 이 세포를 티아민 불포함 배지 중 750㎚에서의 광학 밀도(OD750)가 약 0.05가 되도록 희석하였다. 그 다음, 희석된 세포들을 티아민 불포함 배지 중 고정 상에서 다시 생육하였다(약 2일 내지 3일). 이와 같은 티아민 결핍 세포를, 티아민을 함유하지 않는 배지 중 생장 연구를 위해 배양액에 접종하였다. 야생형 세포를, 탄소원으로서 글루코스를 함유하는(또한 티아민을 함유하거나 함유하지 않는) 배지 중에서 생육한 다음, 천연 운반 펩티드 코코믹사 C-169 THIC 구조물을 포함하는 양성 클론을 유일한 탄소원으로서 수크로스를 함유하는 배지 중에서 생육하였다. 생장은 750㎚에서의 흡광도를 모니터링함으로써 측정하였다. 생장 실험의 결과를 통하여, 티아민 불포함 배지 중 야생형 세포의 생장과 비교하였을 때 티아민 불포함 배지 중 이식 유전자를 발현하는 균주의 생장이 훨씬 컸음을 알 수 있었다. 그러나, 형질 전환체의 세포 생장 속도와 세포 밀도는 티아민 함유 배지 중 야생형 세포의 생장 속도와 세포 밀도에 못미쳤다. 또한, 티아민 불포함 배지 중 형질 전환체 클론의 생장량과, 통합된 코코믹사 효소의 복사체 수 간에는 강한 상관 관계가 있었다(즉, 티아민 불포함 배지 중 이식 유전자의 복사체 수는 더욱 많았으며, 이 배지 중에서 세포는 더욱 잘 생장하였다).
코코믹사 THIC, 아라비돕시스 탈리아나 THIC 유전자, 그리고 시네코시스티스 종 PCC 6803 thiC 유전자를 함유하는 발현 구조물을 사용하여 부가의 형질 전환체를 제조하였다. 코코믹사 및 에이.탈리아나 THIC 유전자의 경우, 천연 운반 펩티드 서열은 클로렐라 프로토테코이데스 스테아로일-ACP 불포화 효소(SAD) 유전자 유래 운반 펩티드 서열과 치환되었다. 시네코시스티스 종은 시아노박테리아이며, thiC 단백질은 천연 운반 펩티드 서열을 함유하지 않는다. 시네코시스티스 종 thiC 구조물에 있어서, 클로렐라 프로토테코이데스 SAD 유전자 유래 운반 펩티드 서열을 시네코시스티스 종 thiC의 N-말단에 융합하였다. 모든 경우에 있어서, 서열들은 프로토테카 모리포르미스 내 발현에 대해 최적화된 코돈이었다. 상기 구조물들 3개는 모두 게놈의 6S 영역에 상동성인 상류 및 하류 재조합 표적화 서열(서열 번호 82 및 84), 클로렐라 프로테코이데스 액틴 프로모터/5'UTR, 그리고 클로렐라 프로토테코이데스 EF1A 유전자 3'UTR을 함유하였다. 3개의 구조물은 모두 씨.레인하르드티 TUB2 프로모터/5'UTR(서열 번호 114)에 의해 작동되는 neoR 유전자를 함유하였으며, 또한 G418에 의해 선택되도록 하는 씨.불가리스 3'UTR(서열 번호 115)을 함유하였다. 에이.탈리아나 THIC의 아미노산 서열은 NCBI 수탁 번호 제NP_180524호에 해당하고, 시네코시스티스 종 thiC의 아미노산 서열은 NCBI 수탁 번호 제NP_442586호에 해당하며, 이들 서열은 둘 다 본원에 참조로 포함된 것이다. 관련된 발현 카세트 서열은 이하 서열 목록에 상세히 나열하였다:
씨.프로토테코이데스 운반 펩티드 함유 코코믹사 THIC 발현 구조물
서열 번호 130
씨.프로토테코이데스 운반 펩티드 함유 코코믹사 THIC 서열 번호 131
씨.프로토테코이데스 액틴 프로모터 /5'UTR 서열 번호 132
씨.프로토테코이데스 EF1A 3'UTR 서열 번호 133
에이.탈리아나 THIC 발현 구조물 서열 번호 134
씨.프로토테코이데스 운반 펩티드 함유 에이.탈리아나 THIC 서열 번호 135
천연 운반 펩티드 함유 에이.탈리아나 THIC 아미노산 서열 서열 번호136
시네코시스티스 종 thiC 발현 구조물 서열 번호 137
씨.프로토테코이데스 운반 펩티드 함유 시네코시스티스 종 thiC
서열 번호 138
시네코시스티스 종 thiC 아미노산 서열 서열 번호 139
neoR 유전자 서열 번호 140
양성 클론을, G418을 함유하는 평판 상에서 스크리닝하였으며, 각각의 형질 전환으로부터 유래하는 몇몇 클론들을 골라내어 PCR로 확인하였다. 코코믹사 C-169(씨.프로토테코이데스 운반 펩티드 함유), 에이.탈리아나 및 시네코시스티스 종 PCC 6803 THIC 유전자를 함유하는 형질 전환 DNA 구조물을 각각 게놈의 6S 위치에 통합한 결과는, 다음과 같은 프라이머들을 사용하는 PCR 분석법을 통하여 확인되었다.
5'THIC 코코믹사 확인 프라이머 서열(서열 번호 141)
ACGTCGCGACCCATGCTTCC
3'THIC 확인 프라이머 서열(서열 번호 142)
GGGTGATCGCCTACAAGA
5'THIC 에이.탈리아나 확인 프라이머 서열(서열 번호 143)
GCGTCATCGCCTACAAGA
5'thiC 시네코시스티스 종 확인 프라이머 서열(서열 번호 144)
CGATGCTGTGCTACGTGA
G418 함유 배지 중 상이한 구조물 각각의 형질 전환체로부터 선택 확인된 양성 클론을 사용하여, (전술한 바와 같이) 티아민 결핍 세포를 대상으로 하는 생장 실험을 수행하였다. 모든 형질 전환체는 티아민 불포함 배지 중에서 (다양한 견고성 정도로) 생육할 수 있었다. 티아민 불포함 배지 중 형질 전환체의 생장과 티아민 함유 배지 중 야생형 세포의 생장을 비교한 결과, 티아민 불포함 배지 중 생장을 지속할 수 있는 능력에 있어서, (1) 에이.탈리아나 형질 전환체; (2) 코코믹사 C-169(씨.프로토테코이데스 운반 펩티드 함유) 형질 전환체; 및 (3) 시네코시스티스 종 형질 전환체와 같은 순위가 매겨졌다. 이와 같은 결과들은, 에이.탈리아나 THIC 복사체 하나는 프로토테카 모리포르미스 세포 내 티아민 영양 요구성을 보완할 수 있었으며, 코코믹사 C-169(천연 운반 펩티드 서열 또는 씨.프로토테코이데스 유래 운반 펩티드 서열 중 어느 하나를 포함) 복사체 다수 개와 시네코시스티스 종 THIC 는 티아민 부재 하에 신속하게 생장할 수 있어야 함을 암시하는 것이다. 상이한 공급원으로부터 유래하는 상이한 THIC로 인한 결과가 다양하였으므로, 임의의 특정 THIC 유전자가 프로토테카 종 내에 존재하는 병터를 완전히 보완할 수 있는 능력은 예측 불가능하였다.
3개의 THIC 아미노산 서열의 정렬을 수행하였다. 시네코시스티스 종 유래 thiC와, 코코믹사 및 에이.탈리아나 유래 THIC 간 서열 보존 수준은 유의적이었던 반면에(아미노산 수준에서 41% 동일), 시아노박테리아 단백질에는 조류 및 식물 단백질에 잘 보존되어 있는, N-말단 존재 도메인이 존재하지 않았다. 도메인이 존재하지 않음에도 불구하고(그리고 이로 인하여 구조상에도 차이가 있을 수 있음에도 불구하고), 시네코시스티스 종 thiC 를 발현하는 구조물은 프로토테카 모리포르미스 세포 내 티아민 원 영양성을 최소한 부분적으로나마 복구할 수 있었다.
실시예
9: 연료 생산
A.
익스펠러
프레스 및 프레스 보조 장치를 사용한 미세 조류로부터 오일의 추출
DCW를 기준으로 38%의 오일을 함유하는 미세 조류 바이오매스는 드럼 건조기를 사용하여 건조시켜 수분 함량이 5% 내지 5.5%가 되게 하였다. 상기 바이오매스는 프렌치 L250 프레스에 공급하였다. 30.4kg(67lbs.)의 바이오매스를 프레스를 통해 공급하고 오일은 회수하지 않았다. 프레스 보조기로서 다양한 백분율의 스위치그래스와 조합된 동일한 건조된 미세 조류 바이오매스를 프레스를 통해 공급하였다. 건조된 미생물 바이오매스와 20% w/w의 스위치그래스의 조합으로 최상의 총 백분율의 오일을 회수하였다. 이어서 프레스된 케이크는 헥산 추출을 거치고 20% 스위치그래스 조건에 대한 최종 수율은 총 이용가능한 오일(중량으로 계산함)의 61.6%이었다. 상기 50% 이상의 오일 건조 세포 중량을 갖는 바이오매스는 오일을 유리시키기 위해 스위치그래스와 같은 프레싱 보조기의 사용을 필요로 하지 않는다. 익스펠러 프레스를 사용하여 미세 조류로부터 오일을 추출하는 기타 다른 방법은 본원에 참조로 포함되어 있는 PCT 특허 출원 PCT/US2010/31108호에 기술되어 있다.
B.
프로토테카
오일로부터 바이오디젤의 생성
전술된 방법에 따라 생성된 프로토테카 모리포르미스 UTEX 1435 유래의 고무 성질이 제거된 오일을 에스테르 결합 전이를 거쳐서 지방산 메틸 에스테르를 생성하였다. 결과는 하기 표 38에 나타내어져 있다.
오일의 지질 프로필은 다음과 같다:
바이오디젤의 지질 프로필은 원료공급 오일의 지질 프로필과 매우 유사하였다. 본 발명의 방법 및 조성물에 의해 제공된 기타 다른 오일은 에스테르 결합 전이를 거쳐서 (a) C8 내지 C14 4% 이상; (b) C8 0.3% 이상; (c) ClO 2% 이상; (d) C12 2% 이상; 및 (e) C8 내지 C14 30% 이상을 포함하는 지질 프로필을 갖는 바이오디젤을 생성할 수 있다.
생성된 바이오디젤의 ASTM D6751 A1 방법에 의한 콜드 소킹 여과능은 300ml의 용적에 대해 120초였다. 이러한 시험은 16시간 동안 40℉로 냉각되고 실온으로 가온되도록 하며 스테인리스강 지지체와 함께 0.7마이크론 유리 섬유 필터를 사용하여 진공 여과하는 300ml의 B100의 여과를 포함한다. 본 발명의 오일은 에스테르 결합 전이하여 바이오디젤을 생성시킬 수 있으며, 이 때 콜드 소킹 시간은 120초 미만, 100초 미만 및 90초 미만이다.
C. 재생 디젤의 생산
전술된 방법에 따라 제조되고 본 실시예에서 바이오디젤을 제조하는데 사용되는 오일과 동일한 지질 프로필을 갖는, 프로토테카 모리포르미스 UTEX 1435 유래의 고무 성질이 제거된 오일은 에스테르 결합 전이를 거쳐서 재생 디젤을 생성하였다.
상기 오일을 먼저 수소화처리하여 산소 및 글리세롤 골격을 제거하여 n-파라핀을 생성하였다. 상기 n-파라핀은 이어서 크래킹 및 이성체화를 거쳤다. 상기 물질의 크로마토그램은 도 1에 나타내어져 있다. 상기 물질은 이어서 냉 여과를 거쳐서 C18 물질의 약 5%를 제거하였다. 냉 여과 후, 총 용적의 물질을 인화점으로 컷팅하고, 인화점, ASTM D-86 증기 분포, 혼탁점 및 점도에 대해 평가하였다. 인화점은 63℃이었고, 점도는 2.86cSt(센티스토크)이었으며; 혼탁점은 4℃이었다. ASTM D86 증류가는 표 39에 나타내어져 있다.
생성된 물질의 T10-T90은 57.9℃이었다. 본원에 개시된 오일의 수소화처리, 이성체화 및 기타 다른 공유적 변형 방법, 및 본원에 개시된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여, 본원에 개시된 방법에 따라 생성된 트리글리세라이드 오일을 사용하는 20℃, 25℃, 30℃, 35℃, 40℃, 45℃, 50℃, 60℃ 및 65℃와 같은 기타 다른 T10-T90 범위를 갖는 재생 디젤 조성물 생성할 수 있다.
생성된 물질의 TlO은 242.1℃이었다. 본원에 개시된 오일의 수소화처리, 이성체화 및 기타 다른 공유적 변형 방법, 및 본원에 개시된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여, 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 290 이상의 T10과 같은 기타 다른 T10 값을 갖는 재생 디젤 조성물을 생성할 수 있다.
생성된 물질의 T9O은 300℃이었다. 본원에 개시된 오일의 수소화처리, 이성체화 및 기타 다른 공유적 변형 방법, 및 본원에 개시된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여, 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 및 290 이상의 T90과 같은 기타 다른 T90 값을 갖는 재생 디젤 조성물을 생성할 수 있다.
생성된 물질의 FBP는 300℃이었다. 본원에 기술된 오일의 수소화처리, 이성체화 및 기타 다른 공유적 변형 방법, 및 본원에 기술된 증류 및 분별(예를 들어, 냉여과) 방법을 사용하여, 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 및 300 이상의 FBP와 같은 기타 다른 FBP 값을 갖는 재생 디젤 조성물을 생성할 수 있다.
(a) C8 내지 C14 4% 이상; (b) C8 0.3% 이상; (c) ClO 2% 이상; (d) C12 2% 이상; 및 (e) C8 내지 C14 30% 이상을 포함하는 지질 프로필을 갖는 오일을 포함하는, 본 발명의 방법 및 조성물에 의해 제공된 기타 다른 오일은 조합된 수소화처리, 이성체화 및 기타 다른 공유적 변형을 거칠 수 있다.
본 발명은 이의 특정 구체예와 관련하여 기술되었지만, 추가의 변형이 가능함이 이해될 것이다. 본원은 일반적으로 본 발명의 원리에 따르고 본 발명이 속하는 기술 분야에서 공지되거나 통상적인 실시 범위 내에 있고 이전에 제시된 필수적 특징에 적용될 수 있는 바와 같이, 본 개시 내용을 벗어나는 것을 포함하는 본 발명의 임의의 변형, 용도 또는 적용을 포함하는 것으로 의도된다.
실시예
10:
C18
:2 및
C18
:3
글리세로지질을
생산하기 위한 미생물 조작
조류 및 식물 내에서의 지질 합성은, 색소체 피루베이트 탈수소화 효소 복합체를 통해 글루코스 또는 기타 다른 탄소원을 아세틸 CoA로 전환하는 것으로 시작되었다. 그 다음, 중탄산염을 기질로서 사용하는 아세틸 CoA 카복실라제(ACCase)는 3-C 화합물, 말로닐 CoA를 생성하였다. 그 다음, b-케토아실-ACP(아실기 운반 단백질) 합성 효소 III(KAS III)은, 말로닐 CoA와 아세틸 CoA 간 제1 축합 반응을 촉진하여 4-C 화합물을 생성하였다. 연속적 2-C의 부가(C16:0를 이용함)는 KAS I에 의해 촉진되었다. 마지막으로, C18:0으로의 2-C 연장 과정은 KAS II에 의해 촉진되었다. 티오에스테라제(TE)는 아실-ACP의 연장을 종결시켰다. 가용성 효소, 스테아로일 ACP 불포화 효소(SAD)는 C18:0-ACP 기질에 대하여 활성을 가졌으며, 또한 D9 위치에 이중 결합을 형성하여 올리에이트-ACP를 생성하였다. 생성된 C18:1 지방산은 올리에이트 또는 광범위한 특이성을 가지는 TE 중 어느 하나의 작용으로 ACP로부터 유리되었다.
색소체 내 ACP로부터 일단 유리된 모든 지방산은 ER, 즉 지질(TAG) 생합성이 일어나는 곳으로 운반되었다. 포괄적으로 말하면, 고등 식물 내 ER에서 일어나는 지질 생합성 경로는 2개가 존재하는데, 이들 2개의 경로는 어느 정도 기질을 공유하는 것이 분명하다. 지방 아실 CoA 독립 경로는, 매우 선택적인 기질 특이성을 나타낼 수 있는 아실리소포스파티딜콜린 아실 트랜스퍼라제를 사용하는 포스파티딜 콜린(P-콜린) 부들 사이에 지방 아실 기들을 운반하며, 궁극적으로는 상기 지방 아실기들을 디아실글리세롤(DAG)로 운반하였다. 효소 디아실글리세롤 아실트랜스퍼라제(DGAT)는 최종 운반 과정, 즉 아실 CoA 기질 유래 지방 아실 기를, DAG를 거쳐 마지막으로 트리아실 글리세롤로 운반하는 과정을 수행하였다. 다른 한편, 지방 아실 CoA 종속 경로는, 기질로서 지방 아실 CoA를 사용하여 지방 아실기를, 각각 글리세롤 포스페이트 아실트랜스퍼라제(GPAT), 리소포스파티딘산 아실트랜스퍼라제(LPAAT) 및 DGAT의 작용을 통하여, 글리세롤-3-포스페이트, 리소포스파티딘산(LPA) 및 DAG로 운반하였다.
C18:2 및 C18:3을 포함하는 TAG를 합성하도록 미생물을 조작하는데 유용한 효소로서는 b-케토아실-ACP 합성 효소 II(KAS II), 스테아로일 ACP 불포화 효소(SAD), 티오에스테라제, 예를 들어 올리에이트 특이적 티오에스테라제, 지방산 불포화 효소(FAD), 그리고 글리세로지질 불포화 효소, 예를 들어 ω-6 지방산 불포화 효소, ω-3 지방산 불포화 효소, 또는 ω-6 올리에이트 불포화 효소를 포함한다. 상이한 효소들은 미생물 내에서 단독으로, 또는 C18:2 또는 C18:3 지방산을 증가시키거나 TAG를 생산하면서 과발현될 수 있었다. KAS II 효소 활성의 발현이 증가함에 따라서, 팔미테이트(C16:0)로부터 스테아레이트(C18:0) 쪽으로, 그리고 그 이상의 프로필을 가지는 지방산으로 탄소가 축적되었다. 몇몇 후보 KAS II 효소의 아미노산 서열을 이하 표 40에 제시하였다. 개시된 KAS II 서열은 올레 지방산, 리놀레 지방산 또는 리놀렌 지방산의 수준을 특이적으로 상승시키는 고등 식물 종으로부터 유래하였다. 당업자는 KAS II에 대한 기타 다른 유전자, 예를 들어 자트로파 컬카스 유전자(GenBank 수탁 번호 제ABJ90469.2호), 글리신 맥스 유전자(GenBank 수탁 번호 제AAW88762.1호), 엘라에이스 올레이페라 유전자(GenBank 수탁 번호 제ACQ41833.1호), 아라비돕시스 탈리아나 유전자(GenBank 수탁 번호 제AAL91174호), 비티스 비니페라 유전자(GenBank 수탁 번호 제CBI27767호) 및 고시피움 히르서텀 유전자(GenBank 수탁 번호 제ADK23940.1호)(이에 제한되는 것은 아님)를 동정할 수 있을 것이다.
예시적 KAS II 효소 | |
KAS II 효소 | 서열 번호 |
리시누스 커뮤니스 | 서열 번호 175 |
헬리안투스 아너스 | 서열 번호 176 |
브라시카 나푸스 | 서열 번호 177 |
글리신 맥스 | 서열 번호 178 |
피.모리포르미스 | 서열 번호 179 |
리놀레 지방산과 리놀렌 지방산의 수준을 높이기 위해, 증가된 수준의 스테아레이트를 올레산(C18:1)으로 전환시키는 것은, 하나 이상의 지질 경로 효소를 미생물 내에서 과발현시킴으로써 이루어질 수 있었다. 불포화물의 수준을 상승시킬 수 있는 활성을 가지는 부가 효소 2가지로서는 스테아로일 ACP 불포화 효소(SAD) 및 올리에이트 특이적 티오에스테라제가 있다. 이와 같은 효소들 중 하나 또는 둘 다의 작용을 통하여, 증가된 수준의 스테아레이트(C18:0)를 올레산으로 전환시키는 것은, 우선 리놀레 지방산과 리놀렌 지방산을 형성시킴으로써 이루어질 수 있었다.
올레산 수준을 상승시키기 위해 과발현하는데 유용한 예시적 SAD 효소의 아미노산 서열을 표 41에 제시하였다. 뿐만 아니라, 피.모리포르미스로부터 유래하는 내인성 SAD(서열 번호 180)는 또한 C18:1 수준을 증가시키는데 효율적이었다. 본원에 개시된, 올레 지방산, 리놀레 지방산 또는 리놀렌 지방산의 수준을 특이적으로 상승시키는 SAD 서열은, 고등 식물 종으로부터 유래하였다. 당업자는 SAD에 대한 기타 다른 유전자들을 동정할 수 있을 것이다.
SAD 효소 | 서열 번호 | GenBank ID 번호 |
리시누스 커뮤니스 | 서열 번호 196 | ACG59946.1 |
헬리안투스 아너스 | 서열 번호 197 | AAB65145.1 |
브라시카 준세아 | 서열 번호 198 | AAD40245.1 |
글리신 맥스 | 서열 번호 199 | ACJ39209.1 |
올레아 유로파에아 | 서열 번호 200 | AAB67840.1 |
베르니시아 포르디 | 서열 번호 201 | ADC32803.1 |
SAD 효소는 C18:0-ACP 기질에 대해 활성을 가졌으며, D9 위치에서 탄소-탄소 이중 결합을 형성하여, 올리에이트-ACP를 생성하였다. 생성된 C18:1 지방산은, 올리에이트 또는 광범위한 특이성을 가지는 TE 중 어느 하나의 작용을 통하여 ACP로부터 유리되었다. 본 발명의 발명자들은, 본원의 실시예에서 올레아 유로파에아 스테아로일-ACP 불포화 효소(수탁 번호 제AAB67840.1호; 서열 번호 172) 또는 카르타머스 팅크토리우스 ACP 티오에스테라제(수탁 번호 제AAA33019.1호; 서열 번호 195)를 과발현시켰을 경우, C18:1 지방산의 축적량이 증가되었다는 것을 보여주었다. 올레 지방산을 증가시키는데 유용한, 예시적 올리에이트 티오에스테라제의 아미노산 서열을 표 42에 제시하였다. 당업자는 올리에이트 티오에스테라제에 대한 다른 유전자를 동정할 수 있을 것이다.
티오에스테라제 효소 | 서열 번호 | GenBank ID 번호 |
헬리안투스 아너스 | 서열 번호 202 | AAL79361.1 |
브라시카 라파 | 서열 번호 203 | AAC49002.1 |
자트로파 컬카스 | 서열 번호 204 | ABX82799.3 |
제아 메이스 | 서열 번호 205 | ACG40089.1 |
제아 메이스 | 서열 번호 206 | ACG42559.1 |
지방산 불포화 효소는 미생물 내에 리놀레 지방산과 리놀렌 지방산의 축적을 증가시키는데에 유용한 부가 효소이다. 특히, 2개의 효소 즉, FAD 2 및 FAD 3의 활성은 미생물 내 리놀레 지방산과 리놀렌 지방산의 축적을 증가시켰다. 예시적 FAD 2 및 FAD 3 효소의 아미노산 서열을 이하 표 43에 제시하였다.
FAD 2 및 FAD 3 효소 | 서열 번호 |
리누스 유시타티시멈 12 불포화 효소 | 서열 번호 181 |
리누스 유시타티시멈 15 불포화 효소 | 서열 번호 182 |
리누스 유시타티시멈 15 불포화 효소 | 서열 번호 183 |
칼타머스 팅크토리우스 12 불포화 효소 | 서열 번호 184 |
헬리안투스 아너스 12 불포화 효소 | 서열 번호 185 |
표 43에 나열된 효소들 이외에, 예시적 Δ12 FAD 효소의 아미노산 서열을 표 44에 나열하였다. 미생물 내 과발현에 적당한 기타 다른 Δ12 FAD 효소는 표 45에 나열하였다. 예시적 Δ15 FAD 및 불포화 지방산과 TAG의 수준을 증가시키는데 유용한 기타 다른 효소를 표 46에 나열하였다. 부가의 글리세로지질 불포화 효소는 표 47에 나열하였다.
Δ12 FAD 효소 | 서열 번호 | GenBank ID 번호 |
칼타머스 팅크토리우스 | 서열 번호 207 | ADM48790.1 |
고시피움 히르서텀 | 서열 번호 208 | CAA71199.1 |
글리신 맥스 | 서열 번호 209 | BAD89862.1 |
제아 메이스 | 서열 번호 210 | ABF50053.1 |
프로토테카 모리포르미스 대립유전자 1 | 서열 번호 211 | |
프로토테카 모리포르미스 대립유전자 2 | 서열 번호 212 |
Δ12 FAD 효소 | GenBank 수탁 번호 |
베르노니아 갈라멘시스 | AAF04094.1 |
베르노니아 갈라멘시스 | AAF04093.1 |
라이티아 팅크토리아 | ADK47520.1 |
올레아 유로파에아 | AAW63041.1 |
베르니시아 포르디 | AAN87573 |
아라비돕시스 탈리아나 | AAA32782.1 |
카멜리나 사티바 | ADU18247.1 |
카멜리나 사티바 | ADU18248.1 |
카멜리나 사티바 | ADU18249.1 |
칼타머스 팅크토리우스 | ADK94440.1 |
글리신 맥스 | BAD89862.1 |
글리신 맥스 | DQ532371.1 |
고시피움 히르서텀 | AAL37484.1 |
리넘 유시타티시멈 | ACF49507.1 |
리넘 유시타티시멈 | ACF49508.1 |
오에노테라 비에티스 | ACB47482 |
사카로마이세스 세레비지아에 | NP_011460.1 |
제아 메이스 | ACG37433.1 |
브라시카 라파 | CAD30827.1 |
Δ15 FAD 효소 | 서열 번호 | GenBank ID 번호 |
브라시카 라파 | 서열 번호 213 | AAA32994.1 |
카멜리나 사티바 | 서열 번호 214 | |
카멜리나 사티바 | 서열 번호 215 | |
글리신 맥스 | 서열 번호 216 | ACF19424.1 |
베르니시아 포르디 | 서열 번호 217 | AAF12821.1 |
리시누스 커뮤니스 | 서열 번호 218 | EEF36775.1 |
리넘 유시타티시멈 | 서열 번호 219 | ADV92272.1 |
프로토테카 모리포르미스 대립유전자 1 | 서열 번호 220 | |
프로토테카 모리포르미스 대립유전자 2 | 서열 번호 221 |
글리세로지질 불포화 효소 | GenBank 수탁 번호 |
글리신 맥스 | ACD69577.1 |
글리신 맥스 컬티바 볼라니아 | ACS15381.1 |
글리신 소자 | P48621.1 |
아라비돕시스 탈리아나 | NP_180559.1 |
리넘 그랜디플로럼 | BAG70949.1 |
제아 메이스 | BAA22440.1 |
올레아 유로파에아 | ABG88130.2 |
자트로파 컬카스 | ABX82798.1 |
베르니시아 포르디 | CAB45155.1 |
베르니시아 포르디 | AAD13527.1 |
본원에 개시된 아미노산 서열들은 본원에 개시된 방법을 사용하여 미생물 내에서 발현되었다. 암호화 서열은 미생물 내 발현에 최적화될 수 있었다. 예를 들어 피.모리포르미스 내 발현에 있어서 본원의 표 2에 개시된 선호 코돈 사용 빈도가 적용되었다.
실시예
11:
리놀렌
불포화 지방산 및
글리세로지질의
생산을 증가시키기 위한 미생물 조작
실시예 10에 기술된 바와 같이, Δ15 불포화 효소는 C18:2(리놀레) 지방산 또는 지방 아실 분자들의 15번 위치에 이중 결합을 형성하여, C18:3(리놀렌) 지방산 또는 지방 아실 분자가 생산되는 것을 촉진한다. 리놀렌 불포화 지방산이 풍부한 오일을 생산하는 임의의 고등 식물 종, 예를 들어 브라시카 나푸스(Bn), 카멜리나 사티바(Cs), 그리고 리넘 유시타티시멈은, 미생물 내에서 발현되어 지방산 프로필에 영향을 미칠 수 있는 Δ15 불포화 효소를 암호화하는 유전자 원이다. 본 실시예는, 형질 전환된 미생물의 지방산 프로필에 있어서 리놀렌산이 증가되도록 미생물을 조작하기 위해 Δ15 불포화 효소를 암호화하는 폴리뉴클레오티드를 사용하는 것에 관하여 기술하고 있다.
프로토테카 모리포르미스 UTEX 1435, 균주 A의, (고급 오일을 생산하도록) 전통적으로 돌연 변이된 파생 균주를 실시예 2에 상세히 기술된 유전자 총 형질 전환법에 따라서 표 49에 나열된 플라스미드 구조물 각각으로 개별 형질 전환하였다. 각각의 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접함)을 함유하였으며, 여기서, 상기 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합에 사용되었다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열되었으며, 수크로스 인버타제 유전자는 선택 마커로서 사용되었다. 단백질 암호화 영역은 모두 표 2에 따라서 프로토테카 모리포르미스 UTEX 1435 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 최적화된 코돈이었다. 브라시카 나푸스(Bn FAD3, GenBank 수탁 번호 제AAA32994호), 카멜리나 사티바 FAD-7 및 리넘 유시타티시멈(Lu FAD3A 및 Lu FAD3B, GenBank 수탁 번호 제ABA02172호 및 제ABA02173호) 유래 불포화 효소 유전자의 암호화 영역은 각각 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 플래그(FLAG)® 에피토프 서열은 재조합 불포화 효소 유전자 서열의 N-말단 세포질 루프 내에서 암호화되었다.
구조물 pSZ2124, pSZ2125, pSZ2126 및 pSZ2127 각각은 균주 A에 개별적으로 도입되어 이 균주를 형질 전환하였다. 1차 형질 전환체를 유일한 탄소원으로서 수크로스를 함유하는 한천 평판 상에서 선택하였다. 각각의 형질 전환체를 클론으로 정제하였으며, 이 클론을 (실시예 1에 개시된 조건과 유사한) 지질 생산에 적당한 조건 하에서 생육하였다(pH 7.0). 각각의 형질 전환체로부터 유래하는 무수 바이오매스로 지질 샘플을 제조하였다. 각각의 형질 전환체로부터 유래하는 무수 바이오매스 20㎎ 내지 40㎎을 MeOH 중 5% H2SO4 2㎖ 중에 재현탁하고 나서, 여기에 적당한 내부 표준(C19:0)을 적당량 함유하는 톨루엔 200ul을 첨가하였다. 혼합물을 간단히 초음파 처리하여 바이오매스를 분산한 다음, 이를 3.5시간 동안 70℃ 내지 75℃에서 가열하였다. 여기에 헵탄 2㎖를 첨가하여 지방산 메틸 에스테르를 추출한 후, 다시 6% K2CO3(aq) 2㎖를 첨가하여 산을 중화하였다. 상기 혼합물을 격렬하게 교반하고, 상층 일부를, 표준 FAME GC/FID법(지방산 메틸 에스테르 가스 크로마토그래피 불꽃 이온화 검출법)을 사용하는 가스 크로마토그래피 분석을 위해서, Na2SO4(무수)가 담긴 바이알에 옮겨 담았다. 표준 지방산 메틸 에스테르 가스 크로마토그래피 불꽃 이온화(FAME GC/FID) 검출법을 사용하여 지방산 프로필을 분석하였다. pSZ2124, pSZ2125, pSZ2126 및 pSZ2127으로 균주 A를 형질 전환하여 생성된 대표적인 클론 세트로부터 얻어진 지방산 프로필(총 지방산의 면적%로 표시)을 표 50에 나타내었다. 비교용으로서, 형질 전환되지 않은 균주 A 대조군 세포로부터 얻은 지질의 지방산 프로필을 표 50에 추가로 제시하였다.
형질 전환되지 않은 프로토테카 모리포르미스(UTEX 1435) 균주 A는 C18:3 지방산 1% 미만을 비롯한 지방산 프로필을 나타냈다. 이와는 반대로, 고등 식물 지방산 불포화 효소를 발현하는 균주 A의 지방산 프로필의 경우에는 C18:3 지방산 조성이 약 2배 내지 17배 증가하였음이 보였다. 리넘 유시타티시멈의 FAD3A 또는 FAD3B, 또는 브라시카 나푸스의 FAD3 유전자 생성물을 발현하는 조작 균주는 최대의 C18:3 증가 정도를 보였다(표 50). 18:3 대 총 C18 불포화물의 비율은, 형질 전환되지 않은 균주 내에서는 약 1%였으며, 형질 전환된 균주 내에서는 약 2% 내지 17%였다. 18:2 대 총 C18:0의 비율은, 형질 전환되지 않은 균주 내에서는 약 12% 내지 13%였으며, 형질 전환된 균주 내에서는 약 1% 내지 15%였다(FAD3A 형질 전환체 내 최저 수준). 이와 같은 데이터는, Δ15 불포화 효소 지방산 불포화 효소의 외부 발현이, 조작된 미생물의 지방산 프로필을 바꾸도록(특히 미생물 세포 내 18:3 지방산 농도가 증가되도록) 허용하는 폴리뉴클레오티드의 유용성과 효율을 입증하였다.
실시예
12: 헤어핀
RNA
접근법을 통해
스테아르산
및
스테아레이트의
생산을 증가시키기 위한 미생물 조작
스테아로일 ACP 불포화 효소(SAD)는 지질 합성 경로의 일부이다. 이 효소는 지방 아실 사슬에 이중 결합을 도입하는 역할을 한다. 예를 들어 SAD 효소는 C18:0 지방산(스테아르산)으로부터 C18:1 지방산이 합성되는 과정을 촉진한다. 실시예 6에 나타낸 바와 같이, 표적화 유전자 중단을 통해 프로토테카 모리포르미스의 SAD2 대립유전자를 중단시키면, 조작된 미생물의 지방산 프로필에 있어서 C18:0 지방산 수준이 측정 가능할 정도로 증가되었다. 본 실시예는, 형질 전환된 미생물의 지방산 프로필에 있어서 포화 C18:0 지방산이 증가하도록 미생물을 조작하기 위해, SAD2의 발현을 하향 조절하는 헤어핀 RNA를 암호화하는 폴리뉴클레오티드를 사용하는 것에 관하여 기술하고 있다.
표 51에 나열된 4개의 구조물 pSZ2139 내지 pSZ2142를, 프로토테카 모리포르미스 SAD2 유전자 생성물의 발현이 감소되도록 설계하였다. 각각의 구조물은 프로토테카 모리포르미스 SAD2 mRNA 전사체에 대해 표적화된 헤어핀 RNA를 암호화하는 상이한 핵산 서열(이 경우, 상기 헤어핀 구조의 줄기부 길이는 180 내지 240 염기쌍임), 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접함)을 함유하였는데, 이 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합에 사용되었다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열하였으며, 이는 선택 마커로서 사용되었다. 각 구조물의 SAD2 RNA 헤어핀을 암호화하는 폴리뉴클레오티드 서열은 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 씨. 불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다.
프로토테카 모리포르미스(UTEX 1435) 균주 A를 형질 전환하는데 사용되는 플라스미드 구조물 |
||
플라스미드 구조물 | 관련 서열 요소 | 서열 번호 |
SZ2139 헤어핀 A |
6S::Crβtub:ScSuc2:Cvnr:Crβtub:PmSAD2-hpA:Cvnr::6S | 서열 번호 226 |
SZ2140 헤어핀 B | 6S::Crβtub:ScSuc2:Cvnr:Crβtub:PmSAD2-hpB:Cvnr::6S | 서열 번호 227 |
SZ2141 헤어핀 C | 6S::Crβtub:ScSuc2:Cvnr:Crβtub:PmSAD2-hpC:Cvnr::6S | 서열 번호 228 |
SZ2142 헤어핀 D | 6S::Crβtub:ScSuc2:Cvnr:Crβtub:PmSAD2-hpD:Cvnr::6S | 서열 번호 229 |
(고급 오일을 생산하도록) 전통적 방식으로 돌연 변이된 프로토테카 모리포르미스 UTEX 1435 파생 균주, 균주 A에, 실시예 2에 상세히 기술된 유전자 총 형질 전환법에 따라서 표 51에 나열된 플라스미드 구조물들을 각각 도입하여 상기 균주를 형질 전환하였다. 유일한 탄소원으로서 수크로스를 함유하는 한천 평판 상에서 1차 형질 전환체를 선택한 다음, 클론으로서 정제한 후, 표준 지질 생산 조건 하에서 생육하였다. 실시예 11에 기술된 바와 같은 직접 에스테르 결합 전이법을 이용하여 지방산 프로필을 측정하였다. 균주 A를 pSZ2139, pSZ2140, pSZ2141 및 pSZ2142로 형질 전환하여 생성된 대표적인 클론 세트로부터 얻어진 지방산 프로필(총 지방산의 면적%로 표시)을 이하 표 52에 제시하였다. 비교를 위해서, 형질 전환되지 않은 균주 A 대조군 세포로부터 얻은 지질의 지방산 프로필을 표 52에 추가로 제시하였다.
상기 표 52에 제시된 데이터는, 숙주 유기체의 C18:0 및 C18:1 지방산 프로필에 SAD2 헤어핀 RNA 구조물 발현이 미치는 분명한 영향력을 보여주는 것이다. SAD2 헤어핀 RNA 구조물을 포함하는 균주 A 형질 전환체의 지방산 프로필은, 불포화 C18:1 지방산의 백분율은 감소하면서 포화 C18:0 지방산의 백분율은 증가하였음을 입증하는 것이다. 형질 전환되지 않은 균주의 지방산 프로필 중 C18:0는 약 3%였다. 형질 전환된 균주의 지방산 프로필은 C18:0 3% 이상 내지 거의 27%까지였다. C18:0 대 총 C18 불포화물의 비율은, 형질 전환되지 않은 균주 내에서는 약 4%였으며, 형질 전환된 균주 내에서는 약 5% 내지 69%였다. 이와 같은 데이터는, 프로토테카 모리포르미스 내 폴리뉴클레오티드 SAD RNA 헤어핀 구조물이 성공적으로 발현 및 사용된 결과, 조작된 숙주 미생물 내 포화 지방산 백분율이 바뀌었음(특히 미생물 세포 내 C18:0 지방산 농도는 증가되고 C18:1 지방산 농도는 감소하였음)을 입증하였다.
실시예
13: β-
케토아실
-
ACP
합성 효소
II
유전자의 과발현을 통한 미세 조류의 지방산 프로필 변경
β-케토아실-ACP 합성 효소 II(KASII)는 지방산 생합성시 C16:0-ACP로부터 C18:0-ACP로의 2-탄소 연장을 촉진하였다. 플라스미드 구조물을 제조하여, KASII 유전자가 발현될 경우 숙주 세포의 지방산 프로필이 영향받을 수 있는지 여부를 평가하였다. 프로토테카 모리포르미스 UTEX 1435 또는 고등 식물(글리신 맥스: GenBank 수탁 번호 제AAW88763호; 헬리안터스 아너스; GenBank 수탁 번호 제ABI18155호; 및 리시누스 커뮤니스: GenBank 수탁 번호 제AAA33872호)로부터 KASII 유전자 서열의 공급원을 선택하였다.
(고급 오일을 생산하도록) 전통적 방식으로 돌연 변이된 프로토테카 모리포르미스 UTEX 1435 파생 균주, 균주 A에, 실시예 2의 방법에 따라서 표 53에 나열된 플라스미드 구조물들 중 하나를 각각 도입하여 이 균주를 형질 전환하였다. 각각의 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접함)을 함유하였는데, 이 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합에 사용되었다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 29로서 나열하였으며, 이는 선택 마커로서 사용되었다. 각각의 구조물에 있어서, KASII 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 37) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. 각각의 KASII 효소의 천연 운반 펩티드를 클로렐라 프로토테코이데스 스테아로일-ACP 불포화 효소 운반 펩티드(서열 번호 54)로 치환하였다. 모든 단백질 암호화 영역은 표 2에 따라서 프로토테카 모리포르미스 UTEX 1435 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 최적화된 코돈이었다.
프로토테카 모리포르미스(UTEX 1435) 균주 A 를 형질 전환하는데 사용되는 플라스미드 구조물 |
|||
플라스미드 구조물 |
KASII 효소의 공급원 |
서열 요소 | 서열 번호 |
SZ1747 | 글리신 맥스 (Glm) | 6S::β-tub:suc2:nr::Amt03:S106SAD:GlmKASII:nr::6S | 서열 번호 230 |
SZ1750 | 헬리안터스 아너스 (Ha) |
6S::β-tub:suc2:nr::Amt03:S106SAD:HaKASII:nr::6S | 서열 번호 231 |
SZ1754 |
리시누스
커뮤니스 ( Rc ) |
6S::β-tub:suc2:nr::Amt03:S106SAD:RcKASII:nr::6S | 서열 번호 232 |
SZ2041 | 프로토테카 모리포르미스 (Pm) |
6S::β-tub:suc2:nr::Amt03:S106SAD:PmKASII:nr::6S | 서열 번호 233 |
구조물 6S::β-Tub:suc2:nr::Amt03:S106SAD :PmKASII:nr::6S 내 관련 제한 위치들은 굵은 글씨체의 소문자에 밑줄을 쳐서 표시하였으며, 각각 5'-3' BspQ 1, Kpn I, Xba I, Mfe I, BamH I, EcoR I, Spe I, Asc I, Cla I, Sac I, BspQ I에 해당하였다. BspQI 위치들은 형질 전환 DNA의 5' 및 3' 말단을 한정하였다. 굵은 글씨체의 소문자 서열은 상동성 재조합을 통하여 6S 위치에서의 표적화 통합을 허용하는, 균주 A 유래 게놈 DNA를 나타낸다. 5'→3' 방향으로 진행되는, 효모 수크로스 인버타제 유전자(균주 A가 수크로스를 대사할 수 있는 능력을 부여함)의 발현을 작동하는 씨.레인하르드티 β-튜불린 프로모터는 박스를 쳐서 표시하였다. 인버타제에 대한 개시 인자 ATG 및 종결 인자 TGA는 굵은 이탤릭체의 대문자로 표시한 반면에, 암호화 영역은 이탤릭체의 소문자로 표시하였다. 클로렐라 불가리스 질산염 환원 효소 3'UTR은 소문자에 밑줄을 쳐서 표시하였으며, 그 다음에 존재하는 피.모리포르미스의 내인성 amt03 프로모터는 이탤릭체에 박스를 쳐서 표시하였다. PmKASII의 개시 인자 ATG 및 종결 인자 TGA 코돈은 굵은 이탤릭체의 대문자로 표시하였으며, 유전자의 나머지 부분은 굵은 이탤릭체로 표시하였다. 클로렐라 프로토테코이데스 S106 스테아로일-ACP 불포화 효소 운반 펩티드는 개시 인자 ATG와 Asc I 위치 사이에 위치하였다. 씨.불가리스 질산염 환원 효소 3'UTR은 또한 소문자에 밑줄을 쳐서 표시하였으며, 그 다음에 존재하는 균주 A 6S 게놈 영역은 굵은 소문자로 표시하였다. 구조물 6S::β-tub:suc2:nr::Amt03:S106SAD:PmKASII:nr::6S의 관련 뉴클레오티드 서열은 서열 번호 234로서 서열 목록에 제공하였다. 클로렐라 프로토테코이데스 S106 스테아로일-ACP 불포화 효소 운반 펩티드를 포함하는 PmKASII의 코돈 최적화된 서열은 서열 목록 중 서열 번호 235로서 제공하였다. 서열 번호 236은 서열 번호 235의 단백질 번역물을 제공하였다.
각각의 플라스미드 구조물을 균주 A에 도입하여 이 균주를 별도로 형질 전환하고 나서, 양성 클론을 유일한 탄소원으로서 수크로스를 포함하는 한천 평판 상에서 선택하였다. 상기 실시예들에서와 같이, 1차 형질 전환체는 클론으로서 정제하였으며, 또한 pH 7의 표준 지질 생산 조건 하에 생육하였고, 지질 샘플은 각각의 형질 전환체의 무수 바이오매스로 제조하였다. 지방산 프로필을 실시예 11에 기술된 직접 에스테르 결합 전이법을 사용하여 측정하였다. 균주 A를 형질 전환하여 생성된 대표적인 클론 세트에서 얻은 지방산 프로필(총 지방산의 면적%로 표시)과, 몇몇 양성 형질 전환체의 지방산 프로필(면적%로 표시)을 형질 전환되지 않은 균주 A 대조군의 지방산 프로필과 비교한 결과를, 이하 표 54에 제시된 각각의 플라스미드 구조물에 대해 요약하였다.
pSZ2041을 사용하여, 표 2에 제시된 코돈 사용 빈도를 이용하여 추가로 코돈 최적화된 프로토테카 모리포르미스(UTEX 1435) KASII 유전자를 과발현하였을 때, C16:0 사슬 길이는 명확히 감소됨과 아울러 C18:1 지방산의 길이는 증가하는 것이 관찰되었다. β-튜불린 프로모터에 의해 작동되는 프로토테카 모리포르미스(UTEX 1435) KASII 유전자를 발현하는 구조물로 형질 전환하였을 때에도 유사한 지방산 프로필 변화가 관찰되었다.
이와 같은 결과들은, 코돈 최적화된 프로토테카 지질 생합성 유전자가 외부 과발현될 때 유전자 조작된 미세 조류의 지방산 프로필이 변경될 수 있음을 보여주는 것이다. 특히 형질 전환되지 않은 세포 내에서의 KASII 유전자의 과발현은 C18 지방산의 백분율을 약 68%에서 약 84%로 증가시킬 수 있었다.
실시예
14: 조작된
프로토테카
내 중간 길이 사슬 지방산 수준의,
KASI
대립 유전자의
표적화
녹아웃을 통한 변화
β-케토아실-ACP 합성 효소 I(KASI)은, 지방산 생합성시 C4:0, C6:0, C8:0, C10:0, C12:0 및 C14:0 지방 아실-ACP 분자의 2-탄소 연장을 촉진하였다. 본 실시예에서는, 녹아웃 플라스미드 구조물인 pSZ2014를 제조하여, KASI 유전자 위치가 표적 중단되었을 때 숙주 세포의 지방산 프로필에 미치는 영향을 평가하였다.
(고급 오일을 생산하도록) 전통적 방식으로 돌연 변이된 프로토테카 모리포르미스 UTEX 1435 파생 균주, 균주 A에, 실시예 2에 기술된 유전자 총 형질 전환법에 따라서 pSZ2014 구조물을 도입하여 이 균주를 형질 전환하였다. pSZ2014는 씨.레인하르드티 β-튜불린 프로모터 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 인버타제 발현 카세트를 포함하였는데, 상기 발현 카세트는, 프로토테카 모리포르미스 게놈의 KASI 위치에 통합되는데 사용되는 구조물을 표적화하는 KASI 유전자 특이적 상동성 영역의 양 말단 중 어느 한쪽에 측접하였다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열하였으며, 또한 선택 마커로 사용되었다. 핵내 게놈 통합용 KASI 위치에 대한 표적화 영역과 관련된 서열을 이하에 보였으며, 또한 서열 번호 238과 서열 번호 239에 나열하였다. pSZ2014내 관련 제한 위치들(굵은 글씨체의 소문자에 밑줄을 쳐서 표시함)로서는 각각 5'→3' BspQ 1, Kpn I, AscI, Xho I, Sac I, BspQ I이 있으며, 이것들을 이하 서열에 보였다. BspQI 위치는 형질 전환 DNA의 5' 말단 및 3' 말단을 한정하였다. 굵은 글씨체의 소문자로 표시한 서열은, 상동성 재조합을 통해 KASI 위치에서의 표적화 통합을 허용하는, 균주 A 유래 게놈 DNA를 나타내는 것이다. 5'→3' 방향으로 진행될 때, 씨.레인하르드티 b-튜불린 프로모터(코돈 최적화 효모 수크로스 인버타제 유전자를 발현시킴)(균주 A에 수크로스를 대사할 수 있는 능력을 부여함)는 글자에 박스를 쳐서 표시하였다. suc2 인버타제에 대한 개시 인자 ATG 코돈과 종결 인자 TGA 코돈은 굵은 이탤릭체 대문자로 표시한 반면에, 암호화 영역은 이탤릭체 소문자로 표시하였다. 클로렐라 불가리스 질산염 환원 효소 3'UTR은 소문자에 밑줄을 쳐서 표시하였다. pSZ2014의 형질 전환 서열을 이하에 보였으며, 서열 번호 237로서 나열하였다.
플라스미드 구조물 pSZ2014를 균주 A에 도입하여 이 균주를 형질 전환하고 나서, 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 선택하였다. 1차 형질 전환체를 클론으로서 정제한 다음, 이를 표준적인 지질 생산 조건 하에서 생육하였다. 각각의 형질 전환체로부터 얻은 무수 바이오매스로부터 지질 샘플을 제조하였다. 실시예 11에 기술된 직접 에스테르 결합 전이법을 사용하여 지방산 프로필을 측정하였다. 몇몇 양성 형질 전환체의 지방산 프로필(총 지방산의 면적%로 표시)을, 형질 전환되지 않은 균주 A 대조군의 지방산 프로필과 비교하였으며, 그 결과는 하기 표 55에 요약되어 있다.
상기 표 55에 나타낸 바와 같이, KASI 대립 유전자의 표적화 중단에 의하여 형질 전환된 미생물의 지방산 프로필이 영향을 받았음을 알 수 있다. pSZ2014 형질 전환 벡터를 포함하는 균주 A의 지방산 프로필은, C18:1 지방산이 감소됨과 아울러, C14:0 및 C16:0 지방산의 조성이 증가하였음을 보여주었다. 모든 형질 전환체에서, C18:0 지방산은 감소하였다. 몇몇 형질 전환체에 있어서, KASI 대립 유전자가 중단되었을 경우에는, 형질 전환되지 않은 균주 A 유기체의 지방산 프로필에 비하여 C18:2 지방산의 백분율이 감소한 지방산 프로필을 추가로 얻을 수 있었다.
그러므로, 본 발명의 발명자들은 내인성 KASI를 중단함으로써 총 C14 지방산 백분율을 약 35%에서 400%로 증가시켰으며, C16 지방산의 백분율은 약 30%에서 약 50%로 증가시켰다.
상기 데이터는 숙주 미생물의 지방산 프로필을 변경함에 있어서 내인성 KASI 대립 유전자의 표적화 유전자 중단의 유용성을 입증하는 것이다.
실시예
15:
프로토테카
내 지방산 프로필을 변경시키기 위한 유전자 변형 접근법의 통합
본 실시예에서는, KASII 대립 유전자를 녹아웃시키고 아울러 중간쇄인 지방산의 가수 분해를 선호하는 외인성 티오에스테라제를 과발현하도록 만드는 유전자 변형법을 통합 수행하여, 미생물 내 숙주 유기체의 지방산 프로필이 미생물 내에서 변경되는 것을 입증하고 있다.
우선, (고급 오일을 생산하기 위하여) 전통적 방식에 따라서 돌연 변이된 프로토테카 모리포르미스 균주(UTEX 1435) 파생 균주, 즉 균주 C를, 실시예 2에 상세히 기술된 유전자 총 형질 전환법에 따라서 플라스미드 구조물 pSZ1283으로 형질 전환하였다. PCT 특허 출원 PCT/US2011/038463 및 PCT/US2011/038463에 이미 개시된 pSZ1283(서열 번호 256)은, 쿠페아 라이티 FATB2(CwTE2) 티오에스테라제의 암호화 서열, 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접함)을 함유하였으며, 이 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합에 사용되었다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열하였으며, 이는 선택 마커로서 사용되었다. CwTE2 암호화 서열은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR(서열 번호 32)의 제어 하에 두었다. CwTE2 및 suc2의 단백질 암호화 영역은 표 2에 따른 프로토테카 모리포르미스 UTEX 1435 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 최적화된 코돈이었다.
pSZ1283을 균주 C에 도입하여 이 균주를 형질 전환하고 나서, 양성 클론을, 유일한 탄소원으로서 수크로스를 포함하는 한천 평판 상에서 선택하였다. 그 다음, 1차 형질 전환체를 클론으로서 정제한 다음, 단일 형질 전환체 즉, 균주 B를 추가 유전자 변형을 위해서 선택하였다. 이와 같이 유전자 조작된 균주를 플라스미드 구조물 pSZ2110(서열 번호 240)(KASII 대립 유전자 1 위치를 중단함)으로 형질 전환하였다. pSZ2110(KASII'5::CrbTub:NeoR:nr::KASII-3'으로 표시)는, G418에 대한 내성을 부여하고, 씨.레인하르드티 β-튜불린 프로모터와 클로렐라 불가리스 질산염 환원 효소 3'UTR(여기서, 상기 발현 카세트는 프로토테카 모리포르미스 게놈의 KASII 위치에 통합할 때 사용되는 구조물을 표적화하는, KASII 유전자 특이적 상동성 영역 양쪽 말단 중 어느 한쪽에 측접)의 제어 하에 있는 네오마이신 내성(NeoR) 발현 카세트를 포함하였다. pSZ2110 구조물 내 관련 제한 위치로서는, 5'→3' 방향으로, BspQ 1, KpnI, XbaI, MfeI, BamHI, EcoRI, SpeI, XhoI , Sac I 및 BspQI이 있으며, 이것들은 굵은 글씨체의 소문자에 밑줄을 쳐서 표시하였다. BspQI 위치는 형질 전환 DNA의 5' 및 3' 말단을 한정한다. 형질 전환 구조물의 5' 및 3' 말단에 존재하는 굵은 글씨체의 소문자로 표시된 서열은, 상동성 재조합을 통해 KASII 대립 유전자 1 위치로의 통합을 표적화하는 UTEX 1435 유래 게놈 DNA를 나타낸다. 씨.레인하르드티 β-튜불린은 소문자에 박스를 쳐서 표시하였다. NeoR 에 대한 개시 인자 ATG와 종결 인자 TGA는 이탤릭체의 대문자로 표시하였으며, 암호화 영역은 이탤릭체의 소문자로 표시하였다.
3'UTR은 소문자에 밑줄을 쳐서 표시하였다.
균주 B를 pSZ2110으로 형질 전환하고 나서, 양성 클론을, G418을 함유하는 선택 한천 평판 상에서 선택하였다. 이후, 1차 형질 전환체를 클론으로서 정제한 다음, 표준 지질 생산 조건(pH 5.0 및 pH 7.0) 하에서 탄소원으로서 수크로스를 기반으로 생육하였다. 실시예 11에 기술된 바와 같이 각각의 형질 전환체로부터 얻어진 무수 바이오매스로부터 지질 샘플을 제조하였다. 5개의 양성 형질 전환체(T1-T5)의 지방산 프로필(총 지방산의 면적 %로 표시), 유일한 탄소원으로서 수크로스를 기반으로 생육된 균주 B(U1)의 프로필, 그리고 유일한 탄소원으로서 글루코스를 기반으로 생육된 비형질 전환 UTEX 1435(U1)의 프로필을 이하 표 56에 제시하였다.
표 56에 보인 바와 같이, 프로토테카 모리포르미스(UTEX 1435) 균주 B 내에서 CwTE2가 발현되었을 때의 영향으로 인하여, 형질 전환된 미생물의 지방산 프로필에는 눈에 띄는 변화가 일어났다. CwTE2를 발현하고, Amt03 프로모터에 의해 CwTE2가 발현되는 것이 촉진되도록 pH 7.0에서 배양된 균주 B의 지방산 프로필에서는, 형질 전환되지 않은 UTEX 1435의 지방산 프로필에 비하여, C10:0, C12:0 및 C14:0 지방산의 조성이 증가함과 아울러, C16:0 및 C18:1 지방산의 조성은 감소되었음이 확인되었다. 이후, C16:0 지방산에서 C18:0 지방산으로의 2-탄소 연장을 촉진하는 효소를 암호화하는 KASII 대립 유전자를 중단하도록 균주 B를 변형시킨 결과, 새로 조작된 균주가 pH 5.0에서 생육되었을 때 이 균주의 지질 프로필에 있어서 C16:0 지방산은 증가하였으며, 아울러 C18:1 지방산은 감소하였다. 배양 배지의 pH는 Amt03 프로모터의 활성에 최적이 아니므로, pH 5.0에서 형질 전환체가 증식하였음은 곧, 티오에스테라제가 지방산 프로필을 바구는데에 기여하는 것과는 별도로, KASII 대립 유전자 녹아웃이 일어났을 때의 영향력을 증명하는 것이다. pH 7.0에서 지질을 생산하여 CwTE2를 발현시키면, pSZ2011 형질 전환체는 UTEX 1435 균주의 지방산 프로필에 비하여, C10:0, C12:0 및 C14:0 지방산의 조성은 증가하고, 아울러 C16:0 및 C18:1 지방산 조성은 감소하는 지방산 프로필을 보였다. 몇몇 pSZ2011 형질 전환체가 pH 7.0에서 배양되었을 때 이 형질 전환체는, pH 7.0에서 배양된 부모 균주 B의 지방산 프로필에 비하여, C16:0 지방산은 증가하고, C18:1 지방산 조성은 더욱 감소한 지방산 프로필을 나타내었다.
이와 같은 데이터는, 숙주 유기체의 지방산 프로필에 영향을 미치도록 만드는 중복 유전자 변형의 유용성을 입증하는 것이다. 뿐만 아니라, 본 실시예는 숙주 미생물의 지방산 프로필을 바꾸는데 있어서 내인성 KASII 대립 유전자의 유전자 중단을 표적화하는 재조합 폴리뉴클레오티드의 용도를 입증하는 것이다.
실시예
16:
프로토테카의
팔미트산 조성을 변경시키기 위한 유전자 변형 접근법의 통합
본 실시예는, KASII 대립 유전자를 녹아웃시키고, 이와 아울러 C14 및 C16 지방산의 가수 분해에 선호적인 특이성을 나타내는 외인성 티오에스테라제를 과발현하는 유전자 변형법들을 통합하면, 숙주 유기체의 지방산 프로필이 미생물 내에서 바뀐다는 사실을 입증하였다.
실시예 2에 상세히 기술된 바와 같은 유전자 총 형질 전환법에 따라서 플라스미드 구조물 pSZ2004를 사용하여, (고급 오일을 생산하도록) 전통적 방식으로 돌연 변이된 프로토테카 모리포르미스(UTEX 1435) 균주 A를 형질 전환하였다. pSZ2004(KASII_5'_btub-SUC2-nr_2X_Amt03-Ch16TE2-nr_KASII_3'으로 표시)는, 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제의 암호화 서열(Ch16TE2, GenBank #Q39513), 5' 및 3' 상동성 재조합 표적화 서열(구조물에 측접)(핵내 게놈의 KASII 위치에 표적화 통합하는데 사용됨), 그리고 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역을 포함하였다. Ch16TE2는 C14 및 C16 지방산에 대해 선호적인 특이성을 보이는 티오에스테라제다. 이러한 에스.세레비지아에 suc2 발현 카세트를 서열 번호 159에 나열하였으며, 이를 또한 선택 마커로서 사용하였다. Ch16TE 암호화 서열은, 직렬로 반복되는 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89)와, 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다. Ch16TE의 단백질 암호화 영역 및 suc2는, 표 2에 따라서 프로토테카 모리포르미스 UTEX 1435 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 최적화된 코돈이었다. pSZ2004는 서열 목록에 서열 번호 249로서 제시하였다.
pSZ2004로 형질 전환하고 나서, 1차 형질 전환체를, 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 선택하였다. 각각의 형질 전환체를 클론으로서 정제하여, 표준 지질 생산 조건(pH 7.0, 실시예 1에 개시된 조건과 유사한 조건) 하에서 생육하였다. 실시예 11에 기술된 바와 같은 표준 지방산 메틸 에스테르 가스 크로마토그래피 불꽃 이온화(FAME GC/FID) 검출법을 사용하여 지방산 프로필을 분석하였다. 형질 전환 벡터 pSZ2004로 형질 전환하여 생산된 대표적인 클론으로부터 얻어진 지방산 프로필(총 지방산의 면적%로 표시)을 표 57에 보였다. 지질 생산 조건(유일한 탄소원으로서 글루코스 포함) 하에서 생육된, 형질 전환되지 않은 균주로부터 얻은 지질의 지방산 프로필을 표 57에 추가로 제시하였다.
상기 표 57에 보인 바와 같이, KASII 대립 유전자를, 선택가능한 마커 및 C14/C16 선호 티오에스테라제를 발현하기 위한 발현 카세트로 표적 중단시키면, 형질 전환된 미생물의 지방산 프로필에 영향을 미쳤다. pSZ2004 형질 전환 벡터를 포함하는 균주는, C14:0 및 C16:0 지방산의 조성이 증가함과 아울러, C18:0 및 C18:1 지방산은 감소하는 지방산 프로필을 보였다. 형질 전환되지 않은 프로토테카 모리포르미스(UTEX 1435) 균주는, C16 지방산 약 27%와 C18:1 지방산 약 58%를 포함하는 지방산 프로필을 나타냈다. 이와는 대조적으로, 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제를 발현시킬 수 있는 카세트와 선택가능한 마커에 의해 KASII 위치가 중단된 균주의 지방산 프로필은, C16 지방산 약 70%와 지방산 약 14%를 포함하였다. C16:0의 수준은 2.5배 이상 증가하였다. 이 데이터는, 외인성 유전자를 과발현하고, 내인성 유전자를 소모시키는 유전자 변형법들은 숙주 유기체 내 지방산 프로필을 변경하도록 통합될 수 있음을 보여주는 것이다.
비교를 위하여, 수크로스 인버타제 유전자를 발현시킬 수 있는 카세트에 의해 KASII 위치가 중단된 균주의 지방산 프로필은 C16 지방산이 약 35%이고 C18:1 지방산이 약 50%였다.
이와 같은 데이터는, 특히 티오에스테라제 효소를 외부적으로 발현시켜, 미생물 세포 내 C14 및 C16 지방산의 농도를 증가시키고, C18:0 및 C18:1 지방산을 감소시키는 것과 같이, 조작된 미생물의 지방산 프로필을 바꾸는 것을 허용하는 폴리뉴클레오티드로 KASII 대립 유전자를 표적화 중단함으로써, 지방산 프로필을 상기한 바와 같이 바꾸는데 있어서 상기 폴리뉴클레오티드의 유용성과 효율을 입증한다.
실시예
17:
리놀레
불포화 지방산 및
글리세로지질을
생산하기 위한 미생물 조작
임의의 Δ12 지방산 불포화 효소는 C18:1 지방산 또는 지방 아실 분자에 이중 결합을 형성하고, 이로써 C18:2(리놀레) 지방산 또는 지방 아실 분자를 생성하는 것을 촉진할 수 있었다. 리놀레 불포화 지방산이 풍부한 오일을 생산하는 임의의 식물 종, 예를 들어 고시피움 히르서텀, 칼타머스 팅크토리우스, 글리신 맥스, 헬리안터스 아너스 및 제아 메이스는, 미생물 내에서 발현되어 지방산 프로필에 영향을 미칠수 있는 Δ12 불포화 효소 암호화 유전자 공급원이다. 본 실시예는 형질 전환된 미생물의 지방산 프로필에 있어서 리놀레산이 증가한 미생물을 조작함에 있어서, Δ12 불포화 효소를 암호화하는 폴리뉴클레오티드의 용도를 기술하였다.
(고급 오일을 생산하도록) 전통적 방식으로 돌연 변이된 프로토테카 모리포르미스 UTEX 1435 파생 균주, 균주 A에, 실시예 2에 상세히 기술된 유전자 총 형질 전환법에 따라서 표 58에 나열된 플라스미드 구조물들 중 하나를 도입하여 이 균주를 형질 전환하였다. 각각의 구조물은 6S 게놈 영역에 대한 5'(서열 번호 82) 및 3'(서열 번호 84) 상동성 재조합 표적화 서열(구조물에 측접함)을 함유하였는데, 이 재조합 표적화 서열은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈으로의 통합에 사용되었다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열하였으며, 이는 선택 마커로서 사용되었다. 모든 단백질 암호화 영역은, 표 2에 따라서 프로토테카 모리포르미스 UTEX 1435에 고유한 코돈 편향 사용을 반영하도록 최적화된 코돈이었다. 고시피움 히르서텀 유래 불포화 효소 유전자(Gh , GenBank 수탁 번호 제CAA71199호), 칼타머스 팅크토리우스 유래 불포화 효소 유전자(Ct GenBank 수탁 번호 제ADM48789호), 글리신 맥스 유래 불포화 효소 유전자(Gm , GenBank 수탁 번호 제BAD89862호), 헬리안투스 아너스 유래 불포화 효소 유전자(Ha, GenBank 수탁 번호 제AAL68983호) 및 제아 메이스 유래 불포화 효소 유전자(Zm, GenBank 수탁 번호 제ABF50053호)의 암호화 영역들은 각각 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었다.
표 58에 나열된 구조물 각각을 개별적으로 균주 A에 도입하여 이 균주를 형질 전환하였다. 유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 1차 형질 전환체를 선택하였다. 각각의 형질 전환체를 클론으로서 정제하였으며, 이를 표준 지질 생산 조건(pH 7.0, 실시예 1에 기술된 조건과 유사한 조건) 하에서 생육하였다. 실시예 11에 기술된 바와 같은 표준 지방산 메틸 에스테르 가스 크로마토그래피 불꽃 이온화(FAME GC/FID) 검출법을 사용하여 지방산 프로필을 분석하였다. 표 58의 상응 균주 A 형질 전환을 통해 생산된 대표적인 클론 세트로부터 얻어진 지방산 프로필을 표 59에 보였다. 비교를 위하여, 형질 전환되지 않은 균주 A 대조군 세포로부터 얻은 지질의 지방산 프로필을 표 59에 추가로 제시하였다.
형질 전환되지 않은 프로토테카 모리포르미스(UTEX 1435) 균주는 C18:2 지방산 8.5% 미만을 포함하는 지방산 프로필을 나타냈다. 표 59에 보인 바와 같이, 고등 식물 지방산 불포화 효소를 발현하는 균주 A의 지질 프로필에서는 C18:2 지방산이 증가하였다. 총 C18 불포화 지방산은 약 64%에서 약 67% 내지 72%로 증가하였다. 이와 유사하게, 총 C18 다중 불포화 지방산(C18:2 및 C18:3) 대 합하여진 총 C18 불포화 지방산(C18:1, C18:2 및 C18:3)의 비율은 14% 미만에서 19% 이상으로 증가하였다. 이와 같은 데이터는, 조작된 미생물의 지방산 프로필을 바꾸는데 있어서 Δ12 불포화 효소 지방산 불포화 효소의 외부 발현을 허용하는 폴리뉴클레오티드의 유용성과 효율을 입증하는 것이다.
실시예
18: 지방산 불포화 효소의 다수 대립 유전자 중단을 통한 조작 미생물의 지방산 수준의 변경
본 실시예는, 형질 전환된 미생물의 지방산 프로필이 변경되도록 미생물을 조작함에 있어서, 선택가능한 마커와, 외인성 SAD 효소를 암호화하는 서열을 포함하는 형질 전환 카세트로 프로토테카 모리포르미스의 FADc 위치를 중단할 때의 형질 전환 벡터의 용도를 기술하고 있다.
(고급 오일을 생산하기 위하여) 전통적 방식에 따라서 돌연 변이된 프로토테카 모리포르미스(UTEX 1435) 파생 균주, 즉 균주 C를, 실시예 2에 상세히 기술된 유전자 총 형질 전환법에 따라서 형질 전환 구조물 pSZ1499(서열 번호 246)으로 형질 전환하였다. pSZ1499는 프로토테카 모리포르미스 UTEX 1435 내 발현에 대해 코돈 최적화된 올레아 유로파에아 스테아로일-ACP 불포화 효소 유전자의 뉴클레오티드 서열을 포함하였다. 상기 pSZ1499 발현 구조물은 씨.레인하르드티 β -튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 핵내 게놈에의 통합에 사용되는, FADc 게놈 영역에 대한 5'(서열 번호 247) 및 3'(서열 번호 248) 상동성 재조합 표적화 서열(구조물에 측접함)을 함유하였다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열하였으며, 이는 선택 마커로서 사용되었다. 올레아 유로파에아 스테아로일-ACP 불포화 효소 암호화 영역은 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 두었으며, 천연 운반 펩티드는 클로렐라 프로토테코이데스 스테아로일-ACP 불포화 효소 운반 펩티드(서열 번호 49)로 치환하였다. 전체 오.유로파에아 SAD 발현 카세트는 pSZ1499라고 명명하였으며, FADc5'_btub-Suc2-nr_amt03-S106SAD-OeSAD-nr-FADc3'로서 표시될 수 있다.
유일한 탄소원으로서 수크로스를 함유하는 평판 상에서 1차 형질 전환체를 선택하였다. 각각의 형질 전환체를 클론으로서 정제하여, 이를 표준 지질 생산 조건(pH 7.0, 실시예 1에 기술된 조건과 유사한 조건) 하에서 생육하였다. 실시예 11에 기술된 바와 같은 표준 지방산 메틸 에스테르 가스 크로마토그래피 불꽃 이온화(FAME GC/FID) 검출법을 사용하여 지방산 프로필을 분석하였다. 형질 전환 벡터로 형질 전환하여 생산된 대표적인 클론 세트로부터 얻어진 지방산 프로필을 표 60에 보였다. 유일한 탄소원으로서 글루코스를 포함하는 지질 생산 조건(pH 5.0) 하에서 생육된, 형질 전환되지 않은 균주 C로부터 얻은 지질의 지방산 프로필을 표 60에 추가로 제시하였다.
표 60에 나타낸 바와 같이, 균주 C를 pSZ1499로 형질 전환하였을 경우, 형질 전환된 미생물의 지방산 프로필은 영향을 받았다. 형질 전환되지 않은 프로토테카 모리포르미스(UTEX 1435) 균주 C의 지방산 프로필은, C18:1 지방산 60% 미만과, C18:2 지방산 7% 이상이었다. 이와는 대조적으로, pSZ1499 로 형질 전환된 균주 C는 지방산 프로필에 있어서 C18:1 지방산의 조성은 증가하였고, 이와 아울러 C18:0 및 C18:2 지방산의 조성은 감소하였다. pSZ1499로 형질 전환된 균주 C의 지방산 프로필에 있어서 C18:2 지방산은 확인되지 않았다. pSZ1499 형질 전환체 내 C18:2 지방산이 검출 가능할 정도로 확인되지 않음은 곧, 다수의 FADc 게놈 위치로의 통합에 사용되는 상동성 재조합 표적화 서열을 보유하는 pSZ1499로 형질 전환되었을 때에는 FAD 활성을 나타내지 않았다는 것을 암시하는 것이었다.
다수의 FADc 대립유전자들이 pSZ1499 형질 전환 벡터에 의해 중단되었음을 입증하기 위하여 서던 블럿 분석법을 수행하였다. 표준 분자 생물학적 방법을 사용하여 게놈 DNA를 균주 C와 pSZ1499 형질 전환체로부터 추출하였다. 각각의 샘플로부터 얻은 DNA를 제한 효소 PstI로 절단한 후 0.8% 아가로스 겔 상에서 이동시켰다. 이 겔로부터 얻은 DNA를 나일론+ 막(애머샴(Amersham)) 상에 옮긴 다음, 이 DNA를 FADc 2' 영역과 상응하는 P32-표지화 폴리뉴클레오티드 프로브와 혼성화하였다. 도 3은, pSZ1499 형질 전환 카세트, 프로토테카 모리포르미스(UTEX 1435)의 서열 결정된 FADc 대립 유전자 2개, 그리고 크기를 예측할 수 있는 pSZ1499 형질 전환 벡터에 의해 중단된 대립 유전자들의 맵을 보여주는 것이다. FADc 대립 유전자 1은 PstI 제한 위치를 포함하였던 반면에, FADc 대립 유전자 2는 그렇지 않았다. SAD 카세트를 통합하면, PstI 제한 위치는 중단된 FADc 대립 유전자에 도입될 것이고, 그 결과, 어떤 대립 유전자가 중단되었는지 여부에 상관 없이 서던 블럿으로 약 6kb의 단편이 확인되었다. 도 4는 서던 블럿 분석 결과를 보여주는 것이다. 약 6kb에서의 혼성화 밴드는 형질 전환체 둘 다에서 확인되었다. 중단되지 않은 대립 유전자를 나타낼, 크기가 더 작은 혼성화 밴드는 확인되지 않았다. 이와 같은 결과들은 FADc 대립 유전자 둘 다는 pSZ1499에 의해 중단되었음을 보여주는 것이다.
FADc 지방산 불포화 효소의 대립 유전자 두 개를 SAD 발현 카세트로 소모시키면, 지방산 프로필에 있어서 C18:1이 약 74%였다. 종합해보면, 이러한 데이터는 조작된 미생물의 지방산 프로필을 바꾸는데 있어서, FAD 대립 유전자의 녹아웃과 스테아로일-ACP 불포화 효소의 외부 발현을 허용하는, 폴리뉴클레오티드의 유용성과 효율을 입증해주는 것이다.
실시예
19: 조작된 미생물로부터 생산된 가공 오일의 특징들
프로토테카 모리포르미스(UTEX 1435)를 형질 전환 벡터 pSZ1500(서열 번호 250)으로 형질 전환하는 방법과 그 효율은 이미 PCT 특허 출원 PCT/US2011/038463 및 PCT/US2011/038463에 기술되어 있다.
(고급 오일을 생산하기 위하여) 전통적 방식에 따라서 돌연 변이된 프로토테카 모리포르미스(UTEX 1435) 파생 균주, 즉 균주 C를, 실시예 2에 상세히 기술된 유전자 총 형질 전환법에 따라서 형질 전환 구조물 pSZ1500으로 형질 전환하였다. 유일한 탄소원으로서 수크로스를 함유하는 한천 평판 상에서 1차 형질 전환체를 선택하고, 이를 클론으로 정제한 다음, 단일 조작된 계열인 균주 D를 분석용으로 선택하였다. 균주 D는 본원에 기술된 바와 같이 생육하였다. 그 다음, 표준적 방법을 사용하여, 제조된 바이오매스로부터의 오일 헥산 추출법을 수행하였는데, 이 경우, 생성된 트리글리세라이드 오일은 잔여 헥산이 존재하지 않는 것으로 확인되었다. 익스펠러 프레스를 사용하여 미세 조류로부터 오일을 추출하는 기타 다른 방법은 본원에 참조로 포함되어 있는 PCT 특허 출원 PCT/US2010/31108호에 기술되어 있다.
이후, 널리 공지된 식물성 오일 가공법을 사용하여 균주 D의 바이오매스로부터 추출된 오일을 정제, 표백 및 탈취하였다. 이와 같은 방법들을 통하여 오일 샘플(RBD469)을 제조하였는데, 이 샘플을 대상으로, 미국 유지 화학회, 미국 재료 시험 협회 및 국제 표준화 기구에 규정된 방법에 따라서 분석 테스트 프로토콜 다수 개를 수행하였다. 이러한 분석 결과들은 하기 표 60에 요약되어 있다.
[표 60]
프로토테카 모리포르미스 균주 D RBD469 오일의 동일한 분획을 미량 원소 함량, 고체 지방 함량 및 로비본드 색상에 대해 분석하였다(AOCS 방법에 따름). 이와 같은 분석 결과들을 하기의 표 61, 표 62 및 표 63에 제시하였다.
RBD469 오일을 대상으로 에스테르 결합 전이법을 수행하여 지방산 메틸 에스테르(FAME)를 생산하였다. 얻어진 RBD469의 지방산 메틸 에스테르 프로필을 표 64에 나타내었다.
실시예
20: 지방산 프로필이 변경된 조작 미세 조류
전술한 바와 같이, 프로토테카 종 내 특이적 내인성 지질 경로 효소를 녹아웃 또는 녹다운하도록 이종 유전자를 통합시키면, 조작된 미생물의 지방산 프로필이 바뀔수 있었다. 본 실시예에서는 숙주 세포의 지질 프로필이, 내인성 지방 아실-ACP 티오에스테라제 유전자인 FATA1을 녹아웃 또는 녹다운함으로써 영향을 받을 수 있는지 여부에 대해 평가하기 위해 플라스미드 구조물을 제조하였다.
A. 내인성
프로토테카
모리포르미스
티오에스테라제
유전자를
녹아웃함으로써
지질 프로필 변경
(고급 오일을 생산하도록) 전통적 방식으로 돌연 변이된 프로토테카 모리포르미스 UTEX 1435 파생 균주, 균주 A에, 실시예 2의 방법을 사용하여 표 65의 플라스미드 구조물들 중 하나를 도입하여 이 균주를 형질 전환하였다. 각각의 구조물은, 씨.레인하르드티 β-튜불린 프로모터/5'UTR 및 클로렐라 불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 에스.세레비지아에 suc2 수크로스 인버타제 암호화 영역과 내인성 FATA1 유전자를 중단하는, 핵내 게놈으로의 통합에 사용되는 영역을 함유하였다. 이와 같은 에스.세레비지아에 suc2 발현 카세트는 서열 번호 159로서 나열하였으며, 이는 선택 마커로서 사용되었다. 모든 단백질 암호화 영역은, 표 2에 따라서 프로토테카 모리포르미스 UTEX 1435 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 최적화된 코돈이었다. 핵내 게놈 통합에 사용되는 FATA1 유전자에 대한 표적화 영역과 관련된 서열들을 이하에 나타내었다.
설 명
서열 번호
FATA1 위치로의 통합에 사용되는 5' 서열 서열 번호 251
FATA1 위치로의 통합에 사용되는 3' 서열 서열 번호 252
플라스미드 구조물 |
서열 요소 |
1 | FATA1-CrbTub_yInv_nr-FATA1 |
2 | FATA1-CrbTub_yInv_nr::amt03_CwTE2_nr-FATA1 |
구조물 FATA1-CrbTub_yInv_nr-FATA1(서열 번호 253) 내 관련 제한 위치들은 굵은 글씨체의 소문자에 밑줄을 쳐서 표시하였는데, 이 제한 위치들로서는 각각 5'→3' 방향의 BspQ 1, Kpn I, Asc I, Mfe I, Sac I, BspQ I이 있다. BspQI 위치는 형질 전환 DNA의 5' 및 3' 말단을 한정한다. 굵은 글씨체의 소문자로 표시한 서열은, 상동성 재조합을 통하여 FATA1 위치에서 표적화 통합이 일어나는 것을 허용하는 균주 A 유래 게놈 DNA를 나타낸다. 5'→3' 방향으로 진행하였을 때, (균주 A에 수크로스를 대사하는 능력을 부여하는) 효모 수크로스 인버타제 유전자의 발현을 작동하는 씨.레인하르드티 β-튜불린 프로모터는 글자에 박스를 쳐서 표시하였다. 인버타제에 대한 개시 인자 ATG와 종결 인자 TGA는 굵은 이탤릭체의 대문자로 표시하였으며, 암호화 영역은 이탤릭체 소문자로 표시하였다. 클로렐라 불가리스 질산염 환원 효소 3'UTR은 소문자에 밑줄을 쳐서 표시하였고, 그 다음에 존재하는 굵은 글씨체의 소문자는 균주 A의 FATA1 게놈 영역을 표시하는 것이었다.
쿠페아 라이티 ACP-티오에스테라제 2(CwTE2) 유전자(수탁 번호 제U56104호)를, 균주 A의 FATA1 위치에 도입하기 위하여, 프로토테카 모리포르미스 Amt03 프로모터/5'UTR(서열 번호 89) 및 씨.불가리스 질산염 환원 효소 3'UTR의 제어 하에 있는 CwTE2 유전자의 단백질 암호화 영역을 발현하는 구조물을 제조하였다. 균주 A 내에서 발현된 구조물은 FATA1-CrbTub_yInv_nr::amt03_CwTE2_nr-FATA1(서열 번호 254)이라 표시하였다.
구조물 FATA1-CrbTub_yInv_nr::amt03_CwTE2_nr-FATA1 내 관련 제한 위치들은 굵은 글씨체의 소문자에 밑줄을 쳐서 표시하였으며, 이 제한 위치들로서는 각각 5'→3' 방향의 BspQ 1, Kpn I, Asc I, Mfe I, BamH I, EcoR I, Spe I, Asc I, Pac I, Sac I, BspQ I이 있다. BspQI 위치들은 형질 전환 DNA의 5' 및 3' 말단을 한정하였다. 굵은 글씨체의 소문자로 표시한 서열은 상동성 재조합을 통하여 FATA1 위치에서의 표적화 통합을 허용하는 균주 A 유래 게놈 DNA를 나타낸다. 5'→3' 방향으로 진행하였을 때, (균주 A에 수크로스를 대사하는 능력을 부여하는) 효모 수크로스 인버타제 유전자의 발현을 작동하는 씨.레인하르드티 β-튜불린 프로모터는 문자에 박스를 쳐서 표시하였다. 인버타제에 대한 개시 인자 ATG와 종결 인자 TGA는 굵은 이탤릭체의 대문자로 표시하였으며, 암호화 영역은 이탤릭체 소문자로 표시하였다. 클로렐라 불가리스 질산염 환원 효소 3'UTR은 소문자에 밑줄을 쳐서 표시하였고, 그 다음에 존재하는 프로토테카 모리포르미스의 내인성 Amt03 프로모터는 이탤릭체 문자에 박스를 쳐서 표시하였다. 씨.라이티 ACP-티오에스테라제의 개시 인자 ATG 및 종결 인자 TGA 코돈은 굵은 이탤릭체의 대문자로 표시하였으며, ACP-티오에스테라제 암호화 영역의 나머지 부분은 굵은 이탤릭체로 표시하였다. 씨.불가리스 질산염 환원 효소 3'UTR은 또한 소문자에 밑줄을 쳐서 표시하였으며, 그 다음에 존재하는 균주 A FATA1 게놈 영역은 굵은 글씨체의 소문자로 표시하였다.
플라스미드 구조물 1 또는 2를 개별적으로 균주 A에 도입하여 이 균주를 형질 전환하고 나서, 유일한 탄소원으로서 수크로스를 포함하는 한천 평판 상에서 양성 클론들을 선택하였다. 상기 실시예들에서와 같이, 1차 형질 전환체를 클론으로서 정제한 다음, 표준적 지질 생산 조건(pH 7) 하에서 생육하고 나서, 각각의 형질 전환체 유래 무수 바이오매스로 지질 샘플들을 제조하였다. 실시예 11에 기술된 바와 같은 직접 에스테르 결합 전이법을 사용하여 지방산 프로필을 측정하였다. 구조물 1로 형질 전환하여 생성된 대표적인 클론 세트들로부터 얻어진 지방산 프로필(총 지방산의 면적%로 표시)을, 형질 전환되지 않은 균주 A 대조군의 지방산 프로필과 비교한 결과를 표 66에 제시하였다. 구조물 2로 형질 전환하여 생성된 대표적인 클론 세트들로부터 얻어진 지방산 프로필(총 지방산의 면적%로 표시)을, 형질 전환되지 않은 균주 A 대조군의 지방산 프로필과 비교한 결과를 표 67에 제시하였다.
표 66에 제시된 결과들은, 숙주의 내인성 FATA1 대립 유전자가 소모될 경우, 조작된 미세 조류의 지방산 프로필이 바뀐다는 것을 보여주는 것이다. 선택가능한 마커를 내인성 FATA1 대립 유전자에 표적화하였을 때, 형질 전환된 미생물의 지방산 프로필에 상기 표적화가 미치는 영향력으로 인하여 C16:0 지방산은 명확히 감소하였으며, 이와 아울러 C18:1 지방산은 증가하였다.
숙주 FATA1 대립 유전자에 선택가능한 마커만을 표적화하는 것과 아울러, 외인성 티오에스테라제와 함께 선택가능한 마커를 통합하였더니, 조작된 미세 조류의 지방산 프로필이 바뀌었다. 상기 표 67에 보인 바와 같이, FATA1 대립 유전자를 중단하는 외인성 티오에스테라제 유전자를 표적화한 결과, C16:0 지방산 생산이 명확히 감소하였다. FATA1 위치에서 CwTE2 티오에스테라제를 발현하면 또한, 분석된 형질 전환체 내에서 나타나는 외인성 티오에스테라제 활성의 수준에 의존적으로 중간쇄 지방산과 C18:1 지방산 생산에 영향을 미쳤다. 표적 통합 위치에서 증폭된 이식 유전자의 복사체 수와 티오에스테르 수준은 서로 조화가 매우 잘 되었다(이는 지방산 프로필에 대한 영향력이나 재조합 단백질 축적 여부(웨스턴 블럿팅에 의해 평가됨)에 의해 규명됨).
CwTE2 유전자를 증폭시킨 유전자 이식 계열에서는 C10:0 내지 C14:0 지방산이 눈에 띄게 증가하였고, 이와 아울러 C18:1 지방산은 감소하였다. 이와는 대조적으로, CwTE2를 약간 증폭시켰거나 아예 증폭시키지 않은 형질 전환체들은 외인성 티오에스테라제를 더욱 낮은 수준으로 발현하였으며, 그 결과, 중간쇄 지방산은 약간 증가하였고, C18:1 지방산의 증가에는 더욱 큰 영향을 미쳤다.
종합하여 보면, 상기 데이터는 숙주의 내인성 FATA1 대립 유전자가 표적 중단되면 조작된 미세 조류의 지질 프로필이 바뀐다는 것을 보여준다. 이 데이터는, FATA 대립 유전자를 표적 중단시켜, 조작된 미생물 세포의 지방산 프로필을 바꿀수 있는(특히 C16 지방산 농도를 감소시키고, C18:1 지방산 농도를 증가시킬 수 있는) 폴리뉴클레오티드의 유용성과 효율을 입증하였다. 상기 데이터는 또한, FATA 대립 유전자의 표적 중단을 허용함과 동시에, 조작된 미생물 세포의 지방산 프로필을 바꾸는(특히 C16 지방산의 농도를 감소시키는) 외인성 티오에스테라제를 발현하는, 폴리뉴클레오티드의 유용성과 효율도 입증하였다.
B. 내인성
프로토테카
모리포르미스
티오에스테라제
유전자의 녹다운에 의한 지질 프로필의 변화
RNAi에 의해 프로토테카 모리포르미스 FATA1 유전자 발현을 하향 조절하는 구조물을, 프로토테카 모리포르미스 UTEX 1435 균주 A 유전적 배경에 도입하였다. 사카로마이세스 세레비지아에 suc2 수크로스 인버타제 유전자를, 유일한 탄소원으로서 수크로스를 바탕으로 생육할 수 있는 능력을 부여하는 선택가능한 마커로서 이용하였다. 구조물은 FatA1 암호화 영역의 제1 엑손 → 내인성 인트론 → 제1 엑손의 역방향 반복 단위를 이용하였다. 6S 게놈 영역에 대한 5' 및 3' 상동성 재조합 표적화 서열(구조물에 측접)(각각 서열 번호 82 및 84로 나열됨)을 헤어핀 구조물의 통합을 위해 핵내 게놈에 포함시켰다. 이 구조물을 6S::β-Tub:suc2:nr:: β-tub:hairpinFatA:nr::6S로 명명하였다.
6S::β-Tub:suc2:nr:: β-tub:hairpin FatA:nr::6S 내 관련 제한 위치들은 굵은 글씨체의 소문자에 밑줄을 쳐서 표시하였으며, 이 제한 위치로서는 각각 5'→3' 방향의 BspQ 1, Kpn I, Mfe I, BamH I, EcoR I, Spe I, Xho I, Sac I, BspQ I이 있다. BspQI 위치는 형질 전환 DNA의 5' 말단 및 3' 말단을 한정한다. 굵은 글씨체의 소문자로 표시한 서열은 상동성 재조합을 통하여 6S 위치에서의 표적 통합을 허용하는 균주 A 유래 게놈 DNA를 나타낸다. 5'→3' 방향으로 진행되는, 효모 수크로스 인버타제 유전자(균주 A가 수크로스를 대사할 수 있는 능력 부여)의 발현을 작동하는 씨.레인하르드티 β-튜불린 프로모터는 글자에 박스를 쳐서 표시하였다. 인버타제에 대한 개시 인자 ATG 및 종결 인자 TGA는 굵은 이탤릭체의 대문자로 표시하였으며, 암호화 영역은 이탤릭체의 소문자로 표시하였다. 클로렐라 불가리스 질산염 환원 효소 3'UTR은 소문자에 밑줄을 쳐서 표시하였으며, 그 다음에 존재하는 제2 씨.레인하르드티 β-튜불린 프로모터(헤어핀 FatA1의 발현을 작동함)는 이탤릭체에 박스를 쳐서 표시하였다. FatA1의 개시 인자 ATG 코돈은 굵은 이탤릭체의 대문자로 표시하였으며, FatA1 암호화 영역의 제1 엑손의 나머지 부분은 대문자로 표시하였다. FatA 유전자의 인트론은 대문자에 밑줄을 쳐서 표시하였으며, 굵은 이탤릭체 대문자에 밑줄을 쳐서 표시한 링커 영역은 FatA1 인트론/역행 제1 엑손 접합부에 삽입하여, 이 벡터 내에서의 RNA 스플라이싱을 보조하도록 만들었다. FatA1의 역행 제1 엑손은 대문자로 표시하였다. 씨.불가리스 질산염 환원 효소 3'UTR도 역시 소문자에 밑줄을 쳐서 표시하였으며, 그 다음에 존재하는 균주 A의 6S 게놈 영역은 굵은 글씨체의 소문자로 표시하였다. 이 RNAi 구조물의 FATA 부분들의 서열은 서열 번호 255로서 나열하였다.
6S::β-Tub:suc2:nr:: β-tub:hairpin FatA:nr::6S를 발현하였을 경우, 헤어핀 RNA가 형성되어 표적 FatA 유전자 생성물이 침묵되었다. 구조물 6S::β-Tub:suc2:nr:: β-tub:hairpin FatA:nr::6S를 균주 A에 도입하여 이 균주를 형질 전환하고 나서, 유일한 탄소원으로서 수크로스를 포함하는 한천 평판 상에서 양성 클론들을 선택하였다. 1차 형질 전환체를 클론으로서 정제한 다음, 표준적 지질 생산 조건(pH 5.0) 하에서 생육하고 나서, 각각의 형질 전환체 유래 무수 바이오매스로 지질 샘플들을 제조하였다. 실시예 11에 기술된 바와 같은 직접 에스테르 결합 전이법을 사용하여 지방산 프로필을 측정하였다. 형질 전환하여 생성된 대표적인 클론 세트들로부터 얻어진 지방산 프로필(총 지방산의 면적%로 표시)을, 형질 전환되지 않은 균주 A 대조군의 지방산 프로필과 비교한 결과를 표 68에 제시하였다.
표 68에 제시된 데이터는, FATA 헤어핀 RNA 구조물의 발현이 숙주 유기체의 C16 및 C18:1 지방산 프로필에 미치는 명확한 영향력을 보여주는 것이다. FATA 헤어핀 RNA 구조물을 포함하는 균주 A 형질 전환체의 지방산 프로필은, C18:1 지방산 백분율이 증가하였음과 아울러, C16 지방산은 감소하였음이 확인되었다. 이러한 데이터는, 조작된 숙주 미생물의 지방산 프로필을 바꾸는데 있어서(특히 미생물 세포 내 C18:1 지방산 농도를 증가시키고, C16 지방산의 농도를 감소시키는데 있어서) 프로토테카 모리포르미스 내 폴리뉴클레오티드 FATA RNA 헤어핀 구조물의 성공적인 발현과 용도를 입증하는 것이다.
실시예
21: 클로렐라
소로키니아나의
조작
본 발명에 의하여, 본원에 기술된 바와 같이 Dawson(도슨) et al.에 의해 교시된 방법과 벡터를 변형함으로써 클로렐라 소로키니아나 내에서 재조합 유전자를 발현시킬 수 있었다. 간단히 말해서, 문헌[Dawson et al ., Current Microbiology Vol. 35 (1997) pp. 356-362]에는 플라스미드 DNA로 클로렐라 소로키니아나를 핵내에서 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 도슨은 미세 입자 투사법(microprojectile bombardment)과 같은 형질 전환법을 사용하여, 전 클로렐라 불가리스 질산염 환원 효소 유전자(NR, GenBank 수탁 번호 제U39931호)를 암호화하는 플라스미드 pSV72-NRg를 돌연 변이 클로렐라 소로키니아나(NR 돌연 변이체)에 도입하였다. 상기 NR 돌연 변이체는 질소원으로서 질산염을 사용하지 않으면 생육할 수 없었다. 질산염 환원 효소는 질산염이 아질산염으로 전환되는 것을 촉진한다. 형질 전환하기 전, 클로렐라 소로키니아나 NR 돌연 변이체는 유일한 질소원으로서 질산염(NO3 -)을 포함하는 배양 배지상에서 마이크로콜로니 단계 이상으로는 생육하지 못하였다. NR 돌연 변이체 클로렐라 소로키니아나 내 클로렐라 불가리스 NR 유전자 생성물의 발현은 질산염 대사 결핍을 복구하는 선택가능한 마커로서 사용되었다. pSV72-NRg 플라스미드로 형질 전환하여, 클로렐라 불가리스 NR 유전자 생성물을 안정적으로 발현하는 NR 돌연 변이 클로렐라 소로키니아나(유일한 탄소원으로서 질산염을 포함하는 한천 평판 상에서 마이크로콜로니 단계 이상으로 생육할 수 있었음)를 제조하였다. 안정적인 형질 전환체의 DNA 평가는 서던 블럿 분석법에 의해 수행되었으며, 안정적인 형질 전환체의 RNA 평가는 RNase 보호법(RNase protection)에 의해 수행되었다. 형질 전환된 클로렐라 소로키니아나(NR 돌연 변이체)의 선택과 유지는, 0.2g/L MgSO4, 0.67g/L KH2PO4, 3.5g/L K2HPO4, 1.0g/L Na3C6H5O7·H2O 및 16.0g/L 한천, 적당한 질소원(예를 들어, NO3 -), 미세 영양소 및 탄소원을 포함하는 한천 평판(pH 7.4) 상에서 수행되었다. 도슨은 또한 클로렐라 소로키니아나 및 클로렐라 소로키니아나 NR 돌연 변이체의 액체 배양 배지 중 번식에 대해서도 개시하였다. 도슨은 클로렐라 불가리스 질산염 환원 효소 유전자의 3' UTR/종결 인자와 프로모터, 그리고 플라스미드 pSV72-NRg는 클로렐라 소로키니아나 NR 돌연 변이체 중 이종 유전자를 발현하는데 적당하였다고 개시하였다. 도슨은 또한 클로렐라 불가리스 질산염 환원 효소 유전자 생성물의 발현은 클로렐라 소로키니아나 NR 돌연 변이체 내에서 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서는, 선택가능한 마커로서 사용될 클로렐라 불가리스 질산염 환원 효소(CvNR) 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pSV72-NRg를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택된 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은 표 69에 따른 클로렐라 소로키니아나의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 클로렐라 소로키니아나 내 발현에 대하여 최적화된 코돈이었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각 단백질 암호화 서열 상류의 CvNR 프로모터에 작동 가능하도록 결합될 수 있었고, 단백질 암호화 서열의 하류 또는 3' 영역에서 CvNR 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 추가로는 형질 전환 벡터의 표적화 게놈 통합에 사용되는 클로렐라 소로키니아나 게놈에 대한 상동성 영역을 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 클로렐라 소로키니아나는, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통해 형질 전환 벡터를 사용하여 안정적으로 형질 전환되었다. CvNR 유전자 생성물의 활성은, 예를 들어 클로렐라 소로키니아나 NR 돌연 변이 균주의 질소 동화 결핍을 복구하고, 형질 전환 벡터를 안정적으로 발현하는 클로렐라 소로키니아나 NR 돌연 변이체를 선택하는 선택가능한 마커로서 사용될 수 있었다. 클로렐라 소로키니아나 지질 생산에 적당한 생육 배지는 0.5g/L KH2PO4, 0.5g/L K2HPO4, 0.25g/L MgSO4-7H2O와, 보충 미량 영양소, 그리고 적당한 질소원과 탄소원을 포함하였으나, 이에 제한되는 것은 아니다(Patterson, Lipids Vol.5:7 (1970), pp.597-600). 클로렐라 소로키니아나 지질의 지방산 프로필은 본원에 기술된 분석 방법과 표준적 지질 추출법을 통하여 평가될 수 있었다.
실시예
22 내지
실시예
44: 도입 및 표
이하 실시예 22 내지 실시예 44는 본 발명에 따라서 다양한 미생물을 조작하는 것에 관해 기술하고 있다. 미생물의 지방산 프로필을 변경하기 위하여, 미생물을 유전자 변형할 수 있었는데, 이때, 내인성 또는 외인성 지질 생합성 경로 효소는 발현 또는 과발현되었거나, 발현이 약화되었다. 미생물 지질 자체의 지방산 프로필을 지방산 불포화 정도에 대해서 바꾸고, 지방산 사슬 길이를 감소 또는 증가시키기 위하여 미생물을 유전자 조작하는 단계는, 형질 전환 벡터(예를 들어, 플라스미드)의 설계 및 구성, 하나 이상의 벡터를 사용하는 미생물의 형질 전환, 형질 전환된 미생물(형질 전환체)의 선택, 형질 전환된 미생물의 생육, 그리고 조작된 미생물에 의해 생산된 지질의 지방산 프로필 분석을 포함한다.
숙주 유기체의 지방산 프로필을 바꾸는 이식 유전자는 다수의 진핵 미생물 내에서 발현될 수 있었다. 진핵 미생물, 예를 들어 클라미도모나스 레인하르드티, 클로렐라 엘립소이데아, 클로렐라 사카로필라, 클로렐라 불가리스, 클로렐라 케슬러리, 클로렐라 소로키니아나, 해마토코커스 플루비알리스, 고니움 펙토랄레, 볼복스 칼테리, 두날리엘라 터티올렉타, 두날리엘라 비리디스, 두날리엘라 살리나, 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체, 나노클로롭시스 종, 탈라시오시라 슈도나나, 파에오닥틸룸 트리코르누툼, 나비큘라 사프로필라, 실린드로테카 후시포르미스, 시클로텔라 크립티카, 심비오디늄 마이크로아드리악티큠, 암피디늄 종, 카에토세로스 종, 모르티에렐라 알피나, 그리고 야로위아 리폴리티카 내에서 이식 유전자를 발현하는 예는 과학 문헌에서 살펴볼 수 있다. 이와 같은 발현 기술들은 본 발명에 교시된 기술들 즉, 지방산 프로필에 변화가 있는 조작 미생물을 생산하기 위한 기술들과 통합될 수 있었다.
숙주 유기체의 지방산 프로필에 변화를 일으키는 이식 유전자는 또한 다수의 원핵 미생물 내에서 발현될 수도 있었다. 유지성 미생물, 예를 들어 로도코커스 오파쿠스 내에서 이식 유전자를 발현하는 것에 관한 예도 문헌에서 살펴볼 수 있다. 이와 같은 발현 기술들은 본 발명에 교시되어 있는 기술들 즉, 지방산 프로필에 변화가 있는 조작 미생물을 생산하기 위한 기술들과 통합될 수 있었다.
3-케토아실 ACP 합성 효소 쿠페아 후커리아나 3-케토아실-ACP 합성 효소(GenBank 수탁 번호제AAC68861.1호), 쿠페아 라이티 베타-케토아실-ACP 합성 효소 II(GenBank 수탁 번호 제AAB37271.1호), 쿠페아 란세올라타 베타-케토아실-ACP 합성 효소 IV(GenBank 수탁 번호 제CAC59946.1호), 쿠페아 라이티 베타-케토아실-ACP 합성 효소 II(GenBank 수탁 번호 제AAB37270.1호), 리시누스 커뮤니스 케토아실-ACP 합성 효소(GenBank 수탁 번호 제XP_002516228호), 고시피움 히르서텀 케토아실-ACP 합성 효소(GenBank 수탁 번호 제ADK23940.1호), 글리신 맥스 색소체 3-케토-아실-ACP 합성 효소 II-A(GenBank 수탁 번호 제AAW88763.1호), 엘라에이스 기니엔시스 베타-케토아실-ACP 합성 효소 II(GenBank 수탁 번호 제AAF26738.2호), 헬리안터스 아너스 색소체 3-케토-아실-ACP 합성 효소 I(GenBank 수탁 번호 제ABM53471.1호), 글리신 맥스 3-케토-아실-ACP 합성 효소 I(GenBank 수탁 번호 제NP_001238610.1호), 헬리안터스 아너스 색소체 3-케토-아실-ACP 합성 효소 II(GenBank 수탁 번호 제ABI18155.1호), 브라시카 나푸스 베타-케토아실-ACP 합성 효소 2(GenBank 수탁 번호 제AAF61739.1호), 페릴라 프루테센스 베타-케토아실-ACP 합성 효소 II(GenBank 수탁 번호 제AAC04692.1호), 헬리안터스 아너스 베타-케토아실-ACP 합성 효소 II(GenBank 수탁 번호 제ABI18155호), 리시누스 커뮤니스 베타-케토아실-ACP 합성 효소 II(GenBank 수탁 번호 제AAA33872호), 해마토코커스 플루비알리스 베타-케토아실 아실기 운반 단백질 합성 효소(GenBank 수탁 번호 제HM560033.1호), 자트로파 컬카스 베타 케토아실-ACP 합성 효소 I(GenBank 수탁 번호 제ABJ90468.1호), 파퓰러스 트리코카르파 베타-케토아실-ACP 합성 효소 I(GenBank 수탁 번호 제XP_002303661.1호), 코리안드럼 사티범 베타-케토아실-ACP 합성 효소 I(GenBank 수탁 번호 제AAK58535.1호), 아라비돕시스 탈리아나 3-옥소아실-[아실기-운반 단백질] 합성 효소 I(GenBank 수탁 번호 제NP_001190479.1호), 비티스 비니페라 3-옥소아실-[아실기-운반 단백질] 합성 효소 I(GenBank 수탁 번호 제XP_002272874.2호) 지방 아실-ACP 티오에스테라제 움벨루라리아 캘리포니카 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAC49001호), 신나모뮴 캠포라 지방 아실-ACP 티오에스 프래그란스 테라제(GenBank 수탁 번호 제Q39473호), 움벨루라리아 캘리포니카 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제Q41635호), 미리스티카 프래그란스지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAB71729호), 미리스티카 프래그란스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAB71730호), 엘라에이스 기니엔시스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제ABD83939호), 엘라에이스 기니엔시스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAD42220호), 파퓰러스 토멘토사 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제ABC47311호), 아라비돕시스 탈리아나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제NP_172327호), 아라비돕시스 탈리아나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제CAA85387호), 아라비돕시스 탈리아나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제CAA85388호), 고시피움 히르서텀 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제Q9SQI3호), 쿠페아 란세올라타 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제CAA54060호), 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAC72882호), 쿠페아 칼로필라 아종 메소스테몬 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제ABB71581호), 쿠페아 란세올라타 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제CAC19933호), 엘라에이스 기니엔시스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAL15645호), 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제Q39513호), 고시피움 히르서텀 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAD01982호), 비티스 비니페라 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제CAN81819호), 가르시니아 망고스타나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAB51525호), 브라시카 준세아 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제ABI18986호), 마듀카 론지폴리아 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAX51637호), 브라시카 나푸스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제ABH11710호), 브라시카 나푸스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제CAA52070.1호), 오리자 사티바(인디카 컬티바 군) 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제EAY86877호), 오리자 사티바(자포니카 컬티바 군) 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제NP_001068400호), 오리자 사티바(인디카 컬티바 군) 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제EAY99617호), 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAC49269호), 얼머스 아메리카나 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAB71731호), 쿠페아 란세올라타 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제CAB60830호), 쿠페아 팔루스트리스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAC49180호), 아이리스 게르마니카 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAG43858호, 아이리스 게르마니카 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAG43858.1호), 쿠페아 팔루스트리스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAC49179호), 미리스티카 프래그란스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAB71729호), 미리스티카 프래그란스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAB717291.1호), 쿠페아 후커리아나 지방 아실-ACP 티오에스테라제 GenBank 수탁 번호 제U39834호), 움벨루라리아 캘리포니카 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제M94159호), 신나모뮴 캠포라 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제U31813호), 리시누스 커뮤니스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제ABS30422.1호), 헬리안터스 아너스 아실-ACP 티오에스테라제(GenBank 수탁 번호 제AAL79361.1호), 자트로파 컬카스 아실-ACP 티오에스테라제(GenBank 수탁 번호 제ABX82799.3호), 제아 메이스 올레오일-아실기 운반 단백질 티오에스테라제(GenBank 수탁 번호 제ACG40089.1호), 해마토코커스 플루비알리스 지방 아실-ACP 티오에스테라제(GenBank 수탁 번호 제HM560034.1호) 불포화 효소 리넘 유시타티시멈 지방산 불포화 효소 3C(GenBank 수탁 번호 제ADV92272.1호), 리시누스 커뮤니스 오메가-3 지방산 불포화 효소, 소포체, 추정(GenBank 수탁 번호 제EEF36775.1호), 베르니시아 포르디 오메가-3 지방산 불포화 효소(GenBank 수탁 번호 제AAF12821호), 글리신 맥스 엽록소오메가 3 지방산 불포화 효소 아형 2(GenBank 수탁 번호 제ACF19424.1호), 프로토테카 모리포르미스 FAD-D 오메가 3 불포화 효소(서열 번호 221), 프로토테카 모리포르미스 리놀리에이트 불포화 효소(서열 번호 220), 칼타머스 팅크토리우스 델타 12 불포화 효소(GenBank 수탁 번호 제ADM48790.1호), 고시피움 히르서텀 오메가-6 불포화 효소(GenBank 수탁 번호 제CAA71199.1호), 글리신 맥스 마이크로좀 불포화 효소(GenBank 수탁 번호 제BAD89862.1호), 제아 메이스 지방산 불포화 효소(GenBank 수탁 번호 제ABF50053.1호), 브라시카 나파 리놀레산 불포화 효소(GenBank 수탁 번호 제AAA32994.1호), 카멜리나 사티바 오메가-3 불포화 효소(서열 번호 214), 프로토테카 모리포르미스 델타 12 불포화 효소 대립 유전자 2(서열 번호 212), 카멜리나 사티바 오메가-3 FAD7-1(서열 번호 215), 헬리안터스 아너스 스테아로일-ACP 불포화 효소(GenBank 수탁 번호 제AAB65145.1호), 리시누스 커뮤니스 스테아로일-ACP 불포화 효소(GenBank 수탁 번호 제AACG59946.1호), 브라시카 준세아 색소체 델타-9-스테아로일-ACP 불포화 효소(GenBank 수탁 번호 제AAD40245.1호), 글리신 맥스 스테아로일-ACP 불포화 효소(GenBank 수탁 번호 제ACJ39209.1호), 올레아 유로파에아 스테아로일-ACP 불포화 효소(GenBank 수탁 번호 제AAB67840.1호), 베르니시아 포르디 스테아로일-아실기-운반 단백질 불포화 효소(GenBank 수탁 번호 제ADC32803.1호), 데스큐라이니아 소피아 델타-12 지방산 불포화 효소(GenBank 수탁 번호 제ABS86964.2호), 유포비아 라가스카에 델타 12-올레산 불포화 효소(GenBank 수탁 번호 제AAS57577.1호), 클로렐라 불가리스 델타 12 지방산 불포화 효소(GenBank 수탁 번호 제ACF98528호), 클로렐라 불가리스 오메가-3 지방산 불포화 효소(GenBank 수탁 번호 제BAB78717호), 해마토코커스 플루비알리스 오메가-3 지방산 불포화 효소(GenBank 수탁 번호 제HM560035.1호), 해마토코커스 플루비알리스 스테아로일-ACP-불포화 효소 GenBank 수탁 번호 제EF586860.1호, 해마토코커스 플루비알리스 스테아로일-ACP-불포화 효소 GenBank 수탁 번호 제EF523479.1호 올리에이트 12-하이드록실라제 효소 리시누스 커뮤니스 올리에이트 12-하이드록실라제(GenBank 수탁 번호 제AAC49010.1호), 피사리아 린데이메리 올리에이트 12-하이드록실라제(GenBank 수탁 번호 제ABQ01458.1호), 피사리아 린데이메리 돌연 변이 이작용성 올리에이트 12-하이드록실라제:불포화 효소(GenBank 수탁 번호 제ACF17571.1호), 피사리아 린데이메리 이작용성 올리에이트 12-하이드록실라제:불포화 효소(GenBank 수탁 번호 제ACQ42234.1호), 피사리아 린데이메리 이작용성 올리에이트 12-하이드록실라제:불포화 효소(GenBank 수탁 번호 제AAC32755.1호), 아라비돕시스 라이라타 아종 라이라타(GenBank 수탁 번호 제XP_002884883.1호) |
실시예
22: 클로렐라
불가리스의
조작
본 발명에 따른 재조합 유전자의 발현을, 본원에 기술된 바와 같이 Chow(초우) 및 Tung(퉁) et al.에 의해 교시된 방법과 벡터를 변형하여 클로렐라 불가리스 내에서 수행할 수 있었다. 간단히 말해서, 문헌[Chow 및 Tung et al ., Plant Cell Reports, Volume 18 (1999), pp. 778-780]에는 클로렐라 불가리스를 플라스미드 DNA로 핵내에서 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 초우 및 퉁은, 전기 천공법과 같은 형질 전환법을 사용하여 플라스미드 pIG121-Hm(GenBank 수탁 번호 제AB489142호)을 클로렐라 불가리스에 도입하였다. pIG121-Hm의 뉴클레오티드 서열은, 베타-글루큐로니다제(GUS) 단백질 암호화 서열 상류의 CaMV 35S 프로모터에 작동 가능하도록 결합되었으며, 또한 GUS 단백질 암호화 서열 하류의 노팔린 합성 효소(nos) 유전자의 3'UTR/종결 인자에도 작동 가능하도록 결합된, GUS 리포터 유전자 생성물을 암호화하는 서열을 포함하였다. 플라스미드 pIG121-Hm 서열은 하이그로마이신 B 항생제 내성 카세트를 추가로 포함하였다. 이 하이그로마이신 B 항생제 내성 카세트는 하이그로마이신 포스포트랜스퍼라제(hpt, GenBank 수탁 번호 제BAH24259호) 유전자 생성물을 암호화하는 서열에 작동 가능하도록 결합된 CaMV 35S 프로모터를 포함하였다. 형질 전환하기 전, 클로렐라 불가리스는 50ug/㎖ 하이그로마이신 B를 포함하는 배양 배지 중에서 번식될 수 없었다. pIG121-Hm 플라스미드로 형질 전환을 수행한 결과, 50ug/㎖ 하이그로마이신 B를 포함하는 배양 배지중에서 번식한 클로렐라 불가리스 형질 전환체를 제조하였다. 클로렐라 불가리스 내 hpt 유전자 생성물의 발현은, 50ug/㎖의 하이그로마이신 B의 존재 하에 형질 전환된 클로렐라 불가리스의 번식을 가능하게 만들었는데, 이로써 클로렐라 불가리스 내에서 사용될 선택가능한 마커로서 하이그로마이신 B 내성 카세트의 유용성이 확립되었다. GUS 리포터 유전자의 검출 가능한 활성은, CaMV 35S 프로모터 및 nos 3'UTR이 클로렐라 불가리스 내 이종 유전자 발현을 가능하게 만드는데 적당함을 암시하였다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 형질 전환된 클로렐라 불가리스의 선택과 유지는 YA 배지(한천 및 4g/L 효모 추출물)를 포함하는 한천 평판 상에서 수행하였다. 액체 배양 배지 중 클로렐라 불가리스의 번식은 초우 및 퉁에 의해 기술된 바와 같이 수행되었다. YA 배지 이외의 배지 중에서 클로렐라 불가리스의 번식에 대해서는 이미 개시된 바 있다(예를 들어, 문헌[Chader et al., Revue des Energies Renouvelabes, Volume 14 (2011), pp. 21-26] 및 [Illman et al., Enzyme and Microbial Technology, Vol. 27 (2000), pp. 631-635] 참조). 초우 및 퉁은, 플라스미드 pIG121-Hm, CaMV 35S 프로모터 및 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자 3'UTR/종결 인자가 클로렐라 불가리스 내 이종 유전자 발현을 가능하게 만드는데 적당하다고 개시하였다. 뿐만 아니라, 초우 및 퉁은, 하이그로마이신 B 내성 카세트는 클로렐라 불가리스 내 선택가능한 마커로서 사용되기 적당하였다고 개시하였다. 부가의 플라스미드, 프로모터, 3'UTR/종결 인자, 그리고 클로렐라 불가리스 내 이종 유전자 발현을 가능하게 하는데 적당한 선택가능한 마커에 대해서는 문헌[Chader et al., Revue des Energies Renouvelabes, Volume 14 (2011), pp. 21-26]에 기술되어 있다.
본 발명의 하나의 구체예에서, 선택가능한 마커로 사용되는 하이그로마이신 B 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 pIG121-Hm을 구성하고 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 의한 클로렐라 불가리스의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 클로렐라 불가리스 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 회적화된 유전자 서열은 각각 단백질 암호화 서열 상류의 CaMV 35S 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에 있는 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 추가로는 클로렐라 불가리스 게놈에 상동성인 영역(형질 전환 벡터의 표적화 게놈 통합용)을 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 널리 공지된 형질 전환 기술, 예를 들어 전기 천공법 또는 기타 다른 공지된 방법을 통하여 클로렐라 불가리스는 형질 전환 벡터로 안정적으로 형질 전환될 수 있었다. 하이그로마이신 B 내성 유전자 생성물의 활성은, 예를 들어 하이그로마이신을 포함하는 한천 배지 상에서 형질 전환 벡터로 형질 전환된 클로렐라 불가리스를 선택하기 위한 마커로서 사용될 수 있었다. 클로렐라 불가리스 지질 생산에 적당한 생장 배지는 미량 금속이 보충되어 있으며, 임의로는 1.5g/L NaNO3도 함유하는 BG11 배지(0.04g/L KH2PO4, 0.075g/L CaCl2, 0.036g/L 시트르산, 0.006g/L 구연산 철 암모늄, 1㎎/L EDTA 및 0.02g/L Na2CO3)를 포함하나, 이에 제한되는 것은 아니다. 지질 생산용으로서 클로렐라 불가리스를 배양하는데 적당한 부가 배지는, 예를 들어 와타나베 배지(1.5g/L KNO3, 1.25g/L KH2PO4, 1.25 g l-1 MgSO4·7H2O, 20 mg l-1 FeSO4·7H2O와 미량 영양소, 그리고 저 질소 배지(203㎎/L (NH4)2HPO4, 2.236g/L KCl, 2.465g/L MgSO4, 1.361g/L KH2PO4 및 10㎎/L FeSO4 포함))를 포함한다(Illman et al., Enzyme and Microbial Technology, Vol. 27 (2000), pp. 631-635). 클로렐라 불가리스 지질의 지방산 프로필은 본원에 기술된 바와 같은 표준적인 지질 추출 및 분석 방법을 통하여 평가할 수 있었다.
실시예
23: 클로렐라
엘립소이데아의
조작
본 발명에 따라서, 재조합 유전자의 발현은 본원에 기술된 바와 같이 Chen(첸) et al.에 의하여 교시된 방법과 벡터를 변형하여 클로렐라 엘립소이데아 내에서 이루어질 수 있었다. 간단히 말해서, 문헌[Chen et al., Current Genetics, Vol. 39:5 (2001), pp. 365-370]에는 클로렐라 엘립소이데아를 플라스미드 DNA로 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 첸은 전기 천공법과 같은 형질 전환법을 사용하여 플라스미드 pBinUWNP-1을 클로렐라 엘립소이데아에 도입하였다. pBinUWNP-1의 뉴클레오티드 서열은 호중구 펩티드-1(NP-1) 단백질 암호화 영역 상류의 제아 메이스 유비쿼틴(ubi1) 유전자 프로모터에 작동 가능하도록 결합되어 있으며, 또한 NP-1 단백질 암호화 영역 하류의 노팔린 합성 효소(nos) 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합된, NP-1 토끼 유전자 생성물 암호화 서열을 포함하였다. 플라스미드 pBinUWNP-1의 서열은 또한 G418 항생제 내성 카세트를 추가로 포함하였다. 이 G418 항생제 내성 카세트는 아미노글리코시드 3'-포스포트랜스퍼라제(aph 3') 유전자 생성물을 암호화하는 서열을 포함하
였다. aph 3' 유전자 생성물은 항생제 G418에 대한 내성을 부여하였다. 형질 전환하기 전, 클로렐라 엘립소이데아는 30ug/㎖ G418을 포함하는 배양 배지 중에서 번식할 수 없었다. pBinUWNP-1 플라스미드로 형질 전환하여, 30ug/㎖ G418을 포함하는 선택 배양 배지 중에서 번식한 클로렐라 엘립소이데아 형질 전환체를 제조하였다. 클로렐라 엘립소이데아 내에서 aph 3' 유전자 생성물을 발현하면, 30ug/㎖ G418 존재 하에 형질 전환된 클로렐라 엘립소이데아가 번식할 수 있었으므로, 클로렐라 엘립소이데아 내에서 사용될 G418 항생제 내성 카세트의 선택가능한 마커로서의 유용성이 확립되었다. NP-1 유전자 생성물의 검출 가능한 활성은, ubi1 프로모터와 nos 3'UTR이 클로렐라 엘립소이데아 내에서의 이종 유전자 발현을 가능하게 만드는데 적당하다는 것을 나타낸다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가하였다. 형질 전환된 클로렐라 엘립소이데아의 선택 및 유지는 납(Knop) 배지(0.2g/L K2HPO4, 0.2g/L MgSO4 ·7H2O, 0.12g/L KCl 및 10㎎/L FeCl3(pH 6.0 내지 8.0)를 포함하고, 0.1% 효모 추출물과 0.2% 글루코스가 보충됨)로서, 15ug/㎖ G418(액체 배양액용) 또는 30ug/㎖ G418(1.8% 한천을 포함하는 고체 배양액용)을 포함하는 배지에서 수행되었다. 납 배지 이외의 배지 중에서 클로렐라 엘립소이데아를 번식시키는 것에 대해서는 개시된 바 있다(문헌[Cho et al ., Fisheries Science, Vol. 73:5 (2007), pp. 1050-1056], [Jarvis 및 Brown, Current Genetics, Vol. 19 (1991), pp.317-321] 및 [Kim et al ., Marine Biotechnology, Vol. 4 (2002), pp.63-73] 참조). 부가의 플라스미드, 프로모터, 3'UTR/종결 인자 및 클로렐라 엘립소이데아 내에서 이종 유전자를 발현하는데 적당한 선택가능한 마커에 대해서도 개시된 바 있다(문헌[Jarvis 및 Brown 및 Kim et al ., Marine Biotechnology, Vol. 4 (2002), pp.63-73] 참조). 첸은, 플라스미드 pBinUWNP-1, ubi1 프로모터, 그리고 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자 3'UTR/종결 인자가 클로렐라 엘립소이데아 내에서 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 첸은, pBinUWNP-1 상에서 암호화된 G418 내성 카세트가 클로렐라 엘립소이데아 내에서 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, aph 3' 유전자 생성물을 암호화하고, G418에 대한 내성을 부여하며, 선택가능한 마커로서 사용되는 뉴클레오티드 서열을 포함하는 벡터 pBinUWNP-1을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택된 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은 표 69에 의한 클로렐라 엘립소이데아의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 클로렐라 엘립소이데아 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 회적화된 유전자 서열은 각각 단백질 암호화 서열 상류의 제아 메이스 ubi1 프로모터에 작동 가능하도록 결합될 수 있으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에 있는 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 추가로 클로렐라 엘립소이데아 게놈에 상동성인 영역(형질 전환 벡터의 표적화 게놈 통합용)을 포함하였다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 널리 공지된 형질 전환 기술, 예를 들어 전기 천공법 또는 기타 다른 공지된 방법을 통하여 클로렐라 엘립소이데아는 형질 전환 벡터로 안정적으로 형질 전환되었다. aph3' 유전자 생성물의 활성은, 예를 들어 G418을 포함하는 납 한천 배지 상에서 형질 전환 벡터로 형질 전환된 클로렐라 엘립소이데아를 선택하기 위한 마커로서 사용될 수 있었다. 클로렐라 엘립소이데아 지질 생산에 적당한 생장 배지는 납 배지와, 자비스(Jarvis) 및 브라운(Brown) 및 Kim et al.에 의해 개시된 배양 배지들을 포함하나, 이에 제한되는 것은 아니다. 클로렐라 엘립소이데아 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
24: 클로렐라
케슬러리의
조작
본 발명에 따라서, 재조합 유전자의 발현은 본원에 기술된 El-Sheekh(엘-쉬크) et al.에 의해 교시된 방법과 벡터를 변형하여 클로렐라 케슬러리 내에서 이루어졌다. 간단히 말해서, 문헌[El-Sheekh et al ., Biologia Plantarium, Vol. 42:2 (1999), pp. 209-216]에는, 플라스미드 DNA로 클로렐라 케슬러리를 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 엘-쉬크는 미세 입자 투사법과 같은 형질 전환법을 사용하여 플라스미드 pBI121(GenBank 수탁 번호 제AF485783호)를 클로렐라 케슬러리에 도입하였다. 플라스미드 pBI121은 카나마이신/네오마이신 항생제 내성 카세트를 포함하였다. 이 카나마이신/네오마이신 항생제 내성 카세트는, 아그로박테리움 튜미파시엔스 노팔린 합성 효소(nos) 유전자 프로모터, 네오마이신 포스포트랜스퍼라제 II(nptII) 유전자 생성물을 암호화하는 서열(GenBank 수탁 번호 제AAL92039호)(카나마이신 및 G418에 대한 내성 부여용), 그리고 아그로박테리움 튜미파시엔스 노팔린 합성 효소(nos) 유전자의 3'UTR/종결 인자를 포함하였다. pBI121은, CaMV 35S 프로모터에 작동 가능하도록 결합되고, 또한 nos 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합된 베타-글루쿠로니다제(GUS) 리포터 유전자 생성물을 암호화하는 서열을 추가로 포함하였다. 형질 전환하기 전, 클로렐라 케슬러리는 15ug/L 카나마이신을 포함하는 배양 배지 중에서 번식할 수 없었다. 상기 균주를 pBI121 플라스미드로 형질 전환하여, 15㎎/L 카나마이신을 포함하는 선택 배양 배지중에서 번식한 클로렐라 케슬러리 형질 전환체를 제조하였다. 클로렐라 캐슬러리 내 nptII 유전자 생성물의 발현은, 이 균주가 15㎎/L 카나마이신의 존재 하에서 번식할 수 있도록 만들 수 있으므로, 카나마이신/네오마이신 항생제 내성 카세트의 클로렐라 케슬러리 내에서 사용될 선택가능한 마커로서의 유용성이 확립되었다. GUS 유전자 생성물의 검출 가능한 활성은, CaMV 35S 프로모터와 nos 3'UTR이 클로렐라 케슬러리 내에서 이종 유전자 발현을 가능하도록 만드는데 적당하다는 것을 암시하였다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 엘-쉬크에 의해 개시된 바와 같이, 형질 전환된 클로렐라 케슬러리의 선택과 유지는, YEG 배지(1% 효모 추출물, 1% 글루코스) 및 15㎎/L 카나마이신을 포함하는 반고체 한천 평판 상에서 수행되었다. 엘-쉬크는 또한 YEG 액체 배양 배지 중 클로렐라 케슬러리의 번식에 대해 개시하였다. 지질 생산을 위해 클로렐라 케슬러리를 배양하는데 적당한 부가의 배지는 문헌[Sato et al., BBA Molecular and Cell Biology of Lipids, Vol. 1633 (2003), pp. 27-34]에 개시되어 있다. 엘-쉬크는, 플라스미드 pBI121, CaMV 프로모터, 그리고 노팔린 합성 효소 유전자 3'UTR/종결 인자가 클로렐라 케슬러리 내에서 이종 유전자 발현을 가능하게 만드는데 적당하다고 개시하였다. 뿐만 아니라, 엘-쉬크는, pBI121 상에 암호화된 카나마이신/네오마이신 내성 카세트가 클로렐라 케슬러리 내에서 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용할 카나마이신/네오마이신 내성 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pBI121을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택된 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은, 표 69에 의하여 클로렐라 케슬러리의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 클로렐라 케슬러리 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 상류의 CaMV 35S 프로모터에 작동 가능하도록 결합될 수 있으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에서 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 추가로는 형질 전환 벡터로의 표적화 게놈 통합용인, 클로렐라 케슬러리 게놈에 상동성인 영역을 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 형질 전환 벡터로 클로렐라 케슬러리를 안정적으로 형질 전환하는 것은, 널리 알려진 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법들을 통하여 이루어졌다. nptII 유전자 생성물의 활성은, 카나마이신이나 네오마이신을 포함하는 YEG 한천 배지(이에 제한되는 것은 아님) 상에서 형질 전환 벡터로 형질 전환된 클로렐라 케슬러리를 선택하기 위한 마커로서 사용될 수 있었다. 클로렐라 케슬러리 지질 생산에 적당한 생장 배지는 YEG 배지와, Sato et al.에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 클로렐라 케슬러리 지질의 지방산 프로필은 본원에 기술된 분석 방법과 표준적인 지질 추출법을 통하여 평가될 수 있었다.
실시예
25:
두날리엘라
터티올렉타의
조작
본 발명에 따라서, 두날리엘라 터티올렉타 내 재조합 유전자의 발현은 본원에 기술된 바와 같이, Walker(워커) et al.에 의해 교시된 방법과 벡터를 변형함으로써 이루어질 수 있었다. 간단히 말해서, 문헌[Walker et al ., Journal of Applied Phycology, Vol. 17 (2005), pp. 363-368]에는 두날리엘라 터티올렉타를 플라스미드 DNA로 안정적으로 핵내 형질 전환하는 것에 대해 개시되어 있다. 워커는 전기 천공법과 같은 형질 전환법을 사용하여 플라스미드 pDbleFLAG1.2를 두날리엘라 터티올렉타에 도입하였다. pDbleFLAG1.2는, 스트렙토알로테이쿠스 힌두스타너스(Streptoalloteichus hindustanus) 블레오마이신 결합 단백질(ble)을 암호화하는 서열을 포함하는 블레오마이신 항생제 내성 카세트(항생제 플레오마이신에 대한 내성 부여)를 암호화하는 서열로서, 두날리엘라 터티올렉타 리불로스-1,5-비스포스페이트 카복실라제/옥시게나제 소형 서브유닛 유전자(rbcS1, GenBank 수탁 번호 제AY530155호)의 3'UTR과 프로모터에 작동 가능하도록 결합된 서열을 포함하였다. 형질 전환하기 전, 두날리엘라 터티올렉타는 1㎎/L 플레오마이신을 포함하는 배양 배지 내에서 번식할 수 없었다. 이 균주를 pDbleFLAG1.2 플라스미드를 사용하여 형질 전환하여, 1㎎/L 플레오마이신을 포함하는 선택 배양 배지 내에서 번식한 두날리엘라 터티올렉타 형질 전환체를 제조하였다. ble 유전자 생성물의 두날리엘라 터티올렉타 내 발현은, 1㎎/L 플레오마이신의 존재 하에서 번식을 가능하게 만들었으며, 이로써 두날리엘라 터티올렉타 내에서 사용될 선택가능한 마커로서 블레오마이신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 워커에 의해 개시된 바와 같이, 형질 전환된 두날리엘라 터티올렉타의 선택 및 유지는, 4.5g/L NaCl 및 1㎎/L 페오마이신을 추가로 포함하는 두날리엘라 배지(DM, 문헌[Provasoli et al., Archiv fur Mikrobiologie, Vol. 25 (1957), pp. 392-428]에 개시된 바와 같음) 중에서 이루어졌다. 지질을 생산하기 위하여 두날리엘라 터티올렉타를 배양하는데 적당한 부가의 배지는 문헌[Takagi et al ., Journal of Bioscience and Bioengineering, Vol. 101:3 (2006), pp. 223-226] 및 [Massart 및 Hanston, Proceedings Venice 2010, Third International Symposium on Energy from Biomass and Waste]에 기술되어 있다. 워커는, 플라스미드 pDbleFLAG1.2, 두날리엘라 터티올렉타 리불로스-1,5-비스포스페이트 카복실라제/옥시게나제 소형 서브유닛 유전자의 3'UTR 및 프로모터가, 두날리엘라 터티올렉타 내 이종 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 워커는 pDbleFLAG1.2 상에 암호화된 블레오마이신 내성 카세트가 두날리엘라 터티올렉타 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서는, 선택가능한 마커로서 사용되는 ble 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pDbleFLAG1.2를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택된 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은, 표 69에 의하여 두날리엘라 터티올렉타의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 두날리엘라 터티올렉타 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 rbcS1 프로모터에 작동 가능하도록 결합될 수 있으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에 있는 rbcS1 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용될 두날리엘라 터티올렉타 게놈에 대한 상동성 영역을 추가로 포함할 수도 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 두날리엘라 터티올렉타를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 전기 천공법 또는 기타 다른 공지된 방법들을 사용하여 이루어질 수 있었다. ble 유전자 생성물의 활성은, 예를 들어 페오마이신을 포함하는 DM 배지에서 형질 전환 벡터로 형질 전환된 두날리엘라 터티올렉타를 선택하기 위한 마커로서 사용될 수 있었다. 두날리엘라 터티올렉타 지질 생산에 적당한 생장 배지로서는 DM 배지와, Takagi et al. 및 Massart 및 Hanston에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 두날리엘라 터티올렉타 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법들을 통하여 평가될 수 있었다.
실시예
26:
볼복스
카르테리의
조작
본 발명에 따라서 볼복스 카르테리 내 재조합 유전자의 발현은 본원에 기술된 바와 같이, Hallman(홀맨) 및 Rappel(라펠) et al.에 의해 교시된 방법과 벡터를 변형함으로써 이루어질 수 있었다. 간단히 말해서, 문헌[Hallman 및 Rappel et al ., The Plant Journal, Volume 17 (1999), pp. 99-109]에는 볼복스 카르테리를 플라스미드 DNA로 안정적으로 핵내 형질 전환하는 것을 기술한다. 홀맨과 라펠은 미세 입자 투사법과 같은 형질 전환법을 사용하여 pzeoE 플라스미드를 볼복스 카르테리에 도입하였다. pzeoE 플라스미드는, 스트렙토알로테이쿠스 힌두스타너스 블레오마이신 결합 단백질(ble)을 암호화하는 서열을 포함하는 블레오마이신 항생제 내성 카세트(항생제 제오신에 대한 내성 부여)를 암호화하는 서열로서, 볼복스 카르테리 베타-튜불린 유전자(GenBank 수탁 번호 제L24547호)의 3'UTR과 프로모터에 작동 가능하도록 결합된 서열을 포함하였다. 형질 전환하기 전, 볼복스 카르테리는 1.5ug/mL 제오신을 포함하는 배양 배지 내에서 번식할 수 없었다. 이 균주를 pzeoE 플라스미드를 사용하여 형질 전환하여, 20ug/mL 이상의 제오신을 포함하는 선택 배양 배지 내에서 번식된 볼복스 카르테리 형질 전환체를 제조하였다. ble 유전자 생성물의 볼복스 카르테리 내 발현은, 20ug/mL 제오신의 존재 하에서 번식을 가능하게 만들었으며, 이로써 볼복스 카르테리 내에서 사용될 선택가능한 마커로서 블레오마이신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 홀맨과 라펠에 의해 개시된 바와 같이, 형질 전환된 볼복스 카르테리의 선택 및 유지는, 1㎎/L 페오마이신을 포함하는 볼복스 배지(VM, 문헌[Provasoli 및 Pintner, The Ecology of Algae, Special Publication No. 2 (1959)], [Tyron, C.A. 및 Hartman, R.T., eds., Pittsburgh: Univeristy of Pittsburgh, pp. 88-96]에 개시된 바와 같음) 중에서 이루어졌다. 지질을 생산하기 위하여 볼복스 카르테리를 배양하는데 적당한 배지는 문헌[Starr in Starr R,C,. Dev Biol Suppl., Vol. 4 (1970), pp.59-100]에 기술되어 있다. 홀맨과 라펠은 플라스미드 pzeoE, 볼복스 카르테리 베타-튜불린 유전자의 3'UTR 및 프로모터가, 볼복스 카르테리 내 이종 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 홀맨과 라펠은 pzeoE 상에 암호화된 블레오마이신 내성 카세트가 볼복스 카르테리 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다. 부가의 플라스미드, 프로모터, 3'UTR/종결 인자, 그리고 볼복스 카르테리 내 이종 유전자 발현을 가능하게 하고, 볼복스 카르테리 내 선택 마커로서 사용되기 적당한 선택가능한 마커에 대해서도 개시된 바 있다(예를 들어, 문헌[Hallamann 및 Sumper, Proceedings of the National Academy of Sciences, Vol. 91 (1994), pp 11562-11566] 및 [Hallman 및 Wodniok, Plant Cell Reports, Volume 25 (2006), pp. 582-581]을 참조한다).
본 발명의 하나의 구체예에서는, 선택가능한 마커로서 사용되는 ble 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pzeoE를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택된 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은, 표 69에 의하여 볼복스 카르테리의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 볼복스 카르테리 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 볼복스 카르테리 베타-튜불린 프로모터에 작동 가능하도록 결합될 수 있으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에 있는 볼복스 카르테리 베타-튜불린 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용될 볼복스 카르테리 게놈에 대한 상동성 영역을 추가로 포함할 수도 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 당업자는 볼복스 카르테리 게놈 내 서열에 존재하는 이와 같은 상동성 영역을 동정할 수 있다(문헌[Prochnik et al., Science, Vol. 329:5988 (2010), pp223-226] 참조). 볼복스 카르테리를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법들을 사용하여 이루어졌다. ble 유전자 생성물의 활성은, 예를 들어 제오신을 포함하는 VM 배지 상에서 형질 전환 벡터로 형질 전환된 볼복스 카르테리를 선택하기 위한 마커로서 사용될 수 있었다. 볼복스 카르테리 지질 생산에 적당한 생장 배지로서는 VM 배지와, 스타(Starr)에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 볼복스 카르테리 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법들을 통하여 평가될 수 있었다.
실시예
27:
해마토코커스
플루비알리스의
조작
본 발명에 따라서 해마토코커스 플루비알리스 내 재조합 유전자의 발현은 본원에 기술된 바와 같이, Steinbrenner(슈타인브레너) 및 Sandmann(샌드만) et al.에 의해 교시된 방법과 벡터를 변형함으로써 이루어질 수 있었다. 간단히 말해서, 문헌[Steinbrenner 및 Sandmann et al ., Applied and Environmental Microbiology, Vol. 72:12 (2006), pp.7477-7484]에는 해마토코커스 플루비알리스를 플라스미드 DNA로 안정적으로 핵내 형질 전환하는 것에 대해 개시되어 있다. 슈타인브레너는 미세 입자 투사법과 같은 형질 전환법을 사용하여 pPlat-pds-L504R을 해마토코커스 플루비알리스에 도입하였다. pPlat-pds-L504R 플라스미드는, 해마토코커스 플루비알리스 피토엔 불포화 효소 유전자(Pds, GenBank 수탁 번호 제AY781170호)의 3'UTR, 단백질 암호화 서열 및 프로모터를 포함하는 노르플루라존 내성 카세트를 포함하였으며, 여기서, Pds의 단백질 암호화 서열은 504번 위치가 변형되어(즉 루신이 아르기닌으로 바뀌어), 제초제 노르플루라존에 대한 내성을 부여하는 유전자 생성물(Pds-L504)을 암호화하였다. pPlat-pds-L504R로 형질 전환하기 전, 해마토코커스 플루비알리스는 5uM 노르플루라존을 포함하는 배지 상에서 번식할 수 없었다. pPlat-pds-L504R 플라스미드로 형질 전환하여, 5uM 노르플루라존을 포함하는 선택 배양 배지중에서 번식한 헤마토코커스 플루비알리스 형질 전환체를 제조하였다. 해마토코커스 플루비알리스 내 Pds-L504R 유전자 생성물의 발현은, 5uM 노르플루라존의 존재 하에서 번식이 가능하도록 만들었는데, 이로써 해마토코커스 플루비알리스 내에서 사용되는 선택가능한 마커로서 노르플루라존 제초제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 슈타인브레너에 의해 개시된 바와 같이, 형질 전환된 해마토코커스 플루비알리스의 선택 및 유지는, 2.42g/L 트리스-아세테이트 및 5mM 노르플루라존이 보충된 OHA 배지(OHM(0.41g/L KNO3, 0.03g/L Na2HPO4, 0.246g/L MgSO4·7H2O, 0.11g/L CaCl2·2H2O, 2.62mg/L Fe( III )citrate x H2O, 0.011㎎/L CoCl2·6H2O, 0.012㎎/L CuSO4·5H2O, 0.075㎎/L Cr2O3, 0.98㎎/L MnCl2·4H2O, 0.12㎎/L Na2MoO4 x 2H20, 0.005㎎/L SeO2 및 25㎎/L 바이오틴, 17.5㎎/L 티아민, 그리고 15㎎/L 비타민 B12))를 포함하는 한천 평판 상에서 이루어졌다. 액체 배양액 중 해마토코커스 플루비알리스의 번식은 슈타인브레너 및 샌드만에 의해 기저 배지(문헌[Kobayashi et al ., Applied and Environmental Microbiology, Vol. 59 (1993), pp.867-873]에 기술되어 있는 기저 배지)를 사용하여 이루어졌다. 슈타인브레너와 샌드만은, pPlat-pds-L504R 플라스미드, 해마토코커스 플루비알리스 파이토엔 불포화 효소 유전자의 3'UTR과 프로모터는 해마토코커스 플루비알리스 내 이종 발현을 가능하게 하는데 적당하였다고 개시하였다. 뿐만 아니라, 슈타인브레너와 샌드만은, pPlat-pds-L504R상에서 암호화되는 노르플루라존 내성 카세트는 해마토코커스 플루비알리스 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다. 부가의 플라스미드, 프로모터, 3'UTR/종결 인자, 그리고 해마토코커스 플루비알리스 내에서 이종 유전자를 발현하는데 적당한 선택가능한 마커에 대해서는 문헌[Kathiresan et al., Journal of Phycology, Vol. 45 (2009), pp 642-649]에 개시되어 있다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 Pds-L504R 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pPlat-pds-L504R을 구성하고, 이 벡터가 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 의하여 해마토코커스 플루비알리스의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 해마토코커스 플루비알리스 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 해마토코커스 플루비알리스 pds 유전자 프로모터에 작동 가능하도록 결합될 수 있으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에 있는 해마토코커스 플루비알리스 pds 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용될 해마토코커스 플루비알리스 게놈에 대한 상동성 영역을 추가로 포함할 수도 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 해마토코커스 플루비알리스를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법들을 사용하여 이루어졌다. Pds-L504R 유전자 생성물의 활성은, 예를 들어 노르플루라존을 포함하는 OHA 배지에서 형질 전환 벡터로 형질 전환된 해마토코커스 플루비알리스에 대하여 선택하기 위한 마커로서 사용될 수 있었다. 해마토코커스 플루비알리스 지질 생산에 적당한 생장 배지는 기저 배지 및 문헌[Kobayashi et al., Kathiresan et al, and Gong and Chen, Journal of Applied Phycology, Vol. 9:5 (1997), pp. 437-444]에 기술된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 해마토코커스 플루비알리스 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
28:
클로스테리움
페라세로섬
-
스트리고섬
-
리토랄레
복합체의 조작
본 발명에 따라서 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 내 재조합 유전자 발현은 본원에 기술된 바와 같은 Abe(아베) et al.에 의해 교시된 방법과 벡터를 변형하여 이루어질 수 있었다. 간단히 말하면, 문헌[Abe et al., Plant Cell Physiology, Vol. 52:9 (2011), pp. 1676-1685]에는, 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체를 플라스미드 DNA로 안정적으로 핵내 형질 전환하는 것에 관하여 개시되어 있다. 아베는 미세 입자 투사법과 같은 형질 전환법을 사용하여 플라스미드 pSA106을 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체에 도입하였다. 플라스미드 pSA106은, 스트렙토알로테이쿠스 힌두스타너스 블레오마이신 결합 단백질 유전자(ble, GenBank 수탁 번호 제CAA37050호)를 암호화하는 서열을 포함하는 블레오마이신 내성 카세트로서, 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 엽록소 a/b 결합 단백질 유전자(CAB, GenBank 수탁 번호 제AB363403호)의 3'UTR과 프로모터에 작동 가능하도록 결합된 카세트를 포함하였다. Psa106으로 형질 전환하기 전, 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체는 3ug/mL 플레오마이신을 포함하는 배지에서 번식할 수 없었다. pSA106을 사용하여 형질 전환하여, 3ug/mL 플레오마이신을 포함하는 선택 배양 배지 내에서 번식한 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 형질 전환체를 제조하였다. ble 유전자 생성물의 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 내 발현은, 3ug/mL 플레오마이신의 존재 하에서 번식을 가능하게 만들었는데, 이로써 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 내에서 사용될 선택가능한 마커로서 블레오마이신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 아베에 의해 개시된 바에 의하면, 형질 전환된 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체의 선택 및 유지는 우선, C 배지(0.1g/L KNO3, 0.015g/L Ca(NO3)2·4H2O, 0.05g/L 글리세로포스페이트 -Na2, 0.04g/L MgSO4·7H2O, 0.5g/L 트리스(하이드록실메틸) 아미노메탄, 미량 무기물, 바이오틴, 비타민 B1 및 B12)를 포함하는 탑 한천에서 수행되었으며, 이후에는 이 복합체를 분리하여, C 배지를 포함하고 플레오마이신이 보충된 한천 평판으로 옮겼다고 개시하였다. 아베에 의해 개시된 바에 의하면, 액체 배양액 중 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체의 번식은 C 배지 중에서 수행되었다. 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체의 번식에 적당한 부가의 액체 배양 배지에 대해서는 문헌[Sekimoto et al ., DNA Research, 10:4 (2003), pp. 147-153]에 기술되어 있다. 아베는, 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 CAB 유전자의 3'UTR, 프로모터 및 pSA106 플라스미드는 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 내에서 이종 유전자 발현을 가능하게 하는데 적당하였다고 개시하였다. 뿐만 아니라, 아베는 pSA106 상에 암호화된 블레오마이신 내성 카세트가 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 내에서 선택가능한 마커로서 사용되기 적당하였다고 개시하였다. 부가의 플라스미드, 프로모터, 3'UTR/종결 인자, 그리고 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 내에서 이종 유전자 발현을 가능하게 만드는데 적당한 선택가능한 마커에 대해서는 문헌[Abe et al ., Plant Cell Physiology, Vol. 49 (2008), pp. 625-632]에 개시된 바 있다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 ble 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pSA106을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하는데, 이 경우, 각각의 단백질 암호화 서열은 표 69에 의하여 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 이 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각 단백질 암호화 서열 상류의 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 CAB 유전자 프로모터에 작동 가능하도록 결합될 수 있으며, 단백질 암호화 서열의 하류 또는 3' 영역에 있는 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 CAB 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 게놈에 상동성인 영역들을 추가로 포함할 수 있었다. 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하도록 상동성 영역들을 선택할 수 있었다. 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체는, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 형질 전환 벡터로 안정적으로 형질 전환되었다. Ble 유전자 생성물의 활성은, 플레오마이신을 포함하는 C 배지(이에 제한되는 것은 아님) 상에서 형질 전환 벡터로 형질 전환된 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체를 선택하는 마커로서 사용될 수 있었다. 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 지질 생산에 적당한 생장 배지는 C 배지 및 Abe et al . 및 Sekimoto et al .에 의해 개시된 바와 같은 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 클로스테리움 페라세로섬-스트리고섬-리토랄레 복합체 지질의 지방산 프로필은 본원에 기술된 분석 방법과 표준적인 지질 추출법을 통하여 평가될 수 있었다.
실시예
29:
두날리엘라
비리디스의
조작
본 발명에 의한 두날리엘라 비리디스 내에서의 재조합 유전자의 발현은 본원에 기술된 바와 같이 Sun(선) et al.에 의해 교시된 방법과 벡터를 변형함으로써 이루어질 수 있었다. 간단히 말해서, 문헌[Sun et al., Gene, Vol. 377 (2006), pp.140-149]에는 두날리엘라 비리디스를 플라스미드 DNA로 안정적으로 형질 전환하는 것에 관하여 개시되어 있다. 선은 전기 천공법과 같은 형질 전환법을 사용하여 전 두날리엘라 비리디스 질산염 환원 효소 유전자를 암호화하는 플라스미드 pDVNR을 돌연 변이 두날리엘라 비리디스(두날리엘라 비리디스 NR-돌연 변이체)에 도입하였다. 상기 NR-돌연 변이체는 질소원으로서 질산염을 사용하지 않았을 때에는 생장할 수 없었다. 질산염 환원 효소는 질산염이 아질산염으로 전환되는 것을 촉진한다. 형질 전환하기 전, 두날리엘라 비리디스 NR 돌연 변이체는 유일한 질소원으로서 질산염(NO3 -)을 포함하는 배양 배지 중에서 번식할 수 없었다. NR 돌연 변이 두날리엘라 비리디스 내 두날리엘라 비리디스 NR 유전자 생성물의 발현은 질산염 대사 결핍을 복구하는 선택가능한 마커로서 사용되었다. pDVNR 플라스미드로 형질 전환하여, 유일한 탄소원으로서 질산염을 포함하는 한천 평판 상에서 생장할 수 있는 두날리엘라 비리디스 NR 유전자 생성물을 안정적으로 발현하는 NR-돌연 변이 두날리엘라 비리디스를 제조하였다. 안정적인 형질 전환체의 DNA는 서던 블럿 분석법에 의해 평가하였다. 형질 전환된 두날리엘라 비리디스(NR 돌연 변이체)의 선택과 유지는 5mM KNO3를 포함하는 한천 평판 상에서 수행되었다. 선은 또한 액체 배양 배지 내에서 두날리엘라 비리디스 NR 돌연 변이체와 두날리엘라 비리디스를 번식시키는 것에 관하여 개시하였다. 두날리엘라 비리디스의 번식에 적당한 부가의 배지에 대해서는 문헌[Gordillo et al., Journal of Applied Phycology, Vol. 10:2 (1998), pp. 135-144] 및 [Moulton 및 Burford, Hydrobiologia, Vols. 204-205:1 (1990), pp. 401-408]에 개시되어 있다. 선은, 두날리엘라 비리디스 질산염 환원 효소 유전자의 3' UTR/종결 인자, 프로모터 및 플라스미드 pDVNR은 두날리엘라 비리디스 NR-돌연 변이체 내에서 이종 발현을 가능하게 하는데 적당하였다고 개시하였다. 선은 또한 두날리엘라 비리디스 질산염 환원 효소 유전자 생성물의 발현은 두날리엘라 비리디스 NR 돌연 변이체 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 두날리엘라 비리디스 질산염 환원 효소(DvNR) 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pDVNR을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서, 두날리엘라 비리디스의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 두날리엘라 비리디스 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각 단백질 암호화 서열 상류의 DvNR 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에 있는 DvNR 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합용인 두날리엘라 비리디스 게놈에 대해 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 두날리엘라 비리디스 NR 돌연 변이체를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 전기 천공법과 같은 널리 공지된 형질 전환 기술 또는 기타 다른 공지된 방법을 통해 이루어졌다. DvNR 유전자 생성물의 활성은, 예를 들어 두날리엘라 비리디스 NR 돌연 변이 균주의 질소 동화 결핍을 복구하고, 형질 전환 벡터를 안정적으로 발현하는 두날리엘라 비리디스 NR-돌연 변이체를 선택하는 선택가능한 마커로서 사용될 수 있었다. 두날리엘라 비리디스 지질 생산에 적당한 생장 배지는 Sun et al., Moulton 및 Burford, 그리고 Gordillo et al.에 의해 개시된 것들을 포함하나, 이에 제한되는 것은 아니다. 두날리엘라 비리디스 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법들을 통하여 평가될 수 있었다.
실시예
30:
두날리엘라
살리나의
조작
본 발명에 의하여 두날리엘라 살리나 내에서 재조합 유전자를 발현하는 것은 본원에 기술된 바와 같이 Geng(겡) et al.에 의해 교시된 방법 및 벡터를 변형하여 이루어질 수 있었다. 간단히 말해서, 문헌[Geng et al ., Journal of Applied Phycology, Vol. 15 (2003), pp. 451-456]에는 두날리엘라 살리나를 플라스미드 DNA로 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 겡은 전기 천공법과 같은 형질 전환법을 사용하여 pUWHBsAg-CAT 플라스미드를 두날리엘라 살리나에 도입하였다. pUWHBsAg-CAT은, HBsAG 단백질 암호화 영역 상류의 제아 메이스 ubi1 프로모터에 작동 가능하도록 결합되고, HBsAG 단백질 암호화 영역 하류의 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자(nos)의 3'UTR/종결 인자에 작동 가능하도록 결합된 B형 간염 표면 항원을 암호화하는 서열을 포함하는, B형 간염 표면 항원(HBsAG) 발현 카세트를 포함하였다. pUWHBsAg-CAT는 또한, 유인원 바이러스 40 프로모터 및 인핸서와 작동 가능하도록 결합된, 클로람페니콜 아세틸트랜스퍼라제(CAT) 유전자 생성물(항생제 클로람페니콜에 대한 내성 부여)을 암호화하는 서열을 포함하는 클로람페니콜 내성 카세트를 추가로 포함하였다. pUWHBsAg-CAT으로 형질 전환하기 전, 두날리엘라 살리나는 60㎎/L 클로람페니콜을 포함하는 배지 상에서 번식할 수 없었다. pUWHBsAg-CAT 플라스미드로 형질 전환하여, 60㎎/L 클로람페니콜을 포함하는 선택 배양 배지 중에서 번식한 두날리엘라 살리나의 형질 전환체를 제조하였다. 두날리엘라 살리나 내 CAT 유전자 생성물의 발현을 통하여, 60㎎/L 클로람페니콜의 존재 하에서 상기 균주는 번식할 수 있었는데, 이로써 두날리엘라 살리나 내에서 클로람페니콜 내성 카세트의 선택가능한 마커로서의 유용성이 확립되었다. HBsAg 유전자 생성물의 검출 가능한 활성은, ubi1 프로모터와 nos 3'UTR/종결 인자가 두날리엘라 살리나 내 유전자 발현을 가능하게 하는데 적당하다는 것을 암시하였다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가하였다. 겡은, 형질 전환된 두날리엘라 살리나의 선택 및 유지는 존슨 배지(Johnson? medium)(J1, 문헌[Borowitzka 및 Borowitzka (eds), Micro-algal Biotechnology. Cambridge University Press, Cambridge, pp. 460-461]에 개시됨)와 60㎎/L 클로람페니콜을 포함하는 한천 평판 상에서 수행되었다고 개시하였다. 두날리엘라 살리나의 액체 중 번식은 겡에 의하여 J1 배지(60㎎/L 클로람페니콜 함유) 중에서 수행되었다. J1 배지 이외의 배지 중에서의 두날리엘라 살리나의 번식에 대해서는 문헌[Feng et al ., Mol . Bio . Reports, Vol. 36 (2009), pp.1433-1439] 및 [Borowitzka et al., Hydrobiologia, Vols. 116-117:1 (1984), pp. 115-121]에 개시되어 있다. 두날리엘라 살리나 내에서 이종 유전자 발현을 가능하게 하는데 적당한 부가의 플라스미드, 프로모터 3'UTR/종결 인자, 그리고 선택가능한 마커는 Feng et al.에 의해 개시된 바 있다. 겡은 플라스미드 pUWHBsAg-CAT, ubi1 프로모터 및 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자 3'UTR/종결 인자는 두날리엘라 살리나 내에서 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 겡은 pUWHBsAg-CAT 상에 암호화되는 CAT 내성 카세트는 두날리엘라 살리나 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 CAT 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pUWHBsAg-CAT을 구성되고, 이것이 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은 표 69에 따라서 두날리엘라 살리나의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 두날리엘라 살리나 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 ubi1 프로모터에 작동 가능하도록 결합될 수 있으며, 단백질 암호화 서열의 하류 또는 3' 영역에서 아그로박테리움 튜미파시엔스 노팔린 합성 효소 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는, 두날리엘라 살리나 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 널리 공지된 형질 전환 기술, 예를 들어 전기 천공법 또는 기타 다른 공지된 방법들을 사용하여 형질 전환 벡터로 두날리엘라 살리나를 안정적으로 형질 전환하였다. CAT 유전자 생성물의 활성은, 예를 들어 클로람페니콜을 포함하는 J1 배지 중에서 형질 전환 벡터로 형질 전환된 두날리엘라 살리나를 선택하는 선택가능한 마커로서 사용될 수 있었다. 두날리엘라 살리나 지질 생산에 적당한 생장 배지는 J1 배지와 Feng et al.와 Borowitzka et al.에 의해 개시된 배양 배지들을 포함하나, 이에 제한되는 것은 아니다. 두날리엘라 살리나 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
31:
고니움
펙토랄의
조작
본 발명에 따라서 고니움 펙토랄 내에서 재조합 유전자를 발현하는 것은, 본원에 기술된 바와 같이 Lerche(레르헤) 및 Hollman et al.에 의해 교시된 바와 같은 방법과 벡터를 변형하여 수행될 수 있다. 간단히 말해서, 문헌[Lerche 및 Hallman et al ., BMC Biotechnology, Volume 9:64, 2009]에는 고니움 펙토랄레를 플라스미드 DNA로 안정적으로 핵내 형질 전환하는 것에 대해 개시되어 있다. 레르헤는 미세 입자 투사법과 같은 형질 전환법을 사용하여 플라스미드 pPmr3을 고니움 펙토랄레에 도입하였다. 플라스미드 pPmr3는 스트렙토마이세스 리모서스의 아미노글리코시드 3'-포스포트랜스퍼라제(aphVIII) 유전자 생성물을 암호화하는 서열(GenBank 수탁 번호 제AAB03856호)(항생제 파로모마이신에 대한 내성 부여)을 포함하며, aphVIII 단백질 암호화 영역 상류의 볼복스 카르테리 hsp70A-rbcS3 하이브리드 프로모터에 작동 가능하도록 결합되고, aphVIII 단백질 암호화 영역 하류의 볼복스 카르테리 rbcS3 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합된 파로모마이신 내성 카세트를 포함하였다. pPmr3으로 형질 전환하기 전, 고니움 펙토랄레는 0.06ug/㎖ 파로모마이신을 포함하는 배지에서 번식할 수 없었다. pPmr3으로 형질 전환하여, 0.75ug/㎖ 이상의 파로모마이신을 포함하는 선택 배양 배지 중에서 번식될 수 있었던 고니움 펙토랄레의 형질 전환체를 제조하였다. 고니움 펙토랄레 내 aphVIII 유전자 생성물이 발현됨으로 인하여 0.75ug/㎖ 이상의 파로모마이신의 존재 하에서 번식될 수 있었는데, 이로써 파로모마이신 항생제 내성 카세트의 고니움 펙토랄레 내에서 사용되는 선택가능한 마커로서의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 레르헤 및 홀맨은, 형질 전환된 고니움 펙토랄레의 선택 및 유지는, 1.0ug/㎖ 파로모마이신을 함유하는 액체 자보르스키 배지(Jaworski? medium)(20㎎/L Ca(NO3)2·4H2O, 12.4㎎/L KH2PO4, 50㎎/L MgSO4·7H2O, 15.9㎎/L NaHCO3, 2.25㎎/L EDTA-FeNa, 2.25㎎/L EDTA Na2, 2.48g/L H3BO3, 1.39g/L MnCl2.4H2O, 1㎎/L (NH4)6MO7O24.4H2O, 0.04㎎/L 비타민 B12, 0.04㎎/L 티아민-HCl, 0.04㎎/L 바이오틴, 80㎎/L NaNO3, 36㎎/L Na4HPO4.12H2O) 중에서 수행되었다고 개시하였다. 고니움 펙토랄레 내에서 이종 유전자 발현을 가능하게 만드는데 적당한 부가의 플라스미드, 프로모터, 3'UTR/종결 인자 및 선택가능한 마커는 레르헤 및 홀맨에 의해 추가로 기술되었다. 레르헤 및 홀맨은, 플라스미드 pPmr3, 볼복스 카르테리 hsp70A-rbcS3 하이브리드 프로모터, 그리고 볼복스 카르테리 rbcS3 유전자의 3'UTR/종결 인자는 고니움 펙토랄레 내 외인성 유전자 발현을 가능하게 만드는데 적당하다고 개시하였다. 뿐만 아니라 레르헤 및 홀맨은, 파로모마이신 내성 카세트 암호화 pPmr3은 고니움 펙토랄레 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 aphVIII 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pPmr3을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 제조하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은 표 69에 의하여 고니움 펙토랄레의 핵내 유전자에 고유한 고돈 편향 사용을 반영하도록 고니움 펙토랄레 내 발현에 대해서 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각 단백질 암호화 서열 상류의 볼복스 카르테리 hsp70A-rbcS3 하이브리드 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에서 볼복스 카르테리 rbcS3 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 고니움 펙토랄레 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 형질 전환 벡터로 고니움 펙토랄레를 안정적으로 형질 전환할 수 있었다. aphVIII 유전자 생성물의 활성은, 예를 들어 파로모마이신을 포함하는 자보르스키 배지 중에서 형질 전환 벡터로 형질 전환된 고니움 펙토랄레를 선택하는 선택가능한 마커로서 사용될 수 있었다. 고니움 펙토랄레 지질 생산에 적당한 생장 배지는 자보르스키 배지와 문헌[Stein, American Journal of Botany, Vol. 45:9 (1958), pp. 664-672]에 개시된 배지를 포함하였다. 고니움 펙토랄레 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법들을 통하여 평가될 수 있었다.
실시예
32:
파에오닥틸룸
트리코르누툼의
조작
본 발명에 따라서, 재조합 유전자의 발현은 본원에 개시된 바와 같이 Apt(앱트) et al.에 의해 교시된 방법 및 벡터를 변형함으로써 파에오닥틸룸 트리코르누툼 내에서 이루어질 수 있었다. 간단히 말해서, 문헌[Apt et al ., Molecular and General Genetics, Vol. 252 (1996), pp. 572-579]에는 파에오닥틸룸 트리코르누툼을 벡터 DNA로 안정적으로 핵내 형질 전환하는 것에 대해 개시되어 있다. 앱트는 미세 입자 투사법과 같은 형질 전환 기술을 사용하여 파에오닥틸룸 트리코르누툼에 플라스미드 pfcpA를 도입하였다. 플라스미드 pfcpA는 항생제 플레오마이신과 제오신에 대한 내성을 나타내는, 스트렙토알로테이쿠스 힌두스타너스 블레오마이신 결합 단백질(ble)을 암호화하는 서열을 포함하고, ble 단백질 암호화 영역 상류의 파에오닥틸룸 트리코르누툼 후코잔틴 엽록소 a 결합 단백질 유전자(fcpA)의 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 ble 단백질 암호화 영역의 하류 또는 3' 영역에서 파에오닥틸룸 트리코르누툼 fcpA 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있는 블레오마이신 내성 카세트를 포함하였다. pfcpA로 형질 전환하기 전에, 파에오닥틸룸 트리코르누툼은 50ug/㎖ 제오신을 포함하는 배지에서 번식할 수 없었다. pfcpA로 형질 전환하여, 50ug/㎖ 제오신을 포함하는 선택 배양 배지에서 번식할 수 있는 파에오닥틸룸 트리코르누툼의 형질 전환체를 제조하였다. 파에오닥틸룸 트리코르누툼 내 ble 유전자 생성물이 발현됨으로써, 50ug/㎖ 제오신의 존재 하에서 번식할 수 있었으며, 이로써 파에오닥틸룸 트리코르누툼 내에서 사용되는 선택가능한 마커로서 블레오마이신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가되었다. 앱트는, 형질 전환된 파에오닥틸룸 트리코르누툼의 선택 및 유지는 LDM 배지(문허 [Starr and Zeikus, Journal of Phycology, Vol. 29, Supplement, (1993)]에 개시됨)와 50㎎/L 제오신을 함유하는 한천 평판상에서 수행되었다고 개시하였다. 앱트는, 50㎎/L 제오신을 함유하는 LDM 배지 중 파에오닥틸룸 트리코르누툼 형질 전환체의 액체 중 번식에 대해 개시하였다. LDM 배지 이외의 배지 중에서 파에오닥틸룸 트리코르누툼을 번식시키는 것에 대해서는 문헌[Zaslavskaia et al., Science, Vol. 292 (2001), pp. 2073-2075], 및 [Radokovits et al., Metabolic Engineering, Vol. 13 (2011), pp. 89-95]에 기술되어 있다. 파에오닥틸룸 트리코르누툼 내에서의 이종 유전자 발현을 가능하게 만드는데 적당한 부가 플라스미드, 프로모터, 3'UTR/종결 인자 및 선택가능한 마커에 대해서는 Apt et al., Zaslavskaia et al. 및 Radokovits et al.에 의해 개시된 바 있다. 앱트는, 플라스미드 pfcpA와, 파에오닥틸룸 트리코르누툼 fcpA 프로모터, 그리고 3'UTR/종결 인자는 파에오닥틸룸 트리코르누툼 내에서 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 앱트는, pfcpA상에서 암호화되는 블레오마이신 내성 카세트는 파에오닥틸룸 트리코르누툼 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 ble 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pfcpA를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 단백질 암호화 서열은 각각 표 69에 따라서 파에오닥틸룸 트리코르누툼의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 파에오닥틸룸 트리코르누툼 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화된 유전자 서열은 각각 단백질 암호화 서열 상류의 파에오닥틸룸 트리코르누툼 fcpA 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에서 파에오닥틸룸 트리코르누툼 fcpA 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 파에오닥틸룸 트리코르누툼 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 당업자는 파에오닥틸룸 트리코르누툼 게놈의 서열 내에 존재하는 이와 같은 상동성 영역들을 동정할 수 있다(문헌[Bowler et al., Nature, Vol. 456 (2008), pp. 239-244]에 개시된 바 참조). 파에오닥틸룸 트리코르누툼을 형질 전환 벡터로 안정적으로 형질 전환하는 것은 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 이루어질 수 있었다. ble 유전자 생성물의 활성은, 예를 들어 파로모마이신을 포함하는 LDM 배지 중에서 형질 전환 벡터로 형질 전환된 파에오닥틸룸 트리코르누툼을 선택하는 마커로서 사용될 수 있었다. 파에오닥틸룸 트리코르누툼 지질 생산에 적당한 생장 배지는 Radokovits et al.에 의해 개시된 f/2 배지를 포함하나, 이에 제한되는 것은 아니다. 파에오닥틸룸 트리코르누툼 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 개시된 분석 방법을 통하여 평가될 수 있었다.
실시예
33:
카에토세로스
종의 조작
본 발명에 따라서, 카에토세로스 종 내 재조합 유전자의 발현은 본원에 기술된 Yamaguchi(야마구치) et al.에 의해 교시된 방법과 벡터를 변형하여 이루어질 수 있었다. 간단히 말해서, 문헌[Yamaguchi et al ., Phycological Research, Vol. 59:2 (2011), pp.113-119]에는 카에토세로스 종을 플라스미드 DNA로 핵내 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 야마구치는 미세 입자 투사법과 같은 형질 전환법을 사용하여 플라스미드 pTpfcp/nat를 카에토세로스 종에 도입하였다. pTpfcp/nat는, nat 단백질 암호화 영역 상류의 탈라시오시라 슈도나나 후코잔틴 엽록소 a/c 결합 단백질 유전자(fcp) 프로모터에 작동 가능하도록 결합되고, 또한 3' 영역(nat 단백질 암호화 서열의 하류)에서 탈라시오시라 슈도나나 fcp 유전자 3'UTR/종결 인자에 작동 가능하도록 결합된, 누르세오트리신 아세틸트랜스퍼라제(nat) 유전자 생성물을 암호화하는 서열(GenBank 수탁 번호 제AAC60439호)을 포함하는 누르세오트리신 내성 카세트를 포함하였다. nat 유전자 생성물은 항생제 누르세오트리신에 대한 내성을 부여한다. pTpfcp/nat으로 형질 전환하기 전, 카에토세로스 종은 500ug/㎖ 누르세오트리신을 포함하는 배지 상에서 번식될 수 없었다. pTpfcp/nat으로 형질 전환하여, 500ug/㎖ 누르세오트리신을 포함하는 선택 배양 배지에서 번식한 카에토세로스 종의 형질 전환체를 제조하였다. 카에토세로스 종 내에서 nat 유전자 생성물이 발현되면, 500ug/㎖ 누르세오트리신의 존재 하에 번식될 수 있었는데, 이로써 카에토세로스 종 내에서 사용되는 선택가능한 마커로서의 누르세오트리신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법으로 평가하였다. 야마구치는, 형질 전환된 카에토세로스 종의 선택과 유지는 f/2 배지(문헌[Guilard, R.R., Culture of Phytoplankton for feeding marine invertebrates, In Culture of Marine Invertebrate Animals, Smith and Chanley (eds) 1975, Plenum Press, New York, pp. 26-60]에 개시됨)와 500ug/㎖ 누르세오트리신을 포함하는 한천 평판 상에서 수행되었다고 개시하였다. 야마구치에 의해 수행된 카에토세로스 종 형질 전환체의 액체 중 번식은 500ug/㎖ 누르세오트리신을 함유하는 f/2 배지 중에서 수행되었다. 부가의 배양 배지 중 카에토세로스 종의 번식에 대해서는, 예를 들어 문헌[Napolitano et al., Journal of the World Aquaculture Society, Vol. 21:2 (1990), pp. 122-130], 및 [Volkman et al., Journal of Experimental Marine Biology and Ecology, Vol. 128:3 (1989), pp. 219-240]에 개시되어 있다. 카에토세로스 종 내 이종 유전자 발현을 가능하게 하는데 적당한 부가의 플라스미드, 프로모터, 3'UTR/종결 인자, 그리고 선택가능한 마커는 Yamaguchi et al.에 의한 동일한 문헌에 개시되었다. 야마구치는 플라스미드 pTpfcp/nat, 탈라시오시라 슈도나나 fcp 프로모터, 그리고 3'UTR/종결 인자가, 카에토세로스 종 내 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 야마구치는, pTpfcp/nat 상에서 암호화되는 누르세오트리신 내성 카세트가 카에토세로스 종 내 선택가능한 마커로서 사용되기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 nat 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 벡터 pTpfcp/nat를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 카에토세로스 컴프레섬의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 밀접하게 관련된 카에토세로스 컴프레섬 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각 단백질 암호화 서열 상류의 탈라시오시라 슈도나나 fcp 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 단백질 암호화 서열의 하류 또는 3' 영역에서 탈라시오시라 슈도나나 fcp 유전자 3'UTR/종결 인자와 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는, 카에토세로스 종 게놈에 대한 상동성 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 카에토세로스 종을 형질 전환 벡터로 안정적으로 형질 전환하는 것은 널리 공지된 형질 전환법, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 이루어졌다. nat 유전자 생성물의 활성은, 예를 들어 누르세오트리신을 포함하는 f/2 한천 배지 중에서 형질 전환 벡터로 형질 전환된 카에토세로스 종을 선택하는 선택가능한 마커로서 사용될 수 있었다. 카에토세로스 종 지질 생산에 적당한 생산 배지는 f/2 배지와 Napolitano et al. 및 Volkman et al.에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 카에토세로스 종 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
34:
실린드로테카
후지포르미스의
조작
본 발명에 따라서 재조합 유전자를 실린드로테카 후지포르미스 내에서 발현하는 것은, 본원에 기술된 Poulsen(풀센) 및 Kroger(크로거) et al.에 의해 교시된 방법과 벡터를 변형함으로써 이루어질 수 있었다. 간단히 말해서, 문헌[Poulsen 및 Kroger et al., FEBS Journal, Vol. 272 (2005), pp.3413-3423]에는 실린드로테카 후지포르미스를 플라스미드 DNA로 형질 전환하는 것에 대해 개시되어 있다. 풀센과 크로거는 미세 입자 투사법과 같은 형질 전환법을 사용하여 pCF-ble 플라스미드를 실린드로테카 후지포르미스에 도입하였다. 플라스미드 pCF-ble은, 항생제 제오신 및 플레오마이신에 대한 내성을 부여하는, 스트렙토알로테이쿠스 힌두스타너스 블레오마이신 결합 단백질(ble)을 암호화하는 서열을 포함하고, ble 단백질 암호화 영역 상류의 실린드로테카 후지포르미스 후코잔틴 엽록소 a/c 결합 단백질 유전자(fcpA, GenBank 수탁 번호 제AY125580호) 프로모터에 작동 가능하도록 결합되었고, 3' 영역(ble 단백질 암호화 영역의 하류)에서 실린드로테카 후지포르미스 fcpA 유전자 3'UTR/종결 인자에 작동 가능하도록 결합된, 블레오마이신 내성 카세트를 포함하였다. pCF-ble로 형질 전환하기 전, 실린드로테카 후지포르미스는 1㎎/㎖ 제오신을 포함하는 배지 상에서 번식할 수 없었다. pCF-ble로 형질 전환하여, 1㎎/㎖ 제오신을 포함하는 선택 배양 배지 중에서 번식한 실린드로테카 후지포르미스 형질 전환체를 제조하였다. 실린드로테카 후지포르미스 내 ble 유전자 생성물의 발현으로 인하여 1㎎/㎖ 제오신의 존재 하에서 번식될 수 있었는데, 이로써 실린드로테카 후지포르미스 내에서 사용되는 선택가능한 마커로서의 블레오마이신 항생제 내성 카세트의 유용성이 확립되었다. 풀센 및 크로거는, 형질 전환된 실린드로테카 후지포르미스의 선택 및 유지는 1㎎/㎖ 제오신과 인공 해양수 배지를 포함하는 한천 평판 상에서 수행되었다고 개시하였다. 풀센 및 크로거는, 1㎎/㎖ 제오신을 포함하는 인공 해양수 배지 중 실린드로테카 후지포르미스 형질 전환체의 액체 중 번식에 대해 개시하였다. 부가의 배양 배지 중 실린드로테카 후지포르미스의 번식에 대해서는, 예를 들어 문헌[Liang et al., Journal of Applied Phycology, Vol. 17:1 (2005), pp. 61-65], 및 [Orcutt 및 Patterson, Lipids, Vol. 9:12 (1974), pp. 1000-1003]에 기술되어 있다. 카에토세로스 종 내 이종 유전자 발현을 가능하게 만드는 부가 플라스미드, 프로모터 및 3'UTR/종결 인자는 풀센 및 크로거에 의한 동일 문헌에 개시되었다. 플센 및 크로거는, 플라스미드 pCF-ble, 실린드로테카 후지포르미스 fcp 프로모터 및 3'UTR/종결 인자는 실린드로테카 후지포르미스 내 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 풀센 및 크로거는, pCF-ble 상에 암호화된 블레오마이신 내성 카세트는 실린드로테카 후지포르미스 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 ble 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 pCF-ble를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택된 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 여기서, 각각의 단백질 암호화 서열은, 표 69에 따른 실린드로테카 후지포르미스의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 실린드로테카 후지포르미스 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화된 유전자 서열은 각각, 단백질 암호화 서열 상류의 실린드로테카 후지포르미스 fcp 유전자 프로모터에 작동 가능하도록 결합될 수 있었고, 단백질 암호화 서열의 하류 또는 3' 영역에서 실린드로테카 후지포르미스 fcp 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 실린드로테카 후지포르미스 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 형질 전환 벡터를 사용하는 실린드로테카 후지포르미스의 안정적인 형질 전환은 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 이루어졌다. Ble 유전자 생성물의 활성은, 예를 들어 제오신을 포함하는 인공 해양수 한천 배지 중 형질 전환 벡터로 형질 전환된 실린드로테카 후지포르미스를 선택하는 선택가능한 마커로서 사용될 수 있었다. 실린드로테카 후지포르미스 지질 생산에 적당한 생장 배지는 Liang et al. 및 Orcutt 및 Patterson에 의해 개시된 배지와 인공 해양수를 포함하나, 이에 제한되는 것은 아니다. 실린드로테카 후지포르미스 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
35:
암피디니움
종의 조작
본 발명에 따라서 암피디니움 종 내 재조합 유전자의 발현은 본원에 기술된 ten Lohuis(텐 로휘스) 및 Miller et al.에 의해 교시된 방법과 벡터를 변형하여 이루어질 수 있었다. 간단히 말해서, 문헌[ten Lohuis 및 Miller et al ., The Plant Journal, Vol. 13:3 (1998), pp. 427-435]에는, 플라스미드 DNA로 암피디니움 종을 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 텐 로휘스는 탄화 규소 위스커의 존재 하에서 교반과 같은 형질 전환 기술을 사용하여 플라스미드 pMT NPT/GUS를 암피디니움 종에 도입하였다. pMT NPT/GUS는, nptII 단백질 암호화 영역 상류의 5' 또는 아그로박테리움 튜미파시엔스 노팔린 합성 효소(nos) 유전자 프로모터에 작동 가능하도록 결합되었고, 3' 영역(nptII 단백질 암호화 영역의 하류)에서 nos 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합된, 네오마이신 포스포트랜스퍼라제 II(nptII) 유전자 생성물을 암호화하는 서열(GenBank 수탁 번호 제AAL92039호)을 포함하는, 네오마이신 내성 카세트를 포함하였다. nptII 유전자 생성물은 항생제 G418에 대한 내성을 부여하였다. pMT NPT/GUS 플라스미드는 CaMV 35S 프로모터에 작동 가능하도록 결합되었으며, 또한 CaMV 35S 3'UTR/종결 인자에도 작동 가능하도록 결합된 베타-글루쿠로니다제(GUS) 리포터 유전자 생성물을 암호화하는 서열을 추가로 포함하였다. pMT NPT/GUS로 형질 전환하기 전, 암피디니움 종은 3㎎/㎖ G418을 포함하는 배지에서 번식할 수 없었다. pMT NPT/GUS로 형질 전환하여, 3㎎/㎖ G418을 포함하는 선택 배양 배지 중에서 번식한 암피디니움 종의 형질 전환체를 제조하였다. nptII 유전자 생성물의 암피디니움 종 내 발현을 통하여, 3㎎/㎖ G418의 존재 하에 번식이 가능하게 되었는데, 이로써 암피디니움 종 내에서 사용되는 선택가능한 마커로서의 네오마이신 항생제 내성 카세트의 유용성이 확립되었다. GUS 리포터 유전자의 검출 가능한 활성은, CaMV 35S 프로모터 및 3'UTR은 암피디니움 종 내 유전자 발현을 가능하게 하는데 적당하다는 것을 암시하는 것이다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가하였다. 텐 로휘스와 밀러는, F/2 풍부 용액(시그마(Sigma)에 의해 공급) 및 3㎎/㎖ G418이 보충된 해양수 포함 배지 중 암피디니움 종 형질 전환체의 액체 중 번식과, F/2 풍부 용액 및 3㎎/㎖ G418이 보충된 해양수 포함 한천 배지에서의 암피디니움 종 형질 전환체의 선택 및 유지에 대해 개시하였다. 부가의 배양 배지 중 암피디니움 종의 번식은, 예를 들어 문헌[Mansour et al., Journal of Applied Phycology, Vol. 17:4 (2005) pp. 287-v300]에 개시되어 있다. 암피디니움 종 내에서 이종 유전자 발현을 가능하게 하는 부가의 프로모터, 3'UTR/종결 인자 및 선택가능한 마커를 포함하는 부가의 플라스미드는 텐 로휘스 및 밀러에 의한 동일 문헌에 개시되어 있다. 텐 로휘스 및 밀러는, 플라스미드 pMT NPT/GUS, 프로모터 그리고 nos 및 CaMV 35S 유전자의 3'UTR/종결 인자가 암피디니움 종 내 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 텐 로휘스 및 밀러는 pMT NPT/GUS 상에서 암호화된 네오마이신 내성 카세트가 암피디니움 종 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로 사용되는 nptII 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 pMT NPT/GUS를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 상기 균주와 밀접한 관련이 있는 종인 암피디니움 카르테라에의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 암피디니움 종 내 발현에 대해서 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 아그로박테리움 튜미파시엔스 노팔린 합성 효소(nos) 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 단백질 암호화 서열의 하류 또는 3' 영역에서 nos 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 암피디니움 종 게놈에 상동성인 영역들을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자들의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 형질 전환 벡터를 사용하는 암피디니움 종의 안정적인 형질 전환은 널리 공지된 형질 전환 기술, 예를 들어 규소 섬유 매개 미세 주입법 또는 기타 다른 공지된 방법을 통하여 이루어질 수 있었다. nptII 유전자 생성물의 활성은, 예를 들어 G418을 포함하는 해양수 한천 배지 중 형질 전환 벡터로 형질 전환된 암피디니움 종을 선택하는 선택가능한 마커로서 사용될 수 있었다. 암피디니움 종 지질 생산에 적당한 생장 배지는 Mansour et al. 및 텐 로휘스 및 밀러에 의해 개시된 배지와 인공 해양수를 포함하였으나, 이에 제한되는 것은 아니었다. 암피디니움 종 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법들을 통하여 평가될 수 있었다.
실시예
36:
심비오디늄
마이크로아드리악티큠의
조작
본 발명에 따라서 심비오디늄 마이크로아드리악티큠 내 재조합 유전자의 발현은 본원에 기술된 바와 같이 ten Lohuis 및 Miller et al.에 의해 교시되는 방법과 벡터를 변형함으로써 이루어질 수 있었다. 간단히 말해서, 문헌[ten Lohuis 및 Miller et al ., The Plant Journal, Vol. 13:3 (1998), pp. 427-435]에는, 플라스미드 DNA로 심비오디늄 마이크로아드리악티큠을 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 텐 로휘스는, 규소 섬유 매개 미세 주입법과 같은 형질 전환 기술을 사용하여 플라스미드 pMT NPT/GUS를 심비오디늄 마이크로아드리악티큠에 도입하였다. pMT NPT/GUS는, nptII 단백질 암호화 영역의 5'또는 상류의 아그로박테리움 튜미파시엔스 노팔린 합성 효소(nos) 유전자 프로모터에 작동 가능하도록 결합되었고, 3' 영역 nptII 단백질 암호화 영역의 하류)에서 nos 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합된, 네오마이신 포스포트랜스퍼라제 II(nptII) 유전자 생성물을 암호화하는 서열(GenBank 수탁 번호 제AAL92039호)을 포함하는 네오마이신 내성 카세트를 포함하였다. nptII 유전자 생성물은 항생제 G418에 대한 내성을 부여하였다. pMT NPT/GUS 플라스미드는 CaMV 35S 프로모터에 작동 가능하도록 결합되었고, 추가로 CaMV 35S 3'UTR/종결 인자에도 작동 가능하도록 결합된, 베타-글루쿠로니다제(GUS) 리포터 유전자 생성물을 암호화하는 서열을 추가로 포함하였다. pMT NPT/GUS로 형질 전환하기 전, 심비오디늄 마이크로아드리악티큠은 3㎎/㎖ G418을 포함하는 배지에서 번식할 수 없었다. pMT NPT/GUS로 형질 전환하여, 3㎎/㎖ G418을 포함하는 선택 배양 배지 내 번식한 심비오디늄 마이크로아드리악티큠 형질 전환체를 제조하였다. nptII 유전자 생성물의 심비오디늄 마이크로아드리악티큠 내 발현으로 인하여, 3㎎/㎖ G418의 존재 하에 번식될 수 있었으며, 이로써, 심비오디늄 마이크로아드리악티큠 내 사용되는 선택가능한 마커로서의 네오마이신 항생제 내성 카세트의 유용성이 확립되었다. GUS 리포터 유전자의 검출 가능한 활성은, CaMV 35S 프로모터 및 3'UTR은 심비오디늄 마이크로아드리악티큠 내 유전자 발현을 가능하게 하는데 적당하다는 것을 암시하였다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가되었다. 텐 로휘스 및 밀러는, F/2 풍부 용액(공급자 시그마에 의해 제공) 및 3㎎/㎖ G418이 보충된, 해양수 포함 배지 중 심비오디늄 마이크로아드리악티큠 형질 전환체의 액체 중 번식과, F/2 풍부 용액 및 3㎎/㎖ G418이 보충된, 해양수 포함 한천 배지에서의 심비오디늄 마이크로아드리악티큠 형질 전환체의 선택과 유지에 대해 개시하였다. 부가의 배양 배지 중 심비오디늄 마이크로아드리악티큠의 번식에 대해서는, 예를 들어 문헌[Iglesias-Prieto et al., Proceedings of the National Academy of Sciences, Vol. 89:21 (1992) pp. 10302-10305]에 개시되어 있다. 심비오디늄 마이크로아드리악티큠 내 이종 유전자 발현을 가능하게 하는 부가의 프로모터, 3'UTR/종결 인자 및 선택가능한 마커를 포함하는 부가의 플라스미드에 대해서는 텐 로휘스 및 밀러에 의한 동일한 문헌에 개시되어 있다. 텐 로휘스와 밀러는, 플라스미드 pMT NPT/GUS와, nos의 3'UTR/종결 인자 및 프로모터, 그리고 CaMV 35S 유전자는 심비오디늄 마이크로아드리악티큠 내 외인성 유전자 발현을 가능하게 하는데에 적당하다고 개시하였다. 뿐만 아니라, 텐 로휘스 및 밀러는, pMT NPT/GUS상에 암호화된 네오마이신 내성 카세트가 심비오디늄 마이크로아드리악티큠 내 선택가능한 마커로서 사용하기에 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로 사용되는 nptII 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 pMT NPT/GUS를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 심비오디늄 마이크로아드리악티큠의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 심비오디늄 마이크로아드리악티큠 내 발현에 대해서 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 아그로박테리움 튜미파시엔스 노팔린 합성 효소(nos) 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 단백질 암호화 서열의 하류 또는 3' 영역에서 nos 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 심비오디늄 마이크로아드리악티큠 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자들의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 형질 전환 벡터를 사용하는 심비오디늄 마이크로아드리악티큠의 안정적인 형질 전환은 널리 공지된 형질 전환 기술, 예를 들어 규소 섬유 매개 미세 주입법 또는 기타 다른 공지된 방법을 통하여 이루어졌다. nptII 유전자 생성물의 활성은, 예를 들어 G418을 포함하는 해양수 한천 배지 중 형질 전환 벡터로 형질 전환된 심비오디늄 마이크로아드리악티큠을 선택하는 선택가능한 마커로서 사용될 수 있었다. 심비오디늄 마이크로아드리악티큠 지질 생산에 적당한 생장 배지는 Iglesias-Prieto et al. 및 텐 로휘스 및 밀러에 의해 개시된 배지와 인공 해양수를 포함하나, 이에 제한되는 것은 아니다. 심비오디늄 마이크로아드리악티큠 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 기술된 분석 방법들을 통하여 평가될 수 있었다.
실시예
37:
나노클로롭시스
종의 조작
본 발명에 따라서 재조합 유전자의 나노클로롭시스 종 W2J3B 내 발현은 본원에 기술된 바와 같이 Kilian(킬리안) et al.에 의해 교시된 방법 및 벡터를 변형하여 이루어질 수 있었다. 간단히 말해서, 문헌[Kilian et al., Proceedings of the National Academy of Sciences, Vol. 108:52 (2011) pp.21265-21269]에는, 형질 전환 구조물을 사용하여 나노클로롭시스를 핵내 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 킬리안은 전기 천공법과 같은 형질 전환법을 사용하여 형질 전환 구조물 C2를 나노클로롭시스 종 W2J3B에 도입하였다. 상기 C2 형질 전환 구조물은, 스트렙토알로테이쿠스 힌두스타너스 블레오마이신 결합 단백질(ble)에 대한 암호화 서열(항생제 플레오마이신과 제오신에 대한 내성 부여)을 포함하고, ble 단백질 암호화 영역 상류의 나노클로롭시스 종 W2J3B 비올라잔틴/엽록소 a 결합 단백질 유전자 VCP2의 프로모터에 작동 가능하도록 결합되어 있으며, ble 단백질 암호화 영역 하류의 나노클로롭시스 종 W2J3B 비올라잔틴/엽록소 a 결합 유전자 VCP1의 3'UTR/종결 인자에 작동 가능하도록 결합된, 블레오마이신 내성 카세트를 포함하였다. C2로 형질 전환하기 전, 나노클로롭시스 종 W2J3B는 2ug/㎖ 제오신을 포함하는 배지에서 번식할 수 없었다. C2로 형질 전환하여, 2ug/㎖ 제오신을 포함하는 선택 배양 배지 중 번식된 나노클로롭시스 종 W2J3B의 형질 전환체를 제조하였다. 나노클로롭시스 종 W2J3B 내 ble 유전자 생성물의 발현을 통하여, 2ug/㎖ 제오신의 존재 하에서 번식이 가능하게 되었는데, 이로써 나노클로롭시스에서 사용되는 선택가능한 마커로서의 블레오마이신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 PCR에 의해 평가되었다. 킬리안은, 미량 금속, 비타민 및 포스페이트 용액을 5배 많은 수준으로 포함하고 2ug/㎖ 제오신을 추가로 함유하는 F/2 배지(문헌[Guilard and Ryther, Canadian Journal of Microbiology, Vol. 8 (1962), pp. 229-239]에 개시됨) 내에서 나노클로롭시스 종 W2J3B 형질 전환체의 액체 중 번식에 대해 개시하였다. 킬리안은 또한, 2㎎/㎖ 제오신과 인공 해양수를 포함하는 한천 F/2 배지에서의 나노클로롭시스 종 W2J3B 형질 전환체의 선택과 유지에 대해서도 개시하였다. 부가 배양 배지 중 나노클로롭시스의 번식에 대해서는, 예를 들어 문헌[Chiu et al., Bioresour Technol ., Vol . 100:2 (2009), pp . 833-838] 및 [Pal et al., Applied Microbiology and Biotechnology, Vol. 90:4 (2011), pp. 1429-1441]에 기술되었다. 나노클로롭시스 종 W2J3B 내에서 이종 유전자 발현을 가능하게 하는 부가 프로모터 및 3'UTR/종결 인자와, 형질 전환체의 선택에 사용되는 선택가능한 마커를 포함하는 부가의 형질 전환 구조물은 킬리안에 의한 동일 문헌에 기술되어 있다. 킬리안은, 형질 전환 구조물 C2, 나노클로롭시스 종 W2J3B 비올라잔틴/엽록소 a 결합 단백질 유전자 VCP2의 프로모터, 그리고 나노클로롭시스 종 W2J3B 비올라잔틴/엽록소 a 결합 단백질 유전자 VCP1의 3'UTR/종결 인자는 나노클로롭시스 종 W2J3B 내 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 킬리안은, C2 상에서 암호화되는 블레오마이신 내성 카세트가 나노클로롭시스 종 W2J3B 내 선택가능한 마커로 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로 사용되는 ble 유전자 생성물을 암호화하는 뉴클레오티드 서열을 포함하는 형질 전환 구조물 C2를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 각각의 단백질 암호화 서열은, 표 69에 따라서 나노클로롭시스 종의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 나노클로롭시스 종 W2J3B 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 나노클로롭시스 종 W2J3B VCP2 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 단백질 암호화 서열의 하류 또는 3' 영역에서 나노클로롭시스 종 W2J3B VCP1 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은, 형질 전환 벡터의 표적화 게놈 통합에 사용되는 나노클로롭시스 종 W2J3B 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 형질 전환 벡터로 나노클로롭시스 종 W2J3B를 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 전기 천공법 또는 기타 다른 공지된 방법을 통하여 이루어졌다. ble 유전자 생성물의 활성은, 예를 들어 제오신을 포함하는 F/2 배지 중에서 형질 전환 벡터로 형질 전환된 나노클로롭시스 종 W2J3B를 선택하는 선택가능한 마커로서 사용될 수 있었다. 나노클로롭시스 종 W2J3B 지질 생산에 적당한 생장 배지는 F/2 배지와 Chiu et al.과 Pal et al.에 의해 개시된 배지를 포함하였으나, 이에 제한되는 것은 아니다. 나노클로롭시스 종 W2J3B 지질의 지방산 프로필은 표준적 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
38:
시클로텔라
크립티카의
조작
본 발명에 따라서 재조합 유전자의 발현은 본원에 개시된 바와 같이 Dunahay(듀나헤이) et al.에 의해 교시된 방법 및 벡터를 변형함으로써 시클로텔라 크립티카 내에서 이루어질 수 있었다. 간단히 말해서, 문헌[Dunahay et al ., Journal of Phycology, Vol. 31 (1995), pp. 1004-1012]에는 시클로텔라 크립티카를 플라스미드 DNA로 안정적으로 형질 전환하는 것이 개시되어 있다. 듀나헤이는 미세 입자 투사법과 같은 형질 전환법을 사용하여 플라스미드 pACCNPT5.1를 시클로텔라 크립티카에 도입하였다. 플라스미드 pACCNPT5.1은, nptII 암호화 영역 상류의 시클로텔라 크립티카 아세틸-CoA 카복실라제(ACCase) 유전자(GenBank 수탁 번호 제L20784호)의 프로모터에 작동 가능하도록 결합되어 있으며, 또한 3' 영역(nptII 암호화 영역의 하류)에서 시클로텔라 크립티카 ACCase 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합되어 있는, 네오마이신 포스포트랜스퍼라제 II(nptII) 유전자 생성물의 암호화 서열을 포함하는, 네오마이신 내성 카세트를 포함하였다. nptII 유전자 생성물은 항생제 G418에 대한 내성을 부여하였다. pACCNPT5.1로 형질 전환하기 전, 시클로텔라 크립티카는 100ug/㎖ G418을 포함하는 50% 인공 해양수 배지에서 번식할 수 없었다. pACCNPT5.1로 형질 전환하여, 100ug/㎖ G418을 포함하는 50% 인공 해양수 선택 배지에서 번식된 시클로텔라 크립티카 형질 전환체를 제조하였다. 시클로텔라 크립티카 내 nptII 유전자 생성물의 발현으로 인하여 이 균주는 100ug/㎖ G418의 존재 하에서 번식할 수 있었는데, 이로써 시클로텔라 크립티카에서 사용되는 선택가능한 마커로서의 네오마이신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가하였다. 듀나헤이는, 1.07mM 규산화 나트륨과 100ug/㎖ G418이 보충된 인공 해양수 배지(ASW, 문헌[Brown, L., Phycologia, Vol. 21 (1982), pp. 408-410]에 개시됨) 내 시클로텔라 크립티카의 액체 중 번식에 대해 개시하였다. 듀나헤이는 또한, 100ug/㎖ G418을 함유하는 ASW 배지를 포함하는 한천 평판 상에서의 시클로텔라 크립티카 형질 전환체의 선택 및 유지에 대해서도 개시하였다. 부가의 배양 배지 중에서의 시클로텔라 크립티카의 번식에 대해서는, 예를 들어 문헌[Sriharan et al ., Applied Biochemistry and Biotechnology , Vol. 28-29:1 (1991), pp . 317-326] 및 [Pahl et al., Journal of Bioscience and Bioengineering, Vol. 109:3 (2010), pp. 235-239]에 기술되어 있다. 듀나헤이는, 플라스미드 pACCNPT5.1과 시클로텔라 크립티카 아세틸-CoA 카복실라제(ACCase) 유전자의 프로모터는 시클로텔라 크립티카 내에서 외인성 유전자의 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 듀나헤이는, pACCNPT5.1상에서 암호화된 네오마이신 내성 카세트가 시클로텔라 크립티카 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, nptII 유전자 생성물을 암호화하는 뉴클레오티드 서열(선택가능한 마커로서 사용)을 포함하는 벡터 pACCNPT5.1을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이때, 각각의 단백질 암호화 서열은, 표 69에 의한 시클로텔라 크립티카의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 시클로텔라 크립티카 내에서의 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화된 유전자 서열은 각각 단백질 암호화 서열 상류의 시클로텔라 크립티카 ACCase 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에서 시클로텔라 크립티카 ACCase 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 시클로텔라 크립티카 게놈에 상동성인 영역을 추가로 포함할 수도 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 시클로텔라 크립티카를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 이루어졌다. nptII 유전자 생성물의 활성은, 예를 들어 G418을 포함하는 한천 ASW 배지 중에서 형질 전환 벡터로 형질 전환된 시클로텔라 크립티카를 선택하는 마커로서 사용될 수 있었다. 시클로텔라 크립티카 지질 생산에 적당한 생장 배지는 ASW 배지와, Sriharan et al.(1991)와 Pahl et al.에 의해 개시된 배지를 포함하나 이에 제한되는 것은 아니다. 시클로텔라 크립티카 지질의 지방산 프로필은 표준적인 지질 추출법과 본원에 개시된 분석 방법을 통하여 평가될 수 있었다.
실시예
39:
나비큘라
사프로필라의
조작
본 발명에 따라서 나비큘라 사프로필라 내에서 재조합 유전자를 발현하는 것은, 본원에 기술된 Dunahay et al.에 의해 교시된 방법과 벡터를 변형함으로써 이루어질 수 있었다. 간단히 말해서, 문헌[Dunahay et al ., Journal of Phycology, Vol. 31 (1995), pp. 1004-1012]에는, 플라스미드 DNA를 사용하여 나비큘라 사프로필라를 안정적으로 형질 전환하는 것이 개시되어 있다. 더나헤이는 미세 입자 투사법과 같은 형질 전환법을 사용하여 플라스미드 pACCNPT5.1를 나비큘라 사프로필라에 도입하였다. 플라스미드 pACCNPT5.1는, nptII 암호화 영역 상류의 시클로텔라 크립티카 아세틸-CoA 카복실라제(ACCase) 유전자(GenBank 수탁 번호 제L20784호)의 프로모터에 작동 가능하게 연결되었으며, 3' 영역(nptII 암호화 영역의 하류)에서 시클로텔라 크립티카 ACCase 유전자의 3'UTR/종결 인자에 작동 가능하도록 결합된, 네오마이신 포스포트랜스퍼라제 II(nptII) 유전자 생성물의 암호화 서열을 포함하는 네오마이신 내성 카세트를 포함하였다. nptII 유전자 생성물은 항생제 G418에 대한 내성을 부여하였다. pACCNPT5.1로 형질 전환하기 전, 나비큘라 사프로필라는 100ug/㎖ G418을 포함하는 인공 해양수 배지에서는 번식할 수 없었다. pACCNPT5.1로 형질 전환한 후에는, 100ug/㎖ G418을 포함하는 인공 해양수 선택 배지중에서 번식한 나비큘라 사프로필라 형질 전환체를 제조하였다. 나비큘라 사프로필라 내 nptII 유전자 생성물의 발현으로 인하여, G418의 존재 하에서 상기 균주는 번식할 수 있었는데, 이로써 네오마이신 항생제 내성 카세트의 나비큘라 사프로필라 내에서 사용되는 선택가능한 마커로서의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가하였다. 더나헤이는, 1.07mM 규산화나트륨과 100ug/㎖ G418이 보충된 인공 해양수 배지(ASW, 문헌[Brown, L., Phycologia, Vol. 21 (1982), pp. 408-410]에 기술됨) 중 나비큘라 사프로필라의 액체 중 번식에 대해 개시하였다. 더나헤이는 또한, 100ug/㎖ G418와 함께 ASW 배지를 포함하는 한천 평판에서의 나비큘라 사프로필라 형질 전환체의 선택 및 유지에 대해 개시하였다. 부가의 배양 배지 중에서의 나비큘라 사프로필라의 번식에 대해서는, 예를 들어 문헌[Tadros 및 Johansen, Journal of Phycology, Vol. 24:4 (1988), pp. 445-452] 및 [Sriharan et al., Applied Biochemistry and Biotechnology, Vol. 20-21:1 (1989), pp . 281-291]에 기술된 바 있다. 더나헤이는, 플라스미드 pACCNPT5.1과 시클로텔라 크립티카 아세틸-CoA 카복실라제(ACCase) 유전자의 프로모터는 나비큘라 사프로필라 내에서 외인성 유전자를 발현시킬 수 있는데에 적당하다고 개시하였다. 뿐만 아니라, 더나헤이는, pACCNPT5.1상에서 암호화된 네오마이신 내성 카세트는 나비큘라 사프로필라 내 선택가능한 마커로서 사용하기 적당하다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는, nptII 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 pACCNPT5.1를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서, 나비큘라 사프로필라와 밀접하게 관련된 나비큘라 펠리큘로사의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록 나비큘라 사프로필라 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 시클로텔라 크립티카 ACCase 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에서 시클로텔라 크립티카 ACCase 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 또한 형질 전환 벡터의 표적화 게놈 통합에 사용되는 나비큘라 사프로필라 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택될 수 있었다. 나비큘라 사프로필라를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 이루어졌다. nptII 유전자 생성물의 활성은, 예를 들어 G418을 포함하는 한천 ASW 배지에서 형질 전환 벡터로 형질 전환된 나비큘라 사프로필라를 선택하는 선택가능한 마커로서 사용될 수 있었다. 나비큘라 사프로필라 지질 생산에 적당한 생장 배지로서는 ASW 배지 및 Sriharan et al.(1989) 및 태드로스(Tadros) 및 요한슨(Johansen)에 의해 개시된 배지를 포함하나, 이에 제한되는 것은 아니다. 나비큘라 사프로필라 지질의 지방산 프로필은 표준적 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
40:
탈라시오시라
슈도나나의
조작
본 발명에 따라서, 재조합 유전자의 탈라시오시라 슈도나나 내 발현은 본원에 기술된 바와 같이 Poulsen(풀센) et al.에 의해 교시된 방법 및 벡터를 변형하여 이루어질 수 있었다. 간단히 말해서, 문헌[Poulsen et al., Journal of Phycology, Vol. 42 (2006), pp. 1059-1065]에는, 플라스미드 DNA를 사용하여 탈라시오시라 슈도나나를 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 풀센은 미세 입자 투사법과 같은 형질 전환법을 사용하여 플라스미드 pTpfcp/nat를 탈라시오시라 슈도나나에 도입하였다. pTpfcp/nat는, nat 단백질 암호화 영역 상류의 탈라시오시라 슈도나나 후코잔틴 엽록소 a/c 결합 단백질 유전자(fcp) 프로모터에 작동 가능하도록 결합되고, 또한 3' 영역(nat 단백질 암호화 서열의 하류)에서 탈라시오시라 슈도나나 fcp 유전자 3'UTR/종결 인자에 작동 가능하도록 결합된, 누르세오트리신 아세틸트랜스퍼라제(nat) 유전자 생성물을 암호화하는 서열(GenBank 수탁 번호 제AAC60439호)을 포함하는, 누르세오트리신 내성 카세트를 포함하였다. nat 유전자 생성물은 항생제 누르세오트리신에 대한 내성을 부여하였다. pTpfcp/nat로 형질 전환하기 전, 탈라시오시라 슈도나나는 10ug/㎖ 누르세오트리신을 포함하는 배지에서 번식할 수 없었다. pTpfcp/nat로 형질 전환하여, 100ug/㎖ 누르세오트리신을 포함하는 선택 배양 배지에서 번식한 탈라시오시라 슈도나나 형질 전환체를 제조하였다. 탈라시오시라 슈도나나 내에서 nat 유전자 생성물이 발현됨으로 인하여, 100ug/㎖ 누르세오트리신의 존재하에 상기 균주는 번식할 수 있었는데, 이로써 탈라시오시라 슈도나나에서 사용되는 선택가능한 마커로서의 누르세오트리신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가하였다. 풀센은, 형질 전환된 탈라시오시라 슈도나나의 선택 및 유지는 100ug/㎖ 누르세오트리신 함유 개질 ESAW 배지(문헌[Harrison et al., Journal of Phycology, Vol. 16 (1980), pp. 28-35]에 기술됨)를 포함하는 액체 배양액 중에서 수행되었다고 개시하였다. 부가의 배양 배지 중 탈라시오시라 슈도나나의 번식에 대해서는, 예를 들어 문헌[Volkman et al., Journal of Experimental Marine Biology and Ecology, Vol. 128:3 (1989), pp. 219-240]에 기술된 바 있다. 탈라시오시라 슈도나나 내에서 사용하기 적당한 부가의 선택가능한 마커를 포함하는 부가의 플라스미드에 대해서는 풀센에 의한 동일한 문헌에 기술되어 있다. 풀센은, 플라스미드 pTpfcp/nat, 그리고 탈라시오시라 슈도나나 fcp 프로모터 및 3'UTR/종결 인자는 탈라시오시라 슈도나나 내에서 외인성 유전자의 발현을 가능하게 하는데 적당하였다고 개시하였다. 뿐만 아니라, 풀센은, pTpfcp/nat 상에서 암호화된 누르세오트리신 내성 카세트는 탈라시오시라 슈도나나 내에서 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는, nat 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 pTpfcp/nat를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 탈라시오시라 슈도나나의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 탈라시오시라 슈도나나 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서상류의 탈라시오시라 슈도나나 fcp 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 또한 단백질 암호화 서열의 하류 또는 3' 영역에서 탈라시오시라 슈도나나 fcp 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는 탈라시오시라 슈도나나 게놈에 대해 상동성인 영역을 추가로 포함할 수도 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 당업자는, 탈라시오시라 슈도나나 게놈의 서열 내에서 이와 같은 상동성 영역을 동정할 수 있었다(문헌[Armbrust et al., Science, Vol. 306: 5693 (2004): pp. 79-86] 참조). 탈라시오시라 슈도나나를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법을 통하여 이루어졌다. nat 유전자 생성물의 활성은, 예를 들어 누르세오트리신을 포함하는 ESAW 한천 배지 내에서 형질 전환 벡터로 형질 전환된 탈라시오시라 슈도나나를 선택하는 마커로서 사용될 수 있었다. 탈라시오시라 슈도나나 지질 생산에 적당한 생장 배지로서는 ESAW 배지와 Volkman et al. 및 Harrison et al.에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 탈라시오시라 슈도나나 지질의 지방산 프로필은 표준적 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
41:
클라미도모나스
레인하르드티의
조작
본 발명에 따라서, 클라미도모나스 레인하르드티 내에서 재조합 유전자의 발현은 본원에 기술된 바와 같이 Cerutti(세루티) et al.에 의해 교시된 방법과 벡터를 변형하여 이루어질 수 있었다. 간단히 말해서, 문헌[Cerutti et al ., Genetics , Vol. 145:1 (1997), pp. 97-110]에는, 형질 전환 벡터로 클라미도모나스 레인하르드티를 핵내 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 세루티는 미세 입자 투사법과 같은 형질 전환법을 사용하여 형질 전환 구조물 P[1030]을 클라미도모나스 레인하르드티에 도입하였다. 구조물 P[1030]는, 아미노글루코시드 3'-아데닐트랜스퍼라제(aadA) 단백질 암호화 영역 상류의 클라미도모나스 레인하르드티 리불로스-1,5-비스포스페이트 카복실라제/옥시게나제 소형 서브유닛 유전자(RbcS2, GenBank 수탁 번호 제X04472호) 프로모터에 작동 가능하도록 결합되고, 3' 영역(aadA 단백질 암호화 서열의 하류)에서 클라미도모나스 레인하르드티 RbcS2 유전자 3'UTR/종결 인자에 작동 가능하도록 결합된, aadA 유전자 생성물 암호화 서열을 포함하는, 스펙티노마이신 내성 카세트를 포함하였다. aadA 유전자 생성물은, 항생제 스펙티노마이신에 대한 내성을 부여하였다. P[1030]로 형질 전환하기 전, 클라미도모나스 레인하르드티는 90ug/㎖ 스펙티노마이신을 포함하는 배지에서는 번식할 수 없었다. P[1030]로 형질 전환하여, 90ug/㎖ 스펙티노마이신을 포함하는 선택 배양 배지에서 번식한 클라미도모나스 레인하르드티 형질 전환체가 제조되었는데, 이로써 클라미도모나스 레인하르드티 내에서 사용되는 선택가능한 마커로서의 스펙티노마이신 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿 분석법에 의해 평가되었다. 세루티는, 형질 전환된 클라미도모나스 레인하르드티의 선택 및 유지는 90ug/㎖ 스펙티노마이신을 함유하고 트리스-아세테이트-포스페이트 배지(TAP, 문헌[Harris, The Chlamydomonas Sourcebook, Academic Press, San Diego, 1989]에 개시됨)를 포함하는 한천 평판 상에서 수행되었다고 개시하였다. 세루티는 또한, 클라미도모나스 레인하르드티의 TAP 액체 배양액(90ug/㎖ 스펙티노마이신 함유) 중 번식에 대해서도 개시하였다. 대안적 배양 배지 중 클라미도모나스 레인하르드티의 번식에 대해서는, 예를 들어 문헌[Dent et al ., African Journal of Microbiology Research, Vol. 5:3 (2011), pp. 260-270] 및 [Yantao et al., Biotechnology and Bioengineering, Vol. 107:2 (2010), pp. 258-268]에 개시되어 있다. 클라미도모나스 레인하르드티에 사용하기 적당한 부가의 선택가능한 마커와 다수의 조절 서열(예를 들어, 클라미도모나스 레인하르드티 내 이종 유전자 발현을 촉진하는데 적당한 3'UTR 및 프로모터)을 포함하는 부가의 구조물은 당업계에 공지되어 있으며, 문헌[Radakovits et al ., Eurkaryotic Cell, Vol. 9:4 (2010), pp. 486-501]에 기술되어 있다. 세루티는, 형질 전환 벡터 P[1030]과 클라미도모나스 레인하르드티 프로모터 및 3'UTR/종결 인자는 클라미도모나스 레인하르드티 내 외인성 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 세루티는, P[1030] 상에 암호화되는 스펙티노마이신 내성 카세트가 클라미도모나스 레인하르드티 내에서 선택가능한 마커로서 사용되기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 aadA 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 P[1030]를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 클라미도모나스 레인하르드티의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 클라미도모나스 레인하르드티 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 클라미도모나스 레인하르드티 RbcS2 프로모터에 작동 가능하도록 결합될 수 있었으며, 단백질 암호화 서열의 하류 또는 3' 영역에서 클라미도모나스 레인하르드티 RbcS2 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는, 클라미도모나스 레인하르드티 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 당업자는, 클라미도모나스 레인하르드티 게놈의 서열 내에서 이와 같은 상동성 영역을 동정할 수 있다(문헌[Merchant et al., Science, Vol. 318:5848 (2007), pp. 245-250] 참조). 클라미도모나스 레인하르드티를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 미세 입자 투사법 또는 기타 다른 공지된 방법들을 통하여 이루어졌다. aadA 유전자 생성물의 활성은, 예를 들어 스펙티노마이신을 포함하는 TAP 한천 배지에서 형질 전환 벡터로 형질 전환된 클라미도모나스 레인하르드티를 선택하는 마커로서 사용될 수 있었다. 클라미도모나스 레인하르드티 지질 생산에 적당한 생장 배지는 ESAW 배지와, Yantao et al. 및 Dent et al.에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 클라미도모나스 레인하르드티 지질의 지방산 프로필은 표준적 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
42:
야로위아
리폴리티카의
조작
본 발명에 따라서 재조합 유전자의 발현은 본원에 기술된 바와 같이 Fickers(픽커스) et al.에 의해 교시된 방법과 벡터를 변형하여 야로위아 리폴리티카 내에서 이루어질 수 있었다. 간단히 말해서, 문헌[Fickers et al ., Journal of Microbiological Methods, Vol. 55 (2003), pp. 727-737]에는, 플라스미드 DNA로 야로위아 리폴리티카를 안정적으로 핵내 형질 전환하는 것에 대해 개시되어 있다. 픽커스는 아세트산 리튬 형질 전환법을 사용하여 플라스미드 JMP123을 야로위아 리폴리티카에 도입하였다. 플라스미드 JMP123은, hph 단백질 암호화 영역 상류의 야로위아 리폴리티카 LIP2 유전자 프로모터(GenBank 수탁 번호 제AJ012632호)에 작동 가능하도록 결합되고, 또한 hph 단백질 암호화 영역 하류의 야로위아 리폴리티카 LIP2 유전자 3'UTR/종결 인자에 작동 가능하도록 결합된, 하이그로마이신 B 포스포트랜스퍼라제 유전자 생성물(hph)을 암호화하는 서열을 포함하는 하이그로마이신 B 내성 카세트를 포함하였다. JMP123으로 형질 전환하기 전, 야로위아 리폴리티카는 100ug/㎖ 하이그로마이신을 포함하는 배지에서 번식할 수 없었다. JMP123으로 형질 전환하여, 100ug/㎖ 하이그로마이신을 포함하는 배지에서 번식할 수 있었던, 형질 전환된 야로위아 리폴리티카가 생산되었는데, 이로써, 야로위아 리폴리티카 내에서 사용되는 선택가능한 마커로서의 하이그로마이신 B 항생제 내성 카세트의 유용성이 확립되었다. 야로위아 리폴리티카 LIP2 유전자의 3'UTR/종결 인자와 프로모터의 JMP123상에 제공된 뉴클레오티드 서열은, LIP2 위치로 hph 암호화 서열이 상동성 재조합되는데 사용되는 공여 서열로서 사용되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿에 의해 평가되었다. 픽커스는, 형질 전환된 야로위아 리폴리티카의 선택 및 유지는 100ug/㎖ 하이그로마이신을 함유하는 표준 YPD 배지(효모 추출 펩톤 덱스트로스)를 포함하는 한천 평판에서 수행되었다. 형질 전환된 야로위아 리폴리티카의 액체 배양은, 하이그로마이신을 함유하는 YPD 배지 중에서 수행되었다. 야로위아 리폴리티카를 배양하는데 사용되는 기타 다른 배지와 기술에 대해서는 개시되었으며, 야로위아 리폴리티카 내에서 사용되는 선택가능한 마커, 3'UTR, 프로모터 및 기타 다른 다수의 플라스미드도, 예를 들어 문헌[Pignede et al., Applied and Environmental Biology, Vol. 66:8 (2000), pp. 3283-3289], [Chuang et al., New Biotechnology, Vol. 27:4 (2010), pp. 277-282], 및 [Barth 및 Gaillardin, (1996), In: K,W. (Ed.), Nonconventional Yeasts in Biotecnology. Sprinter-Verlag, Berlin-Heidelber, pp. 313-388]에 개시되었다. 픽커스는, 형질 전환 벡터 JMP123 및 야로위아 리폴리티카 LIP2 유전자 프로모터, 그리고 3'UTR/종결 인자는 야로위아 리폴리티카 내에서 이종 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 픽커스는, JMP123상에서 암호화되는 하이그로마이신 내성 카세트가 야로위아 리폴리티카 내 선택가능한 마커로서 사용되기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 hph 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 JMP123을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 야로위아 리폴리티카의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 야로위아 리폴리티카 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 야로위아 리폴리티카 LIP2 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 단백질 암호화 서열의 하류 또는 3' 영역에서 야로위아 리폴리티카 LIP2 유전자 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는, 야로위아 리폴리티카 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 당업자는, 야로위아 리폴리티카 게놈의 서열 내에서 이와 같은 상동성 영역을 동정할 수 있다(문헌[Dujun et al ., Nature, Vol. 430 (2004), pp. 35-44] 참조). 야로위아 리폴리티카를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 아세트산 리튬 형질 전환법 또는 기타 다른 공지된 방법들을 통하여 이루어졌다. hph 유전자 생성물의 활성은, 예를 들어 하이그로마이신을 포함하는 YPD 배지에서 형질 전환 벡터로 형질 전환된 야로위아 리폴리티카를 선택하는 마커로서 사용될 수 있었다. 야로위아 리폴리티카 지질 생산에 적당한 생장 배지는 YPD 배지와, Chuang et al.에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 야로위아 리폴리티카 지질의 지방산 프로필은 표준적 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
43:
모르티에렐라
알파인의 조작
본 발명에 따라서, 재조합 유전자의 모르티에렐라 알파인 내 발현은 본원에 기술된 바와 같이 Mackenzie(맥켄지) et al.에 의해 교시된 방법과 벡터를 변형하여 이루어질 수 있었다. 간단히 말해서, 문헌[Mackenzie et al., Applied and Environmental Microbiology, Vol. 66 (2000), pp. 4655-4661]에는, 플라스미드 DNA로 모르티에렐라 알피나를 안정적으로 핵내에서 형질 전환하는 것에 대해 개시되어 있다. 맥켄지는 원형질체 형질 전환법을 사용하여 플라스미드 pD4를 모르티에렐라 알피나에 도입하였다. 플라스미드 pD4는, hpt 단백질 암호화 영역 상류의 모르티에렐라 알피나 히스톤 H4.1 유전자 프로모터(GenBank 수탁 번호 제AJ249812호)에 작동 가능하도록 결합되고, hpt 단백질 암호화 영역 하류의 아스퍼질러스 니듈란스 N-(5'-포스포리보실)안트라닐레이트 이소머라제(trpC) 유전자 3'UTR/종결 인자에 작동 가능하도록 결합된, 하이그로마이신 B 포스포트랜스퍼라제 유전자 생성물(hpt) 암호화 서열을 포함하는 하이그로마이신 B 내성 카세트를 포함하였다. pD4로 형질 전환하기 전, 모르티에렐라 알피나는 300ug/㎖ 하이그로마이신을 포함하는 배지에서 번식할 수 없었다. pD4로 형질 전환하였을 때, 300ug/㎖ 하이그로마이신을 포함하는 배지에서 번식된, 형질 전환된 모르티에렐라 알피나가 생산되었는데, 이로써, 모르티에렐라 알피나 내에서 사용되는 선택가능한 마커로서의 하이그로마이신 B 항생제 내성 카세트의 유용성이 확립되었다. 안정적인 형질 전환체의 게놈 DNA는 서던 블럿에 의해 평가되었다. 맥켄지는, 형질 전환된 모르티에렐라 알피나의 선택 및 유지는 하이그로마이신을 포함하는 PDA(감자 덱스트로스 한천) 배지에서 이루어졌다고 개시하였다. 형질 전환된 모르티에렐라 알피나의 액체 배양(맥켄지에 의함)은 PDA 배지 중 또는 S2GYE 배지(5% 글루코스, 0.5% 효모 추출물, 0.18% NH4SO4, 0.02% MgSO4-7H2O, 0.0001% FeCl3- 6H2O, 0.1% 미량 원소, 10mM K2HPO4-NaH2PO4 포함)(하이그로마이신 함유) 중에서 수행되었다. 모르티에렐라 알피나를 배양하는데 사용되는 기타 다른 배지와 기술, 그리고 모르티에렐라 알피나에서 사용되는 선택가능한 마커, 3'UTR, 프로모터 및 기타 다른 플라스미드에 대해서는, 예를 들어 문헌[Ando et al., Applied and Environmental Biology, Vol. 75:17 (2009) pp. 5529-35] 및 [Lu et al., Applied Biochemistry and Biotechnology, Vol. 164:7 (2001), pp. 979-90]에 개시되어 있다. 맥켄지는, 형질 전환 벡터 pD4와 모르티에렐라 알피나 하스톤 H4.1 프로모터, 그리고 에이.니듈란스 trpC 유전자 3'UTR/종결 인자는 모르티에렐라 알피나 내에서의 이종 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 맥켄지는, pD4상에서 암호화된 하이그로마이신 내성 카세트는 모르티에렐라 알피나 내에서 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 hpt 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 pD4를 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형히여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 모르티에렐라 알피나의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 모르티에렐라 알피나 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 모르티에렐라 알피나 히스톤 H4.1 유전자 프로모터에 작동 가능하도록 결합될 수 있었으며, 단백질 암호화 영역의 하류 또는 3' 영역에서 에이.니듈란스 trpC 3'UTR/종결 인자에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는, 모르티에렐라 알피나 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택될 수 있었다. 당업자는, 모르티에렐라 알파인 게놈의 서열 내에서 이와 같은 상동성 영역을 동정할 수 있다(문헌[Wang et al., PLOS One, Vol. 6:12 (2011)] 참조). 모르티에렐라 알피나를 형질 전환 벡터로 안정적으로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 원형질체 형질 전환법 또는 기타 다른 공지된 방법들을 통하여 이루어졌다. hpt 유전자 생성물의 활성은, 예를 들어 하이그로마이신을 포함하는 PDA 배지에서 형질 전환 벡터로 형질 전환된 모르티에렐라 알피나를 선택하는 마커로서 사용될 수 있었다. 모르티에렐라 알피나 지질 생산에 적당한 생장 배지는 S2GYE 배지와, Lu et al. 및 Ando et al.에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 모르티에렐라 알피나 지질의 지방산 프로필은 표준적 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
실시예
44:
로도코커스
오파쿠스
PD630
의 조작
본 발명에 따라서 재조합 유전자의 로도코커스 오파쿠스 PD630 내 발현은 본원에 기술된 바와 같이 Kalscheuer(칼슈어) et al.에 의해 교시된 방법과 벡터를 변형하여 이루어질 수 있었다. 간단히 말하면, 문헌[Kalscheuer et al ., Applied and Environmental Microbiology, Vol. 52 (1999), pp. 508-515]에는, 로도코커스 오파쿠스를 플라스미드 DNA로 안정적으로 형질 전환하는 것에 대해 개시되어 있다. 칼슈어는 전기 천공법과 같은 형질 전환법을 사용하여 플라스미드 pNC9501을 로도코커스 오파쿠스 PD630에 도입하였다. 플라스미드 pNC9501은, 유전자의 프로모터와 3' 종결 인자 서열을 포함하는, 스트렙토마이세스 아주레우스 23S rRNA A1067 메틸트랜스퍼라제 유전자의 전 뉴클레오티드 서열을 포함하는 티오스트렙톤 내성(thior) 카세트를 포함하였다. pNC9501으로 형질 전환하기 전, 로도코커스 오파쿠스는 1mg/㎖ 티오스트렙톤을 포함하는 배지에서 번식할 수 없었다. 로도코커스 오파쿠스 PD630을 pNC9501로 형질 전환하여, 1mg/㎖ 티오스트렙톤을 포함하는 배양 배지에서 번식된 형질 전환체가 생산되었는데, 이로써, 로도코커스 오파쿠스 PD630 내 선택가능한 마커로서의 티오스트렙톤 내성 카세트의 용도가 확립되었다. 칼슈어에 의해 개시된 제2 플라스미드 pAK68은, 내성 thior 카세트와, 랄스토니아 유트로파 베타-케토티올라제 유전자(phaB) 서열, 아세토아세틸-CoA 환원 효소 유전자(phaA) 서열 및 폴리 3-하이드록시알칸산 합성 효소 유전자(phaC) 서열(폴리하이드록시알카노에이트 생합성용; lacZ 프로모터에 의해 작동됨)을 포함하였다. 폴리하이드록시알카노에이트 생합성 경로가 결핍된 로도코커스 오파쿠스 PD630 균주를 pAK68로 형질 전환하여, 형질 전환된 로도코커스 오파쿠스 PD630(형질 전환되지 않은 균주보다 많은 양의 폴리하이드록시알카노에이트를 생산)을 생산하였다. 도입된 랄스토니아 유트로파 phaB, phaA 및 phaC 효소의 검출 가능한 활성은, pAK68 플라스미드상에서 암호화되는 조절 요소가 로도코커스 오파쿠스 PD630 내 이종 유전자 발현에 적당하였음을 암시하였다. 칼슈어는, 형질 전환된 로도코커스 오파쿠스 PD630의 선택 및 유지는, 표준적 루리아 브로스(Luria Broth)(LB) 배지, 영양 브로스(NB), 또는 티오스트렙톤을 포함하는 무기염 배지(MSM) 상에서 이루어졌다고 개시하였다. 로도코커스 오파쿠스 PD630를 배양하는데 사용되는 기타 다른 배지와 기술에 대해서는, 예를 들어 문헌[Kurosawa et al., Journal of Biotechnology, Vol. 147:3-4 (2010), pp. 212-218] 및 [Alverez et al., Applied Microbial and Biotechnology, Vol. 54:2 (2000), pp.218-223]에 개시되어 있다. 칼슈어는, 형질 전환 벡터 pNC9501 및 pAK68, 스트렙토마이세스 아주레우스 23S rRNA A1067 메틸트랜스퍼라제 유전자의 프로모터 및 lacZ 유전자가 로도코커스 오파쿠스 PD630 내 이종 유전자 발현을 가능하게 하는데 적당하다고 개시하였다. 뿐만 아니라, 칼슈어는, pNC9501 및 pAK68상에서 암호화되는 thior 카세트가 로도코커스 오파쿠스 PD630 내 선택가능한 마커로서 사용하기 적당하였다고 개시하였다.
본 발명의 하나의 구체예에서, 선택가능한 마커로서 사용되는 thior 유전자 생성물 암호화 뉴클레오티드 서열을 포함하는 벡터 pNC9501을 구성하고, 지질 생합성 경로 발현 카세트 서열을 추가로 포함하도록 변형하여, 형질 전환 벡터를 생산하였다. 지질 생합성 경로 발현 카세트는 표 70으로부터 선택되는 하나 이상의 지질 생합성 경로 단백질을 암호화하였는데, 이 경우, 각각의 단백질 암호화 서열은, 표 69에 따라서 로도코커스 오파쿠스의 핵내 유전자에 고유한 코돈 편향 사용을 반영하도록, 로도코커스 오파쿠스 PD630 내 발현에 대해 코돈 최적화되었다. 표 70의 지질 생합성 경로 단백질 각각에 있어서, 코돈 최적화 유전자 서열은 각각, 단백질 암호화 서열 상류의 lacZ 유전자 프로모터에 작동 가능하도록 결합될 수 있었다. 형질 전환 구조물은 형질 전환 벡터의 표적화 게놈 통합에 사용되는, 로도코커스 오파쿠스 PD630 게놈에 상동성인 영역을 추가로 포함할 수 있었다. 상동성 영역은 내인성 지질 생합성 경로 유전자의 하나 이상의 게놈 위치를 중단하는 것으로 선택할 수 있었다. 당업자는, 로도코커스 오파쿠스 PD630 게놈의 서열 내에서 이와 같은 상동성 영역을 동정할 수 있다(문헌[Holder et al ., PLOS Genetics, Vol. 7:9 (2011)] 참조). 로도코커스 오파쿠스 PD630을 형질 전환 벡터로 형질 전환하는 것은, 널리 공지된 형질 전환 기술, 예를 들어 전기 천공법 또는 기타 다른 공지된 방법들을 통하여 이루어졌다. 스트렙토마이세스 아주레우스 23S rRNA A1067 메틸트랜스퍼라제 유전자 생성물의 활성은, 예를 들어 티오스트렙톤을 포함하는 LB 배지에서 형질 전환 벡터로 형질 전환된 로도코커스 오파쿠스 PD630을 선택하는 마커로서 사용될 수 있었다. 로도코커스 오파쿠스 PD630 지질 생산에 적당한 생장 배지는 Kurosawa et al. 및 Albarez et al.에 의해 개시된 배양 배지를 포함하나, 이에 제한되는 것은 아니다. 로도코커스 오파쿠스 PD630 지질의 지방산 프로필은 표준적 지질 추출법과 본원에 기술된 분석 방법을 통하여 평가될 수 있었다.
본원에 인용된 모든 참고 문헌, 예를 들어 특허, 특허 출원 및 공보, 예를 들어 GenBank 수탁 번호는, 사전에 구체적으로 인용되었든 아니든, 본원에 그 자체로서 참조로 포함되어 있는 것이다. 본원에 인용된 공보는, 본 발명과 연관되어 사용될 수 있는 시약, 방법 및 개념을 기술 및 개시하고자 하는 목적으로 인용되었다. 본원에 개시된 것들 중 그 어떤 것도, 본원에 인용된 참고 문헌들이 본원에 기술된 본 발명과 관련하여 선행 기술에 해당함을 인정하는 것으로서 해석되지 않는다. 특히 다음과 같은 특허 출원은 모든 목적을 위하여 그 자체로서 본원에 참조로 포함되었다: PCT 특허 출원 PCT/US2008/065563(2008년 6월 2일 출원; 발명의 명칭“Production of Oil in Microorganisms”), PCT 특허 출원 PCT/US2010/31108(2010년 4월 14일 출원; 발명의 명칭“Methods of Microbial Oil Extraction and Separation”), 그리고 PCT 특허 출원 PCT/US2009/066142(2009년 11월 30일 출원; 발명의 명칭 “Production of Tailored Oils in Heterotrophic Microorganisms”).
서열 목록
서열 번호 1
클로렐라로부터의 HUP 프로모터 (GenBank 수탁 번호 X55349의 서브시퀀스)
서열 번호 2
AY307383으로부터의 클로렐라 엘립소이데아 질산염 환원 효소 프로모터
서열 번호 3
효모 수크로스 인버타제
서열 번호 4
효모 분비 신호
서열 번호 5
고등 식물 분비 신호
서열 번호 6
콘센서스 진핵 분비 신호
서열 번호 7
조합 고등 식물/진핵 분비 신호
서열 번호 8
에스.세레비지아에 수크로스 인버타제 NP_012104
서열 번호 9
서열 번호 10
서열 번호 11
UTEX 329 프로토테카 크로에가니
서열 번호 12
UTEX 1440 프로토테카 윅커해미
서열 번호 13
UTEX 1442 프로토테카 스태그노라
서열 번호 14
UTEX 288 프로토테카 모리포르미스
서열 번호 15
UTEX 1439, UTEX 1441, UTEX 1435, UTEX 1437 프로토테카 모리포르미스
서열 번호 16
UTEX 1533 프로토테카 윅커해미
서열 번호 17
UTEX 1434 프로토테카 모리포르미스
서열 번호 18
UTEX 1438 프로토테카 조프피이
서열 번호 19
UTEX 1436 프로토테카 모리포르미스
서열 번호 20
치코리움 인티부스 인버타제: Genbank 수탁 번호 Y11124
서열 번호 21
스키조사카로마이세스 폼베 인버타제: Genbank 수탁 번호 AB011433
서열 번호 22
피카 아노말라 베타-프럭토푸라노시다제 (인버타제): Genank 수탁 번호 X80640
서열 번호 23
데바리오마이세스 옥시덴탈리스 인버타제: Genank 수탁 번호 X17604
서열 번호 24
오리자 사티바 인버타제: Genank 수탁 번호 AF019113
서열 번호 25
알리움 케파 인버타제: Genank 수탁 번호 AJ006067
서열 번호 26
베타 불가리스 아종 불가리스 인버타제: Genank 수탁 번호 AJ278531
서열 번호 27
비피도박테리움 브레베 UCC2003 베타-프럭토푸라노시다제 (인버타제): Genank 수탁 번호 AAT28190
서열 번호 28
사카로마이세스 세레비지아에 인버타제: Genank 수탁 번호 NP_012104
서열 번호 29
지모모나스 모빌리스 인버타제 A: Genank 수탁 번호 AY171597
서열 번호 30
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니 는 신나모뮴 캠포라 FATB1 (Genbank Q39473) 아미노산 서열
서열 번호 31
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 신나모뮴 캠포라 FATB1 cDNA의 관련 코돈 최적화 발현 구조물
서열 번호 32
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 쿠페아 후커리아나 FATB2 (Genbank AAC49269) 아미노산 서열
서열 번호 33
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 쿠페아 후커리아나 FATB2 cDNA의 관련 코돈 최적화 발현 구조물
서열 번호 34
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 움벨루라리아 캘리포니카 FATB1 (Genbank Q41635) 아미노산 서열
서열 번호 35
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 움벨루라리아 캘리포니카 FATB1 cDNA의 관련 코돈 최적화 발현 구조물
서열 번호 36
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 쿠페아 팔루스트리스 C8 선호 티오에스테라제 (Genbank AAC49179) 아미노산 서열
서열 번호 37
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 쿠페아 팔루스트리스 C8 선호 티오에스테라제 cDNA의 관련 코돈 최적화 발현 구조물
서열 번호 38
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 쿠페아 란세올라타 C10 선호 티오에스테라제 (Genbank CAB60830) 아미노산 서열
서열 번호 39
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 운반 펩티드를 지니는 쿠페아 란세올라타 C10 선호 티오에스테라제의 관련 코돈 최적화 코딩 영역
서열 번호 40
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 엽록체 운반 펩티드를 지니는 아이리스 게르마니카 C14 선호 티오에스테라제 (Genbank AAG43858.1) 아미노산 서열
서열 번호 41
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 아이리스 게르마니카 C14 선호 티오에스테라제의 관련 코돈 최적화 코딩 영역
서열 번호 42
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 엽록체 운반 펩티드를 지니는 미리스티카 프래그란스 지방산 티오에스테라제 (Genbank AAB717291.1) 아미노산 서열
서열 번호 43
프로토테카 모리포르미스 델타 12 지방산 불포화 효소 엽록체 운반 펩티드를 지니는 미리스티카 프래그란스 지방산 티오에스테라제의 관련 코돈 최적화 코딩 영역
서열 번호 44
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 쿠페아 팔루스트리스 C14 선호 티오에스테라제 (Genbank AAC49180) 아미노산 서열
서열 번호 45
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 쿠페아 팔루스트리스 C14 선호 티오에스테라제의 관련 코돈 최적화 코딩 영역
서열 번호 46
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 얼머스 아메리카나 광범위 특이성 티오에스테라제 (Genbank AAB71731) 아미노산 서열
서열 번호 47
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 얼머스 아메리카나 광범위 특이성 티오에스테라제의 관련 코돈 최적화 코딩 영역
서열 번호 48
코돈 최적화 프로토테카 모리포르미스 (UTEX 1435) 델타 12 지방산 불포화 효소 운반 펩티드 cDNA 서열
서열 번호 49
코돈 최적화 클로렐라 프로토테코이데스 (UTEX 250) 스테아로일 ACP 불포화 효소 운반 펩티드 cDNA 서열
서열 번호 50
얼머스 아메리카나 광범위 특이성 티오에스테라제의 코돈 최적화 코딩 영역의 적절한 상동 재조합 발현 구조물
서열 번호 51
신나모뮴 캠포라 C14 선호 티오에스테라제의 코돈 최적화 코딩 영역의 적절한 상동 재조합 발현 구조물
서열 번호 52
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 쿠페아 후커리아나 C10 선호 티오에스테라제의 코돈 최적화 코딩 영역에 대한 관련 발현 구조물
서열 번호 53
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 움벨루라리아 캘리포니카 C12 선호 티오에스테라제의 코돈 최적화 코딩 영역에 대한 관련 발현 구조물
서열 번호 54
클로렐라 프로토테코이데스 스테아로일 ACP 불포화 효소 운반 펩티드를 지니는 얼머스 아메리카나 광범위 특이성 티오에스테라제의 코돈 최적화 코딩 영역에 대한 관련 발현 구조물
서열 번호 55
프로토테카 모리포르미스 FatB/A 프로모터/5'UTR
서열 번호 56
프로토테카 모리포르미스 NRAMP 금속 운반체 프로모터/5'UTR
서열 번호 57
프로토테카 모리포르미스 FLAP 편모-관련 단백질 프로모터/5'UTR
서열 번호 58
프로토테카 모리포르미스 SulfRed Sulfite 환원 효소 프로모터/5'UTR
서열 번호 59
프로토테카 모리포르미스 SugT 당 운반체 프로모터/5'UTR
서열 번호 60
프로토테카 모리포르미스 Amt03-암모늄 운반체 프로모터/5'UTR
서열 번호 61
프로토테카 모리포르미스 Amt02-암모늄 운반체 프로모터/5'UTR
서열 번호 62
프로토테카 모리포르미스 Aat01-아미노산 운반체 프로모터/5'UTR
서열 번호 63
프로토테카 모리포르미스 Aat02-아미노산 운반체 프로모터/5'UTR
서열 번호 64
프로토테카 모리포르미스 Aat03-아미노산 운반체 프로모터/5'UTR
서열 번호 65
프로토테카 모리포르미스 Aat04-아미노산 운반체 프로모터/5'UTR
서열 번호 66
프로토테카 모리포르미스 Aat05-아미노산 운반체 프로모터/5'UTR
서열 번호 67
프로토테카 모리포르미스 Aat01의 추정 프로모터/5'UTR을 시험하기 위한 리포터 구조물의 관련 부분
서열 번호 68
씨. 캠포라 티오에스테라제 정방향 프라이머
서열 번호 69
씨. 캠포라 티오에스테라제 역방향 프라이머
서열 번호 70
cd189 정방향 프라이머
서열 번호 71
cd189 역방향 프라이머
서열 번호 72
프로토테카 모리포르미스 델타 12 FAD 녹아웃 상동 재조합 표적화 구조물의 5' 공여체 DNA 서열
서열 번호 73
프로토테카 모리포르미스 델타 12 FAD 녹아웃 상동 재조합 표적화 구조물의 3' 공여체 DNA 서열
서열 번호 74
프로토테카 모리포르미스 델타 12 FAD 녹아웃 상동 재조합 표적화 구조물
서열 번호 75
프로토테카 모리포르미스 SAD2A 녹아웃 상동 재조합 표적화 구조물의 5' 공여체 DNA 서열
서열 번호 76
프로토테카 모리포르미스 SAD2A 녹아웃 상동 재조합 표적화 구조물의 3' 공여체 DNA 서열
서열 번호 77
프로토테카 모리포르미스 SAD2A 녹아웃 상동 재조합 표적화 구조물
서열 번호 78
프로토테카 모리포르미스 SAD2B 녹아웃 상동 재조합 표적화 구조물의 5' 공여체 DNA 서열
서열 번호 79
프로토테카 모리포르미스 SAD2B 녹아웃 상동 재조합 표적화 구조물의 3' 공여체 DNA 서열
서열 번호 80
프로토테카 모리포르미스 SAD2B 녹아웃 상동 재조합 표적화 구조물
서열 번호 81
피. 모리포르미스 Aat02 프로모터/5'UTR::씨. 프로토테코이데스 스테아로일 ACP 불포화 효소 PTS::신나모뮴 캠포라 C14 티오에스테라제::씨. 불가리스 질산염 환원 효소 3'UTR
서열 번호 82
5' 6S 영역 게놈 공여체 서열
서열 번호 83
신나모뮴 캠포라 티오에스테라제에 대한 관련 발현 구조물
(βtub::neo::nitred::βtub::씨. 캠포라 TE::nitred)
서열 번호 84
3' 6S 영역 게놈 공여체 서열
서열 번호 85
Amt03 정방향 프라이머
서열 번호 86
Amt03 역방향 프라이머
서열 번호 87
Amt02 정방향 프라이머
서열 번호 88
Amt02 역방향 프라이머
서열 번호 89
Amt03 프로모터/UTR 서열
서열 번호 90
amt 프로모터/UTR의 관련 서열::씨. 캠포라 티오에스테라제 발현 구조물
서열 번호 91
코돈-최적화 씨. 캠포라 티오에스테라제 서열
서열 번호 92
코돈-최적화 유. 캘리포니카 티오에스테라제 서열
서열 번호 93
코돈-최적화 유. 아메리카나 티오에스테라제 서열
서열 번호 94
코돈-최적화 씨. 후커리아나 티오에스테라제 서열
서열 번호 95
유. 캘리포니카 티오에스테라제 정방향 프라이머
서열 번호 96
유. 캘리포니카 티오에스테라제 역방향 프라이머
서열 번호 97
유. 아메리카나 티오에스테라제 정방향 프라이머
서열 번호 98
유. 아메리카나 티오에스테라제 역방향 프라이머
서열 번호 99
씨. 후커리아나 티오에스테라제 정방향 프라이머
서열 번호 100
씨. 후커리아나 티오에스테라제 역방향 프라이머
서열 번호 101
FAD 프라이머 1
서열 번호 102
FAD 프라이머 2
서열 번호 103
pSZ1124 (FAD2B) 5' 게놈 표적화 서열
서열 번호 104
pSZ1124 (FAD2B) 3' 게놈 표적화 서열
서열 번호 105
씨. 세레비지아에 suc2 카세트
서열 번호 106
pSZ1125 (FAD2C) 5' 게놈 표적화 서열
서열 번호 107
pSZ1125 (FAD2C) 3' 게놈 표적화 서열
서열 번호 108
에스. 칼베르겐시스 MEL1 아미노산 서열
서열 번호 109
에스. 칼베르겐시스 MEL1 천연 신호 펩티드 아미노산 서열
서열 번호 110
에스. 칼베르겐시스 MEL1 발현 카세트의 관련 서열
서열 번호 111
코돈-최적화 에스. 칼베르겐시스 MEL1 서열
서열 번호 112
5' Clp 상동 재조합 표적화 서열
서열 번호 113
3' Clp 상동 재조합 표적화 서열
서열 번호 114
클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR
서열 번호 115
클로렐라 불가리스 질산염 환원 효소 3'UTR
서열 번호 116
에이. 나이저 AlgC 아미노산 서열
서열 번호 117
에이. 나이저 AlgC 천연 신호 펩티드 아미노산 서열
서열 번호 118
코돈-최적화 에이. 나이저 AlgC 코딩 서열
서열 번호 119
에이. 나이저 AlgC 발현 카세트의 관련 서열
서열 번호 120
씨. 테트라고노볼라 α-갈락토시다제 아미노산 서열
서열 번호 121
코돈 최적화 씨. 테트라고노볼라 α-갈락토시다제 서열
서열 번호 122
씨. 테트라고노볼라 α-갈락토시다제 발현 카세트의 관련 서열
서열 번호 123
5' 프라이머 씨. 불가리스 3'UTR:하류 Clp 서열
서열 번호 124
3' 프라이머 씨. 불가리스 3'UTR:하류 Clp 서열
서열 번호 125
코코믹사 C-169 THIC 아미노산 서열
서열 번호 126
코코믹사 C-169 THIC 천연 운반 펩티드 아미노산 서열
서열 번호 127
코코믹사 C-169 THIC 발현 카세트의 관련 서열
서열 번호 128
코돈-최적화 코코믹사 C-169 THIC 서열
서열 번호 129
코돈-최적화 에스. 세레비지아에 suc2 서열
서열 번호 130
씨. 프로토테코이데스 운반 펩티드를 지니는 코코믹사 C-169 THIC 발현 구조물의 관련 서열
서열 번호 131
씨. 프로토테코이데스 운반 펩티드를 지니는 코돈-최적화 코코믹사 C-169 THIC 서열
서열 번호 132
클로렐라 프로토테코이데스 액틴 프로모터/5'UTR
서열 번호 133
클로렐라 프로토테코이데스 EF1A 3'UTR
서열 번호 134
에이. 탈리아나 THIC 발현 카세트의 관련 서열
서열 번호 135
씨. 프로토테코이데스 운반 펩티드를 지니는 코돈-최적화 에이.탈리아나 THIC
서열 번호 136
에이.탈리아나 아미노산 서열 (천연 운반 펩티드 서열을 지님)
서열 번호 137
시네코시스티스 종 thiC 발현 카세트의 관련 서열
서열 번호 138
씨. 프로토테코이데스 운반 펩티드를 지니는 코돈-최적화 시네코시스티스 종 thiC 서열
서열 번호 139
시네코시스티스 종 thiC 아미노산 서열 (천연 운반 펩티드 서열을 지님)
서열 번호 140
코돈-최적화 neoR 유전자
서열 번호 141
5'THIC 코코믹사 C-169 확인 프라이머
서열 번호 142
3'THIC 확인 프라이머
서열 번호 143
5'THIC 에이. 탈리아나 확인 프라이머
서열 번호 144
5'thiC 시네코시스티스 종 확인 프라이머
서열 번호 145
pSZ1318로부터의 미리스티카 프래그란스 광범위-기반 C14:0-C18:0 티오에스테라제의 코돈-최적화 코딩 영역
서열 번호 146
미리스티카 프래그란스 광범위-기반 C14:0-C18:0 티오에스테라제의 아미노산 서열 (수탁 번호 AAB71729)
서열 번호 147
pSZ1452로부터의 가르시니아 망고스타나 C16:0-선호 티오에스테라제의 코돈-최적화 코딩 영역
서열 번호 148
가르시니아 망고스타나 C16:0-선호 티오에스테라제의 아미노산 서열 (수탁 번호 AAB51525.1)
서열 번호 149
pSZ1417로부터의 쿠페아 후커리아나 C16:0-선호 티오에스테라제의 코돈-최적화 코딩 영역
서열 번호 150
쿠페아 후커리아나 C16:0-선호 티오에스테라제의 아미노산 서열 (수탁 번호 Q39513.1)
서열 번호 151
pSZ1437로부터의 엘라에이스 기니엔시스 C16:0-선호 티오에스테라제의 코돈-최적화 코딩 영역
서열 번호 152
엘라에이스 기니엔시스 C16:0-선호 티오에스테라제의 아미노산 서열 (수탁 번호 AAD42220.2)
서열 번호 153
pSZ1358로부터의 브라시카 나푸스 C18:0-선호 티오에스테라제의 코돈-최적화 코딩 영역
서열 번호 154
브라시카 나푸스 C18:0-선호 티오에스테라제의 아미노산 서열 (수탁 번호 CAA52070.1)
서열 번호 155
pSZ1375로부터의 클로렐라 프로토테코이데스 UTEX 250 스테아로일-ACP 불포화 효소 운반 펩티드를 지니는 리시누스 커뮤니스 ACP-티오에스테라제의 코돈-최적화 코딩 서열
서열 번호 156
리시누스 커뮤니스 ACP-티오에스테라제의 아미노산 서열 (수탁 번호 ABS30422.1)
서열 번호 157
pSZ1317로부터의 클로렐라 프로토테코이데스 UTEX 250 스테아로일-ACP 운반 펩티드를 지니는 미리스티카 프래그란스 광범위-기반 티오에스테라제의 코돈-최적화 코딩 영역
서열 번호 158
클로렐라 프로토테코이데스 UTEX 250 스테아로일-ACP 운반 펩티드 서열을 지니는 미리스티카 프래그란스 광범위-기반 티오에스테라제의 아미노산 서열
서열 번호 159
씨. 레인하르드티 β-튜불린 프로모터/5'UTR 및 씨. 불가리스 질산염 환원 효소 3'UTR을 지니는 에스. 세레비지아에 suc2 유전자의 코돈-최적화 발현 카세트의 뉴클레오티드 서열
서열 번호 160
pSZ1462로부터의 클로렐라 프로토테코이데스 UTEX 250 스테아로일-ACP 불포화 효소 운반 펩티드를 지니는 쿠페아 후커리아나 C16:선호 티오에스테라제의 코돈-최적화 코딩 영역
서열 번호 161
pSZ1436으로부터의 엘라에이스 기니엔시스 C16:0-선호 티오에스테라제 PATE의 코돈-최적화 코딩 영역
서열 번호 162
엘라에이스 기니엔시스 C16:0-선호 티오에스테라제 PATE의 아미노산 서열 (GenBank 수탁 번호 ABD83939)
서열 번호 163
pSZ1468로부터의 RNAi 발현 카세트의 FADc 부분
서열 번호 164
pSZ1468로부터의 FADc RNAi 발현 카세트의 관련 부분
서열 번호 165
pSZ1469로부터의 RNAi 발현 카세트의 FADc 부분
서열 번호 166
pSZ1469로부터의 FADc RNAi 발현 카세트의 관련 부분
서열 번호 167
pSZ1470으로부터의 RNAi 발현 카세트의 FADc 부분
서열 번호 168
pSZ1470으로부터의 FADc RNAi 발현 카세트의 관련 부분
서열 번호 169
pSZ1471로부터의 RNAi 발현 카세트의 FADc 부분
서열 번호 170
pSZ1471로부터의 FADc RNAi 발현 카세트의 관련 부분
서열 번호 171
pSZ1377로부터의 클로렐라 프로토테코이데스 UTEX 250 스테아로일-ACP 운반 펩티드를 지니는 올레아 유로파에아 스테아로일-ACP 불포화 효소의 코돈-최적화 코딩 영역
서열 번호 172
올레아 유로파에아 스테아로일-ACP 불포화 효소의 아미노산 서열 (수탁 번호 AAB67840.1)
서열 번호 173
pSZ1419로부터의 리시누스 커뮤니스 올리에이트 12-하이드록실라제의 코돈-최적화 코딩 서열
서열 번호 174
리시누스 커뮤니스 올리에이트 12-하이드록실라제의 아미노산 서열 (수탁 번호 AAC49010.1)
서열 번호 175
리시누스 커뮤니스
서열 번호 176
헬리안터스 아너스
서열 번호 177
브라시카 나푸스
서열 번호 178
GenBank 수탁 번호 ABR01158.1, ABI18155.1, AAF61739.1 및 AAW88763.1을 각각 지니는 글리신 맥스
서열 번호 179
피. 모리포르미스
서열 번호 180
피. 모리포르미스 스테아로일 ACP 불포화 효소
서열 번호 181
리누스 유시타티시멈 12 불포화 효소
서열 번호 182
리누스 유시타티시멈 15 불포화 효소
서열 번호 183
리누스 유시타티시멈 15 불포화 효소
서열 번호 184
칼타머스 팅크토리우스 12 불포화 효소
서열 번호 185
GenBank 수탁 번호 ABB05230.1, ABA02173.1, ABA02172.1, ADM48789.1 및 AAL68983.1을 각각 지니는 헬리안투스 아너스 12 불포화 효소
서열 번호 186
쿠페아 라이티 FatB1 티오에스테라제: GenBank 수탁 번호 U56103
서열 번호 187
쿠페아 라이티 FatB2 티오에스테라제: GenBank 수탁 번호 U56104
서열 번호 188
형질 전환 구조물, 6S-CrbTub_suc2_nr::CrbTub_CwFatB1_nr-6S, Const.1으로 명명됨
서열 번호 189
형질 전환 구조물, 6S-CrbTub_suc2_nr::CrbTub_CwFatB2_nr-6S, Const.2로 명명됨
서열 번호 190
형질 전환 구조물 6S-CrbTub_suc2_nr::Amt3_CwFatB1_nr-6S (Const.3으로 명명됨) 및 6S-CrbTub_suc2_nr::Amt3_CwFatB2_nr-6S (Const.4로 명명됨)
서열 번호 191
TP1 (UTEX 250 스테아로일 ACP 불포화 효소 운반 펩티드 서열)
서열 번호 192
TP2 (UTEX 1435 스테아로일 ACP 불포화 효소 운반 펩티드 서열)
서열 번호 193
TP3 (UTEX 1435 델타 12 지방산 불포화 효소 운반 펩티드 서열)
서열 번호 194
TP4 (UTEX 1435 이소펜테닐 디포스페이트 합성 효소 운반 펩티드 서열)
서열 번호 195
카르타머스 팅크토리우스 올레오일-아실 담체 단백질 티오에스테라제; GenBank 수탁 번호 AAA33019.1
서열 번호 196
리시누스 커뮤니스 스테아로일-아실 담체 단백질 불포화 효소, GenBank 수탁 번호 AACG59946.1
서열 번호 197
헬리안투스 아너스 스테아로일-ACP 불포화 효소, GenBank 수탁 번호 AAB65145.1
서열 번호 198
브라시카 준세아 색소체 델타-9-스테아로일-아실 담체 단백질 불포화 효소, GenBank 수탁 번호 AAD40245.1
서열 번호 199
글리신 맥스 스테아로일-ACP 불포화 효소, GenBank 수탁 번호 ACJ39209.1
서열 번호 200
올레아 유로파에아 스테아로일-ACP 불포화 효소, GenBank 수탁 번호 AAB67840.1
서열 번호 201
베르니시아 포르디 스테아로일-아실-담체 단백질 불포화 효소, GenBank 수탁 번호 ADC32803.1
서열 번호 202
헬리안투스 아너스 아실-ACP 티오에스테라제 FATA1, GenBank 수탁 번호 AAL79361.1
서열 번호 203
브라시카 라파 FATA1, GenBank 수탁 번호 AAC49002.1
서열 번호 204
자트로파 컬카스 아실-ACP 티오에스테라제, GenBank 수탁 번호 ABX82799.3
서열 번호 205
제아 메이스 올레오일-아실 담체 단백질 티오에스테라제, GenBank 수탁 번호 ACG40089.1
서열 번호 206
제아 메이스 올레오일-아실 담체 단백질 티오에스테라제, GenBank 수탁 번호 ACG42559.1
서열 번호 207
칼타머스 팅크토리우스 델타 12 지방산 CtFAD2-3, GenBank 수탁 번호 ADM48790.1
서열 번호 208
고시피움 히르서텀 오메가-6 불포화 효소, GenBank 수탁 번호 CAA71199.1
서열 번호 209
글리신 맥스 마이크로좀 불포화 효소 GmFAD2-2a, GenBank 수탁 번호 BAD89862.1
서열 번호 210
제아 메이스 지방산 불포화 효소 FAD2, GenBank 수탁 번호 ABF50053.1
서열 번호 211
프로토테카 모리포르미스 d12 불포화 효소 대립유전자 1 CHP - check with Riyaz
서열 번호 212
프로토테카 모리포르미스 델타 12 불포화 효소 대립유전자 2
서열 번호 213
브라시카 나파 리놀레산 불포화 효소 FAD3, GenBank 수탁 번호 AAA32994.1
서열 번호 214
카멜리나 사티바 오메가-3 FAD7-2
서열 번호 215
카멜리나 사티바 오메가-3 FAD7-1
서열 번호 216
글리신 맥스 엽록체 오메가 3 지방산 불포화 효소 아이소형 2, GenBank 수탁 번호 ACF19424.1
서열 번호 217
베르니시아 포르디 오메가-3 지방산 불포화 효소, GenBank 수탁 번호 AAF12821.1
서열 번호 218
리시누스 커뮤니스 오메가-3 지방산 불포화 효소, 소포체, 추정, GenBank 수탁 번호 EEF36775.1
서열 번호 219
리넘 유시타티시멈 지방산 불포화 효소 3C, GenBank 수탁 번호 ADV92272.1
서열 번호 220
프로토테카 모리포르미스 FAD-A 리놀리에이트 불포화 효소
서열 번호 221
프로토테카 모리포르미스 FAD-D 오메가 3 불포화 효소
서열 번호 222
Bn FAD3-3xFLAG에 대한 pSZ2124 형질 전환 서열의 부분, 피. 모리포르미스에서의 발현을 위해 코돈-최적화됨
서열 번호 223
pSZ2125의 부분, 피. 모리포르미스에서의 발현을 위해 코돈-최적화된 카멜리나 사티바 FAD-7-3XFLAG의 코딩 서열
서열 번호 224
pSZ2126의 부분, 피. 모리포르미스에서의 발현을 위해 코돈-최적화된 리넘 유시타티시멈 FAD3A-3XFLAG의 코딩 서열
서열 번호 225
pSZ2127의 부분, 피. 모리포르미스에서의 발현을 위해 코돈-최적화된 리넘 유시타티시멈 FAD3B-3XFLAG의 코딩 서열
서열 번호 226
pSZ2139의 부분, 프로토테카 모리포르미스 SAD2-헤어핀 A
서열 번호 227
pSZ2140의 부분, 프로토테카 모리포르미스 SAD2-헤어핀 B
서열 번호 228
pSZ2141의 부분, 프로토테카 모리포르미스 SAD2-헤어핀 C
서열 번호 229
pSZ2142의 부분, 프로토테카 모리포르미스 SAD2-헤어핀 D
서열 번호 230
코돈-최적화 글리신 맥스 KASII을 포함하는 pSZ1747의 부분
서열 번호 231
코돈-최적화 헬리안터스 아너스 KASII을 포함하는 pSZ1750의 관련 부분
서열 번호 232
코돈-최적화 리시누스 커뮤니스 KASII을 포함하는 pSZ1754의 부분
서열 번호 233
코돈-최적화 프로토테카 모리포르미스 KASII을 포함하는 pSZ2041 형질 전환 벡터의 관련 부분
서열 번호 234
서열 번호 235
서열 번호 236
서열 번호 237
형질 전환 구조물 pSZ2014의 관련 서열
서열 번호 238
서열 번호 239
서열 번호 240
pSZ2110, KASII'5::CrbTub:NeoR:nr::KASII-3'의 관련 서열
서열 번호 241
CtFad2-2의 코돈-최적화 뉴클레오티드 서열을 포함하는 pSZ2150의 부분
서열 번호 242
GlmFad2-2의 코돈-최적화 뉴클레오티드 서열을 포함하는 pSZ2151의 부분
서열 번호 243
HaFad2의 코돈-최적화 뉴클레오티드 서열을 포함하는 pSZ2152의 부분
서열 번호 244
ZmFad2의 코돈-최적화 뉴클레오티드 서열을 포함하는 pSZ2153의 부분
서열 번호 245
플라스미드 pSZ2172에 함유된 형질 전환 DNA의 뉴클레오티드 서열
서열 번호 246
pSZ1499
서열 번호 247
서열 번호 248
서열 번호 249
pSZ2004
서열 번호 250
pSZ1500
서열 번호 251
프로토테카 모리포르미스 FATA1 녹아웃 상동 재조합 표적화 구조물의 5' 공여체 DNA 서열
서열 번호 252
프로토테카 모리포르미스 FATA1 녹아웃 상동 재조합 표적화 구조물의 3' 공여체 DNA 서열
서열 번호 253
서열 번호 254
서열 번호 255
RNAi 발현 카세트의 FATA 부분
서열 번호 256
pSZ1283
SEQUENCE LISTING
<110> SOLAZYME, INC.
<120> Tailored Oils Produced from Recombinant Oleaginous Microorganisms
<130> 057518-415312 (068PCT)
<140> PCT/US12/023696
<141> 2012-02-02
<150> US 61/438,969
<151> 2011-02-02
<150> US 61/476,691
<151> 2011-04-18
<150> US 61/484,458
<151> 2011-05-10
<150> US 61/548,616
<151> 2011-10-18
<160> 256
<170> PatentIn version 3.5
<210> 1
<211> 1187
<212> DNA
<213> Unknown
<220>
<223> Chlorella species
<400> 1
gatcagacgg gcctgacctg cgagataatc aagtgctcgt aggcaaccaa ctcagcagct 60
gcttggtgtt gggtctgcag gatagtgttg cagggcccca aggacagcag gggaacttac 120
accttgtccc cgacccagtt ttatggagtg cattgcctca agagcctagc cggagcgcta 180
ggctacatac ttgccgcacc ggtatgaggg gatatagtac tcgcactgcg ctgtctagtg 240
agatgggcag tgctgcccat aaacaactgg ctgctcagcc atttgttggc ggaccattct 300
gggggggcca gcaatgcctg actttcgggt agggtgaaaa ctgaacaaag actaccaaaa 360
cagaatttct tcctccttgg aggtaagcgc aggccggccc gcctgcgccc acatggcgct 420
ccgaacacct ccatagctgt aagggcgcaa acatggccgg actgttgtca gcactctttc 480
atggccatac aaggtcatgt cgagattagt gctgagtaag acactatcac cccatgttcg 540
attgaagccg tgacttcatg ccaacctgcc cctgggcgta gcagacgtat gccatcatga 600
ccactagccg acatgcgctg tcttttgcca ccaaaacaac tggtacaccg ctcgaagtcg 660
tgccgcacac ctccgggagt gagtccggcg actcctcccc ggcgggccgc ggccctacct 720
gggtagggtc gccatacgcc cacgaccaaa cgacgcagga ggggattggg gtagggaatc 780
ccaaccagcc taaccaagac ggcacctata ataataggtg gggggactaa cagccctata 840
tcgcaagctt tgggtgccta tcttgagaag cacgagttgg agtggctgtg tacggtcgac 900
cctaaggtgg gtgtgccgca gcctgaaaca aagcgtctag cagctgcttc tataatgtgt 960
cagccgttgt gtttcagtta tattgtatgc tattgtttgt tcgtgctagg gtggcgcagg 1020
cccacctact gtggcgggcc attggttggt gcttgaattg cctcaccatc taaggtctga 1080
acgctcactc aaacgccttt gtacaactgc agaactttcc ttggcgctgc aactacagtg 1140
tgcaaaccag cacatagcac tcccttacat cacccagcag tacaaca 1187
<210> 2
<211> 1414
<212> DNA
<213> Chlorella ellipsoidea
<400> 2
cgctgcgcac cagggccgcc agctcgctga tgtcgctcca aatgcggtcc cccgattttt 60
tgttcttcat cttctccacc ttggtggcct tcttggccag ggccttcagc tgcatgcgca 120
cagaccgttg agctcctgat cagcatcctc aggaggccct ttgacaagca agcccctgtg 180
caagcccatt cacggggtac cagtggtgct gaggtagatg ggtttgaaaa ggattgctcg 240
gtcgattgct gctcatggaa ttggcatgtg catgcatgtt cacaatatgc caccaggctt 300
tggagcaaga gagcatgaat gccttcaggc aggttgaaag ttcctggggg tgaagaggca 360
gggccgagga ttggaggagg aaagcatcaa gtcgtcgctc atgctcatgt tttcagtcag 420
agtttgccaa gctcacagga gcagagacaa gactggctgc tcaggtgttg catcgtgtgt 480
gtggtggggg ggggggggtt aatacggtac gaaatgcact tggaattccc acctcatgcc 540
agcggaccca catgcttgaa ttcgaggcct gtggggtgag aaatgctcac tctgccctcg 600
ttgctgaggt acttcaggcc gctgagctca aagtcgatgc cctgctcgtc tatcagggcc 660
tgcacctctg ggctgaccgg ctcagcctcc ttcgcgggca tggagtaggc gccggcagcg 720
ttcatgtccg ggcccagggc agcggtggtg ccataaatgt cggtgatggt ggggaggggg 780
gccgtcgcca caccattgcc gttgctggct gacgcatgca catgtggcct ggctggcacc 840
ggcagcactg gtctccagcc agccagcaag tggctgttca ggaaagcggc catgttgttg 900
gtccctgcgc atgtaattcc ccagatcaaa ggagggaaca gcttggattt gatgtagtgc 960
ccaaccggac tgaatgtgcg atggcaggtc cctttgagtc tcccgaatta ctagcagggc 1020
actgtgacct aacgcagcat gccaaccgca aaaaaatgat tgacagaaaa tgaagcggtg 1080
tgtcaatatt tgctgtattt attcgtttta atcagcaacc aagttcgaaa cgcaactatc 1140
gtggtgatca agtgaacctc atcagactta cctcgttcgg caaggaaacg gaggcaccaa 1200
attccaattt gatattatcg cttgccaagc tagagctgat ctttgggaaa ccaactgcca 1260
gacagtggac tgtgatggag tgccccgagt ggtggagcct cttcgattcg gttagtcatt 1320
actaacgtga accctcagtg aagggaccat cagaccagaa agaccagatc tcctcctcga 1380
caccgagaga gtgttgcggc agtaggacga caag 1414
<210> 3
<211> 512
<212> PRT
<213> Unknown
<220>
<223> Yeast sequence
<400> 3
Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His Phe Thr Pro Asn
1 5 10 15
Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr Asp Glu Lys Asp
20 25 30
Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn Asp Thr Val Trp
35 40 45
Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp Asp Leu Thr Asn
50 55 60
Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg Asn Asp Ser Gly
65 70 75 80
Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn Thr Ser Gly Phe
85 90 95
Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val Ala Ile Trp Thr
100 105 110
Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser Tyr Ser Leu Asp
115 120 125
Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro Val Leu Ala Ala
130 135 140
Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp Tyr Glu Pro Ser
145 150 155 160
Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp Tyr Lys Ile Glu
165 170 175
Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu Glu Ser Ala Phe
180 185 190
Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys Pro Gly Leu Ile
195 200 205
Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr Trp Val Met Phe
210 215 220
Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser Phe Asn Gln Tyr
225 230 235 240
Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala Phe Asp Asn Gln
245 250 255
Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala Leu Gln Thr Phe
260 265 270
Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly Ile Ala Trp Ala
275 280 285
Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn Pro Trp Arg Ser
290 295 300
Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr Glu Tyr Gln Ala
305 310 315 320
Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu Pro Ile Leu Asn
325 330 335
Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr Asn Thr Thr Leu
340 345 350
Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn Ser Thr Gly Thr
355 360 365
Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr Gln Thr Ile Ser
370 375 380
Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys Gly Leu Glu Asp
385 390 395 400
Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser Ala Ser Ser Phe
405 410 415
Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val Lys Glu Asn Pro
420 425 430
Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro Phe Lys Ser Glu
435 440 445
Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu Asp Gln Asn Ile
450 455 460
Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser Thr Asn Thr Tyr
465 470 475 480
Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn Met Thr Thr Gly
485 490 495
Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val Arg Glu Val Lys
500 505 510
<210> 4
<211> 20
<212> PRT
<213> Unknown
<220>
<223> Yeast sequence
<400> 4
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala Ser
20
<210> 5
<211> 18
<212> PRT
<213> Unknown
<220>
<223> higher plants secretion signal
<400> 5
Met Ala Asn Lys Ser Leu Leu Leu Leu Leu Leu Leu Gly Ser Leu Ala
1 5 10 15
Ser Gly
<210> 6
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic concensus sequence
<400> 6
Met Ala Arg Leu Pro Leu Ala Ala Leu Gly
1 5 10
<210> 7
<211> 20
<212> PRT
<213> Unknown
<220>
<223> synthetic peptide
<400> 7
Met Ala Asn Lys Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Pro Leu
1 5 10 15
Ala Ala Ser Gly
20
<210> 8
<211> 2615
<212> DNA
<213> Saccharomyces cerevisiae
<400> 8
gaattcccca acatggtgga gcacgacact ctcgtctact ccaagaatat caaagataca 60
gtctcagaag accaaagggc tattgagact tttcaacaaa gggtaatatc gggaaacctc 120
ctcggattcc attgcccagc tatctgtcac ttcatcaaaa ggacagtaga aaaggaaggt 180
ggcacctaca aatgccatca ttgcgataaa ggaaaggcta tcgttcaaga tgcctctgcc 240
gacagtggtc ccaaagatgg acccccaccc acgaggagca tcgtggaaaa agaagacgtt 300
ccaaccacgt cttcaaagca agtggattga tgtgaacatg gtggagcacg acactctcgt 360
ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg agacttttca 420
acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct gtcacttcat 480
caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg ataaaggaaa 540
ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 600
gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 660
tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag acccttcctc 720
tatataagga agttcatttc atttggagag gacacgctga aatcaccagt ctctctctac 780
aaatctatct ctggcgcgcc atatcaatgc ttcttcaggc ctttcttttt cttcttgctg 840
gttttgctgc caagatcagc gcctctatga cgaacgaaac ctcggataga ccacttgtgc 900
actttacacc aaacaagggc tggatgaatg accccaatgg actgtggtac gacgaaaaag 960
atgccaagtg gcatctgtac tttcaataca acccgaacga tactgtctgg gggacgccat 1020
tgttttgggg ccacgccacg tccgacgacc tgaccaattg ggaggaccaa ccaatagcta 1080
tcgctccgaa gaggaacgac tccggagcat tctcgggttc catggtggtt gactacaaca 1140
atacttccgg ctttttcaac gataccattg acccgagaca acgctgcgtg gccatatgga 1200
cttacaacac accggagtcc gaggagcagt acatctcgta tagcctggac ggtggataca 1260
cttttacaga gtatcagaag aaccctgtgc ttgctgcaaa ttcgactcag ttccgagatc 1320
cgaaggtctt ttggtacgag ccctcgcaga agtggatcat gacagcggca aagtcacagg 1380
actacaagat cgaaatttac tcgtctgacg accttaaatc ctggaagctc gaatccgcgt 1440
tcgcaaacga gggctttctc ggctaccaat acgaatgccc aggcctgata gaggtcccaa 1500
cagagcaaga tcccagcaag tcctactggg tgatgtttat ttccattaat ccaggagcac 1560
cggcaggagg ttcttttaat cagtacttcg tcggaagctt taacggaact catttcgagg 1620
catttgataa ccaatcaaga gtagttgatt ttggaaagga ctactatgcc ctgcagactt 1680
tcttcaatac tgacccgacc tatgggagcg ctcttggcat tgcgtgggct tctaactggg 1740
agtattccgc attcgttcct acaaaccctt ggaggtcctc catgtcgctc gtgaggaaat 1800
tctctctcaa cactgagtac caggccaacc cggaaaccga actcataaac ctgaaagccg 1860
aaccgatcct gaacattagc aacgctggcc cctggagccg gtttgcaacc aacaccacgt 1920
tgacgaaagc caacagctac aacgtcgatc tttcgaatag caccggtaca cttgaatttg 1980
aactggtgta tgccgtcaat accacccaaa cgatctcgaa gtcggtgttc gcggacctct 2040
ccctctggtt taaaggcctg gaagaccccg aggagtacct cagaatgggt ttcgaggttt 2100
ctgcgtcctc cttcttcctt gatcgcggga acagcaaagt aaaatttgtt aaggagaacc 2160
catattttac caacaggatg agcgttaaca accaaccatt caagagcgaa aacgacctgt 2220
cgtactacaa agtgtatggt ttgcttgatc aaaatatcct ggaactctac ttcaacgatg 2280
gtgatgtcgt gtccaccaac acatacttca tgacaaccgg gaacgcactg ggctccgtga 2340
acatgacgac gggtgtggat aacctgttct acatcgacaa attccaggtg agggaagtca 2400
agtgagatct gtcgatcgac aagctcgagt ttctccataa taatgtgtga gtagttccca 2460
gataagggaa ttagggttcc tatagggttt cgctcatgtg ttgagcatat aagaaaccct 2520
tagtatgtat ttgtatttgt aaaatacttc tatcaataaa atttctaatt cctaaaacca 2580
aaatccagta ctaaaatcca gatcccccga attaa 2615
<210> 9
<211> 22
<212> DNA
<213> Prototheca moriformis
<400> 9
tgttgaagaa tgagccggcg ac 22
<210> 10
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 10
cagtgagcta ttacgcactc 20
<210> 11
<211> 541
<212> DNA
<213> Prototheca kruegani
<400> 11
tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa tactctggag 60
ccatagcgaa agcaagttta gtaagcttag gtcattcttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttagta aaataacatg gaggcccgaa ccgactaatg 180
ttgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcag tacaaataga ggggtaaagc 300
actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 12
<211> 573
<212> DNA
<213> Prototheca wickerhamii
<400> 12
tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagattt aataactcga 60
aacctaagcg aaagcaagtc ttaatagggc gtcaatttaa caaaacttta aataaattat 120
aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180
gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240
tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300
gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360
ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420
gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480
ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540
gccatccttt aaagagtgcg taatagctca ctg 573
<210> 13
<211> 541
<212> DNA
<213> Prototheca stagnora
<400> 13
tgttgaagaa tgagccggcg agttaaaaaa aatggcatgg ttaaagatat ttctctgaag 60
ccatagcgaa agcaagtttt acaagctata gtcatttttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggtc aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggacgt gagtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 14
<211> 541
<212> DNA
<213> Prototheca moriformis
<400> 14
tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagataa ttctctggag 60
ccatagcgaa agcaagttta acaagctaaa gtcacccttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtta 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 15
<211> 573
<212> DNA
<213> Prototheca moriformis
<400> 15
tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagaatt aataactcga 60
aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120
aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180
gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240
tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300
gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360
ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420
gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480
ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540
gccatccttt aaagagtgcg taatagctca ctg 573
<210> 16
<211> 573
<212> DNA
<213> Prototheca wickerhamii
<400> 16
tgttgaagaa tgagccgtcg acttaaaata aatggcaggc taagagaatt aataactcga 60
aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120
aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180
gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240
tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300
gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360
ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420
gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480
ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540
gccatccttt aaagagtgcg taatagctca ctg 573
<210> 17
<211> 541
<212> DNA
<213> Prototheca moriformis
<400> 17
tgttgaagaa tgagccggcg agttaaaaag agtggcgtgg ttaaagaaaa ttctctggaa 60
ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt ttgtgggctc cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcgaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 18
<211> 541
<212> DNA
<213> Prototheca zopfii
<400> 18
tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa ttctctggag 60
ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt tcgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 19
<211> 565
<212> DNA
<213> Prototheca moriformis
<400> 19
tgttgaagaa tgagccggcg acttagaaaa ggtggcatgg ttaaggaaat attccgaagc 60
cgtagcaaaa gcgagtctga atagggcgat aaaatatatt aatatttaga atctagtcat 120
tttttctaga cccgaacccg ggtgatctaa ccatgaccag gatgaagctt gggtgatacc 180
aagtgaaggt ccgaaccgac cgatgttgaa aaatcggcgg atgagttgtg gttagcggtg 240
aaataccagt cgaacccgga gctagctggt tctccccgaa atgcgttgag gcgcagcagt 300
acatctagtc tatctagggg taaagcactg tttcggtgcg ggctgtgaga acggtaccaa 360
atcgtggcaa actctgaata ctagaaatga cgatgtagta gtgagactgt gggggataag 420
ctccattgtc aagagggaaa cagcccagac caccagctaa ggccccaaaa tggtaatgta 480
gtgacaaagg aggtgaaaat gcaaatacaa ccaggaggtt ggcttagaag cagccatcct 540
ttaaagagtg cgtaatagct cactg 565
<210> 20
<211> 550
<212> PRT
<213> Chicorium intybus
<400> 20
Met Ser Asn Ser Ser Asn Ala Ser Glu Ser Leu Phe Pro Ala Thr Ser
1 5 10 15
Glu Gln Pro Tyr Arg Thr Ala Phe His Phe Gln Pro Pro Gln Asn Trp
20 25 30
Met Asn Asp Pro Asn Gly Pro Met Cys Tyr Asn Gly Val Tyr His Leu
35 40 45
Phe Tyr Gln Tyr Asn Pro Phe Gly Pro Leu Trp Asn Leu Arg Met Tyr
50 55 60
Trp Ala His Ser Val Ser His Asp Leu Ile Asn Trp Ile His Leu Asp
65 70 75 80
Leu Ala Phe Ala Pro Thr Glu Pro Phe Asp Ile Asn Gly Cys Leu Ser
85 90 95
Gly Ser Ala Thr Val Leu Pro Gly Asn Lys Pro Ile Met Leu Tyr Thr
100 105 110
Gly Ile Asp Thr Glu Asn Arg Gln Val Gln Asn Leu Ala Val Pro Lys
115 120 125
Asp Leu Ser Asp Pro Tyr Leu Arg Glu Trp Val Lys His Thr Gly Asn
130 135 140
Pro Ile Ile Ser Leu Pro Glu Glu Ile Gln Pro Asp Asp Phe Arg Asp
145 150 155 160
Pro Thr Thr Thr Trp Leu Glu Glu Asp Gly Thr Trp Arg Leu Leu Val
165 170 175
Gly Ser Gln Lys Asp Lys Thr Gly Ile Ala Phe Leu Tyr His Ser Gly
180 185 190
Asp Phe Val Asn Trp Thr Lys Ser Asp Ser Pro Leu His Lys Val Ser
195 200 205
Gly Thr Gly Met Trp Glu Cys Val Asp Phe Phe Pro Val Trp Val Asp
210 215 220
Ser Thr Asn Gly Val Asp Thr Ser Ile Ile Asn Pro Ser Asn Arg Val
225 230 235 240
Lys His Val Leu Lys Leu Gly Ile Gln Asp His Gly Lys Asp Cys Tyr
245 250 255
Leu Ile Gly Lys Tyr Ser Ala Asp Lys Glu Asn Tyr Val Pro Glu Asp
260 265 270
Glu Leu Thr Leu Ser Thr Leu Arg Leu Asp Tyr Gly Met Tyr Tyr Ala
275 280 285
Ser Lys Ser Phe Phe Asp Pro Val Lys Asn Arg Arg Ile Met Thr Ala
290 295 300
Trp Val Asn Glu Ser Asp Ser Glu Ala Asp Val Ile Ala Arg Gly Trp
305 310 315 320
Ser Gly Val Gln Ser Phe Pro Arg Ser Leu Trp Leu Asp Lys Asn Gln
325 330 335
Lys Gln Leu Leu Gln Trp Pro Ile Glu Glu Ile Glu Met Leu His Gln
340 345 350
Asn Glu Val Ser Phe His Asn Lys Lys Leu Asp Gly Gly Ser Ser Leu
355 360 365
Glu Val Leu Gly Ile Thr Ala Ser Gln Ala Asp Val Lys Ile Ser Phe
370 375 380
Lys Leu Ala Asn Leu Glu Glu Ala Glu Glu Leu Asp Pro Ser Trp Val
385 390 395 400
Asp Pro Gln Leu Ile Cys Ser Glu Asn Asp Ala Ser Lys Lys Gly Lys
405 410 415
Phe Gly Pro Phe Gly Leu Leu Ala Leu Ala Ser Ser Asp Leu Arg Glu
420 425 430
Gln Thr Ala Ile Phe Phe Arg Val Phe Arg Lys Asn Gly Arg Tyr Val
435 440 445
Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Met Lys Asn Gly Ile
450 455 460
Glu Lys Arg Thr Tyr Gly Ala Phe Val Asp Ile Asp Pro Gln Gln Asp
465 470 475 480
Glu Ile Ser Leu Arg Thr Leu Ile Asp His Ser Ile Val Glu Ser Phe
485 490 495
Gly Gly Arg Gly Lys Thr Cys Ile Thr Thr Arg Val Tyr Pro Thr Leu
500 505 510
Ala Ile Gly Glu Gln Ala Arg Leu Phe Ala Phe Asn His Gly Thr Glu
515 520 525
Ser Val Glu Ile Ser Glu Leu Ser Ala Trp Ser Met Lys Lys Ala Gln
530 535 540
Met Lys Val Glu Glu Pro
545 550
<210> 21
<211> 581
<212> PRT
<213> Schizosaccharomyces pombe
<400> 21
Met Phe Leu Lys Tyr Ile Leu Ala Ser Gly Ile Cys Leu Val Ser Leu
1 5 10 15
Leu Ser Ser Thr Asn Ala Ala Pro Arg His Leu Tyr Val Lys Arg Tyr
20 25 30
Pro Val Ile Tyr Asn Ala Ser Asn Ile Thr Glu Val Ser Asn Ser Thr
35 40 45
Thr Val Pro Pro Pro Pro Phe Val Asn Thr Thr Ala Pro Asn Gly Thr
50 55 60
Cys Leu Gly Asn Tyr Asn Glu Tyr Leu Pro Ser Gly Tyr Tyr Asn Ala
65 70 75 80
Thr Asp Arg Pro Lys Ile His Phe Thr Pro Ser Ser Gly Phe Met Asn
85 90 95
Asp Pro Asn Gly Leu Val Tyr Thr Gly Gly Val Tyr His Met Phe Phe
100 105 110
Gln Tyr Ser Pro Lys Thr Leu Thr Ala Gly Glu Val His Trp Gly His
115 120 125
Thr Val Ser Lys Asp Leu Ile His Trp Glu Asn Tyr Pro Ile Ala Ile
130 135 140
Tyr Pro Asp Glu His Glu Asn Gly Val Leu Ser Leu Pro Phe Ser Gly
145 150 155 160
Ser Ala Val Val Asp Val His Asn Ser Ser Gly Leu Phe Ser Asn Asp
165 170 175
Thr Ile Pro Glu Glu Arg Ile Val Leu Ile Tyr Thr Asp His Trp Thr
180 185 190
Gly Val Ala Glu Arg Gln Ala Ile Ala Tyr Thr Thr Asp Gly Gly Tyr
195 200 205
Thr Phe Lys Lys Tyr Ser Gly Asn Pro Val Leu Asp Ile Asn Ser Leu
210 215 220
Gln Phe Arg Asp Pro Lys Val Ile Trp Asp Phe Asp Ala Asn Arg Trp
225 230 235 240
Val Met Ile Val Ala Met Ser Gln Asn Tyr Gly Ile Ala Phe Tyr Ser
245 250 255
Ser Tyr Asp Leu Ile His Trp Thr Glu Leu Ser Val Phe Ser Thr Ser
260 265 270
Gly Tyr Leu Gly Leu Gln Tyr Glu Cys Pro Gly Met Ala Arg Val Pro
275 280 285
Val Glu Gly Thr Asp Glu Tyr Lys Trp Val Leu Phe Ile Ser Ile Asn
290 295 300
Pro Gly Ala Pro Leu Gly Gly Ser Val Val Gln Tyr Phe Val Gly Asp
305 310 315 320
Trp Asn Gly Thr Asn Phe Val Pro Asp Asp Gly Gln Thr Arg Phe Val
325 330 335
Asp Leu Gly Lys Asp Phe Tyr Ala Ser Ala Leu Tyr His Ser Ser Ser
340 345 350
Ala Asn Ala Asp Val Ile Gly Val Gly Trp Ala Ser Asn Trp Gln Tyr
355 360 365
Thr Asn Gln Ala Pro Thr Gln Val Phe Arg Ser Ala Met Thr Val Ala
370 375 380
Arg Lys Phe Thr Leu Arg Asp Val Pro Gln Asn Pro Met Thr Asn Leu
385 390 395 400
Thr Ser Leu Ile Gln Thr Pro Leu Asn Val Ser Leu Leu Arg Asp Glu
405 410 415
Thr Leu Phe Thr Ala Pro Val Ile Asn Ser Ser Ser Ser Leu Ser Gly
420 425 430
Ser Pro Ile Thr Leu Pro Ser Asn Thr Ala Phe Glu Phe Asn Val Thr
435 440 445
Leu Ser Ile Asn Tyr Thr Glu Gly Cys Thr Thr Gly Tyr Cys Leu Gly
450 455 460
Arg Ile Ile Ile Asp Ser Asp Asp Pro Tyr Arg Leu Gln Ser Ile Ser
465 470 475 480
Val Asp Val Asp Phe Ala Ala Ser Thr Leu Val Ile Asn Arg Ala Lys
485 490 495
Ala Gln Met Gly Trp Phe Asn Ser Leu Phe Thr Pro Ser Phe Ala Asn
500 505 510
Asp Ile Tyr Ile Tyr Gly Asn Val Thr Leu Tyr Gly Ile Val Asp Asn
515 520 525
Gly Leu Leu Glu Leu Tyr Val Asn Asn Gly Glu Lys Thr Tyr Thr Asn
530 535 540
Asp Phe Phe Phe Leu Gln Gly Ala Thr Pro Gly Gln Ile Ser Phe Ala
545 550 555 560
Ala Phe Gln Gly Val Ser Phe Asn Asn Val Thr Val Thr Pro Leu Lys
565 570 575
Thr Ile Trp Asn Cys
580
<210> 22
<211> 550
<212> PRT
<213> Pichia anomala
<400> 22
Met Ile Gln Leu Ser Pro Leu Leu Leu Leu Pro Leu Phe Ser Val Phe
1 5 10 15
Asn Ser Ile Ala Asp Ala Ser Thr Glu Tyr Leu Arg Pro Gln Ile His
20 25 30
Leu Thr Pro Asp Gln Gly Trp Met Asn Asp Pro Asn Gly Met Phe Tyr
35 40 45
Asp Arg Lys Asp Lys Leu Trp His Val Tyr Phe Gln His Asn Pro Asp
50 55 60
Lys Lys Ser Ile Trp Ala Thr Pro Val Thr Trp Gly His Ser Thr Ser
65 70 75 80
Lys Asp Leu Leu Thr Trp Asp Tyr His Gly Asn Ala Leu Glu Pro Glu
85 90 95
Asn Asp Asp Glu Gly Ile Phe Ser Gly Ser Val Val Val Asp Arg Asn
100 105 110
Asn Thr Ser Gly Phe Phe Asn Asp Ser Thr Asp Pro Glu Gln Arg Ile
115 120 125
Val Ala Ile Tyr Thr Asn Asn Ala Gln Leu Gln Thr Gln Glu Ile Ala
130 135 140
Tyr Ser Leu Asp Lys Gly Tyr Ser Phe Ile Lys Tyr Asp Gln Asn Pro
145 150 155 160
Val Ile Asn Val Asn Ser Ser Gln Gln Arg Asp Pro Lys Val Leu Trp
165 170 175
His Asp Glu Ser Asn Gln Trp Ile Met Val Val Ala Lys Thr Gln Glu
180 185 190
Phe Lys Val Gln Ile Tyr Gly Ser Pro Asp Leu Lys Lys Trp Asp Leu
195 200 205
Lys Ser Asn Phe Thr Ser Asn Gly Tyr Leu Gly Phe Gln Tyr Glu Cys
210 215 220
Pro Gly Leu Phe Lys Leu Pro Ile Glu Asn Pro Leu Asn Asp Thr Val
225 230 235 240
Thr Ser Lys Trp Val Leu Leu Leu Ala Ile Asn Pro Gly Ser Pro Leu
245 250 255
Gly Gly Ser Ile Asn Glu Tyr Phe Ile Gly Asp Phe Asp Gly Thr Thr
260 265 270
Phe His Pro Asp Asp Gly Ala Thr Arg Phe Met Asp Ile Gly Lys Asp
275 280 285
Phe Tyr Ala Phe Gln Ser Phe Asp Asn Thr Glu Pro Glu Asp Gly Ala
290 295 300
Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asn Thr Val Pro
305 310 315 320
Thr Glu Asn Trp Arg Ser Ser Met Ser Leu Val Arg Asn Tyr Thr Leu
325 330 335
Lys Tyr Val Asp Val Asn Pro Glu Asn Tyr Gly Leu Thr Leu Ile Gln
340 345 350
Lys Pro Val Tyr Asp Thr Lys Glu Thr Arg Leu Asn Glu Thr Leu Lys
355 360 365
Thr Leu Glu Thr Ile Asn Glu Tyr Glu Val Asn Asp Leu Lys Leu Asp
370 375 380
Lys Ser Ser Phe Val Ala Thr Asp Phe Asn Thr Glu Arg Asn Ala Thr
385 390 395 400
Gly Val Phe Glu Phe Asp Leu Lys Phe Thr Gln Thr Asp Leu Lys Met
405 410 415
Gly Tyr Ser Asn Met Thr Thr Gln Phe Gly Leu Tyr Ile His Ser Gln
420 425 430
Thr Val Lys Gly Ser Gln Glu Thr Leu Gln Leu Val Phe Asp Thr Leu
435 440 445
Ser Thr Thr Trp Tyr Ile Asp Arg Thr Thr Gln His Ser Phe Gln Arg
450 455 460
Asn Ser Pro Val Phe Thr Glu Arg Ile Ser Thr Tyr Val Glu Lys Ile
465 470 475 480
Asp Thr Thr Asp Gln Gly Asn Val Tyr Thr Leu Tyr Gly Val Val Asp
485 490 495
Arg Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Ser Ile Ala Met Thr
500 505 510
Asn Thr Phe Phe Phe Arg Glu Gly Lys Ile Pro Thr Ser Phe Glu Val
515 520 525
Val Cys Asp Ser Glu Lys Ser Phe Ile Thr Ile Asp Glu Leu Ser Val
530 535 540
Arg Glu Leu Ala Arg Lys
545 550
<210> 23
<211> 533
<212> PRT
<213> Debaryomyces occidentalis
<400> 23
Met Val Gln Val Leu Ser Val Leu Val Ile Pro Leu Leu Thr Leu Phe
1 5 10 15
Phe Gly Tyr Val Ala Ser Ser Ser Ile Asp Leu Ser Val Asp Thr Ser
20 25 30
Glu Tyr Asn Arg Pro Leu Ile His Phe Thr Pro Glu Lys Gly Trp Met
35 40 45
Asn Asp Pro Asn Gly Leu Phe Tyr Asp Lys Thr Ala Lys Leu Trp His
50 55 60
Leu Tyr Phe Gln Tyr Asn Pro Asn Ala Thr Ala Trp Gly Gln Pro Leu
65 70 75 80
Tyr Trp Gly His Ala Thr Ser Asn Asp Leu Val His Trp Asp Glu His
85 90 95
Glu Ile Ala Ile Gly Pro Glu His Asp Asn Glu Gly Ile Phe Ser Gly
100 105 110
Ser Ile Val Val Asp His Asn Asn Thr Ser Gly Phe Phe Asn Ser Ser
115 120 125
Ile Asp Pro Asn Gln Arg Ile Val Ala Ile Tyr Thr Asn Asn Ile Pro
130 135 140
Asp Leu Gln Thr Gln Asp Ile Ala Phe Ser Leu Asp Gly Gly Tyr Thr
145 150 155 160
Phe Thr Lys Tyr Glu Asn Asn Pro Val Ile Asp Val Ser Ser Asn Gln
165 170 175
Phe Arg Asp Pro Lys Val Phe Trp His Glu Arg Phe Lys Ser Met Asp
180 185 190
His Gly Cys Ser Glu Ile Ala Arg Val Lys Ile Gln Ile Phe Gly Ser
195 200 205
Ala Asn Leu Lys Asn Trp Val Leu Asn Ser Asn Phe Ser Ser Gly Tyr
210 215 220
Tyr Gly Asn Gln Tyr Gly Met Ser Arg Leu Ile Glu Val Pro Ile Glu
225 230 235 240
Asn Ser Asp Lys Ser Lys Trp Val Met Phe Leu Ala Ile Asn Pro Gly
245 250 255
Ser Pro Leu Gly Gly Ser Ile Asn Gln Tyr Phe Val Gly Asp Phe Asp
260 265 270
Gly Phe Gln Phe Val Pro Asp Asp Ser Gln Thr Arg Phe Val Asp Ile
275 280 285
Gly Lys Asp Phe Tyr Ala Phe Gln Thr Phe Ser Glu Val Glu His Gly
290 295 300
Val Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asp Gln Val
305 310 315 320
Pro Thr Asn Pro Trp Arg Ser Ser Thr Ser Leu Ala Arg Asn Tyr Thr
325 330 335
Leu Arg Tyr Val Ile Gln Met Leu Lys Leu Thr Ala Asn Ile Asp Lys
340 345 350
Ser Val Leu Pro Asp Ser Ile Asn Val Val Asp Lys Leu Lys Lys Lys
355 360 365
Asn Val Lys Leu Thr Asn Lys Lys Pro Ile Lys Thr Asn Phe Lys Gly
370 375 380
Ser Thr Gly Leu Phe Asp Phe Asn Ile Thr Phe Lys Val Leu Asn Leu
385 390 395 400
Asn Val Ser Pro Gly Lys Thr His Phe Asp Ile Leu Ile Asn Ser Gln
405 410 415
Glu Leu Asn Ser Ser Val Asp Ser Ile Lys Ile Gly Phe Asp Ser Ser
420 425 430
Gln Ser Leu Phe Tyr Ile Asp Arg His Ile Pro Asn Val Glu Phe Pro
435 440 445
Arg Lys Gln Phe Phe Thr Asp Lys Leu Ala Ala Tyr Leu Glu Pro Leu
450 455 460
Asp Tyr Asp Gln Asp Leu Arg Val Phe Ser Leu Tyr Gly Ile Val Asp
465 470 475 480
Lys Asn Ile Ile Glu Leu Tyr Phe Asn Asp Gly Thr Val Ala Met Thr
485 490 495
Asn Thr Phe Phe Met Gly Glu Gly Lys Tyr Pro His Asp Ile Gln Ile
500 505 510
Val Thr Asp Thr Glu Glu Pro Leu Phe Glu Leu Glu Ser Val Ile Ile
515 520 525
Arg Glu Leu Asn Lys
530
<210> 24
<211> 654
<212> PRT
<213> Oryza sativa
<400> 24
Met Ala Thr Ser Arg Leu Thr Pro Ala Tyr Asp Leu Lys Asn Ala Ala
1 5 10 15
Ala Ala Val Tyr Thr Pro Leu Pro Glu Gln Pro His Ser Ala Glu Val
20 25 30
Glu Ile Arg Asp Arg Lys Pro Phe Lys Ile Ile Ser Ala Ile Ile Leu
35 40 45
Ser Ser Leu Leu Leu Leu Ala Leu Ile Leu Val Ala Val Asn Tyr Gln
50 55 60
Ala Pro Pro Ser His Ser Ser Gly Asp Asn Ser Gln Pro Ala Ala Val
65 70 75 80
Met Pro Pro Ser Arg Gly Val Ser Gln Gly Val Ser Glu Lys Ala Phe
85 90 95
Arg Gly Ala Ser Gly Ala Gly Asn Gly Val Ser Phe Ala Trp Ser Asn
100 105 110
Leu Met Leu Ser Trp Gln Arg Thr Ser Tyr His Phe Gln Pro Val Lys
115 120 125
Asn Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr
130 135 140
His Leu Phe Tyr Gln Tyr Asn Pro Asp Ser Ala Val Trp Gly Asn Ile
145 150 155 160
Thr Trp Gly His Ala Val Ser Thr Asp Leu Ile Asn Trp Leu His Leu
165 170 175
Pro Phe Ala Met Val Pro Asp Gln Trp Tyr Asp Val Asn Gly Val Trp
180 185 190
Thr Gly Ser Ala Thr Ile Leu Pro Asp Gly Arg Ile Val Met Leu Tyr
195 200 205
Thr Gly Asp Thr Asp Asp Tyr Val Gln Asp Gln Asn Leu Ala Phe Pro
210 215 220
Ala Asn Leu Ser Asp Pro Leu Leu Val Asp Trp Val Lys Tyr Pro Asn
225 230 235 240
Asn Pro Val Ile Tyr Pro Pro Pro Gly Ile Gly Val Lys Asp Phe Arg
245 250 255
Asp Pro Thr Thr Ala Gly Thr Ala Gly Met Gln Asn Gly Gln Arg Leu
260 265 270
Val Thr Ile Gly Ser Lys Val Gly Lys Thr Gly Ile Ser Leu Val Tyr
275 280 285
Glu Thr Thr Asn Phe Thr Thr Phe Lys Leu Leu Tyr Gly Val Leu His
290 295 300
Ala Val Pro Gly Thr Gly Met Trp Glu Cys Val Asp Leu Tyr Pro Val
305 310 315 320
Ser Thr Thr Gly Glu Asn Gly Leu Asp Thr Ser Val Asn Gly Leu Gly
325 330 335
Val Lys His Val Leu Lys Thr Ser Leu Asp Asp Asp Lys His Asp Tyr
340 345 350
Tyr Ala Leu Gly Thr Tyr Asp Pro Val Lys Asn Lys Trp Thr Pro Asp
355 360 365
Asn Pro Asp Leu Asp Val Gly Ile Gly Leu Arg Leu Asp Tyr Gly Lys
370 375 380
Tyr Tyr Ala Ala Arg Thr Phe Tyr Asp Gln Asn Lys Gln Arg Arg Ile
385 390 395 400
Leu Trp Gly Trp Ile Gly Glu Thr Asp Leu Glu Ala Val Asp Leu Met
405 410 415
Lys Gly Trp Ala Ser Leu Gln Ala Ile Pro Arg Thr Ile Val Phe Asp
420 425 430
Lys Lys Thr Gly Thr Asn Val Leu Gln Arg Pro Glu Glu Glu Val Glu
435 440 445
Ser Trp Ser Ser Gly Asp Pro Ile Thr Gln Arg Arg Ile Phe Glu Pro
450 455 460
Gly Ser Val Val Pro Ile His Val Ser Gly Ala Thr Gln Leu Asp Ile
465 470 475 480
Thr Ala Ser Phe Glu Val Asp Glu Thr Leu Leu Glu Thr Thr Ser Glu
485 490 495
Ser His Asp Ala Gly Tyr Asp Cys Ser Asn Ser Gly Gly Ala Gly Thr
500 505 510
Arg Gly Ser Leu Gly Pro Phe Gly Leu Leu Val Val Ala Asp Glu Lys
515 520 525
Leu Ser Glu Leu Thr Pro Val Tyr Leu Tyr Val Ala Lys Gly Gly Asp
530 535 540
Gly Lys Ala Lys Ala His Leu Cys Ala Tyr Gln Thr Arg Ser Ser Met
545 550 555 560
Ala Ser Gly Val Glu Lys Glu Val Tyr Gly Ser Ala Val Pro Val Leu
565 570 575
Asp Gly Glu Asn Tyr Ser Ala Arg Ile Leu Ile Asp His Ser Ile Val
580 585 590
Glu Ser Phe Ala Gln Ala Gly Arg Thr Cys Val Arg Ser Arg Asp Tyr
595 600 605
Pro Thr Lys Asp Ile Tyr Gly Ala Ala Arg Cys Phe Phe Phe Asn Asn
610 615 620
Ala Thr Glu Ala Ser Val Arg Ala Ser Leu Lys Ala Trp Gln Met Lys
625 630 635 640
Ser Phe Ile Arg Pro Tyr Pro Phe Ile Pro Asp Gln Lys Ser
645 650
<210> 25
<211> 690
<212> PRT
<213> Allium cepa
<400> 25
Met Ser Ser Asp Asp Leu Glu Ser Pro Pro Ser Ser Tyr Leu Pro Ile
1 5 10 15
Pro Pro Ser Asp Glu Phe His Asp Gln Pro Pro Pro Leu Arg Ser Trp
20 25 30
Leu Arg Leu Leu Ser Ile Pro Leu Ala Leu Met Phe Leu Leu Phe Leu
35 40 45
Ala Thr Phe Leu Ser Asn Leu Glu Ser Pro Pro Ser Asp Ser Gly Leu
50 55 60
Val Ser Asp Pro Val Thr Phe Asp Val Asn Pro Ala Val Val Arg Arg
65 70 75 80
Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser Gly
85 90 95
Phe Val Leu Asp Pro Val Ala Val Asp Ala Asn Ser Val Val Val His
100 105 110
Arg Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser
115 120 125
Gly Leu Leu Lys Asp Ser Pro Leu Gly Pro Tyr Pro Trp Thr Asn Gln
130 135 140
Met Leu Ser Trp Gln Arg Thr Gly Phe His Phe Gln Pro Val Lys Asn
145 150 155 160
Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr His
165 170 175
Phe Phe Tyr Gln Tyr Asn Pro Glu Gly Ala Val Trp Gly Asn Ile Ala
180 185 190
Trp Gly His Ala Val Ser Arg Asp Leu Val His Trp Thr His Leu Pro
195 200 205
Leu Ala Met Val Pro Asp Gln Trp Tyr Asp Ile Asn Gly Val Trp Thr
210 215 220
Gly Ser Ala Thr Ile Leu Pro Asp Gly Gln Ile Val Met Leu Tyr Thr
225 230 235 240
Gly Ala Thr Asn Glu Ser Val Gln Val Gln Asn Leu Ala Val Pro Ala
245 250 255
Asp Gln Ser Asp Thr Leu Leu Leu Arg Trp Lys Lys Ser Glu Ala Asn
260 265 270
Pro Ile Leu Val Pro Pro Pro Gly Ile Gly Asp Lys Asp Phe Arg Asp
275 280 285
Pro Thr Thr Ala Trp Tyr Glu Pro Ser Asp Asp Thr Trp Arg Ile Val
290 295 300
Ile Gly Ser Lys Asp Ser Ser His Ser Gly Ile Ala Ile Val Tyr Ser
305 310 315 320
Thr Lys Asp Phe Ile Asn Tyr Lys Leu Ile Pro Gly Ile Leu His Ala
325 330 335
Val Glu Arg Val Gly Met Trp Glu Cys Val Asp Phe Tyr Pro Val Ala
340 345 350
Thr Ala Asp Ser Ser His Ala Asn His Gly Leu Asp Pro Ser Ala Arg
355 360 365
Pro Ser Pro Ala Val Lys His Val Leu Lys Ala Ser Met Asp Asp Asp
370 375 380
Arg His Asp Tyr Tyr Ala Ile Gly Thr Tyr Asp Pro Ala Gln Asn Thr
385 390 395 400
Trp Val Pro Asp Asp Ala Ser Val Asp Val Gly Ile Gly Leu Arg Tyr
405 410 415
Asp Trp Gly Lys Phe Tyr Ala Ser Lys Thr Phe Tyr Asp His Ala Lys
420 425 430
Lys Arg Arg Ile Leu Trp Ser Trp Ile Gly Glu Thr Asp Ser Glu Thr
435 440 445
Ala Asp Ile Ala Lys Gly Trp Ala Ser Leu Gln Gly Val Pro Arg Thr
450 455 460
Val Leu Leu Asp Val Lys Thr Gly Ser Asn Leu Ile Thr Trp Pro Val
465 470 475 480
Val Glu Ile Glu Ser Leu Arg Thr Arg Pro Arg Asp Phe Ser Gly Ile
485 490 495
Thr Val Asp Ala Gly Ser Thr Phe Lys Leu Asp Val Gly Gly Ala Ala
500 505 510
Gln Leu Asp Ile Glu Ala Glu Phe Lys Ile Ser Ser Glu Glu Leu Glu
515 520 525
Ala Val Lys Glu Ala Asp Val Ser Tyr Asn Cys Ser Ser Ser Gly Gly
530 535 540
Ala Ala Glu Arg Gly Val Leu Gly Pro Phe Gly Leu Leu Val Leu Ala
545 550 555 560
Asn Gln Asp Leu Thr Glu Gln Thr Ala Thr Tyr Phe Tyr Val Ser Arg
565 570 575
Gly Met Asp Gly Gly Leu Asn Thr His Phe Cys Gln Asp Glu Lys Arg
580 585 590
Ser Ser Lys Ala Ser Asp Ile Val Lys Arg Ile Val Gly His Ser Val
595 600 605
Pro Val Leu Asp Gly Glu Ser Phe Ala Leu Arg Ile Leu Val Asp His
610 615 620
Ser Ile Val Glu Ser Phe Ala Gln Gly Gly Arg Ala Ser Ala Thr Ser
625 630 635 640
Arg Val Tyr Pro Thr Glu Ala Ile Tyr Asn Asn Ala Arg Val Phe Val
645 650 655
Phe Asn Asn Ala Thr Gly Ala Lys Val Thr Ala Gln Ser Leu Lys Val
660 665 670
Trp His Met Ser Thr Ala Ile Asn Glu Ile Tyr Asp Pro Ala Thr Ser
675 680 685
Val Met
690
<210> 26
<211> 501
<212> PRT
<213> Beta vulgaris
<220>
<221> misc_feature
<222> (382)..(382)
<223> Xaa can be any naturally occurring amino acid
<400> 26
Leu Phe Tyr Gln Tyr Asn Pro Asn Gly Val Ile Trp Gly Pro Pro Val
1 5 10 15
Trp Gly His Ser Thr Ser Lys Asp Leu Val Asn Trp Val Pro Gln Pro
20 25 30
Leu Thr Met Glu Pro Glu Met Ala Ala Asn Ile Asn Gly Ser Trp Ser
35 40 45
Gly Ser Ala Thr Ile Leu Pro Gly Asn Lys Pro Ala Ile Leu Phe Thr
50 55 60
Gly Leu Asp Pro Lys Tyr Glu Gln Val Gln Val Leu Ala Tyr Pro Lys
65 70 75 80
Asp Thr Ser Asp Pro Asn Leu Lys Glu Trp Phe Leu Ala Pro Gln Asn
85 90 95
Pro Val Met Phe Pro Thr Pro Gln Asn Gln Ile Asn Ala Thr Ser Phe
100 105 110
Arg Asp Pro Thr Thr Ala Trp Arg Leu Pro Asp Gly Val Trp Arg Leu
115 120 125
Leu Ile Gly Ser Lys Arg Gly Gln Arg Gly Leu Ser Leu Leu Phe Arg
130 135 140
Ser Arg Asp Phe Val His Trp Val Gln Ala Lys His Pro Leu Tyr Ser
145 150 155 160
Asp Lys Leu Ser Gly Met Trp Glu Cys Pro Asp Phe Phe Pro Val Tyr
165 170 175
Ala Asn Gly Asp Gln Met Gly Val Asp Thr Ser Ile Ile Gly Ser His
180 185 190
Val Lys His Val Leu Lys Asn Ser Leu Asp Ile Thr Lys His Asp Ile
195 200 205
Tyr Thr Ile Gly Asp Tyr Asn Ile Lys Lys Asp Ala Tyr Thr Pro Asp
210 215 220
Ile Gly Tyr Met Asn Asp Ser Ser Leu Arg Tyr Asp Tyr Gly Lys Tyr
225 230 235 240
Tyr Ala Ser Lys Thr Phe Phe Asp Asp Ala Lys Lys Glu Arg Ile Leu
245 250 255
Leu Gly Trp Ala Asn Glu Ser Ser Ser Val Glu Asp Asp Ile Lys Lys
260 265 270
Gly Trp Ser Gly Ile His Thr Ile Pro Arg Lys Ile Trp Leu Asp Lys
275 280 285
Leu Gly Lys Gln Leu Ile Gln Trp Pro Ile Ala Asn Ile Glu Lys Leu
290 295 300
Arg Gln Lys Pro Val Asn Ile Tyr Arg Lys Val Leu Lys Gly Gly Ser
305 310 315 320
Gln Ile Glu Val Ser Gly Ile Thr Ala Ala Gln Ala Asp Val Glu Ile
325 330 335
Ser Phe Lys Ile Lys Asp Leu Lys Asn Val Glu Lys Phe Asp Ala Ser
340 345 350
Trp Thr Ser Pro Gln Leu Leu Cys Ser Lys Lys Gly Ala Ser Val Lys
355 360 365
Gly Gly Leu Gly Pro Phe Gly Leu Leu Thr Leu Ala Ser Xaa Gly Leu
370 375 380
Glu Glu Tyr Thr Ala Val Phe Phe Arg Ile Phe Lys Ala Tyr Asp Asn
385 390 395 400
Lys Phe Val Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Leu Asn
405 410 415
Pro Thr Asn Asp Lys Thr Thr Tyr Gly Thr Phe Val Asp Val Asn Pro
420 425 430
Ile Arg Glu Gly Leu Ser Leu Arg Val Leu Ile Asp His Ser Val Val
435 440 445
Glu Ser Phe Gly Ala Lys Gly Lys Asn Val Ile Thr Ala Arg Val Tyr
450 455 460
Pro Thr Leu Ala Ile Asn Glu Lys Ala His Leu Tyr Val Phe Asn Arg
465 470 475 480
Gly Thr Ser Asn Val Glu Ile Thr Gly Leu Thr Ala Trp Ser Met Lys
485 490 495
Lys Ala Asn Ile Ala
500
<210> 27
<211> 518
<212> PRT
<213> Bifidobacterium breve
<400> 27
Met Thr Asp Phe Thr Pro Glu Thr Pro Val Leu Thr Pro Ile Arg Asp
1 5 10 15
His Ala Ala Glu Leu Ala Lys Ala Glu Ala Gly Val Ala Glu Met Ala
20 25 30
Ala Lys Arg Asn Asn Arg Trp Tyr Pro Lys Tyr His Ile Ala Ser Asn
35 40 45
Gly Gly Trp Ile Asn Asp Pro Asn Gly Leu Cys Phe Tyr Lys Gly Arg
50 55 60
Trp His Val Phe Tyr Gln Leu His Pro Tyr Gly Thr Gln Trp Gly Pro
65 70 75 80
Met His Trp Gly His Val Ser Ser Thr Asp Met Leu Asn Trp Lys Arg
85 90 95
Glu Pro Ile Met Phe Ala Pro Ser Leu Glu Gln Glu Lys Asp Gly Val
100 105 110
Phe Ser Gly Ser Ala Val Ile Asp Asp Asn Gly Asp Leu Arg Phe Tyr
115 120 125
Tyr Thr Gly His Arg Trp Ala Asn Gly His Asp Asn Thr Gly Gly Asp
130 135 140
Trp Gln Val Gln Met Thr Ala Leu Pro Asp Asn Asp Glu Leu Thr Ser
145 150 155 160
Ala Thr Lys Gln Gly Met Ile Ile Asp Cys Pro Thr Asp Lys Val Asp
165 170 175
His His Tyr Arg Asp Pro Lys Val Trp Lys Thr Gly Asp Thr Trp Tyr
180 185 190
Met Thr Phe Gly Val Ser Ser Glu Asp Lys Arg Gly Gln Met Trp Leu
195 200 205
Phe Ser Ser Lys Asp Met Val Arg Trp Glu Tyr Glu Arg Val Leu Phe
210 215 220
Gln His Pro Asp Pro Asp Val Phe Met Leu Glu Cys Pro Asp Phe Phe
225 230 235 240
Pro Ile Lys Asp Lys Asp Gly Asn Glu Lys Trp Val Ile Gly Phe Ser
245 250 255
Ala Met Gly Ser Lys Pro Ser Gly Phe Met Asn Arg Asn Val Asn Asn
260 265 270
Ala Gly Tyr Met Ile Gly Thr Trp Glu Pro Gly Gly Glu Phe Lys Pro
275 280 285
Glu Thr Glu Phe Arg Leu Trp Asp Cys Gly His Asn Tyr Tyr Ala Pro
290 295 300
Gln Ser Phe Asn Val Asp Gly Arg Gln Ile Val Tyr Gly Trp Met Ser
305 310 315 320
Pro Phe Val Gln Pro Ile Pro Met Glu Asp Asp Gly Trp Cys Gly Gln
325 330 335
Leu Thr Leu Pro Arg Glu Ile Thr Leu Asp Asp Asp Gly Asp Val Val
340 345 350
Thr Ala Pro Val Ala Glu Met Glu Gly Leu Arg Glu Asp Thr Leu Asp
355 360 365
His Gly Ser Ile Thr Leu Asp Met Asp Gly Glu Gln Val Ile Ala Asp
370 375 380
Asp Ala Glu Ala Val Glu Ile Glu Met Thr Ile Asp Leu Ala Ala Ser
385 390 395 400
Thr Ala Asp Arg Ala Gly Leu Lys Ile His Ala Thr Glu Asp Gly Ala
405 410 415
Tyr Thr Tyr Val Ala Tyr Asp Asp Gln Ile Gly Arg Val Val Val Asp
420 425 430
Arg Gln Ala Met Ala Asn Gly Asp His Gly Tyr Arg Ala Ala Pro Leu
435 440 445
Thr Asp Ala Glu Leu Ala Ser Gly Lys Leu Asp Leu Arg Val Phe Val
450 455 460
Asp Arg Gly Ser Val Glu Val Tyr Val Asn Gly Gly His Gln Val Leu
465 470 475 480
Ser Ser Tyr Ser Tyr Ala Ser Glu Gly Pro Arg Ala Ile Lys Leu Val
485 490 495
Ala Glu Phe Gly Asn Leu Lys Val Glu Ser Leu Lys Leu His His Met
500 505 510
Lys Ser Ile Gly Leu Glu
515
<210> 28
<211> 532
<212> PRT
<213> Saccharomyces cerevisae
<400> 28
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala Ser Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His
20 25 30
Phe Thr Pro Asn Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr
35 40 45
Asp Glu Lys Asp Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn
50 55 60
Asp Thr Val Trp Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp
65 70 75 80
Asp Leu Thr Asn Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg
85 90 95
Asn Asp Ser Gly Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn
100 105 110
Thr Ser Gly Phe Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val
115 120 125
Ala Ile Trp Thr Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser
130 135 140
Tyr Ser Leu Asp Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro
145 150 155 160
Val Leu Ala Ala Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp
165 170 175
Tyr Glu Pro Ser Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp
180 185 190
Tyr Lys Ile Glu Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu
195 200 205
Glu Ser Ala Phe Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys
210 215 220
Pro Gly Leu Ile Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr
225 230 235 240
Trp Val Met Phe Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser
245 250 255
Phe Asn Gln Tyr Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala
260 265 270
Phe Asp Asn Gln Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala
275 280 285
Leu Gln Thr Phe Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly
290 295 300
Ile Ala Trp Ala Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn
305 310 315 320
Pro Trp Arg Ser Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr
325 330 335
Glu Tyr Gln Ala Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu
340 345 350
Pro Ile Leu Asn Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr
355 360 365
Asn Thr Thr Leu Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn
370 375 380
Ser Thr Gly Thr Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr
385 390 395 400
Gln Thr Ile Ser Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys
405 410 415
Gly Leu Glu Asp Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser
420 425 430
Ala Ser Ser Phe Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val
435 440 445
Lys Glu Asn Pro Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro
450 455 460
Phe Lys Ser Glu Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu
465 470 475 480
Asp Gln Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser
485 490 495
Thr Asn Thr Tyr Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn
500 505 510
Met Thr Thr Gly Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val
515 520 525
Arg Glu Val Lys
530
<210> 29
<211> 512
<212> PRT
<213> Zymomonas mobilis
<400> 29
Met Glu Ser Pro Ser Tyr Lys Asn Leu Ile Lys Ala Glu Asp Ala Gln
1 5 10 15
Lys Lys Ala Gly Lys Arg Leu Leu Ser Ser Glu Trp Tyr Pro Gly Phe
20 25 30
His Val Thr Pro Leu Thr Gly Trp Met Asn Asp Pro Asn Gly Leu Ile
35 40 45
Phe Phe Lys Gly Glu Tyr His Leu Phe Tyr Gln Tyr Tyr Pro Phe Ala
50 55 60
Pro Val Trp Gly Pro Met His Trp Gly His Ala Lys Ser Arg Asp Leu
65 70 75 80
Val His Trp Glu Thr Leu Pro Val Ala Leu Ala Pro Gly Asp Leu Phe
85 90 95
Asp Arg Asp Gly Cys Phe Ser Gly Cys Ala Val Asp Asn Asn Gly Val
100 105 110
Leu Thr Leu Ile Tyr Thr Gly His Ile Val Leu Ser Asn Asp Ser Pro
115 120 125
Asp Ala Ile Arg Glu Val Gln Cys Met Ala Thr Ser Ile Asp Gly Ile
130 135 140
His Phe Gln Lys Glu Gly Ile Val Leu Glu Lys Ala Pro Met Pro Gln
145 150 155 160
Val Ala His Phe Arg Asp Pro Arg Val Trp Lys Glu Asn Asp His Trp
165 170 175
Phe Met Val Val Gly Tyr Arg Thr Asp Asp Glu Lys His Gln Gly Ile
180 185 190
Gly His Val Ala Leu Tyr Arg Ser Glu Asn Leu Lys Asp Trp Ile Phe
195 200 205
Val Lys Thr Leu Leu Gly Asp Asn Ser Gln Leu Pro Leu Gly Lys Arg
210 215 220
Ala Phe Met Trp Glu Cys Pro Asp Phe Phe Ser Leu Gly Asn Arg Ser
225 230 235 240
Val Leu Met Phe Ser Pro Gln Gly Leu Lys Ala Ser Gly Tyr Lys Asn
245 250 255
Arg Asn Leu Phe Gln Asn Gly Tyr Ile Leu Gly Lys Trp Gln Ala Pro
260 265 270
Gln Phe Thr Pro Glu Thr Ser Phe Gln Glu Leu Asp Tyr Gly His Asp
275 280 285
Phe Tyr Ala Ala Gln Arg Phe Glu Ala Lys Asp Gly Arg Gln Ile Leu
290 295 300
Ile Ala Trp Phe Asp Met Trp Glu Asn Gln Lys Pro Ser Gln Arg Asp
305 310 315 320
Gly Trp Ala Gly Cys Met Thr Leu Pro Arg Lys Leu Asp Leu Ile Asp
325 330 335
Asn Lys Ile Val Met Thr Pro Val Arg Glu Met Glu Ile Leu Arg Gln
340 345 350
Ser Glu Lys Ile Glu Ser Val Val Thr Leu Ser Asp Ala Glu His Pro
355 360 365
Phe Thr Met Asp Ser Pro Leu Gln Glu Ile Glu Leu Ile Phe Asp Leu
370 375 380
Glu Lys Ser Ser Ala Tyr Gln Ala Gly Leu Ala Leu Arg Cys Asn Gly
385 390 395 400
Lys Gly Gln Glu Thr Leu Leu Tyr Ile Asp Arg Ser Gln Asn Arg Ile
405 410 415
Ile Leu Asp Arg Asn Arg Ser Gly Gln Asn Val Lys Gly Ile Arg Ser
420 425 430
Cys Pro Leu Pro Asn Thr Ser Lys Val Arg Leu His Ile Phe Leu Asp
435 440 445
Arg Ser Ser Ile Glu Ile Phe Val Gly Asp Asp Gln Thr Gln Gly Leu
450 455 460
Tyr Ser Ile Ser Ser Arg Ile Phe Pro Asp Lys Asp Ser Leu Lys Gly
465 470 475 480
Arg Leu Phe Ala Ile Glu Gly Tyr Ala Val Phe Asp Ser Phe Lys Arg
485 490 495
Trp Thr Leu Gln Asp Ala Asn Leu Ala Ala Phe Ser Ser Asp Ala Cys
500 505 510
<210> 30
<211> 360
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 30
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Asp Trp Ser Met Leu Phe Ala Val Ile
35 40 45
Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp
50 55 60
Lys Pro Lys Pro Asn Pro Pro Gln Leu Leu Asp Asp His Phe Gly Pro
65 70 75 80
His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val
85 90 95
Gly Pro Asp Arg Ser Thr Ser Ile Val Ala Val Met Asn His Leu Gln
100 105 110
Glu Ala Ala Leu Asn His Ala Lys Ser Val Gly Ile Leu Gly Asp Gly
115 120 125
Phe Gly Thr Thr Leu Glu Met Ser Lys Arg Asp Leu Ile Trp Val Val
130 135 140
Lys Arg Thr His Val Ala Val Glu Arg Tyr Pro Ala Trp Gly Asp Thr
145 150 155 160
Val Glu Val Glu Cys Trp Val Gly Ala Ser Gly Asn Asn Gly Arg Arg
165 170 175
His Asp Phe Leu Val Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg
180 185 190
Cys Thr Ser Leu Ser Val Met Met Asn Thr Arg Thr Arg Arg Leu Ser
195 200 205
Lys Ile Pro Glu Glu Val Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp
210 215 220
Asn Val Ala Val Lys Asp Glu Glu Ile Lys Lys Pro Gln Lys Leu Asn
225 230 235 240
Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn
245 250 255
Asp Leu Asp Ile Asn Gln His Val Asn Asn Ile Lys Tyr Val Asp Trp
260 265 270
Ile Leu Glu Thr Val Pro Asp Ser Ile Phe Glu Ser His His Ile Ser
275 280 285
Ser Phe Thr Ile Glu Tyr Arg Arg Glu Cys Thr Met Asp Ser Val Leu
290 295 300
Gln Ser Leu Thr Thr Val Ser Gly Gly Ser Ser Glu Ala Gly Leu Val
305 310 315 320
Cys Glu His Leu Leu Gln Leu Glu Gly Gly Ser Glu Val Leu Arg Ala
325 330 335
Lys Thr Glu Trp Arg Pro Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser
340 345 350
Val Ile Pro Ala Glu Ser Ser Val
355 360
<210> 31
<211> 4653
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 31
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240
tccgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa ccccccccag 3300
ctgctggacg accacttcgg cccccacggc ctggtgttcc gccgcacctt cgccatccgc 3360
agctacgagg tgggccccga ccgctccacc agcatcgtgg ccgtgatgaa ccacctgcag 3420
gaggccgccc tgaaccacgc caagtccgtg ggcatcctgg gcgacggctt cggcaccacc 3480
ctggagatgt ccaagcgcga cctgatctgg gtggtgaagc gcacccacgt ggccgtggag 3540
cgctaccccg cctggggcga caccgtggag gtggagtgct gggtgggcgc ctccggcaac 3600
aacggccgcc gccacgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660
tgcacctccc tgagcgtgat gatgaacacc cgcacccgcc gcctgagcaa gatccccgag 3720
gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgaggag 3780
atcaagaagc cccagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840
ccccgctgga acgacctgga catcaaccag cacgtgaaca acatcaagta cgtggactgg 3900
atcctggaga ccgtgcccga cagcatcttc gagagccacc acatctcctc cttcaccatc 3960
gagtaccgcc gcgagtgcac catggacagc gtgctgcagt ccctgaccac cgtgagcggc 4020
ggctcctccg aggccggcct ggtgtgcgag cacctgctgc agctggaggg cggcagcgag 4080
gtgctgcgcg ccaagaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140
gtgatccccg ccgagtccag cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200
cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620
aagtagtggg atgggaacac aaatggaaag ctt 4653
<210> 32
<211> 366
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 32
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Gln Leu Pro Asp Trp Ser Arg Leu Leu Thr
35 40 45
Ala Ile Thr Thr Val Phe Val Lys Ser Lys Arg Pro Asp Met His Asp
50 55 60
Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Phe Gly Leu Glu
65 70 75 80
Ser Thr Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile Arg
85 90 95
Ser Tyr Glu Ile Gly Thr Asp Arg Thr Ala Ser Ile Glu Thr Leu Met
100 105 110
Asn His Leu Gln Glu Thr Ser Leu Asn His Cys Lys Ser Thr Gly Ile
115 120 125
Leu Leu Asp Gly Phe Gly Arg Thr Leu Glu Met Cys Lys Arg Asp Leu
130 135 140
Ile Trp Val Val Ile Lys Met Gln Ile Lys Val Asn Arg Tyr Pro Ala
145 150 155 160
Trp Gly Asp Thr Val Glu Ile Asn Thr Arg Phe Ser Arg Leu Gly Lys
165 170 175
Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly Glu
180 185 190
Ile Leu Val Arg Ala Thr Ser Ala Tyr Ala Met Met Asn Gln Lys Thr
195 200 205
Arg Arg Leu Ser Lys Leu Pro Tyr Glu Val His Gln Glu Ile Val Pro
210 215 220
Leu Phe Val Asp Ser Pro Val Ile Glu Asp Ser Asp Leu Lys Val His
225 230 235 240
Lys Phe Lys Val Lys Thr Gly Asp Ser Ile Gln Lys Gly Leu Thr Pro
245 250 255
Gly Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys Tyr
260 265 270
Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu Thr Gln
275 280 285
Glu Leu Cys Ser Leu Ala Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp
290 295 300
Ser Val Leu Glu Ser Val Thr Ala Met Asp Pro Ser Lys Val Gly Val
305 310 315 320
Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Ala Ile
325 330 335
Val Asn Gly Ala Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly
340 345 350
Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Val Ser
355 360 365
<210> 33
<211> 4668
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 33
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240
gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300
ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360
ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420
aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480
ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540
atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600
cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660
atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720
aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780
gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840
ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900
atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960
ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020
atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080
ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140
gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200
gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260
gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320
ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380
tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440
ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500
tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560
gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620
atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 4668
<210> 34
<211> 360
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 34
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Asp Trp Ser Met Leu Phe Ala Val Ile
35 40 45
Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp
50 55 60
Lys Pro Lys Pro Lys Leu Pro Gln Leu Leu Asp Asp His Phe Gly Leu
65 70 75 80
His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val
85 90 95
Gly Pro Asp Arg Ser Thr Ser Ile Leu Ala Val Met Asn His Met Gln
100 105 110
Glu Ala Thr Leu Asn His Ala Lys Ser Val Gly Ile Leu Gly Asp Gly
115 120 125
Phe Gly Thr Thr Leu Glu Met Ser Lys Arg Asp Leu Met Trp Val Val
130 135 140
Arg Arg Thr His Val Ala Val Glu Arg Tyr Pro Thr Trp Gly Asp Thr
145 150 155 160
Val Glu Val Glu Cys Trp Ile Gly Ala Ser Gly Asn Asn Gly Met Arg
165 170 175
Arg Asp Phe Leu Val Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg
180 185 190
Cys Thr Ser Leu Ser Val Leu Met Asn Thr Arg Thr Arg Arg Leu Ser
195 200 205
Thr Ile Pro Asp Glu Val Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp
210 215 220
Asn Val Ala Val Lys Asp Asp Glu Ile Lys Lys Leu Gln Lys Leu Asn
225 230 235 240
Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn
245 250 255
Asp Leu Asp Val Asn Gln His Val Asn Asn Leu Lys Tyr Val Ala Trp
260 265 270
Val Phe Glu Thr Val Pro Asp Ser Ile Phe Glu Ser His His Ile Ser
275 280 285
Ser Phe Thr Leu Glu Tyr Arg Arg Glu Cys Thr Arg Asp Ser Val Leu
290 295 300
Arg Ser Leu Thr Thr Val Ser Gly Gly Ser Ser Glu Ala Gly Leu Val
305 310 315 320
Cys Asp His Leu Leu Gln Leu Glu Gly Gly Ser Glu Val Leu Arg Ala
325 330 335
Arg Thr Glu Trp Arg Pro Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser
340 345 350
Val Ile Pro Ala Glu Pro Arg Val
355 360
<210> 35
<211> 4653
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 35
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240
agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300
ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360
tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420
gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480
ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540
cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600
aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660
tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720
gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780
atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840
ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900
gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960
gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020
ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080
gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140
gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200
cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620
aagtagtggg atgggaacac aaatggaaag ctt 4653
<210> 36
<211> 393
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 36
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Ala Asn Gly Ser Ala Val Thr Leu Lys
35 40 45
Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Leu Ser Ser Ser Pro Pro
50 55 60
Pro Arg Ala Phe Phe Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Thr
65 70 75 80
Ala Ile Thr Thr Val Phe Val Ala Pro Glu Lys Arg Trp Thr Met Phe
85 90 95
Asp Arg Lys Ser Lys Arg Pro Asn Met Leu Met Asp Ser Phe Gly Leu
100 105 110
Glu Arg Val Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile
115 120 125
Arg Ser Tyr Glu Ile Cys Ala Asp Arg Thr Ala Ser Ile Glu Thr Val
130 135 140
Met Asn His Val Gln Glu Thr Ser Leu Asn Gln Cys Lys Ser Ile Gly
145 150 155 160
Leu Leu Asp Asp Gly Phe Gly Arg Ser Pro Glu Met Cys Lys Arg Asp
165 170 175
Leu Ile Trp Val Val Thr Arg Met Lys Ile Met Val Asn Arg Tyr Pro
180 185 190
Thr Trp Gly Asp Thr Ile Glu Val Ser Thr Trp Leu Ser Gln Ser Gly
195 200 205
Lys Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
210 215 220
Glu Ile Leu Val Arg Ala Thr Ser Val Tyr Ala Met Met Asn Gln Lys
225 230 235 240
Thr Arg Arg Phe Ser Lys Leu Pro His Glu Val Arg Gln Glu Phe Ala
245 250 255
Pro His Phe Leu Asp Ser Pro Pro Ala Ile Glu Asp Asn Asp Gly Lys
260 265 270
Leu Gln Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly Leu
275 280 285
Thr Pro Gly Trp Tyr Asp Leu Asp Val Asn Gln His Val Ser Asn Val
290 295 300
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu
305 310 315 320
Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly
325 330 335
Arg Asp Ser Val Leu Glu Ser Val Thr Ser Met Asp Pro Ser Lys Val
340 345 350
Gly Asp Arg Phe Gln Tyr Arg His Leu Leu Arg Leu Glu Asp Gly Ala
355 360 365
Asp Ile Met Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Thr
370 375 380
Asn Gly Ala Ile Ser Thr Gly Lys Thr
385 390
<210> 37
<211> 4686
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 37
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgcccc cgcgaacggc agcgcggtga ccctgaagtc gggctccctg 3240
aacacccagg aggacacgct gagctcgtcc cccccccccc gcgcgttctt caaccagctg 3300
cccgactgga gcatgctgct gaccgcgatc accacggtct tcgtggcgcc cgagaagcgc 3360
tggaccatgt tcgaccgcaa gtcgaagcgc cccaacatgc tgatggactc cttcggcctg 3420
gagcgcgtgg tccaggacgg cctggtgttc cgccagagct tctcgatccg ctcctacgag 3480
atctgcgcgg accgcaccgc gagcatcgag acggtgatga accacgtcca ggagacctcg 3540
ctgaaccagt gcaagtccat cggcctgctg gacgacggct tcggccgcag ccccgagatg 3600
tgcaagcgcg acctgatctg ggtggtcacc cgcatgaaga tcatggtgaa ccgctacccc 3660
acgtggggcg acaccatcga ggtctcgacg tggctgtccc agagcggcaa gatcggcatg 3720
ggccgcgact ggctgatctc ggactgcaac accggcgaga tcctggtgcg cgcgacgtcc 3780
gtctacgcga tgatgaacca gaagacccgc cgcttcagca agctgcccca cgaggtgcgc 3840
caggagttcg cgccccactt cctggactcg ccccccgcga tcgaggacaa cgacggcaag 3900
ctgcagaagt tcgacgtcaa gacgggcgac tccatccgca agggcctgac ccccggctgg 3960
tacgacctgg acgtgaacca gcacgtgagc aacgtcaagt acatcggctg gatcctggag 4020
tcgatgccca ccgaggtcct ggagacgcag gagctgtgct ccctgaccct ggagtaccgc 4080
cgcgagtgcg gccgcgactc ggtgctggag agcgtcacca gcatggaccc ctcgaaggtg 4140
ggcgaccgct tccagtaccg ccacctgctg cgcctggagg acggcgcgga catcatgaag 4200
ggccgcaccg agtggcgccc caagaacgcg ggcacgaacg gcgcgatctc caccggcaag 4260
acgtgactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 4320
gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 4380
aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 4440
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4500
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4560
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 4620
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctt 4680
gagctc 4686
<210> 38
<211> 408
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 38
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Ala Asn Gly Ser Ala Val Asn Leu Lys
35 40 45
Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro Pro Pro
50 55 60
Arg Ala Phe Leu Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Thr Ala
65 70 75 80
Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr Met Leu Asp
85 90 95
Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Val Gly Leu Lys
100 105 110
Ser Ile Val Arg Asp Gly Leu Val Ser Arg Gln Ser Phe Leu Ile Arg
115 120 125
Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met
130 135 140
Asn His Leu Gln Glu Thr Ser Ile Asn His Cys Lys Ser Leu Gly Leu
145 150 155 160
Leu Asn Asp Gly Phe Gly Arg Thr Pro Gly Met Cys Lys Asn Asp Leu
165 170 175
Ile Trp Val Leu Thr Lys Met Gln Ile Met Val Asn Arg Tyr Pro Thr
180 185 190
Trp Gly Asp Thr Val Glu Ile Asn Thr Trp Phe Ser Gln Ser Gly Lys
195 200 205
Ile Gly Met Ala Ser Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly Glu
210 215 220
Ile Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr
225 230 235 240
Arg Arg Phe Ser Arg Leu Pro Tyr Glu Val Arg Gln Glu Leu Thr Pro
245 250 255
His Phe Val Asp Ser Pro His Val Ile Glu Asp Asn Asp Gln Lys Leu
260 265 270
His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly Leu Thr
275 280 285
Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys
290 295 300
Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Ile Glu Val Leu Glu Thr
305 310 315 320
Gln Glu Leu Cys Ser Leu Thr Val Glu Tyr Arg Arg Glu Cys Gly Met
325 330 335
Asp Ser Val Leu Glu Ser Val Thr Ala Val Asp Pro Ser Glu Asn Gly
340 345 350
Gly Arg Ser Gln Tyr Lys His Leu Leu Arg Leu Glu Asp Gly Thr Asp
355 360 365
Ile Val Lys Ser Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Thr Asn
370 375 380
Gly Ala Ile Ser Thr Ser Thr Ala Lys Thr Ser Asn Gly Asn Ser Ala
385 390 395 400
Ser Asp Asp Asp Asp Lys Leu Gly
405
<210> 39
<211> 1239
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 39
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
cccgcgaacg gcagcgcggt gaacctgaag tcgggctccc tgaacaccca ggaggacacg 180
agctcgtccc cccccccccg cgcgttcctg aaccagctgc ccgactggag catgctgctg 240
accgcgatca ccaccgtctt cgtggcggcg gagaagcagt ggacgatgct ggaccgcaag 300
tcgaagcgcc ccgacatgct ggtggactcc gtcggcctga agagcatcgt gcgcgacggc 360
ctggtctcgc gccagtcctt cctgatccgc agctacgaga tcggcgcgga ccgcaccgcg 420
tcgatcgaga ccctgatgaa ccacctgcag gagacgtcca tcaaccactg caagagcctg 480
ggcctgctga acgacggctt cggccgcacc cccggcatgt gcaagaacga cctgatctgg 540
gtgctgacca agatgcagat catggtcaac cgctacccca cgtggggcga caccgtcgag 600
atcaacacgt ggttctcgca gtccggcaag atcggcatgg cgagcgactg gctgatctcg 660
gactgcaaca ccggcgagat cctgatccgc gcgacctccg tgtgggcgat gatgaaccag 720
aagacgcgcc gcttcagccg cctgccctac gaggtccgcc aggagctgac cccccacttc 780
gtggactcgc cccacgtcat cgaggacaac gaccagaagc tgcacaagtt cgacgtgaag 840
accggcgact ccatccgcaa gggcctgacg ccccgctgga acgacctgga cgtcaaccag 900
cacgtgtcga acgtgaagta catcggctgg atcctggagt ccatgcccat cgaggtcctg 960
gagacccagg agctgtgctc gctgaccgtg gagtaccgcc gcgagtgcgg catggactcc 1020
gtgctggagt cggtcacggc ggtggacccc agcgagaacg gcggccgcag ccagtacaag 1080
cacctgctgc gcctggagga cggcaccgac atcgtcaagt cgcgcaccga gtggcgcccc 1140
aagaacgcgg gcacgaacgg cgcgatctcc accagcaccg cgaagacgtc gaacggcaac 1200
tccgcgagcg atgacgatga caagctggga tgactcgag 1239
<210> 40
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 40
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Ala Gln Ala Ala Thr Arg Val Asn Gly Ser
35 40 45
Lys Val Gly Leu Lys Thr Asp Thr Asn Lys Leu Glu Asp Ala Pro Phe
50 55 60
Ile Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp Trp
65 70 75 80
Ser Val Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys
85 90 95
Gln Trp Thr Leu Ile Asp Trp Lys Arg Gly Gly Pro Asp Met Leu Ser
100 105 110
Asp Ala Phe Gly Leu Pro Lys Ile Ile Glu Asn Gly Leu Leu Tyr Arg
115 120 125
Gln Lys Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Gln Thr Ala
130 135 140
Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn His
145 150 155 160
Val Lys Cys Ala Gly Leu Leu Gly Asn Gly Phe Gly Ser Thr Pro Glu
165 170 175
Met Ser Lys Met Asn Leu Ile Trp Val Val Thr Lys Met Gln Val Leu
180 185 190
Val Glu His Tyr Pro Ser Trp Gly Asp Val Ile Glu Val Asp Thr Trp
195 200 205
Ala Ala Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp His Val Arg
210 215 220
Asp Trp Gln Thr Gly Gln Thr Ile Met Arg Ala Ser Ser Asn Trp Val
225 230 235 240
Met Met Asn Gln Asn Thr Arg Arg Leu Ser Lys Phe Pro Glu Glu Val
245 250 255
Arg Ala Glu Ile Glu Pro Tyr Phe Met Glu Arg Ala Pro Val Ile Asp
260 265 270
Asp Asp Asn Arg Lys Leu Pro Lys Leu Asp Asp Asp Thr Ala Asp His
275 280 285
Val Arg Asn Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln
290 295 300
His Val Lys Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro
305 310 315 320
Ile Ser Ile Leu Glu Ser His Glu Leu Ala Ser Met Thr Leu Glu Tyr
325 330 335
Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ser Val
340 345 350
Ser Asn Asn Cys Thr Asp Gly Ser Glu Glu Leu Pro Ile Glu Cys Gln
355 360 365
His Leu Leu Arg Asn Glu Gly Gly Ser Glu Ile Val Lys Gly Arg Thr
370 375 380
Glu Trp Arg Pro Lys Lys Cys Gly Pro Phe Gly Ala Gly Arg Pro
385 390 395
<210> 41
<211> 1212
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 41
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
gcccaggcgg ccacccgcgt gaacggcagc aaggtgggcc tgaagaccga caccaacaag 180
ctggaggacg cgcccttcat cccctcgtcc gccccccgca ccttctacaa ccagctgccc 240
gactggagcg tcctgctggc ggccatcacc accatcttcc tggcggccga gaagcagtgg 300
accctgatcg actggaagcg cggcggcccc gacatgctgt cggacgcgtt cggcctgccc 360
aagatcatcg agaacggcct gctgtaccgc cagaagttct ccatccgcag ctacgagatc 420
ggcgccgacc agaccgcctc gatcgagacc ctgatgaacc acctgcagga gaccgcgctg 480
aaccacgtca agtgcgccgg cctgctgggc aacggcttcg gctccacccc cgagatgagc 540
aagatgaacc tgatctgggt ggtcaccaag atgcaggtgc tggtcgagca ctacccctcg 600
tggggcgacg tgatcgaggt ggacacctgg gcggccgcgt ccggcaagaa cggcatgcgc 660
cgcgactggc acgtccgcga ctggcagacc ggccagacca tcatgcgcgc cagctcgaac 720
tgggtgatga tgaaccagaa cacccgccgc ctgtccaagt tccccgagga ggtccgcgcc 780
gagatcgagc cctacttcat ggagcgcgcc cccgtgatcg acgacgacaa ccgcaagctg 840
cccaagctgg acgacgacac cgcggaccac gtgcgcaacg gcctgacccc ccgctggagc 900
gacctggacg tgaaccagca cgtcaagaac gtgaagtaca tcggctggat cctggagtcg 960
gcccccatct ccatcctgga gagccacgag ctggcctcga tgaccctgga gtaccgccgc 1020
gagtgcggcc gcgactccgt cctgcagagc ctgacctcgg tgtccaacaa ctgcaccgac 1080
ggcagcgagg agctgcccat cgagtgccag cacctgctgc gcaacgaggg cggctcggag 1140
atcgtcaagg gccgcaccga gtggcgcccc aagaagtgcg gccccttcgg cgccggccgc 1200
ccctgactcg ag 1212
<210> 42
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 42
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Ala Asn Ala His Thr Val Pro Lys Ile Asn
35 40 45
Gly Asn Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu
50 55 60
Asp Ile Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn
65 70 75 80
Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe
85 90 95
Leu Ala Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg
100 105 110
Pro Asp Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val
115 120 125
Gln Asp Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu
130 135 140
Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu
145 150 155 160
Gln Glu Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp
165 170 175
Gly Phe Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val
180 185 190
Val Thr Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp
195 200 205
Val Ile Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met
210 215 220
Lys Arg Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr
225 230 235 240
Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu
245 250 255
Ser Lys Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val
260 265 270
Glu His Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn
275 280 285
Asp Asn Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser
290 295 300
Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp
305 310 315 320
Ile Leu Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr
325 330 335
Gly Met Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu
340 345 350
Gln Ser Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu
355 360 365
Ala Gly Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu
370 375 380
Ile Met Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr
385 390 395 400
Thr Tyr Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala
405 410 415
<210> 43
<211> 1260
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 43
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
gccaacgccc acaccgtgcc caagatcaac ggcaacaagg ccggcctgct gacccccatg 180
gagagcacca aggacgagga catcgtcgcg gcccccaccg tggcgcccaa gcgcaccttc 240
atcaaccagc tgcccgactg gtcgatgctg ctggccgcga tcaccaccat cttcctggcg 300
gccgagaagc agtggaccaa cctggactgg aagccccgcc gccccgacat gctggtcgac 360
ttcgacccct tctccctggg ccgcttcgtg caggacggcc tgatcttccg ccagaacttc 420
agcatccgct cgtacgagat cggcgcggac cgcaccgcct ccatcgagac cctgatgaac 480
cacctgcagg agaccgcgct gaaccacgtc cgctgcatcg gcctgctgga cgacggcttc 540
ggcagcaccc ccgagatgac ccgccgcgac ctgatctggg tggtcacccg catgcaggtc 600
ctggtggacc gctacccctc gtggggcgac gtgatcgagg tcgactcctg ggtgaccccc 660
agcggcaaga acggcatgaa gcgcgagtgg ttcctgcgcg actgcaagac cggcgagatc 720
ctgacccgcg ccacctcggt ctgggtgatg atgaacaagc gcacccgccg cctgtccaag 780
atccccgagg aggtccgcgt ggagatcgag ccctacttcg tcgagcacgg cgtgctggac 840
gaggactcgc gcaagctgcc caagctgaac gacaacaccg ccaactacat ccgccgcggc 900
ctggcgcccc gctggtccga cctggacgtc aaccagcacg tgaacaacgt caagtacatc 960
ggctggatcc tggagagcgt gcccagcagc ctgctggagt cgcacgagct gtacggcatg 1020
accctggagt accgcaagga gtgcggcaag gacggcctgc tgcagtccct gaccgccgtc 1080
gccagcgact acggcggcgg ctcgctggag gccggcgtgg agtgcgacca cctgctgcgc 1140
ctggaggacg gctccgagat catgcgcggc aagaccgagt ggcgccccaa gcgcgccgcg 1200
aacaccacct acttcggcag cgtcgacgac atcccccccg ccaacaacgc gtgactcgag 1260
<210> 44
<211> 362
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 44
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Ser Met Leu Leu Ser Ala Val Thr Thr Val
35 40 45
Phe Gly Val Ala Glu Lys Gln Trp Pro Met Leu Asp Arg Lys Ser Lys
50 55 60
Arg Pro Asp Met Leu Val Glu Pro Leu Gly Val Asp Arg Ile Val Tyr
65 70 75 80
Asp Gly Val Ser Phe Arg Gln Ser Phe Ser Ile Arg Ser Tyr Glu Ile
85 90 95
Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn Met Phe Gln
100 105 110
Glu Thr Ser Leu Asn His Cys Lys Ile Ile Gly Leu Leu Asn Asp Gly
115 120 125
Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu Ile Trp Val Val
130 135 140
Thr Lys Met Gln Ile Glu Val Asn Arg Tyr Pro Thr Trp Gly Asp Thr
145 150 155 160
Ile Glu Val Asn Thr Trp Val Ser Ala Ser Gly Lys His Gly Met Gly
165 170 175
Arg Asp Trp Leu Ile Ser Asp Cys His Thr Gly Glu Ile Leu Ile Arg
180 185 190
Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr Arg Arg Leu Ser
195 200 205
Lys Ile Pro Tyr Glu Val Arg Gln Glu Ile Glu Pro Gln Phe Val Asp
210 215 220
Ser Ala Pro Val Ile Val Asp Asp Arg Lys Phe His Lys Leu Asp Leu
225 230 235 240
Lys Thr Gly Asp Ser Ile Cys Asn Gly Leu Thr Pro Arg Trp Thr Asp
245 250 255
Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile
260 265 270
Leu Gln Ser Val Pro Thr Glu Val Phe Glu Thr Gln Glu Leu Cys Gly
275 280 285
Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Glu
290 295 300
Ser Val Thr Ala Met Asp Pro Ser Lys Glu Gly Asp Arg Ser Leu Tyr
305 310 315 320
Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile Val Lys Gly Arg
325 330 335
Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Lys Gly Ala Ile Leu Thr
340 345 350
Gly Lys Thr Ser Asn Gly Asn Ser Ile Ser
355 360
<210> 45
<211> 1101
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 45
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
agcatgctgc tgtcggcggt gaccacggtc ttcggcgtgg ccgagaagca gtggcccatg 180
ctggaccgca agtccaagcg ccccgacatg ctggtcgagc ccctgggcgt ggaccgcatc 240
gtctacgacg gcgtgagctt ccgccagtcg ttctccatcc gcagctacga gatcggcgcc 300
gaccgcaccg cctcgatcga gacgctgatg aacatgttcc aggagacctc cctgaaccac 360
tgcaagatca tcggcctgct gaacgacggc ttcggccgca cgcccgagat gtgcaagcgc 420
gacctgatct gggtcgtgac caagatgcag atcgaggtga accgctaccc cacgtggggc 480
gacaccatcg aggtcaacac gtgggtgagc gcctcgggca agcacggcat gggccgcgac 540
tggctgatct ccgactgcca caccggcgag atcctgatcc gcgcgacgag cgtctgggcg 600
atgatgaacc agaagacccg ccgcctgtcg aagatcccct acgaggtgcg ccaggagatc 660
gagccccagt tcgtcgactc cgcccccgtg atcgtggacg accgcaagtt ccacaagctg 720
gacctgaaga cgggcgacag catctgcaac ggcctgaccc cccgctggac ggacctggac 780
gtgaaccagc acgtcaacaa cgtgaagtac atcggctgga tcctgcagtc ggtccccacc 840
gaggtgttcg agacgcagga gctgtgcggc ctgaccctgg agtaccgccg cgagtgcggc 900
cgcgactccg tgctggagag cgtcacggcc atggacccct cgaaggaggg cgaccgctcc 960
ctgtaccagc acctgctgcg cctggaggac ggcgcggaca tcgtgaaggg ccgcaccgag 1020
tggcgcccca agaacgccgg cgccaagggc gccatcctga cgggcaagac cagcaacggc 1080
aactcgatct cctgactcga g 1101
<210> 46
<211> 369
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 46
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
35 40 45
Ala Ile Thr Thr Leu Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
50 55 60
Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu
65 70 75 80
Gly Arg Phe Val Gln Asp Gly Leu Val Phe Arg Asn Asn Phe Ser Ile
85 90 95
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu
100 105 110
Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Val Gly
115 120 125
Leu Leu Glu Asp Gly Leu Gly Ser Thr Arg Glu Met Ser Leu Arg Asn
130 135 140
Leu Ile Trp Val Val Thr Lys Met Gln Val Ala Val Asp Arg Tyr Pro
145 150 155 160
Thr Trp Gly Asp Glu Val Gln Val Ser Ser Trp Ala Thr Ala Ile Gly
165 170 175
Lys Asn Gly Met Arg Arg Glu Trp Ile Val Thr Asp Phe Arg Thr Gly
180 185 190
Glu Thr Leu Leu Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Leu
195 200 205
Thr Arg Arg Ile Ser Lys Ile Pro Glu Glu Val Trp His Glu Ile Gly
210 215 220
Pro Ser Phe Ile Asp Ala Pro Pro Leu Pro Thr Val Glu Asp Asp Gly
225 230 235 240
Arg Lys Leu Thr Arg Phe Asp Glu Ser Ser Ala Asp Phe Ile Arg Lys
245 250 255
Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Ile Asn Gln His Val Asn
260 265 270
Asn Val Lys Tyr Ile Gly Trp Leu Leu Glu Ser Ala Pro Pro Glu Ile
275 280 285
His Glu Ser His Glu Ile Ala Ser Leu Thr Leu Glu Tyr Arg Arg Glu
290 295 300
Cys Gly Arg Asp Ser Val Leu Asn Ser Ala Thr Lys Val Ser Asp Ser
305 310 315 320
Ser Gln Leu Gly Lys Ser Ala Val Glu Cys Asn His Leu Val Arg Leu
325 330 335
Gln Asn Gly Gly Glu Ile Val Lys Gly Arg Thr Val Trp Arg Pro Lys
340 345 350
Arg Pro Leu Tyr Asn Asp Gly Ala Val Val Asp Val Pro Ala Lys Thr
355 360 365
Ser
<210> 47
<211> 1122
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 47
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
cagctgcccg actggagcat gctgctggcc gcgatcacca ccctgttcct ggcggccgag 180
aagcagtgga tgatgctgga ctggaagccc aagcgccccg acatgctggt ggaccccttc 240
ggcctgggcc gcttcgtgca ggacggcctg gtgttccgca acaacttcag catccgcagc 300
tacgagatcg gcgcggaccg caccgccagc atcgagaccc tgatgaacca cctgcaggag 360
accgccctga accacgtgaa gagcgtgggc ctgctggagg acggcctggg cagcacccgc 420
gagatgagcc tgcgcaacct gatctgggtg gtgaccaaga tgcaggtggc ggtggaccgc 480
taccccacct ggggcgacga ggtgcaggtg agcagctggg cgaccgccat cggcaagaac 540
ggcatgcgcc gcgagtggat cgtgaccgac ttccgcaccg gcgagaccct gctgcgcgcc 600
accagcgtgt gggtgatgat gaacaagctg acccgccgca tcagcaagat ccccgaggag 660
gtgtggcacg agatcggccc cagcttcatc gacgcgcccc ccctgcccac cgtggaggac 720
gacggccgca agctgacccg cttcgacgag agcagcgccg acttcatccg caagggcctg 780
accccccgct ggagcgacct ggacatcaac cagcacgtga acaacgtgaa gtacatcggc 840
tggctgctgg agagcgcgcc ccccgagatc cacgagagcc acgagatcgc cagcctgacc 900
ctggagtacc gccgcgagtg cggccgcgac agcgtgctga acagcgccac caaggtgagc 960
gacagcagcc agctgggcaa gagcgccgtg gagtgcaacc acctggtgcg cctgcagaac 1020
ggcggcgaga tcgtgaaggg ccgcaccgtg tggcgcccca agcgccccct gtacaacgac 1080
ggcgccgtgg tggacgtgcc cgccaagacc agctgactcg ag 1122
<210> 48
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 48
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
<210> 49
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 49
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
<210> 50
<211> 6207
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 50
gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60
cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120
caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180
gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240
ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300
cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360
accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420
gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480
ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540
cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600
ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660
cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720
gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780
gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840
ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900
taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960
cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020
ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080
ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140
gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200
cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260
cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320
ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380
ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440
ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500
ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560
caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620
catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680
gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740
ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800
catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860
cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920
ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980
catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040
ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100
ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160
ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220
cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280
caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340
cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400
ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460
cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520
cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580
cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640
caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060
tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120
ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180
ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240
ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 3360
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 3420
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 3480
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 3540
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 3600
caacccgcaa acactagtat ggccaccgca tccactttct cggcgttcaa tgcccgctgc 3660
ggcgacctgc gtcgctcggc gggctccggg ccccggcgcc cagcgaggcc cctccccgtg 3720
cgcgggcgcg cccagctgcc cgactggagc atgctgctgg ccgcgatcac caccctgttc 3780
ctggcggccg agaagcagtg gatgatgctg gactggaagc ccaagcgccc cgacatgctg 3840
gtggacccct tcggcctggg ccgcttcgtg caggacggcc tggtgttccg caacaacttc 3900
agcatccgca gctacgagat cggcgcggac cgcaccgcca gcatcgagac cctgatgaac 3960
cacctgcagg agaccgccct gaaccacgtg aagagcgtgg gcctgctgga ggacggcctg 4020
ggcagcaccc gcgagatgag cctgcgcaac ctgatctggg tggtgaccaa gatgcaggtg 4080
gcggtggacc gctaccccac ctggggcgac gaggtgcagg tgagcagctg ggcgaccgcc 4140
atcggcaaga acggcatgcg ccgcgagtgg atcgtgaccg acttccgcac cggcgagacc 4200
ctgctgcgcg ccaccagcgt gtgggtgatg atgaacaagc tgacccgccg catcagcaag 4260
atccccgagg aggtgtggca cgagatcggc cccagcttca tcgacgcgcc ccccctgccc 4320
accgtggagg acgacggccg caagctgacc cgcttcgacg agagcagcgc cgacttcatc 4380
cgcaagggcc tgaccccccg ctggagcgac ctggacatca accagcacgt gaacaacgtg 4440
aagtacatcg gctggctgct ggagagcgcg ccccccgaga tccacgagag ccacgagatc 4500
gccagcctga ccctggagta ccgccgcgag tgcggccgcg acagcgtgct gaacagcgcc 4560
accaaggtga gcgacagcag ccagctgggc aagagcgccg tggagtgcaa ccacctggtg 4620
cgcctgcaga acggcggcga gatcgtgaag ggccgcaccg tgtggcgccc caagcgcccc 4680
ctgtacaacg acggcgccgt ggtggacgtg cccgccaaga ccagcgatga cgatgacaag 4740
ctgggatgac tcgagttaat taactcgagg cagcagcagc tcggatagta tcgacacact 4800
ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata 4860
tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc 4920
gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt 4980
catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc 5040
tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct 5100
ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga 5160
acacaaatgg aaagctgtag agctccttgt tttccagaag gagttgctcc ttgagccttt 5220
cattctcagc ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa 5280
agcttggaat gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa 5340
ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct 5400
gccctgttga aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc 5460
agaatgtgga atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac 5520
acccgccact cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat 5580
atttctcgaa gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg 5640
tgcttgcgga gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc 5700
acccccgcga tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct 5760
ggcccaggcg agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct 5820
tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga 5880
gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct tgttcgagct tgaagagcct 5940
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 6000
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 6060
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 6120
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 6180
ggcggtttgc gtattgggcg ctcttcc 6207
<210> 51
<211> 5576
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 51
gaattcgccc tcccgtgatc acacaggtgc cttgcgagcg tgatcacact attttggggg 60
tcctacagta ctgaaatggt gagaagtcgt actgaaatca aggatgaaca atgaaaatgg 120
tgctgtggtg gcttctcaaa ggtcaagaat cagtcgctcg cgtcaggaaa tcgcggcgtc 180
aaccagcgtg ggcgcggtca gtggccccgc actggtcacc atagcctctc ctgccacagt 240
agcgatcccc tgggcgttca ctctcagcag cggctgtact gcctcccaga ttttcttctt 300
ctggacctgc gggcgtgaga ggatgagcag ggtgggccaa gggctcaatc ctgaacggcc 360
ctcattcggt ttccaatccc acaacacata cccacagcag gtcagaccac gcattccacc 420
atgcgcacca ataacgtgtc cttacctgat tgggtgtggc aggctccgtg gacaggagtg 480
cctcgtcccc cgcccagacc cgctcccccg tcacggcggc gtccgggacc cgcagcggct 540
ccaccgcggt gtgatccgcg ttggcggcgc agagcagcat cccagccgat ttgaccccgc 600
gcatgctccg aggcttgagg ttggccagca ccaccacccg ccggccgaca aggtcctcca 660
gggtcacgtg ccggaccagg ccactcacga tggtgcgagg gcccccctcc tcgccgaggt 720
cgatctgctc gacgtacaga ctgcgacatg cgtggcgagt ggtcatcaga aggaagcagg 780
tgtgcagaag gggcacgtgg ttggtattga gagtagccaa agctttgtgc caatcagaaa 840
gtcaacgcag ctgcctgcct ggctcgcgta caattccttt cttgcgctat gacacttcca 900
gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca ccgatgatgc 960
ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct ccagggcgag 1020
cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta ccaaagcata 1080
ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 1140
gctaaggggg cgcctcttcc cttcgtttca gtcacaaccc gcaaacggcg cgccatgctg 1200
ctgcaggcct tcctgttcct gctggccggc ttcgccgcca agatcagcgc ctccatgacg 1260
aacgagacgt ccgaccgccc cctggtgcac ttcaccccca acaagggctg gatgaacgac 1320
cccaacggcc tgtggtacga cgagaaggac gccaagtggc acctgtactt ccagtacaac 1380
ccgaacgaca ccgtctgggg gacgcccttg ttctggggcc acgccacgtc cgacgacctg 1440
accaactggg aggaccagcc catcgccatc gccccgaagc gcaacgactc cggcgccttc 1500
tccggctcca tggtggtgga ctacaacaac acctccggct tcttcaacga caccatcgac 1560
ccgcgccagc gctgcgtggc catctggacc tacaacaccc cggagtccga ggagcagtac 1620
atctcctaca gcctggacgg cggctacacc ttcaccgagt accagaagaa ccccgtgctg 1680
gccgccaact ccacccagtt ccgcgacccg aaggtcttct ggtacgagcc ctcccagaag 1740
tggatcatga ccgcggccaa gtcccaggac tacaagatcg agatctactc ctccgacgac 1800
ctgaagtcct ggaagctgga gtccgcgttc gccaacgagg gcttcctcgg ctaccagtac 1860
gagtgccccg gcctgatcga ggtccccacc gagcaggacc ccagcaagtc ctactgggtg 1920
atgttcatct ccatcaaccc cggcgccccg gccggcggct ccttcaacca gtacttcgtc 1980
ggcagcttca acggcaccca cttcgaggcc ttcgacaacc agtcccgcgt ggtggacttc 2040
ggcaaggact actacgccct gcagaccttc ttcaacaccg acccgaccta cgggagcgcc 2100
ctgggcatcg cgtgggcctc caactgggag tactccgcct tcgtgcccac caacccctgg 2160
cgctcctcca tgtccctcgt gcgcaagttc tccctcaaca ccgagtacca ggccaacccg 2220
gagacggagc tgatcaacct gaaggccgag ccgatcctga acatcagcaa cgccggcccc 2280
tggagccggt tcgccaccaa caccacgttg acgaaggcca acagctacaa cgtcgacctg 2340
tccaacagca ccggcaccct ggagttcgag ctggtgtacg ccgtcaacac cacccagacg 2400
atctccaagt ccgtgttcgc ggacctctcc ctctggttca agggcctgga ggaccccgag 2460
gagtacctcc gcatgggctt cgaggtgtcc gcgtcctcct tcttcctgga ccgcgggaac 2520
agcaaggtga agttcgtgaa ggagaacccc tacttcacca accgcatgag cgtgaacaac 2580
cagcccttca agagcgagaa cgacctgtcc tactacaagg tgtacggctt gctggaccag 2640
aacatcctgg agctgtactt caacgacggc gacgtcgtgt ccaccaacac ctacttcatg 2700
accaccggga acgccctggg ctccgtgaac atgacgacgg gggtggacaa cctgttctac 2760
atcgacaagt tccaggtgcg cgaggtcaag tgattaatta actcgaggca gcagcagctc 2820
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 2880
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 2940
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3000
catcccctcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 3060
ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 3120
tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 3180
gaagtagtgg gatgggaaca caaatggaaa gcttgagctc ctttcttgcg ctatgacact 3240
tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg 3300
atgcttcgac cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg 3360
cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag 3420
ccatattcaa acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc 3480
actccgctaa gggggcgcct cttcctcttc gtttcagtca caacccgcaa acactagtat 3540
gacgttcggg gtcgccctcc cggccatggg ccgcggtgtc tcccttcccc ggcccagggt 3600
cgcggtgcgc gcccagtcgg cgagtcaggt tttggagagc gggcgcgccc ccgactggtc 3660
catgctgttc gccgtgatca ccaccatctt ctccgccgcc gagaagcagt ggaccaacct 3720
ggagtggaag cccaagccca acccccccca gctgctggac gaccacttcg gcccccacgg 3780
cctggtgttc cgccgcacct tcgccatccg cagctacgag gtgggccccg accgctccac 3840
cagcatcgtg gccgtgatga accacctgca ggaggccgcc ctgaaccacg ccaagtccgt 3900
gggcatcctg ggcgacggct tcggcaccac cctggagatg tccaagcgcg acctgatctg 3960
ggtggtgaag cgcacccacg tggccgtgga gcgctacccc gcctggggcg acaccgtgga 4020
ggtggagtgc tgggtgggcg cctccggcaa caacggccgc cgccacgact tcctggtgcg 4080
cgactgcaag accggcgaga tcctgacccg ctgcacctcc ctgagcgtga tgatgaacac 4140
ccgcacccgc cgcctgagca agatccccga ggaggtgcgc ggcgagatcg gccccgcctt 4200
catcgacaac gtggccgtga aggacgagga gatcaagaag ccccagaagc tgaacgactc 4260
caccgccgac tacatccagg gcggcctgac cccccgctgg aacgacctgg acatcaacca 4320
gcacgtgaac aacatcaagt acgtggactg gatcctggag accgtgcccg acagcatctt 4380
cgagagccac cacatctcct ccttcaccat cgagtaccgc cgcgagtgca ccatggacag 4440
cgtgctgcag tccctgacca ccgtgagcgg cggctcctcc gaggccggcc tggtgtgcga 4500
gcacctgctg cagctggagg gcggcagcga ggtgctgcgc gccaagaccg agtggcgccc 4560
caagctgacc gactccttcc gcggcatcag cgtgatcccc gccgagtcca gcgtgatgga 4620
ctacaaggac cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga 4680
caagtgactc gaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 4740
tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 4800
caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctcttg 4860
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4920
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4980
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5040
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5100
gtacccgtac ccatcagcat ccgggtgaat cttggcctcc aagatatggc caatcctcac 5160
atccagcttg gcaaaatcga ctagactgtc tgcaagtggg aatgtggagc acaaggttgc 5220
ttgtagcgat cgacagactg gtggggtaca ttgacaggtg ggcagcgccg catccatcgt 5280
gcctgacgcg agcgccgccg gttgctcgcc cgtgcctgcc gtcaaagagc ggcagagaaa 5340
tcgggaaccg aaaacgtcac attgcctgat gttgttacat gctggactag actttcttgg 5400
cgtgggtctg ctcctcgcca ggtgcgcgac gcctcggggc tgggtgcgag ggagccgtgc 5460
ggccacgcat ttgacaagac ccaaagctcg catctcagac ggtcaaccgt tcgtattata 5520
cattcaacat atggtacata cgcaaaaagc atgccaacga tgacataggc gaattc 5576
<210> 52
<211> 4674
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 52
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240
gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300
ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360
ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420
aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480
ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540
atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600
cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660
atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720
aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780
gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840
ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900
atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960
ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020
atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080
ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140
gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200
gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260
gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320
ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380
tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440
ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500
tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560
gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620
atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagcttga gctc 4674
<210> 53
<211> 4656
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 53
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240
agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300
ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360
tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420
gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480
ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540
cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600
aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660
tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720
gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780
atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840
ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900
gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960
gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020
ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080
gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140
gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200
cacgacatcg actacaagga cgacgacgac aagtgactcg aggcagcagc agctcggata 4260
gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca cttgctgcct 4320
tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg 4380
tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc cccagcatcc 4440
ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct gtcctgctat 4500
ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt ttgggctccg 4560
cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat gcacgggaag 4620
tagtgggatg ggaacacaaa tggaaagctt gagctc 4656
<210> 54
<211> 4635
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 54
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgccca gctgcccgac tggagcatgc tgctggccgc gatcaccacc 3240
ctgttcctgg cggccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac 3300
atgctggtgg accccttcgg cctgggccgc ttcgtgcagg acggcctggt gttccgcaac 3360
aacttcagca tccgcagcta cgagatcggc gcggaccgca ccgccagcat cgagaccctg 3420
atgaaccacc tgcaggagac cgccctgaac cacgtgaaga gcgtgggcct gctggaggac 3480
ggcctgggca gcacccgcga gatgagcctg cgcaacctga tctgggtggt gaccaagatg 3540
caggtggcgg tggaccgcta ccccacctgg ggcgacgagg tgcaggtgag cagctgggcg 3600
accgccatcg gcaagaacgg catgcgccgc gagtggatcg tgaccgactt ccgcaccggc 3660
gagaccctgc tgcgcgccac cagcgtgtgg gtgatgatga acaagctgac ccgccgcatc 3720
agcaagatcc ccgaggaggt gtggcacgag atcggcccca gcttcatcga cgcgcccccc 3780
ctgcccaccg tggaggacga cggccgcaag ctgacccgct tcgacgagag cagcgccgac 3840
ttcatccgca agggcctgac cccccgctgg agcgacctgg acatcaacca gcacgtgaac 3900
aacgtgaagt acatcggctg gctgctggag agcgcgcccc ccgagatcca cgagagccac 3960
gagatcgcca gcctgaccct ggagtaccgc cgcgagtgcg gccgcgacag cgtgctgaac 4020
agcgccacca aggtgagcga cagcagccag ctgggcaaga gcgccgtgga gtgcaaccac 4080
ctggtgcgcc tgcagaacgg cggcgagatc gtgaagggcc gcaccgtgtg gcgccccaag 4140
cgccccctgt acaacgacgg cgccgtggtg gacgtgcccg ccaagaccag cgatgacgat 4200
gacaagctgg gatgactcga ggcagcagca gctcggatag tatcgacaca ctctggacgc 4260
tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc 4320
gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct 4380
agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc 4440
ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc 4500
ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc 4560
aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat 4620
ggaaagcttg agctc 4635
<210> 55
<211> 997
<212> DNA
<213> Prototheca moriformis
<400> 55
cctgtcgatc gaagagaagg agacatgtgt acattattgg tgtgagggcg ctgaatcggc 60
cattttttaa aatgatcacg ctcatgccaa tagacgcggc acataacgac gttcaaaccc 120
ccgccaaagc cgcggacaac cccatccctc cacacccccc acacaaagaa cccgccaccg 180
cttaccttgc ccacgaggta ggcctttcgt tgcgcaaaac cggcctcggt gatgaatgca 240
tgcccgttcc tgacgagcgc tgcccgggcc aacacgctct tttgctgcgt ctcctcaggc 300
ttgggggcct ccttgggctt gggtgccgcc atgatctgcg cgcatcagag aaacgttgct 360
ggtaaaaagg agcgcccggc tgcgcaatat atatataggc atgccaacac agcccaacct 420
cactcgggag cccgtcccac cacccccaag tcgcgtgcct tgacggcata ctgctgcaga 480
agcttcatga gaatgatgcc gaacaagagg ggcacgagga cccaatcccg gacatccttg 540
tcgataatga tctcgtgagt ccccatcgtc cgcccgacgc tccggggagc ccgccgatgc 600
tcaagacgag agggccctcg accaggaggg gctggcccgg gcgggcactg gcgtcgaagg 660
tgcgcccgtc gttcgcctgc agtcctatgc cacaaaacaa gtcttctgac ggggtgcgtt 720
tgctcccgtg cgggcaggca acagaggtat tcaccctggt catggggaga tcggcgatcg 780
agctgggata agagatactt ctggcaagca atgacaactt gtcaggaccg gaccgtgcca 840
tatatttctc acctagcgcc gcaaaaccta acaatttggg agtcactgtg ccactgagtt 900
cgactggtag ctgaatggag tcgctgctcc actaaacgaa ttgtcagcac cgccagccgg 960
ccgaggaccc gagtcatagc gagggtagta gcgcgcc 997
<210> 56
<211> 753
<212> DNA
<213> Prototheca moriformis
<400> 56
actaattgca atcgtgcagt aatcatcgat atggtcacaa gtagatcccc tactgacacc 60
ctctcgtaca tgtaggcaat gtcatcggcg ccgtcctgct gaccgatgcc gacgtagcag 120
agcagacccg ggccgatctg ggatacgagc cggccctcca cctgcgctcg aggtggaatc 180
aagtaaataa ccaatacact tttcgacacc acacagagtt gcacggacgg tggcgtacct 240
ctacgctcgc gctcttcacg cgctggacga ccgcacgcat gagcccgggt ggcttggtct 300
gggctgcaaa aatgcacaac aaacaagtat cagacgctca tggatgcaca cgcgctccca 360
agcacgctca gactaaatat tacagtagct cgtatctgat aagatatcga gacataccgc 420
tcaactcacc cgcaaactgc gccccgccag gtgatgcgca cagggcccca ccatgcgatc 480
catcgcatcg ctcctcgagg gcgctatcac gtggccggag agcgttcaca gcgtacgcca 540
ctgtatctgg gcggtatgcg gtccgtcaac atggagacag atacccgcac caccaccttg 600
caagctcttc catattggaa gtagaaaatt gtaattgtat catcgcacga ggggccaact 660
tgccgtcggc gagctgggcg acgaacacca cctggacgtt gtcgagactc gctcgtgccg 720
tgcgccgggc cgctgggtat ccagaccgtc gcc 753
<210> 57
<211> 1122
<212> DNA
<213> Prototheca moriformis
<400> 57
caacgacaac cagcaggcaa ctcggtcagc gacccaacac gcgagtcaaa ttgttgcgtg 60
ttcttgcctt gtctatttac tgtgatagca agactgtcgg tcagtcaata ccgcggtgcg 120
cacgtcgggg tgccaagcct agcagagcac gggacggctg gtgctgtgcg ccagctcagc 180
tcgcttcgcg accaattgta ggaccggcaa agtcaccaaa acatgccagc ggtgcgattc 240
aattggtcat gagctctaca aaattgtttt gtgcgtcgcg caggtatcca acggcgcggc 300
agagaaagtt tgacagctct cgatttcatc tcggaaaaat ggggagaatt tatgacacac 360
aagtgcgcag gcggcccagg cggccagcat attctggcgt gacctgggcc gcccacaaaa 420
tgcttggatg cactctaaaa taattatatt tgccatgaac aagggaagag ttaccgcacc 480
cagccctaga cttgggcgcc cgagcaaggt tacgtcaagc caccttcgcc catcgcccaa 540
ctccgtattc cccgacagcc gcacgtggcc ctcgccggaa tgaaccctga atcggcatca 600
cgccacgcgt tcgccaatcg ttccgctctc tggcttcatc ggcctgcgcc ttcacgtcgt 660
ggtcacgaca gtgcattcat acttccattt gcacctcggc acacactttt acgcatcgcc 720
tacccttgct gcggcagtct agggtcactt tgcagccatg ggacagtgct acaccaccgt 780
cggtgcgcaa agctatttca agtgaaccgt gggcggaaaa aaggaatgta cactgtctca 840
accgactcct acaattgttt accatgcaga tcagagctcg acggccatca tcgagcaggt 900
gtggggcctt ggtggcgcgg cgcggggccc cagggcgtcg caggcattga tggcactctg 960
agactttcgc acgcgcatga gggaccccat caagagaaga gtgtgtcttt atgtccccat 1020
tcatgatgat gtatcttgtg attgtcgcag tttggcaagt ttaaccggat cgccgctcca 1080
ggtgtggcgt ggcggatttt tctaggggtg cttgagcagt cg 1122
<210> 58
<211> 574
<212> DNA
<213> Prototheca moriformis
<400> 58
ggcccagggc cctgcggatg gcccacacca gatctagcct ctcttatgcc atgcccgcct 60
cgctgcccgt cgtatccccc cgccgatccg cgcgtagggg accgcggcct gacccacgcc 120
acgaaagagc tttgctcctc aatttctcgc caacagaacc gtatcaaacg ctcaacgcct 180
atcccgaaca atccgtattc acaccaaatc gagtataccg gactggtttg cctagtcttg 240
aaggaaatga tcccgtccat gctcggaagg gggagcgggc ggaggatcct actcatctct 300
gaaatgggat tggtccgaag atgggttggg caagcacgtg ccaaacccca gcgagttgct 360
gacgagcagg ctcatccaat cccccggcga atcctccctc acgccccgca tgcatacaag 420
tccctcccac acgccccctc ccatccattt tcgcctggtc cgaacgcgag cggcgtcgag 480
gcggaccact tgctccgcag cgccgtctgg gtctccaccc cacagcggct ttgctgccag 540
aggcaccccc cttgccccac ctcctcttgc agcc 574
<210> 59
<211> 1096
<212> DNA
<213> Prototheca moriformis
<400> 59
ccaggcaggc ggtagggttg ccgattgctt gagcgaattg gaagatataa ttttttgtgg 60
tgtccctgga cgctgtttgt ggcgctcctt tttggagaag attgcgtggg ggagctttcc 120
atgtaccacg cttccttctg aaaggattct ggccgagtcc tgatgagccc aaagaaaaca 180
cctgcctttc agtgctggca ctctgaaaac gtcaacagat gattatacat gtcacaaaag 240
gcagccgatt aggaacggga gctctggccg ttcgtttggc tgcctgggct gattgaagtg 300
atccaccctg ttcgaatgaa ggcggtcgag tcgaattatc gaccggagct gtcgggaagg 360
cgtccggggc agagtgaggt gctgcggcct ggttgtcgtt caaaaagacc ccggtagccc 420
aacaatcacg aacgaaagga atataattgc ttgcatacta tacattcagt ttctatgtgg 480
cgggtagaca agtctcatgg gcttctaaag gctgtccctt gaaggctact tataaaaact 540
tgctgcgcca tggcacggat cgcgcttgcg caggctgcaa ccctgcgcgc aaggtcaaat 600
acacagcaaa agatactaac agaatttcta aaaacattta aatatttgtt tcgaccagcc 660
aattgtggtc gtaggcacgc aaaagacttt gttttgcgcc caccgagcat ccacgctggc 720
agtcaagcca gtccgatgtg cattgcgtgg cagcatcgag gagcatcaaa aacctcgtgc 780
acgcttttct gtcaatcatc atcaaccact ccaccatgta tacccgatgc atcgcggtgc 840
gcagcgcgcc acgcgtccca gacccgccca aaaacccagc agcggcgaaa gcaaatcttc 900
acttgcccga aaccccgagc agcggcattc acacgtgggc gaaaacccca cttgccctaa 960
caggcgtatg tctgctgtca cgatgcctga caacggtatt atagatatac actgattaat 1020
gtttgagtgt gtgcgagtcg cgaatcagga atgaattgct agtaggcact ccgaccgggc 1080
gggggccgag ggacca 1096
<210> 60
<211> 1075
<212> DNA
<213> Prototheca moriformis
<400> 60
ggccgacagg acgcgcgtca aaggtgctgg gcgtgtatgc cctggtcggc aggtcgttgc 60
tgttgctgcg ctcgtggttc cgcaaccctg attttggcgt cttattctgg cgtggcaagc 120
gctgacgccc gcgagccggg ccggcggcga tgcggtgtct cacggctgcc gagctccaag 180
ggaggcaaga gcgcccggat cagctgaagg gctttacacg caaggtacag ccgctcctgc 240
aaggctgcgt ggtggacttg aacctgtagg tcctctgctg aagttcctcc actacctcac 300
caggcccagc agaccaaagc acaggctttt caggtccgtg tcatccactc taaaacactc 360
gactacgacc tactgatggc cctagattct tcatcaacaa tgcctgagac acttgctcag 420
aattgaaact ccctgaaggg accaccagag gccctgagtt gttccttccc cccgtggcga 480
gctgccagcc aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca 540
ggtcatggga ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc 600
taatcagcta tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt 660
gatccttcgt gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc 720
aactcgcgcg agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat 780
gcgcggcgcc tttcttgcga taatttatgc aatggactgc tctgcaaatt tctgggtctg 840
tcgccaaccc taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta 900
ccgactaccc taatatcagc ccggctgcct gacgccagcg tccacttttg cgtacacatt 960
ccattcgtgc ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt 1020
tcccgacctc cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagcc 1075
<210> 61
<211> 772
<212> DNA
<213> Prototheca moriformis
<400> 61
tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agagctcgac 60
tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 120
tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 180
gccagccagg ctgtacctgt gatcggggct ggcgggaaaa caggcttcgt gtgctcaggt 240
tatgggaggt gcaggacagc tcattaaacg ccaacaatcg cacaattcat ggcaagctaa 300
tcagttattt cccattaacg agctataatt gtcccaaaat tctggtctac cgggggtgat 360
ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc acatgcggtc gccgcgcaac 420
gcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 480
tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 540
ccaaccctag gatcagcggt gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 600
actgccctag tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 660
ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgatccc 720
caacctcctt attgttctgt cgacagagtg ggcccagagg ccggtcgcag cc 772
<210> 62
<211> 991
<212> DNA
<213> Prototheca moriformis
<400> 62
cgaaggggtc tgcatcgatt cgcgcggtct ggaggccagc gtgactgctc gcgaaaatgc 60
tctgccgtgt cgggctctgg ctggggcggc cagagatctc accgtgccac acgcaactgc 120
cgcactctgt gcccgccacc tggcgcgcac atgcgacctc ttccccgtca taccctctcc 180
tcatgtgatc tttccacacg agtgacgcag gtgcgcggag tggagggaat caggacgttt 240
tcaaggtacc tgctcgagcc gtaccaacag ctgccgcccg gcaaggaaga gatcgaggca 300
gagattgccc ggctggaggc ccggataacg gagctcaaga gcaagctgtc cgagtgagac 360
cgcccaggtg cacgtgtcga ctcgctatga catgtactcg acacaacatg aggaattcat 420
cgaatttgta ggaagcgggc attggtacgg gagtgggaaa gcgaaaaaac ctccctccgg 480
cagtgccatc tgccggagtc gaacgttgat agggttctcg tgacagggtg tgacctctca 540
gccttgcatc aattaaacgc tatagacatt atcagtaacc gtgaatcccg cattggatgc 600
cacccgcgcg accattgggg acctgcatta cagatctagg tgagatgaca gcgaggcaac 660
ttcggcccgc ggcccagctt gcggcgcacc aatattggtc acgggaagcc acacaccgac 720
cataaatgaa tacttgtaag ctatgtcaac cgatcaatgg cgtcgaaagt gtgccacgag 780
gatccatctg gcggggcggc gtggcgcaca agcgcagtcg caatttctcg gacccatctg 840
acctaggccc agcgccgcgg gagaaatccc cggcgggtcc tccacgcagt aaccctaatg 900
agtatcgagc gccgaccatt tacaccatcg cccccgaaat ccttccgaca ttattattat 960
cttttagatc ttggaacaga ctctgccaac c 991
<210> 63
<211> 1347
<212> DNA
<213> Prototheca moriformis
<400> 63
agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60
cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120
gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180
ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240
cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300
cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360
tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420
gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480
attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540
tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600
gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660
catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720
tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780
tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840
caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900
atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960
attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020
agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080
gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140
acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200
ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260
cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320
attttccagt cgtcagcgaa atcaagt 1347
<210> 64
<211> 1180
<212> DNA
<213> Prototheca moriformis
<400> 64
gatggtgggg tgtctgcctt gggctgggtg atggaggctg gtggtgcgcg ggtttcctga 60
tgcattctat ctacgcagtg tcatggtgtc cattccacac accagtacac ccttacacta 120
aggatccatc cctccttccc tcttcaggac tacatggacc ccacgagcta ccgaccgggc 180
tttctcaaaa acgtcaaggt catgtttgac atgcgggacg tggtggacga cgtgcaaggt 240
gcgtccggag tgcgcgcaaa tgagcaagtc gggcaatgtg tcggggtggg caccggggct 300
ggagatccgc gatccccgag aaaacgccgt accacccccc gcgctattcc ctcgattgcg 360
cgcagatgtg gtgaccgaca cgggggacaa cctggcggac atggggcgcc ggacctggaa 420
gcacgccaag tcgcacacgg ggaggctcgt gcagtccccc ccatcgtacc tcaagggtct 480
ctttggtcgc gatccaaagt acgctggtgg catggcatgc ccgaaatgaa catcatgtgt 540
gatctccgat tgccaatggc cacctccacg gaccaccttg caggcggaag cgcaatccag 600
ggcccgagcc tgacgaggac ggagactcct cgtccagcgc ggggtccccg acccgacgca 660
gcagccgacc cctgctaacc cggcaacgat cggaccagca accttgctgt agttccgatc 720
cgtgatgacg ggcattgccg ccgctcgatc cgctttgatg actgtctatt atttgcgcgg 780
agccccctcg gaaccctacc ccgctcttgc aagccccttg catcggagat cctcgtgcgc 840
ccgccatgac cccactggat tgcccaacat ccttctttat cgtgtaaaat gtgattcctc 900
ggctgcaatc gactggcctt cgcttctggc cccaagaggg ctcgaacgtg cggcagcgag 960
ggcgctgaca cacccaagcc ctagggcttt caacgtcggc tgccaggccg gataggggga 1020
tcgcctcctt tccaccaccc acctacgagg gattcgagtc ggcttccagc tcagctattc 1080
ggccgcgccc ccggccctgc agacgtcctc cagtttccga acaggtcgct ctcagaacac 1140
ctgccgcggc tgcgatacgg caggctctca aagcgtcgac 1180
<210> 65
<211> 1263
<212> DNA
<213> Prototheca moriformis
<400> 65
cgcgtggagc ggtgcgtgcg gatgccgcgc gcctgccaag gccttttgta tgcctggcct 60
gggaagtttc ctgactgaag catcttcaag atgctctctc acgaccagcg acaccaacac 120
cgtcactttt tgcccctcct gccgcaggtg ccactttcta ctttgacgtc ttctccaggc 180
ggtacattgc gggactgagc gccaattcgg ccaagaacag cgctgtcgac ttgaggaggc 240
aggggtccgt cgactctgcc gagtgacacg ccttcgaccc gactgtacta cggcctgctg 300
aagagtgggt ctcgccggcc ggcgtgaccg gccctgtgcc cacaatcgac catctattcg 360
ctccttgtca tctggcgccg tcaattgccc gcgacttgac ggcaactggc tcgatcgagt 420
cgtattgaaa aagcacgttt tgtcctacag ggccgcggtc cgttaccaac gtggttctcg 480
ttaggttttc gtcgggcggt ggtgcgcgaa ctgtccgatg ccatcccggc aaaccccagc 540
aaggtcgcca gtctggttct gacgcaatag agtgcgtttt gggccagtct aaaaattcgt 600
ctggcatgac gtggctccac atcgtacccg gagcctgcct tggtaatgtg aggcaccggt 660
gccaactcca ttatggcagg catcgagcgc gcaggtgagt acatgacctt ccgtgaattg 720
ggaaggcgag cttgtgtaac gcctgcgatc gtgccagtga ggcatcgtaa actcaaaata 780
ttttgtagaa agtgtctgat gcctggtgag gctgcgtagg gcaagggcaa gcccttggca 840
gatgggtaat gggtccggac ctcacaacag caaccccgcg tcccccttag ggcccctgag 900
gctcgatggc agggccagcg agcccgcggc caaagggcgc catcccacgg tcgcccaacg 960
actccacggg tcctatacct catcttgaat ggcactaaaa actatagaat atcgggcact 1020
ggtgggcgtc tggggtacag ctggccgagc gcagtggcaa accctaggtc ccgcctcaag 1080
ggcgattccc gggtcaatga cacgcaagca agatcacatg gcgcggtccg cctcgcggct 1140
ccacacccag gccctagttt cgcaacccat aaatatcgcc ccgataccat cataagccag 1200
caaataattt tttatcagag ttccaaacct cctcagctgt gggaaaccag cccactctga 1260
acg 1263
<210> 66
<211> 1400
<212> DNA
<213> Prototheca moriformis
<400> 66
ccgagcagtt catggccaag tacaaggact agagaccgga ggtcggtagg ctgaatggag 60
ctggcgtcgt cgtgcgcgac gtgcacgcga tgcgatacta cgaccccaca aacgcatgcc 120
tcccatcttg atgcctttcc ggccatttat actatttctc atttcgctgt aacatcttga 180
ataatagaat tgccctgtgt caagtggatt ccaagaaata ttctgtccca acaaaacaac 240
ccaacctgaa aacaacctca aataccacca gccctgccca cctgcccagt acacttttcc 300
aataccatct ccctaccttc acgcgcaagc ggcacccatg cgcgaccagg ctcgaaagga 360
tttcacgact caggacgagc gagtggcggc gcgaccgcct gcctgttcgt cacgtgccgt 420
acgtcggcga ccgctagagc tttgcctggc aacccccggc ttcgtcaacc cggccagcca 480
ggatctcgac cactctaccg cgaaatcgcc tcaagaagtc gccaaaagtg ccgtacacca 540
tgcttcgcag cgctgttcaa acttgatgcc aatcttgaca atcaggttgc tcgttggctg 600
cgtccacatc ggccgtgatt gcagcaggcg gggatcggac acggaggacg cggcgtcacg 660
ccgcgaacgc agcccgtaac tctacatcaa cgcgatatgt tgcgtaatcc cgcccggctg 720
cgcattgtga caacccattc gcgatggatg gtcggaaaat ggtgtgccaa ctgccctgag 780
ggactctctc gcgaaacggg cacgtccctg tatccgaaac tgtggcatgg ccttgtcgac 840
cacgcaagca cgtggaccct aacaccacga aaataagtaa aaaaggttga catcctctac 900
gagcgaattg tttgctcgac ccttcatcgc acactgtcat tataatgcat ctagctcggc 960
gacaagttta aaaaaggcag gctgcattat tccattttgc cgtggcggca tgggtgccca 1020
ttttatgagg tttgggctct tgggcagcga ccgagccagg ttgagtccct ctcgcccgtc 1080
gacaacgttc caaagcccat aagtggctaa taaacaactt gatggtacct gtacactgcc 1140
agttccttct tccccggccg aggtttacac gtgatggcca tggcttcgcg tttcaggctg 1200
acttcccatt ccgactttcc agagggtccg cggacgccgg gggttggctg cgtgaggccc 1260
accccttgtt ccccgcgtcc cgacaaacac aattgcgtta cataaggggg aagccgcccc 1320
ccgttcagag tgcaaacatc tttcattata tttttcagtc gtcagcgaaa tcaagtatgt 1380
cgctgacagg catgaaggcc 1400
<210> 67
<211> 6490
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 67
gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60
cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120
caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180
gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240
ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300
cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360
accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420
gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480
ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540
cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600
ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660
cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720
gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780
gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840
ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900
taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960
cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020
ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080
ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140
gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200
cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260
cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320
ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380
ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440
ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500
ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560
caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620
catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680
gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740
ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800
catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860
cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920
ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980
catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040
ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100
ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160
ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220
cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280
caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340
cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400
ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460
cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520
cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580
cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640
caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060
tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120
ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180
ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240
ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300
atcgaatttg taggaagcgg gcattggtac gggagtggga aagcgaaaaa acctccctcc 3360
ggcagtgcca tctgccggag tcgaacgttg atagggttct cgtgacaggg tgtgacctct 3420
cagccttgca tcaattaaac gctatagaca ttatcagtaa ccgtgaatcc cgcattggat 3480
gccacccgcg cgaccattgg ggacctgcat tacagatcta ggtgagatga cagcgaggca 3540
acttcggccc gcggcccagc ttgcggcgca ccaatattgg tcacgggaag ccacacaccg 3600
accataaatg aatacttgta agctatgtca accgatcaat ggcgtcgaaa gtgtgccacg 3660
aggatccatc tggcggggcg gcgtggcgca caagcgcagt cgcaatttct cggacccatc 3720
tgacctaggc ccagcgccgc gggagaaatc cccggcgggt cctccacgca gtaaccctaa 3780
tgagtatcga gcgccgacca tttacaccat cgccccccga aatccttccg acattattat 3840
tatcttttag atcttggaac agactctgcc aaccactagt atggccaccg catccacttt 3900
ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg gcgggctccg ggccccggcg 3960
cccagcgagg cccctccccg tgcgcgggcg cgcccccgac tggtccatgc tgttcgccgt 4020
gatcaccacc atcttctccg ccgccgagaa gcagtggacc aacctggagt ggaagcccaa 4080
gcccaacccc ccccagctgc tggacgacca cttcggcccc cacggcctgg tgttccgccg 4140
caccttcgcc atccgcagct acgaggtggg ccccgaccgc tccaccagca tcgtggccgt 4200
gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag tccgtgggca tcctgggcga 4260
cggcttcggc accaccctgg agatgtccaa gcgcgacctg atctgggtgg tgaagcgcac 4320
ccacgtggcc gtggagcgct accccgcctg gggcgacacc gtggaggtgg agtgctgggt 4380
gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg gtgcgcgact gcaagaccgg 4440
cgagatcctg acccgctgca cctccctgag cgtgatgatg aacacccgca cccgccgcct 4500
gagcaagatc cccgaggagg tgcgcggcga gatcggcccc gccttcatcg acaacgtggc 4560
cgtgaaggac gaggagatca agaagcccca gaagctgaac gactccaccg ccgactacat 4620
ccagggcggc ctgacccccc gctggaacga cctggacatc aaccagcacg tgaacaacat 4680
caagtacgtg gactggatcc tggagaccgt gcccgacagc atcttcgaga gccaccacat 4740
ctcctccttc accatcgagt accgccgcga gtgcaccatg gacagcgtgc tgcagtccct 4800
gaccaccgtg agcggcggct cctccgaggc cggcctggtg tgcgagcacc tgctgcagct 4860
ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg cgccccaagc tgaccgactc 4920
cttccgcggc atcagcgtga tccccgccga gtccagcgtg atggactaca aggaccacga 4980
cggcgactac aaggaccacg acatcgacta caaggacgac gacgacaagt gactcgagtt 5040
aattaactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 5100
gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 5160
aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 5220
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 5280
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 5340
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5400
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5460
tagagctcct tgttttccag aaggagttgc tccttgagcc tttcattctc agcctcgata 5520
acctccaaag ccgctctaat tgtggagggg gttcgaattt aaaagcttgg aatgttggtt 5580
cgtgcgtctg gaacaagccc agacttgttg ctcactggga aaaggaccat cagctccaaa 5640
aaacttgccg ctcaaaccgc gtacctctgc tttcgcgcaa tctgccctgt tgaaatcgcc 5700
accacattca tattgtgacg cttgagcagt ctgtaattgc ctcagaatgt ggaatcatct 5760
gccccctgtg cgagcccatg ccaggcatgt cgcgggcgag gacacccgcc actcgtacag 5820
cagaccatta tgctacctca caatagttca taacagtgac catatttctc gaagctcccc 5880
aacgagcacc tccatgctct gagtggccac cccccggccc tggtgcttgc ggagggcagg 5940
tcaaccggca tggggctacc gaaatccccg accggatccc accacccccg cgatgggaag 6000
aatctctccc cgggatgtgg gcccaccacc agcacaacct gctggcccag gcgagcgtca 6060
aaccatacca cacaaatatc cttggcatcg gccctgaatt ccttctgccg ctctgctacc 6120
cggtgcttct gtccgaagca ggggttgcta gggatcgctc cgagtccgca aacccttgtc 6180
gcgtggcggg gcttgttcga gcttgttcga gcttgaagag cctctagagt cgacctgcag 6240
gcatgcaagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 6300
cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 6360
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 6420
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 6480
gcgctcttcc 6490
<210> 68
<211> 20
<212> DNA
<213> Cinnamomum camphora
<400> 68
taccccgcct ggggcgacac 20
<210> 69
<211> 20
<212> DNA
<213> Cinnamomum camphora
<400> 69
cttgctcagg cggcgggtgc 20
<210> 70
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 70
ccggatctcg gccagggcta 20
<210> 71
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 71
tcgatgtcgt gcaccgtcgc 20
<210> 72
<211> 1092
<212> DNA
<213> Prototheca moriformis
<400> 72
gctcttcggg tttgctcacc cgcgaggtcg acgcccagca tggctatcaa gacgaacagg 60
cagcctgtgg agaagcctcc gttcacgatc gggacgctgc gcaaggccat ccccgcgcac 120
tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg cctttgacat cgcggtcatg 180
tccctgctct acgtcgcgtc gacgtacatc gaccctgcgc cggtgcctac gtgggtcaag 240
tatggcgtca tgtggccgct ctactggttc ttccaggtgt gtgtgagggt tgtggttgcc 300
cgtatcgagg tcctggtggc gcgcatgggg gagaaggcgc ctgtcccgct gacccccccg 360
gctaccctcc cggcaccttc cagggcgcct tcggcacggg tgtctgggtg tgcgcgcacg 420
agtgcggcca ccaggccttt tcctccagcc aggccatcaa cgacggcgtg ggcctggtgt 480
tccacagcct gctgctggtg ccctactact cctggaagca ctcgcaccgc cgccaccact 540
ccaacacggg gtgcctggac aaggacgagg tgtttgtgcc gccgcaccgc gcagtggcgc 600
acgagggcct ggagtgggag gagtggctgc ccatccgcat gggcaaggtg ctggtcaccc 660
tgaccctggg ctggccgctg tacctcatgt tcaacgtcgc ctcgcggccg tacccgcgct 720
tcgccaacca ctttgacccg tggtcgccca tcttcagcaa gcgcgaggta ccctttcttg 780
cgctatgaca cttccagcaa aaggtagggc gggctgcgag acggcttccc ggcgctgcat 840
gcaacaccga tgatgcttcg accccccgaa gctccttcgg ggctgcatgg gcgctccgat 900
gccgctccag ggcgagcgct gtttaaatag ccaggccccc gattgcaaag acattatagc 960
gagctaccaa agccatattc aaacacctag atcactacca cttctacaca ggccactcga 1020
gcttgtgatc gcactccgct aagggggcgc ctcttcctct tcgtttcagt cacaacccgc 1080
aaacggcgcg cc 1092
<210> 73
<211> 1400
<212> DNA
<213> Prototheca moriformis
<400> 73
caattggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 60
ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 120
cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 180
ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 240
aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 300
cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 360
actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggagc atcgaggtgg 420
tcatctccga cctcgcgttg gtggcggtgc tcagcgggct cagcgtgctg ggccgcacca 480
tgggctgggc ctggctggtc aagacctacg tggtgcccta catgatcgtg aacatgtggc 540
tggtgctcat cacgctgctc cagcacacgc acccggccct gccgcactac ttcgagaagg 600
actgggactg gctacgcggc gccatggcca ccgtcgaccg ctccatgggc ccgcccttca 660
tggacagcat cctgcaccac atctccgaca cccacgtgct gcaccacctc ttcagcacca 720
tcccgcacta ccacgccgag gaggcctccg ccgccatccg gcccatcctg ggcaagtact 780
accaatccga cagccgctgg gtcggccgcg ccctgtggga ggactggcgc gactgccgct 840
acgtcgtccc cgacgcgccc gaggacgact ccgcgctctg gttccacaag tgagcgcgcc 900
tgcgcgagga cgcagaacaa cgctgccgcc gtgtcttttg cacgcgcgac tccggcgctt 960
cgctggtggc acccccataa agaaaccctc aattctgttt gtggaagaca cggtgtaccc 1020
ccacccaccc acctgcacct ctattattgg tattattgac gcgggagtgg gcgttgtacc 1080
ctacaacgta gcttctctag ttttcagctg gctcccacca ttgtaaagag cctctagagt 1140
cgacctgcag gcatgcaagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 1200
gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg 1260
gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 1320
cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 1380
tgcgtattgg gcgctcttcc 1400
<210> 74
<211> 4091
<212> DNA
<213> Prototheca moriformis
<400> 74
gctcttcggg tttgctcacc cgcgaggtcg acgcccagca tggctatcaa gacgaacagg 60
cagcctgtgg agaagcctcc gttcacgatc gggacgctgc gcaaggccat ccccgcgcac 120
tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg cctttgacat cgcggtcatg 180
tccctgctct acgtcgcgtc gacgtacatc gaccctgcgc cggtgcctac gtgggtcaag 240
tatggcgtca tgtggccgct ctactggttc ttccaggtgt gtgtgagggt tgtggttgcc 300
cgtatcgagg tcctggtggc gcgcatgggg gagaaggcgc ctgtcccgct gacccccccg 360
gctaccctcc cggcaccttc cagggcgcct tcggcacggg tgtctgggtg tgcgcgcacg 420
agtgcggcca ccaggccttt tcctccagcc aggccatcaa cgacggcgtg ggcctggtgt 480
tccacagcct gctgctggtg ccctactact cctggaagca ctcgcaccgc cgccaccact 540
ccaacacggg gtgcctggac aaggacgagg tgtttgtgcc gccgcaccgc gcagtggcgc 600
acgagggcct ggagtgggag gagtggctgc ccatccgcat gggcaaggtg ctggtcaccc 660
tgaccctggg ctggccgctg tacctcatgt tcaacgtcgc ctcgcggccg tacccgcgct 720
tcgccaacca ctttgacccg tggtcgccca tcttcagcaa gcgcgaggta ccctttcttg 780
cgctatgaca cttccagcaa aaggtagggc gggctgcgag acggcttccc ggcgctgcat 840
gcaacaccga tgatgcttcg accccccgaa gctccttcgg ggctgcatgg gcgctccgat 900
gccgctccag ggcgagcgct gtttaaatag ccaggccccc gattgcaaag acattatagc 960
gagctaccaa agccatattc aaacacctag atcactacca cttctacaca ggccactcga 1020
gcttgtgatc gcactccgct aagggggcgc ctcttcctct tcgtttcagt cacaacccgc 1080
aaacggcgcg ccatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag 1140
atcagcgcct ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac 1200
aagggctgga tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac 1260
ctgtacttcc agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac 1320
gccacgtccg acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc 1380
aacgactccg gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc 1440
ttcaacgaca ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg 1500
gagtccgagg agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac 1560
cagaagaacc ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg 1620
tacgagccct cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag 1680
atctactcct ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc 1740
ttcctcggct accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc 1800
agcaagtcct actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc 1860
ttcaaccagt acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag 1920
tcccgcgtgg tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac 1980
ccgacctacg ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc 2040
gtgcccacca acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc 2100
gagtaccagg ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac 2160
atcagcaacg ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac 2220
agctacaacg tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc 2280
gtcaacacca cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag 2340
ggcctggagg accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc 2400
ttcctggacc gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac 2460
cgcatgagcg tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg 2520
tacggcttgc tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc 2580
accaacacct acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg 2640
gtggacaacc tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca 2700
gcagcagctc ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg 2760
ccacacttgc tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt 2820
gtttgatctt gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata 2880
ccacccccag catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct 2940
acgctgtcct gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc 3000
ttggtttggg ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg 3060
ctgatgcacg ggaagtagtg ggatgggaac acaaatggag catcgaggtg gtcatctccg 3120
acctcgcgtt ggtggcggtg ctcagcgggc tcagcgtgct gggccgcacc atgggctggg 3180
cctggctggt caagacctac gtggtgccct acatgatcgt gaacatgtgg ctggtgctca 3240
tcacgctgct ccagcacacg cacccggccc tgccgcacta cttcgagaag gactgggact 3300
ggctacgcgg cgccatggcc accgtcgacc gctccatggg cccgcccttc atggacagca 3360
tcctgcacca catctccgac acccacgtgc tgcaccacct cttcagcacc atcccgcact 3420
accacgccga ggaggcctcc gccgccatcc ggcccatcct gggcaagtac taccaatccg 3480
acagccgctg ggtcggccgc gccctgtggg aggactggcg cgactgccgc tacgtcgtcc 3540
ccgacgcgcc cgaggacgac tccgcgctct ggttccacaa gtgagcgcgc ctgcgcgagg 3600
acgcagaaca acgctgccgc cgtgtctttt gcacgcgcga ctccggcgct tcgctggtgg 3660
cacccccata aagaaaccct caattctgtt tgtggaagac acggtgtacc cccacccacc 3720
cacctgcacc tctattattg gtattattga cgcgggagtg ggcgttgtac cctacaacgt 3780
agcttctcta gttttcagct ggctcccacc attgtaaaga gcctctagag tcgacctgca 3840
ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 3900
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 3960
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 4020
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 4080
ggcgctcttc c 4091
<210> 75
<211> 510
<212> DNA
<213> Prototheca moriformis
<400> 75
gctcttccgc ctggagctgg tgcagagcat gggtcagttt gcggaggaga gggtgctccc 60
cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120
gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180
gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240
catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300
gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360
ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420
caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480
cttccaggag cgcgccacca agtaggtacc 510
<210> 76
<211> 1186
<212> DNA
<213> Prototheca moriformis
<400> 76
caattggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 60
ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 120
cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 180
ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 240
aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 300
cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 360
actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggaag gatcgtagag 420
ctccagccac ggcaacaccg cgcgcctggc ggccgagcac ggcgacaagg gcctgagcaa 480
gatctgcggg ctgatcgcca gcgacgaggg ccggcacgag atcgcctaca cgcgcatcgt 540
ggacgagttc ttccgcctcg accccgaggg cgccgtcgcc gcctacgcca acatgatgcg 600
caagcagatc accatgcccg cgcacctcat ggacgacatg ggccacggcg aggccaaccc 660
gggccgcaac ctcttcgccg acttctccgc cgtcgccgag aagatcgacg tctacgacgc 720
cgaggactac tgccgcatcc tggagcacct caacgcgcgc tggaaggtgg acgagcgcca 780
ggtcagcggc caggccgccg cggaccagga gtacgttctg ggcctgcccc agcgcttccg 840
gaaactcgcc gagaagaccg ccgccaagcg caagcgcgtc gcgcgcaggc ccgtcgcctt 900
ctcctggaga gaagagcctc tagagtcgac ctgcaggcat gcaagcttgg cgtaatcatg 960
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 1020
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 1080
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 1140
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttcc 1186
<210> 77
<211> 3615
<212> DNA
<213> Prototheca moriformis
<400> 77
gctcttccgc ctggagctgg tgcagagcat gggtcagttt gcggaggaga gggtgctccc 60
cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120
gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180
gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240
catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300
gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360
ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420
caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480
cttccaggag cgcgccacca agtaggtacc ctttcttgcg ctatgacact tccagcaaaa 540
ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac 600
cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt 660
ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa 720
acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa 780
gggggcgcct cttcctcttc gtttcagtca caacccgcaa acggcgcgcc atgctgctgc 840
aggccttcct gttcctgctg gccggcttcg ccgccaagat cagcgcctcc atgacgaacg 900
agacgtccga ccgccccctg gtgcacttca cccccaacaa gggctggatg aacgacccca 960
acggcctgtg gtacgacgag aaggacgcca agtggcacct gtacttccag tacaacccga 1020
acgacaccgt ctgggggacg cccttgttct ggggccacgc cacgtccgac gacctgacca 1080
actgggagga ccagcccatc gccatcgccc cgaagcgcaa cgactccggc gccttctccg 1140
gctccatggt ggtggactac aacaacacct ccggcttctt caacgacacc atcgacccgc 1200
gccagcgctg cgtggccatc tggacctaca acaccccgga gtccgaggag cagtacatct 1260
cctacagcct ggacggcggc tacaccttca ccgagtacca gaagaacccc gtgctggccg 1320
ccaactccac ccagttccgc gacccgaagg tcttctggta cgagccctcc cagaagtgga 1380
tcatgaccgc ggccaagtcc caggactaca agatcgagat ctactcctcc gacgacctga 1440
agtcctggaa gctggagtcc gcgttcgcca acgagggctt cctcggctac cagtacgagt 1500
gccccggcct gatcgaggtc cccaccgagc aggaccccag caagtcctac tgggtgatgt 1560
tcatctccat caaccccggc gccccggccg gcggctcctt caaccagtac ttcgtcggca 1620
gcttcaacgg cacccacttc gaggccttcg acaaccagtc ccgcgtggtg gacttcggca 1680
aggactacta cgccctgcag accttcttca acaccgaccc gacctacggg agcgccctgg 1740
gcatcgcgtg ggcctccaac tgggagtact ccgccttcgt gcccaccaac ccctggcgct 1800
cctccatgtc cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc aacccggaga 1860
cggagctgat caacctgaag gccgagccga tcctgaacat cagcaacgcc ggcccctgga 1920
gccggttcgc caccaacacc acgttgacga aggccaacag ctacaacgtc gacctgtcca 1980
acagcaccgg caccctggag ttcgagctgg tgtacgccgt caacaccacc cagacgatct 2040
ccaagtccgt gttcgcggac ctctccctct ggttcaaggg cctggaggac cccgaggagt 2100
acctccgcat gggcttcgag gtgtccgcgt cctccttctt cctggaccgc gggaacagca 2160
aggtgaagtt cgtgaaggag aacccctact tcaccaaccg catgagcgtg aacaaccagc 2220
ccttcaagag cgagaacgac ctgtcctact acaaggtgta cggcttgctg gaccagaaca 2280
tcctggagct gtacttcaac gacggcgacg tcgtgtccac caacacctac ttcatgacca 2340
ccgggaacgc cctgggctcc gtgaacatga cgacgggggt ggacaacctg ttctacatcg 2400
acaagttcca ggtgcgcgag gtcaagtgac aattggcagc agcagctcgg atagtatcga 2460
cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg ccttgacctg 2520
tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc 2580
ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca tccccttccc 2640
tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc tatccctcag 2700
cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct ccgcctgtat 2760
tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg aagtagtggg 2820
atgggaacac aaatggaagg atcgtagagc tccagccacg gcaacaccgc gcgcctggcg 2880
gccgagcacg gcgacaaggg cctgagcaag atctgcgggc tgatcgccag cgacgagggc 2940
cggcacgaga tcgcctacac gcgcatcgtg gacgagttct tccgcctcga ccccgagggc 3000
gccgtcgccg cctacgccaa catgatgcgc aagcagatca ccatgcccgc gcacctcatg 3060
gacgacatgg gccacggcga ggccaacccg ggccgcaacc tcttcgccga cttctccgcc 3120
gtcgccgaga agatcgacgt ctacgacgcc gaggactact gccgcatcct ggagcacctc 3180
aacgcgcgct ggaaggtgga cgagcgccag gtcagcggcc aggccgccgc ggaccaggag 3240
tacgttctgg gcctgcccca gcgcttccgg aaactcgccg agaagaccgc cgccaagcgc 3300
aagcgcgtcg cgcgcaggcc cgtcgccttc tcctggagag aagagcctct agagtcgacc 3360
tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 3420
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 3480
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 3540
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 3600
attgggcgct cttcc 3615
<210> 78
<211> 511
<212> DNA
<213> Prototheca moriformis
<400> 78
gctcttcccg cctggagctg gtgcagagca tggggcagtt tgcggaggag agggtgctcc 60
ccgtgctgca ccccgtggac aagctgtggc agccgcagga cttcctgccc gaccccgagt 120
cgcccgactt cgaggaccag gtggcggagc tgcgcgcgcg cgccaaggac ctgcccgacg 180
agtactttgt ggtgctggtg ggcgacatga tcacggagga ggcgctgccg acctacatgg 240
ccatgctcaa caccttggac ggtgtgcgcg acgacacggg cgcggctgac cacccgtggg 300
cgcgctggac gcggcagtgg gtggccgagg agaaccggca cggcgacctg ctgaacaagt 360
actgttggct gacggggcgc gtcaacatgc gggccgtgga ggtgaccatc aacaacctga 420
tcaagagcgg catgaacccg cagacggaca acaaccctta cttgggcttc gtctacacct 480
ccttccagga gcgcgccacc aagtaggtac c 511
<210> 79
<211> 761
<212> DNA
<213> Prototheca moriformis
<400> 79
cagccacggc aacaccgcgc gccttgcggc cgagcacggc gacaagaacc tgagcaagat 60
ctgcgggctg atcgccagcg acgagggccg gcacgagatc gcctacacgc gcatcgtgga 120
cgagttcttc cgcctcgacc ccgagggcgc cgtcgccgcc tacgccaaca tgatgcgcaa 180
gcagatcacc atgcccgcgc acctcatgga cgacatgggc cacggcgagg ccaacccggg 240
ccgcaacctc ttcgccgact tctccgcggt cgccgagaag atcgacgtct acgacgccga 300
ggactactgc cgcatcctgg agcacctcaa cgcgcgctgg aaggtggacg agcgccaggt 360
cagcggccag gccgccgcgg accaggagta cgtcctgggc ctgccccagc gcttccggaa 420
actcgccgag aagaccgccg ccaagcgcaa gcgcgtcgcg cgcaggcccg tcgccttctc 480
ctggagaaga gcctctagag tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat 540
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 600
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 660
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 720
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc c 761
<210> 80
<211> 3599
<212> DNA
<213> Prototheca moriformis
<400> 80
gctcttcccg cctggagctg gtgcagagca tggggcagtt tgcggaggag agggtgctcc 60
ccgtgctgca ccccgtggac aagctgtggc agccgcagga cttcctgccc gaccccgagt 120
cgcccgactt cgaggaccag gtggcggagc tgcgcgcgcg cgccaaggac ctgcccgacg 180
agtactttgt ggtgctggtg ggcgacatga tcacggagga ggcgctgccg acctacatgg 240
ccatgctcaa caccttggac ggtgtgcgcg acgacacggg cgcggctgac cacccgtggg 300
cgcgctggac gcggcagtgg gtggccgagg agaaccggca cggcgacctg ctgaacaagt 360
actgttggct gacggggcgc gtcaacatgc gggccgtgga ggtgaccatc aacaacctga 420
tcaagagcgg catgaacccg cagacggaca acaaccctta cttgggcttc gtctacacct 480
ccttccagga gcgcgccacc aagtaggtac cctttcttgc gctatgacac ttccagcaaa 540
aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat gatgcttcga 600
ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg gcgagcgctg 660
tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa gccatattca 720
aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg cactccgcta 780
agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacggcgcgc catgctgctg 840
caggccttcc tgttcctgct ggccggcttc gccgccaaga tcagcgcctc catgacgaac 900
gagacgtccg accgccccct ggtgcacttc acccccaaca agggctggat gaacgacccc 960
aacggcctgt ggtacgacga gaaggacgcc aagtggcacc tgtacttcca gtacaacccg 1020
aacgacaccg tctgggggac gcccttgttc tggggccacg ccacgtccga cgacctgacc 1080
aactgggagg accagcccat cgccatcgcc ccgaagcgca acgactccgg cgccttctcc 1140
ggctccatgg tggtggacta caacaacacc tccggcttct tcaacgacac catcgacccg 1200
cgccagcgct gcgtggccat ctggacctac aacaccccgg agtccgagga gcagtacatc 1260
tcctacagcc tggacggcgg ctacaccttc accgagtacc agaagaaccc cgtgctggcc 1320
gccaactcca cccagttccg cgacccgaag gtcttctggt acgagccctc ccagaagtgg 1380
atcatgaccg cggccaagtc ccaggactac aagatcgaga tctactcctc cgacgacctg 1440
aagtcctgga agctggagtc cgcgttcgcc aacgagggct tcctcggcta ccagtacgag 1500
tgccccggcc tgatcgaggt ccccaccgag caggacccca gcaagtccta ctgggtgatg 1560
ttcatctcca tcaaccccgg cgccccggcc ggcggctcct tcaaccagta cttcgtcggc 1620
agcttcaacg gcacccactt cgaggccttc gacaaccagt cccgcgtggt ggacttcggc 1680
aaggactact acgccctgca gaccttcttc aacaccgacc cgacctacgg gagcgccctg 1740
ggcatcgcgt gggcctccaa ctgggagtac tccgccttcg tgcccaccaa cccctggcgc 1800
tcctccatgt ccctcgtgcg caagttctcc ctcaacaccg agtaccaggc caacccggag 1860
acggagctga tcaacctgaa ggccgagccg atcctgaaca tcagcaacgc cggcccctgg 1920
agccggttcg ccaccaacac cacgttgacg aaggccaaca gctacaacgt cgacctgtcc 1980
aacagcaccg gcaccctgga gttcgagctg gtgtacgccg tcaacaccac ccagacgatc 2040
tccaagtccg tgttcgcgga cctctccctc tggttcaagg gcctggagga ccccgaggag 2100
tacctccgca tgggcttcga ggtgtccgcg tcctccttct tcctggaccg cgggaacagc 2160
aaggtgaagt tcgtgaagga gaacccctac ttcaccaacc gcatgagcgt gaacaaccag 2220
cccttcaaga gcgagaacga cctgtcctac tacaaggtgt acggcttgct ggaccagaac 2280
atcctggagc tgtacttcaa cgacggcgac gtcgtgtcca ccaacaccta cttcatgacc 2340
accgggaacg ccctgggctc cgtgaacatg acgacggggg tggacaacct gttctacatc 2400
gacaagttcc aggtgcgcga ggtcaagtga caattggcag cagcagctcg gatagtatcg 2460
acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct 2520
gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg 2580
cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc 2640
ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca 2700
gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta 2760
ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg 2820
gatgggaaca caaatggaca gccacggcaa caccgcgcgc cttgcggccg agcacggcga 2880
caagaacctg agcaagatct gcgggctgat cgccagcgac gagggccggc acgagatcgc 2940
ctacacgcgc atcgtggacg agttcttccg cctcgacccc gagggcgccg tcgccgccta 3000
cgccaacatg atgcgcaagc agatcaccat gcccgcgcac ctcatggacg acatgggcca 3060
cggcgaggcc aacccgggcc gcaacctctt cgccgacttc tccgcggtcg ccgagaagat 3120
cgacgtctac gacgccgagg actactgccg catcctggag cacctcaacg cgcgctggaa 3180
ggtggacgag cgccaggtca gcggccaggc cgccgcggac caggagtacg tcctgggcct 3240
gccccagcgc ttccggaaac tcgccgagaa gaccgccgcc aagcgcaagc gcgtcgcgcg 3300
caggcccgtc gccttctcct ggagaagagc ctctagagtc gacctgcagg catgcaagct 3360
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 3420
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 3480
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 3540
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttcc 3599
<210> 81
<211> 2933
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 81
agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60
cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120
gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180
ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240
cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300
cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360
tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420
gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480
attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540
tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600
gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660
catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720
tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780
tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840
caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900
atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960
attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020
agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080
gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140
acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200
ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260
cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320
attttccagt cgtcagcgaa atcaagtact agtatggcca ccgcatccac tttctcggcg 1380
ttcaatgccc gctgcggcga cctgcgtcgc tcggcgggct ccgggccccg gcgcccagcg 1440
aggcccctcc ccgtgcgcgg gcgcgccccc gactggtcca tgctgttcgc cgtgatcacc 1500
accatcttct ccgccgccga gaagcagtgg accaacctgg agtggaagcc caagcccaac 1560
cccccccagc tgctggacga ccacttcggc ccccacggcc tggtgttccg ccgcaccttc 1620
gccatccgca gctacgaggt gggccccgac cgctccacca gcatcgtggc cgtgatgaac 1680
cacctgcagg aggccgccct gaaccacgcc aagtccgtgg gcatcctggg cgacggcttc 1740
ggcaccaccc tggagatgtc caagcgcgac ctgatctggg tggtgaagcg cacccacgtg 1800
gccgtggagc gctaccccgc ctggggcgac accgtggagg tggagtgctg ggtgggcgcc 1860
tccggcaaca acggccgccg ccacgacttc ctggtgcgcg actgcaagac cggcgagatc 1920
ctgacccgct gcacctccct gagcgtgatg atgaacaccc gcacccgccg cctgagcaag 1980
atccccgagg aggtgcgcgg cgagatcggc cccgccttca tcgacaacgt ggccgtgaag 2040
gacgaggaga tcaagaagcc ccagaagctg aacgactcca ccgccgacta catccagggc 2100
ggcctgaccc cccgctggaa cgacctggac atcaaccagc acgtgaacaa catcaagtac 2160
gtggactgga tcctggagac cgtgcccgac agcatcttcg agagccacca catctcctcc 2220
ttcaccatcg agtaccgccg cgagtgcacc atggacagcg tgctgcagtc cctgaccacc 2280
gtgagcggcg gctcctccga ggccggcctg gtgtgcgagc acctgctgca gctggagggc 2340
ggcagcgagg tgctgcgcgc caagaccgag tggcgcccca agctgaccga ctccttccgc 2400
ggcatcagcg tgatccccgc cgagtccagc gtgatggact acaaggacca cgacggcgac 2460
tacaaggacc acgacatcga ctacaaggac gacgacgaca agtgactcga gttaattaac 2520
tcgaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 2580
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2640
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2700
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2760
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2820
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2880
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag ctt 2933
<210> 82
<211> 726
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 82
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacc 726
<210> 83
<211> 3635
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 83
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa actctagaat atcaatgatc gagcaggacg gcctccacgc cggctccccc 360
gccgcctggg tggagcgcct gttcggctac gactgggccc agcagaccat cggctgctcc 420
gacgccgccg tgttccgcct gtccgcccag ggccgccccg tgctgttcgt gaagaccgac 480
ctgtccggcg ccctgaacga gctgcaggac gaggccgccc gcctgtcctg gctggccacc 540
accggcgtgc cctgcgccgc cgtgctggac gtggtgaccg aggccggccg cgactggctg 600
ctgctgggcg aggtgcccgg ccaggacctg ctgtcctccc acctggcccc cgccgagaag 660
gtgtccatca tggccgacgc catgcgccgc ctgcacaccc tggaccccgc cacctgcccc 720
ttcgaccacc aggccaagca ccgcatcgag cgcgcccgca cccgcatgga ggccggcctg 780
gtggaccagg acgacctgga cgaggagcac cagggcctgg cccccgccga gctgttcgcc 840
cgcctgaagg cccgcatgcc cgacggcgag gacctggtgg tgacccacgg cgacgcctgc 900
ctgcccaaca tcatggtgga gaacggccgc ttctccggct tcatcgactg cggccgcctg 960
ggcgtggccg accgctacca ggacatcgcc ctggccaccc gcgacatcgc cgaggagctg 1020
ggcggcgagt gggccgaccg cttcctggtg ctgtacggca tcgccgcccc cgactcccag 1080
cgcatcgcct tctaccgcct gctggacgag ttcttctgac aattggcagc agcagctcgg 1140
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 1200
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 1260
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 1320
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 1380
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 1440
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 1500
aagtagtggg atgggaacac aaatggagga tcccgcgtct cgaacagagc gcgcagagga 1560
acgctgaagg tctcgcctct gtcgcacctc agcgcggcat acaccacaat aaccacctga 1620
cgaatgcgct tggttcttcg tccattagcg aagcgtccgg ttcacacacg tgccacgttg 1680
gcgaggtggc aggtgacaat gatcggtgga gctgatggtc gaaacgttca cagcctaggg 1740
atatcgaatt cctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga 1800
cggcttcccg gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg 1860
gctgcatggg cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg 1920
attgcaaaga cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac 1980
ttctacacag gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt 2040
cgtttcagtc acaacccgca aacactagta tggccaccgc atccactttc tcggcgttca 2100
atgcccgctg cggcgacctg cgtcgctcgg cgggctccgg gccccggcgc ccagcgaggc 2160
ccctccccgt gcgcgggcgc gcccccgact ggtccatgct gttcgccgtg atcaccacca 2220
tcttctccgc cgccgagaag cagtggacca acctggagtg gaagcccaag cccaaccccc 2280
cccagctgct ggacgaccac ttcggccccc acggcctggt gttccgccgc accttcgcca 2340
tccgcagcta cgaggtgggc cccgaccgct ccaccagcat cgtggccgtg atgaaccacc 2400
tgcaggaggc cgccctgaac cacgccaagt ccgtgggcat cctgggcgac ggcttcggca 2460
ccaccctgga gatgtccaag cgcgacctga tctgggtggt gaagcgcacc cacgtggccg 2520
tggagcgcta ccccgcctgg ggcgacaccg tggaggtgga gtgctgggtg ggcgcctccg 2580
gcaacaacgg ccgccgccac gacttcctgg tgcgcgactg caagaccggc gagatcctga 2640
cccgctgcac ctccctgagc gtgatgatga acacccgcac ccgccgcctg agcaagatcc 2700
ccgaggaggt gcgcggcgag atcggccccg ccttcatcga caacgtggcc gtgaaggacg 2760
aggagatcaa gaagccccag aagctgaacg actccaccgc cgactacatc cagggcggcc 2820
tgaccccccg ctggaacgac ctggacatca accagcacgt gaacaacatc aagtacgtgg 2880
actggatcct ggagaccgtg cccgacagca tcttcgagag ccaccacatc tcctccttca 2940
ccatcgagta ccgccgcgag tgcaccatgg acagcgtgct gcagtccctg accaccgtga 3000
gcggcggctc ctccgaggcc ggcctggtgt gcgagcacct gctgcagctg gagggcggca 3060
gcgaggtgct gcgcgccaag accgagtggc gccccaagct gaccgactcc ttccgcggca 3120
tcagcgtgat ccccgccgag tccagcgtga tggactacaa ggaccacgac ggcgactaca 3180
aggaccacga catcgactac aaggacgacg acgacaagtg actcgaggca gcagcagctc 3240
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 3300
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 3360
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3420
catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 3480
gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 3540
ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 3600
ggaagtagtg ggatgggaac acaaatggaa agctt 3635
<210> 84
<211> 749
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 84
gagctccttg ttttccagaa ggagttgctc cttgagcctt tcattctcag cctcgataac 60
ctccaaagcc gctctaattg tggagggggt tcgaatttaa aagcttggaa tgttggttcg 120
tgcgtctgga acaagcccag acttgttgct cactgggaaa aggaccatca gctccaaaaa 180
acttgccgct caaaccgcgt acctctgctt tcgcgcaatc tgccctgttg aaatcgccac 240
cacattcata ttgtgacgct tgagcagtct gtaattgcct cagaatgtgg aatcatctgc 300
cccctgtgcg agcccatgcc aggcatgtcg cgggcgagga cacccgccac tcgtacagca 360
gaccattatg ctacctcaca atagttcata acagtgacca tatttctcga agctccccaa 420
cgagcacctc catgctctga gtggccaccc cccggccctg gtgcttgcgg agggcaggtc 480
aaccggcatg gggctaccga aatccccgac cggatcccac cacccccgcg atgggaagaa 540
tctctccccg ggatgtgggc ccaccaccag cacaacctgc tggcccaggc gagcgtcaaa 600
ccataccaca caaatatcct tggcatcggc cctgaattcc ttctgccgct ctgctacccg 660
gtgcttctgt ccgaagcagg ggttgctagg gatcgctccg agtccgcaaa cccttgtcgc 720
gtggcggggc ttgttcgagc ttgaagagc 749
<210> 85
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 85
ggaggaattc ggccgacagg acgcgcgtca 30
<210> 86
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 86
ggagactagt ggctgcgacc ggcctgtg 28
<210> 87
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 87
ggaggaattc tcaccagcgg acaaagcacc g 31
<210> 88
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 88
ggagactagt ggctgcgacc ggcctctgg 29
<210> 89
<211> 1065
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic promoter
<400> 89
ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 60
tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 120
ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 180
gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 240
aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 300
cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 360
tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 420
ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 480
aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 540
ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 600
tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 660
gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 720
agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 780
ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 840
taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 900
taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 960
ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 1020
cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagcc 1065
<210> 90
<211> 6981
<212> DNA
<213> Cinnamomum camphora
<400> 90
gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60
cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120
caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180
gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240
ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300
cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360
accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420
gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480
ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540
cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600
ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660
cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720
gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780
gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840
ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900
taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960
cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020
ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080
ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140
gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200
cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260
cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320
ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380
ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440
ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500
ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560
caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620
catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680
gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740
ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800
catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860
cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920
ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980
catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040
ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100
ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160
ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220
cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280
caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340
cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400
ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460
cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520
cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580
cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640
caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060
tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120
ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180
ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240
ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300
ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 3360
tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 3420
ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 3480
gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 3540
aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 3600
cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 3660
tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 3720
ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 3780
aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 3840
ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 3900
tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 3960
gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 4020
agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 4080
ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 4140
taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 4200
taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 4260
ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 4320
cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag tatggccacc 4380
gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc 4440
gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga ctggtccatg 4500
ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac caacctggag 4560
tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc ccacggcctg 4620
gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg ctccaccagc 4680
atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa gtccgtgggc 4740
atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct gatctgggtg 4800
gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac cgtggaggtg 4860
gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct ggtgcgcgac 4920
tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat gaacacccgc 4980
acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc cgccttcatc 5040
gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa cgactccacc 5100
gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat caaccagcac 5160
gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag catcttcgag 5220
agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat ggacagcgtg 5280
ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt gtgcgagcac 5340
ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg gcgccccaag 5400
ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt gatggactac 5460
aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 5520
tgactcgagt taattaactc gaggcagcag cagctcggat agtatcgaca cactctggac 5580
gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 5640
ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 5700
ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 5760
gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 5820
tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 5880
gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5940
atggaaagct gtagagctcc ttgttttcca gaaggagttg ctccttgagc ctttcattct 6000
cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 6060
gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 6120
tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 6180
ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 6240
tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 6300
cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 6360
cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 6420
cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 6480
gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 6540
ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 6600
gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 6660
aaacccttgt cgcgtggcgg ggcttgttcg agcttgttcg agcttgaaga gcctctagag 6720
tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 6780
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 6840
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 6900
tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 6960
ttgcgtattg ggcgctcttc c 6981
<210> 91
<211> 1152
<212> DNA
<213> Cinnamomum camphora
<400> 91
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120
tggtccatgc tgttcgccgt gatcaccacc atcttctccg ccgccgagaa gcagtggacc 180
aacctggagt ggaagcccaa gcccaacccc ccccagctgc tggacgacca cttcggcccc 240
cacggcctgg tgttccgccg caccttcgcc atccgcagct acgaggtggg ccccgaccgc 300
tccaccagca tcgtggccgt gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag 360
tccgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420
atctgggtgg tgaagcgcac ccacgtggcc gtggagcgct accccgcctg gggcgacacc 480
gtggaggtgg agtgctgggt gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg 540
gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgatgatg 600
aacacccgca cccgccgcct gagcaagatc cccgaggagg tgcgcggcga gatcggcccc 660
gccttcatcg acaacgtggc cgtgaaggac gaggagatca agaagcccca gaagctgaac 720
gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacatc 780
aaccagcacg tgaacaacat caagtacgtg gactggatcc tggagaccgt gcccgacagc 840
atcttcgaga gccaccacat ctcctccttc accatcgagt accgccgcga gtgcaccatg 900
gacagcgtgc tgcagtccct gaccaccgtg agcggcggct cctccgaggc cggcctggtg 960
tgcgagcacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg 1020
cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gtccagcgtg 1080
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140
gacgacaagt ga 1152
<210> 92
<211> 1052
<212> DNA
<213> Umbellularia californica
<400> 92
ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc agcgccgccg 60
agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag ctgctggacg 120
accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc tcctacgagg 180
tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag gaggccaccc 240
tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc ctggagatgt 300
ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag cgctacccca 360
cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac aacggcatgc 420
gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc tgcacctccc 480
tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac gaggtgcgcg 540
gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag atcaagaagc 600
tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc ccccgctgga 660
acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg gtgttcgaga 720
ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg gagtaccgcc 780
gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc ggcagctccg 840
aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag gtgctgcgcg 900
cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc gtgatccccg 960
ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac cacgacatcg 1020
actacaagga cgacgacgac aagtgactcg ag 1052
<210> 93
<211> 1031
<212> DNA
<213> Ulmus americana
<400> 93
ggcgcgccca gctgcccgac tggagcatgc tgctggccgc gatcaccacc ctgttcctgg 60
cggccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac atgctggtgg 120
accccttcgg cctgggccgc ttcgtgcagg acggcctggt gttccgcaac aacttcagca 180
tccgcagcta cgagatcggc gcggaccgca ccgccagcat cgagaccctg atgaaccacc 240
tgcaggagac cgccctgaac cacgtgaaga gcgtgggcct gctggaggac ggcctgggca 300
gcacccgcga gatgagcctg cgcaacctga tctgggtggt gaccaagatg caggtggcgg 360
tggaccgcta ccccacctgg ggcgacgagg tgcaggtgag cagctgggcg accgccatcg 420
gcaagaacgg catgcgccgc gagtggatcg tgaccgactt ccgcaccggc gagaccctgc 480
tgcgcgccac cagcgtgtgg gtgatgatga acaagctgac ccgccgcatc agcaagatcc 540
ccgaggaggt gtggcacgag atcggcccca gcttcatcga cgcgcccccc ctgcccaccg 600
tggaggacga cggccgcaag ctgacccgct tcgacgagag cagcgccgac ttcatccgca 660
agggcctgac cccccgctgg agcgacctgg acatcaacca gcacgtgaac aacgtgaagt 720
acatcggctg gctgctggag agcgcgcccc ccgagatcca cgagagccac gagatcgcca 780
gcctgaccct ggagtaccgc cgcgagtgcg gccgcgacag cgtgctgaac agcgccacca 840
aggtgagcga cagcagccag ctgggcaaga gcgccgtgga gtgcaaccac ctggtgcgcc 900
tgcagaacgg cggcgagatc gtgaagggcc gcaccgtgtg gcgccccaag cgccccctgt 960
acaacgacgg cgccgtggtg gacgtgcccg ccaagaccag cgatgacgat gacaagctgg 1020
gatgactcga g 1031
<210> 94
<211> 1182
<212> DNA
<213> Cuphea hookeriana
<400> 94
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
cagctgcccg actggagccg cctgctgacc gccatcacca ccgtgttcgt gaagtccaag 180
cgccccgaca tgcacgaccg caagtccaag cgccccgaca tgctggtgga cagcttcggc 240
ctggagtcca ccgtgcagga cggcctggtg ttccgccagt ccttctccat ccgctcctac 300
gagatcggca ccgaccgcac cgccagcatc gagaccctga tgaaccacct gcaggagacc 360
tccctgaacc actgcaagag caccggcatc ctgctggacg gcttcggccg caccctggag 420
atgtgcaagc gcgacctgat ctgggtggtg attaagatgc agatcaaggt gaaccgctac 480
cccgcctggg gcgacaccgt ggagatcaac acccgcttca gccgcctggg caagatcggc 540
atgggccgcg actggctgat ctccgactgc aacaccggcg agatcctggt gcgcgccacc 600
agcgcctacg ccatgatgaa ccagaagacc cgccgcctgt ccaagctgcc ctacgaggtg 660
caccaggaga tcgtgcccct gttcgtggac agccccgtga tcgaggactc cgacctgaag 720
gtgcacaagt tcaaggtgaa gaccggcgac agcatccaga agggcctgac ccccggctgg 780
aacgacctgg acgtgaacca gcacgtgtcc aacgtgaagt acatcggctg gatcctggag 840
agcatgccca ccgaggtgct ggagacccag gagctgtgct ccctggccct ggagtaccgc 900
cgcgagtgcg gccgcgactc cgtgctggag agcgtgaccg ccatggaccc cagcaaggtg 960
ggcgtgcgct cccagtacca gcacctgctg cgcctggagg acggcaccgc catcgtgaac 1020
ggcgccaccg agtggcgccc caagaacgcc ggcgccaacg gcgccatctc caccggcaag 1080
accagcaacg gcaactccgt gtccatggac tacaaggacc acgacggcga ctacaaggac 1140
cacgacatcg actacaagga cgacgacgac aagtgactcg ag 1182
<210> 95
<211> 20
<212> DNA
<213> Umbellularia californica
<400> 95
ctgggcgacg gcttcggcac 20
<210> 96
<211> 20
<212> DNA
<213> Umbellularia californica
<400> 96
aagtcgcggc gcatgccgtt 20
<210> 97
<211> 20
<212> DNA
<213> Ulmus americana
<400> 97
cccagctgct cacctgcacc 20
<210> 98
<211> 26
<212> DNA
<213> Ulmus americana
<400> 98
cacccaaggc caacggcagc gccgtg 26
<210> 99
<211> 20
<212> DNA
<213> Cuphea hookeriana
<400> 99
taccccgcct ggggcgacac 20
<210> 100
<211> 20
<212> DNA
<213> Cuphea hookeriana
<400> 100
agcttggaca ggcggcgggt 20
<210> 101
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 101
tcacttcatg ccggcggtcc 20
<210> 102
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 102
gcgctcctgc ttggctcgaa 20
<210> 103
<211> 733
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 103
gctcttcgag acgtggtctg aatcctccag gcgggtttcc ccgagaaaga aagggtgccg 60
atttcaaagc agagccatgt gccgggccct gtggcctgtg ttggcgccta tgtagtcacc 120
ccccctcacc caattgtcgc cagtttgcgc aatccataaa ctcaaaactg cagcttctga 180
gctgcgctgt tcaagaacac ctctggggtt tgctcacccg cgaggtcgac gcccagcatg 240
gctatcaaga cgaacaggca gcctgtggag aagcctccgt tcacgatcgg gacgctgcgc 300
aaggccatcc ccgcgcactg tttcgagcgc tcggcgcttc gtagcagcat gtacctggcc 360
tttgacatcg cggtcatgtc cctgctctac gtcgcgtcga cgtacatcga ccctgcgccg 420
gtgcctacgt gggtcaagta tggcgtcatg tggccgctct actggttctt ccaggtgtgt 480
gtgagggttg tggttgcccg tatcgaggtc ctggtggcgc gcatggggga gaaggcgcct 540
gtcccgctga cccccccggc taccctcccg gcaccttcca gggcgccttc ggcacgggtg 600
tctgggtgtg cgcgcacgag tgcggccacc aggccttttc ctccagccag gccatcaacg 660
acggcgtggg cctggtgttc cacagcctgc tgctggtgcc ctactactcc tggaagcact 720
cgcaccgggt acc 733
<210> 104
<211> 739
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 104
ccgccaccac tccaacacgg ggtgcctgga caaggacgag gtgtttgtgc cgccgcaccg 60
cgcagtggcg cacgagggcc tggagtggga ggagtggctg cccatccgca tgggcaaggt 120
gctggtcacc ctgaccctgg gctggccgct gtacctcatg ttcaacgtcg cctcgcggcc 180
gtacccgcgc ttcgccaacc actttgaccc gtggtcgccc atcttcagca agcgcgagcg 240
catcgaggtg gtcatctccg acctggcgct ggtggcggtg ctcagcgggc tcagcgtgct 300
gggccgcacc atgggctggg cctggctggt caagacctac gtggtgccct acctgatcgt 360
gaacatgtgg ctcgtgctca tcacgctgct ccagcacacg cacccggcgc tgccgcacta 420
cttcgagaag gactgggact ggctgcgcgg cgccatggcc accgtggacc gctccatggg 480
cccgcccttc atggacaaca tcctgcacca catctccgac acccacgtgc tgcaccacct 540
cttcagcacc atcccgcact accacgccga ggaggcctcc gccgccatca ggcccatcct 600
gggcaagtac taccagtccg acagccgctg ggtcggccgc gccctgtggg aggactggcg 660
cgactgccgc tacgtcgtcc cggacgcgcc cgaggacgac tccgcgctct ggttccacaa 720
gtgagtgagt gagaagagc 739
<210> 105
<211> 2327
<212> DNA
<213> Saccharomyces cerevisiae
<400> 105
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa acggcgcgcc atgctgctgc aggccttcct gttcctgctg gccggcttcg 360
ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 420
cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 480
agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 540
ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 600
cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 660
ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 720
acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 780
ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 840
tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 900
agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 960
acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 1020
aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 1080
gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 1140
acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 1200
acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 1260
ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 1320
tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 1380
tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 1440
aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 1500
tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 1560
ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 1620
cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 1680
tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 1740
acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 1800
tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 1860
cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 1920
aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 1980
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2040
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2100
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2160
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2220
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2280
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatgga 2327
<210> 106
<211> 735
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 106
gctcttcgag gggctggtct gaatccttca ggcgggtgtt acccgagaaa gaaagggtgc 60
cgatttcaaa gcagacccat gtgccgggcc ctgtggcctg tgttggcgcc tatgtagtca 120
ccccccctca cccaattgtc gccagtttgc gcactccata aactcaaaac agcagcttct 180
gagctgcgct gttcaagaac acctctgggg tttgctcacc cgcgaggtcg acgcccagca 240
tggctatcaa gacgaacagg cagcctgtgg agaagcctcc gttcacgatc gggacgctgc 300
gcaaggccat ccccgcgcac tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg 360
cctttgacat cgcggtcatg tccctgctct acgtcgcgtc gacgtacatc gaccctgcac 420
cggtgcctac gtgggtcaag tacggcatca tgtggccgct ctactggttc ttccaggtgt 480
gtttgagggt tttggttgcc cgtattgagg tcctggtggc gcgcatggag gagaaggcgc 540
ctgtcccgct gacccccccg gctaccctcc cggcaccttc cagggcgcct tcggcacggg 600
tgtctgggtg tgcgcgcacg agtgcggcca ccaggccttt tcctccagcc aggccatcaa 660
cgacggcgtg ggcctggtgt tccacagcct gctgctggtg ccctactact cctggaagca 720
ctcgcaccgg gtacc 735
<210> 107
<211> 739
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 107
ccgccaccac tccaacacgg ggtgcctgga caaggacgag gtgtttgtgc cgccgcaccg 60
cgcagtggcg cacgagggcc tggagtggga ggagtggctg cccatccgca tgggcaaggt 120
gctggtcacc ctgaccctgg gctggccgct gtacctcatg ttcaacgtcg cctcgcggcc 180
gtacccgcgc ttcgccaacc actttgaccc gtggtcgccc atcttcagca agcgcgagcg 240
catcgaggtg gtcatctccg acctggcgct ggtggcggtg ctcagcgggc tcagcgtgct 300
gggccgcacc atgggctggg cctggctggt caagacctac gtggtgccct acctgatcgt 360
gaacatgtgg ctcgtgctca tcacgctgct ccagcacacg cacccggcgc tgccgcacta 420
cttcgagaag gactgggact ggctgcgcgg cgccatggcc accgtggacc gctccatggg 480
cccgcccttc atggacaaca tcctgcacca catctccgac acccacgtgc tgcaccacct 540
cttcagcacc atcccgcact accacgccga ggaggcctcc gccgccatca ggcccatcct 600
gggcaagtac taccagtccg acagccgctg ggtcggccgc gccctgtggg aggactggcg 660
cgactgccgc tacgtcgtcc cggacgcgcc cgaggacgac tccgcgctct ggttccacaa 720
gtgagtgagt gagaagagc 739
<210> 108
<211> 471
<212> PRT
<213> Saccharomyces carlbergensis
<400> 108
Met Phe Ala Phe Tyr Phe Leu Thr Ala Cys Ile Ser Leu Lys Gly Val
1 5 10 15
Phe Gly Val Ser Pro Ser Tyr Asn Gly Leu Gly Leu Thr Pro Gln Met
20 25 30
Gly Trp Asp Asn Trp Asn Thr Phe Ala Cys Asp Val Ser Glu Gln Leu
35 40 45
Leu Leu Asp Thr Ala Asp Arg Ile Ser Asp Leu Gly Leu Lys Asp Met
50 55 60
Gly Tyr Lys Tyr Ile Ile Leu Asp Asp Cys Trp Ser Ser Gly Arg Asp
65 70 75 80
Ser Asp Gly Phe Leu Val Ala Asp Glu Gln Lys Phe Pro Asn Gly Met
85 90 95
Gly His Val Ala Asp His Leu His Asn Asn Ser Phe Leu Phe Gly Met
100 105 110
Tyr Ser Ser Ala Gly Glu Tyr Thr Cys Ala Gly Tyr Pro Gly Ser Leu
115 120 125
Gly Arg Glu Glu Glu Asp Ala Gln Phe Phe Ala Asn Asn Arg Val Asp
130 135 140
Tyr Leu Lys Tyr Asp Asn Cys Tyr Asn Lys Gly Gln Phe Gly Thr Pro
145 150 155 160
Glu Ile Ser Tyr His Arg Tyr Lys Ala Met Ser Asp Ala Leu Asn Lys
165 170 175
Thr Gly Arg Pro Ile Phe Tyr Ser Leu Cys Asn Trp Gly Gln Asp Leu
180 185 190
Thr Phe Tyr Trp Gly Ser Gly Ile Ala Asn Ser Trp Arg Met Ser Gly
195 200 205
Asp Val Thr Ala Glu Phe Thr Arg Pro Asp Ser Arg Cys Pro Cys Asp
210 215 220
Gly Asp Glu Tyr Asp Cys Lys Tyr Ala Gly Phe His Cys Ser Ile Met
225 230 235 240
Asn Ile Leu Asn Lys Ala Ala Pro Met Gly Gln Asn Ala Gly Val Gly
245 250 255
Gly Trp Asn Asp Leu Asp Asn Leu Glu Val Gly Val Gly Asn Leu Thr
260 265 270
Asp Asp Glu Glu Lys Ala His Phe Ser Met Trp Ala Met Val Lys Ser
275 280 285
Pro Leu Ile Ile Gly Ala Asn Val Asn Asn Leu Lys Ala Ser Ser Tyr
290 295 300
Ser Ile Tyr Ser Gln Ala Ser Val Ile Ala Ile Asn Gln Asp Ser Asn
305 310 315 320
Gly Ile Pro Ala Thr Arg Val Trp Arg Tyr Tyr Val Ser Asp Thr Asp
325 330 335
Glu Tyr Gly Gln Gly Glu Ile Gln Met Trp Ser Gly Pro Leu Asp Asn
340 345 350
Gly Asp Gln Val Val Ala Leu Leu Asn Gly Gly Ser Val Ser Arg Pro
355 360 365
Met Asn Thr Thr Leu Glu Glu Ile Phe Phe Asp Ser Asn Leu Gly Ser
370 375 380
Lys Lys Leu Thr Ser Thr Trp Asp Ile Tyr Asp Leu Trp Ala Asn Arg
385 390 395 400
Val Asp Asn Ser Thr Ala Ser Ala Ile Leu Gly Arg Asn Lys Thr Ala
405 410 415
Thr Gly Ile Leu Tyr Asn Ala Thr Glu Gln Ser Tyr Lys Asp Gly Leu
420 425 430
Ser Lys Asn Asp Thr Arg Leu Phe Gly Gln Lys Ile Gly Ser Leu Ser
435 440 445
Pro Asn Ala Ile Leu Asn Thr Thr Val Pro Ala His Gly Ile Ala Phe
450 455 460
Tyr Arg Leu Arg Pro Ser Ser
465 470
<210> 109
<211> 18
<212> PRT
<213> Saccharomyces carlbergensis
<400> 109
Met Phe Ala Phe Tyr Phe Leu Thr Ala Cys Ile Ser Leu Lys Gly Val
1 5 10 15
Phe Gly
<210> 110
<211> 3183
<212> DNA
<213> Saccharomyces carlbergensis
<400> 110
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatgttc gcgttctact tcctgacggc ctgcatctcc ctgaagggcg tgttcggcgt 900
ctccccctcc tacaacggcc tgggcctgac gccccagatg ggctgggaca actggaacac 960
gttcgcctgc gacgtctccg agcagctgct gctggacacg gccgaccgca tctccgacct 1020
gggcctgaag gacatgggct acaagtacat catcctggac gactgctggt cctccggccg 1080
cgactccgac ggcttcctgg tcgccgacga gcagaagttc cccaacggca tgggccacgt 1140
cgccgaccac ctgcacaaca actccttcct gttcggcatg tactcctccg cgggcgagta 1200
cacgtgcgcc ggctaccccg gctccctggg ccgcgaggag gaggacgccc agttcttcgc 1260
gaacaaccgc gtggactacc tgaagtacga caactgctac aacaagggcc agttcggcac 1320
gcccgagatc tcctaccacc gctacaaggc catgtccgac gccctgaaca agacgggccg 1380
ccccatcttc tactccctgt gcaactgggg ccaggacctg accttctact ggggctccgg 1440
catcgcgaac tcctggcgca tgtccggcga cgtcacggcg gagttcacgc gccccgactc 1500
ccgctgcccc tgcgacggcg acgagtacga ctgcaagtac gccggcttcc actgctccat 1560
catgaacatc ctgaacaagg ccgcccccat gggccagaac gcgggcgtcg gcggctggaa 1620
cgacctggac aacctggagg tcggcgtcgg caacctgacg gacgacgagg agaaggcgca 1680
cttctccatg tgggccatgg tgaagtcccc cctgatcatc ggcgcgaacg tgaacaacct 1740
gaaggcctcc tcctactcca tctactccca ggcgtccgtc atcgccatca accaggactc 1800
caacggcatc cccgccacgc gcgtctggcg ctactacgtg tccgacacgg acgagtacgg 1860
ccagggcgag atccagatgt ggtccggccc cctggacaac ggcgaccagg tcgtggcgct 1920
gctgaacggc ggctccgtgt cccgccccat gaacacgacc ctggaggaga tcttcttcga 1980
ctccaacctg ggctccaaga agctgacctc cacctgggac atctacgacc tgtgggcgaa 2040
ccgcgtcgac aactccacgg cgtccgccat cctgggccgc aacaagaccg ccaccggcat 2100
cctgtacaac gccaccgagc agtcctacaa ggacggcctg tccaagaacg acacccgcct 2160
gttcggccag aagatcggct ccctgtcccc caacgcgatc ctgaacacga ccgtccccgc 2220
ccacggcatc gcgttctacc gcctgcgccc ctcctcctga caattgaagc agcagcagct 2280
cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2340
ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2400
tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2460
gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2520
tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2580
gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2640
gggaagtagt gggatgggaa cacaaatgga aagcttgagc tcagaatagt atcgggtgat 2700
gcgaagtcag aaccaggcag ggcctgtcgc ctgaggtggc aacgatggga agcaatcaat 2760
ctgggtacag tcgtccgcac gatcccgtga tctcccccac cgacacctat ccccgcccat 2820
cccggcccac cctttcagtc ccctcagcat gcattgtgca ccgcgacaaa gcatgtctgc 2880
tcgtgcactg gttcaggcca cggcgcaccg agtcctcgcc cttcgcagag tgatcaccct 2940
ccccggaacc agccacgctc gctgctgcgg gccgatcagc cgcgcgcact ccctgcaact 3000
agggacaact caggcaacca cgcgcctcac aagcatggcc gccgtggcat ccaacccgct 3060
cgtgacggtg ggtgcgcaag tgccaggggc ctcgtcgtca cggcgtgcat cctcgaggga 3120
tgcgatccgg caactatatg tcgtttatct ccccaccaat cacaggatga gcccctgtct 3180
aga 3183
<210> 111
<211> 1416
<212> DNA
<213> Saccharomyces carlbergensis
<400> 111
atgttcgcgt tctacttcct gacggcctgc atctccctga agggcgtgtt cggcgtctcc 60
ccctcctaca acggcctggg cctgacgccc cagatgggct gggacaactg gaacacgttc 120
gcctgcgacg tctccgagca gctgctgctg gacacggccg accgcatctc cgacctgggc 180
ctgaaggaca tgggctacaa gtacatcatc ctggacgact gctggtcctc cggccgcgac 240
tccgacggct tcctggtcgc cgacgagcag aagttcccca acggcatggg ccacgtcgcc 300
gaccacctgc acaacaactc cttcctgttc ggcatgtact cctccgcggg cgagtacacg 360
tgcgccggct accccggctc cctgggccgc gaggaggagg acgcccagtt cttcgcgaac 420
aaccgcgtgg actacctgaa gtacgacaac tgctacaaca agggccagtt cggcacgccc 480
gagatctcct accaccgcta caaggccatg tccgacgccc tgaacaagac gggccgcccc 540
atcttctact ccctgtgcaa ctggggccag gacctgacct tctactgggg ctccggcatc 600
gcgaactcct ggcgcatgtc cggcgacgtc acggcggagt tcacgcgccc cgactcccgc 660
tgcccctgcg acggcgacga gtacgactgc aagtacgccg gcttccactg ctccatcatg 720
aacatcctga acaaggccgc ccccatgggc cagaacgcgg gcgtcggcgg ctggaacgac 780
ctggacaacc tggaggtcgg cgtcggcaac ctgacggacg acgaggagaa ggcgcacttc 840
tccatgtggg ccatggtgaa gtcccccctg atcatcggcg cgaacgtgaa caacctgaag 900
gcctcctcct actccatcta ctcccaggcg tccgtcatcg ccatcaacca ggactccaac 960
ggcatccccg ccacgcgcgt ctggcgctac tacgtgtccg acacggacga gtacggccag 1020
ggcgagatcc agatgtggtc cggccccctg gacaacggcg accaggtcgt ggcgctgctg 1080
aacggcggct ccgtgtcccg ccccatgaac acgaccctgg aggagatctt cttcgactcc 1140
aacctgggct ccaagaagct gacctccacc tgggacatct acgacctgtg ggcgaaccgc 1200
gtcgacaact ccacggcgtc cgccatcctg ggccgcaaca agaccgccac cggcatcctg 1260
tacaacgcca ccgagcagtc ctacaaggac ggcctgtcca agaacgacac ccgcctgttc 1320
ggccagaaga tcggctccct gtcccccaac gcgatcctga acacgaccgt ccccgcccac 1380
ggcatcgcgt tctaccgcct gcgcccctcc tcctga 1416
<210> 112
<211> 526
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 112
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattc 526
<210> 113
<211> 507
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 113
gagctcagaa tagtatcggg tgatgcgaag tcagaaccag gcagggcctg tcgcctgagg 60
tggcaacgat gggaagcaat caatctgggt acagtcgtcc gcacgatccc gtgatctccc 120
ccaccgacac ctatccccgc ccatcccggc ccaccctttc agtcccctca gcatgcattg 180
tgcaccgcga caaagcatgt ctgctcgtgc actggttcag gccacggcgc accgagtcct 240
cgcccttcgc agagtgatca ccctccccgg aaccagccac gctcgctgct gcgggccgat 300
cagccgcgcg cactccctgc aactagggac aactcaggca accacgcgcc tcacaagcat 360
ggccgccgtg gcatccaacc cgctcgtgac ggtgggtgcg caagtgccag gggcctcgtc 420
gtcacggcgt gcatcctcga gggatgcgat ccggcaacta tatgtcgttt atctccccac 480
caatcacagg atgagcccct gtctaga 507
<210> 114
<211> 312
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 114
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa ac 312
<210> 115
<211> 408
<212> DNA
<213> Chlorella vulgaris
<400> 115
gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 60
ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 120
tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 180
ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 240
tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 300
gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 360
atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 408
<210> 116
<211> 747
<212> PRT
<213> Aspergillus niger
<400> 116
Met Ile Gly Ser Ser His Ala Val Val Ala Leu Gly Leu Phe Thr Leu
1 5 10 15
Tyr Gly His Ser Ala Ala Ala Pro Ala Ile Gly Ala Ser Asn Ser Gln
20 25 30
Thr Ile Val Thr Asn Gly Thr Ser Phe Ala Leu Asn Gly Asp Asn Val
35 40 45
Ser Tyr Arg Phe His Val Asn Ser Ser Thr Gly Asp Leu Ile Ser Asp
50 55 60
His Phe Gly Gly Val Val Ser Gly Thr Ile Pro Ser Pro Val Glu Pro
65 70 75 80
Ala Val Asn Gly Trp Val Gly Met Pro Gly Arg Ile Arg Arg Glu Phe
85 90 95
Pro Asp Gln Gly Arg Gly Asp Phe Arg Ile Pro Ala Val Arg Ile Arg
100 105 110
Glu Ser Ala Gly Tyr Thr Val Ser Asp Leu Gln Tyr Val Ser His Glu
115 120 125
Val Ile Glu Gly Lys Tyr Ala Leu Pro Gly Leu Pro Ala Thr Phe Gly
130 135 140
Asp Ala Gln Asp Ala Thr Thr Leu Val Val His Leu Tyr Asp Asn Tyr
145 150 155 160
Ser Ser Val Ala Ala Asp Leu Ser Tyr Ser Ile Phe Pro Lys Tyr Asp
165 170 175
Ala Ile Val Arg Ser Val Asn Val Thr Asn Gln Gly Pro Gly Asn Ile
180 185 190
Thr Ile Glu Ala Leu Ala Ser Ile Ser Ile Asp Phe Pro Tyr Glu Asp
195 200 205
Leu Asp Met Val Ser Leu Arg Gly Asp Trp Ala Arg Glu Ala Asn Val
210 215 220
Gln Arg Ser Lys Val Gln Tyr Gly Val Gln Gly Phe Gly Ser Ser Thr
225 230 235 240
Gly Tyr Ser Ser His Leu His Asn Pro Phe Leu Ala Ile Val Asp Pro
245 250 255
Ala Thr Thr Glu Ser Gln Gly Glu Ala Trp Gly Phe Asn Leu Val Tyr
260 265 270
Thr Gly Ser Phe Ser Ala Gln Val Glu Lys Gly Ser Gln Gly Phe Thr
275 280 285
Arg Ala Leu Leu Gly Phe Asn Pro Asp Gln Leu Ser Trp Asn Leu Gly
290 295 300
Pro Gly Glu Thr Leu Thr Ser Pro Glu Cys Val Ala Val Tyr Ser Asp
305 310 315 320
Lys Gly Leu Gly Ser Val Ser Arg Lys Phe His Arg Leu Tyr Arg Asn
325 330 335
His Leu Met Lys Ser Lys Phe Ala Thr Ser Asp Arg Pro Val Leu Leu
340 345 350
Asn Ser Trp Glu Gly Val Tyr Phe Asp Tyr Asn Gln Ser Ser Ile Glu
355 360 365
Thr Leu Ala Glu Glu Ser Ala Ala Leu Gly Val His Leu Phe Val Met
370 375 380
Asp Asp Gly Trp Phe Gly Asp Lys Tyr Pro Arg Val Ser Asp Asn Ala
385 390 395 400
Gly Leu Gly Asp Trp Met Pro Asn Pro Ala Arg Phe Pro Asp Gly Leu
405 410 415
Thr Pro Val Val Gln Asp Ile Thr Asn Leu Thr Val Asn Gly Thr Glu
420 425 430
Ser Thr Lys Leu Arg Phe Gly Ile Trp Val Glu Pro Glu Met Val Asn
435 440 445
Pro Asn Ser Thr Leu Tyr His Glu His Pro Glu Trp Ala Leu His Ala
450 455 460
Gly Pro Tyr Pro Arg Thr Glu Arg Arg Asn Gln Leu Val Leu Asn Leu
465 470 475 480
Ala Leu Pro Ala Val Gln Asp Phe Ile Ile Asp Phe Met Thr Asn Leu
485 490 495
Leu Gln Asp Thr Gly Ile Ser Tyr Val Lys Trp Asp Asn Asn Arg Gly
500 505 510
Ile His Glu Thr Pro Ser Pro Ser Thr Asp His Gln Tyr Met Leu Gly
515 520 525
Leu Tyr Arg Val Phe Asp Thr Leu Thr Thr Arg Phe Pro Asp Val Leu
530 535 540
Trp Glu Gly Cys Ala Ser Gly Gly Gly Arg Phe Asp Ala Gly Met Leu
545 550 555 560
Gln Tyr Val Pro Gln Ile Trp Thr Ser Asp Asn Thr Asp Ala Ile Asp
565 570 575
Arg Ile Thr Ile Gln Phe Gly Thr Ser Leu Ala Tyr Pro Pro Ser Ala
580 585 590
Met Gly Ala His Leu Ser Ala Val Pro Asn Ala Gln Thr Gly Arg Thr
595 600 605
Val Pro Phe Thr Phe Arg Ala His Val Ala Met Met Gly Gly Ser Phe
610 615 620
Gly Leu Glu Leu Asp Pro Ala Thr Val Glu Gly Asp Glu Ile Val Pro
625 630 635 640
Glu Leu Leu Ala Leu Ala Glu Lys Val Asn Pro Ile Ile Leu Asn Gly
645 650 655
Asp Leu Tyr Arg Leu Arg Leu Pro Gln Asp Ser Gln Trp Pro Ala Ala
660 665 670
Leu Phe Val Ser Gln Asp Gly Ala Gln Ala Val Leu Phe Tyr Phe Gln
675 680 685
Val Gln Pro Asn Val Asn His Ala Val Pro Trp Val Arg Leu Gln Gly
690 695 700
Leu Asp Pro Lys Ala Asp Tyr Thr Val Asp Gly Asp Gln Thr Tyr Ser
705 710 715 720
Gly Ala Thr Leu Met Asn Leu Gly Leu Gln Tyr Ser Phe Asp Thr Glu
725 730 735
Tyr Gly Ser Lys Val Val Phe Leu Glu Arg Gln
740 745
<210> 117
<211> 28
<212> PRT
<213> Aspergillus niger
<400> 117
Met Ile Gly Ser Ser His Ala Val Val Ala Leu Gly Leu Phe Thr Leu
1 5 10 15
Tyr Gly His Ser Ala Ala Ala Pro Ala Ile Gly Ala
20 25
<210> 118
<211> 2244
<212> DNA
<213> Aspergillus niger
<400> 118
atgatcggct cctcccacgc ggtcgtcgcc ctgggcctgt tcaccctgta cggccactcc 60
gccgccgcgc ccgccatcgg cgcctccaac tcccagacca tcgtcacgaa cggcacctcc 120
ttcgccctga acggcgacaa cgtgtcctac cgcttccacg tgaactcctc cacgggcgac 180
ctgatctccg accacttcgg cggcgtggtg tccggcacca tcccctcccc cgtggagccc 240
gcggtcaacg gctgggtggg catgcccggc cgcatccgcc gcgagttccc cgaccagggc 300
cgcggcgact tccgcatccc cgcggtgcgc atccgcgagt ccgccggcta caccgtctcc 360
gacctgcagt acgtgtccca cgaggtgatc gagggcaagt acgcgctgcc cggcctgccc 420
gccacgttcg gcgacgccca ggacgccacc accctggtgg tgcacctgta cgacaactac 480
tcctccgtcg cggccgacct gtcctactcc atcttcccca agtacgacgc gatcgtccgc 540
tccgtgaacg tgaccaacca gggccccggc aacatcacca tcgaggcgct ggcctccatc 600
tccatcgact tcccctacga ggacctggac atggtgtccc tgcgcggcga ctgggcccgc 660
gaggcgaacg tgcagcgctc caaggtccag tacggcgtgc agggcttcgg ctcctccacc 720
ggctactcct cccacctgca caaccccttc ctggcgatcg tcgaccccgc gaccaccgag 780
tcccagggcg aggcctgggg cttcaacctg gtctacaccg gctccttctc cgcccaggtc 840
gagaagggct cccagggctt cacgcgcgcc ctgctgggct tcaaccccga ccagctgtcc 900
tggaacctgg gccccggcga gacgctgacg tcccccgagt gcgtcgccgt ctactccgac 960
aagggcctgg gctccgtctc ccgcaagttc caccgcctgt accgcaacca cctgatgaag 1020
tccaagttcg ccacgtccga ccgccccgtg ctgctgaact cctgggaggg cgtctacttc 1080
gactacaacc agtcctccat cgagacgctg gcggaggagt ccgccgccct gggcgtgcac 1140
ctgttcgtca tggacgacgg ctggttcggc gacaagtacc cccgcgtgtc cgacaacgcc 1200
ggcctgggcg actggatgcc caaccccgcc cgcttccccg acggcctgac gcccgtcgtg 1260
caggacatca ccaacctgac cgtcaacggc accgagtcca ccaagctgcg cttcggcatc 1320
tgggtggagc ccgagatggt gaaccccaac tccaccctgt accacgagca ccccgagtgg 1380
gcgctgcacg cgggccccta cccccgcacc gagcgccgca accagctggt cctgaacctg 1440
gccctgcccg cggtccagga cttcatcatc gacttcatga ccaacctgct gcaggacacc 1500
ggcatctcct acgtcaagtg ggacaacaac cgcggcatcc acgagacgcc ctccccctcc 1560
acggaccacc agtacatgct gggcctgtac cgcgtgttcg acacgctgac cacgcgcttc 1620
cccgacgtcc tgtgggaggg ctgcgcgtcc ggcggcggcc ggttcgacgc cggcatgctg 1680
cagtacgtcc cccagatctg gacgtccgac aacacggacg cgatcgaccg catcaccatc 1740
cagttcggca cctccctggc ctaccccccc tccgccatgg gcgcccacct gtccgcggtg 1800
cccaacgccc agaccggccg cacggtgccc ttcaccttcc gcgcccacgt cgcgatgatg 1860
ggcggctcct tcggcctgga gctggacccc gccaccgtgg agggcgacga gatcgtgccc 1920
gagctgctgg cgctggccga gaaggtgaac cccatcatcc tgaacggcga cctgtaccgc 1980
ctgcgcctgc cccaggactc ccagtggccc gcggccctgt tcgtgtccca ggacggcgcc 2040
caggccgtcc tgttctactt ccaggtgcag cccaacgtca accacgccgt cccctgggtc 2100
cgcctgcagg gcctggaccc caaggccgac tacacggtgg acggcgacca gacgtactcc 2160
ggcgcgaccc tgatgaacct gggcctgcag tactccttcg acaccgagta cggctccaag 2220
gtggtgttcc tggagcgcca gtaa 2244
<210> 119
<211> 4011
<212> DNA
<213> Aspergillus niger
<400> 119
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatgatc ggctcctccc acgcggtcgt cgccctgggc ctgttcaccc tgtacggcca 900
ctccgccgcc gcgcccgcca tcggcgcctc caactcccag accatcgtca cgaacggcac 960
ctccttcgcc ctgaacggcg acaacgtgtc ctaccgcttc cacgtgaact cctccacggg 1020
cgacctgatc tccgaccact tcggcggcgt ggtgtccggc accatcccct cccccgtgga 1080
gcccgcggtc aacggctggg tgggcatgcc cggccgcatc cgccgcgagt tccccgacca 1140
gggccgcggc gacttccgca tccccgcggt gcgcatccgc gagtccgccg gctacaccgt 1200
ctccgacctg cagtacgtgt cccacgaggt gatcgagggc aagtacgcgc tgcccggcct 1260
gcccgccacg ttcggcgacg cccaggacgc caccaccctg gtggtgcacc tgtacgacaa 1320
ctactcctcc gtcgcggccg acctgtccta ctccatcttc cccaagtacg acgcgatcgt 1380
ccgctccgtg aacgtgacca accagggccc cggcaacatc accatcgagg cgctggcctc 1440
catctccatc gacttcccct acgaggacct ggacatggtg tccctgcgcg gcgactgggc 1500
ccgcgaggcg aacgtgcagc gctccaaggt ccagtacggc gtgcagggct tcggctcctc 1560
caccggctac tcctcccacc tgcacaaccc cttcctggcg atcgtcgacc ccgcgaccac 1620
cgagtcccag ggcgaggcct ggggcttcaa cctggtctac accggctcct tctccgccca 1680
ggtcgagaag ggctcccagg gcttcacgcg cgccctgctg ggcttcaacc ccgaccagct 1740
gtcctggaac ctgggccccg gcgagacgct gacgtccccc gagtgcgtcg ccgtctactc 1800
cgacaagggc ctgggctccg tctcccgcaa gttccaccgc ctgtaccgca accacctgat 1860
gaagtccaag ttcgccacgt ccgaccgccc cgtgctgctg aactcctggg agggcgtcta 1920
cttcgactac aaccagtcct ccatcgagac gctggcggag gagtccgccg ccctgggcgt 1980
gcacctgttc gtcatggacg acggctggtt cggcgacaag tacccccgcg tgtccgacaa 2040
cgccggcctg ggcgactgga tgcccaaccc cgcccgcttc cccgacggcc tgacgcccgt 2100
cgtgcaggac atcaccaacc tgaccgtcaa cggcaccgag tccaccaagc tgcgcttcgg 2160
catctgggtg gagcccgaga tggtgaaccc caactccacc ctgtaccacg agcaccccga 2220
gtgggcgctg cacgcgggcc cctacccccg caccgagcgc cgcaaccagc tggtcctgaa 2280
cctggccctg cccgcggtcc aggacttcat catcgacttc atgaccaacc tgctgcagga 2340
caccggcatc tcctacgtca agtgggacaa caaccgcggc atccacgaga cgccctcccc 2400
ctccacggac caccagtaca tgctgggcct gtaccgcgtg ttcgacacgc tgaccacgcg 2460
cttccccgac gtcctgtggg agggctgcgc gtccggcggc ggccggttcg acgccggcat 2520
gctgcagtac gtcccccaga tctggacgtc cgacaacacg gacgcgatcg accgcatcac 2580
catccagttc ggcacctccc tggcctaccc cccctccgcc atgggcgccc acctgtccgc 2640
ggtgcccaac gcccagaccg gccgcacggt gcccttcacc ttccgcgccc acgtcgcgat 2700
gatgggcggc tccttcggcc tggagctgga ccccgccacc gtggagggcg acgagatcgt 2760
gcccgagctg ctggcgctgg ccgagaaggt gaaccccatc atcctgaacg gcgacctgta 2820
ccgcctgcgc ctgccccagg actcccagtg gcccgcggcc ctgttcgtgt cccaggacgg 2880
cgcccaggcc gtcctgttct acttccaggt gcagcccaac gtcaaccacg ccgtcccctg 2940
ggtccgcctg cagggcctgg accccaaggc cgactacacg gtggacggcg accagacgta 3000
ctccggcgcg accctgatga acctgggcct gcagtactcc ttcgacaccg agtacggctc 3060
caaggtggtg ttcctggagc gccagtaaca attgaagcag cagcagctcg gatagtatcg 3120
acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct 3180
gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg 3240
cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc 3300
ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca 3360
gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta 3420
ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg 3480
gatgggaaca caaatggaaa gcttgagctc agaatagtat cgggtgatgc gaagtcagaa 3540
ccaggcaggg cctgtcgcct gaggtggcaa cgatgggaag caatcaatct gggtacagtc 3600
gtccgcacga tcccgtgatc tcccccaccg acacctatcc ccgcccatcc cggcccaccc 3660
tttcagtccc ctcagcatgc attgtgcacc gcgacaaagc atgtctgctc gtgcactggt 3720
tcaggccacg gcgcaccgag tcctcgccct tcgcagagtg atcaccctcc ccggaaccag 3780
ccacgctcgc tgctgcgggc cgatcagccg cgcgcactcc ctgcaactag ggacaactca 3840
ggcaaccacg cgcctcacaa gcatggccgc cgtggcatcc aacccgctcg tgacggtggg 3900
tgcgcaagtg ccaggggcct cgtcgtcacg gcgtgcatcc tcgagggatg cgatccggca 3960
actatatgtc gtttatctcc ccaccaatca caggatgagc ccctgtctag a 4011
<210> 120
<211> 411
<212> PRT
<213> Cyamopsis tetragonoloba
<400> 120
Met Ala Thr His Tyr Ser Ile Ile Gly Gly Met Ile Ile Val Val Leu
1 5 10 15
Leu Met Ile Ile Gly Ser Glu Gly Gly Arg Leu Leu Glu Lys Lys Asn
20 25 30
Arg Thr Ser Ala Glu Ala Glu His Tyr Asn Val Arg Arg Tyr Leu Ala
35 40 45
Glu Asn Gly Leu Gly Gln Thr Pro Pro Met Gly Trp Asn Ser Trp Asn
50 55 60
His Phe Gly Cys Asp Ile Asn Glu Asn Val Val Arg Glu Thr Ala Asp
65 70 75 80
Ala Met Val Ser Thr Gly Leu Ala Ala Leu Gly Tyr Gln Tyr Ile Asn
85 90 95
Leu Asp Asp Cys Trp Ala Glu Leu Asn Arg Asp Ser Glu Gly Asn Met
100 105 110
Val Pro Asn Ala Ala Ala Phe Pro Ser Gly Ile Lys Ala Leu Ala Asp
115 120 125
Tyr Val His Ser Lys Gly Leu Lys Leu Gly Val Tyr Ser Asp Ala Gly
130 135 140
Asn Gln Thr Cys Ser Lys Arg Met Pro Gly Ser Leu Gly His Glu Glu
145 150 155 160
Gln Asp Ala Lys Thr Phe Ala Ser Trp Gly Val Asp Tyr Leu Lys Tyr
165 170 175
Asp Asn Cys Glu Asn Leu Gly Ile Ser Val Lys Glu Arg Tyr Pro Pro
180 185 190
Met Gly Lys Ala Leu Leu Ser Ser Gly Arg Pro Ile Phe Phe Ser Met
195 200 205
Cys Glu Trp Gly Trp Glu Asp Pro Gln Ile Trp Ala Lys Ser Ile Gly
210 215 220
Asn Ser Trp Arg Thr Thr Gly Asp Ile Glu Asp Asn Trp Asn Ser Met
225 230 235 240
Thr Ser Ile Ala Asp Ser Asn Asp Lys Trp Ala Ser Tyr Ala Gly Pro
245 250 255
Gly Gly Trp Asn Asp Pro Asp Met Leu Glu Val Gly Asn Gly Gly Met
260 265 270
Thr Thr Glu Glu Tyr Arg Ser His Phe Ser Ile Trp Ala Leu Ala Lys
275 280 285
Ala Pro Leu Leu Val Gly Cys Asp Ile Arg Ala Met Asp Asp Thr Thr
290 295 300
His Glu Leu Ile Ser Asn Ala Glu Val Ile Ala Val Asn Gln Asp Lys
305 310 315 320
Leu Gly Val Gln Gly Lys Lys Val Lys Ser Thr Asn Asp Leu Glu Val
325 330 335
Trp Ala Gly Pro Leu Ser Asp Asn Lys Val Ala Val Ile Leu Trp Asn
340 345 350
Arg Ser Ser Ser Arg Ala Thr Val Thr Ala Ser Trp Ser Asp Ile Gly
355 360 365
Leu Gln Gln Gly Thr Thr Val Asp Ala Arg Asp Leu Trp Glu His Ser
370 375 380
Thr Gln Ser Leu Val Ser Gly Glu Ile Ser Ala Glu Ile Asp Ser His
385 390 395 400
Ala Cys Lys Met Tyr Val Leu Thr Pro Arg Ser
405 410
<210> 121
<211> 1236
<212> DNA
<213> Cyamopsis tetragonoloba
<400> 121
atggccaccc actactccat catcggcggc atgatcatcg tcgtcctgct gatgatcatc 60
ggctccgagg gcggccggct gctggagaag aagaaccgca cctccgccga ggcggagcac 120
tacaacgtgc gccgctacct ggccgagaac ggcctgggcc agaccccccc catgggctgg 180
aactcctgga accacttcgg ctgcgacatc aacgagaacg tcgtccgcga gacggcggac 240
gccatggtgt ccaccggcct ggccgccctg ggctaccagt acatcaacct ggacgactgc 300
tgggcggagc tgaaccgcga ctccgagggc aacatggtgc ccaacgccgc cgcgttcccc 360
tccggcatca aggcgctggc ggactacgtc cactccaagg gcctgaagct gggcgtctac 420
tccgacgcgg gcaaccagac ctgctccaag cgcatgcccg gctccctggg ccacgaggag 480
caggacgcga agacgttcgc ctcctggggc gtcgactacc tgaagtacga caactgcgag 540
aacctgggca tctccgtgaa ggagcgctac ccccccatgg gcaaggcgct gctgtcctcc 600
ggccgcccca tcttcttctc catgtgcgag tggggctggg aggaccccca gatctgggcc 660
aagtccatcg gcaactcctg gcgcaccacc ggcgacatcg aggacaactg gaactccatg 720
acctccatcg ccgactccaa cgacaagtgg gcctcctacg ccggccccgg cggctggaac 780
gaccccgaca tgctggaggt cggcaacggc ggcatgacga cggaggagta ccgctcccac 840
ttctccatct gggccctggc caaggcgccc ctgctggtgg gctgcgacat ccgcgcgatg 900
gacgacacga cgcacgagct gatctccaac gccgaggtga tcgcggtgaa ccaggacaag 960
ctgggcgtgc agggcaagaa ggtcaagtcc acgaacgacc tggaggtctg ggccggcccc 1020
ctgtccgaca acaaggtggc ggtgatcctg tggaaccgct cctcctcccg cgccaccgtc 1080
accgcgtcct ggtccgacat cggcctgcag cagggcacca ccgtcgacgc gcgcgacctg 1140
tgggagcact ccacgcagtc cctggtgtcc ggcgagatct ccgccgagat cgactcccac 1200
gcctgcaaga tgtacgtcct gacgccccgc tcctaa 1236
<210> 122
<211> 3003
<212> DNA
<213> Cyamopsis tetragonoloba
<400> 122
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatggcc acccactact ccatcatcgg cggcatgatc atcgtcgtcc tgctgatgat 900
catcggctcc gagggcggcc ggctgctgga gaagaagaac cgcacctccg ccgaggcgga 960
gcactacaac gtgcgccgct acctggccga gaacggcctg ggccagaccc cccccatggg 1020
ctggaactcc tggaaccact tcggctgcga catcaacgag aacgtcgtcc gcgagacggc 1080
ggacgccatg gtgtccaccg gcctggccgc cctgggctac cagtacatca acctggacga 1140
ctgctgggcg gagctgaacc gcgactccga gggcaacatg gtgcccaacg ccgccgcgtt 1200
cccctccggc atcaaggcgc tggcggacta cgtccactcc aagggcctga agctgggcgt 1260
ctactccgac gcgggcaacc agacctgctc caagcgcatg cccggctccc tgggccacga 1320
ggagcaggac gcgaagacgt tcgcctcctg gggcgtcgac tacctgaagt acgacaactg 1380
cgagaacctg ggcatctccg tgaaggagcg ctaccccccc atgggcaagg cgctgctgtc 1440
ctccggccgc cccatcttct tctccatgtg cgagtggggc tgggaggacc cccagatctg 1500
ggccaagtcc atcggcaact cctggcgcac caccggcgac atcgaggaca actggaactc 1560
catgacctcc atcgccgact ccaacgacaa gtgggcctcc tacgccggcc ccggcggctg 1620
gaacgacccc gacatgctgg aggtcggcaa cggcggcatg acgacggagg agtaccgctc 1680
ccacttctcc atctgggccc tggccaaggc gcccctgctg gtgggctgcg acatccgcgc 1740
gatggacgac acgacgcacg agctgatctc caacgccgag gtgatcgcgg tgaaccagga 1800
caagctgggc gtgcagggca agaaggtcaa gtccacgaac gacctggagg tctgggccgg 1860
ccccctgtcc gacaacaagg tggcggtgat cctgtggaac cgctcctcct cccgcgccac 1920
cgtcaccgcg tcctggtccg acatcggcct gcagcagggc accaccgtcg acgcgcgcga 1980
cctgtgggag cactccacgc agtccctggt gtccggcgag atctccgccg agatcgactc 2040
ccacgcctgc aagatgtacg tcctgacgcc ccgctcctaa caattgaagc agcagcagct 2100
cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2160
ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2220
tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2280
gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2340
tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2400
gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2460
gggaagtagt gggatgggaa cacaaatgga aagcttgagc tcagaatagt atcgggtgat 2520
gcgaagtcag aaccaggcag ggcctgtcgc ctgaggtggc aacgatggga agcaatcaat 2580
ctgggtacag tcgtccgcac gatcccgtga tctcccccac cgacacctat ccccgcccat 2640
cccggcccac cctttcagtc ccctcagcat gcattgtgca ccgcgacaaa gcatgtctgc 2700
tcgtgcactg gttcaggcca cggcgcaccg agtcctcgcc cttcgcagag tgatcaccct 2760
ccccggaacc agccacgctc gctgctgcgg gccgatcagc cgcgcgcact ccctgcaact 2820
agggacaact caggcaacca cgcgcctcac aagcatggcc gccgtggcat ccaacccgct 2880
cgtgacggtg ggtgcgcaag tgccaggggc ctcgtcgtca cggcgtgcat cctcgaggga 2940
tgcgatccgg caactatatg tcgtttatct ccccaccaat cacaggatga gcccctgtct 3000
aga 3003
<210> 123
<211> 22
<212> DNA
<213> Chlorella vulgaris
<400> 123
actgcaatgc tgatgcacgg ga 22
<210> 124
<211> 19
<212> DNA
<213> Chlorella vulgaris
<400> 124
tccaggtcct tttcgcact 19
<210> 125
<211> 632
<212> PRT
<213> Unknown
<220>
<223> Coccomyxa species
<400> 125
Met Thr Thr Asn Leu Ala Lys Leu Pro Leu Gly Gly Leu Ser Ser Arg
1 5 10 15
Ser Ser Ile Ala Gly Ala Pro Leu Arg Val Asn Ser His Ser Arg Glu
20 25 30
Arg His Leu Gly Ala Lys Thr Thr Ala Ile Ala Ala Pro Glu Arg Leu
35 40 45
Asp Tyr Leu Asp Asn Ala Glu Glu Ala Arg Leu Gln Gln Thr Asp Ala
50 55 60
Phe Ala Glu Leu Lys Ala Leu Ser Ser Arg Gln Ser Val Asn Arg Pro
65 70 75 80
Gln Lys Gly Glu Leu Ser Phe Arg Gln Ser Pro Thr Phe Gln Asp Cys
85 90 95
Phe Pro Gly Ser Glu Lys Cys Tyr Arg Glu Val Glu His Asp Gly Lys
100 105 110
Thr Leu Lys Val Pro Phe Arg Arg Val His Leu Gln Asp Asp Asn Gly
115 120 125
His Phe Asp Leu Tyr Asp Thr Ser Gly Pro Gln Gly Val Asn Pro Arg
130 135 140
Glu Gly Leu Pro Lys Ile Arg Ser Ser Trp Val Glu Pro Arg Glu Ala
145 150 155 160
Arg Gly Asp Lys Val Gln Thr Gln Gln Tyr Tyr Ala Lys Gln Gly Ile
165 170 175
Ile Thr Glu Glu Met Ala Phe Cys Ala Ala Arg Glu Arg Met Asp Pro
180 185 190
Glu Phe Ile Arg Ser Glu Val Ala Arg Gly Arg Ala Ile Ile Pro Ala
195 200 205
Asn Lys Arg His Leu Glu Leu Glu Pro Thr Val Val Gly Arg Asn Phe
210 215 220
Leu Val Lys Val Asn Ala Asn Ile Gly Asn Ser Ala Val Ser Ser Ser
225 230 235 240
Ile Glu Glu Glu Val Glu Lys Leu Gln Trp Ser Thr Ile Trp Gly Ala
245 250 255
Asp Thr Ala Met Asp Leu Ser Thr Gly Asn Asn Ile His Glu Thr Arg
260 265 270
Glu Trp Val Met Arg Asn Ser Pro Val Pro Val Gly Thr Val Pro Ile
275 280 285
Tyr Gln Cys Leu Glu Lys Ala Gly Gly Ile Val Glu Asn Ile Thr Trp
290 295 300
Glu Leu Phe Arg Glu Thr Leu Ile Glu Gln Ala Glu Gln Gly Val Asp
305 310 315 320
Tyr Phe Thr Ile His Ala Gly Val Leu Leu Arg Tyr Ile Pro Leu Thr
325 330 335
Ala Asn Arg Val Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala
340 345 350
Lys Leu Cys Leu Leu Asp His Thr Glu Asn Phe Ala Tyr Met His Trp
355 360 365
Asp Glu Ile Leu Asp Ile Cys Ala Gln Tyr Asp Ile Thr Leu Ser Ile
370 375 380
Gly Asp Gly Leu Arg Pro Gly Cys Ile Ala Asp Ala Asn Asp Ala Ala
385 390 395 400
Gln Phe Ala Glu Leu Lys Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp
405 410 415
Ala Lys Asp Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Leu
420 425 430
His Lys Ile Pro Glu Asn Met Glu Lys Gln Leu Asp Trp Cys Ser Glu
435 440 445
Ala Pro Phe Tyr Thr Leu Gly Pro Leu Ala Thr Asp Ile Ala Pro Ala
450 455 460
Tyr Asp His Ile Thr Ser Ala Ile Gly Ala Ala Thr Ile Gly Ala Leu
465 470 475 480
Gly Thr Ala Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu
485 490 495
Pro Asp Arg Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala
500 505 510
Ala His Ala Ala Asp Leu Ala Lys Gly His Pro Tyr Ala Gln Glu Trp
515 520 525
Asp Asn Ala Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Tyr Asp Gln
530 535 540
Phe His Leu Ser Leu Asp Pro Val Thr Ala Arg Leu Phe His Asp Ala
545 550 555 560
Thr Leu Pro Gln Glu Pro Ala Lys Thr Ala His Phe Cys Ser Met Cys
565 570 575
Gly Pro Lys Phe Cys Ser Met Gln Ile Thr Gln Asp Leu Arg Glu Tyr
580 585 590
Ala Lys Asn His Gln Met Glu Glu Asp Glu Ala Ile Gln Thr Gly Met
595 600 605
Ala Glu Met Ser Glu Gln Phe Lys Ser Ile Gly Ala Glu Val Tyr Leu
610 615 620
Asp Glu Ala Val Leu Glu His Ala
625 630
<210> 126
<211> 40
<212> PRT
<213> Unknown
<220>
<223> Coccomyxa species
<400> 126
Met Thr Thr Asn Leu Ala Lys Leu Pro Leu Gly Gly Leu Ser Ser Arg
1 5 10 15
Ser Ser Ile Ala Gly Ala Pro Leu Arg Val Asn Ser His Ser Arg Glu
20 25 30
Arg His Leu Gly Ala Lys Thr Thr
35 40
<210> 127
<211> 6649
<212> DNA
<213> Unknown
<220>
<223> Coccomyxa species
<400> 127
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta tgacacttcc 3300
agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac accgatgatg 3360
cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc tccagggcga 3420
gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct accaaagcca 3480
tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg tgatcgcact 3540
ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca ctagtatgac 3600
caccaacctg gctaagctgc ctctcggcgg cctctcttct cggtcgtcca tcgccggggc 3660
tcctctgcgc gtgaacagcc acagccgcga gcgccacctg ggcgccaaga ccaccgcgat 3720
cgccgctccc gagcggctgg actacctcga caacgcggag gaggcgcggc tgcagcagac 3780
ggacgccttc gccgagctga aggcgctgtc gagccgccag tccgtgaacc ggccccaaaa 3840
gggcgagctg tcgttccggc agtcgccgac ctttcaggac tgcttccctg gctcggagaa 3900
gtgctaccgc gaggtggagc acgatggcaa gacgctcaag gtgccttttc gccgggtgca 3960
cctgcaggac gacaacggcc atttcgacct gtacgacacc tctggccccc agggcgtgaa 4020
cccccgcgag ggtctgccca agatccgctc ctcctgggtg gagccgcgcg aggcgcgggg 4080
cgacaaggtg caaacgcagc agtactacgc caagcaaggc atcatcaccg aggagatggc 4140
cttctgcgct gcgcgcgagc gcatggaccc cgagttcatc cggtctgagg tggcccgggg 4200
tcgggccatc atccctgcga acaagcgcca tctggagctg gagccgaccg tcgtgggccg 4260
caactttctg gtcaaggtga acgccaacat cggcaactct gcggtcagct cgagcatcga 4320
ggaggaggtg gagaagctgc agtggagcac catctggggt gccgacacgg ccatggacct 4380
gagcaccggc aacaacatcc acgagacgcg cgagtgggtg atgcgcaaca gcccggtccc 4440
tgtgggtacg gtccctatct accagtgcct ggagaaggcg ggcggcatcg tggagaacat 4500
cacctgggag ctgttccggg agacgctgat cgagcaggcc gagcagggcg tcgactactt 4560
taccatccac gcgggggtcc tgctccgcta catccccctg acggcgaacc gcgtcaccgg 4620
catcgtcagc cgcggcggct ctatccatgc caagctctgc ctgctggacc acaccgagaa 4680
cttcgcctac atgcactggg acgagatcct ggacatctgc gcccagtacg acatcaccct 4740
gtcgatcggc gacggcctgc gccccggctg catcgcggac gccaacgacg ctgcccagtt 4800
tgctgagctg aagacccagg gcgagctgac ccgccgcgcc tgggcgaagg acgtgcaggt 4860
gatgaacgag ggtcccggcc atgtgccgct gcacaagatc cccgagaaca tggagaagca 4920
gctggactgg tgcagcgagg cgcccttcta cacgctcggc cccctggcga cggacatcgc 4980
gcctgcgtac gaccacatca cctccgcgat cggcgccgcc acgatcggcg cgctggggac 5040
cgcgctgctg tgttacgtga ccccgaagga gcacctgggc ctccccgatc gcgacgacgt 5100
gaaggccggg gtgatcgcct acaagatcgc ggcgcacgcg gctgacctgg cgaagggtca 5160
cccctacgct caggagtggg ataacgccct ctctaaggcg cgcttcgagt tccggtggta 5220
cgaccagttc cacctgtcgc tggaccccgt caccgcccgc ctgttccatg acgcgaccct 5280
gccgcaggag cccgccaaga ccgcccactt ctgctccatg tgcggcccca agttctgctc 5340
catgcagatc acccaggacc tccgcgagta cgccaagaac catcaaatgg aggaggacga 5400
ggcgatccaa accggcatgg ccgagatgtc cgagcagttc aagagcatcg gcgcggaggt 5460
ctacctcgac gaggcggtgc tggagcacgc gtaagcagca gcagctcgga tagtatcgac 5520
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 5580
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 5640
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 5700
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 5760
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 5820
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 5880
tgggaacaca aatggaaagc ttgagctctt gttttccaga aggagttgct ccttgagcct 5940
ttcattctca gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaattta 6000
aaagcttgga atgttggttc gtgcgtctgg aacaagccca gacttgttgc tcactgggaa 6060
aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg tacctctgct ttcgcgcaat 6120
ctgccctgtt gaaatcgcca ccacattcat attgtgacgc ttgagcagtc tgtaattgcc 6180
tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc caggcatgtc gcgggcgagg 6240
acacccgcca ctcgtacagc agaccattat gctacctcac aatagttcat aacagtgacc 6300
atatttctcg aagctcccca acgagcacct ccatgctctg agtggccacc ccccggccct 6360
ggtgcttgcg gagggcaggt caaccggcat ggggctaccg aaatccccga ccggatccca 6420
ccacccccgc gatgggaaga atctctcccc gggatgtggg cccaccacca gcacaacctg 6480
ctggcccagg cgagcgtcaa accataccac acaaatatcc ttggcatcgg ccctgaattc 6540
cttctgccgc tctgctaccc ggtgcttctg tccgaagcag gggttgctag ggatcgctcc 6600
gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag ctgaagagc 6649
<210> 128
<211> 1899
<212> DNA
<213> Unknown
<220>
<223> Coccomyxa species
<400> 128
atgaccacca acctggctaa gctgcctctc ggcggcctct cttctcggtc gtccatcgcc 60
ggggctcctc tgcgcgtgaa cagccacagc cgcgagcgcc acctgggcgc caagaccacc 120
gcgatcgccg ctcccgagcg gctggactac ctcgacaacg cggaggaggc gcggctgcag 180
cagacggacg ccttcgccga gctgaaggcg ctgtcgagcc gccagtccgt gaaccggccc 240
caaaagggcg agctgtcgtt ccggcagtcg ccgacctttc aggactgctt ccctggctcg 300
gagaagtgct accgcgaggt ggagcacgat ggcaagacgc tcaaggtgcc ttttcgccgg 360
gtgcacctgc aggacgacaa cggccatttc gacctgtacg acacctctgg cccccagggc 420
gtgaaccccc gcgagggtct gcccaagatc cgctcctcct gggtggagcc gcgcgaggcg 480
cggggcgaca aggtgcaaac gcagcagtac tacgccaagc aaggcatcat caccgaggag 540
atggccttct gcgctgcgcg cgagcgcatg gaccccgagt tcatccggtc tgaggtggcc 600
cggggtcggg ccatcatccc tgcgaacaag cgccatctgg agctggagcc gaccgtcgtg 660
ggccgcaact ttctggtcaa ggtgaacgcc aacatcggca actctgcggt cagctcgagc 720
atcgaggagg aggtggagaa gctgcagtgg agcaccatct ggggtgccga cacggccatg 780
gacctgagca ccggcaacaa catccacgag acgcgcgagt gggtgatgcg caacagcccg 840
gtccctgtgg gtacggtccc tatctaccag tgcctggaga aggcgggcgg catcgtggag 900
aacatcacct gggagctgtt ccgggagacg ctgatcgagc aggccgagca gggcgtcgac 960
tactttacca tccacgcggg ggtcctgctc cgctacatcc ccctgacggc gaaccgcgtc 1020
accggcatcg tcagccgcgg cggctctatc catgccaagc tctgcctgct ggaccacacc 1080
gagaacttcg cctacatgca ctgggacgag atcctggaca tctgcgccca gtacgacatc 1140
accctgtcga tcggcgacgg cctgcgcccc ggctgcatcg cggacgccaa cgacgctgcc 1200
cagtttgctg agctgaagac ccagggcgag ctgacccgcc gcgcctgggc gaaggacgtg 1260
caggtgatga acgagggtcc cggccatgtg ccgctgcaca agatccccga gaacatggag 1320
aagcagctgg actggtgcag cgaggcgccc ttctacacgc tcggccccct ggcgacggac 1380
atcgcgcctg cgtacgacca catcacctcc gcgatcggcg ccgccacgat cggcgcgctg 1440
gggaccgcgc tgctgtgtta cgtgaccccg aaggagcacc tgggcctccc cgatcgcgac 1500
gacgtgaagg ccggggtgat cgcctacaag atcgcggcgc acgcggctga cctggcgaag 1560
ggtcacccct acgctcagga gtgggataac gccctctcta aggcgcgctt cgagttccgg 1620
tggtacgacc agttccacct gtcgctggac cccgtcaccg cccgcctgtt ccatgacgcg 1680
accctgccgc aggagcccgc caagaccgcc cacttctgct ccatgtgcgg ccccaagttc 1740
tgctccatgc agatcaccca ggacctccgc gagtacgcca agaaccatca aatggaggag 1800
gacgaggcga tccaaaccgg catggccgag atgtccgagc agttcaagag catcggcgcg 1860
gaggtctacc tcgacgaggc ggtgctggag cacgcgtaa 1899
<210> 129
<211> 1613
<212> DNA
<213> Saccharomyces cerevisiae
<400> 129
ggcgcgccat gctgctgcag gccttcctgt tcctgctggc cggcttcgcc gccaagatca 60
gcgcctccat gacgaacgag acgtccgacc gccccctggt gcacttcacc cccaacaagg 120
gctggatgaa cgaccccaac ggcctgtggt acgacgagaa ggacgccaag tggcacctgt 180
acttccagta caacccgaac gacaccgtct gggggacgcc cttgttctgg ggccacgcca 240
cgtccgacga cctgaccaac tgggaggacc agcccatcgc catcgccccg aagcgcaacg 300
actccggcgc cttctccggc tccatggtgg tggactacaa caacacctcc ggcttcttca 360
acgacaccat cgacccgcgc cagcgctgcg tggccatctg gacctacaac accccggagt 420
ccgaggagca gtacatctcc tacagcctgg acggcggcta caccttcacc gagtaccaga 480
agaaccccgt gctggccgcc aactccaccc agttccgcga cccgaaggtc ttctggtacg 540
agccctccca gaagtggatc atgaccgcgg ccaagtccca ggactacaag atcgagatct 600
actcctccga cgacctgaag tcctggaagc tggagtccgc gttcgccaac gagggcttcc 660
tcggctacca gtacgagtgc cccggcctga tcgaggtccc caccgagcag gaccccagca 720
agtcctactg ggtgatgttc atctccatca accccggcgc cccggccggc ggctccttca 780
accagtactt cgtcggcagc ttcaacggca cccacttcga ggccttcgac aaccagtccc 840
gcgtggtgga cttcggcaag gactactacg ccctgcagac cttcttcaac accgacccga 900
cctacgggag cgccctgggc atcgcgtggg cctccaactg ggagtactcc gccttcgtgc 960
ccaccaaccc ctggcgctcc tccatgtccc tcgtgcgcaa gttctccctc aacaccgagt 1020
accaggccaa cccggagacg gagctgatca acctgaaggc cgagccgatc ctgaacatca 1080
gcaacgccgg cccctggagc cggttcgcca ccaacaccac gttgacgaag gccaacagct 1140
acaacgtcga cctgtccaac agcaccggca ccctggagtt cgagctggtg tacgccgtca 1200
acaccaccca gacgatctcc aagtccgtgt tcgcggacct ctccctctgg ttcaagggcc 1260
tggaggaccc cgaggagtac ctccgcatgg gcttcgaggt gtccgcgtcc tccttcttcc 1320
tggaccgcgg gaacagcaag gtgaagttcg tgaaggagaa cccctacttc accaaccgca 1380
tgagcgtgaa caaccagccc ttcaagagcg agaacgacct gtcctactac aaggtgtacg 1440
gcttgctgga ccagaacatc ctggagctgt acttcaacga cggcgacgtc gtgtccacca 1500
acacctactt catgaccacc gggaacgccc tgggctccgt gaacatgacg acgggggtgg 1560
acaacctgtt ctacatcgac aagttccagg tgcgcgaggt caagtgacaa ttg 1613
<210> 130
<211> 3660
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic nucleotide
<400> 130
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatggcc accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg 900
ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccgc 960
gatcgccgct cccgagcggc tggactacct cgacaacgcg gaggaggcgc ggctgcagca 1020
gacggacgcc ttcgccgagc tgaaggcgct gtcgagccgc cagtccgtga accggcccca 1080
aaagggcgag ctgtcgttcc ggcagtcgcc gacctttcag gactgcttcc ctggctcgga 1140
gaagtgctac cgcgaggtgg agcacgatgg caagacgctc aaggtgcctt ttcgccgggt 1200
gcacctgcag gacgacaacg gccatttcga cctgtacgac acctctggcc cccagggcgt 1260
gaacccccgc gagggtctgc ccaagatccg ctcctcctgg gtggagccgc gcgaggcgcg 1320
gggcgacaag gtgcaaacgc agcagtacta cgccaagcaa ggcatcatca ccgaggagat 1380
ggccttctgc gctgcgcgcg agcgcatgga ccccgagttc atccggtctg aggtggcccg 1440
gggtcgggcc atcatccctg cgaacaagcg ccatctggag ctggagccga ccgtcgtggg 1500
ccgcaacttt ctggtcaagg tgaacgccaa catcggcaac tctgcggtca gctcgagcat 1560
cgaggaggag gtggagaagc tgcagtggag caccatctgg ggtgccgaca cggccatgga 1620
cctgagcacc ggcaacaaca tccacgagac gcgcgagtgg gtgatgcgca acagcccggt 1680
ccctgtgggt acggtcccta tctaccagtg cctggagaag gcgggcggca tcgtggagaa 1740
catcacctgg gagctgttcc gggagacgct gatcgagcag gccgagcagg gcgtcgacta 1800
ctttaccatc cacgcggggg tcctgctccg ctacatcccc ctgacggcga accgcgtcac 1860
cggcatcgtc agccgcggcg gctctatcca tgccaagctc tgcctgctgg accacaccga 1920
gaacttcgcc tacatgcact gggacgagat cctggacatc tgcgcccagt acgacatcac 1980
cctgtcgatc ggcgacggcc tgcgccccgg ctgcatcgcg gacgccaacg acgctgccca 2040
gtttgctgag ctgaagaccc agggcgagct gacccgccgc gcctgggcga aggacgtgca 2100
ggtgatgaac gagggtcccg gccatgtgcc gctgcacaag atccccgaga acatggagaa 2160
gcagctggac tggtgcagcg aggcgccctt ctacacgctc ggccccctgg cgacggacat 2220
cgcgcctgcg tacgaccaca tcacctccgc gatcggcgcc gccacgatcg gcgcgctggg 2280
gaccgcgctg ctgtgttacg tgaccccgaa ggagcacctg ggcctccccg atcgcgacga 2340
cgtgaaggcc ggggtgatcg cctacaagat cgcggcgcac gcggctgacc tggcgaaggg 2400
tcacccctac gctcaggagt gggataacgc cctctctaag gcgcgcttcg agttccggtg 2460
gtacgaccag ttccacctgt cgctggaccc cgtcaccgcc cgcctgttcc atgacgcgac 2520
cctgccgcag gagcccgcca agaccgccca cttctgctcc atgtgcggcc ccaagttctg 2580
ctccatgcag atcacccagg acctccgcga gtacgccaag aaccatcaaa tggaggagga 2640
cgaggcgatc caaaccggca tggccgagat gtccgagcag ttcaagagca tcggcgcgga 2700
ggtctacctc gacgaggcgg tgctggagca cgcgtaacaa ttgaagcagc agcagctcgg 2760
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 2820
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 2880
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 2940
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 3000
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 3060
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 3120
aagtagtggg atgggaacac aaatggaaag cttgagctca gaatagtatc gggtgatgcg 3180
aagtcagaac caggcagggc ctgtcgcctg aggtggcaac gatgggaagc aatcaatctg 3240
ggtacagtcg tccgcacgat cccgtgatct cccccaccga cacctatccc cgcccatccc 3300
ggcccaccct ttcagtcccc tcagcatgca ttgtgcaccg cgacaaagca tgtctgctcg 3360
tgcactggtt caggccacgg cgcaccgagt cctcgccctt cgcagagtga tcaccctccc 3420
cggaaccagc cacgctcgct gctgcgggcc gatcagccgc gcgcactccc tgcaactagg 3480
gacaactcag gcaaccacgc gcctcacaag catggccgcc gtggcatcca acccgctcgt 3540
gacggtgggt gcgcaagtgc caggggcctc gtcgtcacgg cgtgcatcct cgagggatgc 3600
gatccggcaa ctatatgtcg tttatctccc caccaatcac aggatgagcc cctgtctaga 3660
<210> 131
<211> 1905
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic nucleotide
<400> 131
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
gcgatcgccg ctcccgagcg gctggactac ctcgacaacg cggaggaggc gcggctgcag 180
cagacggacg ccttcgccga gctgaaggcg ctgtcgagcc gccagtccgt gaaccggccc 240
caaaagggcg agctgtcgtt ccggcagtcg ccgacctttc aggactgctt ccctggctcg 300
gagaagtgct accgcgaggt ggagcacgat ggcaagacgc tcaaggtgcc ttttcgccgg 360
gtgcacctgc aggacgacaa cggccatttc gacctgtacg acacctctgg cccccagggc 420
gtgaaccccc gcgagggtct gcccaagatc cgctcctcct gggtggagcc gcgcgaggcg 480
cggggcgaca aggtgcaaac gcagcagtac tacgccaagc aaggcatcat caccgaggag 540
atggccttct gcgctgcgcg cgagcgcatg gaccccgagt tcatccggtc tgaggtggcc 600
cggggtcggg ccatcatccc tgcgaacaag cgccatctgg agctggagcc gaccgtcgtg 660
ggccgcaact ttctggtcaa ggtgaacgcc aacatcggca actctgcggt cagctcgagc 720
atcgaggagg aggtggagaa gctgcagtgg agcaccatct ggggtgccga cacggccatg 780
gacctgagca ccggcaacaa catccacgag acgcgcgagt gggtgatgcg caacagcccg 840
gtccctgtgg gtacggtccc tatctaccag tgcctggaga aggcgggcgg catcgtggag 900
aacatcacct gggagctgtt ccgggagacg ctgatcgagc aggccgagca gggcgtcgac 960
tactttacca tccacgcggg ggtcctgctc cgctacatcc ccctgacggc gaaccgcgtc 1020
accggcatcg tcagccgcgg cggctctatc catgccaagc tctgcctgct ggaccacacc 1080
gagaacttcg cctacatgca ctgggacgag atcctggaca tctgcgccca gtacgacatc 1140
accctgtcga tcggcgacgg cctgcgcccc ggctgcatcg cggacgccaa cgacgctgcc 1200
cagtttgctg agctgaagac ccagggcgag ctgacccgcc gcgcctgggc gaaggacgtg 1260
caggtgatga acgagggtcc cggccatgtg ccgctgcaca agatccccga gaacatggag 1320
aagcagctgg actggtgcag cgaggcgccc ttctacacgc tcggccccct ggcgacggac 1380
atcgcgcctg cgtacgacca catcacctcc gcgatcggcg ccgccacgat cggcgcgctg 1440
gggaccgcgc tgctgtgtta cgtgaccccg aaggagcacc tgggcctccc cgatcgcgac 1500
gacgtgaagg ccggggtgat cgcctacaag atcgcggcgc acgcggctga cctggcgaag 1560
ggtcacccct acgctcagga gtgggataac gccctctcta aggcgcgctt cgagttccgg 1620
tggtacgacc agttccacct gtcgctggac cccgtcaccg cccgcctgtt ccatgacgcg 1680
accctgccgc aggagcccgc caagaccgcc cacttctgct ccatgtgcgg ccccaagttc 1740
tgctccatgc agatcaccca ggacctccgc gagtacgcca agaaccatca aatggaggag 1800
gacgaggcga tccaaaccgg catggccgag atgtccgagc agttcaagag catcggcgcg 1860
gaggtctacc tcgacgaggc ggtgctggag cacgcgtaac aattg 1905
<210> 132
<211> 1182
<212> DNA
<213> Chlorella protothecoides
<400> 132
actagagagt ttaggtccag cgtccgtggg gggggacggg ctgggagctt gggccgggaa 60
gggcaagacg atgcagtccc tctggggagt cacagccgac tgtgtgtgtt gcactgtgcg 120
gcccgcagca ctcacacgca aaatgcctgg ccgacaggca ggccctgtcc agtgcaacat 180
ccacggtccc tctcatcagg ctcaccttgc tcattgacat aacggaatgc gtaccgctct 240
ttcagatctg tccatccaga gaggggagca ggctccccac cgacgctgtc aaacttgctt 300
cctgcccaac cgaaaacatt attgtttgag gggggggggg ggggggcaga ttgcatggcg 360
ggatatctcg tgaggaacat cactgggaca ctgtggaaca cagtgagtgc agtatgcaga 420
gcatgtatgc taggggtcag cgcaggaagg gggcctttcc cagtctccca tgccactgca 480
ccgtatccac gactcaccag gaccagcttc ttgatcggct tccgctcccg tggacaccag 540
tgtgtagcct ctggactcca ggtatgcgtg caccgcaaag gccagccgat cgtgccgatt 600
cctggggtgg aggatatgag tcagccaact tggggctcag agtgcacact ggggcacgat 660
acgaaacaac atctacaccg tgtcctccat gctgacacac cacagcttcg ctccacctga 720
atgtgggcgc atgggcccga atcacagcca atgtcgctgc tgccataatg tgatccagac 780
cctctccgcc cagatgccga gcggatcgtg ggcgctgaat agattcctgt ttcgatcact 840
gtttgggtcc tttccttttc gtctcggatg cgcgtctcga aacaggctgc gtcgggcttt 900
cggatccctt ttgctccctc cgtcaccatc ctgcgcgcgg gcaagttgct tgaccctggg 960
ctggtaccag ggttggaggg tattaccgcg tcaggccatt cccagcccgg attcaattca 1020
aagtctgggc caccaccctc cgccgctctg tctgatcact ccacattcgt gcatacacta 1080
cgttcaagtc ctgatccagg cgtgtctcgg gacaaggtgt gcttgagttt gaatctcaag 1140
gacccactcc agcacagctg ctggttgacc ccgccctcgc aa 1182
<210> 133
<211> 161
<212> DNA
<213> Chlorella protothecoides
<400> 133
acggagcgtc gtgcgggagg gagtgtgccg agcggggagt cccggtctgt gcgaggcccg 60
gcagctgacg ctggcgagcc gtacgccccg agggtccccc tcccctgcac cctcttcccc 120
ttccctctga cggccgcgcc tgttcttgca tgttcagcga c 161
<210> 134
<211> 6306
<212> DNA
<213> Arabidopsis thaliana
<400> 134
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080
tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140
tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200
accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260
gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320
tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380
gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440
tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500
ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560
ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620
gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680
cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740
gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800
tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860
gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920
ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980
tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040
ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100
tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160
tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220
cacgggaagt agtgggatgg gaacacaaat ggaggatcca ctagagagtt taggtccagc 2280
gtccgtgggg ggggacgggc tgggagcttg ggccgggaag ggcaagacga tgcagtccct 2340
ctggggagtc acagccgact gtgtgtgttg cactgtgcgg cccgcagcac tcacacgcaa 2400
aatgcctggc cgacaggcag gccctgtcca gtgcaacatc cacggtccct ctcatcaggc 2460
tcaccttgct cattgacata acggaatgcg taccgctctt tcagatctgt ccatccagag 2520
aggggagcag gctccccacc gacgctgtca aacttgcttc ctgcccaacc gaaaacatta 2580
ttgtttgagg gggggggggg gggggcagat tgcatggcgg gatatctcgt gaggaacatc 2640
actgggacac tgtggaacac agtgagtgca gtatgcagag catgtatgct aggggtcagc 2700
gcaggaaggg ggcctttccc agtctcccat gccactgcac cgtatccacg actcaccagg 2760
accagcttct tgatcggctt ccgctcccgt ggacaccagt gtgtagcctc tggactccag 2820
gtatgcgtgc accgcaaagg ccagccgatc gtgccgattc ctggggtgga ggatatgagt 2880
cagccaactt ggggctcaga gtgcacactg gggcacgata cgaaacaaca tctacaccgt 2940
gtcctccatg ctgacacacc acagcttcgc tccacctgaa tgtgggcgca tgggcccgaa 3000
tcacagccaa tgtcgctgct gccataatgt gatccagacc ctctccgccc agatgccgag 3060
cggatcgtgg gcgctgaata gattcctgtt tcgatcactg tttgggtcct ttccttttcg 3120
tctcggatgc gcgtctcgaa acaggctgcg tcgggctttc ggatcccttt tgctccctcc 3180
gtcaccatcc tgcgcgcggg caagttgctt gaccctgggc tggtaccagg gttggagggt 3240
attaccgcgt caggccattc ccagcccgga ttcaattcaa agtctgggcc accaccctcc 3300
gccgctctgt ctgatcactc cacattcgtg catacactac gttcaagtcc tgatccaggc 3360
gtgtctcggg acaaggtgtg cttgagtttg aatctcaagg acccactcca gcacagctgc 3420
tggttgaccc cgccctcgca aactagtatg gccaccgcat ccactttctc ggcgttcaat 3480
gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc agcgaggccc 3540
ctccccgtgc gcgggcgcgc cgtccaggcc gcggccaccc gcttcaagaa ggagacgacg 3600
accacccgcg ccacgctgac gttcgacccc cccacgacca actccgagcg cgccaagcag 3660
cgcaagcaca ccatcgaccc ctcctccccc gacttccagc ccatcccctc cttcgaggag 3720
tgcttcccca agtccacgaa ggagcacaag gaggtggtgc acgaggagtc cggccacgtc 3780
ctgaaggtgc ccttccgccg cgtgcacctg tccggcggcg agcccgcctt cgacaactac 3840
gacacgtccg gcccccagaa cgtcaacgcc cacatcggcc tggcgaagct gcgcaaggag 3900
tggatcgacc gccgcgagaa gctgggcacg ccccgctaca cgcagatgta ctacgcgaag 3960
cagggcatca tcacggagga gatgctgtac tgcgcgacgc gcgagaagct ggaccccgag 4020
ttcgtccgct ccgaggtcgc gcggggccgc gccatcatcc cctccaacaa gaagcacctg 4080
gagctggagc ccatgatcgt gggccgcaag ttcctggtga aggtgaacgc gaacatcggc 4140
aactccgccg tggcctcctc catcgaggag gaggtctaca aggtgcagtg ggccaccatg 4200
tggggcgccg acaccatcat ggacctgtcc acgggccgcc acatccacga gacgcgcgag 4260
tggatcctgc gcaactccgc ggtccccgtg ggcaccgtcc ccatctacca ggcgctggag 4320
aaggtggacg gcatcgcgga gaacctgaac tgggaggtgt tccgcgagac gctgatcgag 4380
caggccgagc agggcgtgga ctacttcacg atccacgcgg gcgtgctgct gcgctacatc 4440
cccctgaccg ccaagcgcct gacgggcatc gtgtcccgcg gcggctccat ccacgcgaag 4500
tggtgcctgg cctaccacaa ggagaacttc gcctacgagc actgggacga catcctggac 4560
atctgcaacc agtacgacgt cgccctgtcc atcggcgacg gcctgcgccc cggctccatc 4620
tacgacgcca acgacacggc ccagttcgcc gagctgctga cccagggcga gctgacgcgc 4680
cgcgcgtggg agaaggacgt gcaggtgatg aacgagggcc ccggccacgt gcccatgcac 4740
aagatccccg agaacatgca gaagcagctg gagtggtgca acgaggcgcc cttctacacc 4800
ctgggccccc tgacgaccga catcgcgccc ggctacgacc acatcacctc cgccatcggc 4860
gcggccaaca tcggcgccct gggcaccgcc ctgctgtgct acgtgacgcc caaggagcac 4920
ctgggcctgc ccaaccgcga cgacgtgaag gcgggcgtca tcgcctacaa gatcgccgcc 4980
cacgcggccg acctggccaa gcagcacccc cacgcccagg cgtgggacga cgcgctgtcc 5040
aaggcgcgct tcgagttccg ctggatggac cagttcgcgc tgtccctgga ccccatgacg 5100
gcgatgtcct tccacgacga gacgctgccc gcggacggcg cgaaggtcgc ccacttctgc 5160
tccatgtgcg gccccaagtt ctgctccatg aagatcacgg aggacatccg caagtacgcc 5220
gaggagaacg gctacggctc cgccgaggag gccatccgcc agggcatgga cgccatgtcc 5280
gaggagttca acatcgccaa gaagacgatc tccggcgagc agcacggcga ggtcggcggc 5340
gagatctacc tgcccgagtc ctacgtcaag gccgcgcaga agtgatacgt actcgagacg 5400
gagcgtcgtg cgggagggag tgtgccgagc ggggagtccc ggtctgtgcg aggcccggca 5460
gctgacgctg gcgagccgta cgccccgagg gtccccctcc cctgcaccct cttccccttc 5520
cctctgacgg ccgcgcctgt tcttgcatgt tcagcgacga gctcttgttt tccagaagga 5580
gttgctcctt gagcctttca ttctcagcct cgataacctc caaagccgct ctaattgtgg 5640
agggggttcg aatttaaaag cttggaatgt tggttcgtgc gtctggaaca agcccagact 5700
tgttgctcac tgggaaaagg accatcagct ccaaaaaact tgccgctcaa accgcgtacc 5760
tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac attcatattg tgacgcttga 5820
gcagtctgta attgcctcag aatgtggaat catctgcccc ctgtgcgagc ccatgccagg 5880
catgtcgcgg gcgaggacac ccgccactcg tacagcagac cattatgcta cctcacaata 5940
gttcataaca gtgaccatat ttctcgaagc tccccaacga gcacctccat gctctgagtg 6000
gccacccccc ggccctggtg cttgcggagg gcaggtcaac cggcatgggg ctaccgaaat 6060
ccccgaccgg atcccaccac ccccgcgatg ggaagaatct ctccccggga tgtgggccca 6120
ccaccagcac aacctgctgg cccaggcgag cgtcaaacca taccacacaa atatccttgg 6180
catcggccct gaattccttc tgccgctctg ctacccggtg cttctgtccg aagcaggggt 6240
tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg gcggggcttg ttcgagcttg 6300
aagagc 6306
<210> 135
<211> 1938
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 135
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgtccag 120
gccgcggcca cccgcttcaa gaaggagacg acgaccaccc gcgccacgct gacgttcgac 180
ccccccacga ccaactccga gcgcgccaag cagcgcaagc acaccatcga cccctcctcc 240
cccgacttcc agcccatccc ctccttcgag gagtgcttcc ccaagtccac gaaggagcac 300
aaggaggtgg tgcacgagga gtccggccac gtcctgaagg tgcccttccg ccgcgtgcac 360
ctgtccggcg gcgagcccgc cttcgacaac tacgacacgt ccggccccca gaacgtcaac 420
gcccacatcg gcctggcgaa gctgcgcaag gagtggatcg accgccgcga gaagctgggc 480
acgccccgct acacgcagat gtactacgcg aagcagggca tcatcacgga ggagatgctg 540
tactgcgcga cgcgcgagaa gctggacccc gagttcgtcc gctccgaggt cgcgcggggc 600
cgcgccatca tcccctccaa caagaagcac ctggagctgg agcccatgat cgtgggccgc 660
aagttcctgg tgaaggtgaa cgcgaacatc ggcaactccg ccgtggcctc ctccatcgag 720
gaggaggtct acaaggtgca gtgggccacc atgtggggcg ccgacaccat catggacctg 780
tccacgggcc gccacatcca cgagacgcgc gagtggatcc tgcgcaactc cgcggtcccc 840
gtgggcaccg tccccatcta ccaggcgctg gagaaggtgg acggcatcgc ggagaacctg 900
aactgggagg tgttccgcga gacgctgatc gagcaggccg agcagggcgt ggactacttc 960
acgatccacg cgggcgtgct gctgcgctac atccccctga ccgccaagcg cctgacgggc 1020
atcgtgtccc gcggcggctc catccacgcg aagtggtgcc tggcctacca caaggagaac 1080
ttcgcctacg agcactggga cgacatcctg gacatctgca accagtacga cgtcgccctg 1140
tccatcggcg acggcctgcg ccccggctcc atctacgacg ccaacgacac ggcccagttc 1200
gccgagctgc tgacccaggg cgagctgacg cgccgcgcgt gggagaagga cgtgcaggtg 1260
atgaacgagg gccccggcca cgtgcccatg cacaagatcc ccgagaacat gcagaagcag 1320
ctggagtggt gcaacgaggc gcccttctac accctgggcc ccctgacgac cgacatcgcg 1380
cccggctacg accacatcac ctccgccatc ggcgcggcca acatcggcgc cctgggcacc 1440
gccctgctgt gctacgtgac gcccaaggag cacctgggcc tgcccaaccg cgacgacgtg 1500
aaggcgggcg tcatcgccta caagatcgcc gcccacgcgg ccgacctggc caagcagcac 1560
ccccacgccc aggcgtggga cgacgcgctg tccaaggcgc gcttcgagtt ccgctggatg 1620
gaccagttcg cgctgtccct ggaccccatg acggcgatgt ccttccacga cgagacgctg 1680
cccgcggacg gcgcgaaggt cgcccacttc tgctccatgt gcggccccaa gttctgctcc 1740
atgaagatca cggaggacat ccgcaagtac gccgaggaga acggctacgg ctccgccgag 1800
gaggccatcc gccagggcat ggacgccatg tccgaggagt tcaacatcgc caagaagacg 1860
atctccggcg agcagcacgg cgaggtcggc ggcgagatct acctgcccga gtcctacgtc 1920
aaggccgcgc agaagtga 1938
<210> 136
<211> 644
<212> PRT
<213> Arabidopsis thaliana
<400> 136
Met Ala Ala Ser Val His Cys Thr Leu Met Ser Val Val Cys Asn Asn
1 5 10 15
Lys Asn His Ser Ala Arg Pro Lys Leu Pro Asn Ser Ser Leu Leu Pro
20 25 30
Gly Phe Asp Val Val Val Gln Ala Ala Ala Thr Arg Phe Lys Lys Glu
35 40 45
Thr Thr Thr Thr Arg Ala Thr Leu Thr Phe Asp Pro Pro Thr Thr Asn
50 55 60
Ser Glu Arg Ala Lys Gln Arg Lys His Thr Ile Asp Pro Ser Ser Pro
65 70 75 80
Asp Phe Gln Pro Ile Pro Ser Phe Glu Glu Cys Phe Pro Lys Ser Thr
85 90 95
Lys Glu His Lys Glu Val Val His Glu Glu Ser Gly His Val Leu Lys
100 105 110
Val Pro Phe Arg Arg Val His Leu Ser Gly Gly Glu Pro Ala Phe Asp
115 120 125
Asn Tyr Asp Thr Ser Gly Pro Gln Asn Val Asn Ala His Ile Gly Leu
130 135 140
Ala Lys Leu Arg Lys Glu Trp Ile Asp Arg Arg Glu Lys Leu Gly Thr
145 150 155 160
Pro Arg Tyr Thr Gln Met Tyr Tyr Ala Lys Gln Gly Ile Ile Thr Glu
165 170 175
Glu Met Leu Tyr Cys Ala Thr Arg Glu Lys Leu Asp Pro Glu Phe Val
180 185 190
Arg Ser Glu Val Ala Arg Gly Arg Ala Ile Ile Pro Ser Asn Lys Lys
195 200 205
His Leu Glu Leu Glu Pro Met Ile Val Gly Arg Lys Phe Leu Val Lys
210 215 220
Val Asn Ala Asn Ile Gly Asn Ser Ala Val Ala Ser Ser Ile Glu Glu
225 230 235 240
Glu Val Tyr Lys Val Gln Trp Ala Thr Met Trp Gly Ala Asp Thr Ile
245 250 255
Met Asp Leu Ser Thr Gly Arg His Ile His Glu Thr Arg Glu Trp Ile
260 265 270
Leu Arg Asn Ser Ala Val Pro Val Gly Thr Val Pro Ile Tyr Gln Ala
275 280 285
Leu Glu Lys Val Asp Gly Ile Ala Glu Asn Leu Asn Trp Glu Val Phe
290 295 300
Arg Glu Thr Leu Ile Glu Gln Ala Glu Gln Gly Val Asp Tyr Phe Thr
305 310 315 320
Ile His Ala Gly Val Leu Leu Arg Tyr Ile Pro Leu Thr Ala Lys Arg
325 330 335
Leu Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala Lys Trp Cys
340 345 350
Leu Ala Tyr His Lys Glu Asn Phe Ala Tyr Glu His Trp Asp Asp Ile
355 360 365
Leu Asp Ile Cys Asn Gln Tyr Asp Val Ala Leu Ser Ile Gly Asp Gly
370 375 380
Leu Arg Pro Gly Ser Ile Tyr Asp Ala Asn Asp Thr Ala Gln Phe Ala
385 390 395 400
Glu Leu Leu Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp Glu Lys Asp
405 410 415
Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Met His Lys Ile
420 425 430
Pro Glu Asn Met Gln Lys Gln Leu Glu Trp Cys Asn Glu Ala Pro Phe
435 440 445
Tyr Thr Leu Gly Pro Leu Thr Thr Asp Ile Ala Pro Gly Tyr Asp His
450 455 460
Ile Thr Ser Ala Ile Gly Ala Ala Asn Ile Gly Ala Leu Gly Thr Ala
465 470 475 480
Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu Pro Asn Arg
485 490 495
Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala Ala His Ala
500 505 510
Ala Asp Leu Ala Lys Gln His Pro His Ala Gln Ala Trp Asp Asp Ala
515 520 525
Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Met Asp Gln Phe Ala Leu
530 535 540
Ser Leu Asp Pro Met Thr Ala Met Ser Phe His Asp Glu Thr Leu Pro
545 550 555 560
Ala Asp Gly Ala Lys Val Ala His Phe Cys Ser Met Cys Gly Pro Lys
565 570 575
Phe Cys Ser Met Lys Ile Thr Glu Asp Ile Arg Lys Tyr Ala Glu Glu
580 585 590
Asn Gly Tyr Gly Ser Ala Glu Glu Ala Ile Arg Gln Gly Met Asp Ala
595 600 605
Met Ser Glu Glu Phe Asn Ile Ala Lys Lys Thr Ile Ser Gly Glu Gln
610 615 620
His Gly Glu Val Gly Gly Glu Ile Tyr Leu Pro Glu Ser Tyr Val Lys
625 630 635 640
Ala Ala Gln Lys
<210> 137
<211> 6130
<212> DNA
<213> Unknown
<220>
<223> Synechocystis species
<400> 137
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080
tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140
tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200
accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260
gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320
tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380
gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440
tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500
ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560
ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620
gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680
cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740
gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800
tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860
gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920
ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980
tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040
ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100
tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160
tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220
cacgggaagt agtgggatgg gaacacaaat ggaggatcca ctagagagtt taggtccagc 2280
gtccgtgggg ggggacgggc tgggagcttg ggccgggaag ggcaagacga tgcagtccct 2340
ctggggagtc acagccgact gtgtgtgttg cactgtgcgg cccgcagcac tcacacgcaa 2400
aatgcctggc cgacaggcag gccctgtcca gtgcaacatc cacggtccct ctcatcaggc 2460
tcaccttgct cattgacata acggaatgcg taccgctctt tcagatctgt ccatccagag 2520
aggggagcag gctccccacc gacgctgtca aacttgcttc ctgcccaacc gaaaacatta 2580
ttgtttgagg gggggggggg gggggcagat tgcatggcgg gatatctcgt gaggaacatc 2640
actgggacac tgtggaacac agtgagtgca gtatgcagag catgtatgct aggggtcagc 2700
gcaggaaggg ggcctttccc agtctcccat gccactgcac cgtatccacg actcaccagg 2760
accagcttct tgatcggctt ccgctcccgt ggacaccagt gtgtagcctc tggactccag 2820
gtatgcgtgc accgcaaagg ccagccgatc gtgccgattc ctggggtgga ggatatgagt 2880
cagccaactt ggggctcaga gtgcacactg gggcacgata cgaaacaaca tctacaccgt 2940
gtcctccatg ctgacacacc acagcttcgc tccacctgaa tgtgggcgca tgggcccgaa 3000
tcacagccaa tgtcgctgct gccataatgt gatccagacc ctctccgccc agatgccgag 3060
cggatcgtgg gcgctgaata gattcctgtt tcgatcactg tttgggtcct ttccttttcg 3120
tctcggatgc gcgtctcgaa acaggctgcg tcgggctttc ggatcccttt tgctccctcc 3180
gtcaccatcc tgcgcgcggg caagttgctt gaccctgggc tggtaccagg gttggagggt 3240
attaccgcgt caggccattc ccagcccgga ttcaattcaa agtctgggcc accaccctcc 3300
gccgctctgt ctgatcactc cacattcgtg catacactac gttcaagtcc tgatccaggc 3360
gtgtctcggg acaaggtgtg cttgagtttg aatctcaagg acccactcca gcacagctgc 3420
tggttgaccc cgccctcgca aactagtatg gccaccgcat ccactttctc ggcgttcaat 3480
gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc agcgaggccc 3540
ctccccgtgc gcgggcgcgc catgcgcacc gcgtgggtcg ccaagcgcca gggccagacg 3600
aacgtctccc agatgcacta cgcgcgcaag ggcgtgatca ccgaggagat ggactacgtg 3660
gcgaagcgcg agaacctgcc cgtggagctg atcaaggacg aggtggcgcg gggccgcatg 3720
atcatccccg ccaacatcaa ccacacgaac ctggagccca tggccatcgg catcgcctcc 3780
aagtgcaagg tcaacgcgaa catcggcgcg tcccccaact cctccaacat cgacgaggag 3840
gtggagaagc tgctgctgtc cgtgaagtac ggcgcggaca cggtgatgga cctgtccacc 3900
ggcggcggcg acctggacgt gatccgcacc gccatcatca acgcctcccc cgtgcccatc 3960
ggcacggtgc ccatctacca ggccctggag tccgtgcacg gctccatcga gaacctgacg 4020
cccgacgact tcctgcacat catcgagaag cacgcccagc agggcgtgga ctacatgacg 4080
atccacgcgg gcctgctgat cgagtacctg cccctggtga agtcccgcat cacgggcatc 4140
gtgtcccgcg gcggcggcat catcgccaag tggatgctgc accaccacaa gcagaacccc 4200
ctgtacacgc acttcgacga gatcatcgag atcttcaaga agtacgacgt gtccttctcc 4260
ctgggcgact ccctgcgccc cggctgcacc cacgacgcct ccgacgacgc ccagctgtcc 4320
gagctgaaga cgctgggcca gctgacgcgc cgcgcctggg agcacgacgt ccaggtcatg 4380
gtggagggcc ccggccacgt ccccatcgac cagatcgagt tcaacgtcaa gaagcagatg 4440
gaggagtgct ccgaggcccc cttctacgtg ctgggccccc tggtcaccga catcgcgccc 4500
ggctacgacc acatcacctc cgcgatcggc gccgccatcg cgggctggca cggcaccgcg 4560
atgctgtgct acgtgacgcc caaggagcac ctgggcctgc ccaacgcgga ggacgtgcgc 4620
aacggcctga tcgcctacaa gatcgccgcg cacgccgcgg acatcgcccg ccaccgcccc 4680
ggcgcgcgcg accgcgacga cgagctgtcc aaggcgcgct acaacttcga ctggaaccgc 4740
cagttcgagc tgtccctgga ccccgagcgc gcgaaggagt accacgacga gacgctgccc 4800
gcggacatct acaagaccgc ggagttctgc tccatgtgcg gccccaagtt ctgccccatg 4860
cagaccaagg tggacgccga gatgctggag gagctggagg tcttcctggc caaggacaag 4920
gagatggtgt cccagcgctg atacgtactc gagacggagc gtcgtgcggg agggagtgtg 4980
ccgagcgggg agtcccggtc tgtgcgaggc ccggcagctg acgctggcga gccgtacgcc 5040
ccgagggtcc ccctcccctg caccctcttc cccttccctc tgacggccgc gcctgttctt 5100
gcatgttcag cgacgagctc ttgttttcca gaaggagttg ctccttgagc ctttcattct 5160
cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 5220
gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 5280
tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 5340
ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 5400
tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 5460
cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 5520
cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 5580
cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 5640
gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 5700
ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 5760
gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 5820
aaacccttgt cgcgtggcgg ggcttgttcg agcttgaaga gcctctagag tcgacctgca 5880
ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 5940
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 6000
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 6060
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 6120
ggcgctcttc 6130
<210> 138
<211> 1494
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 138
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccatgcgc 120
accgcgtggg tcgccaagcg ccagggccag acgaacgtct cccagatgca ctacgcgcgc 180
aagggcgtga tcaccgagga gatggactac gtggcgaagc gcgagaacct gcccgtggag 240
ctgatcaagg acgaggtggc gcggggccgc atgatcatcc ccgccaacat caaccacacg 300
aacctggagc ccatggccat cggcatcgcc tccaagtgca aggtcaacgc gaacatcggc 360
gcgtccccca actcctccaa catcgacgag gaggtggaga agctgctgct gtccgtgaag 420
tacggcgcgg acacggtgat ggacctgtcc accggcggcg gcgacctgga cgtgatccgc 480
accgccatca tcaacgcctc ccccgtgccc atcggcacgg tgcccatcta ccaggccctg 540
gagtccgtgc acggctccat cgagaacctg acgcccgacg acttcctgca catcatcgag 600
aagcacgccc agcagggcgt ggactacatg acgatccacg cgggcctgct gatcgagtac 660
ctgcccctgg tgaagtcccg catcacgggc atcgtgtccc gcggcggcgg catcatcgcc 720
aagtggatgc tgcaccacca caagcagaac cccctgtaca cgcacttcga cgagatcatc 780
gagatcttca agaagtacga cgtgtccttc tccctgggcg actccctgcg ccccggctgc 840
acccacgacg cctccgacga cgcccagctg tccgagctga agacgctggg ccagctgacg 900
cgccgcgcct gggagcacga cgtccaggtc atggtggagg gccccggcca cgtccccatc 960
gaccagatcg agttcaacgt caagaagcag atggaggagt gctccgaggc ccccttctac 1020
gtgctgggcc ccctggtcac cgacatcgcg cccggctacg accacatcac ctccgcgatc 1080
ggcgccgcca tcgcgggctg gcacggcacc gcgatgctgt gctacgtgac gcccaaggag 1140
cacctgggcc tgcccaacgc ggaggacgtg cgcaacggcc tgatcgccta caagatcgcc 1200
gcgcacgccg cggacatcgc ccgccaccgc cccggcgcgc gcgaccgcga cgacgagctg 1260
tccaaggcgc gctacaactt cgactggaac cgccagttcg agctgtccct ggaccccgag 1320
cgcgcgaagg agtaccacga cgagacgctg cccgcggaca tctacaagac cgcggagttc 1380
tgctccatgt gcggccccaa gttctgcccc atgcagacca aggtggacgc cgagatgctg 1440
gaggagctgg aggtcttcct ggccaaggac aaggagatgg tgtcccagcg ctga 1494
<210> 139
<211> 459
<212> PRT
<213> Unknown
<220>
<223> Synechosystis species
<400> 139
Met Arg Thr Ala Trp Val Ala Lys Arg Gln Gly Gln Thr Asn Val Ser
1 5 10 15
Gln Met His Tyr Ala Arg Lys Gly Val Ile Thr Glu Glu Met Asp Tyr
20 25 30
Val Ala Lys Arg Glu Asn Leu Pro Val Glu Leu Ile Lys Asp Glu Val
35 40 45
Ala Arg Gly Arg Met Ile Ile Pro Ala Asn Ile Asn His Thr Asn Leu
50 55 60
Glu Pro Met Ala Ile Gly Ile Ala Ser Lys Cys Lys Val Asn Ala Asn
65 70 75 80
Ile Gly Ala Ser Pro Asn Ser Ser Asn Ile Asp Glu Glu Val Glu Lys
85 90 95
Leu Leu Leu Ser Val Lys Tyr Gly Ala Asp Thr Val Met Asp Leu Ser
100 105 110
Thr Gly Gly Gly Asp Leu Asp Val Ile Arg Thr Ala Ile Ile Asn Ala
115 120 125
Ser Pro Val Pro Ile Gly Thr Val Pro Ile Tyr Gln Ala Leu Glu Ser
130 135 140
Val His Gly Ser Ile Glu Asn Leu Thr Pro Asp Asp Phe Leu His Ile
145 150 155 160
Ile Glu Lys His Ala Gln Gln Gly Val Asp Tyr Met Thr Ile His Ala
165 170 175
Gly Leu Leu Ile Glu Tyr Leu Pro Leu Val Lys Ser Arg Ile Thr Gly
180 185 190
Ile Val Ser Arg Gly Gly Gly Ile Ile Ala Lys Trp Met Leu His His
195 200 205
His Lys Gln Asn Pro Leu Tyr Thr His Phe Asp Glu Ile Ile Glu Ile
210 215 220
Phe Lys Lys Tyr Asp Val Ser Phe Ser Leu Gly Asp Ser Leu Arg Pro
225 230 235 240
Gly Cys Thr His Asp Ala Ser Asp Asp Ala Gln Leu Ser Glu Leu Lys
245 250 255
Thr Leu Gly Gln Leu Thr Arg Arg Ala Trp Glu His Asp Val Gln Val
260 265 270
Met Val Glu Gly Pro Gly His Val Pro Ile Asp Gln Ile Glu Phe Asn
275 280 285
Val Lys Lys Gln Met Glu Glu Cys Ser Glu Ala Pro Phe Tyr Val Leu
290 295 300
Gly Pro Leu Val Thr Asp Ile Ala Pro Gly Tyr Asp His Ile Thr Ser
305 310 315 320
Ala Ile Gly Ala Ala Ile Ala Gly Trp His Gly Thr Ala Met Leu Cys
325 330 335
Tyr Val Thr Pro Lys Glu His Leu Gly Leu Pro Asn Ala Glu Asp Val
340 345 350
Arg Asn Gly Leu Ile Ala Tyr Lys Ile Ala Ala His Ala Ala Asp Ile
355 360 365
Ala Arg His Arg Pro Gly Ala Arg Asp Arg Asp Asp Glu Leu Ser Lys
370 375 380
Ala Arg Tyr Asn Phe Asp Trp Asn Arg Gln Phe Glu Leu Ser Leu Asp
385 390 395 400
Pro Glu Arg Ala Lys Glu Tyr His Asp Glu Thr Leu Pro Ala Asp Ile
405 410 415
Tyr Lys Thr Ala Glu Phe Cys Ser Met Cys Gly Pro Lys Phe Cys Pro
420 425 430
Met Gln Thr Lys Val Asp Ala Glu Met Leu Glu Glu Leu Glu Val Phe
435 440 445
Leu Ala Lys Asp Lys Glu Met Val Ser Gln Arg
450 455
<210> 140
<211> 312
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 140
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa ac 312
<210> 141
<211> 18
<212> DNA
<213> Unknown
<220>
<223> Coccomyxa species
<400> 141
gggtgatcgc ctacaaga 18
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 142
acgtcgcgac ccatgcttcc 20
<210> 143
<211> 18
<212> DNA
<213> Arabidopsis thaliana
<400> 143
gcgtcatcgc ctacaaga 18
<210> 144
<211> 18
<212> DNA
<213> Unknown
<220>
<223> Synechosystis sp.
<400> 144
cgatgctgtg ctacgtga 18
<210> 145
<211> 1260
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 145
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
gccaacgccc acaccgtgcc caagatcaac ggcaacaagg ccggcctgct gacccccatg 180
gagagcacca aggacgagga catcgtcgcg gcccccaccg tggcgcccaa gcgcaccttc 240
atcaaccagc tgcccgactg gtcgatgctg ctggccgcga tcaccaccat cttcctggcg 300
gccgagaagc agtggaccaa cctggactgg aagccccgcc gccccgacat gctggtcgac 360
ttcgacccct tctccctggg ccgcttcgtg caggacggcc tgatcttccg ccagaacttc 420
agcatccgct cgtacgagat cggcgcggac cgcaccgcct ccatcgagac cctgatgaac 480
cacctgcagg agaccgcgct gaaccacgtc cgctgcatcg gcctgctgga cgacggcttc 540
ggcagcaccc ccgagatgac ccgccgcgac ctgatctggg tggtcacccg catgcaggtc 600
ctggtggacc gctacccctc gtggggcgac gtgatcgagg tcgactcctg ggtgaccccc 660
agcggcaaga acggcatgaa gcgcgagtgg ttcctgcgcg actgcaagac cggcgagatc 720
ctgacccgcg ccacctcggt ctgggtgatg atgaacaagc gcacccgccg cctgtccaag 780
atccccgagg aggtccgcgt ggagatcgag ccctacttcg tcgagcacgg cgtgctggac 840
gaggactcgc gcaagctgcc caagctgaac gacaacaccg ccaactacat ccgccgcggc 900
ctggcgcccc gctggtccga cctggacgtc aaccagcacg tgaacaacgt caagtacatc 960
ggctggatcc tggagagcgt gcccagcagc ctgctggagt cgcacgagct gtacggcatg 1020
accctggagt accgcaagga gtgcggcaag gacggcctgc tgcagtccct gaccgccgtc 1080
gccagcgact acggcggcgg ctcgctggag gccggcgtgg agtgcgacca cctgctgcgc 1140
ctggaggacg gctccgagat catgcgcggc aagaccgagt ggcgccccaa gcgcgccgcg 1200
aacaccacct acttcggcag cgtcgacgac atcccccccg ccaacaacgc gtgactcgag 1260
<210> 146
<211> 429
<212> PRT
<213> Myristica fragrans
<400> 146
Met Val Ala Thr Ser Ala Ala Ser Ala Phe Phe Pro Val Ala Ser Pro
1 5 10 15
Ser Pro Val Lys Pro Ser Met Met Leu Gly Gly Gly Gly Gly Ser Asp
20 25 30
Asn Leu Asp Ala Arg Gly Ile Lys Ser Arg Pro Ala Ser Ser Gly Gly
35 40 45
Leu Gln Val Lys Ala Asn Ala His Thr Val Pro Lys Ile Asn Gly Asn
50 55 60
Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu Asp Ile
65 70 75 80
Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn Gln Leu
85 90 95
Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala
100 105 110
Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg Pro Asp
115 120 125
Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val Gln Asp
130 135 140
Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly
145 150 155 160
Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu
165 170 175
Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp Gly Phe
180 185 190
Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val Val Thr
195 200 205
Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp Val Ile
210 215 220
Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met Lys Arg
225 230 235 240
Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg Ala
245 250 255
Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu Ser Lys
260 265 270
Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val Glu His
275 280 285
Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn Asp Asn
290 295 300
Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser Asp Leu
305 310 315 320
Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu
325 330 335
Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr Gly Met
340 345 350
Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu Gln Ser
355 360 365
Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu Ala Gly
370 375 380
Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu Ile Met
385 390 395 400
Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr Thr Tyr
405 410 415
Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala
420 425
<210> 147
<211> 1269
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 147
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
gccaacgccc aggcccccac caagatcaac ggctccaccg acgacgccca gctgcccgcc 180
ccccgcacct tcatcaacca gctgcccgac tggtccatgc tgctggccgc catcaccacc 240
gtgttcctgg ccgccgagaa gcagtggatg atgctggact ggaagccccg ccgccccgac 300
atgctgatcg acaccttcgg cctgggccgc atcgtgcagg acggcctggt gttccgccag 360
aacttctcca tccgctccta cgagatcggc gccgaccgca ccgcctccat cgagaccgtg 420
atgaaccacc tgcaggagac cgccctgaac cacgtgaaga ccgccggcct gctgggcgac 480
ggcttcggct ccacccccga gatgtccaag cgcaacctga tctgggtggt gaccaagatg 540
caggtggagg tggaccgcta ccccacctgg ggcgacgtgg tgcaggtgga cacctgggtg 600
tccgcctccg gcaagaacgg catgcgccgc gactggctgc tgcgcgacgg caacaccggc 660
gagaccctga cccgcgcctc ctccgtgtgg gtgatgatga acaagctgac ccgccgcctg 720
tccaagatcc ccgaggaggt gcgcgaggag atcggctcct acttcgtgaa ctccgacccc 780
gtggtggagg aggacggccg caaggtgacc aagctggacg acaacaccgc cgacttcgtg 840
cgcaagggcc tgacccccaa gtggaacgac ctggacatca accagcacgt gaacaacgtg 900
aagtacatcg gctggatcct ggagtccgcc ccccagccca tcctggagac ccgcgagctg 960
tccgccgtga ccctggagta ccgccgcgag tgcggccgcg actccgtgct gcgctccctg 1020
accgccgtgt ccggcggcgg cgtgggcgac ctgggccacg ccggcaacgt ggagtgccag 1080
cacgtgctgc gcctggagga cggcgccgag atcgtgcgcg gccgcaccga gtggcgcccc 1140
aagtacatca acaacttctc catcatgggc cagatcccca ccgacgcctc catggactac 1200
aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 1260
tgaatcgat 1269
<210> 148
<211> 406
<212> PRT
<213> Garcinia mangostana
<400> 148
Met Val Ala Thr Ala Ala Thr Ser Ser Phe Phe Pro Leu Thr Ser Pro
1 5 10 15
Ser Gly Asp Ala Lys Ser Gly Asn Pro Gly Lys Gly Ser Val Ser Phe
20 25 30
Gly Ser Met Lys Ser Lys Ser Ala Ala Ser Ser Arg Gly Leu Gln Val
35 40 45
Lys Ala Asn Ala Gln Ala Pro Thr Lys Ile Asn Gly Ser Thr Asp Asp
50 55 60
Ala Gln Leu Pro Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp
65 70 75 80
Ser Met Leu Leu Ala Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys
85 90 95
Gln Trp Met Met Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu Ile
100 105 110
Asp Thr Phe Gly Leu Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg
115 120 125
Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala
130 135 140
Ser Ile Glu Thr Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His
145 150 155 160
Val Lys Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu
165 170 175
Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Met Gln Val Glu
180 185 190
Val Asp Arg Tyr Pro Thr Trp Gly Asp Val Val Gln Val Asp Thr Trp
195 200 205
Val Ser Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Leu Arg
210 215 220
Asp Gly Asn Thr Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val
225 230 235 240
Met Met Asn Lys Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val
245 250 255
Arg Glu Glu Ile Gly Ser Tyr Phe Val Asn Ser Asp Pro Val Val Glu
260 265 270
Glu Asp Gly Arg Lys Val Thr Lys Leu Asp Asp Asn Thr Ala Asp Phe
275 280 285
Val Arg Lys Gly Leu Thr Pro Lys Trp Asn Asp Leu Asp Ile Asn Gln
290 295 300
His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro
305 310 315 320
Gln Pro Ile Leu Glu Thr Arg Glu Leu Ser Ala Val Thr Leu Glu Tyr
325 330 335
Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Arg Ser Leu Thr Ala Val
340 345 350
Ser Gly Gly Gly Val Gly Asp Leu Gly His Ala Gly Asn Val Glu Cys
355 360 365
Gln His Val Leu Arg Leu Glu Asp Gly Ala Glu Ile Val Arg Gly Arg
370 375 380
Thr Glu Trp Arg Pro Lys Tyr Ile Asn Asn Phe Ser Ile Met Gly Gln
385 390 395 400
Ile Pro Thr Asp Ala Ser
405
<210> 149
<211> 1338
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 149
actagtatgg tggccaccgc cgcctcctcc gccttcttcc ccctgccctc cgccgacacc 60
tcctcccgcc ccggcaagct gggcaacaag ccctcctccc tgtcccccct gaagcccaag 120
tccaccccca acggcggcct gcaggtgaag gccaacgcct ccgccccccc caagatcaac 180
ggctcccccg tgggcctgaa gtccggcggc ctgaaggggc gcgccaccca ggaggacgcc 240
cactccgccc cccccccccg caccttcatc aaccagctgc ccgactggtc catgctgctg 300
gccgccatca ccaccgtgtt cctggccgcc gagaagcagt ggatgatgct ggactggaag 360
cccaagcgcc ccgacatgct ggtggacccc ttcggcctgg gctccatcgt gcaggacggc 420
ctggtgttcc gccagaactt ctccatccgc tcctacgaga tcggcgccga ccgcaccgcc 480
tccatcgaga ccgtgatgaa ccacctgcag gagaccgccc tgaaccacgt gaagatcgcc 540
ggcctgtcca acgacggctt cggccgcacc cccgagatgt acaagcgcga cctgatctgg 600
gtggtggcca agatgcaggt gatggtgaac cgctacccca cctggggcga caccgtggag 660
gtgaacacct gggtggccaa gtccggcaag aacggcatgc gccgcgactg gctgatctcc 720
gactgcaaca ccggcgagat cctgacccgc gcctcctccg tgtgggtgat gatgaaccag 780
aagacccgcc gcctgtccaa gatccccgac gaggtgcgca acgagatcga gccccacttc 840
gtggactccc cccccgtgat cgaggacgac gaccgcaagc tgcccaagct ggacgagaag 900
accgccgact ccatccgcaa gggcctgacc ccccgctgga acgacctgga cgtgaaccag 960
cacgtgaaca acgtgaagta catcggctgg atcctggagt ccaccccccc cgaggtgctg 1020
gagacccagg agctgtgctc cctgaccctg gagtaccgcc gcgagtgcgg ccgcgagtcc 1080
gtgctggagt ccctgaccgc catggacccc tccggcggcg gctacggctc ccagttccag 1140
cacctgctgc gcctggagga cggcggcgag atcgtgaagg gccgcaccga gtggcgcccc 1200
aagaacggcg tgatcaacgg cgtggtgccc accggcgagt cctcccccgg cgactactcc 1260
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1320
gacgacaagt gaatcgat 1338
<210> 150
<211> 415
<212> PRT
<213> Cuphea hookeriana
<400> 150
Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Leu Pro Ser Ala
1 5 10 15
Asp Thr Ser Ser Arg Pro Gly Lys Leu Gly Asn Lys Pro Ser Ser Leu
20 25 30
Ser Pro Leu Lys Pro Lys Ser Thr Pro Asn Gly Gly Leu Gln Val Lys
35 40 45
Ala Asn Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Pro Val Gly Leu
50 55 60
Lys Ser Gly Gly Leu Lys Thr Gln Glu Asp Ala His Ser Ala Pro Pro
65 70 75 80
Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
85 90 95
Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
100 105 110
Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu
115 120 125
Gly Ser Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile
130 135 140
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val
145 150 155 160
Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ile Ala Gly
165 170 175
Leu Ser Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Tyr Lys Arg Asp
180 185 190
Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro
195 200 205
Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly
210 215 220
Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
225 230 235 240
Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys
245 250 255
Thr Arg Arg Leu Ser Lys Ile Pro Asp Glu Val Arg Asn Glu Ile Glu
260 265 270
Pro His Phe Val Asp Ser Pro Pro Val Ile Glu Asp Asp Asp Arg Lys
275 280 285
Leu Pro Lys Leu Asp Glu Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu
290 295 300
Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val
305 310 315 320
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Pro Glu Val Leu Glu
325 330 335
Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly
340 345 350
Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Met Asp Pro Ser Gly Gly
355 360 365
Gly Tyr Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly
370 375 380
Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Gly Val Ile
385 390 395 400
Asn Gly Val Val Pro Thr Gly Glu Ser Ser Pro Gly Asp Tyr Ser
405 410 415
<210> 151
<211> 1344
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 151
actagtatgg tggcctccat cgtggcctgg gccttcttcc ccaccccctc cttctccccc 60
accgggcgcg ccgcctccgc caaggcctcc aagaccatcg gcgagggctc cgagaacctg 120
aacgtgcgcg gcatcatcgc caagcccacc tcctcctccg ccgccaagca gggcaaggtg 180
atggcccagg ccgtgcccaa gatcaacggc gccaaggtgg gcctgaaggc cgagtcccag 240
aaggccgagg aggacgccgc cccctcctcc gccccccgca ccttctacaa ccagctgccc 300
gactggtccg tgctgctggc cgccgtgacc accatcttcc tggccgccga gaagcagtgg 360
accctgctgg actggaagcc ccgccgcccc gacatgctga ccggcgcctt ctccctgggc 420
aagatcgtgc aggacggcct ggtgttccgc cagaacttct ccatccgctc ctacgagatc 480
ggcgccgacc gcaccgcctc catcgagacc ctgatgaacc acctgcagga gaccgccctg 540
aaccacgtgc gcaacgccgg cctgctgggc gacggcttcg gcgccacccc cgagatgtcc 600
aagcgcaacc tgatctgggt ggtgaccaag atgcaggtgc tgatcgagca ctacccctcc 660
tggggcgacg tggtggaggt ggacacctgg gtgggcgcct ccggcaagaa cggcatgcgc 720
cgcgactggc acgtgcgcga ctaccgcacc ggccagacca tcctgcgcgc cacctccatc 780
tgggtgatga tggacaagca cacccgcaag ctgtccaaga tgcccgagga ggtgcgcgcc 840
gagatcggcc cctacttcat ggagcacgcc gccatcgtgg acgaggactc ccgcaagctg 900
cccaagctgg acgacgacac cgccgactac atcaagtggg gcctgacccc ccgctggtcc 960
gacctggacg tgaaccagca cgtgaacaac gtgaagtaca tcggctggat cctggagtcc 1020
gcccccatct ccatcctgga gaaccacgag ctggcctcca tgaccctgga gtaccgccgc 1080
gagtgcggcc gcgactccgt gctgcagtcc ctgaccgccg tggccaacga ctgcaccggc 1140
ggcctgcccg aggcctccat cgagtgccag cacctgctgc agctggagtg cggcgccgag 1200
atcgtgcgcg gccgcaccca gtggcgcccc cgccgcgcct ccggccccac ctccgccggc 1260
tccgccatgg actacaagga ccacgacggc gactacaagg accacgacat cgactacaag 1320
gacgacgacg acaagtgaat cgat 1344
<210> 152
<211> 417
<212> PRT
<213> Elaeis guiniensis
<400> 152
Met Val Ala Ser Ile Val Ala Trp Ala Phe Phe Pro Thr Pro Ser Phe
1 5 10 15
Ser Pro Thr Ala Ser Ala Lys Ala Ser Lys Thr Ile Gly Glu Gly Ser
20 25 30
Glu Asn Leu Asn Val Arg Gly Ile Ile Ala Lys Pro Thr Ser Ser Ser
35 40 45
Ala Ala Lys Gln Gly Lys Val Met Ala Gln Ala Val Pro Lys Ile Asn
50 55 60
Gly Ala Lys Val Gly Leu Lys Ala Glu Ser Gln Lys Ala Glu Glu Asp
65 70 75 80
Ala Ala Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp
85 90 95
Trp Ser Val Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu
100 105 110
Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu
115 120 125
Thr Gly Ala Phe Ser Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe
130 135 140
Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr
145 150 155 160
Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn
165 170 175
His Val Arg Asn Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala Thr Pro
180 185 190
Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Met Gln Val
195 200 205
Leu Ile Glu His Tyr Pro Ser Trp Gly Asp Val Val Glu Val Asp Thr
210 215 220
Trp Val Gly Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp His Val
225 230 235 240
Arg Asp Tyr Arg Thr Gly Gln Thr Ile Leu Arg Ala Thr Ser Ile Trp
245 250 255
Val Met Met Asp Lys His Thr Arg Lys Leu Ser Lys Met Pro Glu Glu
260 265 270
Val Arg Ala Glu Ile Gly Pro Tyr Phe Met Glu His Ala Ala Ile Val
275 280 285
Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asp Asp Asp Thr Ala Asp
290 295 300
Tyr Ile Lys Trp Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn
305 310 315 320
Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala
325 330 335
Pro Ile Ser Ile Leu Glu Asn His Glu Leu Ala Ser Met Thr Leu Glu
340 345 350
Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala
355 360 365
Val Ala Asn Asp Cys Thr Gly Gly Leu Pro Glu Ala Ser Ile Glu Cys
370 375 380
Gln His Leu Leu Gln Leu Glu Cys Gly Ala Glu Ile Val Arg Gly Arg
385 390 395 400
Thr Gln Trp Arg Pro Arg Arg Ala Ser Gly Pro Thr Ser Ala Gly Ser
405 410 415
Ala
<210> 153
<211> 1191
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 153
actagtatgc tgaagctgtc ctgcaacgtg accaacaacc tgcacacctt ctccttcttc 60
tccgactcct ccctgttcat ccccgtgaac cgccgcacca tcgccgtgtc ctccgggcgc 120
gcctcccagc tgcgcaagcc cgccctggac cccctgcgcg ccgtgatctc cgccgaccag 180
ggctccatct cccccgtgaa ctcctgcacc cccgccgacc gcctgcgcgc cggccgcctg 240
atggaggacg gctactccta caaggagaag ttcatcgtgc gctcctacga ggtgggcatc 300
aacaagaccg ccaccgtgga gaccatcgcc aacctgctgc aggaggtggc ctgcaaccac 360
gtgcagaagt gcggcttctc caccgacggc ttcgccacca ccctgaccat gcgcaagctg 420
cacctgatct gggtgaccgc ccgcatgcac atcgagatct acaagtaccc cgcctggtcc 480
gacgtggtgg agatcgagac ctggtgccag tccgagggcc gcatcggcac ccgccgcgac 540
tggatcctgc gcgactccgc caccaacgag gtgatcggcc gcgccacctc caagtgggtg 600
atgatgaacc aggacacccg ccgcctgcag cgcgtgaccg acgaggtgcg cgacgagtac 660
ctggtgttct gcccccgcga gccccgcctg gccttccccg aggagaacaa ctcctccctg 720
aagaagatcc ccaagctgga ggaccccgcc cagtactcca tgctggagct gaagccccgc 780
cgcgccgacc tggacatgaa ccagcacgtg aacaacgtga cctacatcgg ctgggtgctg 840
gagtccatcc cccaggagat catcgacacc cacgagctgc aggtgatcac cctggactac 900
cgccgcgagt gccagcagga cgacatcgtg gactccctga ccacctccga gatccccgac 960
gaccccatct ccaagttcac cggcaccaac ggctccgcca tgtcctccat ccagggccac 1020
aacgagtccc agttcctgca catgctgcgc ctgtccgaga acggccagga gatcaaccgc 1080
ggccgcaccc agtggcgcaa gaagtcctcc cgcatggact acaaggacca cgacggcgac 1140
tacaaggacc acgacatcga ctacaaggac gacgacgaca agtgaatcga t 1191
<210> 154
<211> 366
<212> PRT
<213> Brassica napus
<400> 154
Met Leu Lys Leu Ser Cys Asn Val Thr Asn Asn Leu His Thr Phe Ser
1 5 10 15
Phe Phe Ser Asp Ser Ser Leu Phe Ile Pro Val Asn Arg Arg Thr Ile
20 25 30
Ala Val Ser Ser Ser Gln Leu Arg Lys Pro Ala Leu Asp Pro Leu Arg
35 40 45
Ala Val Ile Ser Ala Asp Gln Gly Ser Ile Ser Pro Val Asn Ser Cys
50 55 60
Thr Pro Ala Asp Arg Leu Arg Ala Gly Arg Leu Met Glu Asp Gly Tyr
65 70 75 80
Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val Gly Ile Asn
85 90 95
Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu Leu Gln Glu Val Ala
100 105 110
Cys Asn His Val Gln Lys Cys Gly Phe Ser Thr Asp Gly Phe Ala Thr
115 120 125
Thr Leu Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg Met
130 135 140
His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Ser Asp Val Val Glu Ile
145 150 155 160
Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg Arg Asp Trp
165 170 175
Ile Leu Arg Asp Ser Ala Thr Asn Glu Val Ile Gly Arg Ala Thr Ser
180 185 190
Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Arg Val Thr
195 200 205
Asp Glu Val Arg Asp Glu Tyr Leu Val Phe Cys Pro Arg Glu Pro Arg
210 215 220
Leu Ala Phe Pro Glu Glu Asn Asn Ser Ser Leu Lys Lys Ile Pro Lys
225 230 235 240
Leu Glu Asp Pro Ala Gln Tyr Ser Met Leu Glu Leu Lys Pro Arg Arg
245 250 255
Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr Tyr Ile Gly
260 265 270
Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Ile Asp Thr His Glu Leu
275 280 285
Gln Val Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp Asp Ile
290 295 300
Val Asp Ser Leu Thr Thr Ser Glu Ile Pro Asp Asp Pro Ile Ser Lys
305 310 315 320
Phe Thr Gly Thr Asn Gly Ser Ala Met Ser Ser Ile Gln Gly His Asn
325 330 335
Glu Ser Gln Phe Leu His Met Leu Arg Leu Ser Glu Asn Gly Gln Glu
340 345 350
Ile Asn Arg Gly Arg Thr Gln Trp Arg Lys Lys Ser Ser Arg
355 360 365
<210> 155
<211> 1038
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 155
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
cgctcctacg aggtgggcat caacaagacc gccaccgtgg agaccatcgc caacctgctg 180
caggaggtgg gctgcaacca cgcccagtcc gtgggcttct ccaccgacgg cttcgccacc 240
accacctcca tgcgcaagat gcacctgatc tgggtgaccg cccgcatgca catcgagatc 300
tacaagtacc ccgcctggtc cgacgtggtg gaggtggaga cctggtgcca gtccgagggc 360
cgcatcggca cccgccgcga ctggatcctg accgactacg ccaccggcca gatcatcggc 420
cgcgccacct ccaagtgggt gatgatgaac caggacaccc gccgcctgca gaaggtgacc 480
gacgacgtgc gcgaggagta cctggtgttc tgcccccgcg agctgcgcct ggccttcccc 540
gaggagaaca accgctcctc caagaagatc tccaagctgg aggaccccgc ccagtactcc 600
aagctgggcc tggtgccccg ccgcgccgac ctggacatga accagcacgt gaacaacgtg 660
acctacatcg gctgggtgct ggagtccatc ccccaggaga tcatcgacac ccacgagctg 720
cagaccatca ccctggacta ccgccgcgag tgccagcacg acgacatcgt ggactccctg 780
acctccgtgg agccctccga gaacctggag gccgtgtccg agctgcgcgg caccaacggc 840
tccgccacca ccaccgccgg cgacgaggac tgccgcaact tcctgcacct gctgcgcctg 900
tccggcgacg gcctggagat caaccgcggc cgcaccgagt ggcgcaagaa gtccgcccgc 960
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1020
gacgacaagt gaatcgat 1038
<210> 156
<211> 371
<212> PRT
<213> Ricinus communis
<400> 156
Met Leu Lys Val Pro Cys Cys Asn Ala Thr Asp Pro Ile Gln Ser Leu
1 5 10 15
Ser Ser Gln Cys Arg Phe Leu Thr His Phe Asn Asn Arg Pro Tyr Phe
20 25 30
Thr Arg Arg Pro Ser Ile Pro Thr Phe Phe Ser Ser Lys Asn Ser Ser
35 40 45
Ala Ser Leu Gln Ala Val Val Ser Asp Ile Ser Ser Val Glu Ser Ala
50 55 60
Ala Cys Asp Ser Leu Ala Asn Arg Leu Arg Leu Gly Lys Leu Thr Glu
65 70 75 80
Asp Gly Phe Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val
85 90 95
Gly Ile Asn Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu Leu Gln
100 105 110
Glu Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly
115 120 125
Phe Ala Thr Thr Thr Ser Met Arg Lys Met His Leu Ile Trp Val Thr
130 135 140
Ala Arg Met His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Ser Asp Val
145 150 155 160
Val Glu Val Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg
165 170 175
Arg Asp Trp Ile Leu Thr Asp Tyr Ala Thr Gly Gln Ile Ile Gly Arg
180 185 190
Ala Thr Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln
195 200 205
Lys Val Thr Asp Asp Val Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg
210 215 220
Glu Leu Arg Leu Ala Phe Pro Glu Glu Asn Asn Arg Ser Ser Lys Lys
225 230 235 240
Ile Ser Lys Leu Glu Asp Pro Ala Gln Tyr Ser Lys Leu Gly Leu Val
245 250 255
Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr
260 265 270
Tyr Ile Gly Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Ile Asp Thr
275 280 285
His Glu Leu Gln Thr Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln His
290 295 300
Asp Asp Ile Val Asp Ser Leu Thr Ser Val Glu Pro Ser Glu Asn Leu
305 310 315 320
Glu Ala Val Ser Glu Leu Arg Gly Thr Asn Gly Ser Ala Thr Thr Thr
325 330 335
Ala Gly Asp Glu Asp Cys Arg Asn Phe Leu His Leu Leu Arg Leu Ser
340 345 350
Gly Asp Gly Leu Glu Ile Asn Arg Gly Arg Thr Glu Trp Arg Lys Lys
355 360 365
Ser Ala Arg
370
<210> 157
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 157
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgccaac 120
gcccacaccg tgcccaagat caacggcaac aaggccggcc tgctgacccc catggagagc 180
accaaggacg aggacatcgt cgcggccccc accgtggcgc ccaagcgcac cttcatcaac 240
cagctgcccg actggtcgat gctgctggcc gcgatcacca ccatcttcct ggcggccgag 300
aagcagtgga ccaacctgga ctggaagccc cgccgccccg acatgctggt cgacttcgac 360
cccttctccc tgggccgctt cgtgcaggac ggcctgatct tccgccagaa cttcagcatc 420
cgctcgtacg agatcggcgc ggaccgcacc gcctccatcg agaccctgat gaaccacctg 480
caggagaccg cgctgaacca cgtccgctgc atcggcctgc tggacgacgg cttcggcagc 540
acccccgaga tgacccgccg cgacctgatc tgggtggtca cccgcatgca ggtcctggtg 600
gaccgctacc cctcgtgggg cgacgtgatc gaggtcgact cctgggtgac ccccagcggc 660
aagaacggca tgaagcgcga gtggttcctg cgcgactgca agaccggcga gatcctgacc 720
cgcgccacct cggtctgggt gatgatgaac aagcgcaccc gccgcctgtc caagatcccc 780
gaggaggtcc gcgtggagat cgagccctac ttcgtcgagc acggcgtgct ggacgaggac 840
tcgcgcaagc tgcccaagct gaacgacaac accgccaact acatccgccg cggcctggcg 900
ccccgctggt ccgacctgga cgtcaaccag cacgtgaaca acgtcaagta catcggctgg 960
atcctggaga gcgtgcccag cagcctgctg gagtcgcacg agctgtacgg catgaccctg 1020
gagtaccgca aggagtgcgg caaggacggc ctgctgcagt ccctgaccgc cgtcgccagc 1080
gactacggcg gcggctcgct ggaggccggc gtggagtgcg accacctgct gcgcctggag 1140
gacggctccg agatcatgcg cggcaagacc gagtggcgcc ccaagcgcgc cgcgaacacc 1200
acctacttcg gcagcgtcga cgacatcccc cccgccaaca acgcgtga 1248
<210> 158
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 158
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Ala Asn Ala His Thr Val Pro Lys Ile Asn
35 40 45
Gly Asn Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu
50 55 60
Asp Ile Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn
65 70 75 80
Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe
85 90 95
Leu Ala Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg
100 105 110
Pro Asp Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val
115 120 125
Gln Asp Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu
130 135 140
Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu
145 150 155 160
Gln Glu Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp
165 170 175
Gly Phe Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val
180 185 190
Val Thr Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp
195 200 205
Val Ile Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met
210 215 220
Lys Arg Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr
225 230 235 240
Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu
245 250 255
Ser Lys Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val
260 265 270
Glu His Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn
275 280 285
Asp Asn Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser
290 295 300
Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp
305 310 315 320
Ile Leu Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr
325 330 335
Gly Met Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu
340 345 350
Gln Ser Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu
355 360 365
Ala Gly Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu
370 375 380
Ile Met Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr
385 390 395 400
Thr Tyr Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala
405 410 415
<210> 159
<211> 2333
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 159
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa acggcgcgcc atgctgctgc aggccttcct gttcctgctg gccggcttcg 360
ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 420
cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 480
agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 540
ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 600
cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 660
ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 720
acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 780
ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 840
tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 900
agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 960
acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 1020
aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 1080
gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 1140
acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 1200
acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 1260
ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 1320
tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 1380
tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 1440
aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 1500
tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 1560
ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 1620
cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 1680
tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 1740
acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 1800
tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 1860
cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 1920
aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 1980
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2040
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2100
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2160
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2220
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2280
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcc 2333
<210> 160
<211> 1233
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 160
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
acccaggagg acgcccactc cgcccccccc ccccgcacct tcatcaacca gctgcccgac 180
tggtccatgc tgctggccgc catcaccacc gtgttcctgg ccgccgagaa gcagtggatg 240
atgctggact ggaagcccaa gcgccccgac atgctggtgg accccttcgg cctgggctcc 300
atcgtgcagg acggcctggt gttccgccag aacttctcca tccgctccta cgagatcggc 360
gccgaccgca ccgcctccat cgagaccgtg atgaaccacc tgcaggagac cgccctgaac 420
cacgtgaaga tcgccggcct gtccaacgac ggcttcggcc gcacccccga gatgtacaag 480
cgcgacctga tctgggtggt ggccaagatg caggtgatgg tgaaccgcta ccccacctgg 540
ggcgacaccg tggaggtgaa cacctgggtg gccaagtccg gcaagaacgg catgcgccgc 600
gactggctga tctccgactg caacaccggc gagatcctga cccgcgcctc ctccgtgtgg 660
gtgatgatga accagaagac ccgccgcctg tccaagatcc ccgacgaggt gcgcaacgag 720
atcgagcccc acttcgtgga ctcccccccc gtgatcgagg acgacgaccg caagctgccc 780
aagctggacg agaagaccgc cgactccatc cgcaagggcc tgaccccccg ctggaacgac 840
ctggacgtga accagcacgt gaacaacgtg aagtacatcg gctggatcct ggagtccacc 900
ccccccgagg tgctggagac ccaggagctg tgctccctga ccctggagta ccgccgcgag 960
tgcggccgcg agtccgtgct ggagtccctg accgccatgg acccctccgg cggcggctac 1020
ggctcccagt tccagcacct gctgcgcctg gaggacggcg gcgagatcgt gaagggccgc 1080
accgagtggc gccccaagaa cggcgtgatc aacggcgtgg tgcccaccgg cgagtcctcc 1140
cccggcgact actccatgga ctacaaggac cacgacggcg actacaagga ccacgacatc 1200
gactacaagg acgacgacga caagtgaatc gat 1233
<210> 161
<211> 1344
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 161
actagtatgg tggcctccat cgccgcctcc gccttcttcc ccaccccctc cttctccccc 60
accgggcgcg ccgcctccgc caaggcctcc aagaccatcg gcgagggctc cgagaacctg 120
gacgcccgcg gcatcatcgc caagcccacc tcctcctccg ccgccatgca gggcaaggtg 180
atggcccagg ccgtgtccaa gatcaacggc gccaaggtgg gcctgaaggc cgagtcccag 240
aaggccgagg aggacgccgc cccctcctcc gccccccgca ccttctacaa ccagctgccc 300
gactggtccg tgctgctggc cgccgtgacc accatcttcc tggccgccga gaagcagtgg 360
accctgctgg actggaagcc ccgccgcccc gacatgctga ccgacgcctt ctccctgggc 420
aagatcgtgc aggacggcct ggtgttcaag cagaacttct ccatccgctc ctacgagatc 480
ggcgccgacc gcaccgcctc catcgagacc ctgatgaacc acctgcagga gaccgccctg 540
aaccacgtgc gctccgccgg cctgatgggc gacggcttcg gcgccacccc cgagatgtcc 600
aagcgcaacc tgatctgggt ggtgaccaag gtgcgcgtgc tgatcgagca ctacccctcc 660
tggggcgacg tggtggaggt ggacacctgg gtgggccccg ccggcaagaa cggcatgcgc 720
cgcgactggc acgtgcgcga ccaccgcacc ggccagacca tcctgcgcgc cacccgcgtg 780
tgggtgatga tgaacaagaa cacccgcaag ctgtccaagg tgcccgagga ggtgcgcgcc 840
gagatcggcc cctacttcgt ggagcgcgcc gccatcgtgg acgaggactc ccgcaagctg 900
cccaagctgg acgaggacac caccgactac gtgaagaagg gcctgacccc ccgctggtcc 960
gacctggacg tgaaccagca cgtgaacaac gtgaagtaca tcggctggat cctggagtcc 1020
gcccccatct ccatcctgga gaaccacgag ctggcctcca tgaccctgga gtaccgccgc 1080
gagtgcggcc gcgactccgt gctgcagtcc ctgaccgccg tggccaacga ctgcaccggc 1140
ggcctgcccg aggcctccat cgagtgccag cacctgctgc agctggagtg cggcgccgag 1200
atcgtgcgcg gccgcaccca gtggcgcccc cgccgcgcct ccggccccac ctccgccggc 1260
tccgccatgg actacaagga ccacgacggc gactacaagg accacgacat cgactacaag 1320
gacgacgacg acaagtgaat cgat 1344
<210> 162
<211> 417
<212> PRT
<213> Elaeis guiniensis
<400> 162
Met Val Ala Ser Ile Ala Ala Ser Ala Phe Phe Pro Thr Pro Ser Phe
1 5 10 15
Ser Pro Thr Ala Ser Ala Lys Ala Ser Lys Thr Ile Gly Glu Gly Ser
20 25 30
Glu Asn Leu Asp Ala Arg Gly Ile Ile Ala Lys Pro Thr Ser Ser Ser
35 40 45
Ala Ala Met Gln Gly Lys Val Met Ala Gln Ala Val Ser Lys Ile Asn
50 55 60
Gly Ala Lys Val Gly Leu Lys Ala Glu Ser Gln Lys Ala Glu Glu Asp
65 70 75 80
Ala Ala Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp
85 90 95
Trp Ser Val Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu
100 105 110
Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu
115 120 125
Thr Asp Ala Phe Ser Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe
130 135 140
Lys Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr
145 150 155 160
Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn
165 170 175
His Val Arg Ser Ala Gly Leu Met Gly Asp Gly Phe Gly Ala Thr Pro
180 185 190
Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Val Arg Val
195 200 205
Leu Ile Glu His Tyr Pro Ser Trp Gly Asp Val Val Glu Val Asp Thr
210 215 220
Trp Val Gly Pro Ala Gly Lys Asn Gly Met Arg Arg Asp Trp His Val
225 230 235 240
Arg Asp His Arg Thr Gly Gln Thr Ile Leu Arg Ala Thr Arg Val Trp
245 250 255
Val Met Met Asn Lys Asn Thr Arg Lys Leu Ser Lys Val Pro Glu Glu
260 265 270
Val Arg Ala Glu Ile Gly Pro Tyr Phe Val Glu Arg Ala Ala Ile Val
275 280 285
Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asp Glu Asp Thr Thr Asp
290 295 300
Tyr Val Lys Lys Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn
305 310 315 320
Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala
325 330 335
Pro Ile Ser Ile Leu Glu Asn His Glu Leu Ala Ser Met Thr Leu Glu
340 345 350
Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala
355 360 365
Val Ala Asn Asp Cys Thr Gly Gly Leu Pro Glu Ala Ser Ile Glu Cys
370 375 380
Gln His Leu Leu Gln Leu Glu Cys Gly Ala Glu Ile Val Arg Gly Arg
385 390 395 400
Thr Gln Trp Arg Pro Arg Arg Ala Ser Gly Pro Thr Ser Ala Gly Ser
405 410 415
Ala
<210> 163
<211> 595
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 163
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tagcagcatg 120
tacctggcct ttgacatcgc ggtcatgtcc ctgctctacg tcgcgtcgac gtacatcgac 180
cctgcaccgg tgcctacgtg ggtcaagtac ggcatcatgt ggccgctcta ctggttcttc 240
caggtgtgtt tgagggtttt ggttgcccgt attgaggtcc tggtggcgcg catggaggag 300
aaggcgcctg tcccgctgac ccccccggct accctcccgg caccttccag ggcgcgtacg 360
ggaagaacca gtagagcggc cacatgatgc cgtacttgac ccacgtaggc accggtgcag 420
ggtcgatgta cgtcgacgcg acgtagagca gggacatgac cgcgatgtca aaggccaggt 480
acatgctgct acgaagcgcc gagcgctcga aacagtgcgc ggggatggcc ttgcgcagcg 540
tcccgatcgt gaacggaggc ttctccacag gctgcctgtt cgtcttgata gccat 595
<210> 164
<211> 6101
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 164
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300
gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360
accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420
cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480
tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540
tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600
gtccgtgtca tccactctaa agagctcgac tacgacctac tgatggccct agattcttca 3660
tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720
ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780
ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840
ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900
gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960
aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020
cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080
ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140
gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200
gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260
aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320
ggcccacagg ccggtcgcag ccactagtat ggctatcaag acgaacaggc agcctgtgga 4380
gaagcctccg ttcacgatcg ggacgctgcg caaggccatc cccgcgcact gtttcgagcg 4440
ctcggcgctt cgtagcagca tgtacctggc ctttgacatc gcggtcatgt ccctgctcta 4500
cgtcgcgtcg acgtacatcg accctgcacc ggtgcctacg tgggtcaagt acggcatcat 4560
gtggccgctc tactggttct tccaggtgtg tttgagggtt ttggttgccc gtattgaggt 4620
cctggtggcg cgcatggagg agaaggcgcc tgtcccgctg acccccccgg ctaccctccc 4680
ggcaccttcc agggcgcgta cgggaagaac cagtagagcg gccacatgat gccgtacttg 4740
acccacgtag gcaccggtgc agggtcgatg tacgtcgacg cgacgtagag cagggacatg 4800
accgcgatgt caaaggccag gtacatgctg ctacgaagcg ccgagcgctc gaaacagtgc 4860
gcggggatgg ccttgcgcag cgtcccgatc gtgaacggag gcttctccac aggctgcctg 4920
ttcgtcttga tagccatctc gaggcagcag cagctcggat agtatcgaca cactctggac 4980
gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 5040
ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 5100
ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 5160
gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 5220
tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 5280
gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5340
atggaaagct gtagagctct tgttttccag aaggagttgc tccttgagcc tttcattctc 5400
agcctcgata acctccaaag ccgctctaat tgtggagggg gttcgaattt aaaagcttgg 5460
aatgttggtt cgtgcgtctg gaacaagccc agacttgttg ctcactggga aaaggaccat 5520
cagctccaaa aaacttgccg ctcaaaccgc gtacctctgc tttcgcgcaa tctgccctgt 5580
tgaaatcgcc accacattca tattgtgacg cttgagcagt ctgtaattgc ctcagaatgt 5640
ggaatcatct gccccctgtg cgagcccatg ccaggcatgt cgcgggcgag gacacccgcc 5700
actcgtacag cagaccatta tgctacctca caatagttca taacagtgac catatttctc 5760
gaagctcccc aacgagcacc tccatgctct gagtggccac cccccggccc tggtgcttgc 5820
ggagggcagg tcaaccggca tggggctacc gaaatccccg accggatccc accacccccg 5880
cgatgggaag aatctctccc cgggatgtgg gcccaccacc agcacaacct gctggcccag 5940
gcgagcgtca aaccatacca cacaaatatc cttggcatcg gccctgaatt ccttctgccg 6000
ctctgctacc cggtgcttct gtccgaagca ggggttgcta gggatcgctc cgagtccgca 6060
aacccttgtc gcgtggcggg gcttgttcga gcttgaagag c 6101
<210> 165
<211> 595
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 165
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tagcagcatg 120
tacctggcct ttgacatcgc ggtcatgtcc ctgctctacg tcgcgtcgac gtacatcgac 180
cctgcaccgg tgcctacgtg ggtcaagtac ggcatcatgt ggccgctcta ctggttcttc 240
caggtgtgtt tgagggtttt ggttgcccgt attgaggtcc tggtggcgcg catggaggag 300
aaggcgcctg tcccgctgac ccccccggct accctcccgg caccttccag ggcgcgtacg 360
ggaagaacca gtagagcggc cacatgatgc cgtacttgac ccacgtaggc accggtgcag 420
ggtcgatgta cgtcgacgcg acgtagagca gggacatgac cgcgatgtca aaggccaggt 480
acatgctgct acgaagcgcc gagcgctcga aacagtgcgc ggggatggcc ttgcgcagcg 540
tcccgatcgt gaacggaggc ttctccacag gctgcctgtt cgtcttgata gccat 595
<210> 166
<211> 5348
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 166
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta tgacacttcc 3300
agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac accgatgatg 3360
cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc tccagggcga 3420
gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct accaaagcca 3480
tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg tgatcgcact 3540
ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca ctagtatggc 3600
tatcaagacg aacaggcagc ctgtggagaa gcctccgttc acgatcggga cgctgcgcaa 3660
ggccatcccc gcgcactgtt tcgagcgctc ggcgcttcgt agcagcatgt acctggcctt 3720
tgacatcgcg gtcatgtccc tgctctacgt cgcgtcgacg tacatcgacc ctgcaccggt 3780
gcctacgtgg gtcaagtacg gcatcatgtg gccgctctac tggttcttcc aggtgtgttt 3840
gagggttttg gttgcccgta ttgaggtcct ggtggcgcgc atggaggaga aggcgcctgt 3900
cccgctgacc cccccggcta ccctcccggc accttccagg gcgcgtacgg gaagaaccag 3960
tagagcggcc acatgatgcc gtacttgacc cacgtaggca ccggtgcagg gtcgatgtac 4020
gtcgacgcga cgtagagcag ggacatgacc gcgatgtcaa aggccaggta catgctgcta 4080
cgaagcgccg agcgctcgaa acagtgcgcg gggatggcct tgcgcagcgt cccgatcgtg 4140
aacggaggct tctccacagg ctgcctgttc gtcttgatag ccatctcgag gcagcagcag 4200
ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact 4260
tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat 4320
cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc 4380
cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt 4440
cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt 4500
gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc 4560
acgggaagta gtgggatggg aacacaaatg gaaagctgta gagctcttgt tttccagaag 4620
gagttgctcc ttgagccttt cattctcagc ctcgataacc tccaaagccg ctctaattgt 4680
ggagggggtt cgaatttaaa agcttggaat gttggttcgt gcgtctggaa caagcccaga 4740
cttgttgctc actgggaaaa ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta 4800
cctctgcttt cgcgcaatct gccctgttga aatcgccacc acattcatat tgtgacgctt 4860
gagcagtctg taattgcctc agaatgtgga atcatctgcc ccctgtgcga gcccatgcca 4920
ggcatgtcgc gggcgaggac acccgccact cgtacagcag accattatgc tacctcacaa 4980
tagttcataa cagtgaccat atttctcgaa gctccccaac gagcacctcc atgctctgag 5040
tggccacccc ccggccctgg tgcttgcgga gggcaggtca accggcatgg ggctaccgaa 5100
atccccgacc ggatcccacc acccccgcga tgggaagaat ctctccccgg gatgtgggcc 5160
caccaccagc acaacctgct ggcccaggcg agcgtcaaac cataccacac aaatatcctt 5220
ggcatcggcc ctgaattcct tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg 5280
gttgctaggg atcgctccga gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct 5340
tgaagagc 5348
<210> 167
<211> 1220
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 167
actagttcac ttgtggaacc agagcgcgga gtcgtcctcg ggcgcgtccg ggacgacgta 60
gcggcagtcg cgccagtcct cccacagggc gcggccgacc cagcggctgt cggactggta 120
gtacttgccc aggatgggcc tgatggcggc ggaggcctcc tcggcgtggt agtgcgggat 180
ggtgctgaag aggtggtgca gcacgtgggt gtcggagatg tggtgcagga tgttgtccat 240
gaagggcggg cccatggagc ggtccacggt ggccatggcg ccgcgcagcc agtcccagtc 300
cttctcgaag tagtgcggca gcgccgggtg cgtgtgctgg agcagcgtga tgagcacgag 360
ccacatgttc acgatcaggt agggcaccac gtaggtcttg accagccagg cccagcccat 420
ggtgcggccc agcacgctga gcccgctgag caccgccacc agcgccaggt cggagatgac 480
cacctcgatg cgctcgcgct tgctgaagat gggcgaccac gggtcaaagt ggttggcgaa 540
gcgcgggtac ggccgcgagg cgacgttgaa catgaggtac agcggccagc ccagggtcag 600
ggtgaccagc accttgccca tgcggatggg cagccactcc tcccactcca ggccctcgtg 660
cgccactgcg cggtgcggcg gcacaaacac ctcgtccttg tccaggcacc ccgtgttgga 720
gtggtggcgg cggtgcgagt gcttccagga gtagtagggc accagcagca ggctgtggaa 780
caccaggccc acgccgtcgt tgatggcctg gctggaggaa aaggcctggt ggccgcactc 840
gtgcgcgcac acccagacac ccgtgccgaa ggcgccctgg aaggtgccgg gagggtagcc 900
gggggggtca gcgggacagg cgccttctcc tccatgcgcg ccaccaggac ctcaatacgg 960
gcaaccaaaa ccctcaaaca cacctggaag aaccagtaga gcggccacat gatgccgtac 1020
ttgacccacg taggcaccgg tgcagggtcg atgtacgtcg acgcgacgta gagcagggac 1080
atgaccgcga tgtcaaaggc caggtacatg ctgctacgaa gcgccgagcg ctcgaaacag 1140
tgcgcgggga tggccttgcg cagcgtcccg atcgtgaacg gaggcttctc cacaggctgc 1200
ctgttcgtct tgatagccat 1220
<210> 168
<211> 6726
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 168
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300
gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360
accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420
cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480
tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540
tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600
gtccgtgtca tccactctaa agagctcgac tacgacctac tgatggccct agattcttca 3660
tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720
ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780
ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840
ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900
gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960
aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020
cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080
ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140
gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200
gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260
aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320
ggcccacagg ccggtcgcag ccactagttc acttgtggaa ccagagcgcg gagtcgtcct 4380
cgggcgcgtc cgggacgacg tagcggcagt cgcgccagtc ctcccacagg gcgcggccga 4440
cccagcggct gtcggactgg tagtacttgc ccaggatggg cctgatggcg gcggaggcct 4500
cctcggcgtg gtagtgcggg atggtgctga agaggtggtg cagcacgtgg gtgtcggaga 4560
tgtggtgcag gatgttgtcc atgaagggcg ggcccatgga gcggtccacg gtggccatgg 4620
cgccgcgcag ccagtcccag tccttctcga agtagtgcgg cagcgccggg tgcgtgtgct 4680
ggagcagcgt gatgagcacg agccacatgt tcacgatcag gtagggcacc acgtaggtct 4740
tgaccagcca ggcccagccc atggtgcggc ccagcacgct gagcccgctg agcaccgcca 4800
ccagcgccag gtcggagatg accacctcga tgcgctcgcg cttgctgaag atgggcgacc 4860
acgggtcaaa gtggttggcg aagcgcgggt acggccgcga ggcgacgttg aacatgaggt 4920
acagcggcca gcccagggtc agggtgacca gcaccttgcc catgcggatg ggcagccact 4980
cctcccactc caggccctcg tgcgccactg cgcggtgcgg cggcacaaac acctcgtcct 5040
tgtccaggca ccccgtgttg gagtggtggc ggcggtgcga gtgcttccag gagtagtagg 5100
gcaccagcag caggctgtgg aacaccaggc ccacgccgtc gttgatggcc tggctggagg 5160
aaaaggcctg gtggccgcac tcgtgcgcgc acacccagac acccgtgccg aaggcgccct 5220
ggaaggtgcc gggagggtag ccgggggggt cagcgggaca ggcgccttct cctccatgcg 5280
cgccaccagg acctcaatac gggcaaccaa aaccctcaaa cacacctgga agaaccagta 5340
gagcggccac atgatgccgt acttgaccca cgtaggcacc ggtgcagggt cgatgtacgt 5400
cgacgcgacg tagagcaggg acatgaccgc gatgtcaaag gccaggtaca tgctgctacg 5460
aagcgccgag cgctcgaaac agtgcgcggg gatggccttg cgcagcgtcc cgatcgtgaa 5520
cggaggcttc tccacaggct gcctgttcgt cttgatagcc atctcgaggc agcagcagct 5580
cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 5640
ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 5700
tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 5760
gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 5820
tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 5880
gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 5940
gggaagtagt gggatgggaa cacaaatgga aagctgtaga gctcttgttt tccagaagga 6000
gttgctcctt gagcctttca ttctcagcct cgataacctc caaagccgct ctaattgtgg 6060
agggggttcg aatttaaaag cttggaatgt tggttcgtgc gtctggaaca agcccagact 6120
tgttgctcac tgggaaaagg accatcagct ccaaaaaact tgccgctcaa accgcgtacc 6180
tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac attcatattg tgacgcttga 6240
gcagtctgta attgcctcag aatgtggaat catctgcccc ctgtgcgagc ccatgccagg 6300
catgtcgcgg gcgaggacac ccgccactcg tacagcagac cattatgcta cctcacaata 6360
gttcataaca gtgaccatat ttctcgaagc tccccaacga gcacctccat gctctgagtg 6420
gccacccccc ggccctggtg cttgcggagg gcaggtcaac cggcatgggg ctaccgaaat 6480
ccccgaccgg atcccaccac ccccgcgatg ggaagaatct ctccccggga tgtgggccca 6540
ccaccagcac aacctgctgg cccaggcgag cgtcaaacca taccacacaa atatccttgg 6600
catcggccct gaattccttc tgccgctctg ctacccggtg cttctgtccg aagcaggggt 6660
tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg gcggggcttg ttcgagcttg 6720
aagagc 6726
<210> 169
<211> 1220
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 169
actagttcac ttgtggaacc agagcgcgga gtcgtcctcg ggcgcgtccg ggacgacgta 60
gcggcagtcg cgccagtcct cccacagggc gcggccgacc cagcggctgt cggactggta 120
gtacttgccc aggatgggcc tgatggcggc ggaggcctcc tcggcgtggt agtgcgggat 180
ggtgctgaag aggtggtgca gcacgtgggt gtcggagatg tggtgcagga tgttgtccat 240
gaagggcggg cccatggagc ggtccacggt ggccatggcg ccgcgcagcc agtcccagtc 300
cttctcgaag tagtgcggca gcgccgggtg cgtgtgctgg agcagcgtga tgagcacgag 360
ccacatgttc acgatcaggt agggcaccac gtaggtcttg accagccagg cccagcccat 420
ggtgcggccc agcacgctga gcccgctgag caccgccacc agcgccaggt cggagatgac 480
cacctcgatg cgctcgcgct tgctgaagat gggcgaccac gggtcaaagt ggttggcgaa 540
gcgcgggtac ggccgcgagg cgacgttgaa catgaggtac agcggccagc ccagggtcag 600
ggtgaccagc accttgccca tgcggatggg cagccactcc tcccactcca ggccctcgtg 660
cgccactgcg cggtgcggcg gcacaaacac ctcgtccttg tccaggcacc ccgtgttgga 720
gtggtggcgg cggtgcgagt gcttccagga gtagtagggc accagcagca ggctgtggaa 780
caccaggccc acgccgtcgt tgatggcctg gctggaggaa aaggcctggt ggccgcactc 840
gtgcgcgcac acccagacac ccgtgccgaa ggcgccctgg aaggtgccgg gagggtagcc 900
gggggggtca gcgggacagg cgccttctcc tccatgcgcg ccaccaggac ctcaatacgg 960
gcaaccaaaa ccctcaaaca cacctggaag aaccagtaga gcggccacat gatgccgtac 1020
ttgacccacg taggcaccgg tgcagggtcg atgtacgtcg acgcgacgta gagcagggac 1080
atgaccgcga tgtcaaaggc caggtacatg ctgctacgaa gcgccgagcg ctcgaaacag 1140
tgcgcgggga tggccttgcg cagcgtcccg atcgtgaacg gaggcttctc cacaggctgc 1200
ctgttcgtct tgatagccat 1220
<210> 170
<211> 5973
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 170
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta tgacacttcc 3300
agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac accgatgatg 3360
cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc tccagggcga 3420
gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct accaaagcca 3480
tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg tgatcgcact 3540
ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca ctagttcact 3600
tgtggaacca gagcgcggag tcgtcctcgg gcgcgtccgg gacgacgtag cggcagtcgc 3660
gccagtcctc ccacagggcg cggccgaccc agcggctgtc ggactggtag tacttgccca 3720
ggatgggcct gatggcggcg gaggcctcct cggcgtggta gtgcgggatg gtgctgaaga 3780
ggtggtgcag cacgtgggtg tcggagatgt ggtgcaggat gttgtccatg aagggcgggc 3840
ccatggagcg gtccacggtg gccatggcgc cgcgcagcca gtcccagtcc ttctcgaagt 3900
agtgcggcag cgccgggtgc gtgtgctgga gcagcgtgat gagcacgagc cacatgttca 3960
cgatcaggta gggcaccacg taggtcttga ccagccaggc ccagcccatg gtgcggccca 4020
gcacgctgag cccgctgagc accgccacca gcgccaggtc ggagatgacc acctcgatgc 4080
gctcgcgctt gctgaagatg ggcgaccacg ggtcaaagtg gttggcgaag cgcgggtacg 4140
gccgcgaggc gacgttgaac atgaggtaca gcggccagcc cagggtcagg gtgaccagca 4200
ccttgcccat gcggatgggc agccactcct cccactccag gccctcgtgc gccactgcgc 4260
ggtgcggcgg cacaaacacc tcgtccttgt ccaggcaccc cgtgttggag tggtggcggc 4320
ggtgcgagtg cttccaggag tagtagggca ccagcagcag gctgtggaac accaggccca 4380
cgccgtcgtt gatggcctgg ctggaggaaa aggcctggtg gccgcactcg tgcgcgcaca 4440
cccagacacc cgtgccgaag gcgccctgga aggtgccggg agggtagccg ggggggtcag 4500
cgggacaggc gccttctcct ccatgcgcgc caccaggacc tcaatacggg caaccaaaac 4560
cctcaaacac acctggaaga accagtagag cggccacatg atgccgtact tgacccacgt 4620
aggcaccggt gcagggtcga tgtacgtcga cgcgacgtag agcagggaca tgaccgcgat 4680
gtcaaaggcc aggtacatgc tgctacgaag cgccgagcgc tcgaaacagt gcgcggggat 4740
ggccttgcgc agcgtcccga tcgtgaacgg aggcttctcc acaggctgcc tgttcgtctt 4800
gatagccatc tcgaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 4860
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 4920
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 4980
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 5040
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 5100
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 5160
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag 5220
ctgtagagct cttgttttcc agaaggagtt gctccttgag cctttcattc tcagcctcga 5280
taacctccaa agccgctcta attgtggagg gggttcgaat ttaaaagctt ggaatgttgg 5340
ttcgtgcgtc tggaacaagc ccagacttgt tgctcactgg gaaaaggacc atcagctcca 5400
aaaaacttgc cgctcaaacc gcgtacctct gctttcgcgc aatctgccct gttgaaatcg 5460
ccaccacatt catattgtga cgcttgagca gtctgtaatt gcctcagaat gtggaatcat 5520
ctgccccctg tgcgagccca tgccaggcat gtcgcgggcg aggacacccg ccactcgtac 5580
agcagaccat tatgctacct cacaatagtt cataacagtg accatatttc tcgaagctcc 5640
ccaacgagca cctccatgct ctgagtggcc accccccggc cctggtgctt gcggagggca 5700
ggtcaaccgg catggggcta ccgaaatccc cgaccggatc ccaccacccc cgcgatggga 5760
agaatctctc cccgggatgt gggcccacca ccagcacaac ctgctggccc aggcgagcgt 5820
caaaccatac cacacaaata tccttggcat cggccctgaa ttccttctgc cgctctgcta 5880
cccggtgctt ctgtccgaag caggggttgc tagggatcgc tccgagtccg caaacccttg 5940
tcgcgtggcg gggcttgttc gagcttgaag agc 5973
<210> 171
<211> 1221
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 171
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
gaggtgcacg tgcaggtgac ccactccctg gcccccgaga agcgcgagat cttcaactcc 180
ctgaacaact gggcccagga gaacatcctg gtgctgctga aggacgtgga caagtgctgg 240
cagccctccg acttcctgcc cgactccgcc tccgagggct tcgacgagca ggtgatggag 300
ctgcgcaagc gctgcaagga gatccccgac gactacttca tcgtgctggt gggcgacatg 360
atcaccgagg aggccctgcc cacctaccag accatgctga acaccctgga cggcgtgcgc 420
gacgagaccg gcgcctccct gaccccctgg gccatctgga cccgcgcctg gaccgccgag 480
gagaaccgcc acggcgacct gctgaacaag tacctgtacc tgtccggccg cgtggacatg 540
aagcagatcg agaagaccat ccagtacctg atcggctccg gcatggaccc ccgcaccgag 600
aacaacccct acctgggctt catctacacc tccttccagg agcgcgccac cttcatctcc 660
cacggcaaca ccgcccgcct ggccaaggag cacggcgacc tgaagctggc ccagatctgc 720
ggcatcatcg ccgccgacga gaagcgccac gagaccgcct acaccaagat cgtggagaag 780
ctgttcgaga tcgaccccga cggcaccgtg ctggccctgg ccgacatgat gcgcaagaag 840
gtgtccatgc ccgcccacct gatgtacgac ggccaggacg acaacctgtt cgagaacttc 900
tcctccgtgg cccagcgcct gggcgtgtac accgccaagg actacgccga catcctggag 960
ttcctggtgg gccgctggga catcgagaag ctgaccggcc tgtccggcga gggccgcaag 1020
gcccaggact acgtgtgcac cctgcccccc cgcatccgcc gcctggagga gcgcgcccag 1080
tcccgcgtga agaaggcctc cgccaccccc ttctcctgga tcttcggccg cgagatcaac 1140
ctgatggact acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac 1200
gacgacgaca agtgaatcga t 1221
<210> 172
<211> 390
<212> PRT
<213> Olea europaea
<400> 172
Met Ala Leu Lys Leu Cys Phe Pro Pro His Lys Met Pro Ser Phe Pro
1 5 10 15
Asp Ala Arg Ile Arg Ser His Arg Val Phe Met Ala Ser Thr Ile His
20 25 30
Ser Pro Ser Met Glu Val Gly Lys Val Lys Lys Pro Phe Thr Pro Pro
35 40 45
Arg Glu Val His Val Gln Val Thr His Ser Leu Ala Pro Glu Lys Arg
50 55 60
Glu Ile Phe Asn Ser Leu Asn Asn Trp Ala Gln Glu Asn Ile Leu Val
65 70 75 80
Leu Leu Lys Asp Val Asp Lys Cys Trp Gln Pro Ser Asp Phe Leu Pro
85 90 95
Asp Ser Ala Ser Glu Gly Phe Asp Glu Gln Val Met Glu Leu Arg Lys
100 105 110
Arg Cys Lys Glu Ile Pro Asp Asp Tyr Phe Ile Val Leu Val Gly Asp
115 120 125
Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn Thr
130 135 140
Leu Asp Gly Val Arg Asp Glu Thr Gly Ala Ser Leu Thr Pro Trp Ala
145 150 155 160
Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn Arg His Gly Asp Leu
165 170 175
Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val Asp Met Lys Gln Ile
180 185 190
Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg Thr
195 200 205
Glu Asn Asn Pro Tyr Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu Arg
210 215 220
Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg Leu Ala Lys Glu His
225 230 235 240
Gly Asp Leu Lys Leu Ala Gln Ile Cys Gly Ile Ile Ala Ala Asp Glu
245 250 255
Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Val Glu Lys Leu Phe Glu
260 265 270
Ile Asp Pro Asp Gly Thr Val Leu Ala Leu Ala Asp Met Met Arg Lys
275 280 285
Lys Val Ser Met Pro Ala His Leu Met Tyr Asp Gly Gln Asp Asp Asn
290 295 300
Leu Phe Glu Asn Phe Ser Ser Val Ala Gln Arg Leu Gly Val Tyr Thr
305 310 315 320
Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe Leu Val Gly Arg Trp Asp
325 330 335
Ile Glu Lys Leu Thr Gly Leu Ser Gly Glu Gly Arg Lys Ala Gln Asp
340 345 350
Tyr Val Cys Thr Leu Pro Pro Arg Ile Arg Arg Leu Glu Glu Arg Ala
355 360 365
Gln Ser Arg Val Lys Lys Ala Ser Ala Thr Pro Phe Ser Trp Ile Phe
370 375 380
Gly Arg Glu Ile Asn Leu
385 390
<210> 173
<211> 1254
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 173
actagtatgg gcggcggcgg ccgcatgtcc accgtgatca cctccaacaa ctccgagaag 60
aagggcggct cctcccacct gaagcgcgcc ccccacacca agcccccctt caccctgggc 120
gacctgaagc gcgccatccc cccccactgc ttcgagcgct ccttcgtgcg cgggcgcgcc 180
tccttctcct acgtggccta cgacgtgtgc ctgtccttcc tgttctactc catcgccacc 240
aacttcttcc cctacatctc ctcccccctg tcctacgtgg cctggctggt gtactggctg 300
ttccagggct gcatcctgac cggcctgtgg gtgatcggcc acgagtgcgg ccaccacgcc 360
ttctccgagt accagctggc cgacgacatc gtgggcctga tcgtgcactc cgccctgctg 420
gtgccctact tctcctggaa gtactcccac cgccgccacc actccaacat cggctccctg 480
gagcgcgacg aggtgttcgt gcccaagtcc aagtccaaga tctcctggta ctccaagtac 540
tccaacaacc cccccggccg cgtgctgacc ctggccgcca ccctgctgct gggctggccc 600
ctgtacctgg ccttcaacgt gtccggccgc ccctacgacc gcttcgcctg ccactacgac 660
ccctacggcc ccatcttctc cgagcgcgag cgcctgcaga tctacatcgc cgacctgggc 720
atcttcgcca ccaccttcgt gctgtaccag gccaccatgg ccaagggcct ggcctgggtg 780
atgcgcatct acggcgtgcc cctgctgatc gtgaactgct tcctggtgat gatcacctac 840
ctgcagcaca cccaccccgc catcccccgc tacggctcct ccgagtggga ctggctgcgc 900
ggcgccatgg tgaccgtgga ccgcgactac ggcgtgctga acaaggtgtt ccacaacatc 960
gccgacaccc acgtggccca ccacctgttc gccaccgtgc cccactacca cgccatggag 1020
gccaccaagg ccatcaagcc catcatgggc gagtactacc gctacgacgg cacccccttc 1080
tacaaggccc tgtggcgcga ggccaaggag tgcctgttcg tggagcccga cgagggcgcc 1140
cccacccagg gcgtgttctg gtaccgcaac aagtacatgg actacaagga ccacgacggc 1200
gactacaagg accacgacat cgactacaag gacgacgacg acaagtgaat cgat 1254
<210> 174
<211> 387
<212> PRT
<213> Ricinus communis
<400> 174
Met Gly Gly Gly Gly Arg Met Ser Thr Val Ile Thr Ser Asn Asn Ser
1 5 10 15
Glu Lys Lys Gly Gly Ser Ser His Leu Lys Arg Ala Pro His Thr Lys
20 25 30
Pro Pro Phe Thr Leu Gly Asp Leu Lys Arg Ala Ile Pro Pro His Cys
35 40 45
Phe Glu Arg Ser Phe Val Arg Ser Phe Ser Tyr Val Ala Tyr Asp Val
50 55 60
Cys Leu Ser Phe Leu Phe Tyr Ser Ile Ala Thr Asn Phe Phe Pro Tyr
65 70 75 80
Ile Ser Ser Pro Leu Ser Tyr Val Ala Trp Leu Val Tyr Trp Leu Phe
85 90 95
Gln Gly Cys Ile Leu Thr Gly Leu Trp Val Ile Gly His Glu Cys Gly
100 105 110
His His Ala Phe Ser Glu Tyr Gln Leu Ala Asp Asp Ile Val Gly Leu
115 120 125
Ile Val His Ser Ala Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser
130 135 140
His Arg Arg His His Ser Asn Ile Gly Ser Leu Glu Arg Asp Glu Val
145 150 155 160
Phe Val Pro Lys Ser Lys Ser Lys Ile Ser Trp Tyr Ser Lys Tyr Ser
165 170 175
Asn Asn Pro Pro Gly Arg Val Leu Thr Leu Ala Ala Thr Leu Leu Leu
180 185 190
Gly Trp Pro Leu Tyr Leu Ala Phe Asn Val Ser Gly Arg Pro Tyr Asp
195 200 205
Arg Phe Ala Cys His Tyr Asp Pro Tyr Gly Pro Ile Phe Ser Glu Arg
210 215 220
Glu Arg Leu Gln Ile Tyr Ile Ala Asp Leu Gly Ile Phe Ala Thr Thr
225 230 235 240
Phe Val Leu Tyr Gln Ala Thr Met Ala Lys Gly Leu Ala Trp Val Met
245 250 255
Arg Ile Tyr Gly Val Pro Leu Leu Ile Val Asn Cys Phe Leu Val Met
260 265 270
Ile Thr Tyr Leu Gln His Thr His Pro Ala Ile Pro Arg Tyr Gly Ser
275 280 285
Ser Glu Trp Asp Trp Leu Arg Gly Ala Met Val Thr Val Asp Arg Asp
290 295 300
Tyr Gly Val Leu Asn Lys Val Phe His Asn Ile Ala Asp Thr His Val
305 310 315 320
Ala His His Leu Phe Ala Thr Val Pro His Tyr His Ala Met Glu Ala
325 330 335
Thr Lys Ala Ile Lys Pro Ile Met Gly Glu Tyr Tyr Arg Tyr Asp Gly
340 345 350
Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Lys Glu Cys Leu Phe
355 360 365
Val Glu Pro Asp Glu Gly Ala Pro Thr Gln Gly Val Phe Trp Tyr Arg
370 375 380
Asn Lys Tyr
385
<210> 175
<211> 535
<212> PRT
<213> Ricinus communis
<400> 175
Met Ser Val Thr Cys Ser Lys Glu Asn Arg His Ala Phe Phe Ser Ser
1 5 10 15
Ser Thr Pro Gly Thr Thr Ser Ser His Ser Arg Thr Arg Arg Arg Pro
20 25 30
Lys Tyr Asn Ser Ile Ser Thr Pro Ala Ser Gln Ser Phe Phe Asn Ser
35 40 45
Leu Ser Ser Ser Gly Ser Ser Phe Gln Gln Leu Met Ser Ser Cys Leu
50 55 60
Ala Phe Glu Pro Cys Ser His Tyr Tyr Ser Ser Asn Gly Leu Phe Pro
65 70 75 80
Asn Thr Pro Leu Leu Pro Lys Arg His Pro Arg Leu His His Arg Leu
85 90 95
Pro Arg Ser Gly Glu Ala Met Ala Val Ala Val Gln Pro Glu Lys Glu
100 105 110
Val Ala Thr Asn Lys Lys Pro Leu Met Lys Gln Arg Arg Val Val Val
115 120 125
Thr Gly Met Gly Val Val Ser Pro Leu Gly His Asp Ile Asp Val Tyr
130 135 140
Tyr Asn Asn Leu Leu Asp Gly Ser Ser Gly Ile Ser Gln Ile Asp Ser
145 150 155 160
Phe Asp Cys Ala Gln Phe Pro Thr Arg Ile Ala Gly Glu Ile Lys Ser
165 170 175
Phe Ser Thr Asp Gly Trp Val Ala Pro Lys Leu Ser Lys Arg Met Asp
180 185 190
Lys Phe Met Leu Tyr Met Leu Thr Ala Gly Lys Lys Ala Leu Ala Asp
195 200 205
Gly Gly Ile Thr Glu Asp Met Met Asp Glu Leu Asp Lys Ala Arg Cys
210 215 220
Gly Val Leu Ile Gly Ser Ala Met Gly Gly Met Lys Val Phe Asn Asp
225 230 235 240
Ala Ile Glu Ala Leu Arg Ile Ser Tyr Arg Lys Met Asn Pro Phe Cys
245 250 255
Val Pro Phe Ala Thr Thr Asn Met Gly Ser Ala Met Leu Ala Met Asp
260 265 270
Leu Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr
275 280 285
Ser Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile Ile Arg Gly Glu
290 295 300
Ala Asp Ile Met Leu Cys Gly Gly Ser Asp Ala Ala Ile Ile Pro Ile
305 310 315 320
Gly Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser Gln Arg Asn Asp
325 330 335
Asp Pro Thr Lys Ala Ser Arg Pro Trp Asp Met Asn Arg Asp Gly Phe
340 345 350
Val Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu Glu Leu Glu His
355 360 365
Ala Lys Lys Arg Gly Ala Asn Ile Tyr Ala Glu Phe Leu Gly Gly Ser
370 375 380
Phe Thr Cys Asp Ala Tyr His Met Thr Glu Pro Arg Pro Asp Gly Val
385 390 395 400
Gly Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Arg Ser Gly Val Ser
405 410 415
Lys Glu Glu Val Asn Tyr Ile Asn Ala His Ala Thr Ser Thr Pro Ala
420 425 430
Gly Asp Leu Lys Glu Tyr Glu Ala Leu Met Arg Cys Phe Ser Gln Asn
435 440 445
Pro Asp Leu Arg Val Asn Ser Thr Lys Ser Met Ile Gly His Leu Leu
450 455 460
Gly Ala Ala Gly Ala Val Glu Ala Ile Ala Thr Ile Gln Ala Ile Arg
465 470 475 480
Thr Gly Trp Val His Pro Asn Ile Asn Leu Glu Asn Pro Glu Glu Gly
485 490 495
Val Asp Thr Lys Val Leu Val Gly Pro Lys Lys Glu Arg Leu Asp Ile
500 505 510
Lys Val Ala Leu Ser Asn Ser Phe Gly Phe Gly Gly His Asn Ser Ser
515 520 525
Ile Ile Phe Ala Pro Tyr Lys
530 535
<210> 176
<211> 491
<212> PRT
<213> Helianthus annus
<400> 176
Met Ala Ala Ser Met Val Cys Thr Trp Ile Val Ala Ala Cys Met Ser
1 5 10 15
Val Ser Ser Ser Ser Ser Ser Asn Ser Leu Phe Ser Ser Lys Arg Lys
20 25 30
Arg Arg Leu Asp Arg Phe Ser Leu Ser Ser Arg Cys Arg Arg Gly Gly
35 40 45
Arg Val Ala Met Ala Ile Ala Ile Gln Pro Ser Ser Ile Glu Met Glu
50 55 60
Glu Glu Thr Thr Leu Thr Lys Arg Lys Gln Pro Pro Thr Lys Gln Arg
65 70 75 80
Arg Val Val Val Thr Gly Met Gly Val Glu Thr Pro Ile Gly Asn Asn
85 90 95
Pro Asp Gln Phe Tyr Asn Asn Leu Leu Gln Gly Val Ser Gly Ile Thr
100 105 110
Gln Ile Glu Ala Phe Asp Cys Ser Ser Tyr Pro Thr Arg Ile Ala Gly
115 120 125
Glu Ile Lys Asn Phe Ser Thr Asp Gly Trp Val Ala Pro Lys Leu Ser
130 135 140
Lys Arg Met Asp Arg Phe Met Leu Tyr Met Leu Thr Ala Gly Lys Lys
145 150 155 160
Ala Leu Ala Asp Ala Gly Ile Ser Pro Ser Asp Ser Asp Glu Ile Asp
165 170 175
Lys Ser Arg Cys Gly Val Leu Ile Gly Ser Ala Met Gly Gly Met Lys
180 185 190
Val Phe Asn Asp Ala Ile Glu Ala Leu Arg Val Ser Tyr Arg Lys Met
195 200 205
Asn Pro Phe Cys Val Pro Phe Ala Thr Thr Asn Met Gly Ser Ala Met
210 215 220
Leu Ala Met Asp Leu Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr
225 230 235 240
Ala Cys Ala Thr Ser Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile
245 250 255
Ile Arg Gly Glu Ala Asp Met Met Leu Cys Gly Gly Ser Asp Ala Val
260 265 270
Ile Ile Pro Ile Gly Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser
275 280 285
Glu Arg Asn Thr Asp Pro Ala Lys Ala Ser Arg Pro Trp Asp Ser Gly
290 295 300
Arg Asp Gly Phe Val Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu
305 310 315 320
Glu Leu Glu His Ala Lys Lys Arg Gly Ala Lys Ile Tyr Ala Glu Phe
325 330 335
Leu Gly Gly Ser Phe Thr Cys Asp Ala Tyr His Met Thr Glu Pro His
340 345 350
Pro Glu Gly Ala Gly Val Ile Leu Cys Ile Glu Lys Ala Leu Ser Gln
355 360 365
Ala Gly Val Arg Arg Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr
370 375 380
Ser Thr Pro Ala Gly Asp Leu Lys Glu Tyr His Ala Leu Leu His Cys
385 390 395 400
Phe Gly Asn Asn Gln Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile
405 410 415
Gly His Leu Leu Gly Ala Ala Gly Ala Val Glu Ala Val Ala Thr Val
420 425 430
Gln Ala Ile Arg Thr Gly Trp Ile His Pro Asn Ile Asn Leu Glu Asn
435 440 445
Pro Asp Gln Gly Val Asp Thr Lys Val Leu Val Gly Ser Lys Lys Glu
450 455 460
Arg Leu Asn Val Lys Val Gly Leu Ser Asn Ser Phe Gly Phe Gly Gly
465 470 475 480
His Asn Ser Ser Ile Leu Phe Ala Pro Phe Gln
485 490
<210> 177
<211> 433
<212> PRT
<213> Brassica napus
<400> 177
Met Ala Val Ala Met Asp Met Glu Lys Glu Ala Lys Val Asp Asn Lys
1 5 10 15
Pro Pro Thr Glu Gln Arg Arg Val Val Val Thr Gly Met Gly Val Glu
20 25 30
Thr Ser Leu Gly His Asp Pro Asp Thr Phe Tyr Glu Asn Leu Leu Gln
35 40 45
Gly Asn Ser Gly Ile Ser Gln Ile Glu Asn Phe Asp Cys Ser Ala Phe
50 55 60
Pro Thr Arg Ile Ala Gly Glu Ile Lys Ser Phe Ser Thr Glu Gly Trp
65 70 75 80
Val Ala Pro Lys Leu Ser Lys Arg Met Asp Lys Phe Met Leu Tyr Leu
85 90 95
Leu Thr Ala Gly Lys Lys Ala Leu Val Asp Gly Gly Val Thr Glu Glu
100 105 110
Val Met Ala Glu Phe Asp Lys Ala Lys Cys Gly Val Leu Ile Gly Ser
115 120 125
Ala Met Gly Gly Met Lys Val Phe Gln Asp Ala Ile Glu Ala Met Lys
130 135 140
Ile Ser Tyr Lys Lys Met Asn Pro Phe Cys Val Pro Phe Ala Thr Thr
145 150 155 160
Asn Met Gly Ser Ala Met Leu Ala Leu Asp Leu Gly Trp Met Gly Pro
165 170 175
Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Ser Asn Phe Cys Ile Leu
180 185 190
Asn Ser Ala Asn His Ile Ile Lys Gly Glu Ala Asp Val Met Leu Cys
195 200 205
Gly Gly Ser Asp Ser Val Ile Ile Pro Ile Gly Leu Gly Gly Phe Val
210 215 220
Ala Cys Arg Ala Leu Ser Gln Arg Asn Asn Asp Pro Thr Lys Ala Ser
225 230 235 240
Arg Pro Trp Asp Ser Asn Arg Asp Gly Phe Val Met Gly Glu Gly Ala
245 250 255
Gly Val Leu Leu Leu Glu Glu Leu Glu His Ala Lys Lys Arg Gly Ala
260 265 270
Thr Ile Tyr Ala Glu Phe Leu Gly Gly Ser Phe Thr Cys Asp Ala Tyr
275 280 285
His Met Thr Glu Pro Arg Pro Asp Gly Ala Gly Val Ile Leu Cys Ile
290 295 300
Glu Arg Ala Leu Ala Asp Ala Gly Ile Ser Lys Glu Gln Ile Asn Tyr
305 310 315 320
Ile Asn Ala His Ala Thr Ser Thr Pro Ala Gly Asp Leu Lys Glu Tyr
325 330 335
Gln Ala Leu Ala His Cys Phe Gly Gln Asn Pro Glu Ile Lys Val Asn
340 345 350
Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly Ala Ala Gly Ala Val
355 360 365
Glu Ala Val Ala Thr Val Gln Ala Ile Arg Thr Gly Trp Val His Pro
370 375 380
Asn Ile Asn Leu Glu Ser Pro Asp Asn Gly Val Asp Thr Asn Leu Leu
385 390 395 400
Val Gly Pro Glu Lys Glu Arg Leu Asp Ile Lys Ala Ala Leu Ser Asn
405 410 415
Ser Phe Gly Phe Gly Gly His Asn Ser Ser Ile Ile Phe Ala Pro Tyr
420 425 430
Lys
<210> 178
<211> 488
<212> PRT
<213> Glycine max
<400> 178
Met Ala Ser Thr Thr Thr Ser Ser Leu Cys Thr Trp Leu Val Ala Ala
1 5 10 15
Cys Met Ser Val Thr Cys His Ala Asp Arg Thr Lys Thr Pro His Ala
20 25 30
Met Phe Arg Ser Ser Lys Lys Ser Arg Tyr Ser Gln Phe Asn Val Cys
35 40 45
Arg Ser Thr His Ser Gly Lys Thr Met Ala Val Ala Leu Gln Pro Thr
50 55 60
Gln Glu Ile Thr Thr Ile Lys Lys Pro Pro Thr Lys Gln Arg Arg Val
65 70 75 80
Val Val Thr Gly Leu Gly Val Val Thr Pro Leu Gly His Glu Pro Asp
85 90 95
Ile Phe Tyr Asn Asn Leu Leu Asp Gly Ala Ser Gly Ile Ser Glu Ile
100 105 110
Glu Thr Phe Asp Cys Ala Glu Tyr Pro Thr Arg Ile Ala Gly Glu Ile
115 120 125
Lys Ser Phe Ser Thr Asp Gly Trp Val Ala Pro Lys Leu Ser Lys Arg
130 135 140
Met Asp Lys Phe Met Leu Tyr Met Leu Thr Ala Gly Lys Lys Ala Leu
145 150 155 160
Val Asp Gly Gly Ile Thr Asp Asp Val Met Asp Glu Leu Asn Lys Glu
165 170 175
Lys Cys Gly Val Leu Ile Gly Ser Ala Met Gly Gly Met Lys Val Phe
180 185 190
Asn Asp Ala Ile Glu Ala Leu Arg Ile Ser Tyr Lys Lys Met Asn Pro
195 200 205
Phe Cys Val Pro Phe Ala Thr Thr Asn Met Gly Ser Ala Met Leu Ala
210 215 220
Met Asp Leu Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr Ala Cys
225 230 235 240
Ala Thr Ser Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile Ile Arg
245 250 255
Gly Glu Ala Asp Val Met Leu Cys Gly Gly Ser Asp Ala Ala Ile Ile
260 265 270
Pro Ile Gly Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser Gln Arg
275 280 285
Asn Thr Asp Pro Thr Lys Ala Ser Arg Pro Trp Asp Ile Asn Arg Asp
290 295 300
Gly Phe Val Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu Glu Leu
305 310 315 320
Glu His Ala Lys Glu Arg Gly Ala Thr Ile Tyr Ala Glu Phe Leu Gly
325 330 335
Gly Ser Phe Thr Cys Asp Ala Tyr His Val Thr Glu Pro Arg Pro Asp
340 345 350
Gly Ala Gly Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Gln Ser Gly
355 360 365
Val Ser Lys Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr Ser Thr
370 375 380
Pro Ala Gly Asp Leu Lys Glu Tyr Gln Ala Leu Met His Cys Phe Gly
385 390 395 400
Gln Asn Pro Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile Gly His
405 410 415
Leu Leu Gly Ala Ala Gly Gly Val Glu Ala Val Ala Thr Ile Gln Ala
420 425 430
Ile Arg Thr Gly Trp Val His Pro Asn Ile Asn Leu Glu Asn Pro Asp
435 440 445
Asn Gly Val Asp Ala Lys Val Leu Val Gly Ser Lys Lys Glu Arg Leu
450 455 460
Asp Val Lys Ala Ala Leu Ser Asn Ser Phe Gly Phe Gly Gly His Asn
465 470 475 480
Ser Ser Ile Ile Phe Ala Pro Tyr
485
<210> 179
<211> 467
<212> PRT
<213> Prototheca moriformis
<400> 179
Met Gln Thr Ala His Gln Arg Pro Pro Thr Glu Gly His Cys Phe Gly
1 5 10 15
Ala Arg Leu Pro Thr Ala Ser Arg Arg Ala Val Arg Arg Ala Trp Ser
20 25 30
Arg Ile Ala Arg Ala Ala Ala Ala Ala Asp Ala Asn Pro Ala Arg Pro
35 40 45
Glu Arg Arg Val Val Ile Thr Gly Gln Gly Val Val Thr Ser Leu Gly
50 55 60
Gln Thr Ile Glu Gln Phe Tyr Ser Ser Leu Leu Glu Gly Val Ser Gly
65 70 75 80
Ile Ser Gln Ile Gln Lys Phe Asp Thr Thr Gly Tyr Thr Thr Thr Ile
85 90 95
Ala Gly Glu Ile Lys Ser Leu Gln Leu Asp Pro Tyr Val Pro Lys Arg
100 105 110
Trp Ala Lys Arg Val Asp Asp Val Ile Lys Tyr Val Tyr Ile Ala Gly
115 120 125
Lys Gln Ala Leu Glu Ser Ala Gly Leu Pro Ile Glu Ala Ala Gly Leu
130 135 140
Ala Gly Ala Gly Leu Asp Pro Ala Leu Cys Gly Val Leu Ile Gly Thr
145 150 155 160
Ala Met Ala Gly Met Thr Ser Phe Ala Ala Gly Val Glu Ala Leu Thr
165 170 175
Arg Gly Gly Val Arg Lys Met Asn Pro Phe Cys Ile Pro Phe Ser Ile
180 185 190
Ser Asn Met Gly Gly Ala Met Leu Ala Met Asp Ile Gly Phe Met Gly
195 200 205
Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Gly Asn Tyr Cys Ile
210 215 220
Leu Gly Ala Ala Asp His Ile Arg Arg Gly Asp Ala Asn Val Met Leu
225 230 235 240
Ala Gly Gly Ala Asp Ala Ala Ile Ile Pro Ser Gly Ile Gly Gly Phe
245 250 255
Ile Ala Cys Lys Ala Leu Ser Lys Arg Asn Asp Glu Pro Glu Arg Ala
260 265 270
Ser Arg Pro Trp Asp Ala Asp Arg Asp Gly Phe Val Met Gly Glu Gly
275 280 285
Ala Gly Val Leu Val Leu Glu Glu Leu Glu His Ala Lys Arg Arg Gly
290 295 300
Ala Thr Ile Leu Ala Glu Leu Val Gly Gly Ala Ala Thr Ser Asp Ala
305 310 315 320
His His Met Thr Glu Pro Asp Pro Gln Gly Arg Gly Val Arg Leu Cys
325 330 335
Leu Glu Arg Ala Leu Glu Arg Ala Arg Leu Ala Pro Glu Arg Val Gly
340 345 350
Tyr Val Asn Ala His Gly Thr Ser Thr Pro Ala Gly Asp Val Ala Glu
355 360 365
Tyr Arg Ala Ile Arg Ala Val Ile Pro Gln Asp Ser Leu Arg Ile Asn
370 375 380
Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly Gly Ala Gly Ala Val
385 390 395 400
Glu Ala Val Ala Ala Ile Gln Ala Leu Arg Thr Gly Trp Leu His Pro
405 410 415
Asn Leu Asn Leu Glu Asn Pro Ala Pro Gly Val Asp Pro Val Val Leu
420 425 430
Val Gly Pro Arg Lys Glu Arg Ala Glu Asp Leu Asp Val Val Leu Ser
435 440 445
Asn Ser Phe Gly Phe Gly Gly His Asn Ser Cys Val Ile Phe Arg Lys
450 455 460
Tyr Asp Glu
465
<210> 180
<211> 400
<212> PRT
<213> Prototheca moriformis
<400> 180
Met Ala Ser Ala Val Thr Phe Ala Cys Ala Pro Pro Arg Gly Ala Val
1 5 10 15
Ala Ala Pro Gly Arg Arg Ala Ala Ser Arg Pro Leu Val Val Arg Ala
20 25 30
Val Ala Ser Glu Ala Pro Leu Gly Val Pro Pro Ser Val Gln Arg Pro
35 40 45
Ser Pro Val Val Tyr Ser Lys Leu Asp Lys Gln His Arg Leu Thr Pro
50 55 60
Glu Arg Leu Glu Leu Val Gln Ser Met Gly Gln Phe Ala Glu Glu Arg
65 70 75 80
Val Leu Pro Val Leu His Pro Val Asp Lys Leu Trp Gln Pro Gln Asp
85 90 95
Phe Leu Pro Asp Pro Glu Ser Pro Asp Phe Glu Asp Gln Val Ala Glu
100 105 110
Leu Arg Ala Arg Ala Lys Asp Leu Pro Asp Glu Tyr Phe Val Val Leu
115 120 125
Val Gly Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Met Ala Met
130 135 140
Leu Asn Thr Leu Asp Gly Val Arg Asp Asp Thr Gly Ala Ala Asp His
145 150 155 160
Pro Trp Ala Arg Trp Thr Arg Gln Trp Val Ala Glu Glu Asn Arg His
165 170 175
Gly Asp Leu Leu Asn Lys Tyr Cys Trp Leu Thr Gly Arg Val Asn Met
180 185 190
Arg Ala Val Glu Val Thr Ile Asn Asn Leu Ile Lys Ser Gly Met Asn
195 200 205
Pro Gln Thr Asp Asn Asn Pro Tyr Leu Gly Phe Val Tyr Thr Ser Phe
210 215 220
Gln Glu Arg Ala Thr Lys Tyr Ser His Gly Asn Thr Ala Arg Leu Ala
225 230 235 240
Ala Glu His Gly Asp Lys Asn Leu Ser Lys Ile Cys Gly Leu Ile Ala
245 250 255
Ser Asp Glu Gly Arg His Glu Ile Ala Tyr Thr Arg Ile Val Asp Glu
260 265 270
Phe Phe Arg Leu Asp Pro Glu Gly Ala Val Ala Ala Tyr Ala Asn Met
275 280 285
Met Arg Lys Gln Ile Thr Met Pro Ala His Leu Met Asp Asp Met Gly
290 295 300
His Gly Glu Ala Asn Pro Gly Arg Asn Leu Phe Ala Asp Phe Ser Ala
305 310 315 320
Val Ala Glu Lys Ile Asp Val Tyr Asp Ala Glu Asp Tyr Cys Arg Ile
325 330 335
Leu Glu His Leu Asn Ala Arg Trp Lys Val Asp Glu Arg Gln Val Ser
340 345 350
Gly Gln Ala Ala Ala Asp Gln Glu Tyr Val Leu Gly Leu Pro Gln Arg
355 360 365
Phe Arg Lys Leu Ala Glu Lys Thr Ala Ala Lys Arg Lys Arg Val Ala
370 375 380
Arg Arg Pro Val Ala Phe Ser Trp Ile Ser Gly Arg Glu Ile Met Val
385 390 395 400
<210> 181
<211> 378
<212> PRT
<213> Linus usitatissimum
<400> 181
Met Gly Ala Gly Gly Arg Met Pro Val Pro Pro Ser Ser Lys Pro Met
1 5 10 15
Lys Arg Ser Pro Tyr Ser Lys Pro Pro Phe Thr Leu Gly Glu Leu Lys
20 25 30
Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser Ile Pro Arg Ser Phe
35 40 45
Ala Tyr Val Ala His Asp Leu Thr Ile Ala Ala Ile Phe Tyr Tyr Ile
50 55 60
Ala Thr Thr Tyr Phe His Leu Leu Pro Ser Pro Leu Asn Tyr Leu Ala
65 70 75 80
Trp Pro Val Tyr Trp Ala Cys Gln Gly Cys Ile Leu Thr Gly Val Trp
85 90 95
Val Leu Ala His Glu Cys Gly His His Ala Phe Ser Asp Tyr Gln Trp
100 105 110
Leu Asp Asp Met Asp Gly Phe Val Leu His Ser Ser Leu Leu Val Pro
115 120 125
Tyr Phe Ser Trp Lys His Ser His Arg Arg His His Ser Asn Thr Gly
130 135 140
Ser Leu Asp Arg Asp Glu Val Phe Val Pro Lys Gln Lys Ala Glu Ile
145 150 155 160
Gly Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro Gly Arg Val Ile Thr
165 170 175
Leu Ala Val Thr Leu Thr Leu Gly Trp Pro Leu Tyr Leu Ala Phe Asn
180 185 190
Val Ser Gly Arg Pro Tyr Asp Arg Phe Ala Cys His Phe Asp Pro His
195 200 205
Gly Pro Ile Tyr Asn Asp Arg Glu Arg Met Glu Ile Tyr Leu Ser Asp
210 215 220
Ala Gly Ile Phe Thr Val Cys Tyr Ile Leu Tyr Arg Leu Val Leu Thr
225 230 235 240
Lys Gly Leu Val Trp Val Val Ser Ile Tyr Gly Val Pro Leu Leu Ile
245 250 255
Val Asn Gly Phe Leu Val Leu Ile Thr Phe Leu Gln His Thr His Pro
260 265 270
Ser Leu Pro His Tyr Lys Ser Ser Glu Trp Asp Trp Met Arg Gly Ala
275 280 285
Leu Ser Thr Val Asp Arg Asp Tyr Gly Leu Leu Asn Thr Val Phe His
290 295 300
Asn Ile Thr Asp Thr His Val Ala His His Leu Phe Ser Thr Met Pro
305 310 315 320
His Tyr His Ala Met Glu Ala Thr Lys Ala Ile Lys Pro Val Leu Gly
325 330 335
Glu Tyr Tyr Gln Phe Asp Gly Thr Pro Phe Val Lys Ala Met Trp Arg
340 345 350
Glu Ala Lys Glu Cys Ile Tyr Val Glu Pro Asp Glu Gly Asp Pro Ser
355 360 365
Gln Gly Val Phe Trp Tyr Asn Asn Lys Leu
370 375
<210> 182
<211> 391
<212> PRT
<213> Linus usitatissimum
<400> 182
Met Ser Pro Pro Asn Ser Met Ser Pro Thr Thr Asn Gly Asn Gly Val
1 5 10 15
Ala Met Asn Gly Ala Lys Lys Gln Leu Asp Phe Asp Pro Ser Ala Ala
20 25 30
Pro Pro Phe Lys Ile Ala Asp Ile Arg Ala Ala Ile Pro Pro His Cys
35 40 45
Trp Val Lys Asn Pro Trp Arg Ser Leu Ser Tyr Val Leu Arg Asp Leu
50 55 60
Leu Val Ile Leu Ser Phe Ala Val Ala Ala Ala Lys Leu Asp Ser Trp
65 70 75 80
Thr Phe Trp Pro Leu Tyr Trp Val Ala Gln Gly Thr Met Phe Trp Ala
85 90 95
Val Phe Val Leu Gly His Asp Cys Gly His Gly Ser Phe Ser Asp Ile
100 105 110
Trp Leu Leu Asn Asn Val Met Gly His Ile Leu His Ser Ser Ile Leu
115 120 125
Val Pro Tyr His Gly Trp Arg Ile Ser His Lys Thr His His Gln Asn
130 135 140
His Gly Asn Val Glu Lys Asp Glu Ser Trp Val Pro Leu Pro Glu Lys
145 150 155 160
Val Tyr Lys Ser Leu Asp Thr Ser Thr Lys Phe Met Arg Phe Thr Ile
165 170 175
Pro Leu Pro Met Phe Ala Tyr Pro Ile Tyr Leu Trp Thr Arg Ser Pro
180 185 190
Gly Lys Lys Gly Ser His Phe Asn Pro Tyr Ser Asp Leu Phe Ala Pro
195 200 205
Asn Glu Arg Ala Ala Val Leu Ile Ser Thr Leu Cys Trp Thr Ala Met
210 215 220
Ala Leu Leu Leu Cys Tyr Ser Ser Phe Ile Tyr Gly Phe Ala Pro Val
225 230 235 240
Leu Lys Ile Tyr Gly Val Pro Tyr Leu Ile Phe Val Ala Trp Leu Asp
245 250 255
Met Val Thr Tyr Leu His His His Gly Tyr Glu Gln Lys Leu Pro Trp
260 265 270
Tyr Arg Gly Lys Glu Trp Ser Tyr Leu Arg Gly Gly Leu Thr Thr Val
275 280 285
Asp Arg Asp Tyr Gly Val Ile Asn Asn Ile His His Asp Ile Gly Thr
290 295 300
His Val Ile His His Leu Phe Pro Gln Met Pro His Tyr His Leu Val
305 310 315 320
Glu Ala Thr Gln Ala Ala Lys His Val Leu Gly Lys Tyr Tyr Arg Glu
325 330 335
Pro Lys Lys Ser Gly Pro Phe Pro Phe His Leu Phe Gly Tyr Leu Val
340 345 350
Arg Ser Leu Gly Glu Asp His Tyr Val Ser Asp Thr Gly Asp Val Val
355 360 365
Phe Tyr Gln Ser Asp Pro His Ile Pro Lys Phe Arg Thr Ser Ser Ala
370 375 380
Thr Thr Lys Ser Lys Ser Ser
385 390
<210> 183
<211> 392
<212> PRT
<213> Linus usitatissimum
<400> 183
Met Ser Pro Pro Asn Ser Met Ser Pro Ala Thr Asn Gly Ser Thr Asn
1 5 10 15
Gly Val Ala Ile Asn Gly Ala Lys Lys Leu Leu Asp Phe Asp Pro Ser
20 25 30
Ala Ala Pro Pro Phe Lys Ile Ala Asp Ile Arg Ala Ala Ile Pro Pro
35 40 45
His Cys Trp Val Lys Asn Pro Trp Arg Ser Leu Ser Tyr Val Leu Arg
50 55 60
Asp Leu Leu Val Ile Leu Ser Phe Ala Val Ala Ala Thr Lys Leu Asp
65 70 75 80
Ser Trp Thr Val Trp Pro Leu Tyr Trp Ile Ala Gln Gly Thr Met Phe
85 90 95
Trp Ala Val Phe Val Leu Gly His Asp Cys Gly His Gly Ser Phe Ser
100 105 110
Asp Ser Trp Leu Leu Asn Asn Val Met Gly His Ile Leu His Ser Ser
115 120 125
Ile Leu Val Pro Tyr His Gly Trp Arg Ile Ser His Lys Thr His His
130 135 140
Gln Asn His Gly Asn Val Glu Lys Asp Glu Ser Trp Val Pro Leu Pro
145 150 155 160
Glu Lys Val Tyr Lys Ser Leu Asp Thr Gly Thr Lys Phe Met Arg Phe
165 170 175
Thr Ile Pro Leu Pro Met Phe Ala Tyr Pro Ile Tyr Leu Trp Arg Arg
180 185 190
Ser Pro Gly Lys Lys Gly Ser His Phe Asn Pro Tyr Ser Asp Leu Phe
195 200 205
Ala Pro Asn Glu Arg Thr Ser Val Met Ile Ser Thr Leu Cys Trp Thr
210 215 220
Ala Met Ala Leu Leu Leu Cys Tyr Ser Ser Phe Ile Tyr Gly Phe Leu
225 230 235 240
Pro Val Phe Lys Ile Tyr Gly Val Pro Tyr Leu Ile Phe Val Ala Trp
245 250 255
Leu Asp Met Val Thr Tyr Leu His His His Gly Tyr Glu Gln Lys Leu
260 265 270
Pro Trp Tyr Arg Gly Lys Glu Trp Ser Tyr Leu Arg Gly Gly Leu Thr
275 280 285
Thr Val Asp Arg Asp Tyr Gly Val Ile Asn Asn Ile His His Asp Ile
290 295 300
Gly Thr His Val Ile His His Leu Phe Pro Gln Met Pro His Tyr His
305 310 315 320
Leu Val Glu Ala Thr Gln Ala Ala Lys His Val Leu Gly Lys Tyr Tyr
325 330 335
Arg Glu Pro Lys Lys Ser Gly Pro Phe Pro Phe His Leu Phe Gly Tyr
340 345 350
Leu Val Arg Ser Leu Gly Glu Asp His Tyr Val Ser Asp Thr Gly Asp
355 360 365
Val Val Phe Tyr Gln Ser Asp Pro His Ile Pro Lys Phe Pro Thr Ser
370 375 380
Ala Thr Thr Lys Ser Lys Ser Ser
385 390
<210> 184
<211> 383
<212> PRT
<213> Carthamus tinctorus
<400> 184
Met Gly Ala Gly Gly Arg Met Ser Asn Pro Ser Glu Gly Glu Lys Lys
1 5 10 15
Thr Glu Leu Glu Gly Ile Gln Arg Val Pro Tyr Gln Lys Pro Pro Phe
20 25 30
Thr Val Gly Asp Val Lys Lys Ala Ile Pro Pro His Cys Phe Asn Arg
35 40 45
Ser Val Ile Arg Ser Phe Ser Tyr Val Val Tyr Asp Leu Thr Ile Ala
50 55 60
Ser Ile Leu Tyr Tyr Ile Ala Thr Thr Phe Ile Pro Leu Leu Pro His
65 70 75 80
Pro Leu Ala Tyr Val Ala Trp Pro Ile Tyr Trp Ala Val Gln Gly Cys
85 90 95
Val Met Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala
100 105 110
Phe Ser Asp Tyr Gln Trp Leu Asp Asp Thr Val Gly Leu Ile Leu His
115 120 125
Ser Val Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg
130 135 140
His His Ser Asn Thr Gly Ser Ile Glu His Asp Glu Val Phe Val Pro
145 150 155 160
Lys Leu Lys Ser Gly Val Arg Ser Thr Ala Lys Tyr Leu Asn Asn Pro
165 170 175
Pro Gly Arg Ile Leu Thr Leu Leu Val Thr Leu Thr Leu Gly Trp Pro
180 185 190
Leu Tyr Leu Met Phe Asn Val Ser Gly Arg Tyr Tyr Asp Arg Phe Ala
195 200 205
Cys His Phe Asp Pro Asn Ser Pro Ile Tyr Ser Asn Arg Glu Arg Ala
210 215 220
Gln Ile Phe Ile Ser Asp Ala Gly Ile Phe Ala Val Leu Tyr Gly Leu
225 230 235 240
Tyr Arg Leu Ala Ala Val Lys Gly Leu Val Trp Val Leu Thr Val Tyr
245 250 255
Ala Gly Pro Leu Leu Val Val Asn Gly Phe Leu Val Leu Ile Thr Phe
260 265 270
Leu Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Thr Glu Trp
275 280 285
Asp Trp Leu Arg Gly Ala Leu Ala Thr Ile Asp Arg Asp Tyr Gly Ile
290 295 300
Leu Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Thr His His
305 310 315 320
Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala
325 330 335
Ile Ile Pro Ile Leu Gly Asp Tyr Tyr Gln Phe Asp Gly Thr Ser Val
340 345 350
Phe Lys Ala Met Tyr Arg Glu Thr Lys Glu Cys Ile Tyr Val Asp Lys
355 360 365
Asp Glu Glu Val Lys Asp Gly Val Tyr Trp Tyr Arg Asn Lys Ile
370 375 380
<210> 185
<211> 382
<212> PRT
<213> Helianthus annus
<400> 185
Met Gly Ala Gly Gly Arg Met Ser Ser Pro Asn Gly Lys Glu Lys Asp
1 5 10 15
Gly Pro Lys Pro Leu Glu Arg Ala Leu His Glu Lys Pro Pro Phe Thr
20 25 30
Val Gly Asp Ile Lys Lys Val Ile Pro Pro His Cys Phe Lys Arg Ser
35 40 45
Val Ile Arg Ser Phe Ser Tyr Val Val Tyr Asp Leu Thr Ile Ala Ser
50 55 60
Ile Phe Tyr Tyr Leu Ala Asn Asn Tyr Ile Pro Leu Leu Pro Asn Ser
65 70 75 80
Leu Ala Tyr Val Ala Trp Pro Val Tyr Trp Ile Phe Gln Gly Cys Val
85 90 95
Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp Tyr Gln Trp Leu Asp Asp Thr Val Gly Leu Ile Leu His Ser
115 120 125
Ala Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Ile Glu His Asp Glu Val Phe Val Pro Lys
145 150 155 160
Leu Lys Ser Ser Val Arg Ser Thr Ala Lys Tyr Leu Asn Asn Pro Pro
165 170 175
Gly Arg Ile Leu Thr Leu Leu Val Thr Leu Thr Met Gly Trp Pro Leu
180 185 190
Tyr Leu Met Phe Asn Val Ser Gly Arg Tyr Tyr Asp Arg Phe Ala Cys
195 200 205
His Phe Asp Pro Asn Ser Pro Ile Tyr Ser Asn Arg Glu Arg Ala Gln
210 215 220
Ile Phe Ile Ser Asp Ala Gly Ile Leu Thr Val Phe Tyr Ile Leu Phe
225 230 235 240
Arg Leu Ala Ser Thr Lys Gly Leu Val Trp Val Leu Thr Met Tyr Gly
245 250 255
Gly Pro Leu Leu Val Val Asn Gly Phe Leu Val Leu Ile Thr Phe Leu
260 265 270
Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Thr Glu Trp Asp
275 280 285
Trp Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asp Tyr Gly Ile Leu
290 295 300
Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Thr His His Leu
305 310 315 320
Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala Ile
325 330 335
Lys Pro Ile Leu Gly Asp Tyr Tyr Gln Phe Asp Gly Thr Ser Ile Phe
340 345 350
Lys Ala Met Tyr Arg Glu Thr Lys Glu Cys Ile Tyr Val Asp Lys Asp
355 360 365
Glu Asp Val Lys Asp Gly Val Tyr Trp Tyr Arg Asn Lys Ile
370 375 380
<210> 186
<211> 397
<212> PRT
<213> Cuphea wrightii
<400> 186
Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Ser Val Pro Thr Pro
1 5 10 15
Gly Thr Ser Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser Leu
20 25 30
Ser Val Pro Phe Lys Pro Asp Asn Gly Gly Phe Val Lys Ala Asn Ala
35 40 45
Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Asn Leu Lys Ser Gly
50 55 60
Ser Leu Glu Thr Pro Pro Arg Ser Phe Ile Asn Gln Leu Pro Asp Leu
65 70 75 80
Ser Met Leu Leu Ser Lys Ile Thr Thr Val Phe Gly Ala Ala Glu Lys
85 90 95
Gln Trp Lys Arg Pro Gly Met Leu Val Glu Pro Phe Gly Val Asp Arg
100 105 110
Ile Phe Gln Asp Gly Val Phe Phe Arg Gln Ser Phe Ser Ile Arg Ser
115 120 125
Tyr Glu Ile Gly Val Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn
130 135 140
Ile Phe Gln Glu Thr Ser Leu Asn His Cys Lys Ser Ile Gly Leu Leu
145 150 155 160
Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu Ile
165 170 175
Trp Val Val Thr Lys Ile Gln Val Glu Val Asn Arg Tyr Pro Thr Trp
180 185 190
Gly Asp Thr Ile Glu Val Asn Thr Trp Val Ser Glu Ser Gly Lys Asn
195 200 205
Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Arg Thr Gly Glu Ile
210 215 220
Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln Asn Thr Arg
225 230 235 240
Arg Leu Ser Lys Phe Pro Tyr Glu Val Arg Gln Glu Ile Ala Pro His
245 250 255
Phe Val Asp Ser Ala Pro Val Ile Glu Asp Asp Arg Lys Leu His Lys
260 265 270
Leu Asp Val Lys Thr Gly Asp Ser Ile Arg Asp Gly Leu Thr Pro Arg
275 280 285
Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile
290 295 300
Gly Trp Ile Leu Lys Ser Val Pro Ile Glu Val Phe Glu Thr Gln Glu
305 310 315 320
Leu Cys Gly Val Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser
325 330 335
Val Leu Glu Ser Val Thr Thr Met Asp Pro Ala Lys Glu Gly Asp Arg
340 345 350
Cys Val Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile Thr
355 360 365
Ile Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly Ala
370 375 380
Ile Ser Ser Gly Lys Thr Ser Asn Gly Asn Ser Val Ser
385 390 395
<210> 187
<211> 408
<212> PRT
<213> Cuphea wrightii
<400> 187
Met Val Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ala
1 5 10 15
Pro Arg Pro Thr Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser
20 25 30
Leu Ser Gln Pro Phe Lys Pro Lys Ser Asn Pro Asn Gly Arg Phe Gln
35 40 45
Val Lys Ala Asn Val Ser Pro His Pro Lys Ala Asn Gly Ser Ala Val
50 55 60
Ser Leu Lys Ser Gly Ser Leu Asn Thr Leu Glu Asp Pro Pro Ser Ser
65 70 75 80
Pro Pro Pro Arg Thr Phe Leu Asn Gln Leu Pro Asp Trp Ser Arg Leu
85 90 95
Arg Thr Ala Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Phe Thr
100 105 110
Arg Leu Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Trp Phe
115 120 125
Gly Ser Glu Thr Ile Val Gln Asp Gly Leu Val Phe Arg Glu Arg Phe
130 135 140
Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu
145 150 155 160
Thr Leu Met Asn His Leu Gln Asp Thr Ser Leu Asn His Cys Lys Ser
165 170 175
Val Gly Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Thr
180 185 190
Arg Asp Leu Ile Trp Val Leu Thr Lys Met Gln Ile Val Val Asn Arg
195 200 205
Tyr Pro Thr Trp Gly Asp Thr Val Glu Ile Asn Ser Trp Phe Ser Gln
210 215 220
Ser Gly Lys Ile Gly Met Gly Arg Glu Trp Leu Ile Ser Asp Cys Asn
225 230 235 240
Thr Gly Glu Ile Leu Val Arg Ala Thr Ser Ala Trp Ala Met Met Asn
245 250 255
Gln Lys Thr Arg Arg Phe Ser Lys Leu Pro Cys Glu Val Arg Gln Glu
260 265 270
Ile Ala Pro His Phe Val Asp Ala Pro Pro Val Ile Glu Asp Asn Asp
275 280 285
Arg Lys Leu His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Cys Lys
290 295 300
Gly Leu Thr Pro Gly Trp Asn Asp Phe Asp Val Asn Gln His Val Ser
305 310 315 320
Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val
325 330 335
Leu Glu Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu
340 345 350
Cys Gly Arg Glu Ser Val Val Glu Ser Val Thr Ser Met Asn Pro Ser
355 360 365
Lys Val Gly Asp Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp
370 375 380
Gly Ala Asp Ile Met Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala
385 390 395 400
Gly Thr Asn Arg Ala Ile Ser Thr
405
<210> 188
<211> 5975
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 188
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagcata ttcaaacacc tagatcacta ccacttctac 960
acaggccact cgagcttgtg atcgcactcc gctaaggggg cgcctcttcc cttcgtttca 1020
gtcacaaccc gcaaacggcg cgccatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cctttcttgc gctatgacac 3300
ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat 3360
gatgcttcga ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg 3420
gcgagcgctg tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa 3480
gccatattca aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg 3540
cactccgcta agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacactagta 3600
tggtggccgc cgccgccagc agcgccttct tcagcgtgcc cacccccggc accagcccca 3660
agcccggcaa gttcggcaac tggcccagca gcctgagcgt gcccttcaag cccgacaacg 3720
gcggcttcca cgtgaaggcc aacgccagcg cccacgggcg cgcccccaag gccaacggca 3780
gcgccgtgaa cctgaagtcc ggcagcctgg agaccccccc ccgcagcttc atcaaccagc 3840
tgcccgacct gagcatgctg ctgagcaaga tcaccaccgt gttcggcgcc gccgagaagc 3900
agtggaagcg ccccggcatg ctggtggagc ccttcggcgt ggaccgcatc ttccaggacg 3960
gcgtgttctt ccgccagagc ttcagcatcc gcagctacga gatcggcgtg gaccgcaccg 4020
ccagcatcga gaccctgatg aacatcttcc aggagaccag cctgaaccac tgcaagagca 4080
tcggcctgct gaacgacggc ttcggccgca cccccgagat gtgcaagcgc gacctgatct 4140
gggtggtgac caagatccag gtggaggtga accgctaccc cacctggggc gacaccatcg 4200
aggtgaacac ctgggtgagc gagagcggca agaacggcat gggccgcgac tggctgatca 4260
gcgactgccg caccggcgag atcctgatcc gcgccaccag cgtgtgggcc atgatgaacc 4320
agaacacccg ccgcctgagc aagttcccct acgaggtgcg ccaggagatc gccccccact 4380
tcgtggacag cgcccccgtg atcgaggacg accgcaagct gcacaagctg gacgtgaaga 4440
ccggcgacag catccgcgac ggcctgaccc cccgctggaa cgacctggac gtgaaccagc 4500
acgtgaacaa cgtgaagtac atcggctgga ttctgaagtc cgtgcccatc gaggtgttcg 4560
agacccagga gctgtgcggc gtgaccctgg agtaccgccg cgagtgcggc cgcgacagcg 4620
tgctggagag cgtgaccacc atggaccccg ccaaggaggg cgaccgctgc gtgtaccagc 4680
acctgctgcg cctggaggac ggcgccgaca tcaccatcgg ccgcaccgag tggcgcccca 4740
agaacgccgg cgccaacggc gccatcagca gcggcaagac cagcaacggc aacagcgtga 4800
gctgattaat taactcgagg cagcagcagc tcggatagta tcgacacact ctggacgctg 4860
gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata tccctgccgc 4920
ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc gagttgctag 4980
ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt catatcgctt 5040
gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc tcctgctcct 5100
gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct ggtactgcaa 5160
cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga acacaaatgg 5220
aaagcttgag ctcttgtttt ccagaaggag ttgctccttg agcctttcat tctcagcctc 5280
gataacctcc aaagccgctc taattgtgga gggggttcga atttaaaagc ttggaatgtt 5340
ggttcgtgcg tctggaacaa gcccagactt gttgctcact gggaaaagga ccatcagctc 5400
caaaaaactt gccgctcaaa ccgcgtacct ctgctttcgc gcaatctgcc ctgttgaaat 5460
cgccaccaca ttcatattgt gacgcttgag cagtctgtaa ttgcctcaga atgtggaatc 5520
atctgccccc tgtgcgagcc catgccaggc atgtcgcggg cgaggacacc cgccactcgt 5580
acagcagacc attatgctac ctcacaatag ttcataacag tgaccatatt tctcgaagct 5640
ccccaacgag cacctccatg ctctgagtgg ccaccccccg gccctggtgc ttgcggaggg 5700
caggtcaacc ggcatggggc taccgaaatc cccgaccgga tcccaccacc cccgcgatgg 5760
gaagaatctc tccccgggat gtgggcccac caccagcaca acctgctggc ccaggcgagc 5820
gtcaaaccat accacacaaa tatccttggc atcggccctg aattccttct gccgctctgc 5880
tacccggtgc ttctgtccga agcaggggtt gctagggatc gctccgagtc cgcaaaccct 5940
tgtcgcgtgg cggggcttgt tcgagcttga agagc 5975
<210> 189
<211> 1256
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 189
actagtatgg tggtggccgc cgccgccagc agcgccttct tccccgtgcc cgccccccgc 60
cccaccccca agcccggcaa gttcggcaac tggcccagca gcctgagcca gcccttcaag 120
cccaagagca accccaacgg ccgcttccag gtgaaggcca acgtgagccc ccacgggcgc 180
gcccccaagg ccaacggcag cgccgtgagc ctgaagtccg gcagcctgaa caccctggag 240
gaccccccca gcagcccccc cccccgcacc ttcctgaacc agctgcccga ctggagccgc 300
ctgcgcaccg ccatcaccac cgtgttcgtg gccgccgaga agcagttcac ccgcctggac 360
cgcaagagca agcgccccga catgctggtg gactggttcg gcagcgagac catcgtgcag 420
gacggcctgg tgttccgcga gcgcttcagc atccgcagct acgagatcgg cgccgaccgc 480
accgccagca tcgagaccct gatgaaccac ctgcaggaca ccagcctgaa ccactgcaag 540
agcgtgggcc tgctgaacga cggcttcggc cgcacccccg agatgtgcac ccgcgacctg 600
atctgggtgc tgaccaagat gcagatcgtg gtgaaccgct accccacctg gggcgacacc 660
gtggagatca acagctggtt cagccagagc ggcaagatcg gcatgggccg cgagtggctg 720
atcagcgact gcaacaccgg cgagatcctg gtgcgcgcca ccagcgcctg ggccatgatg 780
aaccagaaga cccgccgctt cagcaagctg ccctgcgagg tgcgccagga gatcgccccc 840
cacttcgtgg acgccccccc cgtgatcgag gacaacgacc gcaagctgca caagttcgac 900
gtgaagaccg gcgacagcat ctgcaagggc ctgacccccg gctggaacga cttcgacgtg 960
aaccagcacg tgagcaacgt gaagtacatc ggctggattc tggagagcat gcccaccgag 1020
gtgctggaga cccaggagct gtgcagcctg accctggagt accgccgcga gtgcggccgc 1080
gagagcgtgg tggagagcgt gaccagcatg aaccccagca aggtgggcga ccgcagccag 1140
taccagcacc tgctgcgcct ggaggacggc gccgacatca tgaagggccg caccgagtgg 1200
cgccccaaga acgccggcac caaccgcgcc atcagcacct gattaattaa ctcgag 1256
<210> 190
<211> 1370
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 190
gaattcggcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtcg 300
gccgacagga cgcgcgtcaa aggtgctggt cgtgtatgcc ctggccggca ggtcgttgct 360
gctgctggtt agtgattccg caaccctgat tttggcgtct tattttggcg tggcaaacgc 420
tggcgcccgc gagccgggcc ggcggcgatg cggtgcccca cggctgccgg aatccaaggg 480
aggcaagagc gcccgggtca gttgaagggc tttacgcgca aggtacagcc gctcctgcaa 540
ggctgcgtgg tggaattgga cgtgcaggtc ctgctgaagt tcctccaccg cctcaccagc 600
ggacaaagca ccggtgtatc aggtccgtgt catccactct aaagagctcg actacgacct 660
actgatggcc ctagattctt catcaaaaac gcctgagaca cttgcccagg attgaaactc 720
cctgaaggga ccaccagggg ccctgagttg ttccttcccc ccgtggcgag ctgccagcca 780
ggctgtacct gtgatcgagg ctggcgggaa aataggcttc gtgtgctcag gtcatgggag 840
gtgcaggaca gctcatgaaa cgccaacaat cgcacaattc atgtcaagct aatcagctat 900
ttcctcttca cgagctgtaa ttgtcccaaa attctggtct accgggggtg atccttcgtg 960
tacgggccct tccctcaacc ctaggtatgc gcgcatgcgg tcgccgcgca actcgcgcga 1020
gggccgaggg tttgggacgg gccgtcccga aatgcagttg cacccggatg cgtggcacct 1080
tttttgcgat aatttatgca atggactgct ctgcaaaatt ctggctctgt cgccaaccct 1140
aggatcagcg gcgtaggatt tcgtaatcat tcgtcctgat ggggagctac cgactaccct 1200
aatatcagcc cgactgcctg acgccagcgt ccacttttgt gcacacattc cattcgtgcc 1260
caagacattt cattgtggtg cgaagcgtcc ccagttacgc tcacctgttt cccgacctcc 1320
ttactgttct gtcgacagag cgggcccaca ggccggtcgc agccactagt 1370
<210> 191
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 191
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
<210> 192
<211> 114
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 192
actagtatgg cttccgcggc attcaccatg tcggcgtgcc ccgcgatgac tggcagggcc 60
cctggggcac gtcgctccgg acggccagtc gccacccgcc tgagggggcg cgcc 114
<210> 193
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 193
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
<210> 194
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 194
actagtatga cgttcggggt cgccctcccg gccatgggcc gcggtgtctc ccttccccgg 60
cccagggtcg cggtgcgcgc ccagtcggcg agtcaggttt tggagagcgg gcgcgcc 117
<210> 195
<211> 385
<212> PRT
<213> Carthamus tinctorius
<400> 195
Met Leu Ser Lys Gly Ala Pro Ala Ala Pro Ala Val Ala Ala Met Tyr
1 5 10 15
Asn Ala Ser Ala Lys Asp Thr Thr Phe Ala Leu Thr His Ser Arg Ser
20 25 30
Ile Gly Ser Val Ser Ile Arg Arg Arg Tyr Asn Val Phe Leu Cys Asn
35 40 45
Ser Ser Ser Ser Ser Arg Lys Val Ser Pro Leu Leu Ala Val Ala Thr
50 55 60
Gly Glu Gln Pro Ser Gly Val Ala Ser Leu Arg Glu Ala Asp Lys Glu
65 70 75 80
Lys Ser Leu Gly Asn Arg Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly
85 90 95
Leu Ser Tyr Lys Glu Lys Phe Val Ile Arg Cys Tyr Glu Val Gly Ile
100 105 110
Asn Lys Thr Ala Thr Ile Glu Thr Ile Ala Asn Leu Leu Gln Glu Val
115 120 125
Gly Gly Asn His Ala Gln Gly Val Gly Phe Ser Thr Asp Gly Phe Ala
130 135 140
Thr Thr Thr Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg
145 150 155 160
Met His Ile Glu Ile Tyr Arg Tyr Pro Ala Trp Ser Asp Val Ile Glu
165 170 175
Ile Glu Thr Trp Val Gln Gly Glu Gly Lys Val Gly Thr Arg Arg Asp
180 185 190
Trp Ile Leu Lys Asp Tyr Ala Asn Gly Glu Val Ile Gly Arg Ala Thr
195 200 205
Ser Lys Trp Val Met Met Asn Glu Asp Thr Arg Arg Leu Gln Lys Val
210 215 220
Ser Asp Asp Val Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg Thr Leu
225 230 235 240
Arg Leu Ala Phe Pro Glu Glu Asn Asn Asn Ser Met Lys Lys Ile Pro
245 250 255
Lys Leu Glu Asp Pro Ala Glu Tyr Ser Arg Leu Gly Leu Val Pro Arg
260 265 270
Arg Ser Asp Leu Asp Met Asn Lys His Val Asn Asn Val Thr Tyr Ile
275 280 285
Gly Trp Ala Leu Glu Ser Ile Pro Pro Glu Ile Ile Asp Thr His Glu
290 295 300
Leu Gln Ala Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Arg Asp Asp
305 310 315 320
Ile Val Asp Ser Leu Thr Ser Arg Glu Pro Leu Gly Asn Ala Ala Gly
325 330 335
Val Lys Phe Lys Glu Ile Asn Gly Ser Val Ser Pro Lys Lys Asp Glu
340 345 350
Gln Asp Leu Ser Arg Phe Met His Leu Leu Arg Ser Ala Gly Ser Gly
355 360 365
Leu Glu Ile Asn Arg Cys Arg Thr Glu Trp Arg Lys Lys Pro Ala Lys
370 375 380
Arg
385
<210> 196
<211> 395
<212> PRT
<213> Ricinus communis
<400> 196
Met Ala Leu Lys Leu Asn Arg Leu Thr Phe Pro Pro Thr His Lys Leu
1 5 10 15
Pro Ser Gln Ser Pro Phe Gln Arg Ser Pro Asn Arg Val Phe Met Ala
20 25 30
Ala Thr Val Gly Ser Thr Ser Thr Lys Glu Val Glu Asn Leu Lys Lys
35 40 45
Pro Phe Ser Pro Pro Arg Glu Val His Val Gln Val Thr His Ser Met
50 55 60
Pro Pro Gln Lys Met Glu Ile Phe Lys Ser Leu Glu Gly Trp Ala Glu
65 70 75 80
Asp Asn Ile Leu Val His Leu Lys Pro Val Glu Lys Cys Trp Gln Pro
85 90 95
Gln Asp Phe Leu Pro Asp Pro Glu Ser Glu Gly Phe Tyr Glu Gln Val
100 105 110
Lys Glu Leu Arg Glu Arg Ala Arg Glu Leu Pro Asp Asp Tyr Phe Val
115 120 125
Val Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln
130 135 140
Thr Met Leu Asn Thr Leu Asp Gly Val Arg Asp Glu Thr Gly Ala Ser
145 150 155 160
Leu Thr Ser Trp Ala Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn
165 170 175
Arg His Gly Asp Leu Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val
180 185 190
Asp Met Lys His Ile Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser Gly
195 200 205
Met Asp Pro Lys Thr Glu Asn Asn Pro Tyr Leu Gly Phe Ile Tyr Thr
210 215 220
Ser Phe Gln Glu Arg Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg
225 230 235 240
Leu Ala Lys Glu His Gly Asp Met Lys Leu Ala Gln Ile Cys Gly Ile
245 250 255
Ile Ala Ala Asp Glu Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Ala
260 265 270
Glu Lys Leu Phe Glu Ile Asp Pro Asp Gly Thr Val Met Ala Leu Ala
275 280 285
Asp Met Met Arg Lys Lys Ile Ser Met Pro Ala His Leu Met Phe Asp
290 295 300
Gly Gln Asp Asp Asn Leu Phe Asp His Tyr Ser Ser Val Ala Gln Arg
305 310 315 320
Ile Gly Val Tyr Thr Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe Leu
325 330 335
Val Gly Arg Trp Lys Val Glu Asn Leu Ile Gly Leu Ser Gly Glu Gly
340 345 350
Arg Arg Ala Gln Asp Phe Val Cys Gly Leu Pro Gly Arg Ile Arg Arg
355 360 365
Leu Glu Glu Arg Ala Gln Gly Arg Ala Lys Gln Ala Ala Thr Val Pro
370 375 380
Phe Ser Trp Ile Phe Gly Arg Glu Leu Lys Leu
385 390 395
<210> 197
<211> 396
<212> PRT
<213> Helianthus annus
<400> 197
Met Ala Ile Arg Ile Asn Thr Ala Thr Phe Gln Ser Asp Leu Tyr Arg
1 5 10 15
Ser Phe Ala Phe Pro Gln Pro Lys Pro Leu Arg Ser Pro Lys Phe Ala
20 25 30
Met Ala Ser Thr Ile Gly Ser Ala Thr Thr Lys Val Glu Ser Thr Lys
35 40 45
Lys Pro Phe Thr Pro Pro Arg Glu Val His Gln Gln Val Leu His Ser
50 55 60
Met Pro Pro Gln Lys Ile Glu Ile Phe Lys Ser Met Glu Gly Trp Ala
65 70 75 80
Glu Asp Asn Ile Leu Val His Leu Lys Pro Val Glu Lys Cys Trp Gln
85 90 95
Ala Gln Asp Phe Leu Pro Asp Pro Ala Ser Asp Gly Phe Met Glu Gln
100 105 110
Val Glu Glu Leu Arg Ala Arg Ala Lys Glu Ile Pro Asp Asp Tyr Phe
115 120 125
Val Val Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr
130 135 140
Gln Thr Met Leu Asn Thr Leu Asp Gly Val Arg Asp Glu Thr Gly Ala
145 150 155 160
Ser Pro Thr Ser Trp Ala Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu
165 170 175
Asn Arg His Gly Asp Leu Leu His Gln Tyr Leu Tyr Leu Ser Gly Arg
180 185 190
Val Asp Met Arg Gln Ile Gln Lys Thr Ile Gln Tyr Leu Ile Gly Ser
195 200 205
Gly Met Asp Pro Arg Thr Glu Asn Ser Pro Tyr Leu Gly Phe Ile Tyr
210 215 220
Thr Ser Phe Gln Glu Arg Ala Thr Phe Ile Ser His Gly Asn Thr Ala
225 230 235 240
Arg His Ala Lys Glu His Gly Asp Val Lys Leu Ala Gln Met Cys Gly
245 250 255
Ile Ile Ala Ala Asp Glu Lys Arg His Glu Thr Ala Tyr Thr Lys Ile
260 265 270
Val Glu Lys Leu Phe Glu Ile Asp Pro Asp Gly Thr Val Leu Ala Phe
275 280 285
Ala Asp Met Met Arg Lys Lys Ile Ser Met Pro Ala His Leu Met Tyr
290 295 300
Asp Gly Arg Asp Asp Asn Leu Phe Glu Asn Phe Ser Ala Val Ala Gln
305 310 315 320
Arg Leu Gly Val Tyr Thr Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe
325 330 335
Leu Val Gly Arg Trp Lys Val Ala Asp Leu Thr Gly Leu Ser Gly Glu
340 345 350
Gly Arg Lys Ala Gln Asp Tyr Val Cys Gly Leu Ala Pro Arg Ile Arg
355 360 365
Arg Leu Glu Glu Arg Asn Ser Ala Arg Ala Lys Glu Ser Val Asn Val
370 375 380
Pro Phe Ser Trp Ile Phe Asp Arg Glu Val Lys Leu
385 390 395
<210> 198
<211> 401
<212> PRT
<213> Brassica juncea
<400> 198
Met Ala Leu Lys Leu Asn Pro Leu Ala Ser Gln Pro Tyr Asn Phe Pro
1 5 10 15
Ser Ser Ala Arg Pro Pro Ile Ser Thr Phe Arg Ser Pro Lys Phe Leu
20 25 30
Cys Leu Ala Ser Ser Ser Ser Pro Ala Leu Ser Ser Ser Thr Lys Glu
35 40 45
Val Glu Ser Leu Lys Lys Pro Phe Thr Pro Pro Lys Glu Val His Val
50 55 60
Gln Val Leu His Ser Met Pro Pro Gln Lys Ile Glu Ile Phe Lys Ser
65 70 75 80
Met Glu Asp Trp Ala Glu Gln Asn Leu Leu Thr His Leu Lys Asp Val
85 90 95
Glu Lys Ser Trp Gln Pro Gln Asp Phe Leu Pro Asp Pro Ala Ser Asp
100 105 110
Gly Phe Glu Asp Gln Val Lys Glu Leu Arg Glu Arg Ala Arg Glu Leu
115 120 125
Pro Asp Asp Tyr Phe Val Val Leu Val Gly Asp Met Ile Thr Glu Glu
130 135 140
Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn Thr Leu Asp Gly Val Arg
145 150 155 160
Asp Glu Thr Gly Ala Ser Pro Thr Pro Trp Ala Val Trp Thr Arg Ala
165 170 175
Trp Thr Ala Glu Glu Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Leu
180 185 190
Tyr Leu Ser Gly Arg Val Asp Met Arg Gln Ile Glu Lys Thr Ile Gln
195 200 205
Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg Thr Glu Asn Asn Pro Tyr
210 215 220
Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu Arg Ala Thr Phe Val Ser
225 230 235 240
His Gly Asn Thr Ala Arg Gln Ala Lys Glu His Gly Asp Leu Lys Leu
245 250 255
Ala Gln Ile Cys Gly Thr Ile Ala Ala Asp Glu Lys Arg His Glu Thr
260 265 270
Ala Tyr Thr Lys Ile Val Glu Lys Leu Leu Glu Ile Asp Pro Asp Gly
275 280 285
Thr Val Val Ala Phe Ala Asp Met Met Arg Lys Lys Ile Ser Met Pro
290 295 300
Ala His Leu Met Tyr Asp Gly Arg Asp Asp Asn Leu Phe Asp Asn Phe
305 310 315 320
Ser Ser Val Ala Gln Arg Leu Gly Val Tyr Thr Ala Lys Asp Tyr Ala
325 330 335
Asp Ile Leu Glu Phe Leu Ala Gly Arg Trp Lys Ile Glu Ser Leu Ser
340 345 350
Gly Leu Ser Gly Glu Gly Asn Lys Ala Gln Glu Tyr Leu Cys Gly Leu
355 360 365
Thr Pro Arg Ile Arg Arg Leu Asp Glu Arg Ala Gln Ala Arg Ala Lys
370 375 380
Lys Gly Pro Lys Ile Pro Phe Ser Trp Ile His Asp Arg Glu Val Gln
385 390 395 400
Leu
<210> 199
<211> 391
<212> PRT
<213> Glycine max
<400> 199
Met Ala Leu Arg Leu Asn Pro Ile Pro Thr Gln Thr Phe Ser Leu Pro
1 5 10 15
Gln Met Ala Ser Leu Arg Ser Pro Arg Phe Arg Met Ala Ser Thr Leu
20 25 30
Arg Ser Gly Ser Lys Glu Val Glu Asn Ile Lys Lys Pro Phe Thr Pro
35 40 45
Pro Arg Glu Val His Val Gln Val Thr His Ser Met Pro Pro Gln Lys
50 55 60
Ile Glu Ile Phe Lys Ser Leu Glu Asp Trp Ala Glu Gln Asn Ile Leu
65 70 75 80
Thr His Leu Lys Pro Val Glu Lys Cys Trp Gln Pro Gln Asp Phe Leu
85 90 95
Pro Asp Pro Ser Ser Asp Gly Phe Glu Glu Gln Val Lys Glu Leu Arg
100 105 110
Glu Arg Ala Lys Glu Leu Pro Asp Asp Tyr Phe Val Val Leu Val Gly
115 120 125
Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn
130 135 140
Thr Leu Asp Gly Val Arg Asp Glu Thr Gly Ala Ser Leu Thr Ser Trp
145 150 155 160
Ala Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn Arg His Gly Asp
165 170 175
Leu Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val Asp Met Lys Gln
180 185 190
Ile Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg
195 200 205
Thr Glu Asn Ser Pro Tyr Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu
210 215 220
Arg Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg Leu Ala Lys Glu
225 230 235 240
His Gly Asp Ile Lys Leu Ala Gln Ile Cys Gly Met Ile Ala Ser Asp
245 250 255
Glu Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Val Glu Lys Leu Phe
260 265 270
Glu Val Asp Pro Asp Gly Thr Val Met Ala Phe Ala Asp Met Met Arg
275 280 285
Lys Lys Ile Ala Met Pro Ala His Leu Met Tyr Asp Gly Arg Asp Asp
290 295 300
Asn Leu Phe Asp Ser Tyr Ser Ser Val Ala Gln Arg Ile Gly Val Tyr
305 310 315 320
Thr Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe Leu Val Gly Arg Trp
325 330 335
Lys Val Glu Gln Leu Thr Gly Leu Ser Gly Glu Gly Arg Lys Ala Gln
340 345 350
Glu Tyr Ile Cys Gly Leu Pro Pro Arg Ile Arg Arg Leu Glu Glu Arg
355 360 365
Ala Gln Ala Arg Val Lys Glu Ser Ser Thr Leu Lys Phe Ser Trp Ile
370 375 380
His Asp Arg Glu Val Leu Leu
385 390
<210> 200
<211> 390
<212> PRT
<213> Olea europaea
<400> 200
Met Ala Leu Lys Leu Cys Phe Pro Pro His Lys Met Pro Ser Phe Pro
1 5 10 15
Asp Ala Arg Ile Arg Ser His Arg Val Phe Met Ala Ser Thr Ile His
20 25 30
Ser Pro Ser Met Glu Val Gly Lys Val Lys Lys Pro Phe Thr Pro Pro
35 40 45
Arg Glu Val His Val Gln Val Thr His Ser Leu Ala Pro Glu Lys Arg
50 55 60
Glu Ile Phe Asn Ser Leu Asn Asn Trp Ala Gln Glu Asn Ile Leu Val
65 70 75 80
Leu Leu Lys Asp Val Asp Lys Cys Trp Gln Pro Ser Asp Phe Leu Pro
85 90 95
Asp Ser Ala Ser Glu Gly Phe Asp Glu Gln Val Met Glu Leu Arg Lys
100 105 110
Arg Cys Lys Glu Ile Pro Asp Asp Tyr Phe Ile Val Leu Val Gly Asp
115 120 125
Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn Thr
130 135 140
Leu Asp Gly Val Arg Asp Glu Thr Gly Ala Ser Leu Thr Pro Trp Ala
145 150 155 160
Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn Arg His Gly Asp Leu
165 170 175
Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val Asp Met Lys Gln Ile
180 185 190
Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg Thr
195 200 205
Glu Asn Asn Pro Tyr Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu Arg
210 215 220
Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg Leu Ala Lys Glu His
225 230 235 240
Gly Asp Leu Lys Leu Ala Gln Ile Cys Gly Ile Ile Ala Ala Asp Glu
245 250 255
Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Val Glu Lys Leu Phe Glu
260 265 270
Ile Asp Pro Asp Gly Thr Val Leu Ala Leu Ala Asp Met Met Arg Lys
275 280 285
Lys Val Ser Met Pro Ala His Leu Met Tyr Asp Gly Gln Asp Asp Asn
290 295 300
Leu Phe Glu Asn Phe Ser Ser Val Ala Gln Arg Leu Gly Val Tyr Thr
305 310 315 320
Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe Leu Val Gly Arg Trp Asp
325 330 335
Ile Glu Lys Leu Thr Gly Leu Ser Gly Glu Gly Arg Lys Ala Gln Asp
340 345 350
Tyr Val Cys Thr Leu Pro Pro Arg Ile Arg Arg Leu Glu Glu Arg Ala
355 360 365
Gln Ser Arg Val Lys Lys Ala Ser Ala Thr Pro Phe Ser Trp Ile Phe
370 375 380
Gly Arg Glu Ile Asn Leu
385 390
<210> 201
<211> 392
<212> PRT
<213> Vernicia fordii
<400> 201
Met Ala Leu Lys Leu Asn Pro Phe Ile Ser Gln Ser His Lys Phe Pro
1 5 10 15
Thr Phe Ala Leu Pro Pro Met Ala Asn Leu Arg Ser Pro Lys Phe Tyr
20 25 30
Met Ala Ser Thr Leu Arg Glu Ile Glu His Leu Lys Lys Pro Phe Met
35 40 45
Pro Pro Arg Glu Val His Val Gln Val Thr His Ser Met Pro Pro Gln
50 55 60
Lys Ile Glu Ile Phe Lys Ser Leu Glu Asp Trp Ala Glu Gln Asn Ile
65 70 75 80
Leu Val His Leu Lys Pro Val Glu Lys Cys Trp Gln Pro Gln Asp Phe
85 90 95
Leu Pro Asp Pro Ala Ser Asp Asp Phe Asp Glu Gln Val Lys Glu Leu
100 105 110
Arg Glu Arg Ala Lys Glu Ile Pro Asp Asp Tyr Phe Val Val Leu Val
115 120 125
Gly Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln Thr Met Leu
130 135 140
Asn Thr Leu Asp Gly Val Arg Asp Glu Thr Gly Ala Ser Leu Thr Ser
145 150 155 160
Trp Ala Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn Arg His Gly
165 170 175
Asp Leu Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val Asp Met Arg
180 185 190
Gln Ile Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser Gly Met Asp Pro
195 200 205
Arg Thr Glu Asn Ser Pro Tyr Leu Gly Phe Ile Tyr Thr Ser Phe Gln
210 215 220
Glu Arg Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg His Ala Lys
225 230 235 240
Glu His Gly Asp Ile Lys Leu Ala Gln Ile Cys Gly Thr Ile Ala Ser
245 250 255
Asp Glu Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Val Glu Lys Leu
260 265 270
Phe Glu Ile Asp Pro Asn Gly Thr Val Leu Ala Phe Ala Asp Met Met
275 280 285
Arg Lys Lys Ile Ser Met Pro Ala His Leu Met Tyr Asp Gly Cys Asn
290 295 300
Asp Asn Leu Phe Asp His Phe Ser Ala Val Ala Gln Arg Leu Gly Val
305 310 315 320
Tyr Thr Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe Leu Val Gly Arg
325 330 335
Trp Lys Val Asp Lys Leu Met Gly Leu Ser Ala Glu Gly Gln Lys Ala
340 345 350
Gln Asp Tyr Val Cys Arg Leu Pro Pro Arg Ile Arg Arg Leu Glu Glu
355 360 365
Arg Ala Gln Gly Arg Ala Lys Glu Ala Thr Ile Val Pro Phe Ser Trp
370 375 380
Ile Phe Glu Arg Glu Val Gln Leu
385 390
<210> 202
<211> 365
<212> PRT
<213> Helinathus annus
<400> 202
Met Leu Ser Arg Gly Val Pro Thr Ala Thr Ala Thr Ala Tyr Asn Asp
1 5 10 15
Val Ile Lys Glu Thr Ala Arg Ser Val Thr Asn Ser Arg Ser Ile Asp
20 25 30
Ser Val Ser Ile Arg Arg Arg Asn Asn Gly Phe Val Ser Asn Ser Leu
35 40 45
Cys Arg Arg Val Ala Pro Val Met Ala Val Lys Val Asp Glu Gln Arg
50 55 60
Thr Gly Val Ala Val Asp Val Thr Glu Lys Arg Leu Ala Asp Arg Leu
65 70 75 80
Arg Met Gly Ser Leu Thr Glu Asp Gly Leu Ser Tyr Lys Glu Arg Phe
85 90 95
Ile Ile Arg Cys Tyr Glu Val Gly Ile Asn Lys Thr Ala Thr Val Glu
100 105 110
Thr Ile Ala Asn Leu Leu Gln Glu Val Gly Gly Asn His Ala Gln Ser
115 120 125
Val Gly Phe Ser Thr Asp Gly Phe Ala Thr Thr Thr Thr Met Arg Lys
130 135 140
Leu Asn Leu Ile Trp Val Thr Ser Arg Met His Ile Glu Ile Tyr Arg
145 150 155 160
Tyr Pro Ala Trp Ser Asp Val Val Glu Ile Glu Thr Trp Cys Gln Gly
165 170 175
Glu Gly Arg Ile Gly Thr Arg Arg Asp Trp Ile Ile Lys Asp His Ala
180 185 190
Asn Gly Glu Val Ile Gly Arg Ala Thr Ser Lys Trp Val Met Met Asn
195 200 205
Ser Glu Thr Arg Arg Leu Gln Lys Val Asn Asp Asp Ile Arg Asp Glu
210 215 220
Tyr Leu Ile Phe Cys Pro Lys Thr Leu Arg Leu Ala Phe Pro Glu Glu
225 230 235 240
Asn Asn Asn Ser Leu Lys Lys Ile Ala Lys Leu Glu Asp Pro Ala Glu
245 250 255
Cys Ser Thr Leu Gly Leu Val Pro Arg Arg Ala Asp Leu Asp Met Asn
260 265 270
Lys His Val Asn Asn Val Thr Tyr Ile Gly Trp Val Leu Glu Ser Ile
275 280 285
Pro Gln Glu Val Ile Asp Thr His Glu Leu Gln Thr Ile Thr Leu Asp
290 295 300
Tyr Arg Arg Glu Cys Gln His Asp Asp Val Val Asp Ser Leu Thr Ser
305 310 315 320
Ser Glu Ser Pro Ala Val Asn Gly Cys Ala Ser Gly Glu Asn Leu Ser
325 330 335
Lys Phe Leu His Leu Leu Arg Ser Ser Gly Glu Gly Leu Glu Leu Asn
340 345 350
Arg Gly Arg Thr Glu Trp Arg Lys Lys Pro Ala Lys Lys
355 360 365
<210> 203
<211> 362
<212> PRT
<213> Brassica rapa
<400> 203
Met Leu Lys Leu Ser Cys Asn Ala Thr Asp Lys Leu Gln Thr Leu Phe
1 5 10 15
Ser His Ser His Gln Pro Asp Pro Ala His Arg Arg Thr Val Ser Ser
20 25 30
Val Ser Cys Ser His Leu Arg Lys Pro Val Leu Asp Pro Leu Arg Ala
35 40 45
Ile Val Ser Ala Asp Gln Gly Ser Val Ile Arg Ala Glu Gln Gly Leu
50 55 60
Gly Ser Leu Ala Asp Gln Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly
65 70 75 80
Leu Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val Gly Ser
85 90 95
Asn Lys Thr Ala Thr Val Glu Thr Val Ala Asn Leu Leu Gln Glu Val
100 105 110
Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly Phe Ala
115 120 125
Thr Thr Pro Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg
130 135 140
Met His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Gly Asp Val Val Glu
145 150 155 160
Ile Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg Arg Asp
165 170 175
Trp Ile Leu Lys Asp Val Ala Thr Gly Glu Val Thr Gly Arg Ala Thr
180 185 190
Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Lys Val
195 200 205
Ser Asp Asp Val Arg Asp Glu Tyr Leu Val Phe Cys Pro Lys Glu Leu
210 215 220
Arg Leu Ala Phe Pro Glu Glu Asn Asn Arg Ser Leu Lys Lys Ile Pro
225 230 235 240
Lys Leu Glu Asp Pro Ala Gln Tyr Ser Met Ile Gly Leu Lys Pro Arg
245 250 255
Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr Tyr Ile
260 265 270
Gly Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Val Asp Thr His Glu
275 280 285
Leu Gln Val Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp Asp
290 295 300
Val Val Asp Ser Leu Thr Thr Thr Thr Ser Glu Ile Gly Gly Thr Asn
305 310 315 320
Gly Ser Ala Ser Ser Gly Thr Gln Gly Gln Asn Asp Ser Gln Phe Leu
325 330 335
His Leu Leu Arg Leu Ser Gly Asp Gly Gln Glu Ile Asn Arg Gly Thr
340 345 350
Thr Leu Trp Arg Lys Lys Pro Ser Asn Leu
355 360
<210> 204
<211> 369
<212> PRT
<213> Jatropha curcas
<400> 204
Met Met Leu Lys Val Pro Cys Thr Ala Pro Asp Gln Ile Gln Ser Leu
1 5 10 15
Ala Pro Gln Cys Arg Phe Leu Asn Gln His Arg Ser Ser Ser His Phe
20 25 30
Thr Arg Arg Arg Ala Asn Ala Val Val Tyr Ser Ser Pro Val Ala Lys
35 40 45
Ile Ser Thr Gln Pro Val Val Ser Asp Gly Val Thr Lys Val Glu Ser
50 55 60
Gly Cys Glu Ser Leu Ala Asp Arg Leu Arg Leu Gly His Leu Thr Glu
65 70 75 80
Asp Gly Phe Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val
85 90 95
Gly Ile Asn Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Phe Leu Gln
100 105 110
Glu Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly
115 120 125
Phe Ala Thr Thr Pro Thr Met Arg Lys Leu His Leu Ile Trp Val Thr
130 135 140
Ala Arg Met His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Ser Asp Val
145 150 155 160
Val Glu Ile Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg
165 170 175
Arg Asp Trp Ile Leu Lys Asp Tyr Ala Thr Gly Gln Val Ile Gly Arg
180 185 190
Ala Thr Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln
195 200 205
Lys Val Thr Asp Asp Val Arg Asp Glu Tyr Leu Val Phe Cys Pro Arg
210 215 220
Glu Leu Arg Leu Ala Phe Pro Glu Glu Asn Asn Arg Ser Leu Lys Lys
225 230 235 240
Ile Ser Lys Leu Glu Asp Thr Thr Gln Tyr Ser Lys Leu Gly Leu Val
245 250 255
Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr
260 265 270
Tyr Ile Gly Trp Val Leu Glu Ser Met Pro Gln Glu Ile Ile Asp Thr
275 280 285
His Glu Leu Gln Thr Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln His
290 295 300
Asp Asp Val Val Asp Ser Leu Thr Ser Ala Glu Ser Leu Glu Gly Ala
305 310 315 320
Gly Leu Asp Leu His Ala Thr Asn Gly Ser Ala Thr Ala Ile Ala Gly
325 330 335
Glu Gln Asp Ser Arg Asn Phe Leu His Leu Leu Arg Phe Ser Ser Asp
340 345 350
Gly Leu Glu Ile Asn Arg Gly Arg Thr Glu Trp Arg Lys Lys Pro Ser
355 360 365
Arg
<210> 205
<211> 229
<212> PRT
<213> Zea mays
<400> 205
Met Arg Lys Leu Gly Leu Ile Trp Val Thr Asn Arg Met His Ile Glu
1 5 10 15
Ile Tyr Lys Tyr Pro Ala Trp Gly Asp Val Val Glu Ile Glu Thr Trp
20 25 30
Cys Gln Glu Asp Gly Lys Ile Gly Thr Arg Arg Asp Trp Ile Leu Lys
35 40 45
Asp Leu Cys Thr Gly Glu Val Thr Gly Arg Ala Thr Ser Lys Trp Val
50 55 60
Met Met Asn Gln Asn Thr Arg Arg Leu Gln Arg Val Ser Asp Asp Val
65 70 75 80
Arg Asp Glu Val Phe Ile His Cys Pro Lys Thr Pro Arg Leu Ala Phe
85 90 95
Pro Glu Glu Asn Asn Gly Ser Leu Lys Lys Ile Pro Asn Leu Ser Asp
100 105 110
Pro Ala Gln Tyr Ser Arg Leu Gly Leu Val Pro Arg Arg Ala Asp Leu
115 120 125
Asp Met Asn Gln His Val Asn Asn Val Thr Tyr Ile Gly Trp Val Leu
130 135 140
Glu Ser Ile Pro Gln Asp Ile Ile Asp Thr His Glu Leu Gln Thr Ile
145 150 155 160
Thr Leu Asp Tyr Arg Arg Glu Cys Gln His Asp Asp Ile Val Asp Ser
165 170 175
Leu Thr Tyr Val Glu Glu Gly Glu Glu Arg Ser Met Asn Gly Ser Ala
180 185 190
Ser Ser Val Pro His Thr Glu Gln Arg Arg Gln Phe Leu His Cys Leu
195 200 205
Arg Phe Ala Ala Asn Gly Asp Glu Ile Asn Arg Gly Arg Thr Val Trp
210 215 220
Arg Lys Leu Ala Arg
225
<210> 206
<211> 366
<212> PRT
<213> Zea mays
<400> 206
Met Leu Arg Cys His Thr Pro Pro Gln Cys Ala Arg Ala Pro Leu Arg
1 5 10 15
His His Gly Arg Trp Glu Ser Pro Pro Ala Ala Ala Pro Ala Val Val
20 25 30
Val Arg Cys Ala Arg Gly Ala Pro Gln Val Ser Gly Ile Glu Ala Ala
35 40 45
Ser Pro Gly His Ala Ala Val Thr Ala Ala Leu Ala Lys Ala Glu Gly
50 55 60
Gly Asp Ala Arg Pro Ser Leu Ala Glu Arg Leu Arg Leu Gly Asn Leu
65 70 75 80
Leu Glu Asp Gly Leu Ser Tyr Lys Glu Ser Phe Ile Val Arg Cys Tyr
85 90 95
Glu Val Gly Ile Asn Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu
100 105 110
Leu Gln Glu Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr
115 120 125
Asp Gly Phe Ala Thr Thr Thr Thr Met Arg Lys Leu Gly Leu Ile Trp
130 135 140
Val Thr Asn Arg Met His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Gly
145 150 155 160
Asp Phe Val Glu Ile Glu Thr Trp Cys Gln Glu Asp Gly Arg Ile Gly
165 170 175
Thr Arg Arg Asp Trp Ile Leu Lys Asp Leu Ala Asn Gly Glu Val Ile
180 185 190
Gly Arg Ala Thr Ser Lys Trp Val Met Met Asn Gln Asn Thr Arg Arg
195 200 205
Leu Gln Arg Val Ser Asp Asp Val Arg Asp Glu Val Phe Met His Cys
210 215 220
Pro Lys Ala Pro Arg Leu Ala Phe Pro Glu Glu Asn Asn Gly Ser Leu
225 230 235 240
Lys Lys Ile Pro Asn Leu Ser Asp Pro Ala Glu Tyr Ser Arg Leu Gly
245 250 255
Leu Val Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn
260 265 270
Val Thr Tyr Ile Gly Trp Val Leu Glu Ser Ile Pro Gln Asp Ile Ile
275 280 285
Asp Thr His Glu Leu Gln Thr Ile Thr Leu Asp Tyr Arg Arg Glu Cys
290 295 300
Gln Gln Asp Asp Ile Val Asp Ser Leu Thr Cys Ile Glu Glu Gly Glu
305 310 315 320
Glu Lys Ser Met Asn Gly Ser Ala Ser Ala Ala Ala Pro His Lys Glu
325 330 335
Glu Arg Gln Gln Phe Leu His Cys Leu Arg Phe Ala Ala Asn Gly His
340 345 350
Glu Ile Asn Arg Gly Arg Thr Val Trp Arg Lys Leu Ala Arg
355 360 365
<210> 207
<211> 381
<212> PRT
<213> Carthamus tinctorius
<400> 207
Met Gly Ala Gly Gly Arg Met Asn Val Ala Val Ser Gly Ser Glu Lys
1 5 10 15
Pro His Ala Phe Lys Arg Val Pro Val Ser Lys Pro Pro Phe Glu Leu
20 25 30
Ser Asp Leu Lys Lys Ala Val Pro Pro His Cys Phe Lys Arg Ser Leu
35 40 45
Val Arg Ser Phe Ala Ala Leu Phe Arg Asp Ile Ile Ile Val Thr Ala
50 55 60
Leu Tyr Tyr Leu Ala Ala Thr Ile Ile Pro Val Leu Pro Lys Pro Leu
65 70 75 80
Thr Tyr Val Ala Trp Pro Leu Tyr Trp Phe Phe Gln Gly Ala Tyr Leu
85 90 95
Met Gly Leu Trp Val Ile Gly His Glu Cys Gly His His Gly Phe Ser
100 105 110
Glu Tyr Gln Trp Leu Asp Asp Thr Val Gly Phe Ile Val His Ser Phe
115 120 125
Ile Leu Thr Pro Tyr Phe Gly Phe Lys Tyr Ser His Arg Thr His His
130 135 140
Ala Asn Thr Asn Ser Ile Glu Tyr Asp Glu Val Trp Ile Pro Lys Arg
145 150 155 160
Lys Ser Asp Lys Leu Tyr Ser Glu Val Leu Asn Asn Pro Leu Gly Ser
165 170 175
Phe Ile Val Phe Val Phe Lys Ile Val Leu Gly Phe Pro Leu Tyr Phe
180 185 190
Val Phe Asn Leu Tyr Gly Arg Lys Tyr Glu Lys Gly Ile Thr Ser His
195 200 205
Phe Tyr Pro Tyr Ser Pro Ile Phe Asn Asp Ser Glu Arg Phe Gln Ile
210 215 220
Phe Leu Thr Asp Leu Gly Val Phe Gly Thr Leu Tyr Gly Val Tyr Arg
225 230 235 240
Leu Ala Leu Ile Lys Gly Thr Glu Trp Val Ile Asn Phe Tyr Gly Met
245 250 255
Pro Ile Leu Phe Met Ser Gly Ser Phe Ile Leu Leu Thr Tyr Leu His
260 265 270
His Thr His Pro Ser Ile Pro His Tyr Asp Ser Thr Glu Trp Asp Trp
275 280 285
Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asn Phe Gly Phe Leu Asn
290 295 300
His Ala Phe His Asp Ala Thr Arg Thr His Ala Val His His Leu Phe
305 310 315 320
Pro Thr Ile Pro His Tyr His Thr Phe Glu Ala Arg Gln Ala Val Met
325 330 335
Pro Ile Leu Gly Asp Tyr Tyr Lys Tyr Asp Asp Thr Pro Ile Leu Gln
340 345 350
Ala Ile Trp Arg Glu Thr Lys Asp Cys Thr Phe Ile Glu Pro Glu Glu
355 360 365
Val Asn Gly Glu Lys Lys Gly Ile Tyr Trp Phe Tyr Lys
370 375 380
<210> 208
<211> 383
<212> PRT
<213> Gossypium hirsutum
<400> 208
Met Gly Ala Gly Gly Arg Met Ser Val Pro Thr Ser Pro Lys Lys Pro
1 5 10 15
Glu Phe Asn Ser Leu Lys Arg Val Pro Tyr Ser Lys Pro Pro Phe Thr
20 25 30
Leu Ser Glu Ile Lys Lys Ala Ile Pro Pro His Cys Phe Gln Arg Ser
35 40 45
Val Leu Arg Ser Phe Ser Tyr Leu Leu Tyr Asp Phe Ile Leu Ala Ser
50 55 60
Leu Phe Tyr His Val Ala Thr Asn Tyr Phe Pro Asn Leu Pro Gln Ala
65 70 75 80
Leu Ser Asn Val Ala Trp Pro Leu Tyr Trp Ala Met Gln Gly Cys Ile
85 90 95
Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp Tyr Gln Trp Leu Asp Asp Thr Val Gly Leu Ile Leu His Ser
115 120 125
Ser Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys
145 150 155 160
Lys Lys Ser Gly Leu Arg Trp Trp Ala Lys His Phe Asn Asn Pro Pro
165 170 175
Gly Arg Phe Leu Ser Ile Thr Ile Gln Leu Thr Leu Gly Trp Pro Leu
180 185 190
Tyr Leu Ala Phe Asn Val Ala Gly Arg Pro Tyr Asp Arg Phe Ala Cys
195 200 205
His Tyr Asp Pro Tyr Gly Pro Ile Phe Ser Asp Arg Glu Arg Leu Gln
210 215 220
Ile Tyr Ile Ser Asp Ala Gly Val Leu Ala Val Ala Tyr Ala Leu Tyr
225 230 235 240
Arg Leu Val Leu Ala Lys Gly Val Gly Trp Val Ile Ser Val Tyr Gly
245 250 255
Val Pro Leu Leu Val Val Asn Ala Phe Leu Val Met Ile Thr Tyr Leu
260 265 270
Gln His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp Asp
275 280 285
Trp Met Arg Gly Ala Leu Ser Thr Val Asp Arg Asp Tyr Gly Ile Leu
290 295 300
Asn Lys Val Phe His Asn Ile Thr Asp Thr His Val Ala His His Leu
305 310 315 320
Phe Ser Thr Met Pro His Tyr His Ala Met Val Ala Thr Lys Ala Ile
325 330 335
Lys Pro Ile Leu Gly Glu Tyr Tyr Gln Phe Asp Gly Met Pro Val Tyr
340 345 350
Lys Ala Ile Trp Arg Glu Ala Lys Glu Cys Leu Tyr Val Glu Pro Asp
355 360 365
Glu Gly Asp Lys Asp Lys Gly Val Phe Trp Phe Arg Asn Lys Leu
370 375 380
<210> 209
<211> 383
<212> PRT
<213> Glycine max
<400> 209
Met Gly Ala Gly Gly Arg Thr Asp Val Pro Pro Ala Asn Arg Lys Ser
1 5 10 15
Glu Val Asp Pro Leu Lys Arg Val Pro Phe Glu Lys Pro Pro Phe Ser
20 25 30
Leu Ser Gln Ile Lys Lys Val Ile Pro Pro His Cys Phe Gln Arg Ser
35 40 45
Val Phe Arg Ser Phe Ser Tyr Val Val Tyr Asp Leu Thr Ile Ala Phe
50 55 60
Cys Leu Tyr Tyr Val Ala Thr His Tyr Phe His Leu Leu Pro Ser Pro
65 70 75 80
Leu Ser Phe Leu Ala Trp Pro Ile Tyr Trp Ala Val Gln Gly Cys Ile
85 90 95
Leu Thr Gly Val Trp Val Ile Ala His Glu Cys Gly His His Ala Phe
100 105 110
Ser Asp Tyr Gln Leu Leu Asp Asp Ile Val Gly Leu Val Leu His Ser
115 120 125
Gly Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His
130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys
145 150 155 160
Gln Lys Ser Cys Ile Lys Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro
165 170 175
Gly Arg Val Leu Thr Leu Ala Val Thr Leu Thr Leu Gly Trp Pro Leu
180 185 190
Tyr Leu Ala Leu Asn Val Ser Gly Arg Pro Tyr Asp Arg Phe Ala Cys
195 200 205
His Tyr Asp Pro Tyr Gly Pro Ile Tyr Ser Asp Arg Glu Arg Leu Gln
210 215 220
Ile Tyr Ile Ser Asp Ala Gly Val Leu Ala Val Cys Tyr Gly Leu Phe
225 230 235 240
Arg Leu Ala Met Ala Lys Gly Leu Ala Trp Val Val Cys Val Tyr Gly
245 250 255
Val Pro Leu Leu Val Val Asn Gly Phe Leu Val Leu Ile Thr Phe Leu
260 265 270
Gln His Thr His Pro Ala Leu Pro His Tyr Thr Ser Ser Glu Trp Asp
275 280 285
Trp Leu Arg Gly Ala Leu Ala Thr Val Asp Arg Asp Tyr Gly Ile Leu
290 295 300
Asp Lys Val Phe His Asn Ile Thr Asp Thr His Val Ala His Glu Leu
305 310 315 320
Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala Ile
325 330 335
Lys Pro Ile Leu Gly Glu Tyr Tyr Arg Phe Asp Glu Thr Pro Phe Val
340 345 350
Lys Ala Met Trp Arg Glu Ala Arg Glu Cys Ile Tyr Val Glu Pro Asp
355 360 365
Gln Ser Thr Glu Ser Lys Gly Val Phe Trp Tyr Asn Asn Lys Leu
370 375 380
<210> 210
<211> 387
<212> PRT
<213> Zea mays
<400> 210
Met Gly Ala Gly Gly Arg Met Thr Glu Lys Glu Arg Glu Lys Gln Glu
1 5 10 15
Gln Leu Ala Arg Ala Thr Gly Gly Ala Ala Met Gln Arg Ser Pro Val
20 25 30
Glu Lys Pro Pro Phe Thr Leu Gly Gln Ile Lys Lys Ala Ile Pro Pro
35 40 45
His Cys Phe Glu Arg Ser Val Leu Lys Ser Phe Ser Tyr Val Val His
50 55 60
Asp Leu Val Ile Ala Ala Ala Leu Leu Tyr Phe Ala Leu Ala Ile Ile
65 70 75 80
Pro Ala Leu Pro Ser Pro Leu Gly Tyr Ala Ala Trp Pro Leu Tyr Trp
85 90 95
Ile Ala Gln Gly Cys Val Cys Thr Gly Val Trp Val Ile Ala His Glu
100 105 110
Cys Gly His His Ala Phe Ser Asp Tyr Ser Leu Leu Asp Asp Val Val
115 120 125
Gly Leu Val Leu His Ser Ser Leu Met Val Pro Tyr Phe Ser Trp Lys
130 135 140
Tyr Ser His Arg Arg His His Ser Asn Thr Gly Ser Leu Glu Arg Asp
145 150 155 160
Glu Val Phe Val Pro Lys Lys Lys Glu Ala Leu Pro Trp Tyr Thr Pro
165 170 175
Tyr Val Tyr Asn Asn Pro Val Gly Arg Leu Ala His Ile Val Val Gln
180 185 190
Leu Thr Leu Gly Trp Pro Leu Tyr Leu Ala Thr Asn Ala Ser Gly Arg
195 200 205
Pro Tyr Pro Arg Phe Ala Cys His Phe Asp Pro Tyr Gly Pro Ile Tyr
210 215 220
Asn Asp Arg Glu Arg Ala Gln Ile Phe Val Ser Asp Ala Gly Val Ala
225 230 235 240
Ala Val Ala Phe Gly Leu Tyr Lys Leu Ala Ala Ala Phe Gly Val Trp
245 250 255
Trp Val Val Arg Val Tyr Ala Val Pro Leu Leu Ile Val Asn Ala Trp
260 265 270
Leu Val Leu Ile Thr Tyr Leu Gln His Thr His Pro Ser Leu Pro His
275 280 285
Tyr Asp Ser Ser Glu Trp Asp Trp Leu Arg Gly Ala Leu Ala Thr Met
290 295 300
Asp Arg Asp Tyr Gly Ile Leu Asn Arg Val Phe His Asn Ile Thr Asp
305 310 315 320
Thr His Val Ala His His Leu Phe Ser Thr Met Pro His Tyr His Ala
325 330 335
Met Glu Ala Thr Lys Ala Ile Arg Pro Ile Leu Gly Asp Tyr Tyr His
340 345 350
Phe Asp Pro Thr Pro Val Ala Lys Ala Thr Trp Arg Glu Ala Gly Glu
355 360 365
Cys Ile Tyr Val Glu Pro Glu Asp Arg Lys Gly Val Phe Trp Tyr Asn
370 375 380
Lys Lys Phe
385
<210> 211
<211> 368
<212> PRT
<213> Prototheca moriformis
<400> 211
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Ser Ser Met Tyr Leu Ala Phe Asp Ile Ala Val Met Ser
35 40 45
Leu Leu Tyr Val Ala Ser Thr Tyr Ile Asp Pro Ala Pro Val Pro Thr
50 55 60
Trp Val Lys Tyr Gly Val Met Trp Pro Leu Tyr Trp Phe Phe Gln Gly
65 70 75 80
Ala Phe Gly Thr Gly Val Trp Val Cys Ala His Glu Cys Gly His Gln
85 90 95
Ala Phe Ser Ser Ser Gln Ala Ile Asn Asp Gly Val Gly Leu Val Phe
100 105 110
His Ser Leu Leu Leu Val Pro Tyr Tyr Ser Trp Lys His Ser His Arg
115 120 125
Arg His His Ser Asn Thr Gly Cys Leu Asp Lys Asp Glu Val Phe Val
130 135 140
Pro Pro His Arg Ala Val Ala His Glu Gly Leu Glu Trp Glu Glu Trp
145 150 155 160
Leu Pro Ile Arg Met Gly Lys Val Leu Val Thr Leu Thr Leu Gly Trp
165 170 175
Pro Leu Tyr Leu Met Phe Asn Val Ala Ser Arg Pro Tyr Pro Arg Phe
180 185 190
Ala Asn His Phe Asp Pro Trp Ser Pro Ile Phe Ser Lys Arg Glu Arg
195 200 205
Ile Glu Val Val Ile Ser Asp Leu Ala Leu Val Ala Val Leu Ser Gly
210 215 220
Leu Ser Val Leu Gly Arg Thr Met Gly Trp Ala Trp Leu Val Lys Thr
225 230 235 240
Tyr Val Val Pro Tyr Leu Ile Val Asn Met Trp Leu Val Leu Ile Thr
245 250 255
Leu Leu Gln His Thr His Pro Ala Leu Pro His Tyr Phe Glu Lys Asp
260 265 270
Trp Asp Trp Leu Arg Gly Ala Met Ala Thr Val Asp Arg Ser Met Gly
275 280 285
Pro Pro Phe Met Asp Asn Ile Leu His His Ile Ser Asp Thr His Val
290 295 300
Leu His His Leu Phe Ser Thr Ile Pro His Tyr His Ala Glu Glu Ala
305 310 315 320
Ser Ala Ala Ile Arg Pro Ile Leu Gly Lys Tyr Tyr Gln Ser Asp Ser
325 330 335
Arg Trp Val Gly Arg Ala Leu Trp Glu Asp Trp Arg Asp Cys Arg Tyr
340 345 350
Val Val Pro Asp Ala Pro Glu Asp Asp Ser Ala Leu Trp Phe His Lys
355 360 365
<210> 212
<211> 368
<212> PRT
<213> Prototheca moriformis
<400> 212
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Ser Ser Met Tyr Leu Ala Phe Asp Ile Ala Val Met Ser
35 40 45
Leu Leu Tyr Val Ala Ser Thr Tyr Ile Asp Pro Ala Pro Val Pro Thr
50 55 60
Trp Val Lys Tyr Gly Ile Met Trp Pro Leu Tyr Trp Phe Phe Gln Gly
65 70 75 80
Ala Phe Gly Thr Gly Val Trp Val Cys Ala His Glu Cys Gly His Gln
85 90 95
Ala Phe Ser Ser Ser Gln Ala Ile Asn Asp Gly Val Gly Leu Val Phe
100 105 110
His Ser Leu Leu Leu Val Pro Tyr Tyr Ser Trp Lys His Ser His Arg
115 120 125
Arg His His Ser Asn Thr Gly Cys Leu Asp Lys Asp Glu Val Phe Val
130 135 140
Pro Pro His Arg Ala Val Ala His Glu Gly Leu Glu Trp Glu Glu Trp
145 150 155 160
Leu Pro Ile Arg Met Gly Lys Val Leu Val Thr Leu Thr Leu Gly Trp
165 170 175
Pro Leu Tyr Leu Met Phe Asn Val Ala Ser Arg Pro Tyr Pro Arg Phe
180 185 190
Ala Asn His Phe Asp Pro Trp Ser Pro Ile Phe Ser Lys Arg Glu Arg
195 200 205
Ile Glu Val Val Ile Ser Asp Leu Ala Leu Val Ala Val Leu Ser Gly
210 215 220
Leu Ser Val Leu Gly Arg Thr Met Gly Trp Ala Trp Leu Val Lys Thr
225 230 235 240
Tyr Val Val Pro Tyr Met Ile Val Asn Met Trp Leu Val Leu Ile Thr
245 250 255
Leu Leu Gln His Thr His Pro Ala Leu Pro His Tyr Phe Glu Lys Asp
260 265 270
Trp Asp Trp Leu Arg Gly Ala Met Ala Thr Val Asp Arg Ser Met Gly
275 280 285
Pro Pro Phe Met Asp Ser Ile Leu His His Ile Ser Asp Thr His Val
290 295 300
Leu His His Leu Phe Ser Thr Ile Pro His Tyr His Ala Glu Glu Ala
305 310 315 320
Ser Ala Ala Ile Arg Pro Ile Leu Gly Lys Tyr Tyr Gln Ser Asp Ser
325 330 335
Arg Trp Val Gly Arg Ala Leu Trp Glu Asp Trp Arg Asp Cys Arg Tyr
340 345 350
Val Val Pro Asp Ala Pro Glu Asp Asp Ser Ala Leu Trp Phe His Lys
355 360 365
<210> 213
<211> 383
<212> PRT
<213> Brassica napa
<400> 213
Met Val Val Ala Met Asp Gln Arg Ser Asn Val Asn Gly Asp Ser Gly
1 5 10 15
Ala Arg Lys Glu Glu Gly Phe Asp Pro Ser Ala Gln Pro Pro Phe Lys
20 25 30
Ile Gly Asp Ile Arg Ala Ala Ile Pro Lys His Cys Trp Val Lys Ser
35 40 45
Pro Leu Arg Ser Met Ser Tyr Val Thr Arg Asp Ile Phe Ala Val Ala
50 55 60
Ala Leu Ala Met Ala Ala Val Tyr Phe Asp Ser Trp Phe Leu Trp Pro
65 70 75 80
Leu Tyr Trp Val Ala Gln Gly Thr Leu Phe Trp Ala Ile Phe Val Leu
85 90 95
Gly His Asp Cys Gly His Gly Ser Phe Ser Asp Ile Pro Leu Leu Asn
100 105 110
Ser Val Val Gly His Ile Leu His Ser Phe Ile Leu Val Pro Tyr His
115 120 125
Gly Trp Arg Ile Ser His Arg Thr His His Gln Asn His Gly His Val
130 135 140
Glu Asn Asp Glu Ser Trp Val Pro Leu Pro Glu Lys Leu Tyr Lys Asn
145 150 155 160
Leu Pro His Ser Thr Arg Met Leu Arg Tyr Thr Val Pro Leu Pro Met
165 170 175
Leu Ala Tyr Pro Ile Tyr Leu Trp Tyr Arg Ser Pro Gly Lys Glu Gly
180 185 190
Ser His Phe Asn Pro Tyr Ser Ser Leu Phe Ala Pro Ser Glu Arg Lys
195 200 205
Leu Ile Ala Thr Ser Thr Thr Cys Trp Ser Ile Met Leu Ala Thr Leu
210 215 220
Val Tyr Leu Ser Phe Leu Val Asp Pro Val Thr Val Leu Lys Val Tyr
225 230 235 240
Gly Val Pro Tyr Ile Ile Phe Val Met Trp Leu Asp Ala Val Thr Tyr
245 250 255
Leu His His His Gly His Asp Glu Lys Leu Pro Trp Tyr Arg Gly Lys
260 265 270
Glu Trp Ser Tyr Leu Arg Gly Gly Leu Thr Thr Ile Asp Arg Asp Tyr
275 280 285
Gly Ile Phe Asn Asn Ile His His Asp Ile Gly Thr His Val Ile His
290 295 300
His Leu Phe Pro Gln Ile Pro His Tyr His Leu Val Asp Ala Thr Arg
305 310 315 320
Ala Ala Lys His Val Leu Gly Arg Tyr Tyr Arg Glu Pro Lys Thr Ser
325 330 335
Gly Ala Ile Pro Ile His Leu Val Glu Ser Leu Val Ala Ser Ile Lys
340 345 350
Lys Asp His Tyr Val Ser Asp Thr Gly Asp Ile Val Phe Tyr Glu Thr
355 360 365
Asp Pro Asp Leu Tyr Val Tyr Ala Ser Asp Lys Ser Lys Ile Asn
370 375 380
<210> 214
<211> 448
<212> PRT
<213> Camelina sativa
<400> 214
Met Ala Asn Leu Val Leu Ser Glu Cys Gly Ile Arg Pro Leu Pro Arg
1 5 10 15
Ile Tyr Thr Thr Pro Arg Ser Asn Phe Val Ser Asn Asn Asn Lys Pro
20 25 30
Ile Phe Lys Phe Arg Pro Phe Thr Ser Tyr Lys Thr Ser Ser Ser Pro
35 40 45
Leu Ala Cys Ser Arg Asp Gly Phe Gly Lys Asn Trp Ser Leu Asn Val
50 55 60
Ser Val Pro Leu Thr Thr Thr Thr Pro Ile Val Asp Glu Ser Pro Leu
65 70 75 80
Lys Glu Glu Glu Glu Glu Lys Gln Arg Phe Asp Pro Gly Ala Pro Pro
85 90 95
Pro Phe Asn Leu Ala Asp Ile Arg Ala Ala Ile Pro Lys His Cys Trp
100 105 110
Val Lys Asn Pro Trp Lys Ser Met Ser Tyr Val Leu Arg Asp Val Ala
115 120 125
Ile Val Phe Ala Leu Ala Ala Gly Ala Ser Tyr Leu Asn Asn Trp Ile
130 135 140
Val Trp Pro Leu Tyr Trp Leu Ala Gln Gly Thr Met Phe Trp Ala Leu
145 150 155 160
Phe Val Leu Gly His Asp Cys Gly His Gly Ser Phe Ser Asn Asn Pro
165 170 175
Arg Leu Asn Asn Val Val Gly His Leu Leu His Ser Ser Ile Leu Val
180 185 190
Pro Tyr His Gly Trp Arg Ile Ser His Arg Thr His His Gln Asn His
195 200 205
Gly His Val Glu Asn Asp Glu Ser Trp His Pro Met Ser Glu Lys Ile
210 215 220
Tyr Gln Ser Leu Asp Lys Pro Thr Arg Phe Phe Arg Phe Thr Leu Pro
225 230 235 240
Leu Val Met Leu Ala Tyr Pro Phe Tyr Leu Trp Ala Arg Ser Pro Gly
245 250 255
Lys Lys Gly Ser His Tyr His Pro Glu Ser Asp Leu Phe Leu Pro Lys
260 265 270
Glu Lys Thr Asp Val Leu Thr Ser Thr Ala Cys Trp Thr Ala Met Ala
275 280 285
Ala Leu Leu Ile Cys Leu Asn Phe Val Val Gly Pro Val Gln Met Leu
290 295 300
Lys Leu Tyr Gly Ile Pro Tyr Trp Ile Asn Val Met Trp Leu Asp Phe
305 310 315 320
Val Thr Tyr Leu His His His Gly His Glu Asp Lys Leu Pro Trp Tyr
325 330 335
Arg Gly Lys Glu Trp Ser Tyr Leu Arg Gly Gly Leu Thr Thr Leu Asp
340 345 350
Arg Asp Tyr Gly Val Ile Asn Asn Ile His His Asp Ile Gly Thr His
355 360 365
Val Ile His His Leu Phe Pro Gln Ile Pro His Tyr His Leu Val Glu
370 375 380
Ala Thr Glu Ala Val Lys Pro Val Leu Gly Lys Tyr Tyr Arg Glu Pro
385 390 395 400
Asp Lys Ser Gly Pro Leu Pro Leu His Leu Leu Gly Ile Leu Ala Lys
405 410 415
Ser Ile Lys Glu Asp His Tyr Val Ser Asp Glu Gly Asp Val Val Tyr
420 425 430
Tyr Lys Ala Asp Pro Asn Met Tyr Gly Glu Ile Lys Val Gly Ala Asp
435 440 445
<210> 215
<211> 448
<212> PRT
<213> Camelina sativa
<400> 215
Met Ala Asn Leu Val Leu Ser Glu Cys Gly Ile Arg Pro Leu Pro Arg
1 5 10 15
Ile Tyr Thr Thr Pro Arg Ser Asn Phe Val Ser Asn Asn Asn Lys Pro
20 25 30
Ile Phe Lys Phe Arg Pro Leu Thr Ser Tyr Lys Thr Ser Ser Pro Leu
35 40 45
Phe Cys Ser Arg Asp Gly Phe Gly Arg Asn Trp Ser Leu Asn Val Ser
50 55 60
Val Pro Leu Ala Thr Thr Thr Pro Ile Val Asp Glu Ser Pro Leu Glu
65 70 75 80
Glu Glu Glu Glu Glu Glu Lys Gln Arg Phe Asp Pro Gly Ala Pro Pro
85 90 95
Pro Phe Asn Leu Ala Asp Ile Arg Ala Ala Ile Pro Lys His Cys Trp
100 105 110
Val Lys Asn Pro Trp Lys Ser Met Ser Tyr Val Leu Arg Asp Val Ala
115 120 125
Ile Val Phe Ala Leu Ala Ala Gly Ala Ala Tyr Leu Asn Asn Trp Ile
130 135 140
Val Trp Pro Leu Tyr Trp Leu Ala Gln Gly Thr Met Phe Trp Ala Leu
145 150 155 160
Phe Val Leu Gly His Asp Cys Gly His Gly Ser Phe Ser Asn Asn Pro
165 170 175
Arg Leu Asn Asn Val Val Gly His Leu Leu His Ser Ser Ile Leu Val
180 185 190
Pro Tyr His Gly Trp Arg Ile Ser His Arg Thr His His Gln Asn His
195 200 205
Gly His Val Glu Asn Asp Glu Ser Trp His Pro Met Ser Glu Lys Ile
210 215 220
Tyr Gln Ser Leu Asp Lys Pro Thr Arg Phe Phe Arg Phe Thr Leu Pro
225 230 235 240
Leu Val Met Leu Ala Tyr Pro Phe Tyr Leu Trp Ala Arg Ser Pro Gly
245 250 255
Lys Lys Gly Ser His Tyr His Pro Glu Ser Asp Leu Phe Leu Pro Lys
260 265 270
Glu Lys Thr Asp Val Leu Thr Ser Thr Ala Cys Trp Thr Ala Met Ala
275 280 285
Ala Leu Leu Ile Cys Leu Asn Phe Val Val Gly Pro Val Gln Met Leu
290 295 300
Lys Leu Tyr Gly Ile Pro Tyr Trp Ile Asn Val Met Trp Leu Asp Phe
305 310 315 320
Val Thr Tyr Leu His His His Gly His Glu Asp Lys Leu Pro Trp Tyr
325 330 335
Arg Gly Lys Glu Trp Ser Tyr Leu Arg Gly Gly Leu Thr Thr Leu Asp
340 345 350
Arg Asp Tyr Gly Val Ile Asn Asn Ile His His Asp Ile Gly Thr His
355 360 365
Val Ile His His Leu Phe Pro Gln Ile Pro His Tyr His Leu Val Glu
370 375 380
Ala Thr Glu Ala Val Lys Pro Val Leu Gly Lys Tyr Tyr Arg Glu Pro
385 390 395 400
Asp Lys Ser Gly Pro Leu Pro Leu His Leu Leu Gly Ile Leu Ala Lys
405 410 415
Ser Ile Lys Glu Asp His Tyr Val Ser Asp Glu Gly Asp Val Val Tyr
420 425 430
Tyr Lys Ala Asp Pro Asn Met Tyr Gly Glu Ile Lys Val Gly Ala Asp
435 440 445
<210> 216
<211> 453
<212> PRT
<213> Glycine max
<400> 216
Met Ala Thr Trp Val Leu Ser Glu Cys Ser Leu Lys Pro Leu Ala Pro
1 5 10 15
Val Ile Pro Arg Pro Arg Thr Gly Ala Val Leu Ser Ser Thr Ser Lys
20 25 30
Val Gly Phe Leu Glu Thr Asn Lys Val Leu Glu Gly Ser Lys Phe Gln
35 40 45
Pro Leu Arg Cys Asn Leu Arg Glu Arg Asn Trp Gly Leu Lys Val Ser
50 55 60
Val Pro Leu Arg Ile Ala Ser Ile Glu Glu Glu Glu Gln Lys Ser Val
65 70 75 80
Asp Val Ile Asn Gly Ser Asn Gly Val Glu His Glu Lys Leu Pro Glu
85 90 95
Phe Asp Pro Gly Ala Pro Pro Pro Phe Asn Leu Ala Asp Ile Arg Ala
100 105 110
Ala Ile Pro Lys His Cys Trp Val Lys Asp Pro Leu Lys Ser Met Ser
115 120 125
Tyr Val Val Arg Asp Val Ile Ala Val Phe Gly Leu Ala Ser Ala Ala
130 135 140
Ala Tyr Leu Asn Asn Trp Leu Val Trp Pro Leu Tyr Trp Ala Ala Gln
145 150 155 160
Gly Thr Met Phe Trp Ala Leu Phe Val Leu Gly His Asp Cys Gly His
165 170 175
Gly Ser Phe Ser Asn Asn Pro Lys Leu Asn Ser Val Val Gly His Leu
180 185 190
Leu His Ser Ser Ile Leu Val Pro Tyr His Gly Trp Arg Ile Ser His
195 200 205
Arg Thr His His Gln His His Gly His Val Glu Asn Asp Glu Ser Trp
210 215 220
His Pro Leu Pro Glu Lys Leu Phe Arg Ser Leu Asp Thr Val Thr Arg
225 230 235 240
Met Leu Arg Phe Thr Ala Pro Phe Pro Leu Leu Ala Tyr Pro Val Tyr
245 250 255
Leu Trp Gly Arg Ser Pro Gly Lys Thr Gly Ser His Phe Asp Pro Ser
260 265 270
Ser Asp Leu Phe Val Pro Asn Glu Arg Lys Asp Val Ile Thr Ser Thr
275 280 285
Ala Cys Trp Ala Ala Met Leu Gly Leu Leu Val Gly Leu Gly Phe Val
290 295 300
Met Gly Pro Ile Gln Leu Leu Lys Leu Tyr Gly Val Pro Tyr Val Ile
305 310 315 320
Phe Val Met Trp Leu Asp Leu Val Thr Tyr Leu His His His Gly His
325 330 335
Glu Asp Lys Leu Pro Trp Tyr Arg Gly Lys Glu Trp Ser Tyr Leu Arg
340 345 350
Gly Gly Leu Thr Thr Leu Asp Arg Asp Tyr Gly Leu Ile Asn Asn Ile
355 360 365
His His Asp Ile Gly Thr His Val Ile His His Leu Phe Pro Gln Ile
370 375 380
Pro His Tyr His Leu Val Glu Ala Thr Glu Ala Ala Lys Pro Val Phe
385 390 395 400
Gly Lys Tyr Tyr Arg Glu Pro Lys Lys Ser Ser Pro Leu Pro Phe His
405 410 415
Leu Ile Gly Glu Leu Ile Lys Ser Phe Lys Thr Asp His Phe Val Ser
420 425 430
Asp Lys Gly Asp Val Val Tyr Tyr Gln Thr Asp Ser Glu Ile Asn Gly
435 440 445
Ser Ser Lys Ser Glu
450
<210> 217
<211> 451
<212> PRT
<213> Vernicia fordii
<400> 217
Met Ala Val Trp Ala Leu Ser Asp Cys Gly Ile Arg Pro Leu Pro Lys
1 5 10 15
Ile Tyr Ser Lys Pro Arg Leu Ala Phe Thr Ser Asn Asn Pro Gln Pro
20 25 30
Thr Lys Pro Pro Ile Pro Arg Pro Glu Leu Arg Asn Gly Ser Ser Phe
35 40 45
Lys Leu Ser Ser Ala Gly Leu Arg Asp Lys Trp Val Val Asn Leu Ser
50 55 60
Ala Pro Leu Arg Gly Gly Leu Val Glu Glu Asp Glu Asp Asn Phe Glu
65 70 75 80
Gly Asn Arg Val Ile Ser Ile Asp Glu Ser Gly Gly Glu Asp Phe Asp
85 90 95
Pro Asp Ala Pro Pro Pro Asp Thr Leu Ala Asp Ile Arg Ala Ala Ile
100 105 110
Pro Lys His Arg Trp Thr Lys Asn Pro Glu Ile Ser Leu Ser Tyr Val
115 120 125
Val Arg Asn Val Ala Val Val Ser Gly Leu Ala Ala Val Ala Ala Tyr
130 135 140
Phe Asn Asp Trp Ala Phe Trp Ser Pro Tyr Trp Ile Cys Gln Gly Thr
145 150 155 160
Met Leu Ser Ala Leu Phe Val Leu Gly His Asp Cys Gly His Gly Ser
165 170 175
Phe Ser Asn Asn Pro Asn Leu Asp Ser Val Val Gly His Leu Leu His
180 185 190
Tyr Ser Ile Leu Val Pro Tyr His Gly Trp Arg Ile Ser Tyr Arg Thr
195 200 205
His Tyr Arg His His Gln His Ala Glu Asn Asp Glu Ser Trp His Pro
210 215 220
Leu Ser Glu Lys Ile Tyr Lys Gly Leu Asn Asn Val Thr Arg Thr Leu
225 230 235 240
Arg Leu Ser Leu Pro Phe Ser Leu Leu Ala Tyr Pro Ser Tyr Leu Trp
245 250 255
Ser Arg Ser Pro Gly Lys Lys Gly Phe His Phe His Pro Ser Ser Asp
260 265 270
Leu Phe Val Pro Ser Glu Lys Lys Asp Val Ile Thr Ser Thr Val Cys
275 280 285
Trp Thr Ala Met Leu Ala Leu Leu Val Gly Ser Ser Phe Val Met Gly
290 295 300
Leu Val Gln Leu Leu Lys Pro Tyr Gly Ile Pro Tyr Leu Ile Phe Val
305 310 315 320
Met Trp Leu Asp Leu Val Thr Tyr Leu His His His Gly His Glu Asn
325 330 335
Lys Ile Pro Trp Tyr Arg Gly Glu Glu Trp Ser Tyr Leu Arg Gly Arg
340 345 350
Leu Thr Thr Val Gly Arg Asp Tyr Gly Trp Phe Asn Lys Ile His His
355 360 365
Asp Ile Gly Ile His Val Ile His His Leu Phe Pro Gln Ile Pro His
370 375 380
Tyr His Leu Ile Glu Ala Thr Glu Ala Ala Lys Pro Val Leu Gly Lys
385 390 395 400
Tyr Tyr Arg Glu Pro Lys Lys Ser Gly Pro Leu Pro Phe His Leu Leu
405 410 415
Gly Ser Leu Ile Arg Ser Met Lys Glu Asp His Tyr Val Ser Asp Ala
420 425 430
Gly Asp Val Val Tyr Tyr Gln Lys Glu Pro Lys Leu Ser Gly Ala Arg
435 440 445
Cys Leu Ser
450
<210> 218
<211> 506
<212> PRT
<213> Ricinus communis
<400> 218
Met Ser Ala Val Met Leu Ala Arg Ala Thr Asn Val Ala Ala Asn Asn
1 5 10 15
Asn Val Thr Ser Arg Thr Gly Ser His Glu Arg Pro His Thr Pro Ala
20 25 30
Ala Ala Ala His Phe Asn Leu Ser Leu Cys Leu Leu Ser Pro Phe Lys
35 40 45
Gly Ser Pro Leu Gln Leu Glu Gly Ile Leu Leu Met Lys Lys Ala Asp
50 55 60
Ser Val Asn Ala Phe Asp Ala Leu Asp Gly Asp Ala Asp Phe Asp Pro
65 70 75 80
Ser Asp Pro Pro Pro Phe Lys Ile Ala Glu Ile Arg Ala Ala Ile Pro
85 90 95
Lys His Cys Trp Ile Lys Asn Pro Trp Arg Ser Leu Ser Tyr Val Leu
100 105 110
Arg Asp Ala Phe Val Val Leu Ala Leu Ala Ala Ala Ala Leu Phe Leu
115 120 125
Asp Ser Trp Cys Phe Trp Pro Leu Tyr Trp Ala Ala Gln Gly Thr Met
130 135 140
Phe Trp Ala Ile Phe Val Leu Gly His Asp Cys Gly His Gly Ser Phe
145 150 155 160
Ser Asp Ser Thr Leu Leu Asn Asn Val Val Gly His Leu Leu His Ser
165 170 175
Ser Ile Leu Val Pro Tyr His Gly Trp Arg Ile Ser His Arg Thr His
180 185 190
His Gln Asn His Gly Asn Val Asp Lys Asp Glu Ser Trp Val Pro Leu
195 200 205
Pro Glu Lys Ile Tyr Asn Ser Leu Asp Val Ser Thr Arg Ile Met Arg
210 215 220
Phe Thr Val Pro Leu Pro Leu Leu Ala Tyr Pro Ile Tyr Leu Trp Thr
225 230 235 240
Arg Gly Pro Gly Lys Asp Gly Ser His Phe Ser Pro Tyr Ser Asp Leu
245 250 255
Phe Ala Pro Asn Glu Arg Arg Ala Val Leu Thr Ser Thr Val Cys Trp
260 265 270
Ile Leu Met Ile Leu Leu Leu Leu Tyr Ser Cys Phe Val Phe Gly Ser
275 280 285
Val Gln Val Leu Lys Leu Tyr Gly Val Pro Tyr Ile Ile Phe Ile Met
290 295 300
Trp Leu Asp Phe Val Thr Tyr Leu His His His Gly His Glu Gln Lys
305 310 315 320
Leu Pro Trp Tyr Arg Gly Lys Glu Trp Ser Tyr Leu Arg Gly Gly Leu
325 330 335
Thr Thr Val Asp Arg Asp Tyr Gly Trp Ile Asn Asn Ile His His Asp
340 345 350
Ile Gly Thr His Val Ile His His Leu Phe Pro Gln Ile Pro His Tyr
355 360 365
His Leu Val Glu Ala Thr Lys Ala Ala Lys Pro Val Leu Gly Lys Tyr
370 375 380
Tyr Arg Glu Pro Arg Lys Ser Gly Pro Phe Pro Leu His Leu Phe Glu
385 390 395 400
Asn Leu Val Lys Ser Ile Ser Gln Asp His Tyr Val Ser Asp Ile Gly
405 410 415
Asp Val Val Tyr Tyr Gln Thr Asp Pro Glu Leu Tyr Lys Lys Leu Ala
420 425 430
Lys Thr Lys Asp Val Leu Glu Asp Leu Glu Ser Cys Asp Ala Leu Gly
435 440 445
Ile Leu Lys Cys Lys Asn Cys Ser Ala Lys Ser Gly Ser Ser Tyr Ser
450 455 460
Ala Leu Gln Phe Leu Glu Leu Lys Gly Arg Ala Ala Gly Ala Glu Lys
465 470 475 480
Gly Arg Glu Trp Lys Ile Leu Val Phe Glu Ile Leu Thr Leu His His
485 490 495
Arg Ile Ile Ala Gln Met Ser Phe Met Gly
500 505
<210> 219
<211> 392
<212> PRT
<213> Linum usitatissimum
<400> 219
Met Ser Pro Pro Asn Ser Met Gly Met Glu Ala Ala His Pro Thr Gly
1 5 10 15
Asn Gly Asn Gly Val Ala Val Met Asn Gly Ala Ser Ala Asn Lys Pro
20 25 30
Asp Phe Asp Pro Ser Glu Ala Pro Pro Phe Lys Ile Ala Asp Ile Arg
35 40 45
Ala Ala Ile Pro Pro His Cys Trp Val Lys Asn Pro Trp Arg Ser Leu
50 55 60
Ser Tyr Val Leu Arg Asp Ala Val Val Ile Leu Ala Phe Ala Ala Ala
65 70 75 80
Ala Leu Lys Leu Asp Leu Trp Ala Val Trp Pro Leu Tyr Trp Ile Ala
85 90 95
Gln Gly Thr Met Phe Trp Ala Val Phe Val Leu Gly His Asp Cys Gly
100 105 110
His Gly Ser Phe Ser Asp Ser Trp Trp Leu Asn Asn Val Val Gly His
115 120 125
Ile Leu His Ser Ala Ile Leu Val Pro Tyr His Gly Trp Arg Ile Ser
130 135 140
His Lys Thr His His Gln Asn His Gly Asn Val Glu Lys Asp Glu Ser
145 150 155 160
Trp Val Pro Leu Pro Glu Lys Val Tyr Lys Thr Leu Asp Thr Ser Thr
165 170 175
Lys Phe Met Arg Phe Thr Ile Pro Leu Pro Met Phe Ala Tyr Pro Ile
180 185 190
Tyr Leu Trp Thr Arg Ser Pro Gly Lys Lys Gly Ser His Phe Asn Pro
195 200 205
Tyr Ser Asp Leu Phe Ala Pro Gln Glu Arg Lys Ser Val Leu Ile Ser
210 215 220
Thr Ile Ser Trp Ile Ser Met Val Leu Ile Leu Leu Tyr Ala Ser Phe
225 230 235 240
Leu Phe Gly Phe Leu Thr Val Phe Lys Val Tyr Thr Val Pro Tyr Leu
245 250 255
Ile Phe Val Ala Trp Leu Asp Met Val Thr Tyr Leu His His His Gly
260 265 270
His Glu Glu Lys Leu Pro Trp Tyr Arg Gly Gln Glu Trp Ser Tyr Leu
275 280 285
Arg Gly Gly Leu Thr Thr Val Asp Arg Asp Tyr Gly Ile Ile Asn Asn
290 295 300
Ile His His Asp Ile Gly Thr His Val Ile His His Leu Phe Pro Gln
305 310 315 320
Ile Pro His Tyr His Leu Val Glu Ala Thr Lys Ala Ala Lys Ser Val
325 330 335
Leu Gly Lys Tyr Tyr Arg Glu Pro Lys Lys Ser Gly Pro Phe Pro Phe
340 345 350
His Leu Phe Asp Asn Leu Val Arg Ser Leu Gly Glu Asp His Tyr Val
355 360 365
Ser Asp Ala Gly Asp Val Val Phe Tyr Gln Ser Asp Pro Glu Ile Phe
370 375 380
Lys Phe Ser Lys Ser Lys Ser Ala
385 390
<210> 220
<211> 315
<212> PRT
<213> Prototheca moriformis
<400> 220
Met Phe Trp Ala Leu Phe Val Val Gly His Asp Cys Gly His Gln Ser
1 5 10 15
Phe Ser Thr Ser Lys Arg Leu Asn Asp Ala Val Gly Leu Phe Val His
20 25 30
Ser Ile Ile Gly Val Pro Tyr His Gly Trp Arg Ile Ser His Arg Thr
35 40 45
His His Asn Asn His Gly His Val Glu Asn Asp Glu Ser Trp Tyr Pro
50 55 60
Pro Thr Glu Ser Gly Leu Lys Ala Met Thr Asp Met Gly Arg Gln Gly
65 70 75 80
Arg Phe His Phe Pro Ser Met Leu Phe Val Tyr Pro Phe Tyr Leu Phe
85 90 95
Trp Arg Ser Pro Gly Lys Thr Gly Ser His Phe Ser Pro Ala Thr Asp
100 105 110
Leu Phe Ala Leu Trp Glu Ala Pro Leu Ile Arg Thr Ser Asn Ala Cys
115 120 125
Gln Leu Ala Trp Leu Gly Ala Leu Ala Ala Gly Thr Trp Ala Leu Gly
130 135 140
Val Leu Pro Met Leu Asn Leu Tyr Leu Ala Pro Tyr Val Ile Ser Val
145 150 155 160
Ala Trp Leu Asp Leu Val Thr Tyr Leu His His His Gly Pro Ser Asp
165 170 175
Pro Arg Glu Glu Met Pro Trp Tyr Arg Gly Arg Glu Trp Ser Tyr Met
180 185 190
Arg Gly Gly Leu Thr Thr Ile Asp Arg Asp Tyr Gly Leu Phe Asn Lys
195 200 205
Val His His Asp Ile Gly Thr His Val Val His His Leu Phe Pro Gln
210 215 220
Ile Pro His Tyr Asn Leu Cys Arg Ala Thr Lys Ala Ala Lys Lys Val
225 230 235 240
Leu Gly Pro Tyr Tyr Arg Glu Pro Glu Arg Cys Pro Leu Gly Leu Leu
245 250 255
Pro Val His Leu Leu Ala Pro Leu Leu Arg Ser Leu Gly Gln Asp His
260 265 270
Phe Val Asp Asp Ala Gly Ser Val Leu Phe Tyr Arg Arg Ala Glu Gly
275 280 285
Ile Asn Pro Trp Ile Gln Lys Leu Leu Pro Trp Leu Gly Gly Ala Arg
290 295 300
Arg Gly Ala Asp Ala Gln Arg Asp Ala Ala Gln
305 310 315
<210> 221
<211> 452
<212> PRT
<213> Prototheca moriformis
<400> 221
Met Ser Ile Gln Phe Ala Leu Arg Ala Ala Tyr Ile Lys Gly Thr Cys
1 5 10 15
Gln Arg Leu Ser Gly Arg Gly Ala Ala Leu Gly Leu Ser Arg Asp Trp
20 25 30
Thr Pro Gly Trp Thr Leu Pro Arg Cys Trp Pro Ala Ser Ala Ala Ala
35 40 45
Thr Ala Pro Pro Arg Ala Arg His Gln Glu Arg Ala Ile His Leu Thr
50 55 60
Ser Gly Arg Arg Arg His Ser Ala Leu Ala Ser Asp Ala Asp Glu Arg
65 70 75 80
Ala Leu Pro Ser Asn Ala Pro Gly Leu Val Met Ala Ser Gln Ala Asn
85 90 95
Tyr Phe Arg Val Arg Leu Leu Pro Glu Gln Glu Glu Gly Glu Leu Glu
100 105 110
Ser Trp Ser Pro Asn Val Arg His Thr Thr Leu Leu Cys Lys Pro Arg
115 120 125
Ala Met Leu Ser Lys Leu Gln Met Arg Val Met Val Gly Asp Arg Val
130 135 140
Ile Val Thr Ala Ile Asp Pro Val Asn Met Thr Val His Ala Pro Pro
145 150 155 160
Phe Asp Pro Leu Pro Ala Thr Arg Phe Leu Val Ala Gly Glu Ala Ala
165 170 175
Asp Met Asp Ile Thr Val Val Leu Asn Lys Ala Asp Leu Val Pro Glu
180 185 190
Glu Glu Ser Ala Ala Leu Ala Gln Glu Val Ala Ser Trp Gly Pro Val
195 200 205
Val Leu Thr Ser Thr Leu Thr Gly Arg Gly Leu Gln Glu Leu Glu Arg
210 215 220
Gln Leu Gly Ser Thr Thr Ala Val Leu Ala Gly Pro Ser Gly Ala Gly
225 230 235 240
Lys Ser Ser Ile Ile Asn Ala Leu Ala Arg Ala Ala Arg Glu Arg Pro
245 250 255
Ser Asp Ala Ser Val Ser Asn Val Pro Glu Glu Gln Val Val Gly Glu
260 265 270
Asp Gly Arg Ala Leu Ala Asn Pro Pro Pro Phe Thr Leu Ala Asp Ile
275 280 285
Arg Asn Ala Ile Pro Lys Asp Cys Phe Arg Lys Ser Ala Ala Lys Ser
290 295 300
Leu Ala Tyr Leu Gly Asp Leu Ser Ile Thr Gly Met Ala Val Leu Ala
305 310 315 320
Tyr Lys Ile Asn Ser Pro Trp Leu Trp Pro Leu Tyr Trp Phe Ala Gln
325 330 335
Gly Thr Met Phe Trp Ala Leu Phe Val Val Gly His Asp Cys Gly His
340 345 350
Gln Ser Phe Ser Thr Ser Lys Arg Leu Asn Asp Ala Leu Ala Trp Leu
355 360 365
Gly Ala Leu Ala Ala Gly Thr Trp Thr Trp Ala Leu Gly Val Leu Pro
370 375 380
Met Leu Asn Leu Tyr Leu Ala Pro Tyr Val Trp Leu Leu Val Thr Tyr
385 390 395 400
Leu His His His Gly Pro Ser Asp Pro Arg Glu Glu Met Pro Trp Tyr
405 410 415
Arg Gly Arg Glu Trp Ser Tyr Met Arg Gly Gly Leu Thr Thr Ile Asp
420 425 430
Arg Asp Tyr Gly Leu Phe Asn Lys Val His His Asp Ile Gly Thr His
435 440 445
Val Val His His
450
<210> 222
<211> 6756
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 222
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300
aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360
cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420
ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480
cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540
gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600
tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660
ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720
ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780
ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840
aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900
aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960
ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020
gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080
caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140
tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200
tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260
tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320
agcgggccca caggccggtc gcagccacta gtatggtggt ggccatggac cagcgctcca 4380
acgtgaacgg cgactccggc gcccgcaagg aggagggcgg gcgcgccatg gactacaagg 4440
accacgacgg cgactacaag gaccacgaca tcgactacaa ggacgacgac gacaagttcg 4500
acccctccgc ccagcccccc ttcaagatcg gcgacatccg cgccgccatc cccaagcact 4560
gctgggtgaa gtcccccctg cgctccatgt cctacgtgac ccgcgacatc ttcgccgtgg 4620
ccgccctggc catggccgcc gtgtacttcg actcctggtt cctgtggccc ctgtactggg 4680
tggcccaggg caccctgttc tgggccatct tcgtgctggg ccacgactgc ggccacggct 4740
ccttctccga catccccctg ctgaactccg tggtgggcca catcctgcac tccttcatcc 4800
tggtgcccta ccacggctgg cgcatctccc accgcaccca ccaccagaac cacggccacg 4860
tggagaacga cgagtcctgg gtgcccctgc ccgagaagct gtacaagaac ctgccccact 4920
ccacccgcat gctgcgctac accgtgcccc tgcccatgct ggcctacccc atctacctgt 4980
ggtaccgctc ccccggcaag gagggctccc acttcaaccc ctactcctcc ctgttcgccc 5040
cctccgagcg caagctgatc gccacctcca ccacctgctg gtccatcatg ctggccaccc 5100
tggtgtacct gtccttcctg gtggaccccg tgaccgtgct gaaggtgtac ggcgtgccct 5160
acatcatctt cgtgatgtgg ctggacgccg tgacctacct gcaccaccac ggccacgacg 5220
agaagctgcc ctggtaccgc ggcaaggagt ggtcctacct gcgcggcggc ctgaccacca 5280
tcgaccgcga ctacggcatc ttcaacaaca tccaccacga catcggcacc cacgtgatcc 5340
accacctgtt cccccagatc ccccactacc acctggtgga cgccacccgc gccgccaagc 5400
acgtgctggg ccgctactac cgcgagccca agacctccgg cgccatcccc atccacctgg 5460
tggagtccct ggtggcctcc atcaagaagg accactacgt gtccgacacc ggcgacatcg 5520
tgttctacga gaccgacccc gacctgtacg tgtacgcctc cgacaagtcc aagatcaact 5580
agatcgatct taaggcagca gcagctcgga tagtatcgac acactctgga cgctggtcgt 5640
gtgatggact gttgccgcca cacttgctgc cttgacctgt gaatatccct gccgctttta 5700
tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt gctagctgct 5760
tgtgctattt gcgaatacca cccccagcat ccccttccct cgtttcatat cgcttgcatc 5820
ccaaccgcaa cttatctacg ctgtcctgct atccctcagc gctgctcctg ctcctgctca 5880
ctgcccctcg cacagccttg gtttgggctc cgcctgtatt ctcctggtac tgcaacctgt 5940
aaaccagcac tgcaatgctg atgcacggga agtagtggga tgggaacaca aatggaaagc 6000
ttaattaaga gctcttgttt tccagaagga gttgctcctt gagcctttca ttctcagcct 6060
cgataacctc caaagccgct ctaattgtgg agggggttcg aatttaaaag cttggaatgt 6120
tggttcgtgc gtctggaaca agcccagact tgttgctcac tgggaaaagg accatcagct 6180
ccaaaaaact tgccgctcaa accgcgtacc tctgctttcg cgcaatctgc cctgttgaaa 6240
tcgccaccac attcatattg tgacgcttga gcagtctgta attgcctcag aatgtggaat 6300
catctgcccc ctgtgcgagc ccatgccagg catgtcgcgg gcgaggacac ccgccactcg 6360
tacagcagac cattatgcta cctcacaata gttcataaca gtgaccatat ttctcgaagc 6420
tccccaacga gcacctccat gctctgagtg gccacccccc ggccctggtg cttgcggagg 6480
gcaggtcaac cggcatgggg ctaccgaaat ccccgaccgg atcccaccac ccccgcgatg 6540
ggaagaatct ctccccggga tgtgggccca ccaccagcac aacctgctgg cccaggcgag 6600
cgtcaaacca taccacacaa atatccttgg catcggccct gaattccttc tgccgctctg 6660
ctacccggtg cttctgtccg aagcaggggt tgctagggat cgctccgagt ccgcaaaccc 6720
ttgtcgcgtg gcggggcttg ttcgagcttg aagagc 6756
<210> 223
<211> 1437
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 223
actagtatgg ccaacctggt gctgtccgag tgcggcatcc gccccctgcc ccgcatctac 60
accacccccc gctccaactt cgtgtccaac aacaacaagc ccatcttcaa gttccgcccc 120
ctgacctcct acaagacctc ctcccccctg ttctgctccc gcgacggctt cggccgcaac 180
tggtccctga acgtgtccgt gcccctggcc accaccaccc ccatcgtgga cgagtccccc 240
ctggaggagg aggaggagga ggagaagcag cgcgggcgcg ccatggacta caaggaccac 300
gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gttcgacccc 360
ggcgcccccc cccccttcaa cctggccgac atccgcgccg ccatccccaa gcactgctgg 420
gtgaagaacc cctggaagtc catgtcctac gtgctgcgcg acgtggccat cgtgttcgcc 480
ctggccgccg gcgccgccta cctgaacaac tggatcgtgt ggcccctgta ctggctggcc 540
cagggcacca tgttctgggc cctgttcgtg ctgggccacg actgcggcca cggctccttc 600
tccaacaacc cccgcctgaa caacgtggtg ggccacctgc tgcactcctc catcctggtg 660
ccctaccacg gctggcgcat ctcccaccgc acccaccacc agaaccacgg ccacgtggag 720
aacgacgagt cctggcaccc catgtccgag aagatctacc agtccctgga caagcccacc 780
cgcttcttcc gcttcaccct gcccctggtg atgctggcct accccttcta cctgtgggcc 840
cgctcccccg gcaagaaggg ctcccactac caccccgagt ccgacctgtt cctgcccaag 900
gagaagaccg acgtgctgac ctccaccgcc tgctggaccg ccatggccgc cctgctgatc 960
tgcctgaact tcgtggtggg ccccgtgcag atgctgaagc tgtacggcat cccctactgg 1020
atcaacgtga tgtggctgga cttcgtgacc tacctgcacc accacggcca cgaggacaag 1080
ctgccctggt accgcggcaa ggagtggtcc tacctgcgcg gcggcctgac caccctggac 1140
cgcgactacg gcgtgatcaa caacatccac cacgacatcg gcacccacgt gatccaccac 1200
ctgttccccc agatccccca ctaccacctg gtggaggcca ccgaggccgt gaagcccgtg 1260
ctgggcaagt actaccgcga gcccgacaag tccggccccc tgcccctgca cctgctgggc 1320
atcctggcca agtccatcaa ggaggaccac tacgtgtccg acgagggcga cgtggtgtac 1380
tacaaggccg accccaacat gtacggcgag atcaaggtgg gcgccgacta gatcgat 1437
<210> 224
<211> 1269
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 224
actagtatgt ccccccccaa ctccatgtcc cccgccacca acggctccac caacggcgtg 60
gccatcaacg gcgccaagaa gctgctggac gggcgcgcca tggactacaa ggaccacgac 120
ggcgactaca aggaccacga catcgactac aaggacgacg acgacaagtt cgacccctcc 180
gccgcccccc ccttcaagat cgccgacatc cgcgccgcca tcccccccca ctgctgggtg 240
aagaacccct ggcgctccct gtcctacgtg ctgcgcgacc tgctggtgat cctgtccttc 300
gccgtggccg ccaccaagct ggactcctgg accgtgtggc ccctgtactg gatcgcccag 360
ggcaccatgt tctgggccgt gttcgtgctg ggccacgact gcggccacgg ctccttctcc 420
gactcctggc tgctgaacaa cgtgatgggc cacatcctgc actcctccat cctggtgccc 480
taccacggct ggcgcatctc ccacaagacc caccaccaga accacggcaa cgtggagaag 540
gacgagtcct gggtgcccct gcccgagaag gtgtacaagt ccctggacac cggcaccaag 600
ttcatgcgct tcaccatccc cctgcccatg ttcgcctacc ccatctacct gtggcgccgc 660
tcccccggca agaagggctc ccacttcaac ccctactccg acctgttcgc ccccaacgag 720
cgcacctccg tgatgatctc caccctgtgc tggaccgcca tggccctgct gctgtgctac 780
tcctccttca tctacggctt cctgcccgtg ttcaagatct acggcgtgcc ctacctgatc 840
ttcgtggcct ggctggacat ggtgacctac ctgcaccacc acggctacga gcagaagctg 900
ccctggtacc gcggcaagga gtggtcctac ctgcgcggcg gcctgaccac cgtggaccgc 960
gactacggcg tgatcaacaa catccaccac gacatcggca cccacgtgat ccaccacctg 1020
ttcccccaga tgccccacta ccacctggtg gaggccaccc aggccgccaa gcacgtgctg 1080
ggcaagtact accgcgagcc caagaagtcc ggccccttcc ccttccacct gttcggctac 1140
ctggtgcgct ccctgggcga ggaccactac gtgtccgaca ccggcgacgt ggtgttctac 1200
cagtccgacc cccacatccc caagttcccc acctccgcca ccaccaagtc caagtcctcc 1260
tagatcgat 1269
<210> 225
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 225
actagtatgt ccccccccaa ctccatgtcc cccaccacca acggcaacgg cgtggccatg 60
aacggcgcca agaagcagct ggacgggcgc gccatggact acaaggacca cgacggcgac 120
tacaaggacc acgacatcga ctacaaggac gacgacgaca agttcgaccc ctccgccgcc 180
ccccccttca agatcgccga catccgcgcc gccatccccc cccactgctg ggtgaagaac 240
ccctggcgct ccctgtccta cgtgctgcgc gacctgctgg tgatcctgtc cttcgccgtg 300
gccgccgcca agctggactc ctggaccttc tggcccctgt actgggtggc ccagggcacc 360
atgttctggg ccgtgttcgt gctgggccac gactgcggcc acggctcctt ctccgacatc 420
tggctgctga acaacgtgat gggccacatc ctgcactcct ccatcctggt gccctaccac 480
ggctggcgca tctcccacaa gacccaccac cagaaccacg gcaacgtgga gaaggacgag 540
tcctgggtgc ccctgcccga gaaggtgtac aagtccctgg acacctccac caagttcatg 600
cgcttcacca tccccctgcc catgttcgcc taccccatct acctgtggac ccgctccccc 660
ggcaagaagg gctcccactt caacccctac tccgacctgt tcgcccccaa cgagcgcgcc 720
gccgtgctga tctccaccct gtgctggacc gccatggccc tgctgctgtg ctactcctcc 780
ttcatctacg gcttcgcccc cgtgctgaag atctacggcg tgccctacct gatcttcgtg 840
gcctggctgg acatggtgac ctacctgcac caccacggct acgagcagaa gctgccctgg 900
taccgcggca aggagtggtc ctacctgcgc ggcggcctga ccaccgtgga ccgcgactac 960
ggcgtgatca acaacatcca ccacgacatc ggcacccacg tgatccacca cctgttcccc 1020
cagatgcccc actaccacct ggtggaggcc acccaggccg ccaagcacgt gctgggcaag 1080
tactaccgcg agcccaagaa gtccggcccc ttccccttcc acctgttcgg ctacctggtg 1140
cgctccctgg gcgaggacca ctacgtgtcc gacaccggcg acgtggtgtt ctaccagtcc 1200
gacccccaca tccccaagtt ccgcacctcc tccgccacca ccaagtccaa gtcctcctag 1260
atcgat 1266
<210> 226
<211> 5246
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 226
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggtgt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta tgacacttcc 3300
agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac accgatgatg 3360
cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc tccagggcga 3420
gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct accaaagcca 3480
tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg tgatcgcact 3540
ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca ctagtgggtc 3600
gccgcgctgc ctcgcgtccc ctggtggtgc acgccgtcgc cagcgaggcc ccgctgggcg 3660
tgccgccctc ggtgcagcgc ccctcccccg tggtctactc caagctggac aagcaacacc 3720
gcctgacgcc cgagcgcctg gagctggtgc agagcatggg gcagtttgcg gaggagaggt 3780
gtgtttgagg gttttggttg cccgtatcga ggtcctggtg gcgcgcatgg gggagaaggc 3840
gcctgtcccg ctgacccccc cggctaccct cccggcacct tccagggcgc gtacgggatc 3900
cctctcctcc acaaactgcc ccatgctctg caccagctcc aggcgctcgg gcgtcaggcg 3960
gtgctgcttg tccagcttgg agtagaccac gggggagggg cgctgcaccg agggcggaac 4020
gcccagcggg gcctcgctgg cgaccgcgcg caccaccagg ggacgcgagg cagcgcggcg 4080
acccaagctt gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga 4140
tggactgttg ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa 4200
acagcctcag tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg 4260
ctatttgcga ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa 4320
ccgcaactta tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc 4380
ccctcgcaca gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac 4440
cagcactgca atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctgga 4500
gctcttgttt tccagaagga gttgctcctt gagcctttca ttctcagcct cgataacctc 4560
caaagccgct ctaattgtgg agggggttcg aatttaaaag cttggaatgt tggttcgtgc 4620
gtctggaaca agcccagact tgttgctcac tgggaaaagg accatcagct ccaaaaaact 4680
tgccgctcaa accgcgtacc tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac 4740
attcatattg tgacgcttga gcagtctgta attgcctcag aatgtggaat catctgcccc 4800
ctgtgcgagc ccatgccagg catgtcgcgg gcgaggacac ccgccactcg tacagcagac 4860
cattatgcta cctcacaata gttcataaca gtgaccatat ttctcgaagc tccccaacga 4920
gcacctccat gctctgagtg gccacccccc ggccctggtg cttgcggagg gcaggtcaac 4980
cggcatgggg ctaccgaaat ccccgaccgg atcccaccac ccccgcgatg ggaagaatct 5040
ctccccggga tgtgggccca ccaccagcac aacctgctgg cccaggcgag cgtcaaacca 5100
taccacacaa atatccttgg catcggccct gaattccttc tgccgctctg ctacccggtg 5160
cttctgtccg aagcaggggt tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg 5220
gcggggcttg ttcgagcttg aagagc 5246
<210> 227
<211> 615
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 227
actagttgcc cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg 60
accccgagtc gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc 120
tgcccgacga gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga 180
cctacatggc catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggccgacc 240
acccgtgtgt gtttgagggt tttggttgcc cgtattgagg tcctggtggc gcgcatggag 300
gagaaggcgc ctgtcccgct gacccccccg gctaccctcc cggcaccttc cagggcgcgt 360
acgggatcca cgggtggtcg gccgcgcccg tgtcgtcgcg cacaccgtcc aaggtgttga 420
gcatggccat gtaggtcggc agcgcctcct ccgtgatcat gtcgcccacc agcaccacaa 480
agtactcgtc gggcaggtcc ttggcgcgcg cgcgcagctc cgccacctgg tcctcgaagt 540
cgggcgactc ggggtcgggc aggaagtcct gcggctgcca cagcttgtcc acggggtgca 600
gcacgggcaa agctt 615
<210> 228
<211> 615
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 228
actagtgcgc tggacgcggc agtgggtggc cgaggagaac cggcacggcg acctgctgaa 60
caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc gtggaggtga ccatcaacaa 120
cctgatcaag agcggcatga acccgcagac ggacaacaac ccttacttgg gcttcgtcta 180
cacctccttc caggagcgcg cgaccaagta cagccacggc aacaccgcgc gccttgcggc 240
cgagcagtgt gtttgagggt tttggttgcc cgtatcgagg tcctggtggc gcgcatgggg 300
gagaaggcgc ctgtcccgct gacccccccg gctaccctcc cggcaccttc cagggcgcgt 360
acgggatcct gctcggccgc aaggcgcgcg gtgttgccgt ggctgtactt ggtcgcgcgc 420
tcctggaagg aggtgtagac gaagcccaag taagggttgt tgtccgtctg cgggttcatg 480
ccgctcttga tcaggttgtt gatggtcacc tccacggccc gcatgttgac gcgccccgtc 540
agccaacagt acttgttcag caggtcgccg tgccggttct cctcggccac ccactgccgc 600
gtccagcgca agctt 615
<210> 229
<211> 613
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 229
actagtgctg atcgccagcg acgagggccg gcacgagatc gcctacacgc gcatcgtgga 60
cgagttcttc cgcctcgacc ccgagggcgc cgtcgccgcc tacgccaaca tgatgcgcaa 120
gcagatcacc atgcccgcgc acctcatgga cgacatgggc cacggcgagg ccaacccggg 180
ccgcaacctc ttcgccgact tctccgcggt cgccgagaag atcgacgtct acgacgccga 240
ggactgtgtg tttgagggtt ttggttgccc gtatcgaggt cctggtggcg cgcatggggg 300
agaaggcgcc tgtcccgctg acccccccgg ctaccctccc ggcaccttcc agggcgcgta 360
cgggatccag tcctcggcgt cgtagacgtc gatcttctcg gcgaccgcgg agaagtcggc 420
gaagaggttg cggcccgggt tggcctcgcc gtggcccatg tcgtccatga ggtgcgcggg 480
catggtgatc tgcttgcgca tcatgttggc gtaggcggcg acggcgccct cggggtcgag 540
gcggaagaac tcgtccacga tgcgcgtgta ggcgatctcg tgccggccct cgtcgctggc 600
gatcagcaag ctt 613
<210> 230
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 230
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcctccacc 120
cactccggca agaccatggc cgtggccctg cagcccaccc aggagatcac caccatcaag 180
aagcccccca ccaagcagcg ccgcgtggtg gtgaccggcc tgggcgtggt gacccccctg 240
ggccacgagc ccgacatctt ctacaacaac ctgctggacg gcgcctccgg catctccgag 300
atcgagacct tcgactgcgc cgagtacccc acccgcatcg ccggcgagat caagtccttc 360
tccaccgacg gctgggtggc ccccaagctg tccaagcgca tggacaagtt catgctgtac 420
atgctgaccg ccggcaagaa ggccctggtg gacggcggca tcaccgacga cgtgatggac 480
gagctgaaca aggagaagtg cggcgtgctg atcggctccg ccatgggcgg catgaaggtg 540
ttcaacgacg ccatcgaggc cctgcgcatc tcctacaaga agatgaaccc cttctgcgtg 600
cccttcgcca ccaccaacat gggctccgcc atgctggcca tggacctggg ctggatgggc 660
cccaactact ccatctccac cgcctgcgcc acctccaact tctgcatcct gaacgccgcc 720
aaccacatca tccgcggcga ggccgacgtg atgctgtgcg gcggctccga cgccgccatc 780
atccccatcg gcctgggcgg cttcgtggcc tgccgcgccc tgtcccagcg caacaccgac 840
cccaccaagg cctcccgccc ctgggacatc aaccgcgacg gcttcgtgat gggcgagggc 900
gccggcgtgc tgctgctgga ggagctggag cacgccaagg agcgcggcgc caccatctac 960
gccgagttcc tgggcggctc cttcacctgc gacgcctacc acgtgaccga gccccgcccc 1020
gacggcgccg gcgtgatcct gtgcatcgag aaggccctgg cccagtccgg cgtgtccaag 1080
gaggacgtga actacatcaa cgcccacgcc acctccaccc ccgccggcga cctgaaggag 1140
taccaggccc tgatgcactg cttcggccag aaccccgagc tgcgcgtgaa ctccaccaag 1200
tccatgatcg gccacctgct gggcgccgcc ggcggcgtgg aggccgtggc caccatccag 1260
gccatccgca ccggctgggt gcaccccaac atcaacctgg agaaccccga caacggcgtg 1320
gacgccaagg tgctggtggg ctccaagaag gagcgcctgg acgtgaaggc cgccctgtcc 1380
aactccttcg gcttcggcgg ccacaactcc tccatcatct tcgcccccta catggactac 1440
aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 1500
tga 1503
<210> 231
<211> 1530
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 231
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcctgccgc 120
cgcggcggcc gcgtggccat ggccatcgcc atccagccct cctccatcga gatggaggag 180
gagaccaccc tgaccaagcg caagcagccc cccaccaagc agcgccgcgt ggtggtgacc 240
ggcatgggcg tggagacccc catcggcaac aaccccgacc agttctacaa caacctgctg 300
cagggcgtgt ccggcatcac ccagatcgag gccttcgact gctcctccta ccccacccgc 360
atcgccggcg agatcaagaa cttctccacc gacggctggg tggcccccaa gctgtccaag 420
cgcatggacc gcttcatgct gtacatgctg accgccggca agaaggccct ggccgacgcc 480
ggcatctccc cctccgactc cgacgagatc gacaagtccc gctgcggcgt gctgatcggc 540
tccgccatgg gcggcatgaa ggtgttcaac gacgccatcg aggccctgcg cgtgtcctac 600
cgcaagatga accccttctg cgtgcccttc gccaccacca acatgggctc cgccatgctg 660
gccatggacc tgggctggat gggccccaac tactccatct ccaccgcctg cgccacctcc 720
aacttctgca tcctgaacgc cgccaaccac atcatccgcg gcgaggccga catgatgctg 780
tgcggcggct ccgacgccgt gatcatcccc atcggcctgg gcggcttcgt ggcctgccgc 840
gccctgtccg agcgcaacac cgaccccgcc aaggcctccc gcccctggga ctccggccgc 900
gacggcttcg tgatgggcga gggcgccggc gtgctgctgc tggaggagct ggagcacgcc 960
aagaagcgcg gcgccaagat ctacgccgag ttcctgggcg gctccttcac ctgcgacgcc 1020
taccacatga ccgagcccca ccccgagggc gccggcgtga tcctgtgcat cgagaaggcc 1080
ctgtcccagg ccggcgtgcg ccgcgaggac gtgaactaca tcaacgccca cgccacctcc 1140
acccccgccg gcgacctgaa ggagtaccac gccctgctgc actgcttcgg caacaaccag 1200
gagctgcgcg tgaactccac caagtccatg atcggccacc tgctgggcgc cgccggcgcc 1260
gtggaggccg tggccaccgt gcaggccatc cgcaccggct ggatccaccc caacatcaac 1320
ctggagaacc ccgaccaggg cgtggacacc aaggtgctgg tgggctccaa gaaggagcgc 1380
ctgaacgtga aggtgggcct gtccaactcc ttcggcttcg gcggccacaa ctcctccatc 1440
ctgttcgccc ccttccagat ggactacaag gaccacgacg gcgactacaa ggaccacgac 1500
atcgactaca aggacgacga cgacaagtga 1530
<210> 232
<211> 1584
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 232
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcctcccac 120
tactactcct ccaacggcct gttccccaac acccccctgc tgcccaagcg ccacccccgc 180
ctgcaccacc gcctgccccg ctccggcgag gccatggccg tggccgtgca gcccgagaag 240
gaggtggcca ccaacaagaa gcccctgatg aagcagcgcc gcgtggtggt gaccggcatg 300
ggcgtggtgt cccccctggg ccacgacatc gacgtgtact acaacaacct gctggacggc 360
tcctccggca tctcccagat cgactccttc gactgcgccc agttccccac ccgcatcgcc 420
ggcgagatca agtccttctc caccgacggc tgggtggccc ccaagctgtc caagcgcatg 480
gacaagttca tgctgtacat gctgaccgcc ggcaagaagg ccctggccga cggcggcatc 540
accgaggaca tgatggacga gctggacaag gcccgctgcg gcgtgctgat cggctccgcc 600
atgggcggca tgaaggtgtt caacgacgcc atcgaggccc tgcgcatctc ctaccgcaag 660
atgaacccct tctgcgtgcc cttcgccacc accaacatgg gctccgccat gctggccatg 720
gacctgggct ggatgggccc caactactcc atctccaccg cctgcgccac ctccaacttc 780
tgcatcctga acgccgccaa ccacatcatc cgcggcgagg ccgacatcat gctgtgcggc 840
ggctccgacg ccgccatcat ccccatcggc ctgggcggct tcgtggcctg ccgcgccctg 900
tcccagcgca acgacgaccc caccaaggcc tcccgcccct gggacatgaa ccgcgacggc 960
ttcgtgatgg gcgagggcgc cggcgtgctg ctgctggagg agctggagca cgccaagaag 1020
cgcggcgcca acatctacgc cgagttcctg ggcggctcct tcacctgcga cgcctaccac 1080
atgaccgagc cccgccccga cggcgtgggc gtgatcctgt gcatcgagaa ggccctggcc 1140
cgctccggcg tgtccaagga ggaggtgaac tacatcaacg cccacgccac ctccaccccc 1200
gccggcgacc tgaaggagta cgaggccctg atgcgctgct tctcccagaa ccccgacctg 1260
cgcgtgaact ccaccaagtc catgatcggc cacctgctgg gcgccgccgg cgccgtggag 1320
gccatcgcca ccatccaggc catccgcacc ggctgggtgc accccaacat caacctggag 1380
aaccccgagg agggcgtgga caccaaggtg ctggtgggcc ccaagaagga gcgcctggac 1440
atcaaggtgg ccctgtccaa ctccttcggc ttcggcggcc acaactcctc catcatcttc 1500
gccccctaca agatggacta caaggaccac gacggcgact acaaggacca cgacatcgac 1560
tacaaggacg acgacgacaa gtga 1584
<210> 233
<211> 7008
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 233
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300
aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360
cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420
ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480
cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540
gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600
tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660
ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720
ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780
ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840
aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900
aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960
ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020
gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080
caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140
tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200
tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260
tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320
agcgggccca caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt 4380
tcaatgcccg ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga 4440
ggcccctccc cgtgcgcggg cgcgccgccg ccgccgccga cgccaacccc gcccgccccg 4500
agcgccgcgt ggtgatcacc ggccagggcg tggtgacctc cctgggccag accatcgagc 4560
agttctactc ctccctgctg gagggcgtgt ccggcatctc ccagatccag aagttcgaca 4620
ccaccggcta caccaccacc atcgccggcg agatcaagtc cctgcagctg gacccctacg 4680
tgcccaagcg ctgggccaag cgcgtggacg acgtgatcaa gtacgtgtac atcgccggca 4740
agcaggccct ggagtccgcc ggcctgccca tcgaggccgc cggcctggcc ggcgccggcc 4800
tggaccccgc cctgtgcggc gtgctgatcg gcaccgccat ggccggcatg acctccttcg 4860
ccgccggcgt ggaggccctg acccgcggcg gcgtgcgcaa gatgaacccc ttctgcatcc 4920
ccttctccat ctccaacatg ggcggcgcca tgctggccat ggacatcggc ttcatgggcc 4980
ccaactactc catctccacc gcctgcgcca ccggcaacta ctgcatcctg ggcgccgccg 5040
accacatccg ccgcggcgac gccaacgtga tgctggccgg cggcgccgac gccgccatca 5100
tcccctccgg catcggcggc ttcatcgcct gcaaggccct gtccaagcgc aacgacgagc 5160
ccgagcgcgc ctcccgcccc tgggacgccg accgcgacgg cttcgtgatg ggcgagggcg 5220
ccggcgtgct ggtgctggag gagctggagc acgccaagcg ccgcggcgcc accatcctgg 5280
ccgagctggt gggcggcgcc gccacctccg acgcccacca catgaccgag cccgaccccc 5340
agggccgcgg cgtgcgcctg tgcctggagc gcgccctgga gcgcgcccgc ctggcccccg 5400
agcgcgtggg ctacgtgaac gcccacggca cctccacccc cgccggcgac gtggccgagt 5460
accgcgccat ccgcgccgtg atcccccagg actccctgcg catcaactcc accaagtcca 5520
tgatcggcca cctgctgggc ggcgccggcg ccgtggaggc cgtggccgcc atccaggccc 5580
tgcgcaccgg ctggctgcac cccaacctga acctggagaa ccccgccccc ggcgtggacc 5640
ccgtggtgct ggtgggcccc cgcaaggagc gcgccgagga cctggacgtg gtgctgtcca 5700
actccttcgg cttcggcggc cacaactcct gcgtgatctt ccgcaagtac gacgagatgg 5760
actacaagga ccacgacggc gactacaagg accacgacat cgactacaag gacgacgacg 5820
acaagtgaat cgatagatct cttaaggcag cagcagctcg gatagtatcg acacactctg 5880
gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct gtgaatatcc 5940
ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag 6000
ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc ctcgtttcat 6060
atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca gcgctgctcc 6120
tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta ttctcctggt 6180
actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca 6240
caaatggaaa gcttaattaa gagctcttgt tttccagaag gagttgctcc ttgagccttt 6300
cattctcagc ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa 6360
agcttggaat gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa 6420
ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct 6480
gccctgttga aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc 6540
agaatgtgga atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac 6600
acccgccact cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat 6660
atttctcgaa gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg 6720
tgcttgcgga gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc 6780
acccccgcga tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct 6840
ggcccaggcg agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct 6900
tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga 6960
gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct tgaagagc 7008
<210> 234
<211> 7008
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 234
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300
aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360
cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420
ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480
cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540
gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600
tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660
ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720
ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780
ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840
aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900
aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960
ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020
gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080
caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140
tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200
tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260
tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320
agcgggccca caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt 4380
tcaatgcccg ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga 4440
ggcccctccc cgtgcgcggg cgcgccgccg ccgccgccga cgccaacccc gcccgccccg 4500
agcgccgcgt ggtgatcacc ggccagggcg tggtgacctc cctgggccag accatcgagc 4560
agttctactc ctccctgctg gagggcgtgt ccggcatctc ccagatccag aagttcgaca 4620
ccaccggcta caccaccacc atcgccggcg agatcaagtc cctgcagctg gacccctacg 4680
tgcccaagcg ctgggccaag cgcgtggacg acgtgatcaa gtacgtgtac atcgccggca 4740
agcaggccct ggagtccgcc ggcctgccca tcgaggccgc cggcctggcc ggcgccggcc 4800
tggaccccgc cctgtgcggc gtgctgatcg gcaccgccat ggccggcatg acctccttcg 4860
ccgccggcgt ggaggccctg acccgcggcg gcgtgcgcaa gatgaacccc ttctgcatcc 4920
ccttctccat ctccaacatg ggcggcgcca tgctggccat ggacatcggc ttcatgggcc 4980
ccaactactc catctccacc gcctgcgcca ccggcaacta ctgcatcctg ggcgccgccg 5040
accacatccg ccgcggcgac gccaacgtga tgctggccgg cggcgccgac gccgccatca 5100
tcccctccgg catcggcggc ttcatcgcct gcaaggccct gtccaagcgc aacgacgagc 5160
ccgagcgcgc ctcccgcccc tgggacgccg accgcgacgg cttcgtgatg ggcgagggcg 5220
ccggcgtgct ggtgctggag gagctggagc acgccaagcg ccgcggcgcc accatcctgg 5280
ccgagctggt gggcggcgcc gccacctccg acgcccacca catgaccgag cccgaccccc 5340
agggccgcgg cgtgcgcctg tgcctggagc gcgccctgga gcgcgcccgc ctggcccccg 5400
agcgcgtggg ctacgtgaac gcccacggca cctccacccc cgccggcgac gtggccgagt 5460
accgcgccat ccgcgccgtg atcccccagg actccctgcg catcaactcc accaagtcca 5520
tgatcggcca cctgctgggc ggcgccggcg ccgtggaggc cgtggccgcc atccaggccc 5580
tgcgcaccgg ctggctgcac cccaacctga acctggagaa ccccgccccc ggcgtggacc 5640
ccgtggtgct ggtgggcccc cgcaaggagc gcgccgagga cctggacgtg gtgctgtcca 5700
actccttcgg cttcggcggc cacaactcct gcgtgatctt ccgcaagtac gacgagatgg 5760
actacaagga ccacgacggc gactacaagg accacgacat cgactacaag gacgacgacg 5820
acaagtgaat cgatagatct cttaaggcag cagcagctcg gatagtatcg acacactctg 5880
gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct gtgaatatcc 5940
ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag 6000
ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc ctcgtttcat 6060
atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca gcgctgctcc 6120
tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta ttctcctggt 6180
actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca 6240
caaatggaaa gcttaattaa gagctcttgt tttccagaag gagttgctcc ttgagccttt 6300
cattctcagc ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa 6360
agcttggaat gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa 6420
ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct 6480
gccctgttga aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc 6540
agaatgtgga atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac 6600
acccgccact cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat 6660
atttctcgaa gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg 6720
tgcttgcgga gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc 6780
acccccgcga tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct 6840
ggcccaggcg agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct 6900
tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga 6960
gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct tgaagagc 7008
<210> 235
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 235
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgccgcc 120
gccgccgacg ccaaccccgc ccgccccgag cgccgcgtgg tgatcaccgg ccagggcgtg 180
gtgacctccc tgggccagac catcgagcag ttctactcct ccctgctgga gggcgtgtcc 240
ggcatctccc agatccagaa gttcgacacc accggctaca ccaccaccat cgccggcgag 300
atcaagtccc tgcagctgga cccctacgtg cccaagcgct gggccaagcg cgtggacgac 360
gtgatcaagt acgtgtacat cgccggcaag caggccctgg agtccgccgg cctgcccatc 420
gaggccgccg gcctggccgg cgccggcctg gaccccgccc tgtgcggcgt gctgatcggc 480
accgccatgg ccggcatgac ctccttcgcc gccggcgtgg aggccctgac ccgcggcggc 540
gtgcgcaaga tgaacccctt ctgcatcccc ttctccatct ccaacatggg cggcgccatg 600
ctggccatgg acatcggctt catgggcccc aactactcca tctccaccgc ctgcgccacc 660
ggcaactact gcatcctggg cgccgccgac cacatccgcc gcggcgacgc caacgtgatg 720
ctggccggcg gcgccgacgc cgccatcatc ccctccggca tcggcggctt catcgcctgc 780
aaggccctgt ccaagcgcaa cgacgagccc gagcgcgcct cccgcccctg ggacgccgac 840
cgcgacggct tcgtgatggg cgagggcgcc ggcgtgctgg tgctggagga gctggagcac 900
gccaagcgcc gcggcgccac catcctggcc gagctggtgg gcggcgccgc cacctccgac 960
gcccaccaca tgaccgagcc cgacccccag ggccgcggcg tgcgcctgtg cctggagcgc 1020
gccctggagc gcgcccgcct ggcccccgag cgcgtgggct acgtgaacgc ccacggcacc 1080
tccacccccg ccggcgacgt ggccgagtac cgcgccatcc gcgccgtgat cccccaggac 1140
tccctgcgca tcaactccac caagtccatg atcggccacc tgctgggcgg cgccggcgcc 1200
gtggaggccg tggccgccat ccaggccctg cgcaccggct ggctgcaccc caacctgaac 1260
ctggagaacc ccgcccccgg cgtggacccc gtggtgctgg tgggcccccg caaggagcgc 1320
gccgaggacc tggacgtggt gctgtccaac tccttcggct tcggcggcca caactcctgc 1380
gtgatcttcc gcaagtacga cgagatggac tacaaggacc acgacggcga ctacaaggac 1440
cacgacatcg actacaagga cgacgacgac aagtga 1476
<210> 236
<211> 491
<212> PRT
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 236
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Ala Ala Ala Ala Asp Ala Asn Pro Ala Arg
35 40 45
Pro Glu Arg Arg Val Val Ile Thr Gly Gln Gly Val Val Thr Ser Leu
50 55 60
Gly Gln Thr Ile Glu Gln Phe Tyr Ser Ser Leu Leu Glu Gly Val Ser
65 70 75 80
Gly Ile Ser Gln Ile Gln Lys Phe Asp Thr Thr Gly Tyr Thr Thr Thr
85 90 95
Ile Ala Gly Glu Ile Lys Ser Leu Gln Leu Asp Pro Tyr Val Pro Lys
100 105 110
Arg Trp Ala Lys Arg Val Asp Asp Val Ile Lys Tyr Val Tyr Ile Ala
115 120 125
Gly Lys Gln Ala Leu Glu Ser Ala Gly Leu Pro Ile Glu Ala Ala Gly
130 135 140
Leu Ala Gly Ala Gly Leu Asp Pro Ala Leu Cys Gly Val Leu Ile Gly
145 150 155 160
Thr Ala Met Ala Gly Met Thr Ser Phe Ala Ala Gly Val Glu Ala Leu
165 170 175
Thr Arg Gly Gly Val Arg Lys Met Asn Pro Phe Cys Ile Pro Phe Ser
180 185 190
Ile Ser Asn Met Gly Gly Ala Met Leu Ala Met Asp Ile Gly Phe Met
195 200 205
Gly Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Gly Asn Tyr Cys
210 215 220
Ile Leu Gly Ala Ala Asp His Ile Arg Arg Gly Asp Ala Asn Val Met
225 230 235 240
Leu Ala Gly Gly Ala Asp Ala Ala Ile Ile Pro Ser Gly Ile Gly Gly
245 250 255
Phe Ile Ala Cys Lys Ala Leu Ser Lys Arg Asn Asp Glu Pro Glu Arg
260 265 270
Ala Ser Arg Pro Trp Asp Ala Asp Arg Asp Gly Phe Val Met Gly Glu
275 280 285
Gly Ala Gly Val Leu Val Leu Glu Glu Leu Glu His Ala Lys Arg Arg
290 295 300
Gly Ala Thr Ile Leu Ala Glu Leu Val Gly Gly Ala Ala Thr Ser Asp
305 310 315 320
Ala His His Met Thr Glu Pro Asp Pro Gln Gly Arg Gly Val Arg Leu
325 330 335
Cys Leu Glu Arg Ala Leu Glu Arg Ala Arg Leu Ala Pro Glu Arg Val
340 345 350
Gly Tyr Val Asn Ala His Gly Thr Ser Thr Pro Ala Gly Asp Val Ala
355 360 365
Glu Tyr Arg Ala Ile Arg Ala Val Ile Pro Gln Asp Ser Leu Arg Ile
370 375 380
Asn Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly Gly Ala Gly Ala
385 390 395 400
Val Glu Ala Val Ala Ala Ile Gln Ala Leu Arg Thr Gly Trp Leu His
405 410 415
Pro Asn Leu Asn Leu Glu Asn Pro Ala Pro Gly Val Asp Pro Val Val
420 425 430
Leu Val Gly Pro Arg Lys Glu Arg Ala Glu Asp Leu Asp Val Val Leu
435 440 445
Ser Asn Ser Phe Gly Phe Gly Gly His Asn Ser Cys Val Ile Phe Arg
450 455 460
Lys Tyr Asp Glu Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp
465 470 475 480
His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys
485 490
<210> 237
<211> 3602
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 237
gctcttcgct caccgcgtga attgctgtcc caaacgtaag catcatcgtg gctcggtcac 60
gcgatcctgg atccggggat cctagaccgc tggtggagag cgctgccgtc ggattggtgg 120
caagtaagat tgcgcaggtt ggcgaaggga gagaccaaaa ccggaggctg gaagcgggca 180
caacatcgta ttattgcgta tagtagagca gtggcagtcg catttcgagg tccgcaacgg 240
atctcgcaag ctcgctacgc tcacagtagg agaaagggga ccactgcccc tgccagaatg 300
gtcgcgaccc tctccctcgc cggccccgcc tgcaacacgc agtgcgtatc cggcaagcgg 360
gctgtcgcct tcaaccgccc ccatgttggc gtccgggctc gatcaggtgc gctgaggggg 420
gtttggtgtg cccgcgcctc tgggcccgtg tcggccgtgc ggacgtgggg ccctgggcag 480
tggatcagca gggtttgcgt gcaaatgcct ataccggcga ttgaatagcg atgaacggga 540
tacggttgcg ctcactccat gcccatgcga ccccgtttct gtccgccagc cgtggtcgcc 600
cgggctgcga agcgggaccc cacccagcgc attgtgatca ccggaatggg cgtggggtac 660
cctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg 720
gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg gctgcatggg 780
cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg attgcaaaga 840
cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac ttctacacag 900
gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt cgtttcagtc 960
acaacccgca aacggcgcgc catgctgctg caggccttcc tgttcctgct ggccggcttc 1020
gccgccaaga tcagcgcctc catgacgaac gagacgtccg accgccccct ggtgcacttc 1080
acccccaaca agggctggat gaacgacccc aacggcctgt ggtacgacga gaaggacgcc 1140
aagtggcacc tgtacttcca gtacaacccg aacgacaccg tctgggggac gcccttgttc 1200
tggggccacg ccacgtccga cgacctgacc aactgggagg accagcccat cgccatcgcc 1260
ccgaagcgca acgactccgg cgccttctcc ggctccatgg tggtggacta caacaacacc 1320
tccggcttct tcaacgacac catcgacccg cgccagcgct gcgtggccat ctggacctac 1380
aacaccccgg agtccgagga gcagtacatc tcctacagcc tggacggcgg ctacaccttc 1440
accgagtacc agaagaaccc cgtgctggcc gccaactcca cccagttccg cgacccgaag 1500
gtcttctggt acgagccctc ccagaagtgg atcatgaccg cggccaagtc ccaggactac 1560
aagatcgaga tctactcctc cgacgacctg aagtcctgga agctggagtc cgcgttcgcc 1620
aacgagggct tcctcggcta ccagtacgag tgccccggcc tgatcgaggt ccccaccgag 1680
caggacccca gcaagtccta ctgggtgatg ttcatctcca tcaaccccgg cgccccggcc 1740
ggcggctcct tcaaccagta cttcgtcggc agcttcaacg gcacccactt cgaggccttc 1800
gacaaccagt cccgcgtggt ggacttcggc aaggactact acgccctgca gaccttcttc 1860
aacaccgacc cgacctacgg gagcgccctg ggcatcgcgt gggcctccaa ctgggagtac 1920
tccgccttcg tgcccaccaa cccctggcgc tcctccatgt ccctcgtgcg caagttctcc 1980
ctcaacaccg agtaccaggc caacccggag acggagctga tcaacctgaa ggccgagccg 2040
atcctgaaca tcagcaacgc cggcccctgg agccggttcg ccaccaacac cacgttgacg 2100
aaggccaaca gctacaacgt cgacctgtcc aacagcaccg gcaccctgga gttcgagctg 2160
gtgtacgccg tcaacaccac ccagacgatc tccaagtccg tgttcgcgga cctctccctc 2220
tggttcaagg gcctggagga ccccgaggag tacctccgca tgggcttcga ggtgtccgcg 2280
tcctccttct tcctggaccg cgggaacagc aaggtgaagt tcgtgaagga gaacccctac 2340
ttcaccaacc gcatgagcgt gaacaaccag cccttcaaga gcgagaacga cctgtcctac 2400
tacaaggtgt acggcttgct ggaccagaac atcctggagc tgtacttcaa cgacggcgac 2460
gtcgtgtcca ccaacaccta cttcatgacc accgggaacg ccctgggctc cgtgaacatg 2520
acgacggggg tggacaacct gttctacatc gacaagttcc aggtgcgcga ggtcaagtga 2580
caattggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 2640
ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 2700
cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 2760
ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 2820
aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 2880
cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 2940
actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggagg atcgtagagc 3000
tccacctgca tccgcctggc gctcgaggac gccggcgtct cgcccgacga ggtcaactac 3060
gtcaacgcgc acgccacctc caccctggtg ggcgacaagg ccgaggtgcg cgcggtcaag 3120
tcggtctttg gcgacatgaa gggcatcaag atgaacgcca ccaagtccat gatcgggcac 3180
tgcctgggcg ccgccggcgg catggaggcc gtcgccacgc tcatggccat ccgcaccggc 3240
tgggtgcacc ccaccatcaa ccacgacaac cccatcgccg aggtcgacgg cctggacgtc 3300
gtcgccaacg ccaaggccca gcacaaaatc aacgtcgcca tctccaactc cttcggcttc 3360
ggcgggcaca actccgtcgt cgcctttgcg cccttccgcg agtaggcgga gcgagcgcgc 3420
ttggctgagg agggaggcgg ggtgcgagcc ctttggctgc gcgcgatact ctccccgcac 3480
gagcagactc cacgcgcctg aatctacttg tcaacgagca accgtgtgtt ttgtccgtgg 3540
ccattcttat tatttctccg actgtggccg tactctgttt ggctgtgcaa gcaccgaaga 3600
gc 3602
<210> 238
<211> 661
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 238
gctcttcgct caccgcgtga attgctgtcc caaacgtaag catcatcgtg gctcggtcac 60
gcgatcctgg atccggggat cctagaccgc tggtggagag cgctgccgtc ggattggtgg 120
caagtaagat tgcgcaggtt ggcgaaggga gagaccaaaa ccggaggctg gaagcgggca 180
caacatcgta ttattgcgta tagtagagca gtggcagtcg catttcgagg tccgcaacgg 240
atctcgcaag ctcgctacgc tcacagtagg agaaagggga ccactgcccc tgccagaatg 300
gtcgcgaccc tctccctcgc cggccccgcc tgcaacacgc agtgcgtatc cggcaagcgg 360
gctgtcgcct tcaaccgccc ccatgttggc gtccgggctc gatcaggtgc gctgaggggg 420
gtttggtgtg cccgcgcctc tgggcccgtg tcggccgtgc ggacgtgggg ccctgggcag 480
tggatcagca gggtttgcgt gcaaatgcct ataccggcga ttgaatagcg atgaacggga 540
tacggttgcg ctcactccat gcccatgcga ccccgtttct gtccgccagc cgtggtcgcc 600
cgggctgcga agcgggaccc cacccagcgc attgtgatca ccggaatggg cgtggggtac 660
c 661
<210> 239
<211> 605
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 239
gagctccacc tgcatccgcc tggcgctcga ggacgccggc gtctcgcccg acgaggtcaa 60
ctacgtcaac gcgcacgcca cctccaccct ggtgggcgac aaggccgagg tgcgcgcggt 120
caagtcggtc tttggcgaca tgaagggcat caagatgaac gccaccaagt ccatgatcgg 180
gcactgcctg ggcgccgccg gcggcatgga ggccgtcgcc acgctcatgg ccatccgcac 240
cggctgggtg caccccacca tcaaccacga caaccccatc gccgaggtcg acggcctgga 300
cgtcgtcgcc aacgccaagg cccagcacaa aatcaacgtc gccatctcca actccttcgg 360
cttcggcggg cacaactccg tcgtcgcctt tgcgcccttc cgcgagtagg cggagcgagc 420
gcgcttggct gaggagggag gcggggtgcg agccctttgg ctgcgcgcga tactctcccc 480
gcacgagcag actccacgcg cctgaatcta cttgtcaacg agcaaccgtg tgttttgtcc 540
gtggccattc ttattatttc tccgactgtg gccgtactct gtttggctgt gcaagcaccg 600
aagag 605
<210> 240
<211> 3124
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 240
gctcttcgct ggcctgttgc cggacgatcc gtgtcgtcga gactgcattt tgttttgggt 60
gtggggctgg ggtactggat ggcttgaggg catgactttt tctgatggag aagattgcaa 120
tgagatcatt tgggtcgtct atttgtttgc tgtgcaagag ggtttactgg tatctggcac 180
cagcttttgg cccgtgcccg tttgatggac gcgtgacagg caggcgtcct ggaaagcaca 240
gacaccgtac gtacgacctt gacctccccc ccttctccac acggcaggtg cgaggctgcc 300
cacggcgtcg aggcgggcgg tgcgccgggc atggtcccgc atcgcgcgcg cggcggccgc 360
ggccgacgca aaccccgccc gccctgagcg ccgcgtggtc atcacgggcc agggcgtggt 420
gaccagcctg ggccagacga tcgagcagtt ttacagcagc ctgctggagg gcgtgagcgg 480
catctcgcag atacagaagt tcgacaccac gggctacacg acgacgatcg cgggcgagat 540
caagtcgctg cagctggacc cgtacgtgcc caagcgctgg gcgaagcgcg tggacgacgt 600
gataaagtac gtctacatcg cgggcaagca ggcgctggag agcgccggcc tgccgatcga 660
ggcggcgggg ctggcgggcg cggggctgga cccggcgctg tgcggcgtgc tcatcggcac 720
cgccatggcg ggcatgacgt ctttcgcggc gggcgtggag gcgctgacgc gcggtaccct 780
ttcttgcgct atgacacttc cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg 840
ctgcatgcaa caccgatgat gcttcgaccc cccgaagctc cttcggggct gcatgggcgc 900
tccgatgccg ctccagggcg agcgctgttt aaatagccag gcccccgatt gcaaagacat 960
tatagcgagc taccaaagcc atattcaaac acctagatca ctaccacttc tacacaggcc 1020
actcgagctt gtgatcgcac tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca 1080
acccgcaaac tctagaatat caatgatcga gcaggacggc ctccacgccg gctcccccgc 1140
cgcctgggtg gagcgcctgt tcggctacga ctgggcccag cagaccatcg gctgctccga 1200
cgccgccgtg ttccgcctgt ccgcccaggg ccgccccgtg ctgttcgtga agaccgacct 1260
gtccggcgcc ctgaacgagc tgcaggacga ggccgcccgc ctgtcctggc tggccaccac 1320
cggcgtgccc tgcgccgccg tgctggacgt ggtgaccgag gccggccgcg actggctgct 1380
gctgggcgag gtgcccggcc aggacctgct gtcctcccac ctggcccccg ccgagaaggt 1440
gtccatcatg gccgacgcca tgcgccgcct gcacaccctg gaccccgcca cctgcccctt 1500
cgaccaccag gccaagcacc gcatcgagcg cgcccgcacc cgcatggagg ccggcctggt 1560
ggaccaggac gacctggacg aggagcacca gggcctggcc cccgccgagc tgttcgcccg 1620
cctgaaggcc cgcatgcccg acggcgagga cctggtggtg acccacggcg acgcctgcct 1680
gcccaacatc atggtggaga acggccgctt ctccggcttc atcgactgcg gccgcctggg 1740
cgtggccgac cgctaccagg acatcgccct ggccacccgc gacatcgccg aggagctggg 1800
cggcgagtgg gccgaccgct tcctggtgct gtacggcatc gccgcccccg actcccagcg 1860
catcgccttc taccgcctgc tggacgagtt cttctgacaa ttggcagcag cagctcggat 1920
agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac acttgctgcc 1980
ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt gatcttgtgt 2040
gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac ccccagcatc 2100
cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta 2160
tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg tttgggctcc 2220
gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga tgcacgggaa 2280
gtagtgggat gggaacacaa atggaggatc cactagttct agagcggccg ccaccgcggt 2340
ggagctcggc ggcgtgcgca agatgaaccc cttttgcatc cccttctcca tctccaacat 2400
gggcggcgcg atgctggcga tggacatcgg cttcatgggc cccaactact ccatctccac 2460
ggcctgcgcg acgggcaact actgcatcct gggcgcggcg gaccacatcc ggcgcggcga 2520
cgcaaacgtg atgctggccg gcggcgcgga cgcggccatc atcccctcgg gcatcggcgg 2580
cttcatcgcg tgcaaggcgc tgagcaagcg caacgacgag cccgagcgcg cgagccggcc 2640
ctgggacgcc gaccgcgacg gcttcgtcat gggcgagggc gccggcgtgc tggtgctgga 2700
ggagctggag cacgccaagc gccgcggcgc gaccattttg gctgaattag ttggcggcgc 2760
ggccacctcg gacgcgcacc acatgaccga gcccgacccg cagggccgcg gcgtgcgcct 2820
ctgcctcgag cgcgcgctcg agcgcgcgcg cctcgcgccc gagcgcgtcg gctacgtcaa 2880
cgcgcacggc accagcacgc ccgcgggcga cgtggccgag taccgcgcca tccgcgccgt 2940
catcccgcag gactcactac gcatcaactc cacaaagtcc atgatcgggc acctgctcgg 3000
cggcgccggc gcggtcgagg ccgtggccgc catccaggcc ctgcgcaccg gctggctcca 3060
ccccaacttg aacctcgaga accccgcgcc tggcgtcgac cccgtcgtgc tcgtgggctc 3120
ttcc 3124
<210> 241
<211> 1173
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 241
actagtatgg gcgccggcgg ccgcatgtcc aacccctccg agggcgagaa gaagaccgag 60
ctggagggca tccagcgcgt gccctaccag aagcccccct tcaccgtggg cgacgggcgc 120
gccgtgaaga aggccatccc cccccactgc ttcaaccgct ccgtgatccg ctccttctcc 180
tacgtggtgt acgacctgac catcgcctcc atcctgtact acatcgccac caccttcatc 240
cccctgctgc cccaccccct ggcctacgtg gcctggccca tctactgggc cgtgcagggc 300
tgcgtgatga ccggcgtgtg ggtgatcgcc cacgagtgcg gccaccacgc cttctccgac 360
taccagtggc tggacgacac cgtgggcctg atcctgcact ccgtgctgct ggtgccctac 420
ttctcctgga agtactccca ccgccgccac cactccaaca ccggctccat cgagcacgac 480
gaggtgttcg tgcccaagct gaagtccggc gtgcgctcca ccgccaagta cctgaacaac 540
ccccccggcc gcatcctgac cctgctggtg accctgaccc tgggctggcc cctgtacctg 600
atgttcaacg tgtccggccg ctactacgac cgcttcgcct gccacttcga ccccaactcc 660
cccatctact ccaaccgcga gcgcgcccag atcttcatct ccgacgccgg catcttcgcc 720
gtgctgtacg gcctgtaccg cctggccgcc gtgaagggcc tggtgtgggt gctgaccgtg 780
tacgccggcc ccctgctggt ggtgaacggc ttcctggtgc tgatcacctt cctgcagcac 840
acccacccct ccctgcccca ctacgactcc accgagtggg actggctgcg cggcgccctg 900
gccaccatcg accgcgacta cggcatcctg aacaaggtgt tccacaacat caccgacacc 960
cacgtgaccc accacctgtt ctccaccatg ccccactacc acgccatgga ggccaccaag 1020
gccatcatcc ccatcctggg cgactactac cagttcgacg gcacctccgt gttcaaggcc 1080
atgtaccgcg agaccaagga gtgcatctac gtggacaagg acgaggaggt gaaggacggc 1140
gtgtactggt accgcaacaa gatctagatc gat 1173
<210> 242
<211> 1173
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 242
actagtatgg gcgccggcgg ccgcaccgac gtgccccccg ccaaccgcaa gtccgaggtg 60
gaccccctga agcgcgtgcc cttcgagaag ccccccttct ccctgtccca ggggcgcgcc 120
atcaagaagg tgatcccccc ccactgcttc cagcgctccg tgttccgctc cttctcctac 180
gtggtgtacg acctgaccat cgccttctgc ctgtactacg tggccaccca ctacttccac 240
ctgctgccct cccccctgtc cttcctggcc tggcccatct actgggccgt gcagggctgc 300
atcctgaccg gcgtgtgggt gatcgcccac gagtgcggcc accacgcctt ctccgactac 360
cagctgctgg acgacatcgt gggcctggtg ctgcactccg gcctgctggt gccctacttc 420
tcctggaagt actcccaccg ccgccaccac tccaacaccg gctccctgga gcgcgacgag 480
gtgttcgtgc ccaagcagaa gtcctgcatc aagtggtact ccaagtacct gaacaacccc 540
cccggccgcg tgctgaccct ggccgtgacc ctgaccctgg gctggcccct gtacctggcc 600
ctgaacgtgt ccggccgccc ctacgaccgc ttcgcctgcc actacgaccc ctacggcccc 660
atctactccg accgcgagcg cctgcagatc tacatctccg acgccggcgt gctggccgtg 720
tgctacggcc tgttccgcct ggccatggcc aagggcctgg cctgggtggt gtgcgtgtac 780
ggcgtgcccc tgctggtggt gaacggcttc ctggtgctga tcaccttcct gcagcacacc 840
caccccgccc tgccccacta cacctcctcc gagtgggact ggctgcgcgg cgccctggcc 900
accgtggacc gcgactacgg catcctggac aaggtgttcc acaacatcac cgacacccac 960
gtggcccacg agctgttctc caccatgccc cactaccacg ccatggaggc caccaaggcc 1020
atcaagccca tcctgggcga gtactaccgc ttcgacgaga cccccttcgt gaaggccatg 1080
tggcgcgagg cccgcgagtg catctacgtg gagcccgacc agtccaccga gtccaagggc 1140
gtgttctggt acaacaacaa gctgtagatc gat 1173
<210> 243
<211> 1170
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 243
actagtatgg gcgccggcgg ccgcatgtcc tcccccaacg gcaaggagaa ggacggcccc 60
aagcccctgg agcgcgccct gcacgagaag ccccccttca ccgtgggcga cgggcgcgcc 120
atcaagaagg tgatcccccc ccactgcttc aagcgctccg tgatccgctc cttctcctac 180
gtggtgtacg acctgaccat cgcctccatc ttctactacc tggccaacaa ctacatcccc 240
ctgctgccca actccctggc ctacgtggcc tggcccgtgt actggatctt ccagggctgc 300
gtgctgaccg gcgtgtgggt gatcgcccac gagtgcggcc accacgcctt ctccgactac 360
cagtggctgg acgacaccgt gggcctgatc ctgcactccg ccctgctggt gccctacttc 420
tcctggaagt actcccaccg ccgccaccac tccaacaccg gctccatcga gcacgacgag 480
gtgttcgtgc ccaagctgaa gtcctccgtg cgctccaccg ccaagtacct gaacaacccc 540
cccggccgca tcctgaccct gctggtgacc ctgaccatgg gctggcccct gtacctgatg 600
ttcaacgtgt ccggccgcta ctacgaccgc ttcgcctgcc acttcgaccc caactccccc 660
atctactcca accgcgagcg cgcccagatc ttcatctccg acgccggcat cctgaccgtg 720
ttctacatcc tgttccgcct ggcctccacc aagggcctgg tgtgggtgct gaccatgtac 780
ggcggccccc tgctggtggt gaacggcttc ctggtgctga tcaccttcct gcagcacacc 840
cacccctccc tgccccacta cgactccacc gagtgggact ggctgcgcgg cgccctggcc 900
accgtggacc gcgactacgg catcctgaac aaggtgttcc acaacatcac cgacacccac 960
gtgacccacc acctgttctc caccatgccc cactaccacg ccatggaggc caccaaggcc 1020
atcaagccca tcctgggcga ctactaccag ttcgacggca cctccatctt caaggccatg 1080
taccgcgaga ccaaggagtg catctacgtg gacaaggacg aggacgtgaa ggacggcgtg 1140
tactggtacc gcaacaagat ctagatcgat 1170
<210> 244
<211> 1185
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 244
actagtatgg gcgccggcgg ccgcatgacc gagaaggagc gcgagaagca ggagcagctg 60
gcccgcgcca ccggcggcgc cgccatgcag cgctcccccg tggagaagcc ccccttcacc 120
ctgggccagg ggcgcgccat caagaaggcc atcccccccc actgcttcga gcgctccgtg 180
ctgaagtcct tctcctacgt ggtgcacgac ctggtgatcg ccgccgccct gctgtacttc 240
gccctggcca tcatccccgc cctgccctcc cccctgggct acgccgcctg gcccctgtac 300
tggatcgccc agggctgcgt gtgcaccggc gtgtgggtga tcgcccacga gtgcggccac 360
cacgccttct ccgactactc cctgctggac gacgtggtgg gcctggtgct gcactcctcc 420
ctgatggtgc cctacttctc ctggaagtac tcccaccgcc gccaccactc caacaccggc 480
tccctggagc gcgacgaggt gttcgtgccc aagaagaagg aggccctgcc ctggtacacc 540
ccctacgtgt acaacaaccc cgtgggccgc ctggcccaca tcgtggtgca gctgaccctg 600
ggctggcccc tgtacctggc caccaacgcc tccggccgcc cctacccccg cttcgcctgc 660
cacttcgacc cctacggccc catctacaac gaccgcgagc gcgcccagat cttcgtgtcc 720
gacgccggcg tggccgccgt ggccttcggc ctgtacaagc tggccgccgc cttcggcgtg 780
tggtgggtgg tgcgcgtgta cgccgtgccc ctgctgatcg tgaacgcctg gctggtgctg 840
atcacctacc tgcagcacac ccacccctcc ctgccccact acgactcctc cgagtgggac 900
tggctgcgcg gcgccctggc caccatggac cgcgactacg gcatcctgaa ccgcgtgttc 960
cacaacatca ccgacaccca cgtggcccac cacctgttct ccaccatgcc ccactaccac 1020
gccatggagg ccaccaaggc catccgcccc atcctgggcg actactacca cttcgacccc 1080
acccccgtgg ccaaggccac ctggcgcgag gccggcgagt gcatctacgt ggagcccgag 1140
gaccgcaagg gcgtgttctg gtacaacaag aagttctaga tcgat 1185
<210> 245
<211> 6756
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 245
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300
aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360
cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420
ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480
cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540
gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600
tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660
ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720
ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780
ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840
aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900
aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960
ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020
gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080
caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140
tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200
tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260
tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320
agcgggccca caggccggtc gcagccacta gtatgggcgc cggcggccgc atgtccgtgc 4380
ccacctcccc caagaagccc gagttcaact ccctgaagcg cgtgccctac tccaagcccc 4440
ccttcaccct gtccgagggg cgcgccatgg actacaagga ccacgacggc gactacaagg 4500
accacgacat cgactacaag gacgacgacg acaagatcaa gaaggccatc cccccccact 4560
gcttccagcg ctccgtgctg cgctccttct cctacctgct gtacgacttc atcctggcct 4620
ccctgttcta ccacgtggcc accaactact tccccaacct gccccaggcc ctgtccaacg 4680
tggcctggcc cctgtactgg gccatgcagg gctgcatcct gaccggcgtg tgggtgatcg 4740
cccacgagtg cggccaccac gccttctccg actaccagtg gctggacgac accgtgggcc 4800
tgatcctgca ctcctccctg ctggtgccct acttctcctg gaagtactcc caccgccgcc 4860
accactccaa caccggctcc ctggagcgcg acgaggtgtt cgtgcccaag aagaagtccg 4920
gcctgcgctg gtgggccaag cacttcaaca acccccccgg ccgcttcctg tccatcacca 4980
tccagctgac cctgggctgg cccctgtacc tggccttcaa cgtggccggc cgcccctacg 5040
accgcttcgc ctgccactac gacccctacg gccccatctt ctccgaccgc gagcgcctgc 5100
agatctacat ctccgacgcc ggcgtgctgg ccgtggccta cgccctgtac cgcctggtgc 5160
tggccaaggg cgtgggctgg gtgatctccg tgtacggcgt gcccctgctg gtggtgaacg 5220
ccttcctggt gatgatcacc tacctgcagc acacccaccc ctccctgccc cactacgact 5280
cctccgagtg ggactggatg cgcggcgccc tgtccaccgt ggaccgcgac tacggcatcc 5340
tgaacaaggt gttccacaac atcaccgaca cccacgtggc ccaccacctg ttctccacca 5400
tgccccacta ccacgccatg gtggccacca aggccatcaa gcccatcctg ggcgagtact 5460
accagttcga cggcatgccc gtgtacaagg ccatctggcg cgaggccaag gagtgcctgt 5520
acgtggagcc cgacgagggc gacaaggaca agggcgtgtt ctggttccgc aacaagctgt 5580
agatcgatct taaggcagca gcagctcgga tagtatcgac acactctgga cgctggtcgt 5640
gtgatggact gttgccgcca cacttgctgc cttgacctgt gaatatccct gccgctttta 5700
tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt gctagctgct 5760
tgtgctattt gcgaatacca cccccagcat ccccttccct cgtttcatat cgcttgcatc 5820
ccaaccgcaa cttatctacg ctgtcctgct atccctcagc gctgctcctg ctcctgctca 5880
ctgcccctcg cacagccttg gtttgggctc cgcctgtatt ctcctggtac tgcaacctgt 5940
aaaccagcac tgcaatgctg atgcacggga agtagtggga tgggaacaca aatggaaagc 6000
ttaattaaga gctcttgttt tccagaagga gttgctcctt gagcctttca ttctcagcct 6060
cgataacctc caaagccgct ctaattgtgg agggggttcg aatttaaaag cttggaatgt 6120
tggttcgtgc gtctggaaca agcccagact tgttgctcac tgggaaaagg accatcagct 6180
ccaaaaaact tgccgctcaa accgcgtacc tctgctttcg cgcaatctgc cctgttgaaa 6240
tcgccaccac attcatattg tgacgcttga gcagtctgta attgcctcag aatgtggaat 6300
catctgcccc ctgtgcgagc ccatgccagg catgtcgcgg gcgaggacac ccgccactcg 6360
tacagcagac cattatgcta cctcacaata gttcataaca gtgaccatat ttctcgaagc 6420
tccccaacga gcacctccat gctctgagtg gccacccccc ggccctggtg cttgcggagg 6480
gcaggtcaac cggcatgggg ctaccgaaat ccccgaccgg atcccaccac ccccgcgatg 6540
ggaagaatct ctccccggga tgtgggccca ccaccagcac aacctgctgg cccaggcgag 6600
cgtcaaacca taccacacaa atatccttgg catcggccct gaattccttc tgccgctctg 6660
ctacccggtg cttctgtccg aagcaggggt tgctagggat cgctccgagt ccgcaaaccc 6720
ttgtcgcgtg gcggggcttg ttcgagcttg aagagc 6756
<210> 246
<211> 9416
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 246
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgggctgg tctgaatcct tcaggcgggt 1920
gttacccgag aaagaaaggg tgccgatttc aaagcagacc catgtgccgg gccctgtggc 1980
ctgtgttggc gcctatgtag tcaccccccc tcacccaatt gtcgccagtt tgcgcactcc 2040
ataaactcaa aacagcagct tctgagctgc gctgttcaag aacacctctg gggtttgctc 2100
acccgcgagg tcgacgccca gcatggctat caagacgaac aggcagcctg tggagaagcc 2160
tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 2220
gcttcgtagc agcatgtacc tggcctttga catcgcggtc atgtccctgc tctacgtcgc 2280
gtcgacgtac atcgaccctg caccggtgcc tacgtgggtc aagtacggca tcatgtggcc 2340
gctctactgg ttcttccagg tgtgtttgag ggttttggtt gcccgtattg aggtcctggt 2400
ggcgcgcatg gaggagaagg cgcctgtccc gctgaccccc ccggctaccc tcccggcacc 2460
ttccagggcg ccttcggcac gggtgtctgg gtgtgcgcgc acgagtgcgg ccaccaggcc 2520
ttttcctcca gccaggccat caacgacggc gtgggcctgg tgttccacag cctgctgctg 2580
gtgccctact actcctggaa gcactcgcac cgggtaccct ttcttgcgct atgacacttc 2640
cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat 2700
gcttcgaccc cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg 2760
agcgctgttt aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc 2820
atattcaaac acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac 2880
tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac tctagaatat 2940
caatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct 3000
ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga 3060
tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc 3120
agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg 3180
acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg 3240
gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca 3300
ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg 3360
agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc 3420
ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct 3480
cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct 3540
ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct 3600
accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct 3660
actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt 3720
acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg 3780
tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg 3840
ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca 3900
acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg 3960
ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg 4020
ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg 4080
tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca 4140
cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg 4200
accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc 4260
gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg 4320
tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc 4380
tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct 4440
acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc 4500
tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc 4560
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 4620
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 4680
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 4740
catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 4800
gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 4860
ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 4920
ggaagtagtg ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag 4980
gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct 5040
gacgaatgcg cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt 5100
tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag 5160
ggatatcgaa ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc 5220
ggcaggtcgt tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt 5280
ggcgtggcaa acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg 5340
ccggaatcca agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac 5400
agccgctcct gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc 5460
accgcctcac cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagaa 5520
ctcgactacg acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc 5580
caggattgaa actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg 5640
cgagctgcca gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc 5700
tcaggtcatg ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca 5760
agctaatcag ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg 5820
ggtgatcctt cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg 5880
cgcaactcgc gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg 5940
gatgcgtggc accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct 6000
ctgtcgccaa ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag 6060
ctaccgacta ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac 6120
attccattcg tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct 6180
gtttcccgac ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac 6240
tagtatggcc accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg 6300
ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccga 6360
ggtgcacgtg caggtgaccc actccctggc ccccgagaag cgcgagatct tcaactccct 6420
gaacaactgg gcccaggaga acatcctggt gctgctgaag gacgtggaca agtgctggca 6480
gccctccgac ttcctgcccg actccgcctc cgagggcttc gacgagcagg tgatggagct 6540
gcgcaagcgc tgcaaggaga tccccgacga ctacttcatc gtgctggtgg gcgacatgat 6600
caccgaggag gccctgccca cctaccagac catgctgaac accctggacg gcgtgcgcga 6660
cgagaccggc gcctccctga ccccctgggc catctggacc cgcgcctgga ccgccgagga 6720
gaaccgccac ggcgacctgc tgaacaagta cctgtacctg tccggccgcg tggacatgaa 6780
gcagatcgag aagaccatcc agtacctgat cggctccggc atggaccccc gcaccgagaa 6840
caacccctac ctgggcttca tctacacctc cttccaggag cgcgccacct tcatctccca 6900
cggcaacacc gcccgcctgg ccaaggagca cggcgacctg aagctggccc agatctgcgg 6960
catcatcgcc gccgacgaga agcgccacga gaccgcctac accaagatcg tggagaagct 7020
gttcgagatc gaccccgacg gcaccgtgct ggccctggcc gacatgatgc gcaagaaggt 7080
gtccatgccc gcccacctga tgtacgacgg ccaggacgac aacctgttcg agaacttctc 7140
ctccgtggcc cagcgcctgg gcgtgtacac cgccaaggac tacgccgaca tcctggagtt 7200
cctggtgggc cgctgggaca tcgagaagct gaccggcctg tccggcgagg gccgcaaggc 7260
ccaggactac gtgtgcaccc tgcccccccg catccgccgc ctggaggagc gcgcccagtc 7320
ccgcgtgaag aaggcctccg ccaccccctt ctcctggatc ttcggccgcg agatcaacct 7380
gatggactac aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga 7440
cgacgacaag tgaatcgata gatctcttaa ggcagcagca gctcggatag tatcgacaca 7500
ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa 7560
tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt 7620
gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt 7680
ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct 7740
gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc 7800
ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg 7860
gaacacaaat ggaaagctta attaagagct cccgccacca ctccaacacg gggtgcctgg 7920
acaaggacga ggtgtttgtg ccgccgcacc gcgcagtggc gcacgagggc ctggagtggg 7980
aggagtggct gcccatccgc atgggcaagg tgctggtcac cctgaccctg ggctggccgc 8040
tgtacctcat gttcaacgtc gcctcgcggc cgtacccgcg cttcgccaac cactttgacc 8100
cgtggtcgcc catcttcagc aagcgcgagc gcatcgaggt ggtcatctcc gacctggcgc 8160
tggtggcggt gctcagcggg ctcagcgtgc tgggccgcac catgggctgg gcctggctgg 8220
tcaagaccta cgtggtgccc tacctgatcg tgaacatgtg gctcgtgctc atcacgctgc 8280
tccagcacac gcacccggcg ctgccgcact acttcgagaa ggactgggac tggctgcgcg 8340
gcgccatggc caccgtggac cgctccatgg gcccgccctt catggacaac atcctgcacc 8400
acatctccga cacccacgtg ctgcaccacc tcttcagcac catcccgcac taccacgccg 8460
aggaggcctc cgccgccatc aggcccatcc tgggcaagta ctaccagtcc gacagccgct 8520
gggtcggccg cgccctgtgg gaggactggc gcgactgccg ctacgtcgtc ccggacgcgc 8580
ccgaggacga ctccgcgctc tggttccaca agtgagtgag tgagaagagc ctctagagtc 8640
gacctgcagg catgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 8700
ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 8760
tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 8820
gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 8880
gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 8940
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 9000
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 9060
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 9120
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 9180
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 9240
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 9300
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 9360
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgc 9416
<210> 247
<211> 719
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 247
gggctggtct gaatccttca ggcgggtgtt acccgagaaa gaaagggtgc cgatttcaaa 60
gcagacccat gtgccgggcc ctgtggcctg tgttggcgcc tatgtagtca ccccccctca 120
cccaattgtc gccagtttgc gcactccata aactcaaaac agcagcttct gagctgcgct 180
gttcaagaac acctctgggg tttgctcacc cgcgaggtcg acgcccagca tggctatcaa 240
gacgaacagg cagcctgtgg agaagcctcc gttcacgatc gggacgctgc gcaaggccat 300
ccccgcgcac tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg cctttgacat 360
cgcggtcatg tccctgctct acgtcgcgtc gacgtacatc gaccctgcac cggtgcctac 420
gtgggtcaag tacggcatca tgtggccgct ctactggttc ttccaggtgt gtttgagggt 480
tttggttgcc cgtattgagg tcctggtggc gcgcatggag gagaaggcgc ctgtcccgct 540
gacccccccg gctaccctcc cggcaccttc cagggcgcct tcggcacggg tgtctgggtg 600
tgcgcgcacg agtgcggcca ccaggccttt tcctccagcc aggccatcaa cgacggcgtg 660
ggcctggtgt tccacagcct gctgctggtg ccctactact cctggaagca ctcgcaccg 719
<210> 248
<211> 732
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 248
ccgccaccac tccaacacgg ggtgcctgga caaggacgag gtgtttgtgc cgccgcaccg 60
cgcagtggcg cacgagggcc tggagtggga ggagtggctg cccatccgca tgggcaaggt 120
gctggtcacc ctgaccctgg gctggccgct gtacctcatg ttcaacgtcg cctcgcggcc 180
gtacccgcgc ttcgccaacc actttgaccc gtggtcgccc atcttcagca agcgcgagcg 240
catcgaggtg gtcatctccg acctggcgct ggtggcggtg ctcagcgggc tcagcgtgct 300
gggccgcacc atgggctggg cctggctggt caagacctac gtggtgccct acctgatcgt 360
gaacatgtgg ctcgtgctca tcacgctgct ccagcacacg cacccggcgc tgccgcacta 420
cttcgagaag gactgggact ggctgcgcgg cgccatggcc accgtggacc gctccatggg 480
cccgcccttc atggacaaca tcctgcacca catctccgac acccacgtgc tgcaccacct 540
cttcagcacc atcccgcact accacgccga ggaggcctcc gccgccatca ggcccatcct 600
gggcaagtac taccagtccg acagccgctg ggtcggccgc gccctgtggg aggactggcg 660
cgactgccgc tacgtcgtcc cggacgcgcc cgaggacgac tccgcgctct ggttccacaa 720
gtgagtgagt ga 732
<210> 249
<211> 12342
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 249
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggaag aatgcatggc tcttccggcc 1260
tgttgccgga cgatccgtgt cgtcgagact gcattttgtt ttgggtgtgg ggctggggta 1320
ctggatggct tgagggcatg actttttctg atggagaaga ttgcaatgag atcatttggg 1380
tcgtctattt gtttgctgtg caagagggtt tactggtatc tggcaccagc ttttggcccg 1440
tgcccgtttg atggacgcgt gacaggcagg cgtcctggaa agcacagaca ccgtacgtac 1500
gaccttgacc tccccccctt ctccacacgg caggtgcgag gctgcccacg gcgtcgaggc 1560
gggcggtgcg ccgggcatgg tcccgcatcg cgcgcgcggc ggccgcggcc gacgcaaacc 1620
ccgcccgccc tgagcgccgc gtggtcatca cgggccaggg cgtggtgacc agcctgggcc 1680
agacgatcga gcagttttac agcagcctgc tggagggcgt gagcggcatc tcgcagatac 1740
agaagttcga caccacgggc tacacgacga cgatcgcggg cgagatcaag tcgctgcagc 1800
tggacccgta cgtgcccaag cgctgggcga agcgcgtgga cgacgtgata aagtacgtct 1860
acatcgcggg caagcaggcg ctggagagcg ccggcctgcc gatcgaggcg gcggggctgg 1920
cgggcgcggg gctggacccg gcgctgtgcg gcgtgctcat cggcaccgcc atggcgggca 1980
tgacgtcttt cgcggcgggc gtggaggcgc tgacgcgcgg taccctttct tgcgctatga 2040
cacttccagc aaaaggtagg gcgggctgcg agacggcttc ccggcgctgc atgcaacacc 2100
gatgatgctt cgaccccccg aagctccttc ggggctgcat gggcgctccg atgccgctcc 2160
agggcgagcg ctgtttaaat agccaggccc ccgattgcaa agacattata gcgagctacc 2220
aaagccatat tcaaacacct agatcactac cacttctaca caggccactc gagcttgtga 2280
tcgcactccg ctaagggggc gcctcttcct cttcgtttca gtcacaaccc gcaaacggcg 2340
cgccatgctg ctgcaggcct tcctgttcct gctggccggc ttcgccgcca agatcagcgc 2400
ctccatgacg aacgagacgt ccgaccgccc cctggtgcac ttcaccccca acaagggctg 2460
gatgaacgac cccaacggcc tgtggtacga cgagaaggac gccaagtggc acctgtactt 2520
ccagtacaac ccgaacgaca ccgtctgggg gacgcccttg ttctggggcc acgccacgtc 2580
cgacgacctg accaactggg aggaccagcc catcgccatc gccccgaagc gcaacgactc 2640
cggcgccttc tccggctcca tggtggtgga ctacaacaac acctccggct tcttcaacga 2700
caccatcgac ccgcgccagc gctgcgtggc catctggacc tacaacaccc cggagtccga 2760
ggagcagtac atctcctaca gcctggacgg cggctacacc ttcaccgagt accagaagaa 2820
ccccgtgctg gccgccaact ccacccagtt ccgcgacccg aaggtcttct ggtacgagcc 2880
ctcccagaag tggatcatga ccgcggccaa gtcccaggac tacaagatcg agatctactc 2940
ctccgacgac ctgaagtcct ggaagctgga gtccgcgttc gccaacgagg gcttcctcgg 3000
ctaccagtac gagtgccccg gcctgatcga ggtccccacc gagcaggacc ccagcaagtc 3060
ctactgggtg atgttcatct ccatcaaccc cggcgccccg gccggcggct ccttcaacca 3120
gtacttcgtc ggcagcttca acggcaccca cttcgaggcc ttcgacaacc agtcccgcgt 3180
ggtggacttc ggcaaggact actacgccct gcagaccttc ttcaacaccg acccgaccta 3240
cgggagcgcc ctgggcatcg cgtgggcctc caactgggag tactccgcct tcgtgcccac 3300
caacccctgg cgctcctcca tgtccctcgt gcgcaagttc tccctcaaca ccgagtacca 3360
ggccaacccg gagacggagc tgatcaacct gaaggccgag ccgatcctga acatcagcaa 3420
cgccggcccc tggagccggt tcgccaccaa caccacgttg acgaaggcca acagctacaa 3480
cgtcgacctg tccaacagca ccggcaccct ggagttcgag ctggtgtacg ccgtcaacac 3540
cacccagacg atctccaagt ccgtgttcgc ggacctctcc ctctggttca agggcctgga 3600
ggaccccgag gagtacctcc gcatgggctt cgaggtgtcc gcgtcctcct tcttcctgga 3660
ccgcgggaac agcaaggtga agttcgtgaa ggagaacccc tacttcacca accgcatgag 3720
cgtgaacaac cagcccttca agagcgagaa cgacctgtcc tactacaagg tgtacggctt 3780
gctggaccag aacatcctgg agctgtactt caacgacggc gacgtcgtgt ccaccaacac 3840
ctacttcatg accaccggga acgccctggg ctccgtgaac atgacgacgg gggtggacaa 3900
cctgttctac atcgacaagt tccaggtgcg cgaggtcaag tgacaattgg cagcagcagc 3960
tcggatagta tcgacacact ctggacgctg gtcgtgtgat ggactgttgc cgccacactt 4020
gctgccttga cctgtgaata tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc 4080
ttgtgtgtac gcgcttttgc gagttgctag ctgcttgtgc tatttgcgaa taccaccccc 4140
agcatcccct tccctcgttt catatcgctt gcatcccaac cgcaacttat ctacgctgtc 4200
ctgctatccc tcagcgctgc tcctgctcct gctcactgcc cctcgcacag ccttggtttg 4260
ggctccgcct gtattctcct ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca 4320
cgggaagtag tgggatggga acacaaatgg aggatcgtag agctggatcc tctaaagctt 4380
ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 4440
tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 4500
ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 4560
gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 4620
aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 4680
cggacaaagc accggtgtat caggtccgtg tcatccactc taaagaactc gactacgacc 4740
tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 4800
ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 4860
aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 4920
ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 4980
tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 5040
gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 5100
agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 5160
ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 5220
taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 5280
taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 5340
ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 5400
cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag tatggtggcc 5460
accgccgcct cctccgcctt cttccccctg ccctccgccg acacctcctc ccgccccggc 5520
aagctgggca acaagccctc ctccctgtcc cccctgaagc ccaagtccac ccccaacggc 5580
ggcctgcagg tgaaggccaa cgcctccgcc ccccccaaga tcaacggctc ccccgtgggc 5640
ctgaagtccg gcggcctgaa ggggcgcgcc acccaggagg acgcccactc cgcccccccc 5700
ccccgcacct tcatcaacca gctgcccgac tggtccatgc tgctggccgc catcaccacc 5760
gtgttcctgg ccgccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac 5820
atgctggtgg accccttcgg cctgggctcc atcgtgcagg acggcctggt gttccgccag 5880
aacttctcca tccgctccta cgagatcggc gccgaccgca ccgcctccat cgagaccgtg 5940
atgaaccacc tgcaggagac cgccctgaac cacgtgaaga tcgccggcct gtccaacgac 6000
ggcttcggcc gcacccccga gatgtacaag cgcgacctga tctgggtggt ggccaagatg 6060
caggtgatgg tgaaccgcta ccccacctgg ggcgacaccg tggaggtgaa cacctgggtg 6120
gccaagtccg gcaagaacgg catgcgccgc gactggctga tctccgactg caacaccggc 6180
gagatcctga cccgcgcctc ctccgtgtgg gtgatgatga accagaagac ccgccgcctg 6240
tccaagatcc ccgacgaggt gcgcaacgag atcgagcccc acttcgtgga ctcccccccc 6300
gtgatcgagg acgacgaccg caagctgccc aagctggacg agaagaccgc cgactccatc 6360
cgcaagggcc tgaccccccg ctggaacgac ctggacgtga accagcacgt gaacaacgtg 6420
aagtacatcg gctggatcct ggagtccacc ccccccgagg tgctggagac ccaggagctg 6480
tgctccctga ccctggagta ccgccgcgag tgcggccgcg agtccgtgct ggagtccctg 6540
accgccatgg acccctccgg cggcggctac ggctcccagt tccagcacct gctgcgcctg 6600
gaggacggcg gcgagatcgt gaagggccgc accgagtggc gccccaagaa cggcgtgatc 6660
aacggcgtgg tgcccaccgg cgagtcctcc cccggcgact actccatgga ctacaaggac 6720
cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga caagtgaatc 6780
gatagatctc ttaaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 6840
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 6900
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 6960
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 7020
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 7080
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 7140
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag 7200
ctgtagaatt cggccgacag gacgcgcgtc aaaggtgctg gtcgtgtatg ccctggccgg 7260
caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg attttggcgt cttattttgg 7320
cgtggcaaac gctggcgccc gcgagccggg ccggcggcga tgcggtgccc cacggctgcc 7380
ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg gctttacgcg caaggtacag 7440
ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg tcctgctgaa gttcctccac 7500
cgcctcacca gcggacaaag caccggtgta tcaggtccgt gtcatccact ctaaagaact 7560
cgactacgac ctactgatgg ccctagattc ttcatcaaaa acgcctgaga cacttgccca 7620
ggattgaaac tccctgaagg gaccaccagg ggccctgagt tgttccttcc ccccgtggcg 7680
agctgccagc caggctgtac ctgtgatcga ggctggcggg aaaataggct tcgtgtgctc 7740
aggtcatggg aggtgcagga cagctcatga aacgccaaca atcgcacaat tcatgtcaag 7800
ctaatcagct atttcctctt cacgagctgt aattgtccca aaattctggt ctaccggggg 7860
tgatccttcg tgtacgggcc cttccctcaa ccctaggtat gcgcgcatgc ggtcgccgcg 7920
caactcgcgc gagggccgag ggtttgggac gggccgtccc gaaatgcagt tgcacccgga 7980
tgcgtggcac cttttttgcg ataatttatg caatggactg ctctgcaaaa ttctggctct 8040
gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc attcgtcctg atggggagct 8100
accgactacc ctaatatcag cccgactgcc tgacgccagc gtccactttt gtgcacacat 8160
tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt ccccagttac gctcacctgt 8220
ttcccgacct ccttactgtt ctgtcgacag agcgggccca caggccggtc gcagccacta 8280
gtatggtggc caccgccgcc tcctccgcct tcttccccct gccctccgcc gacacctcct 8340
cccgccccgg caagctgggc aacaagccct cctccctgtc ccccctgaag cccaagtcca 8400
cccccaacgg cggcctgcag gtgaaggcca acgcctccgc cccccccaag atcaacggct 8460
cccccgtggg cctgaagtcc ggcggcctga aggggcgcgc cacccaggag gacgcccact 8520
ccgccccccc cccccgcacc ttcatcaacc agctgcccga ctggtccatg ctgctggccg 8580
ccatcaccac cgtgttcctg gccgccgaga agcagtggat gatgctggac tggaagccca 8640
agcgccccga catgctggtg gaccccttcg gcctgggctc catcgtgcag gacggcctgg 8700
tgttccgcca gaacttctcc atccgctcct acgagatcgg cgccgaccgc accgcctcca 8760
tcgagaccgt gatgaaccac ctgcaggaga ccgccctgaa ccacgtgaag atcgccggcc 8820
tgtccaacga cggcttcggc cgcacccccg agatgtacaa gcgcgacctg atctgggtgg 8880
tggccaagat gcaggtgatg gtgaaccgct accccacctg gggcgacacc gtggaggtga 8940
acacctgggt ggccaagtcc ggcaagaacg gcatgcgccg cgactggctg atctccgact 9000
gcaacaccgg cgagatcctg acccgcgcct cctccgtgtg ggtgatgatg aaccagaaga 9060
cccgccgcct gtccaagatc cccgacgagg tgcgcaacga gatcgagccc cacttcgtgg 9120
actccccccc cgtgatcgag gacgacgacc gcaagctgcc caagctggac gagaagaccg 9180
ccgactccat ccgcaagggc ctgacccccc gctggaacga cctggacgtg aaccagcacg 9240
tgaacaacgt gaagtacatc ggctggatcc tggagtccac cccccccgag gtgctggaga 9300
cccaggagct gtgctccctg accctggagt accgccgcga gtgcggccgc gagtccgtgc 9360
tggagtccct gaccgccatg gacccctccg gcggcggcta cggctcccag ttccagcacc 9420
tgctgcgcct ggaggacggc ggcgagatcg tgaagggccg caccgagtgg cgccccaaga 9480
acggcgtgat caacggcgtg gtgcccaccg gcgagtcctc ccccggcgac tactccatgg 9540
actacaagga ccacgacggc gactacaagg accacgacat cgactacaag gacgacgacg 9600
acaagtgaat cgatagatct cttaaggcag cagcagctcg gatagtatcg acacactctg 9660
gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct gtgaatatcc 9720
ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag 9780
ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc ctcgtttcat 9840
atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca gcgctgctcc 9900
tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta ttctcctggt 9960
actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca 10020
caaatggaaa gctgtagagc tcggcggcgt gcgcaagatg aacccctttt gcatcccctt 10080
ctccatctcc aacatgggcg gcgcgatgct ggcgatggac atcggcttca tgggccccaa 10140
ctactccatc tccacggcct gcgcgacggg caactactgc atcctgggcg cggcggacca 10200
catccggcgc ggcgacgcaa acgtgatgct ggccggcggc gcggacgcgg ccatcatccc 10260
ctcgggcatc ggcggcttca tcgcgtgcaa ggcgctgagc aagcgcaacg acgagcccga 10320
gcgcgcgagc cggccctggg acgccgaccg cgacggcttc gtcatgggcg agggcgccgg 10380
cgtgctggtg ctggaggagc tggagcacgc caagcgccgc ggcgcgacca ttttggctga 10440
attagttggc ggcgcggcca cctcggacgc gcaccacatg accgagcccg acccgcaggg 10500
ccgcggcgtg cgcctctgcc tcgagcgcgc gctcgagcgc gcgcgcctcg cgcccgagcg 10560
cgtcggctac gtcaacgcgc acggcaccag cacgcccgcg ggcgacgtgg ccgagtaccg 10620
cgccatccgc gccgtcatcc cgcaggactc actacgcatc aactccacaa agtccatgat 10680
cgggcacctg ctcggcggcg ccggcgcggt cgaggccgtg gccgccatcc aggccctgcg 10740
caccggctgg ctccacccca acttgaacct cgagaacccc gcgcctggcg tcgaccccgt 10800
cgtgctcgtg gggaagagcc tctagatctt aaaatgaagt gaagttccta tactttctag 10860
agaataggaa cttctatagt gagtcgaata agggcgacac aaaatttatt ctaaatgcat 10920
aataaatact gataacatct tatagtttgt attatatttt gtattatcgt tgacatgtat 10980
aattttgata tcaaaaactg attttccctt tattattttc gagatttatt ttcttaattc 11040
tctttaacaa actagaaata ttgtatatac aaaaaatcat aaataataga tgaatagttt 11100
aattataggt gttcatcaat cgaaaaagca acgtatctta tttaaagtgc gttgcttttt 11160
tctcatttat aaggttaaat aattctcata tatcaagcaa agtgacaggc gcccttaaat 11220
attctgacaa atgctctttc cctaaactcc ccccataaaa aaacccgccg aagcgggttt 11280
ttacgttatt tgcggattaa cgattactcg ttatcagaac cgcccagggg gcccgagctt 11340
aagactggcc gtcgttttac aacacagaaa gagtttgtag aaacgcaaaa aggccatccg 11400
tcaggggcct tctgcttagt ttgatgcctg gcagttccct actctcgcct tccgcttcct 11460
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 11520
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 11580
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 11640
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 11700
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 11760
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 11820
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 11880
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 11940
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 12000
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtgggct aactacggct 12060
acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 12120
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 12180
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 12240
cggggtctga cgctcagtgg aacgacgcgc gcgtaactca cgttaaggga ttttggtcat 12300
gagcttgcgc cgtcccgtca agtcagcgta atgctctgct tt 12342
<210> 250
<211> 9362
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 250
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgggctgg tctgaatcct tcaggcgggt 1920
gttacccgag aaagaaaggg tgccgatttc aaagcagacc catgtgccgg gccctgtggc 1980
ctgtgttggc gcctatgtag tcaccccccc tcacccaatt gtcgccagtt tgcgcactcc 2040
ataaactcaa aacagcagct tctgagctgc gctgttcaag aacacctctg gggtttgctc 2100
acccgcgagg tcgacgccca gcatggctat caagacgaac aggcagcctg tggagaagcc 2160
tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 2220
gcttcgtagc agcatgtacc tggcctttga catcgcggtc atgtccctgc tctacgtcgc 2280
gtcgacgtac atcgaccctg caccggtgcc tacgtgggtc aagtacggca tcatgtggcc 2340
gctctactgg ttcttccagg tgtgtttgag ggttttggtt gcccgtattg aggtcctggt 2400
ggcgcgcatg gaggagaagg cgcctgtccc gctgaccccc ccggctaccc tcccggcacc 2460
ttccagggcg ccttcggcac gggtgtctgg gtgtgcgcgc acgagtgcgg ccaccaggcc 2520
ttttcctcca gccaggccat caacgacggc gtgggcctgg tgttccacag cctgctgctg 2580
gtgccctact actcctggaa gcactcgcac cgggtaccct ttcttgcgct atgacacttc 2640
cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat 2700
gcttcgaccc cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg 2760
agcgctgttt aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc 2820
atattcaaac acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac 2880
tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac tctagaatat 2940
caatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct 3000
ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga 3060
tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc 3120
agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg 3180
acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg 3240
gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca 3300
ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg 3360
agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc 3420
ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct 3480
cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct 3540
ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct 3600
accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct 3660
actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt 3720
acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg 3780
tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg 3840
ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca 3900
acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg 3960
ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg 4020
ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg 4080
tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca 4140
cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg 4200
accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc 4260
gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg 4320
tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc 4380
tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct 4440
acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc 4500
tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc 4560
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 4620
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 4680
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 4740
catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 4800
gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 4860
ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 4920
ggaagtagtg ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag 4980
gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct 5040
gacgaatgcg cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt 5100
tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag 5160
ggatatcgaa ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc 5220
ggcaggtcgt tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt 5280
ggcgtggcaa acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg 5340
ccggaatcca agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac 5400
agccgctcct gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc 5460
accgcctcac cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagaa 5520
ctcgactacg acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc 5580
caggattgaa actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg 5640
cgagctgcca gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc 5700
tcaggtcatg ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca 5760
agctaatcag ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg 5820
ggtgatcctt cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg 5880
cgcaactcgc gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg 5940
gatgcgtggc accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct 6000
ctgtcgccaa ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag 6060
ctaccgacta ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac 6120
attccattcg tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct 6180
gtttcccgac ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac 6240
tagtatggcc accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg 6300
ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccgc 6360
caccggcgag cagccctccg gcgtggcctc cctgcgcgag gccgacaagg agaagtccct 6420
gggcaaccgc ctgcgcctgg gctccctgac cgaggacggc ctgtcctaca aggagaagtt 6480
cgtgatccgc tgctacgagg tgggcatcaa caagaccgcc accatcgaga ccatcgccaa 6540
cctgctgcag gaggtgggcg gcaaccacgc ccagggcgtg ggcttctcca ccgacggctt 6600
cgccaccacc accaccatgc gcaagctgca cctgatctgg gtgaccgccc gcatgcacat 6660
cgagatctac cgctaccccg cctggtccga cgtgatcgag atcgagacct gggtgcaggg 6720
cgagggcaag gtgggcaccc gccgcgactg gatcctgaag gactacgcca acggcgaggt 6780
gatcggccgc gccacctcca agtgggtgat gatgaacgag gacacccgcc gcctgcagaa 6840
ggtgtccgac gacgtgcgcg aggagtacct ggtgttctgc ccccgcaccc tgcgcctggc 6900
cttccccgag gagaacaaca actccatgaa gaagatcccc aagctggagg accccgccga 6960
gtactcccgc ctgggcctgg tgccccgccg ctccgacctg gacatgaaca agcacgtgaa 7020
caacgtgacc tacatcggct gggccctgga gtccatcccc cccgagatca tcgacaccca 7080
cgagctgcag gccatcaccc tggactaccg ccgcgagtgc cagcgcgacg acatcgtgga 7140
ctccctgacc tcccgcgagc ccctgggcaa cgccgccggc gtgaagttca aggagatcaa 7200
cggctccgtg tcccccaaga aggacgagca ggacctgtcc cgcttcatgc acctgctgcg 7260
ctccgccggc tccggcctgg agatcaaccg ctgccgcacc gagtggcgca agaagcccgc 7320
caagcgcatg gactacaagg accacgacgg cgactacaag gaccacgaca tcgactacaa 7380
ggacgacgac gacaagtgaa tcgatagatc tcttaaggca gcagcagctc ggatagtatc 7440
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 7500
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 7560
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 7620
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 7680
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 7740
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 7800
ggatgggaac acaaatggaa agcttaatta agagctcccg ccaccactcc aacacggggt 7860
gcctggacaa ggacgaggtg tttgtgccgc cgcaccgcgc agtggcgcac gagggcctgg 7920
agtgggagga gtggctgccc atccgcatgg gcaaggtgct ggtcaccctg accctgggct 7980
ggccgctgta cctcatgttc aacgtcgcct cgcggccgta cccgcgcttc gccaaccact 8040
ttgacccgtg gtcgcccatc ttcagcaagc gcgagcgcat cgaggtggtc atctccgacc 8100
tggcgctggt ggcggtgctc agcgggctca gcgtgctggg ccgcaccatg ggctgggcct 8160
ggctggtcaa gacctacgtg gtgccctacc tgatcgtgaa catgtggctc gtgctcatca 8220
cgctgctcca gcacacgcac ccggcgctgc cgcactactt cgagaaggac tgggactggc 8280
tgcgcggcgc catggccacc gtggaccgct ccatgggccc gcccttcatg gacaacatcc 8340
tgcaccacat ctccgacacc cacgtgctgc accacctctt cagcaccatc ccgcactacc 8400
acgccgagga ggcctccgcc gccatcaggc ccatcctggg caagtactac cagtccgaca 8460
gccgctgggt cggccgcgcc ctgtgggagg actggcgcga ctgccgctac gtcgtcccgg 8520
acgcgcccga ggacgactcc gcgctctggt tccacaagtg agtgagtgag aagagcctct 8580
agagtcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 8640
aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 8700
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 8760
ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 8820
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 8880
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 8940
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 9000
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 9060
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 9120
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 9180
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 9240
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 9300
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 9360
gc 9362
<210> 251
<211> 612
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 251
gctcttcgga gtcactgtgc cactgagttc gactggtagc tgaatggagt cgctgctcca 60
ctaaacgaat tgtcagcacc gccagccggc cgaggacccg agtcatagcg agggtagtag 120
cgcgccatgg caccgaccag cctgcttgcc agtactggcg tctcttccgc ttctctgtgg 180
tcctctgcgc gctccagcgc gtgcgctttt ccggtggatc atgcggtccg tggcgcaccg 240
cagcggccgc tgcccatgca gcgccgctgc ttccgaacag tggcggtcag ggccgcaccc 300
gcggtagccg tccgtccgga acccgcccaa gagttttggg agcagcttga gccctgcaag 360
atggcggagg acaagcgcat cttcctggag gagcaccggt gcgtggaggt ccggggctga 420
ccggccgtcg cattcaacgt aatcaatcgc atgatgatca gaggacacga agtcttggtg 480
gcggtggcca gaaacactgt ccattgcaag ggcataggga tgcgttcctt cacctctcat 540
ttctcatttc tgaatccctc cctgctcact ctttctcctc ctccttcccg ttcacgcagc 600
attcggggta cc 612
<210> 252
<211> 528
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 252
gacagggtgg ttggctggat ggggaaacgc tggtcgcggg attcgatcct gctgcttata 60
tcctccctgg aagcacaccc acgactctga agaagaaaac gtgcacacac acaacccaac 120
cggccgaata tttgcttcct tatcccgggt ccaagagaga ctgcgatgcc cccctcaatc 180
agcatcctcc tccctgccgc ttcaatcttc cctgcttgcc tgcgcccgcg gtgcgccgtc 240
tgcccgccca gtcagtcact cctgcacagg ccccttgtgc gcagtgctcc tgtacccttt 300
accgctcctt ccattctgcg aggcccccta ttgaatgtat tcgttgcctg tgtggccaag 360
cgggctgctg ggcgcgccgc cgtcgggcag tgctcggcga ctttggcgga agccgattgt 420
tcttctgtaa gccacgcgct tgctgctttg ggaagagaag ggggggggta ctgaatggat 480
gaggaggaga aggaggggta ttggtattat ctgagttggg tgaagagc 528
<210> 253
<211> 3499
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 253
gctcttcgga gtcactgtgc cactgagttc gactggtagc tgaatggagt cgctgctcca 60
ctaaacgaat tgtcagcacc gccagccggc cgaggacccg agtcatagcg agggtagtag 120
cgcgccatgg caccgaccag cctgcttgcc agtactggcg tctcttccgc ttctctgtgg 180
tcctctgcgc gctccagcgc gtgcgctttt ccggtggatc atgcggtccg tggcgcaccg 240
cagcggccgc tgcccatgca gcgccgctgc ttccgaacag tggcggtcag ggccgcaccc 300
gcggtagccg tccgtccgga acccgcccaa gagttttggg agcagcttga gccctgcaag 360
atggcggagg acaagcgcat cttcctggag gagcaccggt gcgtggaggt ccggggctga 420
ccggccgtcg cattcaacgt aatcaatcgc atgatgatca gaggacacga agtcttggtg 480
gcggtggcca gaaacactgt ccattgcaag ggcataggga tgcgttcctt cacctctcat 540
ttctcatttc tgaatccctc cctgctcact ctttctcctc ctccttcccg ttcacgcagc 600
attcggggta ccctttcttg cgctatgaca cttccagcaa aaggtagggc gggctgcgag 660
acggcttccc ggcgctgcat gcaacaccga tgatgcttcg accccccgaa gctccttcgg 720
ggctgcatgg gcgctccgat gccgctccag ggcgagcgct gtttaaatag ccaggccccc 780
gattgcaaag acattatagc gagctaccaa agccatattc aaacacctag atcactacca 840
cttctacaca ggccactcga gcttgtgatc gcactccgct aagggggcgc ctcttcctct 900
tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct gcaggccttc ctgttcctgc 960
tggccggctt cgccgccaag atcagcgcct ccatgacgaa cgagacgtcc gaccgccccc 1020
tggtgcactt cacccccaac aagggctgga tgaacgaccc caacggcctg tggtacgacg 1080
agaaggacgc caagtggcac ctgtacttcc agtacaaccc gaacgacacc gtctggggga 1140
cgcccttgtt ctggggccac gccacgtccg acgacctgac caactgggag gaccagccca 1200
tcgccatcgc cccgaagcgc aacgactccg gcgccttctc cggctccatg gtggtggact 1260
acaacaacac ctccggcttc ttcaacgaca ccatcgaccc gcgccagcgc tgcgtggcca 1320
tctggaccta caacaccccg gagtccgagg agcagtacat ctcctacagc ctggacggcg 1380
gctacacctt caccgagtac cagaagaacc ccgtgctggc cgccaactcc acccagttcc 1440
gcgacccgaa ggtcttctgg tacgagccct cccagaagtg gatcatgacc gcggccaagt 1500
cccaggacta caagatcgag atctactcct ccgacgacct gaagtcctgg aagctggagt 1560
ccgcgttcgc caacgagggc ttcctcggct accagtacga gtgccccggc ctgatcgagg 1620
tccccaccga gcaggacccc agcaagtcct actgggtgat gttcatctcc atcaaccccg 1680
gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg cagcttcaac ggcacccact 1740
tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg caaggactac tacgccctgc 1800
agaccttctt caacaccgac ccgacctacg ggagcgccct gggcatcgcg tgggcctcca 1860
actgggagta ctccgccttc gtgcccacca acccctggcg ctcctccatg tccctcgtgc 1920
gcaagttctc cctcaacacc gagtaccagg ccaacccgga gacggagctg atcaacctga 1980
aggccgagcc gatcctgaac atcagcaacg ccggcccctg gagccggttc gccaccaaca 2040
ccacgttgac gaaggccaac agctacaacg tcgacctgtc caacagcacc ggcaccctgg 2100
agttcgagct ggtgtacgcc gtcaacacca cccagacgat ctccaagtcc gtgttcgcgg 2160
acctctccct ctggttcaag ggcctggagg accccgagga gtacctccgc atgggcttcg 2220
aggtgtccgc gtcctccttc ttcctggacc gcgggaacag caaggtgaag ttcgtgaagg 2280
agaaccccta cttcaccaac cgcatgagcg tgaacaacca gcccttcaag agcgagaacg 2340
acctgtccta ctacaaggtg tacggcttgc tggaccagaa catcctggag ctgtacttca 2400
acgacggcga cgtcgtgtcc accaacacct acttcatgac caccgggaac gccctgggct 2460
ccgtgaacat gacgacgggg gtggacaacc tgttctacat cgacaagttc caggtgcgcg 2520
aggtcaagtg acaattggca gcagcagctc ggatagtatc gacacactct ggacgctggt 2580
cgtgtgatgg actgttgccg ccacacttgc tgccttgacc tgtgaatatc cctgccgctt 2640
ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc gcttttgcga gttgctagct 2700
gcttgtgcta tttgcgaata ccacccccag catccccttc cctcgtttca tatcgcttgc 2760
atcccaaccg caacttatct acgctgtcct gctatccctc agcgctgctc ctgctcctgc 2820
tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt attctcctgg tactgcaacc 2880
tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg ggatgggaac acaaatggag 2940
gatcgtagag ctcactagta tcgatttcga agacagggtg gttggctgga tggggaaacg 3000
ctggtcgcgg gattcgatcc tgctgcttat atcctccctg gaagcacacc cacgactctg 3060
aagaagaaaa cgtgcacaca cacaacccaa ccggccgaat atttgcttcc ttatcccggg 3120
tccaagagag actgcgatgc ccccctcaat cagcatcctc ctccctgccg cttcaatctt 3180
ccctgcttgc ctgcgcccgc ggtgcgccgt ctgcccgccc agtcagtcac tcctgcacag 3240
gccccttgtg cgcagtgctc ctgtaccctt taccgctcct tccattctgc gaggccccct 3300
attgaatgta ttcgttgcct gtgtggccaa gcgggctgct gggcgcgccg ccgtcgggca 3360
gtgctcggcg actttggcgg aagccgattg ttcttctgta agccacgcgc ttgctgcttt 3420
gggaagagaa gggggggggt actgaatgga tgaggaggag aaggaggggt attggtatta 3480
tctgagttgg gtgaagagc 3499
<210> 254
<211> 6514
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 254
gctcttcgga gtcactgtgc cactgagttc gactggtagc tgaatggagt cgctgctcca 60
ctaaacgaat tgtcagcacc gccagccggc cgaggacccg agtcatagcg agggtagtag 120
cgcgccatgg caccgaccag cctgcttgcc agtactggcg tctcttccgc ttctctgtgg 180
tcctctgcgc gctccagcgc gtgcgctttt ccggtggatc atgcggtccg tggcgcaccg 240
cagcggccgc tgcccatgca gcgccgctgc ttccgaacag tggcggtcag ggccgcaccc 300
gcggtagccg tccgtccgga acccgcccaa gagttttggg agcagcttga gccctgcaag 360
atggcggagg acaagcgcat cttcctggag gagcaccggt gcgtggaggt ccggggctga 420
ccggccgtcg cattcaacgt aatcaatcgc atgatgatca gaggacacga agtcttggtg 480
gcggtggcca gaaacactgt ccattgcaag ggcataggga tgcgttcctt cacctctcat 540
ttctcatttc tgaatccctc cctgctcact ctttctcctc ctccttcccg ttcacgcagc 600
attcggggta ccctttcttg cgctatgaca cttccagcaa aaggtagggc gggctgcgag 660
acggcttccc ggcgctgcat gcaacaccga tgatgcttcg accccccgaa gctccttcgg 720
ggctgcatgg gcgctccgat gccgctccag ggcgagcgct gtttaaatag ccaggccccc 780
gattgcaaag acattatagc gagctaccaa agccatattc aaacacctag atcactacca 840
cttctacaca ggccactcga gcttgtgatc gcactccgct aagggggcgc ctcttcctct 900
tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct gcaggccttc ctgttcctgc 960
tggccggctt cgccgccaag atcagcgcct ccatgacgaa cgagacgtcc gaccgccccc 1020
tggtgcactt cacccccaac aagggctgga tgaacgaccc caacggcctg tggtacgacg 1080
agaaggacgc caagtggcac ctgtacttcc agtacaaccc gaacgacacc gtctggggga 1140
cgcccttgtt ctggggccac gccacgtccg acgacctgac caactgggag gaccagccca 1200
tcgccatcgc cccgaagcgc aacgactccg gcgccttctc cggctccatg gtggtggact 1260
acaacaacac ctccggcttc ttcaacgaca ccatcgaccc gcgccagcgc tgcgtggcca 1320
tctggaccta caacaccccg gagtccgagg agcagtacat ctcctacagc ctggacggcg 1380
gctacacctt caccgagtac cagaagaacc ccgtgctggc cgccaactcc acccagttcc 1440
gcgacccgaa ggtcttctgg tacgagccct cccagaagtg gatcatgacc gcggccaagt 1500
cccaggacta caagatcgag atctactcct ccgacgacct gaagtcctgg aagctggagt 1560
ccgcgttcgc caacgagggc ttcctcggct accagtacga gtgccccggc ctgatcgagg 1620
tccccaccga gcaggacccc agcaagtcct actgggtgat gttcatctcc atcaaccccg 1680
gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg cagcttcaac ggcacccact 1740
tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg caaggactac tacgccctgc 1800
agaccttctt caacaccgac ccgacctacg ggagcgccct gggcatcgcg tgggcctcca 1860
actgggagta ctccgccttc gtgcccacca acccctggcg ctcctccatg tccctcgtgc 1920
gcaagttctc cctcaacacc gagtaccagg ccaacccgga gacggagctg atcaacctga 1980
aggccgagcc gatcctgaac atcagcaacg ccggcccctg gagccggttc gccaccaaca 2040
ccacgttgac gaaggccaac agctacaacg tcgacctgtc caacagcacc ggcaccctgg 2100
agttcgagct ggtgtacgcc gtcaacacca cccagacgat ctccaagtcc gtgttcgcgg 2160
acctctccct ctggttcaag ggcctggagg accccgagga gtacctccgc atgggcttcg 2220
aggtgtccgc gtcctccttc ttcctggacc gcgggaacag caaggtgaag ttcgtgaagg 2280
agaaccccta cttcaccaac cgcatgagcg tgaacaacca gcccttcaag agcgagaacg 2340
acctgtccta ctacaaggtg tacggcttgc tggaccagaa catcctggag ctgtacttca 2400
acgacggcga cgtcgtgtcc accaacacct acttcatgac caccgggaac gccctgggct 2460
ccgtgaacat gacgacgggg gtggacaacc tgttctacat cgacaagttc caggtgcgcg 2520
aggtcaagtg acaattggca gcagcagctc ggatagtatc gacacactct ggacgctggt 2580
cgtgtgatgg actgttgccg ccacacttgc tgccttgacc tgtgaatatc cctgccgctt 2640
ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc gcttttgcga gttgctagct 2700
gcttgtgcta tttgcgaata ccacccccag catccccttc cctcgtttca tatcgcttgc 2760
atcccaaccg caacttatct acgctgtcct gctatccctc agcgctgctc ctgctcctgc 2820
tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt attctcctgg tactgcaacc 2880
tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg ggatgggaac acaaatggag 2940
gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa ggtctcgcct ctgtcgcacc 3000
tcagcgcggc atacaccaca ataaccacct gacgaatgcg cttggttctt cgtccattag 3060
cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg gcaggtgaca atgatcggtg 3120
gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa ttcggccgac aggacgcgcg 3180
tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt tgctgctgct ggttagtgat 3240
tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa acgctggcgc ccgcgagccg 3300
ggccggcggc gatgcggtgc cccacggctg ccggaatcca agggaggcaa gagcgcccgg 3360
gtcagttgaa gggctttacg cgcaaggtac agccgctcct gcaaggctgc gtggtggaat 3420
tggacgtgca ggtcctgctg aagttcctcc accgcctcac cagcggacaa agcaccggtg 3480
tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg acctactgat ggccctagat 3540
tcttcatcaa aaacgcctga gacacttgcc caggattgaa actccctgaa gggaccacca 3600
ggggccctga gttgttcctt ccccccgtgg cgagctgcca gccaggctgt acctgtgatc 3660
gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg ggaggtgcag gacagctcat 3720
gaaacgccaa caatcgcaca attcatgtca agctaatcag ctatttcctc ttcacgagct 3780
gtaattgtcc caaaattctg gtctaccggg ggtgatcctt cgtgtacggg cccttccctc 3840
aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc gcgagggccg agggtttggg 3900
acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc accttttttg cgataattta 3960
tgcaatggac tgctctgcaa aattctggct ctgtcgccaa ccctaggatc agcggcgtag 4020
gatttcgtaa tcattcgtcc tgatggggag ctaccgacta ccctaatatc agcccgactg 4080
cctgacgcca gcgtccactt ttgtgcacac attccattcg tgcccaagac atttcattgt 4140
ggtgcgaagc gtccccagtt acgctcacct gtttcccgac ctccttactg ttctgtcgac 4200
agagcgggcc cacaggccgg tcgcagccac tagtatggtg gtggccgccg ccgccagcag 4260
cgccttcttc cccgtgcccg ccccccgccc cacccccaag cccggcaagt tcggcaactg 4320
gcccagcagc ctgagccagc ccttcaagcc caagagcaac cccaacggcc gcttccaggt 4380
gaaggccaac gtgagccccc acgggcgcgc ccccaaggcc aacggcagcg ccgtgagcct 4440
gaagtccggc agcctgaaca ccctggagga cccccccagc agcccccccc cccgcacctt 4500
cctgaaccag ctgcccgact ggagccgcct gcgcaccgcc atcaccaccg tgttcgtggc 4560
cgccgagaag cagttcaccc gcctggaccg caagagcaag cgccccgaca tgctggtgga 4620
ctggttcggc agcgagacca tcgtgcagga cggcctggtg ttccgcgagc gcttcagcat 4680
ccgcagctac gagatcggcg ccgaccgcac cgccagcatc gagaccctga tgaaccacct 4740
gcaggacacc agcctgaacc actgcaagag cgtgggcctg ctgaacgacg gcttcggccg 4800
cacccccgag atgtgcaccc gcgacctgat ctgggtgctg accaagatgc agatcgtggt 4860
gaaccgctac cccacctggg gcgacaccgt ggagatcaac agctggttca gccagagcgg 4920
caagatcggc atgggccgcg agtggctgat cagcgactgc aacaccggcg agatcctggt 4980
gcgcgccacc agcgcctggg ccatgatgaa ccagaagacc cgccgcttca gcaagctgcc 5040
ctgcgaggtg cgccaggaga tcgcccccca cttcgtggac gccccccccg tgatcgagga 5100
caacgaccgc aagctgcaca agttcgacgt gaagaccggc gacagcatct gcaagggcct 5160
gacccccggc tggaacgact tcgacgtgaa ccagcacgtg agcaacgtga agtacatcgg 5220
ctggattctg gagagcatgc ccaccgaggt gctggagacc caggagctgt gcagcctgac 5280
cctggagtac cgccgcgagt gcggccgcga gagcgtggtg gagagcgtga ccagcatgaa 5340
ccccagcaag gtgggcgacc gcagccagta ccagcacctg ctgcgcctgg aggacggcgc 5400
cgacatcatg aagggccgca ccgagtggcg ccccaagaac gccggcacca accgcgccat 5460
cagcacctga ttaattaact cgaggcagca gcagctcgga tagtatcgac acactctgga 5520
cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt gaatatccct 5580
gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt 5640
gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct cgtttcatat 5700
cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc gctgctcctg 5760
ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt ctcctggtac 5820
tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga tgggaacaca 5880
aatggaaagc ttgagctctt gttttccaga aggagttgct ccttgagcct ttcattctca 5940
gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaagaca gggtggttgg 6000
ctggatgggg aaacgctggt cgcgggattc gatcctgctg cttatatcct ccctggaagc 6060
acacccacga ctctgaagaa gaaaacgtgc acacacacaa cccaaccggc cgaatatttg 6120
cttccttatc ccgggtccaa gagagactgc gatgcccccc tcaatcagca tcctcctccc 6180
tgccgcttca atcttccctg cttgcctgcg cccgcggtgc gccgtctgcc cgcccagtca 6240
gtcactcctg cacaggcccc ttgtgcgcag tgctcctgta ccctttaccg ctccttccat 6300
tctgcgaggc cccctattga atgtattcgt tgcctgtgtg gccaagcggg ctgctgggcg 6360
cgccgccgtc gggcagtgct cggcgacttt ggcggaagcc gattgttctt ctgtaagcca 6420
cgcgcttgct gctttgggaa gagaaggggg ggggtactga atggatgagg aggagaagga 6480
ggggtattgg tattatctga gttgggtgaa gagc 6514
<210> 255
<211> 767
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 255
atggcaccga ccagcctgct tgccagtact ggcgtctctt ccgcttctct gtggtcctct 60
gcgcgctcca gcgcgtgcgc ttttccggtg gatcatgcgg tccgtggcgc accgcagcgg 120
ccgctgccca tgcagcgccg ctgcttccga acagtggcgg tcagggccgc acccgcggta 180
gccgtccgtc cggaacccgc ccaagagttt tgggagcagc ttgagccctg caagatggcg 240
gaggacaagc gcatcttcct ggaggagcac cggtgcgtgg aggtccgggg ctgaccggcc 300
gtcgcattca acgtaatcaa tcgcatgatg atcagaggac acgaagtctt ggtggcggtg 360
gccagaaaca ctgtccattg caagggcata gggatgcgtt ccttcacctc tcatttctca 420
tttctgaatc cctccctgct cactctttct cctcctcctt cccgttcacg cagcattcgg 480
ggcaacgagg tgggcccgtg ctcctccagg aagatgcgct tgtcctccgc catcttgcag 540
ggctcaagct gctcccaaaa ctcttgggcg ggttccggac ggacggctac cgcgggtgcg 600
gccctgaccg ccactgttcg gaagcagcgg cgctgcatgg gcagcggccg ctgcggtgcg 660
ccacggaccg catgatccac cggaaaagcg cacgcgctgg agcgcgcaga ggaccacaga 720
gaagcggaag agacgccagt actggcaagc aggctggtcg gtgccat 767
<210> 256
<211> 9426
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 256
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940
gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000
cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060
caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120
gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180
caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240
cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300
gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360
ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420
cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480
gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540
gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600
gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660
gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720
cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780
caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840
gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900
ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960
gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020
gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080
caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140
ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200
gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260
caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320
gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380
catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440
caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500
cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920
ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980
ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040
cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100
gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160
ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220
tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280
acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340
agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400
gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460
cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg 5520
acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580
actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640
gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700
ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760
ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820
cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880
gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940
accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000
ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060
ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120
tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180
ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggtg 6240
gtggccgccg ccgccagcag cgccttcttc cccgtgcccg ccccccgccc cacccccaag 6300
cccggcaagt tcggcaactg gcccagcagc ctgagccagc ccttcaagcc caagagcaac 6360
cccaacggcc gcttccaggt gaaggccaac gtgagccccc acgggcgcgc ccccaaggcc 6420
aacggcagcg ccgtgagcct gaagtccggc agcctgaaca ccctggagga cccccccagc 6480
agcccccccc cccgcacctt cctgaaccag ctgcccgact ggagccgcct gcgcaccgcc 6540
atcaccaccg tgttcgtggc cgccgagaag cagttcaccc gcctggaccg caagagcaag 6600
cgccccgaca tgctggtgga ctggttcggc agcgagacca tcgtgcagga cggcctggtg 6660
ttccgcgagc gcttcagcat ccgcagctac gagatcggcg ccgaccgcac cgccagcatc 6720
gagaccctga tgaaccacct gcaggacacc agcctgaacc actgcaagag cgtgggcctg 6780
ctgaacgacg gcttcggccg cacccccgag atgtgcaccc gcgacctgat ctgggtgctg 6840
accaagatgc agatcgtggt gaaccgctac cccacctggg gcgacaccgt ggagatcaac 6900
agctggttca gccagagcgg caagatcggc atgggccgcg agtggctgat cagcgactgc 6960
aacaccggcg agatcctggt gcgcgccacc agcgcctggg ccatgatgaa ccagaagacc 7020
cgccgcttca gcaagctgcc ctgcgaggtg cgccaggaga tcgcccccca cttcgtggac 7080
gccccccccg tgatcgagga caacgaccgc aagctgcaca agttcgacgt gaagaccggc 7140
gacagcatct gcaagggcct gacccccggc tggaacgact tcgacgtgaa ccagcacgtg 7200
agcaacgtga agtacatcgg ctggattctg gagagcatgc ccaccgaggt gctggagacc 7260
caggagctgt gcagcctgac cctggagtac cgccgcgagt gcggccgcga gagcgtggtg 7320
gagagcgtga ccagcatgaa ccccagcaag gtgggcgacc gcagccagta ccagcacctg 7380
ctgcgcctgg aggacggcgc cgacatcatg aagggccgca ccgagtggcg ccccaagaac 7440
gccggcacca accgcgccat cagcacctga ttaattaact cgaggcagca gcagctcgga 7500
tagtatcgac acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc 7560
cttgacctgt gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg 7620
tgtacgcgct tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat 7680
ccccttccct cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct 7740
atccctcagc gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc 7800
cgcctgtatt ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga 7860
agtagtggga tgggaacaca aatggaaagc ttgagctctt gttttccaga aggagttgct 7920
ccttgagcct ttcattctca gcctcgataa cctccaaagc cgctctaatt gtggaggggg 7980
ttcgaattta aaagcttgga atgttggttc gtgcgtctgg aacaagccca gacttgttgc 8040
tcactgggaa aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg tacctctgct 8100
ttcgcgcaat ctgccctgtt gaaatcgcca ccacattcat attgtgacgc ttgagcagtc 8160
tgtaattgcc tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc caggcatgtc 8220
gcgggcgagg acacccgcca ctcgtacagc agaccattat gctacctcac aatagttcat 8280
aacagtgacc atatttctcg aagctcccca acgagcacct ccatgctctg agtggccacc 8340
ccccggccct ggtgcttgcg gagggcaggt caaccggcat ggggctaccg aaatccccga 8400
ccggatccca ccacccccgc gatgggaaga atctctcccc gggatgtggg cccaccacca 8460
gcacaacctg ctggcccagg cgagcgtcaa accataccac acaaatatcc ttggcatcgg 8520
ccctgaattc cttctgccgc tctgctaccc ggtgcttctg tccgaagcag gggttgctag 8580
ggatcgctcc gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag cttgaagagc 8640
ctctagagtc gacctgcagg catgcaagct tggcgtaatc atggtcatag ctgtttcctg 8700
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 8760
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 8820
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 8880
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 8940
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 9000
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 9060
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 9120
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 9180
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 9240
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 9300
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 9360
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 9420
tatcgc 9426
Claims (114)
- 트리아실글리세라이드를 포함하는 천연 오일 또는 상기 천연 오일로부터 생성된 생성물의 제조 방법으로서, 상기 방법은,
프로토테카 (Prototheca) 또는 클로렐라 (Chlorella) 속의 재조합 미세 조류의 세포를 배양하는 단계로서, 상기 세포는 β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 활성을 감소시키거나 제거하도록 작동가능한 재조합 핵산을 포함하며, 여기서 임의로 세포는 외인성 아실-ACP 티오에스테라제를 발현하도록 작동 가능한 재조합 핵산을 포함하는 단계; 및
세포로부터 천연 오일을 회수하는 단계를 포함하고, 임의로 식품, 연료 또는 화학 생성물을 생성하기 위하여 천연 오일을 추가로 가공하는 단계를 포함하며, 천연 오일은 재조합 핵산으로 인하여 변형된 지방산 프로필을 갖는 방법. - 제1항에 있어서, β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현의 감소 또는 제거는 β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자를 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자로의 치환, 또는 중단에 의한 것인 방법.
- 제1항 또는 제2항에 있어서, 재조합 세포는 올리에이트 12-하이드록실라제를 암호화하는 외인성 유전자를 추가로 포함하여, 리시놀레산을 합성하는 방법.
- 제1항 또는 제2항에 있어서, 재조합 세포는 KASI 유전자에 의해 암호화되는 β-케토아실-ACP 합성 효소 I 또는 KASII 유전자에 의해 암호화되는 β-케토아실-ACP 합성 효소 II의 발현을 감소시키거나 제거하도록, 그리고 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함하는 방법.
- 제1항 또는 제2항에 있어서, 재조합 세포는 하나 이상의 지방산 불포화 효소 (FAD) 유전자에 의해 암호화되는 FAD의 발현을 감소시키거나 제거하도록, 그리고 활성 스테아로일 ACP 불포화 효소를 암호화하는 스테아로일-ACP 불포화 효소 외인성 유전자의 생성물을 발현하도록 작동 가능한 핵산을 포함하는 방법.
- 제1항 또는 제2항에 있어서, 미세 조류는 프로토테카 속으로부터 선택되는 방법.
- 제6항에 있어서, 미세 조류는 프로토테카 윅커해미, 프로토테카 스태그노라, 프로토테카 포르토리센시스, 프로토테카 모리포르미스 또는 프로토테카 조프피로부터 선택되는 방법.
- 제7항에 있어서, 미세 조류는 프로토테카 모리포르미스인 방법.
- 제1항 또는 제2항에 있어서, 미세 조류는 클로렐라 속으로부터 선택되는 방법.
- 제9항에 있어서, 미세 조류는 클로렐라 케슬러리, 클로렐라 루테오비리디스, 클로렐라 프로토테코이데스 또는 클로렐라 불가리스로부터 선택되는 방법.
- 제10항에 있어서, 미세 조류는 클로렐라 프로토테코이데스인 방법.
- 프로토테카 또는 클로렐라 속의 재조합 미세 조류 세포로서, 상기 세포는 β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 활성을 감소시키거나 제거하도록 작동 가능한 재조합 핵산을 포함하고, 여기서 임의로 세포는 외인성 아실-ACP 티오에스테라제를 발현하도록 작동 가능한 재조합 핵산을 포함하고, 상기 세포는 비재조합 미세 조류 세포의 지방산 프로필과 비교했을 때 재조합 핵산으로 인하여 변형된 지방산 프로필을 갖는 세포.
- 제12항에 있어서, β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자에 의해 암호화되는 효소의 발현의 감소 또는 제거는 β-케토아실-ACP 합성 효소 I 또는 β-케토아실-ACP 합성 효소 II를 암호화하는 하나 이상의 유전자를 활성 β-케토아실-ACP 합성 효소 I, β-케토아실-ACP 합성 효소 II, 스테아로일 ACP 불포화 효소, 지방산 불포화 효소 또는 아실-ACP 티오에스테라제를 암호화하는 하나 이상의 유전자로의 치환, 또는 중단에 의한 것인 세포.
- 제12항 또는 제13항에 있어서, 미세 조류는 프로토테카 속으로부터 선택되는 세포.
- 제14항에 있어서, 미세 조류는 프로토테카 윅커해미, 프로토테카 스태그노라, 프로토테카 포르토리센시스, 프로토테카 모리포르미스 또는 프로토테카 조프피로부터 선택되는 세포.
- 제15항에 있어서, 미세 조류는 프로토테카 모리포르미스인 세포.
- 제12항에 있어서, 미세 조류는 클로렐라 속으로부터 선택되는 세포.
- 제12항에 있어서, 미세 조류는 클로렐라 케슬러리, 클로렐라 루테오비리디스, 클로렐라 프로토테코이데스 또는 클로렐라 불가리스로부터 선택되는 세포.
- 제18항에 있어서, 미세 조류는 클로렐라 프로토테코이데스인 세포.
- 제12항 또는 제13항의 세포로부터 생산된 오일 함유 생성물 또는 천연 오일.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161438969P | 2011-02-02 | 2011-02-02 | |
US61/438,969 | 2011-02-02 | ||
US201161476691P | 2011-04-18 | 2011-04-18 | |
US61/476,691 | 2011-04-18 | ||
US201161484458P | 2011-05-10 | 2011-05-10 | |
US61/484,458 | 2011-05-10 | ||
US201161548616P | 2011-10-18 | 2011-10-18 | |
US61/548,616 | 2011-10-18 | ||
PCT/US2012/023696 WO2012106560A1 (en) | 2011-02-02 | 2012-02-02 | Tailored oils produced from recombinant oleaginous microorganisms |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197008914A Division KR102117225B1 (ko) | 2011-02-02 | 2012-02-02 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140114274A KR20140114274A (ko) | 2014-09-26 |
KR101964965B1 true KR101964965B1 (ko) | 2019-04-03 |
Family
ID=46601075
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197008914A KR102117225B1 (ko) | 2011-02-02 | 2012-02-02 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
KR1020137023181A KR101964965B1 (ko) | 2011-02-02 | 2012-02-02 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197008914A KR102117225B1 (ko) | 2011-02-02 | 2012-02-02 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
Country Status (11)
Country | Link |
---|---|
US (5) | US9249436B2 (ko) |
EP (2) | EP3643774A1 (ko) |
JP (3) | JP6071904B2 (ko) |
KR (2) | KR102117225B1 (ko) |
CN (2) | CN110066836A (ko) |
AU (3) | AU2012212079B2 (ko) |
BR (1) | BR112013019699A2 (ko) |
CA (1) | CA2825691C (ko) |
MX (2) | MX344012B (ko) |
SG (1) | SG192594A1 (ko) |
WO (1) | WO2012106560A1 (ko) |
Families Citing this family (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG182157A1 (en) | 2007-06-01 | 2012-07-30 | Solazyme Inc | Production of oil in microorganisms |
CN102712858B (zh) | 2008-11-28 | 2015-08-12 | 索拉兹米公司 | 在重组异养型微生物中制备特制油 |
CN103124499B (zh) | 2010-05-28 | 2016-09-28 | 泰拉瑞亚控股公司 | 包含特制油的食品组合物 |
MX354145B (es) | 2010-11-03 | 2018-02-14 | Terravia Holdings Inc | Aceites microbianos con puntos de fluidez reducidos, fluidos dielectricos producidos a partir de estos y metodos relacionados. |
KR102117225B1 (ko) | 2011-02-02 | 2020-06-02 | 테라비아 홀딩스 인코포레이티드 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
WO2012125959A2 (en) | 2011-03-17 | 2012-09-20 | Solazyme, Inc. | Pyrolysis oil and other combustible compositions from microbial biomass |
AU2012253803A1 (en) | 2011-05-06 | 2013-12-05 | Terravia Holdings, Inc. | Genetically engineered microorganisms that metabolize xylose |
US9328351B2 (en) | 2011-11-28 | 2016-05-03 | Solazyme, Inc. | Genetically engineered microbial strains including Prototheca lipid pathway genes |
US9163267B2 (en) * | 2012-04-11 | 2015-10-20 | REG Life Sciences, LLC | Metathesis transformations of microbially-produced fatty acids and fatty acid derivatives |
US9719114B2 (en) | 2012-04-18 | 2017-08-01 | Terravia Holdings, Inc. | Tailored oils |
CA2870364A1 (en) | 2012-04-18 | 2013-10-24 | Solazyme, Inc. | Recombinant microbes with modified fatty acid synthetic pathway enzymes and uses thereof |
US20130316364A1 (en) | 2012-05-23 | 2013-11-28 | Lanzatech New Zealand Limited | Selection Method and Recombinant Microorganisms and uses Therefor |
EP2929032A4 (en) | 2012-12-07 | 2016-04-06 | Solazyme Inc | GENETICALLY MODIFIED MICROBIAL STRAINS WITH CHLORELLA PROTOTHECOIDES LIPID SIGNAL PROGRAMS |
US10098371B2 (en) | 2013-01-28 | 2018-10-16 | Solazyme Roquette Nutritionals, LLC | Microalgal flour |
US9816079B2 (en) | 2013-01-29 | 2017-11-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
US9567615B2 (en) * | 2013-01-29 | 2017-02-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
WO2014138590A2 (en) | 2013-03-07 | 2014-09-12 | Ls9, Inc. | Downstream processing of fatty alcohol compositions produced by recombinant host cells |
BR112015021312A2 (pt) * | 2013-03-08 | 2017-07-18 | Dsm Ip Assets Bv | micro-organismos com perfis de ácido graxo alterado para produção de materiais renováveis e biocombustível |
BR112015021638A2 (pt) | 2013-03-08 | 2017-07-18 | Solazyme Inc | fluido de perfuração, método para perfuração de um orifício de perfuração, lubrificante, fluido de metalurgia, e, máquina de perfuração de microtúneis |
WO2014152830A1 (en) | 2013-03-14 | 2014-09-25 | The University Of Wyoming Research Corporation | Methods and systems for biological coal-to-biofuels and bioproducts |
US10376837B2 (en) | 2013-03-14 | 2019-08-13 | The University Of Wyoming Research Corporation | Conversion of carbon dioxide utilizing chemoautotrophic microorganisms systems and methods |
WO2014151904A1 (en) | 2013-03-15 | 2014-09-25 | Solazyme, Inc. | Thioesterases and cells for production of tailored oils |
US9290749B2 (en) | 2013-03-15 | 2016-03-22 | Solazyme, Inc. | Thioesterases and cells for production of tailored oils |
US9783836B2 (en) | 2013-03-15 | 2017-10-10 | Terravia Holdings, Inc. | Thioesterases and cells for production of tailored oils |
JP2014212732A (ja) * | 2013-04-25 | 2014-11-17 | 旭硝子株式会社 | リシノール酸産生酵母 |
US9249252B2 (en) | 2013-04-26 | 2016-02-02 | Solazyme, Inc. | Low polyunsaturated fatty acid oils and uses thereof |
WO2014201474A1 (en) | 2013-06-14 | 2014-12-18 | Ls9, Inc. | Methods of producing omega-hydroxylated fatty acid derivatives |
US10087453B2 (en) * | 2013-06-25 | 2018-10-02 | Cellectis | Modified diatoms for biofuel production |
FR3009619B1 (fr) | 2013-08-07 | 2017-12-29 | Roquette Freres | Compositions de biomasse de microalgues riches en proteines de qualite sensorielle optimisee |
SG10201802834YA (en) | 2013-10-04 | 2018-05-30 | Terravia Holdings Inc | Tailored oils |
US10687218B2 (en) | 2013-12-03 | 2020-06-16 | Qualcomm Incorporated | Power metric optimization and uplink DM-RS design for LTE/LTE-A uplink transmissions in unlicensed spectrum |
US10066248B2 (en) | 2014-03-03 | 2018-09-04 | Kao Corporation | Method of producing lipid by using β-ketoacyl-ACP synthase |
US9394550B2 (en) | 2014-03-28 | 2016-07-19 | Terravia Holdings, Inc. | Lauric ester compositions |
US20150305362A1 (en) | 2014-04-23 | 2015-10-29 | Solazyme, Inc. | Food-Related Uses of High-Stability Oil |
US11441130B2 (en) | 2014-06-16 | 2022-09-13 | Genomatica, Inc. | Omega-hydroxylase-related fusion polypeptides with improved properties |
US20160002521A1 (en) | 2014-07-03 | 2016-01-07 | Solazyme, Inc. | Lubricants and wellbore fluids |
EP3167053B1 (en) | 2014-07-10 | 2019-10-09 | Corbion Biotech, Inc. | Novel ketoacyl acp synthase genes and uses thereof |
BR112017001404A2 (pt) | 2014-07-24 | 2017-11-21 | Terravia Holdings Inc | tioesterases variantes e métodos de utilização |
JP6573400B2 (ja) * | 2014-09-08 | 2019-09-11 | 公立大学法人兵庫県立大学 | 珪藻の新規形質転換ベクターおよびその含有する新規プロモーター配列 |
CN107208103A (zh) | 2014-09-18 | 2017-09-26 | 泰拉瑞亚控股公司 | 酰基‑acp硫酯酶及其突变体 |
EP3237526B1 (en) | 2014-12-23 | 2022-05-18 | Bridgestone Americas Tire Operations, LLC | Tire comprising an oil-containing rubber composition |
CN107889502A (zh) | 2015-03-31 | 2018-04-06 | 柯碧恩生物技术公司 | 适应于异养培养条件的微藻 |
JP2018512851A (ja) * | 2015-04-06 | 2018-05-24 | テラヴィア ホールディングス, インコーポレイテッド | Lpaatアブレーションを有する油産生微細藻類 |
WO2016174119A1 (en) * | 2015-04-28 | 2016-11-03 | Bayer Cropscience Nv | Brassica plants with modified seed oil composition |
JP6587468B2 (ja) | 2015-09-11 | 2019-10-09 | 花王株式会社 | 脂質の製造方法 |
WO2017101987A1 (en) | 2015-12-15 | 2017-06-22 | REG Life Sciences, LLC | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
US10650621B1 (en) | 2016-09-13 | 2020-05-12 | Iocurrents, Inc. | Interfacing with a vehicular controller area network |
US20180142218A1 (en) | 2016-10-05 | 2018-05-24 | Terravia Holdings, Inc. | Novel acyltransferases, variant thioesterases, and uses thereof |
US10704066B2 (en) | 2017-05-05 | 2020-07-07 | Purissima, Inc. | Neurotransmitters and methods of making the same |
US11618890B2 (en) | 2018-08-22 | 2023-04-04 | Corbion Biotech, Inc. | Beta-ketoacyl-ACP synthase II variants |
WO2020047216A1 (en) | 2018-08-30 | 2020-03-05 | Checkerspot, Inc. | Hydroformylated triglycerides and uses thereof |
CN110885754B (zh) * | 2018-09-07 | 2021-11-12 | 中国石油化工股份有限公司 | 一种利用表面活性剂防治微藻培养过程中生物污染的方法 |
CN111436499B (zh) * | 2018-12-29 | 2023-03-24 | 丰益(上海)生物技术研发中心有限公司 | 油脂组合物及其制备方法和用途 |
WO2020167745A1 (en) | 2019-02-11 | 2020-08-20 | Checkerspot, Inc. | Triglyceride oil compositions |
CN110184084A (zh) * | 2019-05-27 | 2019-08-30 | 江苏大学 | 一种微藻与白土油热解制备生物油的方法及其系统 |
WO2021127181A1 (en) | 2019-12-18 | 2021-06-24 | Checkerspot, Inc. | Uses of microbially derived materials in polymer applications |
MX2022009806A (es) * | 2020-02-10 | 2022-10-03 | C16 Biosciences Inc | Sustitutos de aceite de palma producidos microbialmente. |
GB202005180D0 (en) * | 2020-04-08 | 2020-05-20 | Ge Healthcare Bio Sciences Ab | Methods for targeted integration |
GB202005179D0 (en) * | 2020-04-08 | 2020-05-20 | Ge Healthcare Bio Sciences Ab | Methods for the selection of nucleic acid sequences |
WO2022026341A1 (en) * | 2020-07-28 | 2022-02-03 | The Regents Of The University Of California | Expressing multiple genes from a single transcript in algae and plants |
WO2022104046A1 (en) * | 2020-11-12 | 2022-05-19 | C16 Biosciences, Inc. | Edible microbial oil |
CN112576229B (zh) * | 2020-12-11 | 2023-01-24 | 大庆油田有限责任公司 | 一种利用微生物作用地下原油产甲烷方法 |
KR102491250B1 (ko) | 2021-07-30 | 2023-01-20 | 류시창 | 승강식 피난기 |
EP4208528A4 (en) | 2021-09-17 | 2023-10-11 | Checkerspot, Inc. | HIGH OLEIC OIL COMPOSITIONS AND THEIR USES |
WO2023091669A1 (en) | 2021-11-19 | 2023-05-25 | Checkerspot, Inc. | Recycled polyurethane formulations |
WO2023102069A1 (en) | 2021-12-01 | 2023-06-08 | Checkerspot, Inc. | Polyols, polyurethane dispersions, and uses thereof |
WO2023131656A1 (en) * | 2022-01-05 | 2023-07-13 | Biotrino Aps | Chlorella vulgaris strain with reduced chlorophyll content |
WO2023133417A2 (en) * | 2022-01-05 | 2023-07-13 | Change Foods, Inc. | Dairy-like compositions |
WO2023196923A1 (en) * | 2022-04-07 | 2023-10-12 | Checkerspot, Inc. | Ricinoleate oil production and uses thereof |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002008403A2 (en) * | 2000-07-25 | 2002-01-31 | Calgene Llc | Nucleic acid sequences encoding beta-ketoacyl-acp synthase and uses thereof |
WO2009076559A1 (en) | 2007-12-11 | 2009-06-18 | Synthetic Genomics, Inc. | Secretion of fatty aicds by photosynthetic microorganisms |
WO2010063032A2 (en) * | 2008-11-28 | 2010-06-03 | Solazyme, Inc. | Production of tailored oils in heterotrophic microorganisms |
JP2010528627A (ja) | 2007-06-01 | 2010-08-26 | ソラザイム、インク | 微生物による油の生産 |
Family Cites Families (381)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2235056A (en) | 1938-03-04 | 1941-03-18 | Ici Ltd | Process for the recovery of glycerol from still residues from fermentation processes |
US2383602A (en) | 1943-03-04 | 1945-08-28 | Colgate Palmolive Peet Co | Process for treatment of fatty glycerides |
US2967700A (en) | 1955-03-01 | 1961-01-10 | Morris B Kallison | Whipping and aerating apparatus |
US2874171A (en) | 1957-02-20 | 1959-02-17 | Upjohn Co | Recovery of ergosterol |
US3142135A (en) | 1962-02-13 | 1964-07-28 | Grain Processing Corp | Production of carotenoids by the cultivation of algae |
US3280502A (en) | 1962-11-07 | 1966-10-25 | Hoffmann La Roche | Process for the preparation of lutein |
US3320693A (en) | 1964-09-11 | 1967-05-23 | Kk | Method of industral cultivation of unicellular green algae such as chlorella |
US3475274A (en) | 1967-08-07 | 1969-10-28 | Commercial Solvents Corp | Production of riboflavin |
US3962466A (en) | 1972-11-10 | 1976-06-08 | Dai-Nippon Sugar Manufacturing Co., Ltd. | Method for treatment of microorganisms |
US4049724A (en) | 1973-11-20 | 1977-09-20 | Atlantic Richfield Company | Osmium catalyzed organic hydroperoxide hydroxylation of olefinic compounds |
US4058492A (en) | 1974-01-10 | 1977-11-15 | Bayer Aktiengesellschaft | Process for molding polyurethane foams |
JPS5328989B2 (ko) | 1974-05-27 | 1978-08-17 | ||
US4005062A (en) | 1974-08-16 | 1977-01-25 | Standard Oil Company (Indiana) | Process of preparing water-soluble whippable extract from microorganism protein material |
US3957578A (en) | 1975-01-03 | 1976-05-18 | Hokkaido Sugar Co., Ltd. | Method for manufacture of α-galactosidase by microorganism |
US4103039A (en) | 1976-08-18 | 1978-07-25 | Fuji Oil Company, Limited | Method for producing improved shea fat |
FR2375319A1 (fr) | 1976-12-23 | 1978-07-21 | British Petroleum Co | Procede de traitement d'extraits lipidiques |
US4182777A (en) | 1977-03-01 | 1980-01-08 | Standard Oil Company (Indiana) | Co-dried yeast whey food product and process |
US4266617A (en) | 1979-02-23 | 1981-05-12 | Excel Industries, Inc. | Tractor with full-floating tool bar |
US4288378A (en) | 1979-05-23 | 1981-09-08 | The Procter & Gamble Company | Method of preparing an enriched peanut oil peanut butter stabilizer |
IL57712A (en) | 1979-07-03 | 1984-02-29 | Yissum Res Dev Co | Cultivation of halophilic algae of the dunaliella species for the production of fuel-like product |
US4273790A (en) | 1979-11-19 | 1981-06-16 | Standard Brands Incorporated | Low-fat liquid spread and process |
US4335156A (en) | 1980-09-19 | 1982-06-15 | Nabisco Brands, Inc. | Edible fat product |
US4373434A (en) | 1980-11-24 | 1983-02-15 | Simon-Rosedowns Limited | Apparatus for the expansion of oil bearing seeds |
JPS57150379A (en) | 1981-03-14 | 1982-09-17 | Kikujiro Ishiwatari | Crushing of cell membrane of chlorella |
US4390561A (en) | 1981-11-04 | 1983-06-28 | The Procter & Gamble Company | Margarine oil product |
US4584139A (en) | 1983-01-31 | 1986-04-22 | Olin Corporation | Hydrogenation of long chain olefinic oils with Raney catalyst |
DK402583D0 (da) | 1983-09-05 | 1983-09-05 | Novo Industri As | Fremgangsmade til fremstilling af et immobiliseret lipasepraeparat og anvendelse deraf |
US4519845A (en) | 1984-02-09 | 1985-05-28 | Uop Inc. | Separation of sucrose from molasses |
US4940845A (en) | 1984-05-30 | 1990-07-10 | Kao Corporation | Esterification process of fats and oils and enzymatic preparation to use therein |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US4627192B1 (en) | 1984-11-16 | 1995-10-17 | Sigco Res Inc | Sunflower products and methods for their production |
US4755467A (en) | 1985-06-03 | 1988-07-05 | Unisearch Limited | Method for the production of sorbitol and gluconate |
US5001059A (en) | 1985-07-01 | 1991-03-19 | Bio-Technical Resources, Inc. | L-ascorbic acid production in microorganisms |
US5900370A (en) | 1985-07-01 | 1999-05-04 | Bio-Technical Resources | Process for the production of ascorbic acid with prototheca |
US5792631A (en) | 1985-07-01 | 1998-08-11 | Dcv, Inc. | Microbial process for the production of ascorbic acid using Chlorella protothecoides |
US4603188A (en) | 1985-07-10 | 1986-07-29 | Itoh Seiyu Kabushiki Kaisha | Curable urethane composition |
US4673490A (en) | 1985-08-23 | 1987-06-16 | Fluor Corporation | Process for separating crude oil components |
US5091116A (en) | 1986-11-26 | 1992-02-25 | Kraft General Foods, Inc. | Methods for treatment of edible oils |
US5360730A (en) | 1987-06-05 | 1994-11-01 | Universal Foods Corporation | Zeaxanthin producing strains of Neospongiococcum Excentricum |
DK399387D0 (da) | 1987-07-31 | 1987-07-31 | Novo Industri As | Immobiliseret lipase og dennes anvendelse |
DE3886412T2 (de) | 1987-09-28 | 1994-05-11 | Novo Nordisk As | Verfahren zur immobilisierung von lipasen. |
FR2626584B1 (fr) | 1988-01-28 | 1990-07-13 | Agronomique Inst Nat Rech | Sequence ars efficace chez yarrowia lipolytica et procede pour sa preparation |
US4992605A (en) | 1988-02-16 | 1991-02-12 | Craig Wayne K | Production of hydrocarbons with a relatively high cetane rating |
US4901635A (en) | 1988-04-08 | 1990-02-20 | Anderson International Corp. | Apparatus and method for the continuous extrusion and partial deliquefaction of oleaginous materials |
US5080848A (en) | 1988-12-22 | 1992-01-14 | The Proctor & Gamble Company | Process for making concentrated surfactant granules |
US20060094089A1 (en) | 1988-09-07 | 2006-05-04 | Martek Biosciences Corporation | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
US5130242A (en) | 1988-09-07 | 1992-07-14 | Phycotech, Inc. | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
US5340742A (en) | 1988-09-07 | 1994-08-23 | Omegatech Inc. | Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids |
US5693507A (en) | 1988-09-26 | 1997-12-02 | Auburn University | Genetic engineering of plant chloroplasts |
US6680426B2 (en) | 1991-01-07 | 2004-01-20 | Auburn University | Genetic engineering of plant chloroplasts |
DE3836447C2 (de) | 1988-10-26 | 1994-02-03 | Stockhausen Chem Fab Gmbh | Verfahren zur Gewinnung hochsulfatierter Fettsäuren, Hydroxifettsäuren oder oxalkylierter Hydroxifettsäuren |
DK638688D0 (da) | 1988-11-16 | 1988-11-16 | Novo Industri As | Partikelformet immobiliseret lipase-praeparat, fremgangsmaade til fremstilling deraf og anvendelse deraf |
US5252198A (en) | 1989-05-10 | 1993-10-12 | Davy Mckee (London) Ltd. | Multi-step hydrodesulphurisation process |
US5391383A (en) | 1989-09-20 | 1995-02-21 | Nabisco, Inc. | Edible spray oil |
US5258197A (en) | 1989-09-20 | 1993-11-02 | Nabisco, Inc. | Reduced calorie triglyceride mixtures |
US5434278A (en) | 1989-09-20 | 1995-07-18 | Nabisco, Inc. | Synthesis of acetoglyceride fats |
WO1991009924A1 (en) | 1989-12-29 | 1991-07-11 | The Procter & Gamble Company | Ultra mild surfactant with good lather |
US4992189A (en) | 1990-02-07 | 1991-02-12 | Mobil Oil Corporation | Lubricants and lube additives from hydroxylation and esterification of lower alkene oligomers |
DE4004800C2 (de) | 1990-02-13 | 2000-12-21 | Aventis Cropscience Gmbh | Im Habitus und Ertrag veränderte transgene Pflanzen |
US5407957A (en) | 1990-02-13 | 1995-04-18 | Martek Corporation | Production of docosahexaenoic acid by dinoflagellates |
US7053267B2 (en) | 1990-03-16 | 2006-05-30 | Calgene Llc | Plant seed oils |
US5298421A (en) | 1990-04-26 | 1994-03-29 | Calgene, Inc. | Plant medium-chain-preferring acyl-ACP thioesterases and related methods |
US5164308A (en) | 1990-05-21 | 1992-11-17 | Martek Corporation | Preparation of labelled triglyceride oils by cultivation of microorganisms |
US6483008B1 (en) * | 1990-08-15 | 2002-11-19 | Calgene Llc | Methods for producing plants with elevated oleic acid content |
US6022577A (en) | 1990-12-07 | 2000-02-08 | Nabisco Technology Company | High stearic acid soybean oil blends |
DK0563191T4 (da) | 1990-12-20 | 2000-07-17 | Du Pont | Nucleotidsekvenser af sojabønne-acyl-ACP-thioesterase-gener |
US5945585A (en) | 1990-12-20 | 1999-08-31 | E. I. Du Pont De Nemours And Company | Specific for palmitoyl, stearoyl and oleoyl-alp thioesters nucleic acid fragments encoding acyl-acp thiosesterase enzymes and the use of these fragments in altering plant oil composition |
MY107920A (en) | 1990-12-27 | 1996-06-29 | Kao Corp | Process for producing alcohol |
JPH0699337B2 (ja) | 1990-12-27 | 1994-12-07 | 花王株式会社 | アルコールの製造方法 |
US5380894A (en) | 1991-03-01 | 1995-01-10 | The United States Of America As Represented By The Secretary Of Agriculture | Production of hydroxy fatty acids and estolide intermediates |
US5346724A (en) | 1991-04-12 | 1994-09-13 | Nippon Oil Company, Ltd. | Oil and fat composition for lubricating food processing machines and use thereof |
CU22292A1 (es) | 1991-05-07 | 1995-01-31 | Cigb | Procedimiento para la obtencion a escala industrial de licores de fructosa-glucosa a partir de sacarosa e instalacion para el mismo |
US5455167A (en) | 1991-05-21 | 1995-10-03 | Calgene Inc. | Medium-chain thioesterases in plants |
US5270175A (en) | 1991-07-12 | 1993-12-14 | Dna Plant Technology Corporation | Methods and compositions for producing metabolic products for algae |
US5268192A (en) | 1991-07-16 | 1993-12-07 | Nabisco, Inc. | Low calorie nut products and process of making |
JP3143636B2 (ja) | 1991-09-11 | 2001-03-07 | 株式会社サン・クロレラ | 細胞破裂によるクロレラ細胞壁の破砕方法 |
DE4130986A1 (de) | 1991-09-18 | 1993-03-25 | Bayer Ag | Pinosylvinsynthase-gene |
PH31293A (en) | 1991-10-10 | 1998-07-06 | Rhone Poulenc Agrochimie | Production of y-linolenic acid by a delta6-desaturage. |
US6355861B1 (en) | 1991-10-10 | 2002-03-12 | Rhone-Poulenc Agrochimie | Production of gamma linolenic acid by a Δ6-desaturase |
FR2686619B1 (fr) | 1992-01-28 | 1995-07-13 | Commissariat Energie Atomique | Procede de production selective de lipides poly-insatures a partir d'une culture de micro-algues du type porphyridium et cuve utilisee dans ce procede. |
US5395455A (en) | 1992-03-10 | 1995-03-07 | Energy, Mines And Resources - Canada | Process for the production of anhydrosugars from lignin and cellulose containing biomass by pyrolysis |
DE4209779C1 (ko) | 1992-03-26 | 1993-07-15 | Oelmuehle Leer Connemann Gmbh & Co., 2950 Leer, De | |
ES2141767T3 (es) | 1992-06-19 | 2000-04-01 | Arthur M Nonomura | Procedimientos y composiciones que estimulan la fijacion del carbono en las plantas. |
TW211523B (en) | 1992-06-29 | 1993-08-21 | Amerchol Corp | Hydroxylated milk glycerides |
US6410281B1 (en) | 1992-07-10 | 2002-06-25 | Omegatech, Inc. | Reducing corrosion in a fermentor by providing sodium with a non-chloride sodium salt |
US5298637A (en) | 1992-10-22 | 1994-03-29 | Arco Chemical Technology, L.P. | Process for producing a reduced calorie lipid composition |
JP3090810B2 (ja) | 1993-03-09 | 2000-09-25 | 日本碍子株式会社 | パルミトオレイン酸の製造方法 |
GB2277052A (en) | 1993-04-14 | 1994-10-19 | Du Pont Canada | Polyurethane foam laminates |
JPH078215A (ja) | 1993-04-30 | 1995-01-13 | Kawasaki Steel Corp | ドコサヘキサエン酸含有海洋性微細藻類食品素材およびその製造方法 |
JPH078217A (ja) | 1993-06-29 | 1995-01-13 | Kawasaki Steel Corp | ドコサヘキサエン酸含有健康食品およびその製造方法 |
JP3506740B2 (ja) | 1993-09-09 | 2004-03-15 | 日清オイリオ株式会社 | ドコサヘキサエン酸含有藻類の培養方法 |
CA2118071C (en) | 1993-10-28 | 2004-09-14 | Rodney B. Croteau | Dna encoding limonene synthase from mentha spicata |
CA2176137A1 (en) | 1993-11-10 | 1995-05-18 | Alois Toni Voelker | Plant acyl acp thioesterase sequences |
US5427704A (en) | 1994-01-28 | 1995-06-27 | The Lubrizol Corporation | Triglyceride oils thickened with estolides of hydroxy-containing triglycerides |
US5451332A (en) | 1994-01-28 | 1995-09-19 | The Lubrizol Corporation | Estolides of hydroxy-containing triglycerides that contain a performance additive |
US5458795A (en) | 1994-01-28 | 1995-10-17 | The Lubrizol Corporation | Oils thickened with estolides of hydroxy-containing triglycerides |
WO1995022606A1 (en) | 1994-02-21 | 1995-08-24 | Novo Nordisk A/S | Method for production of an immobilized enzyme preparation and use of the immobilized enzyme preparation |
US5910630A (en) | 1994-04-06 | 1999-06-08 | Davies; Huw Maelor | Plant lysophosphatidic acid acyltransferases |
US5563058A (en) | 1994-04-06 | 1996-10-08 | Calgene, Inc. | Plant lysophosphatidic acid acyltransferases |
US5506201A (en) | 1994-04-29 | 1996-04-09 | International Flavors & Fragrances Inc. | Formulation of a fat surfactant vehicle containing a fragrance |
ES2287935T3 (es) | 1994-05-18 | 2007-12-16 | Bayer Bioscience Gmbh | Secuencias de adn codificantes de enzimas capaces de facilitar la sintesis de a-1,4 glucanos lineales en plantas, hongos y microorganismos. |
JP3375726B2 (ja) | 1994-05-18 | 2003-02-10 | 雪印乳業株式会社 | 食用油脂および油脂混合物 |
US6113971A (en) | 1994-07-25 | 2000-09-05 | Elmaleh; David R. | Olive oil butter |
DE19529795C2 (de) | 1994-08-16 | 1998-09-10 | Frische Gmbh | Verfahren zur Gewinnung von nicht wasserlöslichen, nativen Produkten aus Stoffgemengen mit Hilfe der Zentrifugalkraft |
US5756135A (en) | 1994-09-15 | 1998-05-26 | Robert D. Seeley Trust | Water insoluble yeast solids product and process of making same |
AU3677995A (en) | 1994-10-20 | 1996-05-15 | Procter & Gamble Company, The | Personal treatment compositions and/or cosmetic compositions containing enduring perfume |
US5475160A (en) | 1994-11-07 | 1995-12-12 | Shell Oil Company | Process for the direct hydrogenation of triglycerides |
US5680812A (en) | 1995-01-23 | 1997-10-28 | Linsgeseder; Helmut | Apparatus and method for the extraction of vegetable oils |
DE19503062A1 (de) | 1995-02-01 | 1996-08-08 | Henkel Kgaa | Verwendung von Alkoxylierungsprodukten epoxydierter Fettstoffe als Entschäumer |
US5942479A (en) | 1995-05-27 | 1999-08-24 | The Proctor & Gamble Company | Aqueous personal cleansing composition with a dispersed oil phase comprising two specifically defined oil components |
JP2001518121A (ja) | 1995-06-06 | 2001-10-09 | アグロ マネージメント グループ,インコーポレイティド | 植物に基づく生分解性液体潤滑剤 |
US5685218A (en) | 1995-07-14 | 1997-11-11 | The French Oil Mill Machinery Co. | Method for treating oil-bearing material |
WO1997016408A1 (de) | 1995-10-27 | 1997-05-09 | Basf Aktiengesellschaft | Fettsäurederivate und ihre verwendung als tenside in wasch- und reinigungsmitteln |
FI100248B (fi) | 1996-02-05 | 1997-10-31 | Fortum Oil Oy | Keskitisleen valmistus |
US6086903A (en) | 1996-02-26 | 2000-07-11 | The Proctor & Gamble Company | Personal treatment compositions and/or cosmetic compositions containing enduring perfume |
US6255505B1 (en) | 1996-03-28 | 2001-07-03 | Gist-Brocades, B.V. | Microbial polyunsaturated fatty acid containing oil from pasteurised biomass |
ES2259190T3 (es) | 1996-04-15 | 2006-09-16 | Univ Washington | Composiciones y metodos para la biosintesis de taxol. |
AR006830A1 (es) | 1996-04-26 | 1999-09-29 | Du Pont | Aceite de soja con alta estabilidad oxidativa |
US5595965A (en) | 1996-05-08 | 1997-01-21 | The Lubrizol Corporation | Biodegradable vegetable oil grease |
US6312623B1 (en) | 1996-06-18 | 2001-11-06 | Abb Power T&D Company Inc. | High oleic acid oil compositions and methods of making and electrical insulation fluids and devices comprising the same |
US6342208B1 (en) | 1996-08-02 | 2002-01-29 | Plum Kerni Produktion A/S | Oil-in-water emulsion containing C10-C24 fatty acid derivatives for treating skin of mammals |
CZ36499A3 (cs) | 1996-08-08 | 1999-07-14 | The Procter & Gamble Company | Syntéza polyolových polyesterů |
US5885440A (en) | 1996-10-01 | 1999-03-23 | Uop Llc | Hydrocracking process with integrated effluent hydrotreating zone |
US7109392B1 (en) | 1996-10-09 | 2006-09-19 | Cargill, Incorporated | Methods for increasing oleic acid content in seeds from transgenic plants containing a mutant delta 12 desaturase |
AU5498198A (en) | 1997-01-24 | 1998-08-18 | Kirin Beer Kabushiki Kaisha | Beta-ketoacyl-acp-synthetase ii enzyme and gene encoding the same |
US6465642B1 (en) | 1997-02-07 | 2002-10-15 | The Procter & Gamble Company | Lower alkyl ester recycling in polyol fatty acid polyester synthesis |
DE19710152C2 (de) | 1997-03-12 | 1999-04-22 | Henkel Kgaa | Verfahren zur Herstellung von Aniontensidgranulaten |
US6395965B1 (en) | 1997-03-21 | 2002-05-28 | Restoragen, Inc. | Plant containing a gene construct comprising a chlorella virus promoter and a lac operator |
US6243725B1 (en) | 1997-05-21 | 2001-06-05 | Premier International, Ltd. | List building system |
US6083731A (en) | 1997-06-24 | 2000-07-04 | Washington State University Research Foundation | Recombinant materials and methods for the production of limonene hydroxylases |
US6429014B1 (en) | 1997-07-11 | 2002-08-06 | Washington State University Research Foundation | Monoterpene synthases from grand fir (Abies grandis) |
WO1999006585A1 (en) | 1997-08-01 | 1999-02-11 | Martek Biosciences Corporation | Dha-containing nutritional compositions and methods for their production |
US5891697A (en) | 1997-09-25 | 1999-04-06 | Washington State University Research Foundation | Monoterpene synthases from common sage (Salvia officinalis) |
DE69836548T2 (de) | 1997-09-29 | 2007-06-21 | Japan Tobacco Inc. | Hefeextraktzusammensetzung, hefe zur herstellung derselben und verfahren zur herstellung einer hefeextraktzusammensetzung |
CA2318913A1 (en) | 1998-01-21 | 1999-07-29 | University Of Maryland Biotechnology Institute | Methods for the enrichment of live feed with nutrients essential for fish larvae |
US6265639B1 (en) | 1998-01-22 | 2001-07-24 | Washington State University Foundation | Gymnosperm nucleic acid molecules encoding sesquiterpene synthases and methods of use |
US6407044B2 (en) | 1998-01-28 | 2002-06-18 | The Proctor & Gamble Company | Aerosol personal cleansing emulsion compositions which contain low vapor pressure propellants |
AU2490399A (en) | 1998-02-02 | 1999-08-16 | Regents Of The University Of California, The | Germacrene c synthase gene of (lycopersicon esculentum) |
US6139897A (en) | 1998-03-24 | 2000-10-31 | Kao Corporation | Oil or fat composition containing phytosterol |
US6468955B1 (en) | 1998-05-01 | 2002-10-22 | The Proctor & Gamble Company | Laundry detergent and/or fabric care compositions comprising a modified enzyme |
US20020012979A1 (en) | 1998-06-08 | 2002-01-31 | Alan Berry | Vitamin c production in microorganisms and plants |
US6051539A (en) | 1998-07-02 | 2000-04-18 | Cargill, Inc. | Process for modifying unsaturated triacylglycerol oils resulting products and uses thereof |
US6531303B1 (en) | 1998-07-06 | 2003-03-11 | Arkion Life Sciences Llc | Method of producing geranylgeraniol |
MX219130B (es) | 1998-07-06 | 2004-02-10 | Dcv Inc Haciendo Negocios Como | Metodo para producir vitamina. |
US7511190B2 (en) | 1999-11-17 | 2009-03-31 | Mendel Biotechnology, Inc. | Polynucleotides and polypeptides in plants |
JP2000136199A (ja) | 1998-10-29 | 2000-05-16 | Asahi Glass Co Ltd | シゾサッカロミセス・ポンベで使用可能なシグナルペプチド、分泌型発現ベクター、およびそれらを用いたタンパク質生産方法 |
US6043072A (en) | 1998-11-05 | 2000-03-28 | Washington State University Research Foundation | Nucleic acids encoding Taxus geranylgeranyl diphosphate synthase, and methods of use |
US6762345B1 (en) | 1998-12-03 | 2004-07-13 | E. I. Du Pont De Nemours And Company | Plant stearoyl desaturases |
JP2000175696A (ja) | 1998-12-14 | 2000-06-27 | Yoshio Tanaka | ドナリエラ藻体の抽出方法 |
US6166231A (en) | 1998-12-15 | 2000-12-26 | Martek Biosciences Corporation | Two phase extraction of oil from biomass |
ATE234890T1 (de) | 1998-12-21 | 2003-04-15 | Goldschmidt Ag Th | Verwendung von metallsalzen der ricinolsäure bei der herstellung von polyurethanschäumen |
US6020509A (en) | 1998-12-22 | 2000-02-01 | Condea Vista Company | Method for producing surfactant compositions |
US6630066B2 (en) | 1999-01-08 | 2003-10-07 | Chevron U.S.A. Inc. | Hydrocracking and hydrotreating separate refinery streams |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7211418B2 (en) * | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US6278006B1 (en) | 1999-01-19 | 2001-08-21 | Cargill, Incorporated | Transesterified oils |
AU4211600A (en) | 1999-04-10 | 2000-11-14 | Maxygen, Inc. | Modified lipid production |
ATE446370T1 (de) | 1999-04-12 | 2009-11-15 | Monsanto Technology Llc | Öl, das brassicastanol enthält |
DE19926456A1 (de) | 1999-06-10 | 2000-12-14 | Norddeutsche Pflanzenzucht Han | Verfahren zur Erhöhung des Fettsäuregehalts in Pflanzensamen |
AU5764800A (en) | 1999-07-01 | 2001-01-22 | Johnson & Johnson Consumer Companies, Inc. | Cleansing compositions |
US6217746B1 (en) | 1999-08-16 | 2001-04-17 | Uop Llc | Two stage hydrocracking process |
DE10000978A1 (de) | 2000-01-12 | 2001-07-26 | Gvs Ges Fuer Erwerb Und Verwer | Verfahren zur Erhöhung des Gehalts an Fettsäuren in Pflanzen und Mikroorganismen |
US6391815B1 (en) | 2000-01-18 | 2002-05-21 | Süd-Chemie Inc. | Combination sulphur adsorbent and hydrogenation catalyst for edible oils |
ATE485385T1 (de) | 2000-01-19 | 2010-11-15 | Martek Biosciences Corp | Lösungsmittelfreies extraktionsverfahren |
WO2010120939A2 (en) | 2009-04-14 | 2010-10-21 | Solazyme, Inc. | Methods of microbial oil extraction and separation |
US6338866B1 (en) | 2000-02-15 | 2002-01-15 | Applied Food Biotechnology, Inc. | Pet foods using algal or fungal waste containing fatty acids |
GB0007651D0 (en) | 2000-03-29 | 2000-05-17 | Ascorbex Ltd | Gene sequence |
PT1276885E (pt) | 2000-04-21 | 2007-10-26 | Martek Biosciences Corp | Conversão trófica de algas fototróficas estritas, através de engenharia metabólica |
US6268517B1 (en) | 2000-05-09 | 2001-07-31 | Condea Vista Company | Method for producing surfactant compositions |
DE60129427T3 (de) | 2000-05-11 | 2014-07-24 | The Procter & Gamble Company | Hochkonzentrierte wäscheweichspülerzusammensetzungen und diese enthaltende mittel |
US20020178467A1 (en) | 2000-05-12 | 2002-11-28 | Katayoon Dehesh | Plastid transit peptide sequences for efficient plastid targeting |
MY122480A (en) | 2000-05-29 | 2006-04-29 | Premium Vegetable Oils Sdn Bhd | Trans free hard structural fat for margarine blend and spreads |
DE50105445D1 (de) | 2000-06-20 | 2005-04-07 | Goldschmidt Ag Th | Verwendung von Ricinolsäure in der Herstellung von Polyurethanschäumen |
EP1178118A1 (en) | 2000-08-02 | 2002-02-06 | Dsm N.V. | Isolation of microbial oils |
FR2814064B1 (fr) | 2000-09-20 | 2005-06-17 | Oreal | Composition de lavage comprenant des particules d'oxyde d'aluminium, au moins un agent conditionneur et au moins un tensioactif detergent |
US6596155B1 (en) | 2000-09-26 | 2003-07-22 | Uop Llc | Hydrocracking process |
JP2002125601A (ja) | 2000-10-25 | 2002-05-08 | Kurorera Kogyo Kk | 動物性プランクトン用餌料とその製造方法及び動物性プランクトンの培養方法 |
AU2002224445A1 (en) | 2000-10-26 | 2002-05-06 | Joe E. Guyer | Method of generating and recovering gas from subsurface formations of coal, carbonaceous shale and organic-rich shales |
US6538169B1 (en) | 2000-11-13 | 2003-03-25 | Uop Llc | FCC process with improved yield of light olefins |
EP1408765B1 (en) | 2000-11-21 | 2010-09-15 | Unilever N.V. | Edible spread containing a natural fat phase |
US7081567B2 (en) | 2000-12-03 | 2006-07-25 | Lexun Xue | Transgenic dunaliella salina as a bioreactor |
DK1343860T3 (da) | 2000-12-21 | 2012-05-07 | Aarhuskarlshamn Denmark As | Fremgangsmåde til fremstilling af vegetabilske oliefraktioner med højt indhold af ikke-tokolholdigt, højtsmeltende, uforsæbeligt stof |
US20020144455A1 (en) | 2001-01-06 | 2002-10-10 | Bertrand Jerome C. | Non sooting candle composition |
RU2289568C2 (ru) | 2001-03-26 | 2006-12-20 | Дау Глобал Текнолоджиз Инк. | Способ метатезиса сложных эфиров ненасыщенных жирных кислот или ненасыщенных жирных кислот с низшими олефинами и композиция гетерогенного катализатора, предназначенная для способа метатезиса |
JP4823430B2 (ja) | 2001-03-28 | 2011-11-24 | 花王株式会社 | 界面活性剤組成物 |
WO2002085293A2 (en) | 2001-04-20 | 2002-10-31 | Cargill, Incorporated | Production of alpha-lipoic acid |
US6620427B2 (en) | 2001-04-24 | 2003-09-16 | Abbott Laboratories | Method for improving bone mineralization |
FR2824266B1 (fr) | 2001-05-04 | 2005-11-18 | Oreal | Composition cosmetique de soin ou de maquillage des matieres keratiniques comprenant un ester a groupement aromatique et un agent photoprotecteur et utilisations |
US6503285B1 (en) | 2001-05-11 | 2003-01-07 | Cargill, Inc. | Triacylglycerol based candle wax |
US6596768B2 (en) | 2001-05-22 | 2003-07-22 | Church & Dwight Co., Inc. | Unsaturated lipid-enriched feedstock for ruminants |
US6398707B1 (en) | 2001-05-31 | 2002-06-04 | Wen-Teng Wu | Method of preparing lower alkyl fatty acids esters and in particular biodiesel |
WO2003002719A2 (en) | 2001-06-29 | 2003-01-09 | Brookhaven Science Associates, Llc | Isoform of castor oleate hydroxylase |
US20030082595A1 (en) | 2001-08-03 | 2003-05-01 | Bo Jiang | Nucleic acids of aspergillus fumigatus encoding industrial enzymes and methods of use |
US6706659B2 (en) | 2001-08-29 | 2004-03-16 | Uop Llc | High-activity isomerization catalyst and process |
US6867308B2 (en) | 2001-09-19 | 2005-03-15 | Archer-Daniels-Midland Company | Process for separation of tocopherols |
JP3816774B2 (ja) | 2001-10-01 | 2006-08-30 | 独立行政法人科学技術振興機構 | 炭化水素資化微細藻類およびそれを用いたバイオレメディエーション方法 |
AU2002361664A1 (en) | 2002-01-03 | 2003-07-30 | Archer-Daniels-Midland Company | Polyunsaturated fatty acids as part of reactive structures for latex paints: thickeners, surfactants and dispersants |
CN100448996C (zh) | 2002-01-23 | 2009-01-07 | 皇家奈达尔科股份有限公司 | 戊糖的发酵 |
US7314974B2 (en) | 2002-02-21 | 2008-01-01 | Monsanto Technology, Llc | Expression of microbial proteins in plants for production of plants with improved properties |
US6590113B1 (en) | 2002-03-26 | 2003-07-08 | Ronald T. Sleeter | Process for treating oils containing antioxidant compounds |
US20030229237A1 (en) | 2002-04-02 | 2003-12-11 | Haas Michael J. | In situ production of fatty acid alkyl esters |
CA2484334C (en) | 2002-05-03 | 2013-01-22 | Martek Biosciences Corporation | High-quality lipids and methods for producing by enzymatic liberation from biomass |
US20030211594A1 (en) | 2002-05-07 | 2003-11-13 | Rosebrook Donald Ian | Microalgae for remediation of waste and method of culturing the same |
ES2404660T3 (es) | 2002-05-14 | 2013-05-28 | Viance, Llc | Composiciones hidrófugas para conservantes de la madera |
US6818589B1 (en) | 2002-06-18 | 2004-11-16 | Uop Llc | Isomerization catalyst and processes |
JP2005530506A (ja) | 2002-06-21 | 2005-10-13 | モンサント テクノロジー エルエルシー | 改変された脂肪酸組成を持つ植物の生成のためのチオエステラーゼ関連核酸配列およびその使用方法 |
BR0312792A (pt) | 2002-07-19 | 2005-05-03 | Cytos Biotechnology Ag | Composições de vacinas contendo séries antigênicas de amilóide beta1-6 |
US7232935B2 (en) | 2002-09-06 | 2007-06-19 | Fortum Oyj | Process for producing a hydrocarbon component of biological origin |
US7041866B1 (en) | 2002-10-08 | 2006-05-09 | Uop Llc | Solid-acid isomerization catalyst and process |
US20040074760A1 (en) | 2002-10-17 | 2004-04-22 | Carnegie Mellon University | Production of biofuels |
FI116627B (fi) | 2002-11-01 | 2006-01-13 | Danisco | Menetelmä triglyseridien rasvahappoketjukoostumuksen säätelemiseksi sekä niiden käyttö |
US7135290B2 (en) | 2003-04-12 | 2006-11-14 | Solazyme, Inc. | Methods and compositions for evolving hydrogenase genes |
AU2003295624A1 (en) | 2002-11-18 | 2004-06-15 | Monsanto Technology, Llc | Production of increased oil and protein in plants by the disruption of the phenylpropanoid pathway |
ATE448262T1 (de) | 2003-01-08 | 2009-11-15 | Univ Texas Tech | Elastomere zusammensetzungen auf der basis von castoröl/ epoxidiertem sojabohnenöl |
EP1604027A2 (de) | 2003-01-20 | 2005-12-14 | Sungene GmbH & Co. KGaA | Expressionskassette mit promotoren der stärkesynthase 3 zur expression von nukleinsäuren in stärkehaltigen geweben von pflanzen |
US20060206949A1 (en) | 2003-01-28 | 2006-09-14 | Sylvain Arnould | Custom-made meganuclease and use thereof |
CA2518400A1 (en) | 2003-03-03 | 2004-09-16 | Meiji Seika Kaisha, Ltd. | Transgenic plants modified to accumulate fructooligosaccharides and production thereof |
US7125672B2 (en) | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7238482B2 (en) | 2003-05-07 | 2007-07-03 | E. I. Du Pont De Nemours And Company | Production of polyunsaturated fatty acids in oleaginous yeasts |
US7032664B2 (en) | 2004-06-02 | 2006-04-25 | Halliburton Energy Services, Inc. | Nanocomposite particulates and methods of using nanocomposite particulates |
US7259255B2 (en) | 2003-06-25 | 2007-08-21 | E. I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast |
CN1816614B (zh) | 2003-07-09 | 2010-04-21 | 日清奥利友集团株式会社 | 生产对称的甘油三酯的方法 |
JP4839215B2 (ja) | 2003-08-25 | 2011-12-21 | ファンザイム バイオテクノロジーズ エスアー | 新規真菌タンパク質および同タンパク質をコードする核酸 |
PE20050398A1 (es) | 2003-09-22 | 2005-06-03 | Rosales Jose Antonio Socla | Proceso y purificacion de las xantofilas de marigold |
US20060048240A1 (en) | 2004-04-01 | 2006-03-02 | Nickolai Alexandrov | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
BRPI0415046A (pt) | 2003-10-02 | 2006-12-12 | Univ Mississippi | produção de biodiesel e outras substáncias quìmicas valiosas a partir de resìduos de plantas de tratamento de água residual |
CA2542564A1 (en) * | 2003-11-12 | 2005-05-26 | E.I. Du Pont De Nemours And Company | Delta-15 desaturases suitable for altering levels of polyunsaturated fatty acids in oilseed plants and oleaginous yeast |
US7504259B2 (en) | 2003-11-12 | 2009-03-17 | E. I. Du Pont De Nemours And Company | Δ12 desaturases suitable for altering levels of polyunsaturated fatty acids in oleaginous yeast |
WO2005047216A1 (en) | 2003-11-13 | 2005-05-26 | Neste Oil Oyj | Process for the hydrogenation of olefins |
KR100913626B1 (ko) | 2003-11-20 | 2009-08-24 | 솔베이(소시에떼아노님) | 염소화된 유기 화합물의 제조 방법 |
BRPI0418048A (pt) | 2003-12-23 | 2007-04-17 | Basf Plant Science Gmbh | ácido nucleico de lmp isolado, vetor de expressão, e, métodos para produzir uma planta transgênica e para modular o nìvel de um composto de armazenagem de semente em uma planta |
CN1238469C (zh) | 2004-01-16 | 2006-01-25 | 清华大学 | 有机介质反应体系中脂肪酶转化油脂生产生物柴油新工艺 |
US7063957B2 (en) | 2004-03-26 | 2006-06-20 | The University Of Hong Kong | Methods for production of astaxanthin from the green microalgae Chlorella in dark-heterotrophic cultures |
CN101018862B (zh) * | 2004-04-22 | 2013-10-09 | 联邦科学技术研究组织 | 用重组细胞合成长链多不饱和脂肪酸 |
US7364883B2 (en) | 2004-05-07 | 2008-04-29 | Yeastern Biotech Co., Ltd. | Process for producing poly-unsaturated fatty acids by oleaginous yeasts |
WO2005108586A1 (en) * | 2004-05-07 | 2005-11-17 | Universität Regensburg | A method for increasing the ratio of homologous to non-homologous recombination |
WO2005113784A1 (en) | 2004-05-12 | 2005-12-01 | Luca Technologies, Llc | Generation of hydrogen from hydrocarbon-bearing materials |
US7214297B2 (en) | 2004-06-28 | 2007-05-08 | Applied Materials, Inc. | Substrate support element for an electrochemical plating cell |
US20060075522A1 (en) | 2004-07-31 | 2006-04-06 | Jaclyn Cleveland | Genes and uses for plant improvement |
WO2006036864A2 (en) | 2004-09-22 | 2006-04-06 | Ceres, Inc. | Promoter, promoter control elements, and combinations, and uses thereof |
ES2689290T3 (es) | 2004-09-28 | 2018-11-13 | Neste Oyj | Proceso para eterificar iso-olefinas |
GB0421937D0 (en) | 2004-10-02 | 2004-11-03 | Univ York | Acyl CoA synthetases |
WO2006047445A2 (en) | 2004-10-22 | 2006-05-04 | Martek Biosciences Corporation | Process for preparing materials for extraction |
US7879591B2 (en) | 2004-11-04 | 2011-02-01 | E.I. Du Pont De Nemours And Company | High eicosapentaenoic acid producing strains of Yarrowia lipolytica |
US8685679B2 (en) | 2004-11-04 | 2014-04-01 | E I Du Pont De Nemours And Company | Acyltransferase regulation to increase the percent of polyunsaturated fatty acids in total lipids and oils of oleaginous organisms |
US7189559B2 (en) | 2004-11-04 | 2007-03-13 | E. I. Du Pont De Nemours And Company | Mortierella alpina lysophosphatidic acid acyltransferase homolog for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms |
US7550286B2 (en) | 2004-11-04 | 2009-06-23 | E. I. Du Pont De Nemours And Company | Docosahexaenoic acid producing strains of Yarrowia lipolytica |
US7238277B2 (en) | 2004-12-16 | 2007-07-03 | Chevron U.S.A. Inc. | High conversion hydroprocessing |
US20060225341A1 (en) | 2004-12-20 | 2006-10-12 | Rodolfo Rohr | Production of biodiesel |
MX2007007914A (es) | 2004-12-30 | 2007-08-14 | Sun Drilling Products Corp | Particulas nanocompuestas termoendurecibles, procesamiento para su produccion, y su uso en aplicaciones de perforacion de petroleo y gas natural. |
PT1681337E (pt) | 2005-01-14 | 2010-12-24 | Neste Oil Oyj | Método para a produção de hidrocarbonetos |
DE102005003624A1 (de) | 2005-01-26 | 2006-07-27 | Nutrinova Nutrition Specialties & Food Ingredients Gmbh | Herstellung und Anwendung eines antioxidativ wirksamen Extraktes aus Crypthecodinium sp. |
US7692049B2 (en) | 2005-01-31 | 2010-04-06 | Exxonmobil Chemical Patents Inc. | Hydrocarbon compositions useful for producing fuels and methods of producing the same |
CA2598792A1 (en) | 2005-03-02 | 2006-09-08 | Metanomics Gmbh | Process for the production of fine chemicals |
BRPI0609040B1 (pt) | 2005-03-18 | 2018-07-31 | Microbia, Inc. | Fungo recombinante do gênero yarrowia, método de produção de um carotenóide e método de preparo de um aditivo alimentício ou ração contendo um carotenóide |
US20060223153A1 (en) | 2005-04-05 | 2006-10-05 | Luca Technologies, Llc | Generation of materials with enhanced hydrogen content from anaerobic microbial consortia |
US7426960B2 (en) | 2005-05-03 | 2008-09-23 | Luca Technologies, Inc. | Biogenic fuel gas generation in geologic hydrocarbon deposits |
WO2007067207A1 (en) | 2005-05-11 | 2007-06-14 | Advanced Bionutrition Corporation | Stabilized form of fish oil |
EP1924290A4 (en) | 2005-05-12 | 2011-05-25 | Martek Biosciences Corp | BIOMASS HYDROLYSATE AND ITS USES AND MANUFACTURE |
US7288685B2 (en) | 2005-05-19 | 2007-10-30 | Uop Llc | Production of olefins from biorenewable feedstocks |
PT1741767E (pt) | 2005-07-04 | 2015-11-03 | Neste Oil Oyj | Processo para o fabrico de hidrocarbonetos de gama diesel |
EP1741768B2 (en) | 2005-07-04 | 2023-04-05 | Neste Oyj | Process for the manufacture of diesel range hydrocarbons |
WO2007025145A2 (en) | 2005-08-25 | 2007-03-01 | Solix Biofuels, Inc. | Method, apparatus and system for biodiesel production from algae |
WO2007027669A1 (en) | 2005-08-29 | 2007-03-08 | Cps Biofuels, Inc. | Improved biodiesel fuel, additives, and lubbricants |
FR2890961B1 (fr) | 2005-09-21 | 2007-11-23 | Inst Francais Du Petrole | Procede perfectionne de fabrication d'esters ethyliques a partir de corps gras d'origine naturelle |
AU2006294680A1 (en) | 2005-09-27 | 2007-04-05 | Cornell University | Invertase and inhibitors from coffee |
US8163675B2 (en) | 2005-10-20 | 2012-04-24 | Akzo Nobel N.V. | Emulsifier based on polyamines and fatty acid/maleic anhydride |
PL1795576T3 (pl) | 2005-12-12 | 2014-10-31 | Neste Oil Oyj | Sposób wytwarzania węglowodorów |
US20070167396A1 (en) | 2006-01-19 | 2007-07-19 | Solazyme, Inc. | Methods and compositions for cholesterol reduction in mammals |
US20090274736A1 (en) | 2006-01-19 | 2009-11-05 | Solazyme Inc. | Nutraceutical Compositions From Microalgae And Related Methods of Production And Administration |
US20070166266A1 (en) | 2006-01-19 | 2007-07-19 | Solazyme, Inc. | Methods and compositions for improving the health and appearance of skin |
US9109170B2 (en) | 2006-02-02 | 2015-08-18 | Reg Biofuels, Llc | Biodiesel cold filtration process |
US20070218183A1 (en) | 2006-03-14 | 2007-09-20 | Bunge Oils, Inc. | Oil composition of conjugated linoleic acid |
CA2647150A1 (en) | 2006-03-15 | 2007-09-20 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
CN100590186C (zh) | 2006-03-17 | 2010-02-17 | 中国科学院大连化学物理研究所 | 一种生产生物油脂和生物柴油的方法 |
CN101460141A (zh) | 2006-04-03 | 2009-06-17 | 先进生物营养公司 | 包含二十二碳六烯酸的饲料制剂 |
US20100248322A1 (en) | 2006-04-05 | 2010-09-30 | Luca Technologies, Inc. | Chemical amendments for the stimulation of biogenic gas generation in deposits of carbonaceous material |
US7309602B2 (en) | 2006-04-13 | 2007-12-18 | Ambrozea, Inc. | Compositions and methods for producing fermentation products and residuals |
EP2018174A4 (en) | 2006-04-13 | 2010-03-31 | Ambrozea Inc | COMPOSITIONS AND METHODS FOR PRODUCING FERMENTATION PRODUCTS AND RESIDUES |
WO2007134294A2 (en) | 2006-05-12 | 2007-11-22 | Arizona Board Of Regents, A Body Corporate Of The State Of Az Acting For & On Behalf Of Az State Unviversity | Novel chlorella species and uses therefor |
EP2035553A1 (en) | 2006-06-06 | 2009-03-18 | Total Raffinage Marketing | Lysophosphatidic acid acyltransferase genes and uses thereof |
RU2483057C2 (ru) | 2006-06-28 | 2013-05-27 | Ньюселис Инк. | Смеси жирных кислот и их применение |
CN101108997B (zh) | 2006-07-19 | 2010-07-21 | 中国科学院大连化学物理研究所 | 一种微生物油脂的制备方法 |
US20080188676A1 (en) | 2006-09-14 | 2008-08-07 | Anderson Gregory A | Methods of robust and efficient conversion of cellular lipids to biofuels |
MX2009002835A (es) | 2006-09-18 | 2009-08-07 | Univ Arizona | Ácidos grasos e hidrocarburos de longitud de cadena media de algas. |
JP2008081559A (ja) | 2006-09-26 | 2008-04-10 | Nippon Shokubai Co Ltd | バイオディーゼル燃料組成物およびその製造方法 |
US8367395B2 (en) | 2006-09-28 | 2013-02-05 | Dsm Ip Assets B.V. | Production of sterols in oleaginous yeast and fungi |
EP2076484B1 (en) | 2006-10-13 | 2020-01-08 | Elevance Renewable Sciences, Inc. | Synthesis of terminal alkenes from internal alkenes via olefin metathesis |
US9101161B2 (en) | 2006-11-02 | 2015-08-11 | The Coca-Cola Company | High-potency sweetener composition with phytoestrogen and compositions sweetened therewith |
US8088614B2 (en) | 2006-11-13 | 2012-01-03 | Aurora Algae, Inc. | Methods and compositions for production and purification of biofuel from plants and microalgae |
ITMI20062193A1 (it) | 2006-11-15 | 2008-05-16 | Eni Spa | Processo per produrre frazioni idrocarburiche da miscele di origine biologica |
JP4820277B2 (ja) | 2006-12-20 | 2011-11-24 | 花王株式会社 | ケトン体及び/又は2級アルコールの製造法 |
JP2008178871A (ja) | 2006-12-28 | 2008-08-07 | Tohoku Techno Arch Co Ltd | 強塩基性陰イオン交換樹脂の再生方法 |
US7905930B2 (en) | 2006-12-29 | 2011-03-15 | Genifuel Corporation | Two-stage process for producing oil from microalgae |
US9003695B2 (en) | 2006-12-29 | 2015-04-14 | Genifuel Corporation | Controlled growth environments for algae cultivation |
EP2116597A4 (en) | 2007-02-02 | 2010-12-15 | Kirin Holdings Kk | DNA CODING FOR XYLITOL DEHYDROGENASE |
US8129512B2 (en) | 2007-04-12 | 2012-03-06 | Pioneer Hi-Bred International, Inc. | Methods of identifying and creating rubisco large subunit variants with improved rubisco activity, compositions and methods of use thereof |
AU2008247252B2 (en) | 2007-05-02 | 2012-08-30 | Ouro Fino Participacoes E Empreendimentos S.A. | Process to produce biodiesel and/or fuel oil |
EP2155796A1 (en) | 2007-05-15 | 2010-02-24 | Dow Global Technologies Inc. | High resilience foams |
US8801975B2 (en) | 2007-05-17 | 2014-08-12 | Cooper Industries, Llc | Vegetable oil dielectric fluid composition |
US7914832B2 (en) | 2007-06-01 | 2011-03-29 | Kyoto Eiyo Co., Ltd. | Method for producing chlorella fermented food |
ES2607795T3 (es) | 2007-06-12 | 2017-04-04 | Cps Biofuels, Inc. | Producción de gasolina a partir de materias primas fermentables |
US20090018300A1 (en) | 2007-07-11 | 2009-01-15 | Archer-Daniels-Midland Company | Monomers and polymers from bioderived carbon |
CN101092353B (zh) | 2007-07-12 | 2010-12-01 | 上海交通大学 | 动植物油脂转化脂肪酸单酯的制备方法 |
EA023523B1 (ru) | 2007-08-31 | 2016-06-30 | Мартек Биосайнсиз Корпорейшн | Твердые жировые композиции, содержащие полиненасыщенные жирные кислоты, и способы их получения и использования |
MX2010002825A (es) | 2007-09-12 | 2010-08-31 | Martek Biosciences Corp | Aceites biologicos y produccion y usos de los mismos. |
US20090176272A1 (en) | 2007-09-12 | 2009-07-09 | Kuehnle Agrosystems, Inc. | Expression of nucleic acid sequences for production of biofuels and other products in algae and cyanobacteria |
US20090117253A1 (en) | 2007-10-03 | 2009-05-07 | E. I. Du Pont De Nemours And Company | Peroxisome biogenesis factor protein (pex) disruptions for altering polyunsaturated fatty acids and total lipid content in oleaginous eukaryotic organisms |
EP2211881A4 (en) | 2007-11-01 | 2012-01-04 | Wake Forest University School Of Medicine | COMPOSITIONS AND METHODS FOR PREVENTING AND TREATING DISEASES AFFECTING MAMMALS |
FR2924126B1 (fr) | 2007-11-28 | 2011-04-15 | Roquette Freres | Nouveau procede de culture d'une microalgue heterotrophe |
US20090145392A1 (en) | 2007-11-30 | 2009-06-11 | Clark Richard Hugh | Fuel formulations |
US8815567B2 (en) | 2007-11-30 | 2014-08-26 | E I Du Pont De Nemours And Company | Coenzyme Q10 production in a recombinant oleaginous yeast |
GB0724720D0 (en) | 2007-12-19 | 2008-01-30 | Ici Plc | Triglyceride macromonomers |
WO2009105620A1 (en) | 2008-02-20 | 2009-08-27 | Cco Technology, Ltd. | Selective short chain monounsaturated oils |
CN101230364A (zh) | 2008-02-25 | 2008-07-30 | 清华大学 | 一种利用异养小球藻高密度发酵生产生物柴油的方法 |
US8048654B2 (en) | 2010-06-09 | 2011-11-01 | Joule Unlimited Technologies, Inc. | Methods and compositions for the recombinant biosynthesis of fatty acids and esters |
US8598378B2 (en) | 2008-03-14 | 2013-12-03 | University Of Hawaii | Methods and compositions for extraction and transesterification of biomass components |
US8043496B1 (en) | 2008-03-18 | 2011-10-25 | Peter Allen Schuh | System for extracting oil from algae |
US9487790B2 (en) | 2008-03-31 | 2016-11-08 | Kuehnle Agrosystems, Inc. | Nuclear based expression of genes for production of biofuels and process co-products in algae |
US20100170144A1 (en) | 2008-04-09 | 2010-07-08 | Solazyme, Inc. | Hydroprocessing Microalgal Oils |
EP2265724A4 (en) | 2008-04-09 | 2013-01-23 | Solazyme Inc | Direct chemical modification of microbial biomass and microbial oils |
US20110065821A1 (en) | 2008-05-13 | 2011-03-17 | Cargill, Incorporated | Polyol made from partialy hydrogenated, fully epoxidized natural oils |
CN101280328B (zh) | 2008-05-27 | 2011-06-29 | 清华大学 | 一种从自养到异养两步培养小球藻生产生物柴油的方法 |
US8435790B2 (en) | 2008-07-25 | 2013-05-07 | The Regents Of The University Of California | Methods of modulating lipid concentrations in eukaryotic cells |
CA2732078A1 (en) | 2008-07-28 | 2010-02-04 | University Of Massachusetts | Methods and compositions for improving the production of products in microorganisms |
US8273694B2 (en) | 2008-07-28 | 2012-09-25 | Jeffrey A Brown | Synthetic compositions obtained from algae |
CA2638451A1 (en) | 2008-08-01 | 2010-02-01 | Profero Energy Inc. | Methods and systems for gas production from a reservoir |
US20100035309A1 (en) | 2008-08-06 | 2010-02-11 | Luca Technologies, Inc. | Analysis and enhancement of metabolic pathways for methanogenesis |
US8927475B2 (en) | 2008-08-08 | 2015-01-06 | The Dial Corporation | Consumer products comprising algae derived ingredients |
WO2010019813A2 (en) | 2008-08-13 | 2010-02-18 | Sapphire Energy, Inc. | Production of fatty actds by genetically modified photosynthetic organisms |
NZ591972A (en) | 2008-10-03 | 2013-04-26 | Agrisoma Biosciences Inc | Production of modified fatty acids in plants |
WO2010042664A2 (en) | 2008-10-07 | 2010-04-15 | Ls9, Inc. | Method and compositions for producing fatty aldehydes |
US20100303961A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Methods of Inducing Satiety |
US20100303989A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Microalgal Flour |
US20130122180A1 (en) | 2008-10-14 | 2013-05-16 | Solazyme, Inc. | Microalgal Food Compositions |
US20100297323A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Gluten-free Foods Containing Microalgae |
US20100303957A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Edible Oil and Processes for Its Production from Microalgae |
US20120128851A1 (en) | 2008-10-14 | 2012-05-24 | Solazyme, Inc | Novel microalgal food compositions |
US20100297296A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Healthier Baked Goods Containing Microalgae |
US20100297295A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Microalgae-Based Beverages |
US20100297325A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Egg Products Containing Microalgae |
US20100297292A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Reduced Pigmentation Microalgae Strains and Products Therefrom |
US20100303990A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | High Protein and High Fiber Algal Food Materials |
PT2339925T (pt) | 2008-10-14 | 2022-12-30 | Corbion Biotech Inc | Composições alimentares de biomassa microalgal |
US20100297331A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Reduced Fat Foods Containing High-Lipid Microalgae with Improved Sensory Properties |
US8003365B2 (en) | 2008-12-11 | 2011-08-23 | Bio Architecture Lab, Inc. | Biosynthesis of commodity chemicals |
US9175234B2 (en) | 2008-12-23 | 2015-11-03 | REG Life Sciences, LLC | Methods and compositions related to thioesterase enzymes |
US8389625B2 (en) | 2008-12-23 | 2013-03-05 | Exxonmobil Research And Engineering Company | Production of synthetic hydrocarbon fluids, plasticizers and synthetic lubricant base stocks from renewable feedstocks |
US20100196575A1 (en) | 2009-01-30 | 2010-08-05 | Solae, Llc | Melting Vegetable Protein Based Substitute Cheese |
GB0903717D0 (en) | 2009-03-04 | 2009-04-15 | Innochem Ltd | Flexible polyurethane foam |
CN101824440A (zh) | 2009-03-04 | 2010-09-08 | 中国科学院大连化学物理研究所 | 一种微生物油脂的分离方法 |
WO2010111698A2 (en) | 2009-03-27 | 2010-09-30 | E. I. Du Pont De Nemours And Company | Dielectric heat-transfer fluid |
JP5636039B2 (ja) | 2009-04-14 | 2014-12-03 | ソラザイム、インクSolazyme Inc | 新規微細藻類食物組成物 |
EP2821492A3 (en) | 2009-05-13 | 2015-04-08 | BASF Plant Science Company GmbH | Acyltransferases and uses thereof in fatty acid production |
WO2011026008A1 (en) | 2009-08-28 | 2011-03-03 | Phycal Llc | Biofuel from recombinant oleginous algae using sugar carbon sources |
CA2774975C (en) | 2009-09-25 | 2019-11-05 | Ls9, Inc. | Production of fatty acid derivatives in recombinant bacterial cells expressing an ester synthase variant |
EP2327776A1 (en) | 2009-11-30 | 2011-06-01 | Institut National De La Recherche Agronomique | Method for the production of Very Long Chain Fatty Acids (VLCFA) by fermentation with a recombinant Yarrowia sp |
AU2010330777B2 (en) | 2009-12-18 | 2014-10-23 | Pioneer Hi-Bred International, Inc. | Brassica plants yielding oils with a low total saturated fatty acid content |
EP2519642B1 (en) | 2009-12-28 | 2017-10-25 | DSM IP Assets B.V. | Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof |
WO2011082253A2 (en) | 2009-12-30 | 2011-07-07 | Board Of Trustees Of Michigan State University | A method to produce acetyldiacylglycerols (ac-tags) by expression ofan acetyltransferase gene isolated from euonymus alatus (burning bush) |
US20110256268A1 (en) | 2010-04-14 | 2011-10-20 | Solazyme, Inc. | Oleaginous Yeast Food Compositions |
CA2796395C (en) | 2010-04-14 | 2019-01-15 | Solazyme Roquette Nutritionals, LLC | Lipid-rich microalgal flour food compositions |
EP2558565A4 (en) | 2010-04-14 | 2014-01-29 | Solazyme Inc | FUEL AND CHEMICAL PRODUCTION OF OIL-HOLDING YEAST |
CN103124499B (zh) | 2010-05-28 | 2016-09-28 | 泰拉瑞亚控股公司 | 包含特制油的食品组合物 |
MX354145B (es) | 2010-11-03 | 2018-02-14 | Terravia Holdings Inc | Aceites microbianos con puntos de fluidez reducidos, fluidos dielectricos producidos a partir de estos y metodos relacionados. |
WO2012087673A1 (en) | 2010-12-23 | 2012-06-28 | Exxonmobil Research And Engineering Company | Prokaryotic acyl-acp thioesterases for producing fatty acids in genetically engineered microorganisms |
KR102117225B1 (ko) | 2011-02-02 | 2020-06-02 | 테라비아 홀딩스 인코포레이티드 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
WO2012145626A1 (en) | 2011-04-22 | 2012-10-26 | Ancora Pharmaceuticals Inc. | Synthetic oligosaccharides for staphylococcus vaccine |
AU2012253803A1 (en) | 2011-05-06 | 2013-12-05 | Terravia Holdings, Inc. | Genetically engineered microorganisms that metabolize xylose |
US9328351B2 (en) | 2011-11-28 | 2016-05-03 | Solazyme, Inc. | Genetically engineered microbial strains including Prototheca lipid pathway genes |
SG11201403419SA (en) | 2011-12-23 | 2014-07-30 | Solazyme Inc | Algal thermoplastics, thermosets, paper, adsorbants and absorbants |
US9719114B2 (en) | 2012-04-18 | 2017-08-01 | Terravia Holdings, Inc. | Tailored oils |
CA2870364A1 (en) | 2012-04-18 | 2013-10-24 | Solazyme, Inc. | Recombinant microbes with modified fatty acid synthetic pathway enzymes and uses thereof |
BR112015021638A2 (pt) | 2013-03-08 | 2017-07-18 | Solazyme Inc | fluido de perfuração, método para perfuração de um orifício de perfuração, lubrificante, fluido de metalurgia, e, máquina de perfuração de microtúneis |
US9249252B2 (en) | 2013-04-26 | 2016-02-02 | Solazyme, Inc. | Low polyunsaturated fatty acid oils and uses thereof |
SG10201802834YA (en) | 2013-10-04 | 2018-05-30 | Terravia Holdings Inc | Tailored oils |
US9394550B2 (en) | 2014-03-28 | 2016-07-19 | Terravia Holdings, Inc. | Lauric ester compositions |
EP3167053B1 (en) | 2014-07-10 | 2019-10-09 | Corbion Biotech, Inc. | Novel ketoacyl acp synthase genes and uses thereof |
BR112017001404A2 (pt) | 2014-07-24 | 2017-11-21 | Terravia Holdings Inc | tioesterases variantes e métodos de utilização |
JP2018512851A (ja) | 2015-04-06 | 2018-05-24 | テラヴィア ホールディングス, インコーポレイテッド | Lpaatアブレーションを有する油産生微細藻類 |
JP2018531043A (ja) | 2015-09-28 | 2018-10-25 | コービオン バイオテック, インコーポレイテッド | 不斉トリグリセリド分子を有するトリグリセリド油 |
-
2012
- 2012-02-02 KR KR1020197008914A patent/KR102117225B1/ko active IP Right Grant
- 2012-02-02 BR BR112013019699A patent/BR112013019699A2/pt not_active Application Discontinuation
- 2012-02-02 CN CN201910164460.0A patent/CN110066836A/zh active Pending
- 2012-02-02 US US13/365,253 patent/US9249436B2/en active Active
- 2012-02-02 CN CN201280007593.3A patent/CN103827307A/zh active Pending
- 2012-02-02 KR KR1020137023181A patent/KR101964965B1/ko active IP Right Grant
- 2012-02-02 EP EP19191818.4A patent/EP3643774A1/en not_active Withdrawn
- 2012-02-02 EP EP12741997.6A patent/EP2670855B1/en active Active
- 2012-02-02 MX MX2013008651A patent/MX344012B/es active IP Right Grant
- 2012-02-02 CA CA2825691A patent/CA2825691C/en active Active
- 2012-02-02 AU AU2012212079A patent/AU2012212079B2/en active Active
- 2012-02-02 WO PCT/US2012/023696 patent/WO2012106560A1/en active Application Filing
- 2012-02-02 MX MX2016015902A patent/MX351063B/es unknown
- 2012-02-02 SG SG2013058870A patent/SG192594A1/en unknown
- 2012-02-02 JP JP2013552645A patent/JP6071904B2/ja active Active
- 2012-07-12 US US13/547,457 patent/US8852885B2/en not_active Expired - Fee Related
- 2012-10-11 US US13/650,024 patent/US8633012B2/en active Active
-
2015
- 2015-12-18 US US14/974,983 patent/US10100341B2/en active Active
-
2016
- 2016-07-25 JP JP2016145348A patent/JP6513058B2/ja active Active
- 2016-10-20 AU AU2016247159A patent/AU2016247159B2/en active Active
-
2018
- 2018-03-28 JP JP2018061680A patent/JP2018099138A/ja active Pending
- 2018-09-07 US US16/125,580 patent/US20190100780A1/en not_active Abandoned
-
2019
- 2019-01-31 AU AU2019200668A patent/AU2019200668A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002008403A2 (en) * | 2000-07-25 | 2002-01-31 | Calgene Llc | Nucleic acid sequences encoding beta-ketoacyl-acp synthase and uses thereof |
JP2010528627A (ja) | 2007-06-01 | 2010-08-26 | ソラザイム、インク | 微生物による油の生産 |
WO2009076559A1 (en) | 2007-12-11 | 2009-06-18 | Synthetic Genomics, Inc. | Secretion of fatty aicds by photosynthetic microorganisms |
WO2010063032A2 (en) * | 2008-11-28 | 2010-06-03 | Solazyme, Inc. | Production of tailored oils in heterotrophic microorganisms |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2016247159B2 (en) | Tailored oils produced from recombinant oleaginous microorganisms | |
KR101916421B1 (ko) | 종속영양 미생물유기체로부터 생성된 맞춤 오일 | |
KR101780799B1 (ko) | 재조합 종속영양성 미생물에서 맞춤 오일의 제조 | |
KR20150001830A (ko) | 맞춤 오일 | |
US20140357746A1 (en) | Low Polyunsaturated Fatty Acid Oils and Uses Thereof | |
KR20140131602A (ko) | 미생물에서 오일의 생성 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |