CN101848996A - △9延伸酶及其在制备多不饱和脂肪酸中的用途 - Google Patents
△9延伸酶及其在制备多不饱和脂肪酸中的用途 Download PDFInfo
- Publication number
- CN101848996A CN101848996A CN200880020395A CN200880020395A CN101848996A CN 101848996 A CN101848996 A CN 101848996A CN 200880020395 A CN200880020395 A CN 200880020395A CN 200880020395 A CN200880020395 A CN 200880020395A CN 101848996 A CN101848996 A CN 101848996A
- Authority
- CN
- China
- Prior art keywords
- seq
- sequence
- acid
- host cell
- enzyme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 title abstract description 64
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 99
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 62
- PRHHYVQTPBEDFE-UHFFFAOYSA-N eicosatrienoic acid Natural products CCCCCC=CCC=CCCCCC=CCCCC(O)=O PRHHYVQTPBEDFE-UHFFFAOYSA-N 0.000 claims abstract description 10
- XSXIVVZCUAHUJO-AVQMFFATSA-N (11e,14e)-icosa-11,14-dienoic acid Chemical compound CCCCC\C=C\C\C=C\CCCCCCCCCC(O)=O XSXIVVZCUAHUJO-AVQMFFATSA-N 0.000 claims abstract description 9
- 235000021297 Eicosadienoic acid Nutrition 0.000 claims abstract description 9
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 claims abstract description 9
- AHANXAKGNAKFSK-PDBXOOCHSA-N all-cis-icosa-11,14,17-trienoic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCCCC(O)=O AHANXAKGNAKFSK-PDBXOOCHSA-N 0.000 claims abstract description 7
- 229960004488 linolenic acid Drugs 0.000 claims abstract description 7
- 108090000790 Enzymes Proteins 0.000 claims description 197
- 102000004190 Enzymes Human genes 0.000 claims description 196
- 238000000034 method Methods 0.000 claims description 98
- 125000003729 nucleotide group Chemical group 0.000 claims description 87
- 239000002773 nucleotide Substances 0.000 claims description 86
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 64
- 229920001184 polypeptide Polymers 0.000 claims description 59
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 59
- 235000019197 fats Nutrition 0.000 claims description 54
- 108020004705 Codon Proteins 0.000 claims description 44
- 230000000813 microbial effect Effects 0.000 claims description 43
- 238000009396 hybridization Methods 0.000 claims description 42
- 230000000694 effects Effects 0.000 claims description 33
- 241000235070 Saccharomyces Species 0.000 claims description 25
- 102000039446 nucleic acids Human genes 0.000 claims description 25
- 108020004707 nucleic acids Proteins 0.000 claims description 25
- 241000894006 Bacteria Species 0.000 claims description 23
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 22
- 235000001014 amino acid Nutrition 0.000 claims description 22
- 150000001413 amino acids Chemical class 0.000 claims description 22
- 108091033319 polynucleotide Proteins 0.000 claims description 22
- 102000040430 polynucleotide Human genes 0.000 claims description 22
- 239000002157 polynucleotide Substances 0.000 claims description 22
- 238000005457 optimization Methods 0.000 claims description 20
- 230000000295 complement effect Effects 0.000 claims description 18
- 241000894007 species Species 0.000 claims description 13
- 241000195493 Cryptophyta Species 0.000 claims description 12
- 241000233866 Fungi Species 0.000 claims description 12
- 241000255640 Loa loa Species 0.000 claims description 12
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 claims description 12
- 241000223252 Rhodotorula Species 0.000 claims description 8
- 235000020661 alpha-linolenic acid Nutrition 0.000 claims description 6
- 229960004232 linoleic acid Drugs 0.000 claims description 6
- 238000004064 recycling Methods 0.000 claims description 5
- 241001467333 Thraustochytriaceae Species 0.000 claims description 4
- 241000223230 Trichosporon Species 0.000 claims description 4
- 241001527609 Cryptococcus Species 0.000 claims description 3
- BBWMTEYXFFWPIF-CJBMEHDJSA-N (2e,4e,6e)-icosa-2,4,6-trienoic acid Chemical compound CCCCCCCCCCCCC\C=C\C=C\C=C\C(O)=O BBWMTEYXFFWPIF-CJBMEHDJSA-N 0.000 claims description 2
- 241000003595 Aurantiochytrium limacinum Species 0.000 claims description 2
- 241000235575 Mortierella Species 0.000 claims 1
- 239000012634 fragment Substances 0.000 abstract description 20
- 235000020978 long-chain polyunsaturated fatty acids Nutrition 0.000 abstract description 7
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 abstract description 2
- 235000020778 linoleic acid Nutrition 0.000 abstract 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 206
- 108090000623 proteins and genes Proteins 0.000 description 188
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 98
- 210000004027 cell Anatomy 0.000 description 98
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 94
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 89
- 230000014509 gene expression Effects 0.000 description 87
- 150000002632 lipids Chemical class 0.000 description 76
- 239000002253 acid Substances 0.000 description 71
- 108020004414 DNA Proteins 0.000 description 67
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 56
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 54
- 239000003925 fat Substances 0.000 description 53
- 239000013612 plasmid Substances 0.000 description 51
- 239000000523 sample Substances 0.000 description 43
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 42
- 241001517212 Euglenaria anabaena Species 0.000 description 34
- 239000000047 product Substances 0.000 description 33
- 102000004169 proteins and genes Human genes 0.000 description 32
- 235000018102 proteins Nutrition 0.000 description 30
- 238000013459 approach Methods 0.000 description 29
- 239000003921 oil Substances 0.000 description 29
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 28
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 28
- 238000006243 chemical reaction Methods 0.000 description 27
- 108020004999 messenger RNA Proteins 0.000 description 27
- 230000008859 change Effects 0.000 description 25
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 24
- 239000002299 complementary DNA Substances 0.000 description 24
- 230000001105 regulatory effect Effects 0.000 description 24
- 239000000758 substrate Substances 0.000 description 24
- 239000000194 fatty acid Substances 0.000 description 23
- 238000006555 catalytic reaction Methods 0.000 description 22
- HOBAELRKJCKHQD-UHFFFAOYSA-N (8Z,11Z,14Z)-8,11,14-eicosatrienoic acid Natural products CCCCCC=CCC=CCC=CCCCCCCC(O)=O HOBAELRKJCKHQD-UHFFFAOYSA-N 0.000 description 21
- 230000001276 controlling effect Effects 0.000 description 21
- HOBAELRKJCKHQD-QNEBEIHSSA-N dihomo-γ-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HOBAELRKJCKHQD-QNEBEIHSSA-N 0.000 description 21
- 239000002609 medium Substances 0.000 description 21
- 244000005700 microbiome Species 0.000 description 21
- 229940024606 amino acid Drugs 0.000 description 19
- MBMBGCFOFBJSGT-KUBAVDMBSA-N docosahexaenoic acid Natural products CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 description 19
- 239000000203 mixture Substances 0.000 description 19
- 108010022240 delta-8 fatty acid desaturase Proteins 0.000 description 18
- 229910052799 carbon Inorganic materials 0.000 description 17
- 235000014113 dietary fatty acids Nutrition 0.000 description 17
- 229930195729 fatty acid Natural products 0.000 description 17
- 150000004665 fatty acids Chemical class 0.000 description 17
- 230000012010 growth Effects 0.000 description 17
- 238000013519 translation Methods 0.000 description 17
- -1 Δ 12 desaturases Proteins 0.000 description 17
- 235000020664 gamma-linolenic acid Nutrition 0.000 description 15
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 15
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 241000195619 Euglena gracilis Species 0.000 description 13
- 102220369445 c.668T>C Human genes 0.000 description 13
- 235000013305 food Nutrition 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 230000003570 biosynthesizing effect Effects 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 235000020665 omega-6 fatty acid Nutrition 0.000 description 12
- 102100034544 Acyl-CoA 6-desaturase Human genes 0.000 description 11
- 241000195620 Euglena Species 0.000 description 11
- 108010037138 Linoleoyl-CoA Desaturase Proteins 0.000 description 11
- 102220369446 c.1274G>A Human genes 0.000 description 11
- 238000006062 fragmentation reaction Methods 0.000 description 11
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical class CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 11
- 229940012843 omega-3 fatty acid Drugs 0.000 description 11
- 229940033080 omega-6 fatty acid Drugs 0.000 description 11
- 238000003752 polymerase chain reaction Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 10
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 10
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 10
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 10
- 239000004141 Sodium laurylsulphate Substances 0.000 description 10
- 238000013467 fragmentation Methods 0.000 description 10
- 239000013067 intermediate product Substances 0.000 description 10
- 235000021313 oleic acid Nutrition 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 9
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 9
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 9
- 102100034542 Acyl-CoA (8-3)-desaturase Human genes 0.000 description 9
- 108010073542 Delta-5 Fatty Acid Desaturase Proteins 0.000 description 9
- 239000005642 Oleic acid Substances 0.000 description 9
- 108700026244 Open Reading Frames Proteins 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 9
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 9
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 230000014621 translational initiation Effects 0.000 description 9
- 238000005406 washing Methods 0.000 description 9
- 108700010070 Codon Usage Proteins 0.000 description 8
- 101000912235 Rebecca salina Acyl-lipid (7-3)-desaturase Proteins 0.000 description 8
- 108020004511 Recombinant DNA Proteins 0.000 description 8
- 101000877236 Siganus canaliculatus Acyl-CoA Delta-4 desaturase Proteins 0.000 description 8
- 230000003321 amplification Effects 0.000 description 8
- 238000010276 construction Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 239000002243 precursor Substances 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- TUNFSRHWOTWDNC-UHFFFAOYSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 8
- 241000192542 Anabaena Species 0.000 description 7
- 108010087894 Fatty acid desaturases Proteins 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 7
- 108091081024 Start codon Proteins 0.000 description 7
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 108010011713 delta-15 desaturase Proteins 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 230000004060 metabolic process Effects 0.000 description 7
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 7
- 102220023257 rs387907546 Human genes 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- AVKOENOBFIYBSA-WMPRHZDHSA-N (4Z,7Z,10Z,13Z,16Z)-docosa-4,7,10,13,16-pentaenoic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O AVKOENOBFIYBSA-WMPRHZDHSA-N 0.000 description 6
- 241000024188 Andala Species 0.000 description 6
- 102000036181 Fatty Acid Elongases Human genes 0.000 description 6
- 108010058732 Fatty Acid Elongases Proteins 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- WQDUMFSSJAZKTM-UHFFFAOYSA-N Sodium methoxide Chemical compound [Na+].[O-]C WQDUMFSSJAZKTM-UHFFFAOYSA-N 0.000 description 6
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 6
- 239000005516 coenzyme A Substances 0.000 description 6
- 229940093530 coenzyme a Drugs 0.000 description 6
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 6
- 239000012530 fluid Substances 0.000 description 6
- 235000013350 formula milk Nutrition 0.000 description 6
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 102100028897 Stearoyl-CoA desaturase Human genes 0.000 description 5
- 238000013016 damping Methods 0.000 description 5
- 238000010230 functional analysis Methods 0.000 description 5
- 239000001963 growth medium Substances 0.000 description 5
- 230000000968 intestinal effect Effects 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 238000007899 nucleic acid hybridization Methods 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 238000001556 precipitation Methods 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 229920001817 Agar Polymers 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 235000021355 Stearic acid Nutrition 0.000 description 4
- 108700005078 Synthetic Genes Proteins 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000008034 disappearance Effects 0.000 description 4
- 230000032050 esterification Effects 0.000 description 4
- 238000005886 esterification reaction Methods 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 230000008521 reorganization Effects 0.000 description 4
- 230000003362 replicative effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 150000004671 saturated fatty acids Chemical class 0.000 description 4
- 239000008117 stearic acid Substances 0.000 description 4
- 238000005809 transesterification reaction Methods 0.000 description 4
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- PRHHYVQTPBEDFE-URZBRJKDSA-N (5Z,11Z,14Z)-icosatrienoic acid Chemical compound CCCCC\C=C/C\C=C/CCCC\C=C/CCCC(O)=O PRHHYVQTPBEDFE-URZBRJKDSA-N 0.000 description 3
- JDKIKEYFSJUYJZ-OUJQXAOTSA-N (5Z,11Z,14Z,17Z)-icosatetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCC\C=C/CCCC(O)=O JDKIKEYFSJUYJZ-OUJQXAOTSA-N 0.000 description 3
- 102000057234 Acyl transferases Human genes 0.000 description 3
- 108700016155 Acyl transferases Proteins 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 3
- 241000195623 Euglenida Species 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- 241000907999 Mortierella alpina Species 0.000 description 3
- 229940096437 Protein S Drugs 0.000 description 3
- 229940100389 Sulfonylurea Drugs 0.000 description 3
- 241000235015 Yarrowia lipolytica Species 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- HQPCSDADVLFHHO-LTKCOYKYSA-N all-cis-8,11,14,17-icosatetraenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HQPCSDADVLFHHO-LTKCOYKYSA-N 0.000 description 3
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 150000001721 carbon Chemical group 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000013599 cloning vector Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 3
- 230000009483 enzymatic pathway Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 238000007429 general method Methods 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 235000011187 glycerol Nutrition 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 238000012269 metabolic engineering Methods 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 235000008935 nutritious Nutrition 0.000 description 3
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 3
- 108010033653 omega-3 fatty acid desaturase Proteins 0.000 description 3
- SECPZKHBENQXJG-FPLPWBNLSA-N palmitoleic acid Chemical compound CCCCCC\C=C/CCCCCCCC(O)=O SECPZKHBENQXJG-FPLPWBNLSA-N 0.000 description 3
- NLKNQRATVPKPDG-UHFFFAOYSA-M potassium iodide Chemical compound [K+].[I-] NLKNQRATVPKPDG-UHFFFAOYSA-M 0.000 description 3
- 230000002035 prolonged effect Effects 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000001509 sodium citrate Substances 0.000 description 3
- 230000002269 spontaneous effect Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 3
- 229940038773 trisodium citrate Drugs 0.000 description 3
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 3
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- PIFPCDRPHCQLSJ-WYIJOVFWSA-N 4,8,12,15,19-Docosapentaenoic acid Chemical compound CC\C=C\CC\C=C\C\C=C\CC\C=C\CC\C=C\CCC(O)=O PIFPCDRPHCQLSJ-WYIJOVFWSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108010000700 Acetolactate synthase Proteins 0.000 description 2
- 101100434663 Bacillus subtilis (strain 168) fbaA gene Proteins 0.000 description 2
- 108010023063 Bacto-peptone Proteins 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- PIFPCDRPHCQLSJ-UHFFFAOYSA-N Clupanodonic acid Natural products CCC=CCCC=CCC=CCCC=CCCC=CCCC(O)=O PIFPCDRPHCQLSJ-UHFFFAOYSA-N 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 229930183912 Cytidylic acid Natural products 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 235000021298 Dihomo-γ-linolenic acid Nutrition 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 101150095274 FBA1 gene Proteins 0.000 description 2
- 102000009114 Fatty acid desaturases Human genes 0.000 description 2
- 229920001917 Ficoll Polymers 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 108700023863 Gene Components Proteins 0.000 description 2
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 206010027336 Menstruation delayed Diseases 0.000 description 2
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 108091034057 RNA (poly(A)) Proteins 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 2
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 2
- HXWJFEZDFPRLBG-UHFFFAOYSA-N Timnodonic acid Natural products CCCC=CC=CCC=CCC=CCC=CCCCC(O)=O HXWJFEZDFPRLBG-UHFFFAOYSA-N 0.000 description 2
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- CKUAXEQHGKSLHN-UHFFFAOYSA-N [C].[N] Chemical compound [C].[N] CKUAXEQHGKSLHN-UHFFFAOYSA-N 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 229950006790 adenosine phosphate Drugs 0.000 description 2
- 101150099105 alien gene Proteins 0.000 description 2
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 235000021342 arachidonic acid Nutrition 0.000 description 2
- 229940114079 arachidonic acid Drugs 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 244000309466 calf Species 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 235000011089 carbon dioxide Nutrition 0.000 description 2
- 239000012159 carrier gas Substances 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 2
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 2
- 235000015872 dietary supplement Nutrition 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- DVSZKTAMJJTWFG-UHFFFAOYSA-N docosa-2,4,6,8,10,12-hexaenoic acid Chemical compound CCCCCCCCCC=CC=CC=CC=CC=CC=CC(O)=O DVSZKTAMJJTWFG-UHFFFAOYSA-N 0.000 description 2
- IQLUYYHUNSSHIY-HZUMYPAESA-N eicosatetraenoic acid Chemical compound CCCCCCCCCCC\C=C\C=C\C=C\C=C\C(O)=O IQLUYYHUNSSHIY-HZUMYPAESA-N 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000004129 fatty acid metabolism Effects 0.000 description 2
- 239000005350 fused silica glass Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- IFYYFLINQYPWGJ-UHFFFAOYSA-N gamma-decalactone Chemical compound CCCCCCC1CCC(=O)O1 IFYYFLINQYPWGJ-UHFFFAOYSA-N 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- LTYOQGRJFJAKNA-IJCONWDESA-N malonyl-coenzyme a Chemical compound O[C@@H]1[C@@H](OP(O)(O)=O)[C@H](CO[P@](O)(=O)O[P@@](O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-IJCONWDESA-N 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 150000004702 methyl esters Chemical class 0.000 description 2
- 235000010755 mineral Nutrition 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 235000021290 n-3 DPA Nutrition 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 238000003499 nucleic acid array Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- CNVZJPUDSLNTQU-SEYXRHQNSA-N petroselinic acid Chemical compound CCCCCCCCCCC\C=C/CCCCC(O)=O CNVZJPUDSLNTQU-SEYXRHQNSA-N 0.000 description 2
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 2
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000005477 standard model Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 150000003722 vitamin derivatives Chemical class 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- WBBQTNCISCKUMU-PDBXOOCHSA-N (13Z,16Z,19Z)-docosatrienoic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCCCCCC(O)=O WBBQTNCISCKUMU-PDBXOOCHSA-N 0.000 description 1
- PORPENFLTBBHSG-MGBGTMOVSA-N 1,2-dihexadecanoyl-sn-glycerol-3-phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(O)=O)OC(=O)CCCCCCCCCCCCCCC PORPENFLTBBHSG-MGBGTMOVSA-N 0.000 description 1
- OUKQYSCCWVCDKU-UHFFFAOYSA-N 1-[(3,4-diethoxyphenyl)methyl]-6,7-diethoxy-3,4-dihydroisoquinolin-2-ium;2-(1,3-dimethyl-2,6-dioxopurin-7-yl)acetate Chemical compound O=C1N(C)C(=O)N(C)C2=C1N(CC(O)=O)C=N2.C1=C(OCC)C(OCC)=CC=C1CC1=NCCC2=CC(OCC)=C(OCC)C=C12 OUKQYSCCWVCDKU-UHFFFAOYSA-N 0.000 description 1
- OXEDXHIBHVMDST-UHFFFAOYSA-N 12Z-octadecenoic acid Natural products CCCCCC=CCCCCCCCCCCC(O)=O OXEDXHIBHVMDST-UHFFFAOYSA-N 0.000 description 1
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 1
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- WYMDDFRYORANCC-UHFFFAOYSA-N 2-[[3-[bis(carboxymethyl)amino]-2-hydroxypropyl]-(carboxymethyl)amino]acetic acid Chemical compound OC(=O)CN(CC(O)=O)CC(O)CN(CC(O)=O)CC(O)=O WYMDDFRYORANCC-UHFFFAOYSA-N 0.000 description 1
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- 101710161460 3-oxoacyl-[acyl-carrier-protein] synthase Proteins 0.000 description 1
- LODRRYMGPWQCTR-UHFFFAOYSA-N 5-fluoro-2,4-dioxo-1h-pyrimidine-6-carboxylic acid;hydrate Chemical compound O.OC(=O)C=1NC(=O)NC(=O)C=1F LODRRYMGPWQCTR-UHFFFAOYSA-N 0.000 description 1
- WGPCZPLRVAWXPW-NSHDSACASA-N 5-octyloxolan-2-one Chemical compound CCCCCCCC[C@H]1CCC(=O)O1 WGPCZPLRVAWXPW-NSHDSACASA-N 0.000 description 1
- 101150106774 9 gene Proteins 0.000 description 1
- 241000224423 Acanthamoeba castellanii Species 0.000 description 1
- 101150040074 Aco2 gene Proteins 0.000 description 1
- 241000224489 Amoeba Species 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101100289888 Caenorhabditis elegans lys-5 gene Proteins 0.000 description 1
- 241000222178 Candida tropicalis Species 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 101710134389 Carboxy-terminal domain RNA polymerase II polypeptide A small phosphatase 2 Proteins 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108091027757 Deoxyribozyme Proteins 0.000 description 1
- 108010006731 Dimethylallyltranstransferase Proteins 0.000 description 1
- 102000005454 Dimethylallyltranstransferase Human genes 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241001245610 Eutreptiella Species 0.000 description 1
- 241001594957 Eutreptiella pomquetensis Species 0.000 description 1
- 241000384539 Eutreptiella sp. CCMP389 Species 0.000 description 1
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 description 1
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 description 1
- 241001501873 Isochrysis galbana Species 0.000 description 1
- 108020003285 Isocitrate lyase Proteins 0.000 description 1
- 244000285963 Kluyveromyces fragilis Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 101150007280 LEU2 gene Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001123676 Metschnikowia pulcherrima Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 101100005882 Mus musculus Cel gene Proteins 0.000 description 1
- 101100289046 Mus musculus Lias gene Proteins 0.000 description 1
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 235000021319 Palmitoleic acid Nutrition 0.000 description 1
- 240000005373 Panax quinquefolius Species 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241000206765 Pavlova lutheri Species 0.000 description 1
- 241001043922 Pensacola Species 0.000 description 1
- CNVZJPUDSLNTQU-UHFFFAOYSA-N Petroselaidic acid Natural products CCCCCCCCCCCC=CCCCCC(O)=O CNVZJPUDSLNTQU-UHFFFAOYSA-N 0.000 description 1
- 102000001107 Phosphatidate Phosphatase Human genes 0.000 description 1
- 108010069394 Phosphatidate Phosphatase Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000825199 Rebecca salina Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000233671 Schizochytrium Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241001466451 Stramenopiles Species 0.000 description 1
- 102100036236 Synaptonemal complex protein 2 Human genes 0.000 description 1
- 241001634922 Tausonia pullulans Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000233675 Thraustochytrium Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 1
- FOGRQMPFHUHIGU-UHFFFAOYSA-N Uridylic acid Natural products OC1C(OP(O)(O)=O)C(CO)OC1N1C(=O)NC(=O)C=C1 FOGRQMPFHUHIGU-UHFFFAOYSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 244000126002 Ziziphus vulgaris Species 0.000 description 1
- BZZGGJIAXXBDEA-UHFFFAOYSA-N [S].[OH-].C[NH+](C)C Chemical compound [S].[OH-].C[NH+](C)C BZZGGJIAXXBDEA-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 238000004026 adhesive bonding Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 229920006318 anionic polymer Polymers 0.000 description 1
- 229940121363 anti-inflammatory agent Drugs 0.000 description 1
- 239000002260 anti-inflammatory agent Substances 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003529 anticholesteremic agent Substances 0.000 description 1
- 229940127226 anticholesterol agent Drugs 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000002820 assay format Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 235000015173 baked goods and baking mixes Nutrition 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 238000012474 bioautography Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 102220369447 c.1352G>A Human genes 0.000 description 1
- 229910052792 caesium Inorganic materials 0.000 description 1
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- NSWAMPCUPHPTTC-UHFFFAOYSA-N chlorimuron-ethyl Chemical group CCOC(=O)C1=CC=CC=C1S(=O)(=O)NC(=O)NC1=NC(Cl)=CC(OC)=N1 NSWAMPCUPHPTTC-UHFFFAOYSA-N 0.000 description 1
- 238000005660 chlorination reaction Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- CYQFCXCEBYINGO-IAGOWNOFSA-N delta1-THC Chemical compound C1=C(C)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 CYQFCXCEBYINGO-IAGOWNOFSA-N 0.000 description 1
- KHWCHTKSEGGWEX-UHFFFAOYSA-N deoxyadenylic acid Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(O)=O)O1 KHWCHTKSEGGWEX-UHFFFAOYSA-N 0.000 description 1
- LTFMZDNNPPEQNG-UHFFFAOYSA-N deoxyguanylic acid Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1CC(O)C(COP(O)(O)=O)O1 LTFMZDNNPPEQNG-UHFFFAOYSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 239000008157 edible vegetable oil Substances 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 125000004050 enoyl group Chemical group 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 150000002190 fatty acyls Chemical group 0.000 description 1
- 125000001924 fatty-acyl group Chemical group 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N ferric oxide Chemical compound O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 235000021588 free fatty acids Nutrition 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000013505 freshwater Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- IFYYFLINQYPWGJ-VIFPVBQESA-N gamma-Decalactone Natural products CCCCCC[C@H]1CCC(=O)O1 IFYYFLINQYPWGJ-VIFPVBQESA-N 0.000 description 1
- WGPCZPLRVAWXPW-LLVKDONJSA-N gamma-Dodecalactone Natural products CCCCCCCC[C@@H]1CCC(=O)O1 WGPCZPLRVAWXPW-LLVKDONJSA-N 0.000 description 1
- VZCCETWTMQHEPK-UHFFFAOYSA-N gamma-Linolensaeure Natural products CCCCCC=CCC=CCC=CCCCCC(O)=O VZCCETWTMQHEPK-UHFFFAOYSA-N 0.000 description 1
- 229960002733 gamolenic acid Drugs 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 235000011868 grain product Nutrition 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 239000004226 guanylic acid Substances 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- KYYWBEYKBLQSFW-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O.CCCCCCCCCCCCCCCC(O)=O KYYWBEYKBLQSFW-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- YAMHXTCMCPHKLN-UHFFFAOYSA-N imidazolidin-2-one Chemical compound O=C1NCCN1 YAMHXTCMCPHKLN-UHFFFAOYSA-N 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 101150091094 lipA gene Proteins 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- YAFQFNOUYXZVPZ-UHFFFAOYSA-N liproxstatin-1 Chemical compound ClC1=CC=CC(CNC=2C3(CCNCC3)NC3=CC=CC=C3N=2)=C1 YAFQFNOUYXZVPZ-UHFFFAOYSA-N 0.000 description 1
- 235000020667 long-chain omega-3 fatty acid Nutrition 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 235000013622 meat product Nutrition 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000001937 non-anti-biotic effect Effects 0.000 description 1
- 239000006916 nutrient agar Substances 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- FKCRAVPPBFWEJD-XVFCMESISA-N orotidine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1C(O)=O FKCRAVPPBFWEJD-XVFCMESISA-N 0.000 description 1
- FKCRAVPPBFWEJD-UHFFFAOYSA-N orotidine Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1C(O)=O FKCRAVPPBFWEJD-UHFFFAOYSA-N 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 239000003495 polar organic solvent Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920000193 polymethacrylate Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 229960004839 potassium iodide Drugs 0.000 description 1
- 235000007715 potassium iodide Nutrition 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 108700012830 rat Lip2 Proteins 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- FOGKDYADEBOSPL-UHFFFAOYSA-M rubidium(1+);acetate Chemical compound [Rb+].CC([O-])=O FOGKDYADEBOSPL-UHFFFAOYSA-M 0.000 description 1
- 238000007127 saponification reaction Methods 0.000 description 1
- 235000003441 saturated fatty acids Nutrition 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000003375 selectivity assay Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- BAZAXWOYCMUHIX-UHFFFAOYSA-M sodium perchlorate Chemical compound [Na+].[O-]Cl(=O)(=O)=O BAZAXWOYCMUHIX-UHFFFAOYSA-M 0.000 description 1
- 229910001488 sodium perchlorate Inorganic materials 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- VGTPCRGMBIAPIM-UHFFFAOYSA-M sodium thiocyanate Chemical compound [Na+].[S-]C#N VGTPCRGMBIAPIM-UHFFFAOYSA-M 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000194 supercritical-fluid extraction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- AQWHMKSIVLSRNY-UHFFFAOYSA-N trans-Octadec-5-ensaeure Natural products CCCCCCCCCCCCC=CCCCC(O)=O AQWHMKSIVLSRNY-UHFFFAOYSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- RYYVLZVUVIJVGH-UHFFFAOYSA-N trimethylxanthine Natural products CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 1
- 238000001291 vacuum drying Methods 0.000 description 1
- 239000000273 veterinary drug Substances 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23D—EDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
- A23D9/00—Other edible oils or fats, e.g. shortenings, cooking oils
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23D—EDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
- A23D9/00—Other edible oils or fats, e.g. shortenings, cooking oils
- A23D9/007—Other edible oils or fats, e.g. shortenings, cooking oils characterised by ingredients other than fatty acid triglycerides
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23K—FODDER
- A23K20/00—Accessory food factors for animal feeding-stuffs
- A23K20/10—Organic substances
- A23K20/158—Fatty acids; Fats; Products containing oils or fats
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L33/00—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
- A23L33/10—Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
- A23L33/115—Fatty acids or derivatives thereof; Fats or oils
- A23L33/12—Fatty acids or derivatives thereof
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23V—INDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
- A23V2002/00—Food compositions, function of food ingredients or processes for food or foodstuffs
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Polymers & Plastics (AREA)
- Food Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Animal Husbandry (AREA)
- Mycology (AREA)
- Nutrition Science (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及Δ9延伸酶,所述Δ9延伸酶具有将亚油酸(LA;18:2ω-6)转化成二十碳二烯酸(EDA;20:2ω-6)和/或将α-亚麻酸(ALA;18:3ω-3)转化成二十碳三烯酸(ETrA;20:3ω-3)的能力。公开了分离的核酸片段和包含这种编码Δ9延伸酶的片段的重组构建体,以及用这些Δ9延伸酶在含油酵母中制备长链多不饱和脂肪酸(PUFA)的方法。
Description
本申请要求提交于2007年4月16日的美国临时专利申请60/911,925的优先权,将该专利的全文以引用的方式并入本文中。
发明领域
本发明属于生物技术领域。更具体地讲,本发明涉及编码Δ9脂肪酸延伸酶的多核苷酸序列的鉴定以及这些延伸酶在制备长链多不饱和脂肪酸PUFA中的用途。
背景技术
现今,人们正研究包括植物、藻类、真菌、原生藻菌(stramenopiles)和酵母在内的多种不同宿主作为商业化PUFA生产的手段。基因工程已经证明,一些宿主(即便是天然受限于亚油酸(LA;18:2 ω-6)和α-亚麻酸(ALA;18:3 ω-3)脂肪酸产生的那些宿主)的天然能力可以被显著改变,以导致高水平地产生多种长链ω-3/ω-6 PUFA。不论这是天然能力的结果还是重组技术的结果,花生四烯酸(ARA;20:4 ω-6)、二十碳五烯酸(EPA;20:5 ω-3)和二十二碳六烯酸(DHA;22:6 ω-3)的产生可能均需要表达Δ9延伸酶。
迄今为止鉴定的大多数Δ9延伸酶既具有将LA转化成二十碳二烯酸(EDA;20:2 ω-6)的能力又具有将ALA转化成二十碳三烯酸(ETrA;20:3 ω-3)的能力(其中在与Δ8去饱和酶反应之后,EDA和ETrA随后分别被合成二高-γ-亚麻酸(DGLA;20:3 ω-6)和二十碳四烯酸(ETA;20:4 ω-3);在与Δ5去饱和酶反应后,DGLA和ETA随后分别被合成ARA和EPA;并且,DHA合成需要后续表达额外的C20/22延伸酶和Δ4去饱和酶)。
尽管需要用于产生ARA、EPA和DHA的新方法,但仅少量的Δ9延伸酶得以鉴定。来自绿光等鞭金藻(Isochrysis galbana)的Δ9延伸酶是公开可获得的(在基因库编号(GenBank Accession No)AAL37626以及PCT公开WO 02/077213、WO 2005/083093、WO 2005/012316和WO2004/057001中有描述)。PCT公开WO 2007/061845和WO 2007/061742(申请人的受让人的共同未决的申请)公开了来自小眼虫(Euglenagracilis)和Eutreptiella sp.CCMP389的Δ9延伸酶,以及Δ9延伸酶的基序。
因此,需要鉴定和分离出另外的编码Δ9延伸酶的基因,该基因将适用于在多种宿主生物中异源表达以用于产生ω-3/ω-6脂肪酸。
本申请人通过从Euglena anabaena中分离出编码Δ9脂肪酸延伸酶的基因而解决了这里所说的需要。
发明内容
本发明涉及编码具有Δ9延伸酶活性的多肽的新的遗传构建体,以及它们在藻类、细菌、酵母、类眼虫、原生藻菌和真菌中的使用,用于产生PUFA。因此,本发明提供包含分离的多核苷酸的微生物宿主细胞,该多核苷酸包含:
(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于ClustalV比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该多肽具有至少80%的氨基酸同一性;
(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,该核苷酸序列具有至少80%的序列同一性;
(c)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中该核苷酸序列在严格条件下与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列杂交;或
(d)(a)、(b)或(c)的核苷酸序列的互补序列,其中该互补序列与该核苷酸序列由相同数目的核苷酸组成并且100%互补。
在另一个实施方案中,本发明提供用于产生二十碳二烯酸的方法,该方法包括:
a)提供微生物宿主细胞,该微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)亚油酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使亚油酸转化成二十碳二烯酸的条件下生长;以及
c)任选回收步骤(b)的二十碳二烯酸。
在另一个实施方案中,本发明提供用于产生二十碳三烯酸的方法,该方法包括:
a)提供微生物宿主细胞,该微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)α-亚麻酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使α-亚麻酸转化成二十碳三烯酸的条件下生长;以及
c)任选回收步骤(b)的二十碳三烯酸。
在另一个实施方案中,本发明提供如SEQ ID NO:26中示出的编码Δ9延伸酶的分离的核酸分子,在该序列中至少98个密码子被密码子最优化以便在耶氏酵母属(Yarrowia)物种中表达。
附图简述和序列表
图1是代表性的ω-3和ω-6脂肪酸生物合成途径,该途径提供了肉豆蔻酸经过多种中间产物向DHA的转化。
图2示出了如实施例中所述的Euglena anabaena细胞提取物的脂质概况的色谱图。
图3提供了下列质粒的质粒图谱:(A)pY115(SEQ ID NO:19);(B)pY159(SEQ ID NO:23);(C)pY173(SEQ ID NO:24)和(D)pY174(SEQID NO:25)。
图4A和4B示出了EaD9Elo(SEQ ID NO:11)和EaD9ES(SEQ IDNO:26)的核苷酸序列的比较。
图5提供了下列质粒的质粒图谱:(A)pEaD9ES(SEQ ID NO:28);和(B)pZUFmEaD9eS(SEQ ID NO:29)。
根据下面的详细描述和附带的序列描述可以更充分地理解本发明,下面的详细描述和所附的序列描述形成了本申请的一部分。
下面的序列遵循37C.F.R.§1.821-1.825(“对包含核苷酸序列和/或氨基酸序列公开内容的专利申请的要求-序列规则”(“Requirementsfor Patent Applications Containing Nuceotide Sequences and/or AminoAcid Sequence Disclosures-the Sequence Rules”)),并且符合世界知识产权组织(World Intellectual Property Organization)(WIPO)ST.25标准(1998)以及EPO和PCT的序列表要求(规则5.2和49.5(a-bis)以及行政指令(Administrative Instructions)的208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中示出的规则。
SEQ ID NO:1-4、9-19和22-29为编码基因或蛋白质(或其部分)或质粒的ORF,如表1中所示。
表1
核酸和蛋白质SEQ ID号总汇
描述和缩写 | 核酸SEQ ID NO | 蛋白质SEQ ID NO |
Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo1”) | 1(1129bp) | -- |
Euglena anabaenaΔ9延伸酶的cDNA序列(“EaD9Elo2”) | 2(1145bp) | -- |
小眼虫Δ9延伸酶编码序列(“EgD9e”) | 3(774bp) | 4(258AA) |
质粒pLF121-1 | 9(3668bp) | -- |
质粒pLF121-2 | 10(3684bp) | -- |
Euglena anabaenaΔ9延伸酶编码序列(分别为“EaD8Des1 CDS”或“EaD9Elo1”) | 11(774bp) | 13(258AA) |
Euglena anabaenaΔ9延伸酶编码序列(分别为“EaD8Des2 CDS”或“EaD9Elo2”) | 12(774bp) | 14(258AA) |
描述和缩写 | 核酸SEQ ID NO | 蛋白质SEQ ID NO |
质粒pKR906 | 15(4311bp) | -- |
绿光等鞭金藻Δ9延伸酶(IgD9e) | -- | 16(263AA) |
质粒pDMW263 | 17(9472bp) | -- |
质粒pDMW237 | 18(7879bp) | -- |
质粒pY115 | 19(7783bp) | -- |
质粒pY158 | 22(6992bp) | -- |
质粒pY159 | 23(8707bp) | -- |
质粒pY173 | 24(8219bp) | -- |
质粒pY174 | 25(8235bp) | -- |
来源于Euglena anabaena的、经密码子最优化以便在解脂耶氏酵母(Yarrowialipolytica)中表达的合成的Δ9延伸酶(“EaD9eS”) | 26(774bp) | 27(258AA) |
质粒pEaD9ES | 28(3497bp) | -- |
质粒pZUFmEaD9eS | 29(7769bp) | -- |
SEQ ID NO:5和6分别对应寡核苷酸oEugEL1-1和oEugEL1-2,用于扩增小眼虫Δ9延伸酶。
SEQ ID NO:7和8分别对应M13F通用引物和引物M13-28Rev,用于对Euglena anabaena DNA插入物进行末端测序。
SEQ ID NO:20和21分别对应引物oYFBA1和oYFBA1-6,用于扩增质粒pY115的FBAINm启动子。
发明详述
本文中公开了新的Euglena anabaenaΔ9延伸酶和编码这种延伸酶的基因,其可用于操纵产生健康的PUFA的生化途径。
PUFA或其衍生物可用作膳食替代品或补充剂,尤其是婴儿代乳品(formula),用于接受静脉内营养法的患者或用来预防或治疗营养不良。或者,可以将纯化的PUFA(或其衍生物)掺入食用油、脂肪或调配的人造黄油中,以便食用者在正常使用中将获得所需量的膳食补充。PUFA还可以掺入婴儿代乳品、营养补充剂或其他食品中,并且可用作抗炎或降胆固醇剂。任选地,该组合物可以用于药用(人药或兽药)。
定义
在本公开的上下文中使用了大量术语和缩写。给出了如下定义。
“可读框”缩写为ORF。
“聚合酶链反应”缩写为PCR。
“美国典型培养物保藏中心”缩写为ATCC。
“多不饱和脂肪酸”缩写为PUFA。
“三酰基甘油”缩写为TAG。
如本文所用,术语“发明”或“本发明”不旨在局限于本发明的任一具体实施方案,而是在一般情况下适用于如权利要求和说明书中所描述的本发明的任何实施方案和所有实施方案。
本文所用的以及所附权利要求书中所用的单数形式“一个”、“一种”和“所述”包括复数指代,除非上下文中清楚地指明其他涵义。因此,例如,“一株植物”的涵义包括多株此类植物,“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物,等等。
术语“脂肪酸”指不同链长的长链脂族酸(链烷酸),链长为约C12至C22(尽管更长和更短链长的酸均是已知的)。主要的链长介于C16和C22之间。另外的关于“饱和脂肪酸”与“不饱和脂肪酸”、“单不饱和脂肪酸”与“多不饱和脂肪酸”(或“PUFA”)以及“ω-6脂肪酸”(ω-6或n-6)与“ω-3脂肪酸”(ω-3或n-3)之间的区别的详细信息在美国专利7,238,482中有提供。
本文通过简单的记号系统“X:Y”来描述脂肪酸,其中X表示特定脂肪酸中碳(c)原子的总数,而Y为双键的数目。脂肪酸名称后面的数字表示从脂肪酸羧基端计数的双键的位置,词缀“c”表示双键的顺式构型(例如,棕榈酸(16:0)、硬脂酸(18:0)、油酸(18:1,9c)、岩芹酸(18:1,6c)、LA(18:2,9c,12c)、GLA(18:3,6c,9c,12c)和ALA(18:3,9c,12c,15c))。除非另外指明,否则18:1、18:2和18:3分别指油酸、LA和ALA脂肪酸。如果没有另外明确地写明,则认为双键为顺式构型。例如,18:2(9,12)中的双键将被认为是顺式构型。
在本公开内容中用于描述PUFA的命名在下面的表2中示出。在标题为“简化符号”一栏中,ω-指代系统用于表明碳数目、双键的数目和最接近ω碳的双键位置,双键位置的计数从ω碳开始(为此ω碳的编号为1)。该表的其余部分汇总了ω-3和ω-6脂肪酸及其前体的俗名、将在整个说明书的其余部分中使用的缩写以及每种化合物的化学名称。
表2
多不饱和脂肪酸和前体的命名
俗名 | 缩写 | 化学名称 | 简化符号 |
肉豆蔻酸 | -- | 十四酸 | 14:0 |
棕榈酸 | PA或Palmitate | 十六酸 | 16:0 |
棕榈油酸 | -- | 9-十六碳烯酸 | 16:1 |
硬脂酸 | -- | 十八酸 | 18:0 |
油酸 | -- | 顺式-9-十八碳烯酸 | 18:1 |
亚油酸 | LA | 顺式-9,12-十八碳二烯酸 | 18:2 ω-6 |
γ-亚麻酸 | GLA | 顺式-6,9,12-十八碳三烯酸 | 18:3 ω-6 |
二十碳二烯酸 | EDA | 顺式-11,14-二十碳二烯酸 | 20:2 ω-6 |
二高-γ-亚麻酸 | DGLA | 顺式-8,11,14-二十碳三烯酸 | 20:3 ω-6 |
Sciadonic | SCI | 顺式-5,11,14-二十碳三烯酸 | 20:3b ω-6 |
花生四烯酸 | ARA | 顺式-5,8,11,14-二十碳四烯酸 | 20:4 ω-6 |
α-亚麻酸 | ALA | 顺式-9,12,15-十八碳三烯酸 | 18:3 ω-3 |
十八碳四烯酸 | STA | 顺式-6,9,12,15-十八碳四烯酸 | 18:4 ω-3 |
俗名 | 缩写 | 化学名称 | 简化符号 |
二十碳三烯酸 | ETrA或ERA | 顺式-11,14,17-二十碳三烯酸 | 20:3 ω-3 |
二十碳四烯酸 | ETA | 顺式-8,11,14,17-二十碳四烯酸 | 20:4 ω-3 |
Juniperonic | JUP | 顺式-5,11,14,17-二十碳三烯酸 | 20:4b ω-3 |
二十碳五烯酸 | EPA | 顺式-5,8,11,14,17-二十碳五烯酸 | 20:5 ω-3 |
二十二碳三烯酸 | DRA | 顺式-10,13,16-二十二碳三烯酸 | 22:3 ω-6 |
二十二碳四烯酸 | DTA | 顺式-7,10,13,16-二十二碳四烯酸 | 22:4 ω-6 |
二十二碳五烯酸 | DPAn-6 | 顺式-4,7,10,13,16-二十二碳五烯酸 | 22:5 ω-6 |
二十二碳五烯酸 | DPA | 顺式-7,10,13,16,19-二十二碳五烯酸 | 22:5 ω-3 |
二十二碳六烯酸 | DHA | 顺式-4,7,10,13,16,19-二十二碳六烯酸 | 22:6 ω-3 |
术语“三酰基甘油”、“油”和“TAG”指由与甘油分子酯化的三个脂肪酰残基组成的中性脂质(并且这些术语在整个本公开内容中将可互换使用)。这些油可含有长链PUFA以及较短的饱和的和不饱和的脂肪酸以及较长链的饱和脂肪酸。因此,“油的生物合成”一般指细胞中TAG的合成。
“总脂质和油级分中的PUFA百分比(%)”指PUFA相对于在那些级分中的总脂肪酸的百分比。术语“总脂质级分”或“脂质级分”两者均指含油生物内所有脂质(即中性和极性脂质)的总和,因此包括位于磷脂酰胆碱(PC)级分、磷脂酰乙醇胺(PE)级分和三酰基甘油(TAG或油)级分中的那些脂质。然而,术语“脂质”和“油”将可在整个说明书中互换使用。
代谢途径或生物合成途径在生物化学意义上可以认为是发生于细胞内由酶催化的一系列化学反应,以实现细胞待使用的或待贮存的代谢产物的形成,或启动另一代谢途径(因而称作流量产生步骤)。很多此类途径均很精细,并涉及对起始物质的逐步修饰以使之形成具有期望的精确化学结构的产物。
术语“PUFA生物合成途径”指将油酸转化成诸如LA、EDA、GLA、DGLA、ARA、DRA、DTA和DPAn-6之类的ω-6脂肪酸和诸如ALA、STA、ETrA、ETA、EPA、DPA和DHA之类的ω-3脂肪酸的代谢过程。该过程在文献中已有详细的描述(如参见PCT公开WO 2006/052870)。简而言之,该过程涉及通过添加碳原子来延长碳链和通过加入双键来使分子去饱和,这通过存在于内质网膜内的一系列特异性去饱和酶和延伸酶(即“PUFA生物合成途径酶”)进行。更具体地讲,“PUFA生物合成途径酶”指如下与PUFA生物合成相关的任何酶(以及编码所述酶的基因),包括:Δ9延伸酶、C14/16延伸酶、C16/18延伸酶、C18/20延伸酶、C20/22延伸酶、Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶和/或Δ8去饱和酶。
术语“ω-3/ω-6脂肪酸生物合成途径”指在合适条件下表达时编码催化产生ω-3和ω-6脂肪酸二者之一或两者的酶的一组基因。通常,参与ω-3/ω-6脂肪酸生物合成途径的基因编码PUFA生物合成途径酶。图1示出了代表性的途径,提供了肉豆蔻酸经过多种中间产物向DHA的转化,这展示了ω-3和ω-6脂肪酸两者是如何可以从共同来源而产生。自然,该途径分成两部分,其中一部分将产生ω-3脂肪酸而另一部分产生ω-6脂肪酸。
如本文关于ω-3/ω-6脂肪酸生物合成途径的上下文中所用,术语“功能性的”指该途径中的一些(或全部)基因表达活性酶,从而导致体内催化或底物转化。应当理解,“ω-3/ω-6脂肪酸生物合成途径”或“功能性ω-3/ω-6脂肪酸生物合成途径”并不意味着所有的PUFA生物合成途径酶基因均是必需的,因为许多脂肪酸产物将仅需要表达该途径中的一亚组基因。
术语“Δ6去饱和酶/Δ6延伸酶途径”将指最低程度包括至少一种Δ6去饱和酶和至少一种C18/20延伸酶(也称为Δ6延伸酶)的PUFA生物合成途径,从而使得能分别从LA和ALA开始,以GLA和/或ETA作为脂肪酸中间产物生物来合成DGLA和/或ETA。通过其他去饱和酶和延伸酶的表达,还可以合成ARA、EPA、DPA和DHA。
术语“Δ9延伸酶/Δ8去饱和酶途径”将指最低程度包括至少一种Δ9延伸酶和至少一种Δ8去饱和酶的PUFA生物合成途径,从而使得能分别从LA和ALA开始,以ETA和/或DGLA作为脂肪酸中间产物来生物合成DGLA和/或ETA。通过其他去饱和酶和延伸酶的表达,还可以合成ARA、EPA、DPA和DHA。
术语“脂肪酸中间产物”指在脂肪酸代谢途径中产生的任何脂肪酸,其可以通过其他代谢途径酶的作用进一步转化成本途径的目的脂肪酸产物。例如,当利用Δ9延伸酶/Δ8去饱和酶途径产生EPA时,可以产生EDA、ETrA、DGLA、ETA和ARA并被认为是“脂肪酸中间产物”,因为这些脂肪酸可通过其他代谢途径酶的作用进一步转化成EPA。
术语“脂肪酸副产物”指在脂肪酸代谢途径中产生的既非该途径的目的脂肪酸产物又非该途径的“脂肪酸中间产物”的任何脂肪酸。例如,当利用Δ9延伸酶/Δ8去饱和酶途径中产生EPA时,sciadonic酸(SCI)和juniperonic酸(JUP)也可通过Δ5去饱和酶分别作用于EDA或ETrA而产生。它们被认为是“脂肪酸副产物”,因为两者均不能通过其他代谢途径酶的作用进一步转化成EPA。
术语“去饱和酶”指可以在一种或多种脂肪酸中去饱和(即引入双键)而产生所关注的脂肪酸或前体的多肽。尽管在整个说明书中使用ω-指代系统来指代特定的脂肪酸,但使用Δ-系统从底物的羧基端计数来表示去饱和酶的活性更方便。所关注的去饱和酶包括(例如):(1)使脂肪酸在从该分子的羧基端计数的第8个和第9个碳原子之间去饱和并且可以(例如)催化EDA转化成DGLA和/或催化ETrA转化成ETA的Δ8去饱和酶;(2)Δ5去饱和酶,该去饱和酶催化DGLA转化成ARA和/或催化ETA转化成EPA;(3)Δ6去饱和酶,该去饱和酶催化LA转化成GLA和/或催化ALA转化成STA;(4)Δ4去饱和酶,该去饱和酶催化DPA转化成DHA和/或催化DTA转化成DPAn-6;(5)Δ12去饱和酶,该去饱和酶催化油酸转化成LA;(6)Δ15去饱和酶,该去饱和酶催化LA转化成ALA和/或催化GLA转化成STA;(7)Δ17去饱和酶,该去饱和酶催化ARA转化成EPA和/或催化DGLA转化成ETA;以及(8)Δ9去饱和酶,该去饱和酶催化棕榈酸转化成棕榈油酸(16:1)和/或催化硬脂酸转化成油酸(18:1)。在本领域中,基于Δ15和Δ17去饱和酶将ω-6脂肪酸转化成它们的ω-3对应物的能力(如分别将LA转化成ALA和将ARA转化成EPA),偶尔也将它们称作“ω-3去饱和酶”、“ω-3去饱和酶”和/或“ω-3去饱和酶”。在一些实施方案中,最理想的是,通过用脂肪酸去饱和酶的基因来转化合适的宿主并测定它对该宿主脂肪酸概况的作用,从而经验性地测定特定脂肪酸去饱和酶的特异性。
为了本文的目的,通常将催化第一缩合反应(即丙二酰辅酶A和长链酰基辅酶A转化成β-酮脂酰辅酶A)的酶称为“延伸酶”。一般来讲,延伸酶的底物选择性有些广泛,但由链长度和不饱和程度两者来区分。因此,延伸酶可具有不同的特异性。例如,C14/16延伸酶将会利用C14底物(如肉豆蔻酸),C16/18延伸酶将会利用C16底物(如棕榈酸),C18/20延伸酶(也称为Δ6延伸酶,两个术语可以互换使用)将会利用C18底物(如GLA、STA),而C20/22延伸酶将会利用C20底物(如ARA、EPA)。同样,并且本文尤其关注的是,“Δ9延伸酶”催化LA转化成EDA和/或催化ALA转化成ETrA。重要的是,须注意一些延伸酶具有广泛的特异性并因而单个酶可能能够催化几种延伸酶反应。因此,例如,Δ9延伸酶还可以用作C16/18延伸酶、C18/20延伸酶和/或C20/22延伸酶,并且可以分别对诸如EPA和/或GLA之类的Δ5和Δ6脂肪酸具有备选的但非优选的特异性。在优选的实施方案中,理想的是,通过用脂肪酸延伸酶的基因来转化合适的宿主并测定它对该宿主脂肪酸概况的作用,从而经验性地测定该脂肪酸延伸酶的特异性。延伸酶体系通常包括四种酶,这些酶负责脂肪酸碳链延长而产生比该延伸酶体系所作用的脂肪酸底物长两个碳原子的脂肪酸。更具体地讲,延长过程与脂肪酸合酶相关联进行,其中辅酶A是酰基载体(Lassner等人,Plant Cell,8:281-292(1996))。在第一步骤(已发现该步骤既是底物特异性的又是限速的)中,丙二酰辅酶A与长链酰基辅酶A缩合产生二氧化碳(CO2)和β-酮脂酰辅酶A(其中脂酰基部分已经延长了两个碳原子)。后续的反应包括还原成β-羟酰辅酶A、脱水成烯酰辅酶A以及第二还原反应以产生延长的酰基辅酶A。由延伸酶体系催化的反应的实例是将GLA转化成DGLA、将STA转化成ETA、将LA转化成EDA、将ALA转化成ETrA、将ARA转化成DTA和将EPA转化成DPA。
为了本文目的,术语“EaD9Elo1”指从Euglena anabaena分离的、由SEQ ID NO:11编码的Δ9延伸酶(SEQ ID NO:13)。术语“EaD9Elo2”指从E.anabaena分离的、由SEQ ID NO:12编码的Δ9延伸酶(SEQ IDNO:14)。同样,术语“EaD9eS”指来源于E.anabaena的经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶(即SEQ ID NO:26和27)。
术语“转化效率”和“底物转化百分比”指特定酶(如延伸酶)能够将底物转化成产物的效率。转化效率根据下面的公式测量:([产物]/[底物+产物])*100,其中‘产物’包括中间产物和该途径中来源于它的所有产物。
术语“含油的”指那些往往以脂质形式贮存它们的能源的生物(Weete,Fungal Lipid Biochemistry,第二版,Plenum,1980)。在含油微生物内,细胞油或TAG含量通常符合S形曲线,其中脂质浓度增加直至晚对数生长晚期或稳定生长早期时它达到最高浓度,随后在稳定生长晚期和死亡期期间逐渐下降(Yongrmanitchai和Ward,Appl.Environ.Microbiol.,57:419-25(1991))。含油微生物积累油超过它们的干细胞重量的约25%的情形并不鲜见。
术语“含油酵母”指那些能够产油并被归类为酵母的微生物。含油酵母的实例包括但不限于如下属:耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。
术语“裸藻纲(Euglenophyceae)”指发现生活在淡水环境、海洋环境、土壤环境和寄生环境中的一群单细胞的无色或光合鞭毛虫(“类眼虫”)。该纲的特征为孤立的单细胞,其中大多数是自由游动的并且具有从称为储存器的前内陷长出的两条鞭毛(其中一条可能不露出)。光合类眼虫含有一个至多个叶绿体,叶绿体从微小的盘状至延伸的板状或带状而不同。无色类眼虫依赖于渗透营养或吞噬营养来进行营养同化作用。已经描述了约1000种物种并将它们分为约40个属和6个目。裸藻纲的实例包括但不限于如下属:裸藻属(Euglena)、Eutreptiella和Tetruetreptia。
如本文所用,“核酸”意指多核苷酸,并包括单链或双链的脱氧核糖核苷酸或核糖核苷酸碱基聚合物。核酸也可以包括片段和经修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用,并且指作为单链或双链的RNA或DNA聚合物,任选含有合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的多核苷酸可由cDNA、基因组DNA、合成DNA或它们的混合物的一个或多个片段构成。核苷酸(通常以它们的5′-单磷酸形式存在)可以用如下它们的单字母名称指代:“A”表示腺苷酸或脱氧腺苷酸(分别针对RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“N”表示任何核苷酸。
术语“保守结构域”或“基序”指进化上相关的蛋白质的比对序列中在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其他位置的氨基酸可以发生变化,但在特定位置高度保守的氨基酸表明对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们可通过它们在蛋白质同系物家族的比对序列中的高度保守来鉴定,所以它们可用作识别标签或“签名”来确定具有新的测定序列的蛋白质是否属于以前鉴定的蛋白质家族。PCT公开WO 2007/061845和WO 2007/061742描述了七种不同的与Δ9延伸酶相关的基序。
术语“同源性”、“同源的”、“基本上类似的”和“基本上对应的”在本文中可互换使用。它们指这样的核酸片段,即其中一个或多个核苷酸碱基改变并不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或插入一个或多个核苷酸),相对于初始的未经修饰的核酸片段,该修饰基本上不会改变所得核酸片段的功能特性。因此,正如本领域技术人员应当理解的,本发明涵盖的不仅仅是具体的示例性序列。
此外,技术人员认识到,本发明所涵盖的基本上类似的核苷酸序列也通过它们(在中等严格条件如0.5X SSC,0.1%SDS,60℃下)与本文所示例的序列杂交的能力,或杂交至本文所公开的核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。可以调节严格性条件以筛选中度相似的片段(例如来自远缘生物的同源序列),到筛选高度相似的片段(例如从近缘生物复制功能性酶的基因)。杂交后的洗涤可确定严格性条件。
术语“选择性杂交”包括指在严格杂交条件下,核酸序列与特定核酸靶序列以比其与非靶核酸序列的杂交更高的可检测程度(例如至少两倍于背景)杂交,并指基本排除了非靶核酸。选择性杂交的序列通常彼此具有约至少80%的序列同一性,或90%的序列同一性,最多并包括100%的序列同一性(即完全互补)。
术语“严格条件”或“严格杂交条件”包括指探针将会选择性杂交至其靶序列的条件。严格条件是序列依赖性的,并将因不同的环境而异。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。或者,可调节严格条件以允许序列中的一些错配,以便检测到更低程度的相似性(异源探测)。通常,探针的长度少于约1000个核苷酸,任选长度少于500个核苷酸。
通常,严格条件将是如下那些条件:在pH7.0至8.3下盐浓度低于约1.5M钠离子,通常约0.01至1.0M钠离子浓度(或其他盐),并且对于短探针(例如10至50个核苷酸)温度为至少约30℃,而对于长的探针(例如多于50个核苷酸)温度为至少约60℃。严格条件也可以通过加入诸如甲酰胺之类的去稳定剂来实现。示例性的低严格条件包括在37℃下于含30至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲液中杂交,以及在50至55℃下用1X至2X SSC(20X SSC=3.0MNaCl/0.3M柠檬酸三钠)洗涤。示例性的中等严格条件包括在37℃下于40至45%甲酰胺、1M NaCl、1%SDS中杂交,以及在55至60℃下用0.5X至1X SSC洗涤。示例性的高严格条件包括在37℃下于50%甲酰胺、1M NaCl、1%SDS中杂交,以及在60至65℃下用0.1X SSC洗涤。
特异性通常取决于杂交后洗涤,最终洗涤溶液的离子强度和温度是关键因素。对于DNA-DNA杂交体,Tm可以用Meinkoth等人,Anal.Biochem.,138:267-284(1984)中的等式估算:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M是单价阳离子的体积摩尔浓度,%GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,%form是杂交溶液中甲酰胺的百分比,而L是以碱基对表示的杂交体的长度。Tm是(在确定的离子强度和pH下)50%的互补靶序列与完全匹配的探针杂交时的温度。每出现1%的错配,Tm降低约1℃;因此,可调节Tm、杂交和/或洗涤条件以与具有期望同一性的序列杂交。例如,如果要寻求具有≥90同一性百分比(%)的序列,则可将Tm降低10℃。通常,在确定的离子强度和pH下,严格条件选择为比特定序列及其互补序列的热解链温度(Tm)低约5℃。然而,极严格条件可采用在比热解链温度(Tm)低1、2、3或4℃的温度下杂交和/或洗涤;中等严格条件可采用在比热解链温度(Tm)低6、7、8、9或10℃的温度下杂交和/或洗涤;而低严格条件可采用在比热解链温度(Tm)低11、12、13、14、15或20℃的温度下杂交和/或洗涤。利用上述等式、杂交和洗涤组合物以及所需的Tm,一般技术人员将会理解,杂交和/或洗涤溶液的严格性的变化已经在本质上得以描述。如果所需的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则优选增加SSC的浓度以便能使用更高的温度。对核酸杂交的详尽指导可在以下文献中找到:Tijssen,LaboratoryTechniques in Biochemistry and Molecular Biology--Hybridization withNucleic Acid Probes,第I部分,第2章“Overview of principles ofhybridization and the strategy of nucleic acid probe assays”,Elsevier,NewYork(1993);以及Current Protocols in Molecular Biology,第2章,Ausubel等人编辑,Greene Publishing and Wiley-Interscience,New York(1995)。杂交和/或洗涤条件可进行至少10、30、60、90、120或240分钟。
上下文中核酸序列或多肽序列的“序列同一性”或“同一性”指在特定比较窗口上进行比对以寻求最大对应时,两个序列中相同的核酸碱基或氨基酸残基。
因此,“序列同一性百分比”指通过在比较窗口上比较两个最佳对齐的序列而测得的值,其中与参考序列(其不包括添加或缺失)相比较,比较窗口中的多核苷酸或多肽序列部分可包括添加或缺失(即缺口)以实现两个序列的最佳比对。该百分比通过如下计算:测定相同核酸碱基或氨基酸残基在两个序列中出现的位置的数目,以获得匹配位置的数目,将匹配位置的数目除以比较窗口中的总位置数目并将所得结果乘以100而获得序列同一性百分比。序列同一性百分比的可用的实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或50%至100%的任何整数百分比。这些同一性可以用本文描述的任何程序测定。
序列比对和百分比同一性或相似性的计算可以用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM程序。在本专利申请的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果将基于所参考程序的“默认值”。在此所用的“默认值”将指在首次初始化软件时软件最初加载的任何值或参数集。
“Clustal V比对方法”对应于称为Clustal V(在Higgins和Sharp,CABIOS,5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.,8:189-191(1992)中有所描述)并且可以在LASERGENE生物信息学计算软件包(同上)的MegAlignTM程序中找到的比对方法。对于多重比对,默认值对应于缺口罚分(GAP PENALTY)=10和缺口长度罚分(GAPLENGTH PENALTY)=10。用Clustal V方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、缺口罚分=3、窗口(WINDOW)=5和DIAGONALS SAVED=5。对于核酸,这些参数为KTUPLE=2,缺口罚分=5,窗口=4和DIAGONALS SAVED=4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“百分比同一性”。
“BLASTN比对方法”是由国家生物技术信息中心(National Centerfor Biotechnology Information,NCBI)提供的用以采用默认参数比较核苷酸序列的算法。
本领域的技术人员非常清楚,多种程度的序列同一性可用于从其他物种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。同一性百分比的可用的实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或50%至100%的任何整数百分比。实际上,50%至100%的任何整数氨基酸同一性可用于描述本发明,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。而且,所关注的是这种分离的核苷酸片段的任何全长或部分互补的序列。
“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。因此,本发明涉及编码氨基酸序列的全部或基本部分的任何核酸片段,该氨基酸序列编码在SEQID NO:13和SEQ ID NO:14中示出的本发明的类眼虫多肽。技术人员非常了解具体宿主细胞在使用核苷酸密码子以确定给定氨基酸时所表现出的“密码子偏倚性”。因此,当合成基因用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。
“合成的基因”可由使用本领域技术人员已知的方法化学合成的寡核苷酸构件装配而成。将这些构件进行连接并退火以形成基因节段,该基因节段随后在酶促作用下装配而构建成完整的基因。因此,基于最优化核苷酸序列以反映宿主细胞的密码子偏倚性,可以定制基因用以最优化基因表达。如果密码子使用偏向于宿主偏好的那些密码子,则技术人员会理解成功的基因表达的可能性。优选的密码子的确定可基于对来源于宿主细胞的基因(其中序列信息可获得)的检测。
“基因”指表达特定蛋白质的核酸片段,并且该核酸片段可以指单独的编码区或可以包括位于编码序列之前的调控序列(5′非编码区)和之后的调控序列(3′非编码区)。“天然基因”是指天然存在的具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“内源性基因”指位于生物的基因组内它的天然位置的天然基因。“外来基因”指正常情况下不存在于宿主生物中的基因,它通过基因转移导入宿主生物内。外来基因可以包含插入到非天然生物内的天然基因,或嵌合基因。“转基因”是已通过转化方法导入基因组内的基因。“经密码子最优化的基因”是其密码子使用频率经设计用以模仿宿主细胞优选的密码子使用频率的基因。
“编码序列”指编码特定氨基酸序列的DNA序列。“调控序列”指位于编码序列上游(5′非编码序列)、中间或下游(3′非编码序列)的核苷酸序列,并且该核苷酸序列影响相关编码序列的转录、RNA加工或稳定性或翻译。调控序列可包括但不限于:启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。
“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般来讲,编码序列位于启动子序列的3′端。启动子可整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。导致基因在几乎所有发展阶段中表达的启动子通常称为“组成型启动子”。还应当认识到,由于在大多数情况下调控序列的确切边界(特别是它的5’端)尚未完全确定,因此一些改变形式的DNA片段可能具有相同的启动子活性。
启动子序列可以由邻近的和更远处的上游元件组成,后一类元件常称为增强子和/或沉默子。因此,“增强子”是能刺激启动子活性的DNA序列,并且可以是启动子的固有的元件或插入的异源元件,用以增强启动子的水平或阶段特异性。“沉默子”是能抑制启动子活性的DNA序列,并且可以是启动子的固有的元件或插入的异源元件,用以抑制启动子的水平或阶段特异性。
“翻译前导序列”指位于基因的转录起始位点和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。已经描述了翻译前导序列的实例(Turner,R.和Foster,G.D.,Mol.Biotechnol.,3:225-236(1995))。
术语“3′非编码序列”、“转录终止子”和“终止序列”指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能影响mRNA加工或基因表达的调节信号的其他序列。多腺苷酸化信号通常表征为影响多腺苷酸片添加到mRNA前体的3′末端。3′区可影响相关编码序列的转录、RNA加工或稳定性或翻译。
“RNA转录物”指由RNA聚合酶催化的DNA序列转录所产生的产物。当RNA转录物与DNA序列拷贝完全互补时,它指初级转录物。当RNA转录物是来源于初级转录物的转录后加工的RNA序列时,它指成熟的RNA。“信使RNA”或“mRNA”指无内含子并且可以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA模板互补并用反转录酶从mRNA模板合成的DNA。cDNA可以是单链,或使用DNA聚合酶I的Klenow片段转化成双链。“有义”RNA指包含mRNA并且能在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”指与靶初级转录物或mRNA的全部或部分互补并且可阻断靶基因的表达的RNA转录物(美国专利5,107,065)。反义RNA可以与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。“功能性RNA”指反义RNA、核酶RNA或其他不能翻译但是对细胞过程有影响作用的RNA。术语“互补的”和“反向互补的”对mRNA转录来说可互换使用,并且用以定义信使反义RNA。
术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列可操作地连接。编码序列可能以有义或反义的取向可操作地连接至调控序列。
术语“重组体”指(例如)通过化学合成或通过用基因工程技术操纵分离的核酸片段而实现的两个原本分离的序列片段的人工组合。
如本文所用,术语“表达”指源于本发明的核酸片段的有义RNA(mRNA)或反义RNA的转录和稳定积聚。表达也可指mRNA翻译成蛋白质(其为前体蛋白或成熟蛋白)。
“成熟”蛋白指经翻译后加工的多肽(即已经去除了存在于初始翻译产物中的任何前肽或肽原的多肽)。“前体”蛋白质指mRNA的初级翻译产物(即前肽和肽原仍然存在)。前肽和肽原可以是(但不限于)细胞内定位信号。
术语“质粒”和“载体”指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组为一种独特构建体,该独特构建体能够将表达盒引入细胞中。
术语“表达盒”指包含如下序列的DNA片段:所选基因的编码序列和所选基因产物表达所需的位于编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。因此,表达盒通常由如下序列构成:(1)启动子序列;(2)编码序列(即ORF);和(3)3′非翻译区(即终止子),在真核生物中其通常含有多腺苷酸化位点。表达盒通常包含于载体中以有利于克隆和转化。可以将不同表达盒转化进包括细菌、酵母、植物和哺乳动物细胞在内的不同生物体中,只要能针对每种宿主使用正确的调控序列。
“重组DNA构建体”(在本文中也可互换地称为“表达构建体”和“构建体”)包含核酸片段(如在天然条件下不会一起存在的调控序列和编码序列)的人工组合。因此,重组DNA构建体可以包含源于不同来源的调控序列和编码序列,或源于相同来源但以不同于天然存在的方式排列的调控序列和编码序列。此类构建体可独自使用或与载体组合使用。如果使用载体,则载体的选择取决于本领域技术人员熟知的将要用于转化宿主细胞的方法。例如可以使用质粒载体。技术人员十分了解必须存在于载体上以成功地转化、选择和繁殖含本发明任何分离的核酸片段的宿主细胞的遗传元件。技术人员还将认识到,不同的独立转化事件将导致不同水平和模式的表达(Jones等人,EMBO J.,4:2411-2418(1985);DeAlmeida等人,Mol.Gen.Genetics 218:78-86(1989)),因此,必须筛选多次事件以获得显示期望表达水平和模式的品系。这样的筛选可以通过DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的免疫印迹分析或表型分析等完成。
术语“导入”指将核酸(例如表达盒)或蛋白质提供至细胞中。导入包括指将核酸整合进真核或原核细胞中,在该细胞中核酸可以整合进细胞的基因组内,并且包括指将核酸或蛋白暂时提供给细胞。导入包括指稳定的或瞬时的转化方法以及有性杂交。因此,将核酸片段(如重组DNA构建体或表达盒)插入细胞内的情况下的“导入”意指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可以整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内、转变成自主的复制子或瞬时表达(例如转染的mRNA)。
如本文所用,“转基因”指其基因组内含有异源多核苷酸的细胞。优选的是,异源多核苷酸被稳定地整合进基因组中,使得该多核苷酸能传递至连续的世代。异源多核苷酸可以单独地或作为表达盒的部分整合进基因组中。本文所用的转基因包括因异源核酸存在而已经改变了基因型的任何细胞或细胞系,包括初始进行此类改变的那些转基因以及通过初始的转基因与不同配型交配而产生的那些。在此使用的术语“转基因”不涵盖通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。
本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual;Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989);Silhavy,T.J.、Bennan,M.L.和Enquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1984);以及Ausubel,F.M.等人,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.andWiley-Interscience出版,Hoboken,NJ(1987)。转化方法是本领域技术人员熟知的并且在下文中有所描述:“综述:脂肪酸和三酰基甘油的微生物生物合成”
通常,含油微生物的脂质蓄积是响应存在于生长培养基中的总的碳氮比而触发。该过程(导致含油微生物中游离棕榈酸(16:0)的从头合成)在美国专利7,238,482中有详细描述。棕榈酸是长链饱和和不饱和脂肪酸衍生物的前体,这些脂肪酸衍生物通过延伸酶和去饱和酶的作用形成(图1)。
TAG(脂肪酸的主要贮存单位)通过涉及如下反应的一系列反应形成:(1)一分子的酰基辅酶A和甘油-3-磷酸通过酰基转移酶酯化而生成溶血磷脂酸;(2)第二分子的酰基辅酶A通过酰基转移酶酯化而生成1,2-二酰基甘油磷酸(通常称为磷脂酸);(3)通过磷脂酸磷酸酶除去磷酸而生成1,2-二酰基甘油(DAG);以及(4)在酰基转移酶的作用下加入第三个脂肪酸以形成TAG。广谱的脂肪酸可被整合进TAG中,包括饱和和不饱和脂肪酸以及短链和长链脂肪酸。
ω脂肪酸的生物合成
其中油酸转化成ω-3/ω-6脂肪酸的代谢过程涉及通过添加碳原子使碳链延长和通过加入双键使分子去饱和。这需要存在于内质网膜内的一系列特殊去饱和酶和延伸酶。然而,如图1中看到的和如下所述的,通常存在多个用于产生特定ω-3/ω-6脂肪酸的替代途径。
具体地讲,所有途径均需要最初通过Δ12去饱和酶将油酸转化成LA(第一种ω-6脂肪酸)。然后,利用“Δ9延伸酶/Δ8去饱和酶途径”并将LA用作底物来如下形成长链ω-6脂肪酸:(1)通过Δ9延伸酶将LA转化成ETA;(2)通过Δ8去饱和酶将ETA转化成DGLA;和(3)通过Δ5去饱和酶将DGLA转化成ARA;(4)通过C20/22延伸酶将ARA转化成DTA;以及(5)通过Δ4去饱和酶将DTA转化成DPAn-6。作为另外一种选择,“Δ9延伸酶/Δ8去饱和酶途径”可以将ALA用作底物来如下产生长链ω-3脂肪酸:(1)通过Δ15去饱和酶将LA转化成ALA(第一种ω-3脂肪酸);(2)通过Δ9延伸酶将ALA转化成DGLA;(3)通过Δ8去饱和酶将DGLA转化成ETA;(4)通过Δ5去饱和酶将ETA转化成EPA;(5)通过C20/22延伸酶将EPA转化成DPA;和(6)通过Δ4去饱和酶将DPA转化成DHA。任选地,ω-6脂肪酸可转化成ω-3脂肪酸;例如,ALA可通过Δ15去饱和酶活性由LA生成;ETA和EPA可通过Δ17去饱和酶活性分别由DGLA和ARA生成。
用于ω-3/ω-6脂肪酸生物合成的替代途径利用Δ6去饱和酶和C18/20延伸酶(即“Δ6去饱和酶/Δ6延伸酶途径”)。更具体地讲,LA和ALA可通过Δ6去饱和酶分别转化成GLA和ETA;然后,C18/20延伸酶将GLA转化成DGLA和/或将STA转化成ETA。随后如上所述形成下游PUFA。
预期需要导入特定宿主生物中用以产生ω-3/ω-6脂肪酸的特定功能将取决于宿主细胞(及其天然的PFUA概况和/或去饱和酶/延伸酶概况)、底物的可利用性和所需终产物。例如,在一些实施方案中优选的是Δ9延伸酶/Δ8去饱和酶途径的表达,而不是Δ6去饱和酶/Δ6延伸酶途径的表达,因为通过前面的途径产生的PUFA无GLA和/或ETA。
本领域技术人员将能够鉴定多种编码ω-3/ω-6脂肪酸生物合成所需的每种酶的候选基因。可用的去饱和酶和延伸酶序列可源自任何来源,例如,分离自天然来源(来自细菌、藻类、真菌、植物、动物等)、经由半合成途径产生或从头合成。尽管导入宿主的去饱和酶和延伸酶基因的具体来源不是关键的,但选择具有去饱和酶或延伸酶活性的特定多肽的考虑事项包括:(1)多肽的底物特异性;(2)多肽或其组分是否为限速酶;(3)去饱和酶或延伸酶是否是合成所需PUFA所必需的;(4)多肽所需的辅因子;和/或(5)多肽在其产生后是否被修饰(例如,通过激酶或异戊烯转移酶修饰)。表达的多肽优选具有与它在宿主细胞中的位置的生化环境相容的参数(对于另外的详细内容,参见美国专利7,238,482)。
在另外的实施方案中,考虑每种特定的去饱和酶和/或延伸酶的转化效率也将是有用的。更具体地讲,由于每种酶极少能以100%的效率将底物转化成产物,宿主细胞所产生的未纯化的油的最终脂质概况通常将是由期望的ω-3/ω-6脂肪酸及多种上游PUFA中间产物组成的多种PUFA的混合物。因此,当使所需脂肪酸的生物合成最优化时,每种酶的转换效率也是要考虑的变量。
考虑到上述各个考虑事项,具有合适去饱和酶和延伸酶活性(如Δ6去饱和酶、C18/20延伸酶、Δ5去饱和酶、Δ17去饱和酶、Δ15去饱和酶、Δ9去饱和酶、Δ12去饱和酶、C14/16延伸酶、C16/18延伸酶、Δ9延伸酶、Δ8去饱和酶、Δ4去饱和酶和C20/22延伸酶)的候选基因可根据可公开获得的文献(如GenBank)、专利文献和对具有产生PUFA的能力的生物的实验分析来鉴定。这些基因将适用于导入到特定的宿主生物中,以使该生物能合成PUFA或增强生物的PUFA合成。
新的Δ9延伸酶的序列鉴定
在本发明中,已经从Euglena anabaena中分离出编码Δ9延伸酶的核苷酸序列,汇总于下面的表3中。
表3
Euglena anabaenaΔ9延伸酶的汇总
缩写 | 核苷酸SEQ ID NO | 氨基酸SEQ ID NO |
EaD9Elo1 | 11 | 13 |
EaD9Elo2 | 12 | 14 |
EaD9eS | 26 | 27 |
*注意:SEQ ID NO:27与SEQ ID NO:13的序列相同。
因此,本发明涉及分离的多核苷酸,该多核苷酸包含:
(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于ClustalV比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,该多肽具有至少80%的氨基酸同一性;
(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,该核苷酸序列具有至少80%的序列同一性;或
(c)(a)、(b)或的核苷酸序列的互补序列,其中该互补序列与该核苷酸序列由相同数目的核苷酸组成并且100%互补。
在另一个方面,本发明涉及分离的多核苷酸,该多核苷酸包含编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,该核苷酸序列具有至少90%的序列同一性。
具有至少约80%-90同一性百分比(%)的更优选的氨基酸片段是特别合适的,并且具有至少约90%-95同一性百分比(%)的那些序列是最优选的。类似地,对应本发明ORF的编码Δ9延伸酶的优选核酸序列是编码活性蛋白的那些序列并且其具有至少约80%-90%的同一性;具有至少约90%-95同一性百分比(%)的那些序列是最优选的。
在备选的实施方案中,本发明的EaD9Elo1和/或EaD9Elo2序列可以经密码子最优化以便在特定的宿主生物中表达。如本领域所熟知的,这可以成为进一步优化酶在候选宿主中的表达的有用手段,因为使用宿主优选的密码子可以显著提高编码该多肽的外源基因的表达。通常,宿主优选的密码子可在所关注的具体宿主物种中通过检查蛋白质(优选那些最大量表达的蛋白质)中的密码子使用以及确定哪些密码子的使用频率最高来测定。然后,可利用宿主物种中优选的密码子整个或部分地合成具有(例如)延伸酶活性的所关注的多肽的编码序列。也可以合成DNA的全部(或部分)以去除将存在于转录的mRNA中的二级结构的任何去稳定序列或区域。也可以合成DNA的全部(或部分)以将碱基组成改变成期望宿主细胞中更优选的碱基组成。
在本文中的本发明的一个实施方案中,EaD9Elo1(SEQ ID NO:11)经密码子最优化以便在解脂耶氏酵母中表达。基于先前对解脂耶氏酵母密码子使用概况的确定、对那些优选的密码子的鉴定以及对‘ATG’起始密码子周围的共有序列的确定(参见美国专利7,238,482和美国专利7,125,672),这是可能的。所得的合成基因称为EaD9ES(SEQ ID NO:26)。由经密码子最优化的Δ9延伸酶基因编码的蛋白质序列(即SEQ IDNO:27)与野生型蛋白质序列(即SEQ ID NO:13)相同。可以利用类似的技术来产生源自EaD9Elo2(SEQ ID NO:12)的合成的Δ9延伸酶,以用于在解脂耶氏酵母中表达。
基于野生型EaD9Elo1和/或EaD9Elo2序列,本领域的技术人员应当能够利用本文中的教导内容来产生多种适用于在候选宿主中最佳表达的其他经密码子最优化的Δ9延伸酶蛋白。因此,本发明涉及任何经密码子最优化的Δ9延伸酶蛋白,该延伸酶蛋白来源于野生型核苷酸序列EaD9Elo1(SEQ ID NO:11)或EaD9Elo2(SEQ ID NO:12)。这包括但不限于SEQ ID NO:26中示出的核苷酸序列,该核苷酸序列编码经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶蛋白(即EaD9eS)。在备选的实施方案中,期望修饰编码EaD9Elo1和/或EaD9Elo2的密码子的部分,以增强基因在宿主生物(包括但不限于植物或植物部分、藻类、细菌、侯选的酵母、类眼虫、原生藻菌或真菌)中的表达。
同源物的鉴定和分离
任何本发明的延伸酶序列(即EaD9Elo1、EaD9Elo2或EaD9eS)或其部分均可用于利用序列分析软件来搜索相同或其他细菌、藻类、真菌、类眼虫或植物物种中的Δ9延伸酶同源物。通常,这种计算机软件通过将同源程度赋予多种置换、缺失和其他修饰来匹配相似的序列。
作为另外一种选择,也可将任何本发明的延伸酶序列或其部分用作杂交试剂用以鉴定Δ9延伸酶同源物。核酸杂交试验的基本组成包括探针、怀疑含有所关注的基因或基因片段的样品及特定的杂交方法。本发明的探针通常是与待检测核酸序列互补的单链核酸序列。探针与待检测的核酸序列是“可杂交的”。尽管探针的长度可在5个碱基到数万个碱基之间变化,但通常约15个碱基到约30个碱基的探针长度是合适的。只需要探针分子的部分与待检测的核酸序列互补。另外,探针和靶序列之间不需要完全互补。杂交确实可以在并不完全互补的分子之间发生,结果是杂交区内的一定比率的碱基未与正确的互补碱基配对。
杂交方法是非常确实的。通常探针和样品必须在允许核酸杂交的条件下混合。这涉及在正确浓度和温度条件下在存在无机或有机盐时使探针和样品接触。探针和样品核酸必须接触足够长的时间,使探针和样品核酸之间的任何可能的杂交均可发生。混合物中的探针或标记的浓度将决定杂交发生所需的时间。探针或靶标的浓度越高,所需的杂交孵育时间就越短。任选地,可以加入离液剂(如氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯)。如果需要,可以将甲酰胺加入到杂交混合物中,通常为30-50%(v/v)。
可以采用多种杂交溶液。通常,这些杂交溶液包含约20%至60%体积,优选30%体积的极性有机溶剂。普通的杂交溶液采用约30-50%v/v甲酰胺、约0.15至1M氯化钠、约0.05至0.1M缓冲液(如柠檬酸钠、Tris-HCl、PIPES或HEPES(pH范围约6-9))、约0.05至0.2%去污剂(如十二烷基硫酸钠)或0.5-20mM的EDTA、FICOLL(Pharmacia Inc.)(约300-500千道尔顿)、聚乙烯吡咯烷酮(约250-500千道尔顿)和血清白蛋白。一般的杂交溶液还将包含约0.1至5mg/mL未经标记的载体核酸、片段化的核酸DNA(如小牛胸腺或鲑精DNA或酵母RNA),以及任选约0.5%至2%重量/体积的甘氨酸。还可以包含其他添加剂,例如包括多种极性水溶性或可膨胀试剂(如聚乙二醇)、阴离子聚合物(如聚丙烯酸酯或聚甲基丙烯酸酯)和阴离子糖类聚合物(如硫酸葡聚糖)在内的体积排阻剂。
核酸杂交可适用于多种测定形式。最合适的形式之一是夹心测定形式。夹心测定尤其适用于在非变性条件下杂交。夹心型测定的主要成分是固体支持体。固体支持体具有吸附或共价连接至其上的固定核酸探针,该探针未经标记并且与序列的一部分互补。
在另外的实施方案中,本文描述的任何Δ9延伸酶核酸片段(或其经鉴定的任何同源物)均可用于从相同的或其他细菌、藻类、真菌、类眼虫或植物物种中分离编码同源蛋白质的基因。使用序列依赖性规程分离同源基因是本领域熟知的。序列依赖性规程的实例包括但不限于:(1)核酸杂交方法;(2)DNA和RNA扩增方法,这可通过核酸扩增技术的多种用法来举例说明[如聚合酶链反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反应(LCR),Tabor,S.等人,Proc.Acad.Sci.U.S.A.,82:1074(1985);或链置换扩增(SDA),Walker等人,Proc.Natl.Acad.Sci.U.S.A.,89:392(1992)];以及(3)文库构建和互补筛选方法。
例如,编码与本文描述的Δ9延伸酶相似的蛋白质或多肽的基因可以用本领域技术人员熟知的方法,通过将本发明的核酸片段的全部或部分用作DNA杂交探针来筛选来自(例如)任何期望的酵母或真菌(其中那些产生EDA和/或ETrA的生物将是优选的)的文库而得以直接分离。基于本发明核酸序列的特异性寡核苷酸探针可通过本领域已知的方法(Maniatis,同上)设计和合成。而且,整个序列可直接用于通过熟练技术人员已知的方法(如随机引物DNA标记、切口平移或末端标记技术)合成DNA探针,或使用可获得的体外转录体系合成RNA探针。另外,可设计特异性引物并将其用于扩增部分(或全长)的本发明序列。所得的扩增产物可在扩增反应过程中直接标记或在扩增反应后标记,并用作探针来在合适的严格条件下分离全长的DNA片段。
通常,在PCR类型的扩增技术中,引物具有不同的序列而且彼此之间不互补。取决于所需的检测条件,应当设计引物序列以提供既有效又可靠的靶核酸的复制。PCR引物设计方法是本领域常见且熟知的(Thein和Wallace,“The use of oligonucleotide as specific hybridization probes inthe Diagnosis of Genetic Disorders”,Human Genetic Diseases:A PracticalApproach,K.E.Davis编辑,(1986)第33-50页,IRL:Herndon,VA;以及Rychlik,W.,Methods in Molecular Biology,White,B.A.编辑,(1993)第15卷,第31-39页,PCR Protocols:Current Methods and Applications.Humania:Totowa,NJ)。
通常,可以将本发明序列的两个短片段在PCR规程中用于从DNA或RNA扩增编码同源基因的更长的核酸片段。PCR也可以用克隆的核酸片段的文库进行,其中一个引物的序列源自本发明的核酸片段,而另一个引物的序列利用编码真核基因的mRNA前体3′端的多腺苷酸尾的存在。
备选地,第二个引物序列可以基于来源于克隆载体的序列。例如,技术人员可以按照RACE规程(Frohman等人,Proc.Acad.Sci.U.S.A.,85:8998(1988)),通过用PCR扩增在转录物内单个位点与3′或5′端之间的区域的拷贝来产生cDNA。以3′和5′方向取向的引物可用本发明的序列设计。使用可商业获得的3′RACE或5′RACE体系(Gibco/BRL,Gaithersburg,MD)可以分离特异性的3′或5′cDNA片段(Ohara等人,Proc.Acad.Sci.U.S.A.,86:5673(1989);Loh等人,Science,243:217(1989))。
在其他实施方案中,任何本文所述的Δ9延伸酶核酸片段(或其经鉴定的任何同源物)均可用于产生新的和/或改良的脂肪酸延伸酶。如本领域所熟知的,体外诱变和选择、化学诱变、“基因改组(gene shuffling)”法或其他手段可用于获得天然存在的延伸酶基因的突变(其中这种突变可以包括缺失、插入和点突变或它们的组合)。这将使得能分别在体内产生具有延伸酶活性的多肽,该多肽在宿主细胞内具有更佳的物理参数和动力参数,例如更长的半衰期或更高的所需PUFA的产生速率。或者,如果需要,可以通过常规诱变、所得突变多肽的表达及其活性的测定来确定所关注的多肽(即Δ9延伸酶)对酶活性重要的区域。这些技术的综述在美国专利7,238,482中有描述。源自EaD9Elo1、EaD9Elo2和EaD9eS的所有这类突变蛋白和编码它们的核苷酸序列均在本发明的范围内。
备选地,改良的脂肪酸可以通过结构域交换合成,在该方法中将来自本文所述的任何Δ9延伸酶核酸片段的功能结构域与备选的延伸酶基因的功能结构域交换,从而产生新的蛋白质。如本文所用,“结构域”或“功能结构域”指能够引起微生物中的生物学应答的核酸序列。
用于产生多种ω-3和/或ω-6脂肪酸的方法
预计引入编码本文所述的Δ9延伸酶(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或它们的同源物)的嵌合基因,处于合适的启动子控制下,将会分别导致EDA和/或ETrA在转化的宿主生物中的产生增加。就这一点而论,本发明涵盖了用于直接产生PUFA的方法,该方法包括将脂肪酸底物(即LA和/或ALA)暴露给本文所述的延伸酶(例如,EaD9Elo1、EaD9Elo2或EaD9eS),使得底物被转化成所需的脂肪酸产物(即分别为EDA和/或ETrA)。
更具体地讲,本发明的目的是提供用于在微生物宿主细胞(如酵母、藻类、细菌、类眼虫、原生藻菌和真菌)中产生EDA的方法,其中微生物宿主细胞包含:
(a)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与具有SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列的多肽进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(b)LA源;
其中使微生物宿主细胞在使编码Δ9延伸酶的核酸片段表达并使LA转化成EDA的条件下生长,并且其中可任选回收EDA。
在本发明的备选实施方案中,Δ9延伸酶可用于将ALA转化成ETrA。因此,本发明提供了用于产生ETrA的方法,其中微生物宿主细胞包含:
(a)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与具有SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列的多肽进行比较时,该延伸酶多肽具有至少80%的氨基酸同一性;和
(b)ALA源;
其中使微生物宿主细胞在使编码Δ9延伸酶的核酸片段表达并使ALA转化成ETrA的条件下生长,而且其中可任选回收ETrA。
作为另外一种选择,本文描述的每种Δ9延伸酶基因及其相应的酶产物可间接用于产生多种ω-6和ω-3PUFA(参见图1和美国专利7,238,482)。如果脂肪酸底物经由中间步骤或途径中间产物间接转化成所需的脂肪酸产物,则间接产生了ω-3/ω-6PUFA。因此,预期可以将本文描述的Δ9延伸酶(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或它们的同源物)与另外的编码PUFA生物合成途径的酶(如Δ6去饱和酶、C18/20延伸酶、Δ17去饱和酶、Δ8去饱和酶、Δ15去饱和酶、Δ9去饱和酶、Δ12去饱和酶、C14/16延伸酶、C16/18延伸酶、Δ9延伸酶、Δ5去饱和酶、Δ4去饱和酶、C20/22延伸酶)的基因结合表达以导致更高水平地产生长链ω-3/ω-6脂肪酸(如ARA、EPA、DTA、DPAn-6、DPA和/或DHA)。
在优选的实施方案中,本发明的Δ9延伸酶将与Δ8去饱和酶(例如,来自小眼虫的去饱和酶[Wallis等人,Arch.Biochem.and Biophys.,365(2):307-316(May 1999);PCT公开WO 2000/34439;美国专利6,825,017;PCT公开WO 2004/057001;PCT公开WO 2006/012325;美国专利7,256,033;美国专利申请11/635258];来自卡氏棘变形虫(Acanthamoeba castellanii)的去饱和酶[Sayanova等人,FEBS Lett.,580:1946-1952(2006)];来自盐生巴夫藻(Pavlova salina)的去饱和酶[PCT公开WO 2005/103253];来自路氏巴夫藻(Pavlova lutheri)的去饱和酶[PCT公开WO 2007/127381];来自Tetruetreptia pomquetensisCCMP1491的去饱和酶[美国专利申请11/876115];来自Eutreptiellasp.CCMP389的去饱和酶[美国专利申请11/876115];来自Eutreptiellacf_gymnastica CCMP1594的去饱和酶[美国专利申请11/876115;以及来自Euglena anabaena的去饱和酶[在共同未决的美国专利申请12/099799和12/099811中有描述])最低程度地一起表达。然而,包含于具体表达盒中的具体基因将取决于宿主细胞(及其PUFA概况和/或去饱和酶/延伸酶概况)、底物的可利用性和所需的终产物。
在备选的实施方案中,基于本文所述的完整序列、那些完整序列的互补序列、那些序列的基本部分、源于它们的经密码子最优化的延伸酶以及与它们基本同源的那些序列,破坏宿主生物的天然Δ9延伸酶可能是有用的。
微生物表达系统、表达盒和载体
本文描述的Δ9延伸酶基因和基因产物(即EaD9Elo1、EaD9Elo2、EaD9eS或其他突变酶、经密码子最优化的酶或其同源物)可以在异源微生物宿主细胞中表达,特别是在含油酵母(如解脂耶氏酵母)的细胞中表达。
含有引导外来蛋白质高水平表达的调控序列的微生物表达系统和表达载体是本领域技术人员熟知的。这些表达系统和表达载体的任一种均可用于构建用于产生本发明序列的任何基因产物的嵌合基因。然后可以将这些嵌合基因通过转化导入合适的微生物中以提供所编码的酶的高水平表达。
可用于转化合适的微生物宿主细胞的载体(如构建体、质粒)和DNA表达盒是本领域熟知的。存在于构建体中的序列的具体选择取决于所需的表达产物(同上)、宿主细胞的性质以及提出的相对于未转化细胞分离转化细胞的手段。然而,通常载体含有至少一个表达盒、选择标记和允许自主复制或染色体整合的序列。合适的表达盒包含基因控制转录的5′区(如启动子)、基因编码序列和控制转录终止的DNA片段3′区(如终止子)。最优选的是,这两个控制区均来源于来自转化的微生物宿主细胞的基因,但应当了解这种控制区不必源自选作生产宿主的特定物种的天然基因。
可用于驱动本发明的Δ9延伸酶ORF在期望的微生物宿主细胞中表达的转录控制区(也称为起始控制区或启动子)有许多并且是本领域技术人员所熟悉的。事实上,能够引导这些基因在所选宿主细胞中表达的任何启动子(即天然的、合成的或嵌合的启动子)均适用于本发明,但来自宿主物种的转录和翻译区是尤其有用的。在微生物宿主细胞中的表达可以诱导型或组成型的方式来实现。诱导型表达可通过诱导可操作地连接至所关注的基因的可调节启动子的活性来完成,而组成型表达可通过利用可操作地连接至所关注的基因的组成型启动子来实现。例如,当宿主细胞为酵母时,则提供在酵母细胞中起作用的转录和翻译区,尤其是来自宿主物种的转录和翻译区(例如,对于在解脂耶氏酵母中使用的优选的转录起始调节区,参见专利公开US-2006-0115881-A1)。可以使用许多调控序列的任意一种,这取决于是期望组成型转录还是诱导型转录、启动子在表达所关注的ORF中的效率、构建的容易性等。
已经发现围绕翻译起始密码子‘ATG’的核苷酸序列影响酵母细胞的表达。如果所需多肽在酵母中表达差,则可以修饰外源基因的核苷酸序列以包括有效的酵母翻译起始序列来获得最佳的基因表达。对酵母中的表达而言,这可以通过使无效表达基因框内融合至内源酵母基因(优选高度表达的基因)而使其定点诱变来完成。作为另外一种选择,可以测定宿主中的共有翻译起始序列并将该序列引入异源基因中,以便它们在所关注宿主中最优化表达。
终止区可源于起始区从其获得的基因的3′区或源于不同的基因。大量的终止区是已知的并且(在用于与它们源自的属和物种相同和不同的属和物种两者时)在多种宿主中发挥的功能令人满意。终止区的选择通常更多是为了方便而不是因为任何特殊的性质。终止控制区也可以源于优选宿主的天然的多种基因。在备选的实施方案中,3′-区也可以是合成的,因为本领域的技术人员可利用可用的信息来设计和合成用作转录终止子的3′-区序列。任选地,终止位点可以是非必需的;然而,如果包括则是最优选的。
如本领域的技术人员所意识到的,仅仅将基因插入到克隆载体中不能保证它将被成功地以所需要的水平表达。根据对高表达率的需要,通过操作许多控制转录、翻译、蛋白质稳定性、氧限制和从微生物宿主细胞分泌方面的不同遗传元件,已经建立了许多专用的表达载体。更具体地讲,已经被操作以控制基因表达的一些分子特征包括:相关转录启动子和终止子序列的性质;所克隆基因的拷贝数目(其中可以在单个表达构建体中克隆另外的拷贝和/或将另外的拷贝通过增加质粒拷贝数或通过将克隆基因多次整合进基因组中来引入宿主细胞中);基因是质粒携带的还是整合进了宿主细胞的基因组中;所合成的外来蛋白质的最终细胞定位;蛋白质在宿主生物内的翻译和正确折叠的效率;所克隆基因的mRNA和蛋白质在宿主细胞内的固有稳定性;以及所克隆基因中的密码子使用,使得其频率与宿主细胞的优选密码子使用频率接近。这些类型的修饰的每一种均涵盖在本发明中,作为进一步优化本文所述的Δ9延伸酶的表达的手段。
微生物宿主细胞的转化
一旦已经获得适用于在合适的微生物宿主细胞中表达的DNA盒(例如包含启动子、ORF和终止子的嵌合基因),则将其置于能够在宿主细胞中自主复制的质粒载体中,或将其直接整合进宿主细胞的基因组中。表达盒的整合可以在宿主基因组中随机地发生或者可以通过使用这样的构建体来靶向,即该构建体含有足以靶向宿主基因座中的重组的与宿主基因组同源的区。如果构建体靶向内源性基因座,则转录和翻译调控区的全部或某些可以由内源性基因座提供。
如果两个或更多个基因从独立的复制载体表达,则希望每个载体具有不同的选择手段并且应当缺乏与其他构建体的同源性以便维持稳定表达和防止元件在构建体之间重配(reassortment)。可用实验方法确定对调控区、选择手段和所引入的构建体的增殖方法的正确选择,以便所有导入的基因均以需要的水平表达从而提供所需产品的合成。
包含所关注的基因的构建体可以通过任何标准技术导入微生物宿主细胞中。这些技术包括转化(如醋酸锂转化[Methods in Enzymology,194:186-187(1991)])、原生质体转化、基因枪轰击(bolistic impact)、电穿孔、显微注射或将所关注的基因引入宿主细胞中的任何其他方法。
为方便起见,已通过任何方法操纵来吸收DNA序列(如表达盒)的宿主细胞在本文中将称为“转化的”、“转化体”或“重组体”。因此,术语“转化的”和“转化体”在本文中可互换使用。转化的宿主将具有至少一个拷贝的表达构建体,而且可以具有两个或更多个拷贝,这取决于该表达盒是整合进基因组内还是存在于具有多拷贝数的染色体外元件上。
转化的宿主细胞可以通过多种选择技术来鉴定,如美国专利7,238,482、美国专利7,259,255和PCT公开WO 2006/052870中所述。
转化后,适用于本发明的Δ9延伸酶(以及任选在宿主细胞中共表达的其他PUFA酶)的底物可以由宿主自然产生或通过转基因产生,或者它们可以由外部来源提供。
用于重组表达的优选的微生物宿主
用于表达本发明基因和核酸片段的微生物宿主细胞可以包括在多种原料(包括简单或复杂的碳水化合物、脂肪酸、有机酸、油、甘油和醇,和/或碳氢化合物)上于宽的温度和pH值范围内生长的宿主。基于申请人的受让人的需要,本发明描述的基因已经在含油酵母(并且特别是解脂耶氏酵母)中表达;然而预期的是,由于转录、翻译和蛋白质生物合成结构是高度保守的,因此任何细菌、酵母、藻类、类眼虫、原生藻菌和/或真菌均将是用于表达本发明的核酸片段的合适微生物宿主。
然而,优选的微生物宿主是含油生物,例如含油酵母。这些生物天然能够合成并积聚油,其中油可构成超过约25%的细胞干重,更优选超过约30%的细胞干重,而最优选超过约40%的细胞干重。通常鉴定为含油酵母的属包括但不限于:耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。更具体地讲,示例性的油合成酵母包括:圆红冬孢酵母、斯达氏油脂酵母、产油油脂酵母、拉可夫氏假丝酵母、铁红假丝酵母、热带假丝酵母、产朊假丝酵母、茁芽丝孢酵母、皮状丝孢酵母、胶粘红酵母、牧草红酵母和解脂耶氏酵母(以前归类为解脂假丝酵母(Candida lipolytica))。在备选的实施方案中,可以通过基因工程进行油的生物合成,使得微生物宿主细胞(如酵母)产生多于25%细胞干重的油,从而被认为是含油的。
最优选的是含油酵母解脂耶氏酵母;并且,在又一个实施方案中,最优选的是命名为ATCC #20362、ATCC #8862、ATCC #18944、ATCC#76982和/或LGAM S(7)1的解脂耶氏酵母菌株(Papanikolaou S.和Aggelis G.,Bioresour.Technol.,82(1):43-9(2002))。
历史上,已经使用多种解脂耶氏酵母菌株用于加工和生产:异柠檬酸裂解酶;脂肪酶;聚羟基链烷酸酯;柠檬酸;赤藓醇;2-酮戊二酸;γ-癸内酯;γ-十二内酯;以及丙酮酸。可用于转化含油酵母(即解脂耶氏酵母)的具体教导内容包括美国专利4,880,741和美国专利5,071,764,以及Chen,D.C.等人(Appl.Microbiol.Biotechnol.,48(2):232-235(1997))。可用于在解脂耶氏酵母中工程化生产ARA、EPA和DHA的具体教导内容分别在美国专利申请11/264784、美国专利申请11/265761和美国专利申请11/264737中提供。在这种酵母中表达基因的优选方法是将线性DNA整合到宿主的基因组中;而且,当期望基因高水平表达时,则整合到基因组中的多个位置是尤其有用的[如在Ura3基因座(基因库编号AJ306421)、Leu2基因座(基因库编号AF260230)、Lys5基因座(基因库编号M34929)、Aco2基因座(基因库编号AJ001300)、Pox3基因座(Pox3:基因库编号XP_503244;或Aco3:基因库编号AJ001301)、Δ12去饱和酶基因座(美国专利7,214,491)、Lip1基因座(基因库编号Z50020)、Lip2基因座(基因库编号AJ012632)、SCP2基因座(基因库编号AJ431362)和/或Pex10基因座(基因库编号CAG81606)]。
用于解脂耶氏酵母的优选选择方法是对卡那霉素、潮霉素和氨基糖苷G418抗性以及在缺乏尿嘧啶、亮氨酸、赖氨酸、色氨酸或组氨酸的培养基上生长的能力。在备选的实施方案中,5-氟乳清酸(5-氟尿嘧啶-6-羧酸一水合物;“5-FOA”)可用于选择酵母Ura-突变体。该化合物对具有编码乳清苷5′-单磷酸脱羧酶(OMP脱羧酶)的功能性URA3基因的酵母细胞有毒性;因此,基于这种毒性,5-FOA特别可用于选择和鉴定Ura-突变型酵母菌株(Bartel,P.L.和Fields,S.,Yeast 2-Hybrid System,Oxford University:New York,v.7,第109-147页,1997;对于5-FOA在耶氏酵母中的使用,还可参见PCT公开WO 2006/052870)。
用于耶氏酵母的备选的优选选择方法依赖于用于解脂耶氏酵母的基于磺酰脲(氯嘧磺隆;E.I.duPont de Nemours & Co.,Inc.,Wilmington,DE)抗性的显性非抗生素标记。更具体地讲,该标记基因是具有单个氨基酸改变(W497L)的天然乙酰羟酸合酶(AHAS或乙酰乳酸合酶;E.C.4.1.3.18),从而赋予了磺酰脲除草剂抗性(PCT公布WO 2006/052870)。AHAS是用于生物合成支链氨基酸(即缬氨酸、亮氨酸、异亮氨酸)的途径中的第一常用酶,并且它是磺酰脲和咪唑啉酮除草剂的靶标。
其他优选的微生物宿主包括含油的细菌、藻类、类眼虫、原生藻菌和其他真菌;并且,在这一广泛的微生物宿主群组中,特别关注的是合成ω-3/ω-6脂肪酸的微生物(或可以为该目的进行基因工程改造的那些微生物[例如,诸如啤酒糖酵母(Saccharomyces cerevisiae)之类的其他酵母])。因此,例如,用处于诱导型或调节型启动子控制下的任何本发明的Δ9延伸酶基因转化高山被孢霉(Mortierella alpina)(其在商业上用于生产ARA)可以产生能够合成增加量的EDA的转化生物;EDA可以转化成增加量的DGLA,如果Δ8去饱和酶基因被共表达的话。Mackenzie等人(Appl.Environ.Microbiol.,66:4655(2000))描述了转化高山被孢霉的方法。类似地,用于转化破囊壶菌目(Thraustochytriales)微生物(例如破囊壶菌(Thraustochytrium)、裂殖壶菌(Schizochytrium))的方法在U.S.7,001,772中公开。
不论选择哪种宿主用于表达本文描述的Δ9延伸酶,均需要筛选多个转化体以获得显示期望表达水平和模式的菌株。这种筛选可以通过DNA印迹的Southern分析(Southern,J.Mol.Biol.,98:503(1975))、mRNA表达的Northern分析(Kroczek,J.Chromatogr.Biomed.Appl.,618(1-2):133-145(1993))、蛋白质表达的Western和/或Elisa分析、PUFA产物的表型分析或GC分析来完成。
基于上述教导内容,在一个实施方案中,本发明描写了分别产生EDA或ETrA的方法,该方法包括:
(a)提供含油酵母(例如解脂耶氏酵母),其包含:
(i)编码Δ9延伸酶多肽的第一重组核苷酸分子,该核苷酸分子可操作地连接至至少一个调控序列;和
(ii)分别由LA和/或ALA组成的延伸酶底物源;和
(b)在存在合适的可发酵碳源的情况下使步骤(a)的酵母生长,其中编码Δ9延伸酶多肽的基因得以表达而且分别将LA转化成EDA和/或将ALA转化成ETrA;以及,
(c)任选地分别回收步骤(b)中的EDA和/或ETrA。可能需要供给底物。
编码Δ9延伸酶的基因的核苷酸序列可以选自SEQ ID NO:11和SEQ ID NO:12。在备选的实施方案中,编码Δ9延伸酶多肽的基因的核苷酸序列在SEQ ID NO:26中示出(其中相对于SEQ ID NO:11,至少98个密码子已经被最优化以便在耶氏酵母属中表达)。
由于含油酵母中天然产生的PUFA仅限于18:2脂肪酸(即LA)和通常较少的18:3脂肪酸(即ALA),因此除了本文所述的Δ9延伸酶之外,还将对含油酵母进行基因工程改造以表达多种对长链PUFA生物合成所必需的酶(由此使得能产生例如ARA、EPA、DPA和DHA)。
具体地讲,在本发明的一个实施方案中涉及的含油酵母包含:
(a)包含分离的多核苷酸的第一重组DNA构建体,该多核苷酸编码Δ9延伸酶多肽,并被可操作地连接至至少一个调控序列;和
(b)至少一个另外的重组DNA构建体,该构建体包含可操作地连接至至少一个调控序列的分离的多核苷酸,其编码的多肽选自如下酶:Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ9去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ8去饱和酶、C14/16延伸酶、C16/18延伸酶、C18/20延伸酶和C20/22延伸酶。
在特别优选的实施方案中,至少一个另外的重组DNA构建体编码具有Δ8去饱和酶活性的多肽。
微生物中的ω-3和/或ω-6脂肪酸生物合成的代谢工程
有关本发明的Δ9延伸酶序列的知识将可用于操纵多种宿主细胞中的ω-3和/或ω-6脂肪酸的生物合成。操纵生化途径的方法是本领域的技术人员所熟知的;而且,预计很多操纵方法将可能使含油酵母并且尤其是解脂耶氏酵母中的ω-3和/或ω-6脂肪酸的生物合成达到最大程度。这种操纵可能需要直接在PUFA生物合成途径中进行代谢工程改造,或者需要另外对为PUFA生物合成途径提供碳的途径进行操纵。可用于上调期望的生化途径和下调不期望的生化途径的方法是本领域技术人员熟知的。
例如,与ω-3和/或ω-6脂肪酸生物合成途径竞争能量或碳的生化途径或干扰特定PUFA终产物产生的天然PUFA生物合成途径中的酶可以通过基因破坏来去除或通过其他手段(如反义mRNA)来下调。
在PUFA生物合成途径中作为增加ARA、EPA或DHA的手段的操纵(及其相关技术)的详细讨论分别在美国专利公开2006-0094092-A1、美国专利公开2006-0115881-A1和美国专利公开2006-0110806-A1中给出,在TAG生物合成途径和TAG降解途径中的理想的操纵(及其相关技术)也在其中给出。
在本发明的上下文中,通过上述策略中的任意一种来调节脂肪酸生物合成途径的表达均可能是有用的。例如,本发明提供了方法,通过该方法,将编码Δ9延伸酶/Δ8去饱和酶生物合成途径中的关键酶的基因引入含油酵母中用以产生ω-3和/或ω-6脂肪酸。利用对宿主生物进行代谢工程改造的多种手段,使本发明的Δ9延伸酶基因在天然条件下不具有ω-3和/或ω-6脂肪酸生物合成途径的含油酵母中表达并协调这些基因的表达,以最大程度地产生优选的PUFA产物将是特别有用的。
用于PUFA生产的微生物发酵过程
使转化的微生物宿主细胞在使嵌合的去饱和酶和延伸酶基因的表达最优化而且产生的所需PUFA的产率最大且最经济的条件下生长。通常,可以被优化的培养基条件包括碳源的类型和量、氮源的类型和量、碳氮比、不同矿物离子的量、氧水平、生长温度、pH、生物量生产期的时长、油积聚期的时长以及细胞收获的时间和方法。使所关注的微生物(例如含油酵母,如解脂耶氏酵母)通常在复合培养基(例如酵母提取物-蛋白胨-葡萄糖肉汤培养基(YPD))或缺乏生长所必需的成分并由此强迫选择所需表达盒的确定成分的极限培养基(如Yeast NitrogenBase(DIFCO Laboratories,Detroit,MI))中生长。
本发明的发酵培养基必须含有合适的碳源。美国专利7,238,482中教导了合适的碳源。尽管预期本发明中利用的碳源可以涵盖许多种含碳源,但优选的碳源是糖类(如葡萄糖)、甘油和/或脂肪酸。
氮可以由无机源(如(NH4)2SO4)或有机源(如尿素或谷氨酸)提供。除了合适的碳源和氮源之外,发酵培养基还必须含有合适的矿物质、盐、辅因子、缓冲液、维生素和本领域技术人员已知的适合含油宿主生长并促进PUFA产生所必需的酶促途径的其他组分。要特别注意促进脂质和PUFA合成的几种金属离子(如Fe+2、Cu+2、Mn+2、Co+2、Zn+2、Mg+2)(Nakahara,T.等人,Ind.Appl.Single Cell Oils,D.J.Kyle和R.Colin(编辑).第61-97页(1992))。
本发明中优选的生长培养基是普通的商业制备的培养基,例如Yeast Nitrogen Base(DIFCO Laboratories,Detroit,MI)。也可以使用其他确定成分的生长培养基或合成的生长培养基,适于转化宿主细胞生长的培养基对微生物学或发酵科学领域的技术人员来说将是已知的。适于发酵的pH范围通常介于约pH4.0至pH8.0之间,其中优选将pH5.5至pH7.5作为初始生长条件的范围。发酵可以在有氧或厌氧条件下进行,其中优选为微好氧条件。
通常,在含油酵母细胞中积聚高水平的PUFA需要一个包括两个阶段的过程,因为代谢状态必须在生长和脂肪的合成/贮存之间达到“平衡”。因此,最优选的是,包括两个阶段的发酵过程是在含油酵母(如解脂耶氏酵母)中产生PUFA所必需的。这种方法在美国专利7,238,482中有所描述,其也描述了多种合适的发酵工艺设计(即分批式、补料分批式和连续式)和生长过程中的注意事项。
PUFA油的纯化和处理
PUFA可以游离脂肪酸或以酯化的形式(例如酰基甘油、磷脂、硫脂或糖脂)存在于宿主微生物中,并且可以通过本领域熟知的多种手段从宿主细胞提取。关于酵母脂质的提取技术、质量分析和可接受标准的一篇综述是Z.Jacobs(Critical Reviews in Biotechnology,12(5/6):463-491(1992))的综述。有关下游加工的简述也可由A.Singh和O.Ward(Adv.Appl.Microbiol.,45:271-312(1997))提供。
通常,用于纯化PUFA的手段可包括用有机溶剂萃取(例如,美国专利6,797,303和美国专利5,648,564)、超声处理、超临界流体萃取(如使用二氧化碳)、皂化和物理手段(例如挤压),或它们的组合。另外的详细信息可参考美国专利7,238,482的教导内容。
含PUFA的油在食品、保健食品、药物和动物饲料中的用途
市场目前支持各种掺入了ω-3和/或ω-6脂肪酸(尤其是例如ALA、GLA、ARA、EPA、DPA和DHA)的食物和饲料产品。预期包含长链PUFA的微生物量、部分纯化的包含PUFA的微生物量、纯化的包含PUFA的微生物油和/或纯化的PUFA将在食物和饲料产品中起作用以赋予该制剂的健康益处。更具体地讲,本发明的含有ω-3和/或ω-6脂肪酸的油将适用于多种食物和饲料产品,包括但不限于:食物模拟物、肉产品、谷类产品、烘焙食物、小吃和乳制品(关于详细内容请参见专利公开US-2006-0094092)。
此外,本发明的组合物可用于制剂中以在医疗食物(包括医疗营养品、膳食补充剂、婴儿代乳品以及药物产品)中赋予健康益处。食物加工和食物配制领域的技术人员将了解所述各种油的量和组成如何加入食物或饲料产品中。该量在本文中将称为“有效”量并将取决于食物或饲料产品、期望补充该产品的膳食或医疗食物或医疗营养品旨在纠正或治疗的医学状况。
实施例
本发明将在下面的实施例中得以进一步说明,其中份数和百分比是以重量计并且度数是摄氏度,除非另外说明。应当理解,尽管这些实施例说明了本发明的优选实施方案,但仅是以例证的方式给出的。根据上面的论述和这些实施例,本领域的技术人员可确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下,可对本发明做出多种改变和修饰,以使其适用于多种用途和条件。因此,除了本文所示和描述的那些之外,根据前文所述,本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在涵盖于所附权利要求书的范围内。
一般方法
实施例中使用的标准重组DNA技术和分子克隆技术是本领域所熟知的并且在如下文献中有所描述:1.)Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual;Cold Spring HarborLaboratory:Cold Spring Harbor,NY(1989)(Maniatis);2.)T.J.Silhavy,M.L.Bennan和L.W.Enquist,Experiments with Gene Fusions;Cold SpringHarbor Laboratory:Cold Spring Harbor,NY(1984);以及3.)Ausubel,F.M.等人,Current Protocols in Molecular Biology,由Greene Publishing Assoc.and Wiley-Interscience出版(1987)。
适用于微生物培养物的维持和生长的材料和方法是本领域熟知的。适用于下面实施例的技术可在Manual of Methods for GeneralBacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Phillips编辑),American Society for Microbiology:Washington,D.C.(1994));或Thomas D.Brock in Biotechnology:A Textbook of IndustrialMicrobiology,第2版,Sinauer Associates:Sunderland,MA(1989)的描述中找到。用于微生物细胞的生长和维持的所有试剂、限制性内切酶和材料均获自Aldrich Chemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI)、GIBCO/BRL(Gaithersburg,MD)或Sigma ChemicalCompany(St.Louis,MO),除非另外说明。通常于37℃下在Luria Bertani(LB)平板上培养大肠杆菌(E.coli)菌株。
一般的分子克隆根据标准方法(Sambrook等人,同上)来完成。DNA序列是在ABI自动测序仪上采用染料终止剂技术(美国专利5,366,860;EP272,007)使用载体和插入片段特异性引物的组合来产生的。序列编辑是在Sequencher(Gene Codes Corporation,Ann Arbor,MI)中进行的。所有序列在两个方向上覆盖至少两次。基因序列的比较是使用DNASTAR软件(DNAStar Inc.,Madison,WI)来完成。
缩写的含义如下:“sec”表示秒,“min”表示分钟,“h”或“hr”表示小时,“d”表示天,“μL”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩尔,“mM”表示毫摩尔,“M”表示摩尔,“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“U”表示单位,“bp”表示碱基对并且“kB”表示千碱基。
表达盒的命名:
表达盒的结构将通过简单的记号系统“X::Y::Z”表示,其中X描述启动子片段,Y描述基因片段而Z描述终止子片段,它们均彼此可操作地连接。
解脂耶氏酵母的转化和培养:
ATCC登录号为#20362、#76982和#90812的解脂耶氏酵母菌株可购自美国典型培养物保藏中心(Rockville,MD)。解脂耶氏酵母菌株通常是在根据下面所示的配方的数种培养基中于28-30℃下培育。根据标准方法,按需要通过将20g/L琼脂添加到每种液体培养基中来制备琼脂平板。
YPD琼脂培养基(每升):10g酵母提取物[Difco],20g细菌用蛋白胨[Difco];以及20g葡萄糖。
极限培养基(MM)(每升):20g/L葡萄糖;1.7g无氨基酸的酵母氮源基础;无氨基酸的基础培养基;1.0g脯氨酸;并且pH为6.1(未调节)。
极限培养基+5-氟乳清酸(MM+5-FOA)(每升):20g葡萄糖、6.7g酵母氮源基础、75mg尿嘧啶、75mg尿苷,并且基于对一系列从100mg/L至1000mg/L的浓度的FOA活性试验(因为供应商提供的每批料中会发生改变),选用适量的FOA(Zymo Research Corp.,Orange,CA)。
解脂耶氏酵母的转化是根据Chen,D.C.等人(Appl.Microbiol.Biotechnol.,48(2):232-235(1997))的方法实施,除非另外指明。简而言之,将耶氏酵母划线接种到YPD平板上,并在30℃下培育大约18小时。从平板上刮掉数个大环量的细胞并将其重悬浮于1mL含有如下成分的转化缓冲液中:2.25mL 50%的PEG,平均分子量为3350;0.125mL 2M的醋酸锂,pH 6.0;0.125mL 2M的DTT;以及(可任选)50μg已剪切的鲑精DNA。然后,将大约500ng线性化的DNA(优选包含至少一种嵌合基因)(或100ng环状质粒)在100μL重悬浮的细胞中孵育,并将其在39℃下保持1小时,每间隔15分钟进行涡旋混合。将细胞铺在选择培养基平板上并在30℃下保持2至3天。
解脂耶氏酵母的脂肪酸分析:
对于脂肪酸分析,将细胞通过离心收集并如Bligh,E.G.&Dyer,W.J.(Can.J.Biochem.Physiol.,37:911-9171959))中所述提取脂质。通过将脂质提取物与甲醇钠进行酯交换反应而制备脂肪酸甲酯(Roughan,G.和Nishida I.,Arch Biochem Biophys.,276(1):38-46(1990))并随后将其用配有30mx0.25mm(内径)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890气相色谱仪(GC)进行分析。烘箱温度以3.5℃/分钟从170℃(保持25分钟)升到185℃。
为了进行直接的碱催化酯交换反应,收获耶氏酵母培养物(3mL),在蒸馏水中洗涤一次,并在Speed-Vac中在真空下干燥5-10分钟。将甲醇钠(100μl,1%)加入样品中,然后将样品涡旋振荡20分钟。在加入3滴1M氯化钠和400μl己烷后,涡旋样品并离心。移出上层并如上所述用GC进行分析。
实施例1
来自Euglena anabaena UTEX 373的cDNA文库的合成
本实施例描述了来自Euglena anabaenaUTEX 373的cDNA文库的合成。该工作包括制备RNA、合成cDNA和产生cDNA文库。
Euglena anabaena UTEX 373的培育和RNA制备
Euglena anabaena UTEX 373可获自密西根州立大学RichardTriemer博士的实验室(East Lansing,MI)。移出约2ml培养物用于液体分析,将其以1,800xg离心5分钟。用水洗涤沉淀一次并再次离心。将所得沉淀真空干燥5分钟,重悬浮于100μL三甲基氢氧化硫(TMSH)中,在室温下摇动孵育15分钟。孵育后,加入0.5mL己烷并将该小瓶在室温下另外摇动孵育15分钟。使用配有Omegawax 320熔融石英毛细柱的Hewlett-Packard 6890气相色谱(Supelco Inc.,目录号24152)对脂肪酸甲酯(从己烷层取5μL注射上样)进行分离和定量。用程序控制烘箱温度在170℃保持1.0分钟,以5℃/分钟上升到240℃,然后另外保持1.0分钟。载气通过Whatman氢发生器供应。将保留时间与那些市售的甲酯标准样品(Nu-Chek Prep,Inc.,目录号U-99-A)的保留时间进行比较,所得的色谱图在图2中示出。脂肪酸概况中存在EDA、ETrA、EPA和DHA且不存在GLA和STA表明,Euglena anabaena采用Δ9延伸酶/Δ8去饱和酶途径来用于长链(LC)PUFA的生物合成,并且将会是LC-PUFA生物合成基因(例如但不限于Δ9延伸酶)的良好来源。
将剩余的5mL活跃生长的培养物转移至125mL玻璃烧瓶中的25mLAF-6培养基(Watanabe & Hiroki,NIES-Collection List of Strains,第5版,National Institute for Environmental Studies,Tsukuba,第127页(2004))中。采用16小时光照8小时黑暗周期并进行非常轻微的搅动,使小眼虫培养物在22℃下生长2周。
2周后,将培养物(25mL)转移至500mL玻璃瓶中的100mL AF-6培养基中,如上所述使培养物生长1个月。在这之后,将两份50mL的等份试样转移进两个分开的装有250mL AF-6培养基的500mL玻璃瓶中,如上所述将培养物培育2个月(得到总共约600mL的培养物)。接下来,以1,800xg离心10分钟获得培养物的沉淀颗粒,将其用水洗涤一次并再次离心。使用RNA STAT-60TM试剂(TEL-TEST,Inc.,Friendswood,TX),按照制造商提供的规程(使用5mL试剂,将RNA溶解于0.5mL水中)从一份所得的沉淀中提取总RNA。这样,从沉淀中获得340μg的总RNA(680ug/mL)。将剩余的沉淀在液氮中冷冻并在-80℃下保存。使用mRNA纯化试剂盒(Amersham Biosciences,Piscataway,NJ)按照制造商提供的规程从340μg总RNA中来分离mRNA。这样,获得9.0μg mRNA。
Euglena anabaena cDNA的制备和cDNA文库eug1c的产生
使用CloneminerTM cDNA文库构建试剂盒(目录号18249-029,Invitrogen Corporation,Carlsbad,CA),按照制造商提供的规程(VersionB,25-0608)产生cDNA文库。使用非放射标记方法,从5.12μg mRNA(上文所述的mRNA)中用生物素-attB2-Oligo(dT)引物来合成cDNA。在合成第一链和第二链后,加入attB1衔接子进行连接,并用柱色谱对cDNA按照大小进行分级。将来自级分的DNA浓缩,重组进pDONRTM222中,并转化进大肠杆菌ElectroMAXTM DH10BTM T1噬菌体抗性细胞(Invitrogen Corporation)中。将该Euglena anabaena文库命名为eug1c。
将cDNA文库eug1c铺在LB+卡那霉素平板(约100,000个菌落)上,刮下菌落,使用QIAprepSpin Miniprep Kit(Qiagen Inc.,Valencia,CA)按照制造商提供的规程来分离DNA。这样,获得来自eug1c的质粒DNA子文库。
实施例2
从Euglena anabaena UTEX 373分离全长的Δ9延伸酶
本实施例描述了鉴定编码来自Euglena anabaena UTEX 373的Δ9延伸酶的cDNA(SEQ ID NO:1和2)。这一工作包括产生源自小眼虫Δ9延伸酶(EgD9e;SEQ ID NO:3)的探针以及让该探针与cDNA文库eug1c杂交以鉴定来自Euglena anabaena UTEX 373的Δ9延伸酶同源物。
小眼虫Δ9延伸酶(EgD9e)
将来自裸藻属cDNA文库(eeg1c)的克隆(称为eeg1c.pk001.n5f,含有小眼虫Δ9延伸酶(EgD9e;SEQ ID NO:3;其在美国申请11/601,563中有描述))用作模板,使用寡核苷酸引物oEugEL1-1(SEQ ID NO:5)和oEugEL1-2(SEQ ID NO:6),用VentRDNA聚合酶(目录号M0254S,New England Biolabs Inc.,Beverly,MA)按照制造商的规程扩增EgD9e。使用Zero BluntPCR克隆试剂盒(Invitrogen Corporation),按照制造商的规程将所得DNA片段克隆进pCR-Blunt克隆载体中,以产生pKR906(SEQ ID NO:15)。
菌落转移
将Euglena anabaena cDNA文库eug1c的大约17,000个克隆铺在三个大的正方形(24cm×24cm)Petri平板(Corning,Corning,NY)上,每个平板装有LB+50μg/mL卡那霉素琼脂培养基。使细胞在37℃下生长过夜,然后使平板冷却至室温。
将Biodyne B 0.45μm膜(目录号60207,Pall Corporation,Pensacola,FL)修剪成大约22cm×22cm,并将该膜小心地铺放在琼脂上面以避免气泡。在室温下孵育2分钟后,将膜标记取向,用镊子将膜提起并将菌落面朝上放在用0.5M氢氧化钠和1.5M氯化钠浸湿的滤纸上。变性4分钟后,通过将膜置于用0.5M Tris-HCL(pH7.5)和1.5M氯化钠浸湿的滤纸上4分钟来中和氢氧化钠。重复该步骤,将膜在2XSSC缓冲液(20XSSC是3M的氯化钠、0.3M的柠檬酸钠;pH 7.0)中简单冲洗并在滤纸上风干。
杂交
将膜在200mL杂交溶液中于65℃下预杂交2小时。杂交溶液含有6X SSPE(20X SSPE是3M的氯化钠、0.2M的磷酸钠、20mM的EDTA;pH 7.4)、5X Denhardt试剂(100X Denhardt试剂是2%(w/v)Ficoll、2%(w/v)聚乙烯吡咯烷酮、2%(w/v)乙酰化的牛血清白蛋白)、0.5%十二烷基硫酸钠(SDS)、100μg/mL已剪切的鲑精DNA和5%硫酸葡聚糖。
用来自pKR906(SEQ ID NO:15)的经琼脂糖凝胶纯化过的NcoI/NotIDNA片段(其含有小眼虫Δ9延伸酶基因)来制备DNA探针,使用RadPrime DNA标记系统(Catalog No.18428-011,Invitrogen,Carlsbad,CA)按照制造商的说明书用P32 dCTP标记该DNA片段。使用NICK柱(目录号17-0855-02,Amersham Biosciences,Piscataway,NJ),按照制造商的说明书分离未整合的P32dCTP。将探针在100℃下变性5分钟,置于冰上3分钟,并将其一半加入到杂交溶液中。
将膜在65℃下与探针轻微摇动地杂交过夜,然后在次日用含0.5%SDS的2XSSC洗涤两次(每次5分钟),并用含0.1%SDS的0.2XSSC洗涤两次(每次15分钟)。洗涤后,将hyperfilm(目录号RPN30K,Amersham Biosciences,Piscataway,NJ)在-80℃下暴露于该膜过夜。
根据将平板与暴露的hyperfilm对齐,用巴斯德吸管的钝头将阳性菌落挑选至1mL水中并进行涡旋。制备数份稀释液,并将其铺在装有LB培养基和50μg/mL卡那霉素的小圆形培养皿(82mm)上以在单个平板上获得约100个分离得很好的菌落。如上所述进行转移,不同的是使用NytranN膜圆片(membrane circles)(目录号10416116,Schleicher&Schuell,Keene,NH)并且用剩余的经放射标记过的探针在100mL杂交溶液中杂交。以这种方式,确认了阳性克隆。
使用载体引发的M13F通用引物(SEQ ID NO:7)、M13rev-28引物(SEQ ID NO:8)和聚腺苷酸尾引发的WobbleT寡核苷酸,用ABIBigDye version 3Prism测序试剂盒对384-孔平板中的DNA插入物进行末端测序。对于测序反应,使用100-200ng模板和6.4pmol引物,重复以下反应条件25次:96℃10秒,50℃5秒,60℃4分钟。在基于乙醇的纯化后,将循环测序反应的产物在Perkin-Elmer ABI 3700自动测序仪上分离并检测。WobbleT引物是21mer聚(T)A、聚(T)C和聚(T)G的克分子数相等的混合物,用于对cDNA克隆的3′末端进行测序。
使用SequencherTM(版本4.2,Gene Codes Corporation,Ann Arbor,MI)对序列进行比对和比较,这样,基于插入序列可以将克隆归类为两种不同组中的一种(称为EaD9Elo1和EaD9Elo2)。选择含有每一类序列的cDNA的代表性克隆用于进一步的研究,每种代表性质粒(即pLF121-1和pLF121-2)的序列分别在SEQ ID NO:9和SEQ ID NO:10中示出。用一串NNNN表示的序列表示未进行测序的聚腺苷酸尾区域。EaD9Elo1和EaD9Elo2的编码序列分别在SEQ ID NO:11和SEQ ID NO:12中示出。EaD9Elo1和EaD9Elo2的相应氨基酸序列分别在SEQ ID NO:13和SEQ ID NO:14中示出。
实施例3
Euglena anabaena UTEX 373的Δ9延伸酶序列(EaD9Elo1和
EaD9Elo2)的一级序列分析和与其他公开的Δ9延伸酶序列的比较
使用Clustal V方法(Higgins,D.G.和Sharp,P.M.,Comput.Appl.Biosci.,5:151-153(1989);Higgins等人,Comput.Appl.Biosci.,8:189-191(1992)),用LASERGENE生物信息学计数软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM v6.1程序比较EaD9Elo1(SEQ ID NO:13)和EaD9Elo2(SEQ ID NO:14)的氨基酸序列,该程序采用用于成对比对的默认参数(KTUPLE=1,缺口罚分=3,窗口=5,DIAGONALS SAVED=5,缺口长度罚分=10)。
与EaD9Elo1(SEQ ID NO:13)相比较,EaD9Elo2(SEQ ID NO:14)具有1个氨基酸置换(即,基于EaD9Elo1的编号,254位的R被置换成Q)。EaD9Elo1(SEQ ID NO:11)和EaD9Elo2(SEQ ID NO:12)的核苷酸序列在全长774bp的长度范围内有6个碱基对不同。
通过BLASTP(基本的局部比对搜索工具(Basic Local AlignmentSearch Tool);Altschul等人,J.Mol.Biol.,215:403-410(1993))搜索与BLAST“nr”数据库(包括所有非冗余GenBank CDS翻译物、来源于3-维结构Brookhaven Protein Data Bank的序列、SWISS-PROT蛋白质序列数据库的最新的主要公开版本、EMBL和DDBJ数据库)中所包含的序列的相似性(采用默认参数并关闭过滤器)来评估EaD9Elo1(SEQ IDNO:13)和EaD9Elo2(SEQ ID NO:14)的氨基酸序列。为方便起见,由BLAST所计算的、观察到cDNA序列与所搜索数据库中包含的序列仅偶然匹配的P-值(概率)在本文中报导为“pLog”值,该值代表了所报导的P-值的负对数。因此,pLog值越大,cDNA序列和BLAST的“命中序列”代表同源蛋白的可能性就越大。
当与“nr”数据库进行比较时,相对于绿光等鞭金藻长链多不饱和脂肪酸延伸酶(IgD9e;SEQ ID NO:16)(NCBI编号(NCBI Accession No.)AAL37626(GI 17226123),基因座AAL37626,CDS AF390174;Qi等人,FEBS Lett.,510:159-165(2002)),这两种序列均产生了38.70的pLog值(P值为2e-39)。BLAST打分和概率表明,本核酸片段编码整个EuglenaanabaenaΔ9脂肪酸延伸酶。
使用BlastP、Clustal V和Jotun Hein序列比较方法,将EaD9Elo1(SEQ ID NO:13)和EaD9Elo2(SEQ ID NO:14)的氨基酸序列与IgD9e(SEQ ID NO:16)和小眼虫Δ9延伸酶氨基酸序列(EgD9e;SEQID NO:4;PCT公开WO 2007/061845)进行比较。用每种方法确定的与IgD9e和EgD9e的百分比同一性分别在表4和表5中示出。
序列百分比同一性计算是通过BlastP和Clustal V方法来完成的,如上所述。用Jotun Hein方法(Hein,J.J.,Meth.Enz.,183:626-645(1990))进行的序列百分比同一性计算是用LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM v6.1程序来完成的,该程序采用用于成对比对的默认参数(KTUPLE=2)。
表4
EaD9Elo1(SEQ ID NO:13)和
Ead9elo2(SEQ ID NO:14)与IgD9e(SEQ ID NO:16)的序列比较
去饱和酶 | 通过BLASTP确定的与IgD9e的同一性百分比(%) | 通过Jotun Hein方法确定的与IgD9e的同一性百分比(%) | 通过Clustal V方法确定的与IgD9e的同一性百分比(%) |
EaD9Elo1 | 37% | 40.4% | 32.9% |
EaD9Elo2 | 37% | 41.2% | 32.9% |
表5
EaD9Elo1(SEQ ID NO:13)和
EaD9Elo2(SEQ ID NO:14)与EgD9e(SEQ ID NO:4)的序列比较
去饱和酶 | 通过BLASTP确定的与EgD9e的同一性百分比(%) | 通过Jotun Hein方法确定的与EgD9e的同一性百分比(%) | 通过Clustal V方法确定的与EgD9e的同一性百分比(%) |
EaD9Elo | 77% | 77.2% | 77.1% |
EaD9Elo2 | 77% | 77.2% | 77.1% |
实施例4
解脂耶氏酵母中Euglena anabaena UTEX 373Δ9延伸酶的功能分析
本实施例描述了EaD9Elo1(SEQ ID NO:13)和EaD9Elo2(SEQ IDNO:14)在解脂耶氏酵母中的功能分析。该工作包括如下步骤:(1)构建Gateway-相容的耶氏酵母表达载体pY159;(2)将EaD9Elo1和EaD9Elo2转入pY159中以产生pY173和pY174;以及(3)比较含pY173和pY174的转化生物内的脂质概况。
构建Gateway
-相容的耶氏酵母表达载体pY159
质粒pY5-30(其以前在美国专利7,259,255中有描述)是既可在大肠杆菌中复制又可在解脂耶氏酵母中复制的穿梭质粒。质粒pY5-30包含如下组分:耶氏酵母自主复制序列(ARS18);ColE1质粒的复制起点;用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR);用于在耶氏酵母中选择的耶氏酵母LEU2基因;以及TEF::GUS::XPR嵌合基因。质粒pDMW263(SEQ ID NO:17)由pY5-30产生,这通过使用本领域技术人员所熟知的技术将TEF启动子替换为解脂耶氏酵母FBAINm启动子(美国专利7,202,356)而实现。简而言之,该启动子指经修饰的启动子,其位于由fba1基因编码的果糖二磷酸醛缩酶(E.C.4.1.2.13)的‘ATG’翻译起始密码子前面的5’上游非翻译区,并且该启动子加上具有内含子的5’编码区部分是表达所必需的,其中FBAINm在ATG翻译起始密码子和FBAIN启动子的内含子之间具有52bp的缺失(从而只包含N端的22个氨基酸),并且在内含子后面具有新的翻译共有基序。表6汇总了pDMW263(SEQ ID NO:17)的组分。
表6
质粒pDMW263(SEQ ID NO:17)的组分
SEQ ID NO:17内的RE位点和核苷酸 | 片段和嵌合基因组分的描述 |
4992-4296 | ARS18序列(基因库编号A17608) |
SalI/SacII(8505-2014) | FBAINm::GUS::XPR,包含:·FBAINm:解脂耶氏酵母FBAINm启动子(美国专利7,202,356);·GUS:编码β-葡糖苷酸酶的大肠杆菌基因(Jefferson,R.A.Nature,14:342:837-838(1989));·XPR:耶氏酵母Xpr基因(基因库编号M17741)的约100bp的3’区 |
6303-8505 | 耶氏酵母Leu2基因(基因库编号AF260230) |
将来自pDMW263(SEQ ID NO:17)的NcoI/SalI DNA片段(其含有解脂耶氏酵母FBAINm启动子)克隆进pDMW237(SEQ ID NO:18)的NcoI/SalI DNA片段中以产生pY115(SEQ ID NO:19;图3A),该pDMW237此前在PCT公开WO 2006/012325中有描述(因此将该专利的内容以引用的方式并入),含有来源于绿光等鞭金藻的经密码子最优化以便在解脂耶氏酵母中表达的合成的Δ9延伸酶基因(IgD9eS)。在图3A中,经修饰的FBAINm启动子标记为FBA1+内含子,而该启动子在图3B、3C和3D中标记为YAR FBA1PRO+内含子。
使用寡核苷酸引物oYFBA1(SEQ ID NO:20)和oYFBA1-6(SEQ IDNO:21),采用PCR从质粒pY115(SEQ ID NO:19)扩增FBAINm启动子。引物oYFBA1(SEQ ID NO:20)被设计成在启动子的5’端引入BglII位点,而引物oYFBA1-6(SEQ ID NO:21)被设计成在启动子的3’端引入NotI位点,同时移除NcoI位点,并因而移除了ATG起始密码子。将所得PCR片段用BglII和NotI消化,并克隆进pY115的BglII/NotI片段(其含有载体骨架)中以形成pY158(SEQ ID NO:22)。
将质粒pY158(SEQ ID NO:22)用NotI消化,并补足所产生的DNA末端。在补足而形成平端后,将该DNA片段用牛小肠碱性磷酸酶处理并用琼脂糖凝胶电泳分离。从琼脂糖凝胶中切下6992bp的含有解脂耶氏酵母FBAINm启动子的片段并用QIAquickGel Extraction试剂盒(Qiagen Inc,Valencia,CA)按照制造商的规程进行纯化。使用GatewayVector Conversion System(目录号11823-029,Invitrogen Corporation),按照制造商的规程将纯化过的6992bp片段与rfA盒连接,以形成解脂耶氏酵母Gateway目的载体(destination vector)pY159(SEQ ID NO:23;图3B)。
构建耶氏酵母表达载体pY173和pY174
使用GatewayLR ClonaseTMII酶混合物(目录号11791-020,InvitrogenCorporation),按照制造商的规程将来自pLF121-1(SEQ ID NO:9;实施例2)和pLF121-2(SEQ ID NO:10;实施例2)的cDNA插入物转进pY159(SEQ ID NO:23)中,以分别形成pY173(SEQ ID NO:24;图3C)和pY174(SEQ ID NO:25;图3D)。
EaD9Elo1和EaD9Elo2在解脂耶氏酵母菌株Y2224中的功能分析以如下方式分离菌株Y2224:将来自YPD琼脂平板(1%酵母提取物、2%细菌用蛋白胨、2%葡萄糖、2%琼脂)的解脂耶氏酵母ATCC#20362细胞划线接种至含250mg/L 5-FOA(Zymo Research)的MM平板(尿嘧啶和尿苷各75mg/L,6.7g/L具有硫酸铵且无氨基酸的YNB,以及20g/L葡萄糖)上。将平板在28℃下孵育并将四个得到的菌落分别贴在含有200mg/mL 5-FOA的MM平板上和无尿嘧啶和尿苷的MM平板上以确定尿嘧啶Ura3营养缺陷型。
如在“一般方法”中所述,将菌株Y2224用pY173(SEQ ID NO:24;图3C)和pY174(SEQ ID NO:25;图3D)转化。
使含有pY173和pY174的解脂耶氏酵母转化株的单菌落在不含尿嘧啶的3mL极限培养基中于30℃生长16h,之后,将细胞以250rpm离心以形成沉淀。将细胞用水洗涤一次,通过离心沉淀并风干。在50℃下用500μL 1%的甲醇钠对该沉淀进行酯交换反应(Roughan,G.和Nishida,I.,Arch.Biochem.Biophys.,276(1):38-46(1990))30分钟,之后加入500μL 1M的氯化钠和100μL庚烷。在彻底混合并离心后,通过GC来分析脂肪酸甲酯(FAME)。使用配有Omegawax 320熔融石英毛细柱的Hewlett-Packard 6890气相色谱(目录号24152,Supelco Inc.)对FAME(从己烷层取5μL注射上样)进行分离和定量。用程序控制烘箱温度在220℃保持2.6分钟,以20℃/分钟升温至240℃,然后另外保持2.4分钟。载气通过Whatman氢发生器供应。将保留时间与那些市售的甲酯标准样品(Nu-Chek Prep,Inc)的保留时间进行比较。
表达pY173和pY174的解脂耶氏酵母的脂肪酸概况在表7中示出。脂肪酸确定为16:0、16:1、18:0、18:1(油酸)、LA、20:0、20:1(11)、EDA、22:0、24:0和24:1。通过如下方式计算Δ9延长百分比(Δ9%Elong):将EDA的重量百分比除以EDA和LA的总重量百分比再乘以100以表示为百分比形式。Ave表示平均值。
表7
表达pY173(EaD9Elo1)和pY174(EaD9Elo2)的解脂耶氏酵母的脂肪
酸组分(重量%)
实施例5
用于解脂耶氏酵母的经密码子最优化的Δ9延伸酶基因(EaD9ES)的
合成
以与PCT公开WO 2004/101753和美国专利7,125,672中所描述的类似方式,将Euglena anabaena的Δ9延伸酶基因(EaD9Elo1)的密码子使用最优化以便在解脂耶氏酵母中表达。具体地讲,基于EaD9Elo1(SEQID NO:11)的编码序列,根据耶氏酵母密码子使用模式(PCT公开WO 2004/101753)、‘ATG’翻译起始密码子周围的共有序列以及RNA稳定性的一般规则(Guhaniyogi,G.和J.Brewer,Gene,265(1-2):11-23(2001)),设计经密码子最优化的Δ9延伸酶基因(称为“EaD9ES”,SEQ ID NO:26)。除了修饰翻译起始位点之外,还对774bp编码区中的106bp进行了修饰(13.7%)并最优化了98个密码子(38.0%)。野生型基因(即EaD9Elo1)和合成基因(即EaD9ES)的GC含量(52.1%)几乎相同。分别将NcoI位点和NotI位点整合到EaD9ES(SEQ ID NO:26)的翻译起始密码子的周围和终止密码子之后。图4A和4B示出了EaD9Elo1(SEQ ID NO:11)和EaD9ES(SEQ ID NO:26)的核苷酸序列的比较。由经密码子最优化的基因编码的蛋白质序列(即SEQ ID NO:27)与野生型蛋白质序列(即SEQ ID NO:13)相同。设计的EaD9ES基因由GenScript Corporation(Piscataway,NJ)合成并将其克隆到pUC57(基因库编号Y14837)中,以产生pEaD9ES(SEQ ID NO:28;图5A)。
实施例6
包含经密码子最优化以在解脂耶氏酵母中表达的合成的Δ9延伸酶
基因(来源于Euglena anabaena)(EaD9ES)的解脂耶氏酵母表达载体
pZUFmEaD9ES的构建和功能分析
本实施例描述了包含FBAINm::EaD9ES::Pex20嵌合基因的解脂耶氏酵母载体pZUFmEaD9ES的功能性表达,其中EaD9ES是来源于Euglena anabaena的经密码子最优化以便在耶氏酵母属中表达的合成的Δ9延伸酶。质粒pZUFmEaD9ES(图5B)含有如下组分:
表8
质粒pZUFmEaD9ES(SEQ ID NO:29)的组分
SEQ ID NO:29内的RE位点和核苷酸 | 片段和嵌合基因组分的描述 |
Swa I/BsiW I(6067-318) | FBAINm::EaD9ES::Pex20,包含·FBAINm:解脂耶氏酵母FBAIN启动子(美国专利7,202,356)·EaD9ES:来源于Euglena anabaena的经密码子最优化的Δ9延伸酶(SEQ ID NO:26)·Pex20:耶氏酵母Pex20基因(基因库编号AF054613)的Pex20终止子序列 |
1354-474 | ColE1质粒复制起点 |
2284-1424 | 用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR) |
3183-4487 | 耶氏酵母自主复制序列(ARS18;基因库编号A17608) |
6031-4530 | 耶氏酵母Ura 3基因(基因库编号AJ306421) |
包含pZUFmEaD9ES的解脂耶氏酵母转化株的功能分析
如“一般方法”中所述,将质粒pZUFmEaD9ES转化进菌株Y2224(由野生型耶氏酵母菌株ATCC#20362的Ura3基因自发突变而产生的FOA抗性突变体)中。在MM平板上选择转化株。在30℃下培育2天后,挑取转化株并将其再次划线至新鲜的MM平板上。生长之后,将这些菌株单个地接种在30℃下的3mL液体MM中,以250rpm/min摇动2天。离心收集细胞,提取脂质,通过酯交换反应来制备脂肪酸甲酯,并随后用Hewlett-Packard 6890GC进行分析。
GC分析显示,在所有5个转化株中产生了占总脂质约2.2%的C20:2(EDA)和15.3%的C18:2(LA),其中测得这5个菌株中C18:2转化成C20:2的转化效率为约13%。因此,该实验数据表明,经密码子最优化以便在解脂耶氏酵母中表达的合成的Euglena anabaenaΔ9延伸酶(即EaD9ES,在SEQ ID NO:26和27中示出)有效地将LA延长成了EDA。
序列表
<110>E.I.duPont de Nemours and Company,Inc.
<120>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途
<130>CL3923
<150>US 60/911,925
<151>2007-04-16
<160>29
<170>PatentIn版本3.4
<210>1
<211>1129
<212>DNA
<213>Euglenaanabaena
<400>1
tttttttcgg tctaaaatgg aagcagccaa agaattggtt tccatcgtcc aagaggagct 60
ccccaaggtg gactatgccc agctttggca ggatgccagc agctgtgagg tcctttacct 120
ctcggtggca ttcgtggcga tcaagttcat gctgcgccca ctggacctga agcgccaggc 180
caccttgaag aagctgttca cagcatacaa cttcctcatg tcgatctatt cctttggctc 240
cttcctggcc atggcctatg ccctatcagt aactggcatc ctctccggcg actgtgagac 300
ggcgttcaac aacgatgtgt tcaggatcac aactcagctg ttctacctca gcaagttcgt 360
agagtacatc gactccttct accttcccct tatggacaag ccactgtcgt tccttcagtt 420
cttccatcat ttgggggccc ccattgacat gtggctattc tacaaatacc gcaacgaagg 480
agtctggatc tttgtcctgt tgaatgggtt cattcactgg atcatgtacg gttactattg 540
gacgcggctc atcaagctga acttccccat gcccaagaac ctgatcacct ccatgcagat 600
catccagttc aatgtcgggt tctacatcgt ctggaagtac cgcaatgtgc catgctaccg 660
ccaggatggg atgcgcatgt ttgcctggat cttcaactac tggtatgtcg ggacggtctt 720
gctgctgttc ctcaactttt acgtgcagac gtacatccgg aagccgagga agaaccgagg 780
gaagaaggag taggccacat ggcgcctgcg ctggaggaaa cggtacgctc ggatggtgca 840
ctgcacttgc actccgccgt ttctagcctc ccctcgctct aaccactgcg gcatgcctgc 900
ttgaggcgtg acgttgcctc gtatgataca gtttacaccc ttcccacagc ccacggagct 960
ggtgactgtt tccagcgtct gcagatcatt gatctggtgc aatgtgcaca gaccaagccc 1020
ctctaacgtc ttgcggtgta ccgctcgaca ctcactgcaa gagacagatg gctgagcatg 1080
ttatagcccc ttacattcta cccttcgtcc caacctgacc gtcacattc 1129
<210>2
<211>1145
<212>DNA
<213>Euglena anabaena
<400>2
attttttttc ggtctaaaat ggaagcagcc aaagaattgg tttccatcgt ccaagaggag 60
ctccccaagg tggactatgc ccagctttgg caggacgcca gcagctgtga ggtcctttac 120
ctctcggtgg cattcgtggc gatcaagttc atgctgcgcc cactggacct gaagcgccag 180
gccaccttga agaagctgtt cacagcatac aacttcctca tgtcgatcta ttcctttggc 240
tccttcctgg ccatggccta tgccctatca gtaactggca tcctctccgg cgactgtgag 300
acagcgttca acaacgatgt gttcaggatc acaactcagc tgttctacct cagcaagttc 360
gtagagtaca tcgactcctt ctaccttccc cttatggaca agccactgtc gttccttcag 420
ttcttccatc atttgggggc tcccattgac atgtggctat tctacaaata ccgcaacgaa 480
ggagtctgga tctttgtcct gttgaatggg ttcattcact ggatcatgta cggttactac 540
tggacgcggc tcatcaagct gaacttcccc atgcccaaga acctgatcac ctccatgcag 600
atcatccagt tcaatgtcgg gttctacatc gtctggaagt accgcaatgt gccatgctac 660
cgccaggatg ggatgcgcat gtttgcctgg atcttcaact actggtacgt cgggacggtc 720
ttgctgctgt tcctcaactt ttacgtgcag acgtacatcc ggaagccgag gaagaaccaa 780
gggaagaagg agtaggccac atggcgcctg cgctggagga aacggtacgc tcggatggtg 840
cactgcactt gcactccgcc gcttctagcc tcccctcgct ctaacctctg cgacatgcct 900
gcttgaggcg tgacgttgcc tcgtgcgata cagtttacac ccttcccatg gcccacggag 960
caggtgactg tctccagcgt ctgcaattct gatcattggt ctggtgcaat gtgcgcagac 1020
caagcccctc taacgtcttg cggtgtaccg ctcgacactc actgcacgag acagatggct 1080
gagcatgtta tagcccctga cattctaccc ttcgtcctta cctgaccgtc acattcatgc 1140
ttacc 1145
<210>3
<211>774
<212>DNA
<213>小眼虫
<220>
<221>CDS
<222>(1)..(774)
<223>Δ9延伸酶
<300>
<302>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途
<310>WO 2007/061742
<311>2006-11-16
<312>2007-05-31
<313>(1)..(774)
<300>
<302>Δ9延伸酶及其在制备多不饱和脂肪酸中的用途
<310>US 2007-0117190-A1
<311>2006-1116
<312>2007-05-24
<313>(1)..(774)
<400>3
atg gag gtg gtg aat gaa ata gtc tca att ggg cag gaa gtt tta ccc 48
Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro
1 5 10 15
aaa gtt gat tat gcc caa ctc tgg agt gat gcc agt cac tgt gag gtg 96
Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val
20 25 30
ctt tac ttg tcc atc gca ttt gtc atc ttg aag ttc act ctt ggc ccc 144
Leu Tyr Leu Ser Ile Ala Phe Va1 Ile Leu Lys Phe Thr Leu Gly Pro
35 40 45
ctt ggt cca aaa ggt cag tct cgt atg aag ttt gtt ttc acc aat tac 192
Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr
50 55 60
aac ctt ctc atg tcc att tat tcg ttg gga tca ttc ctc tca atg gca 240
Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala
65 70 75 80
tat gcc atg tac acc atc ggt gtt atg tct gac aac tgc gag aag gct 288
Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala
85 90 95
ttt gac aac aac gtc ttc agg atc acc acg cag ttg ttc tat ttg agc 336
Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
100 105 110
aag ttc ctg gag tat att gac tcc ttc tat ttg cca ctg atg ggc aag 384
Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys
115 120 125
cct ctg acc tgg ttg caa ttc ttc cat cat ttg ggg gca ccg atg gat 432
Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp
130 135 140
atg tgg ctg ttc tat aat tac cga aat gaa gct gtt tgg att ttt gtg 480
Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val
145 150 155 160
ctg ttg aat ggt ttc atc cac tgg atc atg tac ggt tat tat tgg acc 528
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
165 170 175
aga ttg atc aag ctg aag ttc ccc atg cca aaa tcc ctg att aca tca 576
Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser
180 185 190
atg cag atc att caa ttc aat gtt ggt ttc tac att gtc tgg aag tac 624
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
195 200 205
agg aac att ccc tgt tat cgc caa gat ggg atg agg atg ttt ggc tgg 672
Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp
210 215 220
ttc ttc aat tac ttt tat gtt ggc aca gtc ttg tgt ttg ttc ttg aat 720
Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn
225 230 235 240
ttc tat gtg caa acg tat atc gtc agg aag cac aag gga gcc aaa aag 768
Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys
245 250 255
att cag 774
Ile Gln
<210>4
<211>258
<212>PRT
<213>小眼虫
<400>4
Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro
1 5 10 15
Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val
20 25 30
Leu Tyr Leu Ser Ile Ala Phe Val Ile Leu Lys Phe Thr Leu Gly Pro
35 40 45
Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr
50 55 60
Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala
65 70 75 80
Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala
85 90 95
Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
100 105 110
Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys
115 120 125
Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp
130 135 140
Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val
145 150 155 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
165 170 175
Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser
180 185 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
195 200 205
Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp
210 215 220
Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn
225 230 235 240
Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys
245 250 255
Ile Gln
<210>5
<211>30
<212>DNA
<213>人工序列
<220>
<223>有义寡核苷酸oEugEL1-1
<400>5
agcggccgca ccatggaggt ggtgaatgaa 30
<210>6
<211>30
<212>DNA
<213>人工序列
<220>
<223>有义寡核苷酸oEugEL1-2
<400>6
tgcggccgct cactgaatct ttttggctcc 30
<210>7
<211>18
<212>DNA
<213>人工序列
<220>
<223>M13F通用引物
<400>7
tgtaaaacga cggccagt 18
<210>8
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物M1328Rev
<400>8
gtaatacgac tcactatagg gc 22
<210>9
<211>3668
<212>DNA
<213>人工序列
<220>
<223>质粒pLF121-1
<220>
<221>misc_feature
<222>(3616)..(3655)
<223>n为a,c,g,或t
<400>9
gtacaaagtt ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac 60
tatcagtcaa aataaaatca ttatttgcca tccagctgat atcccctata gtgagtcgta 120
ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc tctgatgtta 180
cattgcacaa gataaaaata tatcatcatg ttagaaaaac tcatcgagca tcaaatgaaa 240
ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa 300
tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc 360
gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt 420
atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagcttatg 480
catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc 540
atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct 600
gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc 660
atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc 720
ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt 780
cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt 840
ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa 900
tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa 960
atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc gttgaatatg 1020
gctcatagat cttttctcca tcactgatag ggagtggtaa aataactcca tcaatgatag 1080
agtgtcaaca acatgaccaa aatcccttaa cgtgagttac gcgtattaat tgcgttgcgc 1140
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 1200
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 1260
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 1320
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 1380
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 1440
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 1500
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 1560
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 1620
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 1680
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 1740
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 1800
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggttacac tagaagaaca 1860
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 1920
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 1980
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 2040
cagggaacga cgcgtaccgc tagccaggaa gagtttgtag aaacgcaaaa aggccatccg 2100
tcaggatggc cttctgctta gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc 2160
accctccggg ccgttgcttc acaacgttca aatccgctcc cggcggattt gtcctactca 2220
ggagagcgtt caccgacaaa caacagataa aacgaaaggc ccagtcttcc gactgagcct 2280
ttcgttttat ttgatgcctg gcagttccct actctcgcgt taacgctagc atggatgttt 2340
tcccagtcac gacgttgtaa aacgacggcc agtcttaagc tcgggcccca aataatgatt 2400
ttattttgac tgatagtgac ctgttcgttg caacaaattg atgagcaatg cttttttata 2460
atgccaactt tgtacaaaaa agttggtttt tttcggtcta aaatggaagc agccaaagaa 2520
ttggtttcca tcgtccaaga ggagctcccc aaggtggact atgcccagct ttggcaggat 2580
gccagcagct gtgaggtcct ttacctctcg gtggcattcg tggcgatcaa gttcatgctg 2640
cgcccactgg acctgaagcg ccaggccacc ttgaagaagc tgttcacagc atacaacttc 2700
ctcatgtcga tctattcctt tggctccttc ctggccatgg cctatgccct atcagtaact 2760
ggcatcctct ccggcgactg tgagacggcg ttcaacaacg atgtgttcag gatcacaact 2820
cagctgttct acctcagcaa gttcgtagag tacatcgact ccttctacct tccccttatg 2880
gacaagccac tgtcgttcct tcagttcttc catcatttgg gggcccccat tgacatgtgg 2940
ctattctaca aataccgcaa cgaaggagtc tggatctttg tcctgttgaa tgggttcatt 3000
cactggatca tgtacggtta ctattggacg cggctcatca agctgaactt ccccatgccc 3060
aagaacctga tcacctccat gcagatcatc cagttcaatg tcgggttcta catcgtctgg 3120
aagtaccgca atgtgccatg ctaccgccag gatgggatgc gcatgtttgc ctggatcttc 3180
aactactggt atgtcgggac ggtcttgctg ctgttcctca acttttacgt gcagacgtac 3240
atccggaagc cgaggaagaa ccgagggaag aaggagtagg ccacatggcg cctgcgctgg 3300
aggaaacggt acgctcggat ggtgcactgc acttgcactc cgccgtttct agcctcccct 3360
cgctctaacc actgcggcat gcctgcttga ggcgtgacgt tgcctcgtat gatacagttt 3420
acacccttcc cacagcccac ggagctggtg actgtttcca gcgtctgcag atcattgatc 3480
tggtgcaatg tgcacagacc aagcccctct aacgtcttgc ggtgtaccgc tcgacactca 3540
ctgcaagaga cagatggctg agcatgttat agccccttac attctaccct tcgtcccaac 3600
ctgaccgtca cattcnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnaccca 3660
actttctt 3668
<210>10
<211>3684
<212>DNA
<213>人工序列
<220>
<223>质粒pLF121-2
<220>
<221>misc_feature
<222>(3632)..(3671)
<223>n为a,c,g,或t
<400>10
gtacaaagtt ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac 60
tatcagtcaa aataaaatca ttatttgcca tccagctgat atcccctata gtgagtcgta 120
ttacatggtc atagctgttt cctggcagct ctggcccgtg tctcaaaatc tctgatgtta 180
cattgcacaa gataaaaata tatcatcatg ttagaaaaac tcatcgagca tcaaatgaaa 240
ctgcaattta ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa 300
tgaaggagaa aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc 360
gattccgact cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt 420
atcaagtgag aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagattatg 480
catttctttc cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc 540
atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct 600
gttaaaagga caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc 660
atcaacaata ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc 720
ggggatcgca gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt 780
cggaagaggc ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt 840
ggcaacgcta cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa 900
tcgatagatt gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa 960
atcagcatcc atgttggaat ttaatcgcgg cctcgagcaa gacgtttccc gttgaatatg 1020
gctcatagat cttttctcca tcactgatag ggagtggtaa aataactcca tcaatgatag 1080
agtgtcaaca acatgaccaa aatcccttaa cgtgagttac gcgtattaat tgcgttgcgc 1140
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 1200
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 1260
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 1320
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 1380
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 1440
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 1500
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 1560
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 1620
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 1680
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 1740
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 1800
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggttacac tagaagaaca 1860
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 1920
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 1980
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 2040
cagggaacga cgcgtaccgc tagccaggaa gagtttgtag aaacgcaaaa aggccatccg 2100
tcaggatggc cttctgctta gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc 2160
accctccggg ccgttgcttc acaacgttca aatccgctcc cggcggattt gtcctactca 2220
ggagagcgtt caccgacaaa caacagataa aacgaaaggc ccagtcttcc gactgagcct 2280
ttcgttttat ttgatgcctg gcagttccct actctcgcgt taacgctagc atggatgttt 2340
tcccagtcac gacgttgtaa aacgacggcc agtcttaagc tcgggcccca aataatgatt 2400
ttattttgac tgatagtgac ctgttcgttg caacaaattg atgagcaatg cttttttata 2460
atgccaactt tgtacaaaaa agttggattt tttttcggtc taaaatggaa gcagccaaag 2520
aattggtttc catcgtccaa gaggagctcc ccaaggtgga ctatgcccag ctttggcagg 2580
acgccagcag ctgtgaggtc ctttacctct cggtggcatt cgtggcgatc aagttcatgc 2640
tgcgcccact ggacctgaag cgccaggcca ccttgaagaa gctgttcaca gcatacaact 2700
tcctcatgtc gatctattcc tttggctcct tcctggccat ggcctatgcc ctatcagtaa 2760
ctggcatcct ctccggcgac tgtgagacag cgttcaacaa cgatgtgttc aggatcacaa 2820
ctcagctgtt ctacctcagc aagttcgtag agtacatcga ctccttctac cttcccctta 2880
tggacaagcc actgtcgttc cttcagttct tccatcattt gggggctccc attgacatgt 2940
ggctattcta caaataccgc aacgaaggag tctggatctt tgtcctgttg aatgggttca 3000
ttcactggat catgtacggt tactactgga cgcggctcat caagctgaac ttccccatgc 3060
ccaagaacct gatcacctcc atgcagatca tccagttcaa tgtcgggttc tacatcgtct 3120
ggaagtaccg caatgtgcca tgctaccgcc aggatgggat gcgcatgttt gcctggatct 3180
tcaactactg gtacgtcggg acggtcttgc tgctgttcct caacttttac gtgcagacgt 3240
acatccggaa gccgaggaag aaccaaggga agaaggagta ggccacatgg cgcctgcgct 3300
ggaggaaacg gtacgctcgg atggtgcact gcacttgcac tccgccgctt ctagcctccc 3360
ctcgctctaa cctctgcgac atgcctgctt gaggcgtgac gttgcctcgt gcgatacagt 3420
ttacaccctt cccatggccc acggagcagg tgactgtctc cagcgtctgc aattctgatc 3480
attggtctgg tgcaatgtgc gcagaccaag cccctctaac gtcttgcggt gtaccgctcg 3540
acactcactg cacgagacag atggctgagc atgttatagc ccctgacatt ctacccttcg 3600
tccttacctg accgtcacat tcatgcttac cnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660
nnnnnnnnnn nacccaactt tctt 3684
<210>11
<211>774
<212>DNA
<213>Euglena anabaena
<400>11
atggaagcag ccaaagaatt ggtttccatc gtccaagagg agctccccaa ggtggactat 60
gcccagcttt ggcaggatgc cagcagctgt gaggtccttt acctctcggt ggcattcgtg 120
gcgatcaagt tcatgctgcg cccactggac ctgaagcgcc aggccacctt gaagaagctg 180
ttcacagcat acaacttcct catgtcgatc tattcctttg gctccttcct ggccatggcc 240
tatgccctat cagtaactgg catcctctcc ggcgactgtg agacggcgtt caacaacgat 300
gtgttcagga tcacaactca gctgttctac ctcagcaagt tcgtagagta catcgactcc 360
ttctaccttc cccttatgga caagccactg tcgttccttc agttcttcca tcatttgggg 420
gcccccattg acatgtggct attctacaaa taccgcaacg aaggagtctg gatctttgtc 480
ctgttgaatg ggttcattca ctggatcatg tacggttact attggacgcg gctcatcaag 540
ctgaacttcc ccatgcccaa gaacctgatc acctccatgc agatcatcca gttcaatgtc 600
gggttctaca tcgtctggaa gtaccgcaat gtgccatgct accgccagga tgggatgcgc 660
atgtttgcct ggatcttcaa ctactggtat gtcgggacgg tcttgctgct gttcctcaac 720
ttttacgtgc agacgtacat ccggaagccg aggaagaacc gagggaagaa ggag 774
<210>12
<211>774
<212>DNA
<213>Euglena anabaena
<400>12
atggaagcag ccaaagaatt ggtttccatc gtccaagagg agctccccaa ggtggactat 60
gcccagcttt ggcaggacgc cagcagctgt gaggtccttt acctctcggt ggcattcgtg 120
gcgatcaagt tcatgctgcg cccactggac ctgaagcgcc aggccacctt gaagaagctg 180
ttcacagcat acaacttcct catgtcgatc tattcctttg gctccttcct ggccatggcc 240
tatgccctat cagtaactgg catcctctcc ggcgactgtg agacagcgtt caacaacgat 300
gtgttcagga tcacaactca gctgttctac ctcagcaagt tcgtagagta catcgactcc 360
ttctaccttc cccttatgga caagccactg tcgttccttc agttcttcca tcatttgggg 420
gctcccattg acatgtggct attctacaaa taccgcaacg aaggagtctg gatctttgtc 480
ctgttgaatg ggttcattca ctggatcatg tacggttact actggacgcg gctcatcaag 540
ctgaacttcc ccatgcccaa gaacctgatc acctccatgc agatcatcca gttcaatgtc 600
gggttctaca tcgtctggaa gtaccgcaat gtgccatgct accgccagga tgggatgcgc 660
atgtttgcct ggatcttcaa ctactggtac gtcgggacgg tcttgctgct gttcctcaac 720
ttttacgtgc agacgtacat ccggaagccg aggaagaacc aagggaagaa ggag 774
<210>13
<211>258
<212>PRT
<213>Euglena anabaena
<400>13
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1 5 10 15
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
20 25 30
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
35 40 45
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
50 55 60
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65 70 75 80
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
85 90 95
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
100 105 110
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
115 120 125
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
130 135 140
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145 150 155 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
165 170 175
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
180 185 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
195 200 205
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
210 215 220
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225 230 235 240
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys
245 250 255
Lys Glu
<210>14
<211>258
<212>PRT
<213>Euglena anabaena
<400>14
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1 5 10 15
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
20 25 30
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
35 40 45
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
50 55 60
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65 70 75 80
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
85 90 95
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
100 105 110
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
115 120 125
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
130 135 140
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145 150 155 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
165 170 175
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
180 185 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
195 200 205
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
210 215 220
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225 230 235 240
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Gln Gly Lys
245 250 255
Lys Glu
<210>15
<211>4311
<212>DNA
<213>人工序列
<220>
<223>质粒pKR906
<400>15
agcggccgca ccatggaggt ggtgaatgaa atagtctcaa ttgggcagga agttttaccc 60
aaagttgatt atgcccaact ctggagtgat gccagtcact gtgaggtgct ttacttgtcc 120
atcgcatttg tcatcttgaa gttcactctt ggcccccttg gtccaaaagg tcagtctcgt 180
atgaagtttg ttttcaccaa ttacaacctt ctcatgtcca tttattcgtt gggatcattc 240
ctctcaatgg catatgccat gtacaccatc ggtgttatgt ctgacaactg cgagaaggct 300
tttgacaaca acgtcttcag gatcaccacg cagttgttct atttgagcaa gttcctggag 360
tatattgact ccttctattt gccactgatg ggcaagcctc tgacctggtt gcaattcttc 420
catcatttgg gggcaccgat ggatatgtgg ctgttctata attaccgaaa tgaagctgtt 480
tggatttttg tgctgttgaa tggtttcatc cactggatca tgtacggtta ttattggacc 540
agattgatca agctgaagtt ccccatgcca aaatccctga ttacatcaat gcagatcatt 600
caattcaatg ttggtttcta cattgtctgg aagtacagga acattccctg ttatcgccaa 660
gatgggatga ggatgtttgg ctggttcttc aattactttt atgttggcac agtcttgtgt 720
ttgttcttga atttctatgt gcaaacgtat atcgtcagga agcacaaggg agccaaaaag 780
attcagtgag cggccgcacc tgaattccag cacactggcg gccgttacta gtggatccga 840
gctcggtacc aagcttgatg catagcttga gtattctaac gcgtcaccta aatagcttgg 900
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 960
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 1020
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 1080
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 1140
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 1200
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 1260
caaaaggcca gcaaaagccc aggaaccgta aaaaggccgc gttgctggcg tttttccata 1320
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 1380
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 1440
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 1500
tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 1560
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 1620
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 1680
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 1740
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 1800
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 1860
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 1920
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 1980
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt agcacgtgtc 2040
agtcctgctc ctcggccacg aagtgcacgc agttgccggc cgggtcgcgc agggcgaact 2100
cccgccccca cggctgctcg ccgatctcgg tcatggccgg cccggaggcg tcccggaagt 2160
tcgtggacac gacctccgac cactcggcgt acagctcgtc caggccgcgc acccacaccc 2220
aggccagggt gttgtccggc accacctggt cctggaccgc gctgatgaac agggtcacgt 2280
cgtcccggac cacaccggcg aagtcgtcct ccacgaagtc ccgggagaac ccgagccggt 2340
cggtccagaa ctcgaccgct ccggcgacgt cgcgcgcggt gagcaccgga acggcactgg 2400
tcaacttggc catggtggcc ctcctcacgt gctattattg aagcatttat cagggttatt 2460
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc 2520
gcacatttcc ccgaaaagtg ccacctgtat gcggtgtgaa ataccgcaca gatgcgtaag 2580
gagaaaatac cgcatcagga aattgtaagc gttaataatt cagaagaact cgtcaagaag 2640
gcgatagaag gcgatgcgct gcgaatcggg agcggcgata ccgtaaagca cgaggaagcg 2700
gtcagcccat tcgccgccaa gctcttcagc aatatcacgg gtagccaacg ctatgtcctg 2760
atagcggtcc gccacaccca gccggccaca gtcgatgaat ccagaaaagc ggccattttc 2820
caccatgata ttcggcaagc aggcatcgcc atgggtcacg acgagatcct cgccgtcggg 2880
catgctcgcc ttgagcctgg cgaacagttc ggctggcgcg agcccctgat gctcttcgtc 2940
cagatcatcc tgatcgacaa gaccggcttc catccgagta cgtgctcgct cgatgcgatg 3000
tttcgcttgg tggtcgaatg ggcaggtagc cggatcaagc gtatgcagcc gccgcattgc 3060
atcagccatg atggatactt tctcggcagg agcaaggtga gatgacagga gatcctgccc 3120
cggcacttcg cccaatagca gccagtccct tcccgcttca gtgacaacgt cgagcacagc 3180
tgcgcaagga acgcccgtcg tggccagcca cgatagccgc gctgcctcgt cttgcagttc 3240
attcagggca ccggacaggt cggtcttgac aaaaagaacc gggcgcccct gcgctgacag 3300
ccggaacacg gcggcatcag agcagccgat tgtctgttgt gcccagtcat agccgaatag 3360
cctctccacc caagcggccg gagaacctgc gtgcaatcca tcttgttcaa tcatgcgaaa 3420
cgatcctcat cctgtctctt gatcagagct tgatcccctg cgccatcaga tccttggcgg 3480
cgagaaagcc atccagttta ctttgcaggg cttcccaacc ttaccagagg gcgccccagc 3540
tggcaattcc ggttcgcttg ctgtccataa aaccgcccag tctagctatc gccatgtaag 3600
cccactgcaa gctacctgct ttctctttgc gcttgcgttt tcccttgtcc agatagccca 3660
gtagctgaca ttcatccggg gtcagcaccg tttctgcgga ctggctttct acgtgaaaag 3720
gatctaggtg aagatccttt ttgataatct catgcctgac atttatattc cccagaacat 3780
caggttaatg gcgtttttga tgtcattttc gcggtggctg agatcagcca cttcttcccc 3840
gataacggag accggcacac tggccatatc ggtggtcatc atgcgccagc tttcatcccc 3900
gatatgcacc accgggtaaa gttcacggga gactttatct gacagcagac gtgcactggc 3960
cagggggatc accatccgtc gccccggcgt gtcaataata tcactctgta catccacaaa 4020
cagacgataa cggctctctc ttttataggt gtaaacctta aactgccgta cgtataggct 4080
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 4140
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 4200
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggccctct 4260
agatgcatgc tcgagcggcc gccagtgtga tggatatctg cagaattcag g 4311
<210>16
<211>263
<212>PRT
<213>绿光等鞭金藻
<400>16
Met Ala Leu Ala Asn Asp Ala Gly Glu Arg Ile Trp Ala Ala Val Thr
1 5 10 15
Asp Pro Glu Ile Leu Ile Gly Thr Phe Ser Tyr Leu Leu Leu Lys Pro
20 25 30
Leu Leu Arg Asn Ser Gly Leu Val Asp Glu Lys Lys Gly Ala Tyr Arg
35 40 45
Thr Ser Met Ile Trp Tyr Asn Val Leu Leu Ala Leu Phe Ser Ala Leu
50 55 60
Ser Phe Tyr Val Thr Ala Thr Ala Leu Gly Trp Asp Tyr Gly Thr Gly
65 70 75 80
Ala Trp Leu Arg Arg Gln Thr Gly Asp Thr Pro Gln Pro Leu Phe Gln
85 90 95
Cys Pro Ser Pro Val Trp Asp Ser Lys Leu Phe Thr Trp Thr Ala Lys
100 105 110
Ala Phe Tyr Tyr Ser Lys Tyr Val Glu Tyr Leu Asp Thr Ala Trp Leu
115 120 125
Val Leu Lys Gly Lys Arg Val Ser Phe Leu Gln Ala Phe His His Phe
130 135 140
Gly Ala Pro Trp Asp Val Tyr Leu Gly Ile Arg Leu His Asn Glu Gly
145 150 155 160
Val Trp Ile Phe Met Phe Phe Asn Ser Phe Ile His Thr Ile Met Tyr
165 170 175
Thr Tyr Tyr Gly Leu Thr Ala Ala Gly Tyr Lys Phe Lys Ala Lys Pro
180 185 190
Leu Ile Thr Ala Met Gln Ile Cys Gln Phe Val Gly Gly Phe Leu Leu
195 200 205
Val Trp Asp Tyr Ile Asn Val Pro Cys Phe Asn Ser Asp Lys Gly Lys
210 215 220
Leu Phe Ser Trp Ala Phe Asn Tyr Ala Tyr Val Gly Ser Val Phe Leu
225 230 235 240
Leu Phe Cys His Phe Phe Tyr Gln Asp Asn Leu Ala Thr Lys Lys Ser
245 250 255
Ala Lys Ala Gly Lys Gln Leu
260
<210>17
<211>9472
<212>DNA
<213>人工序列
<220>
<223>质粒pDMW263
<400>17
catggcatgg atggtacgtc ctgtagaaac cccaacccgt gaaatcaaaa aactcgacgg 60
cctgtgggca ttcagtctgg atcgcgaaaa ctgtggaatt gatcagcgtt ggtgggaaag 120
cgcgttacaa gaaagccggg caattgctgt gccaggcagt tttaacgatc agttcgccga 180
tgcagatatt cgtaattatg cgggcaacgt ctggtatcag cgcgaagtct ttataccgaa 240
aggttgggca ggccagcgta tcgtgctgcg tttcgatgcg gtcactcatt acggcaaagt 300
gtgggtcaat aatcaggaag tgatggagca tcagggcggc tatacgccat ttgaagccga 360
tgtcacgccg tatgttattg ccgggaaaag tgtacgtatc accgtttgtg tgaacaacga 420
actgaactgg cagactatcc cgccgggaat ggtgattacc gacgaaaacg gcaagaaaaa 480
gcagtcttac ttccatgatt tctttaacta tgccgggatc catcgcagcg taatgctcta 540
caccacgccg aacacctggg tggacgatat caccgtggtg acgcatgtcg cgcaagactg 600
taaccacgcg tctgttgact ggcaggtggt ggccaatggt gatgtcagcg ttgaactgcg 660
tgatgcggat caacaggtgg ttgcaactgg acaaggcact agcgggactt tgcaagtggt 720
gaatccgcac ctctggcaac cgggtgaagg ttatctctat gaactgtgcg tcacagccaa 780
aagccagaca gagtgtgata tctacccgct tcgcgtcggc atccggtcag tggcagtgaa 840
gggcgaacag ttcctgatta accacaaacc gttctacttt actggctttg gtcgtcatga 900
agatgcggac ttacgtggca aaggattcga taacgtgctg atggtgcacg accacgcatt 960
aatggactgg attggggcca actcctaccg tacctcgcat tacccttacg ctgaagagat 1020
gctcgactgg gcagatgaac atggcatcgt ggtgattgat gaaactgctg ctgtcggctt 1080
taacctctct ttaggcattg gtttcgaagc gggcaacaag ccgaaagaac tgtacagcga 1140
agaggcagtc aacggggaaa ctcagcaagc gcacttacag gcgattaaag agctgatagc 1200
gcgtgacaaa aaccacccaa gcgtggtgat gtggagtatt gccaacgaac cggatacccg 1260
tccgcaagtg cacgggaata tttcgccact ggcggaagca acgcgtaaac tcgacccgac 1320
gcgtccgatc acctgcgtca atgtaatgtt ctgcgacgct cacaccgata ccatcagcga 1380
tctctttgat gtgctgtgcc tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt 1440
ggaaacggca gagaaggtac tggaaaaaga acttctggcc tggcaggaga aactgcatca 1500
gccgattatc atcaccgaat acggcgtgga tacgttagcc gggctgcact caatgtacac 1560
cgacatgtgg agtgaagagt atcagtgtgc atggctggat atgtatcacc gcgtctttga 1620
tcgcgtcagc gccgtcgtcg gtgaacaggt atggaatttc gccgattttg cgacctcgca 1680
aggcatattg cgcgttggcg gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa 1740
gtcggcggct tttctgctgc aaaaacgctg gactggcatg aacttcggtg aaaaaccgca 1800
gcagggaggc aaacaatgat taattaacta gagcggccgc caccgcggcc cgagattccg 1860
gcctcttcgg ccgccaagcg acccgggtgg acgtctagag gtacctagca attaacagat 1920
agtttgccgg tgataattct cttaacctcc cacactcctt tgacataacg atttatgtaa 1980
cgaaactgaa atttgaccag atattgtgtc cgcggtggag ctccagcttt tgttcccttt 2040
agtgagggtt aatttcgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 2100
gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg 2160
gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 2220
cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 2280
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 2340
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 2400
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 2460
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 2520
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 2580
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 2640
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 2700
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 2760
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 2820
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 2880
tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 2940
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 3000
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 3060
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 3120
gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 3180
aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 3240
aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 3300
cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg 3360
ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc 3420
cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta 3480
ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg 3540
ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct 3600
ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta 3660
gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg 3720
ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga 3780
ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt 3840
gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca 3900
ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt 3960
cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt 4020
ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga 4080
aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt 4140
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc 4200
gcacatttcc ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg 4260
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 4320
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 4380
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 4440
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 4500
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 4560
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 4620
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa 4680
tttccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 4740
gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 4800
agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact 4860
atagggcgaa ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat 4920
cgaattcatg tcacacaaac cgatcttcgc ctcaaggaaa cctaattct acatccgagag 4980
actgccgaga tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt 5040
tatataatat tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat 5100
tgctaaatag acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc 5160
atctcgcatt gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa 5220
atatattgta tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg 5280
aaaaacactt cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat 5340
gtagaataaa tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat 5400
ctgcattgcc taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag 5460
tcatcgagaa atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta 5520
ttggacgaga atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat 5580
gtactattct cattgttcat acttctagtc atttcatccc acatattcct tggatttctc 5640
tccaatgaat gacattctat cttgcaaatt caacaattat aataagatat accaaagtag 5700
cggtatagtg gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa 5760
tgatccatta aaggtatata tttatttctt gttatataat ccttttgttt attacatggg 5820
ctggatacat aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca 5880
gtgtcaactg taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa 5940
aaaaaaaatc gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac 6000
attgttcttc gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa 6060
gtacaagtac atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt 6120
ttttttttgt tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt 6180
gtagtaagcc gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc 6240
gctgcgagtt acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga 6300
aatcaacgga tgctcaaccg atttcgacag taataatttg aatcgaatcg gagcctaaaa 6360
tgaacccgag tatatctcat aaaattctcg gtgagaggtc tgtgactgtc agtacaaggt 6420
gccttcatta tgccctcaac cttaccatac ctcactgaat gtagtgtacc tctaaaaatg 6480
aaatacagtg ccaaaagcca aggcactgag ctcgtctaac ggacttgata tacaaccaat 6540
taaaacaaat gaaaagaaat acagttcttt gtatcatttg taacaattac cctgtacaaa 6600
ctaaggtatt gaaatcccac aatattccca aagtccaccc ctttccaaat tgtcatgcct 6660
acaactcata taccaagcac taacctacca aacaccacta aaaccccaca aaatatatct 6720
taccgaatat acagtaacaa gctaccacca cactcgttgg gtgcagtcgc cagcttaaag 6780
atatctatcc acatcagcca caactccctt cctttaataa accgactaca cccttggcta 6840
ttgaggttat gagtgaatat actgtagaca agacactttc aagaagactg tttccaaaac 6900
gtaccactgt cctccactac aaacacaccc aatctgcttc ttctagtcaa ggttgctaca 6960
ccggtaaatt ataaatcatc atttcattag cagggcaggg ccctttttat agagtcttat 7020
acactagcgg accctgccgg tagaccaacc cgcaggcgcg tcagtttgct ccttccatca 7080
atgcgtcgta gaaacgactt actccttctt gagcagctcc ttgaccttgt tggcaacaag 7140
tctccgacct cggaggtgga ggaagagcct ccgatatcgg cggtagtgat accagcctcg 7200
acggactcct tgacggcagc ctcaacagcg tcaccggcgg gcttcatgtt aagagagaac 7260
ttgagcatca tggcggcaga cagaatggtg gcaatggggt tgaccttctg cttgccgaga 7320
tcgggggcag atccgtgaca gggctcgtac agaccgaacg cctcgttggt gtcgggcaga 7380
gaagccagag aggcggaggg cagcagaccc agagaaccgg ggatgacgga ggcctcgtcg 7440
gagatgatat cgccaaacat gttggtggtg atgatgatac cattcatctt ggagggctgc 7500
ttgatgagga tcatggcggc cgagtcgatc agctggtggt tgagctcgag ctgggggaat 7560
tcgtccttga ggactcgagt gacagtcttt cgccaaagtc gagaggaggc cagcacgttg 7620
gccttgtcaa gagaccacac gggaagaggg gggttgtgct gaagggccag gaaggcggcc 7680
attcgggcaa ttcgctcaac ctcaggaacg gagtaggtct cggtgtcgga agcgacgcca 7740
gatccgtcat cctcctttcg ctctccaaag tagatacctc cgacgagctc tcggacaatg 7800
atgaagtcgg tgccctcaac gtttcggatg ggggagagat cggcgagctt gggcgacagc 7860
agctggcagg gtcgcaggtt ggcgtacagg ttcaggtcct ttcgcagctt gaggagaccc 7920
tgctcgggtc gcacgtcggt tcgtccgtcg ggagtggtcc atacggtgtt ggcagcgcct 7980
ccgacagcac cgagcataat agagtcagcc tttcggcaga tgtcgagagt agcgtcggtg 8040
atgggctcgc cctccttctc aatggcagct cctccaatga gtcggtcctc aaacacaaac 8100
tcggtgccgg aggcctcagc aacagacttg agcaccttga cggcctcggc aatcacctcg 8160
gggccacaga agtcgccgcc gagaagaaca atcttcttgg agtcagtctt ggtcttctta 8220
gtttcgggtt ccattgtgga tgtgtgtggt tgtatgtgtg atgtggtgtg tggagtgaaa 8280
atctgtggct ggcaaacgct cttgtatata tacgcacttt tgcccgtgct atgtggaaga 8340
ctaaacctcc gaagattgtg actcaggtag tgcggtatcg gctagggacc caaaccttgt 8400
cgatgccgat agcgctatcg aacgtacccc agccggccgg gagtatgtcg gaggggacat 8460
acgagatcgt caagggtttg tggccaactg gtaaataaat gatgtcgacg tttaaacagt 8520
gtacgcagat ctactataga ggaacattta aattgccccg gagaagacgg ccaggccgcc 8580
tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct 8640
ttttatatgg ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt 8700
agggttgcac caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca 8760
atggcacaaa taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt 8820
gcatcatcta agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga 8880
ggttccgagc actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga 8940
acagcgtgta cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt 9000
gacttgttat agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat 9060
tgagggtctg tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc 9120
gacaataggc cgtggcctca tttttttgcc ttccgcacat ttccattgct cgatacccac 9180
accttgcttc tcctgcactt gccaacctta atactggttt acattgacca acatcttaca 9240
agcggggggc ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc 9300
ttttttcctt tctttcccca cagattcgaa atctaaacta cacatcacag aattccgagc 9360
cgtgagtatc cacgacaaga tcagtgtcga gacgacgcgt tttgtgtaat gacacaatcc 9420
gaaagtcgct agcaacacac actctctaca caaactaacc cagctctggt ac 9472
<210>18
<211>7879
<212>DNA
<213>人工序列
<220>
<223>质粒pDMW237
<400>18
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000
gacgagtcag acagatactc gtcgactcag gcgacgacgg aattcctgca gcccatctgc 6060
agaattcagg agagaccggg ttggcggcgt atttgtgtcc caaaaaacag ccccaattgc 6120
cccggagaag acggccaggc cgcctagatg acaaattcaa caactcacag ctgactttct 6180
gccattgcca ctaggggggg gcctttttat atggccaagc caagctctcc acgtcggttg 6240
ggctgcaccc aacaataaat gggtagggtt gcaccaacaa agggatggga tggggggtag 6300
aagatacgag gataacgggg ctcaatggca caaataagaa cgaatactgc cattaagact 6360
cgtgatccag cgactgacac cattgcatca tctaagggcc tcaaaactac ctcggaactg 6420
ctgcgctgat ctggacacca cagaggttcc gagcacttta ggttgcacca aatgtcccac 6480
caggtgcagg cagaaaacgc tggaacagcg tgtacagttt gtcttaacaa aaagtgaggg 6540
cgctgaggtc gagcagggtg gtgtgacttg ttatagcctt tagagctgcg aaagcgcgta 6600
tggatttggc tcatcaggcc agattgaggg tctgtggaca catgtcatgt tagtgtactt 6660
caatcgcccc ctggatatag ccccgacaat aggccgtggc ctcatttttt tgccttccgc 6720
acatttccat tgctcggtac ccacaccttg cttctcctgc acttgccaac cttaatactg 6780
gtttacattg accaacatct tacaagcggg gggcttgtct agggtatata taaacagtgg 6840
ctctcccaat cggttgccag tctctttttt cctttctttc cccacagatt cgaaatctaa 6900
actacacatc acacaatgcc tgttactgac gtccttaagc gaaagtccgg tgtcatcgtc 6960
ggcgacgatg tccgagccgt gagtatccac gacaagatca gtgtcgagac gacgcgtttt 7020
gtgtaatgac acaatccgaa agtcgctagc aacacacact ctctacacaa actaacccag 7080
ctctccatgg ctctggccaa cgacgctggc gagcgaatct gggctgccgt caccgatccc 7140
gaaatcctca ttggcacctt ctcctacctg ctcctgaagc ctctcctgcg aaactctggt 7200
ctcgtggacg agaagaaagg agcctaccga acctccatga tctggtacaa cgtcctcctg 7260
gctctcttct ctgccctgtc cttctacgtg actgccaccg ctctcggctg ggactacggt 7320
actggagcct ggctgcgaag acagaccggt gatactcccc agcctctctt tcagtgtccc 7380
tctcctgtct gggactccaa gctgttcacc tggactgcca aggccttcta ctattctaag 7440
tacgtggagt acctcgacac cgcttggctg gtcctcaagg gcaagcgagt gtcctttctg 7500
caggccttcc atcactttgg agctccctgg gacgtctacc tcggcattcg actgcacaac 7560
gagggtgtgt ggatcttcat gttctttaac tcgttcattc acaccatcat gtacacctac 7620
tatggactga ctgccgctgg ctacaagttc aaggccaagc ctctgatcac tgccatgcag 7680
atttgccagt tcgtcggtgg ctttctcctg gtctgggact acatcaacgt tccctgcttc 7740
aactctgaca agggcaagct gttctcctgg gctttcaact acgcctacgt cggatctgtc 7800
tttctcctgt tctgtcactt cttttaccag gacaacctgg ccaccaagaa atccgctaag 7860
gctggtaagc agctttagc 7879
<210>19
<211>7783
<212>DNA
<213>人工序列
<220>
<223>质粒pY115
<400>19
catggctctg gccaacgacg ctggcgagcg aatctgggct gccgtcaccg atcccgaaat 60
cctcattggc accttctcct acctgctcct gaagcctctc ctgcgaaact ctggtctcgt 120
ggacgagaag aaaggagcct accgaacctc catgatctgg tacaacgtcc tcctggctct 180
cttctctgcc ctgtccttct acgtgactgc caccgctctc ggctgggact acggtactgg 240
agcctggctg cgaagacaga ccggtgatac tccccagcct ctctttcagt gtccctctcc 300
tgtctgggac tccaagctgt tcacctggac tgccaaggcc ttctactatt ctaagtacgt 360
ggagtacctc gacaccgctt ggctggtcct caagggcaag cgagtgtcct ttctgcaggc 420
cttccatcac tttggagctc cctgggacgt ctacctcggc attcgactgc acaacgaggg 480
tgtgtggatc ttcatgttct ttaactcgtt cattcacacc atcatgtaca cctactatgg 540
actgactgcc gctggctaca agttcaaggc caagcctctg atcactgcca tgcagatttg 600
ccagttcgtc ggtggctttc tcctggtctg ggactacatc aacgttccct gcttcaactc 660
tgacaagggc aagctgttct cctgggcttt caactacgcc tacgtcggat ctgtctttct 720
cctgttctgt cacttctttt accaggacaa cctggccacc aagaaatccg ctaaggctgg 780
taagcagctt tagcggccgc aagtgtggat ggggaagtga gtgcccggtt ctgtgtgcac 840
aattggcaat ccaagatgga tggattcaac acagggatat agcgagctac gtggtggtgc 900
gaggatatag caacggatat ttatgtttga cacttgagaa tgtacgatac aagcactgtc 960
caagtacaat actaaacata ctgtacatac tcatactcgt acccgggcaa cggtttcact 1020
tgagtgcagt ggctagtgct cttactcgta cagtgtgcaa tactgcgtat catagtcttt 1080
gatgtatatc gtattcattc atgttagttg cgtacgagcc ggaagcataa agtgtaaagc 1140
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 1200
ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 1260
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 1320
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 1380
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 1440
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1500
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1560
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1620
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1680
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1740
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1800
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1860
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 1920
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1980
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 2040
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2100
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2160
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2220
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2280
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2340
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 2400
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2460
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2520
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2580
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2640
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2700
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2760
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2820
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2880
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2940
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 3000
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3060
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3120
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3180
tccgcgcaca tttccccgaa aagtgccacc tgacgcgccc tgtagcggcg cattaagcgc 3240
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 3300
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 3360
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 3420
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 3480
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 3540
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 3600
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgct 3660
tacaatttcc attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc 3720
tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta 3780
acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gtaatacgac 3840
tcactatagg gcgaattggg taccgggccc cccctcgagg tcgatggtgt cgataagctt 3900
gatatcgaat tcatgtcaca caaaccgatc ttcgcctcaa ggaaacctaa ttctacatcc 3960
gagagactgc cgagatccag tctacactga ttaattttcg ggccaataat ttaaaaaaat 4020
cgtgttatat aatattatat gtattatata tatacatcat gatgatactg acagtcatgt 4080
cccattgcta aatagacaga ctccatctgc cgcctccaac tgatgttctc aatatttaag 4140
gggtcatctc gcattgttta ataataaaca gactccatct accgcctcca aatgatgttc 4200
tcaaaatata ttgtatgaac ttatttttat tacttagtat tattagacaa cttacttgct 4260
ttatgaaaaa cacttcctat ttaggaaaca atttataatg gcagttcgtt catttaacaa 4320
tttatgtaga ataaatgtta taaatgcgta tgggaaatct taaatatgga tagcataaat 4380
gatatctgca ttgcctaatt cgaaatcaac agcaacgaaa aaaatccctt gtacaacata 4440
aatagtcatc gagaaatatc aactatcaaa gaacagctat tcacacgtta ctattgagat 4500
tattattgga cgagaatcac acactcaact gtctttctct cttctagaaa tacaggtaca 4560
agtatgtact attctcattg ttcatacttc tagtcatttc atcccacata ttccttggat 4620
ttctctccaa tgaatgacat tctatcttgc aaattcaaca attataataa gatataccaa 4680
agtagcggta tagtggcaat caaaaagctt ctctggtgtg cttctcgtat ttatttttat 4740
tctaatgatc cattaaaggt atatatttat ttcttgttat ataatccttt tgtttattac 4800
atgggctgga tacataaagg tattttgatt taattttttg cttaaattca atcccccctc 4860
gttcagtgtc aactgtaatg gtaggaaatt accatacttt tgaagaagca aaaaaaatga 4920
aagaaaaaaa aaatcgtatt tccaggttag acgttccgca gaatctagaa tgcggtatgc 4980
ggtacattgt tcttcgaacg taaaagttgc gctccctgag atattgtaca tttttgcttt 5040
tacaagtaca agtacatcgt acaactatgt actactgttg atgcatccac aacagtttgt 5100
tttgtttttt tttgtttttt ttttttctaa tgattcatta ccgctatgta tacctacttg 5160
tacttgtagt aagccgggtt attggcgttc aattaatcat agacttatga atctgcacgg 5220
tgtgcgctgc gagttacttt tagcttatgc atgctacttg ggtgtaatat tgggatctgt 5280
tcggaaatca acggatgctc aatcgatttc gacagtaatt aattaagtca tacacaagtc 5340
agctttcttc gagcctcata taagtataag tagttcaacg tattagcact gtacccagca 5400
tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt 5460
tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa 5520
gcgctccatacttgcacgct ctctatatac acagttaaat tacatatcca tagtctaacc 5580
tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct 5640
caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg 5700
tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa 5760
gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaggt cggttctggg 5820
caatgaagcc aaccacaaac tcggggtcgg atcgggcaag ctcaatggtc tgcttggagt 5880
actcgccagt ggccagagag cccttgcaag acagctcggc cagcatgagc agacctctgg 5940
ccagcttctc gttgggagag gggactagga actccttgta ctgggagttc tcgtagtcag 6000
agacgtcctc cttcttctgt tcagagacag tttcctcggc accagctcgc aggccagcaa 6060
tgattccggt tccgggtaca ccgtgggcgt tggtgatatc ggaccactcg gcgattcggt 6120
gacaccggta ctggtgcttg acagtgttgc caatatctgc gaactttctg tcctcgaaca 6180
ggaagaaacc gtgcttaaga gcaagttcct tgagggggag cacagtgccg gcgtaggtga 6240
agtcgtcaat gatgtcgata tgggttttga tcatgcacac ataaggtccg accttatcgg 6300
caagctcaat gagctccttg gtggtggtaa catccagaga agcacacagg ttggttttct 6360
tggctgccac gagcttgagc actcgagcgg caaaggcgga cttgtggacg ttagctcgag 6420
cttcgtagga gggcattttg gtggtgaaga ggagactgaa ataaatttag tctgcagaac 6480
tttttatcgg aaccttatct ggggcagtga agtatatgtt atggtaatag ttacgagtta 6540
gttgaactta tagatagact ggactatacg gctatcggtc caaattagaa agaacgtcaa 6600
tggctctctg ggcgtcgcct ttgccgacaa aaatgtgatc atgatgaaag ccagcaatga 6660
cgttgcagct gatattgttg tcggccaacc gcgccgaaaa cgcagctgtc agacccacag 6720
cctccaacga agaatgtatc gtcaaagtga tccaagcaca ctcatagttg gagtcgtact 6780
ccaaaggcgg caatgacgag tcagacagat actcgtcgac gtttaaacag tgtacgcaga 6840
tctactatag aggaacattt aaattgcccc ggagaagacg gccaggccgc ctagatgaca 6900
aattcaacaa ctcacagctg actttctgcc attgccacta ggggggggcc tttttatatg 6960
gccaagccaa gctctccacg tcggttgggc tgcacccaac aataaatggg tagggttgca 7020
ccaacaaagg gatgggatgg ggggtagaag atacgaggat aacggggctc aatggcacaa 7080
ataagaacga atactgccat taagactcgt gatccagcga ctgacaccat tgcatcatct 7140
aagggcctca aaactacctc ggaactgctg cgctgatctg gacaccacag aggttccgag 7200
cactttaggt tgcaccaaat gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt 7260
acagtttgtc ttaacaaaaa gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta 7320
tagcctttag agctgcgaaa gcgcgtatgg atttggctca tcaggccaga ttgagggtct 7380
gtggacacat gtcatgttag tgtacttcaa tcgccccctg gatatagccc cgacaatagg 7440
ccgtggcctc atttttttgc cttccgcaca tttccattgc tcgataccca caccttgctt 7500
ctcctgcact tgccaacctt aatactggtt tacattgacc aacatcttac aagcgggggg 7560
cttgtctagg gtatatataa acagtggctc tcccaatcgg ttgccagtct cttttttcct 7620
ttctttcccc acagattcga aatctaaact acacatcaca gaattccgag ccgtgagtat 7680
ccacgacaag atcagtgtcg agacgacgcg ttttgtgtaa tgacacaatc cgaaagtcgc 7740
tagcaacaca cactctctac acaaactaac ccagctctgg tac 7783
<210>20
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物oYFBA1
<400>20
acgcagatc t ac tatagag 19
<210>21
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物oYFBA1-6
<400>21
agcggccgct ggtaccagag ctgggtt 27
<210>22
<211>6992
<212>DNA
<213>人工序列
<220>
<223>质粒pY158
<400>22
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc ggcaacggtt tcacttgagt gcagtggcta 240
gtgctcttac tcgtacagtg tgcaatactg cgtatcatag tctttgatgt atatcgtatt 300
cattcatgtt agttgcgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 360
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 420
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 480
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 540
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 600
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 660
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 720
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 780
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 840
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 900
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 960
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 1020
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 1080
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 1140
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 1200
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 1260
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 1320
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 1380
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 1440
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 1500
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 1560
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 1620
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 1680
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 1740
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 1800
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 1860
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 1920
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 1980
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 2040
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 2100
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 2160
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 2220
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 2280
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 2340
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 2400
ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt 2460
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt 2520
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc 2580
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga 2640
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc 2700
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt 2760
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 2820
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg 2880
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 2940
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 3000
cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa 3060
ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg 3120
tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga 3180
tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat 3240
tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag 3300
acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt 3360
gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta 3420
tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt 3480
cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa 3540
tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc 3600
taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa 3660
atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga 3720
atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct 3780
cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat 3840
gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg 3900
gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta 3960
aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat 4020
aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg 4080
taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc 4140
gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc 4200
gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac 4260
atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt 4320
tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc 4380
gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt 4440
acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga 4500
tgctcaatcg atttcgacag taattaatta agtcatacac aagtcagctt tcttcgagcc 4560
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 4620
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 4680
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 4740
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 4800
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 4860
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 4920
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 4980
tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 5040
caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 5100
gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 5160
gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 5220
tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 5280
gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 5340
gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 5400
taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 5460
cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 5520
ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 5580
tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 5640
ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 5700
tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 5760
agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 5820
cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 5880
tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 5940
gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 6000
acgagtcaga cagatactcg tcgacgttta aacagtgtac gcagatctac tatagaggaa 6060
catttaaatt gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac 6120
agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct 6180
ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg 6240
gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact 6300
gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact 6360
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 6420
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttagc 6480
aaaaagtgaa ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 6540
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 6600
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 6660
tttgccttcc gcacatttcc attgctcgat acccacacct tgcttctcct gcacttgcca 6720
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 6780
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 6840
ttcgaaatct aaactacaca tcacagaatt ccgagccgtg agtatccacg acaagatcag 6900
tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca acacacactc 6960
tctacacaaa ctaacccagc tctggtacca gc 6992
<210>23
<211>8707
<212>DNA
<213>人工序列
<220>
<223>质粒pY159
<400>23
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc ggcaacggtt tcacttgagt gcagtggcta 240
gtgctcttac tcgtacagtg tgcaatactg cgtatcatag tctttgatgt atatcgtatt 300
cattcatgtt agttgcgtac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 360
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 420
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 480
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 540
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 600
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 660
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 720
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 780
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 840
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 900
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 960
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 1020
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 1080
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 1140
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 1200
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 1260
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 1320
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 1380
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 1440
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 1500
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 1560
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 1620
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 1680
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 1740
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 1800
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 1860
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 1920
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 1980
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 2040
aatacgggat aataccgcgc cacatagcag aactttaaaagtgctcatca ttggaaaacg 2100
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 2160
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 2220
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 2280
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 2340
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 2400
ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt 2460
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt 2520
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc 2580
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga 2640
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc 2700
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt 2760
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct 2820
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg 2880
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 2940
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 3000
cagtcacgac gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa 3060
ttgggtaccg ggccccccct cgaggtcgat ggtgtcgata agcttgatat cgaattcatg 3120
tcacacaaac cgatcttcgc ctcaaggaaa cctaattcta catccgagag actgccgaga 3180
tccagtctac actgattaat tttcgggcca ataatttaaa aaaatcgtgt tatataatat 3240
tatatgtatt atatatatac atcatgatga tactgacagt catgtcccat tgctaaatag 3300
acagactcca tctgccgcct ccaactgatg ttctcaatat ttaaggggtc atctcgcatt 3360
gtttaataat aaacagactc catctaccgc ctccaaatga tgttctcaaa atatattgta 3420
tgaacttatt tttattactt agtattatta gacaacttac ttgctttatg aaaaacactt 3480
cctatttagg aaacaattta taatggcagt tcgttcattt aacaatttat gtagaataaa 3540
tgttataaat gcgtatggga aatcttaaat atggatagca taaatgatat ctgcattgcc 3600
taattcgaaa tcaacagcaa cgaaaaaaat cccttgtaca acataaatag tcatcgagaa 3660
atatcaacta tcaaagaaca gctattcaca cgttactatt gagattatta ttggacgaga 3720
atcacacact caactgtctt tctctcttct agaaatacag gtacaagtat gtactattct 3780
cattgttcat acttctagtc atttcatccc acatattcct tggatttctc tccaatgaat 3840
gacattctat cttgcaaatt caacaattat aataagatat accaaagtag cggtatagtg 3900
gcaatcaaaa agcttctctg gtgtgcttct cgtatttatt tttattctaa tgatccatta 3960
aaggtatata tttatttctt gttatataat ccttttgttt attacatggg ctggatacat 4020
aaaggtattt tgatttaatt ttttgcttaa attcaatccc ccctcgttca gtgtcaactg 4080
taatggtagg aaattaccat acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc 4140
gtatttccag gttagacgtt ccgcagaatc tagaatgcgg tatgcggtac attgttcttc 4200
gaacgtaaaa gttgcgctcc ctgagatatt gtacattttt gcttttacaa gtacaagtac 4260
atcgtacaac tatgtactac tgttgatgca tccacaacag tttgttttgt ttttttttgt 4320
tttttttttt tctaatgatt cattaccgct atgtatacct acttgtactt gtagtaagcc 4380
gggttattgg cgttcaatta atcatagact tatgaatctg cacggtgtgc gctgcgagtt 4440
acttttagct tatgcatgct acttgggtgt aatattggga tctgttcgga aatcaacgga 4500
tgctcaatcg atttcgacag taattaatta agtcatacac aagtcagctt tcttcgagcc 4560
tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa 4620
acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac 4680
atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc 4740
acgctctcta tatacacagt taaattacat atccatagtc taacctctaa cagttaatct 4800
tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt 4860
tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct 4920
caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg 4980
tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca 5040
caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca 5100
gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg 5160
gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct 5220
tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg 5280
gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt 5340
gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct 5400
taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt 5460
cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct 5520
ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct 5580
tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca 5640
ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct 5700
tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga acttatagat 5760
agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt 5820
cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat 5880
tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat 5940
gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg 6000
acgagtcaga cagatactcg tcgacgttta aacagtgtac gcagatctac tatagaggaa 6060
catttaaatt gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac 6120
agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct 6180
ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg 6240
gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact 6300
gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact 6360
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 6420
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttagc 6480
aaaaagtgaa ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 6540
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 6600
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 6660
tttgccttcc gcacatttcc attgctcgat acccacacct tgcttctcct gcacttgcca 6720
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 6780
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 6840
ttcgaaatct aaactacaca tcacagaatt ccgagccgtg agtatccacg acaagatcag 6900
tgtcgagacg acgcgttttg tgtaatgaca caatccgaaa gtcgctagca acacacactc 6960
tctacacaaa ctaacccagc tctggtacca gcggccatca caagtttgta caaaaaagct 7020
gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt gcataaaaaa 7080
cagactacat aatactgtaa aacacaacat atccagtcat attggcggcc gcattaggca 7140
ccccaggctt tacactttat gcttccggct cgtataatgt gtggattttg agttaggatc 7200
cgtcgagatt ttcaggagct aaggaagcta aaatggagaa aaaaatcact ggatatacca 7260
ccgttgatat atcccaatgg catcgtaaag aacattttga ggcatttcag tcagttgctc 7320
aatgtaccta taaccagacc gttcagctgg atattacggc ctttttaaag accgtaaaga 7380
aaaataagca caagttttat ccggccttta ttcacattct tgcccgcctg atgaatgctc 7440
atccggaatt ccgtatggca atgaaagacg gtgagctggt gatatgggat agtgttcacc 7500
cttgttacac cgttttccat gagcaaactg aaacgttttc atcgctctgg agtgaatacc 7560
acgacgattt ccggcagttt ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa 7620
acctggccta tttccctaaa gggtttattg agaatatgtt tttcgtctca gccaatccct 7680
gggtgagttt caccagtttt gatttaaacg tggccaatat ggacaacttc ttcgcccccg 7740
ttttcaccat gggcaaatat tatacgcaag gcgacaaggt gctgatgccg ctggcgattc 7800
aggttcatca tgccgtttgt gatggcttcc atgtcggcag aatgcttaat gaattacaac 7860
agtactgcga tgagtggcag ggcggggcgt aaacgcgtgg atccggctta ctaaaagcca 7920
gataacagta tgcgtatttg cgcgctgatt tttgcggtat aagaatatat actgatatgt 7980
atacccgaag tatgtcaaaa agaggtatgc tatgaagcag cgtattacag tgacagttga 8040
cagcgacagc tatcagttgc tcaaggcata tatgatgtca atatctccgg tctggtaagc 8100
acaaccatgc agaatgaagc ccgtcgtctg cgtgccgaac gctggaaagc ggaaaatcag 8160
gaagggatgg ctgaggtcgc ccggtttatt gaaatgaacg gctcttttgc tgacgagaac 8220
aggggctggt gaaatgcagt ttaaggttta cacctataaa agagagagcc gttatcgtct 8280
gtttgtggat gtacagagtg atattattga cacgcccggg cgacggatgg tgatccccct 8340
ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg tggtgcatat 8400
cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccgg tctccgttat 8460
cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg ccattaacct 8520
gatgttctgg ggaatataaa tgtcaggctc ccttatacac agccagtctg caggtcgacc 8580
atagtgactg gatatgttgt gttttacagc attatgtagt ctgtttttta tgcaaaatct 8640
aatttaatat attgatattt atatcatttt acgtttctcg ttcagctttc ttgtacaaag 8700
tggtgat 8707
<210>24
<211>8219
<212>DNA
<213>人工序列
<220>
<223>质粒pY173
<220>
<221>misc_feature
<222>(8170)..(8209)
<223>n为a,c,g,或t
<400>24
cttgtacaaa gtggtgatgg ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt 60
gcacaattgg caatccaaga tggatggatt caacacaggg atatagcgag ctacgtggtg 120
gtgcgaggat atagcaacgg atatttatgt ttgacacttg agaatgtacg atacaagcac 180
tgtccaagta caatactaaa catactgtac atactcatac tcgtacccgg caacggtttc 240
acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg tatcatagtc 300
tttgatgtat atcgtattca ttcatgttag ttgcgtacga gccggaagca taaagtgtaa 360
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 420
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 480
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 540
cgttcggctg cggcgagcgg tatcagctcactcaaaggcgg taatacggtt atccacaga 600
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 660
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 720
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 780
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 840
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 900
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 960
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1020
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1080
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 1140
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1200
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 1260
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 1320
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 1380
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 1440
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1500
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 1560
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 1620
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 1680
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 1740
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 1800
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 1860
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 1920
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 1980
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2040
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2100
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2160
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2220
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2280
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 2340
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2400
ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg gcgcattaag 2460
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 2520
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 2580
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 2640
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 2700
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 2760
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 2820
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 2880
gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg 2940
gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg 3000
gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac 3060
gactcactat agggcgaatt gggtaccggg ccccccctcg aggtcgatgg tgtcgataag 3120
cttgatatcg aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca 3180
tccgagagac tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa 3240
aatcgtgtta tataatatta tatgtattat atatatacat catgatgata ctgacagtca 3300
tgtcccattg ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt 3360
aaggggtcat ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg 3420
ttctcaaaat atattgtatg aacttatttt tattacttag tattattaga caacttactt 3480
gctttatgaa aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa 3540
caatttatgt agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata 3600
aatgatatct gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac 3660
ataaatagtc atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga 3720
gattattatt ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt 3780
acaagtatgt actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg 3840
gatttctctc caatgaatga cattctatct tgcaaattca acaattataa taagatatac 3900
caaagtagcg gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt 3960
tattctaatg atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat 4020
tacatgggct ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc 4080
ctcgttcagt gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa 4140
tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta 4200
tgcggtacat tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc 4260
ttttacaagt acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt 4320
tgttttgttt ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac 4380
ttgtacttgt agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca 4440
cggtgtgcgc tgcgagttac ttttagctta tgcatgctac ttgggtgtaa tattgggatc 4500
tgttcggaaa tcaacggatg ctcaatcgat ttcgacagta attaattaag tcatacacaa 4560
gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc actgtaccca 4620
gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg cggatacaca 4680
ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat acaagctgaa 4740
caagcgctcc atacttgcac gctctctata tacacagtta aattacatat ccatagtcta 4800
acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat cgcttggcct 4860
cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg atatccgttc 4920
cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct cccttgtcgt 4980
caagacccac cccgggggtc agaataagcc agtcctcaga gtcgccctta ggtcggttct 5040
gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg gtctgcttgg 5100
agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg agcagacctc 5160
tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag ttctcgtagt 5220
cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct cgcaggccag 5280
caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac tcggcgattc 5340
ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt ctgtcctcga 5400
acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg ccggcgtagg 5460
tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt ccgaccttat 5520
cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac aggttggttt 5580
tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg acgttagctc 5640
gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt tagtctgcag 5700
aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa tagttacgag 5760
ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta gaaagaacgt 5820
caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga aagccagcaa 5880
tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct gtcagaccca 5940
cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag ttggagtcgt 6000
actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgtttaaa cagtgtacgc 6060
agatctacta tagaggaaca tttaaattgc cccggagaag acggccaggc cgcctagatg 6120
acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat 6180
atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt 6240
gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca 6300
caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca 6360
tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc 6420
gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg 6480
tgtacagttt gtcttagcaa aaagtgaagg cgctgaggtc gagcagggtg gtgtgacttg 6540
ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg 6600
tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat 6660
aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcgatac ccacaccttg 6720
cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg 6780
gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt 6840
cctttctttc cccacagatt cgaaatctaa actacacatc acagaattcc gagccgtgag 6900
tatccacgac aagatcagtg tcgagacgac gcgttttgtg taatgacaca atccgaaagt 6960
cgctagcaac acacactctc tacacaaact aacccagctc tggtaccagc ggccatcaca 7020
agtttgtaca aaaaagttgg tttttttcgg tctaaaatgg aagcagccaa agaattggtt 7080
tccatcgtcc aagaggagct ccccaaggtg gactatgccc agctttggca ggatgccagc 7140
agctgtgagg tcctttacct ctcggtggca ttcgtggcga tcaagttcat gctgcgccca 7200
ctggacctga agcgccaggc caccttgaag aagctgttca cagcatacaa cttcctcatg 7260
tcgatctatt cctttggctc cttcctggcc atggcctatg ccctatcagt aactggcatc 7320
ctctccggcg actgtgagac ggcgttcaac aacgatgtgt tcaggatcac aactcagctg 7380
ttctacctca gcaagttcgt agagtacatc gactccttct accttcccct tatggacaag 7440
ccactgtcgt tccttcagtt cttccatcat ttgggggccc ccattgacat gtggctattc 7500
tacaaatacc gcaacgaagg agtctggatc tttgtcctgt tgaatgggtt cattcactgg 7560
atcatgtacg gttactattg gacgcggctc atcaagctga acttccccat gcccaagaac 7620
ctgatcacct ccatgcagat catccagttc aatgtcgggt tctacatcgt ctggaagtac 7680
cgcaatgtgc catgctaccg ccaggatggg atgcgcatgt ttgcctggat cttcaactac 7740
tggtatgtcg ggacggtctt gctgctgttc ctcaactttt acgtgcagac gtacatccgg 7800
aagccgagga agaaccgagg gaagaaggag taggccacat ggcgcctgcg ctggaggaaa 7860
cggtacgctc ggatggtgca ctgcacttgc actccgccgt ttctagcctc ccctcgctct 7920
aaccactgcg gcatgcctgc ttgaggcgtg acgttgcctc gtatgataca gtttacaccc 7980
ttcccacagc ccacggagct ggtgactgtt tccagcgtct gcagatcatt gatctggtgc 8040
aatgtgcaca gaccaagccc ctctaacgtc ttgcggtgta ccgctcgaca ctcactgcaa 8100
gagacagatg gctgagcatg ttatagcccc ttacattcta cccttcgtcc caacctgacc 8160
gtcacattcn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna cccaacttt 8219
<210>25
<211>8235
<212>DNA
<213>人工序列
<220>
<223>质粒pY174
<220>
<221>misc_feature
<222>(8186)..(8225)
<223>n为a,c,g,或t
<400>25
cttgtacaaa gtggtgatgg ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt 60
gcacaattgg caatccaaga tggatggatt caacacaggg atatagcgag ctacgtggtg 120
gtgcgaggat atagcaacgg atatttatgt ttgacacttg agaatgtacg atacaagcac 180
tgtccaagta caatactaaa catactgtac atactcatac tcgtacccgg caacggtttc 240
acttgagtgc agtggctagt gctcttactc gtacagtgtg caatactgcg tatcatagtc 300
tttgatgtat atcgtattca ttcatgttag ttgcgtacga gccggaagca taaagtgtaa 360
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 420
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 480
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 540
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 600
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 660
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 720
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 780
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 840
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 900
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 960
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1020
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1080
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 1140
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1200
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 1260
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 1320
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 1380
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 1440
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 1500
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 1560
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 1620
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 1680
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 1740
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 1800
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 1860
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 1920
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 1980
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 2040
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 2100
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 2160
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 2220
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 2280
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 2340
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2400
ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg gcgcattaag 2460
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 2520
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 2580
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 2640
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 2700
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 2760
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 2820
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 2880
gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg 2940
gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg 3000
gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac 3060
gactcactat agggcgaatt gggtaccggg ccccccctcg aggtcgatgg tgtcgataag 3120
cttgatatcg aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca 3180
tccgagagac tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa 3240
aatcgtgtta tataatatta tatgtattat atatatacat catgatgata ctgacagtca 3300
tgtcccattg ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt 3360
aaggggtcat ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg 3420
ttctcaaaat atattgtatg aacttatttt tattacttag tattattaga caacttactt 3480
gctttatgaa aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa 3540
caatttatgt agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata 3600
aatgatatct gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac 3660
ataaatagtc atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga 3720
gattattatt ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt 3780
acaagtatgt actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg 3840
gatttctctc caatgaatga cattctatct tgcaaattca acaattataa taagatatac 3900
caaagtagcg gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt 3960
tattctaatg atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat 4020
tacatgggct ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc 4080
ctcgttcagt gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa 4140
tgaaagaaaa aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta 4200
tgcggtacat tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc 4260
ttttacaagt acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt 4320
tgttttgttt ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac 4380
ttgtacttgt agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca 4440
cggtgtgcgc tgcgagttac ttttagctta tgcatgctac ttgggtgtaa tattgggatc 4500
tgttcggaaa tcaacggatg ctcaatcgat ttcgacagta attaattaag tcatacacaa 4560
gtcagctttc ttcgagcctc atataagtat aagtagttca acgtattagc actgtaccca 4620
gcatctccgt atcgagaaac acaacaacat gccccattgg acagatcatg cggatacaca 4680
ggttgtgcag tatcatacat actcgatcag acaggtcgtc tgaccatcat acaagctgaa 4740
caagcgctcc atacttgcac gctctctata tacacagtta aattacatat ccatagtcta 4800
acctctaaca gttaatcttc tggtaagcct cccagccagc cttctggtat cgcttggcct 4860
cctcaatagg atctcggttc tggccgtaca gacctcggcc gacaattatg atatccgttc 4920
cggtagacat gacatcctca acagttcggt actgctgtcc gagagcgtct cccttgtcgt 498O
caagacccac cccgggggtc agaataagcc agtcctcagagtcgccctta ggtcggttct 5040
gggcaatgaa gccaaccaca aactcggggt cggatcgggc aagctcaatg gtctgcttgg 5100
agtactcgcc agtggccaga gagcccttgc aagacagctc ggccagcatg agcagacctc 5160
tggccagctt ctcgttggga gaggggacta ggaactcctt gtactgggag ttctcgtagt 5220
cagagacgtc ctccttcttc tgttcagaga cagtttcctc ggcaccagct cgcaggccag 5280
caatgattcc ggttccgggt acaccgtggg cgttggtgat atcggaccac tcggcgattc 5340
ggtgacaccg gtactggtgc ttgacagtgt tgccaatatc tgcgaacttt ctgtcctcga 5400
acaggaagaa accgtgctta agagcaagtt ccttgagggg gagcacagtg ccggcgtagg 5460
tgaagtcgtc aatgatgtcg atatgggttt tgatcatgca cacataaggt ccgaccttat 5520
cggcaagctc aatgagctcc ttggtggtgg taacatccag agaagcacac aggttggttt 5580
tcttggctgc cacgagcttg agcactcgag cggcaaaggc ggacttgtgg acgttagctc 5640
gagcttcgta ggagggcatt ttggtggtga agaggagact gaaataaatt tagtctgcag 5700
aactttttat cggaacctta tctggggcag tgaagtatat gttatggtaa tagttacgag 5760
ttagttgaac ttatagatag actggactat acggctatcg gtccaaatta gaaagaacgt 5820
caatggctct ctgggcgtcg cctttgccga caaaaatgtg atcatgatga aagccagcaa 5880
tgacgttgca gctgatattg ttgtcggcca accgcgccga aaacgcagct gtcagaccca 5940
cagcctccaa cgaagaatgt atcgtcaaag tgatccaagc acactcatag ttggagtcgt 6000
actccaaagg cggcaatgac gagtcagaca gatactcgtc gacgtttaaa cagtgtacgc 6060
agatctacta tagaggaaca tttaaattgc cccggagaag acggccaggc cgcctagatg 6120
acaaattcaa caactcacag ctgactttct gccattgcca ctaggggggg gcctttttat 6180
atggccaagc caagctctcc acgtcggttg ggctgcaccc aacaataaat gggtagggtt 6240
gcaccaacaa agggatggga tggggggtag aagatacgag gataacgggg ctcaatggca 6300
caaataagaa cgaatactgc cattaagact cgtgatccag cgactgacac cattgcatca 6360
tctaagggcc tcaaaactac ctcggaactg ctgcgctgat ctggacacca cagaggttcc 6420
gagcacttta ggttgcacca aatgtcccac caggtgcagg cagaaaacgc tggaacagcg 6480
tgtacagttt gtcttagcaa aaagtgaagg cgctgaggtc gagcagggtg gtgtgacttg 6540
ttatagcctt tagagctgcg aaagcgcgta tggatttggc tcatcaggcc agattgaggg 6600
tctgtggaca catgtcatgt tagtgtactt caatcgcccc ctggatatag ccccgacaat 6660
aggccgtggc ctcatttttt tgccttccgc acatttccat tgctcgatac ccacaccttg 6720
cttctcctgc acttgccaac cttaatactg gtttacattg accaacatct tacaagcggg 6780
gggcttgtct agggtatata taaacagtgg ctctcccaat cggttgccag tctctttttt 6840
cctttctttc cccacagatt cgaaatctaa actacacatc acagaattcc gagccgtgag 6900
tatccacgac aagatcagtg tcgagacgac gcgttttgtg taatgacaca atccgaaagt 6960
cgctagcaac acacactctc tacacaaact aacccagctc tggtaccagc ggccatcaca 7020
agtttgtaca aaaaagttgg attttttttc ggtctaaaat ggaagcagcc aaagaattgg 7080
tttccatcgt ccaagaggag ctccccaagg tggactatgc ccagctttgg caggacgcca 7140
gcagctgtga ggtcctttac ctctcggtgg cattcgtggc gatcaagttc atgctgcgcc 7200
cactggacct gaagcgccag gccaccttga agaagctgtt cacagcatac aacttcctca 7260
tgtcgatcta ttcctttggc tccttcctgg ccatggccta tgccctatca gtaactggca 7320
tcctctccgg cgactgtgag acagcgttca acaacgatgt gttcaggatc acaactcagc 7380
tgttctacct cagcaagttc gtagagtaca tcgactcctt ctaccttccc cttatggaca 7440
agccactgtc gttccttcag ttcttccatc atttgggggc tcccattgac atgtggctat 7500
tctacaaata ccgcaacgaa ggagtctgga tctttgtcct gttgaatggg ttcattcact 7560
ggatcatgta cggttactac tggacgcggc tcatcaagct gaacttcccc atgcccaaga 7620
acctgatcac ctccatgcag atcatccagt tcaatgtcgg gttctacatc gtctggaagt 7680
accgcaatgt gccatgctac cgccaggatg ggatgcgcat gtttgcctgg atcttcaact 7740
actggtacgt cgggacggtc ttgctgctgt tcctcaactt ttacgtgcag acgtacatcc 7800
ggaagccgag gaagaaccaa gggaagaagg agtaggccac atggcgcctg cgctggagga 7860
aacggtacgc tcggatggtg cactgcactt gcactccgcc gcttctagcc tcccctcgct 7920
ctaacctctg cgacatgcct gcttgaggcg tgacgttgcc tcgtgcgata cagtttacac 7980
ccttcccatg gcccacggag caggtgactg tctccagcgt ctgcaattct gatcattggt 8040
ctggtgcaat gtgcgcagac caagcccctc taacgtcttg cggtgtaccg ctcgacactc 8100
actgcacgag acagatggct gagcatgtta tagcccctga cattctaccc ttcgtcctta 8160
cctgaccgtc acattcatgc ttaccnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 8220
nnnnnaccca acttt 8235
<210>26
<211>774
<212>DNA
<213>Euglena anabaena
<220>
<221>CDS
<222>(1)..(774)
<223>Δ9延伸酶(经密码子优化用于在解脂耶氏酵母属中表达)
<400>26
atg gag gct gcc aag gag ctg gtc tcc atc gtc cag gag gaa ctt ccc 48
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1 5 10 15
aag gtg gac tac gcc cag ctc tgg cag gac gcc tcc tct tgc gag gtt 96
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
20 25 30
ctg tac ctc tcg gtc gct ttc gtg gcc atc aag ttc atg ctt cga cct 144
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
35 40 45
ctg gac ctc aag cga caa gcc acc ctc aaa aag ctg ttc acc gca tac 192
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
50 55 60
aac ttt ctc atg tcc atc tac tcg ttc ggc tcc ttc ctg gcg atg gcc 240
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65 70 75 80
tac gct ctc tct gtc act ggt att ctt tcc ggc gat tgt gag act gcc 288
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
85 90 95
ttc aac aat gac gtg ttc cga atc acc act cag ctg ttc tac ctc agc 336
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
100 105 110
aag ttc gtc gag tac atc gac tcc ttc tac ctt ccc ctc atg gac aag 384
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
115 120 125
ccc ttg tcg ttt ctg cag ttc ttt cac cat ctc gga gct ccc atc gac 432
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
130 135 140
atg tgg ctg ttc tac aag tat cga aac gaa ggc gtc tgg atc ttt gtt 480
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145 150 155 160
ctg ctc aac ggc ttc att cac tgg atc atg tac ggt tac tat tgg acg 528
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
165 170 175
cga ctc atc aag ctg aac ttc cct atg ccc aag aac ctc att acc tcc 576
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
180 185 190
atg caa att atc cag ttc aac gtc gga ttc tac atc gtc tgg aag tac 624
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
195 200 205
cga aac gtg ccc tgc tac cgg cag gac ggt atg cga atg ttt gcc tgg 672
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
210 215 220
atc ttc aac tac tgg tat gtc ggc acg gtg ctg ctt ctg ttc ctc aac 720
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225 230 235 240
ttc tac gtc cag acc tac att cgg aag cct cga aag aac cga ggc aaa 768
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys
245 250 255
aag gag 774
Lys Glu
<210>27
<211>258
<212>PRT
<213>Euglena anabaena
<400>27
Met Glu Ala Ala Lys Glu Leu Val Ser Ile Val Gln Glu Glu Leu Pro
1 5 10 15
Lys Val Asp Tyr Ala Gln Leu Trp Gln Asp Ala Ser Ser Cys Glu Val
20 25 30
Leu Tyr Leu Ser Val Ala Phe Val Ala Ile Lys Phe Met Leu Arg Pro
35 40 45
Leu Asp Leu Lys Arg Gln Ala Thr Leu Lys Lys Leu Phe Thr Ala Tyr
50 55 60
Asn Phe Leu Met Ser Ile Tyr Ser Phe Gly Ser Phe Leu Ala Met Ala
65 70 75 80
Tyr Ala Leu Ser Val Thr Gly Ile Leu Ser Gly Asp Cys Glu Thr Ala
85 90 95
Phe Asn Asn Asp Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser
100 105 110
Lys Phe Val Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Asp Lys
115 120 125
Pro Leu Ser Phe Leu Gln Phe Phe His His Leu Gly Ala Pro Ile Asp
130 135 140
Met Trp Leu Phe Tyr Lys Tyr Arg Asn Glu Gly Val Trp Ile Phe Val
145 150 155 160
Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr
165 170 175
Arg Leu Ile Lys Leu Asn Phe Pro Met Pro Lys Asn Leu Ile Thr Ser
180 185 190
Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr
195 200 205
Arg Asn Val Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Ala Trp
210 215 220
Ile Phe Asn Tyr Trp Tyr Val Gly Thr Val Leu Leu Leu Phe Leu Asn
225 230 235 240
Phe Tyr Val Gln Thr Tyr Ile Arg Lys Pro Arg Lys Asn Arg Gly Lys
245 250 255
Lys Glu
<210>28
<211>3497
<212>DNA
<213>人工序列
<220>
<223>质粒pEaD9ES
<400>28
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa 420
tgcatctaga tccatggagg ctgccaagga gctggtctcc atcgtccagg aggaacttcc 480
caaggtggac tacgcccagc tctggcagga cgcctcctct tgcgaggttc tgtacctctc 540
ggtcgctttc gtggccatca agttcatgct tcgacctctg gacctcaagc gacaagccac 600
cctcaaaaag ctgttcaccg catacaactt tctcatgtcc atctactcgt tcggctcctt 660
cctggcgatg gcctacgctc tctctgtcac tggtattctt tccggcgatt gtgagactgc 720
cttcaacaat gacgtgttcc gaatcaccac tcagctgttc tacctcagca agttcgtcga 780
gtacatcgac tccttctacc ttcccctcat ggacaagccc ttgtcgtttc tgcagttctt 840
tcaccatctc ggagctccca tcgacatgtg gctgttctac aagtatcgaa acgaaggcgt 900
ctggatcttt gttctgctca acggcttcat tcactggatc atgtacggtt actattggac 960
gcgactcatc aagctgaact tccctatgcc caagaacctc attacctcca tgcaaattat 1020
ccagttcaac gtcggattct acatcgtctg gaagtaccga aacgtgccct gctaccggca 1080
ggacggtatg cgaatgtttg cctggatctt caactactgg tatgtcggca cggtgctgct 1140
tctgttcctc aacttctacg tccagaccta cattcggaag cctcgaaaga accgaggcaa 1200
aaaggagtaa gcggccgcat cggatcccgg gcccgtcgac tgcagaggcc tgcatgcaag 1260
cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 1320
acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 1380
actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 1440
gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 1500
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 1560
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 1620
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 1680
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 1740
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 1800
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 1860
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 1920
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 1980
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 2040
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 2100
ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 2160
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 2220
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 2280
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 2340
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 2400
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 2460
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 2520
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 2580
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 2640
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 2700
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 2760
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 2820
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 2880
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 2940
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 3000
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 3060
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 3120
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 3180
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 3240
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 3300
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 3360
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 3420
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 3480
cacgaggccc tttcgtc 3497
<210>29
<211>7769
<212>DNA
<213>人工序列
<220>
<223>质粒pZUFmEaD9ES
<400>29
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000
gacgagtcag acagatactc gtcgacgttt aaacagtgta cgcagatcta ctatagagga 6060
acatttaaat tgccccggag aagacggcca ggccgcctag atgacaaatt caacaactca 6120
cagctgactt tctgccattg ccactagggg ggggcctttt tatatggcca agccaagctc 6180
tccacgtcgg ttgggctgca cccaacaata aatgggtagg gttgcaccaa caaagggatg 6240
ggatgggggg tagaagatac gaggataacg gggctcaatg gcacaaataa gaacgaatac 6300
tgccattaag actcgtgatc cagcgactga caccattgca tcatctaagg gcctcaaaac 6360
tacctcggaa ctgctgcgct gatctggaca ccacagaggt tccgagcact ttaggttgca 6420
ccaaatgtcc caccaggtgc aggcagaaaa cgctggaaca gcgtgtacag tttgtcttaa 6480
caaaaagtga gggcgctgag gtcgagcagg gtggtgtgac ttgttatagc ctttagagct 6540
gcgaaagcgc gtatggattt ggctcatcag gccagattga gggtctgtgg acacatgtca 6600
tgttagtgta cttcaatcgc cccctggata tagccccgac aataggccgt ggcctcattt 6660
ttttgccttc cgcacatttc cattgctcga tacccacacc ttgcttctcc tgcacttgcc 6720
aaccttaata ctggtttaca ttgaccaaca tcttacaagc ggggggcttg tctagggtat 6780
atataaacag tggctctccc aatcggttgc cagtctcttt tttcctttct ttccccacag 6840
attcgaaatc taaactacac atcacagaat tccgagccgt gagtatccac gacaagatca 6900
gtgtcgagac gacgcgtttt gtgtaatgac acaatccgaa agtcgctagc aacacacact 6960
ctctacacaa actaacccag ctctggtacc atggaggctg ccaaggagct ggtctccatc 7020
gtccaggagg aacttcccaa ggtggactac gcccagctct ggcaggacgc ctcctcttgc 7080
gaggttctgt acctctcggt cgctttcgtg gccatcaagt tcatgcttcg acctctggac 7140
ctcaagcgac aagccaccct caaaaagctg ttcaccgcat acaactttct catgtccatc 7200
tactcgttcg gctccttcct ggcgatggcc tacgctctct ctgtcactgg tattctttcc 7260
ggcgattgtg agactgcctt caacaatgac gtgttccgaa tcaccactca gctgttctac 7320
ctcagcaagt tcgtcgagta catcgactcc ttctaccttc ccctcatgga caagcccttg 7380
tcgtttctgc agttctttca ccatctcgga gctcccatcg acatgtggct gttctacaag 7440
tatcgaaacg aaggcgtctg gatctttgtt ctgctcaacg gcttcattca ctggatcatg 7500
tacggttact attggacgcg actcatcaag ctgaacttcc ctatgcccaa gaacctcatt 7560
acctccatgc aaattatcca gttcaacgtc ggattctaca tcgtctggaa gtaccgaaac 7620
gtgccctgct accggcagga cggtatgcga atgtttgcct ggatcttcaa ctactggtat 7680
gtcggcacgg tgctgcttct gttcctcaac ttctacgtcc agacctacat tcggaagcct 7740
cgaaagaacc gaggcaaaaa ggagtaagc 7769
Claims (12)
1.包含分离的多核苷酸的微生物宿主细胞,所述分离的多核苷酸包含:
(a)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于ClustalV比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,所述多肽具有至少80%的氨基酸同一性;
(b)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中基于BLASTN比对方法在与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列进行比较时,所述核苷酸序列具有至少80%的序列同一性;
(c)编码具有Δ9延伸酶活性的多肽的核苷酸序列,其中所述核苷酸序列在严格条件下与SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26中示出的核苷酸序列杂交;或
(d)(a)、(b)或(c)的核苷酸序列的互补序列,其中所述互补序列与所述核苷酸序列由相同数目的核苷酸组成并且100%互补。
2.权利要求1的微生物宿主细胞,其中所述分离的多核苷酸编码SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列。
3.权利要求1的微生物宿主细胞,其中所述微生物宿主细胞选自酵母、藻类、细菌、类眼虫、原生藻菌和真菌。
4.权利要求3的微生物宿主细胞,其中所述细胞是被孢霉属物种的真菌。
5.权利要求3的微生物宿主细胞,其中所述细胞是选自下列的原生藻菌:破囊壶菌属物种和裂殖壶菌属物种。
6.权利要求3的微生物宿主细胞,其中所述酵母是含油酵母。
7.权利要求6的微生物宿主细胞,其中所述含油酵母选自:耶氏酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。
8.用于产生二十碳二烯酸的方法,所述方法包括:
a)提供微生物宿主细胞,所述微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,所述延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)亚油酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使所述亚油酸转化成二十碳二烯酸的条件下生长;以及,
c)任选回收步骤(b)的二十碳二烯酸。
9.用于产生二十碳三烯酸的方法,所述方法包括:
a)提供微生物宿主细胞,所述微生物宿主细胞包含:
(i)编码Δ9延伸酶多肽的重组核苷酸分子,基于Clustal V比对方法在与SEQ ID NO:13或SEQ ID NO:14中示出的氨基酸序列进行比较时,所述延伸酶多肽具有至少80%的氨基酸同一性;和
(ii)α-亚麻酸源;
b)使步骤(a)的微生物宿主细胞在使编码Δ9延伸酶多肽的核酸片段表达并使所述α-亚麻酸转化成二十碳三烯酸的条件下生长;以及,
c)任选回收步骤(b)的二十碳三烯酸。
10.权利要求8或9的方法,其中所述微生物宿主细胞是包含如SEQID NO:26中示出的编码Δ9延伸酶多肽的重组核苷酸分子的耶氏酵母属物种,其中所述重组核苷酸分子包含至少98个经最优化以便在耶氏酵母属中表达的密码子。
11.权利要求8或9的方法,其中:
a.)所述重组核酸分子具有选自SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:26的核酸序列;并且
b.)所述宿主细胞是解脂耶氏酵母。
12.如SEQ ID NO:26中示出的编码Δ9延伸酶的分离的核酸分子,其中至少98个密码子经密码子最优化以便在耶氏酵母属物种中表达。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US91192507P | 2007-04-16 | 2007-04-16 | |
US60/911,925 | 2007-04-16 | ||
PCT/US2008/060396 WO2008128241A1 (en) | 2007-04-16 | 2008-04-16 | Delta 9 elongases and their use in making polyunsaturated fatty acids |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101848996A true CN101848996A (zh) | 2010-09-29 |
CN101848996B CN101848996B (zh) | 2013-05-29 |
Family
ID=39619289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008800203954A Expired - Fee Related CN101848996B (zh) | 2007-04-16 | 2008-04-16 | △9延伸酶及其在制备多不饱和脂肪酸中的用途 |
Country Status (9)
Country | Link |
---|---|
US (5) | US7794701B2 (zh) |
EP (2) | EP2137304B1 (zh) |
JP (1) | JP5501954B2 (zh) |
CN (1) | CN101848996B (zh) |
AU (2) | AU2008240029B2 (zh) |
BR (1) | BRPI0807291A2 (zh) |
CA (2) | CA2679485A1 (zh) |
DK (1) | DK2137304T3 (zh) |
WO (2) | WO2008128241A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103080316A (zh) * | 2010-08-26 | 2013-05-01 | 纳幕尔杜邦公司 | 突变δ9延伸酶和它们在制备多不饱和脂肪酸中的用途 |
CN106916796A (zh) * | 2015-12-28 | 2017-07-04 | 丰益(上海)生物技术研发中心有限公司 | 裂殖壶菌delta-12脂肪酸脱饱和酶相关序列及其应用 |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102559364B (zh) | 2004-04-22 | 2016-08-17 | 联邦科学技术研究组织 | 用重组细胞合成长链多不饱和脂肪酸 |
US7834250B2 (en) | 2004-04-22 | 2010-11-16 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
CA2661697A1 (en) | 2006-08-29 | 2008-03-06 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of fatty acids |
US7794701B2 (en) * | 2007-04-16 | 2010-09-14 | E.I. Du Pont De Nemours And Company | Δ-9 elongases and their use in making polyunsaturated fatty acids |
DK2169055T3 (da) * | 2007-05-25 | 2015-06-22 | Suntory Holdings Ltd | Nyt lysophosphatidat-acyltransferasegen. |
US8168858B2 (en) | 2008-06-20 | 2012-05-01 | E. I. Du Pont De Nemours And Company | Delta-9 fatty acid elongase genes and their use in making polyunsaturated fatty acids |
EP2358882B1 (en) | 2008-11-18 | 2017-07-26 | Commonwealth Scientific and Industrial Research Organisation | Enzymes and methods for producing omega-3 fatty acids |
BRPI0917722A2 (pt) * | 2008-12-18 | 2017-05-30 | Du Pont | organismo transgênico e método para manipular o teor de malonatos em um organismo transgênico |
WO2010147907A1 (en) | 2009-06-16 | 2010-12-23 | E. I. Du Pont De Nemours And Company | High eicosapentaenoic acid oils from improved optimized strains of yarrowia lipolytica |
US8188335B2 (en) * | 2009-07-17 | 2012-05-29 | Abbott Laboratories | Δ9-elongase for production of polyunsaturated fatty acid-enriched oils |
CA2779552C (en) | 2009-11-03 | 2019-04-09 | Dsm Ip Assets B.V. | Vegetable oil comprising a polyunsaturated fatty acid having at least 20 carbon atoms |
WO2011054800A1 (en) | 2009-11-03 | 2011-05-12 | Dsm Ip Assets B.V. | Composition comprising cells and a polyunsaturated fatty acid having at least 20 carbon atoms (lc-pufa) |
CN103282474A (zh) | 2010-04-22 | 2013-09-04 | 纳幕尔杜邦公司 | 从微生物生物质中获得包含多不饱和脂肪酸的组合物的方法 |
AU2011293180B2 (en) | 2010-08-26 | 2017-03-02 | E. I. Du Pont De Nemours And Company | Recombinant microbial host cells for high eicosapentaenoic acid production |
WO2012027698A1 (en) | 2010-08-26 | 2012-03-01 | E.I. Du Pont De Nemours And Company | Mutant hpgg motif and hdash motif delta-5 desaturases and their use in making polyunsaturated fatty acids |
KR20140000711A (ko) | 2010-12-30 | 2014-01-03 | 이 아이 듀폰 디 네모아 앤드 캄파니 | 수크로스 이용에 있어서의 야로위아 리포라이티카에서의 사카로마이세스 세레비지애 suc2 유전자의 용도 |
US20130040340A1 (en) | 2011-02-07 | 2013-02-14 | E. I. Du Pont De Nemours And Company | Production of alcohol esters in situ using alcohols and fatty acids produced by microorganisms |
US8946460B2 (en) | 2012-06-15 | 2015-02-03 | Commonwealth Scientific And Industrial Research Organisation | Process for producing polyunsaturated fatty acids in an esterified form |
EP2935591B1 (en) | 2012-12-21 | 2017-07-05 | E. I. du Pont de Nemours and Company | Down-regulation of a polynucleotide encoding a sou2 sorbitol utilization protein to modify lipid production in microbial cells |
US20160272997A1 (en) | 2013-10-25 | 2016-09-22 | Pioneer Hi-Bred International, Inc. | Stem canker tolerant soybeans and methods of use |
SG11201604871VA (en) | 2013-12-18 | 2016-07-28 | Commw Scient Ind Res Org | Lipid comprising long chain polyunsaturated fatty acids |
KR102527795B1 (ko) | 2014-06-27 | 2023-05-02 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 도코사펜타에노산을 포함하는 지질 |
US11096344B2 (en) | 2016-02-05 | 2021-08-24 | Pioneer Hi-Bred International, Inc. | Genetic loci associated with brown stem rot resistance in soybean and methods of use |
US20200015500A1 (en) | 2016-12-15 | 2020-01-16 | Dsm Ip Assets B.V. | Blend formulation comprising silicate and microbial and / or plant cells comprising a polyunsaturated fatty acid having at least 20 carbon atoms (lc-pufa) |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4670285A (en) | 1982-08-06 | 1987-06-02 | The University Of Toronto Innovations Foundation | Infant formula |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US5107065A (en) | 1986-03-28 | 1992-04-21 | Calgene, Inc. | Anti-sense regulation of gene expression in plant cells |
US5188958A (en) | 1986-05-29 | 1993-02-23 | Calgene, Inc. | Transformation and foreign gene expression in brassica species |
US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
JP2527340B2 (ja) | 1986-12-15 | 1996-08-21 | アプライド バイオシステムズ インコーポレイテッド | ロ―ダミン染料の5−及び6−スクシニミジルカルボキシレ―ト異性体 |
US5416011A (en) | 1988-07-22 | 1995-05-16 | Monsanto Company | Method for soybean transformation and regeneration |
US5366860A (en) | 1989-09-29 | 1994-11-22 | Applied Biosystems, Inc. | Spectrally resolvable rhodamine dyes for nucleic acid sequence determination |
AU1871492A (en) | 1991-03-29 | 1992-11-02 | Board Of Trustees Of The University Of Illinois, The | Production fo transgenic soybean plants |
US6372965B1 (en) | 1992-11-17 | 2002-04-16 | E.I. Du Pont De Nemours And Company | Genes for microsomal delta-12 fatty acid desaturases and hydroxylases from plants |
US5648564A (en) | 1995-12-21 | 1997-07-15 | Kemin Industries, Inc. | Process for the formation, isolation and purification of comestible xanthophyll crystals from plants |
US6051754A (en) | 1997-04-11 | 2000-04-18 | Abbott Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants |
US6432684B1 (en) | 1997-04-11 | 2002-08-13 | Abbott Laboratories | Human desaturase gene and uses thereof |
US5972664A (en) | 1997-04-11 | 1999-10-26 | Abbott Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids |
US6075183A (en) | 1997-04-11 | 2000-06-13 | Abbott Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants |
US5968809A (en) | 1997-04-11 | 1999-10-19 | Abbot Laboratories | Methods and compositions for synthesis of long chain poly-unsaturated fatty acids |
CN1253588A (zh) | 1997-04-11 | 2000-05-17 | 艾博特公司 | 在植物中合成长链多不饱和脂肪酸的方法和组合物 |
US6403349B1 (en) | 1998-09-02 | 2002-06-11 | Abbott Laboratories | Elongase gene and uses thereof |
JP4383671B2 (ja) | 1998-12-07 | 2009-12-16 | ワシントン ステート ユニバーシティ リサーチ ファウンデーション | 不飽和化酵素、およびそれらを多価不飽和脂肪酸の合成のために用いる方法 |
US6825017B1 (en) | 1998-12-07 | 2004-11-30 | Washington State University Research Foundation | Desaturases and methods of using them for synthesis of polyunsaturated fatty acids |
WO2002000904A2 (en) | 2000-06-23 | 2002-01-03 | E. I. Du Pont De Nemours And Company | Recombinant constructs and their use in reducing gene expression |
MXPA03000507A (es) | 2000-07-21 | 2003-10-06 | Du Pont | Enzima de citocromo p450 asociada con la sintesis de grupos delta12-epoxi en acidos grasos de plantas.. |
ATE540575T1 (de) * | 2001-03-16 | 2012-01-15 | Basf Plant Science Gmbh | Regulatoren des zucker- und lipidstoffwechsels in pflanzen |
GB0107510D0 (en) | 2001-03-26 | 2001-05-16 | Univ Bristol | New elongase gene and a process for the production of -9-polyunsaturated fatty acids |
TWI350854B (en) | 2001-04-16 | 2011-10-21 | Martek Biosciences Corp | Product and process for transformation of thraustochytriales microorganisms |
US6797303B2 (en) | 2001-09-04 | 2004-09-28 | Lycored Natural Products Industries Ltd. | Carotenoid extraction process |
BR0317304A (pt) | 2002-12-19 | 2005-11-08 | Univ Bristol | Processo para a produção de compostos, sequência de ácido nucleico isolada, sequência de aminoácidos, construção gênica, vetor, e, organismo |
US20040172682A1 (en) | 2003-02-12 | 2004-09-02 | Kinney Anthony J. | Production of very long chain polyunsaturated fatty acids in oilseed plants |
US7129089B2 (en) | 2003-02-12 | 2006-10-31 | E. I. Du Pont De Nemours And Company | Annexin and P34 promoters and use in expression of transgenic genes in plants |
US7125672B2 (en) | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7238482B2 (en) | 2003-05-07 | 2007-07-03 | E. I. Du Pont De Nemours And Company | Production of polyunsaturated fatty acids in oleaginous yeasts |
US7259255B2 (en) | 2003-06-25 | 2007-08-21 | E. I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast |
US9433228B2 (en) | 2003-08-01 | 2016-09-06 | Basf Plant Science Gmbh | Method for the production of multiple-unsaturated fatty acids in transgenic organisms |
WO2005047480A2 (en) | 2003-11-12 | 2005-05-26 | E.I. Dupont De Nemours And Company | Delta-15 desaturases suitable for altering levels of polyunsaturated fatty acids in oleaginous plants and yeast |
US7202356B2 (en) | 2003-11-14 | 2007-04-10 | E. I. Du Pont De Nemours And Company | Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast |
EP4219670A3 (de) | 2004-02-27 | 2023-08-09 | BASF Plant Science GmbH | Verfahren zur herstellung mehrfach ungesättigter fettsäuren in transgenen pflanzen |
CN102559364B (zh) | 2004-04-22 | 2016-08-17 | 联邦科学技术研究组织 | 用重组细胞合成长链多不饱和脂肪酸 |
US7834250B2 (en) | 2004-04-22 | 2010-11-16 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
AU2005267202B2 (en) | 2004-06-25 | 2011-10-27 | Corteva Agriscience Llc | Delta-8 desaturase and its use in making polyunsaturated fatty acids |
US7465564B2 (en) | 2004-08-10 | 2008-12-16 | E.I. Du Pont De Nemours And Company | Production of γ-linolenic acid in oleaginous yeast |
US7588931B2 (en) | 2004-11-04 | 2009-09-15 | E. I. Du Pont De Nemours And Company | High arachidonic acid producing strains of Yarrowia lipolytica |
JP5123861B2 (ja) | 2005-11-23 | 2013-01-23 | イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー | Δ9エロンガーゼおよびそれらの多価不飽和脂肪酸製造における使用 |
US7465793B2 (en) * | 2006-04-20 | 2008-12-16 | E.I. Du Pont De Nemours And Company | Synthetic Δ17 desaturase derived from Phytophthora ramourum and its use in making polyunsaturated fatty acids |
US7943823B2 (en) | 2006-04-28 | 2011-05-17 | E.I. Du Pont De Nemours And Company | Delta-8 desaturase and its use in making polyunsaturated fatty acids |
US7678560B2 (en) | 2006-05-17 | 2010-03-16 | E.I. Du Pont De Nemours And Company | Δ 5 desaturase and its use in making polyunsaturated fatty acids |
AU2008216707B2 (en) | 2007-02-12 | 2014-06-19 | E. I. Du Pont De Nemours And Company | Production of arachidonic acid in oilseed plants |
JP2010523113A (ja) * | 2007-04-03 | 2010-07-15 | イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー | マルチザイム(multizyme)および多価不飽和脂肪酸の製造におけるその使用 |
US7790156B2 (en) * | 2007-04-10 | 2010-09-07 | E. I. Du Pont De Nemours And Company | Δ-8 desaturases and their use in making polyunsaturated fatty acids |
US7794701B2 (en) | 2007-04-16 | 2010-09-14 | E.I. Du Pont De Nemours And Company | Δ-9 elongases and their use in making polyunsaturated fatty acids |
WO2009046231A1 (en) * | 2007-10-03 | 2009-04-09 | E. I. Du Pont De Nemours And Company | Optimized strains of yarrowia lipolytica for high eicosapentaenoic acid production |
WO2009124225A1 (en) * | 2008-04-03 | 2009-10-08 | E. I. Du Pont De Nemours And Company | Multizymes |
EP2493569B1 (en) | 2009-10-30 | 2015-09-30 | ReCor Medical, Inc. | Apparatus for treatment of hypertension through percutaneous ultrasound renal denervation |
US9979908B2 (en) | 2014-03-31 | 2018-05-22 | Agency For Science, Technology And Research | Image processing devices and image processing methods with interpolation for improving image resolution |
-
2008
- 2008-04-15 US US12/102,879 patent/US7794701B2/en not_active Expired - Fee Related
- 2008-04-15 US US12/102,979 patent/US8119860B2/en active Active
- 2008-04-16 WO PCT/US2008/060396 patent/WO2008128241A1/en active Application Filing
- 2008-04-16 JP JP2010504199A patent/JP5501954B2/ja not_active Expired - Fee Related
- 2008-04-16 BR BRPI0807291-4A2A patent/BRPI0807291A2/pt not_active Application Discontinuation
- 2008-04-16 US US12/530,481 patent/US20100162435A1/en not_active Abandoned
- 2008-04-16 CA CA002679485A patent/CA2679485A1/en not_active Abandoned
- 2008-04-16 AU AU2008240029A patent/AU2008240029B2/en not_active Ceased
- 2008-04-16 WO PCT/US2008/060393 patent/WO2008128240A1/en active Application Filing
- 2008-04-16 CN CN2008800203954A patent/CN101848996B/zh not_active Expired - Fee Related
- 2008-04-16 AU AU2008240028A patent/AU2008240028B2/en active Active
- 2008-04-16 CA CA002682962A patent/CA2682962A1/en not_active Abandoned
- 2008-04-16 EP EP08745904.6A patent/EP2137304B1/en not_active Not-in-force
- 2008-04-16 DK DK08745904.6T patent/DK2137304T3/da active
- 2008-04-16 EP EP08745901.2A patent/EP2134837B1/en not_active Not-in-force
-
2010
- 2010-06-29 US US12/825,523 patent/US8298797B2/en active Active
-
2012
- 2012-01-11 US US13/347,938 patent/US8377673B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103080316A (zh) * | 2010-08-26 | 2013-05-01 | 纳幕尔杜邦公司 | 突变δ9延伸酶和它们在制备多不饱和脂肪酸中的用途 |
CN103080316B (zh) * | 2010-08-26 | 2016-08-31 | 纳幕尔杜邦公司 | 突变δ9延伸酶和它们在制备多不饱和脂肪酸中的用途 |
CN106916796A (zh) * | 2015-12-28 | 2017-07-04 | 丰益(上海)生物技术研发中心有限公司 | 裂殖壶菌delta-12脂肪酸脱饱和酶相关序列及其应用 |
Also Published As
Publication number | Publication date |
---|---|
AU2008240029A1 (en) | 2008-10-23 |
EP2137304B1 (en) | 2013-08-14 |
US8298797B2 (en) | 2012-10-30 |
US20100267098A1 (en) | 2010-10-21 |
WO2008128241A1 (en) | 2008-10-23 |
WO2008128240A1 (en) | 2008-10-23 |
AU2008240029B2 (en) | 2013-05-02 |
JP2010524468A (ja) | 2010-07-22 |
AU2008240028A1 (en) | 2008-10-23 |
CA2682962A1 (en) | 2008-10-23 |
US20100162435A1 (en) | 2010-06-24 |
DK2137304T3 (da) | 2013-11-11 |
EP2134837A1 (en) | 2009-12-23 |
CA2679485A1 (en) | 2008-10-23 |
EP2137304A1 (en) | 2009-12-30 |
US8119860B2 (en) | 2012-02-21 |
US20120100595A1 (en) | 2012-04-26 |
BRPI0807291A2 (pt) | 2014-04-29 |
CN101848996B (zh) | 2013-05-29 |
US8377673B2 (en) | 2013-02-19 |
US20080254522A1 (en) | 2008-10-16 |
AU2008240028B2 (en) | 2014-03-06 |
JP5501954B2 (ja) | 2014-05-28 |
US7794701B2 (en) | 2010-09-14 |
US20080254195A1 (en) | 2008-10-16 |
EP2134837B1 (en) | 2014-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101848996B (zh) | △9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
CA2683497C (en) | .delta.8 desaturases and their use in making polyunsaturated fatty acids | |
DK2140006T3 (en) | DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
DK2087106T3 (en) | MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
KR102700050B1 (ko) | 조작된 내수송/외수송을 가진 미생물 숙주에서 모유 올리고당류의 생산 | |
CN107002020B (zh) | 使用rna引导的内切核酸酶在非常规酵母中基因靶向 | |
CN101437953B (zh) | 用于改变含油生物的多不饱和脂肪酸和油含量的二酰基甘油酰基转移酶 | |
CN110402085A (zh) | 用于生物控制植物病原体的系统和方法 | |
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
CN101646766B (zh) | △17去饱和酶及其用于制备多不饱和脂肪酸的用途 | |
KR20130138760A (ko) | 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포 | |
DK2443248T3 (en) | IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES | |
KR20130045330A (ko) | 부탄올의 생성에서 추출 발효 전에 용해되지 않은 고형물을 제거하는 방법 및 시스템 | |
DK2931918T5 (en) | PROCEDURE FOR IDENTIFYING A CELL WITH INCREASED CONCENTRATION OF A PARTICULAR METABOLIT COMPARED TO THE SIMILAR WILD TYPE CELL ..... | |
CN101827938A (zh) | 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物 | |
CN101815432A (zh) | 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 | |
KR20130132405A (ko) | 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주 | |
CN112567031B (zh) | 新型crispr相关蛋白及其用途 | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
CN113584033B (zh) | 一种CRISPR/Cpf1基因编辑系统及其构建方法和在赤霉菌中的应用 | |
AU2022402777A1 (en) | C2c9 nuclease-based novel genome editing system and application thereof | |
CN101883843A (zh) | 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量 | |
DK2609201T3 (en) | Mutant DELTA-9 elongases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
DK2475679T3 (da) | Forbedrede, optimerede stammer af yarrowia lipolytica til fremstilling af højkoncentreret eicosapentaensyre |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130529 |
|
CF01 | Termination of patent right due to non-payment of annual fee |