CN109294730A - 在植物细胞中产生长链多不饱和脂肪酸 - Google Patents

在植物细胞中产生长链多不饱和脂肪酸 Download PDF

Info

Publication number
CN109294730A
CN109294730A CN201811036429.0A CN201811036429A CN109294730A CN 109294730 A CN109294730 A CN 109294730A CN 201811036429 A CN201811036429 A CN 201811036429A CN 109294730 A CN109294730 A CN 109294730A
Authority
CN
China
Prior art keywords
fatty acid
total
oil
acid
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811036429.0A
Other languages
English (en)
Other versions
CN109294730B (zh
Inventor
J·R·皮特里
S·P·辛格
R·C·德菲特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Newheed nutrition Australia Pty Ltd.
Commonwealth Scientific and Industrial Research Organization CSIRO
Grains Research and Development Corp
Original Assignee
Niu Xide Private LP
Commonwealth Scientific and Industrial Research Organization CSIRO
Grains Research and Development Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=49756497&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN109294730(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Niu Xide Private LP, Commonwealth Scientific and Industrial Research Organization CSIRO, Grains Research and Development Corp filed Critical Niu Xide Private LP
Publication of CN109294730A publication Critical patent/CN109294730A/zh
Application granted granted Critical
Publication of CN109294730B publication Critical patent/CN109294730B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11BPRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
    • C11B1/00Production of fats or fatty oils from raw materials
    • C11B1/10Production of fats or fatty oils from raw materials by extracting
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/10Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits
    • A01H1/101Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine or caffeine
    • A01H1/104Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine or caffeine involving modified lipid metabolism, e.g. seed oil composition
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/20Brassicaceae, e.g. canola, broccoli or rucola
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/21Esters, e.g. nitroglycerine, selenocyanates
    • A61K31/215Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids
    • A61K31/22Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids of acyclic acids, e.g. pravastatin
    • A61K31/23Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids of acyclic acids, e.g. pravastatin of acids having a carboxyl group bound to a chain of seven or more carbon atoms
    • A61K31/231Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids of acyclic acids, e.g. pravastatin of acids having a carboxyl group bound to a chain of seven or more carbon atoms having one or two double bonds
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K36/00Medicinal preparations of undetermined constitution containing material from algae, lichens, fungi or plants, or derivatives thereof, e.g. traditional herbal medicines
    • A61K36/18Magnoliophyta (angiosperms)
    • A61K36/185Magnoliopsida (dicotyledons)
    • A61K36/31Brassicaceae or Cruciferae (Mustard family), e.g. broccoli, cabbage or kohlrabi
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/04Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • A61P11/06Antiasthmatics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • A61P13/02Drugs for disorders of the urinary system of urine or of the urinary tract, e.g. urine acidifiers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • A61P13/12Drugs for disorders of the urinary system of the kidneys
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P15/00Drugs for genital or sexual disorders; Contraceptives
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/06Antipsoriatics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/08Antiseborrheics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/08Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
    • A61P19/10Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/18Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/24Antidepressants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/02Nutrients, e.g. vitamins, minerals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/04Anorexiants; Antiobesity agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/18Antivirals for RNA viruses for HIV
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/06Antiarrhythmics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/12Antihypertensives
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C57/00Unsaturated compounds having carboxyl groups bound to acyclic carbon atoms
    • C07C57/02Unsaturated compounds having carboxyl groups bound to acyclic carbon atoms with only carbon-to-carbon double bonds as unsaturation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C57/00Unsaturated compounds having carboxyl groups bound to acyclic carbon atoms
    • C07C57/02Unsaturated compounds having carboxyl groups bound to acyclic carbon atoms with only carbon-to-carbon double bonds as unsaturation
    • C07C57/03Monocarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C67/00Preparation of carboxylic acid esters
    • C07C67/02Preparation of carboxylic acid esters by interreacting ester groups, i.e. transesterification
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11BPRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
    • C11B1/00Production of fats or fatty oils from raw materials
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11CFATTY ACIDS FROM FATS, OILS OR WAXES; CANDLES; FATS, OILS OR FATTY ACIDS BY CHEMICAL MODIFICATION OF FATS, OILS, OR FATTY ACIDS OBTAINED THEREFROM
    • C11C1/00Preparation of fatty acids from fats, fatty oils, or waxes; Refining the fatty acids
    • C11C1/002Sources of fatty acids, e.g. natural glycerides, characterised by the nature, the quantities or the distribution of said acids
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11CFATTY ACIDS FROM FATS, OILS OR WAXES; CANDLES; FATS, OILS OR FATTY ACIDS BY CHEMICAL MODIFICATION OF FATS, OILS, OR FATTY ACIDS OBTAINED THEREFROM
    • C11C3/00Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11CFATTY ACIDS FROM FATS, OILS OR WAXES; CANDLES; FATS, OILS OR FATTY ACIDS BY CHEMICAL MODIFICATION OF FATS, OILS, OR FATTY ACIDS OBTAINED THEREFROM
    • C11C3/00Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom
    • C11C3/003Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom by esterification of fatty acids with alcohols
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11CFATTY ACIDS FROM FATS, OILS OR WAXES; CANDLES; FATS, OILS OR FATTY ACIDS BY CHEMICAL MODIFICATION OF FATS, OILS, OR FATTY ACIDS OBTAINED THEREFROM
    • C11C3/00Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom
    • C11C3/04Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom by esterification of fats or fatty oils
    • C11C3/06Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom by esterification of fats or fatty oils with glycerol
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01075Long-chain-alcohol O-fatty-acyltransferase (2.3.1.75)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/158Fatty acids; Fats; Products containing oils or fats
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/10Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
    • A23L33/115Fatty acids or derivatives thereof; Fats or oils
    • A23L33/12Fatty acids or derivatives thereof
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2236/00Isolation or extraction methods of medicinal preparations of undetermined constitution containing material from algae, lichens, fungi or plants, or derivatives thereof, e.g. traditional herbal medicine
    • A61K2236/30Extraction of the material
    • A61K2236/35Extraction with lipophilic solvents, e.g. Hexane or petrol ether
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/21Esters, e.g. nitroglycerine, selenocyanates
    • A61K31/215Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids
    • A61K31/22Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids of acyclic acids, e.g. pravastatin
    • A61K31/23Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids of acyclic acids, e.g. pravastatin of acids having a carboxyl group bound to a chain of seven or more carbon atoms
    • A61K31/232Esters, e.g. nitroglycerine, selenocyanates of carboxylic acids of acyclic acids, e.g. pravastatin of acids having a carboxyl group bound to a chain of seven or more carbon atoms having three or more double bonds, e.g. etretinate
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Botany (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Diabetes (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Nutrition Science (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Environmental Sciences (AREA)
  • Hematology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Cardiology (AREA)

Abstract

本发明涉及在重组植物细胞中合成长链多不饱和脂肪酸,尤其是二十二碳六烯酸的方法。

Description

在植物细胞中产生长链多不饱和脂肪酸
本申请是申请日为2013年06月14日,申请号为201380042832.3,题目为“在植物细胞中产生长链多不饱和脂肪酸”的专利申请的分案申请。
发明领域
本发明涉及在重组植物细胞中合成长链多不饱和脂肪酸,尤其是二十二碳六烯酸的方法。
发明背景
现在广泛认为ω3长链多不饱和脂肪酸(LC-PUFA)是关乎人类和动物健康的重要化合物。可从饮食来源或通过转化亚油酸(LA,18:2ω6)或α-亚麻酸(ALA,18:3ω3)脂肪酸来获得这些脂肪酸,这两种脂肪酸都被认为是人类饮食中的必需脂肪酸。尽管人类和许多其它脊椎动物能够将植物来源的LA或ALA转化成C22,但他们进行这种转化的速率很慢。此外,大多数现代社会的饮食不平衡,其中至少90%的多不饱和脂肪酸(PUFA)属于ω6脂肪酸,而不是理想的4:1或更低的ω6:ω3脂肪酸比例(Trautwein,2001)。对于人类来说,诸如二十碳五烯酸(EPA,20:5ω3)和二十二碳六烯酸(DHA,22:6ω3)等LC-PUFA的直接饮食来源主要是来自鱼类或鱼油。因此,健康专家推荐将含有高水平LC-PUFA的鱼类常规纳入人类饮食中。举例来说,来源于鱼类的LC-PUFA油正越不越多地被掺入食品和婴儿配方食品中。然而,由于全球和国家渔业的下滑,需要找到这些有益健康的油类的替代来源。
与动物相反,开花植物缺乏合成链长度大于18个碳的多不饱和脂肪酸的能力。确切地说,农作物和园艺植物以及其它被子植物不具有合成诸如EPA、二十二碳五烯酸(DPA,22:5ω3)和DHA等衍生自ALA的较长链ω3脂肪酸所需的酶。因此,植物生物技术中的一个重要目标是对能产生大量LC-PUFA的农作物植物进行工程改造,由此提供这些化合物的替代来源。
LC-PUFA生物合成途径
诸如微藻类、苔藓和真菌等生物体中的LC-PUFA的生物合成通常是一系列氧依赖性去饱和反应和延长反应(图1)。这些生物体中产生EPA的最常见途径包括Δ6去饱和、Δ6延长和Δ5去饱和(称为Δ6去饱和途径),而较不常见的途径则使用Δ9延长、Δ8去饱和与Δ5去饱和(称为Δ9去饱和途径)。这些连续的去饱和作用和延长反应可以如图1左上部分(ω6)示意性地显示从ω6脂肪酸底物LA开始,或如图1右下部分(ω3)所显示从ω3底物ALA开始,直到EPA。如果初始Δ6去饱和在ω6底物LA上进行,则该系列三种酶的LC-PUFA产物将是ω6脂肪酸ARA。合成LC-PUFA的生物体可以使用ω3-去饱和酶将ω6脂肪酸转化成ω3脂肪酸,如图1中所示的将花生四烯酸(ARA,20:4ω6)转化成EPA的Δ17-去饱和酶步骤。ω3-去饱和酶家族的一些成员可以作用于多种底物,从LA到ARA。植物ω3-去饱和酶通常特异性催化由LA到ALA的Δ15去饱和,而真菌和酵母ω3-去饱和酶则可对由ARA到EPA的Δ17去饱和具有特异性(Pereira等,2004a;Zank等,2005)。一些报告提出,可能存在可将多种ω6底物转化成其相应ω3产物的非特异性ω3-去饱和酶(Zhang等,2008)。
在这些生物体中,通过EPA的Δ5延长产生DPA,随后通过Δ4去饱和产生DHA而将EPA转化成DHA(图1)。相反,哺乳动物则使用所谓的“Sprecher”途径,通过与Δ4-去饱和酶无关的3个独立的反应将DPA转化成DHA(Sprecher等,1995)。
一般在植物、苔藓、微藻类和诸如秀丽隐杆线虫(Caenorhabditis elegans)等低等动物中发现的前端去饱和酶主要接受与磷脂酰胆碱(PC)底物的sn-2位置发生酯化的脂肪酸底物。这些去饱和酶因此称为酰基-PC脂质连接的前端去饱和酶(Domergue等,2003)。相反,高等动物前端去饱和酶一般接受酰基-CoA底物,其中所述脂肪酸底物连接于CoA而不是PC(Domergue等,2005)。已知一些微藻类去饱和酶和一种植物去饱和酶使用与CoA发生酯化的脂肪酸底物(表2)。
各PUFA延长反应由多组分蛋白复合物催化的4个步骤组成:首先,缩合反应给脂肪酸添加来自丙二酰基-CoA的2C单元,导致形成β-酮酰基中间物。然后通过NADPH将这种中间物还原,随后脱水产生烯酰基中间物。最后第二次还原这种中间物,产生延长的脂肪酸。一般认为这4个反应的缩合步骤具有底物特异性,而其它步骤则不然。实际上,这意味着只要引入PUFA特异性缩合酶(典型地称为‘延长酶’),天然植物延长机制就能够延长PUFA,但天然植物延长机制在延长非天然PUFA底物方面的效率可能较低。2007年公开了对酵母伸长循环脱水酶的鉴定并且表征(Denic和Weissman,2007)。
在植物、苔藓和微藻类中,PUFA去饱和天然地发生在主要属于酰基-PC库的脂肪酸底物,而延长则发生在酰基-CoA库中的底物。脂肪酸从酰基-PC分子转移至CoA载体是通过磷脂酶(PLA)进行,而酰基-CoA脂肪酸转移至PC载体是通过溶血磷脂胆碱酰基转移酶(LPCAT)进行(图21)(Singh等,2005)。
工程改造产生LC-PUFA
大多数LC-PUFA代谢工程一直是使用需氧Δ6去饱和/延长途径来进行。1996年首次报告了使用得自蓝细菌集胞藻的Δ6-去饱和酶在烟草中生物合成γ-亚麻酸(GLA,18:3ω6)(Reddy和Thomas,1996)。最近,已经在诸如红花(种子油中含73%GLA;Knauf等,2006)和大豆(28%GLA;Sato等,2004)等农作物植物中产生了GLA。诸如EPA和DHA等LC-PUFA的产生由于涉及更多的去饱和与延长步骤数目而涉及更复杂的工程改造。Qi等(2004)首先报告了在陆生植物中产生EPA,其将编码来自于球等鞭金藻(Isochrysis galbana)的Δ9-延长酶、来自于小眼虫(Euglena gracilis)的Δ8-去饱和酶和来自于高山被孢霉(Mortierellaalpina)的Δ5-去饱和酶的基因引入拟南芥中,产生多达3%的EPA。在这之后,Abbadi等(2004)报告了使用编码来自于小立碗藓(Physcomitrella patens)的Δ6-去饱和酶和Δ6-延长酶的基因和编码来自于三角褐指藻(Phaeodactylum tricornutum)的Δ5-去饱和酶的基因在亚麻种子中产生了多达0.8%的EPA。
WO 04/017467中首先报告了DHA产生,并且是迄今为止最高的VLC-PUFA产生水平,其中描述了通过引入编码异丝水霉(Saprolegnia diclina)Δ6-去饱和酶、高山被孢霉Δ6-去饱和酶、高山被孢霉Δ5-去饱和酶、异丝水霉Δ4-去饱和酶、异丝水霉Δ17-去饱和酶、高山被孢霉Δ6-延长酶和路氏巴夫藻(Pavlova lutheri)Δ5-延长酶的基因,在大豆胚而非种子中产生了3%的DHA。在也产生DHA的胚中,最高EPA水平是19.6%,表明EPA到DHA的转化效率低下(WO 2004/071467)。这一发现与Robert等(2005)发表的类似,后者的从EPA到DHA的流量低下,其使用斑马鱼Δ5/6-去饱和酶、秀丽隐杆线虫Δ6-延长酶和盐生巴夫藻(Pavlova salina)Δ5-延长酶和Δ4-去饱和酶在拟南芥中产生了3%EPA和0.5%DHA。同样在2005年,Wu等发表了使用畸雌腐霉(Pythium irregulare)Δ6-去饱和酶、破囊壶菌(Thraustochytrid)Δ5-去饱和酶、小立碗藓Δ6-延长酶、金盏花(Calendulaofficianalis)Δ12-去饱和酶、破囊壶菌Δ5-延长酶、致病疫霉(Phytophthorainfestans)Δ17-去饱和酶、虹鳟鱼(Oncorhyncus mykiss)LC-PUFA延长酶、破囊壶菌Δ4-去饱和酶和破囊壶菌LPCAT在芥菜中产生了25%ARA、15%EPA和1.5%DHA(Wu等,2005)。Venegas-Caleron等(2010)和Ruiz-Lopez等(2012)中提供了对产生能合成ω3 LC-PUFA的油料种子农作物的成果汇总。如Ruiz-Lopez等(2012)所指示,迄今为止针对在转基因植物中产生DHA所获得的结果远远不及鱼油中所见的水平。
因此,仍需要在重组细胞中更有效地产生LC-PUFA,确切地说,在油料种子植物的种子中更有效地产生DHA。
发明概述
本发明的诸位发明人已经鉴别了用于产生具有高DHA水平的脂质的方法和植物。
在第一方面,本发明提供了提取的植物脂质,其包含呈酯化形式的脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包括亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),且任选地包括十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中所提取的脂质的总脂肪酸含量中的DHA水平为约7%至20%。
在一个实施方案中,所提取的脂质具有一个或多个或所有以下特征:
i)所提取的脂质的总脂肪酸含量中的棕榈酸水平在约2%与18%之间、在约2%与16%之间,或在约2%与15%之间;
ii)所提取的脂质的总脂肪酸含量中的肉豆蔻酸(C14:0)水平小于约6%、小于约3%、小于约2%,或小于约1%;
iii)所提取的脂质的总脂肪酸含量中的油酸水平在约1%与约30%之间、在约3%与约30%之间、在约6%与约30%之间、在1%与约20%之间、在约30%与约60%之间、在约45%至约60%之间,或为约30%;
iv)所提取的脂质的总脂肪酸含量中的亚油酸(LA)水平在约4%与约35%之间、在约4%与约20%之间,或在约4%与17%之间;
v)所提取的脂质的总脂肪酸含量中的α-亚麻酸(ALA)水平在约4%与约40%之间、在约7%与约40%之间、在约10%与约35%之间、在约20%与约35%之间、在约4%与约16%之间,或在约2%与约16%之间;
vi)所提取的脂质的总脂肪酸含量中的γ-亚麻酸(GLA)水平小于约4%、小于约3%、小于约2%、小于约1%、小于约0.5%、在0.05%与约7%之间、在0.05%与约4%之间、在0.05%与约3%之间或在0.05%与约2%之间;
vii)所提取的脂质的总脂肪酸含量中的十八碳四烯酸(SDA)水平小于约7%、小于约6%、小于约4%、小于约3%、在约0.05%与约7%之间、在约0.05%与约6%之间、在约0.05%与约4%之间、在约0.05%与约3%之间或在0.05%与约2%之间;
viii)所提取的脂质的总脂肪酸含量中的二十碳四烯酸(ETA)水平小于约6%、小于约5%、小于约4%、小于约1%、小于约0.5%、在约0.05%与约6%之间、在约0.05%与约5%之间、在约0.05%与约4%之间、在约0.05%与约3%之间,或在约0.05%与约2%之间;
ix)所提取的脂质的总脂肪酸含量中的二十碳三烯酸(ETrA)水平小于约4%、小于约2%、小于约1%、在约0.05%与约4%之间、在约0.05%与约3%之间、在约0.05%与约2%之间,或在约0.05%与约1%之间;
x)所提取的脂质的总脂肪酸含量中的二十碳五烯酸(EPA)水平小于约4%、小于约3%、小于约2%、在约0.05%与约10%之间、在约0.05%与约5%之间、在约0.05%与约3%之间,或在约0.05%与约2%之间;
xi)所提取的脂质的总脂肪酸含量中的二十二碳五烯酸(DPA)水平小于约4%、小于约3%、小于约2%、在约0.05%与约8%之间、在约0.05%与约5%之间、在约0.05%与约3%之间,或在约0.05%与约2%之间;
xii)所提取的脂质的总脂肪酸含量中的DHA水平为约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、在约8%与20%之间、在约10%与20%之间、在约11%与20%之间、在约10%与约16%之间,或在约14%与20%之间;
xiii)所述脂质在其脂肪酸含量中包含ω6-二十二碳五烯酸(22:5Δ4,7,10,13,16);
xiv)所述脂质在其脂肪酸含量中基本上不含ω6-二十二碳五烯酸(22:5Δ4,7,10,13,16);
xv)所述脂质在其脂肪酸含量中基本上不含SDA、EPA和ETA;
xvi)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约25%之间、在约4%与约20%之间、在约6%与约20%之间、在约4%与约60%之间、在约30%与约60%之间,或在约45%与约60%之间;
xvii)所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约4%与约35%之间、在约8%与约25%之间或在8%与约22%之间;
xviii)所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约20%与约75%之间、在约50%与约75%之间,或在约60%与约75%之间;
xix)所提取的脂质的总脂肪酸含量中的总ω6脂肪酸水平在约35%与约50%之间、在约20%与约35%之间、在约6%与20%之间、小于约20%、小于约16%、小于约10%、在约1%与约16%之间、在约2%与约10%之间,或在约4%与约10%之间;
xx)所提取的脂质的总脂肪酸含量中的新ω6脂肪酸水平小于约10%、小于约8%、小于约6%、小于4%、在约1%与约20%之间、在约1%与约10%之间、在约0.5%与约8%之间,或在约0.5%与4%之间;
xxi)所提取的脂质的总脂肪酸含量中的总ω3脂肪酸水平在36%与约65%之间、在约40%与约60%之间、在约20%与约35%之间、在约10%与约20%之间、为约25%、约30%、约35%或约40%;
xxii)所提取的脂质的总脂肪酸含量中的新ω3脂肪酸水平在约9%与约33%之间、在约10%与约20%之间、在约20%与约30%之间、在约12%与约25%之间、为约13%、约15%、约17%或约20%;
xxiii)所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在约1.0与约3.0之间、在约0.1与约1之间、在约0.1与约0.5之间、小于约0.50、小于约0.40、小于约0.30、小于约0.20、小于约0.15、为约1.0、约0.1或约0.2;
xxiv)所提取的脂质的脂肪酸含量中的新ω6脂肪酸:新ω3脂肪酸的比率在约1.0与约3.0之间、在约0.1与约1之间、在约0.1与约0.5之间、小于约0.50、小于约0.40、小于约0.30、小于约0.20、小于约0.15、为约0.1、约0.2或约1.0;
xxv)所述脂质的脂肪酸组成是基于通过Δ12-去饱和酶油酸到LA的转化效率为至少约60%、至少约70%、至少约80%、在约60%与约98%之间、在约70%与约95%之间,或在约75%与约90%之间;
xxvi)所述脂质的脂肪酸组成是基于通过Δ6-去饱和酶ALA到SDA的转化效率为至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、在约30%与约70%之间、在约35%与约60%之间,或在约50%与约70%之间;
xxvii)所述脂质的脂肪酸组成是基于通过Δ6-延长酶SDA到ETA酸的转化效率为至少约60%、至少约70%、至少约75%、在约60%与约95%之间、在约70%与约88%之间,或在约75%与约85%之间;
xxviii)所述脂质的脂肪酸组成是基于通过Δ5-去饱和酶ETA到EPA的转化效率为至少约60%、至少约70%、至少约75%、在约60%与约99%之间、在约70%与约99%之间,或在约75%与约98%之间;
xxix)所述脂质的脂肪酸组成是基于通过Δ5-延长酶EPA到DPA的转化效率为至少约80%、至少约85%、至少约90%、在约50%与约95%之间,或在约85%与约95%之间;
xxx)所述脂质的脂肪酸组成是基于通过Δ4-去饱和酶DPA到DHA的转化效率为至少约80%、至少约90%、至少约93%、在约50%与约95%之间、在约80%与约95%之间,或在约85%与约95%之间;
xxxi)所述脂质的脂肪酸组成是基于油酸到DHA的转化效率为至少约10%、至少约15%、至少约20%、在约10%与约50%之间、在约10%与约30%之间,或在约10%与约25%之间;
xxxii)所述脂质的脂肪酸组成是基于LA到DHA的转化效率为至少约15%、至少约20%、至少约22%、至少约25%、在约15%与约50%之间、在约20%与约40%之间,或在约20%与约30%之间;
xxxiii)所述脂质的脂肪酸组成是基于ALA到DHA的转化效率为至少约17%、至少约22%、至少约24%、在约17%与约55%之间、在约22%与约35%之间,或在约24%与约35%之间;
xxxiv)所提取的脂质中的总脂肪酸具有小于1%的C20:1;
xxxv)所述脂质的三酰基甘油(TAG)含量为至少约70%、至少约80%、至少约90%、至少95%、在约70%与约99%之间,或在约90%与约99%之间;
xxxvi)所述脂质包含二酰基甘油(DAG);
xxxvii)所述脂质包含小于约10%、小于约5%、小于约1%,或在约0.001%与约5%之间的游离(未酯化)脂肪酸和/或磷脂,或基本上不含游离脂肪酸和/或磷脂;
xxxviii)至少70%或至少80%呈TAG形式的酯化DHA是在TAG的sn-1或sn-3位置上;
xxxix)所述脂质中最丰富的含DHA的TAG种类是DHA/18:3/18:3(TAG 58:12);和
xl)所述脂质包含tri-DHA TAG(TAG 66:18)。
在另一个实施方案中,所提取的脂质呈油形式,其中以重量计至少约90%或至少约95%、至少约98%或在约95%与约98%之间的油是所述脂质。
在一个优选的实施方案中,所述脂质或油,优选为种子油,具有以下特征:在所述脂质或油的总脂肪酸含量中,DHA水平在约7%与20%之间;棕榈酸水平在约2%与约16%之间;肉豆蔻酸水平小于约6%;油酸水平在约1%与约30%之间;LA水平在约4%与约35%之间;ALA存在;GLA存在;SDA水平在约0.05%与约7%之间;ETA水平小于约4%;EPA水平在约0.05%与约10%之间;DPA水平在约0.05%与约8%之间;所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约25%之间;所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约4%与约35%之间;所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约20%与约75%之间;所提取的脂质的脂肪酸含量中的总ω6脂肪酸:总ω3脂肪酸的比率在约0.05与约3.0之间;所提取的脂质的脂肪酸含量中的新ω6脂肪酸:新ω3脂肪酸的比率在约0.03与约3.0之间,优选地小于约0.50;所述脂质的脂肪酸组成是基于:通过Δ12-去饱和酶油酸到LA的转化效率为至少约60%;通过Δ6-延长酶SDA到ETA酸的转化效率为至少约60%;通过Δ5-延长酶EPA到DPA的转化效率在约50%与约95%之间;通过Δ4-去饱和酶DPA到DHA的转化效率在约50%与约95%之间;油酸到DHA的转化效率为至少约10%;且所述脂质的三酰基甘油(TAG)含量为至少约70%;且任选地所述脂质基本上不含胆甾醇和/或所述脂质包含tri-DHA TAG(TAG 66:18)。
在一个更优选的实施方案中,所述脂质或油,优选为种子油,具有以下特征:在所述脂质的总脂肪酸含量中,DHA水平在约7%与20%之间;棕榈酸水平在约2%与约16%之间;肉豆蔻酸水平小于约2%;油酸水平在约1%与约30%之间;LA水平在约4%与约35%之间;ALA水平在约7%与约40%之间;GLA水平小于约4%;SDA水平在约0.05%与约7%之间;ETA水平小于约4%;ETrA水平在约0.05%与约4%之间;EPA水平在约0.05%与约10%之间;DPA水平在约0.05%与约8%之间;所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约25%之间;所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约4%与约35%之间;所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约20%与约75%之间;所提取的脂质的总脂肪酸含量中的新ω6脂肪酸水平在约0.5%与约10%之间;所提取的脂质的总脂肪酸含量中的总ω3脂肪酸水平在36%与约75%之间;所提取的脂质的总脂肪酸含量中的新ω3脂肪酸水平在约9%与约33%之间;所提取的脂质的脂肪酸含量中的总ω6脂肪酸:总ω3脂肪酸的比率在约0.05与约3.0之间;所提取的脂质的脂肪酸含量中的新ω6脂肪酸:新ω3脂肪酸的比率在约0.03与约3.0之间;所述脂质的脂肪酸组成是基于:通过Δ12-去饱和酶油酸到LA的转化效率为至少约60%;通过Δ6-延长酶SDA到ETA酸的转化效率为至少约60%;通过Δ5-去饱和酶ETA到EPA的转化效率为至少约60%;通过Δ5-延长酶EPA到DPA的转化效率在约50%与约95%之间;通过Δ4-去饱和酶DPA到DHA的转化效率在约50%与约95%之间;油酸到DHA的转化效率为至少约10%;LA到DHA的转化效率为至少约15%;ALA到DHA的转化效率为至少约17%;且所提取的脂质中的总脂肪酸含量具有小于1%的C20:1;所述脂质的三酰基甘油(TAG)含量为至少约70%;所述脂质基本上不含胆甾醇且所述脂质包含tri-DHA TAG(TAG 66:18)。优选地,所述脂质或油是芥花油和/或在其从植物或植物部分中提取之后未用酯基转移方法进行处理。在一个特定实施方案中,可以随后处理所述脂质或芥花油以便将所述油中的脂肪酸转化成烷基酯,诸如甲基或乙基酯。可以应用进一步处理以使所述脂质或油富含DHA。
在一个实施方案中,所述脂质或油,优选为种子油,具有以下特征:在所述脂质的总脂肪酸含量中,DHA水平在约7%与20%之间;棕榈酸水平在约2%与约16%之间;肉豆蔻酸水平小于约2%;油酸水平在约30%与约60%之间,优选地在约45%与约60%之间;LA水平在约4%与约20%之间;ALA水平在约2%与约16%之间;GLA水平小于约3%;SDA水平小于约3%;ETA水平小于约4%;ETrA水平小于约2%;EPA水平小于约4%;DPA水平小于约4%;所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约25%之间;所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约30%与约60%之间,或在约40%与约60%之间;所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约20%与约75%之间;所提取的脂质的总脂肪酸含量中的新ω6脂肪酸水平在约0.5%与约10%之间;所提取的脂质的总脂肪酸含量中的总ω3脂肪酸水平在约10%与约20%之间;所提取的脂质的总脂肪酸含量中的新ω3脂肪酸水平在约9%与约20%之间;所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在约0.05与约3.0之间,优选地小于约0.50;所提取的脂质的脂肪酸含量中新ω6脂肪酸:新ω3脂肪酸的比率在约0.03与约3.0之间;所述脂质的三酰基甘油(TAG)含量为至少约70%;所述脂质基本上不含胆甾醇;且所述脂质包含tri-DHA TAG(TAG66:18)。优选地,所述脂质或油基本上不含SDA、EPA和ETA和/或在其从植物或植物部分中提取之后未用酯基转移方法进行处理。在一个特定实施方案中,可以随后处理所述脂质或芥花油以便将所述油中的脂肪酸转化成烷基酯,诸如甲基或乙基酯。可以应用进一步处理以使所述脂质或油富含DHA。
在另一个优选的实施方案中,所述脂质或油,优选为种子油,具有以下特征:在所述脂质或油的总脂肪酸含量中,DHA水平在约7%与20%之间;棕榈酸水平在约2%与约16%之间;肉豆蔻酸水平小于约6%;油酸水平在约1%与约30%之间;LA水平在约4%与约35%之间;ALA存在;GLA存在;SDA水平在约0.05%与约7%之间;ETA水平小于约6%;EPA水平在约0.05%与约10%之间;DPA水平在约0.05%与约8%之间。
在另一个实施方案中,所提取的脂质还包含一种或多种甾醇,优选地为植物甾醇。
在另一个实施方案中,所提取的脂质呈油形式且包含小于约10mg甾醇/g油、小于约7mg甾醇/g油、在约1.5mg与约10mg之间的甾醇/g油或在约1.5mg与约7mg之间的甾醇/g油。
可在所提取的脂质中的甾醇的实例包括但未必限于菜油甾醇/24-甲基胆甾醇、Δ5-豆甾醇、齿孔醇、β-谷甾醇/24-乙基胆甾醇、Δ5-燕麦甾醇/异岩藻甾醇、Δ7-豆甾醇/豆甾-7-烯-3β-醇和Δ7-燕麦甾醇中的一种或多种或全部。
在一个实施方案中,所述植物种类是表26中所列出的植物种类,诸如芥花,且甾醇水平与表26中针对该特定植物种类所列出的大约相同。
在一个实施方案中,所提取的脂质包含小于约0.5mg胆甾醇/g油、小于约0.25mg胆甾醇/g油、在约0mg与约0.5mg之间的胆甾醇/g油,或在约0mg与约0.25mg之间的胆甾醇/g油,或其基本上不含胆甾醇。
在另一个实施方案中,所述脂质是油,优选为得自于油料种子的油。所述油类的实例包括但不限于诸如芥花油等芸苔属植物油、陆地棉油、亚麻油、向日葵属植物油、红花油、毛豆油、玉米油、拟南芥油、二色高粱油、甜高粱油、燕麦油、车轴草属植物油、油棕油、本氏烟油、大麦油、狭叶羽扇豆油、水稻油、光稃稻油、亚麻荠油、深海两节荠油、巨银草油或中国芒油。
还提供了提取的植物脂质,优选为提取的芥花籽油,其包含呈酯化形式的脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包含亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),且任选地包括十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中所述脂质在脂质的总脂肪酸含量方面具有以下特征:
i)DHA水平为约3%、约4%、约5%、约6%或约7%;
ii)棕榈酸水平在约2%与约16%之间;
iii)肉豆蔻酸水平小于约2%;
iv)油酸水平在约30%与约60%之间,优选地在约45%与约60%之间;
v)LA水平在约4%与约20%之间;
vi)ALA水平在约2%与约16%之间;
vii)GLA水平小于约4%;
viii)SDA水平小于约6%或小于约4%;
ix)ETA水平小于约6%或小于约4%;
x)ETrA水平小于约1%;
xi)EPA水平小于约10%和/或EPA水平是DHA水平的0.5-2.0倍;
xii)DPA水平小于约4%;
xiii)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约25%之间;
xiv)所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约30%与约70%之间;
xv)所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约15%与约75%之间,优选地在约15%与约30%之间;
xvi)所提取的脂质的总脂肪酸含量中的新ω6脂肪酸水平在约0.5%与约10%之间;
xvii)所提取的脂质的总脂肪酸含量中的总ω3脂肪酸水平在约10%与约20%之间;
xviii)所提取的脂质的总脂肪酸含量中的新ω3脂肪酸水平在约3%与约20%之间;
xix)所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在约0.05与约3.0之间,优选小于约0.50;
xx)所提取的脂质的脂肪酸含量中新ω6脂肪酸:新ω3脂肪酸的比率在约0.03与约3.0之间;
xxi)所述脂质的三酰基甘油(TAG)含量为至少约70%,且
xxii)所述脂质基本上不含胆甾醇。在一个实施方案中,所述脂质包含tri-DHATAG(TAG 66:18)。更优选地,所述脂质基本上不含SDA和ETA,和/或在其从植物或植物部分中提取之后未用酯基转移方法进行处理。
在另一个方面,提供了一种提取的植物脂质,其包含呈酯化形式的脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包含亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),和十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中(i)所提取的脂质的总脂肪酸含量中的DHA水平在7%与20%之间;(ii)所提取的脂质的总脂肪酸含量中的棕榈酸水平在2%与16%之间;(iii)所提取的脂质的总脂肪酸含量中的肉豆蔻酸(C14:0)水平小于约6%;(iv)所提取的脂质的总脂肪酸含量中的油酸水平在1%与30%之间或在30%与60%之间;(v)所提取的脂质的总脂肪酸含量中的亚油酸(LA)水平在4%与35%之间;(vi)所提取的脂质的总脂肪酸含量中的α-亚麻酸(ALA)水平在4%与40%之间;(vii)所提取的脂质的总脂肪酸含量中的二十碳三烯酸(ETrA)水平小于约4%;(viii)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在4%与25%之间;(ix)所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在1.0与3.0之间或在0.1与1之间;(x)所述脂质的三酰基甘油(TAG)含量为至少70%;且(xi)至少70%呈TAG形式的酯化DHA是在TAG的sn-1或sn-3位置上。在一个实施方案中,一个或多个或所有以下特征:
i)所提取的脂质的总脂肪酸含量中的棕榈酸水平在2%与15%之间;
ii)所提取的脂质的总脂肪酸含量中的肉豆蔻酸(C14:0)水平小于1%;
iii)所提取的脂质的总脂肪酸含量中的油酸水平在约3%与约30%之间、在约6%与约30%之间、在1%与约20%之间、在约45%与约60%之间或为约30%;
iv)所提取的脂质的总脂肪酸含量中的亚油酸(LA)水平在约4%与约20%之间,或在约4%与17%之间;
v)所提取的脂质的总脂肪酸含量中的α-亚麻酸(ALA)水平在约7%与约40%之间、在约10%与约35%之间、在约20%与约35%之间或在约4%与16%之间;
vi)所提取的脂质的总脂肪酸含量中的γ-亚麻酸(GLA)水平小于4%、小于约3%、小于约2%、小于约1%、小于约0.5%、在0.05%与7%之间、在0.05%与4%之间或在0.05%与约3%之间或在0.05%与约2%之间;
vii)所提取的脂质的总脂肪酸含量中的十八碳四烯酸(SDA)水平小于约4%、小于约3%、在约0.05%与约7%之间、在约0.05%与约4%之间、在约0.05%与约3%之间,或在0.05%与约2%之间;
viii)所提取的脂质的总脂肪酸含量中的二十碳四烯酸(ETA)水平小于约4%、小于约1%、小于约0.5%、在约0.05%与约5%之间、在约0.05%与约4%之间、在约0.05%与约3%之间,或在约0.05%与约2%之间;
ix)所提取的脂质的总脂肪酸含量中的二十碳三烯酸(ETrA)水平小于约2%、小于约1%、在0.05%与4%之间、在0.05%与3%之间,或在0.05%与约2%之间,或在0.05%与约1%之间;
x)所提取的脂质的总脂肪酸含量中的二十碳五烯酸(EPA)水平小于4%、小于约3%、小于约2%、在0.05%与10%之间、在0.05%与5%之间,或在0.05%与约3%之间,或在0.05%与约2%之间;
xi)所提取的脂质的总脂肪酸含量中的二十二碳五烯酸(DPA)水平小于4%、小于约3%、小于约2%、在0.05%与8%之间、在0.05%与5%之间,或在0.05%与约3%之间,或在0.05%与约2%之间;
xii)所提取的脂质的总脂肪酸含量中的DHA水平为约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、在约8%与20%之间、在约10%与20%之间、在约11%与20%之间、在约10%与约16%之间,或在约14%与20%之间;
xiii)所述脂质在其脂肪酸含量中包含ω6-二十二碳五烯酸(22:5Δ4,7,10,13,16);
xiv)所述脂质在其脂肪酸含量中基本上不含ω6-二十二碳五烯酸(22:5Δ4,7,10,13,16);
xv)所述脂质在其脂肪酸含量中基本上不含SDA、EPA和ETA;
xvi)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约20%之间,或在约6%与约20%之间;
xvii)所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约4%与约35%之间、在约8%与约25%之间,或在8%与约22%之间;
xviii)所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约20%与约75%之间、在约50%与约75%之间,或在约60%与约75%之间;
xix)所提取的脂质的总脂肪酸含量中的总ω6脂肪酸水平在约35%与约50%之间、在约20%与约35%之间、在约6%与20%之间、小于20%、小于约16%、小于约10%、在约1%与约16%之间、在约2%与约10%之间,或在约4%与约10%之间;
xx)所提取的脂质的总脂肪酸含量中的新ω6脂肪酸水平小于约10%、小于约8%、小于约6%、小于4%、在约1%与约20%之间、在约1%与约10%之间、在约0.5%与约8%之间,或在约0.5%与4%之间;
xxi)所提取的脂质的总脂肪酸含量中的总ω3脂肪酸水平在36%与约65%之间、在40%与约60%之间、在约20%与约35%之间、在约10%与约20%之间、为约25%、约30%、约35%或约40%;
xxii)所提取的脂质的总脂肪酸含量中的新ω3脂肪酸水平在9%与约33%之间、在约10%与约20%之间、在约20%与约30%之间、在约12%与约25%之间、为约13%、约15%、约17%或约20%;
xxiii)所提取的脂质的脂肪酸含量中的总ω6脂肪酸:总ω3脂肪酸的比率在约0.1与约0.5之间、小于约0.50、小于约0.40、小于约0.30、小于约0.20、小于约0.15、为约1.0、约0.1或约0.2;
xxiv)所提取的脂质的脂肪酸含量中新ω6脂肪酸:新ω3脂肪酸的比率在约1.0与约3.0之间、在约0.1与约1之间、在约0.1与约0.5之间、小于约0.50、小于约0.40、小于约0.30、小于约0.20、小于约0.15、为约0.1、约0.2或约1.0;
xxv)所述脂质的脂肪酸组成是基于油酸到DHA的转化效率为至少约10%、至少约15%、至少约20%、在约10%与约50%之间、在约10%与约30%之间,或在约10%与约25%之间;
xxvi)所述脂质的脂肪酸组成是基于LA到DHA的转化效率为至少约15%、至少约20%、至少约22%、至少约25%、在约15%与约50%之间、在约20%与约40%之间,或在约20%与约30%之间;
xxvii)所述脂质的脂肪酸组成是基于ALA到DHA的转化效率为至少约17%、至少约22%、至少约24%、在约17%与约55%之间、在约22%与约35%之间,或在约24%与约35%之间;
xxviii)所提取的脂质中的总脂肪酸具有小于1%的C20:1;
xxix)所述脂质的三酰基甘油(TAG)含量为至少约80%、至少约90%、至少95%、在约70%与约99%之间,或在约90%与约99%之间;
xxx)所述脂质包含二酰基甘油(DAG);
xxxi)所述脂质包含小于约10%、小于约5%、小于约1%,或在约0.001%与约5%之间的游离(未酯化)脂肪酸和/或磷脂,或基本上不含游离脂肪酸和/或磷脂;
xxxii)至少80%呈TAG形式的酯化DHA是在TAG的sn-1或sn-3位置上;
xxxiii)所述脂质中最丰富的含DHA的TAG种类是DHA/18:3/18:3(TAG 58:12);和
xxxiv)所述脂质包含tri-DHA TAG(TAG 66:18)。
关于以上方面,在一个实施方案中,
i)所述脂质呈油形式,其中所述油包含一种或多种甾醇,诸如菜油甾醇、Δ5-豆甾醇、齿孔醇、β-谷甾醇、Δ5-燕麦甾醇、Δ7-豆甾醇和Δ7-燕麦甾醇中的一种或多种或全部,且任选地,所述油包含小于10mg甾醇/g油和/或所述油基本上不含胆甾醇;和/或
ii)所述脂质呈得自于油料种子的油形式,诸如油料种子是芸苔属植物油料种子或芥花种子。
在另一个方面,本发明提供了一种用于产生提取的植物脂质的方法,其包含以下步骤:
i)获得包含脂质的植物部分,所述脂质包含呈酯化形式的脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包括亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),且任选地包括二十碳五烯酸(EPA)、十八碳四烯酸(SDA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中所述植物部分中的可提取脂质的总脂肪酸含量中的DHA水平为约7%至20%;和
ii)从所述植物部分提取脂质,
其中所提取的脂质的总脂肪酸含量中的DHA水平为约7%至20%。
在一个优选的实施方案中,所提取的脂质具有以上定义的特征中的一个或多个。
在一个实施方案中,其中所述植物部分是种子,优选为油料种子。
所述种子的实例包括但不限于芸苔属种子、陆地棉种子、亚麻种子、向日葵属种子、红花种子、毛豆种子、玉米种子、拟南芥种子、二色高粱种子、甜高粱种子、燕麦种子、车轴草属种子、油棕种子、本氏烟种子、大麦种子、狭叶羽扇豆种子、水稻种子、光稃稻种子、亚麻荠种子或深海两节荠种子,优选为油菜种子、芥菜种子或亚麻荠种子。
在另一个实施方案中,所述种子包含至少约18mg、至少约22mg、至少约26mg、在约18mg与约100mg之间、在约22mg与约70mg之间,或在约24mg与约50mg之间的DHA/g种子。
在另一个实施方案中,所述植物部分包含编码以下酶集合之一的外源多核苷酸:
i)ω3-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
ii)Δ15-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
iii)Δ12-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
iv)Δ12-去饱和酶、ω3-去饱和酶或Δ15-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
v)ω3-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;
vi)Δ15-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;
vii)Δ12-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;或
viii)Δ12-去饱和酶、ω3-去饱和酶或Δ15-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;
且其中各多核苷酸可操作地连接于一个或多个能够指导所述多核苷酸在所述植物部分的细胞中表达的启动子。
在另一个实施方案中,所述植物部分具有一个或多个或所有以下特征:
i)所述Δ12-去饱和酶在所述植物的一个或多个细胞中将油酸转化成亚油酸,其效率为至少约60%、至少约70%、至少约80%、在约60%与约98%之间、在约70%与约95%之间,或在约75%与约90%之间;
ii)所述ω3-去饱和酶在所述植物的一个或多个细胞中将ω6脂肪酸转化成ω3脂肪酸,其效率为至少约65%、至少约75%、至少约85%、在约65%与约95%之间、在约75%与约95%之间,或在约80%与约95%之间;
iii)所述Δ6-去饱和酶在所述植物的一个或多个细胞中将ALA转化成SDA,其效率为至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、在约30%与约70%之间、在约35%与约60%之间,或在约50%与约70%之间;
iv)所述Δ6-去饱和酶在所述植物的一个或多个细胞中将亚油酸转化成γ-亚麻酸,其效率小于约5%、小于约2.5%、小于约1%、在约0.1%与约5%之间、在约0.5%与约2.5%之间,或在约0.5%与约1%之间;
v)所述Δ6-延长酶在所述植物的一个或多个细胞中将SDA转化成ETA,其效率为至少约60%、至少约70%、至少约75%、在约60%与约95%之间、在约70%与约88%之间,或在约75%与约85%之间;
vi)所述Δ5-去饱和酶在所述植物的一个或多个细胞中将ETA转化成EPA,其效率为至少约60%、至少约70%、至少约75%、至少约80%、至少约90%、在约60%与约99%之间、在约70%与约99%之间,或在约75%与约98%之间;
vii)所述Δ5-延长酶在所述植物的一个或多个细胞中将EPA转化成DPA,其效率为至少约80%、至少约85%、至少约90%、在约50%与约95%之间,或在约85%与约95%之间;
viii)所述Δ4-去饱和酶在所述植物的一个或多个细胞中将DPA转化成DHA,其效率为至少约80%、至少约90%、至少约93%、在约50%与约95%之间、在约80%与约95%之间,或在约85%与约95%之间;
ix)在所述植物部分的一个或多个细胞中,油酸到DHA的转化效率为至少约10%、至少约15%、至少约20%、在约10%与约50%之间、在约10%与约30%之间,或在约10%与约25%之间;
x)在所述植物部分的一个或多个细胞中,LA到DHA的转化效率为至少约15%、至少约20%、至少约22%、至少约25%、在约15%与约50%之间、在约20%与约40%之间,或在约20%与约30%之间;
xi)在所述植物部分的一个或多个细胞中,ALA到DHA的转化效率为至少约17%、至少约22%、至少约24%、在约17%与约55%之间、在约22%与约35%之间,或在约24%与约35%之间;
xii)所述植物部分的一个或多个细胞所包含的ω3脂肪酸比缺乏外源多核苷酸的相应细胞多出至少约15%、至少约20%、在约15%与约30%之间,或在约22.5%与约27.5%之间;
xiii)相对于亚油酸(LA),所述Δ6-去饱和酶优先对α-亚麻酸(ALA)进行去饱和化;
xiv)所述Δ6-延长酶还具有Δ9-延长酶活性;
xv)所述Δ12-去饱和酶还具有Δ15-去饱和酶活性;
xvi)所述Δ6-去饱和酶还具有Δ8-去饱和酶活性;
xvii)所述Δ8-去饱和酶还具有Δ6-去饱和酶活性或不具有Δ6-去饱和酶活性;
xviii)所述Δ15-去饱和酶还对GLA具有ω3-去饱和酶活性;
xix)所述ω3-去饱和酶还对LA具有Δ15-去饱和酶活性;
xx)所述ω3-去饱和酶能对LA和/或GLA进行去饱和化;
xxi)相对于LA,所述ω3-去饱和酶优先对GLA进行去饱和化;
xxii)所述植物部分中的DHA水平是基于所述植物部分中油酸到DHA的转化效率为至少约10%、至少约15%、至少约20%、在约10%与约50%之间、在约15%与约30%之间,或在约20%与约25%之间;
xxiii)所述植物部分中的DHA水平是基于所述植物部分中LA到DHA的转化效率为至少约15%、至少约20%、至少约22%、在约15%与约60%之间、在约20%与约40%之间,或在约22%与约30%之间;
xxiv)所述植物部分中的DHA水平是基于所述植物部分中ALA到DHA的转化效率为至少约17%、至少约22%、至少约24%、在约17%与约65%之间、在约22%与约35%之间,或在约24%与约35%之间
xxx)所述去饱和酶中的一种或多种或全部对酰基-CoA底物的活性高于对相应的酰基PC底物的活性;
xxxi)所述Δ6-去饱和酶对作为脂肪酸底物的ALA的Δ6-去饱和酶活性高于对LA的Δ6-去饱和酶活性;
xxxii)所述Δ6-去饱和酶对作为脂肪酸底物的ALA-CoA的Δ6-去饱和酶活性高于对作为脂肪酸底物的连接于PC的sn-2位置的ALA的Δ6-去饱和酶活性;
xxxiii)与LA相比,所述Δ6-去饱和酶对作为底物的ALA具有高至少约2倍Δ6-去饱和酶活性、至少3倍活性、至少4倍活性或至少5倍活性;
xxxiv)所述Δ6-去饱和酶对作为脂肪酸底物的ALA-CoA的活性大于对作为脂肪酸底物的连接于PC的sn-2位置的ALA的活性;
xxxv)与作为脂肪酸底物的连接于PC的sn-2位置的ALA相比,所述Δ6-去饱和酶对作为脂肪酸底物的ALA-CoA具有高至少约5倍Δ6-去饱和酶活性或至少10倍活性;
xxxvi)所述去饱和酶是前端去饱和酶;
xxxvii)所述Δ6-去饱和酶对ETA不具有可检测的Δ5-去饱和酶活性。
在另一个实施方案中,所述植物部分具有一个或多个或所有以下特征:
i)所述Δ12-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:10中所提供的序列、其生物学活性片段或与SEQ ID NO:10具有至少50%同一性的氨基酸序列;
ii)所述ω3-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:12中所提供的序列、其生物学活性片段或与SEQ ID NO:12具有至少50%同一性的氨基酸序列;
iii)所述Δ6-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:16中所提供的序列、其生物学活性片段或与SEQ ID NO:16具有至少50%同一性的氨基酸序列;
iv)所述Δ6-延长酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:25中所提供的序列、其生物学活性片段(诸如SEQ ID NO:26)或与SEQ ID NO:25和/或SEQ ID NO:26具有至少50%同一性的氨基酸序列;
v)所述Δ5-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:30中所提供的序列、其生物学活性片段或与SEQ ID NO:30具有至少50%同一性的氨基酸序列;
vi)所述Δ5-延长酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:37中所提供的序列、其生物学活性片段或与SEQ ID NO:37具有至少50%同一性的氨基酸序列;
vii)所述Δ4-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:41中所提供的序列、其生物学活性片段或与SEQ ID NO:41具有至少50%同一性的氨基酸序列。
在一个实施方案中,所述植物部分还包含编码以下各项的外源多核苷酸:二酰基甘油酰基转移酶(DGAT);单酰基甘油酰基转移酶(MGAT);甘油-3-磷酸酯酰基转移酶(GPAT);1-酰基-甘油-3-磷酸酯酰基转移酶(LPAAT),优选为可使用C22多不饱和脂肪酰基-CoA底物的LPAAT;酰基-CoA:溶血磷脂胆碱酰基转移酶(LPCAT);磷脂酶A2(PLA2);磷脂酶C(PLC);磷脂酶D(PLD);CDP-胆碱二酰基甘油胆碱磷酸转移酶(CPT);磷脂胆碱二酰基甘油酰基转移酶(PDAT);磷脂酰胆碱:二酰基甘油胆碱磷酸转移酶(PDCT);酰基-CoA合成酶(ACS);或其中两种或更多种的组合。
在另一个实施方案中,所述植物部分还包含下调所述植物部分的细胞中的内源酶的产生和/或活性的引入突变或外源多核苷酸,所述内源酶选自FAE1、DGAT、MGAT、GPAT、LPAAT、LPCAT、PLA2、PLC、PLD、CPT、PDAT、诸如FATB等硫酯酶或Δ12去饱和酶或其中两种或更多种的组合。
在另一个实施方案中,至少一个或所有的启动子是种子特异性启动子。在一个实施方案中,至少一个或所有的启动子是获自诸如油质蛋白等油生物合成或累积基因或获自诸如conlinin等种子存储蛋白基因。
在另一个实施方案中,指导编码Δ4-去饱和酶和Δ5-延长酶的外源多核苷酸表达的启动子在所述启动子指导编码Δ12-去饱和酶和ω3-去饱和酶的外源多核苷酸表达之前在所述植物部分的正在发育的种子中引发所述多核苷酸表达或达到峰值表达。
在另一个实施方案中,所述外源多核苷酸共价连接于被整合至所述植物部分的细胞的基因组中的DNA分子中,优选地T-DNA分子中,且优选地,其中所述被整合至所述植物部分的细胞的基因组中的DNA分子的数目为不超过1个、2个或3个,或为2个或3个。
在另一个实施方案中,所述植物包含至少两种不同的外源多核苷酸,各外源多核苷酸编码Δ6-去饱和酶,所述Δ6-去饱和酶具有相同或不同的氨基酸序列。
在另一个实施方案中,包含所述外源多核苷酸的植物部分的总油含量为缺乏所述外源多核苷酸的相应植物部分的总油含量的至少约40%,或至少约50%,或至少约60%,或至少约70%,或在约50%与约80%之间。在这些实施方案中,最大油含量可为相应野生型植物部分的油含量的约100%。
在另一个实施方案中,所述脂质呈油形式,优选为得自于油料种子的种子油,且其中以重量计至少约90%或至少约95%、至少约98%,或在约95%与约98%之间的所述脂质是三酰基甘油。
在另一个实施方案中,所述方法还包括处理所述脂质以提高DHA水平,所述DHA水平呈占总脂肪酸含量的百分比形式。举例来说,所述处理是酯基转移。举例来说,可对诸如芥花油等脂质进行处理以便将所述油中的脂肪酸转化成烷基酯,诸如甲基或乙基酯,然后可以进行分级以使所述脂质或油富含DHA。
此外,提供了一种用于产生提取的植物脂质的方法,其包括以下步骤:
i)获得包含脂质的植物部分,优选芥花种子,所述脂质包含呈酯化形式的脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包括亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),且任选地包括二十碳五烯酸(EPA)、十八碳四烯酸(SDA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中所述植物部分中的可提取脂质的总脂肪酸含量中的DHA水平为约3%、约4%、约5%、约6%或约7%;和
ii)从所述植物部分提取脂质,
其中所提取的脂质在所述脂质的总脂肪酸含量方面具有以下特征:
i)DHA水平为约3%、约4%、约5%、约6%或约7%;
ii)棕榈酸水平在约2%与约16%之间;
iii)肉豆蔻酸水平小于约2%;
iv)油酸水平在约30%与约60%之间,优选在约45%与约60%之间;
v)LA水平在约4%与约20%之间;
vi)ALA水平在约2%与约16%之间;
vii)GLA水平小于约4%;
viii)SDA水平小于约6%或小于约4%;
ix)ETA水平小于约6%或小于约4%;
x)ETrA水平小于约1%;
xi)EPA水平小于约10%和/或EPA水平是DHA水平的0.5-2.0倍;
xii)DPA水平小于约4%;
xiii)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约25%之间;
xiv)所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约30%与约70%之间;
xv)所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约15%与约75%之间,优选在约15%与约30%之间;
xvi)所提取的脂质的总脂肪酸含量中的新ω6脂肪酸水平在约0.5%与约10%之间;
xvii)所提取的脂质的总脂肪酸含量中的总ω3脂肪酸水平在约10%与约20%之间;
xviii)所提取的脂质的总脂肪酸含量中的新ω3脂肪酸水平在约3%与约20%之间;
xix)所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在约0.05与约3.0之间,优选小于约0.50;
xx)所提取的脂质的脂肪酸含量中新ω6脂肪酸:新ω3脂肪酸的比率在约0.03与约3.0之间;
xxi)所述脂质的三酰基甘油(TAG)含量为至少约70%;且
xxii)所述脂质基本上不含胆甾醇。在一个实施方案中,所述脂质包含tri-DHATAG(TAG 66:18)。更优选地,所述脂质基本上不含SDA和ETA,和/或在其从所述植物或植物部分中提取之后未用酯基转移方法进行处理。
还提供了一种用于产生提取的植物脂质的方法,其包括以下步骤i)获得包含脂质的植物部分,所述脂质包含呈酯化形式的脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包括亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),和十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中(i)其中所提取的脂质的总脂肪酸含量中的DHA水平在7%与20%之间;(ii)所提取的脂质的总脂肪酸含量中的棕榈酸水平在2%与16%之间;(iii)所提取的脂质的总脂肪酸含量中的肉豆蔻酸(C14:0)水平小于约6%;(iv)所提取的脂质的总脂肪酸含量中的油酸水平在1%与30%之间或在30%与60%之间;(v)所提取的脂质的总脂肪酸含量中的亚油酸(LA)水平在4%与35%之间;(vi)所提取的脂质的总脂肪酸含量中的α-亚麻酸(ALA)水平在4%与40%之间;(vii)所提取的脂质的总脂肪酸含量中的二十碳三烯酸(ETrA)水平小于约4%;(viii)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在4%与25%之间;(ix)所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在1.0与3.0之间或在0.1与1之间;(x)所述脂质的三酰基甘油(TAG)含量为至少70%;且(xi)至少70%呈TAG形式的酯化DHA是在TAG的sn-1或sn-3位置上。
%,和
ii)从所述植物部分提取脂质,
其中所提取的脂质的总脂肪酸含量中的DHA水平为约7%至20%。
还提供了使用本发明方法产生的脂质或包含所述脂质的油。
在另一个方面,本发明提供了一种用于产生多不饱和脂肪酸乙酯的方法,所述方法包括对提取的植物脂质中的三酰基甘油进行酯基转移,其中所提取的植物脂质包含呈酯化形式的脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包括亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),且任选地包括十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中所提取的脂质的总脂肪酸含量中的DHA水平为约7%至20%,从而产生所述乙酯。
在一个优选的实施方案中,所提取的脂质具有以上所定义的特征中的一个或多个。
在另一个方面,本发明提供了一种用于产生多不饱和脂肪酸乙酯的方法,所述方法包括对提取的植物脂质中的三酰基甘油进行酯基转移,其中所提取的植物脂质包含呈三酰基甘油形式的酯化脂肪酸,所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包括亚油酸(LA);ω3脂肪酸,其包括α-亚麻酸(ALA)和二十二碳六烯酸(DHA),和十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA)中的一种或多种,其中(i)所提取的脂质的总脂肪酸含量中的DHA水平为约3%、约4%、约5%、约6%或在7%与20%之间;(ii)所提取的脂质的总脂肪酸含量中的棕榈酸水平在2%与16%之间;(iii)所提取的脂质的总脂肪酸含量中的肉豆蔻酸(C14:0)水平小于约6%;(iv)所提取的脂质的总脂肪酸含量中的油酸水平在1%与30%之间或在30%与60%之间;(v)所提取的脂质的总脂肪酸含量中的亚油酸(LA)水平在4%与35%之间;(vi)所提取的脂质的总脂肪酸含量中的α-亚麻酸(ALA)水平在4%与40%之间;(vii)所提取的脂质的总脂肪酸含量中的二十碳三烯酸(ETrA)水平小于约4%;(viii)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在4%与25%之间;(ix)所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在1.0与3.0之间或在0.1与1之间;(x)所述脂质的三酰基甘油(TAG)含量为至少70%;且(xi)至少70%呈TAG形式的酯化DHA是在TAG的sn-1或sn-3位置上,从而产生所述乙酯。在一个实施方案中,所提取的植物脂质具有一个或多个或所有以下特征:
i)所提取的脂质的总脂肪酸含量中的棕榈酸水平在2%与15%之间;
ii)所提取的脂质的总脂肪酸含量中的肉豆蔻酸(C14:0)水平小于1%;
xxxv)所提取的脂质的总脂肪酸含量中的油酸水平在约3%与约30%之间、在约6%与约30%之间、在1%与约20%之间、在约45%与约60%之间或为约30%;
xxxvi)所提取的脂质的总脂肪酸含量中的亚油酸(LA)水平在约4%与约20%之间,或在约4%与17%之间;
xxxvii)所提取的脂质的总脂肪酸含量中的α-亚麻酸(ALA)水平在约7%与约40%之间、在约10%与约35%之间、在约20%与约35%之间,或在约4%与16%之间;
xxxviii)所提取的脂质的总脂肪酸含量中的γ-亚麻酸(GLA)水平小于约4%、小于约3%、小于约2%、小于约1%、小于约0.5%、在0.05%与7%之间、在0.05%与4%之间,或在0.05%与约3%之间,或在0.05%与约2%之间;
xxxix)所提取的脂质的总脂肪酸含量中的十八碳四烯酸(SDA)水平小于约4%、小于约3%、在约0.05%与约7%之间、在约0.05%与约4%之间、在约0.05%与约3%之间,或在0.05%与约2%之间;
xl)所提取的脂质的总脂肪酸含量中的二十碳四烯酸(ETA)水平小于约4%、小于约1%、小于约0.5%、在约0.05%与约5%之间、在约0.05%与约4%之间、在约0.05%与约3%之间,或在约0.05%与约2%之间;
xli)所提取的脂质的总脂肪酸含量中的二十碳三烯酸(ETrA)水平小于约2%、小于约1%、在0.05%与4%之间、在0.05%与3%之间,或在0.05%与约2%之间,或在0.05%与约1%之间;
xlii)所提取的脂质的总脂肪酸含量中的二十碳五烯酸(EPA)水平小于约4%、小于约3%、小于约2%、在0.05%与10%之间、在0.05%与5%之间,或在0.05%与约3%之间,或在0.05%与约2%之间;
xliii)所提取的脂质的总脂肪酸含量中的二十二碳五烯酸(DPA)水平小于约4%、小于约3%、小于约2%、在0.05%与8%之间、在0.05%与5%之间,或在0.05%与约3%之间,或在0.05%与约2%之间;
xliv)所提取的脂质的总脂肪酸含量中的DHA水平为约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、在约8%与20%之间、在约10%与20%之间、在约11%与20%之间、在约10%与约16%之间,或在约14%与20%之间;
xlv)所述脂质在其脂肪酸含量中包含ω6-二十二碳五烯酸(22:5Δ4,7,10,13,16);
xlvi)所述脂质在其脂肪酸含量中基本上不含ω6-二十二碳五烯酸(22:5Δ4,7,10,13,16);
xlvii)所述脂质在其脂肪酸含量中基本上不含SDA、EPA和ETA;
xlviii)所提取的脂质的总脂肪酸含量中的总饱和脂肪酸水平在约4%与约20%之间,或在约6%与约20%之间;
xlix)所提取的脂质的总脂肪酸含量中的总单不饱和脂肪酸水平在约4%与约35%之间、在约8%与约25%之间,或在8%与约22%之间;
l)所提取的脂质的总脂肪酸含量中的总多不饱和脂肪酸水平在约20%与约75%之间、在约50%与约75%之间,或在约60%与约75%之间;
li)所提取的脂质的总脂肪酸含量中的总ω6脂肪酸水平在约35%与约50%之间、在约20%与约35%之间、在约6%与20%之间、小于20%、小于约16%、小于约10%、在约1%与约16%之间、在约2%与约10%之间,或在约4%与约10%之间;
lii)所提取的脂质的总脂肪酸含量中的新ω6脂肪酸水平小于约10%、小于约8%、小于约6%、小于4%、在约1%与约20%之间、在约1%与约10%之间、在约0.5%与约8%之间,或在约0.5%与4%之间;
liii)所提取的脂质的总脂肪酸含量中的总ω3脂肪酸水平在36%与约65%之间、在40%与约60%之间、在约20%与约35%之间、在约10%与约20%之间、为约25%、约30%、约35%或约40%;
liv)所提取的脂质的总脂肪酸含量中的新ω3脂肪酸水平在9%与约33%之间、在约10%与约20%之间、在约20%与约30%之间、在约12%与约25%之间、为约13%、约15%、约17%或约20%;
lv)所提取的脂质的脂肪酸含量中总ω6脂肪酸:总ω3脂肪酸的比率在约0.1与约0.5之间、小于约0.50、小于约0.40、小于约0.30、小于约0.20、小于约0.15、为约1.0、约0.1或约0.2;
lvi)所提取的脂质的脂肪酸含量中的新ω6脂肪酸:新ω3脂肪酸的比率在约1.0与约3.0之间、在约0.1与约1之间、在约0.1与约0.5之间、小于约0.50、小于约0.40、小于约0.30、小于约0.20、小于约0.15、为约0.1、约0.2或约1.0;
lvii)所述脂质的脂肪酸组成是基于油酸到DHA的转化效率为至少约10%、至少约15%、至少约20%、在约10%与约50%之间、在约10%与约30%之间,或在约10%与约25%之间;
lviii)所述脂质的脂肪酸组成是基于LA到DHA的转化效率为至少约15%、至少约20%、至少约22%、至少约25%、在约15%与约50%之间、在约20%与约40%之间,或在约20%与约30%之间;
lix)所述脂质的脂肪酸组成是基于ALA到DHA的转化效率为至少约17%、至少约22%、至少约24%、在约17%与约55%之间、在约22%与约35%之间,或在约24%与约35%之间;
lx)所提取的脂质中的总脂肪酸具有小于1%的C20:1;
lxi)所述脂质的三酰基甘油(TAG)含量为至少约80%、至少约90%、至少95%、在约70%与约99%之间,或在约90%与约99%之间;
lxii)所述脂质包含二酰基甘油(DAG);
lxiii)所述脂质包含小于约10%、小于约5%、小于约1%,或在约0.001%与约5%之间的游离(未酯化)脂肪酸和/或磷脂,或基本上不含游离脂肪酸和/或磷脂;
lxiv)至少80%呈TAG形式的酯化DHA是在TAG的sn-1或sn-3位置上;
lxv)所述脂质中最丰富的含DHA的TAG种类是DHA/18:3/18:3(TAG 58:12);和
lxvi)所述脂质包含tri-DHA TAG(TAG 66:18)。
关于上述方面,在一个实施方案中,以下各项中一项或多项或全部适用:
i)所述脂质呈油形式,其中所述油包含一种或多种甾醇,诸如菜油甾醇、Δ5-豆甾醇、齿孔醇、β-谷甾醇、Δ5-燕麦甾醇、Δ7-豆甾醇和Δ7-燕麦甾醇中的一种或多种,且任选地,所述油包含小于10mg甾醇/g油和/或所述油基本上不含胆甾醇;
ii)所述脂质呈得自于油料种子的油形式,诸如油料种子是芸苔属植物油料种子或芥花种子;
iii)所提取的植物脂质的总脂肪酸含量中的DHA水平为约3%、约4%、约5%、约6%或在7%与20%之间。
在另一个方面,本发明提供了一种嵌合基因构建体,其按顺序包含第一基因、第二基因、第三基因、第四基因、第五基因和第六基因,所述基因全部共价连接于单个DNA分子上,
其中所述第一、第二和第三基因连接在一起作为第一基因簇,且所述第四、第五和第六基因连接在一起作为第二基因簇,
其中各基因包含启动子、编码区和转录终止子和/或聚腺苷酸化区,使得各启动子可操作地连接于所述编码区和转录终止子和/或聚腺苷酸化区,
其中各启动子独立地与其它启动子同一或不同,使得所述DNA分子包含3、4、5或6个不同的启动子,
其中一个或多个或所有启动子相对于其可操作地连接的编码区而言是异源的,
其中所述第一基因的转录方向远离所述第三基因且与所述第三基因的转录方向相对,
其中所述第四基因的转录方向远离所述第六基因且与所述第六基因的转录方向相对,
其中所述第二基因的转录方向与所述第一基因或所述第三基因相同,
其中所述第五基因的转录方向与所述第四基因或所述第六基因相同,
其中所述第二基因的转录终止子和/或聚腺苷酸化区通过在约0.2与约3.0千碱基之间的第一间隔区与所述第一或第三基因中更接近者的启动子间隔开,
其中所述第一基因簇通过在约1.0与约10.0千碱基之间的第二间隔区与所述第二基因簇间隔开,且
其中所述第五基因的转录终止子和/或聚腺苷酸化区通过在约0.2与约3.0千碱基之间的第三间隔区与所述第四或第六基因中更接近者的启动子间隔开。
在一个实施方案中,所述DNA分子包含第七基因,所述第七基因通过在约1.0与约10.0千碱基之间的间隔区与所述第一基因簇或所述第二基因簇中更接近者间隔开。
在另一个实施方案中,所述DNA分子包含两个或更多个不同的转录终止子和/或聚腺苷酸化区。
在另一个实施方案中,所述间隔区中至少一个包含基质连接区(MAR)。
在另一个实施方案中,所述DNA分子包含侧接所述基因的右边界区和左边界区,并且是T-DNA分子。
在另一个实施方案中,所述基因构建体是在农杆菌属细胞中或被整合至植物细胞的基因组中。
在一个优选的实施方案中,所述基因中至少一个编码脂肪酸去饱和酶或脂肪酸延长酶。
在另一个实施方案中,所述基因构建体包含编码如本文中所定义的酶集合的基因,和/或其中所述基因中的一个或多个编码如本文中所定义的酶。
在另一个方面,本发明提供了一种分离和/或外源多核苷酸,其包含:
i)选自SEQ ID NO:1至9、11、14、18、22、23、28、34、35、39或45中任一者的核苷酸序列,和/或
ii)与SEQ ID NO:1至9、11、14、18、22、23、28、34、35、39或45中所述的序列中的一个或多个具有至少95%同一性或99%同一性的核苷酸序列。
在一个特别优选的实施方案中,所述分离和/或外源多核苷酸包含:
i)SEQ ID NO:2的核苷酸序列;和/或
ii)与SEQ ID NO:2中所阐述的序列具有至少95%同一性或99%同一性的核苷酸序列。
在另一个方面,本发明提供了一种载体或基因构建体,其包含本发明的多核苷酸和/或本发明的基因构建体。
在一个实施方案中,选自SEQ ID NO:11、14、18、22、23、28、34、35、39或45中的任一个的核苷酸序列,或与SEQ ID NO:11、14、18、22、23、28、34、35、39或45中所阐述的序列中的一个或多个具有至少95%同一性或99%同一性的核苷酸序列可操作地连接于启动子。
在另一个方面,本发明提供了一种宿主细胞,其包含编码以下酶集合之一的外源多核苷酸:
i)ω3-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
ii)Δ15-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
iii)Δ12-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
iv)Δ12-去饱和酶、ω3-去饱和酶或Δ15-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;
v)ω3-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;
vi)Δ15-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;
vii)Δ12-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;或
viii)Δ12-去饱和酶、ω3-去饱和酶或Δ15-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶;
且其中各多核苷酸被可操作地连接于一个或多个能够指导所述多核苷酸在所述细胞中表达的启动子。
在一个实施方案中,所述细胞包含如上文所定义的脂质,或其中所述去饱和酶或延长酶中的一种或多种或全部具有一个或多个如上文所定义的特征。
在另一个方面,本发明提供了一种宿主细胞,其包含:
i)编码Δ12-去饱和酶的第一外源多核苷酸,其包含如下氨基酸,所述氨基酸具有如SEQ ID NO:10中所提供的序列、其生物学活性片段或与SEQ ID NO:10具有至少50%同一性的氨基酸序列;和
ii)编码ω3-去饱和酶的第二外源多核苷酸,其包含如下氨基酸,所述氨基酸具有如SEQ ID NO:12中所提供的序列、其生物学活性片段或与SEQ ID NO:12具有至少50%同一性的氨基酸序列,
且其中各多核苷酸被可操作地连接于一个或多个能够指导所述多核苷酸在所述细胞中表达的启动子。
在另一个方面,本发明提供了一种宿主细胞,其包含本发明的多核苷酸、本发明的基因构建体或本发明的载体或基因构建体中的一种或多种。
在一个实施方案中,所述细胞是在植物中、在植物部分中和/或是成熟的植物种子细胞。
在一个实施方案中,所述植物或植物种子分别是油料种子植物或油料种子。
还提供了一种包含本发明的细胞的转基因非人生物体。优选地,所述转基因非人生物体是转基因植物,优选为油料种子植物或拟南芥。在一个实施方案中,所述植物是芸苔属植物,优选为油菜或芥菜或除拟南芥以外的植物。
在另一个方面,本发明提供了一种油料种子植物,其包含:
a)其种子中的脂质,所述脂质包括呈酯化形式的脂肪酸;和
b)编码以下酶集合之一的外源多核苷酸:
i)Δ12-去饱和酶、真菌ω3-去饱和酶和/或真菌Δ15-去饱和酶、Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ6-延长酶和Δ5-延长酶;或
ii)Δ12-去饱和酶、真菌ω3-去饱和酶和/或真菌Δ15-去饱和酶、Δ8-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶、Δ9-延长酶和Δ5-延长酶,
其中各多核苷酸被可操作地连接于一种或多种能够指导所述多核苷酸在所述植物的正在发育的种子中表达的种子特异性启动子,其中所述脂肪酸包括油酸;棕榈酸;ω6脂肪酸,其包括亚油酸(LA)和γ-亚麻酸(GLA);ω3脂肪酸,其包括α-亚麻酸(ALA)、十八碳四烯酸(SDA)、二十二碳五烯酸(DPA)和二十二碳六烯酸(DHA),且任选地包括二十碳五烯酸(EPA)和/或二十碳四烯酸(ETA),且其中所述脂质的总脂肪酸含量中的DHA水平为约7%至20%。
油料种子植物的实例包括但不限于芸苔属植物、陆地棉、亚麻、向日葵属植物、红花、毛豆、玉米、拟南芥、二色高粱、甜高粱、燕麦、车轴草属植物、油棕、本氏烟、大麦、狭叶羽扇豆、水稻、光稃稻、亚麻荠或深海两节荠。在一个实施方案中,所述油料种子植物是芥花、毛豆、亚麻荠或拟南芥植物。在一个替代实施方案中,所述油料种子植物不是拟南芥。
在一个实施方案中,所述去饱和酶中的一种或多种能够使用酰基-CoA底物。在一个优选实施方案中,Δ6-去饱和酶、Δ5-去饱和酶、Δ4-去饱和酶和Δ8-去饱和酶中的一种或多种在存在时能够使用酰基-CoA底物,优选为以下各项中的每一项:i)Δ6-去饱和酶、Δ5-去饱和酶和Δ4-去饱和酶;或ii)Δ5-去饱和酶、Δ4-去饱和酶和Δ8-去饱和酶能够使用酰基-CoA底物。在一个实施方案中,Δ12-去饱和酶和/或ω3-去饱和酶能够使用酰基-CoA底物。酰基-CoA底物优选为ALA-CoA、ETA-CoA、DPA-CoA、ETrA-CoA、LA-CoA、GLA-CoA或ARA-CoA。
在一个实施方案中,所述植物的成熟收获种子的DHA含量为至少约28mg/g种子,优选为至少约32mg/g种子、至少约36mg/g种子、至少约40mg/g种子,更优选为至少约44mg/g种子或至少约48mg/g种子。最大DHA含量可为约80至约100mg/g种子或约80mg或约100mg/g种子。
在另一个方面,本发明提供了一种油菜、芥菜或亚麻荠植物,其能够产生包含DHA的种子,其中所述植物的成熟收获种子的DHA含量为至少约28mg/g种子,优选为至少约32mg/g种子、至少约36mg/g种子、至少约40mg/g种子,更优选为至少约44mg/g种子或至少约48mg/g种子。最大DHA含量可为约80至约100mg/g种子或约80mg或约100mg/g种子。
在另一个方面,本发明提供了包含所述外源多核苷酸的本发明植物的植物细胞。
还提供了一种植物部分,优选为种子,其具有一个或多个以下特征:
i)来自于本发明的植物;
ii)包含如本文中所定义的脂质;
iii)可用于本发明方法中;
iv)包含本发明的基因构建体;或
v)包含如本文中所定义的外源多核苷酸集合。
在另一个方面,本发明提供了成熟收获油菜、芥菜或亚麻荠种子,其包含DHA和以重量计在约4%与约15%之间的水分含量,其中所述种子的DHA含量为至少约28mg/g种子,优选为至少约32mg/g种子、至少约36mg/g种子、至少约40mg/g种子,更优选为至少约44mg/g种子或至少约48mg/g种子。最大DHA含量可为约80至约100mg/g种子或约80mg或约100mg/g种子。
在一个实施方案中,本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分或本发明的种子可用于产生包含一个或多个或所有如本文中所定义的特征的提取脂质。
在另一个方面,本发明提供了一种产生本发明的细胞的方法,所述方法包括:
a)将本发明的基因构建体、本发明的分离和/或外源多核苷酸、本发明的载体或基因构建体、一个或多个本文中所定义的外源多核苷酸组合引入细胞中,优选地引入不能够合成LC-PUFA的细胞中;
b)任选地,在所述细胞中表达所述基因或多核苷酸;
c)任选地,分析所述细胞的脂肪酸组成;和
d)任选地,选择表达所述基因或多核苷酸的细胞。
在一个实施方案中,所述细胞中的脂质具有一个或多个本文中所定义的特征。
在另一个实施方案中,所述基因构建体、所述分离和/或外源多核苷酸、所述载体、所述基因构建体或外源多核苷酸组合被稳定地整合至所述细胞的基因组中。
在另一个实施方案中,所述细胞是植物细胞,且所述方法还包括由步骤a)的细胞再生出转化植物的步骤。
在另一个实施方案中,所述基因和/或外源多核苷酸被瞬时表达于所述细胞中。
还提供了一种使用本发明方法产生的细胞。
在另一个方面,本发明提供了一种产生种子的方法,所述方法包括:
a)种植本发明的植物或产生如本文中所定义的部分的植物,优选地种植在作为具有至少1000株这样的植物的群体的一部分的田地中或在以标准种植密度种植的至少1公顷面积中;
b)从所述植物收获种子;和
c)任选地,从所述种子提取脂质,优选地产生油,其中总DHA产量为至少60kg DHA/公顷。
在一个实施方案中,本发明的植物、植物细胞、植物部分或种子具有一个或多个以下特征:
i)所述油如本文中所定义;
ii)所述植物部分或种子能够用于本发明方法中;
iii)所述外源多核苷酸被包含在本发明的基因构建体中;
iv)所述外源多核苷酸包含本发明的外源多核苷酸;
v)所述植物细胞是本发明的细胞;且
vi)所述种子是根据本发明方法产生。
在另一个方面,本发明提供了一种产生一种或多种脂肪酸去饱和酶和/或脂肪酸延长酶或一种或多种脂肪酸去饱和酶和一种或多种脂肪酸延长酶的方法,所述方法包括在细胞或无细胞表达系统中表达本发明的基因构建体、本发明的分离和/或外源多核苷酸、本发明的载体或基因构建体、本文中所定义的一种或多种外源多核苷酸组合,优选在田地中的油料种子植物中的正在发育的油料种子中。
在另一个方面,本发明提供了使用本发明的方法、由本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分、本发明的种子或本发明的植物、植物细胞、植物部分或种子产生或获得的脂质或油。
在一个实施方案中,所述脂质或油是通过从油料种子提取油而获得。得自于油料种子的油的实例包括但不限于芥花油(油菜、芜菁亚种)、芥子油(芥菜)、其它芸苔属植物油、葵花油(向日葵)、亚麻子油(亚麻)、大豆油(毛豆)、红花油(红花)、玉米油(玉米)、烟草油(普通烟草)、花生油(花生)、棕榈油、棉籽油(陆地棉)、椰子油(椰子)、鳄梨油(鳄梨)、橄榄油(橄榄)、腰果油(腰果)、夏威夷果油(夏威夷果)、杏仁油(巴旦杏)或拟南芥种子油(拟南芥)。
在另一个方面,本发明提供了使用本发明的方法、由本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分、本发明的种子或本发明的植物、植物细胞、植物部分或种子产生或获得的脂肪酸。优选地,所述脂肪酸是DHA。所述脂肪酸可呈具有如本文中所描述的脂肪酸组成的脂肪酸混合物形式。在一个实施方案中,所述脂肪酸未酯化。
还提供了由本发明的种子获得的种子粕。优选的种子粕包括但未必限于油菜、芥菜、亚麻荠或毛豆种子粕。在一个实施方案中,所述种子粕包含如本文中所定义的外源多核苷酸和/或基因构建体。
在另一个方面,本发明提供了一种组合物,其包含本发明的脂质或油、本发明的脂肪酸、本发明的基因构建体、本发明的分离和/或外源多核苷酸、本发明的载体或基因构建体、本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分、本发明的种子、本发明的植物、植物细胞、植物部分或种子,或本发明的种子粕中的一种或多种。在实施方案中,所述组合物包含适用于药物、食物或农业用途的载剂、种子处理化合物、肥料、另一种食物或饲料成分,或添加的蛋白质或维生素。
还提供了饲料、化妆品或化学品,其包含本发明的脂质或油、本发明的脂肪酸、本发明的基因构建体、本发明的分离和/或外源多核苷酸、本发明的载体或基因构建体、本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分、本发明的种子、本发明的植物、植物细胞、植物部分或种子、本发明的种子粕或本发明的组合物中的一种或多种。
在另一个方面,本发明提供了一种生产饲料的方法,所述方法包括将本发明的脂质或油、本发明的脂肪酸、本发明的基因构建体、本发明的分离和/或外源多核苷酸、本发明的载体或基因构建体、本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分、本发明的种子、本发明的植物、植物细胞、植物部分或种子、本发明的种子粕或本发明的组合物中的一种或多种与至少一种其它食物成分混合。
在另一个方面,本发明提供了一种治疗或预防将受益于PUFA的病状的方法,所述方法包括向受试者施用本发明的脂质或油、本发明的脂肪酸、本发明的基因构建体、本发明的分离和/或外源多核苷酸、本发明的载体或基因构建体、本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分、本发明的种子、本发明的植物、植物细胞、植物部分或种子、本发明的种子粕、本发明的组合物或本发明的饲料中的一种或多种。
将受益于PUFA的病状的实例包括但不限于心律不齐、血管成形术、炎症、哮喘、牛皮癣、骨质疏松症、肾结石、AIDS、多发性硬化、类风湿性关节炎、克罗恩病、精神分裂症、癌症、胎儿酒精综合症、注意缺陷多动障碍、囊性纤维化、苯丙酮酸尿症、单相抑郁、攻击性敌对情绪、肾上腺脑白质营养不良、冠心病、高血压、糖尿病、肥胖、阿茲海默病、慢性阻塞性肺病、溃疡性结肠炎、血管成形术后再狭窄、湿疹、高血压、血小板凝聚、胃肠出血、子宫内膜异位、经前期综合征、肌痛性脑脊髓炎、病毒感染后慢性疲劳或眼病。
还提供了本发明的脂质或油、本发明的脂肪酸、本发明的基因构建体、本发明的分离和/或外源多核苷酸、本发明的载体或基因构建体、本发明的细胞、本发明的转基因生物体、本发明的油料种子植物、本发明的油菜、芥菜或亚麻荠植物、本发明的植物部分、本发明的种子、本发明的植物、植物细胞、植物部分或种子、本发明的种子粕、本发明的组合物或本发明的饲料中的一种或多种的用途,其用于制造用来治疗或预防将受益于PUFA的病状的药物。所述药物的制造可包括将本发明的油与药学上可接受的载剂混合,以用于治疗如本文中所描述的病状。所述方法可包括首先对所述油进行纯化和/或酯基转移,和/或对所述油进行分级以增加DHA水平。在一个特定实施方案中,所述方法包括处理所述脂质或油,诸如芥花油,以便将所述油中的脂肪酸转化成烷基酯,诸如甲基或乙基酯。可以应用诸如分级或蒸馏等进一步处理以使所述脂质或油富含DHA。在一个优选实施方案中,所述药物包含DHA乙酯。在一个甚至更优选的实施方案中,所述药物中的DHA乙酯水平在30%与50%之间。所述药物还可以包含EPA乙酯,诸如在所述药物的总脂肪酸含量的30%与50%之间。所述药物适合施用于人类或动物受试者,以便治疗如本文中所描述的医学病状。
在另一个方面,本发明提供了一种交易种子的方法,其包括获得本发明的种子,和交易所获得的种子以获得金钱。
在一个实施方案中,获得所述种子包括栽培本发明的植物和/或从所述植物收获所述种子。
在另一个实施方案中,获得所述种子还包括将所述种子放在容器中和/或存储所述种子。
在另一个实施方案中,获得所述种子还包括将所述种子运输到不同的地点。
在另一个实施方案中,所述方法还包括在交易所述种子之后将所述种子运输到不同的地点。
在另一个实施方案中,所述交易是使用诸如计算机等电子手段进行。
在另一个方面,本发明提供了一种生产种子箱的方法,其包括:
a)对包含本发明的种子的植物地上部分进行捆晒、割晒和/或收割;
b)对所述植物部分进行脱粒和/或簸选,以分离所述种子与所述植物部分的其余部分;和
c)对步骤b)中所分离的种子进行筛选和/或拣选,且将经过筛选和/或拣选的种子装入箱中,从而产生种子箱。
在一个相关实施方案中,所述脂质或油,优选为本发明的或可用于本发明的种子油,具有大约如实例部分的表中所提供的脂肪水平,诸如表16的种子14。
除非另外具体说明,否则本文中的任何实施方案将在采取必要的变更后应用于任何其它实施方案。
本发明在范围上不受本文中所描述的具体实施方案限制,所述实施方案意在仅用于例证目的。如本文中所描述的功能等效产物、组合物和方法显然在本发明范围内。
纵观本说明书,除非另外具体说明或上下文另有要求,否则提到单个步骤、物质组成、步骤族群或组合物族群应涵盖那些步骤、物质组合物、步骤族群或物质组合物族群中的一个和多个(即,一个或多个)。
在下文中通过以下非限制性实例且参考附图描述了本发明。
附图简述
图1.需氧型DHA生物合成途径。
图2.在pJP3416-GA7的左边界与右边界之间的T-DNA插入区的图。RB表示右边界;LB,左边界;TER,转录终止子/聚腺苷酸化区;PRO,启动子;编码区指示在箭头上方,启动子和终止子在箭头下方。Micpu-Δ6D,细小微胞藻(Micromonas pusilla)Δ6-去饱和酶;Pyrco-Δ6E,Pyramimonas cordataΔ6-延长酶;Pavsa-Δ5D,盐生巴夫藻Δ5-去饱和酶;Picpa-ω3D,巴斯德毕赤酵母(Pichia pastoris)ω3-去饱和酶;Pavsa-Δ4D,盐生巴夫藻Δ4-去饱和酶;Lackl-Δ12D,克鲁维郎香酵母(Lachancea kluyveri)Δ12-去饱和酶;Pyrco-Δ5E,Pyramimonas cordataΔ5-延长酶。NOS表示根癌农杆菌胭脂碱合成酶转录终止子/聚腺苷酸化区;FP1,油菜截短napin启动子;FAE1,拟南芥FAE1启动子;凝集素,毛豆凝集素转录终止子/聚腺苷酸化区;Cnl1和Cnl2表示亚麻conlinin1或conlinin2启动子或终止子。MAR表示来自于普通烟草的Rb7基质连接区。
图3.在pJP3404的左边界与右边界之间的T-DNA插入区的图。标注如图2中。
图4.在pJP3367的左边界与右边界之间的插入区的图。标注如图2中。
图5.DHA水平,呈占得自于T2和T3两代中多个独立的转基因拟南芥种子的种子脂质中的总脂肪酸的百分比形式。加括号的T2事件被带到T3。示出了来自于Columbia和fad2突变拟南芥背景的事件。
图6.得自于转基因拟南芥种子的脂质的油含量(w/w)对比DHA含量,呈占总脂肪酸含量的百分比形式。
图7.代表性RT-PCR凝胶,其显示Δ6-去饱和酶基因相对于使用pJP3416-GA7转化的油菜胚的T-DNA中的其它转基因的低表达。各泳道从左侧起显示RT-PCR产物:1,DNA大小标记物;第2泳道,Δ12去饱和酶;第3泳道,ω3-去饱和酶;第4泳道,Δ6-去饱和酶(低表达);第5泳道,Δ6-延长酶;第6泳道,Δ5-去饱和酶;第7泳道,Δ5-延长酶;第8泳道,Δ4-去饱和酶。
图8.ALA百分比相对于油酸百分比的曲线图,各百分比为占获自转基因35S:LEC2油菜体细胞胚的脂质中的总脂肪酸的百分比。
图9.通过NMR对A)金枪鱼油和B)转基因DHA拟南芥种子油的位置分布分析。标注‘DHA-α’的峰表示TAG的sn-1和sn-3位置上存在的DHA的量(在无位置偏好的情况下,这将等于总DHA的66%),而标注‘DHA-β’的峰表示TAG的sn-2位置上存在的DHA的量(在无偏好的情况下,这将等于总DHA的33%)。
图10.对转基因拟南芥的发育种子(灰色)和成熟种子(黑色)中的主要含DHA三酰基甘油种类的LC-MS分析。DHA之后的数字表示其它两种脂肪酸中的总碳原子数和总双键数。因此,DHA/34:1也可以指定为TAG 56:7等等。
图11.在pORE04+11ABGBEC_豇豆_EPA_插入序列的左边界与右边界之间的T-DNA插入区的图。标注如图2中;SSU,拟南芥核酮糖二磷酸羧化酶-加氧酶(rubisco)小亚单位启动子。
图12.二元载体pJP3364的图,其显示了候选Δ12-去饱和酶被克隆到其中的NotI限制位点。
图13.使用SigmaPlot产生的箱线图,其显示脂肪酸20:4ω6(ARA)在用pFN045-pFN050转化的拟南芥T2种子群体的种子脂质中的百分比。各箱中距零最近的边界指示25百分位,各箱内的线标记中位数;而各箱中距零最远的边界指示75百分位。各箱上下所显示的误差线指示90百分位和10百分位。
图14.平均ARA水平,呈占用pFN045-pFN050转化的拟南芥T2种子的种子脂质中的总脂肪酸含量的百分比形式。
图15.箱线图,其显示脂肪酸20:2ω6(EDA)在用pFN045-pFN050转化的拟南芥T2种子群体的种子脂质中的百分比。该箱线图表示如图13中所描述的值。
图16.箱线图,其显示ARA在用pFN045-pFN050转化的拟南芥T4种子群体的种子脂质中的百分比。该箱线图表示如图13中所描述的值。
图17.平均ARA水平,呈占用pFN045-pFN050转化的拟南芥T4种子群体的种子脂质中的总脂肪酸含量的百分比形式。
图18.箱线图,其显示EDA在用pFN045-pFN050转化的拟南芥T4种子群体的种子脂质中的百分比。该箱线图表示如图13中所描述的值。
图19.(A)具有环和侧链编号的基本植物甾醇结构。(B)一些植物甾醇的化学结构。
图20.已知LPAAT的系统树。
图21.在PC、CoA库和TAG库之间转移脂肪酸的各种酰基交换酶。由Singh等(2005)改编而来。
序列表说明
SEQ ID NO:1-pJP3416-GA7核苷酸序列。
SEQ ID NO:2-pGA7-mod_B核苷酸序列。
SEQ ID NO:3-pGA7-mod_C核苷酸序列。
SEQ ID NO:4-pGA7-mod_D核苷酸序列。
SEQ ID NO:5-pGA7-mod_E核苷酸序列。
SEQ ID NO:6-pGA7-mod_F核苷酸序列。
SEQ ID NO:7-pGA7-mod_G核苷酸序列。
SEQ ID NO:8-pORE04+11ABGBEC_豇豆_EPA_插入核苷酸序列。
SEQ ID NO:9–用于在植物中表达克鲁维郎香酵母Δ12去饱和酶的密码子经优化开放阅读框。
SEQ ID NO:10-克鲁维郎香酵母Δ12-去饱和酶。
SEQ ID NO:11-用于在植物中表达巴斯德毕赤酵母ω3去饱和酶的密码子经优化开放阅读框。
SEQ ID NO:12-巴斯德毕赤酵母ω3去饱和酶。
SEQ ID NO:13-编码细小微胞藻Δ6-去饱和酶的开放阅读框。
SEQ ID NO:14-用于在植物中表达细小微胞藻Δ6-去饱和酶的密码子经优化开放阅读框(版本1)。
SEQ ID NO:15-用于在植物中表达细小微胞藻Δ6-去饱和酶的密码子经优化开放阅读框(版本2)。
SEQ ID NO:16-细小微胞藻Δ6-去饱和酶。
SEQ ID NO:17-编码绿色鞭毛藻(Ostreococcus lucimarinus)Δ6-去饱和酶的开放阅读框。
SEQ ID NO:18-用于在植物中表达绿色鞭毛藻Δ6-去饱和酶的密码子经优化开放阅读框。
SEQ ID NO:19-绿色鞭毛藻Δ6-去饱和酶
SEQ ID NO:20–青绿藻(Ostreococcus tauri)Δ6-去饱和酶。
SEQ ID NO:21-编码Pyramimonas cordataΔ6-延长酶的开放阅读框。
SEQ ID NO:22-用于在植物中表达Pyramimonas cordataΔ6-延长酶的密码子经优化开放阅读框。(在3'端截短且编码功能延长酶)(版本1)。
SEQ ID NO:23-用于在植物中表达Pyramimonas cordataΔ6-延长酶的密码子经优化开放阅读框。(在3'端截短且编码功能延长酶)(版本2)。
SEQ ID NO:24-用于在植物中表达Pyramimonas cordataΔ6-延长酶的密码子经优化开放阅读框。(在3'端截短且编码功能延长酶)(版本3)。
SEQ ID NO:25-Pyramimonas cordataΔ6-延长酶。
SEQ ID NO:26-截短Pyramimonas cordataΔ6-延长酶。
SEQ ID NO:27-编码盐生巴夫藻Δ5-去饱和酶的开放阅读框。
SEQ ID NO:28-用于在植物中表达盐生巴夫藻Δ5-去饱和酶的密码子经优化开放阅读框(版本1)。
SEQ ID NO:29-用于在植物中表达盐生巴夫藻Δ5-去饱和酶的密码子经优化开放阅读框(版本2)。
SEQ ID NO:30-盐生巴夫藻Δ5-去饱和酶。
SEQ ID NO:31–编码Pyramimonas cordataΔ5-去饱和酶的开放阅读框。
SEQ ID NO:32-Pyramimonas cordataΔ5-去饱和酶。
SEQ ID NO:33–编码Pyramimonas cordataΔ5-延长酶的开放阅读框。
SEQ ID NO:34-用于在植物中表达Pyramimonas cordataΔ5-延长酶的密码子经优化开放阅读框(版本1)。
SEQ ID NO:35-用于在植物中表达Pyramimonas cordataΔ5-延长酶的密码子经优化开放阅读框(版本2)。
SEQ ID NO:36-用于在植物中表达Pyramimonas cordataΔ5-延长酶的密码子经优化开放阅读框(版本3)。
SEQ ID NO:37-Pyramimonas cordataΔ5-延长酶。
SEQ ID NO:38-编码盐生巴夫藻Δ4-去饱和酶的开放阅读框。
SEQ ID NO:39-用于在植物中表达盐生巴夫藻Δ4-去饱和酶的密码子经优化开放阅读框(版本1)。
SEQ ID NO:40-用于在植物中表达盐生巴夫藻Δ4-去饱和酶的密码子经优化开放阅读框(版本2)。
SEQ ID NO:41-盐生巴夫藻Δ4-去饱和酶。
SEQ ID NO:42-编码球等鞭金藻Δ9-延长酶的开放阅读框。
SEQ ID NO:43-球等鞭金藻Δ9-延长酶。
SEQ ID NO:44-编码赫氏圆石藻(Emiliania huxleyi)CCMP1516Δ9-延长酶的开放阅读框。
SEQ ID NO:45-用于在植物中表达赫氏圆石藻Δ9-延长酶的密码子经优化开放阅读框。
SEQ ID NO 46-赫氏圆石藻CCMP1516Δ9-延长酶。
SEQ ID NO 47-编码Pavlova pinguisΔ9-延长酶的开放阅读框。
SEQ ID NO 48-Pavlova pinguisΔ9-延长酶。
SEQ ID NO 49-编码盐生巴夫藻Δ9-延长酶的开放阅读框。
SEQ ID NO 50-盐生巴夫藻Δ9-延长酶。
SEQ ID NO 51-编码盐生巴夫藻Δ8-去饱和酶的开放阅读框。
SEQ ID NO 52-盐生巴夫藻Δ8-去饱和酶。
SEQ ID NO 53-P19病毒抑制剂。
SEQ ID NO 54-V2病毒抑制剂。
SEQ ID NO 55-P38病毒抑制剂。
SEQ ID NO 56-Pe-P0病毒抑制剂。
SEQ ID NO 57-RPV-P0病毒抑制剂。
SEQ ID NO 58–编码P19病毒抑制剂的开放阅读框。
SEQ ID NO 59-编码V2病毒抑制剂的开放阅读框。
SEQ ID NO 60-编码P38病毒抑制剂的开放阅读框。
SEQ ID NO 61-编码Pe-P0病毒抑制剂的开放阅读框。
SEQ ID NO 62-编码RPV-P0病毒抑制剂的开放阅读框。
SEQ ID NO 63–拟南芥LPAAT2。
SEQ ID NO 64–白池花(Limnanthes alba)LPAAT。
SEQ ID NO 65-酿酒酵母(Saccharomyces cerevisiae)LPAAT。
SEQ ID NO 66-细小微胞藻LPAAT。
SEQ ID NO 67-高山被孢霉LPAAT。
SEQ ID NO 68-油菜LPAAT。
SEQ ID NO 69–油菜LPAAT。
SEQ ID NO 70-致病疫霉ω3去饱和酶。
SEQ ID NO 71-假微型海链藻(Thalassiosira pseudonana)ω3去饱和酶。
SEQ ID NO 72-畸雌腐霉ω3去饱和酶。
发明详述
一般技术和定义
除非另外具体说明,否则本文中所使用的所有技术和科学术语都应该被视为具有与本领域(例如细胞培养、分子遗传学、脂肪酸合成、转基因植物、蛋白质化学和生物化学领域)技术人员通常所理解的含义相同的含义。
除非另外指示,否则本发明中所利用的重组蛋白质、细胞培养和免疫学技术都是本领域技术人员众所周知的标准程序。这样的技术在文献中有充分描述和解释,诸如以下来源:J.Perbal,A Practical Guide to Molecular Cloning,John Wiley and Sons(1984);J.Sambrook等,Molecular Cloning:A Laboratory Manual,Cold Spring HarbourLaboratory Press(1989);T.A.Brown(编),Essential Molecular Biology:A PracticalApproach,第1卷和第2卷,IRL Press(1991);D.M.Glover和B.D.Hames(编),DNA Cloning:APractical Approach,第1-4卷,IRL Press(1995和1996);F.M.Ausubel等(编),CurrentProtocols in Molecular Biology,Greene Pub.Associates and Wiley-Interscience(1988,包括迄今的所有更新);Ed Harlow和David Lane(编),Antibodies:A LaboratoryManual,Cold Spring Harbour Laboratory,(1988);和J.E.Coligan等(编),CurrentProtocols in Immunology,John Wiley&Sons(包括迄今的所有更新)。
术语“和/或”,例如“X和/或Y”应理解为意味着“X和Y”或“X或Y”,并且将被视为明确支持两种含义或任一种含义。
除非有相反说明,否则如本文中所使用,术语“约”是指指定值的+/-10%,更优选+/-5%,更优选+/-1%。
纵观本说明书,词语“包含”或变化形式应理解为暗示包括所述元件、整数或步骤或元件、整数或步骤的族群,而不排除任何其它元件、整数或步骤或元件、整数或步骤的族群。
选定的定义
如本文中所使用,术语“提取的植物脂质”和“分离的植物脂质”是指例如通过粉碎从植物或其部分(诸如种子)中提取的脂质组合物。提取的脂质可以是通过例如粉碎植物种子而获得的相对粗制的组合物,或其中来源于所述植物材料的水、核酸、蛋白质和糖类中的一种或多种或每一种的大部分(如果不是全部)已经被去除的更纯组合物。以下描述了纯化方法的实例。在一个实施方案中,所提取或分离的植物脂质包含以组合物的重量计至少约60%、至少约70%、至少约80%、至少约90%或至少约95%(w/w)脂质。所述脂质在室温下可以是固体或液体,当为液体时,其被视为油。在一个实施方案中,本发明的提取脂质未掺有不是由另一种来源产生的诸如DHA(例如得自于鱼油的DHA)等另一种脂质。在一个实施方案中,在提取之后,油酸:DHA、棕榈酸:DHA、亚油酸:DHA和总ω6脂肪酸:总ω3脂肪酸中一项或多项或全部的比率当与完整种子或细胞中的比率相比时没有显著变化(例如,不大于10%或5%的变化)。在另一个实施方案中,所提取的植物脂质未暴露于诸如氢化或分级等程序,当与完整种子或细胞中的比率相比时,所述程序可能改变油酸:DHA、棕榈酸:DHA、亚油酸:DHA和总ω6脂肪酸:总ω3脂肪酸中一项或多项或全部的比率。当本发明的提取植物脂质包含在油中时,所述油还可能包含非脂肪酸分子,诸如甾醇。
如本文中所使用,术语“提取的植物油”和“分离的植物油”是指包含提取的植物脂质或分离的植物脂质且在在室温下为液体的物质或组合物。所述油是获自植物或其部分,诸如种子。提取的或分离的油可以是通过例如粉碎植物种子而获得的相对粗制的组合物,或其中来源于所述植物材料的水、核酸、蛋白质和糖类中的一种或多种或每一种的大部分(如果不是全部)已经被去除的更纯组合物。所述组合物可以包含其它组分,所述其它组分可以是脂质或非脂质。在一个实施方案中,油组合物包含至少约60%、至少约70%、至少约80%、至少约90%或至少约95%(w/w)提取的植物脂质。在一个实施方案中,本发明的提取油未掺有不是由另一种来源产生的诸如DHA(例如得自于鱼油的DHA)等另一种油。在一个实施方案中,在提取之后,油酸:DHA、棕榈酸:DHA、亚油酸:DHA和总ω6脂肪酸:总ω3脂肪酸中一项或多项或全部的比率当与完整种子或细胞中的比率相比时没有显著变化(例如,不大于10%或5%的变化)。在另一个实施方案中,所提取的植物油未暴露于诸如氢化或分级等程序,当与完整种子或细胞中的比率相比时,所述程序可能改变油酸:DHA、棕榈酸:DHA、亚油酸:DHA和总ω6脂肪酸:总ω3脂肪酸中一项或多项或全部的比率。本发明的提取植物油可以包含非脂肪酸分子,诸如甾醇。
如本文中所使用,“油”是主要包含脂质且在室温下为液体的组合物。举例来说,本发明的油优选包含以重量计至少75%、至少80%、至少85%或至少90%脂质。典型地,经纯化的油包含以所述油中的脂质的重量计为至少90%的三酰基甘油(TAG)。如本文中所描述,可能存在诸如二酰基甘油(DAG)、游离脂肪酸(FFA)、磷脂和甾醇等油的微量组分。
如本文中所使用,术语“脂肪酸”是指通常具有长脂肪族尾部的饱和或不饱和羧酸(或有机酸)。典型地,脂肪酸具有碳-碳键合链,其长度为至少8个碳原子,更优选地长度为至少12个碳。大部分天然存在的脂肪酸具有偶数个碳原子,因为其生物合成涉及具有两个碳原子的乙酸酯。脂肪酸可以呈游离状态(非酯化)或呈酯化形式,诸如作为甘油三酯、二酰基甘油、单酰基甘油的部分、酰基-CoA(硫酯)结合形式或其它结合形式。所述脂肪酸可酯化为磷脂,诸如磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰甘油、磷脂酰肌醇或二磷脂酰甘油形式。
“饱和脂肪酸”沿着链不含任何双键或其它官能团。术语“饱和”是指氢,其中所有的碳(除羧酸[-COOH]基以外)都含有尽可能多的氢。换句话说,ω端含有3个氢(CH3-),而链内的各个碳含有2个氢(-CH2-)。
“不饱和脂肪酸”与饱和脂肪酸具有类似形式,但沿着链存在一个或多个烯烃官能团,各烯烃将链中的单键连接的“-CH2-CH2-”部分置换为双键连接的“-CH=CH-”部分(即,一个碳与另一个碳双键连接)。链中结合于双键任一侧的下两个碳原子可以顺式或反式构型存在。
如本文中所使用,术语“单不饱和脂肪酸”是指在其碳链中包含至少12个碳原子且在链中仅有一个烯烃基(碳-碳双键)的脂肪酸。如本文中所使用,术语“多不饱和脂肪酸”或“PUFA”是指在其碳链中包含至少12个碳原子和至少两个烯烃基(碳-碳双键)的脂肪酸。
如本文中所使用,术语“长链多不饱和脂肪酸”和“LC-PUFA”是指在其碳链中包含至少20个碳原子和至少两个碳-碳双键的脂肪酸,且因此包括VLC-PUFA。如本文中所使用,术语“极长链多不饱和脂肪酸”和“VLC-PUFA”是指在其碳链中包含至少22个碳原子和至少三个碳-碳双键的脂肪酸。通常,脂肪酸碳链中的碳原子数是指非分支碳链。如果碳链是分支的,则碳原子数不包括侧基中的碳原子。在一个实施方案中,所述长链多不饱和脂肪酸是ω3脂肪酸,即从所述脂肪酸的甲基端开始在第三个碳-碳键中发生去饱和(碳-碳双键)。在另一个实施方案中,所述长链多不饱和脂肪酸是ω6脂肪酸,即从所述脂肪酸的甲基端开始在第六个碳-碳键中发生去饱和(碳-碳双键)。在另一个实施方案中,所述长链多不饱和脂肪酸是选自:花生四烯酸(ARA,20:4Δ5,8,11,14;ω6)、二十碳四烯酸(ETA,20:4Δ8,11,14,17;ω3)、二十碳五烯酸(EPA,20:5Δ5,8,11,14,17;ω3)、二十二碳五烯酸(DPA,22:5Δ7,10,13,16,19;ω3)或二十二碳六烯酸(DHA,22:6Δ4,7,10,13,16,19;ω3)。LC-PUFA也可以是二高-γ-亚油酸(DGLA)或二十碳三烯酸(ETrA,20:3Δ11,14,17;ω3)。显而易见,根据本发明产生的LC-PUFA可以是任何或所有上述各项的混合物,并且可包括其它LC-PUFA或这些LC-PUFA中任一种的衍生物。在一个优选实施方案中,所述ω3脂肪酸是至少DHA,优选地DPA和DHA,或EPA、DPA和DHA。
此外,如本文中所使用,术语“长链多不饱和脂肪酸”和“极长链多不饱和脂肪酸”是指呈游离状态(非酯化)或呈酯化形式的脂肪酸,诸如作为甘油三酯、二酰基甘油、单酰基甘油的部分、酰基-CoA结合形式或其它结合形式。所述脂肪酸可酯化为磷脂,诸如磷脂酰胆碱(PC)、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰甘油、磷脂酰肌醇或二磷脂酰甘油形式。因而,LC-PUFA可以混合物形式存在于细胞脂质或从细胞、组织或生物体提取的经纯化油或脂质中。在优选实施方案中,本发明所提供的油包含至少75%或至少85%三酰基甘油,其余部分作为其它形式的脂质存在,诸如所提到的那些,其中至少包含LC-PUFA的所述三酰基甘油。所述油随后可被进一步纯化或处理,例如通过用强碱水解以释放游离脂肪酸,或通过蒸馏等等。
如本文中所使用,“总ω6脂肪酸”或“总ω6脂肪酸含量”等等是指所提取的脂质、油、重组细胞、植物部分或种子中所有ω6脂肪酸(酯化和非酯化)的总和,如上下文所测定,表达为占总脂肪酸含量的百分比。这些ω6脂肪酸包括(如果存在)LA、GLA、DGLA、ARA、EDA和ω6-DPA,且不包括任何ω3脂肪酸和单不饱和脂肪酸。
如本文中所使用,“新ω6脂肪酸”或“新ω6脂肪酸含量”等等是指所提取的脂质、油、重组细胞、植物部分或种子中除LA以外的所有ω6脂肪酸(酯化和非酯化)的总和,如上下文所测定,表达为占总脂肪酸含量的百分比。这些新ω6脂肪酸是通过表达引入细胞中的基因构建体(外源多核苷酸)而在本发明的细胞、植物、植物部分和种子中产生的脂肪酸,且包括(如果存在)GLA、DGLA、ARA、EDA和ω6-DPA,但不包括LA和任何ω3脂肪酸和单不饱和脂肪酸。示例性总ω6脂肪酸含量和新ω6脂肪酸含量是通过如实施例1中所描述将样品中的脂肪酸转化成FAME且利用GC进行分析来确定。
如本文中所使用,“总ω3脂肪酸”或“总ω3脂肪酸含量”等等是指所提取的脂质、油、重组细胞、植物部分或种子中所有ω3脂肪酸(酯化和非酯化)的总和,如上下文所测定,表达为占总脂肪酸含量的百分比。这些ω3脂肪酸包括(如果存在)ALA、SDA、ETrA、ETA、EPA、DPA和DHA,且不包括任何ω6脂肪酸和单不饱和脂肪酸。
如本文中所使用,“新ω3脂肪酸”或“新ω3脂肪酸含量”等等是指所提取的脂质、油、重组细胞、植物部分或种子中除ALA以外的所有ω3脂肪酸(酯化和非酯化)的总和,如上下文所测定,表达为占总脂肪酸含量的百分比。这些新ω3脂肪酸是通过表达引入细胞中的基因构建体(外源多核苷酸)而在本发明的细胞、植物、植物部分和种子中产生的脂肪酸,且包括(如果存在)SDA、ETrA、ETA、EPA、DPA和DHA,但不包括ALA和任何ω6脂肪酸和单不饱和脂肪酸。示例性总ω3脂肪酸含量和新ω3脂肪酸含量是通过如实施例1中所描述将样品中的脂肪酸转化成FAME且利用GC进行分析来确定。
可用于本发明的去饱和酶、延长酶和酰基转移酶蛋白质和其编码基因是本领域中已知的任一种或其同系物或衍生物。表1中列出了这样的基因的实例和所编码蛋白质的大小。据显示参与LC-PUFA生物合成的去饱和酶都属于所谓的“前端”去饱和酶族群。
如本文中所使用,术语“前端去饱和酶”是指能在脂质的酰基链的羧基与预先存在的不饱和部分之间引入双键的一类酶的成员,其结构特征为存在N末端细胞色素b5结构域以及典型脂肪酸去饱和酶结构域,所述典型脂肪酸去饱和酶结构域包括三个高度保守的组氨酸盒(Napier等,1997)。
可通过以下方式测试用于本发明的延长酶或去饱和酶中任一种的活性:在诸如酵母细胞、植物细胞等细胞中或优选在体细胞胚或转基因植物中表达编码所述酶的基因,和确定所述细胞、胚或植物产生LC-PUFA的能力与不表达所述酶的相应细胞、胚或植物相比是否有所增加。
在一个实施方案中,用于本发明的去饱和酶和/或延长酶中的一种或多种可由微藻类中提纯而来,即,在氨基酸序列上与可从微藻类中提纯而来的多肽同一。
尽管本文中将某些酶具体描述为“双功能的”,但不存在该术语未必暗示特定酶不具有除具体定义的活性以外的活性。
去饱和酶
如本文中所使用,术语“去饱和酶”是指能够将碳-碳双键酶引入脂肪酸底物的酰基中的酶,所述脂肪酸底物典型地呈酯化形式,诸如酰基-CoA酯。酰基可酯化成磷脂,诸如磷脂酰胆碱(PC)或酰基载体蛋白(ACP)或在一个优选实施方案中酯化成CoA。相应地,去饱和酶一般可以分类为三组。在一个实施方案中,所述去饱和酶是前端去饱和酶。
如本文中所使用,“Δ4-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的羧基端起第4个碳-碳键处引入碳-碳双键的蛋白质。“Δ4-去饱和酶”至少能够将DPA转化成DHA。在除哺乳动物以外的生物体中,由DPA产生DHA的去饱和步骤是由Δ4-去饱和酶催化,并且已经从淡水原生生物小眼虫和海洋物种破囊壶菌属中分离出编码这种酶的基因(Qiu等,2001;Meyer等,2003)。在一个实施方案中,所述Δ4-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:41中所提供的序列或破囊壶菌属Δ4-去饱和酶、其生物学活性片段或与SEQ ID NO:41具有至少80%同一性的氨基酸序列。
表1.参与LC-PUFA生物合成的克隆的基因
*http://www.ncbi.nlm.nih.gov/ **功能未证实/未确定
如本文中所使用,“Δ5-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的羧基端起第5个碳-碳键处引入碳-碳双键的蛋白质。Ruiz-Lopez等(2012)和Petrie等(2010a)和本文中的表1中列出了Δ5-去饱和酶的实例。在一个实施方案中,Δ5-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:30中所提供的序列、其生物学活性片段或与SEQ ID NO:30具有至少80%同一性的氨基酸序列。在另一个实施方案中,Δ5-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:32中所提供的序列、其生物学活性片段或与SEQ ID NO:32具有至少53%同一性的氨基酸序列。在另一个实施方案中,所述Δ5-去饱和酶是得自于破囊壶菌或赫氏圆石藻。
如本文中所使用,“Δ6-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的羧基端起第6个碳-碳键处引入碳-碳双键的蛋白质。Ruiz-Lopez等(2012)和Petrie等(2010a)和本文中的表1中列出了Δ6-去饱和酶的实例。优选的Δ6-去饱和酶是得自于细小微胞藻、畸雌腐霉或青绿藻。
在一个实施方案中,Δ6-去饱和酶的另一特征在于具有以下各种中的至少两项,优选具有所有三项且优选在植物细胞中:i)对作为脂肪酸底物的α-亚麻酸(ALA,18:3Δ9,12,15,ω3)的Δ6-去饱和酶活性大于对亚油酸(LA,18:2Δ9,12,ω6)的Δ6-去饱和酶活性;ii)对作为脂肪酸底物的ALA-CoA的Δ6-去饱和酶活性大于对作为脂肪酸底物的连接于PC的sn-2位置的ALA的Δ6-去饱和酶活性;iii)对ETrA具有Δ8-去饱和酶活性。表2中提供了这样的Δ6-去饱和酶的实例。
在一个实施方案中,Δ6-去饱和酶对ω3底物的活性大于对对应ω6底物的活性,且对ALA具有活性,以便产生十八碳四烯酸(硬脂四烯酸,SDA,18:4Δ6,9,12,15,ω3),当由外源多核苷酸表达于诸如植物细胞等重组细胞中时,效率为至少30%,更优选为至少40%,或最优选为至少50%;或当表达于酵母细胞中时,效率为至少35%。在一个实施方案中,Δ6-去饱和酶对作为脂肪酸底物的ALA的活性高于对LA的活性,例如高至少约2倍Δ6-去饱和酶活性。在另一个实施方案中,Δ6-去饱和酶对作为脂肪酸底物的ALA-CoA的活性高于对作为脂肪酸底物的连接于PC的sn-2位置的ALA的活性,例如高至少约5倍的Δ6-去饱和酶活性或高至少10倍的活性。在另一个实施方案中,Δ6-去饱和酶对两种脂肪酸底物ALA-CoA和连接于PC的sn-2位置的ALA都具有活性。
表2.经证实对酰基-CoA底物具有活性的去饱和酶
在一个实施方案中,Δ6-去饱和酶对ETA不具有可检测的Δ5-去饱和酶活性。在另一个实施方案中,Δ6-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:16、SEQ IDNO:19或SEQ ID NO:20中所提供的序列、其生物学活性片段或与SEQ ID NO:16、SEQ ID NO:19或SEQ ID NO:20具有至少77%同一性的氨基酸序列。在另一个实施方案中,Δ6-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:19或SEQ ID NO:20中所提供的序列、其生物学活性片段或与SEQ ID NO:19或SEQ ID NO:20具有至少67%同一性的氨基酸序列。Δ6-去饱和酶也可能具有Δ8-去饱和酶活性。
如本文中所使用,“Δ8-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的羧基端起第8个碳-碳键处引入碳-碳双键的蛋白质。Δ8-去饱和酶至少能够将ETrA转化成ETA。表1中列出了Δ8-去饱和酶的实例。在一个实施方案中,Δ8-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:52中所提供的序列、其生物学活性片段或与SEQ ID NO:52具有至少80%同一性的氨基酸序列。
如本文中所使用,“ω3-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的甲基端起第3个碳-碳键处引入碳-碳双键的蛋白质。ω3-去饱和酶因此可以将LA转化成ALA并且将GLA转化成SDA(所有C18脂肪酸)或将DGLA转化成ETA和/或将ARA转化成EPA(C20脂肪酸)。一些ω3-去饱和酶(第I组)仅对C18底物具有活性,诸如植物和蓝藻ω3-去饱和酶。这样的ω3-去饱和酶也是Δ15-去饱和酶。其它ω3-去饱和酶对C20底物具有活性,对C18底物不具有活性(第II组)或具有一定活性(第III组)。这样的ω3-去饱和酶也是Δ17-去饱和酶。优选的ω3-去饱和酶是第III组类型,其将LA转化成ALA、将GLA转化成SDA、将DGLA转化成ETA且将ARA转化成EPA,诸如巴斯德毕赤酵母ω3-去饱和酶(SEQ ID NO:12)。ω3-去饱和酶的实例包括以下各项:Pereira等(2004a)(异丝水霉ω3-去饱和酶,第II组)、Horiguchi等(1998)、Berberich等(1998)和Spychalla等(1997)(秀丽隐杆线虫ω3-去饱和酶,第III组)。在一个优选实施方案中,ω3-去饱和酶是真菌ω3-去饱和酶。如本文中所使用,“真菌ω3-去饱和酶”是指来自于真菌来源(包括卵菌)来源的ω3-去饱和酶,或氨基酸序列与其具有至少95%同一性的其变体。已经从真菌来源分离出编码许多ω3-去饱和酶的基因,诸如致病疫霉(登录号CAJ30870,WO2005083053;SEQ ID NO:70)、异丝水霉(登录号AAR20444,Pereira等,2004a和美国专利7211656)、畸雌腐霉(WO2008022963,第II组;SEQID NO:72)、高山被孢霉(Sakuradani等,2005;登录号BAD91495;WO2006019192)、假微型海链藻(Armbrust等,2004;登录号XP_002291057;WO2005012316,SEQ ID NO:71)、克鲁维郎香酵母(也称为克鲁维糖酵母(Saccharomyces kluyveri);Oura等,2004;登录号AB 118663)。Xue等(2012)描述了得自于卵菌瓜果腐霉菌、大豆疫霉菌和栎树猝死病菌的ω3-去饱和酶,其能够有效地将ω6脂肪酸底物转化成相应ω3脂肪酸,偏好C20底物,即,其Δ17-去饱和酶活性强于Δ15-去饱和酶活性。这些酶缺乏Δ12-去饱和酶活性,但可使用酰基-CoA和磷脂级分中的脂肪酸作为底物。
在一个更优选实施方案中,真菌ω3-去饱和酶是巴斯德毕赤酵母(也称为巴斯德驹形氏酵母)ω3-去饱和酶/Δ15-去饱和酶(Zhang等,2008;登录号EF116884;SEQ ID NO:12)或与其具有至少95%同一性的多肽。
在一个实施方案中,ω3-去饱和酶至少能够实现将ARA转化成EPA、将DGLA转化成ETA、将GLA转化成SDA之一、将ARA转化成EPA且将DGLA转化成ETA、将ARA转化成EPA且将GLA转化成SDA或所有这三种转化。
在一个实施方案中,ω3-去饱和酶对具有至少三个碳-碳双键、优选为ARA的C20脂肪酸具有Δ17-去饱和酶活性。在另一个实施方案中,ω3-去饱和酶对具有三个碳-碳双键、优选为GLA的C18脂肪酸具有Δ15-去饱和酶活性。优选地,两种活性都存在。
如本文中所使用,“Δ12-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的羧基端起第12个碳-碳键处引入碳-碳双键的蛋白质。Δ12-去饱和酶典型地将油酰基磷脂酰胆碱或油酰基-CoA分别转化成亚麻酰基磷脂酰胆碱(18:1-PC)或亚麻酰基-CoA(18:1-CoA)。使用PC连接的底物的子类称为磷脂依赖性Δ12-去饱和酶,后一个子类称为酰基-CoA依赖性Δ12-去饱和酶。植物和真菌Δ12-去饱和酶一般属于前一种子类,而动物Δ12-去饱和酶属于后一种子类,例如由Zhou等(2008)从昆虫克隆的基因所编码的Δ12-去饱和酶。可通过检索序列数据库容易地鉴别许多其它Δ12-去饱和酶序列。
如本文中所使用,“Δ15-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的羧基端起第15个碳-碳键处引入碳-碳双键的蛋白质。已经从植物和真菌物种中克隆了许多编码Δ15-去饱和酶的基因。举例来说,US5952544描述了编码植物Δ15-去饱和酶(FAD3)的核酸。这些酶包含植物Δ15-去饱和酶所特有的氨基酸基序。WO200114538描述了一种编码大豆FAD3的基因。可通过检索序列数据库容易地鉴别许多其它Δ15-去饱和酶序列。
如本文中所使用,“Δ17-去饱和酶”是指能进行去饱和酶反应从而在从脂肪酸底物的羧基端起第17个碳-碳键处引入碳-碳双键的蛋白质。如果Δ17-去饱和酶作用于C20底物从而在ω3键处引入去饱和,则其也被视为ω3-去饱和酶。
在一个优选实施方案中,Δ12-去饱和酶和/或Δ15-去饱和酶是真菌Δ12-去饱和酶或真菌Δ15-去饱和酶。如本文中所使用,“真菌Δ12-去饱和酶”或“真菌Δ15-去饱和酶”是指来自于真菌来源(包括卵菌来源)的Δ12-去饱和酶或Δ15-去饱和酶或氨基酸序列与其具有至少95%同一性的变体。已经从真菌来源分离了编码许多去饱和酶的基因。US7211656描述了得自于异丝水霉的Δ12去饱和酶。WO2009016202描述了得自于泽蛭(Helobdella robusta)、二色蜡蘑(Laccaria bicolor)、霸王莲花青螺(Lottiagigantea)、微鞘藻(Microcoleus chthonoplastes)、领鞭毛虫(Monosiga brevicollis)、香蕉黑条叶斑病菌(Mycosphaerella fijiensis)、禾生球腔菌(Mycospaerellagraminicola)、尾刺耐格里原虫(Naegleria gruben)、红球丛赤壳(Nectriahaematococca)、海葵(Nematostella vectensis)、布拉克须霉(Phycomycesblakesleeanus)、里氏木霉(Trichoderma resii)、小立碗藓、褐腐菌(Postia placenta)、穗状地衣(Selaginella moellendorffii)和雪霉微座孢(Microdochium nivale)的真菌去饱和酶。WO2005/012316描述了得自于假微型海链藻和其它真菌的Δ12-去饱和酶。WO2003/099216描述了编码从粗糙链孢霉(Neurospora crassa)、构巢曲霉(Aspergillusnidulans)、灰葡萄孢(Botrytis cinerea)和高山被孢霉分离的真菌Δ12-去饱和酶和Δ15-去饱和酶的基因。WO2007133425描述了从以下各物分离的真菌Δ15去饱和酶:克鲁维酵母(Saccharomyces kluyveri)、高山被孢霉、构巢曲霉、粗糙链孢霉(Neurospora crassa)、禾谷镰孢菌(Fusarium graminearum)、串珠镰孢菌(Fusarium moniliforme)和稻瘟病菌(Magnaporthe grisea)。优选Δ12去饱和酶来自于大豆疫霉菌(Ruiz-Lopez等,2012)。
真菌Δ12-去饱和酶和真菌Δ15-去饱和酶的一个独特子类是双功能真菌Δ12/Δ15-去饱和酶。已经从以下各物中克隆了编码这些酶的基因:串珠镰孢菌(登录号DQ272516,Damude等,2006)、卡氏棘阿米巴(Acanthamoeba castellanii)(登录号EF017656,Sayanova等,2006)、海生鞭孢簇虫(Perkinsus marinus)(WO2007042510)、麦角菌(Clavicepspurpurea)(登录号EF536898,Meesapyodsuk等,2007)和灰盖鬼伞(Coprinus cinereus)(登录号AF269266,Zhang等,2007)。
在另一个实施方案中,与相应酰基-PC底物的活性相比,ω3-去饱和酶对酰基-CoA底物具有至少一些活性,优选地具有更大活性。如本文中所使用,“相应酰基-PC底物”是指在磷脂酰胆碱(PC)的sn-2位置上酯化的脂肪酸,其中所述脂肪酸是与酰基-CoA底物中相同的脂肪酸。举例来说,酰基-CoA底物可以是ARA-CoA,且相应酰基-PC底物是sn-2ARA-PC。在一个实施方案中,所述活性高至少两倍。优选地,所述ω3-去饱和酶对酰基-CoA底物及其相应酰基-PC底物具有至少一些活性且对C18和C20底物都具有活性。这样的ω3-去饱和酶的实例是已知的,尤其是上文所列出的克隆真菌去饱和酶。
在另一个实施方案中,所述ω3-去饱和酶包含如下氨基酸,所述氨基酸具有如SEQID NO:12中所提供的序列、其生物学活性片段或与SEQ ID NO:12具有至少60%同一性、优选与SEQ ID NO:12具有至少90%或至少95%同一性的氨基酸序列。
在另一个实施方案中,用于本发明的去饱和酶对酰基-CoA底物的活性高于对相应酰基-PC底物的活性。在另一个实施方案中,用于本发明的去饱和酶对酰基-PC底物的活性高于对相应酰基-CoA底物的活性,但对两种底物都具有一定的活性。如上文中所述,“相应酰基-PC底物”是指在磷脂酰胆碱(PC)的sn-2位置上酯化的脂肪酸,其中所述脂肪酸是与酰基-CoA底物中相同的脂肪酸。在一个实施方案中,所述更高活性是高至少两倍。在一个实施方案中,所述去饱和酶是Δ5或Δ6-去饱和酶,或ω3-去饱和酶,所提供的其实例为但不限于表2中所列出的那些。为了测试去饱和酶作用于哪种底物,即酰基-CoA或酰基-PC底物,可如Domergue等(2003)和(2005)中所描述在酵母细胞中进行测定。当延长酶在与去饱和酶一起表达时在植物细胞中具有至少约90%的酶转化效率时,也可以推断去饱和酶能够作用于酰基-CoA底物,其中所述延长酶催化去饱和酶产物延长。基于此,由GA7构建体(实施例2和3)及其变体(实施例5)表达的Δ5-去饱和酶和Δ4-去饱和酶能够将其相应酰基-CoA底物、ETA-CoA和DPA-CoA去饱和化。
延长酶
生物化学证据表明脂肪酸延长由4个步骤组成:缩合、还原、脱水和第二次还原。在本发明上下文中,“延长酶”是指在合适的生理学条件下,在存在延长复合物的其它成员的情况下能催化缩合步骤的多肽。已经证明,相应酰基链的延长仅需要在细胞中异源或同源表达延长蛋白复合物的缩合组分(“延长酶”)。因而,所引入的延长酶能够成功募集转基因宿主的还原和脱水活性,以进行成功的酰基延长。就脂肪酸底物的链长和去饱和度而言,认为延长反应的特异性在于所述缩合组分。该组分也被认为在延长反应中具有速率限制性。
如本文中所使用,“Δ5-延长酶”至少能够将EPA转化成DPA。Δ5-延长酶的实例包括WO2005/103253中所公开的那些。在一个实施方案中,所述Δ5-延长酶对EPA具有活性,从而以至少60%、更优选地至少65%、更优选地至少70%或最优选地至少80%或90%的效率产生DPA。在另一个实施方案中,所述Δ5-延长酶包含如SEQ ID NO:37中所提供的氨基酸序列、其生物学活性片段或与SEQ ID NO:37具有至少47%同一性的氨基酸序列。在另一个实施方案中,所述Δ6-延长酶来自于青绿藻或绿色鞭毛藻(US2010/088776)。
如本文中所使用,“Δ6-延长酶”至少能够将SDA转化成ETA。Δ6-延长酶的实例包括表1中所列出的那些。在一个实施方案中,所述延长酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:25中所提供的序列、其生物学活性片段(诸如SEQ ID NO:26所提供的片段)或与SEQ ID NO:25或SEQ ID NO:26之一或两者具有至少55%同一性的氨基酸序列。在一个实施方案中,Δ6-延长酶来自于小立碗藓(Zank等,2002;登录号AF428243)或假微型海链藻(Ruiz-Lopez等,2012)。
如本文中所使用,“Δ9-延长酶”至少能够将ALA转化成ETrA。Δ9-延长酶的实例包括表1中所列出的那些。在一个实施方案中,所述Δ9-延长酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:43中所提供的序列、其生物学活性片段或与SEQ ID NO:43具有至少80%同一性的氨基酸序列。在另一个实施方案中,所述Δ9-延长酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:46中所提供的序列、其生物学活性片段或与SEQ ID NO:46具有至少81%同一性的氨基酸序列。在另一个实施方案中,所述Δ9-延长酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:48中所提供的序列、其生物学活性片段或与SEQ ID NO:48具有至少50%同一性的氨基酸序列。在另一个实施方案中,所述Δ9-延长酶包含如下氨基酸,所述氨基酸具有如SEQ ID NO:50中所提供的序列、其生物学活性片段或与SEQ ID NO:50具有至少50%同一性的氨基酸序列。在另一个实施方案中,所述Δ9-延长酶对ω6底物的活性高于对相应ω3底物的活性,或相反。
如本文中所使用,术语“对ω6底物的活性高于对相应ω3底物的活性”是指不同在于ω3去饱和酶的作用的所述酶对底物的相对活性。优选地,ω6底物是LA且ω3底物是ALA。
具有Δ6-延长酶和Δ9-延长酶活性的延长酶至少能够(i)将SDA转化成ETA和(ii)将ALA转化成ETrA,且Δ6-延长酶活性高于Δ9-延长酶活性。在一个实施方案中,所述延长酶转化SDA以产生ETA的效率是至少50%,更优选地至少60%,和/或转化ALA以产生ETrA的效率是至少6%或更优选地至少9%。在另一个实施方案中,所述延长酶的Δ6-延长酶活性比Δ9-延长酶活性高至少约6.5倍。在另一个实施方案中,所述延长酶不具有可检测的Δ5-延长酶活性。
其它酶
如本文中所使用,术语“1-酰基-甘油-3-磷酸酯酰基转移酶”(LPAAT),也称为溶血磷脂酸-酰基转移酶或酰基CoA-溶血磷脂酸酯-酰基转移酶,是指能使sn-2位置上的sn-1-酰基-甘油-3-磷酸酯(sn-1G-3-P)酰化以形成磷脂酸(PA)的蛋白质。因而,术语“1-酰基-甘油-3-磷酸酯酰基转移酶活性”是指(sn-1G-3-P)在sn-2位置上酰化产生PA(EC 2.3.1.51)。优选的LPAAT是可使用多不饱和C22酰基-CoA作为底物以便将多不饱和C22酰基转移至LPA的sn-2位置,从而形成PA的那些。这样的LPAAT例示于实施例13中且可如其中所描述进行测试。在一个实施方案中,可用于本发明的LPAAT包含如下氨基酸,所述氨基酸具有如SEQ IDNO:63至69中的任一个所提供的序列、其生物学活性片段或与SEQ ID NO:63至69中的一个或多个具有至少40%同一性的氨基酸序列。在一个优选的实施方案中,可用于本发明的LPAAT包含如下氨基酸,所述氨基酸具有如SEQ ID NO:64、65和67中的任一个所提供的序列、其生物学活性片段或与SEQ ID NO:64、65和67中的一个或多个具有至少40%同一性的氨基酸序列。
如本文中所使用,术语“二酰基甘油酰基转移酶”(EC 2.3.1.20;DGAT)是指能将脂肪酰基从酰基-CoA转移至二酰基甘油底物以产生三酰基甘油的蛋白质。因而,术语“二酰基甘油酰基转移酶活性”是指将酰基-CoA转移至二酰基甘油以产生三酰基甘油。有三种已知类型的DGAT,分别称为DGAT1、DGAT2和DGAT3。DGAT1多肽典型地具有10个跨膜结构域,DGAT2多肽典型地具有2个跨膜结构域,而DGAT3典型地是可溶的。DGAT1多肽的实例包括由来自于以下物种的DGAT1基因编码的多肽:烟曲霉(Aspergillus fumigatus)(登录号X P_755172)、拟南芥(CAB44774)、蓖麻(Ricinus communis)(AAR11479)、油桐(Verniciafordii)(ABC94472)、咸虾花(Vernonia galamensis)(ABV21945,ABV21946)、鬼箭羽(Euonymus alatus)(AAV31083)、秀丽隐杆线虫(AAF82410)、褐家鼠(Rattus norvegicus)(NP_445889)、智人(NP_036211)以及其变体和/或突变体。DGAT2多肽的实例包括由来自于以下物种的DGAT2基因编码的多肽:拟南芥(登录号NP_566952)、蓖麻(AAY16324)、油桐(ABC94474)、拉曼孢霉(Mortierella ramanniana)(AAK84179)、智人(Q96PD7,Q58HT5)、普通牛(Bos taurus)(Q70VD8)、小家鼠(Mus musculus)(AAK84175)、微胞藻CCMP1545以及其变体和/或突变体。DGAT3多肽的实例包括由来自于以下物种的DGAT3基因编码的多肽:花生(落花生(Arachis hypogaea),Saha等,2006)以及其变体和/或突变体。
多肽/肽
术语“重组”在多肽的上下文中是指当所述多肽由细胞或在无细胞表达系统中产生时与其在天然情况下产生时的天然状态相比在量和速率方面有所改变。在一个实施方案中,所述细胞是在天然情况下不产生所述多肽的细胞。然而,所述细胞可以是包含能改变所产生的多肽的量非内源基因的细胞。本发明的重组多肽包括能产生所述多肽的细胞、组织、器官或生物体或无细胞表达系统中的多肽,即,未经过纯化或未与产生所述多肽的转基因(重组)细胞的其它组分分离的多肽,和在这样的细胞或无细胞系统中产生且随后与至少一些其它组分纯化分离的多肽。
术语“多肽”和“蛋白质”一般可互换使用。
一种多肽或一类多肽可以通过其氨基酸序列与参考氨基酸序列的同一性程度(%同一性),或通过其与一个参考氨基酸序列的%同一性高于与另一个参考氨基酸序列的%同一性来定义。多肽与参考氨基酸序列的%同一性典型地通过GAP分析(Needleman和Wunsch,1970;GCG程序)来确定,所用参数为:间隙创建罚分=5和间隙延伸罚分=0.3。查询序列的长度为至少15个氨基酸,且GAP分析在具有至少15个氨基酸的区域上比对两个序列。更优选地,查询序列的长度为至少50个氨基酸,且GAP分析在具有至少50个氨基酸的区域上比对两个序列。更优选地,查询序列的长度为至少100个氨基酸,且GAP分析在具有至少100个氨基酸的区域上比对两个序列。甚至更优选地,查询序列的长度为至少250个氨基酸,且GAP分析在具有至少250个氨基酸的区域上比对两个序列。甚至更优选地,GAP分析比对两个序列的整个长度。所述多肽或所述类别的多肽可与参考多肽具有相同的酶活性或不同的活性,或缺乏所述活性。优选地,所述多肽的酶活性是参考多肽的活性的至少10%、至少50%、至少75%或至少90%。
如本文中所使用,“生物学活性”片段是本文中所定义的多肽的一部分,其保持全长参考多肽的所定义的活性,例如具有去饱和酶和/或延长酶活性或其它酶活性。如本文中所使用的生物学活性片段不包括全长多肽。生物学活性片段可以是任何尺寸的部分,条件是其保持所定义的活性。优选地,生物学活性片段保持全长蛋白质活性的至少10%、至少50%、至少75%或至少90%。
就所定义的多肽或酶而言,应了解,高于本文中所提供的那些数值的%同一性数值将涵盖优选的实施方案。因而,在适当的情况下,与最低%同一性数值相比,优选所述多肽/酶所包含的氨基酸序列与相关指定SEQ ID NO具有至少60%、更优选地至少65%、更优选地至少70%、更优选地至少75%、更优选地至少76%、更优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、更优选地至少93%、更优选地至少94%、更优选地至少95%、更优选地至少96%、更优选地至少97%、更优选地至少98%、更优选地至少99%、更优选地至少99.1%、更优选地至少99.2%、更优选地至少99.3%、更优选地至少99.4%、更优选地至少99.5%、更优选地至少99.6%、更优选地至少99.7%、更优选地至少99.8%且甚至更优选地至少99.9%的同一性。
本文中所定义的多肽的氨基酸序列变体/突变体可以通过在本文中所定义的核酸内引入适当的核苷酸变化或通过体外合成所需多肽来制备。这样的变体/突变体包括例如氨基酸序列内残基的缺失、插入或取代。可进行缺失、插入和取代的组合来获得最终构建体,条件是最终肽产物具有所需的酶活性。
可通过使用本领域中已知的任何技术来制备突变的(改变的)肽。举例来说,可如Harayama(1998)广泛描述对本文中所定义的多核苷酸进行体外突变诱发或DNA改组技术。可以使用本文中所描述的技术容易地筛选源自于突变的/改变的DNA的产物以确定其是否具有例如去饱和酶或延长酶活性。
在设计氨基酸序列突变体时,突变位点的位置和突变的性质将取决于欲修饰的特征。可个别地或连续地修饰突变位点,例如通过(1)首先选择保守性氨基酸进行取代,然后取决于所实现的结果进行较激进的选择;(2)缺失靶残基;或(3)在与所定位的位点相邻处插入其它残基。
氨基酸序列缺失一般在约1至15个残基范围内,更优选地在约1至10个残基范围内且典型地在约1至5个连续残基范围内。
取代突变体去除多肽分子中的至少一个氨基酸残基且在该处插入一个不同的残基。取代型突变诱发的最感兴趣的位点包括在天然存在的去饱和酶或延长酶中不保守的位点。这些位点优选地以相对保守的方式经取代,以便保持酶活性。表3中在“示例性取代”栏目下示出了这样的保守取代。
在一个优选的实施方案中,当与天然存在的多肽相比时,突变体/变体多肽仅具有或具有不多于1个或2个或3个或4个保守氨基酸变化。表3中提供了保守氨基酸变化的详情。如本领域技术人员应知晓,可以合理地预测当在重组细胞中表达时,这样的少数变化不会改变多肽的活性。
可以用多种方式产生多肽,包括根据本领域中已知的方法产生和回收天然多肽或重组多肽。在一个实施方案中,通过在能有效产生多肽的条件下培养能够表达所述多肽的细胞(诸如本文中所定义的宿主细胞)来产生重组多肽。更优选的用于产生多肽的细胞是植物细胞,尤其是植物种子中的细胞。
多核苷酸
本发明还提供和/或使用了多核苷酸,其可以是例如基因、分离的多核苷酸、诸如T-DNA分子等嵌合基因构建体或嵌合DNA。其可以是基因组和合成来源的的DNA或RNA,可以是双链或单链的,并且与碳水化合物、脂质、蛋白质或其它材料组合以履行本文中所定义的活性。术语“多核苷酸”在本文中与术语“核酸分子”可互换使用。“分离的多核苷酸”意味着如果是从天然来源获得则已经与在其天然状态下与其结合或连接的多核苷酸序列分离的多核苷酸,或非天然存在的多核苷酸。优选地,分离的多核苷酸至少60%、更优选地至少75%且更优选地至少90%不含与其天然结合的其它组分。
表3.示例性取代
原残基 示例性取代
Ala(A) val:leu;ile;gly
Arg(R) lys
Asn(N) gln;his
Asp(D) glu
Cys(C) ser
Gln(Q) asn;his
Glu(E) asp
Gly(G) pro,ala
His(H) ash;gln
Ile(I) leu;val;ala
Leu(L) ile;val;met;ala;phe
Lys(K) arg
Met(M) leu;phe
Phe(F) leu;val;ala
Pro(P) gly
Ser(S) thr
Thr(T) ser
Trp(W) tyr
Tyr(Y) trp;phe
Val(V) ile;leu:met;phe,ala
在一个实施方案中,本发明的多核苷酸是非天然存在的。非天然存在的多核苷酸的实例包括但不限于已经突变的那些(诸如通过使用本文中所描述的方法)和编码蛋白质的开放阅读框可操作地连接于在天然情况下不与其结合的启动子(诸如在本文中所描述的构建体中)的多核苷酸。
如本文中所使用,术语“基因”取其最广泛含义且包括脱氧核糖核苷酸序列,所述序列包含转录区和(如果经过翻译的话)结构基因的蛋白质编码区,并且包括位于与5′和3′端上的所述编码区相邻处与任一端相距至少约2kb距离且参与所述基因的表达的序列。就此而言,所述基因包括天然情况下与给定基因结合的诸如启动子、增强子、终止和/或多腺苷酸化信号等控制信号,或异源控制信号,在该情况下所述基因称为“嵌合基因”。位于蛋白质编码区5'端且存在于mRNA上的序列称为5'非翻译序列。位于蛋白质编码区3'端或下游且存在于mRNA上的序列称为3'非翻译序列。术语“基因”涵盖基因的cDNA和基因组形式。基因的基因组形式或克隆含有可能间杂有被称为“内含子”或“干扰区”或“干扰序列”的非编码序列的编码区。内含子是被转录至核RNA(hnRNA)中的基因区段。内含子可含有诸如增强子等调控元件。内含子将从核转录产物或初级转录产物中去除或“剪切出”,因此信使RNA(mRNA)转录物中不存在内含子。mRNA的功能是在翻译过程中确定新生多肽中的氨基酸的序列或顺序。术语“基因”包括编码全部或部分本文中所描述的本发明蛋白质的合成或融合分子以及上述任一者的互补核苷酸序列。
如本文中所使用,术语“嵌合DNA”或“嵌合基因构建体”是指不是处于其非天然位置上的天然DNA分子的任何DNA分子,在本文中也称为“DNA构建体”。典型地,嵌合DNA或嵌合基因包含在自然界中未发现可操作地连接在一起,即相对于彼此为异源的调控序列和转录序列或蛋白质编码序列。因此,嵌合DNA或嵌合基因可包含来源于不同来源的调控序列和编码序列,或来源于相同来源但以不同于自然界中所发现的方式排列的调控序列和编码序列。
术语“内源性”在本文中用于指例如未修饰植物与所研究的植物中在同一发育阶段中正常存在或产生的物质。“内源性基因”是指生物体基因组中的天然位置上的天然基因。如本文中所使用,“重组核酸分子”、“重组多核苷酸”或其变体是指通过重组DNA技术构建或修饰的核酸分子。术语“外来多核苷酸”或“外源性多核苷酸”或“异源多核苷酸”等等是指通过实验操作引入细胞的基因组中的任何核酸。外来或外源基因可以是插入非天然生物体内的基因、引入天然宿主细胞内的新位置上的天然基因或嵌合基因。“转基因”是已经通过转化程序引入基因组中的基因。术语“基因修饰”、“转基因”及其变化形式包括通过转化或转导将基因引入细胞中,从而使细胞内的基因突变并且改变或调节已经进行了这些行为的细胞或生物体或其子代的基因调控。如本文中所使用的“基因组区”是指已经将一个转基因或一组转基因(在本文中也称为簇)插入细胞或其祖先内的基因组内位置。这样的区域仅包含已经通过人为干预(诸如通过本文中所描述的方法)并入的核苷酸。
术语“外源性”在多核苷酸上下文中是指当存在于细胞中时与其天然状态相比存在量有所改变的多核苷酸。在一个实施方案中,所述细胞是在天然条件下不包含所述多核苷酸的细胞。然而,所述细胞可能是包含导致所编码的多肽的产量发生变化的非内源性多核苷酸的细胞。本发明的外源性多核苷酸包括尚未与它们存在于其中的转基因(重组)细胞或无细胞表达系统的其它组分分离的多核苷酸,和这样的细胞或无细胞表达系统中产生且随后与至少一些其它组分纯化分开的多核苷酸。外源性多核苷酸(核酸)可以是天然存在的一段连续核苷酸,或包含来自于不同来源(天然存在的和/或合成的)并且经连接以形成单一多核苷酸的两个或更多个连续核苷酸段。典型地,这样的嵌合多核苷酸至少包含编码本发明多肽的开放阅读框,所述开放阅读框可操作地连接于适合在感兴趣的细胞中驱动所述开放阅读框转录的启动子。
如本文中所使用,术语“不同的外源性多核苷酸”或其变化形式意味着各多核苷酸的核苷酸序列中有至少一个、优选地有多个核苷酸不同。所核苷酸所编码的RNA可能在细胞内翻译成蛋白质或未翻译。在一个实例中,优选各多核苷酸编码具有不同活性的蛋白质。在另一个实例中,各外源性多核苷酸与其他外源多核苷酸具有小于约95%、小于90%或小于80%同一性。优选地,外源性多核苷酸编码功能蛋白/酶。此外,优选不同的外源性多核苷酸是非重叠的,即各多核苷酸是例如染色体外转移核酸的独特区域,其与另一个外源性多核苷酸不重叠。至少,各外源性多核苷酸具有转录起始和终止位点以及指定启动子。个别外源性多核苷酸可以包含或不包含内含子。
就所定义的多核苷酸而言,应了解,高于上文所提供的那些的%同一性数值将涵盖优选实施方案。因而,在适当的情况下,就最小同一性数值而言,优选多核苷酸所包含的多核苷酸序列与相关指定SEQ ID NO具有至少60%、更优选地至少65%、更优选地至少70%、更优选地至少75%、更优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、更优选地至少93%、更优选地至少94%、更优选地至少95%、更优选地至少96%、更优选地至少97%、更优选地至少98%、更优选地至少99%、更优选地至少99.1%、更优选地至少99.2%、更优选地至少99.3%、更优选地至少99.4%、更优选地至少99.5%、更优选地至少99.6%、更优选地至少99.7%、更优选地至少99.8%且甚至更优选地至少99.9%的同一性。
本发明的多核苷酸可在严格条件下与编码本发明多肽的多核苷酸选择性地杂交。如本文中所使用,严格条件是(1)在杂交过程中采用变性剂,诸如甲酰胺,例如含0.1%(w/v)牛血清白蛋白、0.1%Ficoll、0.1%聚乙烯吡咯烷酮的50%(v/v)甲酰胺,含750mM NaCl、75mM柠檬酸钠的50mM磷酸钠缓冲液pH 6.5,42℃;或(2)采用50%甲酰胺、5x SSC(0.75MNaCl、0.075M柠檬酸钠)、50mM磷酸钠(pH 6.8)、0.1%焦磷酸钠、5x邓哈特溶液、经过超声处理的鲑鱼精DNA(50g/ml)、0.1%SDS和10%硫酸葡聚糖,42℃,在0.2 x SSC和0.1%SDS中;和/或(3)采用低离子强度和高洗涤温度,例如0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS,50℃。
当与天然存在的分子相比时,本发明的多核苷酸可具有一个或多个突变,所述突变可以是核苷酸残基的缺失、插入或取代。相对于参考序列具有突变的多核苷酸可以是天然存在的(也就是说,从天然来源分离的)或合成的(例如,通过在上述核酸上进行定点突变诱发或DNA改组)。因而,显而易见本发明的多核苷酸可以来自于天然存在的来源或是重组的。优选的多核苷酸是如本领域中已知的具有密码子经优化以便在植物细胞中翻译的编码区的那些。
重组载体
本发明的一个实施方案包括重组载体,其包含至少一种本文中所定义的多核苷酸分子,所述多核苷酸分子插入能够将所述多核苷酸分子递送至宿主细胞中的任何载体。重组载体包括表达载体。重组载体含有异源多核苷酸序列,即被发现在天然情况下不与本文中所定义的多核苷酸分子相邻且优选地来源于除所述多核苷酸分子的来源物种以外的物种的多核苷酸序列。所述载体可以是RNA或DNA,且典型地是质粒。质粒载体典型地包括额外的核酸序列以便在原核生物细胞中容易地选择、扩增和转化表达盒,例如pUC衍生载体、pSK衍生载体、pGEM衍生载体、pSP衍生载体、pBS衍生载体,或优选地含有一个或多个T-DNA区域的二元载体。额外的核酸序列包括用于载体自主复制的复制起点、优选地编码抗生素抗性或除草剂抗性的选择标记基因、用于提供多个位点以便将所编码的核酸序列或基因插入核酸构建体中的多个独特克隆位点,和能增强原核生物和真核生物(尤其是植物)细胞的转化的序列。重组载体可包含多于一种本文中所定义的多核苷酸,例如3、4、5或6种本文中所定义的多核苷酸的组合,优选地本发明的嵌合基因构建体,各多核苷酸可操作地连接于相关细胞中可操作的表达控制序列。多于一种本文中所定义的多核苷酸,例如3、4、5或6种多核苷酸优选地在单一重组载体中,优选地在单一T-DNA分子中共价连接在一起,然后可作为单一分子引入细胞中以形成根据本发明的重组细胞,且优选地整合至该重组细胞的基因组中,例如转基因植物中的重组细胞。由此,这样连接的多核苷酸将作为单一基因座一起被重组细胞或植物的子代继承。重组载体或植物可包含两种或更多种这样的重组载体,各载体含有多种多核苷酸,例如其中各重组载体包含3、4、5或6种多核苷酸。
如本文中所定义的“可操作地连接”是指两个或更多个核酸(例如DNA)区段之间的功能关系。典型地,其是指转录调控元件(启动子)与所转录的序列之间的功能关系。举例来说,启动子可操作地连接于编码序列,诸如本文中所定义的多核苷酸,条件是其在适当的细胞中刺激或调节编码序列的转录。总体来说,可操作地连接于所转录的序列的启动子转录调控元件与所转录的序列在物理上是连续的,即,它们是顺式作用的。然而,一些转录调控元件,诸如增强子,不需要与转录被它们增强的编码序列在物理上连续或位于与之紧密相邻处。
当存在多个启动子时,各启动子可独立地相同或不同。
诸如嵌合DNA等重组分子或基因构建体还可以含有(a)一种或多种编码信号肽序列的分泌信号,以使得所表达的本文中所定义的多肽能够从产生所述多肽的细胞中分泌或为所表达的多肽提供定位,例如使所述多肽保留在所述细胞中的内质网(ER)中或转移至质体内;和/或(b)含有融合序列,由此导致核酸分子表达为融合蛋白。合适的信号区段的实例包括能够指导本文中所定义的多肽分泌或定位的任何信号区段。重组分子还可以包括在本文中所定义的核酸分子的核酸序列周围和/或内部的间插和/或未翻译序列。
为了促进转化体的鉴别,核酸构建体理想地包含选择或筛选标记基因作为外来或外源多核苷酸,或包含选择或筛选标记基因以及外来或外源多核苷酸。“标记基因”意味着赋予表达所述标记基因的细胞以独特表型且因而允许区分这样的经转化细胞与不具有该标记物的细胞的基因。选择标记物基因赋予可基于对选择剂(例如除草剂、抗生素、辐射、热或对未经转化的细胞具有破坏性的其它处理)的抗性进行“选择”的性状。筛选标记基因(或报告基因)赋予可通过观察或测试,例如通过“筛选”(例如β-葡糖醛酸酶、荧光素酶、GFP或未转化细胞中不存在的其它酶活性)加以鉴别的性状。标记基因和相关核苷酸序列不必连接。标记物的实际选择不重要,只要其与所选择的细胞(诸如植物细胞)联合具有功能(即,选择性)即可。
细菌选择标记物的实例是赋予抗生素抗性的标记物,诸如氨苄西林、红霉素、氯霉素或四环素抗性,优选地卡那霉素抗性。用于选择植物转化体的示例性选择标记物包括但不限于hyg基因,其编码潮霉素B抗性;新霉素磷酸转移酶(nptII)基因,其赋予对卡那霉素、巴龙霉素、G418的抗性;得自于大鼠肝脏的谷胱甘肽-S-转移酶基因,其赋予对谷胱甘肽衍生的除草剂的抗性,例如,如EP 256223中所描述;谷氨酰胺合成酶基因,其在过度表达后赋予对诸如草胺膦等谷氨酰胺合成酶抑制剂的抗性,例如,如WO 87/05327中所描述;得自于产绿色链霉菌(Streptomyces viridochromogenes)的乙酰基转移酶基因,其赋予对选择剂草胺膦的抗性,例如,如EP 275957中所描述;编码5-烯醇莽草酸-3-磷酸酯合成酶(EPSPS)的基因,其赋予对N-膦酰基甲基甘氨酸的耐受性,例如,如Hinchee等(1988)所描述;bar基因,其赋予对双丙氨磷的抗性,例如,如WO91/02071中所描述;腈水解酶基因,诸如得自于臭鼻克雷伯菌(Klebsiella ozaenae)的bxn,其赋予对溴苯腈的抗性(Stalker等,1988);二氢叶酸还原酶(DHFR)基因,其赋予对氨甲蝶呤的抗性(Thillet等,1988);突变乙酰乳酸合成酶基因(ALS),其赋予对咪唑啉酮、磺酰脲或其它ALS抑制性化合物的抗性(EP154,204);突变的邻氨基苯甲酸合成酶基因,其赋予对5-甲基色氨酸的抗性;或茅草枯脱卤素酶基因,其赋予对除草剂的抗性。
优选的筛选标记物包括但不限于uidA基因,其编码β-葡糖醛酸酶(GUS),该酶的各种显色底物是已知的;绿色荧光蛋白基因(Niedz等,1995)或其衍生物;荧光素酶(luc)基因(Ow等,1986),其允许进行生物发光检测;和本领域中已知的其它酶。如本说明书所使用的“报告分子”意味着由其化学性质提供有助于通过参考蛋白质产物确定启动子活性的可分析鉴别信号的分子。
优选地,核酸构建体被稳定并入诸如植物细胞等细胞的基因组中。相应地,所述核酸可包含适当的元件,从而允许分子被并入基因组中,优选地将T-DNA分子或构建体的右边界和左边界序列放在可并入细胞的染色体中的适当载体中。
表达
如本文中所使用,表达载体是能够转化宿主细胞且实现一种或多种指定多核苷酸分子的表达的DNA载体。本发明的优选表达载体可指导酵母和/或植物细胞中的基因表达。可用于本发明的表达载体含有调控序列,诸如转录控制序列、翻译控制序列、复制起点和与重组细胞相容并且控制本发明多核苷酸分子的表达的其它调控序列。确切地说,可用于本发明的多核苷酸或载体包括转录控制序列。转录控制序列是控制转录起始、延长和终止的序列。特别重要的转录控制序列是控制转录起始的那些,诸如启动子和增强子序列。合适的转录控制序列包括可在至少一种本发明重组细胞中起作用的任何转录控制序列。所使用的调控序列的选择取决于靶生物体,诸如相关植物和/或靶器官或组织。这样的调控序列可获自任何真核生物体,诸如植物或植物病毒,或可以化学合成。多种这样的转录控制序列对于本领域技术人员是已知的。特别优选的转录控制序列是在植物中具有指导转录活性的启动子,取决于所使用的植物或其部分,可以是组成性的或阶段和/或组织特异性的。
适用于稳定转染植物细胞或建立转基因植物的许多载体已描述于例如以下文献中:Pouwels等,Cloning Vectors:A Laboratory Manual,1985,增刊1987;Weissbach和Weissbach,Methods for Plant Molecular Biology,Academic Press,1989;和Gelvin等,Plant Molecular Biology Manual,Kluwer Academic Publishers,1990。典型地,植物表达载体包括例如在5'和3'调控序列的转录控制下的一种或多种克隆植物基因和显性选择标记物。这样的植物表达载体还可以含有启动子调控区(例如,控制诱导型或组成型表达、环境调控型表达或发育调控型表达、或细胞特异性表达或组织特异性表达的调控区)、转录起始位点、核糖体结合位点、RNA加工信号、转录终止位点和/或多腺苷酸化信号。
已经描述了在植物细胞中具有活性的许多组成型启动子。用于在植物中进行组成型表达的合适的启动子包括但不限于花椰菜花叶病毒(CaMV)35S启动子、玄参花叶病毒(FMV)35S、甘蔗杆状病毒启动子、鸭拓草黄色斑点病毒启动子、来自核酮糖-1,5-二磷酸羧化酶小亚单位的光诱导型启动子、稻细胞质磷酸丙糖异构酶启动子、拟南芥腺嘌呤磷酸核糖基转移酶启动子、稻肌动蛋白1基因启动子、甘露氨酸合成酶和章鱼碱合成酶启动子、Adh启动子、蔗糖合成酶启动子、R基因复合体启动子和叶绿素α/β结合蛋白基因启动子。
为了在诸如叶、种子、根或茎等植物源组织中表达,优选本发明所利用的启动子在这些特定组织中具有相对较高的表达。为此,可针对基因选择许多具有组织或细胞特异性或增强型表达的启动子。文献中报告的这样的启动子的实例包括豌豆叶绿体谷氨酰胺合成酶GS2启动子、小麦叶绿体果糖-1,6-二磷酸酶启动子、马铃薯核光合ST-LS1启动子、拟南芥的丝氨酸/苏氨酸激酶启动子和葡糖淀粉酶(CHS)启动子。也被报告在光合活性组织中具有活性的是核酮糖-1,5-二磷酸羧化酶启动子和Cab启动子。
响应于环境、激素、化学品和/或发育信号而被调控的多种植物基因启动子也可用于在植物细胞中表达基因,包括由以下各项调控的启动子:(1)热;(2)光(例如豌豆RbcS-3A启动子、玉米RbcS启动子);(3)激素,诸如脱落酸;(4)创伤(例如WunI);或(5)化学品,诸如茉莉酮酸甲酯、水杨酸、类甾醇激素、醇、安全剂(WO97/06269);或采用(6)器官特异性启动子也是有利的。
如本文中所使用,术语“植物种子特异性启动子”或其变化形式是指与其它植物组织相比优先在植物的发育种子中指导基因转录的启动子。在一个实施方案中,种子特异性启动子在植物的发育种子中的表达相对于在植物的叶和/或茎中的表达强至少5倍,且优选地,在发育种子的胚中的表达与其它植物组织相比更强。优选地,所述启动子仅在发育种子中指导相关基因表达,和/或植物的其它部分(诸如叶)中的相关基因表达无法通过Northern印迹分析和/或RT-PCR检测。典型地,所述启动子在种子生长和发育过程中,确切地说,在种子中合成和累积贮藏化合物的阶段中驱动基因表达。这样的启动子可在整个植物贮藏器官中或仅在其部分中,诸如双子叶植物种子的种皮或子叶中,优选地在胚中,或在单子叶植物种子的胚乳或糊粉层中驱动基因表达。
种子特异性表达的优选启动子包括i)来自于编码诸如去饱和酶和延长酶等参与种子中的脂肪酸生物合成和累积的酶的基因的启动子;ii)来自于编码种子贮藏蛋白的基因的启动子;和iii)来自于编码参与种子中碳水化合物生物合成和累积的酶的基因的启动子。合适的种子特异性启动子是油料种子油菜napin基因启动子(US5,608,152)、蚕豆USP启动子(Baumlein等,1991)、拟南芥油质蛋白启动子(W098/45461)、菜豆的菜豆球蛋白启动子(US5,504,200)、芸苔属Bce4启动子(WO91/13980)或蚕豆的豆球蛋白LeB4启动子(Baumlein等,1992),和在诸如玉米、大麦、小麦、黑麦、稻等单子叶植物中引起种子特异性表达的启动子。合适的著名启动子是大麦lpt2或lpt1基因启动子(W095/15389和WO95/23230)或WO99/16890中所描述的启动子(来自于大麦的大麦醇溶蛋白基因、稻的谷蛋白基因、稻的米谷蛋白基因、稻的醇溶谷蛋白基因、小麦的麦醇溶蛋白基因、小麦的谷蛋白基因、玉米的玉米醇溶蛋白基因、燕麦的谷蛋白基因、高粱的kasirin基因、黑麦的黑麦碱基因的启动子)。其它启动子包括Broun等(1998)、Potenza等(2004)、US20070192902和US20030159173所描述的那些。在一个实施方案中,所述种子特异性启动子优先表达于种子的规定部分中,诸如胚、子叶或胚乳。这样的特异性启动子的实例包括但不限于FP1启动子(Ellerstrom等,1996)、豌豆豆球蛋白启动子(Perrin等,2000)、豆植物凝血素启动子(Perrin等,2000)、编码亚麻2S贮藏蛋白的基因的conlinin 1和conlinin 2启动子(Cheng等,2010)、拟南芥FAE1基因的启动子、油菜类球蛋白蛋白基因的BnGLP启动子、亚麻peroxiredoxin基因LPXR启动子。
5'非翻译前导序列可来源于用于表达本发明多核苷酸的异源基因序列的启动子,或优选地,相对于欲产生的酶的编码区是异源的,且需要时可进行特异性修饰以增加mRNA的翻译。关于优化转基因的综述,参见Koziel等(1996)。5'非翻译区还可以获自植物病毒RNA(烟草花叶病毒、烟草蚀刻病毒、玉米矮花叶病病毒、苜蓿花叶病毒等等)、合适的真核生物基因、植物基因(小麦和玉米叶绿素a/b结合蛋白基因前导序列)或合成基因序列。本发明不限于其中所述非翻译区源自于伴随启动子序列的5'非翻译序列的构建体。前导序列也可以源自于无关的启动子或编码序列。可用于本发明上下文中的前导序列包括玉米Hsp70前导序列(US5,362,865和US5,859,347)和TMVω元件。
转录终止是通过可操作地连接于嵌合载体中的相关多核苷酸的3'非翻译DNA序列实现。重组DNA分子的3'非翻译区含有在植物中用于将腺嘌呤核苷酸添加至RNA的3'端的多腺苷酸化信号。3'非翻译区可获自表达于植物细胞中的各种基因。就这种能力而言,常用的是胭脂碱合成酶3'未翻译区、来自于豌豆小亚单位核酮糖二磷酸羧化酶-加氧酶基因的3'未翻译区、来自于大豆7S种子贮藏蛋白基因或亚麻conlinin基因的3'未翻译区。含有农杆菌肿瘤诱导型(Ti)质粒基因的多腺苷酸化信号的3'转录非翻译区也是合适的。
可使用重组DNA技术来提高转化多核苷酸分子的表达,例如通过操纵宿主细胞内的多核苷酸分子的拷贝数、多核苷酸分子的转录效率、所得转录物的翻译效率和翻译后修饰的效率。可用于增加本文中所定义的多核苷酸分子的表达的重组技术包括但不限于将多核苷酸分子整合至一个或多个宿主细胞染色体中、向mRNA添加稳定性序列、取代或修饰转录控制信号(例如启动子、操纵子、增强子)、取代或修饰翻译控制信号(例如核糖体结合位点、Shine-Dalgarno序列)、修饰多核苷酸分子以对应宿主细胞的密码子使用情况和缺失会使转录物不稳定的序列。
重组细胞
本发明还提供了一种重组细胞,优选地重组植物细胞,其是以一种或多种诸如本文中所定义的多核苷酸、嵌合基因或重组载体等重组分子转化的宿主细胞。重组细胞可包含其任何组合,诸如两种或三种重组载体,或一种重组载体与以后总或多种额外的多核苷酸或嵌合DNA。合适的本发明细胞包括可用本发明的多核苷酸、嵌合DNA或重组载体转化的任何细胞,例如编码本文中所描述的多肽或酶的分子。所述细胞优选地为由此能够用于产生LC-PUFA的细胞。重组细胞可以是培养的细胞、体外或生物体中的细胞,例如植物或诸如种子或叶等器官中的细胞。优选地,所述细胞处于植物或植物部分中,更优选地,处于植物种子中。
引入多核苷酸的宿主细胞可以是未转化的细胞或已经用至少一种核酸分子转化的细胞。这样的核酸分子可能与LC-PUFA合成有关或无关。本发明的宿主细胞可以内源性地(即,天然地)能够产生本文中所定义的蛋白质,在这种情况下,由其产生的重组细胞产生多肽的能力得以增强,或仅在用至少一种本发明多核苷酸转化之后能够产生这样的蛋白质。在一个实施方案中,本发明的重组细胞合成长链多不饱和脂肪酸的能力有所增强。如本文中所使用,术语“合成长链多不饱和脂肪酸的能力有所增强的细胞”是一个将本发明的重组细胞与缺乏本发明多核苷酸的宿主细胞相比较的相对术语,其中与天然细胞相比,所述重组细胞产生更多长链多不饱和脂肪酸或更高浓度的LC-PUFA,诸如DHA(相对于其它脂肪酸)。合成另一种产物(例如另一种脂肪酸、脂质、诸如淀粉等碳水化合物、RNA分子、多肽、药物或其它产物)的能力有所增强的细胞具有相应的含义。
本发明的宿主细胞可以是能够产生至少一种本文中所描述的蛋白质的任何细胞,且包括细菌、真菌(包括酵母)、寄生虫、节肢动物、动物和植物细胞。所述细胞可以是原核生物的或真核生物的。优选的宿主细胞是酵母和植物细胞。在一个优选实施方案中,所述植物细胞是种子细胞,确切地说是种子子叶或胚乳中的细胞。在一个实施方案中,所述细胞是动物细胞或海藻细胞。动物细胞可以属于任何类型的动物,诸如非人类动物细胞、非人类脊椎动物细胞、非人类哺乳动物细胞或诸如鱼类等水生动物或甲壳类动物、无脊椎动物、昆虫等的细胞。所述细胞可属于适用于发酵方法的生物体。如本文中所使用,术语“发酵方法”是指任何发酵方法或包括发酵步骤的任何方法。发酵微生物的实例包括真菌生物体,诸如酵母。如本文中所使用,“酵母”包括酵母属、酿酒酵母、卡尔酵母(Saccharomycescarlbergensis)、假丝酵母属、克鲁维酵母属、毕赤酵母属、汉逊酵母属(Hansenula spp.)、木霉属、斯氏油脂酵母(Lipomyces starkey)和解脂耶氏酵母(Yarrowia lipolytica)。优选的酵母包括酵母属菌株,且确切地说是酿酒酵母。
转基因植物
本发明还提供了一种包含本发明细胞的植物,诸如包含一种或多种本发明多核苷酸的转基因植物。术语“植物”在本文中作为名词使用时是指整个植物,但在作为形容词使用时是指植物中所存在的、获自植物的、来源于植物的或与植物有关的任何物质,例如植物器官(例如叶、茎、根、花)、单个细胞(例如花粉)、种子、植物细胞等等。术语“植物部分”是指所有包括植物DNA的植物部分,包括诸如叶或茎、根、开花器官或结构、花粉、种子、种子部分(诸如胚、胚乳、盾片或种皮)、植物组织(诸如维管组织)、其细胞和子代等营养结构,只要所述植物部分能合成根据本发明的脂质即可。
“转基因植物”、“经过基因修饰的植物”或其变化形式是指含有在属于同一物种、品种或栽培变种的野生型植物中未发现的基因构建体(“转基因”)的植物。如本发明上下文中所定义的转基因植物包括使用重组技术进行基因修饰以便在所需植物或植物器官中产生本文中所定义的脂质或至少一种多肽的植物及其后代。转基因植物细胞和转基因植物部分具有相应的含义。如本文中所提到的“转基因”具有生物技术领域中的正常含义且包括通过重组DNA或RNA技术产生或改变并且引入本发明细胞、优选地植物细胞中的基因序列。转基因所包括的基因序列可来源于与引入所述转基因的植物细胞属于同一物种、品种或栽培变种的植物细胞,或来源于不同物种、品种或栽培变种的植物细胞,或来源于除植物细胞以外的细胞。典型地,转基因已经通过人为操作(诸如通过转化)而引入细胞(诸如植物)中,但可以使用本领域技术人员认可的任何方法。
术语“种子”和“籽粒”在本文中可互换使用。“籽粒”是指成熟籽粒,诸如收获的籽粒或虽然仍在植物上但已适合收获的籽粒,但是根据上下文,也可能指吸胀或萌芽后的籽粒。成熟籽粒或种子的水分含量通常低于约18%至20%。如本文中所使用的“发育中的种子”是指成熟前的种子,典型地见于授粉或开花期后的植物繁殖结构中,但也可指从植物分离的成熟前种子。
如本文中所使用,术语“获得植物部分”或“获得种子”分别是指获得植物部分或种子的任何手段,包括从田地或诸如温室或生长室等容器中的植物收获植物部分或种子,或通过从供应商购买或收到植物部分或种子。所述种子可适合于种植,即,能够萌芽和产生后代植物,或者已经用使其不再能够萌芽的方式进行处理,例如可用于食物或饲料应用或用于提取本发明脂质的经过破碎、抛光或碾磨的种子。
如本文中所使用,术语“植物贮藏器官”是指专门用于以例如蛋白质、碳水化合物、脂肪酸和/或油的形式贮藏能量的植物部分。植物贮藏器官的实例是种子、果实、块状根和块茎。本发明优选的植物贮藏器官是种子。
如本文中所使用,术语“具有正常表型”是指本发明的经过基因修饰的植物或植物器官,特别是贮藏器官,诸如种子、块茎或果实,与未经改造的植物或植物器官相比,其生长和繁殖能力未显著降低。在一个实施方案中,具有正常表型的经过基因修饰的植物或植物器官包含可操作地连接于植物贮藏器官特异性启动子的编码沉默阻抑因子的外源多核苷酸,且与不包含所述多核苷酸的同基因植物或器官具有基本上相同的生长或繁殖能力。优选地,当在相同条件下生长时,所产生的生物量、生长率、萌芽率、贮藏器官大小、种子大小和/或活种子数目与缺乏所述外源多核苷酸的植物相比不低于后者的90%。该术语不涵盖可能不同于野生型植物但不影响植物用于商业目的的适用性的植物特征,诸如幼苗叶子的芭蕾舞裙样表型。
本发明所提供的或预期用于实施本发明的植物包括单子叶植物和双子叶植物。在优选的实施方案中,本发明的植物是农作物植物(例如谷类和豆类、玉米、小麦、马铃薯、木薯、稻、高粱、粟、木薯、大麦或豌豆)或其它豆科植物。可以种植所述植物以产生可食用的根、块茎、叶、茎、花或果实。所述植物可以是蔬菜或观赏植物。本发明的植物可以是:玉米(玉米)、芸苔(油菜、芜菁亚种(Brassica rapa ssp.))、芥菜(芥菜)、亚麻(亚麻)、紫花苜蓿(紫苜蓿)、稻(水稻)、黑麦(黑麦(Secale cerale))、高粱(二色高粱、甜高粱)、向日葵(向日葵(Helianthus annus))、小麦(小麦(Tritium aestivum))、大豆(大豆)、烟草(普通烟草)、马铃薯(马铃薯(Solanum tuberosum))、花生(落花生)、棉花(陆地棉)、甜薯(甜薯(Lopmoeabatatus))、木薯(木薯(Manihot esculenta))、咖啡(咖啡(Cofea spp.))、椰子(椰子(Cocos nucifera))、凤梨(菠萝)、柑桔(柑橘(Citrus spp.))、可可(可可(Theobromacacao))、茶(茶(Camellia senensis))、香蕉(香蕉(Musa spp.))、鳄梨(鳄梨)、无花果(无花果(Ficus casica))、番石榴(番石榴(Psidium guajava))、芒果(芒果(Mangiferindica))、橄榄(橄榄)、番木瓜(番木瓜)、腰果(腰果(Anacardium occidentale))、夏威夷果(夏威夷果(Macadamia intergrifolia))、杏仁(巴旦杏)、甜菜(甜菜(Beta vulgaris))、燕麦或大麦。
在一个优选的实施方案中,所述植物是被子植物。
在一个实施方案中,所述植物是油料种子植物,优选地油料种子农作物植物。如本文中所使用,“油料种子植物”是用于由植物的种子商品化生产油的植物物种。油料种子植物可以是油料种子油菜(诸如芸苔)、玉米、向日葵、大豆、高粱、亚麻(亚麻子)或甜菜。此外,油料种子植物可以是其它芸苔属、棉花、花生、罂粟、芥菜、蓖麻子、芝麻、红花或产生坚果的植物。植物在其果实中可产生高水平的油,诸如橄榄、油棕或椰子。本发明可应用的园艺植物是莴苣、菊苣或芸苔属蔬菜,包括甘蓝、椰菜或花椰菜。本发明可应用于烟草、葫芦、胡萝卜、草莓、番茄或胡椒。
在另一个优选的实施方案中,用于产生本发明的转基因植物的非转基因植物(尤其是在种子中)所产生的油具有i)少于20%、少于10%或少于5%的18:2脂肪酸和/或ii)少于10%或少于5%的18:3脂肪酸。
在一个优选的实施方案中,转基因植物对于已经引入的各个和每个基因(转基因)都是纯合的,所以其后代的所需表型不会分离。转基因植物对于所引入的转基因也可能是杂合的,优选地对于所述转基因一律是杂合的,诸如由杂交种子生长而来的F1子代。这样的植物可以提供诸如本领域中众所周知的杂种优势等优势。
在相关的情况下,转基因植物还可以包含编码参与产生LC-PUFA的酶的额外的转基因,诸如但不限于Δ6-去饱和酶、Δ9-延长酶、Δ8-去饱和酶、Δ6-延长酶、Δ5-去饱和酶、ω3-去饱和酶、Δ4-去饱和酶、Δ5-延长酶、二酰基甘油酰基转移酶、LPAAT、Δ17-去饱和酶、Δ15-去饱和酶和/或Δ12去饱和酶。具有一种或多种这些活性的这样的酶的实例在本领域中是已知的且包括本文中所描述的那些。在具体实例中,转基因植物至少包含编码以下各项的外源多核苷酸:
a)Δ4-去饱和酶、Δ5-去饱和酶、Δ6-去饱和酶、Δ5-延长酶和Δ6-延长酶;
b)Δ4-去饱和酶、Δ5-去饱和酶、Δ8-去饱和酶、Δ5-延长酶和Δ9-延长酶;
c)Δ4-去饱和酶、Δ5-去饱和酶、Δ6-去饱和酶、Δ5-延长酶、Δ6-延长酶和Δ15-去饱和酶;
d)Δ4-去饱和酶、Δ5-去饱和酶、Δ8-去饱和酶、Δ5-延长酶、Δ9-延长酶和Δ15-去饱和酶;
e)Δ4-去饱和酶、Δ5-去饱和酶、Δ6-去饱和酶、Δ5-延长酶、Δ6-延长酶和Δ17-去饱和酶;或
f)Δ4-去饱和酶、Δ5-去饱和酶、Δ8-去饱和酶、Δ5-延长酶、Δ9-延长酶和Δ17-去饱和酶。
在一个实施方案中,外源多核苷酸编码多肽集合,所述多肽集合是畸雌腐霉Δ6-去饱和酶、破囊壶菌Δ5-去饱和酶或球石藻(Emiliana huxleyi)Δ5-去饱和酶、小立碗藻Δ6-延长酶、破囊壶菌Δ5-延长酶或青绿藻Δ5-延长酶、致病疫霉ω3-去饱和酶或畸雌腐霉ω3-去饱和酶和破囊壶菌Δ4-去饱和酶。
在一个实施方案中,本发明的植物被种植在田地中,优选地作为至少1,000或1,000,000株基本上相同的植物的群体,或种植在至少1公顷的面积中。种植密度根据植物物种、植物品种、气候、土壤条件、施肥速率和如本领域中已知的其它因素而不同。举例来说,典型地以120至150万株植物/公顷的种植密度种植芸苔。如本领域中已知来收获植物,这可以包括捆晒、割晒和/或收割植物,随后脱粒和/或簸选植物材料以分离种子与植物部分的其余部分(通常呈谷壳形式)。或者,可以用单一方法,例如联合收割机从田地中的植物收获种子。
植物的转化
可使用本领域中已知的技术来产生转基因植物,诸如以下文献中大体描述的那些技术:A.Slater等,Plant Biotechnology-The Genetic Manipulation of Plants,OxfordUniversity Press(2003);和P.Christou和H.Klee,Handbook of Plant Biotechnology,John Wiley and Sons(2004)。
如本文中所使用,术语“稳定转化”和其变化形式是指将外源核酸分子整合至细胞的基因组中,由此在细胞分裂过程中将其转移至后代细胞而无需对其存在进行阳性选择。可通过本领域中已知的任何手段选择稳定转化体或其子代,诸如染色体DNA上的Southern印迹或基因组DNA的原位杂交。
农杆菌介导的转移是用于将基因引入植物细胞中的广泛适用系统,这是因为DNA可以引入整个植物组织或植物器官或组织培养的外植体的细胞中,以便瞬时表达或将DNA稳定整合在植物细胞基因组中。使用农杆菌介导的植物整合载体将DNA引入植物细胞中在本领域中是众所周知的(参见例如US5177010、US5104310、US5004863或US5159135),包括使用农杆菌或其它可将DNA转移至植物细胞中的细菌的花序浸染法。欲转移的DNA区由边界序列限定,且间插DNA(T-DNA)通常被插入植物基因组中。此外,T-DNA的整合是相对精确的过程,其极少产生重排。由于基因转移的简便和确定性,其在有效发生农杆菌介导的转化的那些植物品种中成为首选的方法。优选的农杆菌转化载体能够在大肠杆菌以及农杆菌中复制,从而允许便利的操作,如Klee等,Plant DNA Infectious Agents,Hohn和Schell编,Springer-Verlag,New York,pp.179-203(1985)所描述。
可使用的加速方法包括例如微粒轰击等等。将转化核酸分子递送至植物细胞的方法的一个实例是微粒轰击。该方法的综述见Yang等,Particle Bombardment Technologyfor Gene Transfer,Oxford Press,Oxford,England(1994)。非生物学粒子(微粒)可涂有核酸且被推进力递送至细胞中。示例性粒子包括由钨、金、铂等等构成的那些。微粒轰击除了是一种可再现地转化单子叶植物的有效手段以外,其特别优势还在于既不需要分离原生质体,又不需要对农杆菌感染的易感性。
在另一个替代实施方案中,可稳定地转化质体。已公开的用于在高等植物中进行质体转化的方法包括粒子枪递送含有选择标记物的DNA和通过同源重组使DNA靶向质体基因组(US5,451,513、US5,545,818、US5,877,402、US5,932479和WO99/05265)。
还可以使用其它细胞转化方法,且包括但不限于通过直接将DNA转移至花粉中、通过直接将DNA注入植物的繁殖器官中或通过将DNA直接注入未成熟胚的细胞中随后对脱水的胚进行复水而将DNA引入植物中。
从单个植物原生质体转化体或从各种转化外植体再生、发育和载培植物在本领域中是众所周知的(Weissbach等,Methods for Plant Molecular Biology,AcademicPress,San Diego,Calif.,(1988)。这种再生和生长方法典型地包括以下步骤:选择经转化的细胞,培养那些个体化细胞经过胚发育至生根幼苗阶段的通常阶段。转基因胚和种子的再生方式类似。此后将所得转基因生根苗栽植在适当的植物生长培养基(诸如土壤)中。
含有外来的外源基因的植物的发育或再生在本领域中是众所周知的。优选地,再生的植物经自花授粉以产生纯合转基因植物。或者,将获自再生的植物的花粉与具有重要农艺价值的株系的种子长成的植物进行杂交。反之,将得自于这些重要株系的植物的花粉用于对再生的植物授粉。通过使用本领域技术人员所熟知的方法栽培含有所要外源核酸的本发明转基因植物。
为了证实转基因细胞和植物中存在转基因,可使用本领域技术人员已知的方法来进行聚合酶链反应(PCR)扩增或Southern印迹分析。取决于产物的性质,可用多种方式中的任一种来检测转基因表达产物,且包括Western印迹和酶测定。在获得转基因植物后,可使其生长以产生具有所要表型的植物组织或部分。可收获植物组织或植物部分,和/或收集种子。种子可充当用于生长出含具有所要特征的组织或部分的其它植物的来源。
使用农杆菌或其它转化方法形成的转基因植物典型地含有位于一个染色体上的单个基因座。这样的转基因植物可称为对于所添加的基因是半合的。更优选的转基因植物对于所添加的基因是纯合的,即,转基因植物含有两个添加的基因,一对染色体的各染色体上在同一基因座上具有一个基因。可通过半合转基因植物自花授粉,从而使所产生的一些种子萌芽并分析所得植物中的相关基因来获得纯合转基因植物。
还应理解,还可以使含有两种独立地分离外源基因或基因座的两种不同的转基因植物杂交(交配),以产生含有两组基因或基因座的后代。适当的F1子代的自花授粉可产生对于两种外源基因或基因座都是纯合的植物。还预期与亲本植物回交和与非转基因植物异系杂交,以及营养体繁殖。通常用于不同性状和农作物的其它育种方法的描述可见于Fehr,Breeding Methods for Cultivar Development,Wilcox J.编,American Society ofAgronomy,Madison Wis.(1987)。
提高的外源RNA水平和稳定的表达
沉默阻抑物
在一个实施方案中,本发明的细胞、植物或植物部分包含编码沉默阻抑蛋白的外源多核苷酸。
转录后基因沉默(PTGS)是核苷酸序列特异性防卫机制,其可靶向细胞和病毒mRNA以便降解。PTGS存在于经外来(异源)或内源DNA稳定或瞬时转化的植物或真菌中,且导致与所引入的核酸具有序列相似性的RNA分子的累积减少。
广泛认为沉默阻抑物与相关转基因的共表达将提高由转基因转录而来的细胞中所存在的RNA的水平。尽管这在体外被证明是正确的,但在许多整株植物共表达研究中已经观察到显著副作用。更具体地说,如Mallory等(2002)、Chapman等(2004)、Chen等(2004)、Dunoyer等(2004)、Zhang等(2006)、Lewsey等(2007)和Meng等(2008)中所描述,表达沉默阻抑物(一般在组成型启动子的控制之下)的植物的表型异常程度往往导致其无法用于商业生成。
最近,已发现可通过将沉默阻抑物表达局限于植物种子或其部分来提高RNA分子水平和/或使RNA分子水平稳定许多世代(WO2010/057246)。如本文中所使用,“沉默阻抑蛋白”或SSP是可表达于植物细胞中,从而提高来自于植物细胞中的不同转基因的表达产物的水平(特别是经过从最初转化植物反复传代后)的任何多肽。在一个实施方案中,所述SSP是病毒沉默阻抑物或其突变体。许多病毒沉默阻抑物在本领域中是已知的,且包括但不限于P19、V2、P38、Pe-Po和RPV-P0。在一个实施方案中,病毒沉默阻抑物包含如下氨基酸,所述氨基酸具有如SEQ ID NO 53至57中任一个所提供的序列、其生物学活性片段或与SEQ ID NO53至57中的任何一个或多个具有至少50%同一性的氨基酸序列,并且具有沉默阻抑物的活性。
如本文中所使用,术语“使表达稳定”、“稳定地表达”、“稳定的表达”及其变化形式是指经反复传代(例如至少3代、至少5代或至少10代)后子代植物中的RNA分子水平与缺乏编码所述沉默阻抑物的外源多核苷酸的同基因植物相比基本上相同或较高。然而,该术语不排除经反复传代后RNA分子水平与前一代相比存在一定损失,例如每代损失不少于10%的可能性。
阻抑物可选自任何来源,例如植物、病毒、哺乳动物等。参见WO2010/057246中可获得阻抑物的病毒的列表,和来自于各特定病毒的阻抑物的蛋白质(例如B2、P14等)或编码区名称。可以使用阻抑物的多个拷贝。不同的阻抑物可以一起使用(例如以串联方式)。
RNA分子
基本上任何需要表达于植物种子中的RNA分子都可以与沉默阻抑物一起共表达。所编码的多肽可参与油、淀粉、碳水化合物、营养物等的代谢,或可以负责合成蛋白质、肽、脂肪酸、脂质、蜡、油、淀粉、糖、碳水化合物、香味、气味、毒素、类胡萝卜素、激素、聚合物、类黄酮、贮藏蛋白、酚酸、生物碱、木质素、丹宁酸、维生素、糖蛋白、糖脂等,优选地负责TAG的生物合成或组装。
在一个特定的实例中,植物所产生的用于在植物(诸如芸苔属植物,例如芸苔或向日葵、红花、亚麻、棉花、大豆、亚麻荠或玉米)中产生油的酶的水平有所增加。
所产生的LC-PUFA的水平
重组细胞或诸如种子等植物部分中所产生的LC-PUFA或LC-PUFA组合的水平十分重要。所述水平可以表示为特定LC-PUFA或一组相关LC-PUFA(例如ω3 LC-PUFA或ω6 LC-PUFA)或VLC-PUFA或其它占总脂肪酸组成(以百分比表示),这可以通过本领域中已知的方法来确定。所述水平还可以表示为LC-PUFA含量,例如LC-PUFA占包含所述重组细胞的材料的干重的百分比,例如LC-PUFA占种子干重的百分比。应了解,就LC-PUFA含量而言,油料种子中所产生的LC-PUFA可显著高于不是为了产油而种植的蔬菜或籽粒,但两者可具有相似的LC-PUFA组成,且两者都可以用作人类或动物摄入LC-PUFA的来源。
可通过本领域中已知的任何方法测定LC-PUFA的水平。在一种优选的方法中,从细胞、组织或生物体提取总脂质,并且将脂肪酸转化成甲酯,随后通过气相色谱法(GC)进行分析。实施例1中描述了这样的技术。色谱中的峰位置可用于鉴别各特定脂肪酸,且积分得到的各峰下的面积用于确定量。如本文中所使用,除非另有说明,否则样品中特定脂肪酸的百分比是根据该脂肪酸的峰下面积占色谱中的脂肪酸总面积的百分比来确定。这基本上对应于重量百分比(w/w)。脂肪酸的鉴别可以通过GC-MS来证实。总脂质可以通过本领域中已知的用于纯化级分(诸如TAG级分)的技术进行分离。举例来说,可以进行分析规模的薄层色谱法(TLC)以分离TAG与其它脂质级分,诸如DAG、酰基-CoA或磷脂,以便确定TAG的具体脂肪酸组成。
在一个实施方案中,所提取的脂质中的脂肪酸中ARA、EPA、DPA和DHA的总和在细胞中的总脂肪酸的约7%与约25%之间。在另一个实施方案中,细胞中的总脂肪酸具有少于1%的C20:1。在优选的实施方案中,细胞中的可提取TAG包含本文中所提到的水平的脂肪酸。还涵盖了界定如本文中所描述的脂质的特征的各可能组合。
重组细胞、植物或植物部分(诸如种子)中的LC-PUFA产生水平还可以表示为特定底物脂肪酸转化成一种或多种产物脂肪酸的转化百分比,这在本文中也称为“转化效率”或“酶效率”。这个参数是基于从细胞、植物、植物部分或种子中提取的脂质中的脂肪酸组成,即,所形成的LC-PUFA(包括由其衍生的其它LC-PUFA)的量占一种或多种脂肪酸(包括由其衍生的所有其它脂肪酸)的百分比。转化百分比的通式是:100×(产物LC-PUFA和由其衍生的所有产物的百分比的总和)/(底物脂肪酸和由其衍生的所有产物的百分比总和)。举例来说,就DHA而言,这可以表示为DHA水平(呈占脂质中总脂肪酸含量的百分比形式)与底物脂肪酸(例如OA、LA、ALA、SDA、ETA或EPA)和来源于所述底物的除DHA以外的所有产物的水平的比率。可以表示途径中的单个酶促步骤或途径的部分或整体的转化百分比或转化效率。
本文中根据以下各式计算特定转化效率:
1.OA到DHA=100x(%DHA)/(OA、LA、GLA、DGLA、ARA、EDA、ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)。
2.LA到DHA=100x(%DHA)/(LA、GLA、DGLA、ARA、EDA、ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)。
3.ALA到DHA=100x(%DHA)/(ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)。
4.EPA到DHA=100x(%DHA)/(EPA、DPA和DHA的总%)。
5.DPA到DHA(Δ4-去饱和酶效率)=100x(%DHA)/(DPA和DHA的总%)。
6.Δ12-去饱和酶效率=100x(LA、GLA、DGLA、ARA、EDA、ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)/(OA、LA、GLA、DGLA、ARA、EDA、ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)。
7.ω3-去饱和酶效率=100x(ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)/(LA、GLA、DGLA、ARA、EDA、ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)。
8.OA到ALA=100x(ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)/(OA、LA、GLA、DGLA、ARA、EDA、ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)。
9.Δ6-去饱和酶效率(对ω3底物ALA)=100×(SDA、ETA、EPA、DPA和DHA的总%)/(ALA、SDA、ETrA、ETA、EPA、DPA和DHA的总%)。
10.Δ6-延长酶效率(对ω3底物SDA)=100×(ETA、EPA、DPA和DHA的总%)/(SDA、ETA、EPA、DPA和DHA的总%)。
11.Δ5-去饱和酶效率(对ω3底物ETA)=100×(EPA、DPA和DHA的总%)/(ETA、EPA、DPA和DHA的总%)。
12.Δ5-延长酶效率(对ω3底物EPA)=100×(DPA和DHA的总%)/(EPA、DPA和DHA的总%)。
对于总ω6脂肪酸:总ω3脂肪酸或新ω6脂肪酸:新ω3脂肪酸,本发明脂质(优选地种子油)的脂肪酸组成的特征还在于总脂肪酸含量中的ω6脂肪酸:ω3脂肪酸的比率。术语总ω6脂肪酸、总ω3脂肪酸、新ω6脂肪酸和新ω3脂肪酸具有如本文中所定义的含义。所述比率是用如本文中所例示的方式根据从细胞、植物、植物部分或种子中提取的脂质中的脂肪酸组成进行计算。需要脂质中的ω3脂肪酸水平大于ω6脂肪酸水平,且因此ω6:ω3比率小于1.0是优选的。比率0.0指示完全不存在所定义的ω6脂肪酸;比率0.03是如实施例6中所描述来实现。这样的低比率可以通过组合使用偏好ω3底物的Δ6-去饱和酶与ω3-去饱和酶,特别是真菌ω3-去饱和酶,诸如本文中所例示的巴斯德毕赤酵母ω3-去饱和酶来实现。
每单位重量种子的LC-PUFA产率也可以基于种子中的总油含量和油中的DHA%进行计算。举例来说,如果芸苔种子的油含量为约40%(w/w)且油的总脂肪酸含量的约12%是DHA,则种子的DHA含量为约4.8%或约48mg/g种子。如实施例2中所描述,油含量低于芸苔且具有约9%DHA的拟南芥种子的DHA含量为约25mg/g种子。在DHA含量为约7%时,芸苔种子或亚麻荠种子的DHA含量为约28mg/g种子。因此,本发明提供了油菜、芥菜和亚麻荠植物和由其获得的种子,其包含至少约28mg DHA/g种子。所述种子的水分含量对于干透之后的所收获成熟种子是标准的(4%至15%水分)。本发明还提供了一种用于获得油的方法,包括获得种子和从所述种子提取油;以及油的用途和获得种子的方法,包括从根据本发明的植物收获种子。
如果每公顷的种子产量是已知的或可估计的,则也可以计算每公顷产生的DHA的量。举例来说,在澳大利亚,每公顷芸苔典型地产生约2.5吨种子,这在40%油含量下产生约1000kg油。在总油中存在12%DHA时,这提供约120kg DHA/公顷。如果油含量减少50%,则这仍能提供约60kg DHA/ha。
迄今为止,证据表明一些异源表达于酵母或植物中的去饱和酶在一些延长酶组合时具有相对较低的活性。这可以通过在LC-PUFA合成中提供能够使用脂肪酸的酰基-CoA作为底物的去饱和酶来缓和,且这在重组细胞中,特别是在植物细胞中被认为是有利的。用于有效DHA合成的特别有利的组合是真菌ω3-去饱和酶,例如巴斯德毕赤酵母ω3-去饱和酶(SEQ IDNO:12),其中Δ6-去饱和酶偏好ω3酰基底物,诸如细小微胞藻Δ6-去饱和酶(SEQID NO:13),或其具有至少95%氨基酸序列同一性的变体。
如本文中所使用,术语“基本上不含”意味着组合物(例如脂质或油)包含极少(例如少于约0.5%、少于约0.25%、少于约0.1%或少于约0.01%)或不含所定义的组分。在一个实施方案中,“基本上不含”意味着使用常规分析技术无法检测出所述组分,例如,如实施例1中所述,使用气相色谱法无法检测到特定脂肪酸(诸如ω6-二十二碳五烯酸)。
油的产生
可以使用本领域中常规实行的技术来提取、处理和分析由本发明的细胞、植物、种子等产生的油。典型地,植物种子经熟化、压榨和提取以产生粗油,然后进行脱胶、精制、脱色和除臭。总体来说,用于压碎种子的技术在本领域中是已知的。举例来说,可以通过给油料种子喷水使其软化,使水分含量提高至例如8.5%,并且使用间隙设置为0.23至0.27mm的平滑辊筒将其制成薄片。取决于种子类型,在压碎之前可以不加水。施加热使酶失活,促进进一步破坏细胞,使油滴凝结,且使蛋白质粒子凝聚,所有这些都有助于提取加工。
在一个实施方案中,通过螺旋压榨机来释放大多数种子油。然后使用热追踪柱对螺旋压榨机排出的料饼进行溶剂提取,例如用己烷。或者,可以使压榨操作所产生的粗油通过沉降槽,其具有狭缝状线路引流顶部以去除压榨操作过程中与油一起挤出的固体。可以使经过净化的油通过板框式压滤机以去除任何剩余的精细固体粒子。如果需要,可将由提取方法回收的油与经过净化的油组合以产生掺合的粗油。
在从粗油中汽提溶剂后,将压榨的和提取的部分组合并对其进行正常的油加工程序。如本文中所使用,术语“纯化”在结合本发明的脂质或油使用时典型地意味着已经对提取的脂质或油进行了一个或多个提高脂质/油组分纯度的加工步骤。举例来说,纯化步骤可以包括对所提取的油进行由以下各项组成的群组中的一项或多项或全部:脱胶、脱臭、脱色、干燥和/或分级。然而,如本文中所使用,术语“纯化”不包括酯基转移方法或能改变本发明脂质或油的脂肪酸组成以增加DHA含量(呈占总脂肪酸含量的百分比形式)的其它方法。换句话表达,纯化脂质或油的脂肪酸组成基本上与未纯化脂质或油的相同。
脱胶
脱胶是油类精制中的早期步骤,且其主要目的是从油中去除大部分磷脂,其存在量可占总提取脂质的约1%至2%。向粗油中添加约2%水(典型地含有磷酸,70℃至80℃),从而分离大部分磷脂,伴随痕量金属和颜料。所去除的不溶性材料主要是磷脂与三酰基甘油的混合物,并且也称为卵磷脂。脱胶可通过向粗种子油中添加浓磷酸以便将不可水合之磷脂转化成可水合形式并且使所存在的微量金属螯合来进行。通过离心从种子油中分离胶。
碱精制
碱精制是用于处理粗油的精制方法之一,有时也称为中和。其通常在脱胶之后且在脱色之前进行。在脱胶之后,可以通过添加足以滴定所有脂肪酸和磷酸的量的碱溶液且去除由此形成的肥皂对种子油进行处理。合适的碱性材料包括氢氧化钠、氢氧化钾、碳酸钠、氢氧化锂、氢氧化钙、碳酸钙和氢氧化铵。这个方法典型地在室温下进行且去除游离脂肪酸级分。通过离心或通过萃取至针对肥皂溶剂中来去除肥皂,且用水洗涤经过中和的油。如果需要,则油中的任何过量碱都可以用诸如盐酸或硫酸等合适的酸中和。
脱色
脱色是一项精制方法,其在90℃至120℃下在存在漂白土(0.2%至2.0%)和不存在氧气(通过用氮气或蒸汽操作)的情况下或在真空中将油加热10至30分钟。这个步骤在油加工中旨在去除不需要的颜料(类胡萝卜素、叶绿素、棉籽酚等),并且该方法还去除氧化产物、痕量金属、含硫化合物和痕量肥皂。
脱臭
除臭是在高温(200℃至260℃)和低压(0.1至1mm Hg)下对油类和脂肪进行的一项处理。这典型地通过以约0.1ml/min/100ml种子油的速率向种子油中引入蒸汽来实现。在喷射约30分钟之后,允许种子油在真空下冷却。典型地将种子油转移至玻璃容器且用氩气冲洗,随后在冷冻下存储。这项处理改良种子的颜色并且去除大多数挥发性物质或臭味化合物,包括任何剩余游离脂肪酸、单酰基甘油和氧化产物。
冻凝
冻凝是油类商业生产中有时会用到的一项方法,其通过在低于环境的温度下进行结晶将油类和脂肪分成固体(硬脂)和液体(油精)级分。其最初被应用于棉籽油以产生无固体产物。其典型地用于降低油的饱和脂肪酸含量。
酯基转移
酯基转移是一种在TAG内和TAG之间交换脂肪酸或将脂肪酸转移至另一种醇以形成酯的方法,其是以从TAG释放呈游离脂肪酸或脂肪酸酯(通常为脂肪酸甲酯或乙酯)形式的脂肪酸为起点。当与分级方法组合时,酯基转移可用于修饰脂质的脂肪酸组成(Marangoni等,1995)。酯基转移可使用化学(例如强酸或碱催化)或酶促手段,后者使用脂肪酶,所述脂肪酶可能对TAG上的脂肪酸具有位置特异性(sn-1/3或sn-2特异性),或偏好一些脂肪酸(Speranza等,2012)。可以通过本领域中已知的任何方法实现脂肪酸分级以提高油中的LC-PUFA浓度,诸如冷冻结晶、使用尿素的复合物形成、分子蒸馏、超临界流体萃取和银离子错合。利用尿素的复合物形成因其简单性和在降低油中的饱和脂肪酸和单不饱和脂肪酸水平方面的效率而成为优选的方法(Gamez等,2003)。起初,通过在酸或碱催化的反应条件下进行水解,借此使1mol TAG与至少3mol醇(例如用于乙酯的乙醇或用于甲酯的甲醇)在过量醇(用于使得能够分离所形成的烷基酯与同时形成的甘油)下反应或通过脂肪酶使油中的TAG分裂成其组成脂肪酸,通常呈脂肪酸酯形式。然后可将脂肪酸组成中通常不会被处理改变的这些游离脂肪酸或脂肪酸酯与尿素的乙醇溶液混合以进行复合物形成。饱和脂肪酸和单不饱和脂肪酸容易地与尿素复合且在冷却时结晶析出,且随后可利用过滤将其去除。从而使未与尿素复合的级分富含LC-PUFA。
饲料
本发明包括可用作饲料的组合物。出于本发明的目的,“饲料”包括供人类或动物摄入的任何食物或制品,当进入身体后,(a)用于营养或强化组织或供应能量;和/或(b)保持、恢复或支持足够的营养状况或代谢功能。本发明的饲料包括用于婴儿和/或幼儿的营养组合物,诸如本发明的婴儿配方食品和种子粕。
本发明的饲料包含例如本发明的细胞、本发明的植物、本发明的植物部分、本发明的种子、本发明的提取物、本发明的方法的产物、本发明的发酵方法的产物或组合物以及合适的载体。术语“载体”在其最广泛意义上用于涵盖可能具有或不具有营养价值的任何组分。本领域技术人员应了解,载剂必须适用于饲料中(或以足够低的浓度使用),以便其不会对摄入饲料的生物体产生有害作用。
本发明的饲料包含使用本文中公开的方法、细胞或植物直接或间接产生的油、脂肪酸酯或脂肪酸。组合物可呈固体或液体形式。另外,组合物可包括特定用途所需的量的可食用的常量营养物、蛋白质、碳水化合物、维生素和/或矿物。这些成分的量将取决于组合物打算用于正常个体还是用于具有特殊需要的个体(诸如患有代谢病症的个体等)而变化。
具有营养价值的合适载剂的实例包括但不限于常量营养物,诸如可食用的脂肪、碳水化合物和蛋白质。这样的可食用脂肪的实例包括但不限于椰子油、琉璃苣油、真菌油、黑加仑油、大豆油和甘油单酯和甘油二酯。这样的碳水化合物的实例包括(但不限于):葡萄糖、可食用乳糖和水解淀粉。另外,本发明的营养组合物中可利用的蛋白质的实例包括(但不限于)大豆蛋白、电渗析乳清、电渗析脱脂乳、乳汁乳清或这些蛋白质的水解产物。
关于维生素和矿物质,以下物质可添加至本发明的饲料组合物中:钙、磷、钾、钠、氯、镁、锰、铁、铜、锌、硒、碘和维生素A、E、D、C和复合维生素B。还可以添加其它这样的维生素和矿物质。
本发明的饲料组合物中所利用的组分可以是半纯化或纯化来源的。半纯化或纯化意味着通过纯化天然材料或通过从头合成而制备的材料。
本发明的饲料组合物也可以添加至食物中,即使当不需要对饮食进行补充时。举例来说,组合物可以添加至任何类型的食物中,包括(但不限于):人造黄油、改性黄油、奶酪、乳汁、酸奶、巧克力、糖果、点心、色拉油、烹饪用油、肉、鱼和饮料。
酵母属用于酿造啤酒和葡萄酒以及作为烘焙用剂,特别是面包。其它酵母,诸如产油酵母,包括例如耶氏酵母,也可用于LC-PUFA产生。酵母可以用作动物饲料中的添加剂,诸如用于水产养殖。显而易见,可提供适于合成如本文中所描述的LC-PUFA的经基因工程改造的酵母菌株。这些酵母菌株或其中所产生的LC-PUFA随后可用于食品以及酒和啤酒酿造,以便提供脂肪酸含量有所提高的产物。
另外,根据本发明产生的脂肪酸或经转化而含有并表达受试者基因的宿主细胞也可以用作动物食物补充剂以改变动物的组织、卵或乳汁的脂肪酸组成,使其更合乎人类或动物摄入的需要。这样的动物的实例包括羊、牛、马、家禽(诸如鸡)等。
此外,本发明的饲料可用于水产养殖以提高供人类或动物摄入的鱼类或甲壳动物(诸如对虾)中的脂肪酸水平。优选的鱼类是鲑鱼。
本发明的优选饲料是植物、种子和其它植物部分,诸如叶和茎,其可以直接用作人类或其它动物的食物或饲料。举例来说,动物可以直接生长在生长这样的植物的田间放牧,或以更加定量的控制饲养方式喂食。本发明包括使用这样的植物和植物部分作为饲料以增加人类和其它动物的LC-PUFA水平。
组合物
本发明还涵盖组合物,特别是药物组合物,所述组合物包含一种或多种使用本发明方法产生的脂肪酸和/或所得油。
药物组合物可包含一种或多种脂肪酸和/或油连同众所周知的标准无毒药学上可接受的载剂、佐剂或媒剂,诸如磷酸盐缓冲生理盐水、水、乙醇、多元醇、植物油、润湿剂或乳液,诸如水/油乳液。组合物可呈液体或固体形式。举例来说,组合物可以呈片剂、胶囊、可摄取液体或粉剂、可注射剂或局部用软膏或乳膏剂。可通过例如在分散液情况下保持所需粒度和通过使用表面活性剂来保持适当流动性。还可能需要包括等渗剂,例如糖、氯化钠等等。除了这样的惰性稀释剂以外,所述服组合物还可以包括佐剂,诸如润湿剂、乳化和悬浮剂、甜味剂、调味剂和芳香剂。
悬浮液除了活性化合物以外还可以包含悬浮剂,诸如乙氧基异硬脂醇、聚氧化乙烯山梨糖醇酯和聚氧化乙烯山梨醇酐酯、微晶纤维素、偏氢氧化铝、膨润土、琼脂和黄芪胶或这些物质的混合物。
可使用本领域中众所周知的技术来制备固体剂型,诸如片剂和胶囊剂。举例来说,根据本发明产生的脂肪酸可与诸如乳糖、蔗糖和玉米淀粉等常规片剂基质连同诸如阿拉伯胶、玉米淀粉或明胶等粘合剂、诸如马铃薯淀粉或海藻酸等崩解剂和诸如硬脂酸或硬脂酸镁等润滑剂一起进行制片。可通过将这些赋形剂与抗氧化剂和相关脂肪酸一起并入明胶胶囊中来制备胶囊剂。
对于静脉内施用,可将根据本发明产生的脂肪酸或其衍生物并入商业制品中。
特定脂肪酸的典型剂量是0.1mg至20g,每天摄取1至5次(多达每天100g),且优选地在每天约10mg至约1、2、5或10g范围内(摄取一个或多个剂量)。如本领域中已知,每天需要最少约300mg脂肪酸,尤其是LC-PUFA。然而,应了解,任何量的脂肪酸都将有益于受试者。
本发明的药物组合物的可能施用途径包括例如肠内(例如口服和直肠)和肠胃外。举例来说,可口服或经直肠施用液体制剂。另外,可将均质混合物完全分散在水中,在无菌条件下与生理学上可接受的稀释剂、防腐剂、缓冲剂或推进剂混合以形成喷雾或吸入剂。
待施用于患者的所述组合物的剂量可以由本领域技术人员确定,且取决于各种因素,诸如患者的体重、患者的年龄、患者的总体健康状况、患者的既往病史、患者的免疫状态等。
另外,本发明的组合物可用于化妆品目的。其可添加至预先存在的化妆品组合物中以便形成混合物,或可将根据发明产生的脂肪酸用作化妆品组合物中的唯一“活性”成分。
实施例
实施例1.材料和方法
以瞬时表达系统在植物细胞中表达基因
基本上如Voinnet等(2003)和Wood等(2009)所描述用瞬时表达系统在植物细胞中表达外源基因构建体。将含有欲由诸如CaMV 35S启动子等强组成型启动子表达的编码区的质粒引入根癌农杆菌菌株AGL1中。如WO 2010/057246中所描述将用于表达p19病毒沉默阻抑物的嵌合基因35S:p19单独地引入AGL1中。使重组农杆菌细胞在补充有50mg/L卡那霉素和50mg/L利福平的28℃LB培养液中生长到静止期。然后通过在室温下在5000g下离心15min使细菌形成球粒,随后再悬浮于含有10mM MES pH 5.7、10mM MgCl2和100μΜ乙酰丁香酮的浸润缓冲液中,达到OD600=1.0。然后在28℃下将细胞振荡孵育3小时,随后将相等体积的含35S:p19和相关测试嵌合构建体的农杆菌培养物混合,随后浸润至叶组织中。在浸润之后,典型地使植物再生长5天,随后获取叶盘并冻干以便对脂肪酸进行GC分析。
通过在80℃下在甲醇/HCl/二氯甲烷(10/1/1v/v)溶液中将样品与已知量的作为内标物的十六酸一起孵育2小时来产生冻干样品中的总叶脂质的脂肪酸甲酯(FAME)。在己烷/DCM中提取FAME,在己烷中浓缩至较小体积且注入GC。脂质级分中所存在的个别脂肪酸和总脂肪酸的量是基于已知量的内标物进行定量。
脂肪酸的气相色谱(GC)分析
通过气相色谱分析FAME,使用Agilent Technologies 7890A GC(Palo Alto,California,USA),其配备有30m SGE-BPX70柱(70%氰基丙基聚硅亚苯基硅氧烷,0.25mm内径,0.25mm膜厚度)、FID、分流/不分流注射器和Agilent Technologies 7693系列自动采样器和注射器。使用氦气作为载气。在150℃炉温下以分流模式(50:1比率)注入样品。注入后,将炉温保持在150℃下持续1min,然后以3℃/min升至210℃,再以50℃/min升至240℃,且最终在240℃下保持1.4min。用Agilent Technologies ChemStation软件(Rev B.04.03(16),Palo Alto,California,USA),基于已知量的外标物GLC-411(Nucheck)和C17:0-ME内标物的反应对峰进行定量。
脂质的液相色谱质谱(LC-MS)分析
从冻干的开花后12天(daf)的发育种子和添加已知量的tri-C17:0-TAG作为内部定量标准物之后的成熟种子提取总脂质。将所提取的脂质每5mg干材料溶解于1mL含10mM丁基化羟基甲苯的丁醇:甲醇(1:1v/v)中,且使用Agilent 1200系列LC和6410b电喷雾电离三级四极LC-MS进行分析。使用在二元梯度下以0.2mL/min的流速操作的Ascentis ExpressRP-Amide柱(50mm×2.1mm,2.7μm,Supelco)对脂质进行色谱分离。移动相是:A.10mM H2O中的甲酸铵:甲醇:四氢呋喃(50:20:30v/v/v);B.10mM H2O中的甲酸铵:甲醇:四氢呋喃(5:20:75,v/v/v)。多重反应监测(MRM)列表是基于以下主要脂肪酸:16:0、18:0、18:1、18:2、18:3、18:4、20:1、20:2、20:3、20:4、20:5、22:4、22:5、22:6,使用碰撞能30V和破碎电压60V。个别MRM TAG是基于氨合前驱离子和产物离子由22:6的中和损失而鉴别。TAG是使用10μΜ三硬脂酸甘油酯外标物进行定量。
测定种子脂肪酸分布和油含量
在欲测定种子油含量的情况下,在干燥器中将种子干燥24h,并且将大约4mg种子转移至含有聚四氟乙烯内衬螺帽的2ml玻璃瓶中。将溶解于0.1ml甲苯中的0.05mg甘油三十七烷酸酯添加至该小瓶中作为内标物。
藉由向含有种子材料的小瓶中添加0.7ml 1N甲醇盐酸溶液(Supelco),简单涡旋且在80℃下孵育2h来制备种子FAME。冷却至室温后,向小瓶中添加0.3ml 0.9%NaCl(w/v)和0.1ml己烷且在Heidolph Vibramax 110中充分混合10分钟。将FAME收集至0.3ml玻璃衬管中且如先前所述利用火焰电离检测器(FID)通过GC进行分析。
首先基于市售标准物GLC-411(NU-CHEK PREP,INC.,USA)中所存在的已知量的相同FAME的峰面积反应来修正个别FAME的峰面积。GLC-411含有相等量的31种脂肪酸(wt%),在C8:0至C22:6范围内。在标准物中不存在的脂肪酸的情况下,诸位发明人取最相似的FAME的峰面积反应。举例来说,将16:1d9的FAME峰面积反应用于16:1d7且将C22:6的FAME反应用于C22:5。通过与内标物质量相比较,经过修正的面积用于计算样品中各FAME的质量。油主要以TAG形式存储且其重量是基于FAME重量进行计算。甘油的总摩尔数是通过计算各FAME的摩尔数且将FAME的总摩尔数除以三来确定。TAG计算为甘油和脂肪酰基部分的总和,使用以下关系:油重量%=100×((41×FAME总mol数/3)+(FAME的总g数-(15×FAME总mol数)))/g种子,其中41和15分别是甘油部分和甲基的分子量。
分析油样品的甾醇含量
通过使用4mL含5%KOH的80%MeOH和在80℃下在聚四氟乙烯内衬旋盖玻璃管中加热2h将大约10mg油与作为内标物的添加C24:0monol等分试样的一起皂化。在反应混合物冷却后,添加2mL Milli-Q水且通过振荡和涡旋将甾醇提取至2mL己烷:二氯甲烷(4:1v/v)中。对混合物进行离心且取出甾醇提取物,并且用2mL Milli-Q水洗涤。然后在振荡和离心之后去除甾醇提取物。使用氮气蒸汽蒸发提取物,并且通过使用200mL BSTFA和在80℃下加热2h对甾醇进行硅烷基化。
对于甾醇的GC/GC-MS分析,在氮气物流下在40℃热块上干燥甾醇-OTMSi衍生物,然后再溶解于三氯甲烷或己烷中,随后立即进行GC/GC-MS分析。使用配有SupelcoEquityTM-1熔融石英毛细管柱(15m×0.1mm i.d.,0.1μm膜厚度)、FID、分流/无分流注射器和Agilent Technologies 7683B系列自动采样器和注射器的Agilent Technologies6890A GC(Palo Alto,California,USA)通过气相色谱法(GC)分析甾醇-OTMS衍生物。氦气是载气。以无分流模式注入样品,炉温为120℃。注入后,以10℃/min使炉温升至270℃,且最后以5℃/min达到300℃。利用Agilent Technologies ChemStation软件(Palo Alto,California,USA)对峰进行定量。GC结果中个别组分面积的误差为±5%。
在Finnigan Thermoquest GCQ GC-MS和Finnigan Thermo ElectronCorporation GC-MS上进行GC-质谱(GC-MS)分析;两种系统都配有柱内注射器和Thermoquest Xcalibur软件(Austin,Texas,USA)。各GC都配有与上述毛细管柱具有类似极性的毛细管柱。通过使用质谱数据且通过将保留时间数据与针对权威实验室标准物所获得的数据进行比较来鉴别个别组分。与样品批次同时进行完全程序空白分析。
RT-PCR条件
典型地,通过使用Superscript III One-Step RT-PCR系统(Invitrogen),使用10pmol正向引物和30pmol反向引物、MgSO4最终浓度2.5mM、400ng总RNA与缓冲液和核苷酸组分,根据制造商说明书以25μl体积进行反转录-PCR(RT-PCR)扩增。典型温度方案为:1个循环的45℃、30分钟用于反转录;然后1个循环的94℃、2分钟,随后40个循环的94℃、30秒,52℃、30秒,70℃、1分钟;然后1个循环的72℃、2分钟,随后将反应混合物冷却至5℃。
通过用35S-LEC2诱导产生油菜体细胞胚
如(Attila Kereszt等,2007)所描述,使用氯气对油菜(栽培品种Oscar)种子进行杀菌。使经过灭菌的种子在含0.8%琼脂且调节至pH 5.8的1/2强度MS培养基(Murashige和Skoog,1962)上萌芽,并且在24℃下、在荧光照明(50μE/m2s)下以18/6h(光/暗)光照期生长6至7天。从这些幼苗上无菌分离2至4mm杆长度的子叶叶柄且用作外植体。从来自于新鲜培养板的单一集落接种经过转化的根癌农杆菌菌株AGL1的培养物(一种带有种子特异性二元载体,且第二种带有35S-LEC2构建体),且使其在10mL含适当抗生素的LB培养基中生长并且在28℃下、在以150rpm搅拌下生长过夜。通过在4000rpm下离心5分钟来收集细菌细胞,用含有2%蔗糖的MS培养基洗涤,且再悬浮于10mL相同培养基中,并且在添加乙酰丁香酮达到100μΜ之后,在视情况选择的抗生素存在下生长4小时。在添加至植物组织之前两小时,添加亚精胺达到1.5mM最终浓度,且用新鲜培养基将细菌的最终密度调节至OD 600nm=0.4。将两种细菌培养物(一种携带种子特异性构建体,且另一种携带35S-AtLEC2)以1:1至1:1.5的比率混合。
用20mL根癌农杆菌培养物将新分离的油菜子叶叶柄感染6分钟。在无菌滤纸上揩吸子叶叶柄以去除过量根癌农杆菌,然后转移至共培育培养基(MS培养基,具有1mg/L TDZ、0.1mg/L NAA、100μΜ乙酰丁香酮,补充有L-半胱氨酸(50mg/L)、抗坏血酸(15mg/L)和MES(250mg/l))。用微孔胶带密封培养板且在24℃下在暗处孵育48h。将共培育的外植体转移至预选培养基(MS,含有1mg/L TDZ、0.1mg/L NAA、3mg/L AgNO3、250mg/L氨噻肟头孢菌素和50mg/L特美汀),且在24℃以16h/8h光照期培养4至5天。然后根据种子特异性载体上的选择标记基因将外植体转移至选择培养基(MS,含有1mg/L TDZ、0.1mg/L NAA、3mg/L AgNO3、250mg/L氨噻肟头孢菌素和50mg/L特美汀),且在24℃下以16h/8h光照期培养2至3周。将具有绿色胚性愈伤组织的外植体转移至无激素MS培养基(MS,具有3mg/L AgNO3、250mg/L氨噻肟头孢菌素、50mg/L特美汀和选择剂)且再培养2至3周。使用GC分析从存活外植体分离的鱼雷形或子叶阶段胚的总脂质中的脂肪酸组成。
实施例2.拟南芥种子中的转基因DHA途径的稳定表达
二元载体构建
二元载体pJP3416-GA7和pJP3404各自含有编码5种去饱和酶和2种延长酶的7个异源脂肪酸生物合成基因和处于各载体中所存在的T-DNA的左边界重复序列与右边界重复序列之间的植物选择标记物(图2和3)。SEQ ID NO:1提供了pJP3416-GA7的T-DNA区从右边界序列到左边界序列的核苷酸序列。两种基因构建体都含有编码克鲁维郎香酵母Δ12-去饱和酶(包含SEQ ID NO:1的核苷酸14143-16648)、巴斯德毕赤酵母ω3-去饱和酶(包含SEQID NO:1的核苷酸7654-10156)、细小微胞藻Δ6-去饱和酶(包含SEQ ID NO:1的核苷酸226-2309)、盐生巴夫藻Δ5-去饱和酶和Δ4-去饱和酶(分别包含SEQ ID NO:1的核苷酸4524-6485和10157-14142)和Pyramimonas cordataΔ6-延长酶和Δ5-延长酶(分别包含SEQ IDNO:1的核苷酸2310-4523和17825-19967)的植物密码子经优化基因。就SEQ ID NO:1而言,二元载体pJP3416-GA7的T-DNA(取向:右边界序列至左边界序列)区的特定区域如下:
核苷酸1-163:右边界;480-226,根癌农杆菌胭脂碱合成酶终止子(TER_NOS);1883-489,细小微胞藻Δ6-去饱和酶;2309-1952,油菜截短napin启动子(PRO_FP1);2310-3243,拟南芥FAE1启动子(PRO_FAE1);3312-4181,Pyramimonas cordataΔ6-延长酶;4190-4523,毛豆凝集素终止子(TER_凝集素);4524-4881,PRO_FP1;4950-6230:盐生巴夫藻Δ5-去饱和酶;6231-6485:TER_NOS;7653-6486,普通烟草Rb7基质连接区(MAR);8387-7654,亚麻conlinin1终止子(TER_Cnl1);9638-8388,巴斯德毕赤酵母ω3-去饱和酶;10156-9707,亚麻conlinin1启动子(PRO_Cnl1);10157-12189,亚麻conlinin1启动子;12258-13604,盐生巴夫藻Δ4-去饱和酶;13605-14142,亚麻conlinin2终止子;14143-14592,PRO_Cnl1;14661-15914,克鲁维郎香酵母Δ12-去饱和酶;15915-16648,TER_Cnl1;17816-16649,MAR;17825-18758,PRO_FAE1;18827-19633,Pyramimonas cordataΔ5-延长酶;19634-19967,TER_凝集素;19990-20527,具有重复增强子区的花椰菜花叶病毒35S启动子;20537-21088,产绿色链霉菌基因草胺膦-N-乙酰基转移酶;21097-21349,TER_NOS;21367-21527,左边界。
所述构建体中的7个编码区各自受种子特异性启动子控制,使用3种不同的启动子,即,截短油菜截短napin启动子(pBnFP1)、拟南芥FAE1启动子(pAtFAE1)和亚麻conlinin1启动子(pLuCnl1)。该7个脂肪酸生物合成基因一起编码旨在将18:1Δ9(油酸)转化成22:6Δ4,7,10,13,16,19(DHA)的整个DHA合成途径。两种二元载体都含有可操作地连接于具有重复增强子区的花椰菜花叶病毒(CaMV)35S启动子和根癌农杆菌nos3’聚腺苷酸化区转录终止子的BAR植物选择标记物编码区。植物选择标记物位于与T-DNA区的左边界相邻处,因此相对于T-DNA的取向位于T-DNA远端上转移至植物细胞中。这增加了不会选择将有可能不包括选择标记基因的部分转移T-DNA的可能性。pJP3416-GA7和pJP3404各自含有来自于发根农杆菌的RiA4复制起点(Hamilton,1997)。
通过合成对应于SEQ ID NO:1的核苷酸226-19975的DNA区(GA7区)且将该区插入受体二元载体pJP3416中的PspOMI位点上来产生pJP3416-GA7。GA7上的各脂肪酸生物合成基因包括烟草花叶病毒5’未翻译区(5’UTR)序列,该序列可操作地连接于处于启动子与翻译起始ATG之间的各编码区,以便使由该基因产生的mRNA的翻译效率最大化。如Hall等(1991)所描述,GA7构建体还包括两个普通烟草Rb7基质连接区(MAR)序列。已知MAR序列,有时称为核连接区,在体外特异性结合核基质且在体内可介导染色质与核基质结合。认为MAR的功能是减少转基因沉默。在pJP3416-GA7中,也插入了MAR且其位于T-DNA区内以便充当DNA间隔物以隔离转基因表达盒。pJP3416载体在GA7区插入之前仅含有处于边界之间的植物选择标记物盒。
利用基于序列限制酶的插入物来制造基因构建体pJP3404,其中将基因盒添加至包含用于在种子中产生SDA的基因的二元载体pJP3367。该构建体含有编码克鲁维郎香酵母Δ12-去饱和酶和巴斯德毕赤酵母ω3-去饱和酶的基因(两种酶均由油菜截短napin启动子(FP1)表达)和由拟南芥FAE1启动子表达的细小微胞藻Δ6-去饱和酶(图4)。首先,将拟南芥FAD2内含子侧接EcoRI位点且克隆至pJP3367MfeI位点中以产生pJP3395。将含有分别由FAE1和FP1启动子驱动的P.cordataΔ6-延长酶和Δ5-延长酶盒的片段克隆至pJP3395的KasI位点以产生pJP3398。然后通过用RiA4复制起点替换pJP3398中的RK2复制起点来产生pJP3399。通过将含有分别由FP1和FAE1启动子驱动的盐生巴夫藻Δ5-去饱和酶盒和Δ4-去饱和酶盒的SbfI侧接片段克隆至pJP3399的SbfI位点中来产生最终的二元载体pJP3404。
拟南芥转化和脂肪酸组成分析
将嵌合载体引入根癌农杆菌菌株AGL1以及使用用于转化的花序浸染法来自于用于处理拟南芥(生态型Columbia和fad2突变型)植物的经转化农杆菌培养物的细胞中(Clough和Bent,1998)。在成熟后,从经过处理的植物收获T1种子且接种至含有PPT的MS培养板上以便选择含有BAR选择标记基因的植物。将存活的健康T1幼苗转移至土壤。在植物生长至成熟且允许自花授粉后,从这些植物收获T2种子且如实施例1中所描述通过GC分析来分析其种子脂质的脂肪酸组成。
对于使用pJP3416-GA7转化至Columbia基因背景中的13种转化体和对于使用fad2突变体的6种转化体,种子脂质中的DHA水平的数据示于图5中(标记为T2的泳道)。pJP3416-GA7构建体产生的DHA水平(呈占总脂肪酸含量的百分比形式)平均稍高于pJP3404构建体。表4显示具有最高DHA水平的T2株系的总种子脂质的脂肪酸组成。相同种子中由油酸产生DHA中的各酶促步骤的计算转化效率示于表5中。转化效率计算为(%产物×100)/(%剩余底物+%产物),从而表示为百分比。
pJP3416-GA7T2转化株系中所产生的DHA的最高观察水平是6.2%,另外有0.5%EPA和0.2%DPA(#14株系)。这些T2种子对于转基因而言仍是分离的,即,尚不是均匀纯合的。将来自于独立转基因种子的总种子脂质分布(表4)的汇总数据示于表6中。由于这些种子中的转基因产生的ω3脂肪酸水平(总新ω3脂肪酸,不包括Columbia背景中内源性产生的ALA的水平)是10.7%,而ω6脂肪酸(总新ω6脂肪酸,但不包括18:2Δ9,12)的水平是1.5%。这代表新ω3脂肪酸:新ω6脂肪酸的非常有利的配比,即7.3:1。
将经pJP3416-GA7转化的选定株系,即,Columbia背景中指定为7、10、14、22和34的株系和fad2突变体背景中指定为18、21和25的株系的T2种子接种于含有PPT的MS培养基上,以便体外选择转基因幼苗。对于各株系,将20株抗PPT幼苗转移至土壤且在自花授粉后生长至成熟。这些植物对于选择标记基因而言且因此对于植物基因组中的至少一个T-DNA插入物而言非常可能是纯合的。从这些植物收获T3种子且通过GC分析其种子油中的脂肪酸组成。数据示于表7中。该分析显示,纯合植物的T3种子中的pJP3416-GA7构建体产生的ω3LC-PUFA DHA水平高于分离T2种子。Columbia背景中指定为22.2的T3 pJP3416-GA7转化株系中观察到多达约13.9%DHA,在半合T2种子中增加约5.5%,新ω3脂肪酸的总水平为约24.3%(呈占种子脂质含量中的总脂肪酸的百分比形式)。新ω6脂肪酸的水平是总脂肪酸的1.1%,代表着非常有利的新ω3脂肪酸:新ω6脂肪酸比率,即约22:1。类似地,fad2突变体背景中的转化体产生总计20.6%新ω3脂肪酸,包括11.5%DHA(呈占种子脂质含量中的总脂肪酸的百分比形式)。
表4.得自于DHA水平处于观察范围中较高的一端的独立转基因T2拟南芥种子的总种子脂质的脂肪酸组成。‘Col’是指Columbia生态型且‘FAD2’是指fad2突变生态型。‘GA7’是指用pJP3416-GA7载体的T-DNA转化,pJP3404是指用pJP3404载体的T-DNA转化。GC分析中未解析出20:1n-9和20:1n-11脂肪酸。“其它微量”脂肪酸包括14:0、16:1n7、16:1n9、16:1n13t、16:2n6、16:3n3、i18:0、18:1n5、20:1n5、22:0、22:1n7、22:1n11/n13、24:0、24:1n9。
表5.在来自于如表4独立转基因种子的总种子脂质中观察到的由油酸产生DHA的个别酶促步骤的转换效率。
表6.得自于表2中所示的独立转基因种子的总种子脂质分布的汇总数据。计算不包括表4中的‘微量脂肪酸’。
表7.得自于获自如表3中的植物株系的独立转基因T3和T4拟南芥子代种子的总种子脂质的脂肪酸组成。T4世代中所显示的误差表示n=10的SD。
对于具有较高DHA水平的T3种子,由油酸产生DHA的途径中各酶步骤的酶转化效率示于表8中。株系22.2的种子中的Δ12-去饱和酶转化效率是81.6%且ω3-去饱和酶效率是89.1%,两者都显著较高且表明这些真菌(酵母)酶能够在发育种子中充分发挥功能。DHA途径中的其它外源酶对ω3底物的活性类似地较高,其中Δ6-去饱和酶的作用效率是42.2%,Δ6-延长酶的效率是76.8%,Δ5-去饱和酶的效率是95.0%,Δ5-延长酶的效率是88.7%且Δ4-去饱和酶的效率是93.3%。对ω6底物LA的Δ6-去饱和酶活性低得多,其中Δ6-去饱和酶作用于LA的转化效率仅为0.7%。GLA的存在水平仅为0.4%,且在具有最高DHA含量的T3种子中仅检测到除20:2ω6以外的新ω6产物。来自于独立转基因种子的总种子脂质分布(表7)的汇总数据示于表9中。具有最高DHA水平的株系的该数据所包括的总ω6 FA(包括LA):总ω3 FA(包括ALA)比率为0.10。该株系的脂质中的新ω6 FA(不包括LA):新ω3 FA(不包括ALA)比率是0.05。在这些株系中,总多不饱和脂肪酸水平大于50%,且在至少4个株系中大于60%。总体转化效率计算为:OA到EPA=21.8%,OA到DHA=18.0%,LA到EPA=26.9%,LA到DHA=22.2%,ALA到EPA=30.1%,ALA到DHA=24.9%。
表8.在来自于如表7中的转基因T3拟南芥种子的总种子脂质中观察到的由油酸产生DHA的个别酶促步骤的转化效率。
表9.得自于表5中所示的独立转基因种子的总种子脂质分布的汇总数据。计算不包括表7中的‘微量脂肪酸’。
Columbia背景中得自于pJP3416-GA7株系22.2的T3种子是T2株系22的子代,将其直接播种到土壤中,且通过GC分析所得T3植物的成熟种子的脂肪酸组成。这些种子的平均DHA水平(呈占种子脂质中的总脂肪酸的百分比形式)是13.3±1.6%(n=10)。如表6中(右边列)所示,具有最高DHA水平的株系在种子脂质的总脂肪酸中含有15.1%DHA。由油酸产生DHA中各步骤的酶转化效率示于表8中。
具有最高DHA水平的株系中的总ω6 FA(包括LA):ω3 FA(包括ALA)比率是0.102。具有最高DHA水平的株系中的新ω6 FA(不包括LA):新ω3 FA(不包括ALA)比率是0.053。总饱和脂肪酸的水平为约17.8%且单不饱和脂肪酸的水平为约18.1%。总ω6脂肪酸的水平为约5.7%且ω3-脂肪酸的水平为约55.9%。总体转化效率计算为:OA到EPA=24.5%,OA到DHA=20.1%,LA到EPA=29.9%,LA到DHA=24.5%,ALA到EPA=32.9%,ALA到DHA=27.0%。发现总ω3脂肪酸累积达总脂肪酸的55.9%,而ω6脂肪酸是总分布的5.7%。
进行Southern印迹杂交分析。结果显示,高累积DHA株系是来自于pJP3416-GA7构建体的T-DNA的单拷贝或双拷贝,但转基因株系Columbia#22除外,其在拟南芥植物的基因组中具有三个T-DNA插入物。还分析了T5世代种子,且发现其总种子脂质中具有多达13.6%DHA。发现就DHA产生能力而言,GA7构建体在多次传代后是稳定的。
测定转基因拟南芥DHA株系中的油含量
如实施例1中所描述通过GC测定具有各种DHA水平的转基因拟南芥种子的油含量。数据示于图6中,将油含量(%油,以种子重量计)相对于DHA含量(呈占总脂肪酸的百分比形式)作图。观察到多达26.5mg DHA/g种子(表10)。发现转基因拟南芥种子的油含量与DHA含量负相关。相对于具有约14%DHA的种子,具有DHA水平约9%的转化种子中的DHA的量/种子重量较高。这对于除拟南芥以外的种子是否成立尚未确定。
表10.GA7-转化拟南芥种子中的DHA比例和量
实施例3.亚麻荠种子中的转基因DHA途径的稳定表达
将如上文所述的二元载体pJP3416-GA7引入根癌农杆菌菌株AGL1以及使用用于的转化花序浸染法来自于用于处理亚麻荠开花植物的经转化农杆菌培养物的细胞中(Lu和Kang,2008)。在植物生长和成熟后,从经过处理的植物收获T1种子,播种至土壤上,且通过用除草剂BASTA喷雾来处理所得植物,以选择对于pJP3416-GA7的T-DNA上所存在的bar选择标记基因为转基因且表达该bar选择标记基因的植物。在允许耐受该除草剂的存活的T1植物自花授粉后使其生长至成熟,且收获所得T2种子。获得5种转基因植物,其中仅3种含有整个T-DNA。
从具有来自于这三种含有整个T-DNA的植物的每一种的大约20种种子的库提取脂质。汇集的样品中两种含有非常低、仅可检测水平的DHA,但第三个库含有约4.7%DHA(表12)。因此,从得自于该植物的10个个别T2种子提取脂质且通过GC分析脂肪酸组成。该转化株系的个别种子的脂肪酸组成数据也示于表11中。来自于总种子脂质分布(表11)的汇总数据示于表12中。
表11.经来自于pJP3416-GA7的T-DNA转化的转基因T2亚麻荠种子的总种子脂质的脂肪酸组成。所显示的脂肪酸组成是针对汇集种子批(FD5.46)和从最高到最低DHA分级的10个单一种子(从左到右)。
表12.得自于表11中所示的转基因种子的总种子脂质分布的汇总数据。计算不包括表11中的‘微量脂肪酸’。
这10种个别种子中有6种存在DHA。其它4种种子不具有DHA,且基于亲本株系中的T-DNA插入物的半合子状态,假定是不具有T-DNA的无效分离子。从具有最高DHA水平的单一种子提取的脂质具有9.0%DHA,而EPA、DPA和DHA的总百分比是11.4%。该种子中由于转化而产生的新ω3脂肪酸的总百分比(SDA、ETrA、ETA、EPA、DPA、DHA)是19.3%,而新ω6脂肪酸的相应总和(GLA、EDA、DGLA、ARA和任何ω6延长产物)是2.2%,作为新ω6脂肪酸,仅检测到GLA和EDA。发现总ω6 FA(包括LA):ω3FA(包括ALA)比率是0.44。具有最高DHA水平的种子中的新ω6 FA(不包括LA):新ω3 FA(不包括ALA)比率是0.12。总饱和脂肪酸的水平为约17.8%且单不饱和脂肪酸的水平为约15.5%。总ω6脂肪酸的水平为约20.4%且ω3脂肪酸的水平为约46%。总体转化效率计算为:OA到EPA=15.6%,OA到DHA=12.3%,LA到EPA=17.2%,LA到DHA=13.6%,ALA到EPA=24.8%,ALA到DHA=19.6%。
来自于该株系的纯合种子是在T4代中获得。在事件FD5-46-18-110中产生多达10.3%DHA,而在整个T4代中观察到平均7.3%DHA。
将纯合种子移植到若干个温室中以产生总共超过600株个别植物。使用多种方法(包括索氏抽提法、丙酮提取和己烷提取)从种子中提取油。
因为如上所述获得的亚麻荠的独立转化的株系数较低,故进行进一步实验以便用pJP3416-GA7转化亚麻荠。发明人预计在经过进一步转化的株系中,将实现DHA水平(呈占种子油中的总脂肪酸百分比形式)大于10%,且对于T-DNA而言为纯合的植物达20%DHA。产生20个亚麻荠GA7_modH事件且分析种子的DHA含量。产生3个GA7_modB事件且对来自于事件CMD17.1的T1种子的分析显示汇集种子DHA含量为9.8%。发现最高的单一种子DHA值是13.5%。
实施例4.油菜种子中的转基因DHA途径的稳定表达
使用单一载体的油菜转化和脂肪酸组成分析
使用二元载体pJP3416-GA7产生经过转化的油菜植物和得自于所述植物的种子。经由标准电穿孔程序将如上所述的载体pJP3416-GA7引入根癌农杆菌菌株AGL1中。在28℃下在LB培养基中使转基因农杆菌属细胞的培养物生长过夜,同时以150rpm搅拌。通过在4000rpm下离心5分钟收集细菌细胞,用Winans AB培养基(Winans,1988)洗涤且再悬浮于10mL Winans AB培养基(pH 5.2)中,并且在卡那霉素(50mg/L)、利福平(25mg/L)和100μΜ乙酰丁香酮存在下继续生长过夜。在感染芸苔属细胞之前2小时,添加亚精胺(120mg/L)且用新鲜AB培养基将细菌的最终密度调节至OD 600nm=0.3-0.4。将从在1/2MS上生长的8天龄油菜幼苗新分离的子叶叶柄(Murashige和Skoog,1962)或在MS培养基上用1mg/L噻苯隆(TDZ)和0.1mg/Lα-萘乙酸(NAA)预处理3至4天的胚轴区段用10mL农杆菌属培养物感染5分钟。在无菌滤纸上揩吸经农杆菌感染的外植体以去除过量农杆菌,并且转移至补充有或无不同抗氧化剂(L-半胱氨酸50mg/L和抗坏血酸15mg/L)的共培育培养基(MS培养基,具有1mg/L TDZ、0.1mg/L NAA、100μΜ乙酰丁香酮)。用石蜡膜密封所有培养板且在23℃至24℃下在暗处孵育48h。
然后用含有500mg/L氨噻肟头孢菌素和50mg/L特美汀的无菌蒸馏水将经过处理的外植体洗涤10分钟,在无菌蒸馏水中冲洗10分钟,在无菌滤纸上揩干,转移至预选培养基(MS,含有1mg/L TDZ、0.1mg/L NAA、20mg/L硫酸腺嘌呤(ADS)、1.5mg/L AgNO3、250mg/L氨噻肟头孢菌素和50mg/L特美汀),且在24℃以16h/8h光照期培养5天。然后将其转移至选择培养基(MS,含有1mg/L TDZ、0.1mg/L NAA、20mg/L ADS、1.5mg/L AgNO3、250mg/L氨噻肟头孢菌素和50mg/L特美汀),以1.5mg/L草铵膦作为转化细胞的选择剂,且在24℃下以16h/8h光照期培养4周,每两周将传代培养物取到相同培养基上。将具有绿色愈伤组织的外植体转移至芽引发培养基(MS,含有1mg/L激动素、20mg/L ADS、1.5mg/L AgNO3、250mg/L氨噻肟头孢菌素、50mg/L特美汀和1.5mg/L草铵膦)且再培养2至3周。将从抗性外植体萌发的芽转移至芽延长培养基(MS培养基,具有0.1mg/L激勃酸、20mg/L ADS、1.5mg/L AgNO3、250mg/L氨噻肟头孢菌素和1.5mg/L草铵膦)且再培养2周。选择2至3cm的健康芽且转移至生根培养基(1/2MS,含有1mg/L NAA、20mg/L ADS、1.5mg/L AgNO3和250mg/L氨噻肟头孢菌素)且培养2至3周。将生长良好的生根芽转移至含有育苗混合物的器皿中且在生长室中生长2周,且随后转移至温室。利用该方法获得了大约40株经GA7构建体转化的植物(T0)。
在允许自花授粉之后使植物生长至成熟。如实施例1中所描述分析获自转化植物的种子的种子油中的脂肪酸组成。具有最高DHA水平的转化株系的数据示于表13中。经来自于pJP3416-GA7的T-DNA转化的油菜种子的种子油中的平均DHA水平显著低于经相同构建体转化的拟南芥种子(实施例2)或亚麻荠种子(实施例3)。发现大约40株的最高DHA水平是1.52%,其中大多数转基因株系具有可检测的DHA。注意,这些种子中累积了大量ALA(占总脂肪酸的约35%)未有效转化成SDA或该途径中的下游产物。
对来自于T1事件CT125-2的单一油菜种子进行脂肪酸分布分析,以更好地确定转基因种子中所产生的DHA的量。发现种子含有0%(无效种子)与8.5%之间的DHA(表13)。
播种一些来自于植物株系CT116以及其它显示DHA产生的转基因株系的种子以产生子代植物。对从这些植物的发育胚分离的总RNA进行RT-PCR,以便确定为何在DHA产生方面GA7构建体相对于具有相同构建体的转基因拟南芥和亚麻荠表现不良和相对于pJP3115和pJP3116上的基因组合表现不良(下文)。使用单步RT-PCR试剂盒(Invitrogen)和靶向各转基因的基因特异性引物对总RNA进行RT-PCR。这证实了GA7构建体中的各基因在油菜转化体中都得以良好表达,除了Δ6-去饱和酶在大多数转化种子中表达不良。来自于该构建体的其它基因在油菜和拟南芥种子中充分作用,例如,Δ12-去饱和酶和Δ15-去饱和酶用于提高种子中产生的LA和ALA的水平,同时降低油酸水平。代表性RT-PCR凝胶示于图7中,该图清楚地示出了Δ6-去饱和酶相对于来自于pJP3416-GA7的其它转基因的低表达。
转基因植物和种子是纯合的,因为所述转基因是通过种植来自于具有最高DHA的株系的子代而产生。
表13.经pJP3416-GA7转化的独立T1油菜种子株系CT116-11和CT-125-2与野生型(未转化)对照相比的脂肪酸组成(呈占种子油中的总脂肪酸的百分比形式)。22:6ω3是DHA。得自于单一CT125-2油菜种子的数据由‘SS’表示。
使用两种载体的油菜转化和脂肪酸组成分析
在油菜中进行且作为引入转基因的替代型式的另一个实验中,将如WO 2010/057246中所描述的二元载体pJP3115和pJP3116用于单独地产生经过转化的油菜植物,且从所述植物获得经过转化的种子。pJP3115上的T-DNA包含编码还阳参(Crepis palestina)Δ12-去饱和酶、细小微胞藻Δ6-去饱和酶、Pyramimonas cordataΔ6-延长酶和盐生巴夫藻Δ5-去饱和酶的嵌合基因,且pJP3116上的T-DNA含有编码白苏子Δ15-去饱和酶、Pyramimonas cordataΔ5-延长酶和盐生巴夫藻Δ4-去饱和酶的嵌合基因。两种T-DNA在共同存在且表达于发育种子中时形成七基因途径以便由内源性产生的油酸产生DHA。经由标准电穿孔程序将这些载体引入根癌农杆菌菌株AGL1中且使用如上所述的方法将经过转化的细胞独立地用于转化油菜,以产生经过稳定转化的T0植物。获得了29种pJP3115转化体和19种pJP3116转化体,且使这些植物生长至成熟并且分析在自花授粉之后获得的种子的种子油中的脂肪酸组成。预期用来自于pJP3115的T-DNA进行转化导致由内源性产生的ALA产生EPA,而预期用来自于pJP3116的T-DNA进行转化导致由LA产生的ALA增加。鉴别了若干种呈现这些表型的植物。大多数事件由于在低水平EPA产生下的Δ12去饱和而呈现OA减少/LA增加的表型。在pJP31115转基因汇集种子中观察到多达2.6%EPA。类似地,发现大多数pJP3116事件由于Δ15-去饱和酶活性而具有升高的ALA表型。在用来自于pJP3116的T-DNA转化的汇集种子中发现多达18.5%ALA。
对得自于具有最高EPA和ALA水平的株系的T1植物进行杂交,且分析得自于24个回收事件的子代种子(F1)的DHA含量。在这些事件中的17个事件中发现了DHA,其中在从这些事件汇集的种子中发现了多达1.9%DHA。进行单一种子分析以确定DHA产量范围,数据示于表14中。在杂交子代中观察到了较大范围的DHA水平,这或许是由于亲本株系中的T-DNA的半合性,使得一些种子不接受这两种T-DNA。在总种子脂质中观察到多达6.7%DHA。
表14.得自于pJP3115的T-DNA转基因植物与pJP3116的T-DNA转基因植物杂交的油菜F1单一种子的种子油中的脂肪酸组成(呈占总脂肪酸的百分比形式)。B1、B2和B4表示事件。0.0=GC方法未检出。
表15.得自于表14中所示的转基因种子的总种子脂质分布的汇总数据。计算不包括表14中的‘微量脂肪酸’。
来自于总种子脂质分布(表14)的汇总数据示于表15中。从表15中的数据可见,具有最高DHA水平的种子中的总ω6 FA(包括LA):ω3 FA(包括ALA)比率是3.34。新ω6 FA(不包括LA):新ω3 FA(不包括ALA)比率是1.39。总饱和脂肪酸的水平为约13.7%且单不饱和脂肪酸的水平为约21.8%。总ω6脂肪酸的水平为约46.4%且ω3脂肪酸的水平为约14.8%。总体转化效率计算为:OA到EPA=12.8%,OA到DHA=8.5%,LA到EPA=15.7%,LA到DHA=10.4%,ALA到EPA=72.1%,ALA到DHA=47.9%。在该利用pJP3115与pJP3116的组合的实验中观察到ω6脂肪酸到ω3脂肪酸转化效率降低被认为是由于当与用于将ALA转化成DHA的基因组合时植物Δ15-去饱和酶与真菌Δ15/ω3去饱和酶(实施例2和3)相比效率较低。
产生得自于对所有引入的转基因都是纯合的含DHA株系的子代以便进行分析。
实施例5.对植物种子中编码DHA途径的T-DNA的修饰
为了提高油菜中的DHA产生水平超过实施例4中所描述的水平,如下构建二元载体pJP3416-GA7-modA、pJP3416-GA7-modB、pJP3416-GA7-modC、pJP3416-GA7-modD、pJP3416-GA7-modE和pJP3416-GA7-modF。这些二元载体是实施例2中所描述的pJP3416-GA7构建体的变体,且旨在进一步增加植物种子中的DHA合成,特别是通过改良Δ6-去饱和酶和Δ6-延长酶功能。已经观察到SDA在一些经GA7构建体转化的种子中由于与Δ5-延长酶相比延长效率相对较低而累积,因此在其它修改方案中,将T-DNA中的该两个延长酶基因位置切换。
通过首先将新P.cordataΔ6-延长酶盒克隆在pJP3416-GA7的SbfI位点之间以置换P.cordataΔ5-延长酶盒将pJP3416-GA7中的两个延长酶编码序列切换到T-DNA上的位置以产生pJP3416-GA7-modA。通过交换驱动细小微胞藻Δ6-去饱和酶的FP1启动子与conlinin Cnl2启动子(pLuCnl2)进一步修饰该构建体,以产生pJP3416-GA7-modB。进行该修饰以试图增加Δ6-去饱和酶表达且从而提高酶效率。认为Cnl2启动子与截短napin启动子相比可以在油菜中产生较高转基因表达。通过添加具有稍微不同的密码子用法(SEQ IDNO:15)且由FP1启动子驱动的第二细小微胞藻Δ6-去饱和酶盒来产生pJP3416-GA7-modC,该FP1启动子插入在正好在pJP3416-GA7-modB的右边界内的PmeI位点上。将第二Δ6-去饱和酶盒添加到pJP3416-GA7-modB和pJP3416-GA7-modF,以便增加Δ6-去饱和酶表达水平和延长种子发育的时间段以便使用多个启动子表达Δ6-去饱和酶。将不同的密码子用法用于该两个核苷酸序列中以便在无同一T-DNA内的类似编码区所致的共阻抑风险的情况下翻译同一蛋白质序列。pJP3416-GA7-modD和pJP3416-GA7-modE是类似的变体,其中对应于SEQID NO:1的核苷酸16649-17816的第三MAR序列分别添加至pJP3416-GA7和pJP3416-GA7-modB的PmeI位点上。通过添加含有天然Δ6-去饱和酶核苷酸序列且由pJP3416-GA7-modB右边界上的PmeI位点上的FP1启动子驱动的第二个细小微胞藻Δ6-去饱和酶盒来产生pJP3416-GA7-modF。通过首先用Cnl2:P.cordataΔ5-延长酶盒置换细小微胞藻Δ6-去饱和酶盒,通过限制AscI-PacI位点上的克隆来制造pJP3416-GA7-modG。通过首先用FAE1:细小微胞藻Δ6-去饱和酶盒置换原始FAE1:P.cordataΔ5-延长酶盒,通过限制SbfI位点上的克隆来制造pJP3416-GA7-modG。这些基因构建体各自的T-DNA的核苷酸序列显示为:pJP3416-GA7-modB(SEQ ID NO:2)、pJP3416-GA7-modC(SEQ ID NO:3)、pJP3416-GA7-modD(SEQ IDNO:4)、pJP3416-GA7-modE(SEQ ID NO:5)、pJP3416-GA7-modF(SEQ ID NO:6)和pJP3416-GA7-modG(SEQ ID NO:7)。
使用二元载体pJP3416-GA7-modB、pJP3416-GA7-modC、pJP3416-GA7-modD、pJP3416-GA7-modE、pJP3416-GA7-modF和pJP3416-GA7-modG来产生经过转化的芸苔体细胞胚和油菜、亚麻荠和拟南芥植物和子代种子。pJP3416-GA7-modB的数据示于下一个实施例中。
产生了8个转基因pJP3416-GA7-modB拟南芥事件和15个转基因pJP3416-GA7-modG拟南芥事件。观察到所汇集的pJP3416-GA7-modB种子中的DHA在3.4%与7.2%之间且观察到所汇集的T2pJP3416-GA7-modG种子中的DHA在0.6%与4.1%之间。将若干个最高pJP3416-GA7-modB事件播种在选择培养基上且存活的幼苗产生下一代。分析种子的DHA含量。因为所汇集的T1种子代表分离转基因的群体且包括任何无效分离子,所以预期得自于子代植物的纯合种子将具有增加的DHA水平,多达种子油中的总脂肪酸含量的20%。使用其它经修饰构建体转化拟南芥。尽管仅获得少量转化株系,但所产生的DHA水平都不高于modB构建体。
还使用pJP3416-GA7-modB构建体来产生载培品种Oscar的经转化油菜植物且育种株系表示为NX005。对于Oscar转化,迄今获得了10个独立的经转化植物(T0),且对于NX005,获得了20个独立的株系。从这些转基因株系收获种子(T1种子)。测试种子库的种子油中的DHA水平,且选择显示最高水平的两个株系,这些株系表示为株系CT132.5(载培品种Oscar)和CT133.15(NX005)。使20种得自于CT132.5的种子和11种得自于CT133.15的种子吸胀,且在两天之后,从各个别种子的半子叶中提取油。保持另一半子叶与胚轴且在培养基上培养以保持特定子代株系。测定油中的脂肪酸组成;CT132.5的数据示于表16中。如通过GC分析所测定,所分析的20种种子中有10种的DHA水平在总脂肪酸含量的7%至20%范围内。其它种子的DHA少于7%,且可能具有来自于pJP3416-GA7-modB的T-DNA的部分(不完全)拷贝。转基因株系似乎含有基因未连接的多个转基因插入物。转基因株系CT133.15的种子所展现的DHA水平在0%至5%范围内。不含DHA的种子可能是无效的分离子。这些数据证实modB构建体在芸苔种子中在DHA产生方面表现良好。
还使用pJP3416-GA7-modB和pJP3416-GA7-modF构建体来产生经转化的亚麻荠植物。获得了至少24个独立的经转化植物(T0)且通过子代分析更详细地检查。从这些转基因株系收获种子(T1种子)。测试种子库的种子油中的DHA水平,且选择显示最高DHA水平(在6%与9%之间)的6个株系。分析来自各株系的20种T1种子的DHA水平,如通过GC分析所测定,大部分种子所展现的DHA水平在总脂肪酸含量的6%至14%范围内。测定油中的脂肪酸组成;若干种转基因种子的数据示于表17中。这些数据证实modB和modF构建体在亚麻荠种子中在DHA产生方面都表现良好。
表16.含有modB构建体的萌芽T1转基因油菜种子的半子叶的脂肪酸分布。在含有高于10%DHA的许多样品中观察到多达18.1%DHA。
表17.含有modB或modF构建体的T1转基因亚麻荠种子的脂肪酸分布
诸位发明人认为总体来说,与单拷贝T-DNA转化体相比,在多拷贝T-DNA转化体中,限速酶活性在DHA途径中的效率较高,或可通过插入编码在该途径中可能具有限制性的酶的T-DNA多基因来提高。多拷贝转化体可能具有重要性的证据见经GA7构建体转化的拟南芥种子(实施例2),其中最高产生DHA事件在宿主基因组中插入3个T-DNA。多个基因可能是同一的,或优选地是编码相同多肽的不同变体,或受具有重叠表达模式的不同启动子控制。举例来说,增加表达可通过表达多个Δ6-去饱和酶编码区来实现,即使在产生相同蛋白质的情况下。举例来说,在pJP3416-GA7-modF和pJP3416-GA7-modC中,存在两种细小微胞藻Δ6-去饱和酶版本且是由不同的启动子表达。编码序列具有不同的密码子用法,且因此具有不同的核苷酸序列,以减轻潜在沉默或共阻抑作用,但产生相同蛋白质。
实施例6.种子特异性构建体在体细胞胚中的活性
为了建立预测基因构建体在种子特异性启动子控制下在种子中的表达的快速测定系统,建立油菜的体细胞胚系统。这使用了用于表达参与起始体细胞胚发生的LEC2转录因子的载体。作为说明,经由标准电穿孔将二元载体35S:LEC2和pJP107(Petrie等,2010a和b)引入根癌农杆菌菌株AGL1中且通过共培育将农杆菌转化体用于共转化油菜。pJP107的T-DNA区含有编码球等鞭金藻Δ9-延长酶、盐生巴夫藻Δ8-去饱和酶和盐生巴夫藻Δ5-去饱和酶的基因,其中各基因由种子特异性启动子表达。对照转化仅使用35S:LEC2载体。35S:LEC2表达导致在组织培养物中由经转化的油菜愈伤组织直接产生体细胞胚,如实施例1中所描述。
脂肪酸分析显示构建体pJP107的T-DNA上的种子特异性基因在共转化的LEC2基因存在下被表达于转基因体细胞胚中且用于由LA产生ARA(20:4Δ5,8,11,14)和由ALA产生EPA(20:5Δ5,8,11,14,17)。将3种共转化体细胞胚的数据示于表18中,且将各自的脂肪酸组成与油菜种子的种子油的脂肪酸组成相比较,所述油菜种子对于pJP107的T-DNA是转基因的且表达pJP107的T-DNA(Petrie等,2010a和b)。当与稳定转化的种子分布相比时,在体细胞胚组织中观察到ARA和中间物脂肪酸EDA(20:2ω6)和DGLA(20:3ω6)的类似总百分比以及转化效率。在稳定T2转基因种子和体细胞胚的脂肪酸组成方面观察到类似的结果:ω6脂肪酸的水平分别是26.6%和25.6%(平均),而发现ARA水平分别是9.7%和10.6%(平均)。
当单独引入35S:LEC2且在时程中分析体细胞胚时,发现脂肪酸分布变成更像胚的分布,其中18:3Δ9,12,15减少而18:1Δ9增加,呈逆相关方式(图8)。这些结果表明,体细胞胚在特征方面实际上变得像种子且表达来自于pJP107的T-DNA上的基因。这显示体细胞胚系统允许快速表征油菜中的转基因种子特异性构建体而不需要产生转基因植物和由该植物产生成熟种子的全过程。
表18.通过共转化pJP107与35S:LEC2产生的获自油菜体细胞胚的脂质的脂肪酸组成与未转化对照(WT)和经pJP107转化的T2种子相比较。个别酶转化效率示于相关酶促步骤之后的括号中。D9-Elo是Δ9-延长酶,D8-Des是Δ8-去饱和酶,且D5-Des是Δ5-去饱和酶。
WT T2 pJP107转基因种子 LEC2:#45 LEC2:#57 LEC2:#58
18:1<sup>Δ9</sup> 57.2 45.7 3.8 2.5 1.9
18:2<sup>Δ9,12</sup> 19.1 8.7 10 10.6 10
18:3<sup>Δ9,12,15</sup> 10.2 4.1 22.5 27.5 24.2
20:2<sup>Δ11,14</sup> 7.1±1.9(67%D9-elo) 5.2(61.8%D9-elo) 3.7(56.7%D9-elo) 4.6(61.8%D9-elo)
20:3<sup>Δ8,11,14</sup> 1.1±0.2(60%D8-des) 0.4(67%D8-des) 0.2(73%D8-des) 0.4(73%D8-des)
20:4<sup>Δ5,8,11,14</sup> 9.7±0.9(90%D5-des) 10.6(98%D5-des) 10(96%D5-des) 11.2(97%D5-des)
20:3<sup>Δ11,14,17</sup> 4.0±0.8 9.9 5.5 7.3
20:4<sup>Δ8,11,14,17</sup> 0.3±0.1 0.4 0.3 0.4
20:5<sup>Δ5,8,11,14,17</sup> 2.4±0.2 7.6 6.4 7.9
总新 24.6 34.1 26.1 31.8
通过使用同一系统来产生体细胞胚,用pJP3416-GA7-modB和pJP3416-GA7-modD单独地转化油菜细胞。获得了42个胚,18个针对modB且24个针对modD。从胚提取总脂质且分析脂肪酸组成。所述胚含有在0%与多达16.9%之间的DHA(表19)。在0%DHA下的结果被假定是由于仅整合部分T-DNA或插入基因组的转录沉默区。发现总ω3 FA(包括ALA):总ω6 FA(包括LA)比率对于#270胚是2.3且对于#284胚是11.96。总ω6 FA(包括LA):总ω3 FA(包括ALA)比率对于#284胚是0.08。新ω6 FA(不包括LA):新ω3 FA(不包括ALA)比率对于#284胚是0.03。总体转化效率计算为:(对于#270、#284胚)OA到EPA=14.0%、29.8%;OA到DHA=9.7%、24.2%;LA到EPA=15.4%、30.7%;LA到DHA=10.7%、25.0%;ALA到EPA=22.1%、33.3%;ALA到DHA=15.3%、27.0%。相对于在T3 pJP3416-GA7拟南芥株系所观察的结果,这些效率类似,或比#284的情形更大,这表明pJP3416-GA7-modB载体能够在油菜细胞中良好地发挥作用。SDA水平低于3.0%,表明Δ6-延长酶比GA7构建体表现得甚至更好。在#284中所实现的个别酶效率是:Δ12-去饱和酶,97.4%;ω3-去饱和酶,92.3%;Δ6-去饱和酶,38.2%;Δ6-延长酶,88.2%;Δ5-去饱和酶,98.8%;Δ5-延长酶,94.1%;和Δ4-去饱和酶,86.3%。总饱和脂肪酸是21.2%,总单不饱和脂肪酸是10.2%,总多不饱和脂肪酸是68.6%。
诸位发明人相信这是迄今为止在油菜细胞中实现的最高DHA水平,但进一步数据如下所述。这也证明,pJP3416-GA7-modB中相对于pJP3416-GA7的修饰在提高Δ6-去饱和酶基因的表达水平方面是有效的。将如上所述的二元载体pJP3416-GA7、pJP3416-GA7-modA、pJP3416-GA7-modC、pJP3416-GA7-modD、pJP3416-GA7-modE和pJP3416-GA7-modF与35S:LEC2共转化以产生经转化的油菜体细胞胚。在modD胚中观察到多达7.0%DHA,modE胚中为9.9%,modF胚中为8.3%,且在少数modG胚中为3.6%。
表19.通过共转化种子特异性DHA酸构建体pJP3416-GA7-modB与35S:LEC2而产生的油菜体细胞胚#270和#284以及#286和#289(pJP3416-GA7-modD)的油的脂肪酸组成。
#270 #284 #286 #289
14:0 0.3 0.2 0.2 0.2
16:0 14.0 15.7 17.2 16.6
16:1d9 0.7 0.4 0.8 0.8
16:3 0.5 0.6 1.1 1.3
18:0 2.6 2.4 2.5 2.5
18:1d9 6.6 1.8 1.5 1.1
18:1d11 6.3 6.8 6.5 6.7
18:2 18.9 4.5 10.0 9.8
18:3ω6 0.7 0.8 0.3 0.3
18:3ω3 33.0 37.2 42.0 41.5
20:0 0.9 0.9 0.8 0.8
18:4ω3 1.9 2.8 3.6 4.5
20:1d11 0.2 0.1 0.1 0.1
20:2ω6 0.1 0.1 0.1 0.2
20:3ω3 0.5 0.0 0.5 0.6
22:0 0.8 1.5 0.6 0.7
20:4ω3 0.2 0.9 0.7 0.7
20:5ω3 0.7 0.2 0.3 0.3
22:2ω6 0.0 1.2 0.0 0.0
22:3ω3 0.0 0.1 0.0 0.1
24:0 0.8 1.0 1.0 1.0
24:1 0.8 1.0 0.7 0.9
22:5ω3 2.4 2.7 3.2 3.0
22:6ω3 7.0 16.9 6.1 6.4
实施例7.分析来自于产生DHA的转基因拟南芥种子的TAG
来自于经转化拟南芥种子的TAG上的DHA的位置分布是通过NMR来确定。通过首先在己烷下压碎种子,随后将压碎的种子转移至含有10mL己烷的玻璃管而从大约200mg种子中提取总脂质。在水浴中在大约55℃下使管子升温,然后涡旋并离心。去除己烷溶液且再用4×10mL重复该程序。合并提取物,通过旋转蒸发进行浓缩,且通过使用20mL 7%己烷中的乙醚通过短石英柱对提取的脂质中的TAG进行纯化脱除极性脂质。如先前所描述(Petrie等,2010a和b)定量测定经纯化TAG上的酰基位置分布。
分析显示总种子油中的大多数DHA位于TAG的sn-1/3位置上,而极少见于sn-2位置上(图9)。与该结果相反的是,来自于产生ARA的种子的TAG显示50%ARA(20:4Δ5,8,11,14)位于转基因芥花油的sn-2位置上,而预期仅33%呈随机分布(Petrie等,2012)。
通过基本上相同的方法测定来自于经pJP3416-GA7或pJP3115与pJP3116的组合转化的油菜种子的TAG中的DHA的位置分布。
还通过三级四极LC-MS分析来自于转基因拟南芥种子的总脂质,以确定含DHA的主要三酰基甘油(TAG)种类(图10)。发现DHA含量最丰富的TAG种类是DHA-18:3-18:3(TAG 58:12;命名法未描述位置分布),而第二最丰富的是DHA-18:3-18:2(TAG 58:11)。在总种子油中观察到Tri-DHA TAG(TAG 66:18),虽然含量很低但处于可检测的水平。其它含DHA的主要TAG种类包括DHA-34:3(TAG 56:9)、DHA-36:3(TAG 58:9)、DHA-36:4(TAG 58:10)、DHA-36:7(TAG 58:13)和DHA-38:4(TAG 60:10)。通过Q-TOF MS/MS进一步证实两种含DHA的主要TAG的同一性。
实施例8.预测油菜种子中的DHA产量
实施例2中显示使用GA7基因构建体在拟南芥种子中有效产生DHA,水平为15%。在许多(而不是所有)转化体中,相同构建体在油菜种子中仅产生约1.5%DHA,主要是由于GA7的Δ6-去饱和酶基因在这个物种中的不良表达(实施例4)。基于认识到对GA7构建体的修饰将克服Δ6-去饱和酶基因表达问题(参见实施例5,如实施例6中所显示),进行计算以确定表达来自于pJP3416-GA7变体的基因的油菜转基因种子的可能脂肪酸分布,其中各转基因编码的酶的性能与在具有GA7构建体的拟南芥中所观察到的一样有效。三个计算(#1、#2、#3)的预测脂肪酸组成示于表20中。这是基于野生型(非转化)油菜的脂肪酸组成,其包括59%油酸、20%LA和8%ALA。该表下半部中所示的三种预测部分脂肪酸分布是基于该表上半部中所示的各酶促步骤的转化效率。在#2预测中,75%效率下的Δ12-去饱和、75%下的Δ15-去饱和、35%下的Δ6-去饱和、80%下的Δ6-延长、90%下的Δ5-去饱和、90%下的Δ5-延长和90%下的Δ4-去饱和的组合将在典型芸苔转基因种子中产生大约10%DHA。这些效率全部低于或约等于拟南芥所见的个别效率,所以#2预测代表了保守估计值。#3中所列出的转化效率是基于经pJP3416-GA7转化的拟南芥中所见的有效转化的近似值。预计所产生的DHA占油菜种子所产生的种子油中的总脂肪酸含量的约15%,该结果反映拟南芥中所观察到的最有效产生水平。预期插入多个呈纯合状态的T-DNA能将油菜中的DHA水平提高到20%。
表20.基于转基因拟南芥中的观察酶促效率的选定脂肪酸的预测脂肪酸组成,呈占来自于经DHA途径构建体转化的油菜的种子油中的总脂肪酸含量的百分比形式。酶是按照在由油酸产生DHA的途径中的顺序列出,des=去饱和酶,elo=延长酶。预测脂肪酸组成#1、#2和#3是基于该表上半部中的效率。
实施例9.植物叶子中的转基因EPA途径的稳定表达
二元载体构建
设计二元载体pORE04+11ABGBEC_豇豆_EPA_插入序列(SEQ ID NO:8)用于将T-DNA引入植物中,以便在叶组织中合成EPA。其含有编码以下酶的嵌合基因:细小微胞藻Δ6-去饱和酶(SEQ ID NO:16)、P.cordataΔ6-延长酶(SEQ IDNO:25)和盐生巴夫藻Δ5-去饱和酶(SEQ ID NO:30),各酶受CaMV35S和拟南芥核酮糖二磷酸羧化酶-加氧酶小亚单位(SSU)启动子控制(图9)。该二元载体是通过合成SEQ ID2的区域199-10878且将其克隆至受体二元载体pORE04中的BsiWI和KasI位点上(Coutu等,1997)来构建。3个脂肪酸生物合成基因密码将ALA 18:3Δ9,12,15转化成EPA 20:5Δ5,8,11,14,17所需的酶。
在本氏烟叶细胞中瞬时表达EPA构建体
为了测试所述构建体是正确的且将在叶组织中有效地表达所述基因,将嵌合载体pORE04+11ABGBEC_豇豆_EPA_插入序列引入至根癌农杆菌菌株AGL1中。还如实施例1中所描述将嵌合载体35S:p19引入根癌农杆菌菌株AGL1中。在24℃生长室中使得自于这些的培养物的细胞浸润至本氏烟植物的叶组织中。对若干个直接比较样进行浸润,其中所比较的样品位于同一个叶子的两侧。以一式三份进行实验。在浸润后,使植物再生长5天,随后取叶盘以便如实施例1中所描述通过GC进行脂肪酸分布分析。GC分析显示EPA载体的功能是在本氏烟叶子中产生EPA(表21),其中所发现的最高EPA水平是总叶脂质的10.7%。
普通烟草稳定转化
使用嵌合载体pORE04+11ABGBEC_豇豆_EPA_插入序列稳定地转化普通烟草。经由标准电穿孔程序将所述载体引入根癌农杆菌菌株AGL1中。使经过转化的细胞在补充有卡那霉素(50mg/L)和利福平(25mg/L)的固体LB培养基上生长且在28℃下孵育2天。使用单一集落引发新鲜培养物。在48h有力培养之后,通过在2,000×g下离心收集细胞且去除上清液。将细胞以OD600=0.5的密度再悬浮于含有50%LB和50%MS培养基的新鲜溶液中。
表21.得自于各实验中具有最高EPA水平的转基因本氏烟(瞬时)和普通烟草(稳定初代转化体)事件的总叶脂质的脂肪酸组成。
切下体外生长的普通烟草载培品种W38的叶样品并且用锋利的解剖刀切出约0.5至1cm2大小的方形横断面,同时浸入根癌农杆菌溶液中。允许浸入根癌农杆菌中的受伤的普通烟草叶片在室温下静置10分钟,随后在无菌滤纸上揩干并转移至无补充剂的MS培养板上。在24℃下经过2天的共培育周期之后,用无菌液体MS培养基将外植体洗涤3次,然后用无菌滤纸揩干并且放在补充有1.0mg/L苯甲基氨基嘌呤(BAP)、0.25mg/L吲哚乙酸(IAA)、50mg/L卡那霉素和250mg/L氨噻肟头孢菌素的选择MS琼脂上。在24℃下将培养板孵育2周以允许由经过转化的普通烟草叶片发芽。
为了在体外建立生根的转基因植物,切掉健康绿色芽且转移至含有MS琼脂培养基的200mL组织培养皿中,所述MS琼脂培养基补充有25μg/L IAA、50mg/L卡那霉素和250mg/L氨噻肟头孢菌素。在生根后将转基因芽转移至土壤且在温室中生长至成熟。从21株成熟转基因植物获取足够大的叶盘且如实施例1中所描述分析脂肪酸分布。发现所有转基因样品都含有EPA(表21),其中发现半合初代转化体中的最高EPA水平是总叶脂质的12.1%,该叶样品的脂质中还含有少量(&lt;0.5%)DPA,这是由以Δ6-延长酶的低Δ5-延长活性水平延长EPA而产生。发现总ω3 FA(包括ALA):ω6 FA(包括LA)比率是2.7。总体转化效率计算为:OA到EPA=18.4%,LA到EPA=18.9%,ALA到EPA=25.9%。产生12.1%EPA是值得注意的,尤其是因为所述事件是半合初代转化体。确切地说,ALA到EPA效率接近于在稳定种子转化体中所观察到的效率。值得注意的是,所述构建体不含Δ12或Δ15-去饱和酶用于提高OA和LA到ALA的转化。在添加这些活性的情况下将预期能提高效率。
从半合转化体收获种子且播种以产生纯合植物。
顶部EPA株系中的种子集合似乎正常,且得自于#10和#17株系的种子萌芽情况良好,从而建立T2代。EPA到空白(无EPA)株系的比率表明#28事件是单基因座,且因此还建立了该株系的T3代。T3群体的脂肪酸分布分析表明转基因是纯合的,未发现空白事件且具有稳定的EPA的量。发现整个T3群体中的总叶脂质中的EPA的平均量是9.4%±0.3(表22)。
表22.得自于野生型(WT)和独立的转基因或瞬时转化株系(EPA)的总叶脂质的代表性脂肪酸分布。物种是本氏烟(瞬时转化)、普通烟草(稳定转化的T3群体)、龙爪豆(稳定转化的T1事件)。误差表示多个样品的标准偏差。底部显示的表观转化效率描述ω3途径且计算为产物FA的总和/底物+产物FA的总和。
对纯合T3普通烟草植物的叶样品进行进一步生化分析。从冻干叶材料中提取总脂质且通过薄层色谱法(TLC)进行分级。发现EPA在普通烟草TAG中的存在量多达30.1%以及在极性类脂中为6.3%(表23)。令人感兴趣的是注意到所评估的所有脂质级分(包括TAG、MGDG、DGDG、SQDG、PG、PC、PE、PI和PS)中都存在由转基因途径产生的EPA。所有脂质库都含有低水平的新颖中间物或ω6LC-PUFA脂肪酸,其中新颖ω3:ω6脂肪酸的TAG比率是10:1。
豇豆的稳定转化
如下将嵌合载体pORE04+11ABGBEC-豇豆-EPA-插入序列转化至豇豆(龙爪豆)中。成熟干种子是优选的起始材料,但也可以使用从未成熟豆荚中收获的种子,即最大鲜重种子。对干种子进行手工脱粒以避免种皮破裂且因而减少微生物污染。
将干种子或未成熟豆荚浸在70%乙醇中2min,然后在20%市售漂白剂(8.4g/L次氯酸钠最终浓度)中处理30min。然后用无菌水将种子洗涤若干次。以无菌方式从豆荚中取出未成熟种子,同时使成熟种子吸胀过夜。可以使用两种不同的外植体进行多次生芽,即,胚轴和子叶本身,优选与二等分胚轴连接的子叶。从轴上去除芽尖和根尖,随后在子叶节,即轴与子叶的连接点上制造创口。根据对19种载培品种和植株的初步比较,现已清楚大部分豇豆株系可以转化,唯一的警告是需要针对各株系对不同的组织培养条件进行优化。
表23.分析得自于转基因普通烟草叶子样品的未成熟和成熟(未成熟|成熟)叶脂质级分三酰基甘油(TAG)、总极性脂质(PL)、单半乳糖基二酰基甘油(MGDG)、二半乳糖基二酰基甘油(DGDG)、磺基奎诺糖基二酰基甘油(SQDG)、磷脂酰甘油(PG)、磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰肌醇(PI)和磷脂酰丝氨酸(PS)。误差表示多个样品的标准偏差。在叶TAG中观察到多达30%EPA,其中EPA还在所有极性脂质中都有分布。对于若干种脂肪酸,还观察到了未成熟与成熟叶分布之间的差异。
选择标记基因bar或NptII可用于转化。根癌农杆菌菌株AGL1是用于豇豆转化的优选菌株。在28℃下,在振荡器上以180rpm将含有pORE04+11ABGBEC-豇豆-EPA-插入序列载体的农杆菌培养过夜,且在8000g下将悬浮液离心10min并且再悬浮于培养基1(MS基础培养基,以1:10稀释且含有30g/l蔗糖、20mM 2-MES,在高压釜处理之前调节至pH5.6,补充有过滤器灭菌MS-维生素、100mg/l肌醇、1.7mg/l BAP、0.25mg/l GA3、0.2mM乙酰丁香酮、250mg/l硫代硫酸钠、150mg/l二硫苏糖醇和0.4g/l L-半胱氨酸)中。在无振荡的情况下将外植体浸入细菌悬浮液中1小时,随后用解剖刀在分生组织区中制造创口。然后在无菌滤纸上揩吸经过处理的外植体且转移至固化培养基2(含有0.8%琼脂的培养基1),用滤纸覆盖。共培育4天后,将外植体转移至培养基3(全强度MS培养基,补充有100mg/l肌醇、150mg/l特美汀、30g/L蔗糖、3mM MES、1.7mg/L BAP、5mg/L PPT或25-50mg/L遗传霉素或150mg/L卡那霉素、0.8g/L琼脂,且调节至pH 5.6)以便进行芽诱导和选择经过转化的芽。两周后可见第一批芽。从子叶节区域去除子叶且将培养物转移至新鲜培养基3。每两周将培养物转移至新鲜培养基3,随后去除死的和垂死的组织。对前4次传代培养物进行卡那霉素选择,随后用遗传霉素和卡那霉素交替进行。在6次传代培养之后,将存活的绿色芽转移至培养基4(无BAP但补充有0.5mg/l GA3、50mg/l天冬酰胺、0.1mg/l 3-吲哚乙酸(IAA)、150mg/l特美汀和PPT(10mg/l)、遗传霉素(50mg/L)或卡那霉素(150mg/L))的培养基3以便进行芽延长。每两周对所述芽进行传代培养,直到单个芽的长度大于1cm。将这些较大的芽从皮氏培养皿转移至培养罐(80mm高度)中以便在选择下进一步生长。
大多数再生的芽可在体外生根,且将生根植物转移至土壤并且允许在高湿度室中巩固14至21天,随后转移至环境温室条件。
为了增强对豇豆的基因转移,共培养培养基补充有硫醇化合物。添加L-半胱氨酸、二硫苏糖醇和硫代硫酸钠会减轻受伤组织褐变。
可用简化方案处理大量豇豆外植体。简言之,所述方案由以下步骤组成:灭菌成熟种子在水中吸胀过夜,通过对由此获得的种子进行纵向二等分得到外植体,分开的胚轴(去除芽和根端)仍连接于子叶,通过分生组织区中的局部创伤用农杆菌菌株AGL1感染,在25℃下在光照下在含有硫醇化合物的培养基上共培养4天,在含有选择剂的培养基上进行芽诱导和延长,在体外使芽生根并且转移至温室条件以便开花和结籽,对推定转基因植物进行PCR或酶分析,和通过PCR或酶活性筛选下一代子代。
转基因T0植物的子代在表型方面是正常的。转基因被遗传到子代,且通过筛选其T3子代的酶活性或通过PCR鉴别纯合T2植物。
使用该转化系统,每1000个外植体产生约10个转基因植物,这类似于其它豆科植物的转化频率。取决于欲转化的载培品种或株系,该方案从外植体制备到收获T1种子需要5至8个月。
使用该转化系统将pORE04+11ABGBEC-豇豆-EPA-插入序列二元载体引入再生的转化豇豆植物中。
对pORE04+11ABGBEC-豇豆-EPA-插入序列二元载体进行修饰,其中添加编码Δ5-延长酶和Δ4-去饱和酶的基因,以提供能赋予将所产生的EPA进一步转化成DHA的能力的基因构建体。将该构建体转化至植物中以便在营养组织中产生DHA。
发现EPA存在于经受住化学选择的少数事件中。最高株系的总叶脂质中含有7.1%±0.2 EPA。转化率低于对豇豆的平常经验,其中仅6个株系被证实是转基因的。至今未知是什么导致了这个效果,但令人感兴趣的是注意到大于平常比例的转基因事件含有不完全T-DNA区。有可能较大构建体尺寸造成降低效率。还计算了3种转基因酶各自的表观转化效率(表22)。所有3个种类的结果大致类似,其中在天然ALA的初步Δ6-去饱和之后良好转化成EPA。注意到尽管不存在特异性Δ5-延长酶,但一些EPA到DPA的Δ5-延长。P.cordataΔ6-延长酶先前已显示具有低水平的Δ9-延长酶活性(即18:3Δ9,12,15转化成20:3Δ11,14,17),但在酵母测定中未检测到Δ5-延长酶活性。
实施例10.测试Δ12-去饱和酶基因的变异
二元载体构建
为了测试和比较一系列嵌合Δ12-去饱和酶基因,制造了若干种二元载体用于转化拟南芥和油菜。二元载体pJP3365、pJP3366、pJP3367、pJP3368和pJP3369各自含有编码巴斯德毕赤酵母ω3-去饱和酶(SEQ ID NO:12)和细小微胞藻Δ6-去饱和酶(SEQ ID NO:16)酶和一系列Δ12-去饱和酶之一的基因。Δ12-去饱和酶来自于新型隐球菌(登录号XP_570226,在pJP3365中)、含有L151M突变以增加基因活性的新型隐球菌Δ12-去饱和酶版本(在pJP3366中)、克鲁维郎香酵母(SEQ IDNO:10,在pJP3367中)、集胞藻PCC6803(登录号BAA18169,在pJP3368中)和还阳参(登录号CAA76157,Lee等,1998,在pJP3369中)。还阳参去饱和酶在该系列中是唯一的植物去饱和酶;其它是真菌酶。除了野生型还阳参Δ12-去饱和酶,对于各Δ12-去饱和酶通过将植物密码子经优化蛋白质编码区呈可操作地连接于FP1启动子的取向插入载体pJP3364的NotI位点(参见图12)以提供各去饱和酶的种子特异性表达来制造载体。载体pJP3364已含有编码巴斯德毕赤酵母ω3-去饱和酶和细小微胞藻Δ6-去饱和酶的嵌合基因,各自受种子特异性启动子控制(图12)。设计3种脂肪酸生物合成酶,即Δ12-去饱和酶、ω3-去饱和酶和Δ6-去饱和酶的组合以组装用于将油酸(18:1Δ9)转化成SDA(18:4Δ6,9,12,15)的途径。因此进行测定以测量经转化种子中的SDA产生水平。
拟南芥和油菜转化和分析
将嵌合二元载体引入根癌农杆菌菌株AGL1,以及使用用于转化的花序浸染法来自于用于转化fad2突变型拟南芥植物的经转化农杆菌的培养物的细胞中(Clough和Bent,1998)。在成熟后,从经过处理的植物收获T1种子且接种在含有卡那霉素的MS培养板上以便选择具有各嵌合载体的T-DNA上所存在的NptII选择标记基因的幼苗。将存活T1幼苗转移至土壤。在允许植物自花授粉且使其生长至成熟后,从这些植物收获T2种子且通过GC分析种子脂质的脂肪酸组成。
嵌合载体pJP3367还通过实施例4中所描述的方法用于转化油菜,以产生12个转基因事件。发现汇集的植物种子中的SDA在0.6%至2.2%范围内,且分析得自于具有最高SDA的转基因植物的9个个别种子的脂肪酸组成。得自于所述分析的脂肪酸组成数据示于表24中。
数据显示各T-DNA在拟南芥和油菜中表达的Δ12-去饱和酶活性出乎意料地低,酶转化效率为约20%而不是同一表达盒在GA7构建体(实施例2和3)中所见的70%至80%。来自于这些载体的Δ12-去饱和酶基因的这种相对不良表达的原因还不清楚,但总体上可能与基因在构建体中的位置有关。
相比之下,RT-PCR表达分析显示T-DNA上的巴斯德毕赤酵母ω3-去饱和酶和细小微胞藻Δ6-去饱和酶基因在转化种子中的表达相对良好。表24包括在转化种子中的Δ6-去饱和酶转化效率,其在一个油菜转化株系中在约11%至约25%范围内。这显著高于经GA7构建体转化的油菜种子(实施例4)中所见的约7%的Δ6-去饱和酶转化效率。
表24.经来自于pJP3367的T-DNA转化的T1油菜植物的单一种子的脂肪酸组成(占种子油中的总脂肪酸的百分比)。SDA(18:4ω3)以粗体显示。
因此,为了利用来自于pJP3367的T-DNA赋予较高Δ6-去饱和酶转化效率的优势,使经该T-DNA转化的油菜植物与经来自于pJP3416-GA7的T-DNA转化的植物(实施例4)杂交以产生携带两种T-DNA的子代植物和种子。通过GC分析从F1种子提取的油的脂肪酸组成的DHA含量和其它脂肪酸含量。由于Δ6-去饱和酶的表达增加,观察到DHA水平增加。产生了对于两种T-DNA是纯合的植物并且将产生较高的DHA水平。
实施例11.通过使用沉默阻抑蛋白增加脂肪酸的累积
二元载体构建
WO 2010/057246描述了使用沉默阻抑蛋白(SSP)来增加植物种子中的转基因表达。为了证明使用这样的蛋白质可以使油料种子中的LC-PUFA产生提高和稳定若干代,选择若干种SSP进行测试,即V2(登录号GU178820.1)、p19(登录号AJ288943.1)、p38(登录号DQ286869.1)和P0PE(登录号L04573.1)。p19是来自于番茄丛矮病毒(TBS V)的阻抑蛋白质,其结合21个核苷酸长的siRNA,随后它们指导同源RNA的Argonaute指导型裂解(Voinnet等,2003)。V2是来自于番茄黄化曲叶病毒(TYLCV)的阻抑蛋白,其结合植物蛋白SGS3(Glick等,2008)、认为由ssRNA底物产生双链RNA中间物所需要的蛋白(Beclin等,2002)或结合具有5'悬垂物的dsRNA结构(Fukunaga等,2009)。p38是来自于芜菁皱缩病毒(TCV)的阻抑蛋白,其通过结合Dicer和Argonaute蛋白而干扰植物沉默机制(Azevedo等,2010)。P0蛋白,诸如P0PE和RPV-P0,来自于马铃薯卷叶病毒,其靶向Argonaut蛋白从而增强降解(Baumberger等,2007;Bortolamiol等,2007;Fusaro等,2012)。因此制备基因构建体用于如下在植物种子中表达这些SSP与一组脂肪酸生物合成基因的组合以便由LA(18:1Δ9,12)产生ARA(20:4Δ5,8,11,14)。
通过用PmeI和AvrII进行消化,产生9560bp片段而在来自于pJP3010的单一DNA片段上获得了编码球等鞭金藻Δ9-延长酶和盐生巴夫藻Δ8-去饱和酶和Δ5-去饱和酶的脂肪酸生物合成基因和细菌选择标记物。该片段上的Δ9-延长酶编码区连接于拟南芥FAE1启动子(pAtFAE1)和conlinin转录终止/聚腺苷酸化区(LuCnl2-3')。去饱和酶编码区各自连接于截短napin FP1启动子(pBnFP1)和nos3’转录终止/聚腺苷酸化区。对该片段上的3个脂肪酸生物合成基因进行定向且用与pJP107中相同的方式(Petrie等,2012)间隔且编码与pJP107相同的蛋白质。该DNA片段还包含来自于pCW141的pFP1:GFiP:nos3'基因(参见WO2010/057246),该基因编码绿色荧光蛋白(GFP)。使用该筛选标记基因作为可见种子特异性标记物,从而允许简单且非破坏性地鉴别且从而选择包含和表达所述基因的转基因种子。
将PmeI-AvrII片段插入一系列5种载体各自的PmeI-AvrII位点上,各载体含有不同的SSP基因(WO2010/057246),从而产生命名为pFN045、pFN046、pFN047、pFN048和pFN049的基因构建体。这些包含分别编码SSP、P0PE、p38、p19、35S:V2和V2的基因。各SSP基因受FP1启动子和ocs3'转录终止/聚腺苷酸化区控制,除了在构建体pFN048中,其中V2编码区受组成型CaMV 35S启动子控制。SSP基因在各情况下处于构建体的T-DNA区内,与T-DNA的右边界(RB)相邻。通过用AhdI和NheI消化pFN045,随后用DNA连接酶再环化以缺失FP1:P0PE基因来制造第六构建体,即缺乏任何SSP编码序列的pFN050。6种构建体各自包含处于T-DNA内且与T-DNA的左边界相邻的NptII选择标记基因。所有构建体都具有RK2复制起点以保持农杆菌中的质粒。
用ARA表达载体与SSP组合转化拟南芥
为了转化在种子脂质中具有高亚油酸水平的fad2/fae1双重突变型拟南芥的基因型MC49,用经6种构建体pFN045-pFN050中的每一种单独转化的根癌农杆菌菌株GV3101通过花序浸染法(Clough和Bent,1998)处理植物。使经过处理的植物生长至成熟,并且将从它们收获的T1种子接种于含有卡那霉素的MS培养基上以选择经过转化的T1植物。还使用了筛选种子中的GFP表达作为经过转化的T1种子的可见标记物。将MS/Kan培养板上存活的或获自GFP阳性种子的幼苗转移至土壤且使其生长至成熟以获得T2种子。对于用pFN045、pFN046、pFN047、pFN048、pFN049和pFN050转化,所获得的转化植物数目分别是5、14、32、8、23和24。在该阶段发现编码pFN046中的p38的基因不具功能性,且因此经载体pFN046转化的植物被视为附加对照,即,基本上与pFN050相同。
从各转化植物获取约100个汇集T2种子以便通过FAME制备和GC分析确定种子脂质的脂肪酸组成。还使来自于各转基因株系的6个T2幼苗生长以产生T3种子。
使用GC测定从T2种子中提取的总脂质中的脂肪酸组成。分析显示了T2群体中的ARA和中间物EDA(20:2ω6)和DGLA(20:3ω6)的水平范围。ARA的数据示于图13和14中。
图13显示对T2种子群体的脂质中的ARA水平的箱线图分析。显然,含有FP1:p19和35S:V2基因以及ARA生物合成基因的种子群体中的ARA中位数(50%)水平显著高于含有缺陷FP1:p38基因或来自于pFP050的不含SSP基因的对照T-DNA的种子。经编码p19和V2的基因转化的种子的平均ARA水平高于经p38基因转化的种子或无SSP的那些种子(图14)。一个FP1:p19株系和两个FP1:V2株系分别展现约19%、20%和23%ARA。这些是界外值且因此不包括在箱线图分析的计算中。与其它构建体相比,经包含基因FP1:P0PE和35S:V2的T-DNA转化的植物的存活数较少;认为这些基因在MC49背景下可能不利于植物健康。
不仅构建体之间的ARA水平显著不同,而且观察到从LA到ARA途径的第一中间物即EDA(20:2ω6)在种子脂质中的水平在表达V2或p19的株系中低于缺乏SSP或含有p38构建体的种子(图15)。在T3种子中,一个含有表达p19的构建体的群体展现ARA占种子脂质中的总脂肪酸的百分比为38%。
转基因T3株系的范围进入T4代。表达V2的T4种子中的ARA水平与上一代相比相同或实际上展现与其T3亲本相比有所增加的水平(图16)。表达p19的株系显示变化更大的ARA水平。与T3亲本相比,ARA水平在一些株系中降低,而在其它株系中相同或有所增加。相比之下,含有缺陷p38基因或缺乏SSP的株系总体上显示ARA水平下降且中间物水平增加(图18)。在这些株系中的一些中,ARA降至约1%且EDA水平增至约20%。对于表达p19和V2的株系,与表达p38或缺乏SSP的株系相比,T4种子中的平均ARA水平较高(图17)。
本实验显示,转基因植物的种子中的SSP以及LC-PUFA生物合成途径的其它基因的表达不仅增加第一代子代中的所要脂肪酸的产生水平,而且使后几代的脂肪酸产生水平稳定,诸如第三或第四代子代。脂肪酸产生增加伴随着生物合成途径中的中间物脂肪酸水平降低。由种子特异性启动子表达SSP的p19和V2是优选的。旨在表达p38SSP的构建体具有缺陷且利用该构建体未获得可用数据。V2SSP及其来自于其它病毒的同源物被认为是特别优选的,这是因为它们允许最大限度地表达生物合成途径基因且同时允许发育种子的相同细胞中的其它基因沉默。
实施例12.测定油中的甾醇含量和组成
如实施例1中所描述通过GC和GC-MS分析将得自于购自澳大利亚商业来源的12种植物油样品的植物甾醇表征为O-三甲基硅烷基醚(OTMSi-醚)衍生物。通过滞留数据、质谱解译和与文献和实验室标准质谱数据相比较来鉴别甾醇。通过使用5β(Η)-胆烷-24-醇内标物来定量甾醇。所鉴别的一些甾醇的基本植物甾醇结构和化学结构示于图19和表25中。
所分析的植物油来自于:芝麻(芝麻)、橄榄(橄榄)、向日葵(向日葵)、蓖麻(蓖麻)、芸苔(油菜)、红花(红花)、花生(落花生)、亚麻(亚麻)和大豆(大豆)。在所有油样品中,按照相对丰度降低的顺序,主要的植物甾醇是:β-谷甾醇(在总甾醇含量的28%至55%范围内)、Δ5-燕麦甾醇(异岩藻甾醇)(3%至24%)、菜油甾醇(2%至33%)、Δ5-豆甾醇(0.7%至18%)、Δ7-豆甾醇(1%至18%)和Δ7-燕麦甾醇(0.1%至5%)。鉴别了若干种其它微量甾醇,这些是:胆甾醇、菜子甾醇、海绵甾醇、菜油甾烷醇和齿孔醇。还检测到4种C29:2和2种C30:2甾醇,但进一步研究需要完全鉴别这些微量组分。另外,一些油中存在若干种其它未鉴别甾醇,但由于其丰度极低,故色谱强度不足以鉴别其结构。
甾醇含量表示为mg/g油,按照量降低的顺序为:芥花油(6.8mg/g)、芝麻油(5.8mg/g)、亚麻油(4.8-5.2mg/g)、葵花油(3.7-4.1mg/g)、花生油(3.2mg/g)、红花油(3.0mg/g)、大豆油(3.0mg/g)、橄榄油(2.4mg/g)、蓖麻油(1.9mg/g)。甾醇组成%和总甾醇含量呈现于表26中。
表25.所鉴别的甾醇的IUPAC/系统名称。
甾醇编号 常用名称 IUPAC/系统名称
1 胆甾醇 胆甾-5-烯-3β-醇
2 菜子甾醇 24-甲基胆甾-5,22E-二烯-3β-醇
3 海绵甾醇/24-亚甲基胆甾醇 24-甲基胆甾-5,24(28)E-二烯-3β-醇
4 菜油甾醇/24-甲基胆甾醇 24-甲基胆甾-5-烯-3β-醇
5 菜油甾烷醇/24-甲基胆甾烷醇 24-甲基胆甾烷-3β-醇
7 Δ5-豆甾醇 24-乙基胆甾-5,22E-二烯-3β-醇
9 麦角甾-7-烯-3β-醇 24-甲基胆甾-7-烯-3β-醇
11 齿孔醇 4,4,14-三甲基麦角甾-8,24(28)-二烯-3β-醇
12 β-谷甾醇/24-乙基胆甾醇 24-乙基胆甾-5-烯-3β-醇
13 D5-燕麦甾醇/异岩藻甾醇 24-乙基胆甾-5,24(28)Z-二烯-3β-醇
19 D7-豆甾醇/豆甾-7-烯-3b-醇 24-乙基胆甾-7-烯-3β-醇
20 D7-燕麦甾醇 24-乙基胆甾7,24(28)-二烯-3β-醇
在所有种子油样品中,主要植物甾醇一般是β-谷甾醇(在总甾醇含量的30%至57%范围内)。所述油中其它主要甾醇的比例范围较宽:菜油甾醇(2%至17%)、Δ5-豆甾醇(0.7%至18%)、Δ5-燕麦甾醇(4%至23%)、Δ7-豆甾醇(1%至18%)。来自于不同物种的油具有不同的甾醇分布,其中一些具有相当独特的分布。在芥花油的情况下,菜油甾醇具有最高比例(33.6%),而其它物种样品一般具有较低水平,例如在花生油中多达17%。红花油具有相对较高比例的Δ7-豆甾醇(18%),而该甾醇在其它物种油中通常较低,在葵花油中多达9%。因为它们对于各物种是独特的,因此甾醇分布可用于辅助鉴别特定蔬菜或植物油和检查其纯粹性或是否掺杂其它油。
表26.所测定的植物油的甾醇含量和组成。
C29:2*和C30:2*分别表示具有2个双键的C29甾醇和具有2个双键的C30甾醇
比较向日葵和红花的各2个样品,在各情况下,一种是通过冷压种子产生且未经精制,而另一种不是冷压且经过精制。尽管观察到一些差异,但油的两个来源具有类似的甾醇组成和总甾醇含量,表明加工和精制对这两个参数具有极小影响。甾醇含量在样品之间变化三倍且在1.9mg/g至6.8mg/g范围内。芥花油具有最高的甾醇含量且蓖麻油具有最低的甾醇含量。
实施例13.增加DHA在sn-2 TAG位置上的累积
诸位发明人认为TAG中sn-2位置上的DHA累积可以通过共表达1-酰基-甘油-3-磷酸酰基转移酶(LPAAT)与诸如GA7构建体或其变体赋予的DHA生物合成途径来增加。优选的LPAAT是可作用于多不饱和C22脂肪酰基-CoA底物,从而使多不饱和C22链在LPA的sn-2位置上插入(以形成PA相对于LPAAT)有所增加的那些。细胞质LPAAT酶经常显示变化的底物偏好,特别是在物种的TAG中合成并累积罕见脂肪酸的情况下。来自于荷包蛋花(Limnanthesdouglasii)的LPAAT2显示使用瓢儿菜基-CoA(C22:1-CoA)作为PA合成底物,相比之下,来自于相同物种的LPAAT1不能利用C22底物(Brown等,2002)。
考虑了已知的LPAAT且选择一定数目进行测试,包括一些预期不能增加DHA并入sn-2位置的作为对照。已知的LPAAT包括:拟南芥LPAAT2:(SEQ ID NO:63,登录号ABG48392,Kim等,2005)、白池花LPAAT(SEQ ID NO:64,登录号AAC49185,Lassner等,1995)、酿酒酵母S1c1p(SEQ ID NO:65,登录号NP_010231,Zou等,1997)、高山被孢霉LPAAT1(SEQ ID NO:67,登录号AED33305;美国专利号7879591)和油菜LPAAT(SEQ ID NO:68和SEQ ID NO:69,登录号分别是ADC97479和ADC97478)。选择这些以涵盖三组LPAAT酶:1)典型地对罕见长链多不饱和脂肪酸具有低活性的对照植物种子LPAAT(包括拟南芥和芸苔LPAAT);2.先前已显示通过使用C22酰基-CoA作为底物而作用于C22脂肪酸的LPAAT,在该情况下芥子酸C22:1(包括白池花和酵母LPAAT);3.诸位发明人认为可能能够利用诸如EPA和DHA等长链多不饱和脂肪酸作为底物的LPAAT(包括被孢霉LPAAT)。
拟南芥LPAAT2(也表示为LPAT2)是局限于内质网的酶,已证明其对C16和C18底物具有活性,然而并未测试对C20或C22底物的活性(Kim等,2005)。白池花LPAAT2显示将C22:1酰基链插入PA的sn-2位置,但并未测试使用DHA作为底物的能力(Lassner等,1995)。已证明选定的酿酒酵母LPAAT S1c1p具有使用22:1-CoA以及18:1-CoA作为底物的活性,表明与链长度相关的广泛底物特异性(Zou等,1997)。也未测试DHA-CoA和其它LC-PUFA作为底物。被孢霉LPAAT先前已被证明在转基因解脂耶氏酵母中对EPA和DHA脂肪酸底物具有活性(US7879591)。
诸位发明人鉴别了其它LPAAT。细小微胞藻是产生和在其油中累积DHA的微藻,但在该物种中,DHA在TAG上的位置分布尚未得到证实。通过使用拟南芥LPAAT2作为BLAST查询序列检索细小微胞藻基因组序列鉴别了细小微胞藻LPAAT(SEQ ID NO:66,登录号XP_002501997)。出现了若干个候选序列且人工合成序列XP_002501997以便测试作为LPAAT酶对C22LC-PUFA具有活性的可能性。蓖麻LPAAT注释为蓖麻基因组序列中的推定LPAAT(Chan等,2010)。人工合成来自于蓖麻基因组的4种候选LPAAT且在浸润的本氏烟叶组织的粗制叶溶解物中进行测试。此处描述的候选序列显示LPAAT活性。
将许多候选LPAAT与系统树上的已知LPAAT进行比对(图20)。注意,推定微单胞菌LPAAT不与推定C22LPAAT形成簇,而是发散序列。
作为各种LPAAT使用DHA-CoA作为底物的能力的初步测试,如下制造各自受35S启动子控制的嵌合基因构建体以便在本氏烟叶中组成性表达外源LPAAT:35S:Arath-LPAAT2(拟南芥ER LPAAT);35S:Ricco-LPAAT2;35S:Limal-LPAAT(白池花LPAAT);35S:Sacce-S1c1p(酿酒酵母LPAAT);35S:Micpu-LPAAT(细小微胞藻LPAAT);35S:Moral-LPAAT1(高山被孢霉LPAAT)。实验中使用缺乏外源LPAAT的35S:p19构建体作为对照。如实施例1中所描述将这些构建体各自经由农杆菌引入本氏烟叶子中,且在浸润后5天,将经过处理的叶子区切除并研磨以制造叶子溶解物。各溶解物包括外源LPAAT以及用于合成LPA的内源酶。通过以一式三份向溶解物中单独添加经14C标记的-OA、-LA或-ALA(C18底物)、-ARA(C20底物)和-DHA(C22)建立体外反应。在25℃下孵育反应物且通过TLC测定经14C标记的脂肪酸并入PA中的水平。计算各LPAAT使用DHA相对于ARA和C18脂肪酸的能力。发现白芒花、被孢霉和酵母LPAAT对DHA底物具有活性,其中经放射性标记的PA似乎针对这些而不是其它LPAAT。通过类似的油酸饲料证实所有LPAAT都具有活性。
为了测试种子中的LPAAT活性,将若干个蛋白质编码序列或LPAAT插入受conlinin(pLuCnl1)启动子控制的二元载体中。然后使用分别含有嵌合基因Cnl1:Arath-LPAAT(阴性对照)、Cnl1:Limal-LPAAT、Cnl:Sacce-S1c1p和Cnl1:Moral-LPAAT的所得基因构建体转化油菜和拟南芥植物,以产生以种子特异性方式表达LPAAT的稳定转化体。使具有Cnl1:LPAAT构建体的经转化植物与表达GA7构建体或其变体且在种子中产生DHA的植物杂交(实施例5),从而增加DHA在TAG的sn-2位置上的并入。所述构建体还用于转化已经含有GA7构建体和其变体的油菜、亚麻荠和拟南芥植物(实施例2至5),以产生携带亲本和LPAAT基因构建体的子代。预期DHA在TAG的sn-2位置上的并入相对于在缺乏LPAAT编码转基因的植物中的并入有所增加。还提高了种子中的油含量,特别是对于产生较高DHA水平的种子,从而抵消如实施例2中所描述的拟南芥种子中所见的倾向。
本领域技术人员应了解,可如具体实施方案中所示对本发明进行多种变化和/或修改而不脱离如宽泛描述的本发明的精神或范围。因此,本发明的实施方案被认为在所有方面都是说明性的,而不是限制性的。
本申请要求2012年6月15日提交的US 61/660,392、2012年6月22日提交的US 61/663,344、2012年9月6日提交的US 61/697,676和2013年3月14日提交的US 61/782,680的优先权,各文献的全部内容以引用的方式并入本文中。
本文中所论述和/或参考的所有出版物都全文并入本文中。
本申请将2012年6月15日提交的US 61/660,392、2012年6月22日提交的US 61/663,344和2012年9月6日提交的US 61/697,676以引用的方式并入本文中。
本说明书中所包括的对文献、法案、材料、装置、物品等等的任何论述仅用于提供本发明的背景。不能因为其在本申请的各项权利要求的优先权日之前已经存在就理解为承认任何或所有这些文件形成现有技术基础的一部分或者是本发明相关领域的公共常识。
参考文献
Abbadi et al.(2004)Plant Cell 16:2734-2748.
Abbott et al.(1998)Science 282:2012-2018.
Abdullah et al.(1986)Biotech.4:1087.
Agaba et al.(2004)Marine Biotechnol.(NY)6:251-261.
Alvarez et al.(2000)Theor Appl Genet 100:319-327.
Armbrust et al.(2004)Science 306:79-86.
Attila Kereszt et al.(2007)Nature Protocols 2:948-952.
Baumberger et al.(2007)Curr.Biol.17:1609-1614.
Baumlein et al.(1991)Mol.Gen.Genet.225:459-467.
Baumlein et al.(1992)Plant J.2:233-239.
Beaudoin et al.(2000)Proc.Natl.Acad.Sci.U.S.A.97:6421-6426.
Beclin et al.(2002)Curr.Biol.12:684-688.
Berberich.et al.(1998)Plant Mol.Biol.36:297-306.
Bortolamiol et al.(2007)Curr.Biol.17:1615-1621.
Broun et al.(1998)Plant J.13:201-210.
Brown et al.(2002)Biochem J.364:795-805.
Chapman et al.(2004)Gen.Dev.18:1179-1186.
Chen et al.(2004)The Plant Cell 16:1302-1313.
Cheng et al.(1996)Plant Cell Rep.15:653-657.
Cheng et al.(2010)Transgenic Res 19:221-229.
Chikwamba et al.(2003)Proc.Natl.Acad.Sci.U.S.A.100:11127-11132.
Cho et al.(1999a)J.Biol.Chem.274:471-477.
Cho et al.(1999b)J.Biol.Chem.274:37335-37339.
Clough and Bent(1998)Plant J.16:735-43.
Coutu et al.(2007)Transgenic Res.16:771-781.
Damude et al.(2006).Proc Natl Acad Sci USA 103:9446-9451.
Denic and Weissman(2007)Cell 130:663-677.
Domergue et al(2002)Eur.J.Biochem.269:4105-4113.
Domergue et al.(2002)Eur.J.Biochem.269:4105-4113.
Domergue et al.(2003)J.Biol.Chem.278:35115-35126.
Domergue et al.(2005)Biochem.J.1389:483-490.
Dunoyer et al.(2004)The Plant Cell 16:1235-1250.
Ellerstrom et al.(1996)Plant Mol.Biol.32:1019-1027.
Fujimura et al.(1985)Plant Tissue Culture Lett.2:74.
Fukunaga(2009)EMBO J.28:545-55.
Gamez et al.(2003)Food Res International 36:721-727.
Garcia-Maroto et al.(2002)Lipids 37:417-426.
Girke et al.(1998)Plant J.15:39-48.
Glick et al.(2008)Proc.Natl.Acad.Sci U.S.A.105-157-161.
Grant et al.(1995)Plant Cell Rep.15:254-258.
Hall et al.(1991)Proc.Natl.Acad.Sci.USA 88:9320-9324
Hamilton and Baulcombe(1999)Science 286:950-952.
Hamilton et al.(1997)Gene 200:107-16.
Harayama(1998).Trends Biotechnol.16:76-82.
Hastings et al.(2001)Proc.Natl.Acad.Sci.U.S.A.98:14304-14309.
Hinchee et al.(1988)Biotechnology 6:915-922.
Hoffmann et al.(2008)J Biol.Chem.283:22352-22362.
Hong et al.(2002a)Lipids 37:863-868.
Horiguchi et al.(1998)Plant Cell Physiol.39:540-544.
Horvath et al.(2000)Proc.Natl.Acad.Sci.U.S.A.97:1914-1919.
Huang et al.(1999)Lipids34:649-659.
Inagaki et al.(2002)Biosci.Biotechnol.Biochem.66:613-621.
Johansen and Carrington(2001)Plant Physiol.126-930-938.
Kajikawa et al.(2004)Plant Mol.Biol.54:335-52.
Kajikawa et al.(2006)FEBS Lett 580:149-154.
Kim et al.(2005)Plant Cell.2005 1073-89.
Knutzon et al.(1998)J.Biol Chem.273:29360-6.
Koziel et al.(1996)Plant Mol.Biol.32:393-405.
Lassner(1995)Plant Physiol.109:1389-94.
Leonard et al.(2000)Biochem.J.347:719-724.
Leonard et al.(2000b)Biochem.J.350:765-770.
Leonard et al.(2002)Lipids 37:733-740.
Lewsey et al.(2007)Plant J.50:240-252.
Lo et al.(2003)Genome Res.13:455-466.
Lu and Kang(2008)Plant Cell Rep.27:273-8.
Mallory et al.(2002)Nat.Biotech.20:622-625.
Marangoni et al.(1995)Trends in Food Sci.Technol.6:329-335.
Meesapyodsuk et al.(2007)J Biol Chem 282:20191-20199.
Meng et al.(2008)J.Gen.Virol.89:2349-2358.
Meyer et al.(2003)Biochem.42:9779-9788.
Meyer et al.(2004)Lipid Res 45:1899-1909.
Michaelson et al.(1998a)J.Biol.Chem.273:19055-19059.
Michaelson et al.(1998b)FEBS Lett.439:215-218.
Murashige and Skoog(1962)Physiologia Plantarum 15:473-497.
Napier et al.(1998)Biochem.J.330:611-614.
Needleman and Wunsch(1970)J.Mol.Biol.48:443-453.
Niedz et al.(1995)Plant Cell Reports 14:403.
Ow et al.(1986)Science 234:856-859.
Parker-Barnes et al.(2000)Proc.Natl.Acad.Sci.USA 97:8284-8289.
Pereira et al.(2004a)Biochem.J.378:665-671.
Pereira et al.(2004b)Biochem.J.384:357-366.
Perrin et al.(2000)Mol Breed 6:345-352.
Petrie et al.(2010a)Metab.Eng.12:233-240.
Petrie et al.(2010b)Plant Methods 11:6:8.
Petrie et al.(2012)Transgenic Res.21:139-147.
Potenza et al.(2004)In Vitro Cell Dev Biol-Plant 40:1-22.
Prasher et al(1985)Biochem.Biophys.Res.Commun.127:31-36.
Qi et al.(2002)FEB S Lett.510:159-165.
Qi et al.(2004)Nat.Biotech.22:739-745.
Qiu et al.(2001)J.Biol.Chem.276:31561-31566.
Reddy and Thomas(1996)Nat.Biotech.14:639-642.
Reddy et al.(1993)Plant Mol.Biol.22:293-300.
Robert et al.(2005)Func.Plant Biol.32:473-479.
Robert et al.(2009)Marine Biotech 11:410-418.
Ruiz-Lopez et al.(2012)Transgenic Res.21:139-147.
Saha et al.(2006)Plant Physiol.141:1533-1543.
Saito et al.(2000)Eur.J.Biochem.267:1813-1818.
Sakuradani et al.(1999)Gene 238:445-453.
Sato et al.(2004)Crop Sci.44:646-652.
Sakuradani et al.(2005)Appl.Microbiol.Biotechnol.66:648-654.
Sayanova et al.(2006)J Biol Chem 281:36533-36541.
Sayanova et al.(1997)Proc.Natl.Acad.Sci.U.S.A.94:4211-4216.
Sayanova et al.(2003)FEBS Lett.542:100-104.
Sayanova et al.(2006)Planta 224:1269-1277.
Sayanova et al.(2007)Plant Physiol 144:455-467.
Singh et al.(2005)Curr.Opin.in Plant Biol.8:197-203.
Speranza et al.(2012)Process Biochemistry(In Press).
Sperling et al.(2000)Eur.J.Biochem.267:3801-3811.
Sperling et al.(2001)Arch.Biochm.Biophys.388:293-8.
Sprecher et al.(1995)J.Lipid Res.36:2471-2477.
Spychalla et al.(1997)Proc.Natl.Acad.Sci.U.S.A.94:1142-1147.
Stalker et al.(1998)J.Biol.Chem.263:6310-6314.
Thillet et al.(1988)J.Biol.Chem 263:12500-12508.
Tonon et al.(2003)FEBS Lett.553:440-444.
Toriyama et al.(1986)Theor.Appl.Genet.205:34.
Trautwein(2001)European J.Lipid Sci.and Tech.103:45-55.
Tvrdik(2000)J.Cell Biol.149:707-718.
Venegas-Caleron et al.(2010)Prog.Lipid Res.49:108-119.
Voinnet et al.(2003)Plant J.33:949-956.
Wallis and Browse(1999)Arch.Biochem.Biophys.365:307-316.
Watts and Browse(1999b)Arch.Biochem.Biophys.362:175-182.
Weiss et al.(2003)Int.J.Med.Microbiol.293:95:106.
Whitney et al.(2003)Planta 217:983-992.
Winans(1988)J.Bacteriol.170:4047-54.
Wood(2009)Plant Biotechnol J.7:914-24.
Wu et al.(2005)Nat.Biotech.23:1013-1017.
Yang et al.(2003)Planta 216:597-603.
Zank et al.(2002)Plant J.31:255-268.
Zank et al.(2005)WO 2005/012316
Zhang et al.(2004)FEBS Lett.556:81-85.
Zhang et al.(2006)20:3255-3268.
Zhang et al.(2007a)FEBS Letters 581:315-319.
Zhang et al.(2008)Yeast 25:21-27.
Zhou et al.(2007)Phytochem.68:785-796.
Zhou et al.(2008)Insect Mol Biol 17:667-676.
Zou et al.(1997)Plant Cell.9:909-23.
序列表
&lt;110&gt; 纽希德私人有限公司
粮食研究发展公司
联邦科学技术研究组织
&lt;120&gt; 在植物细胞中产生长链多不饱和脂肪酸
&lt;130&gt; 513594
&lt;150&gt; US 61/660,392
&lt;151&gt; 2012-06-15
&lt;150&gt; US 61/663,344
&lt;151&gt; 2012-06-22
&lt;150&gt; US 61/697,676
&lt;151&gt; 2012-09-06
&lt;150&gt; US 61/782,680
&lt;151&gt; 2013-03-14
&lt;160&gt; 72
&lt;170&gt; PatentIn version 3.5
&lt;210&gt; 1
&lt;211&gt; 21527
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pJP3416-GA7 nucleotide sequence.
&lt;400&gt; 1
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgccccgcgg aaagcttgcg gccgcccgat ctagtaacat 240
agatgacacc gcgcgcgata atttatccta gtttgcgcgc tatattttgt tttctatcgc 300
gtattaaatg tataattgcg ggactctaat cataaaaacc catctcataa ataacgtcat 360
gcattacatg ttaattatta cgtgcttaac gtaattcaac agaaattata tgataatcat 420
cgcaagaccg gcaacaggat tcaatcttaa gaaactttat tgccaaatgt ttgaacgatc 480
ggcgcgcctc attagtgagc cttctcagcc tttccgttaa cgtagtagtg ctgtcccacc 540
ttatcaaggt tagagaaagt agccttccaa gcaccgtagt aagagagcac cttgtagttg 600
agtccccact tcttagcgaa aggaacgaat cttctgctaa cctcaggctg tctgaattga 660
ggcatatcag ggaagaggtg gtggataacc tgacagttaa ggtatcccat aagccagttc 720
acgtatcctc tagaaggatc gatatcaacg gtgtgatcaa cagcgtagtt aacccaagaa 780
aggtgcttat cagatggaac aacagggagg tgagtatgag aagtagagaa gtgagcgaaa 840
aggtacatgt aagcgatcca gtttccgaaa gtgaaccacc agtaagcaac aggccaagag 900
tatccagtag caagcttgat aacagcggtt ctaacaacat gagaaacgag catccaagaa 960
gcctcttcgt agttcttctt acggagaact tgtctagggt ggagaacgta gatccagaaa 1020
gcttgaacaa gaagtccaga ggtaacagga acgaaagtcc aagcttgaag tctagcccaa 1080
gctctagaga atcctctagg tctgttatcc tcaacagcag tgttgaagaa agccacagca 1140
ggagtggtat caagatccat atcgtgtcta accttttgag gggtagcatg gtgcttgtta 1200
tgcatctggt tccacatctc accagaagta gaaagtccga atccacaagt catagcctga 1260
agtctcttgt ccacgtaaac agatccggta agagagttat gtccaccctc atgttgaacc 1320
catccacatc tagctccgaa gaaagcaccg taaacaacag aagcaatgat agggtatcca 1380
gcgtacataa gagcagttcc aagagcgaat gtagcaagaa gctcgagaag tctgtaagcc 1440
acatgggtga tagaaggctt gaagaatcca tctctctcaa gctcagcacg ccatctagcg 1500
aaatcctcaa gcataggagc atcctcagac tcagatctct tgatctcagc aggtctagaa 1560
ggcaaagctc taagcatctt ccaagccttg agagaacgca tgtggaattc tttgaaagcc 1620
tcagtagcat cagcaccagt gttagcaagc atgtagaaga tcacagatcc accagggtgc 1680
ttgaagttag tcacatcgta ctcaacgtcc tcaactctaa cccatctagt ctcgaaagta 1740
gcagcaagct catgaggctc aagagtctta agatcaacag gagcagtaga agcatcctta 1800
gcatcaagag cctcagcaga agatttagac ctggtaagtg gagatctagg agaagatctt 1860
ccatcagtct taggagggca catggtatgg taattgtaaa tgtaattgta atgttgtttg 1920
ttgtttgttg ttgttggtaa ttgttgtaaa agatcctcgt gtatgttttt aatcttgttt 1980
gtatcgatga gttttggttt gagtaaagag tgaagcggat gagttaattt ataggctata 2040
aaggagattt gcatggcgat cacgtgtaat aatgcatgca cgcatgtgat tgtatgtgtg 2100
tgctgtgaga gagaagctct taggtgtttg aagggagtga caagtggcga agaaaaacaa 2160
ttctccgcgg ctgcatgcta tgtgtaacgt gtagctaatg ttctggcatg gcatcttatg 2220
aacgattctt tttaaaaaca aggtaaaaac ttaacttcat aaaattaaaa aaaaaaacgt 2280
ttactaagtt ggtttaaaag gggatgagac tagtagattg gttggttggt ttccatgtac 2340
cagaaggctt accctattag ttgaaagttg aaactttgtt ccctactcaa ttcctagttg 2400
tgtaaatgta tgtatatgta atgtgtataa aacgtagtac ttaaatgact aggagtggtt 2460
cttgagaccg atgagagatg ggagcagaac taaagatgat gacataatta agaacgaatt 2520
tgaaaggctc ttaggtttga atcctattcg agaatgtttt tgtcaaagat agtggcgatt 2580
ttgaaccaaa gaaaacattt aaaaaatcag tatccggtta cgttcatgca aatagaaagt 2640
ggtctaggat ctgattgtaa ttttagactt aaagagtctc ttaagattca atcctggctg 2700
tgtacaaaac tacaaataat atattttaga ctatttggcc ttaactaaac ttccactcat 2760
tatttactga ggttagagaa tagacttgcg aataaacaca ttcccgagaa atactcatga 2820
tcccataatt agtcagaggg tatgccaatc agatctaaga acacacattc cctcaaattt 2880
taatgcacat gtaatcatag tttagcacaa ttcaaaaata atgtagtatt aaagacagaa 2940
atttgtagac ttttttttgg cgttaaaaga agactaagtt tatacgtaca ttttatttta 3000
agtggaaaac cgaaattttc catcgaaata tatgaattta gtatatatat ttctgcaatg 3060
tactattttg ctattttggc aactttcagt ggactactac tttattacaa tgtgtatgga 3120
tgcatgagtt tgagtataca catgtctaaa tgcatgcttt gtaaaacgta acggaccaca 3180
aaagaggatc catacaaata catctcatag cttcctccat tattttccga cacaaacaga 3240
gcattttaca acaattacca acaacaacaa acaacaaaca acattacaat tacatttaca 3300
attaccatac catggaattc gcccagcctc ttgttgctat ggctcaagag caatacgctg 3360
ctatcgatgc tgttgttgct cctgctatct tctctgctac tgattctatc ggatggggac 3420
ttaagcctat ctcttctgct actaaggact tgcctcttgt tgagtctcct acacctctca 3480
tcctttcttt gcttgcttac ttcgctatcg ttggatctgg actcgtttac agaaaggttt 3540
tccctagaac cgtgaaggga caagatccat tccttttgaa ggctcttatg cttgctcaca 3600
acgtgttcct tatcggactt tctctttaca tgtgcctcaa gcttgtgtac gaggcttacg 3660
ttaacaagta ctctttctgg ggaaacgctt acaaccctgc tcaaactgag atggctaagg 3720
ttatctggat cttctacgtg agcaagatct acgagttcat ggataccttc atcatgctcc 3780
tcaagggaaa tgttaaccag gttagcttcc ttcacgttta ccatcacgga tctatctctg 3840
gaatctggtg gatgattact tacgctgctc ctggtggtga tgcttacttc tctgctgctc 3900
ttaactcttg ggttcacgtg tgtatgtaca cctactattt tatggctgcc gtgcttccta 3960
aggacgagaa aactaagaga aagtacctct ggtggggaag ataccttact caaatgcaga 4020
tgttccagtt cttcatgaac cttctccagg ctgtttacct tctctactct tcatctcctt 4080
accctaagtt tatcgctcag ctcctcgtgg tgtacatggt tactcttctc atgcttttcg 4140
gaaacttcta ctacatgaag caccacgcta gcaagtgatg aggcgcgccg ggccgccgcc 4200
atgtgacaga tcgaaggaag aaagtgtaat aagacgactc tcactactcg atcgctagtg 4260
attgtcattg ttatatataa taatgttatc tttcacaact tatcgtaatg catgtgaaac 4320
tataacacat taatcctact tgtcatatga taacactctc cccatttaaa actcttgtca 4380
atttaaagat ataagattct ttaaatgatt aaaaaaaata tattataaat tcaatcactc 4440
ctactaataa attattaatt attatttatt gattaaaaaa atacttatac taatttagtc 4500
tgaatagaat aattagattc tagtctcatc cccttttaaa ccaacttagt aaacgttttt 4560
ttttttaatt ttatgaagtt aagtttttac cttgttttta aaaagaatcg ttcataagat 4620
gccatgccag aacattagct acacgttaca catagcatgc agccgcggag aattgttttt 4680
cttcgccact tgtcactccc ttcaaacacc taagagcttc tctctcacag cacacacata 4740
caatcacatg cgtgcatgca ttattacacg tgatcgccat gcaaatctcc tttatagcct 4800
ataaattaac tcatccgctt cactctttac tcaaaccaaa actcatcgat acaaacaaga 4860
ttaaaaacat acacgaggat cttttacaac aattaccaac aacaacaaac aacaaacaac 4920
attacaatta catttacaat taccatacca tgcctccaag ggactcttac tcttatgctg 4980
ctcctccttc tgctcaactt cacgaagttg atactcctca agagcacgac aagaaagagc 5040
ttgttatcgg agatagggct tacgatgtta ccaacttcgt taagagacac cctggtggaa 5100
agatcattgc ttaccaagtt ggaactgatg ctaccgatgc ttacaagcag ttccatgtta 5160
gatctgctaa ggctgacaag atgcttaagt ctcttccttc tcgtcctgtt cacaagggat 5220
actctccaag aagggctgat cttatcgctg atttccaaga gttcaccaag caacttgagg 5280
ctgagggaat gttcgagcct tctcttcctc atgttgctta cagacttgct gaggttatcg 5340
ctatgcatgt tgctggtgct gctcttatct ggcatggata cactttcgct ggaatcgcta 5400
tgcttggagt tgttcaggga agatgtggat ggcttatgca tgagggtgga cattactctc 5460
tcactggaaa cattgctttc gacagagcta tccaagttgc ttgttacgga cttggatgtg 5520
gaatgtctgg tgcttggtgg cgtaaccagc ataacaagca ccatgctact cctcaaaagc 5580
ttcagcacga tgttgatctt gatacccttc ctctcgttgc tttccatgag agaatcgctg 5640
ctaaggttaa gtctcctgct atgaaggctt ggctttctat gcaagctaag cttttcgctc 5700
ctgttaccac tcttcttgtt gctcttggat ggcagcttta ccttcatcct agacacatgc 5760
tcaggactaa gcactacgat gagcttgcta tgctcggaat cagatacgga cttgttggat 5820
accttgctgc taactacggt gctggatacg ttctcgcttg ttaccttctt tacgttcagc 5880
ttggagctat gtacatcttc tgcaacttcg ctgtttctca tactcacctc cctgttgttg 5940
agcctaacga gcatgctact tgggttgagt acgctgctaa ccacactact aactgttctc 6000
catcttggtg gtgtgattgg tggatgtctt accttaacta ccagatcgag caccaccttt 6060
acccttctat gcctcaattc agacacccta agatcgctcc tagagttaag cagcttttcg 6120
agaagcacgg acttcactac gatgttagag gatacttcga ggctatggct gatactttcg 6180
ctaaccttga taacgttgcc catgctcctg agaagaaaat gcagtaatga gatcgttcaa 6240
acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg atgattatca 6300
tataatttct gttgaattac gttaagcacg taataattaa catgtaatgc atgacgttat 6360
ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac gcgatagaaa 6420
acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct atgttactag 6480
atcggtcgat taaaaatccc aattatattt ggtctaattt agtttggtat tgagtaaaac 6540
aaattcgaac caaaccaaaa tataaatata tagtttttat atatatgcct ttaagacttt 6600
ttatagaatt ttctttaaaa aatatctaga aatatttgcg actcttctgg catgtaatat 6660
ttcgttaaat atgaagtgct ccatttttat taactttaaa taattggttg tacgatcact 6720
ttcttatcaa gtgttactaa aatgcgtcaa tctctttgtt cttccatatt catatgtcaa 6780
aatctatcaa aattcttata tatctttttc gaatttgaag tgaaatttcg ataatttaaa 6840
attaaataga acatatcatt atttaggtat catattgatt tttatactta attactaaat 6900
ttggttaact ttgaaagtgt acatcaacga aaaattagtc aaacgactaa aataaataaa 6960
tatcatgtgt tattaagaaa attctcctat aagaatattt taatagatca tatgtttgta 7020
aaaaaaatta atttttacta acacatatat ttacttatca aaaatttgac aaagtaagat 7080
taaaataata ttcatctaac aaaaaaaaaa ccagaaaatg ctgaaaaccc ggcaaaaccg 7140
aaccaatcca aaccgatata gttggtttgg tttgattttg atataaaccg aaccaactcg 7200
gtccatttgc acccctaatc ataatagctt taatatttca agatattatt aagttaacgt 7260
tgtcaatatc ctggaaattt tgcaaaatga atcaagccta tatggctgta atatgaattt 7320
aaaagcagct cgatgtggtg gtaatatgta atttacttga ttctaaaaaa atatcccaag 7380
tattaataat ttctgctagg aagaaggtta gctacgattt acagcaaagc cagaatacaa 7440
agaaccataa agtgattgaa gctcgaaata tacgaaggaa caaatatttt taaaaaaata 7500
cgcaatgact tggaacaaaa gaaagtgata tattttttgt tcttaaacaa gcatcccctc 7560
taaagaatgg cagttttcct ttgcatgtaa ctattatgct cccttcgtta caaaaatttt 7620
ggactactat tgggaacttc ttctgaaaat agtgatagaa cccacacgag catgtgcttt 7680
ccatttaatt ttaaaaacca agaaacatac atacataaca ttccatcagc ctctctctct 7740
ttttattacg gttaatgact taaaacacat cttattatcc catccttaac acctagcagt 7800
gtctttatac gatctcatcg atcaccactt caaaaccatg cagactgctg ctgcccctgg 7860
agctggcatc ggctaggctg ggtgccgcac tgtcccggaa ggtccctagc gacttgttta 7920
gattgatggg accacctctc aacttcctgc tgctgtccct gctgctggat gtcctgcctc 7980
atctggccga ttgcacgctc cagtcccctg catgtgcact cgctcctcaa ttgcttaaga 8040
tcatcgcagc agctatcgaa gtgctggctc tgttgccctc ctccacggcc ttggttgtag 8100
tagtagctgc cgccgccctt ctggactttt tcccacagga accgccgaat aattcgatag 8160
aaccacacga gcatgtgctt tcatttattt taaaaaccaa gaaacataca taacatttca 8220
tcagcctctc tctctctctc tctctctctc tctctctctc tctctctctc tctctcttta 8280
ttacagctgt tacactaact taaaacacat tcatctcatt attattatta ttatccatcc 8340
ttaacaccta gcagtgtctt tgtacgatct cataatcgat caccccttca tcaggtatcc 8400
ttaggcttca ctccaacgtt gttgcagtta cggaacatgt acacaccatc atggttctca 8460
acgaactggc aagatctcca agttttccaa aggctaaccc acatgttctc atcggtgtgt 8520
ctgtagtgct ctcccataac tttcttgatg cactcggtag cttctctagc atggtagaat 8580
gggatccttg aaacgtagtg atggagcaca tgagtctcga tgatgtcatg gaagatgatt 8640
ccgaggattc cgaactctct atcgatagta gcagcagcac ccttagcgaa agtccactct 8700
tgagcatcgt aatgaggcat agaagaatcg gtgtgctgaa ggaaggtaac gaaaacaagc 8760
cagtggttaa caaggatcca aggacagaac catgtgatga aagtaggcca gaatccgaaa 8820
accttgtaag cggtgtaaac agaagtgagg gtagcaagga ttccaagatc agaaagaacg 8880
atgtaccagt agtccttctt atcgaaaaca gggctagaag gccagtagtg agacttgaag 8940
aacttagaaa caccagggta aggttgtcca gtagcgttag tagcaaggta aagagaaagt 9000
cctccaagct gttggaacaa gagagcgaaa acagagtaga taggagtttc ctcagcgata 9060
tcgtgaaggc tggtaacttg gtgcttctct ttgaattcct cggcggtgta aggaacgaaa 9120
accatatctc tggtcatgtg tccagtagcc ttatggtgct tagcatgaga gaacttccag 9180
ctgaagtaag gaaccataac aagagagtgg agaacccatc caacggtatc gttaacccat 9240
ccgtagttag agaaagcaga atgtccacac tcatgtccaa ggatccagat tccgaatccg 9300
aaacaagaga tagagaacac gtaagcagac caagcagcga atctaaggaa ttcgttaggg 9360
agaagaggga tgtaggtaag tccaacgtaa gcgatagcag agatagccac gatatctctc 9420
accacgtaag acatagactt cacgagagat ctctcgtaac agtgcttagg gatagcgtca 9480
aggatatcct tgatggtgta atctggcacc ttgaaaacgt ttccgaaggt atcgatagcg 9540
gtcttttgct gcttgaaaga tgcaacgttt ccagaacgcc taacggtctt agtagatccc 9600
tcaaggatct cagatccaga cacggtaacc ttagacatgg tatggtaatt gtaaatgtaa 9660
ttgtaatgtt gtttgttgtt tgttgttgtt ggtaattgtt gtaaaatttt tggtggtgat 9720
tggttcttta aggtgtgaga gtgagttgtg agttgtgtgg tgggtttggt gagattgggg 9780
atggtgggtt tatatagtgg agactgagga atggggtcgt gagtgttaac tttgcatggg 9840
ctacacgtgg gttcttttgg gcttacacgt agtattattc atgcaaatgc agccaataca 9900
tatacggtat tttaataatg tgtgggaata caatatgccg agtattttac taattttggc 9960
aatgacaagt gtacatttgg attatcttac ttggcctctc ttgctttaat ttggattatt 10020
tttattctct taccttggcc gttcatattc acatccctaa aggcaagaca gaattgaatg 10080
gtggccaaaa attaaaacga tggatatgac ctacatagtg taggatcaat taacgtcgaa 10140
ggaaaatact gattctctca agcatacgga caagggtaaa taacatagtc accagaacat 10200
aataaacaaa aagtgcagaa gcaagactaa aaaaattagc tatggacatt caggttcata 10260
ttggaaacat cattatccta gtcttgtgac catccttcct cctgctctag ttgagaggcc 10320
ttgggactaa cgagaggtca gttgggatag cagatcctta tcctggacta gcctttctgg 10380
tgtttcagag tcttcgtgcc gccgtctaca tctatctcca ttaggtctga agatgactct 10440
tcacaccaac gacgtttaag gtctctatcc tactcctagc ttgcaatacc tggcttgcaa 10500
tacctggagc atcgtgcacg atgattggat actgtggagg aggagtgttt gctgatttag 10560
agctcccggt tgggtgattt gacttcgatt tcagtttagg cttgttgaaa tttttcaggt 10620
tccattgtga agcctttaga gcttgagctt ccttccatgt taatgccttg atcgaatact 10680
cctagagaaa agggaagtcg atctctgagt attgaaatcg aagtgcacat tttttttcaa 10740
cgtgtccaat caatccacaa acaaagcaga agacaggtaa tctttcatac ttatactgac 10800
aagtaatagt cttaccgtca tgcataataa cgtctcgttc cttcaagagg ggttttccga 10860
catccataac gacccgaagc ctcatgaaag cattagggaa gaacttttgg ttcttcttgt 10920
catggccttt ataggtgtca gccgagctcg ccaattcccg tccgactggc tccgcaaaat 10980
attcgaacgg caagttatgg acttgcaacc ataactccac ggtattgagc aggacctatt 11040
gtgaagactc atctcatgga gcttcagaat gtggttgtca gcaaaccaat gaccgaaatc 11100
catcacatga cggacgtcca gtgggtgagc gaaacgaaac aggaagcgcc tatctttcag 11160
agtcgtgagc tccacaccgg attccggcaa ctacgtgttg ggcaggcttc gccgtattag 11220
agatatgttg aggcagaccc atctgtgcca ctcgtacaat tacgagagtt gttttttttg 11280
tgattttcct agtttctcgt tgatggtgag ctcatattct acatcgtatg gtctctcaac 11340
gtcgtttcct gtcatctgat atcccgtcat ttgcatccac gtgcgccgcc tcccgtgcca 11400
agtccctagg tgtcatgcac gccaaattgg tggtggtgcg ggctgccctg tgcttcttac 11460
cgatgggtgg aggttgagtt tgggggtctc cgcggcgatg gtagtgggtt gacggtttgg 11520
tgtgggttga cggcattgat caatttactt cttgcttcaa attctttggc agaaaacaat 11580
tcattagatt agaactggaa accagagtga tgagacggat taagtcagat tccaacagag 11640
ttacatctct taagaaataa tgtaacccct ttagacttta tatatttgca attaaaaaaa 11700
taatttaact tttagacttt atatatagtt ttaataacta agtttaacca ctctattatt 11760
tatatcgaaa ctatttgtat gtctcccctc taaataaact tggtattgtg tttacagaac 11820
ctataatcaa ataatcaata ctcaactgaa gtttgtgcag ttaattgaag ggattaacgg 11880
ccaaaatgca ctagtattat caaccgaata gattcacact agatggccat ttccatcaat 11940
atcatcgccg ttcttcttct gtccacatat cccctctgaa acttgagaga cacctgcact 12000
tcattgtcct tattacgtgt tacaaaatga aacccatgca tccatgcaaa ctgaagaatg 12060
gcgcaagaac ccttcccctc catttcttat gtggcgacca tccatttcac catctcccgc 12120
tataaaacac ccccatcact tcacctagaa catcatcact acttgcttat ccatccaaaa 12180
gatacccact tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattaca 12240
tttacaatta ccataccatg ccacctagcg ctgctaagca aatgggagct tctactggtg 12300
ttcatgctgg tgttactgac tcttctgctt tcaccagaaa ggatgttgct gatagacctg 12360
atctcaccat cgttggagat tctgtttacg atgctaaggc tttcagatct gagcatcctg 12420
gtggtgctca tttcgtttct ttgttcggag gaagagatgc tactgaggct ttcatggaat 12480
accatagaag ggcttggcct aagtctagaa tgtctagatt ccacgttgga tctcttgctt 12540
ctactgagga acctgttgct gctgatgagg gataccttca actttgtgct aggatcgcta 12600
agatggtgcc ttctgtttct tctggattcg ctcctgcttc ttactgggtt aaggctggac 12660
ttatccttgg atctgctatc gctcttgagg cttacatgct ttacgctgga aagagacttc 12720
tcccttctat cgttcttgga tggcttttcg ctcttatcgg tcttaacatc cagcatgatg 12780
ctaaccatgg tgctttgtct aagtctgctt ctgttaacct tgctcttgga ctttgtcagg 12840
attggatcgg aggatctatg atcctttggc ttcaagagca tgttgttatg caccacctcc 12900
acactaacga tgttgataag gatcctgatc aaaaggctca cggtgctctt agactcaagc 12960
ctactgatgc ttggtcacct atgcattggc ttcagcatct ttaccttttg cctggtgaga 13020
ctatgtacgc tttcaagctt ttgttcctcg acatctctga gcttgttatg tggcgttggg 13080
agggtgagcc tatctctaag cttgctggat acctctttat gccttctttg cttctcaagc 13140
ttaccttctg ggctagattc gttgctttgc ctctttacct tgctccttct gttcatactg 13200
ctgtgtgtat cgctgctact gttatgactg gatctttcta cctcgctttc ttcttcttca 13260
tctcccacaa cttcgagggt gttgcttctg ttggacctga tggatctatc acttctatga 13320
ctagaggtgc tagcttcctt aagagacaag ctgagacttc ttctaacgtt ggaggacctc 13380
ttcttgctac tcttaacggt ggactcaact accaaattga gcatcacttg ttccctagag 13440
ttcaccatgg attctaccct agacttgctc ctcttgttaa ggctgagctt gaggctagag 13500
gaatcgagta caagcactac cctactatct ggtctaacct tgcttctacc ctcagacata 13560
tgtacgctct tggaagaagg cctagatcta aggctgagta atgacaagct tatgtgacgt 13620
gaaataataa cggtaaaata tatgtaataa taataataat aaagccacaa agtgagaatg 13680
aggggaaggg gaaatgtgta atgagccagt agccggtggt gctaattttg tatcgtattg 13740
tcaataaatc atgaattttg tggtttttat gtgttttttt aaatcatgaa ttttaaattt 13800
tataaaataa tctccaatcg gaagaacaac attccatatc catgcatgga tgtttcttta 13860
cccaaatcta gttcttgaga ggatgaagca tcaccgaaca gttctgcaac tatccctcaa 13920
aagctttaaa atgaacaaca aggaacagag caacgttcca aagatcccaa acgaaacata 13980
ttatctatac taatactata ttattaatta ctactgcccg gaatcacaat ccctgaatga 14040
ttcctattaa ctacaagcct tgttggcggc ggagaagtga tcggcgcggc gagaagcagc 14100
ggactcggag acgaggcctt ggaagatctg agtcgaacgg gcagaatcag tattttcctt 14160
cgacgttaat tgatcctaca ctatgtaggt catatccatc gttttaattt ttggccacca 14220
ttcaattctg tcttgccttt agggatgtga atatgaacgg ccaaggtaag agaataaaaa 14280
taatccaaat taaagcaaga gaggccaagt aagataatcc aaatgtacac ttgtcattgc 14340
caaaattagt aaaatactcg gcatattgta ttcccacaca ttattaaaat accgtatatg 14400
tattggctgc atttgcatga ataatactac gtgtaagccc aaaagaaccc acgtgtagcc 14460
catgcaaagt taacactcac gaccccattc ctcagtctcc actatataaa cccaccatcc 14520
ccaatctcac caaacccacc acacaactca caactcactc tcacacctta aagaaccaat 14580
caccaccaaa aattttacaa caattaccaa caacaacaaa caacaaacaa cattacaatt 14640
acatttacaa ttaccatacc atgagcgctg ttaccgttac tggatctgat cctaagaaca 14700
gaggatcttc tagcaacacc gagcaagagg ttccaaaagt tgctatcgat accaacggaa 14760
acgtgttctc tgttcctgat ttcaccatca aggacatcct tggagctatc cctcatgagt 14820
gttacgagag aagattggct acctctctct actacgtgtt cagagatatc ttctgcatgc 14880
ttaccaccgg ataccttacc cataagatcc tttaccctct cctcatctct tacacctcta 14940
acagcatcat caagttcact ttctgggccc tttacactta cgttcaagga cttttcggaa 15000
ccggaatctg ggttctcgct catgagtgtg gacatcaagc tttctctgat tacggaatcg 15060
tgaacgattt cgttggatgg acccttcact cttaccttat ggttccttac ttcagctgga 15120
agtactctca tggaaagcac cataaggcta ctggacacat gaccagagat atggttttcg 15180
ttcctgccac caaagaggaa ttcaagaagt ctaggaactt cttcggtaac ctcgctgagt 15240
actctgagga ttctccactt agaacccttt acgagcttct tgttcaacaa cttggaggat 15300
ggatcgctta cctcttcgtt aacgttacag gacaacctta ccctgatgtt ccttcttgga 15360
aatggaacca cttctggctt acctctccac ttttcgagca aagagatgct ctctacatct 15420
tcctttctga tcttggaatc ctcacccagg gaatcgttct tactctttgg tacaagaaat 15480
tcggaggatg gtcccttttc atcaactggt tcgttcctta catctgggtt aaccactggc 15540
tcgttttcat cacattcctt cagcacactg atcctactat gcctcattac aacgctgagg 15600
aatggacttt cgctaagggt gctgctgcta ctatcgatag aaagttcgga ttcatcggac 15660
ctcacatctt ccatgatatc atcgagactc atgtgcttca ccactactgt tctaggatcc 15720
cattctacaa cgctagacct gcttctgagg ctatcaagaa agttatggga aagcactaca 15780
ggtctagcga cgagaacatg tggaagtcac tttggaagtc tttcaggtct tgccaatacg 15840
ttgacggtga taacggtgtt ctcatgttcc gtaacatcaa caactgcgga gttggagctg 15900
ctgagaagta atgaaggggt gatcgattat gagatcgtac aaagacactg ctaggtgtta 15960
aggatggata ataataataa taatgagatg aatgtgtttt aagttagtgt aacagctgta 16020
ataaagagag agagagagag agagagagag agagagagag agagagagag agagaggctg 16080
atgaaatgtt atgtatgttt cttggttttt aaaataaatg aaagcacatg ctcgtgtggt 16140
tctatcgaat tattcggcgg ttcctgtggg aaaaagtcca gaagggccgc cgcagctact 16200
actacaacca aggccgtgga ggagggcaac agagccagca cttcgatagc tgctgcgatg 16260
atcttaagca attgaggagc gagtgcacat gcaggggact ggagcgtgca atcggccaga 16320
tgaggcagga catccagcag cagggacagc agcaggaagt tgagaggtgg tcccatcaat 16380
ctaaacaagt cgctagggac cttccgggac agtgcggcac ccagcctagc cgatgccagc 16440
tccaggggca gcagcagtct gcatggtttt gaagtggtga tcgatgagat cgtataaaga 16500
cactgctagg tgttaaggat gggataataa gatgtgtttt aagtcattaa ccgtaataaa 16560
aagagagaga ggctgatgga atgttatgta tgtatgtttc ttggttttta aaattaaatg 16620
gaaagcacat gctcgtgtgg gttctatctc gattaaaaat cccaattata tttggtctaa 16680
tttagtttgg tattgagtaa aacaaattcg aaccaaacca aaatataaat atatagtttt 16740
tatatatatg cctttaagac tttttataga attttcttta aaaaatatct agaaatattt 16800
gcgactcttc tggcatgtaa tatttcgtta aatatgaagt gctccatttt tattaacttt 16860
aaataattgg ttgtacgatc actttcttat caagtgttac taaaatgcgt caatctcttt 16920
gttcttccat attcatatgt caaaatctat caaaattctt atatatcttt ttcgaatttg 16980
aagtgaaatt tcgataattt aaaattaaat agaacatatc attatttagg tatcatattg 17040
atttttatac ttaattacta aatttggtta actttgaaag tgtacatcaa cgaaaaatta 17100
gtcaaacgac taaaataaat aaatatcatg tgttattaag aaaattctcc tataagaata 17160
ttttaataga tcatatgttt gtaaaaaaaa ttaattttta ctaacacata tatttactta 17220
tcaaaaattt gacaaagtaa gattaaaata atattcatct aacaaaaaaa aaaccagaaa 17280
atgctgaaaa cccggcaaaa ccgaaccaat ccaaaccgat atagttggtt tggtttgatt 17340
ttgatataaa ccgaaccaac tcggtccatt tgcaccccta atcataatag ctttaatatt 17400
tcaagatatt attaagttaa cgttgtcaat atcctggaaa ttttgcaaaa tgaatcaagc 17460
ctatatggct gtaatatgaa tttaaaagca gctcgatgtg gtggtaatat gtaatttact 17520
tgattctaaa aaaatatccc aagtattaat aatttctgct aggaagaagg ttagctacga 17580
tttacagcaa agccagaata caaagaacca taaagtgatt gaagctcgaa atatacgaag 17640
gaacaaatat ttttaaaaaa atacgcaatg acttggaaca aaagaaagtg atatattttt 17700
tgttcttaaa caagcatccc ctctaaagaa tggcagtttt cctttgcatg taactattat 17760
gctcccttcg ttacaaaaat tttggactac tattgggaac ttcttctgaa aatagtcctg 17820
caggctagta gattggttgg ttggtttcca tgtaccagaa ggcttaccct attagttgaa 17880
agttgaaact ttgttcccta ctcaattcct agttgtgtaa atgtatgtat atgtaatgtg 17940
tataaaacgt agtacttaaa tgactaggag tggttcttga gaccgatgag agatgggagc 18000
agaactaaag atgatgacat aattaagaac gaatttgaaa ggctcttagg tttgaatcct 18060
attcgagaat gtttttgtca aagatagtgg cgattttgaa ccaaagaaaa catttaaaaa 18120
atcagtatcc ggttacgttc atgcaaatag aaagtggtct aggatctgat tgtaatttta 18180
gacttaaaga gtctcttaag attcaatcct ggctgtgtac aaaactacaa ataatatatt 18240
ttagactatt tggccttaac taaacttcca ctcattattt actgaggtta gagaatagac 18300
ttgcgaataa acacattccc gagaaatact catgatccca taattagtca gagggtatgc 18360
caatcagatc taagaacaca cattccctca aattttaatg cacatgtaat catagtttag 18420
cacaattcaa aaataatgta gtattaaaga cagaaatttg tagacttttt tttggcgtta 18480
aaagaagact aagtttatac gtacatttta ttttaagtgg aaaaccgaaa ttttccatcg 18540
aaatatatga atttagtata tatatttctg caatgtacta ttttgctatt ttggcaactt 18600
tcagtggact actactttat tacaatgtgt atggatgcat gagtttgagt atacacatgt 18660
ctaaatgcat gctttgtaaa acgtaacgga ccacaaaaga ggatccatac aaatacatct 18720
catagcttcc tccattattt tccgacacaa acagagcatt ttacaacaat taccaacaac 18780
aacaaacaac aaacaacatt acaattacat ttacaattac cataccatgg cctctatcgc 18840
tatccctgct gctcttgctg gaactcttgg atacgttacc tacaatgtgg ctaaccctga 18900
tatcccagct tctgagaaag ttcctgctta cttcatgcag gttgagtact ggggacctac 18960
tatcggaact attggatacc tcctcttcat ctacttcgga aagcgtatca tgcagaacag 19020
atctcaacct ttcggactca agaacgctat gctcgtttac aacttctacc agaccttctt 19080
caacagctac tgcatctacc ttttcgttac ttctcatagg gctcagggac ttaaggtttg 19140
gggaaacatc cctgatatga ctgctaactc ttggggaatc tctcaggtta tctggcttca 19200
ctacaacaac aagtacgttg agcttctcga caccttcttc atggtgatga ggaagaagtt 19260
cgaccagctt tctttccttc acatctacca ccacactctt ctcatctggt catggttcgt 19320
tgttatgaag cttgagcctg ttggagattg ctacttcgga tcttctgtta acaccttcgt 19380
gcacgtgatc atgtactctt actacggact tgctgctctt ggagttaact gtttctggaa 19440
gaagtacatc acccagatcc agatgcttca gttctgtatc tgtgcttctc actctatcta 19500
caccgcttac gttcagaata ccgctttctg gcttccttac cttcaactct gggttatggt 19560
gaacatgttc gttctcttcg ccaacttcta ccgtaagagg tacaagtcta agggtgctaa 19620
gaagcagtga taagggccgc cgccatgtga cagatcgaag gaagaaagtg taataagacg 19680
actctcacta ctcgatcgct agtgattgtc attgttatat ataataatgt tatctttcac 19740
aacttatcgt aatgcatgtg aaactataac acattaatcc tacttgtcat atgataacac 19800
tctccccatt taaaactctt gtcaatttaa agatataaga ttctttaaat gattaaaaaa 19860
aatatattat aaattcaatc actcctacta ataaattatt aattattatt tattgattaa 19920
aaaaatactt atactaattt agtctgaata gaataattag attctagcct gcagggcggc 19980
cgcggatccc atggagtcaa agattcaaat agaggaccta acagaactcg ccgtaaagac 20040
tggcgaacag ttcatacaga gtctcttacg actcaatgac aagaagaaaa tcttcgtcaa 20100
catggtggag cacgacacac ttgtctactc caaaaatatc aaagatacag tctcagaaga 20160
ccaaagggca attgagactt ttcaacaaag ggtaatatcc ggaaacctcc tcggattcca 20220
ttgcccagct atctgtcact ttattgtgaa gatagtggaa aaggaaggtg gctcctacaa 20280
atgccatcat tgcgataaag gaaaggccat cgttgaagat gcctctgccg acagtggtcc 20340
caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc caaccacgtc 20400
ttcaaagcaa gtggattgat gtgatatctc cactgacgta agggatgacg cacaatccca 20460
ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg agagaacacg 20520
ggggactgaa ttaaatatga gccctgagag gcgtcctgtt gaaatcagac ctgctactgc 20580
tgctgatatg gctgctgttt gtgatatcgt gaaccactac atcgagactt ctaccgttaa 20640
cttcagaact gagcctcaaa ctcctcaaga gtggatcgat gatcttgaga gactccaaga 20700
tagataccct tggcttgttg ctgaggttga gggtgttgtt gctggaatcg cttacgctgg 20760
accttggaag gctagaaacg cttacgattg gactgttgag tctaccgttt acgtttcaca 20820
cagacatcag agacttggac ttggatctac cctttacact caccttctca agtctatgga 20880
agctcaggga ttcaagtctg ttgttgctgt tatcggactc cctaacgatc cttctgttag 20940
acttcatgag gctcttggat acactgctag aggaactctt agagctgctg gatacaagca 21000
cggtggatgg catgatgttg gattctggca aagagatttc gagcttcctg ctcctcctag 21060
acctgttaga ccagttactc agatctgaat ttgcgtgatc gttcaaacat ttggcaataa 21120
agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 21180
aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 21240
tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 21300
gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatca ctagtgatgt 21360
acggttaaaa ccaccccagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag 21420
cgtcaatttg tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg 21480
gcagctcggc acaaaatcac cactcgatac aggcagccca tcagtcc 21527
&lt;210&gt; 2
&lt;211&gt; 23512
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pGA7- mod_B nucleotide sequence
&lt;400&gt; 2
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgccccgcgg aaagcttgcg gccgcggtac cgcccgttcg 240
actcagatct tccaaggcct cgtctccgag tccgctgctt ctcgccgcgc cgatcacttc 300
tccgccgcca acaaggcttg tagttaatag gaatcattca gggattgtga ttccgggcag 360
tagtaattaa taatatagta ttagtataga taatatgttt cgtttgggat ctttggaacg 420
ttgctctgtt ccttgttgtt cattttaaag cttttgaggg atagttgcag aactgttcgg 480
tgatgcttca tcctctcaag aactagattt gggtaaagaa acatccatgc atggatatgg 540
aatgttgttc ttccgattgg agattatttt ataaaattta aaattcatga tttaaaaaaa 600
cacataaaaa ccacaaaatt catgatttat tgacaatacg atacaaaatt agcaccaccg 660
gctactggct cattacacat ttccccttcc cctcattctc actttgtggc tttattatta 720
ttattattac atatatttta ccgttattat ttcacgtcac ataagcttgt taattaatca 780
ttagtgagcc ttctcagcct ttccgttaac gtagtagtgc tgtcccacct tatcaaggtt 840
agagaaagta gccttccaag caccgtagta agagagcacc ttgtagttga gtccccactt 900
cttagcgaaa ggaacgaatc ttctgctaac ctcaggctgt ctgaattgag gcatatcagg 960
gaagaggtgg tggataacct gacagttaag gtatcccata agccagttca cgtatcctct 1020
agaaggatcg atatcaacgg tgtgatcaac agcgtagtta acccaagaaa ggtgcttatc 1080
agatggaaca acagggaggt gagtatgaga agtagagaag tgagcgaaaa ggtacatgta 1140
agcgatccag tttccgaaag tgaaccacca gtaagcaaca ggccaagagt atccagtagc 1200
aagcttgata acagcggttc taacaacatg agaaacgagc atccaagaag cctcttcgta 1260
gttcttctta cggagaactt gtctagggtg gagaacgtag atccagaaag cttgaacaag 1320
aagtccagag gtaacaggaa cgaaagtcca agcttgaagt ctagcccaag ctctagagaa 1380
tcctctaggt ctgttatcct caacagcagt gttgaagaaa gccacagcag gagtggtatc 1440
aagatccata tcgtgtctaa ccttttgagg ggtagcatgg tgcttgttat gcatctggtt 1500
ccacatctca ccagaagtag aaagtccgaa tccacaagtc atagcctgaa gtctcttgtc 1560
cacgtaaaca gatccggtaa gagagttatg tccaccctca tgttgaaccc atccacatct 1620
agctccgaag aaagcaccgt aaacaacaga agcaatgata gggtatccag cgtacataag 1680
agcagttcca agagcgaatg tagcaagaag ctcgagaagt ctgtaagcca catgggtgat 1740
agaaggcttg aagaatccat ctctctcaag ctcagcacgc catctagcga aatcctcaag 1800
cataggagca tcctcagact cagatctctt gatctcagca ggtctagaag gcaaagctct 1860
aagcatcttc caagccttga gagaacgcat gtggaattct ttgaaagcct cagtagcatc 1920
agcaccagtg ttagcaagca tgtagaagat cacagatcca ccagggtgct tgaagttagt 1980
cacatcgtac tcaacgtcct caactctaac ccatctagtc tcgaaagtag cagcaagctc 2040
atgaggctca agagtcttaa gatcaacagg agcagtagaa gcatccttag catcaagagc 2100
ctcagcagaa gatttagacc tggtaagtgg agatctagga gaagatcttc catcagtctt 2160
aggagggcac atggtatggt aattgtaaat gtaattgtaa tgttgtttgt tgtttgttgt 2220
tgttggtaat tgttgtaaaa ttaattaagt gggtatcttt tggatggata agcaagtagt 2280
gatgatgttc taggtgaagt gatgggggtg ttttatagcg ggagatggtg aaatggatgg 2340
tcgccacata agaaatggag gggaagggtt cttgcgccat tcttcagttt gcatggatgc 2400
atgggtttca ttttgtaaca cgtaataagg acaatgaagt gcaggtgtct ctcaagtttc 2460
agaggggata tgtggacaga agaagaacgg cgatgatatt gatggaaatg gccatctagt 2520
gtgaatctat tcggttgata atactagtgc attttggccg ttaatccctt caattaactg 2580
cacaaacttc agttgagtat tgattatttg attataggtt ctgtaaacac aataccaagt 2640
ttatttagag gggagacata caaatagttt cgatataaat aatagagtgg ttaaacttag 2700
ttattaaaac tatatataaa gtctaaaagt taaattattt ttttaattgc aaatatataa 2760
agtctaaagg ggttacatta tttcttaaga gatgtaactc tgttggaatc tgacttaatc 2820
cgtctcatca ctctggtttc cagttctaat ctaatgaatt gttttctgcc aaagaatttg 2880
aagcaagaag taaattgatc aatgccgtca acccacacca aaccgtcaac ccactaccat 2940
cgccgcggag acccccaaac tcaacctcca cccatcggta agaagcacag ggcagcccgc 3000
accaccacca atttggcgtg catgacacct agggacttgg cacgggaggc ggcgcacgtg 3060
gatgcaaatg acgggatatc agatgacagg aaacgacgtt gagagaccat acgatgtaga 3120
atatgagctc accatcaacg agaaactagg aaaatcacaa aaaaaacaac tctcgtaatt 3180
gtacgagtgg cacagatggg tctgcctcaa catatctcta atacggcgaa gcctgcccaa 3240
cacgtagttg ccggaatccg gtgtggagct cacgactctg aaagataggc gcttcctgtt 3300
tcgtttcgct cacccactgg acgtccgtca tgtgatggat ttcggtcatt ggtttgctga 3360
caaccacatt ctgaagctcc atgagatgag tcttcacaat aggtcctgct caataccgtg 3420
gagttatggt tgcaagtcca taacttgccg ttcgaatatt ttgcggagcc agtcggacgg 3480
gaattggcga gctcggctga cacctataaa ggccatgaca agaagaacca aaagttcttc 3540
cctaatgctt tcatgaggct tcgggtcgtt atggatgtcg gaaaacccct cttgaaggaa 3600
cgagacgtta ttatgcatga cggtaagact attacttgtc agtataagta tgaaagatta 3660
cctgtcttct gctttgtttg tggattgatt ggacacgttg aaaaaaaatg tgcacttcga 3720
tttcaatact cagagatcga cttccctttt ctctaggagt attcgatcaa ggcattaaca 3780
tggaaggaag ctcaagctct aaaggcttca caatggaacc tgaaaaattt caacaagcct 3840
aaactgaaat cgaagtcaaa tcacccaacc gggagctcta aatcagcaaa cactcctcct 3900
ccacagtatc caatcatcgt gcacgatgct ccaggtattg caagccaggt attgcaagct 3960
aggagtagga tagagacctt aaacgtcgtt ggtgtgaaga gtcatcttca gacctaatgg 4020
agatagatgt agacggcggc acgaagactc tgaaacacca gaaaggctag tccaggataa 4080
ggatctgcta tcccaactga cctctcgtta gtcccaaggc ctctcaacta gagcaggagg 4140
aaggatggtc acaagactag gataatgatg tttccaatat gaacctgaat gtccatagct 4200
aattttttta gtcttgcttc tgcacttttt gtttattatg ttctggtgac tatgttattt 4260
acccttgtcc gtatgcttga gggtacccta gtagattggt tggttggttt ccatgtacca 4320
gaaggcttac cctattagtt gaaagttgaa actttgttcc ctactcaatt cctagttgtg 4380
taaatgtatg tatatgtaat gtgtataaaa cgtagtactt aaatgactag gagtggttct 4440
tgagaccgat gagagatggg agcagaacta aagatgatga cataattaag aacgaatttg 4500
aaaggctctt aggtttgaat cctattcgag aatgtttttg tcaaagatag tggcgatttt 4560
gaaccaaaga aaacatttaa aaaatcagta tccggttacg ttcatgcaaa tagaaagtgg 4620
tctaggatct gattgtaatt ttagacttaa agagtctctt aagattcaat cctggctgtg 4680
tacaaaacta caaataatat attttagact atttggcctt aactaaactt ccactcatta 4740
tttactgagg ttagagaata gacttgcgaa taaacacatt cccgagaaat actcatgatc 4800
ccataattag tcagagggta tgccaatcag atctaagaac acacattccc tcaaatttta 4860
atgcacatgt aatcatagtt tagcacaatt caaaaataat gtagtattaa agacagaaat 4920
ttgtagactt ttttttggcg ttaaaagaag actaagttta tacgtacatt ttattttaag 4980
tggaaaaccg aaattttcca tcgaaatata tgaatttagt atatatattt ctgcaatgta 5040
ctattttgct attttggcaa ctttcagtgg actactactt tattacaatg tgtatggatg 5100
catgagtttg agtatacaca tgtctaaatg catgctttgt aaaacgtaac ggaccacaaa 5160
agaggatcca tacaaataca tctcatagct tcctccatta ttttccgaca caaacagagc 5220
attttacaac aattaccaac aacaacaaac aacaaacaac attacaatta catttacaat 5280
taccatacca tggcctctat cgctatccct gctgctcttg ctggaactct tggatacgtt 5340
acctacaatg tggctaaccc tgatatccca gcttctgaga aagttcctgc ttacttcatg 5400
caggttgagt actggggacc tactatcgga actattggat acctcctctt catctacttc 5460
ggaaagcgta tcatgcagaa cagatctcaa cctttcggac tcaagaacgc tatgctcgtt 5520
tacaacttct accagacctt cttcaacagc tactgcatct accttttcgt tacttctcat 5580
agggctcagg gacttaaggt ttggggaaac atccctgata tgactgctaa ctcttgggga 5640
atctctcagg ttatctggct tcactacaac aacaagtacg ttgagcttct cgacaccttc 5700
ttcatggtga tgaggaagaa gttcgaccag ctttctttcc ttcacatcta ccaccacact 5760
cttctcatct ggtcatggtt cgttgttatg aagcttgagc ctgttggaga ttgctacttc 5820
ggatcttctg ttaacacctt cgtgcacgtg atcatgtact cttactacgg acttgctgct 5880
cttggagtta actgtttctg gaagaagtac atcacccaga tccagatgct tcagttctgt 5940
atctgtgctt ctcactctat ctacaccgct tacgttcaga ataccgcttt ctggcttcct 6000
taccttcaac tctgggttat ggtgaacatg ttcgttctct tcgccaactt ctaccgtaag 6060
aggtacaagt ctaagggtgc taagaagcag tgataaggcg cgcggcgcgc cgggccgccg 6120
ccatgtgaca gatcgaagga agaaagtgta ataagacgac tctcactact cgatcgctag 6180
tgattgtcat tgttatatat aataatgtta tctttcacaa cttatcgtaa tgcatgtgaa 6240
actataacac attaatccta cttgtcatat gataacactc tccccattta aaactcttgt 6300
caatttaaag atataagatt ctttaaatga ttaaaaaaaa tatattataa attcaatcac 6360
tcctactaat aaattattaa ttattattta ttgattaaaa aaatacttat actaatttag 6420
tctgaataga ataattagat tctagtctca tcccctttta aaccaactta gtaaacgttt 6480
ttttttttaa ttttatgaag ttaagttttt accttgtttt taaaaagaat cgttcataag 6540
atgccatgcc agaacattag ctacacgtta cacatagcat gcagccgcgg agaattgttt 6600
ttcttcgcca cttgtcactc ccttcaaaca cctaagagct tctctctcac agcacacaca 6660
tacaatcaca tgcgtgcatg cattattaca cgtgatcgcc atgcaaatct cctttatagc 6720
ctataaatta actcatccgc ttcactcttt actcaaacca aaactcatcg atacaaacaa 6780
gattaaaaac atacacgagg atcttttaca acaattacca acaacaacaa acaacaaaca 6840
acattacaat tacatttaca attaccatac catgcctcca agggactctt actcttatgc 6900
tgctcctcct tctgctcaac ttcacgaagt tgatactcct caagagcacg acaagaaaga 6960
gcttgttatc ggagataggg cttacgatgt taccaacttc gttaagagac accctggtgg 7020
aaagatcatt gcttaccaag ttggaactga tgctaccgat gcttacaagc agttccatgt 7080
tagatctgct aaggctgaca agatgcttaa gtctcttcct tctcgtcctg ttcacaaggg 7140
atactctcca agaagggctg atcttatcgc tgatttccaa gagttcacca agcaacttga 7200
ggctgaggga atgttcgagc cttctcttcc tcatgttgct tacagacttg ctgaggttat 7260
cgctatgcat gttgctggtg ctgctcttat ctggcatgga tacactttcg ctggaatcgc 7320
tatgcttgga gttgttcagg gaagatgtgg atggcttatg catgagggtg gacattactc 7380
tctcactgga aacattgctt tcgacagagc tatccaagtt gcttgttacg gacttggatg 7440
tggaatgtct ggtgcttggt ggcgtaacca gcataacaag caccatgcta ctcctcaaaa 7500
gcttcagcac gatgttgatc ttgataccct tcctctcgtt gctttccatg agagaatcgc 7560
tgctaaggtt aagtctcctg ctatgaaggc ttggctttct atgcaagcta agcttttcgc 7620
tcctgttacc actcttcttg ttgctcttgg atggcagctt taccttcatc ctagacacat 7680
gctcaggact aagcactacg atgagcttgc tatgctcgga atcagatacg gacttgttgg 7740
ataccttgct gctaactacg gtgctggata cgttctcgct tgttaccttc tttacgttca 7800
gcttggagct atgtacatct tctgcaactt cgctgtttct catactcacc tccctgttgt 7860
tgagcctaac gagcatgcta cttgggttga gtacgctgct aaccacacta ctaactgttc 7920
tccatcttgg tggtgtgatt ggtggatgtc ttaccttaac taccagatcg agcaccacct 7980
ttacccttct atgcctcaat tcagacaccc taagatcgct cctagagtta agcagctttt 8040
cgagaagcac ggacttcact acgatgttag aggatacttc gaggctatgg ctgatacttt 8100
cgctaacctt gataacgttg cccatgctcc tgagaagaaa atgcagtaat gagatcgttc 8160
aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg cgatgattat 8220
catataattt ctgttgaatt acgttaagca cgtaataatt aacatgtaat gcatgacgtt 8280
atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat acgcgataga 8340
aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat ctatgttact 8400
agatcggtcg attaaaaatc ccaattatat ttggtctaat ttagtttggt attgagtaaa 8460
acaaattcga accaaaccaa aatataaata tatagttttt atatatatgc ctttaagact 8520
ttttatagaa ttttctttaa aaaatatcta gaaatatttg cgactcttct ggcatgtaat 8580
atttcgttaa atatgaagtg ctccattttt attaacttta aataattggt tgtacgatca 8640
ctttcttatc aagtgttact aaaatgcgtc aatctctttg ttcttccata ttcatatgtc 8700
aaaatctatc aaaattctta tatatctttt tcgaatttga agtgaaattt cgataattta 8760
aaattaaata gaacatatca ttatttaggt atcatattga tttttatact taattactaa 8820
atttggttaa ctttgaaagt gtacatcaac gaaaaattag tcaaacgact aaaataaata 8880
aatatcatgt gttattaaga aaattctcct ataagaatat tttaatagat catatgtttg 8940
taaaaaaaat taatttttac taacacatat atttacttat caaaaatttg acaaagtaag 9000
attaaaataa tattcatcta acaaaaaaaa aaccagaaaa tgctgaaaac ccggcaaaac 9060
cgaaccaatc caaaccgata tagttggttt ggtttgattt tgatataaac cgaaccaact 9120
cggtccattt gcacccctaa tcataatagc tttaatattt caagatatta ttaagttaac 9180
gttgtcaata tcctggaaat tttgcaaaat gaatcaagcc tatatggctg taatatgaat 9240
ttaaaagcag ctcgatgtgg tggtaatatg taatttactt gattctaaaa aaatatccca 9300
agtattaata atttctgcta ggaagaaggt tagctacgat ttacagcaaa gccagaatac 9360
aaagaaccat aaagtgattg aagctcgaaa tatacgaagg aacaaatatt tttaaaaaaa 9420
tacgcaatga cttggaacaa aagaaagtga tatatttttt gttcttaaac aagcatcccc 9480
tctaaagaat ggcagttttc ctttgcatgt aactattatg ctcccttcgt tacaaaaatt 9540
ttggactact attgggaact tcttctgaaa atagtgatag aacccacacg agcatgtgct 9600
ttccatttaa ttttaaaaac caagaaacat acatacataa cattccatca gcctctctct 9660
ctttttatta cggttaatga cttaaaacac atcttattat cccatcctta acacctagca 9720
gtgtctttat acgatctcat cgatcaccac ttcaaaacca tgcagactgc tgctgcccct 9780
ggagctggca tcggctaggc tgggtgccgc actgtcccgg aaggtcccta gcgacttgtt 9840
tagattgatg ggaccacctc tcaacttcct gctgctgtcc ctgctgctgg atgtcctgcc 9900
tcatctggcc gattgcacgc tccagtcccc tgcatgtgca ctcgctcctc aattgcttaa 9960
gatcatcgca gcagctatcg aagtgctggc tctgttgccc tcctccacgg ccttggttgt 10020
agtagtagct gccgccgccc ttctggactt tttcccacag gaaccgccga ataattcgat 10080
agaaccacac gagcatgtgc tttcatttat tttaaaaacc aagaaacata cataacattt 10140
catcagcctc tctctctctc tctctctctc tctctctctc tctctctctc tctctctctt 10200
tattacagct gttacactaa cttaaaacac attcatctca ttattattat tattatccat 10260
ccttaacacc tagcagtgtc tttgtacgat ctcataatcg atcacccctt catcaggtat 10320
ccttaggctt cactccaacg ttgttgcagt tacggaacat gtacacacca tcatggttct 10380
caacgaactg gcaagatctc caagttttcc aaaggctaac ccacatgttc tcatcggtgt 10440
gtctgtagtg ctctcccata actttcttga tgcactcggt agcttctcta gcatggtaga 10500
atgggatcct tgaaacgtag tgatggagca catgagtctc gatgatgtca tggaagatga 10560
ttccgaggat tccgaactct ctatcgatag tagcagcagc acccttagcg aaagtccact 10620
cttgagcatc gtaatgaggc atagaagaat cggtgtgctg aaggaaggta acgaaaacaa 10680
gccagtggtt aacaaggatc caaggacaga accatgtgat gaaagtaggc cagaatccga 10740
aaaccttgta agcggtgtaa acagaagtga gggtagcaag gattccaaga tcagaaagaa 10800
cgatgtacca gtagtccttc ttatcgaaaa cagggctaga aggccagtag tgagacttga 10860
agaacttaga aacaccaggg taaggttgtc cagtagcgtt agtagcaagg taaagagaaa 10920
gtcctccaag ctgttggaac aagagagcga aaacagagta gataggagtt tcctcagcga 10980
tatcgtgaag gctggtaact tggtgcttct ctttgaattc ctcggcggtg taaggaacga 11040
aaaccatatc tctggtcatg tgtccagtag ccttatggtg cttagcatga gagaacttcc 11100
agctgaagta aggaaccata acaagagagt ggagaaccca tccaacggta tcgttaaccc 11160
atccgtagtt agagaaagca gaatgtccac actcatgtcc aaggatccag attccgaatc 11220
cgaaacaaga gatagagaac acgtaagcag accaagcagc gaatctaagg aattcgttag 11280
ggagaagagg gatgtaggta agtccaacgt aagcgatagc agagatagcc acgatatctc 11340
tcaccacgta agacatagac ttcacgagag atctctcgta acagtgctta gggatagcgt 11400
caaggatatc cttgatggtg taatctggca ccttgaaaac gtttccgaag gtatcgatag 11460
cggtcttttg ctgcttgaaa gatgcaacgt ttccagaacg cctaacggtc ttagtagatc 11520
cctcaaggat ctcagatcca gacacggtaa ccttagacat ggtatggtaa ttgtaaatgt 11580
aattgtaatg ttgtttgttg tttgttgttg ttggtaattg ttgtaaaatt tttggtggtg 11640
attggttctt taaggtgtga gagtgagttg tgagttgtgt ggtgggtttg gtgagattgg 11700
ggatggtggg tttatatagt ggagactgag gaatggggtc gtgagtgtta actttgcatg 11760
ggctacacgt gggttctttt gggcttacac gtagtattat tcatgcaaat gcagccaata 11820
catatacggt attttaataa tgtgtgggaa tacaatatgc cgagtatttt actaattttg 11880
gcaatgacaa gtgtacattt ggattatctt acttggcctc tcttgcttta atttggatta 11940
tttttattct cttaccttgg ccgttcatat tcacatccct aaaggcaaga cagaattgaa 12000
tggtggccaa aaattaaaac gatggatatg acctacatag tgtaggatca attaacgtcg 12060
aaggaaaata ctgattctct caagcatacg gacaagggta aataacatag tcaccagaac 12120
ataataaaca aaaagtgcag aagcaagact aaaaaaatta gctatggaca ttcaggttca 12180
tattggaaac atcattatcc tagtcttgtg accatccttc ctcctgctct agttgagagg 12240
ccttgggact aacgagaggt cagttgggat agcagatcct tatcctggac tagcctttct 12300
ggtgtttcag agtcttcgtg ccgccgtcta catctatctc cattaggtct gaagatgact 12360
cttcacacca acgacgttta aggtctctat cctactccta gcttgcaata cctggcttgc 12420
aatacctgga gcatcgtgca cgatgattgg atactgtgga ggaggagtgt ttgctgattt 12480
agagctcccg gttgggtgat ttgacttcga tttcagttta ggcttgttga aatttttcag 12540
gttccattgt gaagccttta gagcttgagc ttccttccat gttaatgcct tgatcgaata 12600
ctcctagaga aaagggaagt cgatctctga gtattgaaat cgaagtgcac attttttttc 12660
aacgtgtcca atcaatccac aaacaaagca gaagacaggt aatctttcat acttatactg 12720
acaagtaata gtcttaccgt catgcataat aacgtctcgt tccttcaaga ggggttttcc 12780
gacatccata acgacccgaa gcctcatgaa agcattaggg aagaactttt ggttcttctt 12840
gtcatggcct ttataggtgt cagccgagct cgccaattcc cgtccgactg gctccgcaaa 12900
atattcgaac ggcaagttat ggacttgcaa ccataactcc acggtattga gcaggaccta 12960
ttgtgaagac tcatctcatg gagcttcaga atgtggttgt cagcaaacca atgaccgaaa 13020
tccatcacat gacggacgtc cagtgggtga gcgaaacgaa acaggaagcg cctatctttc 13080
agagtcgtga gctccacacc ggattccggc aactacgtgt tgggcaggct tcgccgtatt 13140
agagatatgt tgaggcagac ccatctgtgc cactcgtaca attacgagag ttgttttttt 13200
tgtgattttc ctagtttctc gttgatggtg agctcatatt ctacatcgta tggtctctca 13260
acgtcgtttc ctgtcatctg atatcccgtc atttgcatcc acgtgcgccg cctcccgtgc 13320
caagtcccta ggtgtcatgc acgccaaatt ggtggtggtg cgggctgccc tgtgcttctt 13380
accgatgggt ggaggttgag tttgggggtc tccgcggcga tggtagtggg ttgacggttt 13440
ggtgtgggtt gacggcattg atcaatttac ttcttgcttc aaattctttg gcagaaaaca 13500
attcattaga ttagaactgg aaaccagagt gatgagacgg attaagtcag attccaacag 13560
agttacatct cttaagaaat aatgtaaccc ctttagactt tatatatttg caattaaaaa 13620
aataatttaa cttttagact ttatatatag ttttaataac taagtttaac cactctatta 13680
tttatatcga aactatttgt atgtctcccc tctaaataaa cttggtattg tgtttacaga 13740
acctataatc aaataatcaa tactcaactg aagtttgtgc agttaattga agggattaac 13800
ggccaaaatg cactagtatt atcaaccgaa tagattcaca ctagatggcc atttccatca 13860
atatcatcgc cgttcttctt ctgtccacat atcccctctg aaacttgaga gacacctgca 13920
cttcattgtc cttattacgt gttacaaaat gaaacccatg catccatgca aactgaagaa 13980
tggcgcaaga acccttcccc tccatttctt atgtggcgac catccatttc accatctccc 14040
gctataaaac acccccatca cttcacctag aacatcatca ctacttgctt atccatccaa 14100
aagataccca cttttacaac aattaccaac aacaacaaac aacaaacaac attacaatta 14160
catttacaat taccatacca tgccacctag cgctgctaag caaatgggag cttctactgg 14220
tgttcatgct ggtgttactg actcttctgc tttcaccaga aaggatgttg ctgatagacc 14280
tgatctcacc atcgttggag attctgttta cgatgctaag gctttcagat ctgagcatcc 14340
tggtggtgct catttcgttt ctttgttcgg aggaagagat gctactgagg ctttcatgga 14400
ataccataga agggcttggc ctaagtctag aatgtctaga ttccacgttg gatctcttgc 14460
ttctactgag gaacctgttg ctgctgatga gggatacctt caactttgtg ctaggatcgc 14520
taagatggtg ccttctgttt cttctggatt cgctcctgct tcttactggg ttaaggctgg 14580
acttatcctt ggatctgcta tcgctcttga ggcttacatg ctttacgctg gaaagagact 14640
tctcccttct atcgttcttg gatggctttt cgctcttatc ggtcttaaca tccagcatga 14700
tgctaaccat ggtgctttgt ctaagtctgc ttctgttaac cttgctcttg gactttgtca 14760
ggattggatc ggaggatcta tgatcctttg gcttcaagag catgttgtta tgcaccacct 14820
ccacactaac gatgttgata aggatcctga tcaaaaggct cacggtgctc ttagactcaa 14880
gcctactgat gcttggtcac ctatgcattg gcttcagcat ctttaccttt tgcctggtga 14940
gactatgtac gctttcaagc ttttgttcct cgacatctct gagcttgtta tgtggcgttg 15000
ggagggtgag cctatctcta agcttgctgg atacctcttt atgccttctt tgcttctcaa 15060
gcttaccttc tgggctagat tcgttgcttt gcctctttac cttgctcctt ctgttcatac 15120
tgctgtgtgt atcgctgcta ctgttatgac tggatctttc tacctcgctt tcttcttctt 15180
catctcccac aacttcgagg gtgttgcttc tgttggacct gatggatcta tcacttctat 15240
gactagaggt gctagcttcc ttaagagaca agctgagact tcttctaacg ttggaggacc 15300
tcttcttgct actcttaacg gtggactcaa ctaccaaatt gagcatcact tgttccctag 15360
agttcaccat ggattctacc ctagacttgc tcctcttgtt aaggctgagc ttgaggctag 15420
aggaatcgag tacaagcact accctactat ctggtctaac cttgcttcta ccctcagaca 15480
tatgtacgct cttggaagaa ggcctagatc taaggctgag taatgacaag cttatgtgac 15540
gtgaaataat aacggtaaaa tatatgtaat aataataata ataaagccac aaagtgagaa 15600
tgaggggaag gggaaatgtg taatgagcca gtagccggtg gtgctaattt tgtatcgtat 15660
tgtcaataaa tcatgaattt tgtggttttt atgtgttttt ttaaatcatg aattttaaat 15720
tttataaaat aatctccaat cggaagaaca acattccata tccatgcatg gatgtttctt 15780
tacccaaatc tagttcttga gaggatgaag catcaccgaa cagttctgca actatccctc 15840
aaaagcttta aaatgaacaa caaggaacag agcaacgttc caaagatccc aaacgaaaca 15900
tattatctat actaatacta tattattaat tactactgcc cggaatcaca atccctgaat 15960
gattcctatt aactacaagc cttgttggcg gcggagaagt gatcggcgcg gcgagaagca 16020
gcggactcgg agacgaggcc ttggaagatc tgagtcgaac gggcagaatc agtattttcc 16080
ttcgacgtta attgatccta cactatgtag gtcatatcca tcgttttaat ttttggccac 16140
cattcaattc tgtcttgcct ttagggatgt gaatatgaac ggccaaggta agagaataaa 16200
aataatccaa attaaagcaa gagaggccaa gtaagataat ccaaatgtac acttgtcatt 16260
gccaaaatta gtaaaatact cggcatattg tattcccaca cattattaaa ataccgtata 16320
tgtattggct gcatttgcat gaataatact acgtgtaagc ccaaaagaac ccacgtgtag 16380
cccatgcaaa gttaacactc acgaccccat tcctcagtct ccactatata aacccaccat 16440
ccccaatctc accaaaccca ccacacaact cacaactcac tctcacacct taaagaacca 16500
atcaccacca aaaattttac aacaattacc aacaacaaca aacaacaaac aacattacaa 16560
ttacatttac aattaccata ccatgagcgc tgttaccgtt actggatctg atcctaagaa 16620
cagaggatct tctagcaaca ccgagcaaga ggttccaaaa gttgctatcg ataccaacgg 16680
aaacgtgttc tctgttcctg atttcaccat caaggacatc cttggagcta tccctcatga 16740
gtgttacgag agaagattgg ctacctctct ctactacgtg ttcagagata tcttctgcat 16800
gcttaccacc ggatacctta cccataagat cctttaccct ctcctcatct cttacacctc 16860
taacagcatc atcaagttca ctttctgggc cctttacact tacgttcaag gacttttcgg 16920
aaccggaatc tgggttctcg ctcatgagtg tggacatcaa gctttctctg attacggaat 16980
cgtgaacgat ttcgttggat ggacccttca ctcttacctt atggttcctt acttcagctg 17040
gaagtactct catggaaagc accataaggc tactggacac atgaccagag atatggtttt 17100
cgttcctgcc accaaagagg aattcaagaa gtctaggaac ttcttcggta acctcgctga 17160
gtactctgag gattctccac ttagaaccct ttacgagctt cttgttcaac aacttggagg 17220
atggatcgct tacctcttcg ttaacgttac aggacaacct taccctgatg ttccttcttg 17280
gaaatggaac cacttctggc ttacctctcc acttttcgag caaagagatg ctctctacat 17340
cttcctttct gatcttggaa tcctcaccca gggaatcgtt cttactcttt ggtacaagaa 17400
attcggagga tggtcccttt tcatcaactg gttcgttcct tacatctggg ttaaccactg 17460
gctcgttttc atcacattcc ttcagcacac tgatcctact atgcctcatt acaacgctga 17520
ggaatggact ttcgctaagg gtgctgctgc tactatcgat agaaagttcg gattcatcgg 17580
acctcacatc ttccatgata tcatcgagac tcatgtgctt caccactact gttctaggat 17640
cccattctac aacgctagac ctgcttctga ggctatcaag aaagttatgg gaaagcacta 17700
caggtctagc gacgagaaca tgtggaagtc actttggaag tctttcaggt cttgccaata 17760
cgttgacggt gataacggtg ttctcatgtt ccgtaacatc aacaactgcg gagttggagc 17820
tgctgagaag taatgaaggg gtgatcgatt atgagatcgt acaaagacac tgctaggtgt 17880
taaggatgga taataataat aataatgaga tgaatgtgtt ttaagttagt gtaacagctg 17940
taataaagag agagagagag agagagagag agagagagag agagagagag agagagaggc 18000
tgatgaaatg ttatgtatgt ttcttggttt ttaaaataaa tgaaagcaca tgctcgtgtg 18060
gttctatcga attattcggc ggttcctgtg ggaaaaagtc cagaagggcc gccgcagcta 18120
ctactacaac caaggccgtg gaggagggca acagagccag cacttcgata gctgctgcga 18180
tgatcttaag caattgagga gcgagtgcac atgcagggga ctggagcgtg caatcggcca 18240
gatgaggcag gacatccagc agcagggaca gcagcaggaa gttgagaggt ggtcccatca 18300
atctaaacaa gtcgctaggg accttccggg acagtgcggc acccagccta gccgatgcca 18360
gctccagggg cagcagcagt ctgcatggtt ttgaagtggt gatcgatgag atcgtataaa 18420
gacactgcta ggtgttaagg atgggataat aagatgtgtt ttaagtcatt aaccgtaata 18480
aaaagagaga gaggctgatg gaatgttatg tatgtatgtt tcttggtttt taaaattaaa 18540
tggaaagcac atgctcgtgt gggttctatc tcgattaaaa atcccaatta tatttggtct 18600
aatttagttt ggtattgagt aaaacaaatt cgaaccaaac caaaatataa atatatagtt 18660
tttatatata tgcctttaag actttttata gaattttctt taaaaaatat ctagaaatat 18720
ttgcgactct tctggcatgt aatatttcgt taaatatgaa gtgctccatt tttattaact 18780
ttaaataatt ggttgtacga tcactttctt atcaagtgtt actaaaatgc gtcaatctct 18840
ttgttcttcc atattcatat gtcaaaatct atcaaaattc ttatatatct ttttcgaatt 18900
tgaagtgaaa tttcgataat ttaaaattaa atagaacata tcattattta ggtatcatat 18960
tgatttttat acttaattac taaatttggt taactttgaa agtgtacatc aacgaaaaat 19020
tagtcaaacg actaaaataa ataaatatca tgtgttatta agaaaattct cctataagaa 19080
tattttaata gatcatatgt ttgtaaaaaa aattaatttt tactaacaca tatatttact 19140
tatcaaaaat ttgacaaagt aagattaaaa taatattcat ctaacaaaaa aaaaaccaga 19200
aaatgctgaa aacccggcaa aaccgaacca atccaaaccg atatagttgg tttggtttga 19260
ttttgatata aaccgaacca actcggtcca tttgcacccc taatcataat agctttaata 19320
tttcaagata ttattaagtt aacgttgtca atatcctgga aattttgcaa aatgaatcaa 19380
gcctatatgg ctgtaatatg aatttaaaag cagctcgatg tggtggtaat atgtaattta 19440
cttgattcta aaaaaatatc ccaagtatta ataatttctg ctaggaagaa ggttagctac 19500
gatttacagc aaagccagaa tacaaagaac cataaagtga ttgaagctcg aaatatacga 19560
aggaacaaat atttttaaaa aaatacgcaa tgacttggaa caaaagaaag tgatatattt 19620
tttgttctta aacaagcatc ccctctaaag aatggcagtt ttcctttgca tgtaactatt 19680
atgctccctt cgttacaaaa attttggact actattggga acttcttctg aaaatagtcc 19740
tgcaggctag tagattggtt ggttggtttc catgtaccag aaggcttacc ctattagttg 19800
aaagttgaaa ctttgttccc tactcaattc ctagttgtgt aaatgtatgt atatgtaatg 19860
tgtataaaac gtagtactta aatgactagg agtggttctt gagaccgatg agagatggga 19920
gcagaactaa agatgatgac ataattaaga acgaatttga aaggctctta ggtttgaatc 19980
ctattcgaga atgtttttgt caaagatagt ggcgattttg aaccaaagaa aacatttaaa 20040
aaatcagtat ccggttacgt tcatgcaaat agaaagtggt ctaggatctg attgtaattt 20100
tagacttaaa gagtctctta agattcaatc ctggctgtgt acaaaactac aaataatata 20160
ttttagacta tttggcctta actaaacttc cactcattat ttactgaggt tagagaatag 20220
acttgcgaat aaacacattc ccgagaaata ctcatgatcc cataattagt cagagggtat 20280
gccaatcaga tctaagaaca cacattccct caaattttaa tgcacatgta atcatagttt 20340
agcacaattc aaaaataatg tagtattaaa gacagaaatt tgtagacttt tttttggcgt 20400
taaaagaaga ctaagtttat acgtacattt tattttaagt ggaaaaccga aattttccat 20460
cgaaatatat gaatttagta tatatatttc tgcaatgtac tattttgcta ttttggcaac 20520
tttcagtgga ctactacttt attacaatgt gtatggatgc atgagtttga gtatacacat 20580
gtctaaatgc atgctttgta aaacgtaacg gaccacaaaa gaggatccat acaaatacat 20640
ctcatagctt cctccattat tttccgacac aaacagagca ttttacaaca attaccaaca 20700
acaacaaaca acaaacaaca ttacaattac atttacaatt accataccat ggaatttgct 20760
caacctctcg ttgctatggc tcaagagcag tacgctgcta tcgatgctgt tgttgctcct 20820
gctatcttct ctgctaccga ctctattgga tggggactca agcctatctc ttctgctact 20880
aaggatctcc ctctcgttga atctcctacc cctcttatcc tttctctcct cgcttacttc 20940
gctatcgttg gttctggact cgtttaccgt aaagtgttcc ctagaaccgt taagggacag 21000
gatcctttcc ttctcaaggc tcttatgctc gctcacaacg ttttccttat cggactcagc 21060
ctttacatgt gcctcaagct cgtttacgag gcttacgtga acaagtactc cttctgggga 21120
aacgcttaca accctgctca aaccgagatg gctaaggtga tctggatctt ctacgtgtcc 21180
aagatctacg agttcatgga caccttcatc atgcttctca agggaaacgt taaccaggtt 21240
tccttcctcc atgtttacca ccacggatct atctctggaa tctggtggat gatcacttat 21300
gctgctccag gtggagatgc ttacttctct gctgctctca actcttgggt tcatgtgtgc 21360
atgtacacct actacttcat ggctgctgtt cttcctaagg acgaaaagac caagagaaag 21420
tacctttggt ggggaagata ccttacccag atgcaaatgt tccagttctt catgaacctt 21480
ctccaggctg tttacctcct ctactcttct tctccttacc ctaagttcat tgctcaactc 21540
ctcgttgttt acatggttac cctcctcatg cttttcggaa acttctacta catgaagcac 21600
cacgcttcta agtgataagg gccgccgcca tgtgacagat cgaaggaaga aagtgtaata 21660
agacgactct cactactcga tcgctagtga ttgtcattgt tatatataat aatgttatct 21720
ttcacaactt atcgtaatgc atgtgaaact ataacacatt aatcctactt gtcatatgat 21780
aacactctcc ccatttaaaa ctcttgtcaa tttaaagata taagattctt taaatgatta 21840
aaaaaaatat attataaatt caatcactcc tactaataaa ttattaatta ttatttattg 21900
attaaaaaaa tacttatact aatttagtct gaatagaata attagattct agcctgcagg 21960
gcggccgcgg atcccatgga gtcaaagatt caaatagagg acctaacaga actcgccgta 22020
aagactggcg aacagttcat acagagtctc ttacgactca atgacaagaa gaaaatcttc 22080
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 22140
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 22200
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 22260
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 22320
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 22380
acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga tgacgcacaa 22440
tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca tttggagaga 22500
acacggggga ctgaattaaa tatgagccct gagaggcgtc ctgttgaaat cagacctgct 22560
actgctgctg atatggctgc tgtttgtgat atcgtgaacc actacatcga gacttctacc 22620
gttaacttca gaactgagcc tcaaactcct caagagtgga tcgatgatct tgagagactc 22680
caagatagat acccttggct tgttgctgag gttgagggtg ttgttgctgg aatcgcttac 22740
gctggacctt ggaaggctag aaacgcttac gattggactg ttgagtctac cgtttacgtt 22800
tcacacagac atcagagact tggacttgga tctacccttt acactcacct tctcaagtct 22860
atggaagctc agggattcaa gtctgttgtt gctgttatcg gactccctaa cgatccttct 22920
gttagacttc atgaggctct tggatacact gctagaggaa ctcttagagc tgctggatac 22980
aagcacggtg gatggcatga tgttggattc tggcaaagag atttcgagct tcctgctcct 23040
cctagacctg ttagaccagt tactcagatc tgaatttgcg tgatcgttca aacatttggc 23100
aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc 23160
tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 23220
gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 23280
agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatcactagt 23340
gatgtacggt taaaaccacc ccagtacatt aaaaacgtcc gcaatgtgtt attaagttgt 23400
ctaagcgtca atttgtttac accacaatat atcctgccac cagccagcca acagctcccc 23460
gaccggcagc tcggcacaaa atcaccactc gatacaggca gcccatcagt cc 23512
&lt;210&gt; 3
&lt;211&gt; 25787
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pGA7- mod_C nucleotide sequence
&lt;400&gt; 3
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgccccgatc tagtaacata gatgacaccg cgcgcgataa 240
tttatcctag tttgcgcgct atattttgtt ttctatcgcg tattaaatgt ataattgcgg 300
gactctaatc ataaaaaccc atctcataaa taacgtcatg cattacatgt taattattac 360
gtgcttaacg taattcaaca gaaattatat gataatcatc gcaagaccgg caacaggatt 420
caatcttaag aaactttatt gccaaatgtt tgaacgatct gcccggaagc ggccaactcg 480
aaaatttaat taatcatcag tgagccttct cagcctttcc gttaacgtag tagtgctgtc 540
caactttgtc gaggttgctg aaagtagcct tccaagcacc gtagtaagag agcaccttgt 600
agttgagtcc ccacttctta gcgaaaggga cgaatcttct tgacacctca ggctgtctga 660
attgaggcat atcagggaag agatggtgga taacctggca gttaaggtat cccataagcc 720
agttaacgta tccacgagaa ggatcgatgt caacggtgtg atcaacagcg tagttaaccc 780
agctaaggtg cttgtcagat ggaacaacag ggaggtgagt gtgagaagta gagaagtgag 840
cgaagaggta catgtaagcg atccagtttc cgaaagtgaa ccaccagtaa gcaacaggcc 900
aagagtatcc ggtagcaagc ttgataacag cggttctaac aacgtgagaa acgagcatcc 960
aagaagcttc ctcgtagttc ttcttcctga gcacctgtct aggatggaga acgtagatcc 1020
agaaagcctg aacgagaagt ccagaagtaa caggaacgaa ggtccaagct tgaagtctag 1080
cccaagctct agagaatccc ctaggtctat tatcctccac agcggtgttg aagaaagcca 1140
cagcaggagt ggtatcaaga tccatgtcgt gtctaacttt ctgaggggta gcatggtgct 1200
tgttatgcat ctggttccac atctctccgc tggtagaaag tccgaatccg caagtcatag 1260
cctgaagtct cttatccacg tacacagatc cggtaagaga gttgtgtcca ccctcatgtt 1320
gaacccatcc acatctagct ccgaagaaag caccgtacac aacgctagca atgatagggt 1380
atccagcgta cataagagcg gttccaagag cgaaagtagc aagaagctcc aaaagacggt 1440
aagcaacatg ggtgatagaa ggcttgaaga atccgtccct ctcaagttca gctctccacc 1500
tagcgaaatc ctcaagcata ggagcatcct cagactcaga tctcttgatc tcagcaggtc 1560
tagaaggcaa agctctaagc atcttccaag ccttgaggct acgcatgtga aattctttga 1620
aagcctcagt agcatcagca ccagtgttag caagcatgta gaagatcacg cttccaccag 1680
gatgtttgaa gttggtcacg tcgtactcaa catcctcaac cctaacccat ctagtctcga 1740
aggtagcagc aagttcatga ggctcaaggg tcttaagatc aacaggagcg gtagaagcat 1800
ccttagcatc aagagcctca gcagatgact tagacctggt gagaggagat ctaggagaag 1860
atcttccatc ggtcttagga ggacacatgg cgcgccgatt ttcgagatgg taattgtaaa 1920
tgtaattgta atgttgtttg ttgtttgttg ttgttggtaa ttgttgtaaa attcgagttg 1980
gccgcttccg gggatcctcg tgtatgtttt taatcttgtt tgtatcgatg agttttggtt 2040
tgagtaaaga gtgaagcgga tgagttaatt tataggctat aaaggagatt tgcatggcga 2100
tcacgtgtaa taatgcatgc acgcatgtga ttgtatgtgt gtgctgtgag agagaagctc 2160
ttaggtgttt gaagggagtg acaagtggcg aagaaaaaca attctccgcg gctgcatgct 2220
atgtgtaacg tgtagctaat gttctggcat ggcatcttat gaacgattct ttttaaaaac 2280
aaggtaaaaa cttaacttca taaaattaaa aaaaaaaacg tttactaagt tggtttaaaa 2340
ggggatgaga ggcgccccgc ggaaagcttg ctagccaatt ggggcccaac gttctcgagt 2400
ttttctagaa ggaaactgaa ggcgggaaac gacaatctgc tagtggatct cccagtcacg 2460
acgttgtaaa acgggcgccc cgcggaaagc ttgcggccgc ggtaccgccc gttcgactca 2520
gatcttccaa ggcctcgtct ccgagtccgc tgcttctcgc cgcgccgatc acttctccgc 2580
cgccaacaag gcttgtagtt aataggaatc attcagggat tgtgattccg ggcagtagta 2640
attaataata tagtattagt atagataata tgtttcgttt gggatctttg gaacgttgct 2700
ctgttccttg ttgttcattt taaagctttt gagggatagt tgcagaactg ttcggtgatg 2760
cttcatcctc tcaagaacta gatttgggta aagaaacatc catgcatgga tatggaatgt 2820
tgttcttccg attggagatt attttataaa atttaaaatt catgatttaa aaaaacacat 2880
aaaaaccaca aaattcatga tttattgaca atacgataca aaattagcac caccggctac 2940
tggctcatta cacatttccc cttcccctca ttctcacttt gtggctttat tattattatt 3000
attacatata ttttaccgtt attatttcac gtcacataag cttgttaatt aatcattagt 3060
gagccttctc agcctttccg ttaacgtagt agtgctgtcc caccttatca aggttagaga 3120
aagtagcctt ccaagcaccg tagtaagaga gcaccttgta gttgagtccc cacttcttag 3180
cgaaaggaac gaatcttctg ctaacctcag gctgtctgaa ttgaggcata tcagggaaga 3240
ggtggtggat aacctgacag ttaaggtatc ccataagcca gttcacgtat cctctagaag 3300
gatcgatatc aacggtgtga tcaacagcgt agttaaccca agaaaggtgc ttatcagatg 3360
gaacaacagg gaggtgagta tgagaagtag agaagtgagc gaaaaggtac atgtaagcga 3420
tccagtttcc gaaagtgaac caccagtaag caacaggcca agagtatcca gtagcaagct 3480
tgataacagc ggttctaaca acatgagaaa cgagcatcca agaagcctct tcgtagttct 3540
tcttacggag aacttgtcta gggtggagaa cgtagatcca gaaagcttga acaagaagtc 3600
cagaggtaac aggaacgaaa gtccaagctt gaagtctagc ccaagctcta gagaatcctc 3660
taggtctgtt atcctcaaca gcagtgttga agaaagccac agcaggagtg gtatcaagat 3720
ccatatcgtg tctaaccttt tgaggggtag catggtgctt gttatgcatc tggttccaca 3780
tctcaccaga agtagaaagt ccgaatccac aagtcatagc ctgaagtctc ttgtccacgt 3840
aaacagatcc ggtaagagag ttatgtccac cctcatgttg aacccatcca catctagctc 3900
cgaagaaagc accgtaaaca acagaagcaa tgatagggta tccagcgtac ataagagcag 3960
ttccaagagc gaatgtagca agaagctcga gaagtctgta agccacatgg gtgatagaag 4020
gcttgaagaa tccatctctc tcaagctcag cacgccatct agcgaaatcc tcaagcatag 4080
gagcatcctc agactcagat ctcttgatct cagcaggtct agaaggcaaa gctctaagca 4140
tcttccaagc cttgagagaa cgcatgtgga attctttgaa agcctcagta gcatcagcac 4200
cagtgttagc aagcatgtag aagatcacag atccaccagg gtgcttgaag ttagtcacat 4260
cgtactcaac gtcctcaact ctaacccatc tagtctcgaa agtagcagca agctcatgag 4320
gctcaagagt cttaagatca acaggagcag tagaagcatc cttagcatca agagcctcag 4380
cagaagattt agacctggta agtggagatc taggagaaga tcttccatca gtcttaggag 4440
ggcacatggt atggtaattg taaatgtaat tgtaatgttg tttgttgttt gttgttgttg 4500
gtaattgttg taaaattaat taagtgggta tcttttggat ggataagcaa gtagtgatga 4560
tgttctaggt gaagtgatgg gggtgtttta tagcgggaga tggtgaaatg gatggtcgcc 4620
acataagaaa tggaggggaa gggttcttgc gccattcttc agtttgcatg gatgcatggg 4680
tttcattttg taacacgtaa taaggacaat gaagtgcagg tgtctctcaa gtttcagagg 4740
ggatatgtgg acagaagaag aacggcgatg atattgatgg aaatggccat ctagtgtgaa 4800
tctattcggt tgataatact agtgcatttt ggccgttaat cccttcaatt aactgcacaa 4860
acttcagttg agtattgatt atttgattat aggttctgta aacacaatac caagtttatt 4920
tagaggggag acatacaaat agtttcgata taaataatag agtggttaaa cttagttatt 4980
aaaactatat ataaagtcta aaagttaaat tattttttta attgcaaata tataaagtct 5040
aaaggggtta cattatttct taagagatgt aactctgttg gaatctgact taatccgtct 5100
catcactctg gtttccagtt ctaatctaat gaattgtttt ctgccaaaga atttgaagca 5160
agaagtaaat tgatcaatgc cgtcaaccca caccaaaccg tcaacccact accatcgccg 5220
cggagacccc caaactcaac ctccacccat cggtaagaag cacagggcag cccgcaccac 5280
caccaatttg gcgtgcatga cacctaggga cttggcacgg gaggcggcgc acgtggatgc 5340
aaatgacggg atatcagatg acaggaaacg acgttgagag accatacgat gtagaatatg 5400
agctcaccat caacgagaaa ctaggaaaat cacaaaaaaa acaactctcg taattgtacg 5460
agtggcacag atgggtctgc ctcaacatat ctctaatacg gcgaagcctg cccaacacgt 5520
agttgccgga atccggtgtg gagctcacga ctctgaaaga taggcgcttc ctgtttcgtt 5580
tcgctcaccc actggacgtc cgtcatgtga tggatttcgg tcattggttt gctgacaacc 5640
acattctgaa gctccatgag atgagtcttc acaataggtc ctgctcaata ccgtggagtt 5700
atggttgcaa gtccataact tgccgttcga atattttgcg gagccagtcg gacgggaatt 5760
ggcgagctcg gctgacacct ataaaggcca tgacaagaag aaccaaaagt tcttccctaa 5820
tgctttcatg aggcttcggg tcgttatgga tgtcggaaaa cccctcttga aggaacgaga 5880
cgttattatg catgacggta agactattac ttgtcagtat aagtatgaaa gattacctgt 5940
cttctgcttt gtttgtggat tgattggaca cgttgaaaaa aaatgtgcac ttcgatttca 6000
atactcagag atcgacttcc cttttctcta ggagtattcg atcaaggcat taacatggaa 6060
ggaagctcaa gctctaaagg cttcacaatg gaacctgaaa aatttcaaca agcctaaact 6120
gaaatcgaag tcaaatcacc caaccgggag ctctaaatca gcaaacactc ctcctccaca 6180
gtatccaatc atcgtgcacg atgctccagg tattgcaagc caggtattgc aagctaggag 6240
taggatagag accttaaacg tcgttggtgt gaagagtcat cttcagacct aatggagata 6300
gatgtagacg gcggcacgaa gactctgaaa caccagaaag gctagtccag gataaggatc 6360
tgctatccca actgacctct cgttagtccc aaggcctctc aactagagca ggaggaagga 6420
tggtcacaag actaggataa tgatgtttcc aatatgaacc tgaatgtcca tagctaattt 6480
ttttagtctt gcttctgcac tttttgttta ttatgttctg gtgactatgt tatttaccct 6540
tgtccgtatg cttgagggta ccctagtaga ttggttggtt ggtttccatg taccagaagg 6600
cttaccctat tagttgaaag ttgaaacttt gttccctact caattcctag ttgtgtaaat 6660
gtatgtatat gtaatgtgta taaaacgtag tacttaaatg actaggagtg gttcttgaga 6720
ccgatgagag atgggagcag aactaaagat gatgacataa ttaagaacga atttgaaagg 6780
ctcttaggtt tgaatcctat tcgagaatgt ttttgtcaaa gatagtggcg attttgaacc 6840
aaagaaaaca tttaaaaaat cagtatccgg ttacgttcat gcaaatagaa agtggtctag 6900
gatctgattg taattttaga cttaaagagt ctcttaagat tcaatcctgg ctgtgtacaa 6960
aactacaaat aatatatttt agactatttg gccttaacta aacttccact cattatttac 7020
tgaggttaga gaatagactt gcgaataaac acattcccga gaaatactca tgatcccata 7080
attagtcaga gggtatgcca atcagatcta agaacacaca ttccctcaaa ttttaatgca 7140
catgtaatca tagtttagca caattcaaaa ataatgtagt attaaagaca gaaatttgta 7200
gacttttttt tggcgttaaa agaagactaa gtttatacgt acattttatt ttaagtggaa 7260
aaccgaaatt ttccatcgaa atatatgaat ttagtatata tatttctgca atgtactatt 7320
ttgctatttt ggcaactttc agtggactac tactttatta caatgtgtat ggatgcatga 7380
gtttgagtat acacatgtct aaatgcatgc tttgtaaaac gtaacggacc acaaaagagg 7440
atccatacaa atacatctca tagcttcctc cattattttc cgacacaaac agagcatttt 7500
acaacaatta ccaacaacaa caaacaacaa acaacattac aattacattt acaattacca 7560
taccatggcc tctatcgcta tccctgctgc tcttgctgga actcttggat acgttaccta 7620
caatgtggct aaccctgata tcccagcttc tgagaaagtt cctgcttact tcatgcaggt 7680
tgagtactgg ggacctacta tcggaactat tggatacctc ctcttcatct acttcggaaa 7740
gcgtatcatg cagaacagat ctcaaccttt cggactcaag aacgctatgc tcgtttacaa 7800
cttctaccag accttcttca acagctactg catctacctt ttcgttactt ctcatagggc 7860
tcagggactt aaggtttggg gaaacatccc tgatatgact gctaactctt ggggaatctc 7920
tcaggttatc tggcttcact acaacaacaa gtacgttgag cttctcgaca ccttcttcat 7980
ggtgatgagg aagaagttcg accagctttc tttccttcac atctaccacc acactcttct 8040
catctggtca tggttcgttg ttatgaagct tgagcctgtt ggagattgct acttcggatc 8100
ttctgttaac accttcgtgc acgtgatcat gtactcttac tacggacttg ctgctcttgg 8160
agttaactgt ttctggaaga agtacatcac ccagatccag atgcttcagt tctgtatctg 8220
tgcttctcac tctatctaca ccgcttacgt tcagaatacc gctttctggc ttccttacct 8280
tcaactctgg gttatggtga acatgttcgt tctcttcgcc aacttctacc gtaagaggta 8340
caagtctaag ggtgctaaga agcagtgata aggcgcgcgg cgcgccgggc cgccgccatg 8400
tgacagatcg aaggaagaaa gtgtaataag acgactctca ctactcgatc gctagtgatt 8460
gtcattgtta tatataataa tgttatcttt cacaacttat cgtaatgcat gtgaaactat 8520
aacacattaa tcctacttgt catatgataa cactctcccc atttaaaact cttgtcaatt 8580
taaagatata agattcttta aatgattaaa aaaaatatat tataaattca atcactccta 8640
ctaataaatt attaattatt atttattgat taaaaaaata cttatactaa tttagtctga 8700
atagaataat tagattctag tctcatcccc ttttaaacca acttagtaaa cgtttttttt 8760
tttaatttta tgaagttaag tttttacctt gtttttaaaa agaatcgttc ataagatgcc 8820
atgccagaac attagctaca cgttacacat agcatgcagc cgcggagaat tgtttttctt 8880
cgccacttgt cactcccttc aaacacctaa gagcttctct ctcacagcac acacatacaa 8940
tcacatgcgt gcatgcatta ttacacgtga tcgccatgca aatctccttt atagcctata 9000
aattaactca tccgcttcac tctttactca aaccaaaact catcgataca aacaagatta 9060
aaaacataca cgaggatctt ttacaacaat taccaacaac aacaaacaac aaacaacatt 9120
acaattacat ttacaattac cataccatgc ctccaaggga ctcttactct tatgctgctc 9180
ctccttctgc tcaacttcac gaagttgata ctcctcaaga gcacgacaag aaagagcttg 9240
ttatcggaga tagggcttac gatgttacca acttcgttaa gagacaccct ggtggaaaga 9300
tcattgctta ccaagttgga actgatgcta ccgatgctta caagcagttc catgttagat 9360
ctgctaaggc tgacaagatg cttaagtctc ttccttctcg tcctgttcac aagggatact 9420
ctccaagaag ggctgatctt atcgctgatt tccaagagtt caccaagcaa cttgaggctg 9480
agggaatgtt cgagccttct cttcctcatg ttgcttacag acttgctgag gttatcgcta 9540
tgcatgttgc tggtgctgct cttatctggc atggatacac tttcgctgga atcgctatgc 9600
ttggagttgt tcagggaaga tgtggatggc ttatgcatga gggtggacat tactctctca 9660
ctggaaacat tgctttcgac agagctatcc aagttgcttg ttacggactt ggatgtggaa 9720
tgtctggtgc ttggtggcgt aaccagcata acaagcacca tgctactcct caaaagcttc 9780
agcacgatgt tgatcttgat acccttcctc tcgttgcttt ccatgagaga atcgctgcta 9840
aggttaagtc tcctgctatg aaggcttggc tttctatgca agctaagctt ttcgctcctg 9900
ttaccactct tcttgttgct cttggatggc agctttacct tcatcctaga cacatgctca 9960
ggactaagca ctacgatgag cttgctatgc tcggaatcag atacggactt gttggatacc 10020
ttgctgctaa ctacggtgct ggatacgttc tcgcttgtta ccttctttac gttcagcttg 10080
gagctatgta catcttctgc aacttcgctg tttctcatac tcacctccct gttgttgagc 10140
ctaacgagca tgctacttgg gttgagtacg ctgctaacca cactactaac tgttctccat 10200
cttggtggtg tgattggtgg atgtcttacc ttaactacca gatcgagcac cacctttacc 10260
cttctatgcc tcaattcaga caccctaaga tcgctcctag agttaagcag cttttcgaga 10320
agcacggact tcactacgat gttagaggat acttcgaggc tatggctgat actttcgcta 10380
accttgataa cgttgcccat gctcctgaga agaaaatgca gtaatgagat cgttcaaaca 10440
tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 10500
aatttctgtt gaattacgtt aagcacgtaa taattaacat gtaatgcatg acgttattta 10560
tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 10620
aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatc 10680
ggtcgattaa aaatcccaat tatatttggt ctaatttagt ttggtattga gtaaaacaaa 10740
ttcgaaccaa accaaaatat aaatatatag tttttatata tatgccttta agacttttta 10800
tagaattttc tttaaaaaat atctagaaat atttgcgact cttctggcat gtaatatttc 10860
gttaaatatg aagtgctcca tttttattaa ctttaaataa ttggttgtac gatcactttc 10920
ttatcaagtg ttactaaaat gcgtcaatct ctttgttctt ccatattcat atgtcaaaat 10980
ctatcaaaat tcttatatat ctttttcgaa tttgaagtga aatttcgata atttaaaatt 11040
aaatagaaca tatcattatt taggtatcat attgattttt atacttaatt actaaatttg 11100
gttaactttg aaagtgtaca tcaacgaaaa attagtcaaa cgactaaaat aaataaatat 11160
catgtgttat taagaaaatt ctcctataag aatattttaa tagatcatat gtttgtaaaa 11220
aaaattaatt tttactaaca catatattta cttatcaaaa atttgacaaa gtaagattaa 11280
aataatattc atctaacaaa aaaaaaacca gaaaatgctg aaaacccggc aaaaccgaac 11340
caatccaaac cgatatagtt ggtttggttt gattttgata taaaccgaac caactcggtc 11400
catttgcacc cctaatcata atagctttaa tatttcaaga tattattaag ttaacgttgt 11460
caatatcctg gaaattttgc aaaatgaatc aagcctatat ggctgtaata tgaatttaaa 11520
agcagctcga tgtggtggta atatgtaatt tacttgattc taaaaaaata tcccaagtat 11580
taataatttc tgctaggaag aaggttagct acgatttaca gcaaagccag aatacaaaga 11640
accataaagt gattgaagct cgaaatatac gaaggaacaa atatttttaa aaaaatacgc 11700
aatgacttgg aacaaaagaa agtgatatat tttttgttct taaacaagca tcccctctaa 11760
agaatggcag ttttcctttg catgtaacta ttatgctccc ttcgttacaa aaattttgga 11820
ctactattgg gaacttcttc tgaaaatagt gatagaaccc acacgagcat gtgctttcca 11880
tttaatttta aaaaccaaga aacatacata cataacattc catcagcctc tctctctttt 11940
tattacggtt aatgacttaa aacacatctt attatcccat ccttaacacc tagcagtgtc 12000
tttatacgat ctcatcgatc accacttcaa aaccatgcag actgctgctg cccctggagc 12060
tggcatcggc taggctgggt gccgcactgt cccggaaggt ccctagcgac ttgtttagat 12120
tgatgggacc acctctcaac ttcctgctgc tgtccctgct gctggatgtc ctgcctcatc 12180
tggccgattg cacgctccag tcccctgcat gtgcactcgc tcctcaattg cttaagatca 12240
tcgcagcagc tatcgaagtg ctggctctgt tgccctcctc cacggccttg gttgtagtag 12300
tagctgccgc cgcccttctg gactttttcc cacaggaacc gccgaataat tcgatagaac 12360
cacacgagca tgtgctttca tttattttaa aaaccaagaa acatacataa catttcatca 12420
gcctctctct ctctctctct ctctctctct ctctctctct ctctctctct ctctttatta 12480
cagctgttac actaacttaa aacacattca tctcattatt attattatta tccatcctta 12540
acacctagca gtgtctttgt acgatctcat aatcgatcac cccttcatca ggtatcctta 12600
ggcttcactc caacgttgtt gcagttacgg aacatgtaca caccatcatg gttctcaacg 12660
aactggcaag atctccaagt tttccaaagg ctaacccaca tgttctcatc ggtgtgtctg 12720
tagtgctctc ccataacttt cttgatgcac tcggtagctt ctctagcatg gtagaatggg 12780
atccttgaaa cgtagtgatg gagcacatga gtctcgatga tgtcatggaa gatgattccg 12840
aggattccga actctctatc gatagtagca gcagcaccct tagcgaaagt ccactcttga 12900
gcatcgtaat gaggcataga agaatcggtg tgctgaagga aggtaacgaa aacaagccag 12960
tggttaacaa ggatccaagg acagaaccat gtgatgaaag taggccagaa tccgaaaacc 13020
ttgtaagcgg tgtaaacaga agtgagggta gcaaggattc caagatcaga aagaacgatg 13080
taccagtagt ccttcttatc gaaaacaggg ctagaaggcc agtagtgaga cttgaagaac 13140
ttagaaacac cagggtaagg ttgtccagta gcgttagtag caaggtaaag agaaagtcct 13200
ccaagctgtt ggaacaagag agcgaaaaca gagtagatag gagtttcctc agcgatatcg 13260
tgaaggctgg taacttggtg cttctctttg aattcctcgg cggtgtaagg aacgaaaacc 13320
atatctctgg tcatgtgtcc agtagcctta tggtgcttag catgagagaa cttccagctg 13380
aagtaaggaa ccataacaag agagtggaga acccatccaa cggtatcgtt aacccatccg 13440
tagttagaga aagcagaatg tccacactca tgtccaagga tccagattcc gaatccgaaa 13500
caagagatag agaacacgta agcagaccaa gcagcgaatc taaggaattc gttagggaga 13560
agagggatgt aggtaagtcc aacgtaagcg atagcagaga tagccacgat atctctcacc 13620
acgtaagaca tagacttcac gagagatctc tcgtaacagt gcttagggat agcgtcaagg 13680
atatccttga tggtgtaatc tggcaccttg aaaacgtttc cgaaggtatc gatagcggtc 13740
ttttgctgct tgaaagatgc aacgtttcca gaacgcctaa cggtcttagt agatccctca 13800
aggatctcag atccagacac ggtaacctta gacatggtat ggtaattgta aatgtaattg 13860
taatgttgtt tgttgtttgt tgttgttggt aattgttgta aaatttttgg tggtgattgg 13920
ttctttaagg tgtgagagtg agttgtgagt tgtgtggtgg gtttggtgag attggggatg 13980
gtgggtttat atagtggaga ctgaggaatg gggtcgtgag tgttaacttt gcatgggcta 14040
cacgtgggtt cttttgggct tacacgtagt attattcatg caaatgcagc caatacatat 14100
acggtatttt aataatgtgt gggaatacaa tatgccgagt attttactaa ttttggcaat 14160
gacaagtgta catttggatt atcttacttg gcctctcttg ctttaatttg gattattttt 14220
attctcttac cttggccgtt catattcaca tccctaaagg caagacagaa ttgaatggtg 14280
gccaaaaatt aaaacgatgg atatgaccta catagtgtag gatcaattaa cgtcgaagga 14340
aaatactgat tctctcaagc atacggacaa gggtaaataa catagtcacc agaacataat 14400
aaacaaaaag tgcagaagca agactaaaaa aattagctat ggacattcag gttcatattg 14460
gaaacatcat tatcctagtc ttgtgaccat ccttcctcct gctctagttg agaggccttg 14520
ggactaacga gaggtcagtt gggatagcag atccttatcc tggactagcc tttctggtgt 14580
ttcagagtct tcgtgccgcc gtctacatct atctccatta ggtctgaaga tgactcttca 14640
caccaacgac gtttaaggtc tctatcctac tcctagcttg caatacctgg cttgcaatac 14700
ctggagcatc gtgcacgatg attggatact gtggaggagg agtgtttgct gatttagagc 14760
tcccggttgg gtgatttgac ttcgatttca gtttaggctt gttgaaattt ttcaggttcc 14820
attgtgaagc ctttagagct tgagcttcct tccatgttaa tgccttgatc gaatactcct 14880
agagaaaagg gaagtcgatc tctgagtatt gaaatcgaag tgcacatttt ttttcaacgt 14940
gtccaatcaa tccacaaaca aagcagaaga caggtaatct ttcatactta tactgacaag 15000
taatagtctt accgtcatgc ataataacgt ctcgttcctt caagaggggt tttccgacat 15060
ccataacgac ccgaagcctc atgaaagcat tagggaagaa cttttggttc ttcttgtcat 15120
ggcctttata ggtgtcagcc gagctcgcca attcccgtcc gactggctcc gcaaaatatt 15180
cgaacggcaa gttatggact tgcaaccata actccacggt attgagcagg acctattgtg 15240
aagactcatc tcatggagct tcagaatgtg gttgtcagca aaccaatgac cgaaatccat 15300
cacatgacgg acgtccagtg ggtgagcgaa acgaaacagg aagcgcctat ctttcagagt 15360
cgtgagctcc acaccggatt ccggcaacta cgtgttgggc aggcttcgcc gtattagaga 15420
tatgttgagg cagacccatc tgtgccactc gtacaattac gagagttgtt ttttttgtga 15480
ttttcctagt ttctcgttga tggtgagctc atattctaca tcgtatggtc tctcaacgtc 15540
gtttcctgtc atctgatatc ccgtcatttg catccacgtg cgccgcctcc cgtgccaagt 15600
ccctaggtgt catgcacgcc aaattggtgg tggtgcgggc tgccctgtgc ttcttaccga 15660
tgggtggagg ttgagtttgg gggtctccgc ggcgatggta gtgggttgac ggtttggtgt 15720
gggttgacgg cattgatcaa tttacttctt gcttcaaatt ctttggcaga aaacaattca 15780
ttagattaga actggaaacc agagtgatga gacggattaa gtcagattcc aacagagtta 15840
catctcttaa gaaataatgt aaccccttta gactttatat atttgcaatt aaaaaaataa 15900
tttaactttt agactttata tatagtttta ataactaagt ttaaccactc tattatttat 15960
atcgaaacta tttgtatgtc tcccctctaa ataaacttgg tattgtgttt acagaaccta 16020
taatcaaata atcaatactc aactgaagtt tgtgcagtta attgaaggga ttaacggcca 16080
aaatgcacta gtattatcaa ccgaatagat tcacactaga tggccatttc catcaatatc 16140
atcgccgttc ttcttctgtc cacatatccc ctctgaaact tgagagacac ctgcacttca 16200
ttgtccttat tacgtgttac aaaatgaaac ccatgcatcc atgcaaactg aagaatggcg 16260
caagaaccct tcccctccat ttcttatgtg gcgaccatcc atttcaccat ctcccgctat 16320
aaaacacccc catcacttca cctagaacat catcactact tgcttatcca tccaaaagat 16380
acccactttt acaacaatta ccaacaacaa caaacaacaa acaacattac aattacattt 16440
acaattacca taccatgcca cctagcgctg ctaagcaaat gggagcttct actggtgttc 16500
atgctggtgt tactgactct tctgctttca ccagaaagga tgttgctgat agacctgatc 16560
tcaccatcgt tggagattct gtttacgatg ctaaggcttt cagatctgag catcctggtg 16620
gtgctcattt cgtttctttg ttcggaggaa gagatgctac tgaggctttc atggaatacc 16680
atagaagggc ttggcctaag tctagaatgt ctagattcca cgttggatct cttgcttcta 16740
ctgaggaacc tgttgctgct gatgagggat accttcaact ttgtgctagg atcgctaaga 16800
tggtgccttc tgtttcttct ggattcgctc ctgcttctta ctgggttaag gctggactta 16860
tccttggatc tgctatcgct cttgaggctt acatgcttta cgctggaaag agacttctcc 16920
cttctatcgt tcttggatgg cttttcgctc ttatcggtct taacatccag catgatgcta 16980
accatggtgc tttgtctaag tctgcttctg ttaaccttgc tcttggactt tgtcaggatt 17040
ggatcggagg atctatgatc ctttggcttc aagagcatgt tgttatgcac cacctccaca 17100
ctaacgatgt tgataaggat cctgatcaaa aggctcacgg tgctcttaga ctcaagccta 17160
ctgatgcttg gtcacctatg cattggcttc agcatcttta ccttttgcct ggtgagacta 17220
tgtacgcttt caagcttttg ttcctcgaca tctctgagct tgttatgtgg cgttgggagg 17280
gtgagcctat ctctaagctt gctggatacc tctttatgcc ttctttgctt ctcaagctta 17340
ccttctgggc tagattcgtt gctttgcctc tttaccttgc tccttctgtt catactgctg 17400
tgtgtatcgc tgctactgtt atgactggat ctttctacct cgctttcttc ttcttcatct 17460
cccacaactt cgagggtgtt gcttctgttg gacctgatgg atctatcact tctatgacta 17520
gaggtgctag cttccttaag agacaagctg agacttcttc taacgttgga ggacctcttc 17580
ttgctactct taacggtgga ctcaactacc aaattgagca tcacttgttc cctagagttc 17640
accatggatt ctaccctaga cttgctcctc ttgttaaggc tgagcttgag gctagaggaa 17700
tcgagtacaa gcactaccct actatctggt ctaaccttgc ttctaccctc agacatatgt 17760
acgctcttgg aagaaggcct agatctaagg ctgagtaatg acaagcttat gtgacgtgaa 17820
ataataacgg taaaatatat gtaataataa taataataaa gccacaaagt gagaatgagg 17880
ggaaggggaa atgtgtaatg agccagtagc cggtggtgct aattttgtat cgtattgtca 17940
ataaatcatg aattttgtgg tttttatgtg tttttttaaa tcatgaattt taaattttat 18000
aaaataatct ccaatcggaa gaacaacatt ccatatccat gcatggatgt ttctttaccc 18060
aaatctagtt cttgagagga tgaagcatca ccgaacagtt ctgcaactat ccctcaaaag 18120
ctttaaaatg aacaacaagg aacagagcaa cgttccaaag atcccaaacg aaacatatta 18180
tctatactaa tactatatta ttaattacta ctgcccggaa tcacaatccc tgaatgattc 18240
ctattaacta caagccttgt tggcggcgga gaagtgatcg gcgcggcgag aagcagcgga 18300
ctcggagacg aggccttgga agatctgagt cgaacgggca gaatcagtat tttccttcga 18360
cgttaattga tcctacacta tgtaggtcat atccatcgtt ttaatttttg gccaccattc 18420
aattctgtct tgcctttagg gatgtgaata tgaacggcca aggtaagaga ataaaaataa 18480
tccaaattaa agcaagagag gccaagtaag ataatccaaa tgtacacttg tcattgccaa 18540
aattagtaaa atactcggca tattgtattc ccacacatta ttaaaatacc gtatatgtat 18600
tggctgcatt tgcatgaata atactacgtg taagcccaaa agaacccacg tgtagcccat 18660
gcaaagttaa cactcacgac cccattcctc agtctccact atataaaccc accatcccca 18720
atctcaccaa acccaccaca caactcacaa ctcactctca caccttaaag aaccaatcac 18780
caccaaaaat tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattaca 18840
tttacaatta ccataccatg agcgctgtta ccgttactgg atctgatcct aagaacagag 18900
gatcttctag caacaccgag caagaggttc caaaagttgc tatcgatacc aacggaaacg 18960
tgttctctgt tcctgatttc accatcaagg acatccttgg agctatccct catgagtgtt 19020
acgagagaag attggctacc tctctctact acgtgttcag agatatcttc tgcatgctta 19080
ccaccggata ccttacccat aagatccttt accctctcct catctcttac acctctaaca 19140
gcatcatcaa gttcactttc tgggcccttt acacttacgt tcaaggactt ttcggaaccg 19200
gaatctgggt tctcgctcat gagtgtggac atcaagcttt ctctgattac ggaatcgtga 19260
acgatttcgt tggatggacc cttcactctt accttatggt tccttacttc agctggaagt 19320
actctcatgg aaagcaccat aaggctactg gacacatgac cagagatatg gttttcgttc 19380
ctgccaccaa agaggaattc aagaagtcta ggaacttctt cggtaacctc gctgagtact 19440
ctgaggattc tccacttaga accctttacg agcttcttgt tcaacaactt ggaggatgga 19500
tcgcttacct cttcgttaac gttacaggac aaccttaccc tgatgttcct tcttggaaat 19560
ggaaccactt ctggcttacc tctccacttt tcgagcaaag agatgctctc tacatcttcc 19620
tttctgatct tggaatcctc acccagggaa tcgttcttac tctttggtac aagaaattcg 19680
gaggatggtc ccttttcatc aactggttcg ttccttacat ctgggttaac cactggctcg 19740
ttttcatcac attccttcag cacactgatc ctactatgcc tcattacaac gctgaggaat 19800
ggactttcgc taagggtgct gctgctacta tcgatagaaa gttcggattc atcggacctc 19860
acatcttcca tgatatcatc gagactcatg tgcttcacca ctactgttct aggatcccat 19920
tctacaacgc tagacctgct tctgaggcta tcaagaaagt tatgggaaag cactacaggt 19980
ctagcgacga gaacatgtgg aagtcacttt ggaagtcttt caggtcttgc caatacgttg 20040
acggtgataa cggtgttctc atgttccgta acatcaacaa ctgcggagtt ggagctgctg 20100
agaagtaatg aaggggtgat cgattatgag atcgtacaaa gacactgcta ggtgttaagg 20160
atggataata ataataataa tgagatgaat gtgttttaag ttagtgtaac agctgtaata 20220
aagagagaga gagagagaga gagagagaga gagagagaga gagagagaga gaggctgatg 20280
aaatgttatg tatgtttctt ggtttttaaa ataaatgaaa gcacatgctc gtgtggttct 20340
atcgaattat tcggcggttc ctgtgggaaa aagtccagaa gggccgccgc agctactact 20400
acaaccaagg ccgtggagga gggcaacaga gccagcactt cgatagctgc tgcgatgatc 20460
ttaagcaatt gaggagcgag tgcacatgca ggggactgga gcgtgcaatc ggccagatga 20520
ggcaggacat ccagcagcag ggacagcagc aggaagttga gaggtggtcc catcaatcta 20580
aacaagtcgc tagggacctt ccgggacagt gcggcaccca gcctagccga tgccagctcc 20640
aggggcagca gcagtctgca tggttttgaa gtggtgatcg atgagatcgt ataaagacac 20700
tgctaggtgt taaggatggg ataataagat gtgttttaag tcattaaccg taataaaaag 20760
agagagaggc tgatggaatg ttatgtatgt atgtttcttg gtttttaaaa ttaaatggaa 20820
agcacatgct cgtgtgggtt ctatctcgat taaaaatccc aattatattt ggtctaattt 20880
agtttggtat tgagtaaaac aaattcgaac caaaccaaaa tataaatata tagtttttat 20940
atatatgcct ttaagacttt ttatagaatt ttctttaaaa aatatctaga aatatttgcg 21000
actcttctgg catgtaatat ttcgttaaat atgaagtgct ccatttttat taactttaaa 21060
taattggttg tacgatcact ttcttatcaa gtgttactaa aatgcgtcaa tctctttgtt 21120
cttccatatt catatgtcaa aatctatcaa aattcttata tatctttttc gaatttgaag 21180
tgaaatttcg ataatttaaa attaaataga acatatcatt atttaggtat catattgatt 21240
tttatactta attactaaat ttggttaact ttgaaagtgt acatcaacga aaaattagtc 21300
aaacgactaa aataaataaa tatcatgtgt tattaagaaa attctcctat aagaatattt 21360
taatagatca tatgtttgta aaaaaaatta atttttacta acacatatat ttacttatca 21420
aaaatttgac aaagtaagat taaaataata ttcatctaac aaaaaaaaaa ccagaaaatg 21480
ctgaaaaccc ggcaaaaccg aaccaatcca aaccgatata gttggtttgg tttgattttg 21540
atataaaccg aaccaactcg gtccatttgc acccctaatc ataatagctt taatatttca 21600
agatattatt aagttaacgt tgtcaatatc ctggaaattt tgcaaaatga atcaagccta 21660
tatggctgta atatgaattt aaaagcagct cgatgtggtg gtaatatgta atttacttga 21720
ttctaaaaaa atatcccaag tattaataat ttctgctagg aagaaggtta gctacgattt 21780
acagcaaagc cagaatacaa agaaccataa agtgattgaa gctcgaaata tacgaaggaa 21840
caaatatttt taaaaaaata cgcaatgact tggaacaaaa gaaagtgata tattttttgt 21900
tcttaaacaa gcatcccctc taaagaatgg cagttttcct ttgcatgtaa ctattatgct 21960
cccttcgtta caaaaatttt ggactactat tgggaacttc ttctgaaaat agtcctgcag 22020
gctagtagat tggttggttg gtttccatgt accagaaggc ttaccctatt agttgaaagt 22080
tgaaactttg ttccctactc aattcctagt tgtgtaaatg tatgtatatg taatgtgtat 22140
aaaacgtagt acttaaatga ctaggagtgg ttcttgagac cgatgagaga tgggagcaga 22200
actaaagatg atgacataat taagaacgaa tttgaaaggc tcttaggttt gaatcctatt 22260
cgagaatgtt tttgtcaaag atagtggcga ttttgaacca aagaaaacat ttaaaaaatc 22320
agtatccggt tacgttcatg caaatagaaa gtggtctagg atctgattgt aattttagac 22380
ttaaagagtc tcttaagatt caatcctggc tgtgtacaaa actacaaata atatatttta 22440
gactatttgg ccttaactaa acttccactc attatttact gaggttagag aatagacttg 22500
cgaataaaca cattcccgag aaatactcat gatcccataa ttagtcagag ggtatgccaa 22560
tcagatctaa gaacacacat tccctcaaat tttaatgcac atgtaatcat agtttagcac 22620
aattcaaaaa taatgtagta ttaaagacag aaatttgtag actttttttt ggcgttaaaa 22680
gaagactaag tttatacgta cattttattt taagtggaaa accgaaattt tccatcgaaa 22740
tatatgaatt tagtatatat atttctgcaa tgtactattt tgctattttg gcaactttca 22800
gtggactact actttattac aatgtgtatg gatgcatgag tttgagtata cacatgtcta 22860
aatgcatgct ttgtaaaacg taacggacca caaaagagga tccatacaaa tacatctcat 22920
agcttcctcc attattttcc gacacaaaca gagcatttta caacaattac caacaacaac 22980
aaacaacaaa caacattaca attacattta caattaccat accatggaat ttgctcaacc 23040
tctcgttgct atggctcaag agcagtacgc tgctatcgat gctgttgttg ctcctgctat 23100
cttctctgct accgactcta ttggatgggg actcaagcct atctcttctg ctactaagga 23160
tctccctctc gttgaatctc ctacccctct tatcctttct ctcctcgctt acttcgctat 23220
cgttggttct ggactcgttt accgtaaagt gttccctaga accgttaagg gacaggatcc 23280
tttccttctc aaggctctta tgctcgctca caacgttttc cttatcggac tcagccttta 23340
catgtgcctc aagctcgttt acgaggctta cgtgaacaag tactccttct ggggaaacgc 23400
ttacaaccct gctcaaaccg agatggctaa ggtgatctgg atcttctacg tgtccaagat 23460
ctacgagttc atggacacct tcatcatgct tctcaaggga aacgttaacc aggtttcctt 23520
cctccatgtt taccaccacg gatctatctc tggaatctgg tggatgatca cttatgctgc 23580
tccaggtgga gatgcttact tctctgctgc tctcaactct tgggttcatg tgtgcatgta 23640
cacctactac ttcatggctg ctgttcttcc taaggacgaa aagaccaaga gaaagtacct 23700
ttggtgggga agatacctta cccagatgca aatgttccag ttcttcatga accttctcca 23760
ggctgtttac ctcctctact cttcttctcc ttaccctaag ttcattgctc aactcctcgt 23820
tgtttacatg gttaccctcc tcatgctttt cggaaacttc tactacatga agcaccacgc 23880
ttctaagtga taagggccgc cgccatgtga cagatcgaag gaagaaagtg taataagacg 23940
actctcacta ctcgatcgct agtgattgtc attgttatat ataataatgt tatctttcac 24000
aacttatcgt aatgcatgtg aaactataac acattaatcc tacttgtcat atgataacac 24060
tctccccatt taaaactctt gtcaatttaa agatataaga ttctttaaat gattaaaaaa 24120
aatatattat aaattcaatc actcctacta ataaattatt aattattatt tattgattaa 24180
aaaaatactt atactaattt agtctgaata gaataattag attctagcct gcagggcggc 24240
cgcggatccc atggagtcaa agattcaaat agaggaccta acagaactcg ccgtaaagac 24300
tggcgaacag ttcatacaga gtctcttacg actcaatgac aagaagaaaa tcttcgtcaa 24360
catggtggag cacgacacac ttgtctactc caaaaatatc aaagatacag tctcagaaga 24420
ccaaagggca attgagactt ttcaacaaag ggtaatatcc ggaaacctcc tcggattcca 24480
ttgcccagct atctgtcact ttattgtgaa gatagtggaa aaggaaggtg gctcctacaa 24540
atgccatcat tgcgataaag gaaaggccat cgttgaagat gcctctgccg acagtggtcc 24600
caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc caaccacgtc 24660
ttcaaagcaa gtggattgat gtgatatctc cactgacgta agggatgacg cacaatccca 24720
ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg agagaacacg 24780
ggggactgaa ttaaatatga gccctgagag gcgtcctgtt gaaatcagac ctgctactgc 24840
tgctgatatg gctgctgttt gtgatatcgt gaaccactac atcgagactt ctaccgttaa 24900
cttcagaact gagcctcaaa ctcctcaaga gtggatcgat gatcttgaga gactccaaga 24960
tagataccct tggcttgttg ctgaggttga gggtgttgtt gctggaatcg cttacgctgg 25020
accttggaag gctagaaacg cttacgattg gactgttgag tctaccgttt acgtttcaca 25080
cagacatcag agacttggac ttggatctac cctttacact caccttctca agtctatgga 25140
agctcaggga ttcaagtctg ttgttgctgt tatcggactc cctaacgatc cttctgttag 25200
acttcatgag gctcttggat acactgctag aggaactctt agagctgctg gatacaagca 25260
cggtggatgg catgatgttg gattctggca aagagatttc gagcttcctg ctcctcctag 25320
acctgttaga ccagttactc agatctgaat ttgcgtgatc gttcaaacat ttggcaataa 25380
agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 25440
aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 25500
tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 25560
gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatca ctagtgatgt 25620
acggttaaaa ccaccccagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag 25680
cgtcaatttg tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg 25740
gcagctcggc acaaaatcac cactcgatac aggcagccca tcagtcc 25787
&lt;210&gt; 4
&lt;211&gt; 22824
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pGA7- mod_D nucleotide sequence
&lt;400&gt; 4
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgcctcgatt aaaaatccca attatatttg gtctaattta 240
gtttggtatt gagtaaaaca aattcgaacc aaaccaaaat ataaatatat agtttttata 300
tatatgcctt taagactttt tatagaattt tctttaaaaa atatctagaa atatttgcga 360
ctcttctggc atgtaatatt tcgttaaata tgaagtgctc catttttatt aactttaaat 420
aattggttgt acgatcactt tcttatcaag tgttactaaa atgcgtcaat ctctttgttc 480
ttccatattc atatgtcaaa atctatcaaa attcttatat atctttttcg aatttgaagt 540
gaaatttcga taatttaaaa ttaaatagaa catatcatta tttaggtatc atattgattt 600
ttatacttaa ttactaaatt tggttaactt tgaaagtgta catcaacgaa aaattagtca 660
aacgactaaa ataaataaat atcatgtgtt attaagaaaa ttctcctata agaatatttt 720
aatagatcat atgtttgtaa aaaaaattaa tttttactaa cacatatatt tacttatcaa 780
aaatttgaca aagtaagatt aaaataatat tcatctaaca aaaaaaaaac cagaaaatgc 840
tgaaaacccg gcaaaaccga accaatccaa accgatatag ttggtttggt ttgattttga 900
tataaaccga accaactcgg tccatttgca cccctaatca taatagcttt aatatttcaa 960
gatattatta agttaacgtt gtcaatatcc tggaaatttt gcaaaatgaa tcaagcctat 1020
atggctgtaa tatgaattta aaagcagctc gatgtggtgg taatatgtaa tttacttgat 1080
tctaaaaaaa tatcccaagt attaataatt tctgctagga agaaggttag ctacgattta 1140
cagcaaagcc agaatacaaa gaaccataaa gtgattgaag ctcgaaatat acgaaggaac 1200
aaatattttt aaaaaaatac gcaatgactt ggaacaaaag aaagtgatat attttttgtt 1260
cttaaacaag catcccctct aaagaatggc agttttcctt tgcatgtaac tattatgctc 1320
ccttcgttac aaaaattttg gactactatt gggaacttct tctgaaaata gtggcgcccc 1380
gcggaaagct tgctagccaa ttggggccca acgttctcga gtttttctag aaggaaactg 1440
aaggcgggaa acgacaatct gctagtggat ctcccagtca cgacgttgta aaacgggcgc 1500
cccgcggaaa gcttgcggcc gcccgatcta gtaacataga tgacaccgcg cgcgataatt 1560
tatcctagtt tgcgcgctat attttgtttt ctatcgcgta ttaaatgtat aattgcggga 1620
ctctaatcat aaaaacccat ctcataaata acgtcatgca ttacatgtta attattacgt 1680
gcttaacgta attcaacaga aattatatga taatcatcgc aagaccggca acaggattca 1740
atcttaagaa actttattgc caaatgtttg aacgatcggc gcgcctcatt agtgagcctt 1800
ctcagccttt ccgttaacgt agtagtgctg tcccacctta tcaaggttag agaaagtagc 1860
cttccaagca ccgtagtaag agagcacctt gtagttgagt ccccacttct tagcgaaagg 1920
aacgaatctt ctgctaacct caggctgtct gaattgaggc atatcaggga agaggtggtg 1980
gataacctga cagttaaggt atcccataag ccagttcacg tatcctctag aaggatcgat 2040
atcaacggtg tgatcaacag cgtagttaac ccaagaaagg tgcttatcag atggaacaac 2100
agggaggtga gtatgagaag tagagaagtg agcgaaaagg tacatgtaag cgatccagtt 2160
tccgaaagtg aaccaccagt aagcaacagg ccaagagtat ccagtagcaa gcttgataac 2220
agcggttcta acaacatgag aaacgagcat ccaagaagcc tcttcgtagt tcttcttacg 2280
gagaacttgt ctagggtgga gaacgtagat ccagaaagct tgaacaagaa gtccagaggt 2340
aacaggaacg aaagtccaag cttgaagtct agcccaagct ctagagaatc ctctaggtct 2400
gttatcctca acagcagtgt tgaagaaagc cacagcagga gtggtatcaa gatccatatc 2460
gtgtctaacc ttttgagggg tagcatggtg cttgttatgc atctggttcc acatctcacc 2520
agaagtagaa agtccgaatc cacaagtcat agcctgaagt ctcttgtcca cgtaaacaga 2580
tccggtaaga gagttatgtc caccctcatg ttgaacccat ccacatctag ctccgaagaa 2640
agcaccgtaa acaacagaag caatgatagg gtatccagcg tacataagag cagttccaag 2700
agcgaatgta gcaagaagct cgagaagtct gtaagccaca tgggtgatag aaggcttgaa 2760
gaatccatct ctctcaagct cagcacgcca tctagcgaaa tcctcaagca taggagcatc 2820
ctcagactca gatctcttga tctcagcagg tctagaaggc aaagctctaa gcatcttcca 2880
agccttgaga gaacgcatgt ggaattcttt gaaagcctca gtagcatcag caccagtgtt 2940
agcaagcatg tagaagatca cagatccacc agggtgcttg aagttagtca catcgtactc 3000
aacgtcctca actctaaccc atctagtctc gaaagtagca gcaagctcat gaggctcaag 3060
agtcttaaga tcaacaggag cagtagaagc atccttagca tcaagagcct cagcagaaga 3120
tttagacctg gtaagtggag atctaggaga agatcttcca tcagtcttag gagggcacat 3180
ggtatggtaa ttgtaaatgt aattgtaatg ttgtttgttg tttgttgttg ttggtaattg 3240
ttgtaaaaga tcctcgtgta tgtttttaat cttgtttgta tcgatgagtt ttggtttgag 3300
taaagagtga agcggatgag ttaatttata ggctataaag gagatttgca tggcgatcac 3360
gtgtaataat gcatgcacgc atgtgattgt atgtgtgtgc tgtgagagag aagctcttag 3420
gtgtttgaag ggagtgacaa gtggcgaaga aaaacaattc tccgcggctg catgctatgt 3480
gtaacgtgta gctaatgttc tggcatggca tcttatgaac gattcttttt aaaaacaagg 3540
taaaaactta acttcataaa attaaaaaaa aaaacgttta ctaagttggt ttaaaagggg 3600
atgagactag tagattggtt ggttggtttc catgtaccag aaggcttacc ctattagttg 3660
aaagttgaaa ctttgttccc tactcaattc ctagttgtgt aaatgtatgt atatgtaatg 3720
tgtataaaac gtagtactta aatgactagg agtggttctt gagaccgatg agagatggga 3780
gcagaactaa agatgatgac ataattaaga acgaatttga aaggctctta ggtttgaatc 3840
ctattcgaga atgtttttgt caaagatagt ggcgattttg aaccaaagaa aacatttaaa 3900
aaatcagtat ccggttacgt tcatgcaaat agaaagtggt ctaggatctg attgtaattt 3960
tagacttaaa gagtctctta agattcaatc ctggctgtgt acaaaactac aaataatata 4020
ttttagacta tttggcctta actaaacttc cactcattat ttactgaggt tagagaatag 4080
acttgcgaat aaacacattc ccgagaaata ctcatgatcc cataattagt cagagggtat 4140
gccaatcaga tctaagaaca cacattccct caaattttaa tgcacatgta atcatagttt 4200
agcacaattc aaaaataatg tagtattaaa gacagaaatt tgtagacttt tttttggcgt 4260
taaaagaaga ctaagtttat acgtacattt tattttaagt ggaaaaccga aattttccat 4320
cgaaatatat gaatttagta tatatatttc tgcaatgtac tattttgcta ttttggcaac 4380
tttcagtgga ctactacttt attacaatgt gtatggatgc atgagtttga gtatacacat 4440
gtctaaatgc atgctttgta aaacgtaacg gaccacaaaa gaggatccat acaaatacat 4500
ctcatagctt cctccattat tttccgacac aaacagagca ttttacaaca attaccaaca 4560
acaacaaaca acaaacaaca ttacaattac atttacaatt accataccat ggaattcgcc 4620
cagcctcttg ttgctatggc tcaagagcaa tacgctgcta tcgatgctgt tgttgctcct 4680
gctatcttct ctgctactga ttctatcgga tggggactta agcctatctc ttctgctact 4740
aaggacttgc ctcttgttga gtctcctaca cctctcatcc tttctttgct tgcttacttc 4800
gctatcgttg gatctggact cgtttacaga aaggttttcc ctagaaccgt gaagggacaa 4860
gatccattcc ttttgaaggc tcttatgctt gctcacaacg tgttccttat cggactttct 4920
ctttacatgt gcctcaagct tgtgtacgag gcttacgtta acaagtactc tttctgggga 4980
aacgcttaca accctgctca aactgagatg gctaaggtta tctggatctt ctacgtgagc 5040
aagatctacg agttcatgga taccttcatc atgctcctca agggaaatgt taaccaggtt 5100
agcttccttc acgtttacca tcacggatct atctctggaa tctggtggat gattacttac 5160
gctgctcctg gtggtgatgc ttacttctct gctgctctta actcttgggt tcacgtgtgt 5220
atgtacacct actattttat ggctgccgtg cttcctaagg acgagaaaac taagagaaag 5280
tacctctggt ggggaagata ccttactcaa atgcagatgt tccagttctt catgaacctt 5340
ctccaggctg tttaccttct ctactcttca tctccttacc ctaagtttat cgctcagctc 5400
ctcgtggtgt acatggttac tcttctcatg cttttcggaa acttctacta catgaagcac 5460
cacgctagca agtgatgagg cgcgccgggc cgccgccatg tgacagatcg aaggaagaaa 5520
gtgtaataag acgactctca ctactcgatc gctagtgatt gtcattgtta tatataataa 5580
tgttatcttt cacaacttat cgtaatgcat gtgaaactat aacacattaa tcctacttgt 5640
catatgataa cactctcccc atttaaaact cttgtcaatt taaagatata agattcttta 5700
aatgattaaa aaaaatatat tataaattca atcactccta ctaataaatt attaattatt 5760
atttattgat taaaaaaata cttatactaa tttagtctga atagaataat tagattctag 5820
tctcatcccc ttttaaacca acttagtaaa cgtttttttt tttaatttta tgaagttaag 5880
tttttacctt gtttttaaaa agaatcgttc ataagatgcc atgccagaac attagctaca 5940
cgttacacat agcatgcagc cgcggagaat tgtttttctt cgccacttgt cactcccttc 6000
aaacacctaa gagcttctct ctcacagcac acacatacaa tcacatgcgt gcatgcatta 6060
ttacacgtga tcgccatgca aatctccttt atagcctata aattaactca tccgcttcac 6120
tctttactca aaccaaaact catcgataca aacaagatta aaaacataca cgaggatctt 6180
ttacaacaat taccaacaac aacaaacaac aaacaacatt acaattacat ttacaattac 6240
cataccatgc ctccaaggga ctcttactct tatgctgctc ctccttctgc tcaacttcac 6300
gaagttgata ctcctcaaga gcacgacaag aaagagcttg ttatcggaga tagggcttac 6360
gatgttacca acttcgttaa gagacaccct ggtggaaaga tcattgctta ccaagttgga 6420
actgatgcta ccgatgctta caagcagttc catgttagat ctgctaaggc tgacaagatg 6480
cttaagtctc ttccttctcg tcctgttcac aagggatact ctccaagaag ggctgatctt 6540
atcgctgatt tccaagagtt caccaagcaa cttgaggctg agggaatgtt cgagccttct 6600
cttcctcatg ttgcttacag acttgctgag gttatcgcta tgcatgttgc tggtgctgct 6660
cttatctggc atggatacac tttcgctgga atcgctatgc ttggagttgt tcagggaaga 6720
tgtggatggc ttatgcatga gggtggacat tactctctca ctggaaacat tgctttcgac 6780
agagctatcc aagttgcttg ttacggactt ggatgtggaa tgtctggtgc ttggtggcgt 6840
aaccagcata acaagcacca tgctactcct caaaagcttc agcacgatgt tgatcttgat 6900
acccttcctc tcgttgcttt ccatgagaga atcgctgcta aggttaagtc tcctgctatg 6960
aaggcttggc tttctatgca agctaagctt ttcgctcctg ttaccactct tcttgttgct 7020
cttggatggc agctttacct tcatcctaga cacatgctca ggactaagca ctacgatgag 7080
cttgctatgc tcggaatcag atacggactt gttggatacc ttgctgctaa ctacggtgct 7140
ggatacgttc tcgcttgtta ccttctttac gttcagcttg gagctatgta catcttctgc 7200
aacttcgctg tttctcatac tcacctccct gttgttgagc ctaacgagca tgctacttgg 7260
gttgagtacg ctgctaacca cactactaac tgttctccat cttggtggtg tgattggtgg 7320
atgtcttacc ttaactacca gatcgagcac cacctttacc cttctatgcc tcaattcaga 7380
caccctaaga tcgctcctag agttaagcag cttttcgaga agcacggact tcactacgat 7440
gttagaggat acttcgaggc tatggctgat actttcgcta accttgataa cgttgcccat 7500
gctcctgaga agaaaatgca gtaatgagat cgttcaaaca tttggcaata aagtttctta 7560
agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt 7620
aagcacgtaa taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt 7680
agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag 7740
gataaattat cgcgcgcggt gtcatctatg ttactagatc ggtcgattaa aaatcccaat 7800
tatatttggt ctaatttagt ttggtattga gtaaaacaaa ttcgaaccaa accaaaatat 7860
aaatatatag tttttatata tatgccttta agacttttta tagaattttc tttaaaaaat 7920
atctagaaat atttgcgact cttctggcat gtaatatttc gttaaatatg aagtgctcca 7980
tttttattaa ctttaaataa ttggttgtac gatcactttc ttatcaagtg ttactaaaat 8040
gcgtcaatct ctttgttctt ccatattcat atgtcaaaat ctatcaaaat tcttatatat 8100
ctttttcgaa tttgaagtga aatttcgata atttaaaatt aaatagaaca tatcattatt 8160
taggtatcat attgattttt atacttaatt actaaatttg gttaactttg aaagtgtaca 8220
tcaacgaaaa attagtcaaa cgactaaaat aaataaatat catgtgttat taagaaaatt 8280
ctcctataag aatattttaa tagatcatat gtttgtaaaa aaaattaatt tttactaaca 8340
catatattta cttatcaaaa atttgacaaa gtaagattaa aataatattc atctaacaaa 8400
aaaaaaacca gaaaatgctg aaaacccggc aaaaccgaac caatccaaac cgatatagtt 8460
ggtttggttt gattttgata taaaccgaac caactcggtc catttgcacc cctaatcata 8520
atagctttaa tatttcaaga tattattaag ttaacgttgt caatatcctg gaaattttgc 8580
aaaatgaatc aagcctatat ggctgtaata tgaatttaaa agcagctcga tgtggtggta 8640
atatgtaatt tacttgattc taaaaaaata tcccaagtat taataatttc tgctaggaag 8700
aaggttagct acgatttaca gcaaagccag aatacaaaga accataaagt gattgaagct 8760
cgaaatatac gaaggaacaa atatttttaa aaaaatacgc aatgacttgg aacaaaagaa 8820
agtgatatat tttttgttct taaacaagca tcccctctaa agaatggcag ttttcctttg 8880
catgtaacta ttatgctccc ttcgttacaa aaattttgga ctactattgg gaacttcttc 8940
tgaaaatagt gatagaaccc acacgagcat gtgctttcca tttaatttta aaaaccaaga 9000
aacatacata cataacattc catcagcctc tctctctttt tattacggtt aatgacttaa 9060
aacacatctt attatcccat ccttaacacc tagcagtgtc tttatacgat ctcatcgatc 9120
accacttcaa aaccatgcag actgctgctg cccctggagc tggcatcggc taggctgggt 9180
gccgcactgt cccggaaggt ccctagcgac ttgtttagat tgatgggacc acctctcaac 9240
ttcctgctgc tgtccctgct gctggatgtc ctgcctcatc tggccgattg cacgctccag 9300
tcccctgcat gtgcactcgc tcctcaattg cttaagatca tcgcagcagc tatcgaagtg 9360
ctggctctgt tgccctcctc cacggccttg gttgtagtag tagctgccgc cgcccttctg 9420
gactttttcc cacaggaacc gccgaataat tcgatagaac cacacgagca tgtgctttca 9480
tttattttaa aaaccaagaa acatacataa catttcatca gcctctctct ctctctctct 9540
ctctctctct ctctctctct ctctctctct ctctttatta cagctgttac actaacttaa 9600
aacacattca tctcattatt attattatta tccatcctta acacctagca gtgtctttgt 9660
acgatctcat aatcgatcac cccttcatca ggtatcctta ggcttcactc caacgttgtt 9720
gcagttacgg aacatgtaca caccatcatg gttctcaacg aactggcaag atctccaagt 9780
tttccaaagg ctaacccaca tgttctcatc ggtgtgtctg tagtgctctc ccataacttt 9840
cttgatgcac tcggtagctt ctctagcatg gtagaatggg atccttgaaa cgtagtgatg 9900
gagcacatga gtctcgatga tgtcatggaa gatgattccg aggattccga actctctatc 9960
gatagtagca gcagcaccct tagcgaaagt ccactcttga gcatcgtaat gaggcataga 10020
agaatcggtg tgctgaagga aggtaacgaa aacaagccag tggttaacaa ggatccaagg 10080
acagaaccat gtgatgaaag taggccagaa tccgaaaacc ttgtaagcgg tgtaaacaga 10140
agtgagggta gcaaggattc caagatcaga aagaacgatg taccagtagt ccttcttatc 10200
gaaaacaggg ctagaaggcc agtagtgaga cttgaagaac ttagaaacac cagggtaagg 10260
ttgtccagta gcgttagtag caaggtaaag agaaagtcct ccaagctgtt ggaacaagag 10320
agcgaaaaca gagtagatag gagtttcctc agcgatatcg tgaaggctgg taacttggtg 10380
cttctctttg aattcctcgg cggtgtaagg aacgaaaacc atatctctgg tcatgtgtcc 10440
agtagcctta tggtgcttag catgagagaa cttccagctg aagtaaggaa ccataacaag 10500
agagtggaga acccatccaa cggtatcgtt aacccatccg tagttagaga aagcagaatg 10560
tccacactca tgtccaagga tccagattcc gaatccgaaa caagagatag agaacacgta 10620
agcagaccaa gcagcgaatc taaggaattc gttagggaga agagggatgt aggtaagtcc 10680
aacgtaagcg atagcagaga tagccacgat atctctcacc acgtaagaca tagacttcac 10740
gagagatctc tcgtaacagt gcttagggat agcgtcaagg atatccttga tggtgtaatc 10800
tggcaccttg aaaacgtttc cgaaggtatc gatagcggtc ttttgctgct tgaaagatgc 10860
aacgtttcca gaacgcctaa cggtcttagt agatccctca aggatctcag atccagacac 10920
ggtaacctta gacatggtat ggtaattgta aatgtaattg taatgttgtt tgttgtttgt 10980
tgttgttggt aattgttgta aaatttttgg tggtgattgg ttctttaagg tgtgagagtg 11040
agttgtgagt tgtgtggtgg gtttggtgag attggggatg gtgggtttat atagtggaga 11100
ctgaggaatg gggtcgtgag tgttaacttt gcatgggcta cacgtgggtt cttttgggct 11160
tacacgtagt attattcatg caaatgcagc caatacatat acggtatttt aataatgtgt 11220
gggaatacaa tatgccgagt attttactaa ttttggcaat gacaagtgta catttggatt 11280
atcttacttg gcctctcttg ctttaatttg gattattttt attctcttac cttggccgtt 11340
catattcaca tccctaaagg caagacagaa ttgaatggtg gccaaaaatt aaaacgatgg 11400
atatgaccta catagtgtag gatcaattaa cgtcgaagga aaatactgat tctctcaagc 11460
atacggacaa gggtaaataa catagtcacc agaacataat aaacaaaaag tgcagaagca 11520
agactaaaaa aattagctat ggacattcag gttcatattg gaaacatcat tatcctagtc 11580
ttgtgaccat ccttcctcct gctctagttg agaggccttg ggactaacga gaggtcagtt 11640
gggatagcag atccttatcc tggactagcc tttctggtgt ttcagagtct tcgtgccgcc 11700
gtctacatct atctccatta ggtctgaaga tgactcttca caccaacgac gtttaaggtc 11760
tctatcctac tcctagcttg caatacctgg cttgcaatac ctggagcatc gtgcacgatg 11820
attggatact gtggaggagg agtgtttgct gatttagagc tcccggttgg gtgatttgac 11880
ttcgatttca gtttaggctt gttgaaattt ttcaggttcc attgtgaagc ctttagagct 11940
tgagcttcct tccatgttaa tgccttgatc gaatactcct agagaaaagg gaagtcgatc 12000
tctgagtatt gaaatcgaag tgcacatttt ttttcaacgt gtccaatcaa tccacaaaca 12060
aagcagaaga caggtaatct ttcatactta tactgacaag taatagtctt accgtcatgc 12120
ataataacgt ctcgttcctt caagaggggt tttccgacat ccataacgac ccgaagcctc 12180
atgaaagcat tagggaagaa cttttggttc ttcttgtcat ggcctttata ggtgtcagcc 12240
gagctcgcca attcccgtcc gactggctcc gcaaaatatt cgaacggcaa gttatggact 12300
tgcaaccata actccacggt attgagcagg acctattgtg aagactcatc tcatggagct 12360
tcagaatgtg gttgtcagca aaccaatgac cgaaatccat cacatgacgg acgtccagtg 12420
ggtgagcgaa acgaaacagg aagcgcctat ctttcagagt cgtgagctcc acaccggatt 12480
ccggcaacta cgtgttgggc aggcttcgcc gtattagaga tatgttgagg cagacccatc 12540
tgtgccactc gtacaattac gagagttgtt ttttttgtga ttttcctagt ttctcgttga 12600
tggtgagctc atattctaca tcgtatggtc tctcaacgtc gtttcctgtc atctgatatc 12660
ccgtcatttg catccacgtg cgccgcctcc cgtgccaagt ccctaggtgt catgcacgcc 12720
aaattggtgg tggtgcgggc tgccctgtgc ttcttaccga tgggtggagg ttgagtttgg 12780
gggtctccgc ggcgatggta gtgggttgac ggtttggtgt gggttgacgg cattgatcaa 12840
tttacttctt gcttcaaatt ctttggcaga aaacaattca ttagattaga actggaaacc 12900
agagtgatga gacggattaa gtcagattcc aacagagtta catctcttaa gaaataatgt 12960
aaccccttta gactttatat atttgcaatt aaaaaaataa tttaactttt agactttata 13020
tatagtttta ataactaagt ttaaccactc tattatttat atcgaaacta tttgtatgtc 13080
tcccctctaa ataaacttgg tattgtgttt acagaaccta taatcaaata atcaatactc 13140
aactgaagtt tgtgcagtta attgaaggga ttaacggcca aaatgcacta gtattatcaa 13200
ccgaatagat tcacactaga tggccatttc catcaatatc atcgccgttc ttcttctgtc 13260
cacatatccc ctctgaaact tgagagacac ctgcacttca ttgtccttat tacgtgttac 13320
aaaatgaaac ccatgcatcc atgcaaactg aagaatggcg caagaaccct tcccctccat 13380
ttcttatgtg gcgaccatcc atttcaccat ctcccgctat aaaacacccc catcacttca 13440
cctagaacat catcactact tgcttatcca tccaaaagat acccactttt acaacaatta 13500
ccaacaacaa caaacaacaa acaacattac aattacattt acaattacca taccatgcca 13560
cctagcgctg ctaagcaaat gggagcttct actggtgttc atgctggtgt tactgactct 13620
tctgctttca ccagaaagga tgttgctgat agacctgatc tcaccatcgt tggagattct 13680
gtttacgatg ctaaggcttt cagatctgag catcctggtg gtgctcattt cgtttctttg 13740
ttcggaggaa gagatgctac tgaggctttc atggaatacc atagaagggc ttggcctaag 13800
tctagaatgt ctagattcca cgttggatct cttgcttcta ctgaggaacc tgttgctgct 13860
gatgagggat accttcaact ttgtgctagg atcgctaaga tggtgccttc tgtttcttct 13920
ggattcgctc ctgcttctta ctgggttaag gctggactta tccttggatc tgctatcgct 13980
cttgaggctt acatgcttta cgctggaaag agacttctcc cttctatcgt tcttggatgg 14040
cttttcgctc ttatcggtct taacatccag catgatgcta accatggtgc tttgtctaag 14100
tctgcttctg ttaaccttgc tcttggactt tgtcaggatt ggatcggagg atctatgatc 14160
ctttggcttc aagagcatgt tgttatgcac cacctccaca ctaacgatgt tgataaggat 14220
cctgatcaaa aggctcacgg tgctcttaga ctcaagccta ctgatgcttg gtcacctatg 14280
cattggcttc agcatcttta ccttttgcct ggtgagacta tgtacgcttt caagcttttg 14340
ttcctcgaca tctctgagct tgttatgtgg cgttgggagg gtgagcctat ctctaagctt 14400
gctggatacc tctttatgcc ttctttgctt ctcaagctta ccttctgggc tagattcgtt 14460
gctttgcctc tttaccttgc tccttctgtt catactgctg tgtgtatcgc tgctactgtt 14520
atgactggat ctttctacct cgctttcttc ttcttcatct cccacaactt cgagggtgtt 14580
gcttctgttg gacctgatgg atctatcact tctatgacta gaggtgctag cttccttaag 14640
agacaagctg agacttcttc taacgttgga ggacctcttc ttgctactct taacggtgga 14700
ctcaactacc aaattgagca tcacttgttc cctagagttc accatggatt ctaccctaga 14760
cttgctcctc ttgttaaggc tgagcttgag gctagaggaa tcgagtacaa gcactaccct 14820
actatctggt ctaaccttgc ttctaccctc agacatatgt acgctcttgg aagaaggcct 14880
agatctaagg ctgagtaatg acaagcttat gtgacgtgaa ataataacgg taaaatatat 14940
gtaataataa taataataaa gccacaaagt gagaatgagg ggaaggggaa atgtgtaatg 15000
agccagtagc cggtggtgct aattttgtat cgtattgtca ataaatcatg aattttgtgg 15060
tttttatgtg tttttttaaa tcatgaattt taaattttat aaaataatct ccaatcggaa 15120
gaacaacatt ccatatccat gcatggatgt ttctttaccc aaatctagtt cttgagagga 15180
tgaagcatca ccgaacagtt ctgcaactat ccctcaaaag ctttaaaatg aacaacaagg 15240
aacagagcaa cgttccaaag atcccaaacg aaacatatta tctatactaa tactatatta 15300
ttaattacta ctgcccggaa tcacaatccc tgaatgattc ctattaacta caagccttgt 15360
tggcggcgga gaagtgatcg gcgcggcgag aagcagcgga ctcggagacg aggccttgga 15420
agatctgagt cgaacgggca gaatcagtat tttccttcga cgttaattga tcctacacta 15480
tgtaggtcat atccatcgtt ttaatttttg gccaccattc aattctgtct tgcctttagg 15540
gatgtgaata tgaacggcca aggtaagaga ataaaaataa tccaaattaa agcaagagag 15600
gccaagtaag ataatccaaa tgtacacttg tcattgccaa aattagtaaa atactcggca 15660
tattgtattc ccacacatta ttaaaatacc gtatatgtat tggctgcatt tgcatgaata 15720
atactacgtg taagcccaaa agaacccacg tgtagcccat gcaaagttaa cactcacgac 15780
cccattcctc agtctccact atataaaccc accatcccca atctcaccaa acccaccaca 15840
caactcacaa ctcactctca caccttaaag aaccaatcac caccaaaaat tttacaacaa 15900
ttaccaacaa caacaaacaa caaacaacat tacaattaca tttacaatta ccataccatg 15960
agcgctgtta ccgttactgg atctgatcct aagaacagag gatcttctag caacaccgag 16020
caagaggttc caaaagttgc tatcgatacc aacggaaacg tgttctctgt tcctgatttc 16080
accatcaagg acatccttgg agctatccct catgagtgtt acgagagaag attggctacc 16140
tctctctact acgtgttcag agatatcttc tgcatgctta ccaccggata ccttacccat 16200
aagatccttt accctctcct catctcttac acctctaaca gcatcatcaa gttcactttc 16260
tgggcccttt acacttacgt tcaaggactt ttcggaaccg gaatctgggt tctcgctcat 16320
gagtgtggac atcaagcttt ctctgattac ggaatcgtga acgatttcgt tggatggacc 16380
cttcactctt accttatggt tccttacttc agctggaagt actctcatgg aaagcaccat 16440
aaggctactg gacacatgac cagagatatg gttttcgttc ctgccaccaa agaggaattc 16500
aagaagtcta ggaacttctt cggtaacctc gctgagtact ctgaggattc tccacttaga 16560
accctttacg agcttcttgt tcaacaactt ggaggatgga tcgcttacct cttcgttaac 16620
gttacaggac aaccttaccc tgatgttcct tcttggaaat ggaaccactt ctggcttacc 16680
tctccacttt tcgagcaaag agatgctctc tacatcttcc tttctgatct tggaatcctc 16740
acccagggaa tcgttcttac tctttggtac aagaaattcg gaggatggtc ccttttcatc 16800
aactggttcg ttccttacat ctgggttaac cactggctcg ttttcatcac attccttcag 16860
cacactgatc ctactatgcc tcattacaac gctgaggaat ggactttcgc taagggtgct 16920
gctgctacta tcgatagaaa gttcggattc atcggacctc acatcttcca tgatatcatc 16980
gagactcatg tgcttcacca ctactgttct aggatcccat tctacaacgc tagacctgct 17040
tctgaggcta tcaagaaagt tatgggaaag cactacaggt ctagcgacga gaacatgtgg 17100
aagtcacttt ggaagtcttt caggtcttgc caatacgttg acggtgataa cggtgttctc 17160
atgttccgta acatcaacaa ctgcggagtt ggagctgctg agaagtaatg aaggggtgat 17220
cgattatgag atcgtacaaa gacactgcta ggtgttaagg atggataata ataataataa 17280
tgagatgaat gtgttttaag ttagtgtaac agctgtaata aagagagaga gagagagaga 17340
gagagagaga gagagagaga gagagagaga gaggctgatg aaatgttatg tatgtttctt 17400
ggtttttaaa ataaatgaaa gcacatgctc gtgtggttct atcgaattat tcggcggttc 17460
ctgtgggaaa aagtccagaa gggccgccgc agctactact acaaccaagg ccgtggagga 17520
gggcaacaga gccagcactt cgatagctgc tgcgatgatc ttaagcaatt gaggagcgag 17580
tgcacatgca ggggactgga gcgtgcaatc ggccagatga ggcaggacat ccagcagcag 17640
ggacagcagc aggaagttga gaggtggtcc catcaatcta aacaagtcgc tagggacctt 17700
ccgggacagt gcggcaccca gcctagccga tgccagctcc aggggcagca gcagtctgca 17760
tggttttgaa gtggtgatcg atgagatcgt ataaagacac tgctaggtgt taaggatggg 17820
ataataagat gtgttttaag tcattaaccg taataaaaag agagagaggc tgatggaatg 17880
ttatgtatgt atgtttcttg gtttttaaaa ttaaatggaa agcacatgct cgtgtgggtt 17940
ctatctcgat taaaaatccc aattatattt ggtctaattt agtttggtat tgagtaaaac 18000
aaattcgaac caaaccaaaa tataaatata tagtttttat atatatgcct ttaagacttt 18060
ttatagaatt ttctttaaaa aatatctaga aatatttgcg actcttctgg catgtaatat 18120
ttcgttaaat atgaagtgct ccatttttat taactttaaa taattggttg tacgatcact 18180
ttcttatcaa gtgttactaa aatgcgtcaa tctctttgtt cttccatatt catatgtcaa 18240
aatctatcaa aattcttata tatctttttc gaatttgaag tgaaatttcg ataatttaaa 18300
attaaataga acatatcatt atttaggtat catattgatt tttatactta attactaaat 18360
ttggttaact ttgaaagtgt acatcaacga aaaattagtc aaacgactaa aataaataaa 18420
tatcatgtgt tattaagaaa attctcctat aagaatattt taatagatca tatgtttgta 18480
aaaaaaatta atttttacta acacatatat ttacttatca aaaatttgac aaagtaagat 18540
taaaataata ttcatctaac aaaaaaaaaa ccagaaaatg ctgaaaaccc ggcaaaaccg 18600
aaccaatcca aaccgatata gttggtttgg tttgattttg atataaaccg aaccaactcg 18660
gtccatttgc acccctaatc ataatagctt taatatttca agatattatt aagttaacgt 18720
tgtcaatatc ctggaaattt tgcaaaatga atcaagccta tatggctgta atatgaattt 18780
aaaagcagct cgatgtggtg gtaatatgta atttacttga ttctaaaaaa atatcccaag 18840
tattaataat ttctgctagg aagaaggtta gctacgattt acagcaaagc cagaatacaa 18900
agaaccataa agtgattgaa gctcgaaata tacgaaggaa caaatatttt taaaaaaata 18960
cgcaatgact tggaacaaaa gaaagtgata tattttttgt tcttaaacaa gcatcccctc 19020
taaagaatgg cagttttcct ttgcatgtaa ctattatgct cccttcgtta caaaaatttt 19080
ggactactat tgggaacttc ttctgaaaat agtcctgcag gctagtagat tggttggttg 19140
gtttccatgt accagaaggc ttaccctatt agttgaaagt tgaaactttg ttccctactc 19200
aattcctagt tgtgtaaatg tatgtatatg taatgtgtat aaaacgtagt acttaaatga 19260
ctaggagtgg ttcttgagac cgatgagaga tgggagcaga actaaagatg atgacataat 19320
taagaacgaa tttgaaaggc tcttaggttt gaatcctatt cgagaatgtt tttgtcaaag 19380
atagtggcga ttttgaacca aagaaaacat ttaaaaaatc agtatccggt tacgttcatg 19440
caaatagaaa gtggtctagg atctgattgt aattttagac ttaaagagtc tcttaagatt 19500
caatcctggc tgtgtacaaa actacaaata atatatttta gactatttgg ccttaactaa 19560
acttccactc attatttact gaggttagag aatagacttg cgaataaaca cattcccgag 19620
aaatactcat gatcccataa ttagtcagag ggtatgccaa tcagatctaa gaacacacat 19680
tccctcaaat tttaatgcac atgtaatcat agtttagcac aattcaaaaa taatgtagta 19740
ttaaagacag aaatttgtag actttttttt ggcgttaaaa gaagactaag tttatacgta 19800
cattttattt taagtggaaa accgaaattt tccatcgaaa tatatgaatt tagtatatat 19860
atttctgcaa tgtactattt tgctattttg gcaactttca gtggactact actttattac 19920
aatgtgtatg gatgcatgag tttgagtata cacatgtcta aatgcatgct ttgtaaaacg 19980
taacggacca caaaagagga tccatacaaa tacatctcat agcttcctcc attattttcc 20040
gacacaaaca gagcatttta caacaattac caacaacaac aaacaacaaa caacattaca 20100
attacattta caattaccat accatggcct ctatcgctat ccctgctgct cttgctggaa 20160
ctcttggata cgttacctac aatgtggcta accctgatat cccagcttct gagaaagttc 20220
ctgcttactt catgcaggtt gagtactggg gacctactat cggaactatt ggatacctcc 20280
tcttcatcta cttcggaaag cgtatcatgc agaacagatc tcaacctttc ggactcaaga 20340
acgctatgct cgtttacaac ttctaccaga ccttcttcaa cagctactgc atctaccttt 20400
tcgttacttc tcatagggct cagggactta aggtttgggg aaacatccct gatatgactg 20460
ctaactcttg gggaatctct caggttatct ggcttcacta caacaacaag tacgttgagc 20520
ttctcgacac cttcttcatg gtgatgagga agaagttcga ccagctttct ttccttcaca 20580
tctaccacca cactcttctc atctggtcat ggttcgttgt tatgaagctt gagcctgttg 20640
gagattgcta cttcggatct tctgttaaca ccttcgtgca cgtgatcatg tactcttact 20700
acggacttgc tgctcttgga gttaactgtt tctggaagaa gtacatcacc cagatccaga 20760
tgcttcagtt ctgtatctgt gcttctcact ctatctacac cgcttacgtt cagaataccg 20820
ctttctggct tccttacctt caactctggg ttatggtgaa catgttcgtt ctcttcgcca 20880
acttctaccg taagaggtac aagtctaagg gtgctaagaa gcagtgataa gggccgccgc 20940
catgtgacag atcgaaggaa gaaagtgtaa taagacgact ctcactactc gatcgctagt 21000
gattgtcatt gttatatata ataatgttat ctttcacaac ttatcgtaat gcatgtgaaa 21060
ctataacaca ttaatcctac ttgtcatatg ataacactct ccccatttaa aactcttgtc 21120
aatttaaaga tataagattc tttaaatgat taaaaaaaat atattataaa ttcaatcact 21180
cctactaata aattattaat tattatttat tgattaaaaa aatacttata ctaatttagt 21240
ctgaatagaa taattagatt ctagcctgca gggcggccgc ggatcccatg gagtcaaaga 21300
ttcaaataga ggacctaaca gaactcgccg taaagactgg cgaacagttc atacagagtc 21360
tcttacgact caatgacaag aagaaaatct tcgtcaacat ggtggagcac gacacacttg 21420
tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt gagacttttc 21480
aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc tgtcacttta 21540
ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc gataaaggaa 21600
aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc ccacccacga 21660
ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg gattgatgtg 21720
atatctccac tgacgtaagg gatgacgcac aatcccacta tccttcgcaa gacccttcct 21780
ctatataagg aagttcattt catttggaga gaacacgggg gactgaatta aatatgagcc 21840
ctgagaggcg tcctgttgaa atcagacctg ctactgctgc tgatatggct gctgtttgtg 21900
atatcgtgaa ccactacatc gagacttcta ccgttaactt cagaactgag cctcaaactc 21960
ctcaagagtg gatcgatgat cttgagagac tccaagatag atacccttgg cttgttgctg 22020
aggttgaggg tgttgttgct ggaatcgctt acgctggacc ttggaaggct agaaacgctt 22080
acgattggac tgttgagtct accgtttacg tttcacacag acatcagaga cttggacttg 22140
gatctaccct ttacactcac cttctcaagt ctatggaagc tcagggattc aagtctgttg 22200
ttgctgttat cggactccct aacgatcctt ctgttagact tcatgaggct cttggataca 22260
ctgctagagg aactcttaga gctgctggat acaagcacgg tggatggcat gatgttggat 22320
tctggcaaag agatttcgag cttcctgctc ctcctagacc tgttagacca gttactcaga 22380
tctgaatttg cgtgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt 22440
tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat 22500
taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt 22560
atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg 22620
cgcggtgtca tctatgttac tagatcacta gtgatgtacg gttaaaacca ccccagtaca 22680
ttaaaaacgt ccgcaatgtg ttattaagtt gtctaagcgt caatttgttt acaccacaat 22740
atatcctgcc accagccagc caacagctcc ccgaccggca gctcggcaca aaatcaccac 22800
tcgatacagg cagcccatca gtcc 22824
&lt;210&gt; 5
&lt;211&gt; 24809
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pga7- mod_e nucleotide sequence
&lt;400&gt; 5
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgcctcgatt aaaaatccca attatatttg gtctaattta 240
gtttggtatt gagtaaaaca aattcgaacc aaaccaaaat ataaatatat agtttttata 300
tatatgcctt taagactttt tatagaattt tctttaaaaa atatctagaa atatttgcga 360
ctcttctggc atgtaatatt tcgttaaata tgaagtgctc catttttatt aactttaaat 420
aattggttgt acgatcactt tcttatcaag tgttactaaa atgcgtcaat ctctttgttc 480
ttccatattc atatgtcaaa atctatcaaa attcttatat atctttttcg aatttgaagt 540
gaaatttcga taatttaaaa ttaaatagaa catatcatta tttaggtatc atattgattt 600
ttatacttaa ttactaaatt tggttaactt tgaaagtgta catcaacgaa aaattagtca 660
aacgactaaa ataaataaat atcatgtgtt attaagaaaa ttctcctata agaatatttt 720
aatagatcat atgtttgtaa aaaaaattaa tttttactaa cacatatatt tacttatcaa 780
aaatttgaca aagtaagatt aaaataatat tcatctaaca aaaaaaaaac cagaaaatgc 840
tgaaaacccg gcaaaaccga accaatccaa accgatatag ttggtttggt ttgattttga 900
tataaaccga accaactcgg tccatttgca cccctaatca taatagcttt aatatttcaa 960
gatattatta agttaacgtt gtcaatatcc tggaaatttt gcaaaatgaa tcaagcctat 1020
atggctgtaa tatgaattta aaagcagctc gatgtggtgg taatatgtaa tttacttgat 1080
tctaaaaaaa tatcccaagt attaataatt tctgctagga agaaggttag ctacgattta 1140
cagcaaagcc agaatacaaa gaaccataaa gtgattgaag ctcgaaatat acgaaggaac 1200
aaatattttt aaaaaaatac gcaatgactt ggaacaaaag aaagtgatat attttttgtt 1260
cttaaacaag catcccctct aaagaatggc agttttcctt tgcatgtaac tattatgctc 1320
ccttcgttac aaaaattttg gactactatt gggaacttct tctgaaaata gtggcgcccc 1380
gcggaaagct tgctagccaa ttggggccca acgttctcga gtttttctag aaggaaactg 1440
aaggcgggaa acgacaatct gctagtggat ctcccagtca cgacgttgta aaacgggcgc 1500
cccgcggaaa gcttgcggcc gcggtaccgc ccgttcgact cagatcttcc aaggcctcgt 1560
ctccgagtcc gctgcttctc gccgcgccga tcacttctcc gccgccaaca aggcttgtag 1620
ttaataggaa tcattcaggg attgtgattc cgggcagtag taattaataa tatagtatta 1680
gtatagataa tatgtttcgt ttgggatctt tggaacgttg ctctgttcct tgttgttcat 1740
tttaaagctt ttgagggata gttgcagaac tgttcggtga tgcttcatcc tctcaagaac 1800
tagatttggg taaagaaaca tccatgcatg gatatggaat gttgttcttc cgattggaga 1860
ttattttata aaatttaaaa ttcatgattt aaaaaaacac ataaaaacca caaaattcat 1920
gatttattga caatacgata caaaattagc accaccggct actggctcat tacacatttc 1980
cccttcccct cattctcact ttgtggcttt attattatta ttattacata tattttaccg 2040
ttattatttc acgtcacata agcttgttaa ttaatcatta gtgagccttc tcagcctttc 2100
cgttaacgta gtagtgctgt cccaccttat caaggttaga gaaagtagcc ttccaagcac 2160
cgtagtaaga gagcaccttg tagttgagtc cccacttctt agcgaaagga acgaatcttc 2220
tgctaacctc aggctgtctg aattgaggca tatcagggaa gaggtggtgg ataacctgac 2280
agttaaggta tcccataagc cagttcacgt atcctctaga aggatcgata tcaacggtgt 2340
gatcaacagc gtagttaacc caagaaaggt gcttatcaga tggaacaaca gggaggtgag 2400
tatgagaagt agagaagtga gcgaaaaggt acatgtaagc gatccagttt ccgaaagtga 2460
accaccagta agcaacaggc caagagtatc cagtagcaag cttgataaca gcggttctaa 2520
caacatgaga aacgagcatc caagaagcct cttcgtagtt cttcttacgg agaacttgtc 2580
tagggtggag aacgtagatc cagaaagctt gaacaagaag tccagaggta acaggaacga 2640
aagtccaagc ttgaagtcta gcccaagctc tagagaatcc tctaggtctg ttatcctcaa 2700
cagcagtgtt gaagaaagcc acagcaggag tggtatcaag atccatatcg tgtctaacct 2760
tttgaggggt agcatggtgc ttgttatgca tctggttcca catctcacca gaagtagaaa 2820
gtccgaatcc acaagtcata gcctgaagtc tcttgtccac gtaaacagat ccggtaagag 2880
agttatgtcc accctcatgt tgaacccatc cacatctagc tccgaagaaa gcaccgtaaa 2940
caacagaagc aatgataggg tatccagcgt acataagagc agttccaaga gcgaatgtag 3000
caagaagctc gagaagtctg taagccacat gggtgataga aggcttgaag aatccatctc 3060
tctcaagctc agcacgccat ctagcgaaat cctcaagcat aggagcatcc tcagactcag 3120
atctcttgat ctcagcaggt ctagaaggca aagctctaag catcttccaa gccttgagag 3180
aacgcatgtg gaattctttg aaagcctcag tagcatcagc accagtgtta gcaagcatgt 3240
agaagatcac agatccacca gggtgcttga agttagtcac atcgtactca acgtcctcaa 3300
ctctaaccca tctagtctcg aaagtagcag caagctcatg aggctcaaga gtcttaagat 3360
caacaggagc agtagaagca tccttagcat caagagcctc agcagaagat ttagacctgg 3420
taagtggaga tctaggagaa gatcttccat cagtcttagg agggcacatg gtatggtaat 3480
tgtaaatgta attgtaatgt tgtttgttgt ttgttgttgt tggtaattgt tgtaaaatta 3540
attaagtggg tatcttttgg atggataagc aagtagtgat gatgttctag gtgaagtgat 3600
gggggtgttt tatagcggga gatggtgaaa tggatggtcg ccacataaga aatggagggg 3660
aagggttctt gcgccattct tcagtttgca tggatgcatg ggtttcattt tgtaacacgt 3720
aataaggaca atgaagtgca ggtgtctctc aagtttcaga ggggatatgt ggacagaaga 3780
agaacggcga tgatattgat ggaaatggcc atctagtgtg aatctattcg gttgataata 3840
ctagtgcatt ttggccgtta atcccttcaa ttaactgcac aaacttcagt tgagtattga 3900
ttatttgatt ataggttctg taaacacaat accaagttta tttagagggg agacatacaa 3960
atagtttcga tataaataat agagtggtta aacttagtta ttaaaactat atataaagtc 4020
taaaagttaa attatttttt taattgcaaa tatataaagt ctaaaggggt tacattattt 4080
cttaagagat gtaactctgt tggaatctga cttaatccgt ctcatcactc tggtttccag 4140
ttctaatcta atgaattgtt ttctgccaaa gaatttgaag caagaagtaa attgatcaat 4200
gccgtcaacc cacaccaaac cgtcaaccca ctaccatcgc cgcggagacc cccaaactca 4260
acctccaccc atcggtaaga agcacagggc agcccgcacc accaccaatt tggcgtgcat 4320
gacacctagg gacttggcac gggaggcggc gcacgtggat gcaaatgacg ggatatcaga 4380
tgacaggaaa cgacgttgag agaccatacg atgtagaata tgagctcacc atcaacgaga 4440
aactaggaaa atcacaaaaa aaacaactct cgtaattgta cgagtggcac agatgggtct 4500
gcctcaacat atctctaata cggcgaagcc tgcccaacac gtagttgccg gaatccggtg 4560
tggagctcac gactctgaaa gataggcgct tcctgtttcg tttcgctcac ccactggacg 4620
tccgtcatgt gatggatttc ggtcattggt ttgctgacaa ccacattctg aagctccatg 4680
agatgagtct tcacaatagg tcctgctcaa taccgtggag ttatggttgc aagtccataa 4740
cttgccgttc gaatattttg cggagccagt cggacgggaa ttggcgagct cggctgacac 4800
ctataaaggc catgacaaga agaaccaaaa gttcttccct aatgctttca tgaggcttcg 4860
ggtcgttatg gatgtcggaa aacccctctt gaaggaacga gacgttatta tgcatgacgg 4920
taagactatt acttgtcagt ataagtatga aagattacct gtcttctgct ttgtttgtgg 4980
attgattgga cacgttgaaa aaaaatgtgc acttcgattt caatactcag agatcgactt 5040
cccttttctc taggagtatt cgatcaaggc attaacatgg aaggaagctc aagctctaaa 5100
ggcttcacaa tggaacctga aaaatttcaa caagcctaaa ctgaaatcga agtcaaatca 5160
cccaaccggg agctctaaat cagcaaacac tcctcctcca cagtatccaa tcatcgtgca 5220
cgatgctcca ggtattgcaa gccaggtatt gcaagctagg agtaggatag agaccttaaa 5280
cgtcgttggt gtgaagagtc atcttcagac ctaatggaga tagatgtaga cggcggcacg 5340
aagactctga aacaccagaa aggctagtcc aggataagga tctgctatcc caactgacct 5400
ctcgttagtc ccaaggcctc tcaactagag caggaggaag gatggtcaca agactaggat 5460
aatgatgttt ccaatatgaa cctgaatgtc catagctaat ttttttagtc ttgcttctgc 5520
actttttgtt tattatgttc tggtgactat gttatttacc cttgtccgta tgcttgaggg 5580
taccctagta gattggttgg ttggtttcca tgtaccagaa ggcttaccct attagttgaa 5640
agttgaaact ttgttcccta ctcaattcct agttgtgtaa atgtatgtat atgtaatgtg 5700
tataaaacgt agtacttaaa tgactaggag tggttcttga gaccgatgag agatgggagc 5760
agaactaaag atgatgacat aattaagaac gaatttgaaa ggctcttagg tttgaatcct 5820
attcgagaat gtttttgtca aagatagtgg cgattttgaa ccaaagaaaa catttaaaaa 5880
atcagtatcc ggttacgttc atgcaaatag aaagtggtct aggatctgat tgtaatttta 5940
gacttaaaga gtctcttaag attcaatcct ggctgtgtac aaaactacaa ataatatatt 6000
ttagactatt tggccttaac taaacttcca ctcattattt actgaggtta gagaatagac 6060
ttgcgaataa acacattccc gagaaatact catgatccca taattagtca gagggtatgc 6120
caatcagatc taagaacaca cattccctca aattttaatg cacatgtaat catagtttag 6180
cacaattcaa aaataatgta gtattaaaga cagaaatttg tagacttttt tttggcgtta 6240
aaagaagact aagtttatac gtacatttta ttttaagtgg aaaaccgaaa ttttccatcg 6300
aaatatatga atttagtata tatatttctg caatgtacta ttttgctatt ttggcaactt 6360
tcagtggact actactttat tacaatgtgt atggatgcat gagtttgagt atacacatgt 6420
ctaaatgcat gctttgtaaa acgtaacgga ccacaaaaga ggatccatac aaatacatct 6480
catagcttcc tccattattt tccgacacaa acagagcatt ttacaacaat taccaacaac 6540
aacaaacaac aaacaacatt acaattacat ttacaattac cataccatgg cctctatcgc 6600
tatccctgct gctcttgctg gaactcttgg atacgttacc tacaatgtgg ctaaccctga 6660
tatcccagct tctgagaaag ttcctgctta cttcatgcag gttgagtact ggggacctac 6720
tatcggaact attggatacc tcctcttcat ctacttcgga aagcgtatca tgcagaacag 6780
atctcaacct ttcggactca agaacgctat gctcgtttac aacttctacc agaccttctt 6840
caacagctac tgcatctacc ttttcgttac ttctcatagg gctcagggac ttaaggtttg 6900
gggaaacatc cctgatatga ctgctaactc ttggggaatc tctcaggtta tctggcttca 6960
ctacaacaac aagtacgttg agcttctcga caccttcttc atggtgatga ggaagaagtt 7020
cgaccagctt tctttccttc acatctacca ccacactctt ctcatctggt catggttcgt 7080
tgttatgaag cttgagcctg ttggagattg ctacttcgga tcttctgtta acaccttcgt 7140
gcacgtgatc atgtactctt actacggact tgctgctctt ggagttaact gtttctggaa 7200
gaagtacatc acccagatcc agatgcttca gttctgtatc tgtgcttctc actctatcta 7260
caccgcttac gttcagaata ccgctttctg gcttccttac cttcaactct gggttatggt 7320
gaacatgttc gttctcttcg ccaacttcta ccgtaagagg tacaagtcta agggtgctaa 7380
gaagcagtga taaggcgcgc ggcgcgccgg gccgccgcca tgtgacagat cgaaggaaga 7440
aagtgtaata agacgactct cactactcga tcgctagtga ttgtcattgt tatatataat 7500
aatgttatct ttcacaactt atcgtaatgc atgtgaaact ataacacatt aatcctactt 7560
gtcatatgat aacactctcc ccatttaaaa ctcttgtcaa tttaaagata taagattctt 7620
taaatgatta aaaaaaatat attataaatt caatcactcc tactaataaa ttattaatta 7680
ttatttattg attaaaaaaa tacttatact aatttagtct gaatagaata attagattct 7740
agtctcatcc ccttttaaac caacttagta aacgtttttt tttttaattt tatgaagtta 7800
agtttttacc ttgtttttaa aaagaatcgt tcataagatg ccatgccaga acattagcta 7860
cacgttacac atagcatgca gccgcggaga attgtttttc ttcgccactt gtcactccct 7920
tcaaacacct aagagcttct ctctcacagc acacacatac aatcacatgc gtgcatgcat 7980
tattacacgt gatcgccatg caaatctcct ttatagccta taaattaact catccgcttc 8040
actctttact caaaccaaaa ctcatcgata caaacaagat taaaaacata cacgaggatc 8100
ttttacaaca attaccaaca acaacaaaca acaaacaaca ttacaattac atttacaatt 8160
accataccat gcctccaagg gactcttact cttatgctgc tcctccttct gctcaacttc 8220
acgaagttga tactcctcaa gagcacgaca agaaagagct tgttatcgga gatagggctt 8280
acgatgttac caacttcgtt aagagacacc ctggtggaaa gatcattgct taccaagttg 8340
gaactgatgc taccgatgct tacaagcagt tccatgttag atctgctaag gctgacaaga 8400
tgcttaagtc tcttccttct cgtcctgttc acaagggata ctctccaaga agggctgatc 8460
ttatcgctga tttccaagag ttcaccaagc aacttgaggc tgagggaatg ttcgagcctt 8520
ctcttcctca tgttgcttac agacttgctg aggttatcgc tatgcatgtt gctggtgctg 8580
ctcttatctg gcatggatac actttcgctg gaatcgctat gcttggagtt gttcagggaa 8640
gatgtggatg gcttatgcat gagggtggac attactctct cactggaaac attgctttcg 8700
acagagctat ccaagttgct tgttacggac ttggatgtgg aatgtctggt gcttggtggc 8760
gtaaccagca taacaagcac catgctactc ctcaaaagct tcagcacgat gttgatcttg 8820
atacccttcc tctcgttgct ttccatgaga gaatcgctgc taaggttaag tctcctgcta 8880
tgaaggcttg gctttctatg caagctaagc ttttcgctcc tgttaccact cttcttgttg 8940
ctcttggatg gcagctttac cttcatccta gacacatgct caggactaag cactacgatg 9000
agcttgctat gctcggaatc agatacggac ttgttggata ccttgctgct aactacggtg 9060
ctggatacgt tctcgcttgt taccttcttt acgttcagct tggagctatg tacatcttct 9120
gcaacttcgc tgtttctcat actcacctcc ctgttgttga gcctaacgag catgctactt 9180
gggttgagta cgctgctaac cacactacta actgttctcc atcttggtgg tgtgattggt 9240
ggatgtctta ccttaactac cagatcgagc accaccttta cccttctatg cctcaattca 9300
gacaccctaa gatcgctcct agagttaagc agcttttcga gaagcacgga cttcactacg 9360
atgttagagg atacttcgag gctatggctg atactttcgc taaccttgat aacgttgccc 9420
atgctcctga gaagaaaatg cagtaatgag atcgttcaaa catttggcaa taaagtttct 9480
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 9540
ttaagcacgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 9600
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 9660
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcggtcgatt aaaaatccca 9720
attatatttg gtctaattta gtttggtatt gagtaaaaca aattcgaacc aaaccaaaat 9780
ataaatatat agtttttata tatatgcctt taagactttt tatagaattt tctttaaaaa 9840
atatctagaa atatttgcga ctcttctggc atgtaatatt tcgttaaata tgaagtgctc 9900
catttttatt aactttaaat aattggttgt acgatcactt tcttatcaag tgttactaaa 9960
atgcgtcaat ctctttgttc ttccatattc atatgtcaaa atctatcaaa attcttatat 10020
atctttttcg aatttgaagt gaaatttcga taatttaaaa ttaaatagaa catatcatta 10080
tttaggtatc atattgattt ttatacttaa ttactaaatt tggttaactt tgaaagtgta 10140
catcaacgaa aaattagtca aacgactaaa ataaataaat atcatgtgtt attaagaaaa 10200
ttctcctata agaatatttt aatagatcat atgtttgtaa aaaaaattaa tttttactaa 10260
cacatatatt tacttatcaa aaatttgaca aagtaagatt aaaataatat tcatctaaca 10320
aaaaaaaaac cagaaaatgc tgaaaacccg gcaaaaccga accaatccaa accgatatag 10380
ttggtttggt ttgattttga tataaaccga accaactcgg tccatttgca cccctaatca 10440
taatagcttt aatatttcaa gatattatta agttaacgtt gtcaatatcc tggaaatttt 10500
gcaaaatgaa tcaagcctat atggctgtaa tatgaattta aaagcagctc gatgtggtgg 10560
taatatgtaa tttacttgat tctaaaaaaa tatcccaagt attaataatt tctgctagga 10620
agaaggttag ctacgattta cagcaaagcc agaatacaaa gaaccataaa gtgattgaag 10680
ctcgaaatat acgaaggaac aaatattttt aaaaaaatac gcaatgactt ggaacaaaag 10740
aaagtgatat attttttgtt cttaaacaag catcccctct aaagaatggc agttttcctt 10800
tgcatgtaac tattatgctc ccttcgttac aaaaattttg gactactatt gggaacttct 10860
tctgaaaata gtgatagaac ccacacgagc atgtgctttc catttaattt taaaaaccaa 10920
gaaacataca tacataacat tccatcagcc tctctctctt tttattacgg ttaatgactt 10980
aaaacacatc ttattatccc atccttaaca cctagcagtg tctttatacg atctcatcga 11040
tcaccacttc aaaaccatgc agactgctgc tgcccctgga gctggcatcg gctaggctgg 11100
gtgccgcact gtcccggaag gtccctagcg acttgtttag attgatggga ccacctctca 11160
acttcctgct gctgtccctg ctgctggatg tcctgcctca tctggccgat tgcacgctcc 11220
agtcccctgc atgtgcactc gctcctcaat tgcttaagat catcgcagca gctatcgaag 11280
tgctggctct gttgccctcc tccacggcct tggttgtagt agtagctgcc gccgcccttc 11340
tggacttttt cccacaggaa ccgccgaata attcgataga accacacgag catgtgcttt 11400
catttatttt aaaaaccaag aaacatacat aacatttcat cagcctctct ctctctctct 11460
ctctctctct ctctctctct ctctctctct ctctctttat tacagctgtt acactaactt 11520
aaaacacatt catctcatta ttattattat tatccatcct taacacctag cagtgtcttt 11580
gtacgatctc ataatcgatc accccttcat caggtatcct taggcttcac tccaacgttg 11640
ttgcagttac ggaacatgta cacaccatca tggttctcaa cgaactggca agatctccaa 11700
gttttccaaa ggctaaccca catgttctca tcggtgtgtc tgtagtgctc tcccataact 11760
ttcttgatgc actcggtagc ttctctagca tggtagaatg ggatccttga aacgtagtga 11820
tggagcacat gagtctcgat gatgtcatgg aagatgattc cgaggattcc gaactctcta 11880
tcgatagtag cagcagcacc cttagcgaaa gtccactctt gagcatcgta atgaggcata 11940
gaagaatcgg tgtgctgaag gaaggtaacg aaaacaagcc agtggttaac aaggatccaa 12000
ggacagaacc atgtgatgaa agtaggccag aatccgaaaa ccttgtaagc ggtgtaaaca 12060
gaagtgaggg tagcaaggat tccaagatca gaaagaacga tgtaccagta gtccttctta 12120
tcgaaaacag ggctagaagg ccagtagtga gacttgaaga acttagaaac accagggtaa 12180
ggttgtccag tagcgttagt agcaaggtaa agagaaagtc ctccaagctg ttggaacaag 12240
agagcgaaaa cagagtagat aggagtttcc tcagcgatat cgtgaaggct ggtaacttgg 12300
tgcttctctt tgaattcctc ggcggtgtaa ggaacgaaaa ccatatctct ggtcatgtgt 12360
ccagtagcct tatggtgctt agcatgagag aacttccagc tgaagtaagg aaccataaca 12420
agagagtgga gaacccatcc aacggtatcg ttaacccatc cgtagttaga gaaagcagaa 12480
tgtccacact catgtccaag gatccagatt ccgaatccga aacaagagat agagaacacg 12540
taagcagacc aagcagcgaa tctaaggaat tcgttaggga gaagagggat gtaggtaagt 12600
ccaacgtaag cgatagcaga gatagccacg atatctctca ccacgtaaga catagacttc 12660
acgagagatc tctcgtaaca gtgcttaggg atagcgtcaa ggatatcctt gatggtgtaa 12720
tctggcacct tgaaaacgtt tccgaaggta tcgatagcgg tcttttgctg cttgaaagat 12780
gcaacgtttc cagaacgcct aacggtctta gtagatccct caaggatctc agatccagac 12840
acggtaacct tagacatggt atggtaattg taaatgtaat tgtaatgttg tttgttgttt 12900
gttgttgttg gtaattgttg taaaattttt ggtggtgatt ggttctttaa ggtgtgagag 12960
tgagttgtga gttgtgtggt gggtttggtg agattgggga tggtgggttt atatagtgga 13020
gactgaggaa tggggtcgtg agtgttaact ttgcatgggc tacacgtggg ttcttttggg 13080
cttacacgta gtattattca tgcaaatgca gccaatacat atacggtatt ttaataatgt 13140
gtgggaatac aatatgccga gtattttact aattttggca atgacaagtg tacatttgga 13200
ttatcttact tggcctctct tgctttaatt tggattattt ttattctctt accttggccg 13260
ttcatattca catccctaaa ggcaagacag aattgaatgg tggccaaaaa ttaaaacgat 13320
ggatatgacc tacatagtgt aggatcaatt aacgtcgaag gaaaatactg attctctcaa 13380
gcatacggac aagggtaaat aacatagtca ccagaacata ataaacaaaa agtgcagaag 13440
caagactaaa aaaattagct atggacattc aggttcatat tggaaacatc attatcctag 13500
tcttgtgacc atccttcctc ctgctctagt tgagaggcct tgggactaac gagaggtcag 13560
ttgggatagc agatccttat cctggactag cctttctggt gtttcagagt cttcgtgccg 13620
ccgtctacat ctatctccat taggtctgaa gatgactctt cacaccaacg acgtttaagg 13680
tctctatcct actcctagct tgcaatacct ggcttgcaat acctggagca tcgtgcacga 13740
tgattggata ctgtggagga ggagtgtttg ctgatttaga gctcccggtt gggtgatttg 13800
acttcgattt cagtttaggc ttgttgaaat ttttcaggtt ccattgtgaa gcctttagag 13860
cttgagcttc cttccatgtt aatgccttga tcgaatactc ctagagaaaa gggaagtcga 13920
tctctgagta ttgaaatcga agtgcacatt ttttttcaac gtgtccaatc aatccacaaa 13980
caaagcagaa gacaggtaat ctttcatact tatactgaca agtaatagtc ttaccgtcat 14040
gcataataac gtctcgttcc ttcaagaggg gttttccgac atccataacg acccgaagcc 14100
tcatgaaagc attagggaag aacttttggt tcttcttgtc atggccttta taggtgtcag 14160
ccgagctcgc caattcccgt ccgactggct ccgcaaaata ttcgaacggc aagttatgga 14220
cttgcaacca taactccacg gtattgagca ggacctattg tgaagactca tctcatggag 14280
cttcagaatg tggttgtcag caaaccaatg accgaaatcc atcacatgac ggacgtccag 14340
tgggtgagcg aaacgaaaca ggaagcgcct atctttcaga gtcgtgagct ccacaccgga 14400
ttccggcaac tacgtgttgg gcaggcttcg ccgtattaga gatatgttga ggcagaccca 14460
tctgtgccac tcgtacaatt acgagagttg ttttttttgt gattttccta gtttctcgtt 14520
gatggtgagc tcatattcta catcgtatgg tctctcaacg tcgtttcctg tcatctgata 14580
tcccgtcatt tgcatccacg tgcgccgcct cccgtgccaa gtccctaggt gtcatgcacg 14640
ccaaattggt ggtggtgcgg gctgccctgt gcttcttacc gatgggtgga ggttgagttt 14700
gggggtctcc gcggcgatgg tagtgggttg acggtttggt gtgggttgac ggcattgatc 14760
aatttacttc ttgcttcaaa ttctttggca gaaaacaatt cattagatta gaactggaaa 14820
ccagagtgat gagacggatt aagtcagatt ccaacagagt tacatctctt aagaaataat 14880
gtaacccctt tagactttat atatttgcaa ttaaaaaaat aatttaactt ttagacttta 14940
tatatagttt taataactaa gtttaaccac tctattattt atatcgaaac tatttgtatg 15000
tctcccctct aaataaactt ggtattgtgt ttacagaacc tataatcaaa taatcaatac 15060
tcaactgaag tttgtgcagt taattgaagg gattaacggc caaaatgcac tagtattatc 15120
aaccgaatag attcacacta gatggccatt tccatcaata tcatcgccgt tcttcttctg 15180
tccacatatc ccctctgaaa cttgagagac acctgcactt cattgtcctt attacgtgtt 15240
acaaaatgaa acccatgcat ccatgcaaac tgaagaatgg cgcaagaacc cttcccctcc 15300
atttcttatg tggcgaccat ccatttcacc atctcccgct ataaaacacc cccatcactt 15360
cacctagaac atcatcacta cttgcttatc catccaaaag atacccactt ttacaacaat 15420
taccaacaac aacaaacaac aaacaacatt acaattacat ttacaattac cataccatgc 15480
cacctagcgc tgctaagcaa atgggagctt ctactggtgt tcatgctggt gttactgact 15540
cttctgcttt caccagaaag gatgttgctg atagacctga tctcaccatc gttggagatt 15600
ctgtttacga tgctaaggct ttcagatctg agcatcctgg tggtgctcat ttcgtttctt 15660
tgttcggagg aagagatgct actgaggctt tcatggaata ccatagaagg gcttggccta 15720
agtctagaat gtctagattc cacgttggat ctcttgcttc tactgaggaa cctgttgctg 15780
ctgatgaggg ataccttcaa ctttgtgcta ggatcgctaa gatggtgcct tctgtttctt 15840
ctggattcgc tcctgcttct tactgggtta aggctggact tatccttgga tctgctatcg 15900
ctcttgaggc ttacatgctt tacgctggaa agagacttct cccttctatc gttcttggat 15960
ggcttttcgc tcttatcggt cttaacatcc agcatgatgc taaccatggt gctttgtcta 16020
agtctgcttc tgttaacctt gctcttggac tttgtcagga ttggatcgga ggatctatga 16080
tcctttggct tcaagagcat gttgttatgc accacctcca cactaacgat gttgataagg 16140
atcctgatca aaaggctcac ggtgctctta gactcaagcc tactgatgct tggtcaccta 16200
tgcattggct tcagcatctt taccttttgc ctggtgagac tatgtacgct ttcaagcttt 16260
tgttcctcga catctctgag cttgttatgt ggcgttggga gggtgagcct atctctaagc 16320
ttgctggata cctctttatg ccttctttgc ttctcaagct taccttctgg gctagattcg 16380
ttgctttgcc tctttacctt gctccttctg ttcatactgc tgtgtgtatc gctgctactg 16440
ttatgactgg atctttctac ctcgctttct tcttcttcat ctcccacaac ttcgagggtg 16500
ttgcttctgt tggacctgat ggatctatca cttctatgac tagaggtgct agcttcctta 16560
agagacaagc tgagacttct tctaacgttg gaggacctct tcttgctact cttaacggtg 16620
gactcaacta ccaaattgag catcacttgt tccctagagt tcaccatgga ttctacccta 16680
gacttgctcc tcttgttaag gctgagcttg aggctagagg aatcgagtac aagcactacc 16740
ctactatctg gtctaacctt gcttctaccc tcagacatat gtacgctctt ggaagaaggc 16800
ctagatctaa ggctgagtaa tgacaagctt atgtgacgtg aaataataac ggtaaaatat 16860
atgtaataat aataataata aagccacaaa gtgagaatga ggggaagggg aaatgtgtaa 16920
tgagccagta gccggtggtg ctaattttgt atcgtattgt caataaatca tgaattttgt 16980
ggtttttatg tgttttttta aatcatgaat tttaaatttt ataaaataat ctccaatcgg 17040
aagaacaaca ttccatatcc atgcatggat gtttctttac ccaaatctag ttcttgagag 17100
gatgaagcat caccgaacag ttctgcaact atccctcaaa agctttaaaa tgaacaacaa 17160
ggaacagagc aacgttccaa agatcccaaa cgaaacatat tatctatact aatactatat 17220
tattaattac tactgcccgg aatcacaatc cctgaatgat tcctattaac tacaagcctt 17280
gttggcggcg gagaagtgat cggcgcggcg agaagcagcg gactcggaga cgaggccttg 17340
gaagatctga gtcgaacggg cagaatcagt attttccttc gacgttaatt gatcctacac 17400
tatgtaggtc atatccatcg ttttaatttt tggccaccat tcaattctgt cttgccttta 17460
gggatgtgaa tatgaacggc caaggtaaga gaataaaaat aatccaaatt aaagcaagag 17520
aggccaagta agataatcca aatgtacact tgtcattgcc aaaattagta aaatactcgg 17580
catattgtat tcccacacat tattaaaata ccgtatatgt attggctgca tttgcatgaa 17640
taatactacg tgtaagccca aaagaaccca cgtgtagccc atgcaaagtt aacactcacg 17700
accccattcc tcagtctcca ctatataaac ccaccatccc caatctcacc aaacccacca 17760
cacaactcac aactcactct cacaccttaa agaaccaatc accaccaaaa attttacaac 17820
aattaccaac aacaacaaac aacaaacaac attacaatta catttacaat taccatacca 17880
tgagcgctgt taccgttact ggatctgatc ctaagaacag aggatcttct agcaacaccg 17940
agcaagaggt tccaaaagtt gctatcgata ccaacggaaa cgtgttctct gttcctgatt 18000
tcaccatcaa ggacatcctt ggagctatcc ctcatgagtg ttacgagaga agattggcta 18060
cctctctcta ctacgtgttc agagatatct tctgcatgct taccaccgga taccttaccc 18120
ataagatcct ttaccctctc ctcatctctt acacctctaa cagcatcatc aagttcactt 18180
tctgggccct ttacacttac gttcaaggac ttttcggaac cggaatctgg gttctcgctc 18240
atgagtgtgg acatcaagct ttctctgatt acggaatcgt gaacgatttc gttggatgga 18300
cccttcactc ttaccttatg gttccttact tcagctggaa gtactctcat ggaaagcacc 18360
ataaggctac tggacacatg accagagata tggttttcgt tcctgccacc aaagaggaat 18420
tcaagaagtc taggaacttc ttcggtaacc tcgctgagta ctctgaggat tctccactta 18480
gaacccttta cgagcttctt gttcaacaac ttggaggatg gatcgcttac ctcttcgtta 18540
acgttacagg acaaccttac cctgatgttc cttcttggaa atggaaccac ttctggctta 18600
cctctccact tttcgagcaa agagatgctc tctacatctt cctttctgat cttggaatcc 18660
tcacccaggg aatcgttctt actctttggt acaagaaatt cggaggatgg tcccttttca 18720
tcaactggtt cgttccttac atctgggtta accactggct cgttttcatc acattccttc 18780
agcacactga tcctactatg cctcattaca acgctgagga atggactttc gctaagggtg 18840
ctgctgctac tatcgataga aagttcggat tcatcggacc tcacatcttc catgatatca 18900
tcgagactca tgtgcttcac cactactgtt ctaggatccc attctacaac gctagacctg 18960
cttctgaggc tatcaagaaa gttatgggaa agcactacag gtctagcgac gagaacatgt 19020
ggaagtcact ttggaagtct ttcaggtctt gccaatacgt tgacggtgat aacggtgttc 19080
tcatgttccg taacatcaac aactgcggag ttggagctgc tgagaagtaa tgaaggggtg 19140
atcgattatg agatcgtaca aagacactgc taggtgttaa ggatggataa taataataat 19200
aatgagatga atgtgtttta agttagtgta acagctgtaa taaagagaga gagagagaga 19260
gagagagaga gagagagaga gagagagaga gagaggctga tgaaatgtta tgtatgtttc 19320
ttggttttta aaataaatga aagcacatgc tcgtgtggtt ctatcgaatt attcggcggt 19380
tcctgtggga aaaagtccag aagggccgcc gcagctacta ctacaaccaa ggccgtggag 19440
gagggcaaca gagccagcac ttcgatagct gctgcgatga tcttaagcaa ttgaggagcg 19500
agtgcacatg caggggactg gagcgtgcaa tcggccagat gaggcaggac atccagcagc 19560
agggacagca gcaggaagtt gagaggtggt cccatcaatc taaacaagtc gctagggacc 19620
ttccgggaca gtgcggcacc cagcctagcc gatgccagct ccaggggcag cagcagtctg 19680
catggttttg aagtggtgat cgatgagatc gtataaagac actgctaggt gttaaggatg 19740
ggataataag atgtgtttta agtcattaac cgtaataaaa agagagagag gctgatggaa 19800
tgttatgtat gtatgtttct tggtttttaa aattaaatgg aaagcacatg ctcgtgtggg 19860
ttctatctcg attaaaaatc ccaattatat ttggtctaat ttagtttggt attgagtaaa 19920
acaaattcga accaaaccaa aatataaata tatagttttt atatatatgc ctttaagact 19980
ttttatagaa ttttctttaa aaaatatcta gaaatatttg cgactcttct ggcatgtaat 20040
atttcgttaa atatgaagtg ctccattttt attaacttta aataattggt tgtacgatca 20100
ctttcttatc aagtgttact aaaatgcgtc aatctctttg ttcttccata ttcatatgtc 20160
aaaatctatc aaaattctta tatatctttt tcgaatttga agtgaaattt cgataattta 20220
aaattaaata gaacatatca ttatttaggt atcatattga tttttatact taattactaa 20280
atttggttaa ctttgaaagt gtacatcaac gaaaaattag tcaaacgact aaaataaata 20340
aatatcatgt gttattaaga aaattctcct ataagaatat tttaatagat catatgtttg 20400
taaaaaaaat taatttttac taacacatat atttacttat caaaaatttg acaaagtaag 20460
attaaaataa tattcatcta acaaaaaaaa aaccagaaaa tgctgaaaac ccggcaaaac 20520
cgaaccaatc caaaccgata tagttggttt ggtttgattt tgatataaac cgaaccaact 20580
cggtccattt gcacccctaa tcataatagc tttaatattt caagatatta ttaagttaac 20640
gttgtcaata tcctggaaat tttgcaaaat gaatcaagcc tatatggctg taatatgaat 20700
ttaaaagcag ctcgatgtgg tggtaatatg taatttactt gattctaaaa aaatatccca 20760
agtattaata atttctgcta ggaagaaggt tagctacgat ttacagcaaa gccagaatac 20820
aaagaaccat aaagtgattg aagctcgaaa tatacgaagg aacaaatatt tttaaaaaaa 20880
tacgcaatga cttggaacaa aagaaagtga tatatttttt gttcttaaac aagcatcccc 20940
tctaaagaat ggcagttttc ctttgcatgt aactattatg ctcccttcgt tacaaaaatt 21000
ttggactact attgggaact tcttctgaaa atagtcctgc aggctagtag attggttggt 21060
tggtttccat gtaccagaag gcttacccta ttagttgaaa gttgaaactt tgttccctac 21120
tcaattccta gttgtgtaaa tgtatgtata tgtaatgtgt ataaaacgta gtacttaaat 21180
gactaggagt ggttcttgag accgatgaga gatgggagca gaactaaaga tgatgacata 21240
attaagaacg aatttgaaag gctcttaggt ttgaatccta ttcgagaatg tttttgtcaa 21300
agatagtggc gattttgaac caaagaaaac atttaaaaaa tcagtatccg gttacgttca 21360
tgcaaataga aagtggtcta ggatctgatt gtaattttag acttaaagag tctcttaaga 21420
ttcaatcctg gctgtgtaca aaactacaaa taatatattt tagactattt ggccttaact 21480
aaacttccac tcattattta ctgaggttag agaatagact tgcgaataaa cacattcccg 21540
agaaatactc atgatcccat aattagtcag agggtatgcc aatcagatct aagaacacac 21600
attccctcaa attttaatgc acatgtaatc atagtttagc acaattcaaa aataatgtag 21660
tattaaagac agaaatttgt agactttttt ttggcgttaa aagaagacta agtttatacg 21720
tacattttat tttaagtgga aaaccgaaat tttccatcga aatatatgaa tttagtatat 21780
atatttctgc aatgtactat tttgctattt tggcaacttt cagtggacta ctactttatt 21840
acaatgtgta tggatgcatg agtttgagta tacacatgtc taaatgcatg ctttgtaaaa 21900
cgtaacggac cacaaaagag gatccataca aatacatctc atagcttcct ccattatttt 21960
ccgacacaaa cagagcattt tacaacaatt accaacaaca acaaacaaca aacaacatta 22020
caattacatt tacaattacc ataccatgga atttgctcaa cctctcgttg ctatggctca 22080
agagcagtac gctgctatcg atgctgttgt tgctcctgct atcttctctg ctaccgactc 22140
tattggatgg ggactcaagc ctatctcttc tgctactaag gatctccctc tcgttgaatc 22200
tcctacccct cttatccttt ctctcctcgc ttacttcgct atcgttggtt ctggactcgt 22260
ttaccgtaaa gtgttcccta gaaccgttaa gggacaggat cctttccttc tcaaggctct 22320
tatgctcgct cacaacgttt tccttatcgg actcagcctt tacatgtgcc tcaagctcgt 22380
ttacgaggct tacgtgaaca agtactcctt ctggggaaac gcttacaacc ctgctcaaac 22440
cgagatggct aaggtgatct ggatcttcta cgtgtccaag atctacgagt tcatggacac 22500
cttcatcatg cttctcaagg gaaacgttaa ccaggtttcc ttcctccatg tttaccacca 22560
cggatctatc tctggaatct ggtggatgat cacttatgct gctccaggtg gagatgctta 22620
cttctctgct gctctcaact cttgggttca tgtgtgcatg tacacctact acttcatggc 22680
tgctgttctt cctaaggacg aaaagaccaa gagaaagtac ctttggtggg gaagatacct 22740
tacccagatg caaatgttcc agttcttcat gaaccttctc caggctgttt acctcctcta 22800
ctcttcttct ccttacccta agttcattgc tcaactcctc gttgtttaca tggttaccct 22860
cctcatgctt ttcggaaact tctactacat gaagcaccac gcttctaagt gataagggcc 22920
gccgccatgt gacagatcga aggaagaaag tgtaataaga cgactctcac tactcgatcg 22980
ctagtgattg tcattgttat atataataat gttatctttc acaacttatc gtaatgcatg 23040
tgaaactata acacattaat cctacttgtc atatgataac actctcccca tttaaaactc 23100
ttgtcaattt aaagatataa gattctttaa atgattaaaa aaaatatatt ataaattcaa 23160
tcactcctac taataaatta ttaattatta tttattgatt aaaaaaatac ttatactaat 23220
ttagtctgaa tagaataatt agattctagc ctgcagggcg gccgcggatc ccatggagtc 23280
aaagattcaa atagaggacc taacagaact cgccgtaaag actggcgaac agttcataca 23340
gagtctctta cgactcaatg acaagaagaa aatcttcgtc aacatggtgg agcacgacac 23400
acttgtctac tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac 23460
ttttcaacaa agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca 23520
ctttattgtg aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa 23580
aggaaaggcc atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc 23640
cacgaggagc atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg 23700
atgtgatatc tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc 23760
ttcctctata taaggaagtt catttcattt ggagagaaca cgggggactg aattaaatat 23820
gagccctgag aggcgtcctg ttgaaatcag acctgctact gctgctgata tggctgctgt 23880
ttgtgatatc gtgaaccact acatcgagac ttctaccgtt aacttcagaa ctgagcctca 23940
aactcctcaa gagtggatcg atgatcttga gagactccaa gatagatacc cttggcttgt 24000
tgctgaggtt gagggtgttg ttgctggaat cgcttacgct ggaccttgga aggctagaaa 24060
cgcttacgat tggactgttg agtctaccgt ttacgtttca cacagacatc agagacttgg 24120
acttggatct accctttaca ctcaccttct caagtctatg gaagctcagg gattcaagtc 24180
tgttgttgct gttatcggac tccctaacga tccttctgtt agacttcatg aggctcttgg 24240
atacactgct agaggaactc ttagagctgc tggatacaag cacggtggat ggcatgatgt 24300
tggattctgg caaagagatt tcgagcttcc tgctcctcct agacctgtta gaccagttac 24360
tcagatctga atttgcgtga tcgttcaaac atttggcaat aaagtttctt aagattgaat 24420
cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta 24480
ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 24540
caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 24600
tcgcgcgcgg tgtcatctat gttactagat cactagtgat gtacggttaa aaccacccca 24660
gtacattaaa aacgtccgca atgtgttatt aagttgtcta agcgtcaatt tgtttacacc 24720
acaatatatc ctgccaccag ccagccaaca gctccccgac cggcagctcg gcacaaaatc 24780
accactcgat acaggcagcc catcagtcc 24809
&lt;210&gt; 6
&lt;211&gt; 26543
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pGA7- mod_F nucleotide sequence
&lt;400&gt; 6
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgggcggccg cctagaatct aattattcta ttcagactaa 240
attagtataa gtattttttt aatcaataaa tattaattaa taatttatta gtaggagtga 300
ttgaatttat aatatatttt ttttaatcat ttaaagaatc ttatatcttt aaattgacaa 360
gagttttaaa tggggagagt gttatcatat gacaagtagg attaatgtgt tatagtttca 420
catgcattac gataagttgt gaaagataac attattatat ataacaatga caatcactag 480
cgatcgagta gtgagagtcg tcttattaca ctttcttcct tcgatctgtc acatggcggc 540
ggcccgcgat cgcgataatt ctcagtgcgc cttctccgcc ttgccgttga cgtagtagtg 600
ctgcccgacc ttatccaagt tcgagaacgt cgccttccag gcgccgtaat aggacagcac 660
cttgtagttc agcccccact tcttcgcgaa cgggacgaac cgccggctca cctccggctg 720
gcgaaactgc ggcatgtccg ggaacaggtg atgaatgacc tggcagttca gatatcccat 780
caaccagttc acgtacccgc gcgacgggtc gatgtccacg gtgtgatcga ccgcgtagtt 840
cacccagctc aggtgcttat ccgagggcac gaccgggagg tgcgtgtggc tcgtggagaa 900
gtgcgcgaag aggtacatgt acgcgatcca gttgccgaag gtgaaccacc agtacgcgac 960
gggccacgag taccccgtcg cgagtttaat caccgcggtc ctgacgacgt gagagacgag 1020
catccacgac gcctcctcgt agttcttctt tcgcaacacc tgccgcgggt gcaggacgta 1080
gatccagaac gcctggacga gcagcccgga ggtcaccggg acgaacgtcc acgcctgaag 1140
ccgagcccac gcgcgggaga accccctcgg ccggttgtcc tccacggcgg tgttaaaaaa 1200
cgccaccgcg ggggtcgtgt ccaggtccat gtcgtgcctc actttctgcg gcgtcgcgtg 1260
gtgcttattg tgcatctggt tccacatctc cccgctcgtg gacagcccga acccgcacgt 1320
catcgcttgg aggcgcttgt cgacgtagac ggaccccgtg agcgagttgt gcccgccctc 1380
gtgctggacc caaccgcacc gagcgccgaa gaacgcgccg tacacgacgg acgcgatgat 1440
cgggtacccg gcgtacatga gggcggtgcc gagggcgaag gtcgcgagga gctcgagtaa 1500
ccgatacgcg acgtgcgtta tcgagggctt aaagaacccg tcgcgttcga gctccgcgcg 1560
ccaccgcgcg aaatcctcca acatcggcgc gtcctcgctc tcgctgcgtt tgatctccgc 1620
ggggcgcgac ggcagcgctc tgagcatctt ccacgcctta agcgatcgca tgtggaactc 1680
cttgaacgcc tccgtggcgt ccgcgcccgt gttcgcgagc atgtagaata tcacgctgcc 1740
tcccgggtgt ttgaagtttg tgacgtcgta ctcgacgtcc tccacgcgca cccatcgcgt 1800
ctcgaacgtc gccgcgagct cgtgcggctc gagcgttttg agatcgacgg gcgcggtcga 1860
cgcgtccttg gcgtcgagcg cctccgcgga ggatttgctg cgcgtcagcg gcgatcgcgg 1920
ggacgatcgg ccgtccgtct tcggcgggca catcgtcgcg cgcgcgactt aaaccgacga 1980
cggacggacg aacctgcaac ggcgaattat caattgacgc gttgctctgt ttgtgtcgga 2040
aaataatgga ggaagctatg agatgtattt gcatggatcc tcttttgtgg tccgttacgt 2100
tttgcaaagc atgcatttag acatgtgtat actcaaactc atgcatccat acacattgta 2160
ataaagtagt agtccactga aagttgccaa aatagcaaaa tagtacattg cagaaatata 2220
tatactaaat tcatatattt cgatggaaaa tttcggtttt ccacttaaaa taaaatgtac 2280
gtataaactt agtcttcctt taacgccaaa aaaaagtcta caaatttctg tctttaatac 2340
tacattattt ttgaattgtg ctaaactatg attacatgtg cattaaaatt tgagggaatg 2400
tgtgttctta gatctgattg gcataccctc tgactaatta tgggatcatg agtatttctc 2460
gggaatgtgt ttattcgcaa gtctattctc taacctcagt aaataatgag tggaagttta 2520
gttaaggcca aatagtctaa aatatattat ttgtagtttt gtacacagcc aggattgaat 2580
cttaagagac tctttaagtc taaaattaca atcagatcct agaccacttt ctatttgcat 2640
gaacgtaacc ggatactgat tttttaaatg ttttctttgg ttcaaaatcg ccactatctt 2700
tgacaaaaac attctcgaat aggattcaaa cctaagagcc tttcaaattc gttcttaatt 2760
atgtcatcat ctttagttct gctcccatct ctcatcggtc tcaagaacca ctcctagtca 2820
tttaagtact acgttttata cgcattacat atacatacat ttacacaact aggaattgag 2880
tagggaacaa agtttcaact ttcaactaat agggtaagcc ttctggtaca tggaaaccaa 2940
ccaaccaatc tactaggcgg ccgcccgtcg ggatcttctg caagcatctc tatttcctga 3000
aggtctaacc tcgaagattt aagatttaat tacgtttata attacaaaat tgattctagt 3060
atctttaatt taatgcttat acattattaa ttaatttagt actttcaatt tgttttcaga 3120
aattatttta ctatttttta taaaataaaa gggagaaaat ggctatttaa actgaaggcg 3180
ggaaacgaca atctgctagt ggatctccca gtcacgacgt tgtaaaacgg gcgccccgcg 3240
gaaagcttgc ggccgcggta ccgcccgttc gactcagatc ttccaaggcc tcgtctccga 3300
gtccgctgct tctcgccgcg ccgatcactt ctccgccgcc aacaaggctt gtagttaata 3360
ggaatcattc agggattgtg attccgggca gtagtaatta ataatatagt attagtatag 3420
ataatatgtt tcgtttggga tctttggaac gttgctctgt tccttgttgt tcattttaaa 3480
gcttttgagg gatagttgca gaactgttcg gtgatgcttc atcctctcaa gaactagatt 3540
tgggtaaaga aacatccatg catggatatg gaatgttgtt cttccgattg gagattattt 3600
tataaaattt aaaattcatg atttaaaaaa acacataaaa accacaaaat tcatgattta 3660
ttgacaatac gatacaaaat tagcaccacc ggctactggc tcattacaca tttccccttc 3720
ccctcattct cactttgtgg ctttattatt attattatta catatatttt accgttatta 3780
tttcacgtca cataagcttg ttaattaatc attagtgagc cttctcagcc tttccgttaa 3840
cgtagtagtg ctgtcccacc ttatcaaggt tagagaaagt agccttccaa gcaccgtagt 3900
aagagagcac cttgtagttg agtccccact tcttagcgaa aggaacgaat cttctgctaa 3960
cctcaggctg tctgaattga ggcatatcag ggaagaggtg gtggataacc tgacagttaa 4020
ggtatcccat aagccagttc acgtatcctc tagaaggatc gatatcaacg gtgtgatcaa 4080
cagcgtagtt aacccaagaa aggtgcttat cagatggaac aacagggagg tgagtatgag 4140
aagtagagaa gtgagcgaaa aggtacatgt aagcgatcca gtttccgaaa gtgaaccacc 4200
agtaagcaac aggccaagag tatccagtag caagcttgat aacagcggtt ctaacaacat 4260
gagaaacgag catccaagaa gcctcttcgt agttcttctt acggagaact tgtctagggt 4320
ggagaacgta gatccagaaa gcttgaacaa gaagtccaga ggtaacagga acgaaagtcc 4380
aagcttgaag tctagcccaa gctctagaga atcctctagg tctgttatcc tcaacagcag 4440
tgttgaagaa agccacagca ggagtggtat caagatccat atcgtgtcta accttttgag 4500
gggtagcatg gtgcttgtta tgcatctggt tccacatctc accagaagta gaaagtccga 4560
atccacaagt catagcctga agtctcttgt ccacgtaaac agatccggta agagagttat 4620
gtccaccctc atgttgaacc catccacatc tagctccgaa gaaagcaccg taaacaacag 4680
aagcaatgat agggtatcca gcgtacataa gagcagttcc aagagcgaat gtagcaagaa 4740
gctcgagaag tctgtaagcc acatgggtga tagaaggctt gaagaatcca tctctctcaa 4800
gctcagcacg ccatctagcg aaatcctcaa gcataggagc atcctcagac tcagatctct 4860
tgatctcagc aggtctagaa ggcaaagctc taagcatctt ccaagccttg agagaacgca 4920
tgtggaattc tttgaaagcc tcagtagcat cagcaccagt gttagcaagc atgtagaaga 4980
tcacagatcc accagggtgc ttgaagttag tcacatcgta ctcaacgtcc tcaactctaa 5040
cccatctagt ctcgaaagta gcagcaagct catgaggctc aagagtctta agatcaacag 5100
gagcagtaga agcatcctta gcatcaagag cctcagcaga agatttagac ctggtaagtg 5160
gagatctagg agaagatctt ccatcagtct taggagggca catggtatgg taattgtaaa 5220
tgtaattgta atgttgtttg ttgtttgttg ttgttggtaa ttgttgtaaa attaattaag 5280
tgggtatctt ttggatggat aagcaagtag tgatgatgtt ctaggtgaag tgatgggggt 5340
gttttatagc gggagatggt gaaatggatg gtcgccacat aagaaatgga ggggaagggt 5400
tcttgcgcca ttcttcagtt tgcatggatg catgggtttc attttgtaac acgtaataag 5460
gacaatgaag tgcaggtgtc tctcaagttt cagaggggat atgtggacag aagaagaacg 5520
gcgatgatat tgatggaaat ggccatctag tgtgaatcta ttcggttgat aatactagtg 5580
cattttggcc gttaatccct tcaattaact gcacaaactt cagttgagta ttgattattt 5640
gattataggt tctgtaaaca caataccaag tttatttaga ggggagacat acaaatagtt 5700
tcgatataaa taatagagtg gttaaactta gttattaaaa ctatatataa agtctaaaag 5760
ttaaattatt tttttaattg caaatatata aagtctaaag gggttacatt atttcttaag 5820
agatgtaact ctgttggaat ctgacttaat ccgtctcatc actctggttt ccagttctaa 5880
tctaatgaat tgttttctgc caaagaattt gaagcaagaa gtaaattgat caatgccgtc 5940
aacccacacc aaaccgtcaa cccactacca tcgccgcgga gacccccaaa ctcaacctcc 6000
acccatcggt aagaagcaca gggcagcccg caccaccacc aatttggcgt gcatgacacc 6060
tagggacttg gcacgggagg cggcgcacgt ggatgcaaat gacgggatat cagatgacag 6120
gaaacgacgt tgagagacca tacgatgtag aatatgagct caccatcaac gagaaactag 6180
gaaaatcaca aaaaaaacaa ctctcgtaat tgtacgagtg gcacagatgg gtctgcctca 6240
acatatctct aatacggcga agcctgccca acacgtagtt gccggaatcc ggtgtggagc 6300
tcacgactct gaaagatagg cgcttcctgt ttcgtttcgc tcacccactg gacgtccgtc 6360
atgtgatgga tttcggtcat tggtttgctg acaaccacat tctgaagctc catgagatga 6420
gtcttcacaa taggtcctgc tcaataccgt ggagttatgg ttgcaagtcc ataacttgcc 6480
gttcgaatat tttgcggagc cagtcggacg ggaattggcg agctcggctg acacctataa 6540
aggccatgac aagaagaacc aaaagttctt ccctaatgct ttcatgaggc ttcgggtcgt 6600
tatggatgtc ggaaaacccc tcttgaagga acgagacgtt attatgcatg acggtaagac 6660
tattacttgt cagtataagt atgaaagatt acctgtcttc tgctttgttt gtggattgat 6720
tggacacgtt gaaaaaaaat gtgcacttcg atttcaatac tcagagatcg acttcccttt 6780
tctctaggag tattcgatca aggcattaac atggaaggaa gctcaagctc taaaggcttc 6840
acaatggaac ctgaaaaatt tcaacaagcc taaactgaaa tcgaagtcaa atcacccaac 6900
cgggagctct aaatcagcaa acactcctcc tccacagtat ccaatcatcg tgcacgatgc 6960
tccaggtatt gcaagccagg tattgcaagc taggagtagg atagagacct taaacgtcgt 7020
tggtgtgaag agtcatcttc agacctaatg gagatagatg tagacggcgg cacgaagact 7080
ctgaaacacc agaaaggcta gtccaggata aggatctgct atcccaactg acctctcgtt 7140
agtcccaagg cctctcaact agagcaggag gaaggatggt cacaagacta ggataatgat 7200
gtttccaata tgaacctgaa tgtccatagc taattttttt agtcttgctt ctgcactttt 7260
tgtttattat gttctggtga ctatgttatt tacccttgtc cgtatgcttg agggtaccct 7320
agtagattgg ttggttggtt tccatgtacc agaaggctta ccctattagt tgaaagttga 7380
aactttgttc cctactcaat tcctagttgt gtaaatgtat gtatatgtaa tgtgtataaa 7440
acgtagtact taaatgacta ggagtggttc ttgagaccga tgagagatgg gagcagaact 7500
aaagatgatg acataattaa gaacgaattt gaaaggctct taggtttgaa tcctattcga 7560
gaatgttttt gtcaaagata gtggcgattt tgaaccaaag aaaacattta aaaaatcagt 7620
atccggttac gttcatgcaa atagaaagtg gtctaggatc tgattgtaat tttagactta 7680
aagagtctct taagattcaa tcctggctgt gtacaaaact acaaataata tattttagac 7740
tatttggcct taactaaact tccactcatt atttactgag gttagagaat agacttgcga 7800
ataaacacat tcccgagaaa tactcatgat cccataatta gtcagagggt atgccaatca 7860
gatctaagaa cacacattcc ctcaaatttt aatgcacatg taatcatagt ttagcacaat 7920
tcaaaaataa tgtagtatta aagacagaaa tttgtagact tttttttggc gttaaaagaa 7980
gactaagttt atacgtacat tttattttaa gtggaaaacc gaaattttcc atcgaaatat 8040
atgaatttag tatatatatt tctgcaatgt actattttgc tattttggca actttcagtg 8100
gactactact ttattacaat gtgtatggat gcatgagttt gagtatacac atgtctaaat 8160
gcatgctttg taaaacgtaa cggaccacaa aagaggatcc atacaaatac atctcatagc 8220
ttcctccatt attttccgac acaaacagag cattttacaa caattaccaa caacaacaaa 8280
caacaaacaa cattacaatt acatttacaa ttaccatacc atggcctcta tcgctatccc 8340
tgctgctctt gctggaactc ttggatacgt tacctacaat gtggctaacc ctgatatccc 8400
agcttctgag aaagttcctg cttacttcat gcaggttgag tactggggac ctactatcgg 8460
aactattgga tacctcctct tcatctactt cggaaagcgt atcatgcaga acagatctca 8520
acctttcgga ctcaagaacg ctatgctcgt ttacaacttc taccagacct tcttcaacag 8580
ctactgcatc taccttttcg ttacttctca tagggctcag ggacttaagg tttggggaaa 8640
catccctgat atgactgcta actcttgggg aatctctcag gttatctggc ttcactacaa 8700
caacaagtac gttgagcttc tcgacacctt cttcatggtg atgaggaaga agttcgacca 8760
gctttctttc cttcacatct accaccacac tcttctcatc tggtcatggt tcgttgttat 8820
gaagcttgag cctgttggag attgctactt cggatcttct gttaacacct tcgtgcacgt 8880
gatcatgtac tcttactacg gacttgctgc tcttggagtt aactgtttct ggaagaagta 8940
catcacccag atccagatgc ttcagttctg tatctgtgct tctcactcta tctacaccgc 9000
ttacgttcag aataccgctt tctggcttcc ttaccttcaa ctctgggtta tggtgaacat 9060
gttcgttctc ttcgccaact tctaccgtaa gaggtacaag tctaagggtg ctaagaagca 9120
gtgataaggc gcgcggcgcg ccgggccgcc gccatgtgac agatcgaagg aagaaagtgt 9180
aataagacga ctctcactac tcgatcgcta gtgattgtca ttgttatata taataatgtt 9240
atctttcaca acttatcgta atgcatgtga aactataaca cattaatcct acttgtcata 9300
tgataacact ctccccattt aaaactcttg tcaatttaaa gatataagat tctttaaatg 9360
attaaaaaaa atatattata aattcaatca ctcctactaa taaattatta attattattt 9420
attgattaaa aaaatactta tactaattta gtctgaatag aataattaga ttctagtctc 9480
atcccctttt aaaccaactt agtaaacgtt ttttttttta attttatgaa gttaagtttt 9540
taccttgttt ttaaaaagaa tcgttcataa gatgccatgc cagaacatta gctacacgtt 9600
acacatagca tgcagccgcg gagaattgtt tttcttcgcc acttgtcact cccttcaaac 9660
acctaagagc ttctctctca cagcacacac atacaatcac atgcgtgcat gcattattac 9720
acgtgatcgc catgcaaatc tcctttatag cctataaatt aactcatccg cttcactctt 9780
tactcaaacc aaaactcatc gatacaaaca agattaaaaa catacacgag gatcttttac 9840
aacaattacc aacaacaaca aacaacaaac aacattacaa ttacatttac aattaccata 9900
ccatgcctcc aagggactct tactcttatg ctgctcctcc ttctgctcaa cttcacgaag 9960
ttgatactcc tcaagagcac gacaagaaag agcttgttat cggagatagg gcttacgatg 10020
ttaccaactt cgttaagaga caccctggtg gaaagatcat tgcttaccaa gttggaactg 10080
atgctaccga tgcttacaag cagttccatg ttagatctgc taaggctgac aagatgctta 10140
agtctcttcc ttctcgtcct gttcacaagg gatactctcc aagaagggct gatcttatcg 10200
ctgatttcca agagttcacc aagcaacttg aggctgaggg aatgttcgag ccttctcttc 10260
ctcatgttgc ttacagactt gctgaggtta tcgctatgca tgttgctggt gctgctctta 10320
tctggcatgg atacactttc gctggaatcg ctatgcttgg agttgttcag ggaagatgtg 10380
gatggcttat gcatgagggt ggacattact ctctcactgg aaacattgct ttcgacagag 10440
ctatccaagt tgcttgttac ggacttggat gtggaatgtc tggtgcttgg tggcgtaacc 10500
agcataacaa gcaccatgct actcctcaaa agcttcagca cgatgttgat cttgataccc 10560
ttcctctcgt tgctttccat gagagaatcg ctgctaaggt taagtctcct gctatgaagg 10620
cttggctttc tatgcaagct aagcttttcg ctcctgttac cactcttctt gttgctcttg 10680
gatggcagct ttaccttcat cctagacaca tgctcaggac taagcactac gatgagcttg 10740
ctatgctcgg aatcagatac ggacttgttg gataccttgc tgctaactac ggtgctggat 10800
acgttctcgc ttgttacctt ctttacgttc agcttggagc tatgtacatc ttctgcaact 10860
tcgctgtttc tcatactcac ctccctgttg ttgagcctaa cgagcatgct acttgggttg 10920
agtacgctgc taaccacact actaactgtt ctccatcttg gtggtgtgat tggtggatgt 10980
cttaccttaa ctaccagatc gagcaccacc tttacccttc tatgcctcaa ttcagacacc 11040
ctaagatcgc tcctagagtt aagcagcttt tcgagaagca cggacttcac tacgatgtta 11100
gaggatactt cgaggctatg gctgatactt tcgctaacct tgataacgtt gcccatgctc 11160
ctgagaagaa aatgcagtaa tgagatcgtt caaacatttg gcaataaagt ttcttaagat 11220
tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 11280
acgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag 11340
tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 11400
aattatcgcg cgcggtgtca tctatgttac tagatcggtc gattaaaaat cccaattata 11460
tttggtctaa tttagtttgg tattgagtaa aacaaattcg aaccaaacca aaatataaat 11520
atatagtttt tatatatatg cctttaagac tttttataga attttcttta aaaaatatct 11580
agaaatattt gcgactcttc tggcatgtaa tatttcgtta aatatgaagt gctccatttt 11640
tattaacttt aaataattgg ttgtacgatc actttcttat caagtgttac taaaatgcgt 11700
caatctcttt gttcttccat attcatatgt caaaatctat caaaattctt atatatcttt 11760
ttcgaatttg aagtgaaatt tcgataattt aaaattaaat agaacatatc attatttagg 11820
tatcatattg atttttatac ttaattacta aatttggtta actttgaaag tgtacatcaa 11880
cgaaaaatta gtcaaacgac taaaataaat aaatatcatg tgttattaag aaaattctcc 11940
tataagaata ttttaataga tcatatgttt gtaaaaaaaa ttaattttta ctaacacata 12000
tatttactta tcaaaaattt gacaaagtaa gattaaaata atattcatct aacaaaaaaa 12060
aaaccagaaa atgctgaaaa cccggcaaaa ccgaaccaat ccaaaccgat atagttggtt 12120
tggtttgatt ttgatataaa ccgaaccaac tcggtccatt tgcaccccta atcataatag 12180
ctttaatatt tcaagatatt attaagttaa cgttgtcaat atcctggaaa ttttgcaaaa 12240
tgaatcaagc ctatatggct gtaatatgaa tttaaaagca gctcgatgtg gtggtaatat 12300
gtaatttact tgattctaaa aaaatatccc aagtattaat aatttctgct aggaagaagg 12360
ttagctacga tttacagcaa agccagaata caaagaacca taaagtgatt gaagctcgaa 12420
atatacgaag gaacaaatat ttttaaaaaa atacgcaatg acttggaaca aaagaaagtg 12480
atatattttt tgttcttaaa caagcatccc ctctaaagaa tggcagtttt cctttgcatg 12540
taactattat gctcccttcg ttacaaaaat tttggactac tattgggaac ttcttctgaa 12600
aatagtgata gaacccacac gagcatgtgc tttccattta attttaaaaa ccaagaaaca 12660
tacatacata acattccatc agcctctctc tctttttatt acggttaatg acttaaaaca 12720
catcttatta tcccatcctt aacacctagc agtgtcttta tacgatctca tcgatcacca 12780
cttcaaaacc atgcagactg ctgctgcccc tggagctggc atcggctagg ctgggtgccg 12840
cactgtcccg gaaggtccct agcgacttgt ttagattgat gggaccacct ctcaacttcc 12900
tgctgctgtc cctgctgctg gatgtcctgc ctcatctggc cgattgcacg ctccagtccc 12960
ctgcatgtgc actcgctcct caattgctta agatcatcgc agcagctatc gaagtgctgg 13020
ctctgttgcc ctcctccacg gccttggttg tagtagtagc tgccgccgcc cttctggact 13080
ttttcccaca ggaaccgccg aataattcga tagaaccaca cgagcatgtg ctttcattta 13140
ttttaaaaac caagaaacat acataacatt tcatcagcct ctctctctct ctctctctct 13200
ctctctctct ctctctctct ctctctctct ttattacagc tgttacacta acttaaaaca 13260
cattcatctc attattatta ttattatcca tccttaacac ctagcagtgt ctttgtacga 13320
tctcataatc gatcacccct tcatcaggta tccttaggct tcactccaac gttgttgcag 13380
ttacggaaca tgtacacacc atcatggttc tcaacgaact ggcaagatct ccaagttttc 13440
caaaggctaa cccacatgtt ctcatcggtg tgtctgtagt gctctcccat aactttcttg 13500
atgcactcgg tagcttctct agcatggtag aatgggatcc ttgaaacgta gtgatggagc 13560
acatgagtct cgatgatgtc atggaagatg attccgagga ttccgaactc tctatcgata 13620
gtagcagcag cacccttagc gaaagtccac tcttgagcat cgtaatgagg catagaagaa 13680
tcggtgtgct gaaggaaggt aacgaaaaca agccagtggt taacaaggat ccaaggacag 13740
aaccatgtga tgaaagtagg ccagaatccg aaaaccttgt aagcggtgta aacagaagtg 13800
agggtagcaa ggattccaag atcagaaaga acgatgtacc agtagtcctt cttatcgaaa 13860
acagggctag aaggccagta gtgagacttg aagaacttag aaacaccagg gtaaggttgt 13920
ccagtagcgt tagtagcaag gtaaagagaa agtcctccaa gctgttggaa caagagagcg 13980
aaaacagagt agataggagt ttcctcagcg atatcgtgaa ggctggtaac ttggtgcttc 14040
tctttgaatt cctcggcggt gtaaggaacg aaaaccatat ctctggtcat gtgtccagta 14100
gccttatggt gcttagcatg agagaacttc cagctgaagt aaggaaccat aacaagagag 14160
tggagaaccc atccaacggt atcgttaacc catccgtagt tagagaaagc agaatgtcca 14220
cactcatgtc caaggatcca gattccgaat ccgaaacaag agatagagaa cacgtaagca 14280
gaccaagcag cgaatctaag gaattcgtta gggagaagag ggatgtaggt aagtccaacg 14340
taagcgatag cagagatagc cacgatatct ctcaccacgt aagacataga cttcacgaga 14400
gatctctcgt aacagtgctt agggatagcg tcaaggatat ccttgatggt gtaatctggc 14460
accttgaaaa cgtttccgaa ggtatcgata gcggtctttt gctgcttgaa agatgcaacg 14520
tttccagaac gcctaacggt cttagtagat ccctcaagga tctcagatcc agacacggta 14580
accttagaca tggtatggta attgtaaatg taattgtaat gttgtttgtt gtttgttgtt 14640
gttggtaatt gttgtaaaat ttttggtggt gattggttct ttaaggtgtg agagtgagtt 14700
gtgagttgtg tggtgggttt ggtgagattg gggatggtgg gtttatatag tggagactga 14760
ggaatggggt cgtgagtgtt aactttgcat gggctacacg tgggttcttt tgggcttaca 14820
cgtagtatta ttcatgcaaa tgcagccaat acatatacgg tattttaata atgtgtggga 14880
atacaatatg ccgagtattt tactaatttt ggcaatgaca agtgtacatt tggattatct 14940
tacttggcct ctcttgcttt aatttggatt atttttattc tcttaccttg gccgttcata 15000
ttcacatccc taaaggcaag acagaattga atggtggcca aaaattaaaa cgatggatat 15060
gacctacata gtgtaggatc aattaacgtc gaaggaaaat actgattctc tcaagcatac 15120
ggacaagggt aaataacata gtcaccagaa cataataaac aaaaagtgca gaagcaagac 15180
taaaaaaatt agctatggac attcaggttc atattggaaa catcattatc ctagtcttgt 15240
gaccatcctt cctcctgctc tagttgagag gccttgggac taacgagagg tcagttggga 15300
tagcagatcc ttatcctgga ctagcctttc tggtgtttca gagtcttcgt gccgccgtct 15360
acatctatct ccattaggtc tgaagatgac tcttcacacc aacgacgttt aaggtctcta 15420
tcctactcct agcttgcaat acctggcttg caatacctgg agcatcgtgc acgatgattg 15480
gatactgtgg aggaggagtg tttgctgatt tagagctccc ggttgggtga tttgacttcg 15540
atttcagttt aggcttgttg aaatttttca ggttccattg tgaagccttt agagcttgag 15600
cttccttcca tgttaatgcc ttgatcgaat actcctagag aaaagggaag tcgatctctg 15660
agtattgaaa tcgaagtgca catttttttt caacgtgtcc aatcaatcca caaacaaagc 15720
agaagacagg taatctttca tacttatact gacaagtaat agtcttaccg tcatgcataa 15780
taacgtctcg ttccttcaag aggggttttc cgacatccat aacgacccga agcctcatga 15840
aagcattagg gaagaacttt tggttcttct tgtcatggcc tttataggtg tcagccgagc 15900
tcgccaattc ccgtccgact ggctccgcaa aatattcgaa cggcaagtta tggacttgca 15960
accataactc cacggtattg agcaggacct attgtgaaga ctcatctcat ggagcttcag 16020
aatgtggttg tcagcaaacc aatgaccgaa atccatcaca tgacggacgt ccagtgggtg 16080
agcgaaacga aacaggaagc gcctatcttt cagagtcgtg agctccacac cggattccgg 16140
caactacgtg ttgggcaggc ttcgccgtat tagagatatg ttgaggcaga cccatctgtg 16200
ccactcgtac aattacgaga gttgtttttt ttgtgatttt cctagtttct cgttgatggt 16260
gagctcatat tctacatcgt atggtctctc aacgtcgttt cctgtcatct gatatcccgt 16320
catttgcatc cacgtgcgcc gcctcccgtg ccaagtccct aggtgtcatg cacgccaaat 16380
tggtggtggt gcgggctgcc ctgtgcttct taccgatggg tggaggttga gtttgggggt 16440
ctccgcggcg atggtagtgg gttgacggtt tggtgtgggt tgacggcatt gatcaattta 16500
cttcttgctt caaattcttt ggcagaaaac aattcattag attagaactg gaaaccagag 16560
tgatgagacg gattaagtca gattccaaca gagttacatc tcttaagaaa taatgtaacc 16620
cctttagact ttatatattt gcaattaaaa aaataattta acttttagac tttatatata 16680
gttttaataa ctaagtttaa ccactctatt atttatatcg aaactatttg tatgtctccc 16740
ctctaaataa acttggtatt gtgtttacag aacctataat caaataatca atactcaact 16800
gaagtttgtg cagttaattg aagggattaa cggccaaaat gcactagtat tatcaaccga 16860
atagattcac actagatggc catttccatc aatatcatcg ccgttcttct tctgtccaca 16920
tatcccctct gaaacttgag agacacctgc acttcattgt ccttattacg tgttacaaaa 16980
tgaaacccat gcatccatgc aaactgaaga atggcgcaag aacccttccc ctccatttct 17040
tatgtggcga ccatccattt caccatctcc cgctataaaa cacccccatc acttcaccta 17100
gaacatcatc actacttgct tatccatcca aaagataccc acttttacaa caattaccaa 17160
caacaacaaa caacaaacaa cattacaatt acatttacaa ttaccatacc atgccaccta 17220
gcgctgctaa gcaaatggga gcttctactg gtgttcatgc tggtgttact gactcttctg 17280
ctttcaccag aaaggatgtt gctgatagac ctgatctcac catcgttgga gattctgttt 17340
acgatgctaa ggctttcaga tctgagcatc ctggtggtgc tcatttcgtt tctttgttcg 17400
gaggaagaga tgctactgag gctttcatgg aataccatag aagggcttgg cctaagtcta 17460
gaatgtctag attccacgtt ggatctcttg cttctactga ggaacctgtt gctgctgatg 17520
agggatacct tcaactttgt gctaggatcg ctaagatggt gccttctgtt tcttctggat 17580
tcgctcctgc ttcttactgg gttaaggctg gacttatcct tggatctgct atcgctcttg 17640
aggcttacat gctttacgct ggaaagagac ttctcccttc tatcgttctt ggatggcttt 17700
tcgctcttat cggtcttaac atccagcatg atgctaacca tggtgctttg tctaagtctg 17760
cttctgttaa ccttgctctt ggactttgtc aggattggat cggaggatct atgatccttt 17820
ggcttcaaga gcatgttgtt atgcaccacc tccacactaa cgatgttgat aaggatcctg 17880
atcaaaaggc tcacggtgct cttagactca agcctactga tgcttggtca cctatgcatt 17940
ggcttcagca tctttacctt ttgcctggtg agactatgta cgctttcaag cttttgttcc 18000
tcgacatctc tgagcttgtt atgtggcgtt gggagggtga gcctatctct aagcttgctg 18060
gatacctctt tatgccttct ttgcttctca agcttacctt ctgggctaga ttcgttgctt 18120
tgcctcttta ccttgctcct tctgttcata ctgctgtgtg tatcgctgct actgttatga 18180
ctggatcttt ctacctcgct ttcttcttct tcatctccca caacttcgag ggtgttgctt 18240
ctgttggacc tgatggatct atcacttcta tgactagagg tgctagcttc cttaagagac 18300
aagctgagac ttcttctaac gttggaggac ctcttcttgc tactcttaac ggtggactca 18360
actaccaaat tgagcatcac ttgttcccta gagttcacca tggattctac cctagacttg 18420
ctcctcttgt taaggctgag cttgaggcta gaggaatcga gtacaagcac taccctacta 18480
tctggtctaa ccttgcttct accctcagac atatgtacgc tcttggaaga aggcctagat 18540
ctaaggctga gtaatgacaa gcttatgtga cgtgaaataa taacggtaaa atatatgtaa 18600
taataataat aataaagcca caaagtgaga atgaggggaa ggggaaatgt gtaatgagcc 18660
agtagccggt ggtgctaatt ttgtatcgta ttgtcaataa atcatgaatt ttgtggtttt 18720
tatgtgtttt tttaaatcat gaattttaaa ttttataaaa taatctccaa tcggaagaac 18780
aacattccat atccatgcat ggatgtttct ttacccaaat ctagttcttg agaggatgaa 18840
gcatcaccga acagttctgc aactatccct caaaagcttt aaaatgaaca acaaggaaca 18900
gagcaacgtt ccaaagatcc caaacgaaac atattatcta tactaatact atattattaa 18960
ttactactgc ccggaatcac aatccctgaa tgattcctat taactacaag ccttgttggc 19020
ggcggagaag tgatcggcgc ggcgagaagc agcggactcg gagacgaggc cttggaagat 19080
ctgagtcgaa cgggcagaat cagtattttc cttcgacgtt aattgatcct acactatgta 19140
ggtcatatcc atcgttttaa tttttggcca ccattcaatt ctgtcttgcc tttagggatg 19200
tgaatatgaa cggccaaggt aagagaataa aaataatcca aattaaagca agagaggcca 19260
agtaagataa tccaaatgta cacttgtcat tgccaaaatt agtaaaatac tcggcatatt 19320
gtattcccac acattattaa aataccgtat atgtattggc tgcatttgca tgaataatac 19380
tacgtgtaag cccaaaagaa cccacgtgta gcccatgcaa agttaacact cacgacccca 19440
ttcctcagtc tccactatat aaacccacca tccccaatct caccaaaccc accacacaac 19500
tcacaactca ctctcacacc ttaaagaacc aatcaccacc aaaaatttta caacaattac 19560
caacaacaac aaacaacaaa caacattaca attacattta caattaccat accatgagcg 19620
ctgttaccgt tactggatct gatcctaaga acagaggatc ttctagcaac accgagcaag 19680
aggttccaaa agttgctatc gataccaacg gaaacgtgtt ctctgttcct gatttcacca 19740
tcaaggacat ccttggagct atccctcatg agtgttacga gagaagattg gctacctctc 19800
tctactacgt gttcagagat atcttctgca tgcttaccac cggatacctt acccataaga 19860
tcctttaccc tctcctcatc tcttacacct ctaacagcat catcaagttc actttctggg 19920
ccctttacac ttacgttcaa ggacttttcg gaaccggaat ctgggttctc gctcatgagt 19980
gtggacatca agctttctct gattacggaa tcgtgaacga tttcgttgga tggacccttc 20040
actcttacct tatggttcct tacttcagct ggaagtactc tcatggaaag caccataagg 20100
ctactggaca catgaccaga gatatggttt tcgttcctgc caccaaagag gaattcaaga 20160
agtctaggaa cttcttcggt aacctcgctg agtactctga ggattctcca cttagaaccc 20220
tttacgagct tcttgttcaa caacttggag gatggatcgc ttacctcttc gttaacgtta 20280
caggacaacc ttaccctgat gttccttctt ggaaatggaa ccacttctgg cttacctctc 20340
cacttttcga gcaaagagat gctctctaca tcttcctttc tgatcttgga atcctcaccc 20400
agggaatcgt tcttactctt tggtacaaga aattcggagg atggtccctt ttcatcaact 20460
ggttcgttcc ttacatctgg gttaaccact ggctcgtttt catcacattc cttcagcaca 20520
ctgatcctac tatgcctcat tacaacgctg aggaatggac tttcgctaag ggtgctgctg 20580
ctactatcga tagaaagttc ggattcatcg gacctcacat cttccatgat atcatcgaga 20640
ctcatgtgct tcaccactac tgttctagga tcccattcta caacgctaga cctgcttctg 20700
aggctatcaa gaaagttatg ggaaagcact acaggtctag cgacgagaac atgtggaagt 20760
cactttggaa gtctttcagg tcttgccaat acgttgacgg tgataacggt gttctcatgt 20820
tccgtaacat caacaactgc ggagttggag ctgctgagaa gtaatgaagg ggtgatcgat 20880
tatgagatcg tacaaagaca ctgctaggtg ttaaggatgg ataataataa taataatgag 20940
atgaatgtgt tttaagttag tgtaacagct gtaataaaga gagagagaga gagagagaga 21000
gagagagaga gagagagaga gagagagagg ctgatgaaat gttatgtatg tttcttggtt 21060
tttaaaataa atgaaagcac atgctcgtgt ggttctatcg aattattcgg cggttcctgt 21120
gggaaaaagt ccagaagggc cgccgcagct actactacaa ccaaggccgt ggaggagggc 21180
aacagagcca gcacttcgat agctgctgcg atgatcttaa gcaattgagg agcgagtgca 21240
catgcagggg actggagcgt gcaatcggcc agatgaggca ggacatccag cagcagggac 21300
agcagcagga agttgagagg tggtcccatc aatctaaaca agtcgctagg gaccttccgg 21360
gacagtgcgg cacccagcct agccgatgcc agctccaggg gcagcagcag tctgcatggt 21420
tttgaagtgg tgatcgatga gatcgtataa agacactgct aggtgttaag gatgggataa 21480
taagatgtgt tttaagtcat taaccgtaat aaaaagagag agaggctgat ggaatgttat 21540
gtatgtatgt ttcttggttt ttaaaattaa atggaaagca catgctcgtg tgggttctat 21600
ctcgattaaa aatcccaatt atatttggtc taatttagtt tggtattgag taaaacaaat 21660
tcgaaccaaa ccaaaatata aatatatagt ttttatatat atgcctttaa gactttttat 21720
agaattttct ttaaaaaata tctagaaata tttgcgactc ttctggcatg taatatttcg 21780
ttaaatatga agtgctccat ttttattaac tttaaataat tggttgtacg atcactttct 21840
tatcaagtgt tactaaaatg cgtcaatctc tttgttcttc catattcata tgtcaaaatc 21900
tatcaaaatt cttatatatc tttttcgaat ttgaagtgaa atttcgataa tttaaaatta 21960
aatagaacat atcattattt aggtatcata ttgattttta tacttaatta ctaaatttgg 22020
ttaactttga aagtgtacat caacgaaaaa ttagtcaaac gactaaaata aataaatatc 22080
atgtgttatt aagaaaattc tcctataaga atattttaat agatcatatg tttgtaaaaa 22140
aaattaattt ttactaacac atatatttac ttatcaaaaa tttgacaaag taagattaaa 22200
ataatattca tctaacaaaa aaaaaaccag aaaatgctga aaacccggca aaaccgaacc 22260
aatccaaacc gatatagttg gtttggtttg attttgatat aaaccgaacc aactcggtcc 22320
atttgcaccc ctaatcataa tagctttaat atttcaagat attattaagt taacgttgtc 22380
aatatcctgg aaattttgca aaatgaatca agcctatatg gctgtaatat gaatttaaaa 22440
gcagctcgat gtggtggtaa tatgtaattt acttgattct aaaaaaatat cccaagtatt 22500
aataatttct gctaggaaga aggttagcta cgatttacag caaagccaga atacaaagaa 22560
ccataaagtg attgaagctc gaaatatacg aaggaacaaa tatttttaaa aaaatacgca 22620
atgacttgga acaaaagaaa gtgatatatt ttttgttctt aaacaagcat cccctctaaa 22680
gaatggcagt tttcctttgc atgtaactat tatgctccct tcgttacaaa aattttggac 22740
tactattggg aacttcttct gaaaatagtc ctgcaggcta gtagattggt tggttggttt 22800
ccatgtacca gaaggcttac cctattagtt gaaagttgaa actttgttcc ctactcaatt 22860
cctagttgtg taaatgtatg tatatgtaat gtgtataaaa cgtagtactt aaatgactag 22920
gagtggttct tgagaccgat gagagatggg agcagaacta aagatgatga cataattaag 22980
aacgaatttg aaaggctctt aggtttgaat cctattcgag aatgtttttg tcaaagatag 23040
tggcgatttt gaaccaaaga aaacatttaa aaaatcagta tccggttacg ttcatgcaaa 23100
tagaaagtgg tctaggatct gattgtaatt ttagacttaa agagtctctt aagattcaat 23160
cctggctgtg tacaaaacta caaataatat attttagact atttggcctt aactaaactt 23220
ccactcatta tttactgagg ttagagaata gacttgcgaa taaacacatt cccgagaaat 23280
actcatgatc ccataattag tcagagggta tgccaatcag atctaagaac acacattccc 23340
tcaaatttta atgcacatgt aatcatagtt tagcacaatt caaaaataat gtagtattaa 23400
agacagaaat ttgtagactt ttttttggcg ttaaaagaag actaagttta tacgtacatt 23460
ttattttaag tggaaaaccg aaattttcca tcgaaatata tgaatttagt atatatattt 23520
ctgcaatgta ctattttgct attttggcaa ctttcagtgg actactactt tattacaatg 23580
tgtatggatg catgagtttg agtatacaca tgtctaaatg catgctttgt aaaacgtaac 23640
ggaccacaaa agaggatcca tacaaataca tctcatagct tcctccatta ttttccgaca 23700
caaacagagc attttacaac aattaccaac aacaacaaac aacaaacaac attacaatta 23760
catttacaat taccatacca tggaatttgc tcaacctctc gttgctatgg ctcaagagca 23820
gtacgctgct atcgatgctg ttgttgctcc tgctatcttc tctgctaccg actctattgg 23880
atggggactc aagcctatct cttctgctac taaggatctc cctctcgttg aatctcctac 23940
ccctcttatc ctttctctcc tcgcttactt cgctatcgtt ggttctggac tcgtttaccg 24000
taaagtgttc cctagaaccg ttaagggaca ggatcctttc cttctcaagg ctcttatgct 24060
cgctcacaac gttttcctta tcggactcag cctttacatg tgcctcaagc tcgtttacga 24120
ggcttacgtg aacaagtact ccttctgggg aaacgcttac aaccctgctc aaaccgagat 24180
ggctaaggtg atctggatct tctacgtgtc caagatctac gagttcatgg acaccttcat 24240
catgcttctc aagggaaacg ttaaccaggt ttccttcctc catgtttacc accacggatc 24300
tatctctgga atctggtgga tgatcactta tgctgctcca ggtggagatg cttacttctc 24360
tgctgctctc aactcttggg ttcatgtgtg catgtacacc tactacttca tggctgctgt 24420
tcttcctaag gacgaaaaga ccaagagaaa gtacctttgg tggggaagat accttaccca 24480
gatgcaaatg ttccagttct tcatgaacct tctccaggct gtttacctcc tctactcttc 24540
ttctccttac cctaagttca ttgctcaact cctcgttgtt tacatggtta ccctcctcat 24600
gcttttcgga aacttctact acatgaagca ccacgcttct aagtgataag ggccgccgcc 24660
atgtgacaga tcgaaggaag aaagtgtaat aagacgactc tcactactcg atcgctagtg 24720
attgtcattg ttatatataa taatgttatc tttcacaact tatcgtaatg catgtgaaac 24780
tataacacat taatcctact tgtcatatga taacactctc cccatttaaa actcttgtca 24840
atttaaagat ataagattct ttaaatgatt aaaaaaaata tattataaat tcaatcactc 24900
ctactaataa attattaatt attatttatt gattaaaaaa atacttatac taatttagtc 24960
tgaatagaat aattagattc tagcctgcag ggcggccgcg gatcccatgg agtcaaagat 25020
tcaaatagag gacctaacag aactcgccgt aaagactggc gaacagttca tacagagtct 25080
cttacgactc aatgacaaga agaaaatctt cgtcaacatg gtggagcacg acacacttgt 25140
ctactccaaa aatatcaaag atacagtctc agaagaccaa agggcaattg agacttttca 25200
acaaagggta atatccggaa acctcctcgg attccattgc ccagctatct gtcactttat 25260
tgtgaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg ataaaggaaa 25320
ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 25380
gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 25440
tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag acccttcctc 25500
tatataagga agttcatttc atttggagag aacacggggg actgaattaa atatgagccc 25560
tgagaggcgt cctgttgaaa tcagacctgc tactgctgct gatatggctg ctgtttgtga 25620
tatcgtgaac cactacatcg agacttctac cgttaacttc agaactgagc ctcaaactcc 25680
tcaagagtgg atcgatgatc ttgagagact ccaagataga tacccttggc ttgttgctga 25740
ggttgagggt gttgttgctg gaatcgctta cgctggacct tggaaggcta gaaacgctta 25800
cgattggact gttgagtcta ccgtttacgt ttcacacaga catcagagac ttggacttgg 25860
atctaccctt tacactcacc ttctcaagtc tatggaagct cagggattca agtctgttgt 25920
tgctgttatc ggactcccta acgatccttc tgttagactt catgaggctc ttggatacac 25980
tgctagagga actcttagag ctgctggata caagcacggt ggatggcatg atgttggatt 26040
ctggcaaaga gatttcgagc ttcctgctcc tcctagacct gttagaccag ttactcagat 26100
ctgaatttgc gtgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt 26160
gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt 26220
aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta 26280
tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc 26340
gcggtgtcat ctatgttact agatcactag tgatgtacgg ttaaaaccac cccagtacat 26400
taaaaacgtc cgcaatgtgt tattaagttg tctaagcgtc aatttgttta caccacaata 26460
tatcctgcca ccagccagcc aacagctccc cgaccggcag ctcggcacaa aatcaccact 26520
cgatacaggc agcccatcag tcc 26543
&lt;210&gt; 7
&lt;211&gt; 23760
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pGA7- mod_G nucleotide sequence
&lt;400&gt; 7
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgccccgcgg aaagcttgcg gccgcggtac cgcccgttcg 240
actcagatct tccaaggcct cgtctccgag tccgctgctt ctcgccgcgc cgatcacttc 300
tccgccgcca acaaggcttg tagttaatag gaatcattca gggattgtga ttccgggcag 360
tagtaattaa taatatagta ttagtataga taatatgttt cgtttgggat ctttggaacg 420
ttgctctgtt ccttgttgtt cattttaaag cttttgaggg atagttgcag aactgttcgg 480
tgatgcttca tcctctcaag aactagattt gggtaaagaa acatccatgc atggatatgg 540
aatgttgttc ttccgattgg agattatttt ataaaattta aaattcatga tttaaaaaaa 600
cacataaaaa ccacaaaatt catgatttat tgacaatacg atacaaaatt agcaccaccg 660
gctactggct cattacacat ttccccttcc cctcattctc actttgtggc tttattatta 720
ttattattac atatatttta ccgttattat ttcacgtcac ataagcttgt taattaatta 780
tcactgcttc ttagcaccct tagacttgta cctcttacgg tagaagttgg cgaagagaac 840
gaacatgttc accataaccc agagttgaag gtaaggaagc cagaaagcgg tattctgaac 900
gtaagcggtg tagatagagt gagaagcaca gatacagaac tgaagcatct ggatctgggt 960
gatgtacttc ttccagaaac agttaactcc aagagcagca agtccgtagt aagagtacat 1020
gatcacgtgc acgaaggtgt taacagaaga tccgaagtag caatctccaa caggctcaag 1080
cttcataaca acgaaccatg accagatgag aagagtgtgg tggtagatgt gaaggaaaga 1140
aagctggtcg aacttcttcc tcatcaccat gaagaaggtg tcgagaagct caacgtactt 1200
gttgttgtag tgaagccaga taacctgaga gattccccaa gagttagcag tcatatcagg 1260
gatgtttccc caaaccttaa gtccctgagc cctatgagaa gtaacgaaaa ggtagatgca 1320
gtagctgttg aagaaggtct ggtagaagtt gtaaacgagc atagcgttct tgagtccgaa 1380
aggttgagat ctgttctgca tgatacgctt tccgaagtag atgaagagga ggtatccaat 1440
agttccgata gtaggtcccc agtactcaac ctgcatgaag taagcaggaa ctttctcaga 1500
agctgggata tcagggttag ccacattgta ggtaacgtat ccaagagttc cagcaagagc 1560
agcagggata gcgatagagg ccatggtatg gtaattgtaa atgtaattgt aatgttgttt 1620
gttgtttgtt gttgttggta attgttgtaa aattaattaa gtgggtatct tttggatgga 1680
taagcaagta gtgatgatgt tctaggtgaa gtgatggggg tgttttatag cgggagatgg 1740
tgaaatggat ggtcgccaca taagaaatgg aggggaaggg ttcttgcgcc attcttcagt 1800
ttgcatggat gcatgggttt cattttgtaa cacgtaataa ggacaatgaa gtgcaggtgt 1860
ctctcaagtt tcagagggga tatgtggaca gaagaagaac ggcgatgata ttgatggaaa 1920
tggccatcta gtgtgaatct attcggttga taatactagt gcattttggc cgttaatccc 1980
ttcaattaac tgcacaaact tcagttgagt attgattatt tgattatagg ttctgtaaac 2040
acaataccaa gtttatttag aggggagaca tacaaatagt ttcgatataa ataatagagt 2100
ggttaaactt agttattaaa actatatata aagtctaaaa gttaaattat ttttttaatt 2160
gcaaatatat aaagtctaaa ggggttacat tatttcttaa gagatgtaac tctgttggaa 2220
tctgacttaa tccgtctcat cactctggtt tccagttcta atctaatgaa ttgttttctg 2280
ccaaagaatt tgaagcaaga agtaaattga tcaatgccgt caacccacac caaaccgtca 2340
acccactacc atcgccgcgg agacccccaa actcaacctc cacccatcgg taagaagcac 2400
agggcagccc gcaccaccac caatttggcg tgcatgacac ctagggactt ggcacgggag 2460
gcggcgcacg tggatgcaaa tgacgggata tcagatgaca ggaaacgacg ttgagagacc 2520
atacgatgta gaatatgagc tcaccatcaa cgagaaacta ggaaaatcac aaaaaaaaca 2580
actctcgtaa ttgtacgagt ggcacagatg ggtctgcctc aacatatctc taatacggcg 2640
aagcctgccc aacacgtagt tgccggaatc cggtgtggag ctcacgactc tgaaagatag 2700
gcgcttcctg tttcgtttcg ctcacccact ggacgtccgt catgtgatgg atttcggtca 2760
ttggtttgct gacaaccaca ttctgaagct ccatgagatg agtcttcaca ataggtcctg 2820
ctcaataccg tggagttatg gttgcaagtc cataacttgc cgttcgaata ttttgcggag 2880
ccagtcggac gggaattggc gagctcggct gacacctata aaggccatga caagaagaac 2940
caaaagttct tccctaatgc tttcatgagg cttcgggtcg ttatggatgt cggaaaaccc 3000
ctcttgaagg aacgagacgt tattatgcat gacggtaaga ctattacttg tcagtataag 3060
tatgaaagat tacctgtctt ctgctttgtt tgtggattga ttggacacgt tgaaaaaaaa 3120
tgtgcacttc gatttcaata ctcagagatc gacttccctt ttctctagga gtattcgatc 3180
aaggcattaa catggaagga agctcaagct ctaaaggctt cacaatggaa cctgaaaaat 3240
ttcaacaagc ctaaactgaa atcgaagtca aatcacccaa ccgggagctc taaatcagca 3300
aacactcctc ctccacagta tccaatcatc gtgcacgatg ctccaggtat tgcaagccag 3360
gtattgcaag ctaggagtag gatagagacc ttaaacgtcg ttggtgtgaa gagtcatctt 3420
cagacctaat ggagatagat gtagacggcg gcacgaagac tctgaaacac cagaaaggct 3480
agtccaggat aaggatctgc tatcccaact gacctctcgt tagtcccaag gcctctcaac 3540
tagagcagga ggaaggatgg tcacaagact aggataatga tgtttccaat atgaacctga 3600
atgtccatag ctaatttttt tagtcttgct tctgcacttt ttgtttatta tgttctggtg 3660
actatgttat ttacccttgt ccgtatgctt gagggtaccc tagtagattg gttggttggt 3720
ttccatgtac cagaaggctt accctattag ttgaaagttg aaactttgtt ccctactcaa 3780
ttcctagttg tgtaaatgta tgtatatgta atgtgtataa aacgtagtac ttaaatgact 3840
aggagtggtt cttgagaccg atgagagatg ggagcagaac taaagatgat gacataatta 3900
agaacgaatt tgaaaggctc ttaggtttga atcctattcg agaatgtttt tgtcaaagat 3960
agtggcgatt ttgaaccaaa gaaaacattt aaaaaatcag tatccggtta cgttcatgca 4020
aatagaaagt ggtctaggat ctgattgtaa ttttagactt aaagagtctc ttaagattca 4080
atcctggctg tgtacaaaac tacaaataat atattttaga ctatttggcc ttaactaaac 4140
ttccactcat tatttactga ggttagagaa tagacttgcg aataaacaca ttcccgagaa 4200
atactcatga tcccataatt agtcagaggg tatgccaatc agatctaaga acacacattc 4260
cctcaaattt taatgcacat gtaatcatag tttagcacaa ttcaaaaata atgtagtatt 4320
aaagacagaa atttgtagac ttttttttgg cgttaaaaga agactaagtt tatacgtaca 4380
ttttatttta agtggaaaac cgaaattttc catcgaaata tatgaattta gtatatatat 4440
ttctgcaatg tactattttg ctattttggc aactttcagt ggactactac tttattacaa 4500
tgtgtatgga tgcatgagtt tgagtataca catgtctaaa tgcatgcttt gtaaaacgta 4560
acggaccaca aaagaggatc catacaaata catctcatag cttcctccat tattttccga 4620
cacaaacaga gcattttaca acaattacca acaacaacaa acaacaaaca acattacaat 4680
tacatttaca attaccatac catggaattc gcccagcctc ttgttgctat ggctcaagag 4740
caatacgctg ctatcgatgc tgttgttgct cctgctatct tctctgctac tgattctatc 4800
ggatggggac ttaagcctat ctcttctgct actaaggact tgcctcttgt tgagtctcct 4860
acacctctca tcctttcttt gcttgcttac ttcgctatcg ttggatctgg actcgtttac 4920
agaaaggttt tccctagaac cgtgaaggga caagatccat tccttttgaa ggctcttatg 4980
cttgctcaca acgtgttcct tatcggactt tctctttaca tgtgcctcaa gcttgtgtac 5040
gaggcttacg ttaacaagta ctctttctgg ggaaacgctt acaaccctgc tcaaactgag 5100
atggctaagg ttatctggat cttctacgtg agcaagatct acgagttcat ggataccttc 5160
atcatgctcc tcaagggaaa tgttaaccag gttagcttcc ttcacgttta ccatcacgga 5220
tctatctctg gaatctggtg gatgattact tacgctgctc ctggtggtga tgcttacttc 5280
tctgctgctc ttaactcttg ggttcacgtg tgtatgtaca cctactattt tatggctgcc 5340
gtgcttccta aggacgagaa aactaagaga aagtacctct ggtggggaag ataccttact 5400
caaatgcaga tgttccagtt cttcatgaac cttctccagg ctgtttacct tctctactct 5460
tcatctcctt accctaagtt tatcgctcag ctcctcgtgg tgtacatggt tactcttctc 5520
atgcttttcg gaaacttcta ctacatgaag caccacgcta gcaagtgatg aggcgcgccg 5580
ggccgccgcc atgtgacaga tcgaaggaag aaagtgtaat aagacgactc tcactactcg 5640
atcgctagtg attgtcattg ttatatataa taatgttatc tttcacaact tatcgtaatg 5700
catgtgaaac tataacacat taatcctact tgtcatatga taacactctc cccatttaaa 5760
actcttgtca atttaaagat ataagattct ttaaatgatt aaaaaaaata tattataaat 5820
tcaatcactc ctactaataa attattaatt attatttatt gattaaaaaa atacttatac 5880
taatttagtc tgaatagaat aattagattc tagtctcatc cccttttaaa ccaacttagt 5940
aaacgttttt ttttttaatt ttatgaagtt aagtttttac cttgttttta aaaagaatcg 6000
ttcataagat gccatgccag aacattagct acacgttaca catagcatgc agccgcggag 6060
aattgttttt cttcgccact tgtcactccc ttcaaacacc taagagcttc tctctcacag 6120
cacacacata caatcacatg cgtgcatgca ttattacacg tgatcgccat gcaaatctcc 6180
tttatagcct ataaattaac tcatccgctt cactctttac tcaaaccaaa actcatcgat 6240
acaaacaaga ttaaaaacat acacgaggat cttttacaac aattaccaac aacaacaaac 6300
aacaaacaac attacaatta catttacaat taccatacca tgcctccaag ggactcttac 6360
tcttatgctg ctcctccttc tgctcaactt cacgaagttg atactcctca agagcacgac 6420
aagaaagagc ttgttatcgg agatagggct tacgatgtta ccaacttcgt taagagacac 6480
cctggtggaa agatcattgc ttaccaagtt ggaactgatg ctaccgatgc ttacaagcag 6540
ttccatgtta gatctgctaa ggctgacaag atgcttaagt ctcttccttc tcgtcctgtt 6600
cacaagggat actctccaag aagggctgat cttatcgctg atttccaaga gttcaccaag 6660
caacttgagg ctgagggaat gttcgagcct tctcttcctc atgttgctta cagacttgct 6720
gaggttatcg ctatgcatgt tgctggtgct gctcttatct ggcatggata cactttcgct 6780
ggaatcgcta tgcttggagt tgttcaggga agatgtggat ggcttatgca tgagggtgga 6840
cattactctc tcactggaaa cattgctttc gacagagcta tccaagttgc ttgttacgga 6900
cttggatgtg gaatgtctgg tgcttggtgg cgtaaccagc ataacaagca ccatgctact 6960
cctcaaaagc ttcagcacga tgttgatctt gatacccttc ctctcgttgc tttccatgag 7020
agaatcgctg ctaaggttaa gtctcctgct atgaaggctt ggctttctat gcaagctaag 7080
cttttcgctc ctgttaccac tcttcttgtt gctcttggat ggcagcttta ccttcatcct 7140
agacacatgc tcaggactaa gcactacgat gagcttgcta tgctcggaat cagatacgga 7200
cttgttggat accttgctgc taactacggt gctggatacg ttctcgcttg ttaccttctt 7260
tacgttcagc ttggagctat gtacatcttc tgcaacttcg ctgtttctca tactcacctc 7320
cctgttgttg agcctaacga gcatgctact tgggttgagt acgctgctaa ccacactact 7380
aactgttctc catcttggtg gtgtgattgg tggatgtctt accttaacta ccagatcgag 7440
caccaccttt acccttctat gcctcaattc agacacccta agatcgctcc tagagttaag 7500
cagcttttcg agaagcacgg acttcactac gatgttagag gatacttcga ggctatggct 7560
gatactttcg ctaaccttga taacgttgcc catgctcctg agaagaaaat gcagtaatga 7620
gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 7680
atgattatca tataatttct gttgaattac gttaagcacg taataattaa catgtaatgc 7740
atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 7800
gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 7860
atgttactag atcggtcgat taaaaatccc aattatattt ggtctaattt agtttggtat 7920
tgagtaaaac aaattcgaac caaaccaaaa tataaatata tagtttttat atatatgcct 7980
ttaagacttt ttatagaatt ttctttaaaa aatatctaga aatatttgcg actcttctgg 8040
catgtaatat ttcgttaaat atgaagtgct ccatttttat taactttaaa taattggttg 8100
tacgatcact ttcttatcaa gtgttactaa aatgcgtcaa tctctttgtt cttccatatt 8160
catatgtcaa aatctatcaa aattcttata tatctttttc gaatttgaag tgaaatttcg 8220
ataatttaaa attaaataga acatatcatt atttaggtat catattgatt tttatactta 8280
attactaaat ttggttaact ttgaaagtgt acatcaacga aaaattagtc aaacgactaa 8340
aataaataaa tatcatgtgt tattaagaaa attctcctat aagaatattt taatagatca 8400
tatgtttgta aaaaaaatta atttttacta acacatatat ttacttatca aaaatttgac 8460
aaagtaagat taaaataata ttcatctaac aaaaaaaaaa ccagaaaatg ctgaaaaccc 8520
ggcaaaaccg aaccaatcca aaccgatata gttggtttgg tttgattttg atataaaccg 8580
aaccaactcg gtccatttgc acccctaatc ataatagctt taatatttca agatattatt 8640
aagttaacgt tgtcaatatc ctggaaattt tgcaaaatga atcaagccta tatggctgta 8700
atatgaattt aaaagcagct cgatgtggtg gtaatatgta atttacttga ttctaaaaaa 8760
atatcccaag tattaataat ttctgctagg aagaaggtta gctacgattt acagcaaagc 8820
cagaatacaa agaaccataa agtgattgaa gctcgaaata tacgaaggaa caaatatttt 8880
taaaaaaata cgcaatgact tggaacaaaa gaaagtgata tattttttgt tcttaaacaa 8940
gcatcccctc taaagaatgg cagttttcct ttgcatgtaa ctattatgct cccttcgtta 9000
caaaaatttt ggactactat tgggaacttc ttctgaaaat agtgatagaa cccacacgag 9060
catgtgcttt ccatttaatt ttaaaaacca agaaacatac atacataaca ttccatcagc 9120
ctctctctct ttttattacg gttaatgact taaaacacat cttattatcc catccttaac 9180
acctagcagt gtctttatac gatctcatcg atcaccactt caaaaccatg cagactgctg 9240
ctgcccctgg agctggcatc ggctaggctg ggtgccgcac tgtcccggaa ggtccctagc 9300
gacttgttta gattgatggg accacctctc aacttcctgc tgctgtccct gctgctggat 9360
gtcctgcctc atctggccga ttgcacgctc cagtcccctg catgtgcact cgctcctcaa 9420
ttgcttaaga tcatcgcagc agctatcgaa gtgctggctc tgttgccctc ctccacggcc 9480
ttggttgtag tagtagctgc cgccgccctt ctggactttt tcccacagga accgccgaat 9540
aattcgatag aaccacacga gcatgtgctt tcatttattt taaaaaccaa gaaacataca 9600
taacatttca tcagcctctc tctctctctc tctctctctc tctctctctc tctctctctc 9660
tctctcttta ttacagctgt tacactaact taaaacacat tcatctcatt attattatta 9720
ttatccatcc ttaacaccta gcagtgtctt tgtacgatct cataatcgat caccccttca 9780
tcaggtatcc ttaggcttca ctccaacgtt gttgcagtta cggaacatgt acacaccatc 9840
atggttctca acgaactggc aagatctcca agttttccaa aggctaaccc acatgttctc 9900
atcggtgtgt ctgtagtgct ctcccataac tttcttgatg cactcggtag cttctctagc 9960
atggtagaat gggatccttg aaacgtagtg atggagcaca tgagtctcga tgatgtcatg 10020
gaagatgatt ccgaggattc cgaactctct atcgatagta gcagcagcac ccttagcgaa 10080
agtccactct tgagcatcgt aatgaggcat agaagaatcg gtgtgctgaa ggaaggtaac 10140
gaaaacaagc cagtggttaa caaggatcca aggacagaac catgtgatga aagtaggcca 10200
gaatccgaaa accttgtaag cggtgtaaac agaagtgagg gtagcaagga ttccaagatc 10260
agaaagaacg atgtaccagt agtccttctt atcgaaaaca gggctagaag gccagtagtg 10320
agacttgaag aacttagaaa caccagggta aggttgtcca gtagcgttag tagcaaggta 10380
aagagaaagt cctccaagct gttggaacaa gagagcgaaa acagagtaga taggagtttc 10440
ctcagcgata tcgtgaaggc tggtaacttg gtgcttctct ttgaattcct cggcggtgta 10500
aggaacgaaa accatatctc tggtcatgtg tccagtagcc ttatggtgct tagcatgaga 10560
gaacttccag ctgaagtaag gaaccataac aagagagtgg agaacccatc caacggtatc 10620
gttaacccat ccgtagttag agaaagcaga atgtccacac tcatgtccaa ggatccagat 10680
tccgaatccg aaacaagaga tagagaacac gtaagcagac caagcagcga atctaaggaa 10740
ttcgttaggg agaagaggga tgtaggtaag tccaacgtaa gcgatagcag agatagccac 10800
gatatctctc accacgtaag acatagactt cacgagagat ctctcgtaac agtgcttagg 10860
gatagcgtca aggatatcct tgatggtgta atctggcacc ttgaaaacgt ttccgaaggt 10920
atcgatagcg gtcttttgct gcttgaaaga tgcaacgttt ccagaacgcc taacggtctt 10980
agtagatccc tcaaggatct cagatccaga cacggtaacc ttagacatgg tatggtaatt 11040
gtaaatgtaa ttgtaatgtt gtttgttgtt tgttgttgtt ggtaattgtt gtaaaatttt 11100
tggtggtgat tggttcttta aggtgtgaga gtgagttgtg agttgtgtgg tgggtttggt 11160
gagattgggg atggtgggtt tatatagtgg agactgagga atggggtcgt gagtgttaac 11220
tttgcatggg ctacacgtgg gttcttttgg gcttacacgt agtattattc atgcaaatgc 11280
agccaataca tatacggtat tttaataatg tgtgggaata caatatgccg agtattttac 11340
taattttggc aatgacaagt gtacatttgg attatcttac ttggcctctc ttgctttaat 11400
ttggattatt tttattctct taccttggcc gttcatattc acatccctaa aggcaagaca 11460
gaattgaatg gtggccaaaa attaaaacga tggatatgac ctacatagtg taggatcaat 11520
taacgtcgaa ggaaaatact gattctctca agcatacgga caagggtaaa taacatagtc 11580
accagaacat aataaacaaa aagtgcagaa gcaagactaa aaaaattagc tatggacatt 11640
caggttcata ttggaaacat cattatccta gtcttgtgac catccttcct cctgctctag 11700
ttgagaggcc ttgggactaa cgagaggtca gttgggatag cagatcctta tcctggacta 11760
gcctttctgg tgtttcagag tcttcgtgcc gccgtctaca tctatctcca ttaggtctga 11820
agatgactct tcacaccaac gacgtttaag gtctctatcc tactcctagc ttgcaatacc 11880
tggcttgcaa tacctggagc atcgtgcacg atgattggat actgtggagg aggagtgttt 11940
gctgatttag agctcccggt tgggtgattt gacttcgatt tcagtttagg cttgttgaaa 12000
tttttcaggt tccattgtga agcctttaga gcttgagctt ccttccatgt taatgccttg 12060
atcgaatact cctagagaaa agggaagtcg atctctgagt attgaaatcg aagtgcacat 12120
tttttttcaa cgtgtccaat caatccacaa acaaagcaga agacaggtaa tctttcatac 12180
ttatactgac aagtaatagt cttaccgtca tgcataataa cgtctcgttc cttcaagagg 12240
ggttttccga catccataac gacccgaagc ctcatgaaag cattagggaa gaacttttgg 12300
ttcttcttgt catggccttt ataggtgtca gccgagctcg ccaattcccg tccgactggc 12360
tccgcaaaat attcgaacgg caagttatgg acttgcaacc ataactccac ggtattgagc 12420
aggacctatt gtgaagactc atctcatgga gcttcagaat gtggttgtca gcaaaccaat 12480
gaccgaaatc catcacatga cggacgtcca gtgggtgagc gaaacgaaac aggaagcgcc 12540
tatctttcag agtcgtgagc tccacaccgg attccggcaa ctacgtgttg ggcaggcttc 12600
gccgtattag agatatgttg aggcagaccc atctgtgcca ctcgtacaat tacgagagtt 12660
gttttttttg tgattttcct agtttctcgt tgatggtgag ctcatattct acatcgtatg 12720
gtctctcaac gtcgtttcct gtcatctgat atcccgtcat ttgcatccac gtgcgccgcc 12780
tcccgtgcca agtccctagg tgtcatgcac gccaaattgg tggtggtgcg ggctgccctg 12840
tgcttcttac cgatgggtgg aggttgagtt tgggggtctc cgcggcgatg gtagtgggtt 12900
gacggtttgg tgtgggttga cggcattgat caatttactt cttgcttcaa attctttggc 12960
agaaaacaat tcattagatt agaactggaa accagagtga tgagacggat taagtcagat 13020
tccaacagag ttacatctct taagaaataa tgtaacccct ttagacttta tatatttgca 13080
attaaaaaaa taatttaact tttagacttt atatatagtt ttaataacta agtttaacca 13140
ctctattatt tatatcgaaa ctatttgtat gtctcccctc taaataaact tggtattgtg 13200
tttacagaac ctataatcaa ataatcaata ctcaactgaa gtttgtgcag ttaattgaag 13260
ggattaacgg ccaaaatgca ctagtattat caaccgaata gattcacact agatggccat 13320
ttccatcaat atcatcgccg ttcttcttct gtccacatat cccctctgaa acttgagaga 13380
cacctgcact tcattgtcct tattacgtgt tacaaaatga aacccatgca tccatgcaaa 13440
ctgaagaatg gcgcaagaac ccttcccctc catttcttat gtggcgacca tccatttcac 13500
catctcccgc tataaaacac ccccatcact tcacctagaa catcatcact acttgcttat 13560
ccatccaaaa gatacccact tttacaacaa ttaccaacaa caacaaacaa caaacaacat 13620
tacaattaca tttacaatta ccataccatg ccacctagcg ctgctaagca aatgggagct 13680
tctactggtg ttcatgctgg tgttactgac tcttctgctt tcaccagaaa ggatgttgct 13740
gatagacctg atctcaccat cgttggagat tctgtttacg atgctaaggc tttcagatct 13800
gagcatcctg gtggtgctca tttcgtttct ttgttcggag gaagagatgc tactgaggct 13860
ttcatggaat accatagaag ggcttggcct aagtctagaa tgtctagatt ccacgttgga 13920
tctcttgctt ctactgagga acctgttgct gctgatgagg gataccttca actttgtgct 13980
aggatcgcta agatggtgcc ttctgtttct tctggattcg ctcctgcttc ttactgggtt 14040
aaggctggac ttatccttgg atctgctatc gctcttgagg cttacatgct ttacgctgga 14100
aagagacttc tcccttctat cgttcttgga tggcttttcg ctcttatcgg tcttaacatc 14160
cagcatgatg ctaaccatgg tgctttgtct aagtctgctt ctgttaacct tgctcttgga 14220
ctttgtcagg attggatcgg aggatctatg atcctttggc ttcaagagca tgttgttatg 14280
caccacctcc acactaacga tgttgataag gatcctgatc aaaaggctca cggtgctctt 14340
agactcaagc ctactgatgc ttggtcacct atgcattggc ttcagcatct ttaccttttg 14400
cctggtgaga ctatgtacgc tttcaagctt ttgttcctcg acatctctga gcttgttatg 14460
tggcgttggg agggtgagcc tatctctaag cttgctggat acctctttat gccttctttg 14520
cttctcaagc ttaccttctg ggctagattc gttgctttgc ctctttacct tgctccttct 14580
gttcatactg ctgtgtgtat cgctgctact gttatgactg gatctttcta cctcgctttc 14640
ttcttcttca tctcccacaa cttcgagggt gttgcttctg ttggacctga tggatctatc 14700
acttctatga ctagaggtgc tagcttcctt aagagacaag ctgagacttc ttctaacgtt 14760
ggaggacctc ttcttgctac tcttaacggt ggactcaact accaaattga gcatcacttg 14820
ttccctagag ttcaccatgg attctaccct agacttgctc ctcttgttaa ggctgagctt 14880
gaggctagag gaatcgagta caagcactac cctactatct ggtctaacct tgcttctacc 14940
ctcagacata tgtacgctct tggaagaagg cctagatcta aggctgagta atgacaagct 15000
tatgtgacgt gaaataataa cggtaaaata tatgtaataa taataataat aaagccacaa 15060
agtgagaatg aggggaaggg gaaatgtgta atgagccagt agccggtggt gctaattttg 15120
tatcgtattg tcaataaatc atgaattttg tggtttttat gtgttttttt aaatcatgaa 15180
ttttaaattt tataaaataa tctccaatcg gaagaacaac attccatatc catgcatgga 15240
tgtttcttta cccaaatcta gttcttgaga ggatgaagca tcaccgaaca gttctgcaac 15300
tatccctcaa aagctttaaa atgaacaaca aggaacagag caacgttcca aagatcccaa 15360
acgaaacata ttatctatac taatactata ttattaatta ctactgcccg gaatcacaat 15420
ccctgaatga ttcctattaa ctacaagcct tgttggcggc ggagaagtga tcggcgcggc 15480
gagaagcagc ggactcggag acgaggcctt ggaagatctg agtcgaacgg gcagaatcag 15540
tattttcctt cgacgttaat tgatcctaca ctatgtaggt catatccatc gttttaattt 15600
ttggccacca ttcaattctg tcttgccttt agggatgtga atatgaacgg ccaaggtaag 15660
agaataaaaa taatccaaat taaagcaaga gaggccaagt aagataatcc aaatgtacac 15720
ttgtcattgc caaaattagt aaaatactcg gcatattgta ttcccacaca ttattaaaat 15780
accgtatatg tattggctgc atttgcatga ataatactac gtgtaagccc aaaagaaccc 15840
acgtgtagcc catgcaaagt taacactcac gaccccattc ctcagtctcc actatataaa 15900
cccaccatcc ccaatctcac caaacccacc acacaactca caactcactc tcacacctta 15960
aagaaccaat caccaccaaa aattttacaa caattaccaa caacaacaaa caacaaacaa 16020
cattacaatt acatttacaa ttaccatacc atgagcgctg ttaccgttac tggatctgat 16080
cctaagaaca gaggatcttc tagcaacacc gagcaagagg ttccaaaagt tgctatcgat 16140
accaacggaa acgtgttctc tgttcctgat ttcaccatca aggacatcct tggagctatc 16200
cctcatgagt gttacgagag aagattggct acctctctct actacgtgtt cagagatatc 16260
ttctgcatgc ttaccaccgg ataccttacc cataagatcc tttaccctct cctcatctct 16320
tacacctcta acagcatcat caagttcact ttctgggccc tttacactta cgttcaagga 16380
cttttcggaa ccggaatctg ggttctcgct catgagtgtg gacatcaagc tttctctgat 16440
tacggaatcg tgaacgattt cgttggatgg acccttcact cttaccttat ggttccttac 16500
ttcagctgga agtactctca tggaaagcac cataaggcta ctggacacat gaccagagat 16560
atggttttcg ttcctgccac caaagaggaa ttcaagaagt ctaggaactt cttcggtaac 16620
ctcgctgagt actctgagga ttctccactt agaacccttt acgagcttct tgttcaacaa 16680
cttggaggat ggatcgctta cctcttcgtt aacgttacag gacaacctta ccctgatgtt 16740
ccttcttgga aatggaacca cttctggctt acctctccac ttttcgagca aagagatgct 16800
ctctacatct tcctttctga tcttggaatc ctcacccagg gaatcgttct tactctttgg 16860
tacaagaaat tcggaggatg gtcccttttc atcaactggt tcgttcctta catctgggtt 16920
aaccactggc tcgttttcat cacattcctt cagcacactg atcctactat gcctcattac 16980
aacgctgagg aatggacttt cgctaagggt gctgctgcta ctatcgatag aaagttcgga 17040
ttcatcggac ctcacatctt ccatgatatc atcgagactc atgtgcttca ccactactgt 17100
tctaggatcc cattctacaa cgctagacct gcttctgagg ctatcaagaa agttatggga 17160
aagcactaca ggtctagcga cgagaacatg tggaagtcac tttggaagtc tttcaggtct 17220
tgccaatacg ttgacggtga taacggtgtt ctcatgttcc gtaacatcaa caactgcgga 17280
gttggagctg ctgagaagta atgaaggggt gatcgattat gagatcgtac aaagacactg 17340
ctaggtgtta aggatggata ataataataa taatgagatg aatgtgtttt aagttagtgt 17400
aacagctgta ataaagagag agagagagag agagagagag agagagagag agagagagag 17460
agagaggctg atgaaatgtt atgtatgttt cttggttttt aaaataaatg aaagcacatg 17520
ctcgtgtggt tctatcgaat tattcggcgg ttcctgtggg aaaaagtcca gaagggccgc 17580
cgcagctact actacaacca aggccgtgga ggagggcaac agagccagca cttcgatagc 17640
tgctgcgatg atcttaagca attgaggagc gagtgcacat gcaggggact ggagcgtgca 17700
atcggccaga tgaggcagga catccagcag cagggacagc agcaggaagt tgagaggtgg 17760
tcccatcaat ctaaacaagt cgctagggac cttccgggac agtgcggcac ccagcctagc 17820
cgatgccagc tccaggggca gcagcagtct gcatggtttt gaagtggtga tcgatgagat 17880
cgtataaaga cactgctagg tgttaaggat gggataataa gatgtgtttt aagtcattaa 17940
ccgtaataaa aagagagaga ggctgatgga atgttatgta tgtatgtttc ttggttttta 18000
aaattaaatg gaaagcacat gctcgtgtgg gttctatctc gattaaaaat cccaattata 18060
tttggtctaa tttagtttgg tattgagtaa aacaaattcg aaccaaacca aaatataaat 18120
atatagtttt tatatatatg cctttaagac tttttataga attttcttta aaaaatatct 18180
agaaatattt gcgactcttc tggcatgtaa tatttcgtta aatatgaagt gctccatttt 18240
tattaacttt aaataattgg ttgtacgatc actttcttat caagtgttac taaaatgcgt 18300
caatctcttt gttcttccat attcatatgt caaaatctat caaaattctt atatatcttt 18360
ttcgaatttg aagtgaaatt tcgataattt aaaattaaat agaacatatc attatttagg 18420
tatcatattg atttttatac ttaattacta aatttggtta actttgaaag tgtacatcaa 18480
cgaaaaatta gtcaaacgac taaaataaat aaatatcatg tgttattaag aaaattctcc 18540
tataagaata ttttaataga tcatatgttt gtaaaaaaaa ttaattttta ctaacacata 18600
tatttactta tcaaaaattt gacaaagtaa gattaaaata atattcatct aacaaaaaaa 18660
aaaccagaaa atgctgaaaa cccggcaaaa ccgaaccaat ccaaaccgat atagttggtt 18720
tggtttgatt ttgatataaa ccgaaccaac tcggtccatt tgcaccccta atcataatag 18780
ctttaatatt tcaagatatt attaagttaa cgttgtcaat atcctggaaa ttttgcaaaa 18840
tgaatcaagc ctatatggct gtaatatgaa tttaaaagca gctcgatgtg gtggtaatat 18900
gtaatttact tgattctaaa aaaatatccc aagtattaat aatttctgct aggaagaagg 18960
ttagctacga tttacagcaa agccagaata caaagaacca taaagtgatt gaagctcgaa 19020
atatacgaag gaacaaatat ttttaaaaaa atacgcaatg acttggaaca aaagaaagtg 19080
atatattttt tgttcttaaa caagcatccc ctctaaagaa tggcagtttt cctttgcatg 19140
taactattat gctcccttcg ttacaaaaat tttggactac tattgggaac ttcttctgaa 19200
aatagtcctg caggctagta gattggttgg ttggtttcca tgtaccagaa ggcttaccct 19260
attagttgaa agttgaaact ttgttcccta ctcaattcct agttgtgtaa atgtatgtat 19320
atgtaatgcg tataaaacgt agtacttaaa tgactaggag tggttcttga gaccgatgag 19380
agatgggagc agaactaaag atgatgacat aattaagaac gaatttgaaa ggctcttagg 19440
tttgaatcct attcgagaat gtttttgtca aagatagtgg cgattttgaa ccaaagaaaa 19500
catttaaaaa atcagtatcc ggttacgttc atgcaaatag aaagtggtct aggatctgat 19560
tgtaatttta gacttaaaga gtctcttaag attcaatcct ggctgtgtac aaaactacaa 19620
ataatatatt ttagactatt tggccttaac taaacttcca ctcattattt actgaggtta 19680
gagaatagac ttgcgaataa acacattccc gagaaatact catgatccca taattagtca 19740
gagggtatgc caatcagatc taagaacaca cattccctca aattttaatg cacatgtaat 19800
catagtttag cacaattcaa aaataatgta gtattaaaga cagaaatttg tagacttttt 19860
tttggcgtta aaggaagact aagtttatac gtacatttta ttttaagtgg aaaaccgaaa 19920
ttttccatcg aaatatatga atttagtata tatatttctg caatgtacta ttttgctatt 19980
ttggcaactt tcagtggact actactttat tacaatgtgt atggatgcat gagtttgagt 20040
atacacatgt ctaaatgcat gctttgcaaa acgtaacgga ccacaaaaga ggatccatgc 20100
aaatacatct catagcttcc tccattattt tccgacacaa acagagcaga ctctagagga 20160
tccccccgtt ttacaacaat taccaacaac aacaaacaac aaacaacatt acaattacat 20220
ttacaattac catcccaaat cggcgcgcca tgtgtcctcc taagaccgat ggaagatctt 20280
ctcctagatc tcctctcacc aggtctaagt catctgctga ggctcttgat gctaaggatg 20340
cttctaccgc tcctgttgat cttaagaccc ttgagcctca tgaacttgct gctaccttcg 20400
agactagatg ggttagggtt gaggatgttg agtacgacgt gaccaacttc aaacatcctg 20460
gtggaagcgt gatcttctac atgcttgcta acactggtgc tgatgctact gaggctttca 20520
aagaatttca catgcgtagc ctcaaggctt ggaagatgct tagagctttg ccttctagac 20580
ctgctgagat caagagatct gagtctgagg atgctcctat gcttgaggat ttcgctaggt 20640
ggagagctga acttgagagg gacggattct tcaagccttc tatcacccat gttgcttacc 20700
gtcttttgga gcttcttgct actttcgctc ttggaaccgc tcttatgtac gctggatacc 20760
ctatcattgc tagcgttgtg tacggtgctt tcttcggagc tagatgtgga tgggttcaac 20820
atgagggtgg acacaactct cttaccggat ctgtgtacgt ggataagaga cttcaggcta 20880
tgacttgcgg attcggactt tctaccagcg gagagatgtg gaaccagatg cataacaagc 20940
accatgctac ccctcagaaa gttagacacg acatggatct tgataccact cctgctgtgg 21000
ctttcttcaa caccgctgtg gaggataata gacctagggg attctctaga gcttgggcta 21060
gacttcaagc ttggaccttc gttcctgtta cttctggact tctcgttcag gctttctgga 21120
tctacgttct ccatcctaga caggtgctca ggaagaagaa ctacgaggaa gcttcttgga 21180
tgctcgtttc tcacgttgtt agaaccgctg ttatcaagct tgctaccgga tactcttggc 21240
ctgttgctta ctggtggttc actttcggaa actggatcgc ttacatgtac ctcttcgctc 21300
acttctctac ttctcacact cacctccctg ttgttccatc tgacaagcac cttagctggg 21360
ttaactacgc tgttgatcac accgttgaca tcgatccttc tcgtggatac gttaactggc 21420
ttatgggata ccttaactgc caggttatcc accatctctt ccctgatatg cctcaattca 21480
gacagcctga ggtgtcaaga agattcgtcc ctttcgctaa gaagtgggga ctcaactaca 21540
aggtgctctc ttactacggt gcttggaagg ctactttcag caacctcgac aaagttggac 21600
agcactacta cgttaacgga aaggctgaga aggctcactg atgattaatt aaatttgggc 21660
tcgaaccggt tcgagcaagc ttatgtgacg tgaaataata acggtaaaat atatgtaata 21720
ataataataa taaagccaca aagtgagaat gaggggaagg ggaaatgtgt aatgagccag 21780
tagccggtgg tgctaatttt gtatcgtatt gtcaataaat catgaatttt gtggttttta 21840
tgtgtttttt taaatcatga attttaaatt ttataaaata atctccaatc ggaagaacaa 21900
cattccatat ccatgcatgg atgtttcttt acccaaatct agttcttgag aggatgaagc 21960
atcaccgaac agttctgcaa ctatccctca aaagctttaa aatgaacaac aaggaacaga 22020
gcaacgttcc aaagatccca aacgaaacat attatctata ctaatactat attattaatt 22080
actactgccc ggaatcacaa tccctgaatg attcctatta actacaagcc ttgttggcgg 22140
cggagaagtg atcggcgcgg cgagaagcag cggactcgga gacgaggcct tggaagatct 22200
cctgcagggc ggccgcggat cccatggagt caaagattca aatagaggac ctaacagaac 22260
tcgccgtaaa gactggcgaa cagttcatac agagtctctt acgactcaat gacaagaaga 22320
aaatcttcgt caacatggtg gagcacgaca cacttgtcta ctccaaaaat atcaaagata 22380
cagtctcaga agaccaaagg gcaattgaga cttttcaaca aagggtaata tccggaaacc 22440
tcctcggatt ccattgccca gctatctgtc actttattgt gaagatagtg gaaaaggaag 22500
gtggctccta caaatgccat cattgcgata aaggaaaggc catcgttgaa gatgcctctg 22560
ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 22620
ttccaaccac gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg 22680
acgcacaatc ccactatcct tcgcaagacc cttcctctat ataaggaagt tcatttcatt 22740
tggagagaac acgggggact gaattaaata tgagccctga gaggcgtcct gttgaaatca 22800
gacctgctac tgctgctgat atggctgctg tttgtgatat cgtgaaccac tacatcgaga 22860
cttctaccgt taacttcaga actgagcctc aaactcctca agagtggatc gatgatcttg 22920
agagactcca agatagatac ccttggcttg ttgctgaggt tgagggtgtt gttgctggaa 22980
tcgcttacgc tggaccttgg aaggctagaa acgcttacga ttggactgtt gagtctaccg 23040
tttacgtttc acacagacat cagagacttg gacttggatc taccctttac actcaccttc 23100
tcaagtctat ggaagctcag ggattcaagt ctgttgttgc tgttatcgga ctccctaacg 23160
atccttctgt tagacttcat gaggctcttg gatacactgc tagaggaact cttagagctg 23220
ctggatacaa gcacggtgga tggcatgatg ttggattctg gcaaagagat ttcgagcttc 23280
ctgctcctcc tagacctgtt agaccagtta ctcagatctg aatttgcgtg atcgttcaaa 23340
catttggcaa taaagtttct taagattgaa tcctgttgcc ggtcttgcga tgattatcat 23400
ataatttctg ttgaattacg ttaagcatgt aataattaac atgtaatgca tgacgttatt 23460
tatgagatgg gtttttatga ttagagtccc gcaattatac atttaatacg cgatagaaaa 23520
caaaatatag cgcgcaaact aggataaatt atcgcgcgcg gtgtcatcta tgttactaga 23580
tcactagtga tgtacggtta aaaccacccc agtacattaa aaacgtccgc aatgtgttat 23640
taagttgtct aagcgtcaat ttgtttacac cacaatatat cctgccacca gccagccaac 23700
agctccccga ccggcagctc ggcacaaaat caccactcga tacaggcagc ccatcagtcc 23760
&lt;210&gt; 8
&lt;211&gt; 11042
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; pORE04+11ABGBEC_Cowpea_EPA_insert nucleotide sequence
&lt;400&gt; 8
tcctgtggtt ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta 60
aatatccgat tattctaata aacgctcttt tctcttaggt ttacccgcca atatatcctg 120
tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa tctgctagtg gatctcccag 180
tcacgacgtt gtaaaacggg cgccctagaa tctaattatt ctattcagac taaattagta 240
taagtatttt tttaatcaat aaataataat taataattta ttagtaggag tgattgaatt 300
tataatatat tttttttaat catttaaaga atcttatatc tttaaattga caagagtttt 360
aaatggggag agtgttatca tatcacaagt aggattaatg tgttatagtt tcacatgcat 420
tacgataagt tgtgaaagat aacattatta tatataacaa tgacaatcac tagcgatcga 480
gtagtgagag tcgtcttatt acactttctt ccttcgatct gtcacatggc ggcggcccga 540
attctcatca cttagaagcg tggtgcttca tgtagtagaa gtttccgaaa agcatgagaa 600
gagtcaccat gtacaccacg aggagctgag cgataaactt agggtaaggt gaagaagagt 660
agaggaggta cacagcctgg agaaggttca tgaagaactg gaacatttgc atctgggtga 720
ggtatcttcc ccaccagagg tactttctct tagttttctc atccttaggg agcacagcag 780
ccataaagta gtaggtgtac atgcacacgt gcacccaaga gttgagagca gcagagaaat 840
aagcatcacc acctggagca gcgtaggtga tcatccacca gattccagag atagatccgt 900
gatggtacac gtggaggaat gacacctggt tcacatttcc cttgaggagc atgatgaagg 960
tatccatgaa ctcgtagatc tttgacacgt agaaaatcca gatcacctta gccatctcgg 1020
tctgagcagg gttgtaagcg tttccccaga aagagtactt gttcacgtaa gcctcgtaca 1080
cgagcttgag gcacatgtag agtgagagtc cgatgaggaa cacgttatga gcgagcatga 1140
gagccttgag caagaatgga tcctgtccct tcacagttct agggaacacc tttctgtaca 1200
cgagtccaga tcccacgata gcgaagtaag cgaggagaga caagataaga ggggtaggag 1260
attccacgag agggagatcc ttagtagcag aagagatagg cttgagtccc catccgatag 1320
aatcggtagc agagaagata gcaggagcca caacagcatc gatagcagcg tattgttctt 1380
gagccatagc cacgagaggc tgagcaaatt ccatgaattc tgttcttctt tactctttgt 1440
gtgactgagg tttggtctag tgctttggtc atctatatat aatgataaca acaatgagaa 1500
caagctttgg agtgatcgga gggtctagga tacatgagat tcaagtggac taggatctac 1560
accgttggat tttgagtgtg gatatgtgtg aggttaattt tacttggtaa cggccacaaa 1620
ggcctaagga gaggtgttga gacccttatc ggcttgaacc gctggaataa tgccacgtgg 1680
aagataattc catgaatctt atcgttatct atgagtgaaa ttgtgtgatg gtggagtggt 1740
gcttgctcat tttacttgcc tggtggactt ggccctttcc ttatggggaa tttatatttt 1800
acttactata gagctttcat accttttttt taccttggat ttagttaata tataatggta 1860
tgattcatga ataaaaatgg gaaatttttg aatttgtact gctaaatgca taagattagg 1920
tgaaactgtg gaatatatat ttttttcatt taaaagcaaa atttgccttt tactagaatt 1980
ataaatatag aaaaatatat aacattcaaa taaaaatgaa aataagaact ttcaaaaaac 2040
agaactatgt ttaatgtgta aagattagtc gcacatcaag tcatctgtta caatatgtta 2100
caacaagtca taagcccaac aaagttagca cgtctaaata aactaaagag tccacgaaaa 2160
tattacaaat cataagccca acaaagttat tgatcaaaaa aaaaaaacgc ccaacaaagc 2220
taaacaaagt ccaaaaaaaa cttctcaagt ctccatcttc ctttatgaac attgaaaact 2280
atacacaaaa caagtcagat aaatctcttt ctgggcctgt cttcccaacc tcctacatca 2340
cttccctatc ggattgaatg ttttacttgt accttttccg ttgcaatgat attgatagta 2400
tgtttgtgaa aactaatagg gttaacaatc gaagtcatgg aatatggatt tggtccaaga 2460
ttttccgaga gctttctagt agaaagccca tcaccagaaa tttactagta aaataaatca 2520
ccaattaggt ttcttattat gtgccaaatt caatataatt atagaggata tttcaaatga 2580
aaacgtatga atgttattag taaatggtca ggtaagacat taaaaaaatc ctacgtcaga 2640
tattcaactt taaaaattcg atcagtgtgg aattgtacaa aaatttggga tctactatat 2700
atatataatg ctttacaaca cttggatttt tttttggagg ctggaatttt taatctacat 2760
atttgttttg gccatgcacc aactcattgt ttagtgtaat actttgattt tgtcaaatat 2820
atgtgttcgt gtatatttgt ataagaattt ctttgaccat atacacacac acatatatat 2880
atatatatat atattatata tcatgcactt ttaattgaaa aaataatata tatatatata 2940
gtgcattttt tctaacaacc atatatgttg cgattgatct gcaaaaatac tgctagagta 3000
atgaaaaata taatctattg ctgaaattat ctcagatgtt aagattttct taaagtaaat 3060
tctttcaaat tttagctaaa agtcttgtaa taactaaaga ataatacaca atctcgacca 3120
cggaaaaaaa acacataata aatttggggc ccctagaatc taattattct attcagacta 3180
aattagtata agtatttttt taatcaataa ataataatta ataatttatt agtaggagtg 3240
attgaattta taatatattt tttttaatca tttaaagaat cttatatctt taaattgaca 3300
agagttttaa atggggagag tgttatcata tcacaagtag gattaatgtg ttatagtttc 3360
acatgcatta cgataagttg tgaaagataa cattattata tataacaatg acaatcacta 3420
gcgatcgagt agtgagagtc gtcttattac actttcttcc ttcgatctgt cacatggcgg 3480
cggcccgcgg ccgctcatca gtgagccttc tcagcctttc cgttcacgta gtagtgctgt 3540
cccaccttat cgaggtttga gaaggtagcc ttccaagcac cgtagtaaga gagcaccttg 3600
tagttgagtc cccacttctt agcgaaagga acgaatcttc ttgacacctc aggctgtctg 3660
aactgtggca tatctgggaa gaggtgatgg atcacctggc agttgaggta tcccatgagc 3720
cagttcacgt aacccctaga aggatcgata tccacggtgt gatccacagc gtagttcacc 3780
caagaaaggt gcttatcaga tggcaccact gggagatggg tatgagaggt agagaagtga 3840
gcgaagaggt acatgtaagc gatccagttt ccgaaggtga accaccaata agcaacaggc 3900
caagagtatc cggtagcgag cttgataaca gcggttctca caacgtgaga cacgagcatc 3960
caagaagcct cttcgtagtt cttctttctg agcacctgtc taggatggag aacgtagatc 4020
cagaaagcct gcacgagaag tccagaagtc acaggaacga aagtccaagc ctgaagtcta 4080
gcccaagctc tagaaaatcc cctaggcctg ttatcctcaa cagcggtgtt gaagaaagcc 4140
acagcaggag tggtatcgag atccatatca tgcctcacct tttgtggggt tgcgtggtgc 4200
ttgttgtgca tctggttcca catctcacca gaggtagaaa gtccgaatcc gcaagtcata 4260
gcctggagcc tcttatccac atacacagat ccggtgagag agttatgacc accctcgtgt 4320
tgaacccatc cacatctagc tccgaagaaa gcaccgtaca ccacagaagc gataataggg 4380
tatccagcat acatgagagc agttccgaga gcgaaagtag caagaagctc gagaagtctg 4440
tatgccacgt gggtgataga aggcttgaag aatccatccc tctcaagctc agctctccac 4500
ctagcgaaat cttcgagcat aggagcatcc tcagactcag acctcttgat ctcagctggt 4560
ctagaaggca aagccctaag catcttccaa gccttgagag atctcatgtg aaattctttg 4620
aaagcctcag tagcatcagc accggtgtta gcgagcatgt agaagatcac agaaccacca 4680
gggtgcttga agttagtaac atcgtactca acatcctcaa ctctcaccca tctagtctcg 4740
aaggtagcag ccaactcatg aggctcaaga gtcttgagat ccacaggagc agtagaagca 4800
tccttagcat cgagagcctc agcagatgac ttagacctgg taagaggtga cctaggagaa 4860
gatcttccat cagtctttgg agggcacatg cggccgctgt tcttctttac tctttgtgtg 4920
actgaggttt ggtctagtgc tttggtcatc tatatataat gataacaaca atgagaacaa 4980
gctttggagt gatcggaggg tctaggatac atgagattca agtggactag gatctacacc 5040
gttggatttt gagtgtggat atgtgtgagg ttaattttac ttggtaacgg ccacaaaggc 5100
ctaaggagag gtgttgagac ccttatcggc ttgaaccgct ggaataatgc cacgtggaag 5160
ataattccat gaatcttatc gttatctatg agtgaaattg tgtgatggtg gagtggtgct 5220
tgctcatttt acttgcctgg tggacttggc cctttcctta tggggaattt atattttact 5280
tactatagag ctttcatacc ttttttttac cttggattta gttaatatat aatggtatga 5340
ttcatgaata aaaatgggaa atttttgaat ttgtactgct aaatgcataa gattaggtga 5400
aactgtggaa tatatatttt tttcatttaa aagcaaaatt tgccttttac tagaattata 5460
aatatagaaa aatatataac attcaaataa aaatgaaaat aagaactttc aaaaaacaga 5520
actatgttta atgtgtaaag attagtcgca catcaagtca tctgttacaa tatgttacaa 5580
caagtcataa gcccaacaaa gttagcacgt ctaaataaac taaagagtcc acgaaaatat 5640
tacaaatcat aagcccaaca aagttattga tcaaaaaaaa aaaacgccca acaaagctaa 5700
acaaagtcca aaaaaaactt ctcaagtctc catcttcctt tatgaacatt gaaaactata 5760
cacaaaacaa gtcagataaa tctctttctg ggcctgtctt cccaacctcc tacatcactt 5820
ccctatcgga ttgaatgttt tacttgtacc ttttccgttg caatgatatt gatagtatgt 5880
ttgtgaaaac taatagggtt aacaatcgaa gtcatggaat atggatttgg tccaagattt 5940
tccgagagct ttctagtaga aagcccatca ccagaaattt actagtaaaa taaatcacca 6000
attaggtttc ttattatgtg ccaaattcaa tataattata gaggatattt caaatgaaaa 6060
cgtatgaatg ttattagtaa atggtcaggt aagacattaa aaaaatccta cgtcagatat 6120
tcaactttaa aaattcgatc agtgtggaat tgtacaaaaa tttgggatct actatatata 6180
tataatgctt tacaacactt ggattttttt ttggaggctg gaatttttaa tctacatatt 6240
tgttttggcc atgcaccaac tcattgttta gtgtaatact ttgattttgt caaatatatg 6300
tgttcgtgta tatttgtata agaatttctt tgaccatata cacacacaca tatatatata 6360
tatatatata ttatatatca tgcactttta attgaaaaaa taatatatat atatatagtg 6420
cattttttct aacaaccata tatgttgcga ttgatctgca aaaatactgc tagagtaatg 6480
aaaaatataa tctattgctg aaattatctc agatgttaag attttcttaa agtaaattct 6540
ttcaaatttt agctaaaagt cttgtaataa ctaaagaata atacacaatc tcgaccacgg 6600
aaaaaaaaca cataataaat ttgggcgcgc cgcgtattgg ctagagcagc ttgccaacat 6660
ggtggagcac gacactctcg tctactccaa gaatatcaaa gatacagtct cagaagacca 6720
aagggctatt gagacttttc aacaaagggt aatatcggga aacctcctcg gattccattg 6780
cccagctatc tgtcacttca tcaaaaggac agtagaaaag gaaggtggca cctacaaatg 6840
ccatcattgc gataaaggaa aggctatcgt tcaagatgcc tctgccgaca gtggtcccaa 6900
agatggaccc ccacccacga ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc 6960
aaagcaagtg gattgatgtg ataacatggt ggagcacgac actctcgtct actccaagaa 7020
tatcaaagat acagtctcag aagaccaaag ggctattgag acttttcaac aaagggtaat 7080
atcgggaaac ctcctcggat tccattgccc agctatctgt cacttcatca aaaggacagt 7140
agaaaaggaa ggtggcacct acaaatgcca tcattgcgat aaaggaaagg ctatcgttca 7200
agatgcctct gccgacagtg gtcccaaaga tggaccccca cccacgagga gcatcgtgga 7260
aaaagaagac gttccaacca cgtcttcaaa gcaagtggat tgatgtgata tctccactga 7320
cgtaagggat gacgcacaat cccactatcc ttcgcaagac cttcctctat ataaggaagt 7380
tcatttcatt tggagaggac acgctgaaat caccagtctc tctctacaaa tctatctctg 7440
cgatcgcatg cctcctaggg attcttactc ttacgctgct cctccatctg ctcagctcca 7500
tgaagttgat actcctcaag agcacgataa gaaagaactc gtgatcggag atagggctta 7560
cgatgtgacc aacttcgtga agagacaccc tggtggaaag attatcgctt accaggttgg 7620
aactgatgct accgatgctt acaagcagtt ccacgtgaga tctgctaagg ctgataagat 7680
gctcaagtct ctcccatcta ggcctgtgca caagggatat tctccaagaa gggctgatct 7740
tatcgctgat ttccaagagt tcaccaagca gcttgaggct gagggaatgt tcgaaccttc 7800
tctccctcat gtggcttaca gactcgctga ggttatcgct atgcatgttg ctggtgctgc 7860
tctcatctgg cacggatata ctttcgctgg aatcgctatg ctcggagtgg ttcagggaag 7920
atgtggatgg cttatgcatg agggtggaca ctactctctc accggaaaca ttgctttcga 7980
tagggctatc caggtggcat gctatggact tggatgtgga atgtctggtg cttggtggag 8040
aaaccagcat aacaagcacc atgctacccc tcaaaagctc cagcatgatg tggatctcga 8100
tactctccct ctcgtggctt tccatgagag aatcgctgct aaggtgaagt ctcctgctat 8160
gaaggcttgg ctctctatgc aggctaagct tttcgctcct gtgactactc ttctcgttgc 8220
tcttggatgg cagctctacc tccatcctag acacatgctc aggaccaagc actacgatga 8280
gcttgctatg ctcggtatca gatacggact cgttggatac ctcgctgcta attacggtgc 8340
tggatacgtt ctcgcttgct accttcttta cgttcagctc ggagctatgt acatcttctg 8400
caacttcgct gtgtctcaca ctcatctccc tgtggttgaa cctaacgagc atgctacttg 8460
ggttgagtac gctgctaacc acactaccaa ctgctctcca tcttggtggt gtgattggtg 8520
gatgtcttac ctcaactacc agatcgagca ccacctctac ccttctatgc ctcagttcag 8580
acaccctaag atcgctccta gagtgaagca gcttttcgag aagcacggac tccactacga 8640
tgtgagagga tactttgagg ctatggctga taccttcgct aacctcgata atgtggctca 8700
cgctcctgag aagaaaatgc agtgatgagc gatcgcgatc gttcaaacat ttggcaataa 8760
agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 8820
aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 8880
tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 8940
gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatcc ctgcagggcg 9000
tattggctag agcagcttgc caacatggtg gagcacgaca ctctcgtcta ctccaagaat 9060
atcaaagata cagtctcaga agaccaaagg gctattgaga cttttcaaca aagggtaata 9120
tcgggaaacc tcctcggatt ccattgccca gctatctgtc acttcatcaa aaggacagta 9180
gaaaaggaag gtggcaccta caaatgccat cattgcgata aaggaaaggc tatcgttcaa 9240
gatgcctctg ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa 9300
aaagaagacg ttccaaccac gtcttcaaag caagtggatt gatgtgataa catggtggag 9360
cacgacactc tcgtctactc caagaatatc aaagatacag tctcagaaga ccaaagggct 9420
attgagactt ttcaacaaag ggtaatatcg ggaaacctcc tcggattcca ttgcccagct 9480
atctgtcact tcatcaaaag gacagtagaa aaggaaggtg gcacctacaa atgccatcat 9540
tgcgataaag gaaaggctat cgttcaagat gcctctgccg acagtggtcc caaagatgga 9600
cccccaccca cgaggagcat cgtggaaaaa gaagacgttc caaccacgtc ttcaaagcaa 9660
gtggattgat gtgatatctc cactgacgta agggatgacg cacaatccca ctatccttcg 9720
caagaccttc ctctatataa ggaagttcat ttcatttgga gaggacacgc tgaaatcacc 9780
agtctctctc tacaaatcta tctctctcga gatgattgaa caagatggat tgcacgcagg 9840
ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg 9900
ctgctctgat gccgccgtgt tccggctgtc agcgcagggg aggccggttc tttttgtcaa 9960
gaccgacctg tccggtgccc tgaatgaact tcaagacgag gcagcgcggc tatcgtggct 10020
ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga 10080
ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc 10140
cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac 10200
ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc 10260
cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact 10320
gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga ctcatggcga 10380
tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg 10440
ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga 10500
agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga 10560
ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgaaacg cgtgatcgtt 10620
caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 10680
tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 10740
tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 10800
aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 10860
tagatcgacg tccgtacggt taaaaccacc ccagtacatt aaaaacgtcc gcaatgtgtt 10920
attaagttgt ctaagcgtca atttgtttac accacaatat atcctgccac cagccagcca 10980
acagctcccc gaccggcagc tcggcacaaa atcaccactc gatacaggca gcccatcagt 11040
cc 11042
&lt;210&gt; 9
&lt;211&gt; 1254
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Lachancea
kluyveri 12 desaturase in plants
&lt;400&gt; 9
atgagcgctg ttaccgttac tggatctgat cctaagaaca gaggatcttc tagcaacacc 60
gagcaagagg ttccaaaagt tgctatcgat accaacggaa acgtgttctc tgttcctgat 120
ttcaccatca aggacatcct tggagctatc cctcatgagt gttacgagag aagattggct 180
acctctctct actacgtgtt cagagatatc ttctgcatgc ttaccaccgg ataccttacc 240
cataagatcc tttaccctct cctcatctct tacacctcta acagcatcat caagttcact 300
ttctgggccc tttacactta cgttcaagga cttttcggaa ccggaatctg ggttctcgct 360
catgagtgtg gacatcaagc tttctctgat tacggaatcg tgaacgattt cgttggatgg 420
acccttcact cttaccttat ggttccttac ttcagctgga agtactctca tggaaagcac 480
cataaggcta ctggacacat gaccagagat atggttttcg ttcctgccac caaagaggaa 540
ttcaagaagt ctaggaactt cttcggtaac ctcgctgagt actctgagga ttctccactt 600
agaacccttt acgagcttct tgttcaacaa cttggaggat ggatcgctta cctcttcgtt 660
aacgttacag gacaacctta ccctgatgtt ccttcttgga aatggaacca cttctggctt 720
acctctccac ttttcgagca aagagatgct ctctacatct tcctttctga tcttggaatc 780
ctcacccagg gaatcgttct tactctttgg tacaagaaat tcggaggatg gtcccttttc 840
atcaactggt tcgttcctta catctgggtt aaccactggc tcgttttcat cacattcctt 900
cagcacactg atcctactat gcctcattac aacgctgagg aatggacttt cgctaagggt 960
gctgctgcta ctatcgatag aaagttcgga ttcatcggac ctcacatctt ccatgatatc 1020
atcgagactc atgtgcttca ccactactgt tctaggatcc cattctacaa cgctagacct 1080
gcttctgagg ctatcaagaa agttatggga aagcactaca ggtctagcga cgagaacatg 1140
tggaagtcac tttggaagtc tttcaggtct tgccaatacg ttgacggtga taacggtgtt 1200
ctcatgttcc gtaacatcaa caactgcgga gttggagctg ctgagaagta atga 1254
&lt;210&gt; 10
&lt;211&gt; 416
&lt;212&gt; PRT
&lt;213&gt; Lachancea kluyveri
&lt;400&gt; 10
Met Ser Ala Val Thr Val Thr Gly Ser Asp Pro Lys Asn Arg Gly Ser
1 5 10 15
Ser Ser Asn Thr Glu Gln Glu Val Pro Lys Val Ala Ile Asp Thr Asn
20 25 30
Gly Asn Val Phe Ser Val Pro Asp Phe Thr Ile Lys Asp Ile Leu Gly
35 40 45
Ala Ile Pro His Glu Cys Tyr Glu Arg Arg Leu Ala Thr Ser Leu Tyr
50 55 60
Tyr Val Phe Arg Asp Ile Phe Cys Met Leu Thr Thr Gly Tyr Leu Thr
65 70 75 80
His Lys Ile Leu Tyr Pro Leu Leu Ile Ser Tyr Thr Ser Asn Ser Ile
85 90 95
Ile Lys Phe Thr Phe Trp Ala Leu Tyr Thr Tyr Val Gln Gly Leu Phe
100 105 110
Gly Thr Gly Ile Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe
115 120 125
Ser Asp Tyr Gly Ile Val Asn Asp Phe Val Gly Trp Thr Leu His Ser
130 135 140
Tyr Leu Met Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Gly Lys His
145 150 155 160
His Lys Ala Thr Gly His Met Thr Arg Asp Met Val Phe Val Pro Ala
165 170 175
Thr Lys Glu Glu Phe Lys Lys Ser Arg Asn Phe Phe Gly Asn Leu Ala
180 185 190
Glu Tyr Ser Glu Asp Ser Pro Leu Arg Thr Leu Tyr Glu Leu Leu Val
195 200 205
Gln Gln Leu Gly Gly Trp Ile Ala Tyr Leu Phe Val Asn Val Thr Gly
210 215 220
Gln Pro Tyr Pro Asp Val Pro Ser Trp Lys Trp Asn His Phe Trp Leu
225 230 235 240
Thr Ser Pro Leu Phe Glu Gln Arg Asp Ala Leu Tyr Ile Phe Leu Ser
245 250 255
Asp Leu Gly Ile Leu Thr Gln Gly Ile Val Leu Thr Leu Trp Tyr Lys
260 265 270
Lys Phe Gly Gly Trp Ser Leu Phe Ile Asn Trp Phe Val Pro Tyr Ile
275 280 285
Trp Val Asn His Trp Leu Val Phe Ile Thr Phe Leu Gln His Thr Asp
290 295 300
Pro Thr Met Pro His Tyr Asn Ala Glu Glu Trp Thr Phe Ala Lys Gly
305 310 315 320
Ala Ala Ala Thr Ile Asp Arg Lys Phe Gly Phe Ile Gly Pro His Ile
325 330 335
Phe His Asp Ile Ile Glu Thr His Val Leu His His Tyr Cys Ser Arg
340 345 350
Ile Pro Phe Tyr Asn Ala Arg Pro Ala Ser Glu Ala Ile Lys Lys Val
355 360 365
Met Gly Lys His Tyr Arg Ser Ser Asp Glu Asn Met Trp Lys Ser Leu
370 375 380
Trp Lys Ser Phe Arg Ser Cys Gln Tyr Val Asp Gly Asp Asn Gly Val
385 390 395 400
Leu Met Phe Arg Asn Ile Asn Asn Cys Gly Val Gly Ala Ala Glu Lys
405 410 415
&lt;210&gt; 11
&lt;211&gt; 1251
&lt;212&gt; DNA
&lt;213&gt; Pichia pastoris
&lt;400&gt; 11
atgtctaagg ttaccgtgtc tggatctgag atccttgagg gatctactaa gaccgttagg 60
cgttctggaa acgttgcatc tttcaagcag caaaagaccg ctatcgatac cttcggaaac 120
gttttcaagg tgccagatta caccatcaag gatatccttg acgctatccc taagcactgt 180
tacgagagat ctctcgtgaa gtctatgtct tacgtggtga gagatatcgt ggctatctct 240
gctatcgctt acgttggact tacctacatc cctcttctcc ctaacgaatt ccttagattc 300
gctgcttggt ctgcttacgt gttctctatc tcttgtttcg gattcggaat ctggatcctt 360
ggacatgagt gtggacattc tgctttctct aactacggat gggttaacga taccgttgga 420
tgggttctcc actctcttgt tatggttcct tacttcagct ggaagttctc tcatgctaag 480
caccataagg ctactggaca catgaccaga gatatggttt tcgttcctta caccgccgag 540
gaattcaaag agaagcacca agttaccagc cttcacgata tcgctgagga aactcctatc 600
tactctgttt tcgctctctt gttccaacag cttggaggac tttctcttta ccttgctact 660
aacgctactg gacaacctta ccctggtgtt tctaagttct tcaagtctca ctactggcct 720
tctagccctg ttttcgataa gaaggactac tggtacatcg ttctttctga tcttggaatc 780
cttgctaccc tcacttctgt ttacaccgct tacaaggttt tcggattctg gcctactttc 840
atcacatggt tctgtccttg gatccttgtt aaccactggc ttgttttcgt taccttcctt 900
cagcacaccg attcttctat gcctcattac gatgctcaag agtggacttt cgctaagggt 960
gctgctgcta ctatcgatag agagttcgga atcctcggaa tcatcttcca tgacatcatc 1020
gagactcatg tgctccatca ctacgtttca aggatcccat tctaccatgc tagagaagct 1080
accgagtgca tcaagaaagt tatgggagag cactacagac acaccgatga gaacatgtgg 1140
gttagccttt ggaaaacttg gagatcttgc cagttcgttg agaaccatga tggtgtgtac 1200
atgttccgta actgcaacaa cgttggagtg aagcctaagg atacctgatg a 1251
&lt;210&gt; 12
&lt;211&gt; 415
&lt;212&gt; PRT
&lt;213&gt; Pichia pastoris
&lt;400&gt; 12
Met Ser Lys Val Thr Val Ser Gly Ser Glu Ile Leu Glu Gly Ser Thr
1 5 10 15
Lys Thr Val Arg Arg Ser Gly Asn Val Ala Ser Phe Lys Gln Gln Lys
20 25 30
Thr Ala Ile Asp Thr Phe Gly Asn Val Phe Lys Val Pro Asp Tyr Thr
35 40 45
Ile Lys Asp Ile Leu Asp Ala Ile Pro Lys His Cys Tyr Glu Arg Ser
50 55 60
Leu Val Lys Ser Met Ser Tyr Val Val Arg Asp Ile Val Ala Ile Ser
65 70 75 80
Ala Ile Ala Tyr Val Gly Leu Thr Tyr Ile Pro Leu Leu Pro Asn Glu
85 90 95
Phe Leu Arg Phe Ala Ala Trp Ser Ala Tyr Val Phe Ser Ile Ser Cys
100 105 110
Phe Gly Phe Gly Ile Trp Ile Leu Gly His Glu Cys Gly His Ser Ala
115 120 125
Phe Ser Asn Tyr Gly Trp Val Asn Asp Thr Val Gly Trp Val Leu His
130 135 140
Ser Leu Val Met Val Pro Tyr Phe Ser Trp Lys Phe Ser His Ala Lys
145 150 155 160
His His Lys Ala Thr Gly His Met Thr Arg Asp Met Val Phe Val Pro
165 170 175
Tyr Thr Ala Glu Glu Phe Lys Glu Lys His Gln Val Thr Ser Leu His
180 185 190
Asp Ile Ala Glu Glu Thr Pro Ile Tyr Ser Val Phe Ala Leu Leu Phe
195 200 205
Gln Gln Leu Gly Gly Leu Ser Leu Tyr Leu Ala Thr Asn Ala Thr Gly
210 215 220
Gln Pro Tyr Pro Gly Val Ser Lys Phe Phe Lys Ser His Tyr Trp Pro
225 230 235 240
Ser Ser Pro Val Phe Asp Lys Lys Asp Tyr Trp Tyr Ile Val Leu Ser
245 250 255
Asp Leu Gly Ile Leu Ala Thr Leu Thr Ser Val Tyr Thr Ala Tyr Lys
260 265 270
Val Phe Gly Phe Trp Pro Thr Phe Ile Thr Trp Phe Cys Pro Trp Ile
275 280 285
Leu Val Asn His Trp Leu Val Phe Val Thr Phe Leu Gln His Thr Asp
290 295 300
Ser Ser Met Pro His Tyr Asp Ala Gln Glu Trp Thr Phe Ala Lys Gly
305 310 315 320
Ala Ala Ala Thr Ile Asp Arg Glu Phe Gly Ile Leu Gly Ile Ile Phe
325 330 335
His Asp Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Arg Ile
340 345 350
Pro Phe Tyr His Ala Arg Glu Ala Thr Glu Cys Ile Lys Lys Val Met
355 360 365
Gly Glu His Tyr Arg His Thr Asp Glu Asn Met Trp Val Ser Leu Trp
370 375 380
Lys Thr Trp Arg Ser Cys Gln Phe Val Glu Asn His Asp Gly Val Tyr
385 390 395 400
Met Phe Arg Asn Cys Asn Asn Val Gly Val Lys Pro Lys Asp Thr
405 410 415
&lt;210&gt; 13
&lt;211&gt; 1392
&lt;212&gt; DNA
&lt;213&gt; Micromonas pusilla
&lt;400&gt; 13
atgtgcccgc cgaagacgga cggccgatcg tccccgcgat cgccgctgac gcgcagcaaa 60
tcctccgcgg aggcgctcga cgccaaggac gcgtcgaccg cgcccgtcga tctcaaaacg 120
ctcgagccgc acgagctcgc ggcgacgttc gagacgcgat gggtgcgcgt ggaggacgtc 180
gagtacgacg tcacaaactt caaacacccg ggaggcagcg tgatattcta catgctcgcg 240
aacacgggcg cggacgccac ggaggcgttc aaggagttcc acatgcgatc gcttaaggcg 300
tggaagatgc tcagagcgct gccgtcgcgc cccgcggaga tcaaacgcag cgagagcgag 360
gacgcgccga tgttggagga tttcgcgcgg tggcgcgcgg agctcgaacg cgacgggttc 420
tttaagccct cgataacgca cgtcgcgtat cggttactcg agctcctcgc gaccttcgcc 480
ctcggcaccg ccctcatgta cgccgggtac ccgatcatcg cgtccgtcgt gtacggcgcg 540
ttcttcggcg ctcggtgcgg ttgggtccag cacgagggcg ggcacaactc gctcacgggg 600
tccgtctacg tcgacaagcg cctccaagcg atgacgtgcg ggttcgggct gtccacgagc 660
ggggagatgt ggaaccagat gcacaataag caccacgcga cgccgcagaa agtgaggcac 720
gacatggacc tggacacgac ccccgcggtg gcgtttttta acaccgccgt ggaggacaac 780
cggccgaggg ggttctcccg cgcgtgggct cggcttcagg cgtggacgtt cgtcccggtg 840
acctccgggc tgctcgtcca ggcgttctgg atctacgtcc tgcacccgcg gcaggtgttg 900
cgaaagaaga actacgagga ggcgtcgtgg atgctcgtct ctcacgtcgt caggaccgcg 960
gtgattaaac tcgcgacggg gtactcgtgg cccgtcgcgt actggtggtt caccttcggc 1020
aactggatcg cgtacatgta cctcttcgcg cacttctcca cgagccacac gcacctcccg 1080
gtcgtgccct cggataagca cctgagctgg gtgaactacg cggtcgatca caccgtggac 1140
atcgacccgt cgcgcgggta cgtgaactgg ttgatgggat atctgaactg ccaggtcatt 1200
catcacctgt tcccggacat gccgcagttt cgccagccgg aggtgagccg gcggttcgtc 1260
ccgttcgcga agaagtgggg gctgaactac aaggtgctgt cctattacgg cgcctggaag 1320
gcgacgttct cgaacttgga taaggtcggg cagcactact acgtcaacgg caaggcggag 1380
aaggcgcact ga 1392
&lt;210&gt; 14
&lt;211&gt; 1395
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Micromonas
pusilla 6 desaturase in plants (version 1)
&lt;400&gt; 14
atgtgccctc ctaagactga tggaagatct tctcctagat ctccacttac caggtctaaa 60
tcttctgctg aggctcttga tgctaaggat gcttctactg ctcctgttga tcttaagact 120
cttgagcctc atgagcttgc tgctactttc gagactagat gggttagagt tgaggacgtt 180
gagtacgatg tgactaactt caagcaccct ggtggatctg tgatcttcta catgcttgct 240
aacactggtg ctgatgctac tgaggctttc aaagaattcc acatgcgttc tctcaaggct 300
tggaagatgc ttagagcttt gccttctaga cctgctgaga tcaagagatc tgagtctgag 360
gatgctccta tgcttgagga tttcgctaga tggcgtgctg agcttgagag agatggattc 420
ttcaagcctt ctatcaccca tgtggcttac agacttctcg agcttcttgc tacattcgct 480
cttggaactg ctcttatgta cgctggatac cctatcattg cttctgttgt ttacggtgct 540
ttcttcggag ctagatgtgg atgggttcaa catgagggtg gacataactc tcttaccgga 600
tctgtttacg tggacaagag acttcaggct atgacttgtg gattcggact ttctacttct 660
ggtgagatgt ggaaccagat gcataacaag caccatgcta cccctcaaaa ggttagacac 720
gatatggatc ttgataccac tcctgctgtg gctttcttca acactgctgt tgaggataac 780
agacctagag gattctctag agcttgggct agacttcaag cttggacttt cgttcctgtt 840
acctctggac ttcttgttca agctttctgg atctacgttc tccaccctag acaagttctc 900
cgtaagaaga actacgaaga ggcttcttgg atgctcgttt ctcatgttgt tagaaccgct 960
gttatcaagc ttgctactgg atactcttgg cctgttgctt actggtggtt cactttcgga 1020
aactggatcg cttacatgta ccttttcgct cacttctcta cttctcatac tcacctccct 1080
gttgttccat ctgataagca cctttcttgg gttaactacg ctgttgatca caccgttgat 1140
atcgatcctt ctagaggata cgtgaactgg cttatgggat accttaactg tcaggttatc 1200
caccacctct tccctgatat gcctcaattc agacagcctg aggttagcag aagattcgtt 1260
cctttcgcta agaagtgggg actcaactac aaggtgctct cttactacgg tgcttggaag 1320
gctactttct ctaaccttga taaggtggga cagcactact acgttaacgg aaaggctgag 1380
aaggctcact aatga 1395
&lt;210&gt; 15
&lt;211&gt; 1395
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Micromonas
pusilla 6 desaturase in plants (version 2)
&lt;400&gt; 15
atgtgtcctc ctaagaccga tggaagatct tctcctagat ctcctctcac caggtctaag 60
tcatctgctg aggctcttga tgctaaggat gcttctaccg ctcctgttga tcttaagacc 120
cttgagcctc atgaacttgc tgctaccttc gagactagat gggttagggt tgaggatgtt 180
gagtacgacg tgaccaactt caaacatcct ggtggaagcg tgatcttcta catgcttgct 240
aacactggtg ctgatgctac tgaggctttc aaagaatttc acatgcgtag cctcaaggct 300
tggaagatgc ttagagcttt gccttctaga cctgctgaga tcaagagatc tgagtctgag 360
gatgctccta tgcttgagga tttcgctagg tggagagctg aacttgagag ggacggattc 420
ttcaagcctt ctatcaccca tgttgcttac cgtcttttgg agcttcttgc tactttcgct 480
cttggaaccg ctcttatgta cgctggatac cctatcattg ctagcgttgt gtacggtgct 540
ttcttcggag ctagatgtgg atgggttcaa catgagggtg gacacaactc tcttaccgga 600
tctgtgtacg tggataagag acttcaggct atgacttgcg gattcggact ttctaccagc 660
ggagagatgt ggaaccagat gcataacaag caccatgcta cccctcagaa agttagacac 720
gacatggatc ttgataccac tcctgctgtg gctttcttca acaccgctgt ggaggataat 780
agacctaggg gattctctag agcttgggct agacttcaag cttggacctt cgttcctgtt 840
acttctggac ttctcgttca ggctttctgg atctacgttc tccatcctag acaggtgctc 900
aggaagaaga actacgagga agcttcttgg atgctcgttt ctcacgttgt tagaaccgct 960
gttatcaagc ttgctaccgg atactcttgg cctgttgctt actggtggtt cactttcgga 1020
aactggatcg cttacatgta cctcttcgct cacttctcta cttctcacac tcacctccct 1080
gttgttccat ctgacaagca ccttagctgg gttaactacg ctgttgatca caccgttgac 1140
atcgatcctt ctcgtggata cgttaactgg cttatgggat accttaactg ccaggttatc 1200
caccatctct tccctgatat gcctcaattc agacagcctg aggtgtcaag aagattcgtc 1260
cctttcgcta agaagtgggg actcaactac aaggtgctct cttactacgg tgcttggaag 1320
gctactttca gcaacctcga caaagttgga cagcactact acgttaacgg aaaggctgag 1380
aaggctcact gatga 1395
&lt;210&gt; 16
&lt;211&gt; 463
&lt;212&gt; PRT
&lt;213&gt; Micromonas pusilla
&lt;400&gt; 16
Met Cys Pro Pro Lys Thr Asp Gly Arg Ser Ser Pro Arg Ser Pro Leu
1 5 10 15
Thr Arg Ser Lys Ser Ser Ala Glu Ala Leu Asp Ala Lys Asp Ala Ser
20 25 30
Thr Ala Pro Val Asp Leu Lys Thr Leu Glu Pro His Glu Leu Ala Ala
35 40 45
Thr Phe Glu Thr Arg Trp Val Arg Val Glu Asp Val Glu Tyr Asp Val
50 55 60
Thr Asn Phe Lys His Pro Gly Gly Ser Val Ile Phe Tyr Met Leu Ala
65 70 75 80
Asn Thr Gly Ala Asp Ala Thr Glu Ala Phe Lys Glu Phe His Met Arg
85 90 95
Ser Leu Lys Ala Trp Lys Met Leu Arg Ala Leu Pro Ser Arg Pro Ala
100 105 110
Glu Ile Lys Arg Ser Glu Ser Glu Asp Ala Pro Met Leu Glu Asp Phe
115 120 125
Ala Arg Trp Arg Ala Glu Leu Glu Arg Asp Gly Phe Phe Lys Pro Ser
130 135 140
Ile Thr His Val Ala Tyr Arg Leu Leu Glu Leu Leu Ala Thr Phe Ala
145 150 155 160
Leu Gly Thr Ala Leu Met Tyr Ala Gly Tyr Pro Ile Ile Ala Ser Val
165 170 175
Val Tyr Gly Ala Phe Phe Gly Ala Arg Cys Gly Trp Val Gln His Glu
180 185 190
Gly Gly His Asn Ser Leu Thr Gly Ser Val Tyr Val Asp Lys Arg Leu
195 200 205
Gln Ala Met Thr Cys Gly Phe Gly Leu Ser Thr Ser Gly Glu Met Trp
210 215 220
Asn Gln Met His Asn Lys His His Ala Thr Pro Gln Lys Val Arg His
225 230 235 240
Asp Met Asp Leu Asp Thr Thr Pro Ala Val Ala Phe Phe Asn Thr Ala
245 250 255
Val Glu Asp Asn Arg Pro Arg Gly Phe Ser Arg Ala Trp Ala Arg Leu
260 265 270
Gln Ala Trp Thr Phe Val Pro Val Thr Ser Gly Leu Leu Val Gln Ala
275 280 285
Phe Trp Ile Tyr Val Leu His Pro Arg Gln Val Leu Arg Lys Lys Asn
290 295 300
Tyr Glu Glu Ala Ser Trp Met Leu Val Ser His Val Val Arg Thr Ala
305 310 315 320
Val Ile Lys Leu Ala Thr Gly Tyr Ser Trp Pro Val Ala Tyr Trp Trp
325 330 335
Phe Thr Phe Gly Asn Trp Ile Ala Tyr Met Tyr Leu Phe Ala His Phe
340 345 350
Ser Thr Ser His Thr His Leu Pro Val Val Pro Ser Asp Lys His Leu
355 360 365
Ser Trp Val Asn Tyr Ala Val Asp His Thr Val Asp Ile Asp Pro Ser
370 375 380
Arg Gly Tyr Val Asn Trp Leu Met Gly Tyr Leu Asn Cys Gln Val Ile
385 390 395 400
His His Leu Phe Pro Asp Met Pro Gln Phe Arg Gln Pro Glu Val Ser
405 410 415
Arg Arg Phe Val Pro Phe Ala Lys Lys Trp Gly Leu Asn Tyr Lys Val
420 425 430
Leu Ser Tyr Tyr Gly Ala Trp Lys Ala Thr Phe Ser Asn Leu Asp Lys
435 440 445
Val Gly Gln His Tyr Tyr Val Asn Gly Lys Ala Glu Lys Ala His
450 455 460
&lt;210&gt; 17
&lt;211&gt; 1449
&lt;212&gt; DNA
&lt;213&gt; Ostreococcus lucimarinus
&lt;400&gt; 17
atgtgcgtcg aaacgaccga aggcacatcg cgaacgatgg cgaacgaacg cacgagctcg 60
tcgtcgtcgc tgagcgaagg cggaacgccg acggtgacgg tcgggatggg aagcgaagac 120
gcggggaaga agactcgaaa cgcgagcgtc acggcgtgga cgaaagagtt ggagccgcac 180
gcgatcgcga agacgttcga acggcggtac gtgacgatcg aaggcgtgga atacgatgtg 240
acggatttta agcatcccgg aggatcggtt atttattaca tgctgtcgaa cacgggagcg 300
gacgcgacgg aggcttttaa agagtttcat tatcggtcga aaaaggcgcg caaggcgttg 360
gcggcgttgc cgcataagcc agtggacgcg gcgacgcggg aaccgatcga agatgaggcg 420
atgctgaagg atttcgcgca gtggcgcaag gaattggagc gtgagggatt ttttaagccc 480
tcgccggcgc acgtggcgta tcgattcgcc gagctcgcgg cgatgttcgc gctcggcacg 540
gcgttgatgc acgcgcgttg gcacgtcgct tccgtgatcg tgtactcgtg tttcttcggc 600
gcgcgatgcg gttgggtgca gcacgagggt gggcacaatt cgttgactgg aaacatttgg 660
tgggacaagc gaatccaagc cttcgccgcg gggttcggct tggcgtcgag tggcgacatg 720
tggaacaaca tgcacaacaa gcatcacgcg acgccccaaa aggtgcgaca cgatatggat 780
ctcgacacca ctcccacggt ggcgttcttc aactccgcgg ttgaagaaaa tcgcccgcgg 840
ggattcagta agttgtggtt gcgccttcaa gcgtggacct tcgtgcccgt gacgtccggt 900
atggttttgt tcttctggat gttcgtcttg cacccgcgta acgcgctgcg acgcaaaagc 960
ttcgaagaag cggcttggat gttttccgcg cacgtcattc gcacggcggt tatcaaagcc 1020
gtcaccggct actcctggat cgcctcgtac ggcttgttcg cggcgacgat gtgggcgagc 1080
ggatgttact tgttcgcgca cttttccacg tctcacacgc acttggatgt cgtgccgagc 1140
gataaacacc tctcgtgggt gcgatacgcc gtcgatcaca cgatcgacat caatccgaac 1200
aacagcgtcg tcaactggtt gatgggctac ttgaactgcc aagtcatcca tcacctgttc 1260
ccggatatgc ctcagttccg ccaacccgaa gtctcccgcc gattcgtccc gtttgcgaag 1320
aagtggaact taaactacaa ggtcttgacg tattatgggg cctggaaggc gacgttcggc 1380
aacttgaacg acgtcgggaa gcactattac gtgcacggat ctcagcgcgt caaatcaaag 1440
tcggcgtga 1449
&lt;210&gt; 18
&lt;211&gt; 1449
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Ostreococcus
lucimarinus 6-desaturase in plants
&lt;400&gt; 18
atgtgtgttg agactactga gggaacctct agaactatgg ctaacgagag gacctcttct 60
tcttcttcac tctctgaggg tggaactcct actgttactg tgggaatggg atctgaggat 120
gctggaaaga aaaccagaaa cgcttctgtt actgcttgga ccaaagagct tgagcctcac 180
gctatcgcta agaccttcga gagaagatac gttaccatcg agggtgttga gtacgatgtg 240
accgatttca aacaccctgg tggatctgtg atctactaca tgctctctaa cactggtgct 300
gatgctactg aggctttcaa agagttccac taccgttcta agaaggctag aaaggctctt 360
gctgctcttc ctcacaagcc tgttgatgct gctactagag agcctattga ggacgaggct 420
atgcttaagg atttcgctca gtggagaaaa gagttggaga gagagggatt cttcaagcct 480
tctcctgctc atgttgctta ccgtttcgct gaactcgctg ctatgttcgc tcttggaacc 540
gctcttatgc atgctagatg gcacgttgct agcgttatcg tgtactcctg tttcttcgga 600
gctagatgtg gatgggttca acatgagggt ggacacaact ctcttaccgg aaacatctgg 660
tgggataaga gaatccaagc tttcgctgct ggattcggac ttgcttcttc tggtgacatg 720
tggaacaaca tgcacaacaa gcaccatgct actcctcaga aagtgagaca cgatatggat 780
cttgatacca cccctaccgt tgctttcttc aactctgctg tggaggaaaa cagacctagg 840
ggattctcta agctttggct cagacttcaa gcttggacct tcgttcctgt tacctctgga 900
atggtgctct tcttctggat gttcgttctc catcctagaa acgctctccg tcgtaagtct 960
ttcgaagagg ctgcttggat gttctctgct cacgttatca gaaccgctgt tatcaaggct 1020
gttaccggat actcttggat cgctagctac ggacttttcg ctgctactat gtgggcttct 1080
ggatgctacc ttttcgctca cttctctact tctcacaccc acctcgatgt tgttccatct 1140
gataagcacc ttagctgggt taggtacgct gttgatcaca ccatcgacat caaccctaac 1200
aactctgttg tgaactggct tatgggatac cttaactgcc aggttatcca ccatctcttc 1260
cctgatatgc ctcaattcag acagcctgag gtgtcaagaa gattcgtccc tttcgctaag 1320
aagtggaacc tcaactacaa ggtgctcact tactacggtg cttggaaggc tactttcgga 1380
aacctcaacg atgttggaaa gcactactac gttcacggat ctcagagagt gaagagcaag 1440
agcgcttga 1449
&lt;210&gt; 19
&lt;211&gt; 482
&lt;212&gt; PRT
&lt;213&gt; Ostreococcus lucimarinus
&lt;400&gt; 19
Met Cys Val Glu Thr Thr Glu Gly Thr Ser Arg Thr Met Ala Asn Glu
1 5 10 15
Arg Thr Ser Ser Ser Ser Ser Leu Ser Glu Gly Gly Thr Pro Thr Val
20 25 30
Thr Val Gly Met Gly Ser Glu Asp Ala Gly Lys Lys Thr Arg Asn Ala
35 40 45
Ser Val Thr Ala Trp Thr Lys Glu Leu Glu Pro His Ala Ile Ala Lys
50 55 60
Thr Phe Glu Arg Arg Tyr Val Thr Ile Glu Gly Val Glu Tyr Asp Val
65 70 75 80
Thr Asp Phe Lys His Pro Gly Gly Ser Val Ile Tyr Tyr Met Leu Ser
85 90 95
Asn Thr Gly Ala Asp Ala Thr Glu Ala Phe Lys Glu Phe His Tyr Arg
100 105 110
Ser Lys Lys Ala Arg Lys Ala Leu Ala Ala Leu Pro His Lys Pro Val
115 120 125
Asp Ala Ala Thr Arg Glu Pro Ile Glu Asp Glu Ala Met Leu Lys Asp
130 135 140
Phe Ala Gln Trp Arg Lys Glu Leu Glu Arg Glu Gly Phe Phe Lys Pro
145 150 155 160
Ser Pro Ala His Val Ala Tyr Arg Phe Ala Glu Leu Ala Ala Met Phe
165 170 175
Ala Leu Gly Thr Ala Leu Met His Ala Arg Trp His Val Ala Ser Val
180 185 190
Ile Val Tyr Ser Cys Phe Phe Gly Ala Arg Cys Gly Trp Val Gln His
195 200 205
Glu Gly Gly His Asn Ser Leu Thr Gly Asn Ile Trp Trp Asp Lys Arg
210 215 220
Ile Gln Ala Phe Ala Ala Gly Phe Gly Leu Ala Ser Ser Gly Asp Met
225 230 235 240
Trp Asn Asn Met His Asn Lys His His Ala Thr Pro Gln Lys Val Arg
245 250 255
His Asp Met Asp Leu Asp Thr Thr Pro Thr Val Ala Phe Phe Asn Ser
260 265 270
Ala Val Glu Glu Asn Arg Pro Arg Gly Phe Ser Lys Leu Trp Leu Arg
275 280 285
Leu Gln Ala Trp Thr Phe Val Pro Val Thr Ser Gly Met Val Leu Phe
290 295 300
Phe Trp Met Phe Val Leu His Pro Arg Asn Ala Leu Arg Arg Lys Ser
305 310 315 320
Phe Glu Glu Ala Ala Trp Met Phe Ser Ala His Val Ile Arg Thr Ala
325 330 335
Val Ile Lys Ala Val Thr Gly Tyr Ser Trp Ile Ala Ser Tyr Gly Leu
340 345 350
Phe Ala Ala Thr Met Trp Ala Ser Gly Cys Tyr Leu Phe Ala His Phe
355 360 365
Ser Thr Ser His Thr His Leu Asp Val Val Pro Ser Asp Lys His Leu
370 375 380
Ser Trp Val Arg Tyr Ala Val Asp His Thr Ile Asp Ile Asn Pro Asn
385 390 395 400
Asn Ser Val Val Asn Trp Leu Met Gly Tyr Leu Asn Cys Gln Val Ile
405 410 415
His His Leu Phe Pro Asp Met Pro Gln Phe Arg Gln Pro Glu Val Ser
420 425 430
Arg Arg Phe Val Pro Phe Ala Lys Lys Trp Asn Leu Asn Tyr Lys Val
435 440 445
Leu Thr Tyr Tyr Gly Ala Trp Lys Ala Thr Phe Gly Asn Leu Asn Asp
450 455 460
Val Gly Lys His Tyr Tyr Val His Gly Ser Gln Arg Val Lys Ser Lys
465 470 475 480
Ser Ala
&lt;210&gt; 20
&lt;211&gt; 456
&lt;212&gt; PRT
&lt;213&gt; Ostreococcus lucimarinus
&lt;400&gt; 20
Met Cys Val Glu Thr Glu Asn Asn Asp Gly Ile Pro Thr Val Glu Ile
1 5 10 15
Ala Phe Asp Gly Glu Arg Glu Arg Ala Glu Ala Asn Val Lys Leu Ser
20 25 30
Ala Glu Lys Met Glu Pro Ala Ala Leu Ala Lys Thr Phe Ala Arg Arg
35 40 45
Tyr Val Val Ile Glu Gly Val Glu Tyr Asp Val Thr Asp Phe Lys His
50 55 60
Pro Gly Gly Thr Val Ile Phe Tyr Ala Leu Ser Asn Thr Gly Ala Asp
65 70 75 80
Ala Thr Glu Ala Phe Lys Glu Phe His His Arg Ser Arg Lys Ala Arg
85 90 95
Lys Ala Leu Ala Ala Leu Pro Ser Arg Pro Ala Lys Thr Ala Lys Val
100 105 110
Asp Asp Ala Glu Met Leu Gln Asp Phe Ala Lys Trp Arg Lys Glu Leu
115 120 125
Glu Arg Asp Gly Phe Phe Lys Pro Ser Pro Ala His Val Ala Tyr Arg
130 135 140
Phe Ala Glu Leu Ala Ala Met Tyr Ala Leu Gly Thr Tyr Leu Met Tyr
145 150 155 160
Ala Arg Tyr Val Val Ser Ser Val Leu Val Tyr Ala Cys Phe Phe Gly
165 170 175
Ala Arg Cys Gly Trp Val Gln His Glu Gly Gly His Ser Ser Leu Thr
180 185 190
Gly Asn Ile Trp Trp Asp Lys Arg Ile Gln Ala Phe Thr Ala Gly Phe
195 200 205
Gly Leu Ala Gly Ser Gly Asp Met Trp Asn Ser Met His Asn Lys His
210 215 220
His Ala Thr Pro Gln Lys Val Arg His Asp Met Asp Leu Asp Thr Thr
225 230 235 240
Pro Ala Val Ala Phe Phe Asn Thr Ala Val Glu Asp Asn Arg Pro Arg
245 250 255
Gly Phe Ser Lys Tyr Trp Leu Arg Leu Gln Ala Trp Thr Phe Ile Pro
260 265 270
Val Thr Ser Gly Leu Val Leu Leu Phe Trp Met Phe Phe Leu His Pro
275 280 285
Ser Lys Ala Leu Lys Gly Gly Lys Tyr Glu Glu Leu Val Trp Met Leu
290 295 300
Ala Ala His Val Ile Arg Thr Trp Thr Ile Lys Ala Val Thr Gly Phe
305 310 315 320
Thr Ala Met Gln Ser Tyr Gly Leu Phe Leu Ala Thr Ser Trp Val Ser
325 330 335
Gly Cys Tyr Leu Phe Ala His Phe Ser Thr Ser His Thr His Leu Asp
340 345 350
Val Val Pro Ala Asp Glu His Leu Ser Trp Val Arg Tyr Ala Val Asp
355 360 365
His Thr Ile Asp Ile Asp Pro Ser Gln Gly Trp Val Asn Trp Leu Met
370 375 380
Gly Tyr Leu Asn Cys Gln Val Ile His His Leu Phe Pro Ser Met Pro
385 390 395 400
Gln Phe Arg Gln Pro Glu Val Ser Arg Arg Phe Val Ala Phe Ala Lys
405 410 415
Lys Trp Asn Leu Asn Tyr Lys Val Met Thr Tyr Ala Gly Ala Trp Lys
420 425 430
Ala Thr Leu Gly Asn Leu Asp Asn Val Gly Lys His Tyr Tyr Val His
435 440 445
Gly Gln His Ser Gly Lys Thr Ala
450 455
&lt;210&gt; 21
&lt;211&gt; 894
&lt;212&gt; DNA
&lt;213&gt; Pyramimonas cordata
&lt;400&gt; 21
atggagttcg ctcagcctct tgtggctatg gcacaggagc agtatgccgc aattgacgcg 60
gtggtagccc ctgcaatttt ctcagctacc gacagcatcg gttggggtct taagcccatt 120
agcagcgcga caaaggatct tcctctcgtt gagagtccga cgccgctcat actgagcctg 180
ttggcctatt ttgcgatcgt cggctctggg ctggtgtacc gcaaagtatt ccctcgcaca 240
gtaaaggggc aagacccctt cctgctgaag gcgctcatgc ttgcgcacaa cgtgttcctc 300
attggcctca gtctatacat gtgcttgaag cttgtctacg aggcttacgt caacaagtac 360
tccttctggg gaaacgccta caaccccgca cagaccgaga tggcgaaggt catctggatt 420
ttctacgtct ccaagatcta tgagttcatg gacacgttca tcatgctctt gaagggcaac 480
gtcaaccagg tctctttcct gcatgtgtac catcatggct ccatctctgg tatctggtgg 540
atgatcacct acgctgcccc tggcggtgac gcgtacttct cggcggcgct caactcgtgg 600
gtgcacgtgt gcatgtacac gtactacttc atggcggcgg tgctgcccaa ggacgagaag 660
accaagcgca agtacctctg gtggggccgc tacctgaccc agatgcagat gttccagttc 720
ttcatgaacc tgctccaggc ggtctacctc ctctactcct ctagccccta ccccaagttc 780
atcgcccagc tgctggtggt gtacatggtc acgctgctga tgctcttcgg caacttctac 840
tacatgaagc accacgcgag caagaagcag aagctggcca gcaagaagca gtag 894
&lt;210&gt; 22
&lt;211&gt; 870
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pyramimonas
cordata 6 elongase in plants (truncated at 3' end and encoding
functional elongase) (version 1)
&lt;400&gt; 22
atggaattcg cccagcctct tgttgctatg gctcaagagc aatacgctgc tatcgatgct 60
gttgttgctc ctgctatctt ctctgctact gattctatcg gatggggact taagcctatc 120
tcttctgcta ctaaggactt gcctcttgtt gagtctccta cacctctcat cctttctttg 180
cttgcttact tcgctatcgt tggatctgga ctcgtttaca gaaaggtttt ccctagaacc 240
gtgaagggac aagatccatt ccttttgaag gctcttatgc ttgctcacaa cgtgttcctt 300
atcggacttt ctctttacat gtgcctcaag cttgtgtacg aggcttacgt taacaagtac 360
tctttctggg gaaacgctta caaccctgct caaactgaga tggctaaggt tatctggatc 420
ttctacgtga gcaagatcta cgagttcatg gataccttca tcatgctcct caagggaaat 480
gttaaccagg ttagcttcct tcacgtttac catcacggat ctatctctgg aatctggtgg 540
atgattactt acgctgctcc tggtggtgat gcttacttct ctgctgctct taactcttgg 600
gttcacgtgt gtatgtacac ctactatttt atggctgccg tgcttcctaa ggacgagaaa 660
actaagagaa agtacctctg gtggggaaga taccttactc aaatgcagat gttccagttc 720
ttcatgaacc ttctccaggc tgtttacctt ctctactctt catctcctta ccctaagttt 780
atcgctcagc tcctcgtggt gtacatggtt actcttctca tgcttttcgg aaacttctac 840
tacatgaagc accacgctag caagtgatga 870
&lt;210&gt; 23
&lt;211&gt; 870
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pyramimonas
cordata 6 elongase in plants (truncated at 3' end and encoding
functional elongase) (version 2)
&lt;400&gt; 23
atggaattcg cccagcctct tgttgctatg gctcaagagc aatacgctgc tatcgatgct 60
gttgttgctc ctgctatctt ctctgctact gattctatcg gatggggact taagcctatc 120
tcttctgcta ctaaggactt gcctcttgtt gagtctccta cacctctcat cctttctttg 180
cttgcttact tcgctatcgt tggatctgga ctcgtttaca gaaaggtttt ccctagaacc 240
gtgaagggac aagatccatt ccttttgaag gctcttatgc ttgctcacaa cgtgttcctt 300
atcggacttt ctctttacat gtgcctcaag cttgtgtacg aggcttacgt taacaagtac 360
tctttctggg gaaacgctta caaccctgct caaactgaga tggctaaggt tatctggatc 420
ttctacgtga gcaagatcta cgagttcatg gataccttca tcatgctcct caagggaaat 480
gttaaccagg ttagcttcct tcacgtttac catcacggat ctatctctgg aatctggtgg 540
atgattactt acgctgctcc tggtggtgat gcttacttct ctgctgctct taactcttgg 600
gttcacgtgt gtatgtacac ctactatttt atggctgccg tgcttcctaa ggacgagaaa 660
actaagagaa agtacctctg gtggggaaga taccttactc aaatgcagat gttccagttc 720
ttcatgaacc ttctccaggc tgtttacctt ctctactctt catctcctta ccctaagttt 780
atcgctcagc tcctcgtggt gtacatggtt actcttctca tgcttttcgg aaacttctac 840
tacatgaagc accacgctag caagtgatga 870
&lt;210&gt; 24
&lt;211&gt; 870
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pyramimonas
cordata 6 elongase in plants (truncated at 3' end and encoding
functional elongase) (version 3)
&lt;400&gt; 24
atggaatttg ctcaacctct cgttgctatg gctcaagagc agtacgctgc tatcgatgct 60
gttgttgctc ctgctatctt ctctgctacc gactctattg gatggggact caagcctatc 120
tcttctgcta ctaaggatct ccctctcgtt gaatctccta cccctcttat cctttctctc 180
ctcgcttact tcgctatcgt tggttctgga ctcgtttacc gtaaagtgtt ccctagaacc 240
gttaagggac aggatccttt ccttctcaag gctcttatgc tcgctcacaa cgttttcctt 300
atcggactca gcctttacat gtgcctcaag ctcgtttacg aggcttacgt gaacaagtac 360
tccttctggg gaaacgctta caaccctgct caaaccgaga tggctaaggt gatctggatc 420
ttctacgtgt ccaagatcta cgagttcatg gacaccttca tcatgcttct caagggaaac 480
gttaaccagg tttccttcct ccatgtttac caccacggat ctatctctgg aatctggtgg 540
atgatcactt atgctgctcc aggtggagat gcttacttct ctgctgctct caactcttgg 600
gttcatgtgt gcatgtacac ctactacttc atggctgctg ttcttcctaa ggacgaaaag 660
accaagagaa agtacctttg gtggggaaga taccttaccc agatgcaaat gttccagttc 720
ttcatgaacc ttctccaggc tgtttacctc ctctactctt cttctcctta ccctaagttc 780
attgctcaac tcctcgttgt ttacatggtt accctcctca tgcttttcgg aaacttctac 840
tacatgaagc accacgcttc taagtgataa 870
&lt;210&gt; 25
&lt;211&gt; 297
&lt;212&gt; PRT
&lt;213&gt; Pyramimonas cordata
&lt;400&gt; 25
Met Glu Phe Ala Gln Pro Leu Val Ala Met Ala Gln Glu Gln Tyr Ala
1 5 10 15
Ala Ile Asp Ala Val Val Ala Pro Ala Ile Phe Ser Ala Thr Asp Ser
20 25 30
Ile Gly Trp Gly Leu Lys Pro Ile Ser Ser Ala Thr Lys Asp Leu Pro
35 40 45
Leu Val Glu Ser Pro Thr Pro Leu Ile Leu Ser Leu Leu Ala Tyr Phe
50 55 60
Ala Ile Val Gly Ser Gly Leu Val Tyr Arg Lys Val Phe Pro Arg Thr
65 70 75 80
Val Lys Gly Gln Asp Pro Phe Leu Leu Lys Ala Leu Met Leu Ala His
85 90 95
Asn Val Phe Leu Ile Gly Leu Ser Leu Tyr Met Cys Leu Lys Leu Val
100 105 110
Tyr Glu Ala Tyr Val Asn Lys Tyr Ser Phe Trp Gly Asn Ala Tyr Asn
115 120 125
Pro Ala Gln Thr Glu Met Ala Lys Val Ile Trp Ile Phe Tyr Val Ser
130 135 140
Lys Ile Tyr Glu Phe Met Asp Thr Phe Ile Met Leu Leu Lys Gly Asn
145 150 155 160
Val Asn Gln Val Ser Phe Leu His Val Tyr His His Gly Ser Ile Ser
165 170 175
Gly Ile Trp Trp Met Ile Thr Tyr Ala Ala Pro Gly Gly Asp Ala Tyr
180 185 190
Phe Ser Ala Ala Leu Asn Ser Trp Val His Val Cys Met Tyr Thr Tyr
195 200 205
Tyr Phe Met Ala Ala Val Leu Pro Lys Asp Glu Lys Thr Lys Arg Lys
210 215 220
Tyr Leu Trp Trp Gly Arg Tyr Leu Thr Gln Met Gln Met Phe Gln Phe
225 230 235 240
Phe Met Asn Leu Leu Gln Ala Val Tyr Leu Leu Tyr Ser Ser Ser Pro
245 250 255
Tyr Pro Lys Phe Ile Ala Gln Leu Leu Val Val Tyr Met Val Thr Leu
260 265 270
Leu Met Leu Phe Gly Asn Phe Tyr Tyr Met Lys His His Ala Ser Lys
275 280 285
Lys Gln Lys Leu Ala Ser Lys Lys Gln
290 295
&lt;210&gt; 26
&lt;211&gt; 288
&lt;212&gt; PRT
&lt;213&gt; Pyramimonas cordata
&lt;400&gt; 26
Met Glu Phe Ala Gln Pro Leu Val Ala Met Ala Gln Glu Gln Tyr Ala
1 5 10 15
Ala Ile Asp Ala Val Val Ala Pro Ala Ile Phe Ser Ala Thr Asp Ser
20 25 30
Ile Gly Trp Gly Leu Lys Pro Ile Ser Ser Ala Thr Lys Asp Leu Pro
35 40 45
Leu Val Glu Ser Pro Thr Pro Leu Ile Leu Ser Leu Leu Ala Tyr Phe
50 55 60
Ala Ile Val Gly Ser Gly Leu Val Tyr Arg Lys Val Phe Pro Arg Thr
65 70 75 80
Val Lys Gly Gln Asp Pro Phe Leu Leu Lys Ala Leu Met Leu Ala His
85 90 95
Asn Val Phe Leu Ile Gly Leu Ser Leu Tyr Met Cys Leu Lys Leu Val
100 105 110
Tyr Glu Ala Tyr Val Asn Lys Tyr Ser Phe Trp Gly Asn Ala Tyr Asn
115 120 125
Pro Ala Gln Thr Glu Met Ala Lys Val Ile Trp Ile Phe Tyr Val Ser
130 135 140
Lys Ile Tyr Glu Phe Met Asp Thr Phe Ile Met Leu Leu Lys Gly Asn
145 150 155 160
Val Asn Gln Val Ser Phe Leu His Val Tyr His His Gly Ser Ile Ser
165 170 175
Gly Ile Trp Trp Met Ile Thr Tyr Ala Ala Pro Gly Gly Asp Ala Tyr
180 185 190
Phe Ser Ala Ala Leu Asn Ser Trp Val His Val Cys Met Tyr Thr Tyr
195 200 205
Tyr Phe Met Ala Ala Val Leu Pro Lys Asp Glu Lys Thr Lys Arg Lys
210 215 220
Tyr Leu Trp Trp Gly Arg Tyr Leu Thr Gln Met Gln Met Phe Gln Phe
225 230 235 240
Phe Met Asn Leu Leu Gln Ala Val Tyr Leu Leu Tyr Ser Ser Ser Pro
245 250 255
Tyr Pro Lys Phe Ile Ala Gln Leu Leu Val Val Tyr Met Val Thr Leu
260 265 270
Leu Met Leu Phe Gly Asn Phe Tyr Tyr Met Lys His His Ala Ser Lys
275 280 285
&lt;210&gt; 27
&lt;211&gt; 1278
&lt;212&gt; DNA
&lt;213&gt; Pavlova salina
&lt;400&gt; 27
atgccgccgc gcgatagcta ctcgtacgcc gccccgccgt cggcccagct gcacgaggtc 60
gataccccgc aggagcatga taagaaggag ctcgtcatcg gtgaccgcgc gtacgacgtg 120
accaactttg tgaagcgcca cccgggtggc aagatcatcg cataccaggt tggcacagat 180
gcgacggacg cgtacaagca gttccatgtg cggtctgcca aggcggacaa gatgctcaag 240
tcgctgcctt cgcgcccggt gcacaagggc tactcgcccc gccgcgctga cctcattgcc 300
gacttccagg agttcaccaa gcagctggag gcggagggca tgtttgagcc gtcgctgccg 360
cacgtggcat accgcctggc ggaggtgatc gcgatgcacg tggccggcgc cgcgctcatc 420
tggcacgggt acaccttcgc gggcattgcc atgctcggcg ttgtgcaggg ccgctgcggc 480
tggctcatgc acgagggcgg ccactactcg ctcacgggca acattgcttt tgaccgtgcc 540
atccaagtcg cgtgctacgg ccttggctgc ggcatgtcgg gcgcgtggtg gcgcaaccag 600
cacaacaagc accacgcgac gccgcagaag ttgcagcacg acgtcgacct cgacaccctc 660
ccgctcgtcg ccttccacga gcggatagcc gccaaggtga agagccccgc gatgaaggcg 720
tggcttagta tgcaggcgaa gctcttcgcg ccagtgacca cgctgctggt cgcgctgggc 780
tggcagctgt acctgcaccc gcgccatatg ctgcgcacca agcactacga cgagctcgcg 840
atgctcggca ttcgctacgg ccttgtcggc tacctcgcgg cgaactacgg cgcggggtac 900
gtgctcgcgt gctacctgct gtacgtgcag ctcggcgcca tgtacatctt ctgcaacttt 960
gccgtgtcgc acacacacct gccggttgtc gagcctaacg agcacgcaac gtgggtggag 1020
tacgccgcga accacacgac caactgctcg ccctcgtggt ggtgcgactg gtggatgtcg 1080
tacctcaact accagatcga gcaccacctc tacccgtcca tgccgcagtt ccgccacccg 1140
aagattgcgc cgcgggtgaa gcagctcttc gagaagcacg gcctgcacta cgacgtgcgt 1200
ggctacttcg aggccatggc ggacacgttt gccaaccttg acaacgtcgc gcacgcgccg 1260
gagaagaaga tgcagtga 1278
&lt;210&gt; 28
&lt;211&gt; 1281
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pavlova
salina 5 desaturase in plants (version 1)
&lt;400&gt; 28
atgcctccaa gggactctta ctcttatgct gctcctcctt ctgctcaact tcacgaagtt 60
gatactcctc aagagcacga caagaaagag cttgttatcg gagatagggc ttacgatgtt 120
accaacttcg ttaagagaca ccctggtgga aagatcattg cttaccaagt tggaactgat 180
gctaccgatg cttacaagca gttccatgtt agatctgcta aggctgacaa gatgcttaag 240
tctcttcctt ctcgtcctgt tcacaaggga tactctccaa gaagggctga tcttatcgct 300
gatttccaag agttcaccaa gcaacttgag gctgagggaa tgttcgagcc ttctcttcct 360
catgttgctt acagacttgc tgaggttatc gctatgcatg ttgctggtgc tgctcttatc 420
tggcatggat acactttcgc tggaatcgct atgcttggag ttgttcaggg aagatgtgga 480
tggcttatgc atgagggtgg acattactct ctcactggaa acattgcttt cgacagagct 540
atccaagttg cttgttacgg acttggatgt ggaatgtctg gtgcttggtg gcgtaaccag 600
cataacaagc accatgctac tcctcaaaag cttcagcacg atgttgatct tgataccctt 660
cctctcgttg ctttccatga gagaatcgct gctaaggtta agtctcctgc tatgaaggct 720
tggctttcta tgcaagctaa gcttttcgct cctgttacca ctcttcttgt tgctcttgga 780
tggcagcttt accttcatcc tagacacatg ctcaggacta agcactacga tgagcttgct 840
atgctcggaa tcagatacgg acttgttgga taccttgctg ctaactacgg tgctggatac 900
gttctcgctt gttaccttct ttacgttcag cttggagcta tgtacatctt ctgcaacttc 960
gctgtttctc atactcacct ccctgttgtt gagcctaacg agcatgctac ttgggttgag 1020
tacgctgcta accacactac taactgttct ccatcttggt ggtgtgattg gtggatgtct 1080
taccttaact accagatcga gcaccacctt tacccttcta tgcctcaatt cagacaccct 1140
aagatcgctc ctagagttaa gcagcttttc gagaagcacg gacttcacta cgatgttaga 1200
ggatacttcg aggctatggc tgatactttc gctaaccttg ataacgttgc ccatgctcct 1260
gagaagaaaa tgcagtaatg a 1281
&lt;210&gt; 29
&lt;211&gt; 1281
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pavlova
salina 5 desaturase in plants (version 2)
&lt;400&gt; 29
atgcctccta gggactctta ctcttacgct gctcctcctt ctgctcaact tcacgaggtt 60
gacactcctc aagagcacga caagaaagag cttgttatcg gagatagggc ttacgatgtg 120
accaacttcg ttaagagaca ccctggtgga aagatcattg cttaccaagt gggaactgat 180
gctaccgatg cttacaagca gttccatgtg agatctgcta aggctgacaa gatgctcaag 240
tctctccctt ctagacctgt tcacaaggga tactctccta gaagagctga tcttatcgct 300
gacttccaag agttcactaa gcaacttgag gctgagggaa tgttcgaacc ttctctccct 360
catgttgctt accgtcttgc tgaggttatc gctatgcatg ttgctggtgc tgctcttatc 420
tggcacggat acactttcgc tggaatcgct atgcttggag ttgttcaggg aagatgcgga 480
tggcttatgc atgagggtgg acactactct cttaccggaa acattgcttt cgatagggct 540
atccaagttg cttgttacgg acttggatgc ggaatgtctg gtgcttggtg gagaaaccag 600
cataacaagc accatgctac tcctcaaaag ctccagcacg atgttgatct tgataccctc 660
cctctcgttg ctttccatga gagaatcgct gctaaggtta agtctcctgc tatgaaggct 720
tggctctcca tgcaagctaa actcttcgct cctgttacca ctcttcttgt tgctcttgga 780
tggcagcttt accttcaccc tagacacatg ctcagaacta agcactacga cgagcttgct 840
atgcttggta tcagatacgg acttgtggga taccttgctg ctaactacgg tgctggatac 900
gttcttgctt gctaccttct ctacgttcag cttggagcta tgtacatctt ctgcaacttc 960
gctgtttctc acactcatct ccctgttgtt gagcctaacg agcatgctac ttgggttgag 1020
tacgctgcta accacactac taactgctct ccatcttggt ggtgtgattg gtggatgagc 1080
tacctcaact accagatcga gcatcacctt tacccttcta tgcctcagtt caggcatcct 1140
aagatcgctc ctagagtgaa gcaactcttc gagaagcacg gacttcacta cgatgtgcgt 1200
ggatacttcg aggctatggc tgatactttc gctaacctcg ataacgttgc tcatgctcct 1260
gagaagaaaa tgcaatgatg a 1281
&lt;210&gt; 30
&lt;211&gt; 425
&lt;212&gt; PRT
&lt;213&gt; Pavlova salina
&lt;400&gt; 30
Met Pro Pro Arg Asp Ser Tyr Ser Tyr Ala Ala Pro Pro Ser Ala Gln
1 5 10 15
Leu His Glu Val Asp Thr Pro Gln Glu His Asp Lys Lys Glu Leu Val
20 25 30
Ile Gly Asp Arg Ala Tyr Asp Val Thr Asn Phe Val Lys Arg His Pro
35 40 45
Gly Gly Lys Ile Ile Ala Tyr Gln Val Gly Thr Asp Ala Thr Asp Ala
50 55 60
Tyr Lys Gln Phe His Val Arg Ser Ala Lys Ala Asp Lys Met Leu Lys
65 70 75 80
Ser Leu Pro Ser Arg Pro Val His Lys Gly Tyr Ser Pro Arg Arg Ala
85 90 95
Asp Leu Ile Ala Asp Phe Gln Glu Phe Thr Lys Gln Leu Glu Ala Glu
100 105 110
Gly Met Phe Glu Pro Ser Leu Pro His Val Ala Tyr Arg Leu Ala Glu
115 120 125
Val Ile Ala Met His Val Ala Gly Ala Ala Leu Ile Trp His Gly Tyr
130 135 140
Thr Phe Ala Gly Ile Ala Met Leu Gly Val Val Gln Gly Arg Cys Gly
145 150 155 160
Trp Leu Met His Glu Gly Gly His Tyr Ser Leu Thr Gly Asn Ile Ala
165 170 175
Phe Asp Arg Ala Ile Gln Val Ala Cys Tyr Gly Leu Gly Cys Gly Met
180 185 190
Ser Gly Ala Trp Trp Arg Asn Gln His Asn Lys His His Ala Thr Pro
195 200 205
Gln Lys Leu Gln His Asp Val Asp Leu Asp Thr Leu Pro Leu Val Ala
210 215 220
Phe His Glu Arg Ile Ala Ala Lys Val Lys Ser Pro Ala Met Lys Ala
225 230 235 240
Trp Leu Ser Met Gln Ala Lys Leu Phe Ala Pro Val Thr Thr Leu Leu
245 250 255
Val Ala Leu Gly Trp Gln Leu Tyr Leu His Pro Arg His Met Leu Arg
260 265 270
Thr Lys His Tyr Asp Glu Leu Ala Met Leu Gly Ile Arg Tyr Gly Leu
275 280 285
Val Gly Tyr Leu Ala Ala Asn Tyr Gly Ala Gly Tyr Val Leu Ala Cys
290 295 300
Tyr Leu Leu Tyr Val Gln Leu Gly Ala Met Tyr Ile Phe Cys Asn Phe
305 310 315 320
Ala Val Ser His Thr His Leu Pro Val Val Glu Pro Asn Glu His Ala
325 330 335
Thr Trp Val Glu Tyr Ala Ala Asn His Thr Thr Asn Cys Ser Pro Ser
340 345 350
Trp Trp Cys Asp Trp Trp Met Ser Tyr Leu Asn Tyr Gln Ile Glu His
355 360 365
His Leu Tyr Pro Ser Met Pro Gln Phe Arg His Pro Lys Ile Ala Pro
370 375 380
Arg Val Lys Gln Leu Phe Glu Lys His Gly Leu His Tyr Asp Val Arg
385 390 395 400
Gly Tyr Phe Glu Ala Met Ala Asp Thr Phe Ala Asn Leu Asp Asn Val
405 410 415
Ala His Ala Pro Glu Lys Lys Met Gln
420 425
&lt;210&gt; 31
&lt;211&gt; 1329
&lt;212&gt; DNA
&lt;213&gt; Pyramimonas cordata
&lt;400&gt; 31
atgggaaagg gaggcaatgc tagcgctcct actgcgaaga aggaggtgtt gatcgagggg 60
aagttttacg atgtcaccga cttcaggcac cccggtggtt cgatcatcaa gtttctctcg 120
ggttctggtg ctgacgccac cgcttcctac cgcgagttcc acgttaggtc agcgaaggca 180
gacaagttct tgaagacgct gccctcccgc gaagccactc cccaggagct gaagcaggcg 240
gttgagttct ccaagctcaa cccgccctcc gcggagagtg cctctgctcc cctgaccgac 300
cttgccaagg tggaagcgct gaacaaggac ttcgaggctt tccgtgagca gctcattcag 360
gagggcttct ttaagcccaa tatcccgcat gtggtcaagc gcatcacgga agtcgtggcg 420
atgatggccg tagcctcctg gatgatggtg cagaccaacg ctcttgttgt gaccctcgga 480
gttctgatcc gcggcattgc acagggccgg tgcggttggc ttatgcacga gggcggccac 540
tatagtctta ctgggaagat ctccattgat aggcgtctgc aggagtcaat ttacggattc 600
ggctgtggaa tgtccggcgc ctggtggcgc aaccagcaca acaagcacca cgcaacccca 660
cagaagctgc agcatgacgt cgacctggag acccttcctc tgatggcttt caacaacgct 720
gttaccgata gacgcaaggt gaagcctggt agtctccagg ctctgtggct caagtaccag 780
gccttcctct tcttccccgt gacctccctt ctggtcggcc tcggttggac caccgtcctc 840
caccccaggc acagcttgcg caccaagcac tatttcgagc tgctctgcat ggctgctcgt 900
tacgcgagtt tcgctgctct tttcgctccc aagtacggac ttgcaggagc tgccgggctc 960
tacctcgcca ccttcgctgt cgggtgcaac tatattttca tcaacttctc ggtctctcac 1020
actcacctgc ccgtgagcgg tgcgagcgag tacctgcatt gggtcgtgta ttcggccatc 1080
cacaccacta acatcaaatc cagcatgctg tgcgattggt ggatgtcatt cctcaacttc 1140
cagatcgagc atcacctgtt cccttcaatg ccccagttcc gccacaagat tatctccccg 1200
cgtgtaaagg ccttgtttga gaagcacggt cttgtgtatg atgtgcgccc ctattggggg 1260
gccatggctg acaccttcaa gaacttgaat gacgttggca ctcacgcatc tcactccaag 1320
gcgcactag 1329
&lt;210&gt; 32
&lt;211&gt; 442
&lt;212&gt; PRT
&lt;213&gt; Pyramimonas cordata
&lt;400&gt; 32
Met Gly Lys Gly Gly Asn Ala Ser Ala Pro Thr Ala Lys Lys Glu Val
1 5 10 15
Leu Ile Glu Gly Lys Phe Tyr Asp Val Thr Asp Phe Arg His Pro Gly
20 25 30
Gly Ser Ile Ile Lys Phe Leu Ser Gly Ser Gly Ala Asp Ala Thr Ala
35 40 45
Ser Tyr Arg Glu Phe His Val Arg Ser Ala Lys Ala Asp Lys Phe Leu
50 55 60
Lys Thr Leu Pro Ser Arg Glu Ala Thr Pro Gln Glu Leu Lys Gln Ala
65 70 75 80
Val Glu Phe Ser Lys Leu Asn Pro Pro Ser Ala Glu Ser Ala Ser Ala
85 90 95
Pro Leu Thr Asp Leu Ala Lys Val Glu Ala Leu Asn Lys Asp Phe Glu
100 105 110
Ala Phe Arg Glu Gln Leu Ile Gln Glu Gly Phe Phe Lys Pro Asn Ile
115 120 125
Pro His Val Val Lys Arg Ile Thr Glu Val Val Ala Met Met Ala Val
130 135 140
Ala Ser Trp Met Met Val Gln Thr Asn Ala Leu Val Val Thr Leu Gly
145 150 155 160
Val Leu Ile Arg Gly Ile Ala Gln Gly Arg Cys Gly Trp Leu Met His
165 170 175
Glu Gly Gly His Tyr Ser Leu Thr Gly Lys Ile Ser Ile Asp Arg Arg
180 185 190
Leu Gln Glu Ser Ile Tyr Gly Phe Gly Cys Gly Met Ser Gly Ala Trp
195 200 205
Trp Arg Asn Gln His Asn Lys His His Ala Thr Pro Gln Lys Leu Gln
210 215 220
His Asp Val Asp Leu Glu Thr Leu Pro Leu Met Ala Phe Asn Asn Ala
225 230 235 240
Val Thr Asp Arg Arg Lys Val Lys Pro Gly Ser Leu Gln Ala Leu Trp
245 250 255
Leu Lys Tyr Gln Ala Phe Leu Phe Phe Pro Val Thr Ser Leu Leu Val
260 265 270
Gly Leu Gly Trp Thr Thr Val Leu His Pro Arg His Ser Leu Arg Thr
275 280 285
Lys His Tyr Phe Glu Leu Leu Cys Met Ala Ala Arg Tyr Ala Ser Phe
290 295 300
Ala Ala Leu Phe Ala Pro Lys Tyr Gly Leu Ala Gly Ala Ala Gly Leu
305 310 315 320
Tyr Leu Ala Thr Phe Ala Val Gly Cys Asn Tyr Ile Phe Ile Asn Phe
325 330 335
Ser Val Ser His Thr His Leu Pro Val Ser Gly Ala Ser Glu Tyr Leu
340 345 350
His Trp Val Val Tyr Ser Ala Ile His Thr Thr Asn Ile Lys Ser Ser
355 360 365
Met Leu Cys Asp Trp Trp Met Ser Phe Leu Asn Phe Gln Ile Glu His
370 375 380
His Leu Phe Pro Ser Met Pro Gln Phe Arg His Lys Ile Ile Ser Pro
385 390 395 400
Arg Val Lys Ala Leu Phe Glu Lys His Gly Leu Val Tyr Asp Val Arg
405 410 415
Pro Tyr Trp Gly Ala Met Ala Asp Thr Phe Lys Asn Leu Asn Asp Val
420 425 430
Gly Thr His Ala Ser His Ser Lys Ala His
435 440
&lt;210&gt; 33
&lt;211&gt; 804
&lt;212&gt; DNA
&lt;213&gt; Pyramimonas cordata
&lt;400&gt; 33
atggcgtcta ttgcgattcc ggctgcgctg gcagggactc ttggttatgt gacgtacaat 60
gtcgcaaacc cagatattcc tgcatccgag aaggtgcctg cttactttat gcaggtcgag 120
tattgggggc caacgattgg gaccatcggt tatcttctgt tcatctactt tggtaaacgg 180
attatgcaaa acaggagcca gccgtttggc ctgaagaacg ctatgctggt gtacaacttc 240
tatcagactt tcttcaactc gtactgcata tacctttttg tcacgtcgca ccgcgctcag 300
gggctgaaag tttggggaaa catccccgat atgactgcca acagctgggg gatctcacag 360
gtgatctggc tgcactacaa caacaagtac gttgagctgc tggacacgtt cttcatggtc 420
atgcgcaaga agtttgacca gctttcgttc ctgcacattt accatcatac cctgttgatc 480
tggtcttggt tcgtggtgat gaaattggag cccgttgggg actgctactt tggctctagc 540
gtcaacacgt ttgtgcacgt cattatgtac tcgtactatg gccttgccgc gctcggggtg 600
aattgcttct ggaagaagta cattacgcag attcagatgc tgcagttctg tatctgcgct 660
tcgcactcga tttataccgc ctatgtgcag aacaccgcgt tctggttgcc ttacttgcag 720
ctgtgggtga tggtgaacat gttcgtgttg ttcgccaact tctatcgcaa gcgctacaag 780
agcaagggtg ccaagaagca gtaa 804
&lt;210&gt; 34
&lt;211&gt; 807
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pyramimonas
cordata 5 elongase in plants (version 1)
&lt;400&gt; 34
atggcctcta tcgctatccc tgctgctctt gctggaactc ttggatacgt tacctacaat 60
gtggctaacc ctgatatccc agcttctgag aaagttcctg cttacttcat gcaggttgag 120
tactggggac ctactatcgg aactattgga tacctcctct tcatctactt cggaaagcgt 180
atcatgcaga acagatctca acctttcgga ctcaagaacg ctatgctcgt ttacaacttc 240
taccagacct tcttcaacag ctactgcatc taccttttcg ttacttctca tagggctcag 300
ggacttaagg tttggggaaa catccctgat atgactgcta actcttgggg aatctctcag 360
gttatctggc ttcactacaa caacaagtac gttgagcttc tcgacacctt cttcatggtg 420
atgaggaaga agttcgacca gctttctttc cttcacatct accaccacac tcttctcatc 480
tggtcatggt tcgttgttat gaagcttgag cctgttggag attgctactt cggatcttct 540
gttaacacct tcgtgcacgt gatcatgtac tcttactacg gacttgctgc tcttggagtt 600
aactgtttct ggaagaagta catcacccag atccagatgc ttcagttctg tatctgtgct 660
tctcactcta tctacaccgc ttacgttcag aataccgctt tctggcttcc ttaccttcaa 720
ctctgggtta tggtgaacat gttcgttctc ttcgccaact tctaccgtaa gaggtacaag 780
tctaagggtg ctaagaagca gtgataa 807
&lt;210&gt; 35
&lt;211&gt; 867
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pyramimonas
cordata 5 elongase in plants (version 2)
&lt;400&gt; 35
atggaatttg ctcaacctct cgttgctatg gctcaagagc agtacgctgc tatcgatgct 60
gttgttgctc ctgctatctt ctctgctacc gactctattg gatggggact caagcctatc 120
tcttctgcta ctaaggatct ccctctcgtt gaatctccta cccctcttat cctttctctc 180
ctcgcttact tcgctatcgt tggttctgga ctcgtttacc gtaaagtgtt ccctagaacc 240
gttaagggac aggatccttt ccttctcaag gctcttatgc tcgctcacaa cgttttcctt 300
atcggactca gcctttacat gtgcctcaag ctcgtttacg aggcttacgt gaacaagtac 360
tccttctggg gaaacgctta caaccctgct caaaccgaga tggctaaggt gatctggatc 420
ttctacgtgt ccaagatcta cgagttcatg gacaccttca tcatgcttct caagggaaac 480
gttaaccagg tttccttcct ccatgtttac caccacggat ctatctctgg aatctggtgg 540
atgatcactt atgctgctcc aggtggagat gcttacttct ctgctgctct caactcttgg 600
gttcatgtgt gcatgtacac ctactacttc atggctgctg ttcttcctaa ggacgaaaag 660
accaagagaa agtacctttg gtggggaaga taccttaccc agatgcaaat gttccagttc 720
ttcatgaacc ttctccaggc tgtttacctc ctctactctt cttctcctta ccctaagttc 780
attgctcaac tcctcgttgt ttacatggtt accctcctca tgcttttcgg aaacttctac 840
tacatgaagc accacgcttc taagtga 867
&lt;210&gt; 36
&lt;211&gt; 807
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pyramimonas
cordata 5 elongase in plants (version 3)
&lt;400&gt; 36
atggcttcta tcgctatccc tgctgctctt gctggaactc ttggatacgt gacctacaac 60
gtggctaacc ctgatattcc tgcttctgag aaggttccag cttacttcat gcaagtggag 120
tactggggac ctactatcgg aactatcggt tacctcctct tcatctactt cggaaagcgt 180
atcatgcaaa acagaagcca gcctttcgga cttaagaacg ctatgctcgt gtacaacttc 240
taccagacct tcttcaacag ctactgcatc tacctcttcg ttacctctca tagggctcag 300
ggacttaaag tttggggaaa catccctgat atgaccgcta actcttgggg aatctctcag 360
gttatctggc tccactacaa caacaagtac gtggagcttc tcgatacctt cttcatggtg 420
atgaggaaga agttcgacca gctttctttc cttcacatct accaccacac tcttctcatc 480
tggtcatggt tcgtggttat gaagctcgag cctgttggag attgctactt cggatctagc 540
gttaacacct tcgtgcacgt gatcatgtac tcttactacg gacttgctgc tcttggagtt 600
aactgcttct ggaagaagta catcacccag atccagatgc ttcagttctg tatctgcgct 660
tctcactcta tctacaccgc ttacgttcag aacactgctt tctggcttcc ttaccttcag 720
ctctgggtga tggttaacat gttcgtgctc ttcgctaact tctaccgtaa aaggtacaag 780
agcaagggtg ctaagaagca gtgataa 807
&lt;210&gt; 37
&lt;211&gt; 267
&lt;212&gt; PRT
&lt;213&gt; Pyramimonas cordata
&lt;400&gt; 37
Met Ala Ser Ile Ala Ile Pro Ala Ala Leu Ala Gly Thr Leu Gly Tyr
1 5 10 15
Val Thr Tyr Asn Val Ala Asn Pro Asp Ile Pro Ala Ser Glu Lys Val
20 25 30
Pro Ala Tyr Phe Met Gln Val Glu Tyr Trp Gly Pro Thr Ile Gly Thr
35 40 45
Ile Gly Tyr Leu Leu Phe Ile Tyr Phe Gly Lys Arg Ile Met Gln Asn
50 55 60
Arg Ser Gln Pro Phe Gly Leu Lys Asn Ala Met Leu Val Tyr Asn Phe
65 70 75 80
Tyr Gln Thr Phe Phe Asn Ser Tyr Cys Ile Tyr Leu Phe Val Thr Ser
85 90 95
His Arg Ala Gln Gly Leu Lys Val Trp Gly Asn Ile Pro Asp Met Thr
100 105 110
Ala Asn Ser Trp Gly Ile Ser Gln Val Ile Trp Leu His Tyr Asn Asn
115 120 125
Lys Tyr Val Glu Leu Leu Asp Thr Phe Phe Met Val Met Arg Lys Lys
130 135 140
Phe Asp Gln Leu Ser Phe Leu His Ile Tyr His His Thr Leu Leu Ile
145 150 155 160
Trp Ser Trp Phe Val Val Met Lys Leu Glu Pro Val Gly Asp Cys Tyr
165 170 175
Phe Gly Ser Ser Val Asn Thr Phe Val His Val Ile Met Tyr Ser Tyr
180 185 190
Tyr Gly Leu Ala Ala Leu Gly Val Asn Cys Phe Trp Lys Lys Tyr Ile
195 200 205
Thr Gln Ile Gln Met Leu Gln Phe Cys Ile Cys Ala Ser His Ser Ile
210 215 220
Tyr Thr Ala Tyr Val Gln Asn Thr Ala Phe Trp Leu Pro Tyr Leu Gln
225 230 235 240
Leu Trp Val Met Val Asn Met Phe Val Leu Phe Ala Asn Phe Tyr Arg
245 250 255
Lys Arg Tyr Lys Ser Lys Gly Ala Lys Lys Gln
260 265
&lt;210&gt; 38
&lt;211&gt; 1344
&lt;212&gt; DNA
&lt;213&gt; Pavlova salina
&lt;400&gt; 38
atgcctccga gcgcggcgaa gcagatgggc gcgagcacgg gcgtgcatgc gggcgtcaca 60
gattcgtcgg ccttcacgcg caaggatgtc gccgacaggc cggacctcac gatcgtgggt 120
gacagcgtgt acgatgcgaa ggcgttccgc tccgagcatc cgggtggcgc gcactttgtg 180
tcgctgttcg gcgggcgcga tgccacggag gcgttcatgg agtaccaccg gcgcgcctgg 240
cccaagtcgc gcatgtcgcg cttccacgtc ggctctctgg catcgaccga ggagcccgtc 300
gccgccgatg agggctacct ccagctgtgc gctcgcatcg ccaagatggt gccgtcggtc 360
agcagcgggt tcgcgccggc gtcgtactgg gtgaaggccg ggctgatcct cggctccgcg 420
atcgcgctcg aggcgtacat gctgtacgcg ggcaagcgcc tgctcccgtc gatcgtgctc 480
gggtggctgt ttgcgctgat tggcctgaac atccagcacg atgccaacca cggcgcgctc 540
tccaagtcgg cctcggtcaa cctggcgctc gggttgtgcc aggactggat cggcgggagc 600
atgatcctct ggctgcagga gcacgttgtc atgcaccact tgcacaccaa cgacgttgac 660
aaggacccgg accagaaggc gcacggcgcc ctgcggctca agccgaccga cgcgtggagc 720
ccgatgcact ggctgcagca cctctacctg ctgcctgggg agacgatgta cgccttcaag 780
ctgctgtttc tcgacatcag cgagctggtg atgtggcggt gggagggcga gcccatcagc 840
aagctggccg ggtacctctt catgccctcg ctgctcctca agctcacctt ctgggcgcgc 900
tttgtcgcgc tgccgctgta cctcgcgccc agcgtgcaca cggcggtgtg catcgcggcg 960
acggtaatga cggggagctt ctacctcgcc ttcttcttct tcatctcgca caacttcgag 1020
ggcgtggcga gcgtcggacc ggacggcagc atcaccagca tgacgcgcgg cgcatccttc 1080
ctcaagcggc aggccgagac ctcgtccaac gtgggcggcc cgctgctcgc cacgctcaac 1140
ggcggcctca actaccaaat cgagcaccac ctcttcccca gggtgcacca cggcttctac 1200
cctcgcctcg cgccgttggt caaggcggag ctcgaggcgc gcggcattga gtacaagcac 1260
taccccacca tatggagcaa cctggcatcc acgctgaggc acatgtacgc gctcggccgc 1320
aggccgcgca gcaaggcgga gtga 1344
&lt;210&gt; 39
&lt;211&gt; 1347
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pavlova
salina 4 desaturase in plants (version 1)
&lt;400&gt; 39
atgccaccta gcgctgctaa gcaaatggga gcttctactg gtgttcatgc tggtgttact 60
gactcttctg ctttcaccag aaaggatgtt gctgatagac ctgatctcac catcgttgga 120
gattctgttt acgatgctaa ggctttcaga tctgagcatc ctggtggtgc tcatttcgtt 180
tctttgttcg gaggaagaga tgctactgag gctttcatgg aataccatag aagggcttgg 240
cctaagtcta gaatgtctag attccacgtt ggatctcttg cttctactga ggaacctgtt 300
gctgctgatg agggatacct tcaactttgt gctaggatcg ctaagatggt gccttctgtt 360
tcttctggat tcgctcctgc ttcttactgg gttaaggctg gacttatcct tggatctgct 420
atcgctcttg aggcttacat gctttacgct ggaaagagac ttctcccttc tatcgttctt 480
ggatggcttt tcgctcttat cggtcttaac atccagcatg atgctaacca tggtgctttg 540
tctaagtctg cttctgttaa ccttgctctt ggactttgtc aggattggat cggaggatct 600
atgatccttt ggcttcaaga gcatgttgtt atgcaccacc tccacactaa cgatgttgat 660
aaggatcctg atcaaaaggc tcacggtgct cttagactca agcctactga tgcttggtca 720
cctatgcatt ggcttcagca tctttacctt ttgcctggtg agactatgta cgctttcaag 780
cttttgttcc tcgacatctc tgagcttgtt atgtggcgtt gggagggtga gcctatctct 840
aagcttgctg gatacctctt tatgccttct ttgcttctca agcttacctt ctgggctaga 900
ttcgttgctt tgcctcttta ccttgctcct tctgttcata ctgctgtgtg tatcgctgct 960
actgttatga ctggatcttt ctacctcgct ttcttcttct tcatctccca caacttcgag 1020
ggtgttgctt ctgttggacc tgatggatct atcacttcta tgactagagg tgctagcttc 1080
cttaagagac aagctgagac ttcttctaac gttggaggac ctcttcttgc tactcttaac 1140
ggtggactca actaccaaat tgagcatcac ttgttcccta gagttcacca tggattctac 1200
cctagacttg ctcctcttgt taaggctgag cttgaggcta gaggaatcga gtacaagcac 1260
taccctacta tctggtctaa ccttgcttct accctcagac atatgtacgc tcttggaaga 1320
aggcctagat ctaaggctga gtaatga 1347
&lt;210&gt; 40
&lt;211&gt; 1347
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Pavlova
salina 4 desaturase in plants (version 2)
&lt;400&gt; 40
atgcctccat ctgctgctaa acagatggga gcttctactg gtgttcacgc tggtgttacc 60
gattcttctg ctttcaccag aaaggatgtg gctgatagac ctgatcttac catcgttggt 120
gactctgtgt acgatgctaa ggctttcaga tctgagcatc ctggtggtgc tcatttcgtt 180
tcactcttcg gaggaagaga tgctactgag gctttcatgg aataccacag aagagcttgg 240
cctaagtcta ggatgtctag gttccatgtt ggatctcttg cttctaccga ggaacctgtt 300
gctgctgatg agggatacct tcagctttgt gctaggatcg ctaagatggt gccttctgtg 360
tcatctggat tcgctccagc ttcttactgg gttaaggctg gacttatcct cggatctgct 420
atcgctcttg aggcttacat gctctacgct ggaaagagac ttctcccttc tatcgttctt 480
ggatggctct tcgctcttat cggacttaac atccagcatg acgctaacca tggtgctttg 540
tctaagtctg ctagcgttaa ccttgctctt ggactttgtc aggattggat cggaggatct 600
atgatccttt ggctccaaga gcatgttgtt atgcaccacc tccacaccaa cgatgttgat 660
aaggaccctg atcaaaaggc tcatggtgct cttagactca agcctaccga tgcttggtca 720
cctatgcatt ggcttcagca cctttacctt ctccctggtg aaactatgta cgctttcaag 780
ctcctcttcc tcgatatctc tgagcttgtg atgtggagat gggagggtga acctatctct 840
aagctcgctg gatacctctt catgccttct cttctcctca agcttacctt ctgggctaga 900
ttcgttgctc ttcctcttta cctcgctcct tctgttcata ctgctgtgtg tatcgctgct 960
actgttatga ccggaagctt ctaccttgct ttcttcttct tcatcagcca caacttcgag 1020
ggtgttgctt ctgttggacc tgatggatct atcacctcta tgaccagggg agcttctttc 1080
cttaagaggc aggctgagac ttcttctaat gtgggaggac ctcttcttgc tactcttaac 1140
ggtggactca actaccaaat cgagcaccac cttttcccta gagttcacca cggattctac 1200
cctagacttg ctcctcttgt gaaggctgaa cttgaggcta gaggaatcga gtacaagcac 1260
taccctacca tctggtctaa cctcgcttct accctcagac atatgtacgc tcttggaaga 1320
aggcctagat ctaaggctga gtgatga 1347
&lt;210&gt; 41
&lt;211&gt; 447
&lt;212&gt; PRT
&lt;213&gt; Pavlova salina
&lt;400&gt; 41
Met Pro Pro Ser Ala Ala Lys Gln Met Gly Ala Ser Thr Gly Val His
1 5 10 15
Ala Gly Val Thr Asp Ser Ser Ala Phe Thr Arg Lys Asp Val Ala Asp
20 25 30
Arg Pro Asp Leu Thr Ile Val Gly Asp Ser Val Tyr Asp Ala Lys Ala
35 40 45
Phe Arg Ser Glu His Pro Gly Gly Ala His Phe Val Ser Leu Phe Gly
50 55 60
Gly Arg Asp Ala Thr Glu Ala Phe Met Glu Tyr His Arg Arg Ala Trp
65 70 75 80
Pro Lys Ser Arg Met Ser Arg Phe His Val Gly Ser Leu Ala Ser Thr
85 90 95
Glu Glu Pro Val Ala Ala Asp Glu Gly Tyr Leu Gln Leu Cys Ala Arg
100 105 110
Ile Ala Lys Met Val Pro Ser Val Ser Ser Gly Phe Ala Pro Ala Ser
115 120 125
Tyr Trp Val Lys Ala Gly Leu Ile Leu Gly Ser Ala Ile Ala Leu Glu
130 135 140
Ala Tyr Met Leu Tyr Ala Gly Lys Arg Leu Leu Pro Ser Ile Val Leu
145 150 155 160
Gly Trp Leu Phe Ala Leu Ile Gly Leu Asn Ile Gln His Asp Ala Asn
165 170 175
His Gly Ala Leu Ser Lys Ser Ala Ser Val Asn Leu Ala Leu Gly Leu
180 185 190
Cys Gln Asp Trp Ile Gly Gly Ser Met Ile Leu Trp Leu Gln Glu His
195 200 205
Val Val Met His His Leu His Thr Asn Asp Val Asp Lys Asp Pro Asp
210 215 220
Gln Lys Ala His Gly Ala Leu Arg Leu Lys Pro Thr Asp Ala Trp Ser
225 230 235 240
Pro Met His Trp Leu Gln His Leu Tyr Leu Leu Pro Gly Glu Thr Met
245 250 255
Tyr Ala Phe Lys Leu Leu Phe Leu Asp Ile Ser Glu Leu Val Met Trp
260 265 270
Arg Trp Glu Gly Glu Pro Ile Ser Lys Leu Ala Gly Tyr Leu Phe Met
275 280 285
Pro Ser Leu Leu Leu Lys Leu Thr Phe Trp Ala Arg Phe Val Ala Leu
290 295 300
Pro Leu Tyr Leu Ala Pro Ser Val His Thr Ala Val Cys Ile Ala Ala
305 310 315 320
Thr Val Met Thr Gly Ser Phe Tyr Leu Ala Phe Phe Phe Phe Ile Ser
325 330 335
His Asn Phe Glu Gly Val Ala Ser Val Gly Pro Asp Gly Ser Ile Thr
340 345 350
Ser Met Thr Arg Gly Ala Ser Phe Leu Lys Arg Gln Ala Glu Thr Ser
355 360 365
Ser Asn Val Gly Gly Pro Leu Leu Ala Thr Leu Asn Gly Gly Leu Asn
370 375 380
Tyr Gln Ile Glu His His Leu Phe Pro Arg Val His His Gly Phe Tyr
385 390 395 400
Pro Arg Leu Ala Pro Leu Val Lys Ala Glu Leu Glu Ala Arg Gly Ile
405 410 415
Glu Tyr Lys His Tyr Pro Thr Ile Trp Ser Asn Leu Ala Ser Thr Leu
420 425 430
Arg His Met Tyr Ala Leu Gly Arg Arg Pro Arg Ser Lys Ala Glu
435 440 445
&lt;210&gt; 42
&lt;211&gt; 792
&lt;212&gt; DNA
&lt;213&gt; Isochrysis galbana
&lt;400&gt; 42
atggccctcg caaacgacgc gggagagcgc atctgggcgg ctgtgaccga cccggaaatc 60
ctcattggca ccttctcgta cttgctactc aaaccgctgc tccgcaattc cgggctggtg 120
gatgagaaga agggcgcata caggacgtcc atgatctggt acaacgttct gctggcgctc 180
ttctctgcgc tgagcttcta cgtgacggcg accgccctcg gctgggacta tggtacgggc 240
gcgtggctgc gcaggcaaac cggcgacaca ccgcagccgc tcttccagtg cccgtccccg 300
gtttgggact cgaagctctt cacatggacc gccaaggcat tctattactc caagtacgtg 360
gagtacctcg acacggcctg gctggtgctc aagggcaaga gggtctcctt tctccaggcc 420
ttccaccact ttggcgcgcc gtgggatgtg tacctcggca ttcggctgca caacgagggc 480
gtatggatct tcatgttttt caactcgttc attcacacca tcatgtacac ctactacggc 540
ctcaccgccg ccgggtataa gttcaaggcc aagccgctca tcaccgcgat gcagatctgc 600
cagttcgtgg gcggcttcct gttggtctgg gactacatca acgtcccctg cttcaactcg 660
gacaaaggga agttgttcag ctgggctttc aactatgcat acgtcggctc ggtcttcttg 720
ctcttctgcc actttttcta ccaggacaac ttggcaacga agaaatcggc caaggcgggc 780
aagcagctct ag 792
&lt;210&gt; 43
&lt;211&gt; 263
&lt;212&gt; PRT
&lt;213&gt; Isochrysis galbana
&lt;400&gt; 43
Met Ala Leu Ala Asn Asp Ala Gly Glu Arg Ile Trp Ala Ala Val Thr
1 5 10 15
Asp Pro Glu Ile Leu Ile Gly Thr Phe Ser Tyr Leu Leu Leu Lys Pro
20 25 30
Leu Leu Arg Asn Ser Gly Leu Val Asp Glu Lys Lys Gly Ala Tyr Arg
35 40 45
Thr Ser Met Ile Trp Tyr Asn Val Leu Leu Ala Leu Phe Ser Ala Leu
50 55 60
Ser Phe Tyr Val Thr Ala Thr Ala Leu Gly Trp Asp Tyr Gly Thr Gly
65 70 75 80
Ala Trp Leu Arg Arg Gln Thr Gly Asp Thr Pro Gln Pro Leu Phe Gln
85 90 95
Cys Pro Ser Pro Val Trp Asp Ser Lys Leu Phe Thr Trp Thr Ala Lys
100 105 110
Ala Phe Tyr Tyr Ser Lys Tyr Val Glu Tyr Leu Asp Thr Ala Trp Leu
115 120 125
Val Leu Lys Gly Lys Arg Val Ser Phe Leu Gln Ala Phe His His Phe
130 135 140
Gly Ala Pro Trp Asp Val Tyr Leu Gly Ile Arg Leu His Asn Glu Gly
145 150 155 160
Val Trp Ile Phe Met Phe Phe Asn Ser Phe Ile His Thr Ile Met Tyr
165 170 175
Thr Tyr Tyr Gly Leu Thr Ala Ala Gly Tyr Lys Phe Lys Ala Lys Pro
180 185 190
Leu Ile Thr Ala Met Gln Ile Cys Gln Phe Val Gly Gly Phe Leu Leu
195 200 205
Val Trp Asp Tyr Ile Asn Val Pro Cys Phe Asn Ser Asp Lys Gly Lys
210 215 220
Leu Phe Ser Trp Ala Phe Asn Tyr Ala Tyr Val Gly Ser Val Phe Leu
225 230 235 240
Leu Phe Cys His Phe Phe Tyr Gln Asp Asn Leu Ala Thr Lys Lys Ser
245 250 255
Ala Lys Ala Gly Lys Gln Leu
260
&lt;210&gt; 44
&lt;211&gt; 801
&lt;212&gt; DNA
&lt;213&gt; Emiliania huxleyi
&lt;400&gt; 44
atgctcgatc gcgcctcgtc cgacgcggcc atctggtctg cggtgtccga tccggaaatc 60
ctgatcggca ctttctccta cctgctgctc aagccgctgc tacgcaactc agggctcgtg 120
gacgagcgga aaggcgccta ccggacctcg atgatctggt acaacgtggt gctcgcgctc 180
ttctccgcga cgagcttcta cgtgactgcg accgcgctcg ggtgggacaa gggcaccggc 240
gagtggctcc gcagtctcac gggcgacagc ccgcagcagc tgtggcaatg cccgtcgagg 300
gtatgggact ccaagctgtt cctgtggacg gccaaggcct tctactactc aaagtacgtg 360
gagtacctcg acacggcgtg gctcgtcctc aaggggaaga aggtctcctt cctgcagggc 420
ttccaccact ttggcgcgcc gtgggacgtg tacctgggca ttcggctgaa gaacgagggc 480
gtgtggatct tcatgttctt caactcgttc atccacacgg tcatgtacac gtactacggc 540
ctcaccgccg cgggctacaa gatccgcggc aagccgatca tcaccgcgat gcaaataagc 600
cagttcgtcg gcggctttgt cctagtgtgg gactacatca acgtgccgtg cttccacgcc 660
gacgccgggc aggtcttcag ctgggtcttt aactatgctt acgtcggctc cgtctttctg 720
ctgttctgcc acttcttcta catggacaac atcgcgaagg ccaaggccaa gaaggccgtc 780
gctacccgca aggcgctgtg a 801
&lt;210&gt; 45
&lt;211&gt; 801
&lt;212&gt; DNA
&lt;213&gt; Artificial Sequence
&lt;220&gt;
&lt;223&gt; Codon-optimized open reading frame for expression of Emiliania
huxleyi 9 elongase in plants
&lt;400&gt; 45
atgcttgata gagcttcatc tgatgctgct atttggagcg ctgtttctga tcctgagatc 60
cttatcggaa ccttctctta ccttttgctt aagcctctcc tcagaaactc tggacttgtg 120
gatgagagaa agggagctta ccgtacttct atgatctggt acaacgttgt tcttgctctt 180
ttctctgcta cctctttcta cgttactgct actgctcttg gatgggataa gggaactggt 240
gagtggctta gatctcttac tggtgattct cctcaacaac tttggcagtg cccttctaga 300
gtttgggaca gcaaactctt cttgtggact gctaaagcct tctactactc caagtacgtt 360
gagtaccttg atactgcttg gcttgttctc aagggaaaga aggtttcatt cctccaggga 420
ttccatcatt tcggtgctcc atgggatgtt taccttggaa tcaggcttaa gaacgaggga 480
gtttggatct tcatgttctt caacagcttc atccacactg ttatgtacac ttactacgga 540
cttactgctg ctggatacaa gatcagagga aagcctatca tcaccgctat gcaaatctct 600
caattcgttg gtggattcgt tcttgtgtgg gactacatca acgttccttg tttccatgct 660
gatgctggac aagttttctc ttgggtgttc aactacgctt atgtgggatc tgttttcctt 720
cttttctgcc acttcttcta catggacaac attgctaagg ctaaggctaa aaaggctgtt 780
gctaccagaa aggctctttg a 801
&lt;210&gt; 46
&lt;211&gt; 266
&lt;212&gt; PRT
&lt;213&gt; Emiliania huxleyi
&lt;400&gt; 46
Met Leu Asp Arg Ala Ser Ser Asp Ala Ala Ile Trp Ser Ala Val Ser
1 5 10 15
Asp Pro Glu Ile Leu Ile Gly Thr Phe Ser Tyr Leu Leu Leu Lys Pro
20 25 30
Leu Leu Arg Asn Ser Gly Leu Val Asp Glu Arg Lys Gly Ala Tyr Arg
35 40 45
Thr Ser Met Ile Trp Tyr Asn Val Val Leu Ala Leu Phe Ser Ala Thr
50 55 60
Ser Phe Tyr Val Thr Ala Thr Ala Leu Gly Trp Asp Lys Gly Thr Gly
65 70 75 80
Glu Trp Leu Arg Ser Leu Thr Gly Asp Ser Pro Gln Gln Leu Trp Gln
85 90 95
Cys Pro Ser Arg Val Trp Asp Ser Lys Leu Phe Leu Trp Thr Ala Lys
100 105 110
Ala Phe Tyr Tyr Ser Lys Tyr Val Glu Tyr Leu Asp Thr Ala Trp Leu
115 120 125
Val Leu Lys Gly Lys Lys Val Ser Phe Leu Gln Gly Phe His His Phe
130 135 140
Gly Ala Pro Trp Asp Val Tyr Leu Gly Ile Arg Leu Lys Asn Glu Gly
145 150 155 160
Val Trp Ile Phe Met Phe Phe Asn Ser Phe Ile His Thr Val Met Tyr
165 170 175
Thr Tyr Tyr Gly Leu Thr Ala Ala Gly Tyr Lys Ile Arg Gly Lys Pro
180 185 190
Ile Ile Thr Ala Met Gln Ile Ser Gln Phe Val Gly Gly Phe Val Leu
195 200 205
Val Trp Asp Tyr Ile Asn Val Pro Cys Phe His Ala Asp Ala Gly Gln
210 215 220
Val Phe Ser Trp Val Phe Asn Tyr Ala Tyr Val Gly Ser Val Phe Leu
225 230 235 240
Leu Phe Cys His Phe Phe Tyr Met Asp Asn Ile Ala Lys Ala Lys Ala
245 250 255
Lys Lys Ala Val Ala Thr Arg Lys Ala Leu
260 265
&lt;210&gt; 47
&lt;211&gt; 819
&lt;212&gt; DNA
&lt;213&gt; Pavlova pinguis
&lt;400&gt; 47
atggttgcgc cacccatcac gctcgagtgg ctgctttcgc cgaagctcaa ggatgcagtg 60
ttcggtgggg aggtgctcta cttctccatt gcctacctgt ttcttgcgcc cattttgaag 120
cgcaccccgt tggtggacac gcggaagggc gcgtataaga gtggtatgat cgcgtacaac 180
gtgatcatgt gcgtgttctc gctggtgtgc ttcatctgcc agctcgcagc cctgggctat 240
gacatgggct acttgcagtg ggtgcgtgac ctcacagggg acgagattgt ccccctctac 300
caggacgtgt ccccgtcccc cgccttctcc aacaagctct tcaagtattc gtctattgcc 360
ttccactact ccaagtatgt tgagtacatg gacaccgcat ggctggtgat gaagggcaag 420
cccgtgtcct tgctccaggg cttccaccac tttggcgccg cctgggacac ctactttggc 480
atcaccttcc agaacgaggg catctacgtg ttcgtggtgc tcaacgcctt catccacacg 540
atcatgtacg catactacgc ggccactgcg gcgggtctca agttctcact gaagttcgtc 600
atcacgctca tgcagatcac ccaattcaac gtgggcttcg taatggtgta tcactacatc 660
accctggagt acttccgcaa ctcaccggag ctcgtcttct cctacctttt caactatgcg 720
tacgtctgca cggttctcct cctcttcatg cagttcttct acatggacaa ctttggcaag 780
aagaaggccg ctgccgccgc gggcaagaag aagaagtag 819
&lt;210&gt; 48
&lt;211&gt; 272
&lt;212&gt; PRT
&lt;213&gt; Pavlova pinguis
&lt;400&gt; 48
Met Val Ala Pro Pro Ile Thr Leu Glu Trp Leu Leu Ser Pro Lys Leu
1 5 10 15
Lys Asp Ala Val Phe Gly Gly Glu Val Leu Tyr Phe Ser Ile Ala Tyr
20 25 30
Leu Phe Leu Ala Pro Ile Leu Lys Arg Thr Pro Leu Val Asp Thr Arg
35 40 45
Lys Gly Ala Tyr Lys Ser Gly Met Ile Ala Tyr Asn Val Ile Met Cys
50 55 60
Val Phe Ser Leu Val Cys Phe Ile Cys Gln Leu Ala Ala Leu Gly Tyr
65 70 75 80
Asp Met Gly Tyr Leu Gln Trp Val Arg Asp Leu Thr Gly Asp Glu Ile
85 90 95
Val Pro Leu Tyr Gln Asp Val Ser Pro Ser Pro Ala Phe Ser Asn Lys
100 105 110
Leu Phe Lys Tyr Ser Ser Ile Ala Phe His Tyr Ser Lys Tyr Val Glu
115 120 125
Tyr Met Asp Thr Ala Trp Leu Val Met Lys Gly Lys Pro Val Ser Leu
130 135 140
Leu Gln Gly Phe His His Phe Gly Ala Ala Trp Asp Thr Tyr Phe Gly
145 150 155 160
Ile Thr Phe Gln Asn Glu Gly Ile Tyr Val Phe Val Val Leu Asn Ala
165 170 175
Phe Ile His Thr Ile Met Tyr Ala Tyr Tyr Ala Ala Thr Ala Ala Gly
180 185 190
Leu Lys Phe Ser Leu Lys Phe Val Ile Thr Leu Met Gln Ile Thr Gln
195 200 205
Phe Asn Val Gly Phe Val Met Val Tyr His Tyr Ile Thr Leu Glu Tyr
210 215 220
Phe Arg Asn Ser Pro Glu Leu Val Phe Ser Tyr Leu Phe Asn Tyr Ala
225 230 235 240
Tyr Val Cys Thr Val Leu Leu Leu Phe Met Gln Phe Phe Tyr Met Asp
245 250 255
Asn Phe Gly Lys Lys Lys Ala Ala Ala Ala Ala Gly Lys Lys Lys Lys
260 265 270
&lt;210&gt; 49
&lt;211&gt; 840
&lt;212&gt; DNA
&lt;213&gt; Pavlova salina
&lt;400&gt; 49
atggcgactg aagggatgcc ggcgataacg ctggactggc tgctctcgcc cgggctgaag 60
gatgccgtaa ttggcgggga ggtgctctac ttttcgcttg ggtatctgct gctcgagccc 120
atcctcaagc gctcaccgtt tgtggacaag cgcaagggcg cataccgcaa cggcatgatc 180
gcgtacaaca tcctcatgtg cggtttctcg ctggtatgct tcgtgtgcca gatggcggcg 240
ctcggccttg atcgcggcca cctgcagttt gtccgcgacc tcacgggcga cagcgtggtg 300
cagctctacc aggacgtgag cccatcccct gcattcgcga acaagctctt ccggtactca 360
gcggtggcgt tccactactc aaagtacgtg gagtacatgg acacagcgtg gcttgtgctg 420
aagggcaagc ccgtctcgtt cctgcagggc ttccaccact tcggcgccgc gtgggacacc 480
tactttggca tcacgtttca gaacgagggc acctacgtct ttgtgctgct caacgcattc 540
atccacacaa tcatgtacac ctactacggc gcgacggcag cgggcatcaa aatctcgatg 600
aagccgctga tcaccctcat gcagatcacg cagttcctgc tgggcttcgc gctcgtctac 660
ccgtacattg acctcggcta cttccgtgcg tcgcccgagc tcgtgtggag ctacctgttc 720
aactatgcgt acgtactcat ggtgctcttc ctcttcatgc gcttcttcta ccacgacaac 780
tttagcaagc acaagccaat ctcgcgcatc gactccagca accgcatgaa aaccgagtag 840
&lt;210&gt; 50
&lt;211&gt; 279
&lt;212&gt; PRT
&lt;213&gt; Pavlova salina
&lt;400&gt; 50
Met Ala Thr Glu Gly Met Pro Ala Ile Thr Leu Asp Trp Leu Leu Ser
1 5 10 15
Pro Gly Leu Lys Asp Ala Val Ile Gly Gly Glu Val Leu Tyr Phe Ser
20 25 30
Leu Gly Tyr Leu Leu Leu Glu Pro Ile Leu Lys Arg Ser Pro Phe Val
35 40 45
Asp Lys Arg Lys Gly Ala Tyr Arg Asn Gly Met Ile Ala Tyr Asn Ile
50 55 60
Leu Met Cys Gly Phe Ser Leu Val Cys Phe Val Cys Gln Met Ala Ala
65 70 75 80
Leu Gly Leu Asp Arg Gly His Leu Gln Phe Val Arg Asp Leu Thr Gly
85 90 95
Asp Ser Val Val Gln Leu Tyr Gln Asp Val Ser Pro Ser Pro Ala Phe
100 105 110
Ala Asn Lys Leu Phe Arg Tyr Ser Ala Val Ala Phe His Tyr Ser Lys
115 120 125
Tyr Val Glu Tyr Met Asp Thr Ala Trp Leu Val Leu Lys Gly Lys Pro
130 135 140
Val Ser Phe Leu Gln Gly Phe His His Phe Gly Ala Ala Trp Asp Thr
145 150 155 160
Tyr Phe Gly Ile Thr Phe Gln Asn Glu Gly Thr Tyr Val Phe Val Leu
165 170 175
Leu Asn Ala Phe Ile His Thr Ile Met Tyr Thr Tyr Tyr Gly Ala Thr
180 185 190
Ala Ala Gly Ile Lys Ile Ser Met Lys Pro Leu Ile Thr Leu Met Gln
195 200 205
Ile Thr Gln Phe Leu Leu Gly Phe Ala Leu Val Tyr Pro Tyr Ile Asp
210 215 220
Leu Gly Tyr Phe Arg Ala Ser Pro Glu Leu Val Trp Ser Tyr Leu Phe
225 230 235 240
Asn Tyr Ala Tyr Val Leu Met Val Leu Phe Leu Phe Met Arg Phe Phe
245 250 255
Tyr His Asp Asn Phe Ser Lys His Lys Pro Ile Ser Arg Ile Asp Ser
260 265 270
Ser Asn Arg Met Lys Thr Glu
275
&lt;210&gt; 51
&lt;211&gt; 1284
&lt;212&gt; DNA
&lt;213&gt; Pavlova salina
&lt;400&gt; 51
atgggacgcg gcggagacag cagtgggcag gcgcatccgg cggcggagct ggcggtcccg 60
agcgaccgcg cggaggtgag caacgctgac agcaaagcgc tgcacatcgt gctgtatggc 120
aagcgcgtgg atgtgaccaa gttccaacgc acgcacccgg gtggtagcaa ggtcttccgg 180
atcttccagg accgcgatgc gacggagcag ttcgagtcct accactcgaa gcgcgcgatc 240
aagatgatgg agggcatgct caagaagtct gaggatgctc ccgccgacac gcccttgccc 300
tcccagtcac cgatggggaa ggacttcaag gcgatgatcg agcggcacgt tgcagcgggt 360
tactacgatc catgcccgct cgatgagctg ttcaagctca gcctcgtgct cctcccgacc 420
tttgcgggca tgtacatgct caaggcgggc gtcggctccc cgctctgcgg cgccctcatg 480
gtgagctttg gctggtacct cgatggctgg ctcgcgcacg actatctgca ccactccgtc 540
ttcaaggggt ccgtcgcacg caccgtcggg tggaacaacg cggcgggcta cttcctcggc 600
ttcgtgcagg ggtatgcggt cgagtggtgg cgcgcgcggc ataacacgca ccacgtgtgc 660
accaatgagg acggctcgga ccccgacatc aaaacggcgc cgctgctcat atacgtgcgc 720
aacaagccga gcatcgccaa gcgcctgaac gccttccagc gctaccagca gtactactat 780
gtgccggtga tggcaatcct cgacctgtac tggcggctcg agtcgatcgc ctacgtcgcg 840
atgcgcctgc cgaagatgct gccgcaggcc ctcgcactcg tcgcgcacta cgccatcgtc 900
gcgtgggtct ttgcgggcaa ctaccacctg ctcccgctcg tgacggttct gcgcgggttt 960
ggcactggga tcaccgtttt cgcgacgcac tacggtgagg acattctcga cgcggaccag 1020
gtgcgtcaca tgacgctcgt cgagcagacg gcactcacct cgcgcaacat ctcgggcggc 1080
tggctcgtga acgtgctcac cggcttcatc tcactgcaga cggagcacca cctgttcccg 1140
atgatgccaa ccggcaacct catgactatc cagcccgagg tgcgcgcctt cttcaagaag 1200
cacggacttg agtaccgcga gggcaacctc attgagtgcg tgcggcagaa catccgtgcg 1260
cttgcattcg agcacctgct ttga 1284
&lt;210&gt; 52
&lt;211&gt; 427
&lt;212&gt; PRT
&lt;213&gt; Pavlova salina
&lt;400&gt; 52
Met Gly Arg Gly Gly Asp Ser Ser Gly Gln Ala His Pro Ala Ala Glu
1 5 10 15
Leu Ala Val Pro Ser Asp Arg Ala Glu Val Ser Asn Ala Asp Ser Lys
20 25 30
Ala Leu His Ile Val Leu Tyr Gly Lys Arg Val Asp Val Thr Lys Phe
35 40 45
Gln Arg Thr His Pro Gly Gly Ser Lys Val Phe Arg Ile Phe Gln Asp
50 55 60
Arg Asp Ala Thr Glu Gln Phe Glu Ser Tyr His Ser Lys Arg Ala Ile
65 70 75 80
Lys Met Met Glu Gly Met Leu Lys Lys Ser Glu Asp Ala Pro Ala Asp
85 90 95
Thr Pro Leu Pro Ser Gln Ser Pro Met Gly Lys Asp Phe Lys Ala Met
100 105 110
Ile Glu Arg His Val Ala Ala Gly Tyr Tyr Asp Pro Cys Pro Leu Asp
115 120 125
Glu Leu Phe Lys Leu Ser Leu Val Leu Leu Pro Thr Phe Ala Gly Met
130 135 140
Tyr Met Leu Lys Ala Gly Val Gly Ser Pro Leu Cys Gly Ala Leu Met
145 150 155 160
Val Ser Phe Gly Trp Tyr Leu Asp Gly Trp Leu Ala His Asp Tyr Leu
165 170 175
His His Ser Val Phe Lys Gly Ser Val Ala Arg Thr Val Gly Trp Asn
180 185 190
Asn Ala Ala Gly Tyr Phe Leu Gly Phe Val Gln Gly Tyr Ala Val Glu
195 200 205
Trp Trp Arg Ala Arg His Asn Thr His His Val Cys Thr Asn Glu Asp
210 215 220
Gly Ser Asp Pro Asp Ile Lys Thr Ala Pro Leu Leu Ile Tyr Val Arg
225 230 235 240
Asn Lys Pro Ser Ile Ala Lys Arg Leu Asn Ala Phe Gln Arg Tyr Gln
245 250 255
Gln Tyr Tyr Tyr Val Pro Val Met Ala Ile Leu Asp Leu Tyr Trp Arg
260 265 270
Leu Glu Ser Ile Ala Tyr Val Ala Met Arg Leu Pro Lys Met Leu Pro
275 280 285
Gln Ala Leu Ala Leu Val Ala His Tyr Ala Ile Val Ala Trp Val Phe
290 295 300
Ala Gly Asn Tyr His Leu Leu Pro Leu Val Thr Val Leu Arg Gly Phe
305 310 315 320
Gly Thr Gly Ile Thr Val Phe Ala Thr His Tyr Gly Glu Asp Ile Leu
325 330 335
Asp Ala Asp Gln Val Arg His Met Thr Leu Val Glu Gln Thr Ala Leu
340 345 350
Thr Ser Arg Asn Ile Ser Gly Gly Trp Leu Val Asn Val Leu Thr Gly
355 360 365
Phe Ile Ser Leu Gln Thr Glu His His Leu Phe Pro Met Met Pro Thr
370 375 380
Gly Asn Leu Met Thr Ile Gln Pro Glu Val Arg Ala Phe Phe Lys Lys
385 390 395 400
His Gly Leu Glu Tyr Arg Glu Gly Asn Leu Ile Glu Cys Val Arg Gln
405 410 415
Asn Ile Arg Ala Leu Ala Phe Glu His Leu Leu
420 425
&lt;210&gt; 53
&lt;211&gt; 172
&lt;212&gt; PRT
&lt;213&gt; Tomato bushy stunt virus
&lt;400&gt; 53
Met Glu Arg Ala Ile Gln Gly Asn Asp Ala Arg Glu Gln Ala Asn Ser
1 5 10 15
Glu Arg Trp Asp Gly Gly Ser Gly Gly Thr Thr Ser Pro Phe Lys Leu
20 25 30
Pro Asp Glu Ser Pro Ser Trp Thr Glu Trp Arg Leu His Asn Asp Glu
35 40 45
Thr Asn Ser Asn Gln Asp Asn Pro Leu Gly Phe Lys Glu Ser Trp Gly
50 55 60
Phe Gly Lys Val Val Phe Lys Arg Tyr Leu Arg Tyr Asp Arg Thr Glu
65 70 75 80
Ala Ser Leu His Arg Val Leu Gly Ser Trp Thr Gly Asp Ser Val Asn
85 90 95
Tyr Ala Ala Ser Arg Phe Phe Gly Phe Asp Gln Ile Gly Cys Thr Tyr
100 105 110
Ser Ile Arg Phe Arg Gly Val Ser Ile Thr Val Ser Gly Gly Ser Arg
115 120 125
Thr Leu Gln His Leu Cys Glu Met Ala Ile Arg Ser Lys Gln Glu Leu
130 135 140
Leu Gln Leu Ala Pro Ile Glu Val Glu Ser Asn Val Ser Arg Gly Cys
145 150 155 160
Pro Glu Gly Thr Glu Thr Phe Glu Lys Glu Ser Glu
165 170
&lt;210&gt; 54
&lt;211&gt; 116
&lt;212&gt; PRT
&lt;213&gt; Tomato yellow leaf curl virus
&lt;400&gt; 54
Met Trp Asp Pro Leu Leu Asn Glu Phe Pro Glu Ser Val His Gly Phe
1 5 10 15
Arg Cys Met Leu Ala Ile Lys Tyr Leu Gln Ser Val Glu Glu Thr Tyr
20 25 30
Glu Pro Asn Thr Leu Gly His Asp Leu Ile Arg Asp Leu Ile Ser Val
35 40 45
Val Arg Ala Arg Asp Tyr Val Glu Ala Thr Arg Arg Tyr Asn His Phe
50 55 60
His Ala Arg Leu Glu Gly Ser Pro Lys Ala Glu Leu Arg Gln Pro Ile
65 70 75 80
Gln Gln Pro Cys Cys Cys Pro His Cys Pro Arg His Lys Gln Ala Thr
85 90 95
Ile Met Asp Val Gln Ala His Val Pro Glu Ala Gln Asn Ile Gln Asn
100 105 110
Val Ser Lys Pro
115
&lt;210&gt; 55
&lt;211&gt; 351
&lt;212&gt; PRT
&lt;213&gt; Turnip crinkle virus
&lt;400&gt; 55
Met Glu Asn Asp Pro Arg Val Arg Lys Phe Ala Ser Glu Gly Ala Gln
1 5 10 15
Trp Ala Ile Lys Trp Gln Lys Lys Gly Trp Ser Ser Leu Thr Ser Arg
20 25 30
Gln Lys Gln Thr Ala Arg Ala Ala Met Gly Ile Lys Leu Ser Pro Val
35 40 45
Ala Gln Pro Val Gln Lys Val Thr Arg Leu Ser Ala Pro Val Ala Leu
50 55 60
Ala Tyr Arg Glu Val Ser Thr Gln Pro Arg Val Ser Thr Ala Arg Asp
65 70 75 80
Gly Ile Thr Arg Ser Gly Ser Glu Leu Ile Thr Thr Leu Lys Lys Asn
85 90 95
Thr Asp Thr Glu Pro Lys Tyr Thr Thr Ala Val Leu Asn Pro Ser Glu
100 105 110
Pro Gly Thr Phe Asn Gln Leu Ile Lys Glu Ala Ala Gln Tyr Glu Lys
115 120 125
Tyr Arg Phe Thr Ser Leu Arg Phe Arg Tyr Ser Pro Met Ser Pro Ser
130 135 140
Thr Thr Gly Gly Lys Val Ala Leu Ala Phe Asp Arg Asp Ala Ala Lys
145 150 155 160
Pro Pro Pro Asn Asp Leu Ala Ser Leu Tyr Asn Ile Glu Gly Cys Val
165 170 175
Ser Ser Val Pro Trp Thr Gly Phe Ile Leu Thr Val Pro Thr Asp Ser
180 185 190
Thr Asp Arg Phe Val Ala Asp Gly Ile Ser Asp Pro Lys Leu Val Asn
195 200 205
Phe Gly Lys Leu Ile Met Ala Thr Tyr Gly Gln Gly Ala Asn Asp Ala
210 215 220
Ala Gln Leu Gly Glu Val Arg Val Glu Tyr Thr Val Gln Leu Lys Asn
225 230 235 240
Arg Thr Gly Ser Thr Ser Asp Ala Gln Ile Gly Asp Phe Ala Gly Val
245 250 255
Lys Asp Gly Pro Arg Leu Val Ser Trp Ser Lys Thr Lys Gly Thr Ala
260 265 270
Gly Trp Glu His Asp Cys His Phe Leu Gly Thr Gly Asn Phe Ser Leu
275 280 285
Thr Leu Phe Tyr Glu Lys Ala Pro Val Ser Gly Leu Glu Asn Ala Asp
290 295 300
Ala Ser Asp Phe Ser Val Leu Gly Glu Ala Ala Ala Gly Ser Val Gln
305 310 315 320
Trp Ala Gly Val Lys Val Ala Glu Arg Gly Gln Ser Val Lys Met Val
325 330 335
Thr Thr Glu Glu Gln Pro Arg Gly Lys Trp Gln Ala Leu Arg Ile
340 345 350
&lt;210&gt; 56
&lt;211&gt; 303
&lt;212&gt; PRT
&lt;213&gt; Pea mosaic virus
&lt;400&gt; 56
Met His Gly Ile Glu Gln Pro Gln Leu Pro Leu Asp Tyr Val His Arg
1 5 10 15
Cys Ala Ser Thr Ser Phe Leu Leu Ala Ser Leu Asp Gly Leu Leu Ser
20 25 30
Glu Ala Arg Glu Leu Ser Gly Pro Leu Ala Leu Ile Thr Ser Ser Tyr
35 40 45
Tyr Leu Leu Val Ser Ile Ala Leu Cys Trp Ala Ile Pro Gly Ser Phe
50 55 60
Trp Tyr Arg Pro Gly Cys Trp Leu Gln Pro Val Ser Gly Arg Asn Leu
65 70 75 80
Ile Phe Cys Gly Pro Thr Glu Ala Leu Gln Arg Phe Arg Leu Tyr Ala
85 90 95
Ala Arg Leu Gly Leu Val Leu Ser Glu Asn Cys Pro Arg His Gly Gln
100 105 110
Ser Ala Ala Ile Thr Leu Gln Ser Tyr Trp Ala Leu Pro Asn Asn Ile
115 120 125
Trp Met Asp Met Ala Gln Leu Asp Leu Leu Thr Phe Ser Met Pro Ile
130 135 140
Ala Asn Thr Phe Ala Tyr Leu Ala Asp Cys Glu Ala Arg Phe Pro Pro
145 150 155 160
Ile Val Glu Gly Val Gly Ser Ala Tyr Tyr Val Pro Thr Leu Leu Gly
165 170 175
Leu Thr His Gln Asp Pro Arg Leu Tyr Leu Ala Leu Arg Arg Arg Asn
180 185 190
Leu Asp Leu Ser Gly Glu Pro His Arg Val Arg Pro Gly Val Leu Glu
195 200 205
Ser Met Ala Leu Leu Cys Ser Ser Val Arg Ser Thr Ser Arg Ser Arg
210 215 220
Gln Ile Pro Pro Leu Tyr Gly Ser Val Leu His His Val Leu Gly Leu
225 230 235 240
Ala Glu Arg Asp Cys Ile Leu Phe Asp Thr Asp Ser Asn Tyr Ser Ser
245 250 255
Tyr Thr His Arg Val Leu Glu Gln Asp Arg Asn Arg Ala Asp Gln Ser
260 265 270
Leu Phe Ser Ile Asp Leu Glu Tyr Val His Asp Leu Glu Leu Ile Ala
275 280 285
Leu Gly Tyr Ser Asp Glu Asp Asp Glu Asp Leu Asp Asn Phe Phe
290 295 300
&lt;210&gt; 57
&lt;211&gt; 256
&lt;212&gt; PRT
&lt;213&gt; Cereal yellow dwarf virus
&lt;400&gt; 57
Met Phe Ile Ala Gln Pro Cys Gly Arg Val Leu Val Phe Asp Val Ala
1 5 10 15
Ser Arg Thr Pro Ser Phe Phe Thr Arg Tyr Ser Val Glu Leu Ser Leu
20 25 30
Arg Val Leu Asp Pro Phe Phe Thr Arg Ala Val Thr Asp Phe Arg Tyr
35 40 45
Thr Gln Asn Glu Ile Asp Leu Phe Cys Val Ser Leu Gly Phe Leu Leu
50 55 60
Pro Ile Leu Leu Thr Gly Glu Ser Tyr Ser Trp Arg Gly His Leu Asn
65 70 75 80
Leu Pro Leu Ser Tyr Thr Glu Leu Leu Val Arg Trp Gly Leu Ala Val
85 90 95
Gly Tyr Phe Pro Thr Phe Ser Thr Asp Gly Asp Ile Arg Gln Asn Pro
100 105 110
Glu Leu Arg Ile Asp Leu Ser Thr Met Ser Thr Arg Ser Phe Tyr Glu
115 120 125
Gln Phe Leu Leu Arg Tyr Asn Thr Ser Gly Leu Ala Lys Ala Ile Val
130 135 140
Gly Gln Gln Glu Cys Phe Gln Ser Gly Met Glu Ser Phe Lys Arg Phe
145 150 155 160
Leu His Tyr Arg Leu Thr Cys Phe Glu Ser Cys Leu Pro Arg Pro Arg
165 170 175
Trp Glu Ser Pro Leu Ala Pro Gly Pro Tyr Leu Asp Arg Ala Phe Glu
180 185 190
Ala Thr Leu Leu Gly Arg Met Val Gly His Asn Gln Leu Leu Phe Thr
195 200 205
Gly Leu Ser Ser Asp Ile Thr Arg Tyr Tyr Asn Glu Leu Val Val Glu
210 215 220
Gly Val Pro Val Ala Phe Trp Asp Ala Ala Gly Ile Thr Leu His His
225 230 235 240
Ala Gly Glu Glu Tyr Phe Ser Asn Ser Tyr Ile Gln Lys Ile Leu Gln
245 250 255
&lt;210&gt; 58
&lt;211&gt; 519
&lt;212&gt; DNA
&lt;213&gt; Tomato bushy stunt virus
&lt;400&gt; 58
atggaacgag ctatacaagg aaacgacgct agggaacaag ctaacagtga acgttgggat 60
ggaggatcag gaggtaccac ttctcccttc aaacttcctg acgaaagtcc gagttggact 120
gagtggcggc tacataacga tgagacgaat tcgaatcaag ataatcccct tggtttcaag 180
gaaagctggg gtttcgggaa agttgtattt aagagatatc tcagatacga caggacggaa 240
gcttcactgc acagagtcct tggatcttgg acgggagatt cggttaacta tgcagcatct 300
cgatttttcg gtttcgacca gatcggatgt acctatagta ttcggtttcg aggagttagt 360
atcaccgttt ctggagggtc gcgaactctt cagcatctct gtgagatggc aattcggtct 420
aagcaagaac tgctacagct tgccccaatc gaagtggaaa gtaatgtatc aagaggatgc 480
cctgaaggta ctgagacctt cgaaaaagaa agcgagtaa 519
&lt;210&gt; 59
&lt;211&gt; 351
&lt;212&gt; DNA
&lt;213&gt; Tomato yellow leaf curl virus
&lt;400&gt; 59
atgtgggatc cacttctaaa tgaatttcct gaatctgttc acggatttcg ttgtatgtta 60
gctattaaat atttgcagtc cgttgaggaa acttacgagc ccaatacatt gggccacgat 120
ttaattaggg atcttatatc tgttgtaagg gcccgtgact atgtcgaagc gaccaggcga 180
tataatcatt tccacgcccg cctcgaaggt tcgccgaagg ctgaacttcg acagcccata 240
cagcagccgt gctgctgtcc ccattgtcca aggcacaaac aagcgacgat catggacgta 300
caggcccatg taccggaagc ccagaatata cagaatgtat cgaagccctg a 351
&lt;210&gt; 60
&lt;211&gt; 1056
&lt;212&gt; DNA
&lt;213&gt; Turnip crinkle virus
&lt;400&gt; 60
atggaaaatg atcctagagt ccgaaagttc gcatccgagg gcgcccaatg ggcgataaag 60
tggcagaaga agggctggtc atccctaacc agcagacaga aacagaccgc ccgcgcagcg 120
atggggatca agctctcccc tgtggcgcaa cctgtgcaga aagtgactcg actgagtgct 180
ccggtggctc tcgcctaccg cgaggtttcc acccagcctc gggtttctac tgccagggac 240
ggcataacca gaagcggttc tgaactgatc acaaccctga agaagaacac tgacactgaa 300
cctaagtaca ccacagctgt gcttaaccca agcgaacccg gaacattcaa ccaactcatc 360
aaggaggcgg cccagtatga aaaataccga ttcacgtcac tcagatttag gtactctccc 420
atgagccctt caaccaccgg gggcaaggtg gctctggcat tcgaccgaga cgctgccaaa 480
cctccgccca acgacctcgc ttccctctac aacatagagg gttgtgtatc tagcgtgccc 540
tggacagggt ttattttgac cgtcccaaca gattctactg accgctttgt ggcggatggt 600
atcagcgatc caaagcttgt caatttcggc aagctcatca tggccaccta tggccaagga 660
gccaatgatg ccgcccaact cggtgaagtg cgagtcgagt acaccgtgca gctcaagaac 720
agaactggct caaccagcga cgcccagatt ggggacttcg cgggtgttaa ggacggaccc 780
aggttggtct cgtggtccaa gaccaaggga acagctgggt gggagcacga ttgtcatttt 840
ctcggaaccg gaaacttctc gttgacactg ttctacgaga aggcgcccgt ttcggggcta 900
gaaaacgcag acgcctctga cttctcggtc ctgggagaag ccgcagcagg tagtgtccaa 960
tgggctggag tgaaggtagc agaaagggga caaagcgtga aaatggtcac aactgaggag 1020
cagccaaggg gaaaatggca agcactcagg atttag 1056
&lt;210&gt; 61
&lt;211&gt; 912
&lt;212&gt; DNA
&lt;213&gt; Pea mosaic virus
&lt;400&gt; 61
atgcacggaa ttgagcagcc tcaactaccg ctagattacg ttcaccgttg cgcatcaacc 60
tccttcttgc tcgcatcact agatggcctc ctttctgaag cccgtgaact ctcagggcct 120
ctggctctca ttacttctag ctattactta cttgtttcta ttgccctctg ctgggcaatc 180
cctggatcct tctggtatag gcctggctgc tggttgcagc cagtctcagg gcggaatctc 240
atcttttgcg gccctaccga ggccttgcaa cgattccgtc tgtacgctgc cagacttggg 300
ttggtcctgt cagagaactg cccaagacac ggccaatcag cagcaatcac ccttcaatca 360
tactgggcac ttcctaacaa catctggatg gacatggccc aattggactt gctcaccttc 420
tcaatgccaa ttgctaatac atttgcctac ttggcagatt gtgaagcaag atttcctcct 480
attgttgaag gagtgggatc tgcttactat gtgccaacgc tgctcggact tactcaccaa 540
gaccccaggc tttatcttgc gcttcgcagg agaaaccttg atcttagtgg cgaacctcat 600
agagttcgtc ctggtgtcct ggagtctatg gctttgctct gttctagtgt acgtagcaca 660
agccgttcca ggcaaattcc tcctttatat ggcagcgttt tgcaccacgt tttgggcctg 720
gccgagagag actgcatcct ctttgatacg gatagtaact actcctctta cactcatcgg 780
gttcttgaac aagaccggaa tcgggctgat cagtcattgt ttagcattga cttggaatat 840
gttcatgacc tggagcttat tgccctgggt tactctgatg aagatgatga agatcttgat 900
aacttcttct ag 912
&lt;210&gt; 62
&lt;211&gt; 771
&lt;212&gt; DNA
&lt;213&gt; Cereal yellow dwarf virus
&lt;400&gt; 62
atgttcatcg cccaaccttg cgggcgagtt cttgtgttcg acgtcgcctc ccgcacgcca 60
tcgttcttca ctcgttatag tgttgaactc tcgctccgtg ttctagaccc attcttcacg 120
cgagcagtaa cagatttccg atacacccaa aatgaaatcg atttattttg tgtgtctctt 180
ggctttctgt tgccaattct cctcacagga gaatcttact cttggcgcgg tcacctcaac 240
ctcccccttt cttacaccga attacttgtt cgatgggggc tcgcagtggg gtacttccct 300
accttctcca ctgatggtga cattcgacag aacccagaac tccgcatcga cctgtccacc 360
atgtcaaccc gctctttcta cgagcagttc ctactcagat ataacacgag tgggttggca 420
aaagctatcg tcggacagca agagtgcttt caaagcggca tggagtcttt taaaagattc 480
ctacactacc gcctcacgtg ctttgaaagc tgccttccac gacctcgttg ggaaagtcct 540
ttggctcctg gtccttatct ggacagggct tttgaggcaa ctcttctcgg ccgtatggtc 600
ggtcataacc aactactctt taccggtttg tcttctgata tcactaggta ttataacgag 660
ttggttgtgg aaggcgtgcc ggtggctttt tgggacgctg ccggcattac tttgcatcac 720
gctggtgaag aatatttttc gaattcttac attcaaaaga ttcttcaatg a 771
&lt;210&gt; 63
&lt;211&gt; 389
&lt;212&gt; PRT
&lt;213&gt; Arabidopsis thaliana
&lt;400&gt; 63
Met Val Ile Ala Ala Ala Val Ile Val Pro Leu Gly Leu Leu Phe Phe
1 5 10 15
Ile Ser Gly Leu Ala Val Asn Leu Phe Gln Ala Val Cys Tyr Val Leu
20 25 30
Ile Arg Pro Leu Ser Lys Asn Thr Tyr Arg Lys Ile Asn Arg Val Val
35 40 45
Ala Glu Thr Leu Trp Leu Glu Leu Val Trp Ile Val Asp Trp Trp Ala
50 55 60
Gly Val Lys Ile Gln Val Phe Ala Asp Asn Glu Thr Phe Asn Arg Met
65 70 75 80
Gly Lys Glu His Ala Leu Val Val Cys Asn His Arg Ser Asp Ile Asp
85 90 95
Trp Leu Val Gly Trp Ile Leu Ala Gln Arg Ser Gly Cys Leu Gly Ser
100 105 110
Ala Leu Ala Val Met Lys Lys Ser Ser Lys Phe Leu Pro Val Ile Gly
115 120 125
Trp Ser Met Trp Phe Ser Glu Tyr Leu Phe Leu Glu Arg Asn Trp Ala
130 135 140
Lys Asp Glu Ser Thr Leu Lys Ser Gly Leu Gln Arg Leu Ser Asp Phe
145 150 155 160
Pro Arg Pro Phe Trp Leu Ala Leu Phe Val Glu Gly Thr Arg Phe Thr
165 170 175
Glu Ala Lys Leu Lys Ala Ala Gln Glu Tyr Ala Ala Ser Ser Glu Leu
180 185 190
Pro Ile Pro Arg Asn Val Leu Ile Pro Arg Thr Lys Gly Phe Val Ser
195 200 205
Ala Val Ser Asn Met Arg Ser Phe Val Pro Ala Ile Tyr Asp Met Thr
210 215 220
Val Thr Ile Pro Lys Thr Ser Pro Pro Pro Thr Met Leu Arg Leu Phe
225 230 235 240
Lys Gly Gln Pro Ser Val Val His Val His Ile Lys Cys His Ser Met
245 250 255
Lys Asp Leu Pro Glu Ser Asp Asp Ala Ile Ala Gln Trp Cys Arg Asp
260 265 270
Gln Phe Val Ala Lys Asp Ala Leu Leu Asp Lys His Ile Ala Ala Asp
275 280 285
Thr Phe Pro Gly Gln Gln Glu Gln Asn Ile Gly Arg Pro Ile Lys Ser
290 295 300
Leu Ala Val Val Leu Ser Trp Ala Cys Val Leu Thr Leu Gly Ala Ile
305 310 315 320
Lys Phe Leu His Trp Ala Gln Leu Phe Ser Ser Trp Lys Gly Ile Thr
325 330 335
Ile Ser Ala Leu Gly Leu Gly Ile Ile Thr Leu Cys Met Gln Ile Leu
340 345 350
Ile Arg Ser Ser Gln Ser Glu Arg Ser Thr Pro Ala Lys Val Val Pro
355 360 365
Ala Lys Pro Lys Asp Asn His His Pro Glu Ser Ser Ser Gln Thr Glu
370 375 380
Thr Glu Lys Glu Lys
385
&lt;210&gt; 64
&lt;211&gt; 281
&lt;212&gt; PRT
&lt;213&gt; Limnanthes alba
&lt;400&gt; 64
Met Ala Lys Thr Arg Thr Ser Ser Leu Arg Asn Arg Arg Gln Leu Lys
1 5 10 15
Thr Ala Val Ala Ala Thr Ala Asp Asp Asp Lys Asp Gly Ile Phe Met
20 25 30
Val Leu Leu Ser Cys Phe Lys Ile Phe Val Cys Phe Ala Ile Val Leu
35 40 45
Ile Thr Ala Val Ala Trp Gly Leu Ile Met Val Leu Leu Leu Pro Trp
50 55 60
Pro Tyr Met Arg Ile Arg Leu Gly Asn Leu Tyr Gly His Ile Ile Gly
65 70 75 80
Gly Leu Val Ile Trp Leu Tyr Gly Ile Pro Ile Glu Ile Gln Gly Ser
85 90 95
Glu His Thr Lys Lys Arg Ala Ile Tyr Ile Ser Asn His Ala Ser Pro
100 105 110
Ile Asp Ala Phe Phe Val Met Trp Leu Ala Pro Ile Gly Thr Val Gly
115 120 125
Val Ala Lys Lys Glu Val Ile Trp Tyr Pro Leu Leu Gly Gln Leu Tyr
130 135 140
Thr Leu Ala His His Ile Arg Ile Asp Arg Ser Asn Pro Ala Ala Ala
145 150 155 160
Ile Gln Ser Met Lys Glu Ala Val Arg Val Ile Thr Glu Lys Asn Leu
165 170 175
Ser Leu Ile Met Phe Pro Glu Gly Thr Arg Ser Gly Asp Gly Arg Leu
180 185 190
Leu Pro Phe Lys Lys Gly Phe Val His Leu Ala Leu Gln Ser His Leu
195 200 205
Pro Ile Val Pro Met Ile Leu Thr Gly Thr His Leu Ala Trp Arg Lys
210 215 220
Gly Thr Phe Arg Val Arg Pro Val Pro Ile Thr Val Lys Tyr Leu Pro
225 230 235 240
Pro Ile Asn Thr Asp Asp Trp Thr Val Asp Lys Ile Asp Asp Tyr Val
245 250 255
Lys Met Ile His Asp Ile Tyr Val Arg Asn Leu Pro Ala Ser Gln Lys
260 265 270
Pro Leu Gly Ser Thr Asn Arg Ser Lys
275 280
&lt;210&gt; 65
&lt;211&gt; 303
&lt;212&gt; PRT
&lt;213&gt; Saccharomyces cerevisiae
&lt;400&gt; 65
Met Ser Val Ile Gly Arg Phe Leu Tyr Tyr Leu Arg Ser Val Leu Val
1 5 10 15
Val Leu Ala Leu Ala Gly Cys Gly Phe Tyr Gly Val Ile Ala Ser Ile
20 25 30
Leu Cys Thr Leu Ile Gly Lys Gln His Leu Ala Gln Trp Ile Thr Ala
35 40 45
Arg Cys Phe Tyr His Val Met Lys Leu Met Leu Gly Leu Asp Val Lys
50 55 60
Val Val Gly Glu Glu Asn Leu Ala Lys Lys Pro Tyr Ile Met Ile Ala
65 70 75 80
Asn His Gln Ser Thr Leu Asp Ile Phe Met Leu Gly Arg Ile Phe Pro
85 90 95
Pro Gly Cys Thr Val Thr Ala Lys Lys Ser Leu Lys Tyr Val Pro Phe
100 105 110
Leu Gly Trp Phe Met Ala Leu Ser Gly Thr Tyr Phe Leu Asp Arg Ser
115 120 125
Lys Arg Gln Glu Ala Ile Asp Thr Leu Asn Lys Gly Leu Glu Asn Val
130 135 140
Lys Lys Asn Lys Arg Ala Leu Trp Val Phe Pro Glu Gly Thr Arg Ser
145 150 155 160
Tyr Thr Ser Glu Leu Thr Met Leu Pro Phe Lys Lys Gly Ala Phe His
165 170 175
Leu Ala Gln Gln Gly Lys Ile Pro Ile Val Pro Val Val Val Ser Asn
180 185 190
Thr Ser Thr Leu Val Ser Pro Lys Tyr Gly Val Phe Asn Arg Gly Cys
195 200 205
Met Ile Val Arg Ile Leu Lys Pro Ile Ser Thr Glu Asn Leu Thr Lys
210 215 220
Asp Lys Ile Gly Glu Phe Ala Glu Lys Val Arg Asp Gln Met Val Asp
225 230 235 240
Thr Leu Lys Glu Ile Gly Tyr Ser Pro Ala Ile Asn Asp Thr Thr Leu
245 250 255
Pro Pro Gln Ala Ile Glu Tyr Ala Ala Leu Gln His Asp Lys Lys Val
260 265 270
Asn Lys Lys Ile Lys Asn Glu Pro Val Pro Ser Val Ser Ile Ser Asn
275 280 285
Asp Val Asn Thr His Asn Glu Gly Ser Ser Val Lys Lys Met His
290 295 300
&lt;210&gt; 66
&lt;211&gt; 373
&lt;212&gt; PRT
&lt;213&gt; Micromonas pusilla
&lt;400&gt; 66
Met Thr Pro Tyr Gln Trp Phe Asn Val Val Ser Ser Leu Gly Tyr Val
1 5 10 15
Leu Phe Thr Ala Thr Thr Ser Thr Val Thr Met Leu Val Pro Ala Ile
20 25 30
Ile Leu Leu Arg Pro Val Ser Ala Asn Leu Tyr Ala Arg Cys Thr Ser
35 40 45
Trp Ile Phe Ala Cys Trp Trp Thr Ser Cys Leu Phe Ile Thr Glu Arg
50 55 60
Leu Asn Gly Val Lys Val Arg Val Thr Gly Asp Ala Leu Pro Leu Asn
65 70 75 80
Ala Pro Leu Leu Ile Met Ser Asn His Lys Cys Asn Leu Asp Trp Met
85 90 95
Phe Leu Trp Ser Ser Ala Ile Arg Thr Gly Ser Met Phe His Val Gly
100 105 110
Val Phe Lys Ala Val Ala Lys Ser Glu Ile Arg Val Ile Pro Ile Phe
115 120 125
Gly Trp Gly Cys Lys Leu Asn Gly Phe Ala Tyr Val Arg Arg Arg Trp
130 135 140
Ser Ser Asp Ala Ser His Leu Thr Ser Trp Ile Gln Ser Gln Ile Arg
145 150 155 160
Arg Arg Leu Asn Ala Asn Trp Thr Leu Ile Phe Pro Glu Gly Thr Arg
165 170 175
Tyr Thr Asp Arg Asn Lys Glu Arg Ser Asp Leu Ser Cys Ala Lys Asp
180 185 190
Gly Leu Glu Pro Met Ala Gly Glu Ile Leu Arg Pro Arg Thr Lys Gly
195 200 205
Leu Ala Leu Leu Leu Arg Glu Ser Ala Lys Gly Gly Gly Tyr Tyr Arg
210 215 220
Lys Ile Val Asp Met Thr Ile Gln Tyr Thr Asp Ala Asp Gly Lys Pro
225 230 235 240
Leu Lys Gly Ala Ala Leu Gly Thr Arg Cys Phe Gly Gln Leu Ala Lys
245 250 255
Gly Gln Leu Pro Val Ala Thr Cys His Val His Phe Asp Val Phe Ser
260 265 270
His Lys Asp Val Pro Ala Gly Glu Asp Glu Asp Glu Val Glu Ala Trp
275 280 285
Val Trp Lys Arg Trp Arg Lys Lys Ala Asn Met Leu Glu Ala Cys Ala
290 295 300
Ser Ala Gly Gln Phe Glu Gly Val Arg Glu Trp Ser Thr Ser Gly Thr
305 310 315 320
Ala Val Pro Leu Lys Thr Gln Thr Ala Leu Arg Cys Phe Phe Val Leu
325 330 335
Gln Gly Leu Val Cys Val Gly Val Ala Cys Ser Ser Thr Ala Phe Leu
340 345 350
Ala Tyr Val Ala Cys Ala Ala Val Gly Ala Ala Val Ile Ala Gln Thr
355 360 365
Asp Pro Ala Trp Trp
370
&lt;210&gt; 67
&lt;211&gt; 314
&lt;212&gt; PRT
&lt;213&gt; Mortierella alpina
&lt;400&gt; 67
Met Ser Ile Gly Ser Ser Asn Pro Val Leu Leu Ala Ala Ile Pro Phe
1 5 10 15
Val Tyr Leu Phe Val Leu Pro Arg Val Leu Ala Phe Leu Pro Gln Lys
20 25 30
Ala Gln Phe Leu Ala Lys Cys Ile Val Val Leu Ile Ala Thr Leu Ile
35 40 45
Met Ser Val Ala Gly Cys Phe Ile Ser Ile Val Cys Ala Leu Leu Asp
50 55 60
Lys Arg Tyr Val Ile Asn Tyr Val Val Ser Arg Leu Phe Ser Phe Leu
65 70 75 80
Ala Ala Arg Pro Cys Gly Val Thr Tyr Lys Ile Val Gly Glu Glu His
85 90 95
Leu Asp Lys Tyr Pro Ala Ile Val Val Cys Asn His Gln Ser Ser Met
100 105 110
Asp Met Met Val Leu Gly Arg Val Phe Pro Lys His Cys Val Val Met
115 120 125
Ala Lys Lys Glu Leu Leu Tyr Phe Pro Phe Leu Gly Met Phe Met Lys
130 135 140
Leu Ser Asn Ala Ile Phe Ile Asp Arg Lys Asn His Lys Lys Ala Ile
145 150 155 160
Glu Ser Thr Thr Gln Ala Val Ala Asp Met Lys Lys His Asn Ser Gly
165 170 175
Ile Trp Ile Phe Pro Glu Gly Thr Arg Ser Arg Leu Asp Lys Ala Asp
180 185 190
Leu Leu Pro Phe Lys Lys Gly Ala Phe His Leu Ala Ile Gln Ala Gln
195 200 205
Leu Pro Ile Leu Pro Ile Ile Ser Gln Gly Tyr Ser His Ile Tyr Asp
210 215 220
Ser Ser Lys Arg Tyr Phe Pro Gly Gly Glu Leu Glu Ile Arg Val Leu
225 230 235 240
Glu Pro Ile Pro Thr Thr Gly Leu Thr Thr Asp Asp Val Asn Asp Leu
245 250 255
Met Asp Lys Thr Arg Asn Leu Met Leu Lys His Leu Lys Glu Met Asp
260 265 270
Ser Gln Tyr Ser Ser Ser Thr Ala Glu Asn Gly Ser Thr His Ile Asp
275 280 285
Ala Asp Ile Ala Lys Ser Thr Ala Thr Ser Ile Gly Asn Thr Asp Asp
290 295 300
Ala Ile Thr Lys Arg Arg Thr Pro Lys Glu
305 310
&lt;210&gt; 68
&lt;211&gt; 391
&lt;212&gt; PRT
&lt;213&gt; Braccisa napus
&lt;400&gt; 68
Met Ala Met Ala Ala Ala Ala Val Ile Val Pro Leu Gly Ile Leu Phe
1 5 10 15
Phe Ile Ser Gly Leu Val Val Asn Leu Leu Gln Ala Val Cys Tyr Val
20 25 30
Leu Ile Arg Pro Leu Ser Lys Asn Thr Tyr Arg Lys Ile Asn Arg Val
35 40 45
Val Ala Glu Thr Leu Trp Leu Glu Leu Val Trp Ile Val Asp Trp Trp
50 55 60
Ala Gly Val Lys Ile Gln Val Phe Ala Asp Asp Glu Thr Phe Asn Arg
65 70 75 80
Met Gly Lys Glu His Ala Leu Val Val Cys Asn His Arg Ser Asp Ile
85 90 95
Asp Trp Leu Val Gly Trp Ile Leu Ala Gln Arg Ser Gly Cys Leu Gly
100 105 110
Ser Ala Leu Ala Val Met Lys Lys Ser Ser Lys Phe Leu Pro Val Ile
115 120 125
Gly Trp Ser Met Trp Phe Ser Glu Tyr Leu Phe Leu Glu Arg Asn Trp
130 135 140
Ala Lys Asp Glu Ser Thr Leu Lys Ser Gly Leu Gln Arg Leu Asn Asp
145 150 155 160
Phe Pro Arg Pro Phe Trp Leu Ala Leu Phe Val Glu Gly Thr Arg Phe
165 170 175
Thr Glu Ala Lys Leu Lys Ala Ala Gln Glu Tyr Ala Ala Ser Ser Gln
180 185 190
Leu Pro Val Pro Arg Asn Val Leu Ile Pro Arg Thr Lys Gly Phe Val
195 200 205
Ser Ala Val Ser Asn Met Arg Ser Phe Val Pro Ala Ile Tyr Asp Met
210 215 220
Thr Val Ala Ile Pro Lys Thr Ser Pro Pro Pro Thr Met Leu Arg Leu
225 230 235 240
Phe Lys Gly Gln Pro Ser Val Val His Val His Ile Lys Cys His Ser
245 250 255
Met Lys Asp Leu Pro Glu Ser Asp Asp Ala Ile Ala Gln Trp Cys Arg
260 265 270
Asp Gln Phe Val Ala Lys Asp Ala Leu Leu Asp Lys His Ile Ala Ala
275 280 285
Asp Thr Phe Pro Gly Gln Lys Glu His Asn Ile Gly Arg Pro Ile Lys
290 295 300
Ser Leu Ala Val Val Val Ser Trp Ala Cys Leu Leu Thr Leu Gly Ala
305 310 315 320
Met Lys Phe Leu His Trp Ser Asn Leu Phe Ser Ser Leu Lys Gly Ile
325 330 335
Ala Leu Ser Ala Leu Gly Leu Gly Ile Ile Thr Leu Cys Met Gln Ile
340 345 350
Leu Ile Arg Ser Ser Gln Ser Glu Arg Ser Thr Pro Ala Lys Val Ala
355 360 365
Pro Ala Lys Pro Lys Asp Lys His Gln Ser Gly Ser Ser Ser Gln Thr
370 375 380
Glu Val Glu Glu Lys Gln Lys
385 390
&lt;210&gt; 69
&lt;211&gt; 390
&lt;212&gt; PRT
&lt;213&gt; Braccisa napus
&lt;400&gt; 69
Met Ala Met Ala Ala Ala Val Ile Val Pro Leu Gly Ile Leu Phe Phe
1 5 10 15
Ile Ser Gly Leu Val Val Asn Leu Leu Gln Ala Ile Cys Tyr Val Leu
20 25 30
Ile Arg Pro Leu Ser Lys Asn Thr Tyr Arg Lys Ile Asn Arg Val Val
35 40 45
Ala Glu Thr Leu Trp Leu Glu Leu Val Trp Ile Val Asp Trp Trp Ala
50 55 60
Gly Val Lys Ile Gln Val Phe Ala Asp Asn Glu Thr Phe Asn Arg Met
65 70 75 80
Gly Lys Glu His Ala Leu Val Val Cys Asn His Arg Ser Asp Ile Asp
85 90 95
Trp Leu Val Gly Trp Ile Leu Ala Gln Arg Ser Gly Cys Leu Gly Ser
100 105 110
Ala Leu Ala Val Met Lys Lys Ser Ser Lys Phe Leu Pro Val Ile Gly
115 120 125
Trp Ser Met Trp Phe Ser Glu Tyr Leu Phe Leu Glu Arg Asn Trp Ala
130 135 140
Lys Asp Glu Ser Thr Leu Lys Ser Gly Leu Gln Arg Leu Asn Asp Phe
145 150 155 160
Pro Arg Pro Phe Trp Leu Ala Leu Phe Val Glu Gly Thr Arg Phe Thr
165 170 175
Glu Ala Lys Leu Lys Ala Ala Gln Glu Tyr Ala Ala Ser Ser Glu Leu
180 185 190
Pro Val Pro Arg Asn Val Leu Ile Pro Arg Thr Lys Gly Phe Val Ser
195 200 205
Ala Val Ser Asn Met Arg Ser Phe Val Pro Ala Ile Tyr Asp Met Thr
210 215 220
Val Ala Ile Pro Lys Thr Ser Pro Pro Pro Thr Met Leu Arg Leu Phe
225 230 235 240
Lys Gly Gln Pro Ser Val Val His Val His Ile Lys Cys His Ser Met
245 250 255
Lys Asp Leu Pro Glu Ser Asp Asp Ala Ile Ala Gln Trp Cys Arg Asp
260 265 270
Gln Phe Val Ala Lys Asp Ala Leu Leu Asp Lys His Ile Ala Ala Asp
275 280 285
Thr Phe Pro Gly Gln Gln Glu Gln Asn Ile Gly Arg Pro Ile Lys Ser
290 295 300
Leu Ala Val Val Leu Ser Trp Ser Cys Leu Leu Ile Leu Gly Ala Met
305 310 315 320
Lys Phe Leu His Trp Ser Asn Leu Phe Ser Ser Trp Lys Gly Ile Ala
325 330 335
Phe Ser Ala Leu Gly Leu Gly Ile Ile Thr Leu Cys Met Gln Ile Leu
340 345 350
Ile Arg Ser Ser Gln Ser Glu Arg Ser Thr Pro Ala Lys Val Val Pro
355 360 365
Ala Lys Pro Lys Asp Asn His Asn Asp Ser Gly Ser Ser Ser Gln Thr
370 375 380
Glu Val Glu Lys Gln Lys
385 390
&lt;210&gt; 70
&lt;211&gt; 361
&lt;212&gt; PRT
&lt;213&gt; Phytophthora infestans
&lt;400&gt; 70
Met Ala Thr Lys Glu Ala Tyr Val Phe Pro Thr Leu Thr Glu Ile Lys
1 5 10 15
Arg Ser Leu Pro Lys Asp Cys Phe Glu Ala Ser Val Pro Leu Ser Leu
20 25 30
Tyr Tyr Thr Val Arg Cys Leu Val Ile Ala Val Ala Leu Thr Phe Gly
35 40 45
Leu Asn Tyr Ala Arg Ala Leu Pro Glu Val Glu Ser Phe Trp Ala Leu
50 55 60
Asp Ala Ala Leu Cys Thr Gly Tyr Ile Leu Leu Gln Gly Ile Val Phe
65 70 75 80
Trp Gly Phe Phe Thr Val Gly His Asp Ala Gly His Gly Ala Phe Ser
85 90 95
Arg Tyr His Leu Leu Asn Phe Val Val Gly Thr Phe Met His Ser Leu
100 105 110
Ile Leu Thr Pro Phe Glu Ser Trp Lys Leu Thr His Arg His His His
115 120 125
Lys Asn Thr Gly Asn Ile Asp Arg Asp Glu Val Phe Tyr Pro Gln Arg
130 135 140
Lys Ala Asp Asp His Pro Leu Ser Arg Asn Leu Ile Leu Ala Leu Gly
145 150 155 160
Ala Ala Trp Leu Ala Tyr Leu Val Glu Gly Phe Pro Pro Arg Lys Val
165 170 175
Asn His Phe Asn Pro Phe Glu Pro Leu Phe Val Arg Gln Val Ser Ala
180 185 190
Val Val Ile Ser Leu Leu Ala His Phe Phe Val Ala Gly Leu Ser Ile
195 200 205
Tyr Leu Ser Leu Gln Leu Gly Leu Lys Thr Met Ala Ile Tyr Tyr Tyr
210 215 220
Gly Pro Val Phe Val Phe Gly Ser Met Leu Val Ile Thr Thr Phe Leu
225 230 235 240
His His Asn Asp Glu Glu Thr Pro Trp Tyr Ala Asp Ser Glu Trp Thr
245 250 255
Tyr Val Lys Gly Asn Leu Ser Ser Val Asp Arg Ser Tyr Gly Ala Leu
260 265 270
Ile Asp Asn Leu Ser His Asn Ile Gly Thr His Gln Ile His His Leu
275 280 285
Phe Pro Ile Ile Pro His Tyr Lys Leu Lys Lys Ala Thr Ala Ala Phe
290 295 300
His Gln Ala Phe Pro Glu Leu Val Arg Lys Ser Asp Glu Pro Ile Ile
305 310 315 320
Lys Ala Phe Phe Arg Val Gly Arg Leu Tyr Ala Asn Tyr Gly Val Val
325 330 335
Asp Gln Glu Ala Lys Leu Phe Thr Leu Lys Glu Ala Lys Ala Ala Thr
340 345 350
Glu Ala Ala Ala Lys Thr Lys Ser Thr
355 360
&lt;210&gt; 71
&lt;211&gt; 418
&lt;212&gt; PRT
&lt;213&gt; Thalassiosira pseudonana
&lt;400&gt; 71
Met Tyr Arg Leu Thr Ser Thr Phe Leu Ile Ala Leu Ala Phe Ser Ser
1 5 10 15
Ser Ile Asn Ala Phe Ser Pro Gln Arg Pro Pro Arg Thr Ile Thr Lys
20 25 30
Ser Lys Val Gln Ser Thr Val Leu Pro Ile Pro Thr Lys Asp Asp Leu
35 40 45
Asn Phe Leu Gln Pro Gln Leu Asp Glu Asn Asp Leu Tyr Leu Asp Asp
50 55 60
Val Asn Thr Pro Pro Arg Ala Gly Thr Ile Met Lys Met Leu Pro Lys
65 70 75 80
Glu Thr Phe Asn Ile Asp Thr Ala Thr Ser Leu Gly Tyr Phe Gly Met
85 90 95
Asp Met Ala Ala Val Val Ser Ser Met Thr Leu Leu Asn Ala Ile Val
100 105 110
Thr Ser Asp Gln Tyr His Ala Leu Pro Leu Pro Leu Gln Ala Ala Thr
115 120 125
Val Ile Pro Phe Gln Leu Leu Ala Gly Phe Ala Met Trp Cys Met Trp
130 135 140
Cys Ile Gly His Asp Ala Gly His Ser Thr Val Ser Lys Thr Lys Trp
145 150 155 160
Ile Asn Arg Val Val Gly Glu Val Ala His Ser Val Val Cys Leu Thr
165 170 175
Pro Phe Val Pro Trp Gln Met Ser His Arg Lys His His Leu Asn His
180 185 190
Asn His Ile Glu Lys Asp Tyr Ser His Lys Trp Tyr Ser Arg Asp Glu
195 200 205
Phe Asp Asp Ile Pro Gln Leu Tyr Lys Thr Phe Gly Tyr Asn Pro Arg
210 215 220
Met Met Gln Leu Pro Phe Leu Tyr Phe Met Tyr Leu Ala Leu Gly Ile
225 230 235 240
Pro Asp Gly Gly His Val Val Phe Tyr Gly Arg Met Trp Glu Gly Val
245 250 255
Ser Leu Gln Lys Lys Phe Asp Ala Ala Ile Ser Val Ala Val Ser Cys
260 265 270
Ala Thr Ala Gly Ser Leu Trp Met Asn Met Gly Thr Ala Asp Phe Thr
275 280 285
Val Val Cys Met Val Pro Trp Leu Val Leu Ser Trp Trp Leu Phe Met
290 295 300
Val Thr Tyr Leu Gln His His Ser Glu Asp Gly Lys Leu Tyr Thr Asp
305 310 315 320
Glu Thr Phe Thr Phe Glu Lys Gly Ala Phe Glu Thr Val Asp Arg Ser
325 330 335
Tyr Gly Lys Leu Ile Asn Arg Met Ser His His Met Met Asp Gly His
340 345 350
Val Val His His Leu Phe Phe Glu Arg Val Pro His Tyr Arg Leu Glu
355 360 365
Ala Ala Thr Glu Ala Leu Val Lys Gly Met Asp Glu Thr Gly Gln Lys
370 375 380
His Leu Tyr Lys Tyr Ile Asp Thr Pro Asp Phe Asn Ala Glu Ile Val
385 390 395 400
Asn Gly Phe Arg Asp Asn Trp Phe Leu Val Glu Glu Glu Asn Ile Lys
405 410 415
Arg Glu
&lt;210&gt; 72
&lt;211&gt; 363
&lt;212&gt; PRT
&lt;213&gt; Pythium irregulare
&lt;400&gt; 72
Met Ala Ser Thr Ser Ala Ala Gln Asp Ala Ala Pro Tyr Glu Phe Pro
1 5 10 15
Ser Leu Thr Glu Ile Lys Arg Ala Leu Pro Ser Glu Cys Phe Glu Ala
20 25 30
Ser Val Pro Leu Ser Leu Tyr Tyr Thr Ala Arg Ser Leu Ala Leu Ala
35 40 45
Gly Ser Leu Ala Val Ala Leu Ser Tyr Ala Arg Ala Leu Pro Leu Val
50 55 60
Gln Ala Asn Ala Leu Leu Asp Ala Thr Leu Cys Thr Gly Tyr Val Leu
65 70 75 80
Leu Gln Gly Ile Val Phe Trp Gly Phe Phe Thr Val Gly His Asp Cys
85 90 95
Gly His Gly Ala Phe Ser Arg Ser His Val Leu Asn Phe Ser Val Gly
100 105 110
Thr Leu Met His Ser Ile Ile Leu Thr Pro Phe Glu Ser Trp Lys Leu
115 120 125
Ser His Arg His His His Lys Asn Thr Gly Asn Ile Asp Lys Asp Glu
130 135 140
Ile Phe Tyr Pro Gln Arg Glu Ala Asp Ser His Pro Val Ser Arg His
145 150 155 160
Leu Val Met Ser Leu Gly Ser Ala Trp Phe Ala Tyr Leu Phe Ala Gly
165 170 175
Phe Pro Pro Arg Thr Met Asn His Phe Asn Pro Trp Glu Ala Met Tyr
180 185 190
Val Arg Arg Val Ala Ala Val Ile Ile Ser Leu Gly Val Leu Phe Ala
195 200 205
Phe Ala Gly Leu Tyr Ser Tyr Leu Thr Phe Val Leu Gly Phe Thr Thr
210 215 220
Met Ala Ile Tyr Tyr Phe Gly Pro Leu Phe Ile Phe Ala Thr Met Leu
225 230 235 240
Val Val Thr Thr Phe Leu His His Asn Asp Glu Glu Thr Pro Trp Tyr
245 250 255
Ala Asp Ser Glu Trp Thr Tyr Val Lys Gly Asn Leu Ser Ser Val Asp
260 265 270
Arg Ser Tyr Gly Ala Leu Ile Asp Asn Leu Ser His Asn Ile Gly Thr
275 280 285
His Gln Ile His His Leu Phe Pro Ile Ile Pro His Tyr Lys Leu Asn
290 295 300
Asp Ala Thr Ala Ala Phe Ala Lys Ala Phe Pro Glu Leu Val Arg Lys
305 310 315 320
Asn Ala Ala Pro Ile Ile Pro Thr Phe Phe Arg Met Ala Ala Met Tyr
325 330 335
Ala Lys Tyr Gly Val Val Asp Thr Asp Ala Lys Thr Phe Thr Leu Lys
340 345 350
Glu Ala Lys Ala Ala Ala Lys Thr Lys Ser Ser
355 360

Claims (17)

1.从种子提取的油,所述种子是油菜(Brassica napus)种子、亚麻荠(Camelinasativa)种子或拟南芥(Arabidopsis thaliana)种子,其中所述油的总脂肪酸含量包含:
a)总单不饱和脂肪酸含量,其包含油酸,
b)总饱和脂肪酸含量,其包含棕榈酸或棕榈酸和肉豆蔻酸(C14:0),
c)总ω6脂肪酸含量,其包含亚油酸(LA)和γ-亚麻酸(GLA),以及,如果存在的话,花生四烯酸(ARA),和
d)总ω3脂肪酸含量,其包含α-亚麻酸(ALA)、二十二碳六烯酸(DHA)、十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA),
其中
i)EPA、DPA和DHA,以及任选存在的ARA各自以一定水平存在于所述总脂肪酸含量中,各水平以所述总脂肪酸含量的百分比表示,其中所述提取的油中的ARA、EPA、DPA和DHA的水平的总和在所述总脂肪酸含量的7%至25%之间,
ii)二十碳三烯酸(ETrA)以所述总脂肪酸含量的0.05%至3%之间的水平存在于所述提取的油中,
iii)棕榈酸以所述总脂肪酸含量的2%至16%之间的水平存在于所述提取的油中,
iv)油酸以所述总脂肪酸含量的1%至30%之间的水平存在于所述提取的油中,
v)LA以所述总脂肪酸含量的4%至35%之间的水平存在于所述提取的油中,
vi)GLA以低于所述总脂肪酸含量的4%的水平存在于所述提取的油中,
vii)ALA以所述总脂肪酸含量的4%至40%之间的水平存在于所述提取的油中,
viii)所述提取的油的总饱和脂肪酸含量在总脂肪酸含量的4%至25%之间,
ix)所述提取的油的总ω6脂肪酸含量与总ω3脂肪酸含量的比例在0.1至3之间,和
x)如果存在的话,肉豆蔻酸以低于所述总脂肪酸含量的1%的水平存在。
2.从种子提取的油,所述种子是油菜种子、亚麻荠种子或拟南芥种子,其中所述油的总脂肪酸含量包含:
a)总单不饱和脂肪酸含量,其包含油酸,
b)总饱和脂肪酸含量,其包含棕榈酸或棕榈酸和肉豆蔻酸(C14:0),
c)总ω6脂肪酸含量,其包含亚油酸(LA)和γ-亚麻酸(GLA),以及,如果存在的话,花生四烯酸(ARA),和
d)总ω3脂肪酸含量,其包含α-亚麻酸(ALA)、二十二碳六烯酸(DHA)、十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA),
其中
i)EPA、DPA和DHA,以及任选存在的ARA各自以一定水平存在于所述总脂肪酸含量中,各水平以所述总脂肪酸含量的百分比表示,其中所述提取的油中的ARA、EPA、DPA和DHA的水平的总和在所述总脂肪酸含量的7%至25%之间,
ii)二十碳三烯酸(ETrA)以所述总脂肪酸含量的0.05%至3%之间的水平存在于所述提取的油中,
iii)棕榈酸以所述总脂肪酸含量的2%至16%之间的水平存在于所述提取的油中,
iv)油酸以所述总脂肪酸含量的约30%的水平存在于所述提取的油中,
v)LA以所述总脂肪酸含量的4%至35%之间的水平存在于所述提取的油中,
vi)GLA以低于所述总脂肪酸含量的4%的水平存在于所述提取的油中,
vii)ALA以所述总脂肪酸含量的4%至40%之间的水平存在于所述提取的油中,
viii)所述提取的油的总饱和脂肪酸含量在总脂肪酸含量的4%至25%之间,
ix)所述提取的油的总ω6脂肪酸含量与总ω3脂肪酸含量的比例在0.1至3之间,和
x)如果存在的话,肉豆蔻酸以低于所述总脂肪酸含量的1%的水平存在。
3.从种子提取的油,所述种子是油菜种子、亚麻荠种子或拟南芥种子,其中所述油的总脂肪酸含量包含:
a)总单不饱和脂肪酸含量,其包含油酸,
b)总饱和脂肪酸含量,其包含棕榈酸和,如果存在的话,肉豆蔻酸(C14:0),
c)总ω6脂肪酸含量,其包含亚油酸(LA)和γ-亚麻酸(GLA),或棕榈酸和,花生四烯酸(ARA),和
d)总ω3脂肪酸含量,其包含α-亚麻酸(ALA)、二十二碳六烯酸(DHA)、十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA),
其中
i)EPA、DPA和DHA,以及任选存在的ARA各自以一定水平存在于所述总脂肪酸含量中,各水平以所述总脂肪酸含量的百分比表示,其中所述提取的油中的ARA、EPA、DPA和DHA的水平的总和在所述总脂肪酸含量的7%至25%之间,
ii)DHA以三酰基甘油(TAG)的形式酯化,其中至少70%的以TAG形式酯化的DHA是在TAG的sn-1或sn-3位置上酯化的,
iii)棕榈酸以所述总脂肪酸含量的2%至16%之间的水平存在于所述提取的油中,
iv)油酸以所述总脂肪酸含量的1%至30%之间的水平存在于所述提取的油中,
v)LA以所述总脂肪酸含量的4%至35%之间的水平存在于所述提取的油中,
vi)GLA以低于所述总脂肪酸含量的4%的水平存在于所述提取的油中,
vii)ALA以所述总脂肪酸含量的4%至40%之间的水平存在于所述提取的油中,
viii)所述提取的油的总饱和脂肪酸含量在总脂肪酸含量的4%至25%之间,
ix)所述提取的油的总ω6脂肪酸含量与总ω3脂肪酸含量的比例在0.1至3之间,
x)如果存在的话,肉豆蔻酸以低于所述总脂肪酸含量的1%的水平存在,和
xi)如果存在的话,二十碳三烯酸(ETrA)以低于所述总脂肪酸含量的4%的水平存在。
4.从种子提取的油,所述种子是油菜种子、亚麻荠种子或拟南芥种子,其中所述油的总脂肪酸含量包含:
a)总单不饱和脂肪酸含量,其包含油酸,
b)总饱和脂肪酸含量,其包含棕榈酸和,如果存在的话,肉豆蔻酸(C14:0),
c)总ω6脂肪酸含量,其包含亚油酸(LA)和γ-亚麻酸(GLA),以及,或棕榈酸和,花生四烯酸(ARA),和
d)总ω3脂肪酸含量,其包含α-亚麻酸(ALA)、二十二碳六烯酸(DHA)、十八碳四烯酸(SDA)、二十碳五烯酸(EPA)、二十二碳五烯酸(DPA)和二十碳四烯酸(ETA),
其中
i)EPA、DPA和DHA,以及任选存在的ARA各自以一定水平存在于所述总脂肪酸含量中,各水平以所述总脂肪酸含量的百分比表示,其中所述提取的油中的ARA、EPA、DPA和DHA的水平的总和在所述总脂肪酸含量的7%至25%之间,
ii)DHA以三酰基甘油(TAG)的形式酯化,其中至少70%的以TAG形式酯化的DHA是在TAG的sn-1或sn-3位置上酯化的,
iii)棕榈酸以所述总脂肪酸含量的2%至16%之间的水平存在于所述提取的油中,
iv)油酸以所述总脂肪酸含量的约30%的水平存在于所述提取的油中,
v)LA以所述总脂肪酸含量的4%至35%之间的水平存在于所述提取的油中,
vi)GLA以低于所述总脂肪酸含量的4%的水平存在于所述提取的油中,
vii)ALA以所述总脂肪酸含量的4%至40%之间的水平存在于所述提取的油中,
viii)所述提取的油的总饱和脂肪酸含量在总脂肪酸含量的4%至25%之间,
ix)所述提取的油的总ω6脂肪酸含量与总ω3脂肪酸含量的比例在0.1至3之间,
x)如果存在的话,肉豆蔻酸以低于所述总脂肪酸含量的1%的水平存在,和
xi)如果存在的话,二十碳三烯酸(ETrA)以低于所述总脂肪酸含量的4%的水平存在。
5.权利要求1-4任一项的油,其中γ-亚麻酸(GLA)以低于所述总脂肪酸含量的2%的水平存在于所述提取的油中。
6.权利要求1或3的油,其中油酸以所述总脂肪酸含量的3%到30%之间的水平存在于所述提取的油中。
7.权利要求1-4任一项的油,其中所述提取的油的总饱和脂肪酸含量在总脂肪酸含量的6%至20%之间。
8.权利要求1-4任一项的油,包含总ω3脂肪酸含量中的新ω3脂肪酸和总ω6脂肪酸含量中的新ω6脂肪酸,其中所述提取的油中的新ω6脂肪酸含量与新ω3脂肪酸含量的比例在0.1至1之间。
9.权利要求1-4任一项的油,包含tri-DHA TAG(TAG 66:18)。
10.权利要求1-4任一项的油,其中至少80%的以TAG形式酯化的DHA在TAG的sn-1或sn-3位置上。
11.权利要求1-4任一项的油,其中SDA、ETA、EPA、DPA和DHA各自以一定水平存在于所述总脂肪酸含量中,各水平以所述总脂肪酸含量的百分比表示,其中ETA、EPA、DPA和DHA的百分比总和除以SDA、ETA、EPA、DPA和DHA的百分比总和,以百分比表示,是至少75%。
12.权利要求1-4任一项的油,其中ETA、EPA、DPA和DHA各自以一定水平存在于所述总脂肪酸含量中,各水平以所述总脂肪酸含量的百分比表示,其中EPA、DPA和DHA的百分比总和除以ETA、EPA、DPA和DHA的百分比总和,以百分比表示,在70%至88%之间。
13.权利要求1-4任一项的油,其中DHA以所述总脂肪酸含量的约3%的水平存在。
14.权利要求1-4任一项的油,其中DHA以所述总脂肪酸含量的约4%的水平存在。
15.权利要求1-4任一项的油,其中DHA以所述总脂肪酸含量的约5%的水平存在。
16.权利要求1-4任一项的油,其中DHA以所述总脂肪酸含量的约6%的水平存在。
17.权利要求1-4任一项的油,其中DHA以所述总脂肪酸含量的7%至20%之间的水平存在。
CN201811036429.0A 2012-06-15 2013-06-14 在植物细胞中产生长链多不饱和脂肪酸 Active CN109294730B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201261660392P 2012-06-15 2012-06-15
US61/660,392 2012-06-15
US201261663344P 2012-06-22 2012-06-22
US61/663,344 2012-06-22
US201261697676P 2012-09-06 2012-09-06
US61/697,676 2012-09-06
US201361782680P 2013-03-14 2013-03-14
US61/782,680 2013-03-14
CN201380042832.3A CN104853596B (zh) 2012-06-15 2013-06-14 在植物细胞中产生长链多不饱和脂肪酸

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380042832.3A Division CN104853596B (zh) 2012-06-15 2013-06-14 在植物细胞中产生长链多不饱和脂肪酸

Publications (2)

Publication Number Publication Date
CN109294730A true CN109294730A (zh) 2019-02-01
CN109294730B CN109294730B (zh) 2021-09-21

Family

ID=49756497

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201811036429.0A Active CN109294730B (zh) 2012-06-15 2013-06-14 在植物细胞中产生长链多不饱和脂肪酸
CN201380042832.3A Active CN104853596B (zh) 2012-06-15 2013-06-14 在植物细胞中产生长链多不饱和脂肪酸

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201380042832.3A Active CN104853596B (zh) 2012-06-15 2013-06-14 在植物细胞中产生长链多不饱和脂肪酸

Country Status (26)

Country Link
US (16) US8816111B2 (zh)
EP (2) EP2861059B1 (zh)
JP (3) JP6242882B2 (zh)
KR (2) KR20150037771A (zh)
CN (2) CN109294730B (zh)
AU (4) AU2013273934B2 (zh)
BR (2) BR112014031362A8 (zh)
CA (2) CA2876519C (zh)
CL (2) CL2014003402A1 (zh)
DK (1) DK2861059T3 (zh)
EA (1) EA036786B1 (zh)
ES (1) ES2636487T3 (zh)
HK (2) HK1209581A1 (zh)
HU (1) HUE033766T2 (zh)
IL (1) IL236288A (zh)
MX (1) MX349678B (zh)
MY (1) MY187101A (zh)
NZ (1) NZ631702A (zh)
PE (2) PE20150769A1 (zh)
PH (1) PH12014502795A1 (zh)
PL (1) PL2861059T3 (zh)
PT (1) PT2861059T (zh)
SG (2) SG11201408362SA (zh)
UA (2) UA117223C2 (zh)
WO (1) WO2013185184A2 (zh)
ZA (1) ZA201500015B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109796328A (zh) * 2019-03-14 2019-05-24 浙江工业大学 一种高纯度香榧籽油金松酸的分离方法

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0510132A (pt) 2004-04-22 2007-10-02 Commw Scient Ind Res Org sìntese de ácidos graxos poliinsaturados de cadeia longa por células recombinantes
CN102559364B (zh) 2004-04-22 2016-08-17 联邦科学技术研究组织 用重组细胞合成长链多不饱和脂肪酸
EP2059588A4 (en) 2006-08-29 2010-07-28 Commw Scient Ind Res Org FATTY ACID SYNTHESIS
AU2009240795B2 (en) * 2008-04-25 2014-03-20 Commonwealth Scientific And Industrial Research Organisation Recombinant cells and methods for hydroxylating fatty acids
CN114045301A (zh) 2008-11-18 2022-02-15 联邦科学技术研究组织 产生ω-3脂肪酸的酶和方法
WO2011006948A1 (en) 2009-07-17 2011-01-20 Basf Plant Science Company Gmbh Novel fatty acid desaturases and elongases and uses thereof
US8816111B2 (en) 2012-06-15 2014-08-26 Commonwealth Scientific And Industrial Research Organisation Lipid comprising polyunsaturated fatty acids
EP2935601B1 (en) * 2012-12-21 2018-03-21 E. I. du Pont de Nemours and Company Recombinant microbial cells that produce at least 28% eicosapentaenoic acid as dry cell weight
CN104726473B (zh) * 2013-12-18 2020-02-14 联邦科学技术研究组织 包含二十二碳六烯酸的提取的植物脂质
US11718577B2 (en) 2013-12-18 2023-08-08 Commonwealth Scientific And Industrial Research Organisation Lipid compositions comprising triacylglycerol with long-chain polyunsaturated fatty acids
US9752165B2 (en) * 2014-02-10 2017-09-05 Cellulosic Ethanol Technologies, Llc Processes and systems for recovering oil from fermentation products
EA037184B1 (ru) * 2014-06-27 2021-02-16 Коммонвелт Сайнтифик Энд Индастриэл Рисерч Организэйшн Липид, содержащий докозапентаеновую кислоту
MY188557A (en) * 2014-06-27 2021-12-22 Commw Scient Ind Res Org Lipid comprising docosapentaenoic acid
CN105219789B (zh) * 2014-06-27 2023-04-07 联邦科学技术研究组织 包含二十二碳五烯酸的提取的植物脂质
EP4303288A3 (en) 2014-07-07 2024-03-06 Nuseed Global Innovation Ltd Processes for producing industrial products from plant lipids
CN107429256B (zh) 2014-11-14 2022-03-04 巴斯夫植物科学有限公司 增加种子油中生育酚含量的材料和方法
CN105053569B (zh) * 2015-08-27 2018-12-18 广州市优百特饲料科技有限公司 一种功能性脂肪饲料添加剂及其制备方法
CN105029096B (zh) * 2015-08-27 2018-08-17 广州市优百特饲料科技有限公司 一种幼禽脂肪粉及其制备方法
AR109245A1 (es) * 2016-05-12 2018-11-14 Basf Plant Science Co Gmbh Métodos para optimizar la producción de metabolitos en plantas genéticamente modificadas y para procesar estas plantas
BR112018076314A2 (pt) * 2016-06-16 2019-03-26 Nuseed Pty Ltd. canola de evento elite ns-b50027-4
SG11201811219UA (en) * 2016-06-16 2019-01-30 Nuseed Pty Ltd Inbred transgenic canola line ns-b50027-4 and seeds thereof
CN110462043A (zh) 2016-09-02 2019-11-15 联邦科学技术研究组织 具有修饰的性状的植物
EP3367716B1 (en) 2017-02-22 2021-04-21 CTIA - The Wireless Association Mobile message source authentication
CN107114369B (zh) * 2017-03-24 2020-01-21 浙江大学 植物磺肽素-α在提高植物灰霉病抗性中的应用
KR101976468B1 (ko) * 2017-11-30 2019-05-10 주식회사이맥솔루션 요소수 점적 결정법을 이용한 고산가 유지 폐자원 활용 고순도 불포화 지방산 메틸 에스테르의 제조방법
US11913006B2 (en) 2018-03-16 2024-02-27 Nuseed Global Innovation Ltd. Plants producing modified levels of medium chain fatty acids
CN108315394A (zh) * 2018-04-23 2018-07-24 沈阳师范大学 甜高粱蔗糖合成酶基因的表达检测方法及扩增引物
AU2018420462A1 (en) * 2018-04-25 2020-11-26 Nuseed Nutritional Us Inc. DHA enriched polyunsaturated fatty acid compositions
PL3560342T3 (pl) 2018-04-25 2021-02-22 Nuseed Nutritional Us Inc. Kompozycje wielonienasyconych kwasów tłuszczowych wzbogacone w dha
CN108452156A (zh) * 2018-05-02 2018-08-28 郭书安 一种治疗冠心病的口服液
EP3586640A1 (en) 2018-06-21 2020-01-01 Nuseed Pty Ltd Dha enriched polyunsaturated fatty acid compositions
EP3586643A1 (en) 2018-06-21 2020-01-01 Nuseed Pty Ltd Dha enriched polyunsaturated fatty acid compositions
EP3586641A1 (en) 2018-06-21 2020-01-01 Nuseed Pty Ltd Dha enriched polyunsaturated fatty acid compositions
EP3586642A1 (en) 2018-06-21 2020-01-01 Nuseed Pty Ltd Ala enriched polyunsaturated fatty acid compositions
EP3850106B1 (en) * 2018-09-11 2024-05-29 Nuseed Nutritional Australia Pty Ltd Methods of identifying dha canola ns-b50027-4
KR102216753B1 (ko) * 2018-11-27 2021-02-17 주식회사이맥솔루션 팜유 또는 동물성 폐유지를 이용한 고순도 불포화 지방산 메틸 에스테르 제조방법
CA3152291A1 (en) * 2019-08-26 2021-03-04 Nuseed Nutritional Australia Pty Ltd Brassica juncea line nubj1207
CN110476816B (zh) * 2019-09-29 2022-10-14 西南大学 一种快速获得葡萄桐幼苗的方法
KR20220088902A (ko) 2019-10-25 2022-06-28 누시드 뉴트리셔널 유에스 아이엔씨. 농축 다중불포화 지방산 조성물
CN111235170A (zh) * 2020-01-17 2020-06-05 华中农业大学 qMYR2基因在调节或筛选稻米中油脂组分含量的应用
US20210254092A1 (en) * 2020-02-07 2021-08-19 Board Of Regents Of The University Of Nebraska Methods of Producing Insect Pheromones
US20240100168A1 (en) * 2020-04-17 2024-03-28 Wake Forest University Lipid compositions and methods of preparation thereof
JP7162352B2 (ja) * 2020-05-01 2022-10-28 株式会社東洋発酵 外用組成物
WO2021226242A1 (en) 2020-05-05 2021-11-11 Nuseed Pty Ltd Aquafeed for improved fish health
CA3202599A1 (en) * 2020-12-18 2022-06-23 Johnathan Andrew Napier Increasing the accumulation of epa and dha in recombinant camelina
CN112816635B (zh) * 2020-12-31 2023-08-18 绿城农科检测技术有限公司 一种黑木耳中测定脂肪酸的方法
CN114208843A (zh) * 2021-12-03 2022-03-22 浙江万里学院 一种植物生长调节剂、提高香蕉果实耐冷性的处理方法及验证方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566583B1 (en) * 1997-06-04 2003-05-20 Daniel Facciotti Schizochytrium PKS genes
US20050273885A1 (en) * 2004-04-22 2005-12-08 Singh Surinder P Synthesis of long-chain polyunsaturated fatty acids by recombinant cells
US20060246556A1 (en) * 2002-12-19 2006-11-02 University Of Bristol Novel method for the production of polyunsaturated fatty acids
US20070270600A1 (en) * 2004-01-30 2007-11-22 Bionovate Limited Solvent Extraction of Lipids Such as Essential Fatty Acids
US20110039010A1 (en) * 2008-04-25 2011-02-17 Basf Plant Science Gmbh Plant Seed Oil
US20110201683A1 (en) * 2008-08-11 2011-08-18 Nestec S.A. Oil containing one or more long-chain polyunsaturated fatty acids phospholipids derived from biomass
US20120016144A1 (en) * 2008-11-18 2012-01-19 James Robertson Petrie Enzymes and methods for producing omega-3 fatty acids

Family Cites Families (278)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3484155A (en) 1966-02-07 1969-12-16 Donald L Praeger Head mounted electric squint light
FR1564863A (zh) 1968-03-12 1969-04-25
US4399216A (en) 1980-02-25 1983-08-16 The Trustees Of Columbia University Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
WO1984002913A1 (en) 1983-01-17 1984-08-02 Monsanto Co Chimeric genes suitable for expression in plant cells
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
DE3587718T2 (de) 1984-03-06 1994-08-04 Mgi Pharma Inc Herbizide Resistenz in Pflanzen.
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
ZA871352B (en) 1986-02-27 1987-08-12 The General Hospital Corporation Plant cells resistant to herbicidal glutamine synthetase inhibitors
MA20977A1 (fr) 1986-05-19 1987-12-31 Ciba Geigy Ag Plantes tolerant les herbicides contenant le gene de gluthathione S-Transferase
US5188958A (en) 1986-05-29 1993-02-23 Calgene, Inc. Transformation and foreign gene expression in brassica species
US5177010A (en) 1986-06-30 1993-01-05 University Of Toledo Process for transforming corn and the products thereof
SE455438B (sv) 1986-11-24 1988-07-11 Aga Ab Sett att senka en brennares flamtemperatur samt brennare med munstycken for oxygen resp brensle
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
CN87100603A (zh) 1987-01-21 1988-08-10 昂科公司 抗黑素瘤疫苗
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US5932479A (en) 1988-09-26 1999-08-03 Auburn University Genetic engineering of plant chloroplasts
WO1991002071A2 (en) 1989-08-09 1991-02-21 Dekalb Plant Genetics Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
ATE205530T1 (de) 1990-03-16 2001-09-15 Calgene Llc Neue sequenzen vorzugsweise exprimiert während der frühen keimentwicklung und darauf bezogene methoden
US5877402A (en) 1990-05-01 1999-03-02 Rutgers, The State University Of New Jersey DNA constructs and methods for stably transforming plastids of multicellular plants and expressing recombinant proteins therein
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
US5861187A (en) 1990-08-30 1999-01-19 Cargill, Incorporated Oil from canola seed with altered fatty acid profiles and a method of producing oil
US7135614B1 (en) 1990-08-30 2006-11-14 Cargill, Incorporated Brassica or helianthus plants having mutant delta-12 or delta-15 sequences
US5518908A (en) 1991-09-23 1996-05-21 Monsanto Company Method of controlling insects
US6355861B1 (en) 1991-10-10 2002-03-12 Rhone-Poulenc Agrochimie Production of gamma linolenic acid by a Δ6-desaturase
US5614393A (en) 1991-10-10 1997-03-25 Rhone-Poulenc Agrochimie Production of γ-linolenic acid by a Δ6-desaturase
PH31293A (en) 1991-10-10 1998-07-06 Rhone Poulenc Agrochimie Production of y-linolenic acid by a delta6-desaturage.
US6683232B1 (en) 1991-10-10 2004-01-27 Rhone-Poulenc Agrochimie Production of γ linolenic acid by a Δ6-desaturase
DE69233118T2 (de) 1991-12-04 2004-04-15 E.I. Du Pont De Nemours And Co., Wilmington Fettsäure-desaturase gene aus pflanzen
US5593874A (en) 1992-03-19 1997-01-14 Monsanto Company Enhanced expression in plants
US5683898A (en) 1992-05-15 1997-11-04 Sagami Chemical Research Center Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid
US5798259A (en) 1992-05-15 1998-08-25 Sagami Chemical Research Center Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid
CA2113557A1 (en) 1992-05-15 1993-11-25 Kazunaga Yazawa Gene which codes for eicosapentaenoic acid synthetase group and process for producing eicosapentaenoic acid
US6372965B1 (en) 1992-11-17 2002-04-16 E.I. Du Pont De Nemours And Company Genes for microsomal delta-12 fatty acid desaturases and hydroxylases from plants
US6872872B1 (en) 1992-11-17 2005-03-29 E. I. Du Pont De Nemours And Company Genes for microsomal delta-12 fatty acid desaturases and related enzymes from plants
WO1994019930A1 (en) 1993-03-11 1994-09-15 National Research Council Of Canada Enhanced regeneration system for cereals
CA2092588C (en) 1993-03-26 2008-07-08 Narender S. Nehra Enhanced regeneration system for cereals
US5362865A (en) 1993-09-02 1994-11-08 Monsanto Company Enhanced expression in plants using non-translated leader sequences
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
DE4435392B4 (de) 1994-10-04 2008-02-07 Immuno Ag Verfahren zur Trennung von vWF in hochmolekularen vWF und niedermolekularen vWF
GB9515941D0 (en) 1995-08-03 1995-10-04 Zeneca Ltd DNA constructs
EP0847310A4 (en) 1995-07-28 1998-09-02 POLYESTER OLIGOMER ACRYLATE
US6342658B1 (en) 1995-12-14 2002-01-29 Cargill, Incorporated Fatty acid desaturases and mutant sequences thereof
CA2238964C (en) 1995-12-14 2006-10-10 Cargill, Incorporated Plants having mutant sequences that confer altered fatty acid profiles
US7541519B2 (en) 1995-12-14 2009-06-02 Cargill, Incorporated Fatty acid desaturases and mutant sequences thereof
HUP9902123A3 (en) 1996-06-21 2002-01-28 Monsanto Technology Llc St Louis Methods for the production of stably-transformed, fertile wheat employing agrobacterium-mediated transformation
AU727694B2 (en) 1996-07-10 2000-12-21 Sagami Chemical Research Center Process for producing icosapentaenoic acid by genetic recombination
US7109392B1 (en) 1996-10-09 2006-09-19 Cargill, Incorporated Methods for increasing oleic acid content in seeds from transgenic plants containing a mutant delta 12 desaturase
WO1998018952A1 (fr) 1996-10-30 1998-05-07 Nippon Suisan Kaisha, Ltd. Procede de production de matieres grasses contenant des acides gras hautement insatures contenant eux-memes un acide docosahexaenoique a concentration selective
US6194167B1 (en) 1997-02-18 2001-02-27 Washington State University Research Foundation ω-3 fatty acid desaturase
AT406373B (de) 1997-02-27 2000-04-25 Immuno Ag Verfahren zur reinigung von faktor viii/vwf-komplex mittels kationenaustauscherchromatographie
EP0972844B1 (en) 1997-03-04 2008-09-17 Suntory Limited Process for preparing highly unsaturated fatty acid and lipid containing highly unsaturated fatty acid
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
US6428990B1 (en) 1997-04-11 2002-08-06 Abbott Laboratories Human desaturase gene and uses thereof
US6432684B1 (en) 1997-04-11 2002-08-13 Abbott Laboratories Human desaturase gene and uses thereof
US5968809A (en) 1997-04-11 1999-10-19 Abbot Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids
JP4087460B2 (ja) * 1997-04-11 2008-05-21 カルジーン エル エル シー 植物における長鎖多不飽和脂肪酸の合成のための方法および組成物
US5972664A (en) 1997-04-11 1999-10-26 Abbott Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids
US6051754A (en) 1997-04-11 2000-04-18 Abbott Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants
US6075183A (en) 1997-04-11 2000-06-13 Abbott Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants
US7589253B2 (en) 1997-04-15 2009-09-15 Commonwealth Scientific And Industrial Research Organisation Fatty acid epoxygenase genes from plants and uses therefor in modifying fatty acid metabolism
US6235529B1 (en) 1997-04-29 2001-05-22 The Regents Of The University Of California Compositions and methods for plant transformation and regeneration
CA2283422A1 (en) 1997-06-04 1998-12-10 Calgene, Llc Production of polyunsaturated fatty acids by expression of polyketide-like synthesis genes in plants
WO1998056239A1 (en) 1997-06-12 1998-12-17 Cargill, Incorporated Fatty acid desaturases and mutant sequences thereof
AR015136A1 (es) 1997-07-23 2001-04-18 Sanford Scient Inc Transforamacion de plastidos mejorada de plantas superiores y producccion de plantas transgenicas con resistencia a los herbicidas
US5912416A (en) 1997-08-05 1999-06-15 California Oils Corporation Safflower products with very high levels of unsaturated fatty acids
JP2001516575A (ja) 1997-09-12 2001-10-02 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼイション 植物における遺伝子発現の調節
ES2276475T5 (es) 1997-09-30 2014-07-11 The Regents Of The University Of California Producción de proteínas en semillas de plantas
GB9724783D0 (en) 1997-11-24 1998-01-21 Inst Arable Crops Research Novel polypeptides
KR20010033517A (ko) 1997-12-23 2001-04-25 더 유니버시티 오브 브리스톨 불포화화효소
US20030152983A1 (en) 1997-12-23 2003-08-14 University Of Bristol Desaturase
US6100447A (en) 1998-02-12 2000-08-08 Applied Phytologics, Inc. Method of barley transformation
US6838594B1 (en) 1998-03-20 2005-01-04 E. I. Du Pont De Nemours And Company Limnanthes oil genes
WO1999049050A2 (en) 1998-03-20 1999-09-30 E.I. Du Pont De Nemours And Company Limanthes oil genes
US6492108B1 (en) 1998-03-26 2002-12-10 Incyte Genomics, Inc. Delta-6 desaturase homologs
CA2329159A1 (en) 1998-05-29 1999-12-02 Bruce Kelder Compositions and methods for the synthesis of fatty acids, their derivatives and downstream products
PT1086236E (pt) 1998-06-12 2007-12-12 Calgene Llc Ácidos gordos poliinsaturados em plantas
WO1999064616A2 (en) 1998-06-12 1999-12-16 Abbott Laboratories Polyunsaturated fatty acids in plants
BR9913382A (pt) 1998-08-20 2001-09-25 Du Pont Fragmentos de ácido nucléico isolados codificadores de uma enzima modificadora de ácidos graxos vegetais associada com a formação de uniões duplas conjugadas, genes quiméricos, células hospedeiras transformadas, sementes, óleos, métodos de alteração do nìvel de ácidos graxos com uniões duplas conjugadas em uma célula hospedeira, métodos de produção de óleo de sementes contendo ácidos graxos com uniões duplas conjugadas nas sementes de plantas, métodos de produção de enzimas modificadoras de ácidos graxos associadas com a formação de uniões duplas conjugadas, métodos de isolamento de fragmentos de ácidos nucléicos e seus subfragmentos funcionalmente equivalentes codificadores de uma enzima modificadora de ácidos graxos vegetais associada a formação de uniões duplas conjugadas, alimento animal, métodos de aprimoramento da qualidade de carcaça de um animal e complemento
EP1107975A4 (en) 1998-08-24 2003-07-16 Univ Rutgers SYNTHETIC FATTY ACID DESATURASEGEN FOR EXPRESSION IN PLANTS
US20030163845A1 (en) 1998-09-02 2003-08-28 Pradip Mukerji Elongase genes and uses thereof
US6913916B1 (en) 1998-09-02 2005-07-05 Abbott Laboratories Elongase genes and uses thereof
US6403349B1 (en) 1998-09-02 2002-06-11 Abbott Laboratories Elongase gene and uses thereof
US6677145B2 (en) 1998-09-02 2004-01-13 Abbott Laboratories Elongase genes and uses thereof
WO2000020603A1 (en) 1998-10-05 2000-04-13 Abbott Laboratories Altered fatty acid biosynthesis in insect cells using delta five desaturase
AU1097900A (en) 1998-10-05 2000-04-26 Abbott Laboratories Delta 6 and delta 12 desaturases and modified fatty acid biosynthesis and products produced therefrom
US6609661B1 (en) 1998-10-06 2003-08-26 Kabushiki Kaisha Nippon Conlux Bank-note processing device
CA2346006A1 (en) 1998-10-09 2000-04-20 Merck & Co., Inc. Delta 6 fatty acid desaturase
JP4182192B2 (ja) 1998-11-26 2008-11-19 独立行政法人産業技術総合研究所 イコサペンタエン酸及び/又はドコサヘキサエン酸の生合成に関与する酵素群をコードする遺伝子
US6864077B1 (en) 1998-12-03 2005-03-08 Edgar B. Cahoon Membrane-bound desaturases
JP2001095588A (ja) 1998-12-04 2001-04-10 Research Institute Of Innovative Technology For The Earth 緑藻のω3脂肪酸不飽和化酵素遺伝子及びその利用
US6825017B1 (en) 1998-12-07 2004-11-30 Washington State University Research Foundation Desaturases and methods of using them for synthesis of polyunsaturated fatty acids
US7217856B2 (en) 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US8003772B2 (en) 1999-01-14 2011-08-23 Martek Biosciences Corporation Chimeric PUFA polyketide synthase systems and uses thereof
US7271315B2 (en) 1999-01-14 2007-09-18 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US7247461B2 (en) 1999-01-14 2007-07-24 Martek Biosciences Corporation Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof
US7211418B2 (en) 1999-01-14 2007-05-01 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US20070244192A1 (en) 1999-01-14 2007-10-18 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
WO2000052183A1 (en) 1999-03-05 2000-09-08 Monsanto Technology Llc Multigene expression vectors for the biosynthesis of products via multienzyme biological pathways
EP1035207A1 (en) 1999-03-09 2000-09-13 MultiGene Biotech GmbH cDNA molecules of the members of gene family encoding human fatty acid desaturases and their use in diagnosis and therapy
EP1161542A1 (en) 1999-03-18 2001-12-12 University Of Bristol Polysaturated fatty acid (pufa) elongase from caenorhabditis elegans
ATE334206T1 (de) 1999-06-07 2006-08-15 Basf Plant Science Gmbh Delta6-acetylenase und delta6-desaturase aus ceratodon purpureus
WO2001002591A1 (de) 1999-07-06 2001-01-11 Basf Plant Science Gmbh Δ6-desaturasegene exprimierende pflanzen und pufas enthaltende öle aus diesen pflanzen und ein verfahren zur herstellung ungesättigter fettsäuren
AU6091600A (en) 1999-07-12 2001-01-30 Ohio University Mammalian cells expressing desaturases and elongases
JP3648134B2 (ja) 1999-07-13 2005-05-18 Abb株式会社 自動塗装装置
US7070970B2 (en) 1999-08-23 2006-07-04 Abbott Laboratories Elongase genes and uses thereof
US7531718B2 (en) 1999-08-26 2009-05-12 Monsanto Technology, L.L.C. Nucleic acid sequences and methods of use for the production of plants with modified polyunsaturated fatty acids
IL148374A0 (en) 1999-08-26 2002-09-12 Calgene Llc Plants with modified polyunsaturated fatty acids
US7067722B2 (en) 1999-08-26 2006-06-27 Monsanto Technology Llc Nucleic acid sequences and methods of use for the production of plants with modified polyunsaturated fatty acids
DE10044468A1 (de) 1999-09-10 2001-03-15 Axiva Gmbh Neue Nukleinsäure aus Tetrahymena kodierend für eine delta-6Desaturase, ihre Herstellung und ihre Verwendung
FR2798391B1 (fr) 1999-09-15 2001-12-14 Inst Nat Sante Rech Med Enzyme thyroidienne nadph oxydase, acide nucleique codant pour cette enzyme et leurs applications
DE19950589A1 (de) 1999-10-20 2001-05-23 Gvs Ges Fuer Erwerb Und Verwer Elongasepromotoren für gewebespezifische Expression von Transgenen in Pflanzen
JP4221476B2 (ja) 1999-11-19 2009-02-12 独立行政法人産業技術総合研究所 イコサペンタエン酸生合成遺伝子群をクローニングしたプラスミド及びイコサペンタエン酸を産生するラン藻
AU782788B2 (en) 1999-11-22 2005-08-25 Plant Bioscience Limited Enhanced transgene expression by co-expression with a suppressor of post-transcriptional gene silencing (PTGS)
US6620986B1 (en) 1999-11-23 2003-09-16 The United States Of America As Represented By The Secretary Of Agriculture Transformation of Ricinus communis, the castor plant
WO2001038541A1 (en) 1999-11-25 2001-05-31 Basf Plant Science Gmbh Moss genes from physcomitrella patents encoding proteins involved in the synthesis of polyunsaturated fatty acids and lipids
GB9929681D0 (en) 1999-12-15 2000-02-09 Implyx Ltd Transgenic insect
JP2001169780A (ja) 1999-12-15 2001-06-26 Natl Inst Of Advanced Industrial Science & Technology Meti ドコサヘキサエン酸生産細菌の遺伝子
GB9929897D0 (en) 1999-12-18 2000-02-09 Slabas Antoni R Improvements in or relating to conjugated fatty acids and related compounds
US20030172398A1 (en) 1999-12-21 2003-09-11 Browse John A. Novel delta-12 desaturase and methods of using it for synthesis of polyunsaturated fatty acids
KR20020073580A (ko) 2000-02-09 2002-09-27 바스프 악티엔게젤샤프트 신규 연장효소 유전자 및 다가불포화 지방산의 제조 방법
WO2001090325A2 (en) 2000-05-19 2001-11-29 Millennium Pharmaceuticals, Inc. 50365, a hexokinase family member and uses thereof
US20040157221A9 (en) 2000-03-07 2004-08-12 Millennium Pharmaceuticals, Inc. Novel 25869, 25934, 26335, 50365, 21117, 38692, 46508, 16816, 16839, 49937, 49931 and 49933 molecules and uses therefor
US6686185B1 (en) 2000-03-07 2004-02-03 Millennium Pharmaceuticals, Inc. 25934, a novel fatty acid desaturase and uses therefor
US7411054B2 (en) 2000-03-07 2008-08-12 Millennium Pharmaceuticals, Inc. 25869, 25934, 26335, 50365, 21117, 38692, 46508, 16816, 16839, 49937, 49931 and 49933 molecules and uses therefor
US6492577B1 (en) 2000-03-16 2002-12-10 The Regents Of The University Of California Leafy cotyledon2 genes and their uses
WO2001073060A2 (en) 2000-03-24 2001-10-04 Millennium Pharmaceuticals, Inc. 18221, dual specificity phosphatase and uses thereof
CA2301158A1 (en) 2000-03-24 2001-09-24 Stephen J. Allen Screening methods for compounds useful for modulating lipid metabolism in disease
AU2000234588A1 (en) 2000-03-31 2001-10-15 Idemitsu Petrochemical Co. Ltd. Process for producing lipids and lipid-secreting microorganisms
ES2349892T3 (es) 2000-04-18 2011-01-12 Commonwealth Scientific And Industrial Research Organisation Procedimiento de modificación del contenido de aceite de semilla de algodón.
US7091005B2 (en) 2000-05-16 2006-08-15 Merck & Co., Inc. Gene responsible for Stargardt-like dominant macular dystrophy
EP1328189B1 (en) 2000-05-16 2016-08-24 Dario B. Crosetto Apparatus for anatomical and functional medical imaging
AU2001263473A1 (en) 2000-05-26 2001-12-11 Washington State University Research Foundation Palmitate desaturase gene
AU2001261764A1 (en) 2000-06-12 2001-12-24 Boyce Thompson Institute For Plant Research Fatty acid desaturase gene and protein for modulating activation of defense signaling pathways in plants
AU7007701A (en) 2000-06-23 2002-01-08 Millennium Pharm Inc 46508, a novel human peptidyl-trna hydrolase family member and uses thereof
WO2002002760A2 (en) 2000-06-29 2002-01-10 Millennium Pharmaceuticals, Inc. 25869, a human carboxylesterase and uses thereof
AU2001275990A1 (en) 2000-07-17 2002-01-30 Millennium Pharmaceuticals, Inc. 16816 and 16839, novel human phospholipase c molecules and uses therefor
GB0316629D0 (en) 2003-07-16 2003-08-20 Univ York Transgenic cell
EP1339839A2 (en) 2000-08-21 2003-09-03 Millennium Pharmaceuticals, Inc. Human transporter family members and uses thereof
EP1322767B1 (en) 2000-09-26 2008-07-23 Xenon Pharmaceuticals Inc. Methods and compositions employing a stearoyl-coa desaturase-hscd5
ATE510908T1 (de) 2000-09-28 2011-06-15 Bioriginal Food & Science Corp Fad5-2, mitglied der desaturase-familie und verwendungen davon
WO2002090993A2 (en) 2000-11-27 2002-11-14 Focus Technologies, Inc. Functional protein expression for rapid cell-free phenotyping
JP2004513662A (ja) 2000-11-29 2004-05-13 キセノン ジェネティックス インコーポレイテッド ヒトエロンガーゼ遺伝子、その使用およびそれを調節する化合物
DE10102338A1 (de) 2001-01-19 2002-07-25 Basf Plant Science Gmbh Verfahren zur Expression von Biosynthesegenen in pflanzlichen Samen unter Verwendung von neuen multiplen Expressionskonstrukten
DE10102337A1 (de) 2001-01-19 2002-07-25 Basf Plant Science Gmbh Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren, neue Biosynthesegene sowie neue pflanzliche Expressionskonstrukte
US6635451B2 (en) 2001-01-25 2003-10-21 Abbott Laboratories Desaturase genes and uses thereof
JP4347572B2 (ja) 2001-01-25 2009-10-21 アボット・ラボラトリーズ デサチュラーゼ遺伝子とその使用
DE10106660A1 (de) 2001-02-12 2002-08-29 Celanese Ventures Gmbh Verfahren zur Herstellung von gamma-Linolensäure aus einer Ciliaten-Kultur durch Zusatz geeigneter Vorläufermoleküle zu dem Kulturmedium
GB0107510D0 (en) 2001-03-26 2001-05-16 Univ Bristol New elongase gene and a process for the production of -9-polyunsaturated fatty acids
WO2002081702A1 (en) 2001-04-05 2002-10-17 Idemitsu Technofine Co., Ltd. Fatty acid δ6-position desaturase genes and plasmids and tra nsformant containing these genes
TWI324181B (en) 2001-04-16 2010-05-01 Martek Biosciences Corp Product and process for transformation of thraustochytriales microorganisms
TWI337619B (en) 2001-04-16 2011-02-21 Martek Biosciences Corp Pufa polyketide synthase systems and uses thereof
US7045683B2 (en) 2001-05-04 2006-05-16 Abbott Laboratories Δ4-desaturase genes and uses thereof
US20030082754A1 (en) 2001-05-04 2003-05-01 Pradip Mukerji Delta4 - desaturase genes and uses thereof
US20050129739A1 (en) 2001-05-14 2005-06-16 Gerhard Kohn Production and use of a polar lipid-rich fraction containing omega-3 and/or omega-6 highly unsaturated fatty acids from microbes, genetically modified plant seeds and marine organisms
CA2448501C (en) 2001-06-06 2013-06-04 Bioriginal Food & Science Corporation Flax (linum usitatissimum l.) seed-specific promoters
DE10134660A1 (de) 2001-07-20 2003-02-06 Basf Plant Science Gmbh Fettsäure-Desaturase-Gene aus Granatapfel und Verfahren zur Herstellung von ungesättigten Fettsäuren
US20050089879A1 (en) 2001-07-31 2005-04-28 Ivo Feussner Method for producing arachidonic acid in transgenic organisms
US6875595B2 (en) 2001-09-13 2005-04-05 Divergence, Inc. Nematode fatty acid desaturase-like sequences
JP2003116566A (ja) 2001-10-12 2003-04-22 Osamu Suzuki n−3系ドコサペンタエン酸の製造方法
US7211656B2 (en) 2002-01-30 2007-05-01 Abbott Laboratories Desaturase genes, enzymes encoded thereby, and uses thereof
MXPA04007327A (es) 2002-01-30 2004-11-26 Basf Plant Science Gmbh Nuevo gen de enlogasa y metodo para producir acidos grasos poliinsaturados.
GB2385852A (en) 2002-02-27 2003-09-03 Rothamsted Ex Station Delta 6-desaturases from Primulaceae
US7700833B2 (en) 2002-03-01 2010-04-20 Cornell University Process for the production of unsaturated fatty acids
CA2519169C (en) 2002-03-16 2013-04-30 The University Of York Transgenic plants expressing enzymes involved in fatty acid biosynthesis
US7566813B2 (en) 2002-03-21 2009-07-28 Monsanto Technology, L.L.C. Nucleic acid constructs and methods for producing altered seed oil compositions
DE10219203A1 (de) 2002-04-29 2003-11-13 Basf Plant Science Gmbh Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren in Pflanzen
JP4515904B2 (ja) 2002-05-22 2010-08-04 モンサント テクノロジー エルエルシー 真菌からの脂肪酸不飽和化酵素
AU2003277812A1 (en) 2002-06-21 2004-01-06 Monsanto Technology Llc Thioesterase-related nucleic acid sequences and methods
WO2004005442A1 (de) 2002-07-03 2004-01-15 Basf Plant Science Gmbh Verfahren zur herstellung von konjugierten mehrfach ungesättigten fettsäuren mit mindestens zwei doppelbindungen in pflanzen
MXPA05001096A (es) 2002-07-29 2005-11-23 Rigel Pharmaceuticals Inc Metodos para tratamiento o prevencion de enfermedades autoinmunes con compuestos de 2,4-diamino-pirimidina.
RU2005106861A (ru) 2002-08-12 2005-09-10 Монсанто Текнолоджи Ллс (Us) Способ увеличения в растениях суммарного содержания масла
BR0313609A (pt) 2002-08-19 2006-06-13 Anderson Power Products sistema de travamento por manìpulo para conectores elétricos e processos de sua realização
DE10246125A1 (de) 2002-10-01 2004-04-15 Aventis Behring Gmbh Konzentrat eines Faktor VIII:C-haltigen von-Willebrand-Faktors und das dazu gehörige Verfahren
US8084074B2 (en) 2003-02-12 2011-12-27 E. I. Du Pont De Nemours And Company Production of very long chain polyunsaturated fatty acids in oil seed plants
US20040172682A1 (en) 2003-02-12 2004-09-02 Kinney Anthony J. Production of very long chain polyunsaturated fatty acids in oilseed plants
CA2517253C (en) 2003-02-27 2018-07-03 Basf Plant Science Gmbh Method for the production of polyunsaturated fatty acids
CA2520795C (en) 2003-03-31 2015-06-23 University Of Bristol Novel plant acyltransferases specific for long-chained, multiply unsaturated fatty acids
DE10315026A1 (de) 2003-04-02 2004-10-14 Bioplanta Arzneimittel Gmbh Zusammensetzungen enthaltend omega-3-fettsäurehaltige Öle und Pflanzenextrakte
WO2004090123A2 (de) 2003-04-08 2004-10-21 Basf Plant Science Gmbh Δ-4-desaturasen aus euglena gracilis, exprimierende pflanzen und pufa enthaltende öle
EP1618193B1 (en) 2003-04-16 2008-05-07 BASF Plant Science GmbH Use of genes for increasing the oil content in plants
US7125672B2 (en) 2003-05-07 2006-10-24 E. I. Du Pont De Nemours And Company Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts
US8313911B2 (en) 2003-05-07 2012-11-20 E I Du Pont De Nemours And Company Production of polyunsaturated fatty acids in oleaginous yeasts
US7238482B2 (en) * 2003-05-07 2007-07-03 E. I. Du Pont De Nemours And Company Production of polyunsaturated fatty acids in oleaginous yeasts
US20110059496A1 (en) 2003-06-25 2011-03-10 E. I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast
US7267976B2 (en) 2003-07-02 2007-09-11 E.I. Du Pont De Nemours And Company Acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous yeasts
US7208590B2 (en) 2003-07-15 2007-04-24 Abbott Laboratories Genes involved in polyketide synthase pathways and uses thereof
EP2169053B1 (de) 2003-08-01 2015-09-09 BASF Plant Science GmbH Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren in transgenen Organismen
PT1656449E (pt) 2003-08-21 2009-07-27 Monsanto Technology Llc Dessaturases dos ácidos gordos a partir de prímulas
US7504259B2 (en) 2003-11-12 2009-03-17 E. I. Du Pont De Nemours And Company Δ12 desaturases suitable for altering levels of polyunsaturated fatty acids in oleaginous yeast
WO2005047479A2 (en) 2003-11-12 2005-05-26 E.I. Dupont De Nemours And Company Delta-15 desaturases suitable for altering levels of polyunsaturated fatty acids in oilseed plants and oleaginous yeast
MY140210A (en) 2003-12-22 2009-11-30 Suntory Holdings Ltd Marchantiales-derived unsaturated fatty acid synthetase genes and use of the same
ATE515567T1 (de) 2004-02-17 2011-07-15 Univ York Desaturase-enzyme
US9458436B2 (en) 2004-02-27 2016-10-04 Basf Plant Science Gmbh Method for producing polyunsaturated fatty acids in transgenic plants
PL1723220T3 (pl) 2004-02-27 2013-09-30 Basf Plant Science Gmbh Sposób wytwarzania wielokrotnie nienasyconych kwasów tłuszczowych w roślinach transgenicznych
EP1720988B1 (de) 2004-02-27 2011-10-12 BASF Plant Science GmbH Verfahren zur herstellung von ungesättigten omega-3-fettsäuren in transgenen organismen
DE102004017369A1 (de) 2004-04-08 2005-11-03 Nutrinova Nutrition Specialties & Food Ingredients Gmbh Screeningverfahren zur Identifizierung von PUFA-PKS in Proben
DE102004017370A1 (de) 2004-04-08 2005-10-27 Nutrinova Nutrition Specialties & Food Ingredients Gmbh PUFA-PKS Gene aus Ulkenia
EP1734947B1 (en) 2004-04-16 2015-04-15 Monsanto Technology, LLC Expression of fatty acid desaturases in corn
BRPI0510132A (pt) 2004-04-22 2007-10-02 Commw Scient Ind Res Org sìntese de ácidos graxos poliinsaturados de cadeia longa por células recombinantes
AU2005235627B2 (en) 2004-04-22 2011-07-07 Commonwealth Scientific And Industrial Research Organisation Synthesis of long-chain polyunsaturated fatty acids by recombinant cells
CN101018862B (zh) * 2004-04-22 2013-10-09 联邦科学技术研究组织 用重组细胞合成长链多不饱和脂肪酸
ES2351973T3 (es) 2004-06-04 2011-02-14 Fluxome Sciences A/S Células metabólicamente modificadas por ingeniería para la producción de ácidos grasos poliinsaturados.
WO2006012325A1 (en) 2004-06-25 2006-02-02 E.I. Dupont De Nemours And Company Delta-8 desaturase and its use in making polyunsaturated fatty acids
DE102004060340A1 (de) 2004-07-16 2006-02-09 Basf Plant Science Gmbh Verfahren zur Erhöhung des Gehalts an mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen
JP4587451B2 (ja) 2004-08-20 2010-11-24 サントリーホールディングス株式会社 ω3脂肪酸不飽和化活性を有するポリペプチドおよびそのポリペプチドをコードするポリヌクレオチドならびにそれらの利用
DE102004044421B4 (de) 2004-09-14 2010-06-24 Biotest Ag Verfahren zur Trennung eines von Willebrand Faktors mit einer spezifischen VWF-Aktivität von wenigstens 50 E/mg VWF-Antigen von einem von Willebrand Faktor mit niedriger Aktivität und Verwendung von Hydroxylapatit dafür
GB0421937D0 (en) 2004-10-02 2004-11-03 Univ York Acyl CoA synthetases
US20060094102A1 (en) 2004-11-04 2006-05-04 Zhixiong Xue Ammonium transporter promoter for gene expression in oleaginous yeast
US7273746B2 (en) 2004-11-04 2007-09-25 E.I. Dupont De Nemours And Company Diacylglycerol acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms
US7198937B2 (en) 2004-11-04 2007-04-03 E. I. Du Pont De Nemours And Company Mortierella alpina diacylglycerol acyltransferase for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms
US7189559B2 (en) 2004-11-04 2007-03-13 E. I. Du Pont De Nemours And Company Mortierella alpina lysophosphatidic acid acyltransferase homolog for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms
US7192762B2 (en) 2004-11-04 2007-03-20 E. I. Du Pont De Nemours And Company Mortierella alpina glycerol-3-phosphate o-acyltransferase for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms
US7879591B2 (en) 2004-11-04 2011-02-01 E.I. Du Pont De Nemours And Company High eicosapentaenoic acid producing strains of Yarrowia lipolytica
US7550286B2 (en) 2004-11-04 2009-06-23 E. I. Du Pont De Nemours And Company Docosahexaenoic acid producing strains of Yarrowia lipolytica
US8685679B2 (en) 2004-11-04 2014-04-01 E I Du Pont De Nemours And Company Acyltransferase regulation to increase the percent of polyunsaturated fatty acids in total lipids and oils of oleaginous organisms
US20100120103A1 (en) 2004-12-14 2010-05-13 Avesthagen Limited Recombinant Production Docosahexaenoic Acid (DHA) in Yeast
DE102004063326A1 (de) 2004-12-23 2006-07-06 Basf Plant Science Gmbh Verfahren zur Herstellung mehrfach ungesättigter Fettsäuren in transgenen Organismen
DE102004062294A1 (de) 2004-12-23 2006-07-06 Basf Plant Science Gmbh Verfahren zur Herstellung von mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen
DE102005013779A1 (de) 2005-03-22 2006-09-28 Basf Plant Science Gmbh Verfahren zur Herstellung von mehrfach ungesättigten C20- und C22-Fettsäuren mit mindestens vier Doppelbindungen in transgenen Pflanzen
AR053477A1 (es) 2005-05-23 2007-05-09 Arcadia Biosciences Inc Cartamo con acido gamma - linolenico elevado
WO2006135866A2 (en) 2005-06-10 2006-12-21 Martek Biosciences Corporation Pufa polyketide synthase systems and uses thereof
WO2007005882A2 (en) 2005-07-05 2007-01-11 North Carolina State University Methods and compositions for expressing proteins in plants
DE102005038036A1 (de) 2005-08-09 2007-02-15 Basf Plant Science Gmbh Verfahren zur Herstellung von Arachidonsäure und/oder Eicosapentaensäure in transgenen Nutzpflanzen
GB2431158A (en) 2005-10-13 2007-04-18 Rothamsted Res Ltd Process for the production of arachidonic and/or eicosapentaenoic acid
DE102005052551A1 (de) 2005-11-02 2007-05-16 Rothamsted Res Harpenden Verfahren zur Herstellung von y-Linolensäure und/oder Stearidonsäure in transgenen Brassicaceae und Linaceae
DK1951866T3 (da) 2005-11-23 2014-10-27 Du Pont Delta-9-elongaser og anvendelse heraf til fremstilling af flerumættede fedtsyrer
CA2640473A1 (en) 2006-02-03 2007-08-16 The Texas A & M University System Enhancing expression of value-added genes by transgenic expression of tombusvirus-based p19 gene mutants
GB0603160D0 (en) 2006-02-16 2006-03-29 Rothamsted Res Ltd Nucleic acid
AR059376A1 (es) 2006-02-21 2008-03-26 Basf Plant Science Gmbh Procedimiento para la produccion de acidos grasos poliinsaturados
JP2009529891A (ja) 2006-03-15 2009-08-27 マーテック バイオサイエンシーズ コーポレーション 多価不飽和脂肪酸を含む植物種子油
US7943823B2 (en) 2006-04-28 2011-05-17 E.I. Du Pont De Nemours And Company Delta-8 desaturase and its use in making polyunsaturated fatty acids
EP2013335A2 (en) 2006-05-01 2009-01-14 E.I. Du Pont De Nemours And Company Fungal delta12 desaturase and delta15 desaturase motifs
MX2008015182A (es) 2006-05-29 2008-12-12 Icon Genetics Gmbh Sistema de expresion inducible basado en virus de plantas.
CA2982638A1 (en) * 2006-06-28 2008-01-03 Nucelis Inc. Fatty acid blends and uses therefor
DE102006034313A1 (de) 2006-07-21 2008-01-24 Basf Plant Science Gmbh Verfahren zur Herstellung von Arachidonsäure und/oder Eicosapentaensäure
EP2500420B1 (en) 2006-08-24 2016-06-22 BASF Plant Science GmbH Pythium omega 3 desaturase with specificity to all omega 6 fatty acids longer than 18 carbon chains
EP2059588A4 (en) 2006-08-29 2010-07-28 Commw Scient Ind Res Org FATTY ACID SYNTHESIS
WO2008040787A2 (de) 2006-10-06 2008-04-10 Basf Plant Science Gmbh Verfahren zur herstellung mehrfach ungesättigter fettsäuren in transgenen organismen
US8916361B2 (en) 2006-11-17 2014-12-23 Abbott Laboratories Elongase gene and uses thereof
US7709239B2 (en) 2006-12-07 2010-05-04 E.I. Du Pont De Nemours And Company Mutant Δ8 desaturase genes engineered by targeted mutagenesis and their use in making polyunsaturated fatty acids
CA2679988A1 (en) 2007-04-03 2008-10-16 E. I. Du Pont De Nemours And Company Multizymes and their use in making polyunsaturated fatty acids
US8119860B2 (en) 2007-04-16 2012-02-21 E. I. Du Pont De Nemours And Company Delta-9 elongases and their use in making polyunsaturated fatty acids
US7943365B2 (en) 2007-05-03 2011-05-17 E.I. Du Pont De Nemours And Company Δ-5 desaturases and their use in making polyunsaturated fatty acids
EP2176433B1 (de) 2007-07-31 2011-10-12 BASF Plant Science GmbH Desaturasen und verfahren zur herstellung mehrfach ungesättigter fettsäuren in transgenen organismen
US8318914B2 (en) 2007-07-31 2012-11-27 Bioriginal Food & Science Corp. Elongases and methods for producing polyunsaturated fatty acids in transgenic organisms
WO2009017821A1 (en) * 2007-08-01 2009-02-05 Bioglow Inc. Bioluminescent plants comprising bacterial lux operon and methods of making same
US8119784B2 (en) 2008-04-02 2012-02-21 E. I. Du Pont De Nemours And Company Delta-4 desaturase and its use in making polyunsaturated fatty acids
BRPI0911606A2 (pt) 2008-04-25 2015-07-28 Commw Scient Ind Res Org Polipeptídeo e métodos para produzir triacilgliceróis compreendendo ácidos graxos modificados
CA2723072C (en) 2008-04-30 2017-01-10 Rothamsted Research Ltd. Desaturase and method for the production of polyunsaturated fatty acids in transgenic organisms
EP2285967B1 (en) 2008-06-03 2016-12-21 BASF Plant Science GmbH Fatty acid dehydratases and uses thereof
US8168858B2 (en) 2008-06-20 2012-05-01 E. I. Du Pont De Nemours And Company Delta-9 fatty acid elongase genes and their use in making polyunsaturated fatty acids
EP3431607A3 (en) 2008-07-01 2019-03-06 BASF Plant Science GmbH Promoters from brassica napus for seed specific gene expression
CN102202498B (zh) 2008-07-21 2016-09-07 澳大利亚联邦科学与工业研究组织 改良的棉籽油及应用
WO2010009500A1 (en) 2008-07-21 2010-01-28 Commonwealth Scientific And Industrial Research Organisation Improved vegetable oils and uses therefor
US9090902B2 (en) 2008-08-26 2015-07-28 Basf Plant Science Gmbh Nucleic acids encoding desaturases and modified plant oil
DK2337791T3 (da) 2008-10-14 2013-11-04 Monsanto Technology Llc Anvendelse af fedtsyredesaturaser fra Hemiselmis SPP
WO2010066703A2 (en) 2008-12-12 2010-06-17 Basf Plant Science Gmbh Desaturases and process for the production of polyunsaturated fatty acids in transgenic organisms
US9212371B2 (en) 2009-05-13 2015-12-15 Basf Plant Science Company Gmbh Acyltransferases and uses thereof in fatty acid production
AU2010260227B2 (en) 2009-06-16 2015-01-29 E. I. Du Pont De Nemours And Company Improvement of long chain omega-3 and omega-6 polyunsaturated fatty acid biosynthesis by expression of acyl-CoA lysophospholipid acyltransferases
US8188335B2 (en) 2009-07-17 2012-05-29 Abbott Laboratories Δ9-elongase for production of polyunsaturated fatty acid-enriched oils
WO2011006948A1 (en) 2009-07-17 2011-01-20 Basf Plant Science Company Gmbh Novel fatty acid desaturases and elongases and uses thereof
AU2010288482A1 (en) 2009-08-31 2012-04-12 Basf Plant Science Company Gmbh Regulatory nucleic acid molecules for enhancing seed-specific gene expression in plants promoting enhanced polyunsaturated fatty acid synthesis
WO2011064181A1 (en) 2009-11-24 2011-06-03 Basf Plant Science Company Gmbh Novel fatty acid desaturase and uses thereof
WO2011064183A1 (en) 2009-11-24 2011-06-03 Basf Plant Science Company Gmbh Novel fatty acid elongase and uses thereof
TW201144442A (en) 2010-05-17 2011-12-16 Dow Agrosciences Llc Production of DHA and other LC-PUFAs in plants
CN103201379B (zh) 2010-06-28 2015-08-19 联邦科学技术研究组织 生产脂质的方法
CA2823678A1 (en) 2010-10-01 2012-04-05 Kyushu University, National University Corporation Transformation of a stramenopile for production of a microbial oil
EP2630235B1 (en) 2010-10-21 2017-04-05 BASF Plant Science Company GmbH Novel fatty acid desaturases, elongases, elongation components and uses therof
JP5150814B2 (ja) * 2010-10-29 2013-02-27 オプテックス株式会社 三角測距方式の距離検出回路
TW201307553A (zh) * 2011-07-26 2013-02-16 Dow Agrosciences Llc 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術
EP2836599B1 (en) 2012-04-12 2019-11-06 Rothamsted Research Limited Production of omega-3 long chain polyunsaturated fatty acids
US8816111B2 (en) 2012-06-15 2014-08-26 Commonwealth Scientific And Industrial Research Organisation Lipid comprising polyunsaturated fatty acids
CA2879154A1 (en) 2012-08-03 2014-02-06 Basf Plant Science Company Gmbh Novel enzymes, enzyme components and uses thereof
GB201217524D0 (en) 2012-10-01 2012-11-14 Rothamsted Res Ltd Recombinant organisms
CN104726473B (zh) 2013-12-18 2020-02-14 联邦科学技术研究组织 包含二十二碳六烯酸的提取的植物脂质
CN105219789B (zh) 2014-06-27 2023-04-07 联邦科学技术研究组织 包含二十二碳五烯酸的提取的植物脂质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566583B1 (en) * 1997-06-04 2003-05-20 Daniel Facciotti Schizochytrium PKS genes
US20060246556A1 (en) * 2002-12-19 2006-11-02 University Of Bristol Novel method for the production of polyunsaturated fatty acids
US20070270600A1 (en) * 2004-01-30 2007-11-22 Bionovate Limited Solvent Extraction of Lipids Such as Essential Fatty Acids
US20050273885A1 (en) * 2004-04-22 2005-12-08 Singh Surinder P Synthesis of long-chain polyunsaturated fatty acids by recombinant cells
US20110015415A1 (en) * 2004-04-22 2011-01-20 Commonwealth Scientific And Industrial Research Organisation Synthesis of long-chain polyunsaturated fatty acids by recombinant cells
US20110039010A1 (en) * 2008-04-25 2011-02-17 Basf Plant Science Gmbh Plant Seed Oil
US20110201683A1 (en) * 2008-08-11 2011-08-18 Nestec S.A. Oil containing one or more long-chain polyunsaturated fatty acids phospholipids derived from biomass
US20120016144A1 (en) * 2008-11-18 2012-01-19 James Robertson Petrie Enzymes and methods for producing omega-3 fatty acids

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109796328A (zh) * 2019-03-14 2019-05-24 浙江工业大学 一种高纯度香榧籽油金松酸的分离方法
CN109796328B (zh) * 2019-03-14 2022-03-25 浙江工业大学 一种高纯度香榧籽油金松酸的分离方法

Also Published As

Publication number Publication date
US9969954B2 (en) 2018-05-15
US20180008568A1 (en) 2018-01-11
AU2018247287B2 (en) 2021-08-19
MY187101A (en) 2021-08-31
US20220356414A1 (en) 2022-11-10
SG10201810439SA (en) 2018-12-28
US20240084214A1 (en) 2024-03-14
US9932541B2 (en) 2018-04-03
CA3082388A1 (en) 2013-12-19
JP7254744B2 (ja) 2023-04-10
SG11201408362SA (en) 2015-01-29
IL236288A (en) 2016-06-30
US10655082B2 (en) 2020-05-19
US20180258026A1 (en) 2018-09-13
CN104853596B (zh) 2018-10-09
US11306271B2 (en) 2022-04-19
KR20150037771A (ko) 2015-04-08
CN104853596A (zh) 2015-08-19
PL2861059T3 (pl) 2017-10-31
AU2017201411A1 (en) 2017-03-23
CA2876519C (en) 2020-09-15
EP3266316A1 (en) 2018-01-10
KR20200083595A (ko) 2020-07-08
CA2876519A1 (en) 2013-12-19
PE20200448A1 (es) 2020-02-28
AU2021269427A1 (en) 2021-12-16
ES2636487T3 (es) 2017-10-05
CL2014003402A1 (es) 2015-12-11
US20170320806A1 (en) 2017-11-09
AU2018247287A1 (en) 2018-11-01
UA127917C2 (uk) 2024-02-14
PE20150769A1 (es) 2015-06-11
AU2017201411B2 (en) 2018-07-12
JP6242882B2 (ja) 2017-12-06
HK1248989A1 (zh) 2018-10-26
KR102197208B1 (ko) 2021-01-04
US20170349527A1 (en) 2017-12-07
US10899992B2 (en) 2021-01-26
HK1209581A1 (zh) 2016-04-08
US9556102B2 (en) 2017-01-31
BR122019026149A2 (zh) 2017-07-25
BR112014031362A2 (pt) 2017-07-25
PT2861059T (pt) 2017-08-08
EA036786B1 (ru) 2020-12-21
EP2861059A4 (en) 2016-03-09
US20200369980A1 (en) 2020-11-26
AU2013273934B2 (en) 2016-12-01
NZ631702A (en) 2017-01-27
DK2861059T3 (en) 2017-08-28
US20210139809A1 (en) 2021-05-13
HUE033766T2 (en) 2018-01-29
JP2015528027A (ja) 2015-09-24
JP2018075003A (ja) 2018-05-17
UA117223C2 (uk) 2018-07-10
US11834621B2 (en) 2023-12-05
EA201590026A1 (ru) 2015-05-29
IL236288A0 (en) 2015-02-26
AU2013273934A1 (en) 2015-01-22
CL2019002477A1 (es) 2019-12-06
US20170349526A1 (en) 2017-12-07
US9999607B2 (en) 2018-06-19
WO2013185184A3 (en) 2014-02-13
US8816111B2 (en) 2014-08-26
PH12014502795A1 (en) 2015-02-09
ZA201500015B (en) 2016-04-28
US9932290B2 (en) 2018-04-03
JP2020172643A (ja) 2020-10-22
US20150045569A1 (en) 2015-02-12
US9550718B2 (en) 2017-01-24
BR122019026149A8 (pt) 2022-06-28
US10335386B2 (en) 2019-07-02
EP2861059B1 (en) 2017-05-03
US20180311200A1 (en) 2018-11-01
BR112014031362A8 (pt) 2022-06-28
US9932289B2 (en) 2018-04-03
US20130338388A1 (en) 2013-12-19
EP2861059A2 (en) 2015-04-22
MX2014015375A (es) 2016-02-18
US20170349528A1 (en) 2017-12-07
JP6784656B2 (ja) 2020-11-11
US20150203788A1 (en) 2015-07-23
MX349678B (es) 2017-08-08
US20130338387A1 (en) 2013-12-19
WO2013185184A2 (en) 2013-12-19
US20170334826A1 (en) 2017-11-23
CN109294730B (zh) 2021-09-21
US8946460B2 (en) 2015-02-03

Similar Documents

Publication Publication Date Title
AU2017201411B2 (en) Production of long chain polyunsaturated fatty acids in plant cells
CN111154724B (zh) 包含二十二碳六烯酸的提取的植物脂质
KR102527795B1 (ko) 도코사펜타에노산을 포함하는 지질
CN107858204B (zh) 产生ω-3脂肪酸的酶和方法
RU2743384C2 (ru) Способы получения промышленных продуктов из растительных липидов
JP6293481B2 (ja) 脂質を生成する方法
AU2024201251A1 (en) Plants with modified traits
AU2017204957A1 (en) Plants with modified traits
KR100854607B1 (ko) 식물 스테롤 아실전달효소
JP2017537633A (ja) 低飽和脂肪酸または無飽和脂肪酸トランスジェニックキャノーラの生成
AU2018250483A1 (en) Processes for producing lipids
KR102673214B1 (ko) 도코사펜타에노산을 포함하는 지질
AU2020277266B2 (en) Enzymes and methods for producing omega-3 fatty acids
CN113980730A (zh) 包含二十二碳五烯酸的提取的植物脂质
US20220025391A1 (en) Improved method for the production of high levels of pufa in plants
CN113412332A (zh) 用于在植物中产生高水平pufa的改进方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211216

Address after: Australia, Australia, Capital Territory

Patentee after: COMMONWEALTH SCIENTIFIC AND INDUSTRIAL Research Organisation

Patentee after: GRAINS RESEARCH AND DEVELOPMENT Corp.

Patentee after: Newheed nutrition Australia Pty Ltd.

Address before: Australia, Australia, Capital Territory

Patentee before: COMMONWEALTH SCIENTIFIC AND INDUSTRIAL Research Organisation

Patentee before: GRAINS RESEARCH AND DEVELOPMENT Corp.

Patentee before: NUSEED Pty Ltd.