ES2628553T3 - Sistemas de PUFA policétido sintasa y usos de los mismos - Google Patents
Sistemas de PUFA policétido sintasa y usos de los mismos Download PDFInfo
- Publication number
- ES2628553T3 ES2628553T3 ES10178962.6T ES10178962T ES2628553T3 ES 2628553 T3 ES2628553 T3 ES 2628553T3 ES 10178962 T ES10178962 T ES 10178962T ES 2628553 T3 ES2628553 T3 ES 2628553T3
- Authority
- ES
- Spain
- Prior art keywords
- domain
- nucleic acid
- acid sequence
- seq
- pufa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8247—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/04—Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
- A61P15/06—Antiabortive agents; Labour repressants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
- A61P19/10—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/08—Antiepileptics; Anticonvulsants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/18—Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/24—Antidepressants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/06—Antihyperlipidemics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/06—Immunosuppressants, e.g. drugs for graft rejection
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8273—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
- C12P7/625—Polyesters of hydroxy carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6434—Docosahexenoic acids [DHA]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6472—Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Wood Science & Technology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Zoology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Animal Behavior & Ethology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Immunology (AREA)
- Rheumatology (AREA)
- Physical Education & Sports Medicine (AREA)
- Psychiatry (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Pain & Pain Management (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Cell Biology (AREA)
- Cardiology (AREA)
Abstract
Una molécula aislada de ácido nucleico que consiste en una secuencia de ácido nucleico seleccionada entre el grupo que consiste en: a. una secuencia de ácido nucleico que codifica una secuencia de aminoácidos seleccionada entre el grupo que consiste en: SEC ID Nº 30, posiciones 1-450 de SEC ID Nº 6, y fragmentos biológicamente activos de la misma, en la que los fragmentos biológicamente activos muestran una actividad ß-hidroxi acil-ACP deshidrasa (DH) tipo FabA; b. una secuencia de ácido nucleico que codifica una secuencia de aminoácidos que es al menos un 60 % idéntica a dicha secuencia de aminoácidos de (a), en la que dicha secuencia de aminoácidos tiene una actividad ß-hidroxi acil-ACP deshidrasa (DH) tipo FabA; y c. una secuencia de ácido nucleico que es completamente complementaria a la secuencia de ácido nucleico de (a) o (b).
Description
Sistemas de PUFA policétido sintasa y usos de los mismos
Campo de la invención
Esta invención se refiere a sistemas de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS) para microorganismos, incluyendo organismos eucariotas, tales como microorganismos traustoquitridios. Más particularmente, esta invención se refiere a ácido nucleicos que codifican sistemas PUFA PKS no bacterianos, a sistemas PUFA PKS no bacterianos, a organismos genéticamente modificados que comprenden sistemas PUKA PKS no bacterianos, y a métodos para preparar y usar los sistemas PUFA PKS no bacterianos descritos en este documento.
Antecedentes de la invención
Los sistemas de policétido sintasa (PKS) son generalmente conocidos en la técnica como complejos enzimáticos derivados de sistemas de ácido graso sintasa (FAS), pero que a menudo están muy modificados para producir productos especializados que típicamente muestran poco parecido a ácidos grasos. Los investigadores han intentado explotar los sistemas de policétidos sintasa (PKS) que se han descrito en la bibliografía como dentro de uno de tres tipos básicos, típicamente mencionados como: Tipo II, Tipo I y modular. El sistema Tipo II se caracteriza por proteínas separables, cada una de las cuales realiza una reacción enzimática distinta. Las enzimas trabajan en concierto para producir el producto final y cada enzima individual del sistema típicamente participa varias veces en la producción del producto final. Este tipo de sistema funciona de un modo análogo a los sistemas de ácido graso sintasa (FAS) encontrados en plantas y bacterias. Los sistemas PKS Tipo I son similares al sistema Tipo II porque las enzimas se usan de un modo iterativo para producir el producto final. El Tipo I difiere del Tipo II porque las actividades enzimáticas, en lugar de estar asociadas con proteínas separables, existen como dominios de proteínas más grandes. Este sistema es análogo a los sistemas FAS Tipo I encontrados en animales y hongos.
En contraste con los sistemas Tipo I y II, en los sistemas PKS modulares, cada dominio enzimático se usa solamente una vez en la producción del producto final. Los dominios se encuentran en proteínas muy grandes y el producto de cada reacción se pasa a otro dominio en la proteína PKS. Adicionalmente, en todos los sistemas PKS descritos anteriormente, si se incorpora un doble enlace carbono-carbono en el producto final, siempre está en configuración trans.
En los sistemas PKS Tipo I y Tipo II descritos anteriormente, se realiza el mismo conjunto de reacciones en cada ciclo hasta que se obtiene el producto final. No se permite la introducción de reacciones únicas durante el procedimiento biosintético. Los sistemas PKS modulares requieren proteínas grandes que no utilizan la economía de las reacciones iterativas (es decir, se requiere un dominio distinto para cada reacción). Adicionalmente, como se ha indicado anteriormente, se introducen en dobles enlaces carbono-carbono en la configuración trans en todos los sistemas PKS descritos previamente.
Los ácidos grasos poliinsaturados (PUFA) son componentes críticos de los lípidos de membrana en la mayoría de los eucariotas (Lauritzen et al., Prog. Lipid Res. 40 1 (2001); McConn et al., Plant J. 15, 521 (1998)) y son precursores de ciertas hormonas y moléculas de señalización (Heller et al., Drugs 55, 487 (1998); Creelman et al., Annu. Rev. Plant Physiol. Plant Mol. Biol. 48, 355 (1997)). Las rutas conocidas de la síntesis de PUFA implican el procesamiento de ácidos grasos saturados 16:0 o 18:0 (la abreviatura X:Y indica un grupo acilo que contiene X átomos de carbono e Y dobles enlaces cis; las posiciones de doble enlace de los PUFA se indican respecto al carbono de metilo de la cadena de ácido graso (3 u 6) con interrupción de metileno sistemática de los dobles enlaces) derivados de ácido graso sintasa (FAS) por reacciones de elongación y desaturación aeróbica (Sprecher, Curr. Opin. Clin. Nutr. Metab. Care 2,135 (1999); Parker-Barnes et al., Proc. Natl. Acad. Sci. USA 97, 8284 (2000); Shanklin et al., Annu. Rev. Plant Physiol. Plant Nol. Biol. 49, 611 (1998)). Partiendo de acetil-CoA, la síntesis de DHA requiere aproximadamente 30 actividades enzimáticas distintas y casi 70 reacciones incluyendo las cuatro etapas repetitivas del ciclo de síntesis de ácido graso. Las policétido sintasas (PKS) realizan algunas de las mismas reacciones que FAS (Hopwood et al., Annu. Rev. Genet. 24, 37 (1990); Bentley et al., Annu. Rev. Microbiol. 53, 411 (1999)) y usa la misma proteína pequeña (o dominio), proteína transportadora de acilo (ACP), como sitio de unión covalente para el crecimiento de la cadena de carbono. Sin embargo, en estos sistemas enzimáticos, el ciclo completo de reducción, deshidratación y reducción observado en FAS a menudo se abrevia de modo que se produce una cadena de carbono altamente derivatizada, que típicamente contiene muchos grupos ceto e hidroxi así como dobles enlaces carbono-carbono en la configuración trans. Los productos lineales de PKS a menudo se ciclan para formar agentes bioquímicos complejos que incluyen antibióticos y otros muchos productos secundarios (Hopwood et al., (1990) supra; Bentley et al., (1999), supra; Keating et al., Curr. Opin. Chem. Biol. 3, 598 (1999)).
Se han presentado PUFA de cadena muy larga tales como ácido docosahexaenoico (DHA; 22:6ω3) y ácido eicosapentaenoico (EPA; 20:5ω3) de varias especies de bacterias marinas, incluyendo Shewanella sp (Nichols et al., Curr. Op. Biotechnol. 10, 240 (1999); Yazawa, Lipids 31, S (1996); DeLong et al., Appl. Environ. Microbiol. 51, 730 (1986)). El análisis de un fragmento genómico (clonado como plásmido pEPA) de Shewanella sp cepa
SCRC2738 condujo a la identificación de cinco fases de lectura abierta (Orf), que hace un total de 20 Kb, que son necesarias y suficientes para la producción de EPA en E. coli (Yazawa, (1996), supra). Varios de los dominios proteicos predichos eran homólogos de enzimas FAS, mientras que otras regiones no mostraron homología con proteínas de función conocida. En base a estas observaciones y estudios bioquímicos, se sugirió que la síntesis de PUFA en Shewanella implicaba la elongación de ácidos grasos de 16 o 18 carbonos producidos por FAS y la inserción de dobles enlaces por desaturasas aeróbicas indefinidas (Watanabe et al., J. Biochem. 122, 467 (1997)). El reconocimiento de que esta hipótesis era incorrecta comenzó con un reexamen de las secuencias proteicas codificadas por las cinco Orf de Shewanella. Fueron identificables al menos 11 regiones dentro de las cinco Orf como dominios enzimáticos putativos (véase, Metz et al., Science 293:290-293 (2001)). Cuando se comparan con secuencias en las bases de datos de genes, siete de estas estaban más fuertemente relacionadas con proteínas PKS que a proteínas FAS. Incluidos en este grupo estaban los dominios que putativamente codifican malonil-CoA:ACP aciltransferasa (MAT), 3-cetoacil-ACP sintasa (KS), 3-cetoacil-ACP reductasa (KR), aciltransferasa (AT), fosfopanteteína transferasa, factor de longitud de cadena (o inicio de cadena) (CLF) y un grupo muy inusual de seis dominios ACP (es decir, la presencia de más de dos dominios ACP agrupados no se ha presentado previamente en secuencias PKS o FAS). Sin embargo, tres regiones fueron mucho más homólogas a proteínas FAS bacterianas. Una de estas fue similar a la enoil reductasa (ER) resistente a Triclosán recién descrita de Streptococcus pneumoniae (Heath et al., Nature 406, 145 (2000)); una comparación del péptido ORF8 con la enol reductasa de S. pneumoniae usando el programa LALIGN (matriz, BLOSUM50; penalización por abertura de hueca -10; penalización por elongación -1) indicó una similitud del 49 % sobre un solapamiento de 386aa). Dos regiones fueron homólogas de la proteínas FAS de E. coli codificada por fabA, que cataliza la síntesis de trans-2-decenoil-ACP y la isomerización reversible de este producto en cis-3-decenoil-ACP (Heath et al., J. Biol. Chem., 271,27795 (1996)). En esta base, pareció probable que al menos algunos de los dobles enlaces en EPA de Shewanella se introducían por mecanismo de deshidrasa-isomerasa catalizado por dominios tipo FabA en Orf7.
Células de E. coli cultivadas de forma anaeróbica que albergaban el plásmido pEPA acumularon EPA a los mismos niveles que cultivos aeróbicos (Metz et al., 2001, supra), lo que indica que no está implicada una desaturasa dependiente de oxígeno en la síntesis de EPA. Cuando se introdujo pEPA en un mutante fabB-de E. coli, que es incapaz de sintetizar ácidos grasos monosaturados y requiere ácidos grasos insaturados para el crecimiento, las células resultantes perdieron su auxotrofismo de ácidos grasos. También se acumularon niveles mucho mayores de EPA que otras cepas que contienen pEPA, lo que sugiere que EPA compite con ácidos grasos monoinsaturados producidos de forma endógena para la transferencia a glicerolípidos. Cuando se cultivaron células de E. coli que contenían pEPA en presencia de [13C]-acetato, los datos del análisis de 13C-NMR de EPA purificado a partir de las células confirmó la identidad de EPA y proporcionó evidencias de que este ácido graso se sintetizaba a partir de acetil-CoA y malonil-CoA (véase Metz et al., 2001, supra). Un homogeneizado libre de células de células fabB-que contenían pEPA sintetizaba tanto EPA como ácidos grasos saturados a partir de [14C]-malonil-CoA. Cuando se separó el homogeneizado en un sedimento de alta velocidad de 200.000 xg y una fracción sobrenadante sin membrana, la síntesis de ácidos grasos saturados se confinaba al sobrenadante, lo que es coherente con la naturaleza soluble de las enzimas FAS Tipo II (Magnuson et al., Microbiol. Rev. 57, 522 (1993)). Se encontró síntesis de EPA solamente en la fracción sedimentada a alta velocidad, lo que indica que la síntesis de EPA puede suceder sin dependencia de las enzimas de FAS de E. coli o de intermedios solubles (tales como 16:0-ACP) de la fracción citoplasmática. Como las proteínas codificadas por los genes de EPA de Shewanella no son particularmente hidrófobas, la restricción de la actividad de síntesis de EPA a esta fracción puede reflejar una necesidad de molécula aceptora asociada a membrana. Adicionalmente, en contraste con FAS de E. coli, la síntesis de EPA es específicamente dependiente de NADPH y no requiere NADH. Todos estos resultados son coherentes con los genes de pEPA que codifican una PKS multifuncional que actúa independientemente de FAS, elongasa, y actividades desaturasa para sintetizar EPA directamente. Es probable que la ruta de PKS para la síntesis de PUFA que se ha identificado en Shewanella esté propagada en bacterias marinas. Genes con alta homología al grupo génico de Shewanella se han identificado en Photobacterium profundum (Allen et al., Appli. Environ. Microbiol. 65:1710 (1999)) y en Moritella marina (Vibrio marinus) (Tanaka et al., Biotechnol. Lett. 21:939 (1999)).
Los análisis bioquímicos y genéticos moleculares realizados con Shewanella proporcionan evidencias convincentes para policétidos sintasas que son capaces de sintetizar PUFA a partir de malonil-CoA. Se ha propuesto un esquema completo para la síntesis de EPA por la PKS de Shewanella. La identificación de dominios proteicos homólogos a la proteína FabA de E. coli, y la observación de que la síntesis de EPA bacteriana sucede de forma anaeróbica, proporciona evidencias para un mecanismo donde la inserción de dobles enlaces cis sucede a través de la acción de una deshidratasa/2-trans, 3-cis isomerasa bifuncional (DH/2,3I). En E. coli, la condensación del intermedio 3-cis acilo con malonil-ACP requiere una cetoacil-ACP sintasa particular y esto puede proporcionar un fundamento la presencia de dos KS en el grupo génico de Shewanella (en Orf 5 y Orf 7). Sin embargo, el ciclo de PKS prolonga la cadena en incrementos de dos carbonos mientras que los dobles enlaces en el producto EPA suceden cada tres carbonos. Esta disyuntiva puede resolverse si los dobles enlaces en C-14 y C-8 de EPA se generan por isomerización 2-trans, 2-cis (DH/2,2I) seguida por incorporación del doble enlace cis en la cadena de ácido graso en elongación. Se sabe que sucede la conversión enzimática de un doble enlace trans en la configuración cis sin migración del enlace, por ejemplo en la síntesis de 11-cis-retinal en el ciclo retinoide (Jang et al., J. Biol. Chem. 275, 28128 (2000)). Aunque dicha función enzimática no se ha identificado aún en la PKS de Shewanella, puede residir en uno de los dominios proteicos no asignados.
Las rutas de PKS para la síntesis de PUFA en Shewanella y otras bacterias marinas, Vibrio marinus, se describen en detalle en la patente de Estados Unidos n.º 6.140.486 (expedida a partir de la solicitud de Estados Unidos n.º de serie 09/090.793, presentada el 4 de junio, 1998, titulada "Production of Polyunsaturated Fatty Acids by Expression of Polyketide-like Synthesis Genes in Plants", que se incorpora por referencia en este documento en su totalidad).
Los ácidos grasos poliinsaturados (PUFA) se consideran útiles para propósitos nutricionales, farmacéuticos, industriales y otros propósitos. Un suministro expansivo de PUFA a partir de fuentes naturales y de síntesis química no es suficiente para las necesidades comerciales. Como se requieren varias enzimas desaturasa y elongasa diferentes para la síntesis de ácidos grasos a partir de ácido linoleico (LA, 18:2 Δ 9, 12), común en la mayoría de las especies vegetales, en los PUFA de cadena más saturada y más larga, la modificación por ingeniería de células hospedadoras vegetales para la expresión de PUFA tales como EPA y DHA puede requerir la expresión de cinco o seis actividades enzimáticas diferentes para conseguir la expresión, al menos para EPA y DHA. Adicionalmente, para la producción de cantidades utilizables de dichos PUFA, pueden requerirse esfuerzos adicionales de ingeniería, por ejemplo, la regulación negativa de enzimas que compiten por el sustrato, la modificación por ingeniería de actividades enzimáticas superiores tales como por mutagénesis o direccionamiento de enzimas a orgánulos plastidios. Por lo tanto, es de interés obtener material genético implicado en la biosíntesis de PUFA a partir de especies que producen de forma natural estos ácidos grasos y expresan el material aislado solo o en combinación en un sistema heterólogo que puede manipularse para permitir la producción de cantidades comerciales de PUFA.
El descubrimiento de un sistema PUFA PKS en bacterias marinas tales como Shewanella y Vibrio marinus (véase la patente de Estados Unidos n.º 6.140.486, ibid.) proporciona un recurso para nuevos métodos de producción comercial de PUFA. Sin embargo, estas bacterias marinas tienen limitaciones que finalmente restringirán su utilidad a un nivel comercial. En primer lugar, aunque la patente de Estados Unidos n.º 6.140.486 describe que los sistema PUFA PKS de bacterias marinas pueden usarse para modificar genéticamente plantas, las bacterias marinas viven y crecen de forma natural en entornos marinos fríos y los sistemas enzimáticos de estas bacterias no funcionan bien por encima de 30 ºC. En contraste, muchas plantas de cultivo, que son dianas atractivas para manipulación genética usando el sistema PUFA PKS, tienen condiciones de crecimiento normal a temperaturas por encima de 30 ºC que varían hasta más de 40 ºC. Por lo tanto, se predice que el sistema PUFA PKS de bacterias marinas no será fácilmente adaptable a expresión en plantas en condiciones normales de crecimiento. Además, los genes de PUFA PKS de bacterias marinas, que son de una fuente bacteriana, pueden no ser compatibles con los genomas de células hospedadoras eucariotas, o al menos pueden requerir adaptación significativa para funcionar en hospedadores eucariotas. Adicionalmente, los sistemas PUFA PKS de bacterias marinas conocidos no producen directamente triglicéridos, mientras que sería deseable la producción directa de triglicéridos porque los triglicéridos son un producto de almacenamiento de lípidos en microorganismos y como resultado pueden acumularse a niveles muy altos (por ejemplo, hasta el 80-85 % del peso celular) en células microbianas/vegetales (en oposición a un producto lipídico "estructural" (por ejemplo, fosfolípidos) que generalmente pueden acumularse solamente a bajos niveles (por ejemplo, menos del 10-15 % del peso celular como máximo)).
Por lo tanto, existe la necesidad en la técnica de otros sistemas PUFA PKS que tengan mayor flexibilidad para uso comercial.
Sumario de la invención
Una realización de la presente invención se refiere a una molécula aislada de ácido nucleico de la reivindicación 1.
En aspectos alternativos, la secuencia de ácido nucleico codifica una secuencia de aminoácidos que es al menos un 70 % idéntica a una secuencia de aminoácidos seleccionada entre el grupo que consiste en: posiciones 1-450 de SEC ID Nº 6; y SEC ID Nº 30. En una realización preferida, la secuencia de ácido nucleico codifica una secuencia de aminoácidos elegida entre: SEC ID Nº 30; y posiciones 1-450 de SEC ID Nº 6; y/o fragmentos biológicamente activos de las mismas. En un aspecto, la secuencia de ácido nucleico se elige entre: SEC ID Nº 29, y posiciones 1-1350 de SEC ID Nº 5.
Otra realización de la presente invención se refiere a una molécula de ácido nucleico recombinante en forma de un vector que comprende la molécula de ácido nucleico descrita anteriormente, unida de forma funcional a al menos una secuencia de control de la transcripción. En otra realización, la presente invención se refiere a una célula recombinante transfectada con el vector descrito justo anteriormente.
Otra realización más de la presente invención se refiere a un microorganismo genéticamente modificado, donde el microorganismo expresa un sistema PKS que comprende al menos un dominio biológicamente activo de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS). El al menos un dominio del sistema PUFA PKS está codificado por una secuencia de ácido nucleico elegida entre las secuencias de ácido nucleico de la invención.
En esta realización, el microorganismo se modifica genéticamente para que afecte a la actividad del sistema PKS.
En un aspecto, el microorganismo genéticamente modificado es un traustoquitridio, que puede incluir, aunque sin limitación, un traustoquitridio de un género elegido entre Schizochytrium y Thraustochytrium. En otro aspecto, el
microorganismo se ha modificado genéticamente de forma adicional para que exprese de forma recombinante al menos una molécula de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS bacteriano, de un sistema PKS Tipo I, de un sistema PKS Tipo II, y/o de un sistema PKS modular.
En otro aspecto de esta realización, el microorganismo expresa de forma endógena un sistema PUFA PKS que comprende el al menos un dominio biológicamente activo de un sistema PUFA PKS, y donde la modificación genética comprende la expresión de una molécula de ácido nucleico recombinante seleccionada entre el grupo que consiste en una molécula de ácido nucleico recombinante que codifica al menos un dominio biológicamente activo de un segundo sistema PKS y una molécula de ácido nucleico recombinante que codifica una proteína que afecta a la actividad del sistema PUFA PKS. Preferiblemente, la molécula de ácido nucleico recombinante comprende una cualquiera de las secuencias de ácido nucleico descritas anteriormente.
En un aspecto de esta realización, la molécula de ácido nucleico recombinante codifica una fosfopanteteína transferasa. En otro aspecto, la molécula de ácido nucleico recombinante comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS bacteriano, de un sistema PKS Tipo I, de un sistema PKS Tipo II, y/o de un sistema PKS modular.
En otro aspecto de esta realización, el microorganismo se modifica genéticamente por transfección con una molécula de ácido nucleico recombinante que codifica el al menos un domino de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS). Dicha molécula de ácido nucleico recombinante puede incluir cualquier molécula de ácido nucleico recombinante que comprenda cualquiera de las secuencias de ácido nucleico descritas anteriormente. En un aspecto, el microorganismo se ha modificado genéticamente de forma adicional para que exprese de forma recombinante al menos una molécula de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS bacteriano, de un sistema PKS Tipo I, de un sistema PKS Tipo II, o de un sistema PKS modular.
Otra realización más de la presente invención se refiere a una planta genéticamente modificada, donde la planta se ha modificado genéticamente para que exprese de forma recombinante un sistema PKS que comprende al menos un dominio biológicamente activo de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS). El dominio puede estar codificado por cualquiera de las secuencias de ácido nucleico descritas anteriormente. En un aspecto, la planta se ha modificado genéticamente de forma adicional para que exprese de forma recombinante al menos una molécula de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS bacteriano, de un sistema PKS Tipo I, de un sistema PKS Tipo II, y de un sistema PKS modular.
Otra realización más de la presente invención se refiere a un método para producir una molécula bioactiva que se produce por un sistema de policétido sintasa. El método incluye la etapa de cultivar en condiciones eficaces para producir la molécula bioactiva un organismo modificado genéticamente que expresa un sistema PKS que comprende al menos un dominio biológicamente activo de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS).
El dominio del sistema PUFA PKS está codificado por cualquiera de las secuencias de ácido nucleico descrita anteriormente.
En un aspecto de esta realización, el organismo expresa de forma endógena un sistema PKS que comprende el al menos un dominio del sistema PUFA PKS, y la modificación genética está en una secuencia de ácido nucleico que codifica el al menos un dominio de sistema PUFA PKS. Por ejemplo, la modificación genética puede cambiar al menos un producto producido por el sistema PKS endógeno, en comparación con un organismo de tipo silvestre.
En otro aspecto de esta realización, el organismo expresa de forma endógena un sistema PKS que comprende el al menos un dominio biológicamente activo del sistema PUFA PKS, y la modificación genética comprende transfección del organismo con una molécula de ácido nucleico recombinante seleccionada entre el grupo que consiste en: una molécula de ácido nucleico recombinante que codifica al menos un dominio biológicamente activo de un segundo sistema PKS y una molécula de ácido nucleico recombinante que codifica una proteína que afecta a la actividad del sistema PUFA PKS. Por ejemplo, la modificación genética puede cambiar al menos un producto producido por el sistema PKS endógeno, en comparación con un organismo de tipo silvestre.
En otro aspecto más de esta realización, el organismo se modifica genéticamente por transfección con una molécula de ácido nucleico recombinante que codifica el al menos un dominio del sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS). En otro aspecto, el organismo produce un perfil de ácido graso poliinsaturado (PUFA) que difiere del organismo de origen natural sin modificación genética. En otro aspecto, el organismo expresa de forma endógena un sistema PUFA PKS no bacteriano, y donde la modificación genética comprende sustitución de un dominio de un sistema PKS diferente en el lugar de una secuencia de ácido nucleico que codifica al menos un dominio del sistema PUFA PKS no bacteriano.
En otro aspecto más, el organismo expresa de forma endógena un sistema PUFA PKS no bacteriano que se ha modificado transfectando el organismo con una molécula de ácido nucleico recombinante que codifica una proteína
que regula la longitud de cadena de ácidos grasos producidos por el sistema PUFA PKS. Por ejemplo, la molécula de ácido nucleico recombinante que codifica una proteína que regula la longitud de cadena de ácidos grasos puede remplazar una secuencia de ácido nucleico que codifica un factor de longitud de cadena en el sistema PUFA PKS no bacteriano. En otro aspecto, la proteína que regula la longitud de cadena de los ácidos grasos producidos por el sistema PUFA PKS es un factor de longitud de cadena. En otro aspecto, la proteína que regula la longitud de cadena de los ácidos grasos producidos por el sistema PUFA PKS es un factor de longitud de cadena que dirige la síntesis de unidades C20.
En un aspecto, el organismo expresa un sistema PUFA PKS no bacteriano que comprende una modificación genética en un dominio elegido entre: un dominio que codifica dominio β-hidroxi acil ACP deshidrasa (DH) tipo FabA y un dominio que codifica β-ceto acil ACP sintasa (KS), donde la modificación altera la relación de ácidos grasos de cadena larga producidos por el sistema PUFA PKS en comparación con la ausencia de la modificación. En un aspecto, la modificación comprende sustituir un dominio DH que no posee actividad de isomerización por una βhidroxi acil ACP deshidrasa (DH) tipo FabA en el sistema PUFA PKS no bacteriano. En otro aspecto, la modificación se selecciona entre el grupo que consiste en una deleción de todo o parte del dominio, una sustitución de un dominio homólogo de un organismo diferente para el dominio, y una mutación del dominio.
En otro aspecto, el organismo expresa un sistema PKS y la modificación genética comprende sustituir un dominio de β-hidroxi acil ACP deshidrasa (DH) tipo FabA de un sistema PUFA PKS para un dominio DH que no posee actividad de isomerización.
En otro aspecto, el organismo expresa un sistema PUFA PKS no bacteriano que comprende una modificación en un dominio de enoil ACP reductasa (ER), donde la modificación provoca la producción de un compuesto diferente en comparación con la ausencia de la modificación. Por ejemplo, la modificación puede seleccionarse entre el grupo que consiste en una deleción de todo o parte del dominio ER, una sustitución de un dominio ER de un organismo diferente por el dominio ER, y una mutación del dominio ER.
En un aspecto, la molécula bioactiva producida por el presente método puede incluir, aunque sin limitación, una formulación antiinflamatoria, un agente quimioterapéutico, un excipiente activo, un fármaco para osteoporosis, un antidepresivo, un anticonvulsivo, un fármaco anti-Helicobacter pylori, un fármaco para el tratamiento de enfermedad neurodegenerativa, un fármaco para el tratamiento de enfermedad hepática degenerativa, un antibiótico, y una formulación para disminuir el colesterol. En un aspecto, la molécula bioactiva es un ácido graso poliinsaturado (PUFA). En otro aspecto, la molécula bioactiva es una molécula que incluye dobles enlaces carbono-carbono en la configuración cis. En otro aspecto, la molécula bioactiva es una molécula que incluye un doble enlace cada tres carbonos.
En un aspecto de esta realización, el organismo es un microorganismo, y en otro aspecto, el organismo es una planta.
Otra realización de la presente invención se refiere a un método para producir una planta que tiene un perfil de ácido graso poliinsaturado (PUFA) que difiere de la planta de origen natural, que comprende modificar genéticamente células de la planta para que expresen un sistema PKS que comprende al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS. El dominio del sistema PUFA PKS está codificado por cualquiera de las secuencias de ácido nucleico descritas anteriormente.
Otra realización más de la presente invención se refiere a un método para producir leche animal humanizada, que comprende modificar genéticamente células productoras de leche de un animal no humano productor de leche con al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS. El dominio del sistema PUFA PKS está codificado por cualquiera de las secuencias de ácido nucleico descritas anteriormente.
Otra realización más de la presente invención se refiere a un método para producir un microbio recombinante, que comprende modificar genéticamente células microbianas para expresar al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS. El dominio del sistema PUFA PKS está codificado por cualquiera de las secuencias de ácido nucleico descritas anteriormente.
Otra realización más de la presente invención se refiere a una célula hospedadora recombinante que se ha modificado para que exprese un sistema de ácido grado poliinsaturado (PUFA) policétido sintasa (PKS), donde la PKS cataliza reacciones enzimáticas tanto iterativas como no iterativas. El sistema PUFA PKS comprende: (a) al menos dos dominios enoil ACP reductasa (ER); (b) al menos seis dominios de proteína de transporte de acilo (ACP);
(c) al menos dos dominios β-ceto acil ACP sintasa (KS); (d) al menos un dominio acil transferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP acil transferasa (MAT). En un aspecto, el sistema PUFA PKS es un sistema PUFA PKS eucariota. En otro aspecto, el
sistema PUFA PKS es un sistema PUFA PKS de algas, y preferiblemente un sistema PUFA PKS de Traustoquitriales, que puede incluir, aunque sin limitación, un sistema PUFA PKS de Schizochytrium o un sistema PUFA PKS de Thraustochytrium.
En esta realización, el sistema PUFA PKS puede expresarse en una célula hospedadora procariota o en una célula hospedadora eucariota. En un aspecto, la célula hospedadora es una célula vegetal. Por consiguiente, una realización de la invención es un método para producir un producto que contiene al menos un PUFA, que comprende cultivar una planta que comprende dicha célula vegetal en condiciones eficaces para producir el producto. La célula hospedadora es una célula microbiana y en este caso, una realización de la presente invención es un método para producir un producto que contiene al menos un PUFA, que comprende cultivar un cultivo que contiene dicha célula microbiana en condiciones eficaces para producir el producto. En un aspecto, el sistema PKS cataliza la producción directa de triglicéridos.
Otra realización más de la presente invención se refiere a un microorganismo modificado genéticamente que comprende un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS), donde la PKS cataliza reacciones enzimáticas tanto iterativas como no iterativas. El sistema PUFA PKS comprende: (a) al menos dos dominios enoil ACP reductasa (ER); (b) al menos seis dominios de proteína de transporte de acilo (ACP); (c) al menos dos dominios β-ceto acil ACP sintasa (KS); (d) al menos un dominio acil transferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP acil transferasa (MAT). La modificación genética afecta a la actividad del sistema PUFA PKS. En un aspecto de esta realización, el microorganismo es un microorganismo eucariota.
Otra realización más de la presente invención se refiere a una célula hospedadora recombinante que se ha modificado para que exprese un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS) no bacteriano, donde la PUFA PKS no bacteriana cataliza reacciones enzimáticas tanto iterativas como no iterativas. El sistema PUFA PKS no bacteriano comprende: (a) al menos un dominio enoil ACP reductasa (ER); (b) múltiples dominios de proteína de transporte de acilo (ACP); (c) al menos dos dominios β-ceto acil ACP sintasa (KS); (d) al menos un dominio acil transferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios βhidroxi acil ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP acil transferasa (MAT).
Breve descripción de las figuras
La Fig. 1 es una representación gráfica de la estructura de dominios del sistema PUFA PKS de Schizochytrium.
La Fig. 2 muestra una comparación de dominios PKS de Schizochytrium y Shewanella.
La Fig. 3 muestra una comparación de dominios PKS de Schizochytrium y un sistema PKS relacionado de Nostoc cuyo producto es un ácido graso de cadena larga que no contiene ningún doble enlace.
Descripción detallada de la invención
La presente invención se refiere en líneas generales a sistemas de ácido grado poliinsaturado (PUFA) policétido sintasa (PKS) derivados no bacterianos, a organismos modificados genéticamente que comprenden sistemas PUFA PKS no bacterianos, a métodos para preparar y usar dichos sistemas para la producción de productos de interés, incluyendo moléculas bioactivas, y a nuevos métodos para identificar nuevos microorganismos eucariotas que tengan dicho sistema PUFA PKS. Como se usa en este documento, un sistema PUFA PKS generalmente tiene las siguientes características de identificación: (1) produce PUFA como producto natural del sistema; y (2) comprende varias proteínas multifuncionales ensambladas en un complejo que realiza procesamiento tanto iterativo de la cadena de ácido graso así como proceso no iterativo, incluyendo isomerización trans-cis y reacciones de reducción de enoilo en ciclos seleccionados (véase la Fig. 1, por ejemplo).
Más específicamente, en primer lugar, un sistema PUFA PKS que forma la base de esta invención produce ácidos grasos poliinsaturados (PUFA) como productos (es decir, un organismo que contiene de forma endógena (de forma natural) dicho sistema PKS produce PUFA usando este sistema). Los PUFA mencionados en este documento son preferiblemente ácidos grasos poliinsaturados con una longitud de cadena de carbono de al menos 16 carbonos, y más preferiblemente al menos 18 carbonos, y más preferiblemente al menos 20 carbonos, y más preferiblemente 22
o más carbonos, con al menos 3 o más dobles enlaces, y preferiblemente 4 o más, y más preferiblemente 5 o más, e incluso más preferiblemente 6 o más dobles enlaces, donde todos los dobles enlaces están en configuración cis. Un objeto de la presente invención es encontrar o crear mediante manipulación genética o manipulación del producto final, sistemas PKS que produzcan ácidos grasos poliinsaturados de longitud de cadena deseada y con cantidades deseadas de dobles enlaces. Ejemplos de PUFA incluyen, aunque sin limitación, DHA (ácido docosahexaenoico (C22:6, ω-3)), DPA (ácido docosapentaenoico (C22:5, ω-6)), y EPA (ácido eicosapentaenoico (C20:5, ω-3)).
En segundo lugar el sistema PUFA PKS descrito en este documento incorpora reacciones tanto iterativas como no iterativas, que distinguen el sistema de los sistemas PKS descritos previamente (por ejemplo, tipo I, tipo II o modular). Más particularmente, el sistema PUFA PKS descrito en este documento contiene dominios que parecen funcionar durante cada ciclo así como aquellos que parecen funcionar durante solamente algunos de los ciclos. Un aspecto clave de esto puede estar relacionado con los dominios que muestran homología con las enzimas FabA bacterianas. Por ejemplo, la enzima FabA de E. coli ha demostrado poseer dos actividades enzimáticas. Posee una actividad de deshidratación en que se extrae una molécula de agua (H2O) de una cadena de carbono que contiene un grupo hidroxi, dejando un doble enlace trans en esa cadena de carbono. Además, tiene una actividad isomerasa en que el doble enlace trans se convierte en la configuración cis. Esta isomerización se consigue junto con una migración de la posición del doble enlace a carbonos adyacentes. En sistemas PKS (y FAS), la cadena principal de carbono se prolonga en incrementos de dos carbonos. Por lo tanto, se puede predecir la cantidad de reacciones de extensión necesarias para producir los productos PUFA de estos sistemas PKS. Por ejemplo, para producir DHA (C22:6, todo cis) se requieren 10 reacciones de extensión. Como existen solamente 6 dobles enlaces en el producto final, significa que durante algunos de los ciclos de reacción, se retiene doble enlace (como isómero cis), y en otros, el doble enlace se reduce antes de la siguiente extensión.
Antes del descubrimiento de un sistema PUFA PKS en bacterias marinas (véase la patente de Estados Unidos n.º 6.140.486), no se sabía que los sistemas PKS poseían esta combinación de reacciones enzimáticas iterativas y selectivas, y no se creía que fueran capaces de producir dobles enlaces carbono-carbono en configuración cis. Sin embargo, el sistema PUFA PKS descrito por la presente invención tiene la capacidad de introducir dobles enlaces cis y la capacidad de variar la secuencia de reacción en el ciclo.
Por lo tanto, los presentes inventores proponen usar estas características del sistema PUFA PKS para producir un intervalo de moléculas bioactivas que no podían producirse por los sistemas PKS descritos previamente (Tipo II y Tipo I y modular). Estas moléculas bioactivas incluyen, aunque sin limitación, ácidos grasos poliinsaturados (PUFA), antibióticos u otros compuestos bioactivos, muchos de los cuales se analizarán a continuación. Por ejemplo, usando el conocimiento de las estructuras génicas de PUFA PKS descritas en este documento, puede usarse cualquiera de varios métodos para alterar los genes de PUFA PKS, o combinar partes de estos genes con otros sistemas de síntesis, incluyendo otros sistemas PKS, de modo que se produzcan nuevos productos. La capacidad inherente de este tipo particular de sistema para hacer reacciones tanto iterativas como selectivas posibilitará que este sistema produzca productos que no se encontrarían si se aplicaran métodos similares a otros tipos de sistemas PKS.
En una realización, un sistema PUFA PKS de acuerdo con la presente invención comprende al menos los siguientes dominios biológicamente activos: (a) al menos dos dominios enoil ACP reductasa (ER); (b) al menos seis dominios de proteína de transporte de acilo (ACP); (c) al menos dos dominios β-ceto acil ACP sintasa (KS); (d) al menos un dominio acil transferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP acil transferasa (MAT). Las funciones de estos dominios generalmente son conocidas de forma individual en la técnica y se describirán en detalle a continuación con respecto al sistema PUFA PKS de la presente invención.
En otra realización, el sistema PUFA PKS comprende al menos los siguientes dominios biológicamente activos: (a) al menos un dominio enoil ACP reductasa (ER); (b) múltiples dominios de proteína de transporte de acilo (ACP) (al menos cuatro, y preferiblemente al menos cinco, y más preferiblemente al menos seis, incluso más preferiblemente siete, ocho, nueve o más de nueve); (c) al menos dos dominios β-ceto acil ACP sintasa (KS); (d) al menos un dominio acil transferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP acil transferasa (MAT). Preferiblemente, dicho sistema PUFA PKS es un sistema PUFA PKS no bacteriano.
En una realización, un sistema PUFA PKS de la presente invención es un sistema PUFA PKS no bacteriano. En otras palabras, en una realización, el sistema PUFA PKS de la presente invención se aísla de un organismo que no es una bacteria, o es un homólogo de o deriva de un sistema PUFA PKS de un organismo que no es una bacteria, tal como un eucariota o una arqueobacteria. Los eucariotas se separan de los procariotas en base al grado de diferenciación de las células. El grupo superior con más diferenciación se llama eucariótico. El grupo inferior con menos células diferenciadas se llama procariótico. En general, los procariotas no poseen una membrana nuclear como no muestran mitosis durante la división celular, tienen solamente un cromosoma, su citoplasma contiene ribosomas 70S, no poseen ninguna mitocondria, retículo endoplasmático, cloroplastos, lisosomas o aparato de golgi, sus flagelos (si están presentes) consisten en una única fibrilla. En contraste, los eucariotas tienen una membrana nuclear, muestran mitosis durante la división celular, tienen muchos cromosomas, su citoplasma contiene ribosomas 80S, poseen mitocondrias, retículo endoplasmático, cloroplastos (en algas), lisosomas y aparato de golgi, y sus flagelos (si están presentes) consisten en muchas fibrillas. En general, las bacterias son procariotas, mientras que las algas, hongos, protistas, protozoos y plantas superiores son eucariotas. Los sistemas PUFA PKS de las bacterias marinas (por ejemplo, Shewanella y Vibrio marinus) no son la base de la presente invención, aunque la presente invención contempla el uso de dominios de estos sistemas PUFA PKS bacterianos junto con dominios de los sistemas PUFA PKS no bacterianos de la presente invención. Por ejemplo, de acuerdo con la presente
invención, pueden producirse organismos modificados genéticamente que incorporan dominios funcionales de PUFA PKS no bacterianos con dominios funcionales de PUFA PKS bacterianos, así como dominios funcionales de PKS o proteínas de otros sistemas PKS (tipo I, tipo II, modular) o sistemas FAS.
Schizochytrium es un microorganismo marino traustoquitridio que acumula grandes cantidades de triacilgliceroles ricos en DHA y ácido docosapentaenoico (DPA; 22:5 ω-6); por ejemplo, 30 % DHA + DPA en peso seco (Barclay et al., J. Appl. Phycol. 6, 123 (1994)). En eucariotas que sintetizan PUFA de 20 y 22 carbonos mediante una ruta de elongación/desaturación, las combinaciones de intermedios de 18, 20 y 22 carbonos son relativamente grandes de modo que experimentos de marcaje in vivo usando [14C]-acetato revelan una clara cinética de precursor-producto para los intermedios predichos (Gellerman et al., Biochim. Biophys. Acta 573:23 (1979)). Además, los intermedios radiomarcados proporcionados de forma exógena a dichos organismos se convierten en los productos PUFA finales. Los presentes inventores han demostrado que [-14C]-acetato se captaba rápidamente por células de Schizochytrium y se incorporaba en ácidos grasos, pero en el tiempo de marcaje más corto (1 min), DHA contenía un 31 % del marcador recuperado en ácidos grasos, y este porcentaje permanecía esencialmente inalterado durante los 10-15 min de incorporación de [14C]-acetato y las posteriores 24 horas de crecimiento en cultivo (véase el Ejemplo 3). Asimismo, DPA representaba el 10 % del marcador en todo el experimento. No existen evidencias de una relación precursor-producto entre ácidos grasos de 16 o 18 carbonos y los ácidos grasos poliinsaturados de 22 carbonos. Estos resultados son coherentes con la rápida síntesis de DHA a partir de [14C]-acetato que implica combinaciones muy pequeñas (posiblemente unidas a enzima) de intermedios. Un homogeneizado libre de células derivado de cultivos de Schizochytrium incorporaba [1-14C]-malonil-CoA en DHA, DPA, y ácidos grasos saturados. Se retuvieron las mismas actividades biosintéticas por una fracción sobrenadante de 100.000 xg pero no estaban presentes en el sedimento de membrana. Por tanto, la síntesis de DHA y DPA en Schizochytrium no implica desaturasas unidas a membrana o enzimas de elongación de ácidos grasos como los descritos para otros eucariotas (Parker-Barnes et al., 2000, supra; Shanklin et al., 1998, supra). Estos datos de fraccionamiento contrastan con los obtenidos de las enzimas de Shewanella (véase Metz et al., 2001, supra) y pueden indicar el uso de una molécula aceptora de acilo diferente (soluble), tal como CoA, por la enzima de Schizochytrium.
En la solicitud de Estados Unidos n.º de serie 09/231.899 (patente de Estados Unidos n.º 6.566.583) en trámite junto con la presente, se construye una biblioteca de ADNc a partir de Schizochytrium y se secuenciaron aproximadamente 8.000 clones aleatorios (EST). Dentro de este conjunto de datos, solamente un gen expresado moderadamente (0,3 % de todas las secuencias) se identificó como ácido graso desaturasa, aunque una segunda desaturasa putativa estaba representada por un único clon (0,01 %). Por el contrario, secuencias que mostraban homología a 8 de los 11 dominios de los genes PKS de Shewanella mostrados en la Fig. 2 se identificaron todos a frecuencias de 0,2-0,5 %. En la solicitud de Estados Unidos n.º de serie 09/231.899, se secuenciaron varios clones de ADNc que mostraban homología con los genes PKS de Shewanella, y se ensamblaron diversos clones en secuencias de ácido nucleico que representaban dos fases parciales de lectura abierta y una fase completa de lectura abierta. Los nucleótidos 390-4443 de la secuencia de ADNc que contenía la primera fase parcial de lectura abierta descrita en la solicitud de Estados Unidos n.º de serie 09/231.899 (indicada en la misma como SEC ID Nº 69) coincide con los nucleótidos 4677-8730 (más el codón de parada) de la secuencia indicada en este documento como OrfA (SEC ID Nº 1). Los nucleótidos 1-4876 de la secuencia de ADNc que contenía la segunda fase parcial de lectura abierta descrita en la solicitud de Estados Unidos n.º de serie 09/231.899 (indicada en la misma como SEC ID Nº 71) coincide con los nucleótidos 1311-6177 (más el codón de parada) de la secuencia indicada en este documento como OrfB (SEC ID Nº 3). Los nucleótidos 145-4653 de la secuencia de ADNc que contiene la fase completa de lectura abierta descrita en la solicitud de Estados Unidos n.º de serie 09/231.899 (indicada en la misma como SEC ID Nº 76 y denominada incorrectamente como fase parcial de lectura abierta) coincide con la secuencia completa (más el codón de parada) de la secuencia indicada en este documento como OrfC (SEC ID Nº 5).
La secuenciación adicional de clones de ADNc y genómicos por los presentes inventores permitió la identificación de la secuencia genómica de longitud completa de cada uno de OrfA, OrfB y OrfC y la identificación completa de los dominios con homología a aquellos en Shewanella (véase la Fig. 2). Se indica que en Schizochytrium, el ADN genómico y el ADNc son idénticos, debido a la ausencia de intrones en el genoma del organismo, según el conocimiento de los presentes inventores. Por lo tanto, una referencia a una secuencia de nucleótidos de Schizochytrium puede referirse a ADN genómico o ADNc. En base a la comparación de los dominios PKS de Schizochytrium con Shewanella, claramente, el genoma de Schizochytrium codifica proteínas que son muy similares a las proteínas en Shewanella que son capaces de catalizar la síntesis de EPA. Las proteínas en Schizochytrium constituyen un sistema PUFA PKS que cataliza la síntesis de DHA y DPA. Como se analiza en detalle en este documento, una modificación simple del esquema de reacción identificado para Shewanella permitirá la síntesis de DHA en Schizochytrium. La homología entre los genes procariotas de Shewanella y eucariotas de Schizochytrium sugiere que la PUFA PKS ha experimentado transferencia génica lateral.
La Fig. 1 es una representación gráfica de las tres fases de lectura abierta del sistema PUFA PKS de Schizochytrium, e incluye la estructura de dominios de este sistema PUFA PKS. Como se describe en el Ejemplo 1 a continuación, la estructura de dominios de cada fase de lectura abierta es la siguiente:
Fase de lectura abierta A (OrfA):
La secuencia completa de nucleótidos para OrfA está representada en este documento como SEC ID Nº 1. Los nucleótidos 4677-8730 de la SEC ID Nº 1 corresponden a los nucleótidos 390-4443 de la secuencia indicada como SEC ID Nº 69 en la solicitud de Estados Unidos n.º de serie 09/231.899. Por lo tanto, los nucleótidos 1-4676 de la SEC ID Nº 1 representan secuencia adicional que no se había descrito en la solicitud de Estados Unidos n.º de serie 09/231.899. Esta nueva región de la SEC ID Nº 1 codifica los siguientes dominios en OrfA: (1) El domino OrfA-KS;
(2) el dominio OrfA-MAT; y (3) al menos una parte de la región del dominio ACP (por ejemplo, al menos los dominios ACP 1-4). Se indica que los nucleótidos 1-389 de la SEC ID Nº 69 en la solicitud de Estados Unidos n.º de serie 09/231.899 no coinciden con los 389 nucleótidos que están cadena arriba de la posición 4677 en la SEC ID Nº 1 descrita en este documento. Por lo tanto, las posiciones 1-389 de la SEC ID Nº 69 en la solicitud de Estados Unidos n.º de serie 09/231.899 parecen estar colocados incorrectamente cerca de os nucleótidos 390-4443 de esa secuencia. La mayoría de estos primeros 389 nucleótidos (aproximadamente las posiciones 60-389) son coincidentes con una parte cadena arriba de OrfA (SEC ID Nº 1) de la presente invención y por lo tanto, se cree que sucedió un error en el esfuerzo por preparar el contig de las construcciones de ADNc en la solicitud de Estados Unidos n.º de serie 09/231.899. La región en la cual sucedió el error de alineación en la solicitud de Estados Unidos n.º de serie 09/231.899 está dentro de la región de secuencia altamente repetitiva (es decir, la región ACP, analizada a continuación), que probablemente creó alguna confusión en el ensamble de esa secuencia a partir de diversos clones de ADNc.
OrfA es una secuencia de 8730 nucleótidos (sin incluir el codón de parada) que codifica una secuencia de 2910 aminoácidos, representada en este documento como SEC ID Nº 2. Dentro de la OrfA hay doce dominios: (a) un dominio β-ceto acil ACP sintasa (KS); (b) un dominio malonil-CoA:ACP acil transferasa (MAT); (c) nueve dominios de proteína de transporte de acilo (ACP); y (d) un dominio cetorreductasa (KR).
La secuencia de nucleótidos para OrfA se ha depositado en GenBank como el n.º de acceso AF378327 (secuencia de aminoácidos con n.º de acceso AAK728879). Se comparó OrfA con secuencias conocidas en una búsqueda convencional BLAST (búsqueda de homología BLAST en BLAST 2.0 Basic usando blastp para búsquedas de aminoácidos, blastn para búsqueda de ácido nucleico, y BlastX para búsquedas de ácido nucleico y búsquedas de la secuencia traducida de aminoácidos en las 6 fases de lectura abierta con parámetros normales por defecto, donde la secuencia de consulta se filtra para regiones de baja complejidad por defecto (descrito en Altschul, S.F., Madden, T.L., Schääffer, A.A., Zhang, J., Zhang, Z., Miller, W. y Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389-3402, incorporado por referencia en este documento en su totalidad).
A nivel de ácido nucleico OrfA no tiene homología significativa con ninguna secuencia conocida de nucleótidos. A nivel de aminoácidos, las secuencias con el mayor grado de homología a OrfA fueron: glucolípidos sintasa de heterocistos de Nostoc sp. 7120 (n.º de acceso NC_003272), que era un 42 % idéntico a OrfA sobre 1001 restos de aminoácido; y Orf8 de Moritella marinus (Vibrio marinus) (n.º de acceso AB025342), que era un 40 % idéntica a OrfA sobre 993 restos de aminoácido.
El primer dominio en OrfA es un dominio KS, también mencionado en este documento como OrfA-KS. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde el punto de inicio entre aproximadamente las posiciones 1 y 40 de la SEC ID Nº 1 (OrfA) hasta un punto final entre aproximadamente las posiciones 1428 y 1500 de la SEC ID Nº 1. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio OrfA-KS está representada en este documento como SEC ID Nº 7 (posiciones 1-1500 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el dominio KS abarca desde el punto de inicio entre aproximadamente las posiciones 1 y 14 de la SEC ID Nº 2 (OrfA) hasta un punto final entre aproximadamente las posiciones 476 y 500 de la SEC ID Nº
2. La secuencia de aminoácidos que contiene el dominio OrfA-KS está representada en este documento como la SEC ID Nº 8 (posiciones 1-500 de la SEC ID Nº 2). Se aprecia que el dominio OrfA-KS contiene un motivo de sitio activo: DXAC* (*C215 del sitio de unión a acilo).
Un dominio o proteína que tenga actividad biológica (función) 3-ceto acil ACP sintasa (KS) se caracteriza como la enzima que realiza la etapa inicial del ciclo de reacción de elongación de FAS (y PKS). El grupo acilo destinado para elongación se une a un resto de cisteína en el sitio activo de la enzima por un enlace tio-éster. En la reacción de múltiples etapas, la acil-enzima experimenta condensación con malonil ACP para formar ceto acil ACP, CO2 y enzima libre. La KS desempeña un papel clave en el ciclo de elongación y en muchos sistemas ha demostrado poseer mayor especificidad de sustrato que otras enzimas del ciclo de reacción. Por ejemplo, E. coli tiene tres enzimas KS distintas-cada una con su propio papel particular en la fisiología del organismo (Magnuson et al., Microbiol. Rev. 57, 522 (1993)). Los dos dominios KS del sistema PUFA PKS podrían tener distintos papeles en la secuencia de reacción biosintética de PUFA.
Como una clase de enzimas, las KS se han caracterizado bien. Se conocen las secuencias de muchos genes KS verificados, se han identificado los motivos de sitio activo y se han determinado las estructuras cristalinas de varios. Las proteínas (o dominios de proteínas) pueden identificarse fácilmente como pertenecientes a la familia KS de enzimas por homología a secuencias KS conocidas.
El segundo dominio en OrfA es un dominio MAT, también mencionado en este documento como OrfA-MAT. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1723 y 1798 de la SEC ID Nº 1 (OrfA) hasta un punto final entre aproximadamente las posiciones 2805 y 3000 de la SEC ID Nº 1. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio OrfA-MAT está representada en este documento como SEC ID Nº 9 (posiciones 1723-3000 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el dominio MAT abarca desde un punto de inicio entre aproximadamente las posiciones 575 y 600 de la SEC ID Nº 2 (OrfA) hasta un punto final entre aproximadamente las posiciones 935 y 1000 de la SEC ID Nº 2. La secuencia de aminoácidos que contiene el dominio OrfA-MAT está representada en este documento como SEC ID Nº 10 (posiciones 575-1000 de la SEC ID Nº 2). Se aprecia que el dominio OrfA-MAT contiene un motivo de sitio activo: GHS*XG (*S706 del sitio de unión a acilo), representado en este documento como SEC ID Nº 11.
Un dominio o proteína que tiene actividad biológica (función) malonil-CoA:ACP acil transferasa (MAT) se caracteriza como una que transfiere el resto malonilo desde malonil-CoA a ACP. Además del motivo de sitio activo (GxSxG), estas enzimas poseen un motivo prolongado (aminoácidos R y Q en posiciones clave) que las identifica como enzimas MAT (en contraste con el dominio AT de OrfB de Schizochytrium). En algunos sistemas PKS (pero no el dominio PUFA PKS) lo dominios MAT preferentemente cargarán metil o etil malonato en el grupo ACP (a partir del éster de CoA correspondiente), introduciendo de ese modo ramificaciones en la cadena lineal de carbono. Los dominios MAT pueden reconocerse por su homología a secuencias MAT conocidas y por su estructura de motivo prolongado.
Los dominios 3-11 de OrfA son nueve dominios ACP en tándem, también mencionados en este documento OrfA-ACP (el primer dominio en la secuencia es OrfA-ACP 1, el segundo dominio es OrfA-ACP 2, el tercer dominio es OrfA-ACP 3, etc.). El primer dominio ACP, OrfA-ACP 1, está contenido dentro de la secuencia de nucleótidos que abarca desde aproximadamente la posición 3343 a aproximadamente la posición 3600 de la SEC ID Nº 1 (OrfA). La secuencia de nucleótidos que contiene la secuencia que codifica el dominio OrfA-ACP 1 está representada en este documento como SEC ID Nº 12 (posiciones 3343-3600 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el primer dominio ACP abarca desde aproximadamente la posición 1115 a aproximadamente la posición 1200 de la SEC ID Nº 2. La secuencia de aminoácidos que contiene el dominio OrfA-ACP 1 está representada en este documento como SEC ID Nº 13 (posiciones 1115-1200 de la SEC ID Nº 2). Se aprecia que el dominio OrfA-ACP 1 contiene un motivo de sitio activo: LGIDS* (*S1157 del motivo de unión a panteteína), representado en este documento por la SEC ID Nº 14.
Las secuencias de nucleótidos y aminoácidos de los nueve dominios ACP están altamente conservadas y por lo tanto, la secuencia para cada dominio no está representada no este documento por un identificador de secuencia individual. Sin embargo, en base a la información descrita en este documento, un experto en la materia puede determinar fácilmente la secuencia que contiene cada uno de los otros ocho dominios ACP (véase el análisis a continuación).
Los nueve dominios ACP juntos abarcan una región de OrfA desde aproximadamente la posición 3283 hasta aproximadamente la posición 6388 de la SEC ID Nº 1, que corresponde a las posiciones de aminoácido de aproximadamente 1095 a aproximadamente 2096 de la SEC ID Nº 2. La secuencia de nucleótidos para la región ACP completa que contiene los nueve dominios está representada en este documento como SEC ID Nº 16. La región representada por la SEC ID Nº 16 incluye los segmentos enlazadores entre dominios ACP individuales. El intervalo repetitivo para los nueve dominios está aproximadamente cada 330 nucleótidos de la SEC ID Nº 16 (el número real de aminoácidos medido entre serinas de sitios activos adyacentes varía de 104 a 116 aminoácidos). Cada uno de los nueve dominios ACP contiene un motivo de unión a panteteína LGIDS* (representado en este documento por la SEC ID Nº 14), donde S* es la serina (S) del sitio de unión a panteteína. La serina (S) del sitio de unión a panteteína está localizada cerca del centro de cada secuencia de dominio ACP. En cada extremo de la región de dominio ACP y entre cada dominio ACP hay región que está muy enriquecida en prolina (P) y alanina (A), que se cree que es una región enlazadora. Por ejemplo, entre los dominios ACP 1 y 2 está la secuencia: APAPVKAAAPAAPVASAPAPA, representada en este documento como SEC ID Nº 15. Las localizaciones de los restos de serina del sitio activo (es decir, el sitio de unión a panteteína) para cada uno de los nueve dominios ACP, con respecto a la secuencia de aminoácidos de la SEC ID Nº 2, son las siguientes: ACP1 = S1157; ACP2 = S1266; ACP3 = S1377; ACP4 = S1488; ACP5 = S1604; ACP6 = S1715; ACP7 = S1819; ACP8 = S1930; y ACP9 = S2034. Dado que el tamaño promedio de un dominio ACP es de aproximadamente de 85 aminoácidos, excluyendo el enlazador, y de aproximadamente 110 aminoácidos incluyendo el enlazador, estando la serina del sitio activo aproximadamente en el centro del dominio, un experto en la materia puede determinar fácilmente las posiciones de cada uno de los nueve dominios ACP en OrfA.
Un dominio o proteína que tiene actividad biológica (función) de proteína de transporte de acilo (ACP) se caracteriza como polipéptidos pequeños (típicamente, de 80 a 100 aminoácidos de longitud), que funciona como transportadores para cadenas de acilo graso en crecimiento mediante un enlace tio-éster a un co-factor unido covalentemente de la proteína. Existen como unidades separadas o como dominios dentro de proteínas más grandes. Las ACP se convierten desde apo-formas inactivas en holo-formas funcionales por transferencia del resto fosfopanteteinilo de CoA a un resto de serina altamente conservado de la ACP. Los grupos acilo se unen a ACP
mediante un enlace tio-éster en el extremo libre del resto fosfopanteteinilo. Las ACP pueden identificarse por marcaje con panteteína radiactiva y por homología de secuencia con ACP conocidas. La presencia de variaciones del motivo mencionado anterior (LGIDS*) también es un distintivo de una ACP.
El dominio 12 en OrfA es un dominio KR, también mencionado en este documento como OrfA-KR. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio de aproximadamente la posición 6598 de la SEC ID Nº 1 hasta un punto final de aproximadamente la posición 8730 de la SEC ID Nº 1. La secuencia de nucleótidos que contienen la secuencia que codifica el dominio OrfA-KR está representada en este documente como SEC ID Nº 17 (posiciones 6598-8730 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el dominio KR abarca desde el punto de inicio de aproximadamente la posición 2200 de la SEC ID Nº 2 (OrfA) hasta un punto final de aproximadamente la posición 2910 de la SEC ID Nº 2. La secuencia de aminoácidos que contiene el dominio OrfA-KR está representada en este documento como SEC ID Nº 18 (posiciones 2200-2910 de la SEC ID Nº 2). Dentro del dominio KR hay una región central con homología aldehído de cadena cortadeshidrogenasas. (KR es un miembro de esta familia). Esta región central abarca desde aproximadamente la posición 7198 hasta aproximadamente la posición 7500 de la SEC ID Nº 1, que corresponde con las posiciones de aminoácido 2400-2500 de la SEC ID Nº 2.
Un dominio o proteína que tiene actividad cetorreductasa, también mencionada como actividad biológica (función) 3ceto acil ACP reductasa (KR), se caracteriza como una que cataliza la reducción dependiente de nucleótido piridina de formas 3-ceto acilo de ACP. Es la primera etapa reductora en el ciclo de elongación de biosíntesis de ácidos grasos de novo y una reacción a menudo realizada en biosíntesis de policétidos. Se observa similitud significativa de secuencia con una familia de enoil ACP reductasas (ER), la otra reductasa de FAS (pero no la familia ER presente en el sistema PUFA PKS), y la familia de alcohol de cadena corta deshidrogenasa. El análisis Pfam de la región PUFA PKS indicada anteriormente revela la homología con la familia de alcohol de cadena corta deshidrogenasa en la región central. El análisis Blast de la misma región revela coincidencias en el área central con enzimas KR conocidas así como una región prolongada de homología a dominios de los otros sistemas PUFA PKS caracterizados.
Fase de lectura abierta B (OrfB):
La secuencia completa de nucleótidos para OrfB está representada en este documento como SEC ID Nº 3. Los nucleótidos 1311-6177 de la SEC ID Nº 3 corresponden a los nucleótidos 1-4867 de la secuencia indicada como SEC ID Nº 71 en la solicitud de Estados Unidos n.º de serie 09/231.899 (La secuencia de ADNc en la solicitud de Estados Unidos n.º de serie 09/231.899 contiene aproximadamente 345 nucleótidos adicionales más allá del codón de parada, incluyendo una cola poliA). Por lo tanto, los nucleótidos 1-1310 de la SEC ID Nº 1 representan secuencia adicional que no se describía en la solicitud de Estados Unidos n.º de serie 09/231.899. Esta nueva región de la SEC ID Nº 3 contiene la mayor parte del dominio KS codificado por OrfB.
OrfB es una secuencia de 6177 nucleótidos (sin incluir el codón de parada) que codifica una secuencia de 2059 aminoácidos, representada en este documento como SEC ID Nº 4. Dentro de la OrfB hay cuatro dominios: (a) un dominio β-ceto acil-ACP sintasa (KS); (b) un dominio de factor de longitud de cadena (CLF); (c) un dominio acil transferasa (AT); y, (d) un dominio enoil ACP-reductasa (ER).
La secuencia de nucleótidos para OrfB se ha depositado en GenBank con el n.º de acceso AF378328 (secuencia de aminoácidos n.º de acceso AAK728880). Se comparó OrfB con secuencias conocidas en una búsqueda BLAST convencional como se ha descrito anteriormente. A nivel de ácido nucleico, OrfB no tiene homología significativa con ninguna secuencia conocida de nucleótidos. A nivel de aminoácidos, las secuencias con el mayor grado de homología a OrfB fueron: proteína hipotética de Shewanella sp. (n.º de acceso U73935), que era un 53 % idéntica a ORFB sobre 458 restos de aminoácido; ORF11 de Moritella marinus (Vibrio marinus) (n.º de acceso AB025342), que era un 53 % idéntica a ORFB sobre 460 restos de aminoácido; ácido graso omega-3 poliinsaturado sintasa PfaD de Photobacterium profundum (n.º de acceso AF409100), que era un 52 % idéntica a ORFB sobre 457 restos de aminoácido; y proteína hipotética de Nostoc sp. 7120 (n.º de acceso NC_003272), que era un 53 % idéntica a ORFB sobre 430 restos de aminoácido.
El primer dominio en OrfB es un dominio KS, también mencionado en este documento como ORFB-KS. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde el punto de inicio entre aproximadamente las posiciones 1 y 43 de la SEC ID Nº 3 (OrfB) hasta un punto final entre aproximadamente las posiciones 1332 y 1350 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-KS está representada en este documento como SEC ID Nº 19 (posiciones 1-1350 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio KS abarca desde el punto de inicio entre aproximadamente las posiciones 1 y 15 de la SEC ID Nº 4 (OrfB) hasta un punto final entre aproximadamente las posiciones 444 y 450 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-KS está representada en este documento como SEC ID Nº 20 (posiciones 1-450 de la SEC ID Nº 4). Se aprecia que el dominio ORFB-KS contiene un motivo de sitio activo: DXAC* (*C196 del sitio de unión a acilo). La actividad biológica de KS y métodos para identificar proteínas o dominios que tengan dicha actividad se ha descrito anteriormente.
El segundo dominio en OrfB es un dominio CLF, también mencionado en este documento como ORFB-CLF. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde el punto de inicio entre aproximadamente las posiciones 1378 y 1402 de la SEC ID Nº 3 (OrfB) hasta un punto final entre aproximadamente las posiciones 2682 y 2700 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-CLF está representada en este documento como SEC ID Nº 21 (posiciones 1378-2700 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio CLF abarca desde un punto de inicio entre aproximadamente las posiciones 460 y 468 de la SEC ID Nº 4 (ORFB) hasta un punto final entre aproximadamente las posiciones 894 y 900 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-CLF está representada en este documento como SEC ID Nº 22 (posiciones 460-900 de la SEC ID Nº 4). Se observa que el dominio ORFB-CLF contiene un motivo de sitio activo de KS sin la cisteína de unión a acilo.
Un dominio o proteína se menciona como factor de longitud de cadena (CLF) en base al siguiente fundamento. El CLF se describió originalmente como característico de sistemas PKS Tipo II (enzimas disociadas) y se planteó la hipótesis de que desempeñaba un papel en la determinación de la cantidad de ciclos de elongación, y por tanto la longitud de cadena, del producto final. Las secuencias de aminoácidos de CLF muestran homología a dominios KS (y se cree que forman heterodímeros con una proteína KS), pero carecen de la cisteína del sitio activo. El papel de CLF en los sistemas PKS es actualmente controvertido. Nuevas evidencias (C. Bisang et al., Nature 401,502 (1999)) sugieren un papel en el cebado (que proporciona el grupo acilo inicial a elongar) de los sistemas PKS. En este papel, se cree que el dominio CLF descarboxila malonato (como malonil-ACP), formando por tanto un grupo acetato que puede transferirse al sitio activo KS. Este acetato por lo tanto actúa como la molécula de "cebado" que puede experimentar la reacción inicial de elongación (condensación). Se han identificado homólogos del CLF Tipo II como dominios "de carga" en algunos sistemas PKS modulares. Un dominio con las características de secuencia del CLF se encuentra en todos los sistemas PUFA PKS actualmente identificados y en cada caso se encuentra como parte de una proteína de múltiples dominios.
El tercer dominio en OrfB es un dominio AT, también mencionado en este documento como ORFB-AT. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde el punto de inicio entre aproximadamente las posiciones 2701 y 3598 de la SEC ID Nº 3 (OrfB) hasta un punto final entre aproximadamente las posiciones 3975 y 4200 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-AT está representada en este documento como SEC ID Nº 23 (posiciones 2701-4200 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio AT abarca desde el punto de inicio entre aproximadamente las posiciones 901 y 1200 de la SEC ID Nº 4 (ORFB) hasta un punto final entre aproximadamente las posiciones 1325 y 1400 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-AT está representada en este documento como SEC ID Nº 24 (posiciones 901-1400 de la SEC ID Nº 4). Se aprecia que el dominio ORFB-AT contiene un motivo de sitio activo de GxS*xG (*S1140 del sitio de unión a acilo) que es característico de proteínas aciltransfersa (AT).
Una "aciltransferasa" o "AT" se refiere a una clase general de enzimas que puede realizar varias reacciones distintas de transferencia de acilo. El dominio de Schizochytrium muestra buena homología aun dominio presente en todos los demás sistemas PUFA PKS actualmente examinados y homología muy débil a algunas aciltransferasas cuyas funciones específicas se han identificado (por ejemplo, a malonil-CoA:ACP aciltransferasa, MAT). A pesar de la débil homología a MAT, este dominio AT no se cree que funcione como MAT porque no posee una estructura de motivo prolongado característico de dichas enzimas (véase la descripción del dominio MAT, anteriormente). Para los propósitos de esta descripción, las funciones del dominio AT en un sistema PUFA PKS incluyen, aunque sin limitación: transferencia del grupo acilo graso desde el dominio o dominios ORFA ACP a agua (es decir, una tioesterasa -que libera el grupo acilo graso como un ácido graso libre), transferencia de un grupo acilo graso a un aceptor tal como CoA, transferencia del grupo acilo entre los diversos dominios ACP, o transferencia del grupo acilo graso a una molécula aceptora lipófila (por ejemplo, a ácido lisofosfatídico).
El cuarto dominio en OrfB es un dominio ER, también mencionado en este documento como ORFB-ER. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde el punto de inicio de aproximadamente la posición 4648 de la SEC ID Nº 3 (OrfB) hasta un punto final de aproximadamente la posición 6177 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-ER está representada en este documento como SEC ID Nº 25 (posiciones 4648-6177 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio ER abarca desde un punto de inicio de aproximadamente la posición 1550 de la SEC ID Nº 4 (ORFB) hasta un punto final de aproximadamente la posición 2059 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-ER está representada en este documento como SEC ID Nº 26 (posiciones 1550-2059 de la SEC ID Nº 4).
Describimos que este dominio tiene actividad biológica enoil reductasa (ER). La enzima ER reduce el doble enlace trans (introducido por la actividad DH) en el acilo graso-ACP, provocando saturación completa de esos carbonos. El dominio ER en la PUFA PKS muestra homología a una familia recién caracterizada de enzimas ER (Heath et al., Nature 406, 145 (2000)). Heath y Rock identificaron esta nueva clase de enzimas ER clonando un gen de interés de Streptococcus pneumoniae, purificando una proteína expresada a partir de ese gen, y mostrando que tenía actividad ER en un ensayo in vitro. La secuencia del dominio ER de Schizochytrium de OrfB muestra homología a la proteína ER de S. pneumoniae. Todos los sistemas PUFA PKS actualmente examinados contienen al menos un dominio con
homología de secuencia muy elevada al dominio ER de Schizochytrium. El sistema PUFA PKS de Schizochytrium contiene dos dominios ER (uno en OrfB y uno en OrfC).
Fase de lectura abierta C (OrfC):
La secuencia completa de nucleótidos para OrfC está representada en este documento como SEC ID Nº 5. Los nucleótidos 1-4509 de la SEC ID Nº 5 (es decir, la secuencia completa de fase de lectura abierta, sin incluir el codón de parada) corresponden a los nucleótidos 145-4653 de la secuencia indicada como SEC ID Nº 76 en la solicitud de Estados Unidos n.º de serie 09/231.899 (La secuencia de ADNc en la solicitud de Estados Unidos n.º 09/231.899 contiene aproximadamente 144 nucleótidos cadena arriba del codón de inicio para OrfC y aproximadamente 110 nucleótidos más allá del codón de parada, incluyendo una cola poliA). OrfC es una secuencia de 4509 nucleótidos (sin incluir el codón de parada) que codifica una secuencia de 1503 aminoácidos, representada en este documento como SEC ID Nº 6. Dentro de la OrfC hay tres dominios: (a) dos dominios β-hidroxi acil-ACP deshidrasa (DH) tipo FabA; y (b) un dominio enoil ACP-reductasa (ER).
La secuencia de nucleótidos para OrfC se ha depositado en GenBank con el n.º de acceso AF378329 (secuencia de aminoácidos n.º de acceso AAK728881). Se comparó OrfC con secuencias conocidas en una búsqueda BLAST convencional como se ha descrito anteriormente. A nivel de ácido nucleico, OrfC no tiene homología significativa con ninguna secuencia conocida de nucleótidos. A nivel de aminoácidos (Blastp), las secuencias con el mayor grado de homología a ORFC fueron: ORF11 de Moritella marinus (Vibrio marinus) (n.º de acceso ABO25342), que es un 45% idéntica a ORFC sobre 514 restos de aminoácido, proteína hipotética 8 de Shewanella sp. (n.º de acceso U73935), que es un 49% idéntica a ORFC sobre 447 restos de aminoácido, proteína hipotética de Nostoc sp. (n.º de acceso NC_003272), que es un 49% idéntica a ORFC sobre 430 restos de aminoácido, y proteína hipotética 7 de Shewanella sp. (n.º de acceso U73935), que es un 37% idéntica a ORFC sobre 930 restos de aminoácido.
El primer dominio en OrfC es un dominio DH, también mencionado en este documento como ORFC-DH1. Este es uno de los dos dominios DH en OrfC, y por lo tanto se denomina DH1. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1 y 778 de la SEC ID Nº 5 (OrfC) hasta un punto final entre aproximadamente las posiciones 1233 y 1350 de la SEC ID Nº 5. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFC-DH1 está representada en este documento como SEC ID Nº 27 (posiciones 1-1350 de la SEC ID Nº 5). La secuencia de aminoácidos que contiene el dominio DH1 abarca desde el punto de inicio entre aproximadamente las posiciones 1 y 260 de la SEC ID Nº 6 (ORFC) hasta un punto final entre aproximadamente las posiciones 411 y 450 de la SEC ID Nº 6. La secuencia de aminoácidos que contiene el dominio ORFC-DH1 está representada en este documento como SEC ID Nº 28 (posiciones 1-450 de la SEC ID Nº 6).
Las características de ambos dominios DH (véase a continuación para DH 2) en los sistemas PUFA PKS se han descrito en las secciones precedentes. Esta clase de enzima elimina HOH de un β-ceto acil-ACP y deja un doble enlace trans en la cadena de carbono. Los dominios DH de los sistemas PUFA PKS muestran homología a enzimas DH bacterianas asociadas con sus sistemas FAS (en lugar de a los dominios DH de otros sistemas PKS). Un subconjunto de DH bacterianas, las DH tipo FabA, poseen actividad cis-trans isomerasa (Heath et al., J. Biol. Chem., 271, 27795 (1996)). Es la homología a las DH tipo FabA lo que indica que uno o ambos dominios DH son responsables de la inserción de los dobles enlaces cis en los productos de PUFA PKS.
El segundo dominio en OrfC es un dominio DH, también mencionado en este documento como ORFC-DH2. Este es el segundo de los dos dominios DH en OrfC, y por lo tanto se denomina DH2. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1351 y 2437 de la SEC ID Nº 5 (OrfC) hasta un punto final entre aproximadamente las posiciones 2607 y 2850 de la SEC ID Nº 5. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFC-DH2 está representada en este documento como SEC ID Nº 29 (posiciones 1351-2850 de la SEC ID Nº 5). La secuencia de aminoácidos que contiene el dominio DH2 abarca desde el punto de inicio entre aproximadamente las posiciones 451 y 813 de la SEC ID Nº 6 (ORFC) hasta un punto final entre aproximadamente las posiciones 869 y 950 de la SEC ID Nº 6. La secuencia de aminoácidos que contiene el dominio ORFC-DH2 está representada en este documento como SEC ID Nº 30 (posiciones 451-950 de la SEC ID Nº 6). La actividad biológica DH se ha descrito anteriormente.
El tercer dominio en OrfC es un dominio ER, también mencionado en este documento como ORFC-ER. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio de aproximadamente la posición 2998 de la SEC ID Nº 5 (OrfC) hasta un punto final de aproximadamente la posición 4509 de la SEC ID Nº 5. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFC-ER está representada en este documento como SEC ID Nº 31 (posiciones 2998-4509 de la SEC ID Nº 5). La secuencia de aminoácidos que contiene el dominio ER abarca desde el punto de inicio de aproximadamente la posición 1000 de la SEC ID Nº 6 (ORFC) hasta un punto final de aproximadamente la posición 1502 de la SEC ID Nº 6. La secuencia de aminoácidos que contiene el dominio ORFC-ER está representada en este documento como SEC ID Nº 32 (posiciones 1000-1502 de la SEC ID Nº 6). La actividad biológica ER se ha descrito anteriormente.
Una realización de la presente invención se refiere a una molécula aislada de ácido nucleico que comprende una secuencia de ácido nucleico de un sistema PUFA PKS no bacteriano, un homólogo de la misma, un fragmento de la misma, y/o una secuencia de ácido nucleico que es complementaria a cualquiera de dichas secuencias de ácido nucleico. En un aspecto, la presente invención se refiere a una molécula aislada de ácido nucleico como se expone en la reivindicación 1.
De acuerdo con la presente invención, una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS es una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio del sistema PUFA PKS descrito en detalle en este documento, como se ejemplifica por el sistema PUFA PKS Schizochytrium. Las actividades biológicas de los diversos dominios dentro del sistema PUFA PKS de Schizochytrium se han descrito en detalle anteriormente. Por lo tanto, una molécula aislada de ácido nucleico descrita en este documento puede codificar el producto de traducción de cualquier fase de lectura abierta de PUFA PKS, dominio de PUFA PKS, fragmento biológicamente activo del mismo, o cualquier homólogo de una fase de lectura abierta o dominio de PUFA PKS de origen natural que tenga actividad biológica. Un homólogo de una proteína o dominio dado es una proteína o polipéptido que tiene una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de referencia de origen natural (es decir, de la proteína o dominio de referencia) porque al menos uno o unos pocos, aunque sin limitación a uno o unos pocos, aminoácidos se han delecionado (por ejemplo, una versión truncada de la proteína, tal como un péptido o fragmento), insertado, invertido, sustituido y/o derivatizado (por ejemplo, por glucosilación, fosforilación, acetilación, miristoilación, prenilación, palmitación, amidación y/o adición de glucosilfosfatidil inositol). Homólogos preferidos de una proteína o dominio de PUFA PKS se describen en detalle a continuación. Se aprecia que los homólogos pueden incluir homólogos producidos de forma sintética, variantes alélicas de origen natural de una proteína o dominio dado, o secuencias homólogas de organismos diferentes al organismo del cual se obtuvo la secuencia de referencia.
En general, la actividad biológica o acción biológica de una proteína o dominio se refiere a cualquier función mostrada o realizada por la proteína o dominio que está atribuida a la forma de origen natural de la proteína o dominio medida u observada in vivo (es decir, en el entorno fisiológico natural de la proteína) o in vitro (es decir, en condiciones de laboratorio). Las actividades biológicas de los sistemas PUFA PKS y las proteínas/dominios individuales que componen un sistema PUFA PKS se han descrito en detalle en otra parte en este documento. Las modificaciones de una proteína o dominio, tal como en un homólogo o mimético (analizado a continuación), pueden producir proteínas o dominios que tienen la misma actividad biológica que la proteína o dominio de origen natural, o proteínas o dominios que tienen actividad biológica disminuida o aumentada en comparación con la proteína o dominio de origen natural. Modificaciones que provocan una disminución en la expresión o una disminución en la actividad de la proteína o dominio, pueden mencionarse como inactivación (completa o parcial), regulación negativa,
- o acción disminuida de una proteína o dominio. Asimismo, modificaciones que provocan un aumento en la expresión
- o un aumento en la actividad de la proteína o dominio, pueden mencionarse como amplificación, sobreproducción, activación, potenciación, regulación positiva o acción aumentada de una proteína o dominio. Un dominio funcional de un sistema PUFA PKS es un dominio (es decir, un dominio puede ser una parte de una proteína) que es capaz de realizar una función biológica (es decir, tiene actividad biológica).
De acuerdo con la presente invención, una molécula aislada de ácido nucleico es una molécula de ácido nucleico que se ha retirado de su entorno natural (es decir, que se ha sometido a manipulación humana), siendo su entorno natural el genoma o cromosoma en que se encuentra la molécula de ácido nucleico en la naturaleza. Por tanto, "aislado" no refleja necesariamente el grado al cual se ha purificado la molécula de ácido nucleico, sino que indica que la molécula no incluye un genoma completo o un cromosoma completo en que se encuentra la molécula de ácido nucleico en la naturaleza. Una molécula aislada de ácido nucleico puede incluir un gen. Una molécula aislada de ácido nucleico que incluye un gen no es un fragmento de un cromosoma que incluye dicho gen, sino que en su lugar incluye la región codificante y regiones reguladoras asociadas con el gen, pero no genes adicionales encontrados de forma natural en el mismo cromosoma. Una molécula aislada de ácido nucleico también puede incluir una secuencia específica de ácido nucleico flanqueada por (es decir, en el extremo 5' y/o 3' de la secuencia) ácido nucleicos adicionales que no flanquean de forma normal la secuencia específica de ácido nucleico en la naturaleza (es decir, secuencias heterólogas). La molécula aislada de ácido nucleico puede incluir ADN, ARN (por ejemplo, ARNm), o derivados de ADN o ARN (por ejemplo, ADNc). Aunque la expresión "molécula de ácido nucleico" se refiere principalmente a la molécula física de ácido nucleico y la expresión "secuencia de ácido nucleico" se refiere principalmente a la secuencia de nucleótidos en la molécula de ácido nucleico, las dos expresiones pueden usarse de forma intercambiable, especialmente con respecto a una molécula de ácido nucleico,
- o una secuencia de ácido nucleico, que es capaz de codificar una proteína o dominio de una proteína.
Preferiblemente, una molécula aislada de ácido nucleico de la presente invención se produce usando tecnología de ADN recombinante (por ejemplo, amplificación por reacción en cadena de la polimerasa (PCR), clonación) o síntesis química. Las moléculas aisladas de ácido nucleico incluyen moléculas naturales de ácido nucleico y homólogos de las mismas incluyendo, aunque sin limitación, variantes alélicas naturales y moléculas modificadas de ácido nucleico en que se han insertado delecionado, sustituido y/o invertido nucleótidos de tal modo que dichas modificaciones proporcionen el efecto deseado sobre la actividad biológica del sistema PUFA PKS como se describe en este documento. Se han analizado homólogos de proteína (por ejemplo, proteínas codificadas por homólogos de ácidos nucleico) en detalle anteriormente.
Una molécula de ácido nucleico homóloga puede producirse usando varios métodos conocidos para los expertos en la materia (véase, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press, 1989). Por ejemplo, pueden modificarse moléculas de ácido nucleico usando una diversidad de técnicas incluyendo, aunque sin limitación, técnicas clásicas de mutagénesis y técnicas de ADN recombinante, tales como mutagénesis dirigida al sitio, tratamiento químico de una molécula de ácido nucleico para inducir mutaciones, escisión con enzima de restricción de un fragmento de ácido nucleico, ligamiento de fragmento de ácido nucleico, amplificación por PCR y/o mutagénesis de regiones seleccionadas de una secuencia de ácido nucleico, síntesis de mezclas de oligonucleótidos y ligamiento de grupos mezclados para "componer" una mezcla de moléculas de ácido nucleico y combinaciones de las mismas. Pueden seleccionarse moléculas de ácido de nucleico homólogas de una mezcla de ácidos nucleicos modificados seleccionando la función de la proteína codificada por el ácido nucleico y/o por hibridación con un gen de tipo silvestre.
El tamaño mínimo de una molécula de ácido nucleico de la presente invención es un tamaño suficiente para formar una sonda o cebador oligonucleotídico que sea capaz de formar un híbrido estable (por ejemplo, en condiciones de rigurosidad moderada, alta o muy alta) con la secuencia complementaria de una molécula de ácido nucleico útil en la presente invención, o de un tamaño suficiente para codificar una secuencia de aminoácidos que tenga una actividad biológica de al menos un dominio de un sistema PUFA PKS de acuerdo con la presente invención. Por tanto, el tamaño de la molécula de ácido nucleico que codifica dicha proteína puede depender de la composición del ácido nucleico y el porcentaje de homología o identidad entre la molécula de ácido nucleico y la secuencia complementaria así como de las condiciones de hibridación per se (por ejemplo, temperatura, concentración salina, y concentración de formamida). El tamaño mínimo de una molécula de ácido nucleico que se usa como cebador oligonucleotídico o como sonda es típicamente de al menos aproximadamente 12 a aproximadamente 15 nucleótidos de longitud si las moléculas de ácido nucleico son ricas en GC y de al menos aproximadamente 15 a aproximadamente 18 bases de longitud si son ricas en AT. No existe límite, salvo un límite práctico, en el tamaño máximo de una molécula de ácido nucleico de la presente invención, porque la molécula de ácido nucleico puede incluir una secuencia suficiente para codificar un fragmente biológicamente activo de un dominio de un sistema PUFA PKS, un dominio completo de un sistema PUFA PKS, varios dominios dentro de una fase de lectura abierta (Orf) de un sistema PUFA PKS, una Orf completa de un sistema PUFA PKS, o más de un Orf de un sistema PUFA PKS.
En una realización de la presente invención, una molécula aislada de ácido nucleico consiste en una secuencia de ácido nucleico que codifica una secuencia de aminoácidos seleccionada entre el grupo que consiste en: SEC ID Nº 30, posiciones 1-450 de SEC ID Nº 6, o fragmentos biológicamente activos de las mismas. En un aspecto, la secuencia de ácido nucleico se selecciona entre el grupo que consiste en: posiciones 1-1350 de SEC ID Nº 5 y SEC ID Nº 29.
En una realización de la presente invención, cualquiera de las secuencias de aminoácidos de PUFA PKS descritas anteriormente, así como homólogos de dichas secuencias, puede producirse con de al menos uno, y hasta aproximadamente 20, aminoácidos heterólogos adicionales flanqueando cada uno de los extremos C y/o N terminales de la secuencia dada de aminoácidos. La proteína o polipéptido resultante puede mencionarse como "que consiste esencialmente en" una secuencia dada de aminoácidos. De acuerdo con la presente invención, los aminoácidos heterólogos son una secuencia de aminoácidos que no se encuentran de forma natural (es decir, no se encuentran en la naturaleza, in vivo) que flanquean la secuencia dada de aminoácidos o que podrían no estar codificados por los nucleótidos que flanquean la secuencia de ácido nucleico de origen natural que codifica la secuencia dada de aminoácidos tal como existe en el gen, así dichos nucleótidos en la secuencia de origen natural se traducen usando el uso convencional de codones para el organismo del cual se obtiene la secuencia dada de aminoácidos. Asimismo, la expresión "que consiste esencialmente en", cuando se usa con referencia a una secuencia de ácido nucleico en ese documento, se refiere a una secuencia de ácido nucleico que codifica una secuencia dada de aminoácidos que puede estar flanqueada por de al menos uno, y hasta como mucho aproximadamente 60, nucleótidos heterólogos adicionales en cada uno de los extremos 5' y/o 3' de la secuencia de ácido nucleico que codifica la secuencia dada de aminoácidos. Los nucleótidos heterólogos no se encuentran de forma natural (es decir, no se encuentran en la naturaleza, in vivo) flanqueando la secuencia de ácido nucleico que codifica la secuencia dada de aminoácidos tal como existe en el gen natural.
La presente invención también incluye una molécula aislada de ácido nucleico que consiste en una secuencia de ácido nucleico que codifica una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS. En un aspecto, dicha secuencia de ácido nucleico codifica un homólogo de cualquiera de las Orf o dominios de PUFA PKS de Schizochytrium, incluyendo: posiciones 1-450 de SEC ID Nº 6; o SEC ID Nº 30, donde el homólogo tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS como se ha descrito previamente en este documento.
En un aspecto de la invención, un homólogo de una proteína o dominio de PUFA PKS de Schizochytrium abarcado por la presente invención comprende una secuencia de aminoácidos que es al menos un 60 % idéntica a una secuencia de aminoácidos elegida entre: posiciones 1-450 de SEC ID Nº 6; o SEC ID Nº 30, donde dicha secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS. En un aspecto adicional, la secuencia de aminoácidos del homólogo es al menos un 65 % idéntica, y más preferiblemente al menos un 70 % idéntica, y más preferiblemente al menos un 75 % idéntica, y más preferiblemente al menos un 80 %
idéntica y más preferiblemente al menos un 85 % idéntica, y más preferiblemente al menos un 90 % idéntica, y más preferiblemente al menos un 95 % idéntica, y más preferiblemente al menos un 96 % idéntica, y más preferiblemente al menos un 97 % idéntica, y más preferiblemente al menos un 98 % idéntica, y más preferiblemente al menos un 99 % idéntica a un secuencia de aminoácidos elegida entre: posiciones 1-450 de SEC ID No 6; o SEC ID Nº 30, donde la secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS.
De acuerdo con la presente invención, el término "contiguo" o "consecutivo", con respecto a secuencias de ácido nucleico o aminoácidos descritas en este documento, significa conectados en una secuencia ininterrumpida. Por ejemplo, para que una primera secuencia comprenda 30 aminoácidos contiguos "o consecutivos" de una segunda secuencia, significa que la primera secuencia incluye una secuencia ininterrumpida de 30 restos de aminoácido que es 100 % idéntica a una secuencia ininterrumpida de 30 restos de aminoácido en la segunda secuencia. Asimismo, para que una primera secuencia tenga "identidad del 100 %" con una segunda secuencia significa que la primera secuencia coincide exactamente con la segunda secuencia sin huecos entre nucleótidos o aminoácidos.
Como se usa en este documento, salvo que se especifique de otro modo, referencias a un porcentaje (%) de identidad se refiere a un evaluación de homología que se realiza usando: (1) una búsqueda de homología en BLAST
2.0 Basic BLAST usando blastp para búsquedas de aminoácidos, blastn para búsquedas de ácidos nucleicos, y blastX para búsqueda de ácido nucleico y búsquedas de aminoácidos traducidos en las 6 fases de lectura abierta, todas con parámetros convencionales por defecto, donde la secuencia de consulta se filtra para regiones de baja complejidad por defecto (descrito en Altschul, S.F., Madden, T.L., Schääffer, A.A., Zhang, J., Zhang, Z., Miller, W. y Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389-3402, incorporado por referencia en este documento en su totalidad); (2) una alineación BLAST 2 (usando los parámetros descritos a continuación): (3) y/o PSI-BLAST con los parámetros convencionales por defecto (BLAST con iteración específica de posición). Se aprecia que debido a algunas diferencias en los parámetros convencionales entre BLAST 2.0 Basic BLAST y BLAST 2, podrían reconocerse dos secuencias específicas como teniendo homología significativa usando el programa BLAST 2, mientras que una búsqueda realizada en BLAST 2.0 Basic BLAST usando una de las secuencias como secuencia de consulta puede no identificar la segunda secuencia en las máximas coincidencias. Además, PSI-BLAST proporciona una versión automatizada, fácil de usar de una búsqueda "de perfil", que es un modo sensible de buscar homólogos de secuencia. El programa primero realiza una búsqueda en base de datos BLAST con huecos. El programa PSI-BLAST usa la información de cualquier alineación significativa devuelta para construir una matriz de valores específica de posición, que remplaza la secuencia de consulta por la siguiente ronda de búsqueda en base de datos. Por lo tanto, debe entenderse que el porcentaje de identidad puede determinarse usando uno cualquiera de estos programas.
Pueden alinearse dos secuencias específicas entre sí usando la secuencia BLAST 2 como se describe en Tatusova and Madden, (1999), "Blast 2 sequences -a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247-250, incorporado por referencia en este documento en su totalidad. La alineación de secuencia BLAST 2 se realiza en blastp o blastn usando el algoritmo BLAST 2.0 para realizar una búsqueda BLAST con huecos (BLAST 2.0) entre las dos secuencias que permita la introducción de huecos (deleciones e inserciones) en la alineación resultante. Para propósitos de claridad en este documento, se realiza una alineación de secuencia BLAST 2 usando los siguientes parámetros convencionales por defecto.
Para blastn, usando matriz 0 BLOSUM62:
Recompensa por coincidencia = 1
Penalización por desapareamiento = -2
Penalizaciones por abertura de hueco (5) y extensión de hueco (2)
Filtro (activo) de tamaño de palabra (11) esperado (10) con x_disminución de hueco (50).
Para blastp, usando matriz 0 BLOSUM62:
Penalizaciones por abertura de hueco (11) y extensión de hueco (1)
Filtro (activo) de tamaño de palabra (3) esperado (10) con x_disminución de hueco (50).
En otra realización de la invención, una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio de un sistema PUFA PKS de la presente invención incluye una secuencia de aminoácidos que es suficientemente similar a una proteína o polipéptido de PUFA PKS de origen natural, que es una secuencia de ácido nucleico que codifica la secuencia de aminoácidos capaz de hibridar en condiciones de rigurosidad moderada, alta o muy alta (descritas a continuación) a (es decir, con) una molécula de ácido nucleico que codifica la proteína o polipéptido de PUFA PKS de origen natural (es decir, al complemento de la hebra de ácido nucleico que codifica la proteína o polipéptido de PUFA PKS de origen natural). Preferentemente, una secuencia de aminoácidos que tiene
la actividad biológica de al menos un dominio de un sistema PUFA PKS de la presente invención está codificada por una secuencia de ácido nucleico que hibrida en condiciones de rigurosidad moderada, alta o muy alta con el complemento de una secuencia de ácido nucleico que codifica una proteína que comprende una secuencia de amino ácidos representada por cualquiera de las posiciones 1-450 de SEC ID Nº 6 o SEC ID Nº 30.
Los métodos para deducir una secuencia complementaria son conocidos para los expertos en la materia. Debe apreciarse que como las tecnologías de secuenciación de aminoácidos y secuenciación de ácidos nucleicos no están completamente libres de errores, las secuencias presentadas en este documento, en el mejor de los casos, representan secuencias evidentes de dominios y proteínas de PUFA PKS de la presente invención.
Como se usa en este documento, las condiciones de hibridación se refieren a condiciones convencionales de hibridación en las que se usan moléculas de ácido nucleico para identificar moléculas similares de ácido nucleico. Dichas condiciones convencionales se describen, por ejemplo, en Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press, 1989. Sambrook et al., ibid., se incorpora por referencia en este documento en su totalidad (véase específicamente, las páginas 9.31-9.62). Además, se describen fórmulas para calcular las condiciones apropiadas de hibridación y lavado para conseguir hibridación que permita grados variables de desapareamiento de nucleótidos se describen, por ejemplo, en Meinkoth et al., 1984, Anal. Biochem. 138, 267-284, Meinkoth et al., ibid., se. incorpora por referencia en este documento en su totalidad.
Más particularmente, condiciones de hibridación y lavado de rigurosidad moderada, como se menciona en este documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido nucleico que tengan al menos aproximadamente un 70 % de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que se estaba usando para sondear en la reacción de hibridación (es decir, condiciones que permiten aproximadamente un 30 % o menos de desapareamiento de nucleótidos. Condiciones de hibridación y lavado de rigurosidad alta, como se menciona en este documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido nucleico que tienen al menos aproximadamente un 80 % de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que se está usando para sondear en la reacción de hibridación (es decir, condiciones que permiten aproximadamente un 20 % o menos de desapareamiento de nucleótidos). Condiciones de hibridación y lavado de rigurosidad muy alta, como se menciona en este documento, se refiere a condiciones que permiten el aislamiento de moléculas de ácido nucleico que tienen al menos aproximadamente un 90 % de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que se está usando para sondear en la reacción de hibridación (es decir, condiciones que permiten aproximadamente un 10 % o menos de desapareamiento de nucleótidos). Como se ha analizado anteriormente, un experto en la materia puede usar las fórmulas en Meinkoth et al., ibid para calcular las condiciones apropiadas de hibridación y lavado para conseguir estos niveles particulares de desapareamiento de nucleótidos. Dichas condiciones variarán, dependiendo de si se están formando híbridos ADN:ARN o ADN:ADN. Las temperaturas de fusión calculadas para híbridos de ADN:ADN son 10 ºC menores que para híbridos de ADN:ARN. En realizaciones particulares, las condiciones de hibridación rigurosas para híbridos de ADN:ADN incluyen hibridación a una fuerza iónica de SSC 6X (Na+ 0,9 M) a una temperatura entre aproximadamente 20 ºC y aproximadamente 35 ºC (rigurosidad más baja), más preferiblemente, entre aproximadamente 28 ºC y aproximadamente 40 ºC (más riguroso), e incluso más preferiblemente, entre aproximadamente 35 ºC y aproximadamente 45 ºC (incluso más riguroso), con condiciones apropiadas de lavado.
En realizaciones particulares, las condiciones de hibridación rigurosas para híbridos de ADN:ARN incluyen hibridación a una fuerza iónica de SSC 6X (Na+ 0,9 M) a una temperatura entre aproximadamente 30 ºC centígrados y aproximadamente 45 ºC, más preferiblemente, entre aproximadamente 38 ºC y aproximadamente 50 ºC, e incluso más preferiblemente, entre aproximadamente 45 ºC y aproximadamente 55 ºC, con condiciones de lavado igualmente rigurosas. Estos valores se basan en cálculos de una temperatura de fusión para moléculas mayores de aproximadamente 100 nucleótidos, formamida al 0 % y un contenido de G + C de aproximadamente del 40 %. Como alternativa, la Tm puede calcularse de forma empírica como se expone en Sambrook et al., supra, páginas 9.31 to
9.62. En general, las condiciones de lavado deben ser tan rigurosas como sea posible y deben ser apropiadas para las condiciones elegidas de hibridación. Por ejemplo, las condiciones de hibridación pueden incluir una combinación de condiciones salinas y de temperatura que son aproximadamente 20-25 ºC inferiores a la Tm calculada de un híbrido particular, y las condiciones de lavado típicamente incluyen una combinación de condiciones salinas y de temperatura que son aproximadamente 12-20 ºC inferiores a la Tm calculada del híbrido particular. Un ejemplo de condiciones de hibridación adecuadas para su uso con híbridos de ADN:ADN incluyen una hibridación de 2-24 horas en SSC 6X (formamida al 50 %) a aproximadamente 42 ºC, seguida por etapas de lavado que incluyen uno o más lavado a temperatura ambiente en SSC 2X, seguidos por lavados adicionales a temperaturas mayores o inferiores fuerzas iónicas (por ejemplo, al menos un lavado como aproximadamente 37 ºC en SSC aproximadamente 0,1X-0,5X, seguido por al menos un lavado a aproximadamente 68 ºC en SSC aproximadamente 0,1X-0,5X).
Otra realización de la presente invención incluye una molécula de ácido nucleico recombinante que comprende un vector recombinante y una molécula de ácido nucleico que consiste en una secuencia de ácido nucleico que codifica una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS de acuerdo con la invención. Dichas secuencias de ácido nucleico se han descrito en detalle anteriormente. De acuerdo con la presente invención, un vector recombinante es una molécula de ácido nucleico modificada por ingeniería (es decir, producida de forma artificial) que se usa como herramienta para manipular una secuencia de
ácido nucleico de elección y para introducir dicha secuencia de ácido nucleico en una célula hospedadora. El vector recombinante por lo tanto es adecuado para su uso en clonación, secuenciación, y/o manipulación de otro modo de la secuencia de ácido nucleico de elección, tal como mediante la expresión y/o suministro de la secuencia de ácido nucleico de elección en una célula hospedadora para formar una célula recombinante. Dicho vector típicamente contiene secuencias heterólogas de ácido nucleico, es decir secuencias de ácido nucleico que no se encuentran de forma natural adyacentes a la secuencia de ácido nucleico a clonar o suministrar, aunque el vector también puede contener secuencias reguladoras de ácido nucleico (por ejemplo, promotores, regiones no traducidas) que se encuentran de forma natural adyacentes a moléculas de ácido nucleico de la presente invención o que son útiles para la expresión de las moléculas de ácido nucleico de la presente invención (analizadas en detalle a continuación). El vector puede ser ARN o ADN, procariota o eucariota, y típicamente es un plásmido. El vector puede mantenerse como un elemento extracromosómico (por ejemplo, un plásmido) o puede integrarse en el cromosoma de un organismo recombinante (por ejemplo, un microbio o una planta). El vector completo puede permanecer en su sitio dentro de una célula hospedadora, o en ciertas condiciones, el ADN plasmídico puede delecionarse, dejando detrás la molécula de ácido nucleico de la presente invención. La molécula de ácido nucleico integrada puede estar bajo el control del promotor cromosómico, bajo el control del promotor nativo o plasmídico, o bajo una combinación de varios controles de promotor. Pueden integrarse una o múltiples copias de la molécula de ácido nucleico en el cromosoma. Un vector recombinante de la presente invención puede contener al menos un marcador de selección.
En una realización, un vector recombinante usado en una molécula de ácido nucleico recombinante de la presente invención es un vector de expresión. Como se usa en este documento, la expresión "vector de expresión" se usa para hacer referencia a un vector que es adecuado para la producción de un producto codificado (por ejemplo, una proteína de interés). En esta realización, una secuencia de ácido nucleico que codifica el producto a producir (por ejemplo, un dominio de PUFA PKS) se inserta en el vector recombinante para producir una molécula de ácido nucleico recombinante. La secuencia de ácido nucleico que codifica la proteína a producir se inserta en el vector de un modo que une de forma funcional la secuencia de ácido nucleico a secuencias reguladoras en el vector, lo que posibilita la transcripción y traducción de la secuencia de ácido nucleico dentro de la célula hospedadora recombinante.
En otra realización, un vector recombinante usado en una molécula de ácido nucleico recombinante de la presente invención es un vector de direccionamiento. Como se usa en este documento, la expresión "vector de direccionamiento" se usa para hacer referencia a un vector que se usa para suministrar una molécula de ácido nucleico particular en una célula hospedadora recombinante, donde la molécula de ácido nucleico se usa para delecionar o inactivar un gen endógeno dentro de la célula o microorganismo hospedador (es decir, se usa para alteración génica dirigida o tecnología knock-out). Dicho vector también puede conocerse en la técnica como vector "knock-out". En un aspecto de esta realización, una parte del vector, pero más típicamente la molécula de ácido nucleico insertada en el vector (es decir, el inserto), tiene una secuencia de ácido nucleico que es homóloga a una secuencia de ácido nucleico de un gen diana en la célula hospedadora (es decir, un gen que es una diana para delecionarse o inactivarse). La secuencia de ácido nucleico del inserto del vector se diseña para unirse al gen diana de modo que el gen diana y su inserto experimenten recombinación homóloga, mediante lo cual el gen diana endógeno se deleciona, se inactiva o atenúa (es decir, por al menos una parte del gen diana endógeno que se está mutando o delecionando).
Típicamente, una molécula de ácido nucleico recombinante incluye al menos una molécula de ácido nucleico de la presente invención unida de forma funcional a una o más secuencias de control de la transcripción. Como se usa en este documento, la expresión "molécula recombinante" o "molécula de ácido nucleico recombinante" se refiere principalmente a una molécula de ácido nucleico o secuencia de ácido nucleico unida de forma funcional a una secuencia de control de la transcripción, pero puede usarse de forma intercambiable con la expresión "molécula de ácido nucleico", cuando dicha molécula de ácido nucleico es una molécula recombinante como se analiza en este documento. De acuerdo con la presente invención, la expresión "unido de forma funcional" se refiere a unir una molécula de ácido nucleico a una secuencia de control de la transcripción de un modo tal que la molécula sea capaz de expresarse cuando se introduce por transfección (es decir, transformación, transducción, transfección, conjugación o conducción) en una célula hospedadora. Las secuencias de control de la transcripción son secuencias que controlan el inicio, elongación, o terminación de la transcripción. Las secuencias de control de la transcripción particularmente importantes son aquellas que controlan el inicio de la transcripción, tales como secuencias promotoras, potenciadoras, operadoras y represoras. Las secuencias de control de la transcripción adecuadas incluyen cualquier secuencia de control de la transcripción que pueda funcionar en una célula hospedadora u organismo en que tiene que introducirse la molécula de ácido nucleico recombinante.
Las moléculas de ácido nucleico recombinantes de la presente invención también pueden contener secuencias reguladoras adicionales, tales como secuencias reguladoras de la traducción, origines de replicación, y otras secuencias reguladoras que son compatibles con la célula recombinante. En una realización, una molécula recombinante de la presente invención, incluyendo aquellas que se integran en el cromosoma de la célula hospedadora, también contiene señales de secreción (es decir, se secuencias de ácido nucleico del segmento señal) para posibilitar que una proteína expresada se secrete desde la célula que produce la proteína. Los segmentos señal adecuados incluyen un segmento señal que está asociado de forma natural con la proteína a expresar o cualquier segmento señal heterólogo capaz de dirigir la secreción de la proteína de acuerdo con la
presente invención. En otra realización, una molécula recombinante de la presente invención comprende una secuencia líder para posibilitar que una proteína expresada se suministre e inserte en la membrana de una célula hospedadora. Las secuencias líder adecuadas incluyen una secuencia líder que está asociada de forma natural con la proteína, o cualquier secuencia líder heteróloga capaz de dirigir el suministro e inserción de la proteína a la membrana de una célula.
Los presentes inventores han descubierto que las Orf A y B de PUFA PKS de Schizochytrium están estrechamente vinculadas en el genoma y se a secuenciado la región entre las Orf. Las Orf están orientadas en direcciones opuestas y 4244 pares de bases separan los codones de inicio (ATG) (es decir, están dispuestas del siguiente modo: 3'OrfA5' -4244 pb -5'OrfB3'). El examen de la región intergénica de 4244 pb no reveló ninguna Orf obvia (no se encontraron coincidencias significativas en una búsqueda BlastX). Ambas Orf A y B se expresan altamente en Schizochytrium, al menos durante el tiempo de producción de aceite, lo que implica que los elementos promotores activos están incluidos en esta región intergénica. Se cree que estos elementos genéticos tienen utilidad como secuencia promotora bidireccional para aplicaciones transgénicas. Por ejemplo, en una realización preferida, podría clonarse esta región, colocar cualquier gen de interés en cada extremo e introducir la construcción en Schizochytrium (o algún otro hospedador en que los promotores puedan mostrar que funcionan). Se predice que los elementos reguladores, en las condiciones apropiadas, proporcionarían un alto nivel de expresión coordinado de los dos genes introducidos. La secuencia completa de nucleótidos para la región reguladora que contiene elementos reguladores de PUFA PKS de Schizochytrium (por ejemplo, un promotor) están representados en este documento como SEC ID Nº 36.
De un modo similar, la OrfC se expresa altamente en Schizochytrium durante el tiempo de producción de aceite y se espera que los elementos reguladores residan en la región cadena arriba de su codón de inicio. Una región de ADN genómico cadena arriba de OrfC se ha clonado y secuenciado y está representada en este documento como (SEC ID Nº 37). Esta secuencia contiene los 3886 nt inmediatamente cadena arriba del codón de inicio de OrfC. El examen de esta región no reveló ninguna Orf obvia (es decir, no se encontraron coincidencias significativa en una búsqueda BlastX). Se cree que los elementos reguladores contenidos en esta región, en las condiciones apropiadas, proporcionarán expresión de alto nivel de un gen colocado detrás de ellos. Adicionalmente, en las condiciones apropiadas, el nivel de expresión puede coordinarse con genes bajo el control de la región intergénica A-B (SEC ID Nº 36).
Por lo tanto, en una realización, una molécula de ácido nucleico recombinante útil en la presente invención, como se describe en este documento, puede incluir una región reguladora de PUFA PKS contenida en la SEC ID Nº 36 y/o SEC ID Nº 37. Dicha región reguladora puede incluir cualquier parte (fragmento) de la SEC ID Nº 36 y/o SEC ID Nº 37 que tiene al menos actividad transcripcional basal de PUFA PKS.
Una o más moléculas recombinantes de la presente invención pueden usarse para producir un producto codificado (por ejemplo, un dominio, proteína, o sistema PUFA PKS) de la presente invención. En una realización, un producto codificado se produce expresando una molécula de ácido nucleico como se describe en este documento en condiciones eficaces para producir la proteína. Un método preferido para producir una proteína codificada es transfectar una célula hospedadora con una o más moléculas recombinantes para formar una célula recombinante. Las células hospedadoras adecuadas a transfectar incluyen, aunque sin limitación, cualquier célula bacteriana, fúngica (por ejemplo, levadura), de insecto, vegetal o animal que pueda transfectarse. Las células hospedadoras pueden ser células sin transfectar o células que ya se han transfectado con al menos otra molécula de ácido nucleico recombinante.
De acuerdo con la presente invención, el término "transfección" se usa para hacer referencia a cualquier método por el cual puede insertarse una molécula exógena de ácido nucleico "es decir, una molécula de ácido nucleico recombinante) en una célula. El término "transformación" puede usarse de forma intercambiable con el término "transfección" cuando dicho término se usa para hacer referencia a la introducción de moléculas de ácido nucleico en células microbianas, tales como algas, bacterias y levaduras. En sistemas microbianos, el término "transformación" se usa para describir un cambio hereditario debido a la adquisición de ácidos nucleicos exógenos por el microorganismo y es esencialmente sinónimo al término "transfección". Sin embargo, en células animales, la transformación ha adquirido un segundo significado que puede hacer referencia a cambios en las propiedades de crecimiento de las células en cultivo después de que se conviertan en cancerosas, por ejemplo. Por lo tanto, para evitar confusiones, el término "transfección" se usa preferiblemente con respecto a la introducción de ácidos nucleicos exógenos en células animales, y el término "transfección" se usará en este documento para abarcar en líneas generales transfección de células animales, células vegetales y transformación de células microbianas, en la medida en que los términos pertenecen a la introducción de ácidos nucleicos exógenos en una célula. Por lo tanto, las técnicas de transfección incluyen, aunque sin limitación, transformación, bombardeo de partículas, electroporación, microinyección, lipofección, adsorción, infección y fusión de protoplastos.
Los expertos en la materia apreciarán que el uso de tecnologías de ADN recombinante puede mejorar el control de la expresión de moléculas de ácido nucleico transfectadas manipulando, por ejemplo, la cantidad de copias de las moléculas de ácido nucleico dentro de la célula hospedadora, la eficacia con se transcriben esas moléculas de ácido nucleico, la eficacia con que se traducen los transcritos resultantes, y la eficacia de modificaciones post
traduccionales. Adicionalmente, la secuencia promotora podría modificarse por ingeniería genética para mejorar el nivel de expresión en comparación con el promotor nativo. Las técnicas recombinantes útiles para controlar la expresión de moléculas de ácido nucleico incluyen, aunque sin limitación, integración de las moléculas de ácido nucleico en uno o más cromosomas de la célula hospedadora, la adición de secuencias de estabilidad del vector a los plásmidos, sustituciones o modificaciones de las señales de control de la transcripción (por ejemplo, promotores, operadores, potenciadores), sustituciones o modificaciones de las señales de control de la traducción (por ejemplo, sitios de unión al ribosoma, secuencias de Shine-Dalgarno), modificación de moléculas de ácido nucleico para que correspondan al uso de codones de la célula hospedadora, y deleción de secuencias que desestabilizan los transcritos.
El análisis general anterior con respecto a moléculas de ácido nucleico recombinantes y transfección de células hospedadoras pretende tener aplicación a cualquier molécula de ácido nucleico recombinante analizada en este documento, incluyendo aquellas que codifican cualquier secuencia de aminoácidos que tenga una actividad biológica de al menos un dominio de una PUFA PKS, aquellas que codifican secuencias de aminoácidos de otros sistemas PKS, y aquellas que codifican otras proteínas o dominios.
Describimos el uso de un nuevo método para identificar un microorganismo que tenga un sistema PUFA PKS que sea homólogo en estructura, organización de dominios y/o función a un sistema PUFA PKS de Schizochytrium. El microorganismo puede ser un microorganismo no bacteriano, y el microorganismo identificado por este método puede ser un microorganismo eucariota. Además, describimos los microorganismos identificados por dicho método y el uso de estos microorganismos y el sistema PUFA PKS de estos microorganismos en las diversas aplicaciones para un sistema PUFA PKS (por ejemplo, organismos modificados genéticamente y métodos para producir moléculas bioactivas). El método de selección único descrito y demostrado en este documento posibilita la rápida identificación de nuevas cepas microbianas que contienen un sistema PUFA PKS homólogo al sistema PUFA PKS de Schizochytrium de la presente invención. Los solicitantes han usado este método para descubrir y describir en este documento que un microorganismo Thraustochytrium contiene un sistema PUFA PKS que es homólogo al encontrado en Schizochytrium. Este descubrimiento se describe en detalle en el Ejemplo 2 a continuación.
Los organismos microbianos con un sistema PUFA PKS similar al encontrado en Schizochytrium, tal como el microorganismo Thraustochytrium descubierto por los presentes inventores y descrito en el Ejemplo 2, puede identificarse/aislarse/seleccionarse fácilmente por los siguientes métodos usados por separado o en cualquier combinación de estos métodos.
En general, el método para identificar un microorganismo no bacteriano que tiene un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS) incluye una primera etapa de (a) seleccionar un microorganismo que produce al menos un PUFA; y una segunda etapa de (b) identificar un microorganismo de (a) que tiene una capacidad de producir PUFA aumentados en condiciones de oxígenos disuelto de menos de aproximadamente el 5 % de saturación en el medio de fermentación, en comparación con la producción de PUFA mediante dicho organismo en condiciones de oxígeno disuelto de más del 5 % de saturación, más preferiblemente 10 % de saturación, más preferiblemente más del 15 % de saturación y más preferiblemente más del 20 % de saturación en el medio de fermentación. Un microorganismo que produce al menos un PUFA y tiene una capacidad de producir PUFA aumentados en condiciones de oxígeno disuelto de menos de aproximadamente el 5 % de saturación se identifica como candidato para contener un sistema PUFA PKS. Posterior a la identificación de un microorganismo que es un fuerte candidato para que contenga un sistema PUFA PKS, el método puede incluir una etapa adicional
(c) de detectar si el organismo identificado en la etapa (b) comprende un sistema PUFA PKS.
La etapa (b) puede realizarse cultivando el microorganismo seleccionado para el proceso de detección en condiciones de bajo oxígeno/anóxicas y condiciones aeróbicas y, además de medir el contenido de PUFA en el organismo, se determina el perfil de ácidos grasos, así como el contenido de grasas. Comparando los resultados en las condiciones de bajo oxígeno/anóxicas con los resultados en condiciones aeróbicas, el método proporciona un fuerte indicio de si el microorganismo de ensayo contiene un sistema PUFA PKS de la presente invención. Esta realización se describe en detalle a continuación.
Inicialmente, las cepas microbianas a examinar para la presencia de un sistema PUFA PKS se cultivan en condiciones aeróbicas, para inducir la producción de una gran cantidad de células (biomasa bacteriana). Como un elemento del proceso de identificación, estas células después se colocan en condiciones de cultivo de bajo oxígeno
o anóxicas (por ejemplo, oxígeno disuelto de menos de aproximadamente el 5 % de saturación, más preferiblemente menos de aproximadamente el 2 %, incluso más preferiblemente menos de aproximadamente el 1 %, y mucho más preferiblemente oxígeno disuelto de aproximadamente el 0 % de saturación en el medio de cultivo) y se dejaron crecer durante aproximadamente otras 24-72 horas. En este proceso, los microorganismos deben cultivarse a una temperatura mayor de aproximadamente 15 ºC, y más preferiblemente mayor de aproximadamente 20 ºC, e incluso más preferiblemente mayor de aproximadamente 25 ºC, e incluso más preferiblemente mayor de 30 ºC. El entorno de cultivo bajo o anóxico puede mantenerse fácilmente en cámaras de cultivo capaces de inducir este tipo de entorno atmosférico en la cámara (y por tanto en los cultivos) o cultivando las células de un modo que induzca el entorno de bajo oxígeno directamente en el propio matraz/recipiente de cultivo.
En un método de cultivo, los microbios pueden cultivarse en matraces de agitación que, en lugar de contener normalmente una pequeña cantidad de medio de cultivo -menos de aproximadamente el 50 % de la capacidad total y habitualmente menos de aproximadamente el 25 % de la capacidad total -para mantener el medio aireado según se agita en una mesa oscilatoria, se llenan en su lugar hasta más de aproximadamente el 50 % de su capacidad, y más preferiblemente más del aproximadamente el 60 %, y mucho más preferiblemente más de aproximadamente el 75 % de su capacidad con medio de cultivo. La alta carga del matraz de agitación con medio de cultivo evita que se mezcle muy bien en el matraz cuando se coloca en una mesa oscilatoria, evitando la difusión de oxígeno en el cultivo. Por lo tanto, según crecen los microbios, usan el oxígeno existente en el medio y naturalmente crean un entorno bajo o ausente en oxígeno en el matraz de agitación.
Después del periodo de cultivo, las células se recogen y analizan para el contenido de compuestos bioactivos de interés (por ejemplo, lípidos), pero más particularmente, para compuestos que contengan dos o más enlaces insaturados, y más preferiblemente tres o más dobles enlaces, e incluso más preferiblemente cuatro o más dobles enlaces. Para lípidos, estas cepas que poseen dichos compuestos de más de aproximadamente el 5 %, y más preferiblemente más de aproximadamente el 10 %, y más preferiblemente más de aproximadamente el 15 %, e incluso más preferiblemente más de aproximadamente el 20 % del peso seco del microorganismo se identifican como que contienen de forma predecible un nuevo sistema PKS del tipo descrito anteriormente. Para otros compuestos bioactivos, tales como antibióticos o compuestos que se sintetizan en cantidades más pequeñas, esas cepas que poseen dichos compuestos a más de aproximadamente el 0,5 %, y más preferiblemente más de aproximadamente el 0,1 %, y más preferiblemente más de aproximadamente el 0,25 %, y más preferiblemente más de aproximadamente el 0,5 %, y más preferiblemente más de aproximadamente el 0,75 %, y más preferiblemente más de aproximadamente el 1 %, y más preferiblemente más de aproximadamente el 2,5 %, y más preferiblemente más de aproximadamente el 5 % del peso seco del microorganismo se identifican como que contienen de forma predecible un nuevo sistema PKS del tipo descrito anteriormente.
Como alternativa, o junto con este método, pueden identificarse cepas microbianas potenciales que contienen nuevos sistemas PUFA PKS como se describe en este documento examinando el perfil de ácidos grasos de la cepa (obtenida por cultivo del organismo o a través de fuentes publicadas u otras fuentes fácilmente disponibles). Si el microbio contiene más de aproximadamente el 30 %, y más preferiblemente más de aproximadamente el 40 %, y más preferiblemente más de aproximadamente el 45 %, e incluso y más preferiblemente más de aproximadamente el 50 %, de sus ácidos grados totales como C14:0, C16:0 y/o C16:1, aunque produciendo también al menos un ácido graso de cadena larga con tres o más enlaces insaturados, y más preferiblemente 4 o más dobles enlaces, y más preferiblemente 5 o más dobles enlaces, e incluso más preferiblemente 6 o más dobles enlaces, entonces esta cepa microbiana se identifica como un candidato probable a poseer un nuevo sistema PUFA PKS del tipo descrito en esta invención. La selección de este organismo en las condiciones de bajo oxígeno descritas anteriormente, y la confirmación de la producción de moléculas bioactivas que contienen dos o más enlaces insaturados sugeriría la existencia de un nuevo sistema PUFA PKS en el organismo, que podría confirmase adicionalmente por análisis del genoma de los microbios.
El éxito de este método también puede potenciarse seleccionando cepas eucariotas que se sabe que contienen ácidos grasos C17:0 y o C17:1 (junto con los grandes porcentajes de ácidos grasos C14:0, C16:0 y C16:1 descritos anteriormente) -porque los ácidos grados C17:0 y C17:1 son marcadores potenciales para un sistema de producción de ácidos grasos basado o influenciado por bacterias (procariotas). Otro marcador para identificar cepas que contienen nuevos sistemas PUFA PKS es la producción de perfiles simples de ácidos grasos por el organismo. De acuerdo con la presente invención, un "perfil simple de ácidos grasos" se define como 8 o menos ácidos grasos que se producen por la cepa a niveles mayores del 10 % de los ácidos grasos totales.
El uso de cualquiera de estos métodos o marcadores (individualmente o preferiblemente en combinación) posibilitaría a un experto en la materia identificar fácilmente cepas microbianas con alta predicción de contener un nuevo sistema PUFA PKS del tipo descrito en esta invención.
Combinando muchos de los métodos y marcadores descritos anteriormente, se ha desarrollado un nuevo filtro biorracional (usando cultivos en matraz de agitación) para detectar microorganismos que contienen sistemas PKS productores de PUFA. Este sistema de selección se realiza del siguiente modo:
Una parte de un cultivo de la cepa/microorganismo a ensayar se coloca en matraz de agitación con separadores de 250 ml con 500 ml de medio de cultivo (tratamiento aeróbico), y otra parte de cultivo de la misma cepa se coloca en un matraz de agitación sin separadores de 250 ml con 250 ml de medio de cultivo (tratamiento anóxico/de bajo oxígeno). Pueden emplearse diversos medios de cultivo dependiente del tipo y cepa de microorganismo que se está evaluando. Ambos matraces se colocan en una mesa oscilatoria a 200 rpm. Después de 48-72 horas de tiempo de cultivo, los cultivos se recogen por centrifugación y las células se analizan para el contenido de éster metílico de ácido graso mediante cromatografía de gases para determinar los siguientes datos para cada cultivo: (1) perfil de ácidos grasos; (2) contenido de PUFA; y (3) contenido de grasas (aproximadamente como cantidad total de ácidos grasos/peso seco de la célula).
Estos datos después se analizan haciendo las siguientes cinco preguntas (Sí/No):
Comparación de los datos del matraz de bajo O2/anóxico con los datos del matraz aeróbico:
- (1)
- ¿El DHA (u otro contenido de PUFA) (como % FAME (ésteres metílicos de ácido graso)) permanece aproximadamente igual o preferiblemente aumentado en el cultivo de bajo oxígeno en comparación con el cultivo aeróbico?
- (2)
- ¿Es C14:0 + C16:0 + C16:1 mayor de aproximadamente el 40 % de TFA en el cultivo anóxico?
- (3)
- ¿Existen muy pocos (<1 % como FAME) o ningún precursor (C18:3n-3 + C18:2n-6+C18:3n-6) para la ruta convencional de elongasa/desaturasa dependiente de oxígeno en el cultivo anóxico?
- (4)
- ¿Aumentó el contenido de grasas (como cantidad total de ácidos grasos/peso seco de la célula) en el cultivo de bajo oxígeno en comparación con el cultivo aeróbico?
- (5)
- ¿Aumentó DHA (u otro contenido de PUFA) como % de peso seco de la célula en el cultivo de bajo oxígeno en comparación con el cultivo aeróbico?
Si las tres primeras preguntas se responden sí, esta es un buen indicio de que la cepa contiene un sistema genético PKS para fabricar PUFA de cadena larga. Cuantas más preguntas se contesten sí (preferiblemente las tres primeras peguntas deben contestarse sí), más fuerte es el indicio de que la cepa contiene dicho sistema genético PKS. Si las cinco preguntas se contestan sí, entonces hay un indicio muy fuerte de que la cepa contiene un sistema genético PKS para fabricar PUFA de cadena larga. La ausencia de 18:3n-3/18:2n-6/18:3n-6 indicaría que las condiciones de bajo oxígeno habrían inactivado o inhibido la ruta convencional para la síntesis de PUFA. Un ácido graso alto 14:0/16:0/16:1 es un indicador preliminar de un perfil de síntesis de ácidos grasos influenciado de forma bacteriana (la presencia de C17:0 y 17:1 también es un indicador de esto) y de un perfil simple de ácidos grasos. La síntesis aumentada de PUFA y la síntesis de grasas que contienen PUFA en las condiciones de bajo oxígeno son directamente indicativas de un sistema PUFA PKS, ya que este sistema no requiere oxígeno para fabricar ácidos grasos altamente insaturados.
Finalmente, en el método de identificación, una vez identificado un fuerte candidato, el microbio se selecciona preferiblemente para detectar si el microbio contiene o no un sistema PUFA PKS. Por ejemplo, puede seleccionarse el genoma del microbio para detectar la presencia de una o más secuencias de ácido nucleico que codifiquen un dominio de un sistema PUFA PKS como se describe en este documento. Preferiblemente, esta etapa de detección incluye un método adecuado de detección de ácido nucleico, tal como hibridación, amplificación y/o secuenciación de una o más secuencias de ácido nucleico en el microbio de interés. Las sondas y/o cebadores usados en los métodos de detección pueden derivarse de cualquier sistema PUFA PKS conocido, incluyendo los sistemas PUFA PKS de bacterias marinas descritos en la patente de Estados Unidos n.º 6.140.486 o los sistemas PUFA PKS de traustoquitridio descritos en la solicitud de Estados Unidos n.º de serie 09/231.899 y en este documento. Una vez se han identificado nuevos sistemas PUFA PKS, también puede usarse el material genético de estos sistemas para detectar nuevos sistemas PUFA PKS adicionales. Los métodos de hibridación, amplificación y secuenciación de ácidos nucleicos con el fin de identificar y detectar una secuencia son bien conocidos en la técnica. Usando estos métodos de detección, puede evaluarse la homología de secuencia y estructura de dominios, (por ejemplo, la presencia, cantidad y/o disposición de diversos dominios funcional de PUFA PKS) y compararse con los sistemas PUFA PKS conocidos descritos en este documento.
Puede identificarse un sistema PUFA PKS usando ensayos biológicos. Por ejemplo, en la solicitud de Estados Unidos n.º de serie 09/231.899, Ejemplo 7, se describen los resultados de un experimento clave usando un inhibidor bien conocido de algunos tipos de sistemas de síntesis de ácidos grasos, es decir, tiolactomicina. Los inventores demostraron que la síntesis de PUFA en células completas de Schizochytrium podría bloquearse específicamente sin bloquear la síntesis de ácidos grasos saturados de cadena corta. El significado de ese resultado es el siguiente: los inventores conocían a partir del análisis de las secuencias de ADNc de Schizochytrium que está presente un sistema de ácido grado sintasa Tipo I en Schizochytrium. Se sabía que la tiolactomicina no inhibe sistemas FAS Tipo I, y esto es coherente con los datos de los inventores -es decir, la producción de los ácidos grasos saturados (principalmente C 14:0 y C16:0 en Schizochytrium) no se inhibía por el tratamiento con tiolactomicina. No hay indicaciones en la bibliografía o en los propios datos de los inventores de que la tiolactomicina tengan ningún inhibidor sobre la elongación de ácidos grasos C14:0 o C16:0 o su desaturación (es decir, la conversión de ácidos grasos saturados de cadena corta, en PUFA mediante la ruta clásica). Por lo tanto, el hecho de que la producción de PUFA en Schizochytrium se bloqueara por tiolactomicina indica fuertemente que la ruta clásica de síntesis de PUFA no producen los PUFA en + Schizochytrium, sino que en su lugar está implicada una ruta diferente de síntesis. Además, se había determinado previamente que el sistema PUFA PKS de Shewanella se inhibe por tiolactomicina (obsérvese que el sistema PUFA PKS de la presente invención tiene elementos de sistemas tanto Tipo I como Tipo II), y se sabía que la tiolactomicina es un inhibidor de los sistemas FAS Tipo II (tal como el encontrado en E. coli).
Por lo tanto, este experimento indicó que Schizochytrium producía PUFA como resultado de una ruta que no implica FAST Tipo I. Podría usarse un fundamento y etapa de detección similares para detectar un sistema PUFA PKS en un microbio identificado usando el nuevo método de selección descrito en este documento.
Además, el Ejemplo 3 muestra datos bioquímicos adicionales que proporcionan evidencias de que no se producen PUFA en Schizochytrium mediante la ruta clásica (es decir, no se observa cinética de producto precursor entre C16:0 y DHA en células completas y, puede separarse la síntesis de PUFA in vitro de la fracción de membrana todas las ácido graso desaturasas de la ruta clásica de síntesis de PUFA, con la excepción de la delta 9 desaturasa que inserta el primer doble enlace de la serie, están asociadas con membranas celulares). Este tipo de datos bioquímicos podría usarse para detectar actividad PUFA PKS en microbios identificados por el nuevo método de selección descrito anteriormente.
Las cepas microbianas a seleccionar usando el método de selección/identificación de la presente invención se eligen entre el grupo que consiste en: bacterias, algas, hongos, protozoos o protistas, pero muy preferiblemente entre los microbios eucariotas que consisten en algas, hongos, protozoos y protistas. Estos microbios son preferiblemente capaces de crecer y producir los compuestos bioactivos que contienen dos o más enlaces insaturados a temperaturas mayores de aproximadamente 15 ºC, más preferiblemente mayores de aproximadamente 20 ºC e incluso más preferiblemente mayores de aproximadamente 25 ºC y mucho más preferiblemente mayores de aproximadamente 30 ºC.
Pueden identificarse nuevos sistemas PUFA PKS bacterianos en bacterias que producen PUFA a temperaturas que exceden aproximadamente 20 ºC, preferiblemente que exceden aproximadamente 25 ºC e incluso más preferiblemente que exceden aproximadamente 30 ºC. Como se ha descrito previamente en este documento, las bacterias marinas Shewanella y Vibrio marinus, descritas en la patente de Estados Unidos n.º 6.140.486, no producen PUFA a temperaturas mayores, lo que limita la utilidad de sistemas PUFA PKS derivados de estas bacterias, particularmente en aplicaciones en plantas en condiciones de campo. Por lo tanto, en una realización, el método de selección de la presente invención puede usarse para identificar bacterias que tengas un sistema PUGA PKS que sea capaz de crecer y producir PUFA a temperaturas mayores (por ejemplo, por encima de aproximadamente 20, 25 o 30 ºC). Pueden añadirse inhibidores de crecimiento eucariota tales como nistatina (antifúngico) o cicloheximida (inhibidor de la síntesis de proteínas eucariotas) a placas de agar usadas para cultivar/seleccionar cepas iniciales de muestras de agua/muestras de suelo recogida de los tipos de hábitats/nichos descritos a continuación. Este proceso podría ayudar a seleccionar el enriquecimiento de cepas bacterianas sin (o mínima) contaminación de cepas eucariotas. Este proceso de selección, en combinación con el cultivo de las placas a elevadas temperaturas (por ejemplo 30 ºC), y después la selección de las cepas que producen al menos un PUFA identificaría inicialmente cepas bacterianas candidatas con un sistema PUFA PKS que es funcional a elevadas temperaturas (en oposición a esas cepas bacterianas de la técnica anterior que solamente muestran producción de PUFA a temperaturas menores de aproximadamente 20 ºC y más preferiblemente por debajo de aproximadamente 5 ºC).
Las localizaciones para la recogida de los tipos preferidos de microbios para la selección de un sistema PUFA PKS de acuerdo con la presente invención incluyen cualquiera de las siguientes: entornos de bajo oxígeno (o localizaciones cerca de estos tipos de entornos de bajo oxígeno incluyendo en los intestinos de animales incluyendo invertebrados que consumen microbios o alimentos que contienen microbios (incluyendo tipos de organismos de alimentación por filtración), hábitats acuáticos que contienen bajo oxígeno o nada de oxígeno (incluyendo de agua dulce, salinos y marinos), y especialmente en o cerca de entornos de bajo oxígeno (regiones) en los océanos. Las cepas microbianas preferiblemente no serían anaerobios obligados sino que estarían adaptados a vivir en entornos tanto aeróbicos como bajos o anóxicos. Los entornos de suelo que contienen entornos tanto anaeróbicos como de bajo oxígeno o anóxicos también serían entornos excelentes para encontrar estos organismos y especialmente en estos tipos de suelo en hábitats acuáticos o hábitats acuáticos temporales.
Una cepa microbiana particularmente preferida sería una cepa (seleccionada entre el grupo que consiste en algas, hongos (incluyendo levaduras), protozoos o protistas) que, durante una parte de su ciclo vital, es capaz de consumir células bacterianas completas (bacterívoro) por mecanismos tales como fagocitosis, capacidad fagocítica o endocítica y/o tiene una fase de su ciclo vital en que existe como fase ameboide o protoplasto desnudo. Este método de nutrición aumentaría enormemente el potencial de transferencia de un sistema PKS bacteriano a una célula eucariota si sucediera un error y la célula bacteriana (o su ADN) no se digiriera y en su lugar se incorporara de forma funcional a la célula eucariota.
Las cepas de microbios (diferentes de los miembros de los traustoquitridios) con capacidad de bacterívoro (especialmente por fagocitosis o endocitosis) pueden encontrarse en las siguientes clases microbianas (incluyendo aunque sin limitación los géneros ejemplares):
En las algas y microbios tipo algas (incluyendo estramenópilos): de la clase Euglenophyceae (por ejemplo, géneros Euglena, y Peranema), la clase Chrysophyceae (por ejemplo, el género Ochromonas), la clase Dinobryaceae (por ejemplo, los géneros Dinobryon, Platychrysis, y Chrysochromulina), la Dinophyceae (incluyendo los géneros Crypthecodinium, Gymnodinium, Peridinium, Ceratium, Gyrodinium, y Oxyrrhis), la clase Cryptophyceae (por
ejemplo, los géneros Cryptomonas, y Rhodomonas), la clase Xanthophyceae (por ejemplo, el género Olisthodiscus) (e incluyendo formas de algas en que existe una fase ameboide como en los flagelados Rhizochloridaceae, y zoosporas/gametos de Aphanochaete pascheri, Bumilleria stigeoclonium y Vaucheria geminata), la clase Eustigmatophyceae, y la clase Prymnesiopyceae (incluyendo los géneros Prymnesium y Diacronema).
En los estramenópilos incluyendo los: Proteromonas, Opalinas, Developayella, Diplopterys, Labirintúlidos, Traustoquitridios, Bicosoecidas, Oomicetes, Hipoquitridiomicetes, Commation, Reticulosphaera, Pelagomonas, Pelapococcus, Ollicola, Aureococcus, Parmales, Raphidiofitos, Synuridos, Rhizochromulinaales, Pedinellales, Dictyochales, Chrysomeridales, Sarcinochrysidales, Hydrurales, Hibberdiales, y Chromulinales.
En los Hongos: clase Mixomicetes (forma mixameba) -moho mucilaginoso, clase Acrasieae incluyendo los órdenes Acrasiceae (por ejemplo, el género Sappinia), clase Guttulinaceae (por ejemplo, los géneros Guttulinopsis, y Guttulina), clase Dictysteliaceae (por ejemplo, los géneros Acrasis, Dictyostelium, Polysphondylium, y Coenonia), y clase Phycomyceae incluyendo los órdenes Chytridiales, Ancylistales, Blastocladiales, Monoblepharidales, Saprolegniales, Peronosporales, Mucorales, y Entomophthorales.
En los Protozoos: cepas de Protozoos con fases vitales con capacidad de bacterívoro (incluyendo por fagocitosis) pueden seleccionarse entre los tipos clasificados como ciliados, flagelados o amebas. Protozoos ciliados incluyen los grupos: Chonotriches, Colpodides, Cyrtophores, Haptorides, Karyorelictes, Oligohymenophora, Polyhymenophora (espirotricos), Prostomes y Suctoria. Protozoos flagelados incluyen los Biosoecidas, Bodonidas, Cercomonadas, Crisofitos (por ejemplo, los géneros Anthophysa, Chrysamoemba, Chrysosphaerella, Dendromonas, Dinobryon, Mallomonas, Ochromonas, Paraphysomonas, Poterioochromonas, Spumella, Syncrypta, Synura, y Uroglena), flagelados Collar, Criptófitos (por ejemplo, los géneros Chilomonas, Cryptomonas, Cyanomonas, y Goniomonas), Dinoflagelados, Diplomonados, Euglenoides, Heterolobosea, Pedinellidos, Pelobiontes, Phalansteriidos, Pseudodendromonadas, Spongomonadas y Volvocales (y otros flagelados incluyendo los géneros de flagelados no asignados de Artodiscus, Clautriavia, Helkesimastix, Kathablepharis y Multicilia). Protozoos ameboides incluyen los grupos: Actinophryidos, Centrohelidos, Desmothoricidos, Diplophryidos, Eumamoebae, Heterolobosea, Leptomyxidos, ameba filosa Nucleariid, Pelebiontes, amebas Testate y Vampyrellidos (e incluyendo los géneros ameboides no asignados Gymnophrys, Biomyxa, Microcometes, Reticulomyxa, Belonocystios, Elaeorhanis, Allelogromia, Gromia o Lieberkuhnia). Los órdenes de protozoos incluyen los siguientes: Percolomonadeae, Heterolobosea, Lyromonadea, Pseudociliata, Trichomonadea, Hypermastigea, Heteromiteae, Telonemea, Cyathobodonea, Ebridea, Pyytomyxea, Opalinea, Kinetomonadea, Hemimastigea, Protostelea, Myxagastrea, Dictyostelea, Choanomonadea, Apicomonadea, Eogregarinea, Neogregarinea, Coelotrolphea, Eucoccidea, Haemosporea, Piroplasmea, Spirotrichea, Prostomatea, Litostomatea, Phyllopharyngea, Nassophorea, Oligohymenophorea, Colpodea, Karyorelicta, Nucleohelea, Centrohelea, Acantharea, Sticholonchea, Polycystinea, Phaeodarea, Lobosea, Filosea, Athalamea, Monothalamea, Polythalamea, Xenophyophorea, Schizocladea, Holosea, Entamoebea, Myxosporea, Actinomyxea, Halosporea, Paramyxea, Rhombozoa y Orthonectea.
Describimos cepas de los microorganismos enumerados anteriormente que se han recogido de uno de los hábitats preferidos enumerados anteriormente.
Describimos microorganismos identificados usando el nuevo método de detección de PUFA PKS descrito anteriormente, los genes PUFA PKS y proteínas codificados por el mismo, y el uso de dichos microorganismos y/o de genes y proteínas de PUFA PKS (incluyendo homólogos y fragmentos de los mismos) en cualquiera de los métodos descritos en este documento. En particular, se identificaron organismos por el método de selección que después se modificaron genéticamente para regular la producción de moléculas bioactivas por dicho sistema PUFA PKS.
La presente invención se refiere a una molécula de ácido nucleico aislada que consiste en una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo o fragmento biológicamente activo del mismo de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS) de un microorganismo traustroquitridio. Como se ha analizado anteriormente, los presentes inventores han usado de forma satisfactoria el método para identificar un microorganismo no bacteriano que tenga un sistema PUFA PKS para identificar miembros adicionales del orden Traustroquitriales que contengan un sistema PUFA PKS. La identificación de tres de estos microorganismos se describe en el Ejemplo 2. Específicamente, los presentes inventores han usado el método de selección de la presente invención para identificar Thraustochytrium sp. 23B (ATCC 20892) como con alta predicción de contener un sistema PUFA PKS, seguido por detección de secuencias en el genoma de Thraustochytrium sp. 23B que hibrida con los genes de PUFA PKS de Schizochytrium descritos en este documento. También se han identificado Schizochytrium limacium (IFO 32693) y Ulkenia (BP-5601) como buenos candidatos para contener sistemas PUFA PKS. En base a estos datos y a las similitudes entre miembros del orden Traustroquitriales, se cree que ahora pueden identificarse fácilmente muchos otros sistemas PUFA PKS de Traustroquitriales usando los métodos y herramientas proporcionados por la presente invención. Por lo tanto, los sistemas PUFA PKS de Traustroquitriales y partes y/u homólogos de los mismos (por ejemplo, proteínas, dominios y fragmentos de los mismos), organismos modificados genéticamente que comprenden dichos sistemas y partes y/u homólogos de los mismos y métodos para usar dichos microorganismos y sistemas PUFA PKS, están abarcados por la presente invención.
Los avances han provocado la revisión de la taxonomía de los traustroquitridios. Los teóricos taxonómicos colocan a los traustroquitridios con las algas o protistas tipo algas. Sin embargo, a causa de la inexactitud taxonómica, sería mejor para los propósitos de la presente invención considerar las cepas descritas en la presente invención como traustroquitridios (Orden: Traustroquitriales; Familia: Thraustochytriaceae; Género: Thraustochytrium, Schizochytrium, Labyrinthuloides, o Japonochytrium). Para la presente invención, los miembros de los labirintúlidos se consideran incluidos en los traustroquitridios. Los cambios taxonómicos se resumen a continuación. Las cepas de ciertos microorganismos unicelulares descritos en este documento son miembros del orden Traustroquitriales. Los traustroquitridios son eucariotas marinos con una historia taxonómica evolutiva. Los problemas con la colocación taxonómica de los traustroquitridios se han revisado por Moss (1986), Bahnweb y Jackle (1986) y Chamberlain y Moss (1988). De acuerdo con la presente invención, las expresiones "traustroquitridio", "microorganismo de Traustroquitriales" y "microorganismo del orden Traustroquitriales " pueden usarse de forma intercambiable.
Para propósitos de conveniencia, los taxónomos colocaron en primer lugar los traustoquitridios con otros eucariotas zoospóricos incoloros en los Ficomicetes (hongos tipo alga). El nombre Ficomicetes, sin embargo, se bajó finalmente de estatus taxonómico, y los traustoquitridios se retuvieron en los Oomicetes (los hongos zoospóricos biflagelados). Inicialmente se asumió que los Oomicetes estaban relacionados con las algas Heterokonta, y finalmente un amplio intervalo de estudios de ultra-estructura y bioquímicos, resumidos por Barr (Barr, 1981, Biosystems 14:359-370) apoyaron esta suposición. Los Oomicetes estaban de hecho aceptados por Leedale (Leedale, 1974, Taxon 23:261270) y otros ficólogos como parte de las algas Heterokonta. Sin embargo, por cuestión de conveniencia resultante de su naturaleza heterotrófica, los Oomicetes y los traustoquitridios se han estudiado en gran medida por los micólogos (científicos que estudian los hongos) en lugar de los ficólogos (científicos que estudian las algas).
Desde otra perspectiva taxonómica, los biólogos evolutivos han desarrollado dos escuelas de pensamiento generales del modo en que evolucionan los eucariotas. Una teoría propone un origen exógeno de orgánulos unidos a membrana a través de una serie de endosimbiosis (Margulis, 1970, Origin of Eukaryotic Cells. Yale University Press, New Haven); por ejemplo, las mitocondrias se obtuvieron de endosimbiosis bacteriana, los cloroplastos de cianofitos, y los flagelos de espiroquetas. La otra teoría sugiere una evolución gradual de los orgánulos unidos a membrana a partir de los sistemas no unidos a membrana del ancestro procariota mediante un proceso autógeno (Cavalier-Smith, 1975, Nature (Lond.) 256:462-468). Sin embargo, ambos grupos de biólogos evolutivos han retirado los Oomicetes y los traustoquitridios de los hongos y los han colocados con las algas cromofitas en el reino Chromophyta (Cavalier-Smith, 1981, BioSystems 14:461-481) (este reino se ha expandido más recientemente para incluir otros protistas y los miembros de este reino se llaman ahora estramenópilos) o con todas las algas en el reino Protoctista (Margulis y Sagen, 1985, Biosystems 18:141-147).
Con el desarrollo de microscopia electrónica, estudios sobre la ultra-estructura de las zoosporas de dos géneros de traustoquitridios, Thraustochytrium y Schizochytrium, (Perkins, 1976, pág. 279-312 en "Recent Advances in Aquatic Mycology" (ed. E.B.G. Jones), John Wiley y Sons, Nueva York; Kazama, 1980, Can. J. Bot. 58:2434-2446; Barr, 1981, Biosystems 14:359-370) han proporcionado buenas evidencias de que Thraustochytriaceae están relacionados solamente de forma distante con los Oomicetes. Adicionalmente, los datos genéticos que representan una análisis de correspondencia (una forma de estadística multivariada) de secuencias de ARN ribosómico 5 S indican que los Traustoquitriales son claramente un grupo único de eucariotas, completamente separado de los hongos, y muy estrechamente relacionado con las algas rojas y pardas, y con miembros de los Oomicetes (Mannella, et al., 1987, Mol. Evol. 24:228-235). La mayoría de los taxonomistas han acordado retirar los traustoquitridios de los Oomicetes (Bartnicki-Garcia, 1987, pág. 389-403 en "Evolutionary Biology of the Fungi" (eds. Rayner, A.D.M., Brasier, C.M. y Moore, D.), Cambridge University Press, Cambridge). En resumen, empleando el sistema taxonómico de Cavalier-Smith (Cavalier-Smith, 1981, BioSystems 14:461-481, 1983; Cavalier-Smith, 1993, Microbiol Rev. 57:953-994), los traustoquitridios se clasifican con las algas cromofitas en el reino Chromophyta (estramenópilos). Esta colocación taxonómica se ha reafirmado más recientemente por Cavalier-Smith et al. usando las características de ARNr 18s del Heterokonta para demostrar que los traustoquitridios son cromistas no hongos (Cavalier-Smith et al., 1994, Phil. Tran. Roy. Soc. London Series BioSciences 346:387-397). Esto los coloca en un reino completamente diferente de los hongos, que están todos colocados en el reino Eufungi. La colocación taxonómica de los traustoquitridios por lo tanto se resume del siguiente modo:
Reino: Chromophyta (estramenópilos)
Filo: Heterokonta
Orden: Traustoquitriales
Familia: Thraustochytriaceae
Género: Thraustochytrium, Schizochytrium, Labyrinthuloides, o Japonochytrium
Algunos de los primeros taxónomos separaron unos pocos miembros originales del género Thraustochytrium (aquellos con una fase de vida ameboide) en un género diferente llamado Ulkenia. Sin embargo, ahora se sabe que
la mayoría, sino todos, los traustoquitridios (incluyendo Thraustochytrium y Schizochytrium), muestran fases ameboides y, por tanto, Ulkenia no se considera por nadie como un género válido. Como se usa en este documento, el género Thraustochytrium incluirá Ulkenia.
A pesar de la inexactitud de la colocación taxonómica con clasificaciones superiores de Filo y Reino, los traustoquitridios siguen siendo una agrupación distintiva y característica cuyos miembros siguen siendo clasificables dentro del orden Traustoquitriales.
Los ácidos grasos poliinsaturados (PUFA) son componentes esenciales de membrana en eucariotas superiores y los precursores de muchas moléculas de señalización derivadas de lípidos. El sistema PUFA PKS de la presente invención usa rutas para la síntesis de PUFA que no requieren desaturación y elongación de ácidos grasos saturados. Las rutas catalizadas por PUFA PKS son distintas de las PKS previamente reconocidas tanto en estructura como en mecanismo. Se sugiere que la generación de dobles enlaces cis implica isomerasas específicas de posición; se cree que estas enzimas son útiles en la producción de nuevas familias de antibióticos.
Para producir rendimientos significativamente elevados de diversas moléculas bioactivas usando el sistema PUFA PKS de la presente invención, un organismo, preferiblemente un microorganismo o una planta, puede modificarse genéticamente para afectar a la actividad de un sistema PUFA PKS. En un aspecto, dicho organismo puede contener de forma endógena y expresar un sistema PUFA PKS, y la modificación genética puede ser una modificación genética de uno o más de los dominios funcionales del sistema PUFA PKS endógeno, mediante lo cual la modificación tiene algún efecto sobre la actividad del sistema PUFA PKS. En otro aspecto, dicho organismo puede contener de forma endógena y expresar un sistema PUFA PKS, y la modificación genética puede ser una introducción de al menos una secuencia exógena de ácido nucleico (por ejemplo, una molécula de ácido nucleico recombinante), donde la secuencia exógena de ácido nucleico codifica al menos un dominio o proteína biológicamente activa de un segundo sistema PKS y/o una proteína que afecta a la actividad de dicho sistema PUFA PKS (por ejemplo, una fosfopanteteinil transferasa (PPTasa), analizada a continuación). En otro aspecto más, el organismo no contiene necesariamente de forma endógena (de forma natural) un sistema PUFA PKS, pero se modifica genéticamente para introducir al menos una molécula de ácido nucleico recombinante que codifique una secuencia de aminoácidos que tenga la actividad biológica de al menos un dominio de un sistema PUFA PKS. En este aspecto, la actividad de PUFA PKS se ve afectada por la introducción o aumento de la actividad de PUFA PKS en el organismo. Diversas realizaciones asociadas con cada uno de estos aspectos se analizarán en mayor detalle a continuación.
Por lo tanto, de acuerdo con la presente invención, una realización se refiere a un microorganismo modificado genéticamente, donde el microorganismo expresa un sistema PKS que comprende al menos un dominio biológicamente activo de acuerdo con la presente invención de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS).
La modificación genética afecta a la actividad del sistema PKS en el organismo. El proceso de selección mencionado en la parte (b) se ha descrito en detalle anteriormente e incluye las etapas de: (a) seleccionar un microorganismo que produce al menos un PUFA; y, (b) identificar un microorganismo de (a) que tenga capacidad de producir PUFA aumentados en condiciones de oxígeno disuelto de menos de aproximadamente el 5 % de saturación en el medio de fermentación, en comparación con la producción de PUFA por el microorganismo en condiciones de oxígeno disuelto de más de aproximadamente el 5 % de saturación, y preferiblemente aproximadamente el 10 %, y más preferiblemente aproximadamente el 15 %, y más preferiblemente aproximadamente el 20 % de saturación en el medio de fermentación. El microorganismo modificado genéticamente descrito en este documento puede incluir una cualquiera o más de las secuencias de ácido nucleico identificadas anteriormente, y/o cualquiera de los otros homólogos de cualquier ORF o dominio de PUFA PKS de Schizochytrium descrito en detalle anteriormente.
Como se usa en este documento, un microorganismo modificado genéticamente puede incluir una bacteria, protista, microalga, hongo, u otro microbio modificado genéticamente y, particularmente, cualquiera de los géneros del orden Traustoquitriales (por ejemplo, un traustoquitridio) descrito en este documento (por ejemplo, Schizochytrium, Thraustochytrium, Japonochytrium, Labyrinthuloides). Dicho microorganismo modificado genéticamente tiene un genoma que está modificado (es decir, mutado o cambiado) a partir de su forma normal (es decir, de tipo silvestre o de origen natural) de modo que se consiga el resultado deseado (es decir, actividad PUFA PKS aumentada o modificada y/o producción de un producto deseado usando el sistema PKS). La modificación genética de un microorganismo puede conseguirse usando técnicas de desarrollo clásico de cepas y/o técnicas genéticas moleculares. Dichas técnicas son conocidas en la técnica y se describen en líneas generales para microorganismos, por ejemplo, en Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press. La referencia Sambrook et al., ibid, se incorpora por referencia en este documento en su totalidad. Un microorganismo modificado genéticamente puede incluir un microorganismo en que se han insertado, delecionado o modificado moléculas de ácido nucleico (es decir, mutado; por ejemplo, por inserción, deleción, sustitución y/o inversión de nucleótidos), de tal modo que dichas modificaciones proporcionan el efecto deseado dentro del microorganismo.
Las células hospedadoras del microorganismo preferido a modificar de acuerdo con la presente invención incluyen, aunque sin limitación, cualquier bacteria, protista, microalga, hongo o protozoo. En un aspecto, los microorganismos
preferidos para modificar genéticamente incluyen, aunque sin limitación, cualquier microorganismo del orden Traustoquitriales. Células hospedadoras particularmente preferidas para su uso en la presente invención podrían incluir microorganismo de un género que incluye, aunque sin limitación: Thraustochytrium, Labyrinthuloides, Japonochytrium, y Schizochytrium. Especies preferidas dentro de estos géneros incluyen, aunque sin limitación: cualquier especie de Schizochytrium, incluyendo Schizochytrium aggregatum, Schizochytrium limacinum, Schizochytrium minutum; cualquier especie de Thraustochytrium (incluyendo las antiguas especies Ulkenia tales como U. visurgensis, U. amoeboida, U. sarkariana, U. profunda, U. radiata, U. minuta y Ulkenia sp. BP-5601), e incluyendo Thraustochytrium striatum, Thraustochytrium aureum, Thraustochytrium roseum; y cualquier especie de Japonochytrium. Cepas particularmente preferidas de Traustoquitriales incluyen, aunque sin limitación: Schizochytrium sp. (S31)(ATCC 20888); Schizochytrium sp. (S8)(ATCC 20889); Schizochytrium sp. (LC-RM)(ATCC 18915); Schizochytrium sp. (SR21); Schizochytrium aggregatum (Goldstein et Belsky)(ATCC 28209); Schizochytrium limacinum (Honda et Yokochi)(IFO 32693); Thraustochytrium sp. (23B)(ATCC 20891); Thraustochytrium striatum (Schneider)(ATCC 24473); Thraustochytrium aureum (Goldstein)(ATCC 34304); Thraustochytrium roseum (Goldstein)(ATCC 28210); y Japonochytrium sp. (L1)(ATCC 28207). Otros ejemplos de microorganismos hospedadores adecuados para modificación genética incluyen, aunque sin limitación, levaduras incluyendo Saccharomyces cerevisiae, Saccharomyces carlsbergensis, u otra levadura como Candida, Kluyveromyces, u otros hongos, por ejemplo, hongos filamentosos tales como Aspergillus, Neurospora, Penicillium, etc. También pueden usarse células bacterianas como hospedadores. Estas incluyen Escherichia coli, que puede ser útil en procesos de fermentación. Como alternativa, puede usarse un hospedador tal como una especie de Lactobacillus o una especie de Bacillus como hospedador.
Otra realización de la presente invención se refiere a una planta modificada genéticamente, donde la planta se ha modificado genéticamente para que exprese de forma recombinante un sistema PKS que comprende al menos un dominio biológicamente activo de acuerdo con la invención de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS).
La planta modificada genéticamente puede incluir uno cualquiera o más de las secuencias de ácido nucleico identificadas anteriormente, y/o cualquiera de los otros homólogos de cualquiera de las ORF o dominios de PUFA PKS de Schizochytrium descritos en detalle anteriormente.
Como se usa en este documento, una planta modificada genéticamente puede incluir cualquier planta modificada genéticamente incluyendo plantas superiores y particularmente, cualquier planta consumible u plantas útiles para producir una molécula bioactiva deseada de la presente invención. Dicha planta modificada genéticamente tiene un genoma que está modificado (es decir, mutado o cambiado) a partir de su forma normal (es decir, de tipo silvestre o de origen natural) de modo que consiga el resultado deseado (es decir, actividad PUFA PKS aumentada o modificada y/o producción de un producto deseado usando el sistema PKS). La modificación genética de una planta puede conseguirse usando técnicas clásicas de desarrollo de cepas y/o técnicas de genética molecular. Los métodos para producir una planta transgénica, donde se incorpora una molécula de ácido nucleico recombinante que codifica una secuencia deseada de aminoácidos en el genoma de la planta, son conocidos en la técnica. Una planta preferida para modificar genéticamente de acuerdo con la presente invención es preferiblemente una planta adecuada para consumo por animales, incluyendo seres humanos.
Las plantas preferidas para modificar genéticamente de acuerdo con la presente invención (es decir, células hospedadoras vegetales) incluyen, aunque sin limitación, cualquier planta superior, y particularmente plantas consumibles, incluyendo planta de cultivo y especialmente plantas usadas por sus aceites. Dichas plantas pueden incluir, por ejemplo: canola, soja, colza, linaza, maíz, cártamo, girasol y tabaco. Otras plantas preferidas incluyen aquellas plantas que son conocidas por producir compuestos usados como agentes farmacéuticos, agentes aromatizantes, agentes nutracéuticos, ingredientes alimenticios funcionales o agentes cosméticamente activos o plantas que se modifican por ingeniería genética para producir estos compuestos/agentes.
De acuerdo con la presente invención, un microorganismo o planta modificado genéticamente incluye un microorganismo o planta que se ha modificado usando tecnología recombinante. Como se usa en este documento, las modificaciones genéticas que provocan una disminución en la expresión génica, en la función del gen, o en la función del producto génico (es decir, la proteína codificada por el gen) pueden mencionarse como inactivación (completa o parcial), deleción, interrupción, bloqueo o regulación negativa de un gen. Por ejemplo, una modificación genética en un gen que provoca una disminución en la función de la proteína codificada por dicho gen, puede ser el resultado de una deleción completa del gen (es decir, el gen no existe, y por lo tanto la proteína no existe), una mutación en el gen que provoca traducción incompleta o ausencia de traducción de la proteína (por ejemplo, la proteína no se expresa), o una mutación en el gen que disminuye o suprime la función natural de la proteína (por ejemplo, se expresa una proteína que tiene actividad o acción enzimática disminuida o ausente. Las modificaciones genéticas que provocan un aumento en la expresión génica o función pueden mencionarse como amplificación, sobreproducción, sobreexpresión, activación, potenciación, adición, o regulación positiva de un gen.
La modificación génica de un microorganismo o planta de acuerdo con la presente invención preferiblemente afecta a la actividad del sistema PKS expresado por la planta, sea el sistema PKS endógeno y modificado genéticamente, endógeno con la introducción de moléculas de ácido nucleico recombinante en el organismo, o proporcionado
completamente por tecnología recombinante. De acuerdo con la presente invención, "afectar a la actividad de un sistema PKS" incluye cualquier modificación genética que cause cualquier cambio o modificación detectable o medible en el sistema PKS expresado por el organismo en comparación con la ausencia de la modificación genética. Un cambio o modificación detectable en el sistema PKS puede incluir, aunque sin limitación: la introducción de actividad del sistema PKS en un organismo de modo que el organismo ahora tenga actividad del sistema PKS medible/detectable (es decir, el organismo no contenía un sistema PKS antes de la modificación genética), la introducción en el organismo de un dominio funcional a partir de un sistema PKS diferente que un sistema PKS expresado de forma endógena por el organismo de modo que se modifique la actividad del sistema PKS (por ejemplo, un dominio de PUFA PKS bacteriano o un dominio de PKS Tipo I se introduce en un organismo que expresa de forma endógena un sistema PUFA PKS no bacteriano), un cambio en la cantidad de una molécula bioactiva producida por el sistema PKS (por ejemplo, el sistema produce más (cantidad aumentada) o menos (cantidad disminuida) de un producto dado en comparación con la ausencia de la modificación genética), un cambio en el tipo de una molécula bioactiva producida por el sistema PKS (por ejemplo, el sistema produce un producto nuevo o diferente, o una variante de un producto que se produce de forma natural por el sistema ), y/o un cambio en la proporción de múltiples moléculas bioactivas producidas por el sistema PKS (por ejemplo, el sistema produce una relación diferente de un PUFA a otro PUFA, produce un perfil completamente diferente de lípidos en comparación con la ausencia de la modificación genética, o sitúa diversos PUFA en diferentes posiciones en un triacilglicerol en comparación con la configuración natural). Dicha modificación genética incluye cualquier tipo de modificación genética e incluye específicamente modificaciones hechas por tecnología recombinante y por mutagénesis clásica.
Debe apreciarse que referencias a aumentar la actividad de un dominio funcional o proteína en un sistema PUFA PKS se refiere a cualquier modificación genética en el organismo que contiene el dominio o proteína (o en el que tiene que introducirse el dominio o proteína) que provoca funcionalidad aumentada del dominio o sistema proteico y puede incluir mayor actividad del dominio o proteína (por ejemplo, actividad específica o actividad enzimática in vivo), inhibición o degradación reducida del dominio o sistema proteico, y sobreexpresión del dominio o proteína. Por ejemplo, puede aumentarse la cantidad de copias del gen, pueden aumentarse los niveles de expresión mediante el uso de un promotor que da mayores niveles de expresión que los del promotor nativo, o puede alterarse un gen por ingeniería genética o mutagénesis clásica para aumentar la actividad del dominio o proteína codificada por el gen.
Asimismo, referencias a disminuir la actividad de un dominio funcional o proteína en un sistema PUFA PKS se refiere a cualquier modificación genética en el organismo que contiene dicho dominio o proteína (o en cual tiene que introducirse el dominio o proteína) que provoca funcionalidad disminuida del dominio o proteína e incluye actividad disminuida del dominio o proteína, inhibición o degradación aumentada del dominio o proteína y una reducción o eliminación de la expresión del dominio o proteína. Por ejemplo, la acción del dominio o proteína de la presente invención puede disminuirse bloqueando o reduciendo la producción del dominio o proteína, "eliminando" el gen o parte del mismo que codifica el dominio o proteína, reduciendo la actividad del dominio o proteína, o inhibiendo la actividad del dominio o proteína. El bloqueo o reducción de la producción de un dominio o proteína puede incluir colocar el gen que codifica el dominio o proteína bajo el control de un promotor que requiere la presencia de un compuesto inductor en el medio de cultivo. Estableciendo las condiciones de modo que el inductor llegue a eliminarse del medio, podría inactivarse la expresión del gen que codifica el dominio o proteína (y por lo tanto, de síntesis proteica). El bloqueo o reducción de la actividad del dominio o proteína también podría incluir el uso de un enfoque de tecnología de escisión similar al descrito en la patente de Estados Unidos n.º 4.743.546, incorporada por referencia en este documento. Para usar este enfoque, el gen que codifica la proteína de interés se clona entre secuencias genéticas específicas que permiten escisión controlada específica del gen a partir del genoma. La escisión podría impulsarse por, por ejemplo, un desplazamiento en la temperatura de cultivo del cultivo, como en la patente de Estados Unidos n.º 4.743.546, o por alguna otra señal física o nutricional.
En una realización de la presente invención, una modificación genética incluye una modificación de una secuencia de ácido nucleico que codifica una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS no bacteriano como se describe en este documento. Dicha modificación puede ser a una secuencia de aminoácidos dentro un sistema PUFA PKS no bacteriano expresado de forma endógena (de forma natural), mediante lo cual un microorganismo que contiene de forma natural dicho sistema se modifica genéticamente por, por ejemplo, mutagénesis clásica y técnicas de selección y/o técnicas de genética molecular, incluyendo técnicas de ingeniería genética. Las técnicas de ingeniería genética pueden incluir, por ejemplo, el uso de un vector recombinante de direccionamiento para delecionar una parte de un gen endógeno, o para remplazar una parte de un gen endógeno con una secuencia heteróloga. Ejemplos de secuencias heterólogas que podrían introducirse en un genoma hospedador incluyen secuencias que codifican al menos un dominio funcional de otro sistema PKS, tal como un sistema PUFA PKS no bacteriano diferente, un sistema PUFA PKS bacteriano, un sistema PKS tipo I, un sistema PKS tipo II, o un sistema PKS modular. Otras secuencias heterólogas a introducir en el genoma de un hospedador incluyen una secuencia que codifica una proteína o dominio funcional que no es un dominio de un sistema PKS, pero que afectará a la actividad del sistema PKS endógeno. Por ejemplo, podría introducirse en el genoma hospedador una molécula de ácido nucleico que codifica una fosfopanteteinil transferasa (analizada a continuación). Se analizan modificaciones específicas que podrían hacerse a un sistema PUFA PKS endógeno en detalle a continuación.
En otro aspecto de esta realización de la invención, la modificación genética puede incluir: (1) la introducción de una molécula de ácido nucleico recombinante que codifica una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema PUFA PKS no bacteriano; y/o (2) la introducción de una molécula de ácido nucleico recombinante que codifica una proteína o dominio funcional que afecta a la actividad de un sistema PUFA PKS, en un hospedador. El hospedador puede incluir:(1) una célula hospedadora que no expresa ningún sistema PKS donde todos los dominios funcionales de un sistema PKS se introducen en la célula hospedadora, y donde al menos un dominio funcional es de un sistema PUFA PKS no bacteriano; (2) una célula hospedadora que expresa un sistema PKS (endógeno o recombinante) que tiene al menos un dominio funcional de un sistema PUFA PKS no bacteriano, donde la molécula introducida de ácido nucleico recombinante puede modificar al menos una función adicional de dominio de PUFA PKS, no bacteriano u otra proteína o dominio que afecte a la actividad del sistema PUFA PKS del hospedador; y (3) Una célula hospedadora que expresa un sistema PKS (endógeno o recombinante) que no incluye necesariamente una función de dominio de un PUFA PKS no bacteriano, y donde la molécula introducida de ácido nucleico recombinante incluye una secuencia de ácido nucleico que codifica al menos un dominio funcional de un sistema PUFA PKS no bacteriano. En otras palabras, la presente invención pretende abarcar cualquier organismo modificado genéticamente (por ejemplo, el microorganismo o planta), donde el organismo comprende al menos una función de dominio de PUFA PKS no bacteriano (de forma endógena o por modificación recombinante), y donde la modificación genética tiene un efecto medible sobre la función del dominio de PUFA PKS no bacteriano o sobre el sistema PKS cuando el organismo comprende un sistema PKS funcional.
Por lo tanto, usando los sistemas PUFA PKS no bacterianos de la presente invención que, por ejemplo, hacen uso de genes de sistemas PUFA PKS de traustroquitridios, puede usarse mezcla génica para ampliar el intervalo de productos PUFA para que incluyan EPA, DHA, ARA, GLA, SDA y otros, así como para producir una amplia diversidad de moléculas bioactivas incluyendo antibióticos, otros compuestos farmacéuticos, y otros productos deseables. El método para obtener estas moléculas bioactivas incluye no solo la mezcla de genes de diversos organismos sino también diversos métodos para modificar genéticamente los genes de PUFA PKS no bacteriana descritos en este documento. El conocimiento de la base genética y la estructura de dominios del sistema PUFA PKS no bacteriano de la presente invención proporcionan una base para diseñar nuevos organismos modificados genéticamente que producirán una diversidad de moléculas bioactivas. Aunque la mezcla y modificación de cualquier dominio de PKS y genes relacionados se contempla por los presentes inventores, a modo de ejemplo, a continuación se analizan diversas manipulaciones posibles del sistema PUFA PKS con respecto a modificación genética y producción de moléculas bioactivas.
Por ejemplo, en una realización, se alteran los productos del sistema PUFA PKS no bacteriano, tales como los producidos por traustroquitridios, modificando el dominio CLF (factor de longitud de cadena). Este dominio es característico de sistemas PKS Tipo II (enzimas disociadas). Su secuencia de aminoácidos muestra homología a dominios KS (pares ceto sintasa), pero carece de la cisteína del sitio activo. CLF puede funcionar determinando la cantidad de ciclos de elongación, y por tanto la longitud de cadena, del producto final. En esta realización de la invención, usando el estado actual del conocimiento sobre la síntesis de FAS y PKS se proporciona una estrategia racional para la producción de ARA mediante modificación dirigida del sistema PUFA PKS no bacteriano. Hay controversia en la bibliografía respecto a la función de CLF en sistema PKS (C. Bisang et al., Nature 401, 502 (1999)) y se pone de manifiesto que otros dominios pueden estar implicados en la determinación de la longitud de cadena del producto final. Sin embargo, es significativo que Schizochytrium produce tanto DHA (C22:6, ω-3) y DPA (C22:5, ω-6). En el sistema PUFA-PKS los dobles enlaces cis se introducen durante la síntesis de la cadena de carbono creciente. Como la colocación de los dobles enlaces ω-3 y ω-6 sucede de forma prematura en la síntesis de las moléculas, se esperaría que afectara a la posterior determinación de la longitud de cadena del producto final. Por tanto, sin deseo de limitarse a teoría alguna, los presentes inventores creen que la introducción de un factor (por ejemplo, CLF) que dirija la síntesis de unidades C20 (el lugar de unidades C22) en el sistema PUFA PKS de Schizochytrium provocará la producción de EPA (C20:5, ω-3) y ARA (C20:4, ω-6). Por ejemplo, en sistemas heterólogos, podría explotarse el CLF sustituyendo directamente un CLF de un sistema productor de EPA (tal como uno de Photobacterium) en el conjunto de genes de Schizochytrium. Los ácidos grasos de los transformantes resultantes pueden analizarse posteriormente para alteraciones en los perfiles para identificar los transformantes que producen EPA y/o ARA.
Además de la dependencia en el desarrollo de un sistema heterólogo (sistema recombinante, tal como podría introducirse en plantas), el concepto de CLF puede explotarse en Schizochytrium (es decir, por modificación de un genoma de Schizochytrium). Se ha demostrado la transformación y recombinación homóloga en Schizochytrium. Puede explotarse esto construyendo un clon con el CLF de OrfB remplazado con un CLF de un sistema C20 PUFA PKS. Se insertará un gen marcador cadena abajo de la región codificante. Después pueden transformarse las células de tipo silvestre, seleccionar el fenotipo marcador y después detectar aquellos que hubieran incorporado el nuevo CLF. De nuevo, se analizarían estos para cualquier efecto sobre los perfiles de ácidos grasos para identificar transformantes productores de EPA y/o ARA. Si se encuentra que algún factor diferente a los asociados con el CLF influye en la longitud de cadena del producto final, podría emplearse una estrategia similar para alterar esos factores.
Describimos la alteración de los productos de PUFA PKS, que implica la modificación o sustitución de los pares βhidroxi acil ACP deshidrasa/ceto sintasa. Durante la síntesis de ácido cis-vaccénico (C8:1, Δ11) en E. coli, se cree que la creación del doble enlace cis depende de una enzima DH específica β-hidroxi acil ACP deshidrasa, el producto del gen FabA. Esta enzima retira HOH de un β-ceto acil ACP y deja un doble enlace trans en la cadena de carbono. Un subconjunto de DH, tipo FabA, posee actividad cis-trans isomerasa (Heath et al., 1996, supra). Un nuevo aspecto de sistemas PUFA PKS bacterianos y no bacterianos es la presencia de dos dominios DH tipo FabA. Sin el deseo de limitarse a teoría alguna, los presentes inventores creen que uno de estos dos dominios DH o ambos poseerán actividad cis-trans isomerasa (la manipulación de los dominios DH se analiza en mayor detalle a continuación).
Otro aspecto de las síntesis de ácidos grasos insaturados en E. coli es la necesidad de una enzima KS particular, βceto acil ACP sintasa, el producto del gen FabB. Esta es la enzima que realiza la condensación de un ácido graso, unido a un resto de cisteína en el sitio activo (mediante un enlace tio-éster), con un malonil ACP. En la reacción de múltiples etapas, se libera CO2 y se prolonga la cadena lineal en dos carbonos. Se cree que solamente esta KS puede prolongar una cadena de carbono que contenga un doble enlace. Esta prolongación sucede solamente cuando el doble enlace está en configuración cis; si está en configuración trans, el doble enlace se reduce por enoil ACP reductasa (ER) antes de la elongación (Heath et al., 1996, supra). Todos los sistemas PUFA PKS caracterizados hasta ahora tienen dos dominios KS, uno de los cuales muestra mayor homología a la KS tipo FabB de E. coli que el otro. De nuevo, sin el deseo de limitarse a teoría alguna, los presentes inventores creen que en sistema PUFA PKS, las especificidades e interacciones de los dominios enzimáticos DH (tipo FabA) y KS (tipo FabB) determinan la cantidad y colocación de dobles enlaces cis en los productos finales. Como la cantidad de reacciones de elongación de dos carbonos es mayor que la cantidad de dobles enlaces presentes en los productos finales de PUFA PKS, puede determinarse que en algunos ciclos de extensión sucede reducción completa. Por tanto, pueden usarse los dominios DH y KS como dianas para alteración de la relación DHA/DPA o relaciones de otros ácidos grasos de cadena larga. Estos pueden modificarse y/o evaluarse mediante la introducción de dominios homólogos de otros sistemas o por mutagénesis de estos fragmentos génicos.
Los dominios ER (enoil-ACP reductasa -una enzima que reduce el doble enlace trans en el acilo graso-ACP produciendo carbonos completamente saturados) pueden modificarse o sustituirse para cambiar el tipo de producto fabricado por el sistema PKS. Por ejemplo, los presentes inventores saben que el sistema PUFA PKS de Schizochytrium difiere de los sistemas bacterianos descritos previamente en que tiene dos dominios ER (en lugar de uno). Sin el deseo de limitarse a teoría alguna, los presentes inventores creen que estos dominios ER pueden influir fuertemente en el producto resultante de producción de PKS. El producto de PKS resultante podría cambiarse eliminando por separado los dominios individuales o modificando su secuencia de nucleótidos o por sustitución de los dominios ER de otros organismos.
En otra realización, pueden introducirse moléculas de ácido nucleico que codifican proteínas o dominios que no son parte de un sistema PKS, pero que afectan a un sistema PKS, en un organismo. Por ejemplo, todos los sistemas PUFA PKS descritos anteriormente contienen múltiples dominios ACP, en tándem. ACP (como proteína separada o como un dominio de una proteína más grande) requiere unión de un co-factor de fosfopanteteína para producir la holo-ACP activa. La unión de fosfopanteteína a la apo-ACP se realiza por miembros de la superfamilia de enzimas las fosfopanteteinil transferasa (PPT asa) (Lambalot R.H., et al., Chemistry and Biology, 3, 923 (1996)).
Por analogía a otros sistemas PKS y FAS, los presentes inventores suponen que la activación de los múltiples dominios ACP presentes en la proteína OrfA de Schizochytrium se realiza por una PPTasa endógena específica. El gen que codifica esta supuesta PPTasa aún no se ha identificado en Schizochytrium. Si dicho gen está presente en Schizochytrium, pueden idearse varios enfoques que podrían usarse en un intento por identificarlo y clonarlo. Estos podrían incluir (aunque sin limitación): generación y secuenciación parcial de una biblioteca de ADNc preparada a partir de células de crecimiento activo de Schizochytrium (nota, se identificó una secuencia en la biblioteca de ADNc de Schizochytrium actualmente disponible que mostró homología a PPTasa; sin embargo, parece ser parte de una proteína FAS de múltiples dominios, y por tanto no puede codificar la PPTasa específica de OrfA deseada); uso de cebadores oligonucleotídicos degenerados diseñados usando motivos de aminoácidos presentes en muchas PPTasa en reacciones de PCR (para obtener una molécula de sonda de ácido nucleico para seleccionar bibliotecas genómicas o de ADNc); enfoques genéticos basados en interacciones, proteína-proteína (por ejemplo, un sistema doble híbrido de levadura) en que se usarían los OrfA-dominios ACP como "cebo" para encontrar una "diana" (es decir, la PPTasa); y purificación y secuenciación parcial de la propia enzima como medio para generar una sonda de ácido nucleico para seleccionar bibliotecas genómicas o de ADN.
También es concebible que una PPTasa heteróloga pueda ser capaz de activar los dominios ACP de OrfA de Schizochytrium. Se ha demostrado que algunas PPTasas, por ejemplo la enzima sfp de Bacillus subtilis (Lambalot et al., supra) y la enzima svp de Streptomyces verticillus (Sanchez et al., 2001, Chemistry & Biology 8:725-738) tienen una amplia tolerancia de sustrato. Estas enzimas pueden ensayarse para observar si activarán los dominios ACP de Schizochytrium. Además, una reciente publicación describió la expresión de una proteína PKS fúngica en tabaco (Yalpani et al., 2001, The Plant Cell 13:1401-1409). Se detectaron productos del sistema PKS introducido (codificado por el gen de la ácido 6-metilsalicílico sintasa de Penicillium patulum) en la planta transgénica, aunque la correspondiente PPTasa fúngica no estaba presente en esas plantas. Esto sugirió que una o más PPTasas
vegetales endógenas reconocían y activaban el dominio ACP de PKS fúngica. De relevancia para esta observación, los presentes inventores han identificado dos secuencias (genes) en la base de datos de genoma completo de Arabidopsis que probablemente codifican PPTasas. Estas secuencias (números de acceso a GenBank; AAG51443 y AAC05345) están actualmente registradas como codificantes de "Proteínas Desconocidas". Pueden identificarse como PPTasas putativas en base a la presencia en las secuencias proteicas traducidas de varios motivos característicos incluyendo; G(I/V)D y WxxKE(A/S)xxK (SEC ID Nº 33), (enumerados en Lambalot et al., 1996 como característicos de todas las PPTasas). Además, estas dos proteínas putativas contienen dos motivos adicionales típicamente encontrados en PPTasas típicamente asociadas con PKS y sistemas de síntesis no ribosómica de péptidos; es decir, FN(I/L/V)SHS (SEC ID Nº 34) y (I/V/L)G(I/L/V)D(I/L/V) (SEC ID Nº 35). Además, estos motivos existen en las posiciones relativas esperadas en las secuencias proteicas. Es probable que estén presentes homólogos de los genes de Arabidopsis en otras plantas, tales como tabaco. De nuevo, estos genes pueden clonarse y expresarse para observar si las enzimas que codifican pueden activar los dominios ACP de OrfA de Schizochytrium, o como alternativa, podría expresarse OrfA directamente en la planta transgénica (dirigido al plásmido o el citoplasma).
Otra PPTasa heteróloga que puede reconocer los dominios ACP de OrfA como sustratos es la proteína Het I de Nostoc sp. PCC 7120 (antiguamente llamado Anabaena sp. PCC 7120). Como se aprecia en la patente de Estados Unidos n.º 6.140.486, varios genes de PUFA PKS de Shewanella mostraron un alto grado de homología a los dominios proteicos presentes en un grupo PKS encontrado en Nostoc (Figura 2 de esa patente). Este sistema PKS de Nostoc está asociado con la síntesis de hidroxi ácidos grasos de cadena larga (C26 o C28) que se esterifican en restos de azúcar y forman una parte de la pared celular del heterocisto. Estos dominios de PKS de Nostoc también son muy homólogos a los dominios encontrados en las Orf B y C de las proteínas de PKS de Schizochytrium (es decir, las mismas que corresponden a las encontradas en las proteínas de PKS de Shewanella).
Hasta muy recientemente, ninguno de los dominios de PKS de Nostoc presente en las bases de datos GenBank mostró alta homología a ninguna de los dominios de OrfA de Schizochytrium (o la proteína Orf 5 homóloga de Shewanella). Sin embargo, el genoma completo de Nostoc se ha secuenciado recientemente y como resultado ahora está disponible la secuencia de la región justo cadena arriba del grupo génico PKS. En esta región hay tres Orf que muestran homología a los dominios (KS, MAT, ACP y KR) de OrfA (véase la Fig. 3). Se incluyen en este conjunto dos dominios ACP, ambos cuales muestran alta homología a los dominios ACP de OrfA. Al final del grupo PKS de Nostoc está el gen que codifica la PPTasa Het I. Previamente, no era obvio cual podría ser el sustrato de la enzima Het I, sin embargo, la presencia de dominios ACP en tándem en la Orf recién identificada (HgI E) del grupo sugiere fuertemente a los presentes inventores que es esos ACP. La homología de los dominios ACP de Schizochytrium y Nostoc, así como la disposición en tándem de los dominios en ambas proteínas, hace de Het I un candidato probable para activación heteróloga de las ACP de OrfA de Schizochytrium. Los presentes inventores creen que son los primeros en reconocer y contemplar este uso para la PPTasa Het I de Nostoc.
Como se indica en Metz et al., 2001, supra, una nueva característica de los sistemas PUFA PKS es la presencia de dos dominios deshidratasa, ambos cuales muestran homología a las proteínas FabA de E. coli. Con la disponibilidad de las nuevas secuencias génicas de PKS de Nostoc mencionadas anteriormente, ahora pueden compararse los dos sistemas y sus productos. La secuencia de los dominios en el grupo de Nostoc (de HglE a Het I) como los han definido los presentes inventores es (véase, la Fig. 3):
KS-MAT-2xACP, KR, KS, CLF-AT, ER (HetM, HetN) HetI
En las Orf A, B y C de PUFA PKS de Schizochytrium la secuencia (OrfA -B -C) es:
KS-MAT-9xACP-KR KS-CLF-AT-ER DH-DH-ER
Puede observarse la correspondencia de la secuencia de los dominios (también existe una alta homología de secuencia de aminoácidos). El producto del sistema PKS de Nostoc es un hidroxi ácido graso de cadena larga (C26
o C28 con uno o dos grupos hidroxi) que no contienen dobles enlaces (cis o trans). El producto del sistema PKS de Schizochytrium es un ácido graso poliinsaturado de cadena larga (C22, con 5 o 6 dobles enlaces -todos cis). Una diferencia obvia entre los dos conjuntos de dominios es la presencia de los dos dominios DH en las proteínas de Schizochytrium -justo los dominios implicados en la formación de los dobles enlaces cis de DHA y de DPA (presumiblemente HetM y HetN en el sistema de Nostoc están implicadas en la inclusión de los grupos hidroxilo y también contienen un dominio DH cuyo origen difiere del de los encontrados en el PUFA). Además, el papel del dominio ER duplicado en las Orf B y C de Schizochytrium es desconocido (el segundo dominio ER no está presente en otros sistemas PUFA PKS caracterizados). La homología de secuencia de aminoácidos entre los dos conjuntos de dominios implica una relación evolutiva. Se puede concebir que el conjunto génico de PUFA PKS deriva de (en un sentido evolutivo) un conjunto génico de PKS tipo Nostoc ancestral por incorporación de los dominios DH (tipo FabA). La adición de los dominios DH provocaría la introducción de dobles enlaces cis en la nueva estructura del producto final de PKS.
Las comparaciones de las estructuras de dominio de PKS de Schizochytrium y Nostoc así como la comparación de la organización de dominios entre las proteínas de PUFA PKS de Schizochytrium y Shewanella demuestran la
capacidad natural de alterar el orden de los dominios así como de incorporar nuevos dominios para crear nuevos productos finales. Además, los genes ahora pueden manipularse en el laboratorio para crear nuevos productos, la implicación de estas observaciones es que debe ser posible continuar manipulando los sistemas de un modo dirigido
o aleatorio para influir en los productos finales. Por ejemplo, en una realización preferida, podría idearse la sustitución de uno de los dominios DH (tipo FabA) del sistema PUFA PKS en el lugar de un dominio DH que no poseía actividad de isomerización, creando potencialmente una molécula con una mezcla de dobles enlaces cis y trans. Los productos actuales del sistema PUFA PKS de Schizochytrium son DHA y DPA (C22:5 ω6). Si se manipula el sistema para producir ácidos grasos C20, se esperaría los productos EPA y ARA (C20:4 ω6). Esto podría proporcionar una nueva fuente para ARA. También se podría sustituir dominios de sistemas PUFA PKS relacionados que produjeran una diferente relación DHA a DPA -por ejemplo usando genes de Tharaustochytrium 23B (el sistema PUFA PKS del cual se identifica por primera vez en este documento).
Adicionalmente, podría idearse la alteración específica de uno de los dominios ER (por ejemplo, por retirada, o inactivación) en el sistema PUFA PKS de Schizochytrium (otros sistemas PUFA PKS descritos hasta ahora no tienen dos dominios ER) para determinar su efecto sobre el perfil de producto final. Podrían intentarse estrategias similares de un modo dirigido para cada uno de los distintos dominios de las proteínas de PUFA PKS usando enfoques más o menos sofisticados. Por supuesto, no se establecería limitación a la manipulación de dominios individuales. Finalmente, podría ampliarse el enfoque mezclando dominios del sistema PUFA PKS y otros sistemas PKS o FAS (por ejemplo, tipo I, tipo II, modular) para crear un intervalo completo de nuevos productos finales. Por ejemplo, podrían introducirse los dominios DH de PUFA PKS en sistemas que no incorporan normalmente dobles enlaces cis en sus productos finales.
Por consiguiente, la presente invención abarca métodos para modificar genéticamente células microbianas o vegetales por: modificación genética de al menos una secuencia de ácido nucleico en el organismo que codifica una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio funcional de un sistema PUFA PKS no bacteriano de acuerdo con la presente invención, y/o expresión de al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica dicha secuencia de aminoácidos. Se han descrito en detalle anteriormente diversas realizaciones de dichas secuencias, métodos para modificar genéticamente un organismo, y modificaciones específicas. Típicamente, el método se usa para producir un organismo modificado genéticamente particular que produce una molécula o moléculas bioactivas particulares.
Una realización de la presente invención se refiere a una célula hospedadora recombinante que se ha modificado para que exprese un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS), donde la PKS cataliza reacciones enzimáticas tanto iterativas como no iterativas, y donde el sistema PUFA PKS comprende: (a) al menos dos dominios enoil ACP-reductasa (ER); (b) al menos seis dominios de proteína de transporte de acilo (ACP); (c) al menos dos dominios β-ceto acil-ACP sintasa (KS); (d) al menos un dominio acil transferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil-ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT). En una realización, el sistema PUFA PKS es un sistema PUFA PKS eucariota. En una realización preferida, el sistema PUFA PKS es un sistema PUFA PKS de algas. En una realización más preferida, el sistema PUFA PKS es un sistema PUFA PKS de Traustoquitriales. Dichos sistemas PUFA PKS pueden incluir, aunque sin limitación, un sistema PUFA PKS de Schizochytrium, y un sistema PUFA PKS de Thraustochytrium. En una realización, el sistema PUFA PKS puede expresarse en una célula hospedadora procariota. En otra realización, el sistema PUFA PKS puede expresarse en una célula hospedadora eucariota.
Otra realización de la presente invención se refiere a una célula hospedadora recombinante que se ha modificado para que exprese un sistema PUFA PKS no bacteriano, donde el sistema PKS cataliza reacciones enzimáticas tanto iterativas como no iterativas, y donde el sistema PUFA PKS no bacteriano comprende al menos los siguientes dominios biológicamente activos: (a) al menos un dominio enoil ACP-reductasa (ER); (b) múltiples dominios de proteína de transporte de acilo (ACP) (al menos cuatro); (c) al menos dos dominios β-aceto acil-ACP sintasa (KS);
(d) al menos un dominio aciltransferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil-ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT).
Un aspecto de esta realización de la invención se refiere a un método para producir un producto que contiene al menos un PUFA, que comprende cultivar una planta que comprende cualquiera de las células hospedadoras recombinantes descritas anteriormente, donde la célula hospedadora recombinante es una célula vegetal, en condiciones eficaces para producir el producto. Otro aspecto de esta realización de la invención se refiere a un método para producir un producto que contiene al menos un PUFA, que comprende cultivar un cultivo que contiene cualquiera de las células hospedadoras recombinantes descritas anteriormente, donde la célula hospedadora es una célula microbiana, en condiciones eficaces para producir el producto. En una realización preferida, el sistema PKS en la célula hospedadora cataliza la producción directa de triglicéridos.
Otra realización de la presente invención se refiere a un microorganismo que comprende un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS) no bacteriano, donde la PKS cataliza reacciones enzimáticas tanto iterativas como no iterativas, y donde el sistema PUFA PKS comprende: (a) al menos dos dominios enoil ACP
reductasa (ER); (b) al menos seis dominios de proteína de transporte de acilo (ACP); (c) al menos dos dominios βceto acil-ACP sintasa (KS); (d) al menos un dominio aciltransferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil-ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT). Preferiblemente, el microorganismo es un microorganismo no bacteriano y más preferiblemente, un microorganismo eucariota.
Otra realización más de la presente invención se refiere a un microorganismo que comprende un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS) no bacteriano, donde la PKS cataliza reacciones enzimáticas tanto iterativas como no iterativas, y donde el sistema PUFA PKS comprende: (a) al menos un dominio enoil ACPreductasa (ER); (b) múltiples dominios de proteína de transporte de acilo (ACP) (al menos cuatro); (c) al menos dos dominios β-ceto acil-ACP sintasa (KS); (d) al menos un dominio aciltransferasa (AT); (e) al menos un dominio cetorreductasa (KR); (f) al menos dos dominios β-hidroxi acil-ACP deshidrasa (DH) tipo FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT).
En una realización de la presente invención, se contempla que podría combinarse un programa de mutagénesis con un proceso de selección selectiva para obtener moléculas bioactivas de interés. Esto incluiría métodos para buscar un intervalo de compuestos bioactivos. Esta búsqueda no se restringiría a la producción de aquellas moléculas con dobles enlaces cis. Los métodos de mutagénesis podrían incluir, aunque sin limitación: mutagénesis química, combinación de genes, cambio de regiones de los genes que codifican dominios enzimáticos específicos, o mutagénesis restringida a regiones específicas de esos genes, así como otros métodos.
Por ejemplo, podrían usarse métodos de mutagénesis de alto rendimiento para influir en u optimizar la producción de la molécula bioactiva deseada. Una vez se ha desarrollado un sistema modelo eficaz, podrían modificarse estos genes de un modo de alto rendimiento. La utilización de estas tecnologías puede idearse a dos niveles. Primero, si puede concebirse un filtro suficientemente selectivo para la producción de un producto de interés (por ejemplo, ARA), podría usarse para intentar alterar el sistema para producir este producto (por ejemplo, en lugar de, o en concierto con, otras estrategias tales como las analizadas anteriormente). Adicionalmente, si las estrategias resumidas anteriormente produjeran un conjunto de genes que produjeran el producto de interés, entonces podrían usarse las tecnologías de alto rendimiento para optimizar el sistema. Por ejemplo, si el dominio introducido solamente funcionara a temperaturas relativamente bajas, podrían concebirse métodos de selección para permitir la eliminación de esa limitación. En una realización de la invención, se usan métodos de selección para identificar organismos no bacterianos adicionales que tienen nuevos sistemas PKS similares al sistema PUFA PKS de Schizochytrium, como se describe en este documento (véase anteriormente). Pueden usarse sistemas PKS homólogos identificados en dichos organismos en métodos similares a los descritos en este documento para Schizochytrium, así como para una fuente adicional de material genético a partir de la cual crear, modificar adicionalmente y/o mutar un sistema PKS para la expresión en ese organismo, en otro organismo, o en una planta superior, para producir una diversidad de compuestos.
Está reconocido que muchas alteraciones genéticas, ya sean aleatorias o dirigidas, que pueden introducirse en un sistema PKS nativo (endógeno, natural), provocarán una inactivación de funciones enzimáticas. Describimos un sistema para seleccionar solamente aquellas modificaciones que no bloquean la capacidad del sistema PKS de producir un producto. Por ejemplo, la cepa FabB-de E. coli es incapaz de sintetizar ácidos grasos insaturados y requiere suplementación del medio con ácidos grasos que puedan sustituir sus ácidos grasos insaturados normales para crecer (véase, Metz et al., 2001, supra). Sin embargo, esta necesidad (suplementación del medio) puede eliminarse cuando la cepa se transforma con un sistema PUFA PKS funcional (es decir, uno que produce un producto PUFA en el hospedador de E. coli -véase (Metz et al., 2001, supra, Figura 2A). La cepa FabBtransformada ahora requiere un sistema PUFA PKS funcional (para producir los ácidos grasos insaturados) para crecer sin suplementación. El elemento clave en este ejemplo es que la producción de un amplio intervalo de ácidos grasos insaturados bastará (incluso sustitutos de ácidos grasos insaturados tales como ácidos grasos de cadena ramificada). Por lo tanto, en otra realización preferida de la invención, podría crearse una gran cantidad de mutaciones en uno o más de los genes de PUFA PKS descritos en este documento, y después transformar la cepa FabB-apropiadamente modificada (por ejemplo, crear mutaciones en una construcción de expresión que contiene un dominio ER y transformar una cepa FabB-que tiene los otros dominios esenciales en un plásmido diferente -o integrado en el cromosoma) y seleccionar solamente aquellos transformantes que crecen sin suplementación del medio (es decir, que aún poseen una capacidad de producir una molécula que podría complementar el defecto FabB-). Podrían desarrollarse filtros adicionales para buscar compuestos particulares (por ejemplo, uso de GC para ácidos grasos) que se producen en este subconjunto selectivo de un sistema PKS activo. Podrían idearse varios filtros selectivos similares para moléculas bioactivas de interés.
Como se ha descrito anteriormente, en una realización de la presente invención, un microorganismo o planta modificado genéticamente incluye un microorganismo o planta que tiene una capacidad potenciada de sintetizar moléculas bioactivas deseadas (productos) o que tiene una capacidad recién introducida de sintetizar productos específicos (por ejemplo, de sintetizar un antibiótico específico). De acuerdo con la presente invención, "una capacidad potenciada de sintetizar" un producto se refiere a cualquier potenciación, o regulación positiva, en una ruta relacionada con la síntesis del producto de modo que el microorganismo o planta produzca una cantidad aumentada del producto (incluyendo cualquier producción de un producto donde antes no había) en comparación
con el microorganismo o planta de tipo silvestre, cultivado o desarrollado, en las mismas condiciones. Los métodos para producir dichos organismos modificados genéticamente se han descrito en detalle anteriormente.
Una realización de la presente invención es un método para producir moléculas bioactivas deseadas (también mencionadas como productos o compuestos) haciendo crecer o cultivando un microorganismo o planta modificada genéticamente de la presente invención (descrita en detalle anteriormente). Dicho método incluye la etapa de cultivar en un medio de fermentación o hacer crecer en un entorno adecuado, tal como suelo, un microorganismo o planta, respectivamente, que tenga una modificación genética como se ha descrito previamente en este documento y de acuerdo con la presente invención. En una realización preferida, el método para producir moléculas bioactivas de la presente invención incluye la etapa de cultivar en condiciones eficaces para producir la molécula bioactiva un organismo modificado genéticamente que expresa un sistema PKS que comprende al menos un dominio biológicamente activo de un sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS) de acuerdo con la invención. En este aspecto preferido del método, el organismo se modifica genéticamente para afectar a la actividad del sistema PKS (descrito en detalle anteriormente). Las células hospedadoras preferidas para modificación genética respecto al sistema PUFA PKS de la invención se han descrito anteriormente.
En el método de producción de compuestos bioactivos deseados de la presente invención, se cultiva o hace crecer un microorganismo modificado genéticamente en un medio adecuado, en condiciones eficaces para producir el compuesto bioactivo. Un medio apropiado, o eficaz se refiere a cualquier medio en que un microorganismo modificado genéticamente de la presente invención, cuando se cultiva, sea capaz de producir el producto deseado. Dicho medio es típicamente un medio acuoso que comprende fuentes asimilables de carbono, nitrógeno y fosfato. Dicho medio también puede incluir sales, minerales, metales y otros nutrientes apropiados. Los microorganismos de la presente invención pueden cultivarse en biorreactores convencionales de fermentación. Los microorganismos pueden cultivarse por cualquier proceso de fermentación que incluya, aunque sin limitación, fermentación discontinua, semicontinua, con reciclado celular, y continua. Las condiciones preferidas de cultivo para microorganismos hospedadores potenciales de acuerdo con la presente invención son bien conocidas en la técnica. Las moléculas bioactivas deseadas producidas por el microorganismo modificado genéticamente pueden recuperarse del medio de fermentación usando técnicas convencionales de separación y purificación. Por ejemplo, el medio de fermentación puede filtrarse o centrifugarse para retirar los microorganismos, desechos celulares y otra materia particulada, y el producto puede recuperarse del sobrenadante sin células por métodos convencionales, tales como, por ejemplo, intercambio iónico, cromatografía, extracción, extracción de disolvente, separación en membrana, electrodiálisis, ósmosis inversa, destilación, derivatización química y cristalización. Como alternativa, los microorganismos que producen el compuesto deseado, o extractos y diversas fracciones del mismo, pueden usarse sin eliminar los componentes del microorganismo del producto.
En el método para la producción de compuestos bioactivos deseados de la presente invención, se cultiva una planta modificada genéticamente en un medio de fermentación o se hace crecer en un medio adecuado tal como suelo. Un medio apropiado o eficaz de fermentación se ha analizado en detalle anteriormente. Un medio de cultivo adecuado para plantas superiores incluye cualquier medio de cultivo para plantas, incluyendo, aunque sin limitación, suelo, arena, cualquier otro medio particulado que de soporte al crecimiento de las raíces (por ejemplo, vermiculita, perlita, etc.) o cultivo hidropónico, así como luz adecuada, agua y suplementos nutricionales que optimizan el crecimiento de la planta superior. Las plantas modificadas genéticamente de la presente invención se modifican por ingeniería para que produzcan cantidades significativas del producto deseado a través de la actividad del sistema PKS que está modificado genéticamente de acuerdo con la presente invención. Los compuestos pueden recuperarse a través de procesos de purificación que extraen los compuestos de la planta. En una realización preferida, el compuesto se recupera por recolección de la planta. En esta realización, la planta puede consumirse en su estado natural o procesarse adicionalmente en productos consumibles.
Como se ha descrito anteriormente, un microorganismo modificado genéticamente útil en la presente invención puede, en un aspecto, contener de forma endógena y expresar un sistema PUFA PKS, y la modificación genética puede ser una modificación genética de uno o más de los dominios funcionales del sistema PUFA PKS endógeno, mediante lo cual la modificación tiene algún efecto sobre la actividad del sistema PUFA PKS. En otro aspecto, dicho organismo puede contener de forma endógena y expresar un sistema PUFA PKS, y la modificación genética puede ser una introducción de al menos una secuencia exógena de ácido nucleico (por ejemplo, una molécula de ácido nucleico recombinante), donde la secuencia exógena de ácido nucleico codifica al menos un dominio o proteína biológicamente activa de un segundo sistema PKS y/o una proteína que afecta a la actividad de dicho sistema PUFA PKS (por ejemplo, una fosfopanteteinil transferasa (PPTasa), analizada a continuación). En otro aspecto más, el organismo no contiene necesariamente de forma endógena (natural) un sistema PUFA PKS, pero se modifica genéticamente para introducir al menos una molécula de ácido nucleico recombinante que codifique una secuencia de aminoácidos que tenga la actividad biológica de al menos un dominio de un sistema PUFA PKS. En este aspecto, la actividad PUFA PKS se ve afectada por la introducción o aumento de la actividad PUFA PKS en el organismo. Se han analizado en detalle anteriormente diversas realizaciones asociadas con cada uno de estos aspectos.
En una realización del método para producir compuestos bioactivos, la modificación genética cambia al menos un producto producido por el sistema PKS endógeno, en comparación con un organismo de tipo silvestre.
En otra realización, el organismo expresa de forma endógena un sistema PKS que comprende el al menos un dominio biológicamente activo del sistema PUFA PKS, y la modificación genética comprende la transfección del organismo con una molécula de ácido nucleico recombinante seleccionada entre el grupo que consiste en: una molécula de ácido nucleico recombinante que codifica al menos un dominio biológicamente activo de un segundo sistema PKS y una molécula de ácido nucleico recombinante que codifica una proteína que afecta a la actividad del sistema PUFA PKS. En esta realización, la modificación genética preferiblemente cambia al menos un producto producido por el sistema PKS endógeno, en comparación con un organismo de tipo silvestre. Un segundo sistema PKS puede incluir otro sistema PUFA PKS (bacteriano o no bacteriano), un sistema PKS tipo I, un sistema PKS tipo II, y/o un sistema PKS modular. Se han descrito anteriormente ejemplos de proteínas que afectan a la actividad de un sistema PKS (por ejemplo, PPTasa).
En otra realización, el organismo se modifica genéticamente por transfección con una molécula de ácido nucleico recombinante que codifica el al menos un dominio del sistema de ácido graso poliinsaturado (PUFA) policétido sintasa (PKS). Dichas moléculas de ácido nucleico recombinantes se ha descrito en detalle previamente en este documento.
En otra realización, el organismo expresa de forma endógena un sistema PUFA PKS no bacteriano, y la modificación genética comprende la sustitución de un dominio de un sistema PKS diferente en el lugar de una secuencia de ácido nucleico que codifica al menos un dominio del sistema PUFA PKS no bacteriano. En otra realización, el organismo expresa de forma endógena un sistema PUFA PKS no bacteriano que se ha modificado por transfección del organismo con una molécula de ácido nucleico recombinante que codifica una proteína que regula la longitud de cadena de los ácidos grasos producidos por el sistema PUFA PKS. En un aspecto, la molécula de ácido nucleico recombinante que codifica una proteína que regula la longitud de cadena de los ácidos grasos remplaza una secuencia de ácido nucleico que codifica un factor de longitud de cadena en el sistema PUFA PKS no bacteriano. En otro aspecto, la proteína que regula la longitud de cadena de los ácidos grasos producidos por el sistema PUFA PKS es un factor de longitud de cadena. En otro aspecto, la proteína que regula la longitud de cadena de los ácidos grasos producidos por el sistema PUFA PKS es un factor de longitud de cadena que dirige la síntesis de unidades C20.
En una realización del método para producir una molécula bioactiva, el organismo produce un perfil de ácido graso poliinsaturado (PUFA) que difiere del organismo de origen natural sin una modificación genética.
Muchas otras modificaciones genéticas útiles para producir moléculas bioactivas serán evidentes para los expertos en la materia, dada la presente descripción, y se han analizado previamente en este documento otras diversas modificaciones. La presente invención contempla cualquier modificación genética relacionada con un sistema PUFA PKS descrito en este documento que provoque la producción de una molécula bioactiva deseada.
Las moléculas bioactivas, de acuerdo con la presente invención, incluyen cualquier molécula (compuestos, productos, etc.) que tenga una actividad biológica, y que pueda producirse por un sistema PKS que comprende al menos una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio funcional de un sistema PUFA PKS no bacteriano descrito en este documento. Dichas moléculas bioactivas pueden incluir, aunque sin limitación: un ácido graso poliinsaturado (PUFA), una formulación anti-inflamatoria, un agente quimioterapéutico, un excipiente activo, un fármaco para la osteoporosis, un anti-depresivo, un anti-convulsivo, un fármaco anti-Helicobacter pylori, un fármaco para el tratamiento de enfermedad neurodegenerativa, un fármaco para el tratamiento de enfermedad hepática degenerativa, un antibiótico, y una formulación para disminuir el nivel de colesterol. Una ventaja del sistema PUFA PKS no bacteriano de la presente invención es la capacidad de dicho sistema de introducir dobles enlaces carbono-carbono en configuración cis, y moléculas que incluyen un doble enlace cada tres carbonos. Esta capacidad puede utilizarse para producir una diversidad de compuestos.
Preferiblemente, los compuestos bioactivos de interés se producen por el microorganismo modificado genéticamente en una cantidad que es mayor de aproximadamente el 0,05 %, y preferiblemente mayor de aproximadamente el 0,1 %, y más preferiblemente mayor de aproximadamente el 0,25 %, y más preferiblemente mayor de aproximadamente el 0,5 %, y más preferiblemente mayor de aproximadamente el 0,75 %, y más preferiblemente mayor de aproximadamente el 1 %, y más preferiblemente mayor de aproximadamente el 2,5 %, y más preferiblemente mayor de aproximadamente el 5 %, y más preferiblemente mayor de aproximadamente el 10 %, y más preferiblemente mayor de aproximadamente el 15 %, e incluso más preferiblemente mayor de aproximadamente el 20 % del peso seco del microorganismo. Para compuestos lipídicos, preferiblemente, dichos compuestos se producen en una cantidad que es mayor de aproximadamente el 5 % del peso seco del microorganismo. Para otros compuestos bioactivos, dichos antibióticos o compuestos que se sintetizan en cantidades más pequeñas, aquellas cepas que procesan dichos compuestos en peso seco del microorganismo, se identifican de forma predecible como que contienen un nuevo sistema PKS del tipo descrito anteriormente. En algunas realizaciones, se secretan moléculas bioactivas (compuestos) particulares por el microorganismo, en lugar de acumularse. Por lo tanto, dichas moléculas bioactivas se recuperan generalmente del medio de cultivo y la concentración de molécula producida variará dependiendo del microorganismo y el tamaño del cultivo.
Otra realización más de la presente invención se refiere a un método para producir leche animal humanizada. Este método incluye las etapas de modificar genéticamente células productoras de leche de un animal no humano productor de leche con al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS de acuerdo con la invención. El sistema PUFA PKS es un sistema PUFA PKS no bacteriano.
Los métodos para modificar genéticamente una célula hospedadora y para producir un produce un animal no humano productor de leche, modificado genéticamente, son conocidos en la técnica. Ejemplos de animales hospedadores a modificar incluyen ganado vacuno, ovejas, cerdos, cabras, yaks, etc., que son susceptibles a manipulación genética y clonación para rápida expansión de una población que expresa el transgén. Para animales, pueden adaptarse transgenes tipo PKS para su expresión en orgánulos, tejidos y fluidos corporales diana a través de modificación de las regiones reguladoras génicas. Es de particular interés la producción de PUFA en la leche materna del animal hospedador.
Los siguientes ejemplos se proporcionan con fines ilustrativos y no pretenden limitar el alcance de la presente invención.
Ejemplos
Ejemplo 1
El siguiente ejemplo describe el análisis adicional de secuencias relacionadas con PKS de Schizochytrium.
Los presentes inventores han secuenciado el ADN genómico que incluye la longitud completa de las tres fases de lectura abierta (Orf) en el sistema PUFA PKS de Schizochytrium usando los métodos generales resumidos en los Ejemplos 8 y 9 de la publicación PCT n.º WO 0042195 y la solicitud de Estados Unidos n.º de serie 09/231.899. Los dominios biológicamente activos en las proteínas PKS de Schizochytrium se representan gráficamente en la Fig. 1. La estructura de dominios del sistema PUFA PKS de Schizochytrium se describe más particularmente del siguiente modo.
Fase de lectura abierta A (OrfA):
La secuencia completa de nucleótidos para OrfA se representa en este documento como SEC ID Nº 1. OrfA es una secuencia de 8730 nucleótidos (sin incluir el codón de parada) que codifica una secuencia de 2910 aminoácidos, representada en este documento como SEC ID Nº 2. Dentro de OrfA hay doce dominios:
- (a)
- un dominio β-ceto acil-ACP sintasa (KS);
- (b)
- un dominio malonil-CoA:ACP aciltransferasa (MAT);
- (c)
- nueve dominios de proteína de transporte de acilo (ACP);
- (d)
- un dominio cetorreductasa (KR).
Los dominios contenidos dentro de OrfA se han determinado en base a:
- (1)
- resultados de un análisis con el programa Pfam (Pfam es una base de datos de múltiples alineaciones de dominios proteicos o regiones proteicas conservadas. Las alineaciones representan alguna estructura evolutivamente conservada que tiene implicaciones para la función de la proteína. El perfil de modelos ocultos de Markov (perfil HMM) construido a partir de las alineaciones Pfam puede ser muy útil para reconocer de forma automática que una nueva proteína pertenece a una familia existente de proteínas, incluso si la homología es débil. A diferencia de los métodos convencionales de alineación por pares (por ejemplo, BLAST, FASTA), los HMM de Pfam dan sensibilidad con proteínas de múltiples dominios. La referencia proporcionada para la versión Pfam usada es: Bateman A, Birney E, Cerruti L, Durbin R, Etwiller L, Eddy SR, Griffiths-Jones S, Howe KL, Marshall M, Sonnhammer EL (2002) Nucleic Acids Research 30(1):276-280); y/o
- (2)
- comparación de homología a sistemas PUFA-PKS bacterianos (por ejemplo, Shewanella) usando una búsqueda de homología BLAST 2.0 Basic BLAST usando blastp para búsquedas de aminoácidos con parámetros convencionales por defecto, donde la secuencia de consulta se filtra para regiones de baja complejidad por defecto (descrito en Altschul, S.F., Madden, T.L., Schääffer, A.A., Zhang, J., Zhang, Z., Miller, W. y Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389-3402, incorporado por referencia en este documento en su totalidad).
Se cree que las secuencias proporcionadas para dominios individuales contienen la longitud completa de la secuencia que codifica un dominio funcional, y puede contener secuencia flanqueante adicional dentro de la Orf.
ORFA-KS
El primer dominio en OrfA es un dominio KS, también mencionado en este documento como ORFA-KS. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1 y 40 de la SEC ID Nº 1 (OrfA) hasta un punto final entre aproximadamente las posiciones 1428 y 1500 de la SEC ID Nº 1. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFA-KS está representada en este documento como SEC ID Nº 7 (posiciones 1-1500 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el dominio KS abarca desde un punto de inicio entre aproximadamente las posiciones 1 y 14 de la SEC ID Nº 2 (ORFA) hasta un punto final entre aproximadamente las posiciones 476 y 500 de la SEC ID Nº 2. La secuencia de aminoácidos que contiene el dominio ORFA-KS está representada en este documento como SEC ID Nº 8 (posiciones 1-500 de la SEC ID Nº 2). Se aprecia que el dominio ORFA-KS contiene un motivo de sitio activo: DXAC* (*C215 del sitio de unión a acilo).
ORFA-MAT
El segundo dominio en OrfA es un dominio MAT, también mencionado en este documento como ORFA-MAT. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1723 y 1798 de la SEC ID Nº 1 (OrfA) hasta un punto final entre aproximadamente las posiciones 2805 y 3000 de la SEC ID Nº 1. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFA-MAT está representada en este documento como SEC ID Nº 9 (posiciones 1723-3000 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el dominio MAT abarca desde un punto de inicio entre aproximadamente las posiciones 575 y 600 de la SEC ID Nº 2 (ORFA) hasta un punto final entre aproximadamente las posiciones 935 y 1000 de la SEC ID Nº 2. La secuencia de aminoácidos que contiene el dominio ORFA-MAT está representada en este documento como SEC ID Nº 10 (posiciones 575-1000 de la SEC ID Nº 2). Se aprecia que el dominio ORFA-MAT contiene un motivo de sitio activo: GHS*XG (*S706 del sitio de unión a acilo), representado en este documento como SEC ID Nº 11.
ORFA-ACP n.º 1-9
Los dominios 3-11 de OrfA son nueve dominios ACP en tándem, también mencionados en este documento como ORFA-ACP (el primer dominio en la secuencia es ORFA-ACP1, el segundo dominio es ORFA-ACP2, el tercer dominio es ORFA-ACP3, etc.). El primer dominio ACP, ORFA-ACP1, está contenido dentro de la secuencia de nucleótidos que abarca desde aproximadamente la posición 3343 hasta aproximadamente la posición 3600 de la SEC ID Nº 1 (OrfA). La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFA-ACP1 está representada en este documento como SEC ID Nº 12 (posiciones 3343-3600 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el primer dominio ACP abarca desde aproximadamente la posición 1115 hasta aproximadamente la posición 1200 de la SEC ID Nº 2. La secuencia de aminoácidos que contiene el dominio ORFA-ACP1 está representada en este documento como SEC ID Nº 13 (posiciones 1115-1200 de la SEC ID Nº 2). Se aprecia que el dominio ORFA-ACP1 contiene un motivo de sitio activo: LGIDS* (*S1157 del motivo de unión a panteteína), representado en este documento por la SEC ID Nº 14. Las secuencias de nucleótidos y aminoácidos de los nueve dominios ACP están muy conservados y, por lo tanto, la secuencia para cada dominio no está representada en este documento por un identificador de secuencia individual. Sin embargo, en base a esta información, un experto en la materia puede determinar fácilmente la secuencia para cada uno de los otros ocho dominios ACP. El intervalo repetido para los nueve dominios es de aproximadamente 110 a aproximadamente 330 nucleótidos de la SEC ID Nº 1.
Los nueve dominios ACP juntos abarcan una región de OrfA desde aproximadamente la posición 3283 hasta aproximadamente la posición 6288 de la SEC ID Nº 1, que corresponde a las posiciones de aminoácido desde aproximadamente 1095 hasta aproximadamente 2096 de la SEC ID Nº 2. Esta región incluye los segmentos enlazadores entre dominios ACP individuales. Cada uno de los nueve dominios ACP contiene un motivo de unión a panteteína LGIDS* (representado en este documento por la SEC ID Nº 14), donde * es la S del sitio de unión a panteteína S. En cada extremo de la región del dominio ACP y entre cada dominio ACP hay una región que está muy enriquecida en prolina (P) y alanina (A), que se cree que es una región enlazadora. Por ejemplo, entre los dominios ACP 1 y 2 está la secuencia: APAPVKAAAPAAPVASAPAPA, representada en este documento como SEC ID Nº 15.
ORFA-KR
El dominio 12 en OrfA es un dominio KR, también mencionado en este documento como ORFA-KR. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio desde aproximadamente la posición 6598 de la SEC ID Nº 1 hasta un punto final desde aproximadamente la posición 8730 de la SEC ID Nº 1. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFA-KR está representada en este documento como SEC ID Nº 17 (posiciones 6598-8730 de la SEC ID Nº 1). La secuencia de aminoácidos que contiene el dominio KR abarca desde un punto de inicio de aproximadamente la posición 2200 de la SEC ID Nº 2 (ORFA) hasta un punto final de aproximadamente la posición 2910 de la SEC ID Nº 2. La secuencia de aminoácidos que contiene el dominio ORFA-KR está representada en este documento como SEC ID Nº 18 (posiciones 2200-2910
de la SEC ID Nº 2). Dentro del dominio KR hay una región central con homología a las aldehído de cadena cortadeshidrogenasas (KR es un miembro de esta familia). Esta región central abarca desde aproximadamente la posición 7198 hasta aproximadamente la posición 7500 de la SEC ID Nº 1, que corresponde a las posiciones de aminoácido 2400-2500 de la SEC ID Nº 2.
Fase de lectura abierta B (OrfB):
La secuencia completa de nucleótidos para OrfB está representada en este documento como SEC ID Nº 3. OrfB es una secuencia de 6177 nucleótidos (sin incluir el codón de parada) que codifica una secuencia de 2059 aminoácidos, representada en este documento como SEC ID Nº 4. Dentro de la OrfB hay cuatro dominios:
- (a)
- dominio β-ceto acil-ACP sintasa (KS);
- (b)
- un dominio de factor de longitud de cadena (CLF);
- (c)
- un dominio acil transferasa (AT);
- (d)
- un dominio enoil ACP-reductasa (ER).
Los dominios contenidos dentro de ORFB se han determinado en base a: (1) resultados de un análisis con el programa Pfam, descrito anteriormente; y/o (2) comparación de homología a sistemas PUFA-PKS bacterianos (por ejemplo, Shewanella) usando una búsqueda de homología con BLAST 2.0 Basic BLAST, también descrito anteriormente. Se cree que las secuencias proporcionadas para dominios individuales contienen la longitud completa de la secuencia que codifica un dominio funcional, y puede contener secuencia flanqueante adicional dentro de la Orf.
ORFB-KS
El primer dominio en OrfB es un dominio KS, también mencionado en este documento como ORFB-KS. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1 y 43 de la SEC ID Nº 3 (OrfB) hasta un punto final entre aproximadamente las posiciones 1332 y 1350 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-KS está representada en este documento como SEC ID Nº 19 (posiciones 1-1350 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio KS abarca desde un punto de inicio entre aproximadamente las posiciones 1 y 15 de la SEC ID Nº 4 (ORFB) hasta un punto final entre aproximadamente las posiciones 444 y 450 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-KS está representada en este documento como SEC ID Nº 20 (posiciones 1-450 de la SEC ID Nº 4). Se aprecia que el dominio ORFB-KS contiene un motivo de sitio activo: DXAC* (*C196 del sitio de unión a acilo).
ORFB-CLF
El segundo dominio en OrfB es un dominio CLF, también mencionado en este documento como ORFB-CLF. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1378 y 1402 de la SEC ID Nº 3 (OrfB) hasta un punto final entre aproximadamente las posiciones 2682 y 2700 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-CLF está representada en este documento como SEC ID Nº 21 (posiciones 1378-2700 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio CLF abarca desde un punto de inicio entre aproximadamente las posiciones 460 y 468 de la SEC ID Nº 4 (ORFB) hasta un punto final entre aproximadamente las posiciones 894 y 900 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-CLF está representada en este documento como SEC ID Nº 22 (posiciones 460-900 de la SEC ID Nº 4). Se aprecia que el dominio ORFB-CLF contiene un motivo de sitio activo de KS son la cisteína de unión a acilo.
ORFB-AT
El tercer dominio en OrfB es un dominio AT, también mencionado en este documento como ORFB-AT. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 2701 y 3598 de la SEC ID Nº 3 (OrfB) hasta un punto final entre aproximadamente las posiciones 3975 y 4200 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-AT está representada en este documento como SEC ID Nº 23 (posiciones 2701-4200 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio AT abarca desde un punto de inicio entre aproximadamente las posiciones 901 y 1200 de la SEC ID Nº 4 (ORFB) hasta un punto final entre aproximadamente las posiciones 1325 y 1400 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-AT está representada en este documento como SEC ID Nº 24 (posiciones 901-1400 de la SEC ID Nº 4). Se aprecia que el dominio ORFB-AT contiene un motivo de sitio activo de AT de GxS*xG (*S1140 del sitio de unión a acilo).
ORFB-ER
El cuarto dominio en OrfB es un dominio ER, también mencionado en este documento como ORFB-ER. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio de aproximadamente la posición 4648 de la SEC ID Nº 3 (OrfB) hasta un punto final de aproximadamente la posición 6177 de la SEC ID Nº 3. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFB-ER está representada en este documento como SEC ID Nº 25 (posiciones 4648-6177 de la SEC ID Nº 3). La secuencia de aminoácidos que contiene el dominio ER abarca desde un punto de inicio de aproximadamente la posición 1550 de la SEC ID Nº 4 (ORFB) hasta un punto final de aproximadamente la posición 2059 de la SEC ID Nº 4. La secuencia de aminoácidos que contiene el dominio ORFB-ER está representada en este documento como SEC ID Nº 26 (posiciones 1550-2059 de la SEC ID Nº 4).
Fase de lectura abierta C (OrfC):
La secuencia completa de nucleótidos para OrfC está representada en este documento como SEC ID Nº 5. OrfC es una secuencia de 4509 nucleótidos (sin incluir el codón de parada) que codifica una secuencia de 1503 aminoácidos, representada en este documento como SEC ID Nº 6. Dentro de OrfC hay tres dominios:
- (a)
- dos dominios β-hidroxi acil-ACP deshidrasa (DH) tipo FabA;
- (b)
- un dominio enoil ACP-reductasa (ER).
Los dominios contenidos dentro de ORFC se han determinado en base a: (1) resultados de un análisis con el programa Pfam, descrito anteriormente; y/o (2) comparación de homología a sistemas PUFA-PKS bacterianos (por ejemplo, Shewanella) usando una búsqueda de homología con BLAST 2.0 Basic BLAST, también descrito anteriormente. Se cree que las secuencias proporcionadas para dominios individuales contienen la longitud completa de la secuencia que codifica un dominio funcional, y puede contener secuencia flanqueante adicional dentro de la Orf.
ORFC-DH1
El primer dominio en OrfC es un dominio DH, también mencionado en este documento como ORFC-DH1. Éste es uno de los dos dominios DH en OrfC, y por lo tanto se denomina DH1. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1 y 778 de la SEC ID Nº 5 (OrfC) hasta un punto final entre aproximadamente las posiciones 1233 y 1350 de la SEC ID Nº 5. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFC-DH1 está representada en este documento como SEC ID Nº 27 (posiciones 1-1350 de la SEC ID Nº 5). La secuencia de aminoácidos que contiene el dominio DH1 abarca desde un punto de inicio entre aproximadamente las posiciones 1 y 260 de la SEC ID Nº 6 (ORFC) hasta un punto final entre aproximadamente las posiciones 411 y 450 de la SEC ID Nº 6. La secuencia de aminoácidos que contiene el dominio ORFC-DH1 está representada en este documento como SEC ID Nº 28 (posiciones 1-450 de la SEC ID Nº 6).
ORFC-DH2
El segundo dominio en OrfC es un dominio DH, también mencionado en este documento como ORFC-DH2. Éste es el segundo de los dos dominios DH en OrfC, y por lo tanto se denomina DH2. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio entre aproximadamente las posiciones 1351 y 2437 de la SEC ID Nº 5 (OrfC) hasta un punto final entre aproximadamente las posiciones 2607 y 2850 de la SEC ID Nº 5. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFC-DH2 está representada en este documento como SEC ID Nº 29 (posiciones 1351-2850 de la SEC ID Nº 5). La secuencia de aminoácidos que contiene el dominio DH2 abarca desde un punto de inicio entre aproximadamente las posiciones 451 y 813 de la SEC ID Nº 6 (ORFC) hasta un punto final entre aproximadamente las posiciones 869 y 950 de la SEC ID Nº 6. La secuencia de aminoácidos que contiene el dominio ORFC-DH2 está representada en este documento como SEC ID Nº 30 (posiciones 451-950 de la SEC ID Nº 6).
ORFC-ER
El tercer dominio en OrfC es un dominio ER, también mencionado en este documento como ORFC-ER. Este dominio está contenido dentro de la secuencia de nucleótidos que abarca desde un punto de inicio de aproximadamente la posición 2998 de la SEC ID Nº 5 (OrfC) hasta un punto final de aproximadamente la posición 4509 de la SEC ID Nº 5. La secuencia de nucleótidos que contiene la secuencia que codifica el dominio ORFC-ER está representada en este documento como SEC ID Nº 31 (posiciones 2998-4509 de la SEC ID Nº 5). La secuencia de aminoácidos que contiene el dominio ER abarca desde un punto de inicio de aproximadamente la posición 1000 de la SEC ID Nº 6 (ORFC) hasta un punto final de aproximadamente la posición 1502 de la SEC ID Nº 6. La secuencia de aminoácidos que contiene el dominio ORFC-ER está representada en este documento como SEC ID Nº 32 (posiciones 1000-1502 de la SEC ID Nº 6).
Ejemplo 2
El siguiente ejemplo describe el uso del proceso de selección de la presente invención para identificar otros tres organismos no bacterianos que comprenden un sistema PUFA PKS de acuerdo con la presente invención.
Se cultivó Thraustochytrium sp. 23B (ATCC 20892) de acuerdo con el método de selección descrito en solicitud provisional de Estados Unidos n.º de serie 60/298.796 y como se describe en detalle en este documento.
El filtro biorracional (usando cultivos en matraz de agitación) desarrollado para detectar microorganismos que contienen sistemas PKS que producen PUFA es el siguiente:
Se colocan dos ml de un cultivo de la cepa/microorganismo a ensayar en matraz de agitación con separadores de 250 ml con 50 ml medio de cultivo (tratamiento aeróbico) y se colocan otros 2 ml de cultivo de la misma cepa en un matraz de agitación sin separadores de 250 ml con 200 ml de medio de cultivo (tratamiento anóxico). Ambos matraces se colocan en una mesa oscilatoria a 200 rpm. Después de 48-72 h de tiempo de cultivo, se recogen los cultivos por centrifugación y se analizan las células para ésteres metílicos de ácidos graso mediante cromatografía de gases para determinar los siguientes datos parta cada cultivo: (1) perfil de ácidos grasos; (2) contenido de PUFA;
- (3)
- contenido de grasa (estimada como la cantidad total de ácidos grasos (TFA)). Estos datos se analizan después haciendo las siguientes cinco preguntas:
Criterios de selección: Matraz de bajo O2/anóxico frente al matraz aeróbico (sí/no)
- (1)
- ¿El DHA (u otro contenido de PUFA) (como % de FAME) permanecía aproximadamente igual o preferiblemente aumentaba en el cultivo de bajo oxígeno en comparación con el cultivo aeróbico?
- (2)
- ¿Es C14:0 + C16:0 + C16:1 mayor de aproximadamente el 40 % de TFA en el cultivo anóxico?
- (3)
- ¿Hay muy poco (>1 % como FAME) o ningún precursor (C18:3n-3 +C18:2n-6+C18:3n-6) para la ruta convencional de elongasa/desaturasa dependiente de oxígeno en el cultivo anóxico?
- (4)
- ¿El contenido de grasa (como la cantidad total de ácidos grasos/peso seco de la célula) aumentaba en el cultivo de bajo oxígeno en comparación con el cultivo aeróbico?
- (5)
- ¿El DHA (u otro contenido de PUFA) estaba aumentado como % en peso seco de la célula en el cultivo de bajo oxígeno en comparación con el cultivo aeróbico?
Si las tres primeras preguntas se contestan sí, existe un buen indicio de que la cepa contiene un sistema genético PKS para fabricar PUFA de cadena larga. Cuantas más preguntas se contesten sí (preferiblemente las tres primeras preguntas deben contestarse sí), más fuerte será el indicio de que la cepa contiene dicho sistema genético PKS. Si las cinco preguntas se contestan sí, entonces existe un indicio muy fuerte de que la cepa contiene un sistema genético PKS para fabricar PUFA de cadena larga.
Siguiente el método resumido anteriormente, se usó un vial congelado de Thraustochytrium sp. 23B (ATCC 20892) para inocular un matraz de agitación de 250 ml que contenía 50 ml de medio RCA. El cultivo se agitó en una mesa
- oscilatoria (200 rpm) durante 72 h a 25 ºC. El medio RCA contiene lo siguiente:
- Medio RCA
- Agua
- 1000 ml
- Sales marinas Reef Crystals®
- 40 g/l
- Glucosa
- 20 g/l
- Glutamato monosódico (MSG)
- 20 g/l
- Extracto de levadura
- 1 g/l
- Metales PII*
- 5 ml/l
- Mezcla de vitaminas*
- 1 ml/l
- pH
- 7,0
*La mezcla de metales PII y la mezcla de vitaminas son iguales a las resumidas en la patente de Estados Unidos n.º 5.130.742.
Entonces se usaron 25 ml del cultivo de 72 h de antigüedad para inocular otro matraz de agitación de 250 ml que contenía 50 ml de medio RCA bajo en nitrógeno (10 g/l de MSG en lugar de 20 g/l) y los otros 25 ml de cultivo se usaron para inocular un matraz de agitación de 250 ml que contenía 175 ml de medio RCA bajo en nitrógeno. Los dos matraces después se colocaron en una mesa oscilatoria (200 rpm) durante 72 h a 25 ºC. Las células después se recogieron mediante centrifugación y se secaron por liofilización. Las células secadas se analizaron para el
contenido de grasa y el perfil y contenido de ácidos grasos usando procedimientos convencionales de cromatografía de gases (tales como los resumidos en el documento US 5.130.742).
Los resultados de la selección para Thraustochytrium 23B fueron los siguientes:
¿Aumentaba DHA como % de FAME? Sí (38->44 %)
¿C14:0 + C16:0 + C16:1 mayor que aproximadamente el 40 % de TFA? Sí (44 %)
¿Nada de C18:3(n-3) o C18:3(n-6)? Sí (0 %)
¿Aumentaba el contenido de grasa? Sí (aumento de 2 veces)
¿Aumentaba DHA (u otro contenido de PUFA)? Sí (aumento de 2,3 veces)
Los resultados, especialmente el aumento significativo en el contenido de DHA (como % de FAME) en condiciones de bajo oxígeno, indican fuertemente la presencia de un sistema PKS que produce PUFA en la cepa de
Thraustochytrium.
Para proporcionar datos adicionales que confirmen la presencia de un sistema PUFA PKS, se realizó transferencia de Southern de Thraustochytrium 23B usando sondas de PKS de Schizochytrium cepa 20888, una cepa que ya se ha determinado que contiene un sistema PKS que produce PUFA (es decir, SEC ID Nº 1-32 descritas anteriormente). Se detectaron fragmentos de ADN genómico de Thraustochytrium 23B que son homólogos a sondas de hibridación de genes de síntesis de PUFA por PKS usando la técnica de transferencia de Southern. Se digirió el ADN genómico de Thraustochytrium 23B con endonucleasas de restricción ClaI o KpnI, se separó por electroforesis en gel de agarosa (0,7 % de agarosa, en tampón convencional Tris-Acetato-EDTA), y se transfirió a una membrana Nytran Supercharge de Schleicher & Schuell por transferencia capilar. Se usaron dos sondas de hibridación marcadas con digoxigenina -una específica para la región enoil reductasa (ER) de Orf B de PKS de Schizochytrium (nucleótidos 5012-5511 de Orf B; SEC ID Nº 3), y la otra específica para una región conservada en el inicio de la Orf C de PKS de Schizochytrium (nucleótidos 76-549 de OrfC; SEC ID Nº 5).
La sonda de OrfB-ER detectó un fragmento ClaI de aproximadamente 13 kb y un fragmento KpnI de aproximadamente 3,6 kb en el ADN genómico de Thraustochytrium 23B. La sonda de OrfC detectó un fragmento ClaI de aproximadamente 7,5 kb y un fragmento KpnI de aproximadamente 4,6 kb en el ADN genómico de Thraustochytrium 23B.
Finalmente, se seleccionó una biblioteca genómica recombinante, que consistía en fragmentos de ADN del ADN genómico de Thraustochytrium 23B insertado en vector lambda FIX II (Stratagene), usando sondas marcadas con digoxigenina correspondientes a los siguientes segmentos de genes de PUFA-PKS de Schizochytrium 20888: nucleótidos 7385-7879 de Orf A (SEC ID Nº 1), nucleótidos 5012-5511 de Orf B (SEC ID Nº 3), y nucleótidos 76-549 de Orf C (SEC ID Nº 5). Cada una de estas sondas detectó placas positivas de la biblioteca de Thraustochytrium 23B, lo que indica homología extensiva entre los genes de PUFA-PKS de Schizochytrium y los genes de Thraustochytrium 23B.
En resumen, estos resultados demuestran que el ADN genómico de Thraustochytrium 23B contiene secuencias que son homólogas a genes de PKS de Schizochytrium 20888.
Este microorganismo traustoquitridio está incluido en este documento como una fuente adicional de estos genes para uso en las realizaciones anteriores.
Thraustochytrium 23B (ATCC 20892) es significativamente diferente de Schizochytrium sp. (ATCC 20888) en su perfil de ácidos grasos. Thraustochytrium 23B puede tener relaciones DHA:DPA(n-6) tan elevadas como de 14:1 en comparación con solamente 2-3:1 en Schizochytrium (ATCC 20888). Thraustochytrium 23B también puede tener niveles mayores de C20:5(n-3). El análisis de los dominios en el sistema PUFA PKS de Thraustochytrium 23B en comparación con el sistema PUFA PKS conocido de Schizochytrium debe proporcionarnos información clave sobre el modo de modificar estos dominios para influir en la relación y tipos de PUFA producidos usando estos sistemas.
El método de selección descrito anteriormente se ha utilizado para identificar otras cepas candidatas potenciales que contengan un sistema PUFA PKS. Dos cepas adicionales que los presentes inventores han identificado que tienen sistemas PUFA PKS son Schizochytrium limacium (SR21) Honda y Yokochi (IF032693) y Ulkenia (BP-5601). Ambas se seleccionaron como anteriormente, pero en medio N2 (glucosa: 60 g/l; KH2PO4: 4,0 g/l; extracto de levadura: 1,0 g/l; agua de remojo de maíz: 1 ml/l; NH4NO3: 1,0 g/l; sales marinas artificiales (Reef Crystals): 20 g/l; todas las concentraciones anteriores mezcladas en agua desionizada). Para ambas cepas de Schizochytrium y Ulkenia, las respuestas a las primeras tres preguntas de filtro analizadas anteriormente para Thraustochytrium 23B fueron sí (Schizochytrium -DHA % FAME 32->41 % aeróbico frente a anóxico, 58 % 14:0/16:0/16:1, 0 % precursores) y
(Ulkenia -DHA % FAME 28->44 % aeróbico frente a anóxico, 63 % 14:0/16:0/16:1, 0 % precursores), lo que indica que estas cepas son buenos candidatos para que contengan un sistema PUFA PKS. Se obtuvieron respuestas negativas para las dos preguntas finales para cada cepa: grasa disminuida del 61 % en peso seco al 22 % en peso seco, y DHA del 21-9 % en peso seco en S. limacium y grasa disminuida del 59 al 21 % en peso seco en Ulkenia y DHA del 16 % al 9 % en peso seco. Estos microorganismos traustoquitridios también se reivindican en este documento como fuentes adicionales de los genes para uso en las realizaciones anteriores.
Ejemplo 3
El siguiente ejemplo demuestras que la síntesis de DHA y DPA en Schizochytrium no implica desaturasas unidas a membrana o enzimas de elongación de ácidos grasos como las descritas para otros eucariotas (Parker-Barnes et al., 2000, supra; Shanklin et al., 1998, supra).
Schizochytrium cumula grandes cantidades de triacilgliceroles ricos en DHA y ácido docosapentaenoico (DPA; 22:5ω6); por ejemplo, 30 % de DHA + DPA en peso seco. En eucariotas que sintetizan PUFA de 20 y 22 carbonos mediante una ruta de elongación/desaturación, las combinaciones de intermedios de 18, 20 y 22 carbonos son relativamente grandes de modo que experimentos de marcaje in vivo usando [14C]-acetato revelan una clara cinética precursor-producto para los intermedios predichos. Además, los intermedios radiomarcados proporcionados de forma exógena a dichos organismos se convierten en los productos PUFA finales.
Se suministró [1-14C]acetato a un cultivo de 2 días de antigüedad como un único pulso a tiempo cero. Después se recogieron muestras de células por centrifugación y se extrajeron los lípidos. Además, se estimó la captación de [114C]acetato por las células midiendo la radiactividad de la muestra antes y después de la centrifugación. Se separaron los ésteres metílicos del ácido graso derivados de los lípidos celulares totales por AgNO3-TLC (disolvente, hexano:éter dietílico:ácido acético, 70:30:2 en volumen). La identidad de las bandas de ácido graso se verificó por cromatografía de gases, y se midió la radiactividad en ellas por recuento de centelleo. Los resultados mostraron que se captaba rápidamente [1-14C]-acetato por células de Schizochytrium y se incorporaba en los ácidos grasos, pero en el tiempo más corto de marcaje (1 min) DHA contenía un 31 % del marcador recuperado en los ácidos grasos y este porcentaje permaneció esencialmente inalterado durante los 10-15 min de incorporación de [14C]-acetato y las posteriores 24 horas de crecimiento del cultivo (datos no mostrados). Asimismo, DPA representaba el 10 % del marcador en todo el experimento. No existen evidencias de una relación precursor-producto entre ácidos grasos de 16 o 18 carbonos y los ácidos grasos poliinsaturados de 22 carbonos. Estos resultados son coherentes con la rápida síntesis de DHA a partir de [14C]-acetato que implica combinaciones muy pequeñas (posiblemente unidas a enzimas) de intermedios.
A continuación, las células se alteraron en tampón fosfato 100 mM (pH 7,2), que contenía DTT 2 mM, EDTA 2 mM, y glicerol al 10 %, agitando con vórtice con perlas de vidrio. El homogeneizado sin células se centrifugó a 100.000 g durante 1 hora. Se incubaron alícuotas equivalentes de las fracciones de homogeneizado total, sedimento (sedimento H-S), y sobrenadante (sobrenadante H-S) en tampón de homogenización suplementado con acetil-CoA 20 µM, [1-14C]malonil-CoA 100 µM (0,9 Gbq/mol), NADH 2 mM, y NADPH 2 mM durante 60 min a 25 ºC. Se extrajeron los ensayos y se prepararon y separaron los ésteres metílicos de ácido graso como se ha descrito anteriormente antes de la detección de la radiactividad con un Instantimager (Packard Instruments, Meriden, CT). Los resultados mostraron que un homogenizado sin células derivado de cultivos de Schizochytrium incorporaba [1-14C]-malonil-CoA en DHA, DPA, y ácidos grasos saturados (datos no mostrados). Se retuvieron las mismas actividades biosintéticas por una fracción de sobrenadante a 100.000 xg pero no estuvieron presentes en el sedimento de membrana. Estos datos contrastan con los obtenidos durante los ensayos de las enzimas bacterianas (véase Metz et al., 2001, supra) y pueden indicar el uso de una molécula aceptora de acilo diferente (soluble). Por tanto, la síntesis de DHA y DPA en Schizochytrium no implica desaturasas unidas a membrana o enzimas de elongación de ácidos grasos como las descritas para otros eucariotas.
Aunque se han descrito en detalle diversas realizaciones de la presente invención definida en las reivindicaciones, es evidente para los expertos en la materia que encontrarán modificaciones y adaptaciones de esas realizaciones. Debe entenderse expresamente, sin embargo, que dichas modificaciones y adaptaciones están dentro del alcance de la presente invención, como se describe en las siguientes reivindicaciones.
LISTADO DE SECUENCIAS
<110> Metz, James
Barclay, William
Flatt, James
Kuner, Jerry
<120> SISTEMAS DE PUFA POLICÉTIDO SINTASA Y USOS DE LOS MISMOS
<130> 2997-29-PCT
<150> 60/284.066
<151>
<150> 60/298.796
5 <151>
<150> 60/323.269
<151>
<170> PatentIn versión 3.1
<210> 1 15 <211> 8730
<212> ADN
<213> Schizochytrium sp.
<220> 20 <221> CDS
<222> (1)..(8730)
<223>
<400> 1 25
<210> 2
<211> 2910
<212> PRT
<213> Schizochytrium sp.
<400> 2
<210> 3
<211> 6177
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(6177)
<223>
<400> 3
<210> 4
<211> 2059
5 <212> PRT
<213> Schizochytrium sp.
<220>
- <221>
- misc_feature 10 <222> (370)..(370)
<223> El 'Xaa' en la posición 370 representa Leu.
<220>
- <221>
- misc_feature 15 <222> (371)..(371)
<223> El 'Xaa' en la posición 371 representa Ala. o Val.
<400> 4
<210> 5
<211> 4509
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(4509)
<223>
<400> 5
<210> 6
<211> 1503
<212> PRT
<213> Schizochytrium sp.
<400> 6
<210> 7
<211> 600
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(600)
<223>
<400> 7
<210> 8
<211> 200
<212> PRT
<213> Schizochytrium sp.
<400> 8
<211> 1278
<212> ADN
<213> Schizochytrium sp.
<221> CDS
<222> (1)..(1278)
<223>
<210> 10
<211> 426
<212> PRT
<213> Schizochytrium sp.
<400> 10
<210> 11
<211> 5
<212> PRT
<213> Schizochytrium sp.
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> X = cualquier aminoácido
<400> 11
<210> 12
<211> 258
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(258)
<223>
<400> 12
<210> 13
<211> 86
<212> PRT
<213> Schizochytrium sp.
<400> 13
<210> 14
<211> 5
<212> PRT 15 <213> Schizochytrium sp.
<400> 14
<210> 15
<211> 21
<212> PRT
- <213>
- Schizochytrium sp. 25
<400> 15
<210> 16
<211> 3006
<212> ADN
<213> Schizochytrium sp.
<400> 16
<210> 17
<211> 2133
<212> ADN
- <213>
- Schizochytrium sp. 15
<220>
<221> CDS
<222> (1)..(2133)
<223> 20
<400> 17
<210> 18
<211> 711
<212> PRT
<213> Schizochytrium sp.
<400> 18
<210> 19
<211> 1350
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(1350)
<223>
<400> 19
<210> 20
<211> 450
<212> PRT
<213> Schizochytrium sp.
5
<220>
<221> misc_feature
<222> (370)..(370)
- <223>
- El 'Xaa' en la posición 370 representa Leu. 10
<220>
<221> misc_feature
<222> (371)..(371)
- <223>
- El 'Xaa' en la posición 371 representa Ala. o Val. 15
<400> 20 <210> 21
<211> 1323
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(1323)
<223>
<400> 21
<210> 22
<211> 441
<212> PRT
<213> Schizochytrium sp.
<400> 22
<210> 23
<211> 1500
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(1500)
<223>
<400> 23
<210> 24
<211> 500
<212> PRT
<213> Schizochytrium sp.
<400> 24
<210> 25
<211> 1530
<212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS
<222> (1)..(1530)
<223>
<400> 25
<210> 26
<211> 510
<212> PRT
<213> Schizochytrium sp.
<400> 26
<210> 27
<211> 4512
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(4512)
<223>
<400> 27
<210> 28
<211> 1503
<212> PRT
<213> Schizochytrium sp.
<400> 28
<210> 29
<211> 1500
5 <212> ADN
<213> Schizochytrium sp.
<220>
<221> CDS 10 <222> (1)..(1500)
<223>
<400> 29
<210> 30
<211> 500
<212> PRT
<213> Schizochytrium sp.
<400> 30
<210> 31
<211> 1512
<212> ADN
<213> Schizochytrium sp. 5
<220>
<221> CDS
<222> (1)..(1512)
<223> 10
<400> 31
<210> 32
<211> 504
<212> PRT
<213> Schizochytrium sp.
<400> 32
<210> 33
<211> 9
5 <212> PRT
<213> Secuencia artificial
<220>
<223> motivo 10 <220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> x = cualquier aminoácido
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> x = A o S
<220>
<221> MISC_FEATURE
<222> (7)..(8)
<223> x = cualquier aminoácido
<400> 33
<210> 34
<211> 6
<212> PRT
<213> Secuencia artificial
<220>
<223> motivo
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> x = I o L o V
<400> 34
<210> 35
<211> 5
<212> PRT
<213> Secuencia artificial
<220>
<223> motivo
<220>
<221> MISC_FEATURE
<222> (1)..(5)
<223> x = I o L o V
<400> 35
<210> 36
<211> 4244
<212> ADN
<213> Schizochytrium sp.
<400> 36 5 <210> 37
<211> 3886
<212> ADN
<213> Schizochytrium sp. 5
<220>
<221> misc_feature
<222> (2115)..(2115)
<223> n = a, c, g o t 10
<400> 37
Claims (11)
- REIVINDICACIONES1. Una molécula aislada de ácido nucleico que consiste en una secuencia de ácido nucleico seleccionada entre el grupo que consiste en:
- a.
- una secuencia de ácido nucleico que codifica una secuencia de aminoácidos seleccionada entre el grupo que consiste en: SEC ID Nº 30, posiciones 1-450 de SEC ID Nº 6, y fragmentos biológicamente activos de la misma, en la que los fragmentos biológicamente activos muestran una actividad β-hidroxi acil-ACP deshidrasa (DH) tipo FabA;
- b.
- una secuencia de ácido nucleico que codifica una secuencia de aminoácidos que es al menos un 60 % idéntica a dicha secuencia de aminoácidos de (a), en la que dicha secuencia de aminoácidos tiene una actividad β-hidroxi acil-ACP deshidrasa (DH) tipo FabA; y
- c.
- una secuencia de ácido nucleico que es completamente complementaria a la secuencia de ácido nucleico de
(a) o (b). -
- 2.
- La molécula aislada de ácido nucleico de la reivindicación 1, en la que dicha molécula de ácido nucleico consiste en la secuencia de ácido nucleico de las posiciones 1-1350 de SEC ID Nº 5, o de la secuencia de ácido nucleico de SEC ID Nº 29.
-
- 3.
- Vector que consiste en una secuencia de ácido nucleico seleccionada entre el grupo que consiste en:
- a.
- una secuencia de ácido nucleico que codifica una secuencia de aminoácidos seleccionada entre el grupo que consiste en: SEC ID Nº 30, posiciones 1-450 de SEC ID Nº 6, y fragmentos biológicamente activos de la misma, en la que los fragmentos biológicamente activos muestran una actividad ß-hidroxi acil-ACP deshidrasa (DH) tipo FabA;
- b.
- una secuencia de ácido nucleico que codifica una secuencia de aminoácidos que es al menos un 60% idéntica a dicha secuencia de aminoácidos de (a), en la que dicha secuencia de aminoácidos tiene una actividad ß-hidroxi acil-ACP deshidrasa (DH) tipo FabA;
- c.
- una secuencia de ácido nucleico que es completamente complementaria a la secuencia de ácido nucleico de
(a) o (b); y- d.
- la secuencia de ácido nucleico de las posiciones 1-1350 de SEC ID Nº 5, o la secuencia de ácido nucleico de SEC ID Nº 29;
unidas de forma funcional a al menos una secuencia de control de la transcripción. -
- 4.
- Una célula recombinante que comprende el vector de la reivindicación 3.
-
- 5.
- Un microorganismo modificado genéticamente, en el que dicho microorganismo expresa un sistema PKS que comprende al menos un dominio biológicamente activo de un sistema PUFA PKS, en el que dicho microorganismo comprende el vector de la reivindicación 3.
-
- 6.
- El microorganismo modificado genéticamente de la reivindicación 5, en el que dicho microorganismo se ha modificado genéticamente adicionalmente para que exprese de forma recombinante al menos una molécula de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PKS seleccionado entre el grupo que consiste en: un sistema PUFA PKS bacteriano; un sistema PKS Tipo I; un sistema PKS Tipo II; y un sistema PKS modular.
-
- 7.
- Una planta modificada genéticamente que comprende el vector de la reivindicación 3, en la que dicha planta se ha modificado genéticamente para que exprese de forma recombinante un sistema PKS que comprende al menos un dominio biológicamente activo de un sistema PUFA PKS, en la que dicho dominio está codificado por el vector de la reivindicación 3.
-
- 8.
- La planta modificada genéticamente de la reivindicación 7, en la que dicha planta se ha modificado genéticamente adicionalmente para que exprese de forma recombinante al menos una molécula de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PKS seleccionado entre el grupo que consiste en: un sistema PUFA PKS bacteriano; un sistema PKS Tipo I; un sistema PKS Tipo II; y un sistema PKS modular.
-
- 9.
- Un método para producir una molécula bioactiva que se produce por un sistema PKS, que comprende hacer crecer o cultivar, en condiciones eficaces para producir dicha molécula bioactiva en un organismo modificado genéticamente, en el que dicho organismo modificado genéticamente es el microorganismo modificado genéticamente de acuerdo con la reivindicación 5 o 6 o la planta modificada genéticamente de acuerdo con la
reivindicación 7 u 8 que exprese un sistema PKS que comprende al menos un dominio biológicamente activo del sistema PUFA PKS. -
- 10.
- Un método para producir una planta que tiene un perfil de PUFA que difiere de la planta de origen natural, que
5 comprende modificar genéticamente células de dicha planta para que expresen un sistema PKS que comprende al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS, en el que dicho al menos un dominio está codificado por el vector de la reivindicación 3.10 11. Un método para producir leche animal humanizada, que comprende modificar genéticamente células productoras de leche de un animal no humano productor de leche con al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS, en el que dicho al menos un dominio está codificado por el vector de la reivindicación 3. - 12. Un método para producir un microbio recombinante, que comprende modificar genéticamente células microbianas para que expresen al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica al menos un dominio biológicamente activo de un sistema PUFA PKS, en el que dicho al menos un dominio está codificado por el vector de la reivindicación 3.131 132 133
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28406601P | 2001-04-16 | 2001-04-16 | |
US284066P | 2001-04-16 | ||
US29879601P | 2001-06-15 | 2001-06-15 | |
US298796P | 2001-06-15 | ||
US32326901P | 2001-09-18 | 2001-09-18 | |
US323269P | 2001-09-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2628553T3 true ES2628553T3 (es) | 2017-08-03 |
Family
ID=27403446
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES10178950.1T Expired - Lifetime ES2567305T3 (es) | 2001-04-16 | 2002-04-16 | Sistemas de PUFA policétido sintasa y usos de los mismos |
ES02731415.2T Expired - Lifetime ES2562766T3 (es) | 2001-04-16 | 2002-04-16 | Sistemas de PUFA policétido sintasa y usos de los mismos |
ES10178962.6T Expired - Lifetime ES2628553T3 (es) | 2001-04-16 | 2002-04-16 | Sistemas de PUFA policétido sintasa y usos de los mismos |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES10178950.1T Expired - Lifetime ES2567305T3 (es) | 2001-04-16 | 2002-04-16 | Sistemas de PUFA policétido sintasa y usos de los mismos |
ES02731415.2T Expired - Lifetime ES2562766T3 (es) | 2001-04-16 | 2002-04-16 | Sistemas de PUFA policétido sintasa y usos de los mismos |
Country Status (9)
Country | Link |
---|---|
EP (5) | EP2366774A3 (es) |
JP (4) | JP2005510203A (es) |
CN (2) | CN101892249A (es) |
AR (1) | AR040622A1 (es) |
AU (2) | AU2002303394B2 (es) |
CA (1) | CA2444164C (es) |
ES (3) | ES2567305T3 (es) |
TW (3) | TWI426127B (es) |
WO (1) | WO2002083870A2 (es) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5340742A (en) | 1988-09-07 | 1994-08-23 | Omegatech Inc. | Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids |
US6566583B1 (en) | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
US7217856B2 (en) | 1999-01-14 | 2007-05-15 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US7211418B2 (en) | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US8003772B2 (en) | 1999-01-14 | 2011-08-23 | Martek Biosciences Corporation | Chimeric PUFA polyketide synthase systems and uses thereof |
US7247461B2 (en) | 1999-01-14 | 2007-07-24 | Martek Biosciences Corporation | Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof |
JP2004501603A (ja) | 2000-01-28 | 2004-01-22 | マーテック バイオサイエンシズ ボールダーコーポレイション | 発酵槽での真核微生物の超高密度培養によるポリエン脂肪酸を含有する脂質の生産促進 |
AU2003303242B2 (en) * | 2002-12-19 | 2009-05-21 | Monsanto Technology, Llc | Elevation of oil levels in Brassica plants |
MX341785B (es) * | 2003-03-26 | 2016-09-01 | Dsm Ip Assets B V * | Sistemas de sintasa de poliquetida pufa y uso de los mismos. |
EP1720539A4 (en) * | 2004-02-13 | 2010-07-21 | Martek Biosciences Corp | FATTY ACID SYNTHASE (FAS) SCHIZOCHYTRIUM AND RELATED PRODUCTS AND METHODS |
DE102004017370A1 (de) * | 2004-04-08 | 2005-10-27 | Nutrinova Nutrition Specialties & Food Ingredients Gmbh | PUFA-PKS Gene aus Ulkenia |
DE102004017369A1 (de) | 2004-04-08 | 2005-11-03 | Nutrinova Nutrition Specialties & Food Ingredients Gmbh | Screeningverfahren zur Identifizierung von PUFA-PKS in Proben |
US7807849B2 (en) | 2004-04-22 | 2010-10-05 | Commonwealth Scientific And Industrial Research Organisation | Synthesis of long-chain polyunsaturated fatty acids by recombinant cells |
BR122019013200B1 (pt) | 2004-04-22 | 2022-04-12 | Commonwealth Scientific And Industrial Research Organisation | Polinucleotídeo isolado, vetor, célula microbiana recombinante capaz de sintetizar ácido (s) graxo(s) poliinsaturado(s) de cadeia longa, método para produção da referida célula microbiana recombinante, método para produção de ácido(s) graxo(s) poliinsaturado(s) de cadeia longa, método para produção de óleo, método para produção de semente oleaginosa, extrato de semente transgênica, composição, ração e uso da referida célula recombinante, vetor ou extrato |
WO2006135866A2 (en) * | 2005-06-10 | 2006-12-21 | Martek Biosciences Corporation | Pufa polyketide synthase systems and uses thereof |
SG163551A1 (en) | 2005-07-01 | 2010-08-30 | Martek Biosciences Corp | Polyunsaturated fatty acid-containing oil product and uses and production thereof |
AU2007226511A1 (en) | 2006-03-15 | 2007-09-20 | Dsm Ip Assets B.V. | Plant seed oils containing polyunsaturated fatty acids |
EP2059588A4 (en) | 2006-08-29 | 2010-07-28 | Commw Scient Ind Res Org | FATTY ACID SYNTHESIS |
NZ574846A (en) * | 2006-08-29 | 2012-04-27 | Martek Biosciences Corp | USE OF DPA(n-6) OILS IN INFANT FORMULA |
EP2358882B1 (en) | 2008-11-18 | 2017-07-26 | Commonwealth Scientific and Industrial Research Organisation | Enzymes and methods for producing omega-3 fatty acids |
CA3012998C (en) * | 2009-03-19 | 2021-09-07 | Dsm Ip Assets B.V. | Polyunsaturated fatty acid synthase nucleic acid molecules and polypeptides, compositions, and methods of making and uses thereof |
JP6242882B2 (ja) | 2012-06-15 | 2017-12-06 | コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション | 植物細胞における長鎖多価不飽和脂肪酸の産生 |
CN104726473B (zh) | 2013-12-18 | 2020-02-14 | 联邦科学技术研究组织 | 包含二十二碳六烯酸的提取的植物脂质 |
KR102527795B1 (ko) | 2014-06-27 | 2023-05-02 | 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 | 도코사펜타에노산을 포함하는 지질 |
BR112021002299A2 (pt) * | 2018-08-10 | 2021-05-04 | Kyowa Hakko Bio Co., Ltd | micro-organismo produzindo ácido graxo poli-insaturado e método para produzir ácido graxo poli-insaturado |
EP3835410A4 (en) * | 2018-08-10 | 2022-05-18 | Kyowa Hakko Bio Co., Ltd. | MICROORGANISM PRODUCING EICOSAPENTAENOIC ACID AND METHOD FOR PRODUCTION OF EICOSAPENTAENOIC ACID |
CN218198109U (zh) * | 2019-10-23 | 2023-01-03 | 索尼公司 | 移动装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4743546A (en) | 1985-02-13 | 1988-05-10 | Biotechnica International, Inc. | Controlled gene excision |
US5130742A (en) | 1986-05-20 | 1992-07-14 | Canon Kabushiki Kaisha | Camera having selectable white balance modes |
US5130242A (en) * | 1988-09-07 | 1992-07-14 | Phycotech, Inc. | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
AU5346296A (en) * | 1995-04-17 | 1996-11-07 | Japan As Represented By Director-General Of Agency Of Industrial Science And Technology | Novel microorganisms capable of producing highly unsaturated fatty acids and process for producing highly unsaturated fa tty acids by using the microorganisms |
IN1998CH01219A (en) * | 1997-06-04 | 2005-03-04 | Calgene Llc | Production of polyunsaturated fatty acid by expression of polyketide-like synthesis genes in plants |
US6566583B1 (en) * | 1997-06-04 | 2003-05-20 | Daniel Facciotti | Schizochytrium PKS genes |
JP6257306B2 (ja) | 2013-12-18 | 2018-01-10 | キヤノン株式会社 | 着弾位置測定装置および着弾位置測定方法 |
-
2002
- 2002-04-15 TW TW100122042A patent/TWI426127B/zh not_active IP Right Cessation
- 2002-04-15 TW TW099125328A patent/TWI426126B/zh not_active IP Right Cessation
- 2002-04-15 TW TW091107633A patent/TWI337619B/zh not_active IP Right Cessation
- 2002-04-16 AU AU2002303394A patent/AU2002303394B2/en not_active Expired
- 2002-04-16 CN CN2010102222164A patent/CN101892249A/zh active Pending
- 2002-04-16 ES ES10178950.1T patent/ES2567305T3/es not_active Expired - Lifetime
- 2002-04-16 JP JP2002582209A patent/JP2005510203A/ja not_active Withdrawn
- 2002-04-16 CA CA2444164A patent/CA2444164C/en not_active Expired - Lifetime
- 2002-04-16 EP EP10178976A patent/EP2366774A3/en not_active Withdrawn
- 2002-04-16 AR AR20020101372A patent/AR040622A1/es not_active Application Discontinuation
- 2002-04-16 EP EP10178938A patent/EP2366771A3/en not_active Withdrawn
- 2002-04-16 ES ES02731415.2T patent/ES2562766T3/es not_active Expired - Lifetime
- 2002-04-16 EP EP10178950.1A patent/EP2366772B1/en not_active Expired - Lifetime
- 2002-04-16 EP EP02731415.2A patent/EP1385934B1/en not_active Expired - Lifetime
- 2002-04-16 ES ES10178962.6T patent/ES2628553T3/es not_active Expired - Lifetime
- 2002-04-16 CN CNA028117492A patent/CN1535312A/zh active Pending
- 2002-04-16 EP EP10178962.6A patent/EP2366773B1/en not_active Expired - Lifetime
- 2002-04-16 WO PCT/US2002/012254 patent/WO2002083870A2/en active Application Filing
-
2008
- 2008-06-16 JP JP2008156666A patent/JP4781399B2/ja not_active Expired - Lifetime
- 2008-11-21 AU AU2008249168A patent/AU2008249168B2/en not_active Expired
-
2009
- 2009-10-16 JP JP2009239439A patent/JP5460232B2/ja not_active Expired - Lifetime
-
2013
- 2013-07-09 JP JP2013143216A patent/JP5806259B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2628553T3 (es) | Sistemas de PUFA policétido sintasa y usos de los mismos | |
US7973149B2 (en) | PUFA polyketide synthase systems and uses thereof | |
AU2002303394A1 (en) | PUFA polyketide synthase systems and uses thereof | |
ES2516641T3 (es) | Sistemas de policétido sintasa de AGPI y usos de los mismos | |
HK1162575A (en) | Pufa polyketide synthase systems and uses thereof | |
HK1060900B (en) | Pufa polyketide synthase systems and uses thereof | |
HK1162578A (en) | Pufa polyketide synthase systems and uses thereof | |
HK1162577A (en) | Pufa polyketide synthase systems and uses thereof | |
HK1162576A (en) | Pufa polyketide synthase systems and uses thereof | |
AU2012227225A1 (en) | Pufa polyketide synthase system and uses thereof |