MXPA01009577A - Una nueva clase de enzimas en la trayectoria biosintetica para la produccion de triacilglicerol y moleculas de adn recombinante que codifican estan enzimas. - Google Patents

Una nueva clase de enzimas en la trayectoria biosintetica para la produccion de triacilglicerol y moleculas de adn recombinante que codifican estan enzimas.

Info

Publication number
MXPA01009577A
MXPA01009577A MXPA01009577A MXPA01009577A MXPA01009577A MX PA01009577 A MXPA01009577 A MX PA01009577A MX PA01009577 A MXPA01009577 A MX PA01009577A MX PA01009577 A MXPA01009577 A MX PA01009577A MX PA01009577 A MXPA01009577 A MX PA01009577A
Authority
MX
Mexico
Prior art keywords
gly
leu
ser
lys
asp
Prior art date
Application number
MXPA01009577A
Other languages
English (en)
Inventor
Anders Dahlqvist
Original Assignee
Basf Plant Science Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Gmbh filed Critical Basf Plant Science Gmbh
Publication of MXPA01009577A publication Critical patent/MXPA01009577A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

La presente invención se refiere a aislamiento, identificación y caracterización de secuencias de nucleótidos que codifican una enzima que cataliza la transferencia deácidos grasos a partir de fosfolípidos a diacilglicerol en la trayectoria biosintética para la producción de triacilglicerol, a dichas enzimas y un proceso para la producción de triacilglicerol

Description

UNA NUEVA CLASE DE ENZIMAS EN LA TRAYECTORIA BIOSINTÉTICA PARA LA PRODUCCIÓN DE TRIACILGLICEROL Y MOLÉCULAS DE ADN RECOMBINANTE QUE CODIFICAN ESTAS ENZIMAS La presente invención se refiere al aislamiento, identificación y caracterización de las moléculas de ADN recombinante que codifican enzimas que catalizan la transferencia de ácidos grasos a partir de los fosfolipidos a diacilglicerol en la trayectoria biosintética para la producción de triacilglicerol . El triacilglicerol (TAG) es la reserva de energía a base de lipidos más común en la naturaleza. La trayectoria o ruta principal para la síntesis de TAG se cree, involucra tres transferencias de acilo secuenciales de acil-CoA hasta una estructura de glícerol (1, 2) . Por muchos años, la acil-CoA : diacilglicerol aciltransferasa (DAGAT), la cual cataliza la tercera reacción de transferencia de acilo, se que pensó era solamente la única enzima involucrada en la síntesis de TAG. Actúa por la desviación del diacilglicerol (DAG) de la síntesis de lipidos de la membrana en TAG (2) . Los genes que codifican esta enzima fueron recientemente identificados tanto en los ratones (3) como en las plantas (4,5), y las proteínas codificadas mostraron ser homologas a acil-CoA: colesterol aciltransferasa (ACAT) . También se reportó recientemente que existe otra DAGAT en el hongo oleaginoso Mortierella ramanniana , la cual no está relacionada al DAGAT de ratón, la familia del gen ACAT o cualquier otro gen conocido ( 6) . La presente invención se refiere a un nuevo tipo de enzimas y sus genes que los codifican para la transformación. Más específicamente, la invención se refiere al uso de un tipo de genes que codifican un tipo de enzimas no descrito previamente, posteriormente designado como fosfolípido: diacilglicerol aciltrans ferasas (PDAT), con ello esta enzima cataliza una reacción independiente de acil-CoA. El tipo mencionado de genes expresados solo en organismos transgénicos , incrementará la cantidad total de aceite ( triacilgliceroles ) producidos en las células. Los genes PDAT, en combinación con un gen para la síntesis de un ácido graso no común, cuando se expresan en organismos transgénicos, incrementarán los niveles de los ácidos grasos no comunes en los triacilgliceroles. Hay un interés considerable alrededor del mundo, en la producción de materias base químicas, tales como ácidos grasos, para uso industrial a partir de recursos de plantas renovables en lugar de las petroquímicas no renovables. Este concepto tiene amplia atracción en los fabricantes y consumidores en las bases de la conservación de los recursos y proporciona oportunidad significante para desarrollar nuevos cultivos industriales para la agricultura . Hay un arreglo diverso de ácidos grasos inusuales en aceites a partir de especies de plantas silvestres y estos han sido bien caracterizados. Muchos de estos ácidos tienen potencial industrial y esto ha conducido al interés en domesticar especies de plantas relevantes para permitir la producción agrícola de ácidos grasos particulares. El desarrollo en tecnologías diseñadas genéticamente combinadas con el mayor entendimiento de la biosíntesis de ácidos granos inusuales, ahora hace posible transferir genes codificantes para las enzimas claves involucradas en la síntesis de un ácido graso particular a partir de especies silvestres en cultivos domesticados de semillas de aceites. En esta forma individual, los ácidos grasos se pueden producir en alta pureza y cantidades a costos moderados. En todos los cultivos como nabo, girasol, palmera de aceite, etc., el aceite (es decir, triacilgliceroles ) es el producto más valioso de las semillas o frutos y otros compuestos como almidón, proteína y fibra son considerados como derivados con menos valor. Incrementando la cantidad del aceite en base al peso en costo de otros compuestos en los cultivos, podrá por lo tanto, incrementar el valor del cultivo. Si los genes, que regulan la distribución del carbono reducido en la producción del aceite se pueden sobre-regular, las células acumularán más aceite en costo de otros productos. Tales genes no podrían solamente ser usados en células que producen ya elevado aceite, tales como cultivos de aceite, pero podrían también incluir producción de aceite significante en cultivos que contienen aceite moderado o bajo, tal como por ejemplo, soya, trigo, maíz, papa, remolacha azucarera y nabos, así como también en microorganismos .
Sumario de la Invención Muchos de los ácidos grasos inusuales de interés, por ejemplo, ácidos grasos de cadena media, ácidos grasos hidroxi, ácidos grasos epóxi y ácidos grasos acetilénicos, tienen propiedades físicas que son distintamente diferentes de los ácidos grasos de las plantas comunes. Los presentes inventores han encontrado que, en especies de plantas que acumulan naturalmente estos ácidos grasos no comunes en sus aceites de semillas (es decir, triacilglicerol ) , estos ácidos están ausentes, o se presentan en cantidades muy bajas en los ( fosfo ) lipidos de la membrana de la semilla. La baja concentración de estos ácidos en los lipidos de la membrana son más probablemente un prerrequisito para la función propia de la membrana y con ello para las funciones propias de la célula. Un aspecto de la invención es que semillas de cultivos transgénicos se puedan elaborar para acumular altas cantidades de ácidos grasos no comunes si estos ácidos grasos son eficientemente removidos de los lipidos de la membrana y encausados en los triacilgliceroles de las semillas . Los inventores han identificado una nueva clase de enzimas en plantas que catalizan la transferencia de ácidos grasos de los fosfolipidos a diacilglicerol en la producción de triacilglicerol a través de una reacción independiente de acil-CoA y que estas enzimas ( fosfolipido : diacilglicerol aciltransferasas, abreviadas como PDAT) , están involucradas en la remoción de ácidos grasos epoxigenados , hidroxilados , y probablemente también otros ácidos grasos no comunes tales como ácidos grasos de cadena media, de fosfolipidos en plantas. Esta reacción de enzima mostró estar presente en las preparaciones microsomales de levadura para hornear ( Saccharomyces cerevisiae) . La presente invención además pertenece a una enzima que comprende una secuencia de aminoácido como se expone en la SEC ID NO : 2 , o un fragmento funcional, derivado, alelo, homólogo o isoenzima de la misma. Se obtuvo un asi llamado mutante de levadura narcótica, disuelto en el gen respectivo, y las membranas microsomales del mutante muestran perder totalmente la actividad PDAT. Esto es, se prevé que el gen disuelto codifica a una enzima PDAT (SEC ID N0:1 y 2) . Además, esta enzima PDAT se caracteriza a través de la secuencia de aminoácido como se expone en la SEC ID NO : 2 , por contener una porción lipasa de hilera de la secuencia conservada FXKWVEA. La presente invención pertenece además, a una enzima que comprende una secuencia de aminoácido como se expone en la SEC ID NO: 16, 20 o 22, o un fragmento funcional, derivado, alelo, homólogo o isoenzima del mismo .
Además, genes y/o proteínas de función hasta ahora desconocida, se identificaron y están contemplados dentro del ámbito de la presente invención. Se identificaron un gen de Schi zosaccharomyces pombe, SPBC776.14 (SEC ID N0:3), una estructura de lectura abierta putativa CAA22887 de la SPBC776.14 (SEC ID N0:3). Además, se identificaron las secuencias genómicas adicionales de Arabidopsis thaliana (SEC ID NO: 4, 10 y 11) que codifican para las proteínas putativas, así como también la estructura de lectura abierta putativa AAC80628 del sitio A. Thaliana AC 004557 (SEC ID NO: 14) y se identificó una estructura de lectura abierta putativa AAD10668 del sitio de A. thaliana AC 003027 (SEC ID NO: 15) . También, se identificó un clon de ADNc parcialmente secuenciado de Neurospora crassa (SEC ID NO: 9) y un clon de Zea mays EST (Secuencia Extendida Tac) (SEC ID NO:7), y la secuencia de aminoácido putativa correspondiente (SEC ID NO : 8 ) . Finalmente, dos clones de ADNc se identificaron, uno en Arabidopsis thaliana EST (SEC ID NO: 5, y que corresponde a la secuencia de aminoácido predicha SEC ID NO: 6) y se identificó un clon de Lycopersicon esculentum EST (SEC ID NO: 12) . Además, las enzimas designadas como PDAT que comprenden una secuencia de aminoácido seleccionada del grupo que consiste de la secuencia como se expone en la SEC ID NO: 6, 17, 18, 25 o 27 que contienen una porción lipasa FXKWVEA están contempladas dentro del ámbito de la invención. Sin embargo, una enzima que comprende una secuencia de aminoácido codificada a través de una secuencia de nucleótido, porción, derivado, alelo u homólogo de la misma, se selecciona del grupo que consiste de secuencias como las expuestas en la SEC ID NO: 1, 3, 4, 5, 7, 9, 10, 11, 12, 19, 21, 23, 24, 25, 26, 28, 29, 30 ó 31, o un fragmento funcional, derivado, alelo, homólogo o isoenzima de la enzima que codifica a la secuencia de aminoácido, están incluidas dentro del ámbito de la invención. Un fragmento funcional de la enzima presente se entiende como cualquier secuencia de polipéptido que muestra actividad de enzima especifica de un fosfolipido : diacilglicerol aciltransferasa (PDAT). La longitud del fragmento funcional puede por ejemplo, variar en un rango desde aproximadamente 660 + 10 aminoácidos hasta 660 + 250 aminoácidos, preferiblemente desde aproximadamente 660 + 50, hasta 660 + 100 aminoácidos, en donde el "número básico" de 660 aminoácidos, corresponde en este caso, a la cadena de polipéptido de la enzima PDAT de la SEC ID NO: 2, codificada por una secuencia de nucleótidos de conformidad con la SEC ID N0:1. Consecuentemente, el "número básico" de enzimas de longitud completa funcional, puede variar en correspondencia con la secuencia de nucleótido que lo codifica . Una porción de la secuencia de nucleótido presente significa que es cualquier secuencia de nucleótido que codifica a un polipéptido el cual muestra actividad especifica de un fosfolipido : diacilglicerol aciltransferasa (PDAT). La longitud de la porción de nucleótido puede variar en un amplio rango de aproximadamente varios cientos de nucleótidos basados en la región codificante del gen o una secuencia altamente conservada. Por ejemplo, la longitud varia en un rango desde aproximadamente 1900 + 10 hasta 1900 + 1000 nucleótidos, preferiblemente desde aproximadamente 1900 + 50, hasta aproximadamente 1900 + 700 y más preferiblemente desde aproximadamente 1900 + 100 hasta 1900 + 500 nucleótidos, con ello el "número básico" de 1900 nucleótidos corresponde en este caso, a la secuencia de nucleótido codificante de la enzima PDAT de la SEC ID NO:l. Consecuentemente, el "número básico" de gen de longitud completa funcional puede variar. Una variante alélica de la secuencia de nucleótidos presente, se entiende como cualquier secuencia de nucleótido diferente la cual codifica un polipéptido con una función funcionalmente equivalente. Los alelos pertenecen a las variantes que se originan naturalmente de las secuencias de nucleótidos de la presente invención, asi como también a las secuencias de nucleótidos sintéticos producidas por métodos conocidos en la técnica. Están contempladas aún, secuencias de nucleótidos alteradas, las cuales resultan en una enzima con actividad alterada y/o regulación o la cual es resistente contra los inhibidores específicos. La presente invención además incluye mutaciones naturales o sintéticas de las secuencias de nucleótidos originalmente aisladas. Estas mutaciones pueden ser substitución, adición supresión, inversión o inserción de uno o más nucleótidos. Una secuencia de nucleótido homologa se entiende como una secuencia complementaria y/o una secuencia la cual específicamente se hibridiza con la secuencia de nucleótidos presente. Las secuencias hibridizantes incluyen secuencias similares seleccionadas del grupo de ADN o ARN el cual específicamente interactúa con las secuencias de nucleótidos presentes bajo al menos, condiciones de rigurosidad moderadas, las cuales se conocen en la técnica. Un ejemplo no limitante, preferido de condiciones de hibridación rigurosas son, la hibridación en citrato sódico/cloruro de sodio 6X (SSC) a aproximadamente 45°C, seguido por uno o más lavados en SSC 0.2 X, SDS 0.1% a 50-65°C. Esto además incluye secuencias de nucleótidos cortas de por ejemplo, 10 hasta 30 nucleótidos, preferiblemente, 12 a 15 nucleótidos. Están también incluidos cebadores o sondas de hibridación. Una secuencia de nucleótido homologa incluida dentro del ámbito de la presente invención, es una secuencia la cual es al menos, aproximadamente 40%, preferiblemente al menos aproximadamente 50% o 60%, y más preferiblemente al menos, aproximadamente 70%, 80% o 90% y más preferiblemente al menos, aproximadamente 95%, 96%, 97%, 98% o 99% o más, homologa a una secuencia de nucleótido de la SEC ID NO : 1. Todas las definiciones antes mencionadas son reales para las secuencias de aminoácidos y enzimas funcionales, y pueden ser fácilmente transferidas por una persona experta en la técnica.
Las isoenzimas son también entendidas como enzimas, las cuales tienen la mismo o similar especificidad de substrato y/o actividad catalxtica, pero una estructura primaria diferente. En una primera modalidad, esta invención se dirige a secuencias de ácido nucleico que codifican a una PDAT. Esto incluye secuencias que codifican PDATs biológicamente activas, asi como también secuencias que son usadas como sondas, vectores para la transformación o intermediarios de clonación. La secuencia codificante PDAT puede codificar una secuencia parcial o completa, dependiendo del uso propuesto. Están propuestas toda o una porción de la secuencia genómica, secuencia de ADNc, PDAT precursor o PDAT maduro. Además está incluida una secuencia de nucleótido seleccionada del grupo que consiste de secuencias expuestas en la SEC ID NO: 1, 3, 4, 10, 11, 19, 21, 23, 24, 29 o 30, o una porción, derivado, alelo u homólogo de la misma. La invención pertenece a una secuencia de nucleótido parcial que corresponde a una secuencia de nucleótido de longitud completa, seleccionada del grupo que consiste de secuencias expuestas en la SEC ID NO: 5, 7, 9, 12, 25, 26, 28 o 31, o una porción, derivado, alelo u homólogo del mismo. Sin embargo, está contemplada dentro del ámbito de la invención, una secuencia de nucleótido que comprende una secuencia de nucleótido la cual es al menos, 40% homologa a una secuencia de nucleótidos seleccionada del grupo que consiste de aquellas secuencias expuestas en la SEC ID NO: 1, 3, 4, 5, 7, 9, 10, 11, 12, 19, 21, 23, 24, 25, 26, 28, 30 o 31. La presente invención pertenece a un constructo de gen que comprende dichas secuencias de nucleótidos de la presente invención, los cuales están operablemente ligados a un ácido nucleico heterologo. El término operablemente ligado significa una organización serial por ejemplo, de un promotor, secuencia codificante, terminador y/o además elementos regulatorios , con ello, cada elemento puede cubrir completamente su función original durante la expresión de la secuencia de nucleótidos . Además, un vector que comprende dicha secuencia de nucleótidos de la presente invención, está contemplado en la presente invención. Esto incluye también un vector de expresión, asi como también un vector que además comprende un gen marcador que se puede seleccionar y/o secuencias de nucleótidos para replicación en una célula hospedera y/o la integración en el genoma de la célula hospedera . En un aspecto diferente, esta invención se refiere a un método para producir un PDAT en una célula hospedera o progenie de la misma, incluyendo semillas de aceite diseñadas genéticamente, levaduras y módulos de cualquier otro organismo que acumula aceite vía la expresión de un constructo en la célula. Las células que contienen un PDAT como un resultado de la producción de la secuencia que codifica a PDAT, están también contempladas dentro del ámbito de la invención. Además, la invención pertenece a una célula u organismo transgénico que contiene dicha secuencia de nucleótidos y/o dicho constructo o construcción de gen y/o dicho vector. El objeto de la presente invención es además una célula u organismo transgénico, el cual es una célula u organismo eucariótico. Preferiblemente, la célula u organismo transgénico es una célula de levadura o una célula de planta o una planta. La presente invención además pertenece a dicha célula u organismo transgénico que tiene una trayectoria biosintética alterada para la producción de un triacilglicerol . Una célula u organismo transgénico que tiene un contenido de aceite alterado, está también contemplada dentro del ámbito de esta invención . Además, la invención pertenece a una célula u organismo transgénico, en donde la actividad de PDAT está alterada en dicha célula u organismo. Esta actividad alterada de PDAT se caracteriza por una alteración en la expresión del gen, actividad catalítica y/o regulación de la actividad de la enzima. Sin embargo, una célula u organismo transgénico se incluye en la presente invención, en donde la trayectoria biosintética alterada por la producción de triacilglicerol se caracteriza por la prevención de acumulación de ácidos grasos indeseables en los lipidos de las membranas. En una modalidad diferente, esta invención también se refiere a métodos para usar una secuencia de ADN que codifica a un PDAT para incrementar el contenido de aceite dentro de una célula. Otro aspecto de la invención se refiere a la acomodación de altas cantidades de ácidos grasos no comunes en el triacilglicerol producido dentro de una célula, introduciendo una secuencia de ADN que produce un PDAT que remueve específicamente estos ácidos grasos a partir de los lipidos de las membranas de la célula y canales de ellos en triacilglicerol . Las células de plantas que tienen tal modificación también están contempladas aqui. Además, la invención pertenece a un proceso para la producción de triacilglicerol, que comprende crecimiento de dicha célula u organismo transgénico bajo condiciones en donde dicha secuencia de nucleótido esLá expresada y con ello, dichas células transgénicas comprenden una enzima que cataliza la transferencia de ácidos grasos desde los fosfolipidos a los diacilgliceroles , formando triacilglicerol. Sin embargo, los triacilgliceroles producidos por el proceso mencionado anteriormente, están incluidos en el ámbito de la presente invención. Un objeto de la presente invención es además, el uso de una secuencia de nucleótidos presente y/o dicha enzima para la producción de triacilglicerol y/o triacilgliceroles con ácidos grasos no comunes. El uso de dicha secuencia de nucleótidos presente y/o dicha enzima de la presente invención para la transformación de cualquier célula u organismo para ser expresado en esta célula u organismo y que resulta en un contenido de aceite alterado, preferiblemente incrementado de esta célula u organismo, está también contemplado dentro del ámbito de la presente invención. Un PDAT de esta invención incluye cualquier secuencia de aminoácidos, tales como una proteina, polipéptido o fragmento de polipéptido, obtenible de un microorganismo, animal o fuente de planta que demuestra la habilidad para catalizar la producción de triacilglicerol a partir de un fosfolipido y diacilglicerol bajo condiciones reactivas de enzimas. Por "condiciones reactivas de enzima" se sugiere que cualesquiera condiciones están disponibles en un ambiente (por ejemplo, factores como temperatura, pH, carencia de substancias de inhibición), las cuales permitirán que la enzima funcione. Otros PDATs son obtenibles de las secuencias especificas proporcionadas aquí. Además, será aparente que uno puede obtener PDATs naturales y sintéticos, incluyendo secuencias de aminoácidos modificadas y materiales iniciadores para moldear proteínas sintéticas a partir de los PDATs ejemplificados y a partir de PDATs los cuales son obtenibles a través del uso de tales secuencias ejemplificadas. Las secuencias de aminoácido modificadas incluyen secuencias que han sido mutadas, truncadas, incrementadas y similares, si tales secuencias fueron parcialmente o completamente sintetizadas. Las secuencias que son actualmente purificadas de preparaciones de plantas o son idénticas o que codifican proteínas idénticas a estas, a pesar del método usado para obtener la proteína o secuencia, son igualmente consideradas naturalmente derivadas. Además, las sondas de ácido nucleico (ADN o ARN) de la presente invención, pueden ser usadas para seleccionar y recuperar PDATs "homólogos" o "relacionados" de una variedad de plantas y fuentes microbianas. Además, es también aparente que una persona experta en la técnica pueda, con la información proporcionada en esta solicitud, en cualquier organismo identificado una actividad PDAT, purificar una enzima con esta actividad y con ello identificar una secuencia de ácido nucleico "no homologa" que codifica a tal enzima. La presente invención puede ser esencialmente caracterizada por los siguientes aspectos: 1. Uso de un gen PDAT (clon o ADNc genómico) para t ans formación . 2. Uso de una molécula de ADN de conformidad con el punto 1 en donde dicho ADN se usa para la transformación de cualquier organismo para ser expresado en este organismo y resulta en una enzima PDAT recombinante activa para incrementar el contenido de aceite del organismo. Uso de una molécula de ADN del punto 1, en donde dicho ADN es usado para la transformación de cualquier organismo para prevenir la acumulación de ácidos grasos indeseables en los lipidos de la membrana . Uso de conformidad con el punto 1, en donde dicho gen PDAT es usado para la transformación de los organismos transgénicos que acumulan aceite, diseñados con ingeniería genética para producir cualquier ácido graso no común el cual es dañino si se presenta en altas cantidades en los lipidos de la membrana, tales como ácidos grasos de cadena media, ácidos grasos hidroxilados, ácidos grasos epoxigenados y ácidos grasos acetilénicos . Uso de conformidad con el punto 1, en donde dicho gen PDAT es usado para transformar organismos, y en donde dichos organismos son cruzados con otros organismos que acumulan aceite, diseñados genéticamente para producir cualquier ácido graso no común, el cual es dañino si se presenta en altas cantidades en los lípidos de la membrana, comprendiendo ácidos grasos de cadena media, ácidos grasos hidroxilados , ácidos grasos epoxigenados y ácidos grasos acetilénicos . Uso de conformidad con el punto 1, en donde la enzima codificada por dicho gen PDAT o ADNc está codificada por un PDAT con distinta especificidad de acilo . Uso de conformidad con el punto 1, en donde dicho gen que codifica PDAT o ADNc, se deriva de Saccharomyces cereviseae, o contiene secuencias de nucleótidos que codifican para una secuencia de aminoácido 30% o más, idéntica a la secuencia de aminoácido de PDAT como se presenta en la SEC ID NO: 2. Uso de conformidad con el punto 1, en donde dicho gen que codifica PDAT o ADNc, se deriva de Saccharomyces cereviseae, o contiene secuencias de nucleótidos que codifican para una secuencia de aminoácido 40% o más, idéntica a la secuencia de aminoácido de PDAT como se presenta en la SEC ID NO: 2. Uso de conformidad con el punto 1, en donde dicho gen que codifica PDAT o ADNc, se deriva de Saccharomyces cereviseae, o contiene secuencias de nucleótidos que codifican para una secuencia de aminoácido 60% o más idéntica a la secuencia de aminoácido de PDAT como se presenta en la SEC ID NO: 2. Uso de conformidad con el punto 1, en donde dicho gen que codifica PDAT o ADNc, se deriva de Saccharomyces cereviseae, o contiene secuencias de nucleótidos que codifican para una secuencia de aminoácido 80% o más idéntica a la secuencia de aminoácido de PDAT como se presenta en la SEC ID NO: 2. Uso de conformidad con el punto 1, en donde dicho gen que codifica PDAT o ADNc, se deriva de plantas, o contiene secuencias de nucleótidos que codifican para una secuencia de aminoácido 40% o más idéntica a la secuencia de aminoácido de PDAT de Arabidopsis thaliana o a la proteina codificada por la contraparte de longitud completa de los clones de ADNc parciales de Zea mays, Lycopersicon esculentum, o Neurospora crassa. Organismos que acumulan aceite transgénico que comprenden, en su genoma, un gen PDAT transferido por tecnología de ADN recombinante o hibridación somática . 13. Organismos transgénicos que acumulan aceite, de conformidad con el punto 12 que comprenden en su genoma, un gen PDAT que tiene especificidad para substratos con un ácido graso no común particular, y el gen de dicho ácido graso no común. 14. Organismos transgénicos de conformidad con el punto 12 o 13, los cuales se seleccionan del grupo que consiste de hongos, plantas y animales. 15. Organismos transgénicos de conformidad con el punto 12 o 13, los cuales se seleccionan del grupo de plantas agrícolas. 16. Organismos transgénicos de conformidad con el punto 12 o 13, los cuales se seleccionan del grupo de plantas agrícolas y en donde dicho gen PDAT está expresado bajo el control de un promotor específico de órgano de almacenamiento. 17. Organismos transgénicos de conformidad con el punto 12 o 13, los cuales se seleccionan del grupo de plantas agrícolas y en donde dicho gen PDAT está expresado bajo el control de un promotor de semilla.
Aceites a partir de organismos de conformidad con el punto 12-1 . Un método para alterar la especificidad acilo de un PDAT por alteración de la secuencia de nucleótido de un gen codificante que se origina naturalmente, y como una secuencia de esta alteración creando un gen que codifica para una enzima con nueva especificidad acilo . Una proteina codificada por una molécula de ADN de conformidad con el punto 1 o un fragmento funcional del mismo. Una proteina del punto 20 designada acetiltransferasa de fosfolipido : diacilglicerol . Una proteína del punto 21, la cual tiene una especificidad de acilo distinta. Una proteína del punto 13 que tiene la secuencia de aminoácido como se expone en la SEC ID NO : 2 , 13, 14 o 15 (y las proteínas codificadas por la longitud completa o genes parciales expuestos en la SEC ID NO: 1, 3, 4, 5, 7, 9, 10, 11 o 12) o una secuencia de aminoácido con al menos, 30% de homología a dicha secuencia de aminoácido. 24. Una proteína del punto 23, aislada de Saccharomyces cereviseae . Métodos Generales: Cepas de levaduras v plasmidos. Las cepas de levadura de tipo silvestre usadas, fueron ya sea FY1679 [MATa his3-A200 Ieu2-Al trpl-A6 ura3-52) ó W303-1A (MATa. ADE2-1 canl-100 his3-ll, 15 leu2-3, 112 trpl-1 ura3-l) (7). La cepa de disrupción YNR008w : : KanMX2 FVKT004-04C(AL), la cual es congénica a FY1679, se obtuvo de la colección Euroscarf (8) . Un fragmento de 2751 pb que contiene el gen YNR008w con 583 pb de 5' yl83 pb del ADN de flanqueo al 3' , se amplificó del ADN genómico W303-1A, usando polimerasa Taq con 5 ' -TCTCCATCTTCTGCAAAACCT-3' y 5' -CCTGTCAAAAACCTTCTCCTC-3 ' como cebadores. El producto PCR resultante, se purificó por electroforesis en gel de agarosa y se clonó en el sitio JScoRV de pBluescript (pbluescript-pdat ) . Para experimentos de complementación, el fragmento clonado se liberó de la digestión pBluescript y HindIII-SacI y después se clonó entre los sitios HindlII y SacI de pFL39 (9), así generando pUSl. Para la sobre expresión del gen PDAT, un fragmento EcoRI de 2202 pb del plasmido pBluscript, el cual contiene solamente 24 pb del ADN de flanqueo 5' , se clonó en el sitio BamHI del vector de expresión GAL 1-TPK2 pJN92 (12), asi generando pUS4. Preparaciones Microsomales . Los microsomas de semillas en desarrollo de girasol [Helianthus annuus) , Rícinus communis y Crepis palaestina , se prepararon usando el procedimiento de Stobart y Stymne (11). Para obtener microsomas de levaduras, lg de células de levadura (peso fresco) , se re-suspendieron en 8 mi de amortiguador enfriado en hielo (20 mM Tris-Cl, pH 7.9, 10 mM MgCl2, 1 mM EDTA, glicerol al 5% (v/v) , 1 mM de DTT, 0.3 M de sulfato de amonio) en un tubo de vidrio de 12 mi. En este tubo, se agregaron 4 mi de perlillas de vidrio (diámetro 0.45-0.5 mm) , y el tubo fue entonces sacudido lentamente (3 x 60 s) en un homogenizador celular MSK (B. Braun Melsungen AG, Alemania). La suspensión homogenizada se centrifugó a 20,000 x g por 15 min a 6°C y el sobrenadante resultante se centrifugo nuevamente a 100,000 x g por 2 h a 6°C. La pelotilla de 100, 000 x g se resuspendió en 0.1 M de fosfato de potasio (pH 7.2), y se almacenó a -80°C. Es subsecuentemente referido como la fracción microsomal de levadura cruda. Substratos lípidos. Ácidos ricinoleico (12-hidroxi-9-octadecenoico) y vernólico ( 12 , 13-epoxi-9-octadecenoico ) radio-etiquetados, se sintetizaron enzimátícamente a partir de ácido [ 1-14C ] oleico y ácido [1-14C] linoleico, respectivamente, por incubación con preparaciones microsomales a partir de semillas de Ricinus communis y Crepis palaestina , respectivamente (12). Se realizó la síntesis de fosfatidilcolinas (PC) ó fosfatidiletanolaminas (PE) con grupos acilo etiquetados con 14C en la posición sn-2, usando ya sea acilación enzimática (13), o sintética (14) de ácido [14C] oleico, [1 C] ricinoleico, o [1 C] vernólico . El Dioleoilo-PC que se etiquetó en la posición sn-1, se sintetizó de sn-1- [1 C] oleoilo-lyso-PC y ácido oleico no etiquetado como se describe en (14). El sn-l-oleoilo-sn-2- [14C] ricinoleoilo-DAG, se sintetizó de PCR por la acción de las fosfolipasa C tipo XI de B. Cereus (Sigma Chemical Co . ) como se describe en (15). Monovernoloilo y divemoleoilo-DAG se sintetizaron de TAG extraído de semillas de Euphorbia lagascae, usando la lipasa TAG (Rizhopus arrhizus, Sigma Chemical Co.), como se describe previamente (16). El monoricinoleoilo-TAG se sintetizó de conformidad con el mismo método usando TAG extraído de semilla de ricino.
Análisis de Lipidos. La composición lipida total de levadura se determinó a partir de células cosechadas de un cultivo liquido de 40 mi, disueltas en un sacudidor de perlilla de vidrio y extraídas en cloroformo como se describe por Bligh y Dyer (17), y después se separó por cromatografía de capa delgada en hexano/dietiléter/ácido acético (80:20:1) usando 60 placas de gel de sílice pre-revestidas (Merck) . Las áreas de lipidos se ubicaron por breve exposición a vapores I2 e identificaron por medio de estándares apropiados. Lipidos polares, esterol-ésteres y triacilgliceroles, así como también las clases de lipidos menores restantes, referidas como otros lipidos, se escindieron de las placas. Los metilésteres de ácido graso se prepararon por calentamiento del material escindido seco a 85°C por 60 minutos en ácido sulfúrico al 2% (v/v) en metanol seco. Los metilésteres se extrajeron con hexano y se analizaron por GLC a través de una columna de sílice fusionado 50 m x 0.32 mm CP- ax58-CB (Chrompack) , con ácido metilheptadecanoico como un estándar interno. El contenido de ácido graso de cada fracción se cuantificó y se usó para calcular la cantidad relativa de cada clase de lipidos. Para determinar el contenido de lipidos totales, alícuotas de 3 mi de cultivos de levadura se cosecharon por centrifugación y las pelotillas resultantes se lavaron con agua destilada y se liofilizaron . El peso de las células secas se determinó y el contenido de ácidos grasos se cuantificó por análisis GLC después de la conversión a metilésteres como se describe anteriormente. El contenido lipido fue entonces calculado como nmol de ácido graso (FA) por mg de peso seco de levadura. Ensayos de enzimas. Alícuotas de fracciones microsomales crudas (que corresponden a 10 nmol de PC microsomal) a partir de semillas de plantas en desarrollo o células de levadura se liofilizaron durante la noche. Substratos lípidos etiquetados con 1 C, se disolvieron en benceno, fueron entonces agregados a las microsomas secas. El benceno se evaporó bajo una corriente de N2, conduciendo a los lípidos en contacto directo con las membranas, y se agregó 0.1 mi de 50 mM de fosfato de potasio (pH 7.2). La suspensión se mezcló vigorosamente y se incubó a 30°C por el periodo de tiempo indicado, hasta 90 min. Los lípidos se extrajeron de la mezcla de reacción usando cloroformo y se separaron por cromatografía de capa delgada en hexano/dietiléter/ácido acético (35:70:1.5) usando 60 placas de gel de sílice (Merck) . Los lípidos radioactivos se visualizaron y cuantificaron en las placas por autoradíografia electrónica (Instant Imager, Packard, US) . Cultivo de levadura. Células de levadura se hicieron crecer a 28°C en un sacudidor rotatorio en un medio YPD liquido (extracto de levadura al 1%, peptona al 2%, glucosa al 2%), medio sintético (18) que contiene glicerol al 2% (v/v) y etanol al 2% (v/v) , o medio mínimo (19) que contiene 16 g/1 de glicerol. La presente invención está además caracterizada por los siguientes ejemplos, los cuales no son limitantes: Síntesis independiente de acil-CoA de TAG por microsomas de semillas de aceite. Un gran número de ácidos grasos inusuales se pueden encontrar en semillas de aceite (20) . Muchos de estos ácidos grasos, tales como ácidos ricinoleico (21) y vernólico (22), se sintetizaron usando fosfatidilcolina (PC) con grupos oleoilo o linoleoilo esterificados a la posición sn-2, respectivamente, como el precursor inmediato. Sin embargo, aunque el PC puede ser un substrato por síntesis de ácido graso inusual y es el lípido de la membrana principal en semillas, los ácidos grasos inusuales son raramente encontrados en las membranas. En su lugar, son principalmente incorporados en el TAG. Un mecanismo para la transferencia eficiente y selectiva de estos grupos acilo inusuales de PC en TAG, podrá por lo tanto, existir en semillas de aceites que acumulan tales ácidos grasos inusuales. Esta reacción de transferencia fue caracterizada bioquímicamente en semillas de semilla de ricino (Ricinus communis) y Crepis palaestina, plantas las cuales acumulan altos niveles de ácido ricinoleico y vernólico, respectivamente, y girasol (Helianthus annuus) , una planta la cual tiene solamente ácidos grasos comunes en su aceite de semilla. Las fracciones microsomales crudas de semillas en desarrollo se incubaron con PC que tiene grupos oleoilo, ricinoleoilo o vernoloilo etiquetados con 1 C en la posición sn-Z . Después de la incubación, los lípidos se extrajeron y analizaron por cromatografía de capa delgada. Encontramos que la cantidad de radioactividad que se incorporó en la fracción lípida neutral se incrementó linealmente durante un periodo de 4 horas (datos no mostrados). La distribución de grupos [14C] acilo dentro de la fracción lípida neutral, se analizó después de 80 minutos (Fig. 1). De manera interesante, la cantidad y distribución de la radiactividad entre diferentes lípidos neutrales fue fuertemente dependiente tanto de las especies de plantas como del tipo de cadena [ 1 C ] acilo . Así, las microsomas de girasol incorporan más de la etiqueta en DAG, sin considerar el tipo de grupo [1 C]acilo. En contraste, las microsomas R. communis, preferencialmente incorporan grupos [ 1 C] ricinoleoilo y [ 14C ] ernoloilo en TAG, mientras los grupos. [14C]oleilo se encuentran mayormente en DAG. Las microsomas C. palaestina finalmente, incorporan solamente grupos [ 1 C] vernoloilo en TAG, con grupos [ 14C ] ricinoleilo se encuentran mayormente como ácidos grasos libres, y grupos [1 C]oleilo en DAG. Esto muestra que los altos niveles in vivo de ácido ricinoleico y ácido vernólico en la alberca TAG de R. communis y C. palaestina, respectivamente, pueden ser explicados por una transferencia eficiente y selectiva de los grupos acilo correspondientes de PC a TAG en estos organismos. La síntesis in vitro de triacilgliceroles en preparaciones microsomales de semilla de ricino en desarrollo, se resumen en la tabla 1. PDAT: Una nueva enzima que cataliza la síntesis independiente de acil-CoA de TAG. Se investigó si el DAG podría servir como un donador acilo, así como también un aceptor acilo en las reacciones catalizadas por los microsomas de semilla de aceite. Por lo tanto, DAG divernoloilo no etiquetado se incubó con ya sea sn-1-oleoilo-sr¡-2- [ C] ricinoleoilo-DAG o sn-l-oleoilo-sn-2- [14C] ricinoleoilo-PC en la presencia de microsomas de R. communis . La síntesis de moléculas TAG que contienen tanto grupos [ 1 C] ricinoleoilo y vernoloilo, fue 5 veces superior cuando el [ 14C ] ricinoleoilo-PC sirvió como el donador acilo, comparado con [ 14C] ricinoleoilo-DAG (fig. IB). Estos datos sugieren fuertemente que el PC es el donador de acilo inmediato y DAG el aceptor acilo en la formación independiente acil-CoA de TAG por las microsomas de semillas de aceite. Por lo tanto, esta reacción está catalizada por una nueva enzima, la cual llamamos transferasa de fosfolípido : diacilglicerol (PDAT). Actividad PDAT en microsomas de levadura. Las células de levadura tipo silvestre se cultivaron bajo condiciones en donde se indujo la síntesis de TAG. Las membranas microsomales se prepararon a partir de estas células y se incubaron con sn-2- [1 C] -ricinoleoilo-PC y DAG y se analizaron los productos etiquetados con 14C formados. Los grupos [14C] ricinoleoilo derivados de PC dentro de la fracción lípida neutral, principalmente se encuentran en los ácidos grasos libres o TAG, y también que la cantidad de TAG sintetizada fue dependiente de la cantidad de DAG que se agregó a la reacción (Fig. 2) . La síntesis in vitro de TAG que contiene tanto grupos ricinoleoilo como vernoloilo, una especie TAG no presente in vivo, de exógeno agregado de sn-2- [14C] ricinoleoilo-PC y vernoloilo-DAG no etiquetado (Fig. 2, linea 3), claramente demuestra la existencia de una síntesis acil-CoA independiente de TAG que involucra a PC y DAG como substratos en membranas microsomales de levadura. Consecuentemente, la síntesis TAG en levadura se puede catalizar por una enzima similar a la PDAT encontrada en plantas. El gen que codifica a PDAT en levadura. Se conoce un gen en el genoma de levadura (YNR008w) , pero nada se sabe acerca de la función de YNR008w, excepto que el gen no es esencial para el crecimiento bajo circunstancias normales. Las membranas microsomales se prepararon de la cepa de levadura FVKT004-04C(AL) (8) en la cual este gen con función desconocida se ha disuelto. La actividad PDAT en las microsomas se ensayó usando PC con ácidos grasos radioetiquetados en la posición sn-2. La actividad se encontró como completamente ausente en la etapa de disrupción (Fig. 2, línea 4) . Significantemente, la actividad podrá ser parcialmente restaurada por la presencia de YNR008w en la única copia de plasmido pUSl (Fig. 2, línea 5). Sin embargo, los grupos acilo de fosfatidiletanolamina (PE) fueron eficientemente incorporados en TAG por microsomas de la cepa tipo silvestre, mientras no ocurrió incorporación de este substrato en la cepa mutante (dato no mostrado) . Esto muestra que la YNR008w codifica a una levadura PDAT la cual cataliza la transferencia de un grupo acilo a partir de la posición sn-2 de los fosfolipidos a DAG, asi se forma el TAG. Deberá notarse que no se formaron ésteres de colesterol a partir del PC radiactivo aún en incubaciones con ergoesteroles agregados, no fue la cantidad de ácidos grasos libres radioactivos formados de PC afectados por la disrupción del gen YUNR008w (dato no mostrado. Esto demuestra que la levadura PDAT no tiene actividades de síntesis del éster de colesterol o actividades de la fosfolipasa. Contenido de TAG incrementado en células de levadura que sobre expresan PDAT. El efecto de sobre expresar el gen que codifica a PDAT se estudió mediante la transformación de una cepa de levadura tipo silvestre con el plasmido pUS4 en el cual, el gen está expresado del promotor GAL 1:TPK2 inducido por la galactosa. Las células que contienen el vector de expresión vacío se usaron como un control. Las células se hicieron crecer en un medio glicerol-etanol sintético, y la expresión del gen se indujo después de ya sea 2 horas (fase log temprana), o 25 horas (fase estacionaria) por la adición de galactosa. Las células se incubaron entonces por otras 21 horas, después de lo cual se cosecharon y se realizaron los ensayos. Encontramos que la sobre expresión de PDAT no tuvo efecto significante en la velocidad de crecimiento como la determinada por la densidad óptica. Sin embargo, el contenido lipido total, medido como µp??? de ácidos grasos por mg de levadura en peso seco, fue 47% (fase log) o 29% (fase estacionaria) superior en la cepa que sobre expresa PDAT que en el control. Además, el lipido polar y el contenido de esteroléster no fue afectado por la sobre expresión de PDAT. En cambio, el contenido elevado de lipidos en estas células es completamente debido a un contenido TAG incrementado (Fig. 3AB) . Asi, la cantidad de TAG se incrementó por 2 veces en PDAT que sobre expresa las células de fase log temprana y por 40% en las células de fase estacionaria. Es interesante notar que un incremento significante en el contenido TAG se alcanzó por la sobre expresión de PDAT aún bajo condiciones (es decir, en fase estacionaria) , en donde el DAGAT es inducido y asi contribuye significativamente a la síntesis de TAG. La actividad PDAT in vitro ensayada en las microsomas de la cepa que sobre expresa PDAT, fue 7 veces superior que en la cepa de control, un hallazgo el cual es consistente con los niveles incrementados de TAG que se observó in vivo (Fig. 3C) . Estos resultados demuestran claramente el uso potencial del gen PDAT en el aumento del contenido de aceite en organismos transgénicos . Especificidad de substrato de levadura PDAT. La especificidad del substrato de levadura PDAT fue analizada usando microsomas preparados de la cepa que sobre expresa PDAT (véase Figura 4). La velocidad de la síntesis TAG, bajo condiciones dadas en la Figura 4 con di-oleoilo-PC como el donador acilo, fue 0.15 nmol por min y mg de proteína. Con ambos grupos oleoilo de PC etiquetada fueron posibles, bajo las condiciones de ensayo dadas, para detectar la transferencia de 11 pmol/min de la cadena [14C] oleoilo en TAG y la formación de 15 pmol/min de lyso-PC. En microsomas de la cepa deficiente de PDAT, sin TAG y todas y se detectaron solamente cantidades de rastro de lyso-PC, sugiriendo fuertemente que la levadura PDAT cataliza la formación de cantidades equimolares de TAG y lyso-PC cuando se proporcionan con PC y DAG como substratos. El hecho de que algunas veces se forma más lyso-PC que TAG, puede ser explicado por la presencia de una fosfolipasa en las microsomas de levaduras, las cuales producen lyso-PC y ácidos grasos no esterificados de PC. La especificidad de PDAT de levadura para diferentes posiciones de grupo acilo, se investigó por la incubación de las microsomas con di-oleoilo-PC llevando un grupo [14C] acilo ya sea en la posición sn-1 (Fig. 4A barra 2) 0 en la posición sn-2 (Fig. 4A barra 3) . Encontramos que el mayor producto etiquetado con 14C formado en el caso formador fue lyso-PC, y en el último caso TAG. Concluimos que la PDAT de levadura tiene una especificidad para la transferencia de grupos acilo a partir de la posición sn-2 del fosfolipido a DAG, asi formando sn-l-lyso-PC y TAG. Bajo las condiciones de ensayo dadas, cantidades de trazas de DAG etiquetado con 14C se formaron en el PC sn-1 etiquetado por la acción reversible de una colina-CDP : fosfotransferasa colina. Esta DAG etiquetada puede entonces, ser convertida en TAG por la actividad PDAT. No es posible por lo tanto, distinguir si las cantidades menores de TAG etiquetado que se forman por la presencia de di-oleoilo-PC que lleva un grupo [1 C] acilo en la posición sn-1, se sintetizan directamente del PC sn-1-etiquetado por un PDAT que también puede actuar en la posición sn-1, o si éste es primero convertido a DAG sn-1 etiquetado y después acilado por un PDAT con selectividad estricta por los grupos transferencia y acilo en la posición sn-2 de PC. Tomados en conjunto, esto muestra que el PDAT codificado por YNR008w cataliza una transferencia acilo de la posición sn-2 de PC a DAG, asi causa la formación de TAG y lyso-PC. La especificidad del substrato de PDAT de levadura fue además analizada con respecto al grupo principal del donador acilo, el grupo acilo transferido y las cadenas acilo de la molécula DAG aceptora. Los dos lipidos de la membrana mayor de S. cerevisiae son PC y PE, y como se muestran en la Fig. 4B (barras 1 y 2), el dioleoilo-PE es casi 4 veces más eficiente que el dioleoilo-PC como el donador acilo en la reacción catalizada PDAT. Sin embargo, la velocidad de la transferencia de acilo es fuertemente dependiente del tipo de grupo acilo que es transferido. Asi, un grupo ricinoleoilo en la posición sn-2 de PC es 2.5 veces más eficientemente transferido en TAG que un grupo oleoilo en la misma posición (Fig. 4B barras 1 y 3) . En contraste, la levadura PDAT no tiene preferencia por la transferencia de los grupos vernoloilo sobre los grupos oleoilo (Fig. 4B barras 1 y 4) . La cadena acilo de la molécula DAG aceptora también afecta la eficiencia de la reacción. Asi, DAG con un grupo ricinoleoilo o vernoloilo es un aceptor acilo más eficiente que el dioleoilo-DAG (Fig. 4B barras 1, 5 y 6) . Tomados juntos, estos resultados claramente muestran que la eficiencia de la transferencia de acilo catalizada por PDAT es fuertemente dependiente de las propiedades de los substratos lipidos. Genes PDAT. Las secuencias de nucleótido y aminoácido de varios genes PDAT se dan como en la SEC ID NO:l hasta 15. Además, las secuencias provisionales y/o parciales están dadas como SEC ID NO: 16 hasta 20 y 21 hasta 31, respectivamente. Una de las secuencias genómicas de Arabidopsis (SEC ID NO : 4 ) identifica un clon de ADNc de Arabidopsis EST; T04806. Este clon de ADNc fue completamente caracterizado y la secuencia de nucleótido se da como SEC ID NO: 5. Basados en la homología de secuencia del ADNc T04806 y la secuencia de ADNc genómica de Arabidopsis thaliana (SEC ID NO:4), es aparente que un adicional A está presente en la posición 417 en el clon de ADNc (dato no mostrado) . Excluyendo este nucleótido podrá dar la secuencia de aminoácido demostrada en la SEC ID NO: 12.
Contenido TAG incrementado en semillas de Arabidopsis thaliana que expresan la levadura PDAT. Para la expresión del gen PDAT de levadura en Arabidopsis thaliana, un fragmento EcoRI del pBluescript-PDAT , se clonó junto con el promotor napin (25 en el vector pGTV-KAN (26) . Un plasmido (pGNapPDAT) que tiene el gen PDAT de levadura en la orientación correcta se identificó y transformó en Agrobacterium turnefaciens . Esta bacteria se usó para transformar plantas de Arabidopsis thaliana columbia (C-24) usando el método de transformación de raíz (27). Las plantas transformadas con un vector vacío se usaron como controles. La primera generación de semillas (TI) se cosechó y germinó en un medio que contiene canamicina. La segunda generación de semillas (T2) se vertió de plantas individuales y sus contenidos de ácidos grasos se analizaron por cuantificación de sus ésteres de metilo por cromatografía líquida de gas después de la metilación de las semillas con ácido sulfúrico al 2% en metanol a 85°C por 1.5 horas. La cuantificación se hizo con metilésteres de ácido heptadecanóico como estándar interno. Para la transformación con pGNapPDAT, una planta Ti (26-14) dio origen a siete plantas T2 de las cuales 3 plantas proporcionaron semillas con diferencia estadísticamente (en una prueba de dos aspectos de diferencia media) , de contenido de aceite superior que las semillas de las plantas T2 generadas de la planta TI transformada 32-4 con un vector vacío (tabla 2) .
Referencias citadas en la descripción: 1. Bell, R. M. & Coleman, R. A. (1980) Annu. Rev. Biochem. 49, 459-487. 2. Stymne, S. & Stobart, K. (1987 ) en The biochemistry of plants: a comprehens ive treatise, Vol. 9, ed. Stumpf, P. K. (Academic Press, New York), pp . 175- 214. 3. Cases, S. et al. (1998) Proc. Nati. Acad. Sci. USA 95, 13018-13023. 4. Hobbs, D. H., Luc, C & Hills, M. J. (1999) FEBS Lett. 452, 145-9 5. Zou, J. , Wei, Y., Jako, C, Kumar, A., Selvara , G. & Taylor, D.C. (1999) Plant J. 19, 645-653. 6. Lardizabal, K. , Hawkins, D., Mai, J. , & agner, N. (1999) Abstract presented at the Biochem. Mol. Plant Fatty Acids Glycerolipids Symposium, South Lake Tahoe, USA. Thomas, B. J & Rothstein, T. (1989) Cell 56, 619-630. Entian, K. D. & Kotter, P. (1998) Meth. Microbiol. 26, 431-449. Kern, L., de Montigny, J. , Jund, R & Lacroute, F. (1990) Gene 88, 149-157. Ronne, H . , Carlberg, M. , Hu, G. Z, & Nehlin, J. O. (1991) Mol. Cell. Biol. 11, 4876-4884. Stobart, K. & Stymne, S. (1990) en Method in Plant Biochemistry, vol . 4, eds . Harwood, J. L & Bowyer, J. R. (Academic press, Londres), pp . 19-46. Bafor, M . , Smith, M.A., Jonsson, L . , Stobart, A . K. & Stymne, S. (1991) Biochem. J. 280, 507-514. Bañas, A. , Johansson, I. & Stymne, (1992) Plant Science 84, 137-144. Kanda, P. % Wells, M. A . (1981) J. Lipid Res. 22, 877-879. Stáhl, U., Ek, B. & Stymne, S. (1998) Plant Physiol. 17, 197-205. Stobart, K., Mancha, M. & Lenman M. Dahlqvist, A. & Stymne, S. (1997) Planta 203, 58-66. Bligh, E. G. & Dyer, W. J. (1959) Can. J. Biochem.
Physiol. 37, 911-917.
Sherman, F. , Fink, G. R . & Hicks, J.B. (1986) en Laboratory Course Manual for Methods in Yeast Genentics (Cold Spring Harbor Laboratory) . Meesters, P. A . E. P. Huijberts, G. N. M. y Eggink, G. (1996) Appl. Microbiol. Biotechnol. 45, 575-579. van de Loo, F, J. , Fox, B. G. & Sommerville, C. (1993) en Lipid metabolism in plants, ed. Moore, T. S. (CRC Press, Inc.), pp . 91-126. van de Loo, F. J. , Broun, P., Turner , S & Sommerville, S. (1995) Proc. Nati. Acad. Sci. USA 95, 6743-6747. Lee, M . , Lenman, M., Bañas, A., Bafor, . , Singh, S., Schweizer, M., Nilsson, R. , Liljenberg, C., Dahlqvist, A. , Gummeson, P-O., Sjódahl, S., Green, A . , y Stymne, S. (1998) Science 280, 915-918. Thompson, J. D., Gibson, T. J. , Plewniak, F. , Jeanmougin, F. & Higgins, D. G (1997) Nucl. Acids . Res 24. 4876-4882. Saitou, N. & Nei . M. (1987) Mol. Biol. Evol. 4. 406-425. Stálberg, K., Ellerstrom, M., Josefsson, L., & Rask, L. (1993) Plant Mol. Biol. 23, 671. Becker, D., Kemper, E . , Schell, J., Masterson, R. (1992) Plant Mol. Biol. 20, 1195 27. D. Valvekens, M. Van Montagu y Van Lusbettens (1988) Proc. Nati. Acad. Sci . U S A 85, 5536.
Descripción de las Figuras FIG. 1 Metabolismo de PC etiquetado con C en la fracción lipida neutral por microsomas de plantas. (A) Microsomas de semillas de girasol en desarrollo, R. communis y C. palaestina, se incubaron por 80 minutos a 30°C con PC (8 nmol) que tiene ácido oleico en su posición sn-1, y ya sea ácido oleico, ricinoleico o vernólico etiquetado con 14C en su posición sn-2. La radioactividad incorporada en TAG (barras abiertas), DAG (barras sólidas) y ácidos grasos no esterificados (barra sombreada), se cuantificó usando cromatografía de capa delgada, seguida por autoradiografía electrónica, y se mostró como porcentaje de substrato etiquetado agregado. (B) Síntesis in vitro de TAG que lleva dos grupos vernoloilo y uno [14C] ricinoleoilo por microsomas a partir de R. communis . Los substratos agregados fueron divernoloilo-DAG no etiquetado (5 nmol), junto con ya sea sn-l-oleoilo-sn-2- [14C] ricinoleoilo-DAG (0.4 nmol, 7700 dpm/nmol) o sn-l-oleoilo-sn-2- [ 14C] ricinoleoilo-PC (0.4 nmol, 7700 dpm/nmol). Las microsomas se incubaron con los substratos por 30 minutos a 30°C, después de lo cual, las muestras se removieron para los análisis lipidos como se describe en la sección "métodos generales". Los datos mostrados son el promedio de dos experimentos.
FIG. 2 Actividad PDAT en microsomas de levadura, como se visualiza por auto radiograma de productos lipidos neutrales separados en TLC. Membranas microsomales (10 nmol de PC) de la cepa FY1679 de levadura tipo silvestre (lineas 1-3) , una cepa de levadura congénita (FVKT004-04C(AL) que se disuelve por YNR008w (linea 4), o la misma cepa de disolución transformada con el plasmido pUSl, que contiene el gen YNR008w detrás de su promotor nativo (linea 5), se ensayó por su actividad PDAT. Como substratos, usamos 2 nmol de sn-l-oleoilo-sn-2- [14C] ricinoleoilo-PC junto con ya sea 5 nmol de dioleoilo-DAG (lineas 2, 4 y 5) o rac-oleoilo-vernoleoilo-DAG (linea 3) . El ensayo enzimático y el análisis de lipidos se realizó como se describe en Materiales y Métodos. Las células se precultivaron por 20 horas en un medio YPD líquido, se cosecharon y resuspendieron en un volumen igual de medio mínimo (19) que contiene 16 g/1 de glicerol. Las células entonces se hicieron crecer por unas 24 horas adicionales antes de ser cosechadas. La selección del plasmido se mantuvo por el crecimiento de las células transformadas en un medico sintético carente de uracilo (18). Abreviaciones: 1-OH-TAG, monoricinoleoilo-TAG; 1-OH-1-ep-TAG, monoricinoleoilo-monovernoloilo-TAG; OH-FA, ácido ricinoleico no esterificado .
FIG.3 Contenido lípido (A,B) y actividad PDAT (C) en células de levadura que sobre expresan PDAT. El gen PDAT en el plasmido pUS4 se sobre expresó del promotor GAL1-TPK2 inducido por galactosa en la cepa W303-1A de tipo silvestre (7). Su expresión se indujo después de 2 horas (A) o 25 horas (B) de crecimiento por la adición de 2% de concentración final (p/v) de galactosa. Las células entonces se incubaron por otras 22 horas antes de ser cosechadas. Las cantidad de lípidos de las células cosechadas se determinó por análisis GLC de sus contenidos de ácidos grasos y se representó como µp??? de ácidos grasos por mg de peso seco en ya sea TAG (barra abierta), lipidos polares (barra sombreada), ésteres esterol (barra sólida) y otros lipidos (barra cortada) . Los datos mostrados son los valores medios de los resultados con tres cultivos de levaduras independientes. (C) Síntesis in vitro de TAG por microsomas preparadas de células de levadura que contienen ya sea el vector vacío (vector) o el plasmido PDAT (+ PDAT) . Las células se hicieron crecer como en la Fig. 3A. Los substratos lipidos dioleoilo-GDAG (2.5 nmol) y sn-l-oleoilo-sn-2- [14C] -oleoilo-PC (2 nmol) se agregaron a alícuotas de microsomas (10 nmol PC), los cuales entonces se incubaron por 10 minutos a 28 °C. La cantidad de etiqueta incorporada en TAG se cuantificó por autoradiografía electrónica. Los resultados mostrados son los valores medios de dos experimentos .
FIG. 4 Especificidad del substrato de PDAT de levadura. La actividad PDAT se ensayó por la incubación de alícuotas de microsomas liofilizados (10 nmol PC) con substratos lipidos a 30°C por 10 minutos (panel A) o 90 minutos (panel B) . El DAG no etiquetado (2.5 nmol) se usó como substrato junto con diferentes fosfolípidos etiquetados, como se muestra en la figura. (A) La especificidad de la posición sn de PDAT de levadura sin considerar el substrato donador acilo. El dioleoilo-DAG junto con ya sea sn-1- [14C] -oleoilo-sn-2- [14C] oleoilo-PC ( di- [ 1 C ] -PC ) , sn-1- [14C] oleoilo-sn-2-oleoilo-PC ( snl- [14C] -PC) o sn-l-oleoilo-sn-2- [14C] oleoilo-PC ( sn2- [ 1 C ] -PC) . (B) Especificidad de PDAT de levadura sin considerar el grupo fosfolipido principal y de la composición acilo del fosfolipido, así como también del diacilglicerol . El dioleoilo-DAG junto con ya sea sn-l-oleoilo-sji-2- [1 C] -oleoilo-PC (oleoilo-PC), sn-l-oleoilo-sn-2- [14C] oleoilo-PE (oleoilo-PE) o sn-1-oleoilo-sn-2- [1 C] ricinoleoilo-PC ( ricinoleoilo-PC) , o sn-l-oleoilo-sfl-2- [14C] vernoloilo-PC (vernoloilo-PC) . En los experimentos presentados en las 2 barras en la más recta, el monoricinoleoilo-DAG ( ricinoleoilo-DAG o mono-vernoloilo-DAG ( ernoloilo-DAG) se usó junto con sn-1-oleoilo-sn-2- [14C] -oleoilo-PC . La etiqueta que se incorporó en TAG (barras sólidas) y lyso-PC (LPC, barras abiertas), se cuantificó por autoradiografia electrónica. Los resultados mostrados son los valores medios de dos experimentos. Las microsomas usadas fueron de células W303-1A, que sobre expresan el gen PDAT del promotor GALl-TPK2, como se describe en la Fig. 3. La expresión se indujo en la fase estacionaria temprana y las células se cosecharon unas 24 horas adicionales.
TABLA. 1: Síntesis in vitro de triacilgliceroles en preparaciones microsomales de semilla de ricino en desarrollo. Alícuotas de microsomas (20 nmol PC) , se liofilizaron y se agregaron substratos lípidos en solución de benceno: (a) 0.4 nmol [14C]-DAG (7760 dpm/nmol) y fueron indicadas 1.6 nmol de DAG no etiquetado; (B) 0.4 nmol [14C]-DAG (7760 dpm/nmol) y 5 nmol de di-ricinoleoilo-PC no etiquetado y (C) 0.25 nmol [14C]-PC (4000 dpm/nmol) y 5 nmol de DAG no etiquetado. El benceno se evaporó por N2 y se agregó 0.1 mol de 50 mM de fosfato de potasio, mezclado uniformemente e incubado a 30°C por (A) 20 minutos; (B) y (C) 30 minutos. Los ensayos se terminaron por la extracción de los lípidos en cloroformo. Los lípidos entonces fueron separados por cromatografía de capa delgada en 60 placas de gel de sílice (Merck; Darmstadt, Alemania) en hexano (dietiléter/acético 35:70:1.5. Los lípidos radioactivos se visualizaron y la radioactividad se cuantificó en la placa por autoradiografía electrónica (Instant Imager, Packard, US) . Los resultados están presentes como valores medios de dos experimentos. Radioactividad en diferentes especies de triacilgliceroles (TAG) diferentes formadas. Abreviaciones usadas: 1-OH-, mono-ricinoleoilo ; 2-OH, di-ricinoleoilo- ; 3-OH-, triricinoleoilo ; 1-OH-l-ver-, mono-ricinoleoilo-monovernoleoilo ; l-OH-2-ver, mono-ricinoleoilo-divernoleoilo . Se preparó enzimáticamente DAG y PC radioetiquetado . El grupo ricinoleoilo radioetiquetado está unido en la posición sn-2 del lipido y el grupo oleoilo no etiquetado en la posición sn-1. El DAG no etiquetado con las cadenas de vernoleoilo o ricinoleoilo, se preparó por la acción de la lipasa TAG (6) en aceite de Euphorbia lagascae o semilla de ricino, respectivamente. El di-ricinoleoilo-PC sintético fue principalmente proporcionado de Metapontum Agribios (Italia).
TABLA 2: Ácidos grasos totales por mg de semillas T2 vertidas de individuos de plantas de Arabidopsis thaliana, transformadas con el gen PDAT de levadura bajo el control del promotor napin (26-14) o transformadas con el vector vacio (32-4) . *= diferencia estadística entre las plantas de control y las plantas transformadas con PDAT en una prueba de dos lados de diferencia media a a = 5.
Descripción de la SEC ID: SEC ID NO. 1: Secuencia de ADN genómico y secuencia de aminoácido sugerido del gen PDAT de Saccharomyces cerevisiae, YNR008w con el número de acceso de GenBank Z7 1623 y Y13139, y con el número ID de nucleótido 1302481. SEC ID NO. 2: La secuencia de aminoácido de la estructura lectíra abierta sugerida YNR008w de Saccharomyces cerevisiae. SEC ID NO. 3: Secuencia de ADN genómico del gen SPBC776.14 de Schizosaccharomyces pombe. SEC ID NO. 4: Secuencia de ADN genómico de parte del sitio de Arabidopsis thaliana con el número de acceso de GenBank AB006704. SEC ID NO. 5: Secuencia de nucleótido del clon de ADNc de Arabidopsis thaliana con el número de acceso de GenBank T04806, y número ID de nucleótido 315966. SEC ID NO. 6: Secuencia de aminoácido predicha del clon de ADNc de Arabidopsis thaliana con el número de acceso de GenBank T04806. SEC ID NO. 7: Secuencia de aminoácido y nucleótido del clon Zea mays EST con el número de acceso de GenBank AI491339, y número ID de nucleótido 4388167. SEC ID NO. 8: Secuencia de aminoácido predicha del clon EST de Zea mays con el número de acceso de GenBank AI491339, y el número ID de nucleótido 4388167. SEC ID NO. 9: Secuencia de ADN de parte del clon EST de Neurospora crassa W07G1, con número de acceso de GenBank AI398644, y número ID de nucleótido 4241729. SEC ID NO. 10: Secuencia de ADN genómico de parte del sitio Arabidopsis thaliana con el número de acceso de GenBank AC004557. SEC ID NO. 11: Secuencia de ADN genómico de parte del sitio Arabidopsis thaliana con el número de acceso de GenBank AC003027. SEC ID NO. 12: Secuencia de ADN de parte del clon de ADNc de Lycopersicon esculentum con el número de acceso de GenBank AI486635. SEC ID NO. 13: Secuencia de aminoácido de la estructura de lectura abierta putativa de Schizosaccharomyces pombe CAA22887 del gen de Schizosaccharomyces pombe SPBC776.14.
SEC ID NO. 14: Secuencia de aminoácido de la estructura de lectura abierta putativa de Arabidopsis thaliana AAC80628 derivada del sitio de Arabidopsis thaliana con el número de acceso de GenBank AC004557. SEC ID NO. 15: Secuencia de aminoácido de la estructura de lectura abierta putativa de Arabidopsis thaliana AAD10668 derivada del sitio de Arabidopsis thaliana con el número de acceso de GenBank AC003027.
Las secuencias parciales y/o provisionales además están definidas a través de las siguientes SEC IDs. SEC ID NO. 16: La secuencia de aminoácido de ORF YNR008w de levadura a partir de Saccharomyces cerevisiae . SEC ID NO. 17: Secuencia de aminoácido de la región de la secuencia genómica de Arabidopsis thaliana (AC004557 ) . SEC ID NO. 18: Secuencia de aminoácido de la región de la secuencia genómica de Arabidopsis thaliana (AB006704 ) . SEC ID NO. 19: La secuencia de ADN genómico correspondiente y secuencia de aminoácido de ORF YNR008w de levadura de Saccharomyces cerevisiae. SEC ID NO. 20: La secuencia de aminoácido de ORF YNRO O 8w de Saccharomyces cerevisiae derivada de la secuencia de ADN genómico correspondiente. SEC ID NO. 21 : Secuencia de ADN genómico del gen PDAT de Saccharomyces cerevisiae, YNR008w, número ID de nucleótido de genbank 1302481, y la secuencia de aminoácido sugerida YNR008w. SEC ID NO. 22: La secuencia de aminoácido sugerida del gen de levadura YNR008w de Saccharomyces cerevisiae . SEC ID NO. 23: Secuencia de ADN genómico del gen SPBC776.14 de Schizosaccharomyces pombe. SEC ID NO. 24: Secuencia de AND genómico de parte del sitio de Arabidopsis thaliana con el número de acceso de genbank AB006704. SEC ID NO. 25: Secuencia de nucleótido y la secuencia de aminoácido correspondiente del clon de Arabidopsis thaliana EST, con el número de acceso de GenBank T04806, y número ID 315966. SEC ID NO. 26: Secuencia de aminoácido y nucleótido del clon de ADNc de Zea mays con el número ID de genbank 4388167. SEC ID NO. 21: Secuencia de aminoácido del clon de ADNc de Zea mays con el número ID de genbank 4388167.
SEC ID NO. 28: Secuencia de ADN de parte del clon de ADNc de Neurospora crassa W07G1, número ID 4241729. SEC ID NO. 29: Secuencia de ADN genómico de parte del sitio de Arabidopsis thaliana con número de acceso de genbank AC004557. SEC ID NO. 30: Secuencia de ADN genómico de parte del sitio de Arabidopsis thaliana con número de acceso de GenBank AC003027. SEC ID NO. 31: Secuencia de ADN de parte del clon de ADNc de Lycopersicon esculentum con el número de acceso de GenBank AI486635. <110> BASF AG <120 U A NUEVA CLASE DE ENZIMAS EN LA TRAYECTORIA BIOSINTÉTICA PARA LA PRODUCCIÓN DE TRIACILGLICEROL Y MOLÉCULAS DE ADN RECOMBINANTE QUE CODIFICAN ESTAS ENZIMAS <13?> BASF-NAE-3377-99-Sept-2000 <140> PCT/EP 00/02701 <141> 2000-03-23 <160> 31 <170> Patentln Ver. 2.1 <210> 1 <211> 1986 <212> ADN genómico <213> Saccharomyces cerevisiae <220> <22 > CDS <222> (1) .. (1983.) <400> 1 atg ggc acá ctg ttt cga aga aat gtc cag aac caá aag agt gat tct 48 et Gly Thr Leu Phe Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 15 gat gaa aac aat aaa ggg ggt tct gtt cat aac aag cga gag age aga 96 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 aac cae att cat cat caá cag gga tta ggc cat aag aga aga agg ggt 144 Asn His lie His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 40 45 att agt ggc agt gca aaa aga aat gag cgt ggc aaa gat ttc gac agg 192 lie Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 aaa aga gac ggg aac ggt aga aaa cgt tgg aga gat tec aga aga ctg 240 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 att ttc att ctt ggt gca ttc tta ggt gta ctt ttg ceg ttt age ttt 288 lie Phe lie Leu Gly Ala Phe Leu Gly Val Leu "Leu Pro Phe Ser Phe 85 90 95 ggc gct tat cat gtt cat aat age gat age gac ttg ttt gac aac ttt 336 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 105 110 gta aat ttt gat tea ctt aaa gtg tat ttg gat gat tgg aaa gat gtt 384 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 115 120 125 ccc cea ca ggt ata agt tcg ttt att gat gat att cag gct ggt aac 432 Leu Pro Gln Gly lie Ser Ser Phe lie Asp Asp lie Gln Ala Gly Asn 130 135 140 tac tec acá tet tet tta gat gat etc agt gaa aat ttt gee gtt ggt 480 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 145 150 155 160 aaa caá etc tta cgt gat tat aat ate gag gee aaa cat ect gtt gta 528 Lys Gln Leu Leu Arg Asp Tyr Asn lie Glu Ala Lys His Pro Val Val 165 170 175 atg gtt ect ggt gtc att tet acg gga att gaa age tgg gga gtt att 576 Met Val Pro Gly Val lie Ser Thr Gly lie Glu Ser Trp Gly Val lie 180 185 190 gga gac gat gag tgc gat agt tet gcg cat ttt cgt aaa cgg ctg tgg 624 Gly Asp Asp Glu Cys Asp Ser Ser Ala His Phe Arg Lys Arg Leu Trp 195 200 205 gga agt ttt tac atg ctg aga acá atg gtt atg gat aaa gtt tgt tgg 672 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 ttg aaa cat gta atg tta gat ect gaa acá ggt ctg gac cea ceg aac 720 Leu Lys His Val Met Leu Asp Pro Glu Thr Gly Leu Asp Pro Pro Asn 225 230 235 240 ttt acg cta cgt gca gca cag ggc ttc gaa tea act gat tat ttc ate 768 Phe Thr Leu Arg Ala Ala Gln Gly Phe Glu Ser Thr Asp Tyr Phe lie 245 250 255 gca ggg tat tgg att tgg aac aaa gtt ttc caá aat ctg gga gta att 816 Ala Gly Tyr Trp lie Trp Asn Lys Val Phe Gln Asn Leu Gly Val lie 260 255 270 ggc tat gaa ccc aat aaa atg acg agt gct gcg tat gat tgg agg ctt 864 Gly Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 gca tat tta gat cta gaa aga cgc gat agg tac ttt acg aag cta aag 912 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 gaa caá ate gaa ctg ttt cat caá ttg agt ggt gaa aaa gtt tgt tta 960 Glu Gln lie Glu Leu Phe His Gln Leu Ser Gly Glu Lys Val Cys Leu 305 310 315 320 att gga cat tet atg ggt tet cag att ate ttt tac ttt atg aaa tgg 1008 He Qiy HÍS Ser Met Gly Ser Gln lie lie Phe Tyr Phe Met Lys Trp 325 330 335 gtc gag gct gaa ggc ect ctt tac ggt aat ggt ggt cgt ggc tgg gtt 1056 Val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 aac gaa cae ata gat tea ttc att aat gca gca ggg acg ctt ctg ggc 1104 Asn Glu His lie Asp Ser Phe lie Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 gct cea aag gca gct cea gct cta att agt ggt gaa atg aaa gat acc 1152 Ala Pro Lys Ala Val Pro Ala Leu lie Ser Gly Glu Met Lys Asp Thr 370 375 380 att caá tta aat acg tta gee atg tat ggt ttg gaa aag ttc ttc tea 1200 lie Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 390 395 400 aga att gag aga gta aaa atg tta caá acg tgg ggt ggt ata cea tea 1248 Arg lie Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly lie Pro Ser 405 410 415 atg cta cea aag gga gaa gag gtc att tgg ggg gat atg aag tea tet 1296 Met Leu Pro Lys Gly Glu Glu Val lie Trp Gly Asp Met Lys Ser Ser 420 425 430 tea gag gat gca ttg aat aac aac act gac acá tac ggc aat ttc att 1344 Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe lie 435 440 445 cga ttt gaa agg aat acg age gat gct ttc aac aaa aat ttg acá atg 1392 Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 aaa gac gee att aac atg ac tta teg ata tea ect gaa tgg etc ca 1440 Lys Asp Ala lie Asn Met Thr Leu Ser lie Ser Pro Glu Trp Leu Gln 465 470 475 480 aga aga gta cat gag cag tac teg ttc ggc tat tec aag aat gaa gaa 1488 Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 gag tta aga aaa aat gag cta cae cae aag cae tgg teg aat cea atg 1536 Glu Leu Arg Lys Asn Glu Leu His His Lys His Trp Ser Asn Pro Met 500 505 510 gaa gta cea ctt cea gaa gct ecc cae atg aaa ate tat tgt ata tac 1584 Glu Val Pro Leu Pro Glu Ala Pro His Met Lys lie Tyr Cys lie Tyr 515 520 525 ggg gtg aac aac cea act gaa agg gea tat gta tat aag gaa gag gat 1632 Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 gac tec tet gct ctg aat ttg acc ate gac tac gaa age aag caá ect 1680 Asp Ser Ser Ala Leu Asn Leu Thr lie Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 gta ttc etc acc gag ggg gac gga acc gtt ceg etc gtg gcg cat tea 1728 Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 atg tgt cae aaa tgg gee cag ggt gct tea ceg tac aac ect gee gga 1776 Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 att aac gtt act att gtg gaa atg aaa cae cag cea gat cga ttt gat 1324 lie Asn Val Thr lie Val Glu Met Lys His Gln Pro Asp Arg Pne Asp 595 600 605 ata cgt ggt gga gca aaa age gcc gaa cae gta gac ate etc ggc age 1872 lie Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp lie Leu Gly Ser 610 615 620 gcg gag ttg aac gat tac ate ttg aaa att gca age ggt aat ggc gat 1920 Ala Glu Leu Asn Asp Tyr lie Leu Lys lie Ala Ser Gly Asn Gly Asp 625 630 635 640 etc gtc gag cea cgc caá ttg tet aat ttg age cag tgg gtt tet cag 1968 Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 atg ecc ttc cea atg taa 1986 Met Pro Phe Pro Met <210> 2 <211> 661 <212> PRT <213> Saccharomyces cerevisiae <400> 2 Met Gly Thr Leu Phe Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 15 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 Asn His lie His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 40 45 lie Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 lie Phe lie Leu Gly Ala Phe Leu Gly Val Leu Leu Pro Phe Ser Phe 85 90 95 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 105 110 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 115 120 125 Leu Pro Gln Gly lie Ser Ser Phe lie Asp Asp lie Gln Ala Gly Asn 130 135 140 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 1-45 150 155 160 Lys Gln Leu Leu Arg Asp Tyr Asn lie Glu Ala Lys His Pro Val Val 165 170 175 Met Val Pro Gly Val He Ser Thr Gly He Glu Ser Trp Gly Val He 180 185 190 Gly Asp Asp Glu Cys Asp Ser Ser Ala His Phe Arg Lys Arg Leu Trp 195 200 205 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 Leu Lys His Val Met Leu Asp Pro Glu Thr Gly Leu Asp Pro Pro Asn 225 230 235 240 Phe Thr Leu Arg Ala Ala Gln Gly Phe Glu Ser Thr Asp Tyr Phe He 245 250 255 Ala Gly Tyr Trp He Trp Asn Lys Val Phe Gln Asn Leu Gly Val He 260 265 270 Gly Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 Glu Gln lie Glu Leu Phe His Gln Leu Ser Gly Glu Lys Val Cys Leu 305 310 315 320 lie Gly His Ser Met Gly Ser Gln lie lie Phe Tyr Phe Met Lys Trp 325 330 335 Val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 Asn Glu His lie Asp Ser Phe lie Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 Ala Pro Lys Ala Val Pro Ala Leu lie Ser Gly Glu Met Lys Asp Thr 370 375 380 lie Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 390 395 400 Arg lie Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly lie Pro Ser 405 410 415 Met Leu Pro Lys Gly Glu Glu Val lie Trp Gly Asp Met Lys Ser Ser 420 425 430 Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe lie 435 440 445 Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 Lys Asp Ala lie Asn Met Thr Leu Ser lie Ser Pro Glu Trp Leu Gln 465 470 475 480 Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 Glu Leu Arg Lys Asn Glu Leu His His Lys His Trp Ser Asn Pro Met 500 505 510 Glu Val Pro Leu Pro Glu Ala Pro His Met Lys lie Tyr Cys lie Tyr 515 520 525 Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 Asp Ser Ser Ala Leu Asn Leu Thr lie Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 lie Asn Val Thr lie Val Glu Met Lys His Gln Pro Asp Arg Phe Asp 595 600 605 lie Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp lie Leu Gly Ser 610 615 620 Ala Glu Leu Asn Asp Tyr lie Leu Lys lie Ala Ser Gly Asn Gly Asp 625 630 635 640 Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 Met Pro P e Pro Met 660 <210> 3 <211> 2312 <212> ^DN genómico <213> Schizosaccharornyces pombe <400> 3 atggcgtctt ccaagaagag caaaactcat aagaaaaaga aagaagtcaa atctcctatc 60 gacttaccaa attcaaagaa accaactcgc gctttgagtg agcaaccttc agcgtccgaa 120 acacaatctg tttcaaataa atcaagaaaa tctaaatttg gaaaaagatt gaattttata 180 ttgggcgcta CCtcgggaat atgcggtgct ttttttttcg ctgttggaga cgacaatgct 240 gttttcgacc ctgctacgtt agataaattt gggaatatgc taggctcttc agacttgttt 300 gatgacatta aaggatattt atcttataat gtgtttaagg atgcaccttt tactacggac 360 aagccttcgc agtctcctag cggaaatgaa gttcaagttg gtcttgatat gtacaatgag 420 ggatatcgaa gtgaccatcc tgttattatg gttcctggtg ttatcagctc aggattagaa 480 agttggtcgt ttaataattg ctcgattcct tactttagga aacgtctttg gggcagctgg 540 tctatgctga aggcaatgtt ccttgacaag caatgctggc ttgaacattt aatgcttgat 600 aaaaaaaccg gcttggatcc gaagggaatt aagctgcgag cagctcaggg gtttgaagca 660 gctgattttt ttatcacggg ctattggatt tggagtaaag taattgaaaa ccttgctgca 720 attggttatg agcctaataa catgttaagt gcttcttacg attggcggtt atcatatgca 780 aatttagagg aacgtgataa atatttttca aagttaaaaa tgttcattga gtacagcaac 840 attgtacata agaaaaaggt agtgttgatt tctcactcca tgggttcaca ggttacgtac 900. tattttttta agtgggttga agctgagggc tacggaaatg gtggaccgac ttgggttaat 960 gatcatattg aagcatttat aaatgtgagt ctcgatggtt gtttgactac gtttctaact 1020 tttgaataga tatcgggatc tttgattgga gcacccaaaa cagtggcagc gcttttatcg 1080 ggtgaaatga aagatacagg tattgtaatt acattaaaca tgttaatatt taatttttgc 1140 taaccgtttt aagctcaatt gaatcagttt tcggtctatg ggtaagcaat aaattgttga 1200 gatttgttac taatttactg tttagtttgg aaaaatttt ttcccgttct gaggtatatt 1260 caaaaataca aatgtgctct actttttcta acttttaata gagagccatg atggttcgca 1320 ctatgggagg agttagttct atgcttccta aaggaggcga tgttgcatgg ggaaatgcca 1380 gttgggtaag aaatatgtgc tgttaatttt ttattaatat ttaggctcca gatgatctta 1440 atcaaacaaa tttttccaat ggtgcaatta ttcgatatag agaagacatt gataaggacc 1500 acgatgaatt tgacatagat gatgcattac aatttttaaa aaatgttaca gatgacgatt 1560 ttaaagtcat gctagcgaaa aattattccc acggtcttgc ttggactgaa aaagaagtgt 1520 taaaaaataa cgaaatgccg tctaaatgga taaatccgct agaagtaaga acattaaagt 1680 tactaaatta tactaaccca aatagactag tcttccttat gctcctgata tgaaaattta 1740 ttgcgttcac ggggtcggaa aaccaactga gagaggttat tattatacta ataatcctga 1T00 ggggcaacct gtcattgatt cctcggttaa tgatggaaca aaagttgaaa atgtgagaga 1860 atttatgttt caaacattct attaactgtt ttattagggt atcgttatgg atgatggtga 1920 tggaacttta ccaatattag cccttggttt ggtgtgcaat aaagtttggc aaacaaaaag 1980 gtttaatcct gctaatacaa gtatcacaaa ttatgaaatc aagcatgaac ctgctgcgtt 2040 tgatctgaga ggaggacctc gctcggcaga acacgtcgat atacttggac attcagagct 2100 aaatgtatgt tcattttacc ttacaaattt ctattactaa ctcttgaaat aaggaaatta 2160 ttttaaaagt ttcatcaggc catggtgact cggtaccaaa ccgttatata tcagatatcc 2220 agtacggaca taagttttgt agattgcaat taactaacta accgaacagg gaaataataa 2280 atgagataaa tctcgataaa cctagaaatt aa 2312 <210> 4 <211> 3685 <212> ADN genómico <213> Arabidopsis tlaaliana <400> 4 atgcccctta ttcatcggaa aaagccgacg gagaaaccat cgacgccgcc atotgaagag 60 gtggtgcacg atgaggattc gcaaaagaaa ccacacgaat cttccaaatc ccaccataag 120 aaatcgaacg gaggagggaa gtggtcgtgc atcgattctt gttgttggtt cattgggtgt 180 gtgtgtgtaa cctggtggtt ccttctctte ctttacaacg caatgcctgc gagcttccct 240 cagtatgtaa cggagcgaat cacgggtcct ttgcctgacc cgcccggtgt taagctcaaa 300 aaagaaggtc ttaaggcgaa acatcctgtt gtcttcattc ctgggattgt caccggtggg 360 ctcgagcttt gggaaggcaa acaatgcgct gatggtttat ttagaaaacg tttgtggggt 420 ggaacttttg gtgaagtcta caaaaggtga gctcaacaat tctcactctt cctttatatt 480 gggacttgga ttggatctga tgagatcacg cacttgttgc ttcttcaaca tcactcaaac 540 tttaattcca tgtttgtctg tcttactctt tacttttttt tttttttgat gtgaaacgc 600 attttcttaa gagactattt ctgtatgtgt aaggtaagcg ttccaaggac gtaattggct 660 tggactattt ctgtttgatt gttaactcta ggatataaaa tagctgcctt ggaatttcaa 720 gtcatcttat tgccaaatct gttgctagac atgccctaga gtccgttcat aacaagttac 780 ttcctttact gtcgttgcgt gtagatttag ctttgtgtag cgtataatga agtagtgttt 840 tatgtcttgt tgggaataga gaagttctaa ctacatctgt ggaaagtgtg ttcaggctgt 900 gatagaggac tgttgcttta ttattcaact atgtatatgt gtaattaaag ctagttcctt 960 tttgatcttt cagctcaatg tgctttcctc aatttttttc tcaatttcaa agtttcacat 1020 cgagtttatt cacatgtctt gaatttcgtc catcctcgtt ctgttatcca gctttgaact 1080 cctcccgacc ctgctatgga tatattaaaa aaaaagtgtt ttgtgggttg catctttgtt 1140 acgatctgca ccttcttctc tcggctcagt gttcatgttt ttgctatggt agagatgggc 1200 aatgttattg ttgatggtaa cagtggtata gttgatagta tcttaactaa tcaattatct 1260 ctttgattca ggcctctatg ttgggtggaa cacatgtcac ttgacaatga aactgggttg 1320 gatccagctg gtattagagt tcgagctgta tcaggactcg tggctgctga ctactttgct 1380 cctggctact ttgtctgggc agtgctgatt gctaaccttg cacatattgg atatgaagag 1440 aaaaatatgt acatggctgc atatgactgg cggctttcgt ttcagaacac agaggttctt 1500 ttctcatcgt cctttctatt attctgttcc atgttacgtt tctttcttca ttacttaagg 1560 cttaaatatg tttcatgttg aattaatagg tacgtgatca gactcttagc cgtatgaaaa 1620 gtaatacaga gttgatggtt tctaccaacg gtggaaaaaa agcagttata gttccgcatt 1680 ccatgggggt cttgtatttt ctacatttta tgaagtgggt tgaggcacca gctcctctgg 1740 gtggcggggg tgggccagat tggtgtgcaa agtatattaa ggcggtgatg aacattggtg 1800 gaccatttct cggtgttcca aaagctgttg cagggctttt ctctgctgaa gcaaaggatg 1860 ttgcagttgc caggtattga atatctgctt atacttttga tgatcagaac cttggctctg 1920 gaactcaaag ttattctact aaatatcaat tctaataaca ttgctatatt atcgctgcaa 1980 ctgacattgg ttgattattt ttgctgctta tgtaactgaa actctcttga gattagacaa 2040 atgatgaatt gataattctt acgcattgct ctgtgatgac cagtttctta gcttcgacga 2100 taacatttgt catactgtct tttggagggc attgaatttt gctatggaaa gcgctggagc 2160 ctccatgctt gcattcttta ccaattagcg ttattctgct tctttcaatt ttcttgtata 2220 tgcatctatg gtcttttatt tcttcttaat taaagactcg ttggattagt tgctctatta 2280 gtcacttggt tccttaatat agaactttac tttcttcgaa aattgcagag cgattgcccc 2340 aggattctta gacaccgata tatttagact tcagaccttg cagcatgtaa tgagaatgac 2400 acgcacatgg gactcaacaa tgtctatgtt accgaaggga ggtgacacga tatggggcgg 2460 gcttgattgg tcaccggaga aaggccacac ctgttgtggg aaaaagcaaa agaacaacga 2520 aacttgtggt gaagcaggtg aaaacggagt ttccaagaaa agtcctgtta actatggaag 2580 gatgatatct tttgggaaag aagtagcaga ggctgcgcca tctgagatta ataatattga 2640 ttttcgagta aggacatata aatcataata aaccttgtac attttgtgat tgtatgatga 2700 atatctgtac attttatctg gtgaagggtg ctgtcaaagg tcagagta.tc ccaaatcaca 2760 cctgtcgtga cgtgtggaca gagtaccatg acatgggaat tgctgggatc aaagctatcg 2820 ctgagtataa ggtctacact gctggtgaag ctatagatct actacattat gttgctccta "2880 agatgatggc gcgtggtgcc gctcatttct cttatggaat tgctgatgat ttggatgaca 2940 ccaagtatca agatcccaaa tactggtcaa atccgttaga gacaaagtaa gtgatttctt 3000 gattccaact gtatccttcg tcctgatgca ttatcagtct ttttgttttc ggtcttgttg 3060 gatatggttt tcagctcaaa gcttacaaag ctgtttctga gcctttctca aaaaggcttg 3120 ctcagtaata ttgaggtgct aaagttgata catgtgactc ttgcttataa atcctccgtt 3180 tggtttgttc tgctttttca gattaccgaa tgctcctgag atggaaatct actcattata 3240 cggagtgggg ataccaacgg aacgagcata cgtatacaag cttaaccagt ctcccgacag 3300 ttgcatcccc tttcagatat tcacttctgc tcacgaggag gacgaagata gctgtctgaa 3360 agcaggag t tacaatgtgg atggggatga aacagtaccc gtcctaagtg ccgggtacat 3420 gtgtgcaaaa gcgtggcgtg gcaagacaag attcaaccct tccggaatca agacttatat 3480 aagagaatac aatcactctc cgccggctaa cctgttggaa gggcgcggga cgcagagtgg 3540 .tgcccatgtt gatatcatgg gaaactttgc tttgatcgaa gatatcatga gggttgccgc 3500 cggaggtaac gggtctgata taggacatga ccaggtccac tctggcatat ttgaatggtc 3660 ggagcgtatt gacctgaagc tgtga 3685 <210> 5 <211> 2427 <212> ADNc <213> Arabi<aopsis thaliana <400> 5 agaaacagct ctttgtctct ctcgactgat ctaacaatcc ctaatctgtg ttctaaattc 60 ctggacgaga tttgacaaag tccgtatagc ttaacctggt ttaatttcaa gtgacagata 120 tgccccttat tcatcggaaa aagccgacgg agaaaccatc gacgccgcca tctgaagagg 180 tggtgcacga tgaggattcg caaaagaaac cacacgaatc ttccaaatcc caccataaga 240 5 aatcgaacgg aggagggaag tggtcgtgca tcgattcttg ttgttggttc attgggtgtg 300 tgtgtgtaac ctggtggttt cttctcttcc tttacaacgc aatgcctgcg agcttccctc 360 agtatgtaac ggagcgaauc acgggtcctt tgcctgaccc gcccggtgtt aagctcaaaa 420 aaagaaggtc ttaaggcgaa acatcctgtt gtcttcattc ctgggattgt caccggtggg 480 ctcgagcttt gggaaggcaa acaatgcgct gatggtttat ttagaaaacg tttgtggggt 540 ggaacttttg gtgaagtcta caaaaggcct ctatgttggg tggaacacat gtcacttgac 600 aatgaaactg ggttggaccc agctggtatt agagttcgag ctgtatcagg actcgtggct 660 gctgactact ttgctcctgg ctactttgtc tgggcagtgc tgattgctaa ccttgcacat 720 attggatatg aagagaaaaa tatgtacatg gctgcatatg actggcggct ttcgtttcag 780 aacacagagg acgtgatca gactcttagc cgtatgaaaa gtaatataga gttgatggtt 840 tctaccaacg gtggaaaaaa agcagttata gttccgcatt ccatgggggt cttgtatttt 900 ctacatttta tgaagtgggt tgaggcacca gctcctctgg gtggcggggg tgggccagat 960 , n tggtgcgcaa agtatattaa ggcggtgatg aacattggtg gaccatttct tggtgttcca 1020 aaagctgttg cagggctttt ctctgctgaa gcaaaggatg ttgcagttgc cagagcgatt 1080 gccccaggat tcttagacac cgatatattt agacttcaga ccttgcagca tgtaatgaga 1140 atgacacgca catgggactc aacaatgtct atgttaccga agggaggtga cacgatatgg 1200 ggcgggcttg attggtcacc ggagaaaggc cacacctgtt gtgggaaaaa gcaaaagaac 1260 aacgaaactt gtggtgaagc aggtgaaaac ggagtttcca agaaaagtcc tgttaactat 1320 ggaaggatga tatcttttgg gaaagaagta gcagaggctg cgccatctga gattaataat 1380 attgattttc gaggtgctgt caaaggtcag agtatcccaa atcacacctg tcgtgacgtg 1440 tggacagagt accatgacat gggaattgct gggatcaaag ctatcgctga gtataaggtc 1500 tacactgctg gtgaagctat agatctacta cattatgttg ctcctaagat gatggcgcgt 1560 ggtgccgctc atttctctüa tggaattgct gatgatttgg atgacaccaa gtatcaagat 1620 cccaaatact ggtcaaatcc gttagagaca aaattaccga atgctcctga gatggaaatc 1680 tactcattat acggagtggg gataccaacg gaacgagcat acgtatacaa gcttaaccag 1740 5 tctcccgaca gttgcatccc ctttcagata ttcact'tctg ctcacgagga ggacgaagat 1800 agctgtctga aagcaggagt ttacaatgtg gatggggatg aaacagtacc cgtcctaagt 1860 gccgggtaca tgtgtgcaaa agcgtggcgt ggcaagacaa gattcaaccc ttccggaatc 1920 aagacttata taagagaata caatcactct ccgccggcta acctgttgga agggcgcggg 1980 acgcagagtg gtgcccatgt tgatatcatg ggaaactttg ctttgatcga agatatcatg 2040 agggttgccg ccggaggtaa cgggtctgat ataggacatg accaggtcca ctctggcata 2100 tttgaatggt cggagcgtat tgacctgaag ctgtgaatat catgatctct ttaagctgtc 2160 ctgtcagctt atgtgaatcc aatactttga aagagagatc atcatcaatt catcatcatc 2220 gtcatcatca tgatgctcaa ctcacaaaga agcctgagaa tgatactttg gtgcgaaatt 2280 ctcaatacct ctttaatatt cttattgaat gtaaattata caatcctatc taatgtttga 2340 acgataacac aaaacttgct gcngccatgt ttgtttgtct tgtcaaaagc atcaatttgt 2400 gggttaaaaa aaaaaaaaaa aaaaaaa 2427 20 <210> 6 <211> 671 <212> PRT <213> Ara idopsis thaliana <400> 6 Met Pro Leu lie His Arg Lys Lys ' Pro Thr Glu Lys Pro Ser Thr Pro 1 5 10 15 Pro Ser Glu Glu Val Val His Asp Glu Asp Ser Gln Lys Lys Pro His 20 25 30 Glu Ser Ser Lys Ser His His Lys Lys Ser Asn Gly Gly Gly Lys Trp 35 40 45 Ser Cys lie Asp Ser Cys Cys. Trp Phe He Gly Cys val cys Val Thr 50 55 60 Trp Trp Phe Leu Leu Phe Leu Tyr Asn Ala Met Pro Ala Ser Phe Pro 65 70 75 80 Gln Tyr Val Thr Glu Arg lie Thr Gly Pro Leu Pro Asp Pro Pro Gly 85 90 95 Val Lys Leu Lys Lys Glu Gly Leu Lys Ala Lys His Pro Val Val Phe 100 105 110 lie Pro Gly He Val Thr Gly Gly Leu Glu Leu Trp Glu Gly Lys Gln 115 120 125 Cys Ala Asp Gly Leu Phe Arg Lys Arg Leu Trp Gly Gly Thr Phe Gly 130 135 140 Glu Val Tyr Lys Arg Pro Leu Cys Trp Val Glu His Mee Ser Leu Asp 145 150 155 160 Asn Glu Thr Gly Leu Asp Pro Ala Gly He Arg Val Arg Ala Val Ser 165 170 175 Gly Leu Val Ala Ala Asp Tyr Phe Ala Pro Gly Tyr Phe Val Trp Ala 180 185 190 Val Leu He Ala Asn Leu Ala His He Gly Tyr Glu Glu Lys Asn Met 195 200 205 Tyr Met Ala Ala Tyr Asp Trp Arg Leu Ser Phe Gln Asn Thr Glu Val 210 -215 220 Arg Asp Gln Thr Leu Ser Arg Met Lys Ser Asn He Glu Leu Met Val 225 230 235 240 Ser Thr Asn Gly Gly Lys Lys Ala Val He Val Pro His Ser Met Gly 245 250 255 Val Leu Tyr Phe Leu His Phe Met Lys Trp Val Glu Ala Pro Ala Pro 260 265 270 Leu Gly Gly Gly Gly Gly Pro Asp Trp Cys Ala Lys Tyr He Lys Ala 275 280 285 Val Met Asn lie Gly Gly Pro Phe Leu Gly Val Pro Lys Ala Val Ala 290 295 300 Gly Leu Phe Ser Ala Glu Ala Lys Asp Val Ala Val Ala Arg Ala lie 305 310 315 320 Ala Pro Gly Phe Leu Asp Thr Asp lie Phe Arg Leu Gln Thr Leu Gln 325 330 335 His Val Met Arg Met Thr Arg Thr Trp Asp Ser Thr Met Ser Met Leu 340 345 350 Pro Lys Gly Gly Asp Thr lie Trp Gly Gly Leu Asp Trp Ser Pro Glu 355 360 365 Lys Gly His Thr Cys Cys Gly Lys Lys Gln Lys Asn Asn Glu Thr Cys 370 375 380 Gly Glu Ala Gly Glu Asn Gly Val Ser Lys Lys Ser Pro Val Asn Tyr 385 390 395 400 Gly Arg Met lie Ser Phe Gly Lys Glu Val Ala Glu Ala Ala Pro Ser 405 410 415 Glu lie Asn Asn lie Asp Phe Arg Gly Ala Val Lys Gly Gln Ser lie 420 425 430 Pro Asn His Thr Cys Arg Asp Val Trp Thr Glu Tyr His Asp Met Gly 435 440 445 lie Ala Gly lie Lys Ala lie Ala Glu Tyr Lys Val Tyr Thr Ala Gly 450 455 460 Glu Ala lie Asp Leu Leu His Tyr Val Ala Pro Lys Met Met Ala Arg 465 470 475 480 Gly Ala Ala His Phe Ser Tyr Gly lie Ala Asp Asp Leu Asp Asp Thr 485 490 495 Lys Tyr Gln Asp Pro Lys Tyr Trp Ser Asn Pro Leu Glu Thr Lys Leu 500 505 510 Pro Asn Ala Pro Glu "Met Glu lie Tyr Ser Leu Tyr Gly Val Gly lie 515 520 525 Pro Thr Glu Arg Ala Tyr Val Tyr Lys Leu Asn Gln Ser Pro Asp Ser 530 '535 540 Cys lie Pro Phe Gln lie Phe Thr Ser Ala His Glu Glu Asp Glu Asp 545 550 555 560 Ser Cys Leu Lys Ala Gly Val Tyr Asn Val Asp Gly Asp Glu Thr Val 565 570 575 Pro Val Leu Ser Ala Gly Tyr Met Cys Ala Lys Ala Trp Arg Gly Lys 580 585 590 Thr Arg Phe Asn Pro Ser Gly lie Lys Thr Tyr lie Arg Glu Tyr Asn 595 600 605 His Ser Pro Pro Ala Asn Leu Leu Glu Gly Arg Gly Thr Gln Ser Gly 610 615 620 Ala His Val Asp lie Met Gly Asn Ehe Ala' Leu lie Glu Asp lie Met 625 630 635 640 Arg Val Ala Ala Gly Gly Asn Gly Ser Asp lie Gly His Asp Gln Val 645 650 655 His Ser Gly lie Phe Glu Trp Ser Glu Arg lie Asp Leu Lys Leu 660 665 670 <210> 7 <211> 643 <212> ADNc <213> Zea mays <220> <221> CDS <222> (1) .. (402) <400> 7 cgg gag aaa ata gct gct ttg aag ggg ggt gtt tac tta gcc gat ggt 48 Arg Glu Lys lie Ala Ala Leu Lys Gly Gly Val Tyr Leu Ala Asp Gly 1 5 10 15 gat gaa ac.t gtt cea gtt ctt agt gcg ggc tac atg tgt gcg aaa gga 96 Asp Glu Thr Val Pro Val Leu Ser Ala Gly Tyr et Cys Ala Lys Gly 20 25 30 tgg cgt ggc aaa act cgt ttc age ect gcc ggc age aag act tac gtg 144 Trp Arg Gly Lys Tlir Arg Phe Ser Pro Ala Gly Ser Lys Thr Tyr Val 35 40 45 aga gaa tac age cat teg cea ecc tet act etc ctg gaa ggc agg ggc 192 Arg Glu Tyr Ser His Ser Pro Pro Ser Thr Leu Leu Glu Gly Arg Gly 50 55 60 acc cag age ggt gca cat gtt gat ata atg ggg aac ttt gct cta att 240 Thr Gln Ser Gly Ala His Val Asp lie Met Gly Asn Phe Ala Leu lie 65 70 75 80 gag gac gtc ate aga ata gct gct ggg gca acc ggt gag gaa att ggt 288 Glu Asp Val lie Arg lie Ala Ala Gly Ala Thr Gly Glu Glu lie Gly 85 90 95 ggc gat cag gtt tat tea gat ata ttc aag tgg tea gag aaa ate aaa 336 Gly Asp Gln Val Tyr Ser Asp lie Phe Lys Trp Ser Glu Lys lie Lys 100 105 110 ttg aaa ttg taa ect atg gga agt taa aga agt gcc gac ceg ttt att 384 Leu Lys Leu 115 gcg ttc caá agt gtc ctg cctgagtgca actctggatt t gcttaaat 432 attgtaattt -ttcacgcttc attcgtccct ttgtcaaatt tacatttgac aggacgccaa 492 tgcgatacga tgttgtaccg ctattttcag cattgtatat taaactgtac aggtgtaagt 552 tgcatttgcc agctgaaatt gtgtagtcgt tttctttacg atttaatanc aagtggcgga 612 gcagtgcccc aagcnaaaaa aaaaaaaaaa a. 643 <210> 8 <211> 115 <212> PRT <213> Zea mays <400> 8 Arg Glu Lys lie Ala Ala Leu Lys Gly Gly Val Tyr Leu Ala Asp Gly 1 5 10 15 Asp Glu Thr Val Pro Val Leu Ser Ala Gly Tyr Met Cys Ala Lys Gly 20 25 30 Trp Arg Gly Lys Thr Arg Phe Ser Pro Ala Gly Ser Lys Thr Tyr Val 35 40 45 Arg Glu Tyr Ser His Ser Pro Pro Ser Thr Leu Leu Glu Gly Arg Gly 50 55 60 Thr Gln Ser Gly Ala His Val Asp lie Met Gly Asn Phe Ala Leu lie 65 70 75 80 Glu Asp Val lie Arg lie Ala Ala Gly Ala Thr Gly Glu Glu lie Gly 85 90 95 Gly Asp Gln Val Tyr Ser Asp lie Phe Lys Trp Ser Glu Lys lie Lys 100 105 110 Leu Lys Leu 115 <210> 9 <211> 616 <212> ADNc <213> Neurospora crassa <400> 9 ggtggcgaag acganggcgg aagttggagg ctaacgagaa tgacnctcgg agatggatct 60 accctctaga gacacgacca ccnttgcacc cagcctcaag gtntacngtt tntatgggta 120 ggaagccgac ggagcgagcc tacatctatc tggcgcccga tcccgggacg acaacgcatc 180 tttagatgac gatcgatacg actttgactn aggggcacat tgaccacggt gtgattttgg 240 gcgaaggcga tggcacagtg aaccttatga gtttggggta cctgtgcaat aaggggtgga 300 aaatgaagag atacaatcct gcgggctcaa aaataaccgt ggtcgagatg ccgcatgaac 360 cagaacggtt caatccgaga ggagggccga atacggcgga tcacgcggat attctaggaa 420 ggcagaatct aaacgagtac attcttaaag tggcggcagg tcgaggcgat acaattgagg 480 attttattac tagtaatatt cttaaatatg tagaaaaggt tgaaatttat gaagagtaat 540 taaatacggc acataggtta ctcaatagta tgactaatta aaaaaaaatt ttttttctaa 600 aaaaaaaaaa aaaaaa 616 <210> 10 <211> 1562 <212> ADN genómico <213> Arabidopsis t aliana <400> 10 atgaaaaaaa tatcttcaca ttattcggta gtcatagcga tactcgttgt ggtgacgatg 60 acctcgatgt gtcaagctgt gggtagcaac gtgtaccctt tgattctggt tccaggaaac 120 ggaggtaacc agctagaggt acggctggac agagaataca agccaagtag tgtctggtgt 180 agcagctggt tatatccgat tcataagaag agtggtggat ggtttaggct atggttcgat 240 gcagc g gt tattgtctcc cttcaccagg tgcttcagcg atcgaatgat gttgtactat 300 gaccctgatt tggatga ta ccaaaatgct cctggtgtcc aaacccgggt tcctcatttc 360 ggttcgacca aatcacttct atacctcgac cctcgtctcc ggttagtact ttccaagata 420 tatcattttg ggaca tgc ataatgaaca aaatagacat aaatttgggg gattattgtt 480 atatcaatat ccatttatat gctagtcggt aatgtgagtg ttatgttagt atagttaatg 540 tgagtgttat gtgattttcc attttaaatg aagc agaaa gttgtcgttt aataatgttg 600 ctatgtcatg agaattataa ggacactatg taaatgtagc ttaataataa -ggtttgattt 660 gcagagatgc cacatcttac atggaacatt tggtgaaagc tctagagaaa aaatgcgggt 720 atgttaacga ccaaaccatc ctaggagctc catatgattt caggtacggc ctggctgctt 780 cgggccaccc gtcccgtg a gcctcacagt tcctacaaga cctcaaacaa ttggtggaaa 840 aaact gcag cgagaacgaa ggaaagccag tgatactcct ctcccatagc ctaggaggac 900 •ttttcgtcct ccatttcctc aaccgtacca ccccttcatg gcgccgcaag tacatcaaac 960 actttgttgc actcgctgcg ccatggggtg ggacgatctc tcagatgaag acatttgctt 1020 ctggcaacac actcggtgtc cctttagtta accctttgct ggtcagacgg catcagagga 1080 cctccgagag taaccaatgg ctacttccat ctaccaaagt gt tcacgac agaactaaac 1140 cgcttgtcgt aactccccag gttaactaca cagcttacga gatggatcgg ttttttgcag 1200 acattggatt c caeaagga gttgtgcctt acaagacaag agtgttgcct t aacagagg 1260 agctgatgac tccgggagtg ccagtcactt gcatatatgg gagaggag t gatacaccgg 1320 aggttttgat gtatggaaaa ggaggattcg ataagcaacc agagattaag tatggagatg 1380 gagatgggac ggttaatttg gcgagct ag cagctttgaa agtcgatagc ttgaacaccg 1440 tagagattga tggagtttcg catacatcta tac taaaga cgagatcgca cttaaagaga 1500 ttatgaagca gatttcaatt attaattatg aattagccaa tgttaatgcc gtcaatgaat 1560 ga 1562 <210> 11 <211> 3896 <212> ADN genómico <213> Arabidopsis thaliana <400> 11 atgggagcga attcgaaatc agtaacggct tccttcaccg tcatcgccgt ttttttcttg 60 atttgcggtg gccgaactgc ggtggaggat gagaccgagt ttcacggcga ctactcgaag 120 ctatcgggta taatcattcc gggatttgcg tcgacgcagc tacgagcgtg gtcgatcctt 180 gactgtccat acactccgtt ggacttcaat ccgctcgacc tcgtatggct agacaccact 240 aaggtecgtg atcttcattt ccttcgctcc ttattctgtc ggtcgagtca cttgttgatg 300 aattccaagc gaaatatagc aatgaagcat gtctcgtctc tcttattgat tcgttcatta 360 gtcaacagcg acgcttctga atctgagttt agagtcatat aaaacagctg actcggcgag 420 tgtctcccat cgcttctggt tcgccaaatg tagcgcaatg aatgtgtaat tagtctgcgc 480 tttttattca actagatctg caagtttttc agagtgctca atagtagtta gaaaatgtta 540 ggtcatttta cttgtgcatt gtgattcttt tggttgttgc ttactgatcg acgtgatgga 600 tggtttacag cttctttctg ctgtcaactg ctggtttaag tgtatggtgc tagatcctta 660 taatcaaaca gaccatcccg agtgtaagtc acggcctgac agtggtcttt cagccatcac 720 agaattggat ccaggctaca taacaggtag tttcggattt ttctttcttt tgagttttct 780 tcaatttgat atcaccttgt tgtgatataa tatggctaag ttcactaatt tggtcaattt 840 tcaggtcctc tttctactgt ctggaaagag tggcttaagt ggtgcgttga gtttggtata 900 gaagcaaatg caattgtcgc tgttccatac gattggagat tgtcaccaac caaattggaa 960 gagcgtgacc tttactttca caagctcaag ttagtcctta tcaggctaat gtcttttatc 1020 ttctcttttt atgtaagata agctaagagc tctggtcgtc ttcctttttg caggttgacc 1080 tttgaaactg ctttaaaact ccgtggcggc ccttctatag tatttgccca ttcaatgggt 1140 aataatgtct tcagatactt tctggaatgg ctgaggctag aaattgcacc aaaacattat 1200 ttgaagtggc ttgatcagca tatccatgct tatttcgctg ttggtaccgg cctactatcc 1260 ttaagttacc attttatttt ttctctaatt gggggagtta tgttgtgact tactggattg 1320 agctcgatac ctgatttgtt gttgatttag gagctcctct tcttggttct gttgaggcaa 1380 tcaaatctac tctctctggt gtaacgtttg gccttcctgt ttctgaggtg acctctgact 1440 tctctttagt tttaagtagt tgatatcaac caggtcttat aactcactgg attttccttt 1500 tgaaagtatt acttttgtta attgaactgc tgtacgcgat atggtatctg tagatcttga 1560 agtgctagtt atcaaagaac atattgtggg tagtatacct gtcagcggcc ttagctaata ¦ 1620 caaccaaacc acatgtacac tgatttagtt ttcagattat tatggtagac tttaagttga 1680 gaagaaactt tgactgaaat ctttttattt taataggcta tgatttgttt attgaaatca 1740 tgtgacatat tgacatgcgc ttctcatgtt ttttgttggc aaggcttcag ggaactgctc 1800 ggttgttgtc caattctttt gcgtcgtcat tgtggcttat gccattttca aagaattgca 1860 agggtgataa cacattctgg acgcattttt ctgggggtgc tgcaaagaaa gataagcgcg 1920 tataccactg tgatgaagag gaatatcaat caaaatattc tggctggccg acaaatatta 1980 ttaacattga aattccttcc actagcggtt agactctgta tatgcaactg taacactaac 2040 aaaagtttca ccaagaatgt tcactctcat atttcgttcc tttgatgtgt atccatcagt 2100 tacagaaaca gctctagtca acatgaccag catggaatgt ggccttccca cccttttgtc .2160 tttcacagcc cgtgaactag cagatgggac tcttttcaaa gcaatagaag actatgaccc 2220 agatagcaag aggatgttac accagttaaa gaagtacgta cctttctttg tgataagaaa 2280 tattgctcat cgatcatcac ttgctggctt cttgtacgtc aaattgtttt gtttaaatct 2340 ctatatcaat tgttcatatg ctttgtcttt cttactataa gaaacaagta taatcagaaa 2400 ccttattatt gattatcagt tctctcctta tattatggaa tgtctttttc gtttacagtt 24S0 atgaatgcaa aagggggtat tttagttgat tgattctctc attctctagt ttgttttgac 2520 taatagcgtc aattttgttt ttctagcaaa tctttgtgaa ttatatataa catgctaact 2580 atacttttca ggttgtatca tgatgaccct gtttttaatc ctctgactcc ttgggagaga .2640 ccacctataa aaaatgtatt ttgcatatat ggtgctcatc taaagacaga ggtatgatgc 2700 attctcaata tcacattatg cgttgacttt gttattatat tccccatttg gtttgcaata 2760 tctttttgaa ttatgattta tcttctccct tgcatcttat gctattaagc gttaaaggta 2820 ctaaacgtat gaagctgtct gtcataggtt ggttattact ttgccccaag tggcaaacct 2880 tatcctgata attggatcat cacggatatc atttatgaaa ctgaaggttc cctcgtgtca 2940 aggtaatttt ccgcaatggc agaagtaaaa caggaaggca aagtcttctg tat-cagtcta 3000 gtggcatgtt atctcagttg cataagcaaa ttattaaaca actaaaattt aagtactttt 3060 ttatcattcc ttttgagctt agtggatgat cagtggctta aagtgggaag aggtgttgca 3120 tgaaacatga cacttgtatc aaagataact agcaaaacaa aactaaccca tttctgaatt 3180 tcatattatt aggagtagtc gtgcttttaa aaaatttgtt ttaagaaacc gaaaaactag 3240 ttcatatctt gattgtgcaa tatctgcagg tctggaactg tggttgatgg gaacgctgga 3300 cctataactg gggatgagac ggtaagctca gaagttggtt ttgaaattat cttcttgcaa 3360 actactgaag actaagataa tacttgcttc tggaacactg cttgctatgt tctctagtac 3420 actgcaatat tgactctccg ctacttttat tgattatgaa attgatctct tataggtacc 3480 ctatcattca ctctcttggt gcaagaattg gctcggacct aaagttaaca taacaatggc 3540 tccccaggta ctctttttta gttcctcacc ttatatagat caaactttaa gtgtactttt 3600 ccggccatgt gttgattt-ac ctccaatttg ttctttctaa aaatcatata tctctgtact 3660 cctcaagaac ttgtactaat ctaaacgaga ttctcattgg gaaaataaaa caacagccag 3720 aacacgatgg aagcgacgta catgtggaac taaatgttga tcatgagcat gggtcagaca 3780 tcatagctaa catgacaaaa gcaccaaggg ttaagtacat aaccttttat gaagactctg 3840 agagcattcc ggggaagaga accgcagtct gggagcttga taaaagtggg tattaa 3896 <210> 12 <211> 709 <212> ADNc <213> Lycopersicon esculentum <400> 12 ctggggccaa aagtgaacat aacaaggaca ccacagtcag agcatgatgt tcagatgtac 60 aagtgcatct aaatatagag catcaacatg gtgaagatat cattcccaat atgacaaagt 120 tacctacaat gaagtacata acctattatg aggattctga aagttttcca gggacaagaa 180 cagcagtttg ggagcttgat aaagcaaatc acaggaacat tgtcagatct ccagctttga 240 tgcgggagct gtggcttgag atgtggcatg atattcatcc tgataaaaag tccaagtttg 300 ttacaaaagg tggtgtctga tcctcactat tttcttctat aaatgtttga gtttgtattg 360 acattgtaag tattgcaaca aaaagcaaag cgtgggcctc tgagggatga ggactgctat 420 tgggattacg ggaaagctcg atgtgcatgg. gctgaacatt gtgaatacag gttagaatat 480 tcaaattata ttttgcaaaa tattctcttt ttgtgtattt aggccacctt tccccggtca 540 caacgatgca gatatgtatt cggggatgtt cacctgggac agagttgcag attgaagagt 600 tctacatctc acatcctgtc acactatgtg tgatatttaa gaaactttgt ttggcggaac 660 aacaagtttg cacaaacatt tgaagaagaa agcgaaatga ttcagagag 709 <210> 13 <211> 623 <212> PRT <213> Schizosaccharomyces ponibe <400> 13 Met Ala Ser Ser Lys Lys Ser Lys Thr His Lys Lys Lys Lys Glu Val 1 5 10 15 Lys Ser Pro lie Asp Leu Pro Asn Ser Lys Lys Pro Thr Arg Ala Leu 20 25 30 Ser Glu Gln Pro Ser Ala Ser Glu Thr Gln Ser Val Ser Asn Lys Ser 35 40 45 Arg Lys Ser Lys Phe Gly Lys Arg Leu Asn Phe lie Leu Gly Ala lie 50 55 60 Leu Gly lie Cys Gly Ala Phe Phe Phe Ala Val Gly Asp Asp Asn Ala 65 70 75 80 Val Phe Asp Pro Ala Thr Leu Asp Lys Phe Gly Asn Mee Leu Gly Ser 85 90 95 Ser Asp Leu Phe Asp Asp lie Lys Gly Tyr Leu Ser Tyr Asn Val Phe 100 105 110 Lys Asp Ala Pro Phe Thr Thr Asp Lys Pro Ser Gln Ser Pro Ser Gly 115 120 125 Asn Glu Val Gln Val Gly Leu Asp Met Tyr Asn Glu Gly Tyr Arg Ser 130 135 140 Asp His Pro Val lie Met Val Pro Gly Val lie Ser Ser Gly Leu Glu 145 150 155 160 Ser Trp Ser Phe Asn Asn Cys Ser lie Pro Tyr Phe Arg Lys Arg Leu 165 170 175 Trp Gly Ser Trp Ser Met Leu Lys Ala Met Phe Leu Asp Lys Gln Cys 180 185 190 Trp Leu Glu His Leu Met Leu Asp Lys Lys Thr Gly Leu Asp Pro Lys 195 200 205 Gly lie Lys Leu Arg Ala Ala Gln Gly Phe Glu Ala Ala Asp Phe Phe 210 215 220 He Thr Gly Tyr Trp lie Trp Ser Lys Val lie Glu Asn Leu Ala Ala 225 230 235 240 lie Gly Tyr Glu Pro Asn Asn Met Leu Ser Ala Ser Tyr Asp Trp Arg 245 250 255 Leu Ser Tyr Ala Asn Leu Glu Glu Arg Asp Lys Tyr Ehe Ser Lys Leu 260 265 270 Lys Met Phe lie Glu Tyr Ser Asn lie Val His Lys Lys Lys Val Val 275 280 285 Leu lie Ser His Ser Met Gly Ser Gln Val Thr Tyr Tyr Phe Phe Lys 290 295 300 Trp Val Glu Ala Glu Gly Tyr Gly Asn Gly Gly Pro Thr Trp Val Asn 305 310 315 320 Asp His lie Glu Ala Phe lie Asn lie Ser Gly Ser Leu lie Gly Ala 325 330 335 Pro Lys Thr Val Ala Ala Leu Leü Ser Gly Glu Met Lys Asp Thr Gly 340 345 350 lie Val lie Thr Leu Asn lie Leu Glu Lys Phe Phe Ser Arg Ser Glu 355 360 365 Arg Ala Met Met Val Arg Thr Met Gly Gly Val Ser Ser Met Leu Pro 370 375 380 Lys Gly Gly Asp Val Ala Pro Asp Asp "Leu Asn Gln Thr Asn Phe Ser 385 390 395 400 Asn Gly Ala lie lie Arg Tyr Arg Glu Asp lie Asp Lys Asp His Asp 405 410 415 Glu Phe Asp lie Asp Asp Ala Leu Gln Phe Leu Lys Asn Val Thr Asp 420 425 430 Asp Asp Phe Lys Val Met Leu Ala Lys Asn Tyr Ser His Gly Leu Ala 435 440 445 Trp Thr Glu Lys Glu Val Leu Lys Asn Asn Glu Met Pro Ser Lys Trp 450 455 460 lie Asn Pro Leu Glu Thr Ser Leu Pro Tyr Ala Pro Asp Met Lys lie 465 470 475 480 Tyr Cys Val His Gly Val Gly Lys Pro Thr Glu Arg Gly Tyr Tyr Tyr 485 490 495 Thr Asn Asn Pro Glu Gly Gln Pro Val lie Asp Ser Ser Val Asn Asp 500 505 510 Gly Thr Lys Val -Glu Asn Gly lie Val Met Asp Asp Gly Asp Gly Thr 515 520 525 Leu Pro lie Leu Ala Leu Gly Leu Val Cys As Lys Val Trp Gln Thr 530 535 540 Lys Arg Phe Asn Pro Ala Asn Thr Ser lie Thr Asn Tyr Glu lie Lys 545 550 555 560 His Glu Pro Ala Ala Phe Asp Leu Arg Gly Gly Pro Arg Ser Ala Glu 565 570 575 His Val Asp lie Leu Gly His "Ser Glu Leu Asn Glu lie lie Leu Lys 580 585 590 Val Ser Ser Gly His Gly Asp Ser Val Pro Asn Arg Tyr lie Ser Asp 595 600 605 lie Gln Glu lie lie Asn Glu lie Asn Leu Asp Lys Pro Arg Asn 610 615 620 <21?> 14 <211> 432 <212> PRT <213> Arabidopsis thaliana <400> 14 Met Lys Lys lie Ser Ser His Tyr Ser Val Val lie Ala lie Leu Val 1 5 10 15 Val Val Thr Met Thr Ser Met Cys Gln Ala Val Gly Ser Asn Val Tyr 20 25 30 Pro Leu lie Leu Val Pro Gly Asn Gly Gly Asn Gln Leu Glu Val Arg 35 40 45 Leu Asp Arg Glu Tyr Lys Pro Ser Ser Val Trp Cys Ser Ser Trp Leu 50 55 60 Tyr Pro lie His Lys Lys Ser Gly Gly Trp Phe Arg Leu Trp Phe Asp S5 70 75 80 Ala Ala Val Leu Leu Ser Pro Phe Thr Arg Cys Phe Ser Asp Arg Met 85 90 95 Met Leu Tyr Tyr Asp Pro Asp Leu Asp Asp Tyr Gln Asn Ala Pro Gly 100 105 110 Val Gln Thr Arg Val Pro His Phe Gly Ser Thr Lys Ser Leu Leu Tyr 115 120 125 Leu Asp Pro Arg Leu Arg Asp Ala Thr Ser Tyr Met Glu His Leu Val 130 135 140 Lys Ala Leu Glu Lys Lys Cys Gly Tyr Val Asn Asp Gln Thr lie Leu 145 150 155 160 Gly Ala Pro Tyr Asp Phe Arg Tyr Gly Leu Ala Ala Ser Gly His Pro 165 170 175 Ser Arg Val Ala Ser Gln Phe Leu Gln Asp Leu Lys Gln Leu Val Glu 180 185 190 Lys Thr Ser Ser Glu Asn Glu Gly Lys Pro Val lie Leu Leu Ser His 195 200 205 Ser Leu Gly Gly Leu Phe Val Leu His Phe Leu Asn Arg Thr Thr Pro 210 215 220 Ser Trp Arg Arg Lys Tyr lie Lys His Phe Val Ala Leu Ala Ala Pro 225 230 235 240 Trp Gly Gly Thr lie Ser Gln Met Lys Thr Phe Ala Ser Gly Asn Thr 245 250 255 Leu Gly Val Pro Leu Val Asn Pro Leu Leu Val Arg Arg His Gln Arg 260 265 270 Thr Ser Glu Ser Asn Gln Trp Leu Leu Pro Ser Thr Lys Val Phe His 275 280 285 Asp Arg Thr Lys Pro Leu Val Val Thr Pro Gln Val Asn Tyr Thr Ala 290 295 300 Tyr Glu Met Asp Arg Phe Phe Ala Asp lie' Gly Phe Ser Gln Gly Val 305 310 315 320 Val Pro Tyr Lys Thr Arg Val Leu Pro Leu Thr Glu Glu Leu Mét Thr 325 330 335 Pro Gly Val Pro Val Thr Cys lie Tyr Gly Arg Gly Val Asp Thr Pro 340 345 350 Glu Val Leu Met Tyr Gly Lys Gly Gly Phe Asp Lys Gln Pro Glu lie 355 360 365 Lys Tyr Gly Asp Gly Asp Gly Thr Val Asn Leu Ala Ser Leu Ala Ala 370 375 380 Leu Lys Val Asp Ser Leu Asn Thr Val Glu lie Asp Gly Val Ser His 385 390 395 400 Thr Ser lie Leu Lys Asp Glu lie Ala Leu Lys Glu lie Met Lys Gln 405 410 415 Ser lie lie Asn Tyr Glu Leu Ala Asn Val Asn Ala Val Asn Glu 420 425 430 <210> 15 <211> 552 <212> P T <213> Arabidopsis thaliana <400> 15 Met Gly Ala Asn Ser Lys Ser Val Thr Ala Ser Phe Thr Val lie Ala 1 5 10 15 Val Phe Phe Leu lie Cys Gly Gly Arg Thr Ala Val Glu Asp Glu Thr 20 25 30 Glu Phe His Gly Asp Tyr Ser Lys Leu Ser Gly lie lie lie Pro Gly 35 40 45 Phe Ala Ser Thr Gln Leu Arg Ala Trp Ser lie Leu Asp Cys Pro Tyr 50 55 60 Thr Pro Leu Asp Phe Asn Pro Leu Asp Leu Val Trp Leu Asp Thr Thr 65 70 75 80 Lys Leu Leu Ser Ala Val Asn Cy.s Trp Phe Lys Cys Met Val Leu Asp 85 90 95 Pro Tyr Asn Gln Thr Asp His Pro Glu Cys Lys Ser Arg Pro Asp Ser 100 105 110 Gly Leu Ser Ala lie Thr Glu Leu Asp Pro Gly Tyr lie Thr Gly Pro 115 12Q 125 Leu Ser Thr Val Trp Lys Glu Trp Leu Lys Trp Cys Val Glu Phe Gly 130 135 140 lie Glu Ala Asn Ala lie Val Ala Val Pro Tyr Asp Trp Arg Leu Ser 145 150 155 160 Pro Thr Lys Leu Glu Glu Arg Asp Leu Tyr Phe His Lys Leu Lys Leu 165 170 175 Thr Phe Glu Thr Ala Leu Lys Leu Arg Gly Gly Pro Ser lie Val Phe 180 185 190 Ala His Ser Met Gly Asn Asn al Phe Arg Tyr Phe Leu Glu Trp Leu 195 200 205 Arg Leu Glu lie Ala Pro Lys His Tyr Leu Lys Trp Leu Asp Gl His 210 215 220 lie His Ala Tyr Phe Ala Val Gly Ala Pro Leu Leu Gly Ser Val Glu 225 230 235 240 Ala lie Lys Ser Thr Leu Ser Gly Val Thr Phe Gly Leu Pro Val Ser 245 250 255 Glu Gly Thr Ala Arg Leu Leu Ser Asn Ser Phe Ala Ser Ser Leu Trp 260 265 270 Leu Met Pro Phe Ser Lys Asn Cys Lys Gly Asp Asn Thr Phe Trp Thr 275 280 285 His Phe Ser Gly Gly Ala Ala Lys Lys Asp Lys Arg Val Tyr His Cys 290 295 300 Asp Glu Glu Glu Tyr Gln Ser Lys Tyr Ser' Gly Trp Pro Thr Asn lie 305 310 315 320 lie Asn lie Glu lie Pro Ser Thr Ser Ala Arg Glu Leu Ala Asp Gly 325 330 335 Thr Leu Phe Lys Ala lie Glu Asp Tyr Asp Pro Asp Ser Lys Arg Met 340 345 350 Leu His Gln Leu Lys Lys Tyr Val Pro Phe Phe Val lie Arg Asn lie 355 360 365 Ala His Arg Ser Ser Leu Ala Gly Phe Leu Leu Tyr His Asp Asp Pro 370 375 380 Val Phe Asn Pro Leu Thr Pro Trp Glu Arg Pro Pro lie Lys Asn Val 385 390 395 400 Phe Cys lie Tyr Gly Ala His Leu Lys Thr Glu Val Gly Tyr Tyr Phe 405 410 415 Ala Pro Ser Gly Lys Pro Tyr Pro Asp Asn Trp lie lie Thr Asp lie 420 425 430 lie Tyr Glu Thr Glu Gly Ser Leu Val Ser Arg Ser Gly Thr Val Val 435 440 445 Asp Gly Asn Ala Gly Pro lie Thr Gly Asp Glu Thr Val Pro Tyr His 450 455 460 Ser Leu Ser Trp Cys Lys Asn Trp Leu Gly Pro Lys Val Asn lie Thr 465 470 475 480 Met Ala Pro Gln lie Leu lie Gly Lys lie Lys Gln Gln Pro Glu His 485 490 495 Asp Gly Ser Asp Val His Val Glu Leu Asn Val Asp His Glu His Gly 500 505 510 Ser Asp lie lie Ala Asn Met Thr Lys Ala Pro Arg Val Lys Tyr lie 515 520 525 Thr Phe Tyr Glu Asp Ser Glu Ser lie Pro Gly Lys Arg Thr Ala Val 530 535 540 Trp Glu Leu Asp Lys Ser Gly Tyr 545 550 <210> 16 <211> 661 <212> PRT <213> Saccharomyces cerevisiae <400> 16 Met Gly Thr Leu Phe Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 15 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 Asn His lie His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 40 45 lie Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 lie Phe lie Leu Gly Ala Phe Leu Gly Val Leu Leu Pro Phe Ser Phe 85 90 95 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 105 110 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 115 120 125 Leu Pro Gln Gly lie Ser Ser Phe lie Asp Asp lie Gln Ala Gly Asn 130 135 140 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 145 150 155 160 Lys Gln Leu Leu Arg Asp Tyr Asn lie Glu Ala Lys His Pro Val Val 165 170 175 Met Val Pro Gly Val lie Ser Thr Gly lie Glu Ser Trp Gly Val lie 180 185 190 Gly Asp Asp Glu Cys Asp Ser Ser Ala His Phe Arg Lys Arg Leu Trp 195 200 205 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 Leu Lys His Val Met Leu Asp Pro Glu Thr Gly Leu Asp Pro Pro Asn 225 230 235 240 Phe Thr Leu Arg Ala Ala Gln Gly Phe Glu Ser Thr Asp Tyr Phe lie 245 250 255 Ala Gly Tyr Trp lie Trp Asn Lys Val Phe Gln Asn Leu Gly Val lie 260 265 270 Gly Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 Glu Gln lie Glu Leu Phe His Gln Leu Ser Gly Glu Lys Val Cys Leu 305 310 315 320 lie Gly His Ser Met Gly Ser Gln lie lie Phe Tyr Phe Met Lys Trp 325 330 335 Val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 Asn Glu His lie Asp Ser Phe lie Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 Ala Pro Lys Ala Val Pro Ala Leu lie Ser Gly Glu Met Lys Asp Thr 370 375 380 lie Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 390 395 400 Arg lie Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly lie Pro Ser 405 410 415 Met Leu Pro Lys Gly Glu Glu Val lie Trp Gly Asp Met Lys Ser Ser 42C 425 430 Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe lie 435 440 445 Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 Lys Asp Ala lie Asn Met Thr Leu Ser lie Ser Pro Glu Trp Leu Gln 465 470 475 480 Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 Glu Leu Arg Lys Asn Glu Leu "His His Lys His Trp Ser Asn Pro Met 500 505 510 Glu Val Pro Leu Pro Glu Ala Pro His Met Lys lie Tyr Cys lie Tyr 515 520 525 Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 Asp Ser Ser Ala Leu Asn Leu Thr lie Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 lie Asn Val Thr lie Val Glu Met Lys His Gln Pro Asp Arg Phe Asp 595 600 605 Tle Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp lie Leu Gly Ser 610 615 620 Ala Glu Leu Asn Asp Tyr lie Leu Lys lie'Ala Ser Gly Asn Gly Asp 625 630 635 640 Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 Mee Pro Phe Pro Met 660 <210> 17 <211> 38'7 <212> PRT <213> Arabidopsis thaliana <400> 17 Val Gly Ser Asn Val Tyr Pro Leu lie Leu Val Pro Gly Asn Gly Gly 1 5 10 15 Asn Gln Leu Glu Val Arg Leu Asp Arg Glu Tyr Lys Pro Ser Ser Val 20 25 30 Trp Cys Ser Ser Trp Leu Tyr Pro lie His Lys Lys Ser Gly Gly Trp 35 40 45 Phe Arg Leu Trp Phe Asp Ala Ala Val Leu Leu Ser Pro Phe Thr Arg 50 55 60 Cys Phe Ser Asp Arg Met et Leu Tyr Tyr Asp Pro Asp Leu Asp Asp 65 70 75 80 Tyr Gln Asn Ala Pro Gly Val Gln Thr Arg Val Pro His Phe Gly Ser 85 90 95 Thr Lys Ser Leu Leu Tyr Leu Asp Pro Arg Leu Arg Asp Ala Thr Ser 100 105 110 Tyr Met Glu His Leu Val Lys Ala Leu Glu Lys Lys Cys Gly Tyr Val 115 120 125 Asn Asp Gln Thr lie Leu Gly Ala Pro Tyr Asp Phe Arg Tyr Gly Leu 130 135 140 Ala Ala Ser Gly His Pro Ser Arg Val Ala Ser Gln Phe Leu Gln Asp 145 150 155 160 Leu Lys Gln Leu Val Glu Lys Thr Ser Ser Glu Asn Glu Gly Lys Pro 165 170. 175 Val lie Leu Leu Ser His Ser Leu Gly Gly Leu Phe Val Leu His Phe 180 185 . 190 Leu Asn -Arg Thr Thr Pro Ser Trp Arg Arg Lys Tyr lie .Lys His Phe 195 200 205 Val Ala Leu Ala Ala Pro Trp Gly Gly Thr lie Ser Gln Met Lys Thr 210 215 220 Phe Ala Ser Gly Asn Thr Leu Gly Val Pro Leu Val Asn Pro Leu Leu 225 230 235 240 Val Arg Arg His Gln Arg Thr Ser Glu Ser Asn Gln Trp Leu Leu Pro 245 250 255 Ser Thr 'Lys Val Phe His Asp Arg Thr Lys Pro Leu Val Val Thr Pro 260 265 270 Gln Val Asn Tyr Thr Ala Tyr Glu Met Asp Arg Phe Phe Ala Asp lie 275 280 285 Gly Phe Ser Gln Gly Val Val Pro Tyr Lys Thr Arg Val Leu Pro Leu 290 295 300 Thr Glu Glu Leu Met Thr Pro Gly Val Pro Val Thr Cys lie Tyr Gly 305 310 315 320 Arg Gly Val Asp Thr Pro Glu Val Leu Met Tyr Gly Lys Gly Gly Phe 325 330 335 Asp Lys Gln Pro Glu lie Lys Tyr Gly Asp Gly Asp Gly Thr Val Asn 340 345 350 Leu Ala Ser Leu Ala Ala Leu Lys Val Asp Ser Leu Asn Thr Val Glu 355 360 365 lie Asp Gly Val Ser His Thr Ser lie Leu Lys Asp Glu lie Ala Leu 370 375 380 Lys Glu lie 385 <210> 18 <211> 389 <212> PRT <213> Ara idopsis thaliana <400> 18 Leu Lys Lys Glu Gly Leu Lys Ala Lys His Pro Val Val Phe lie Pro 1 5 10 15 Gly lie Val "Thr Gly Gly Leu Glu Leu Trp Glu Gly Lys Gln Cys Ala 20 25 30 Asp Gly Leu Phe Arg Lys Arg Leu Trp Gly Gly Thr Phe Leu Cys Trp 35 40 45 Val Glu His Met Ser Leu Asp Asn Glu Thr Gly Leu Asp Pro Ala Gly 50 55. 60 lie Arg Val Arg Ala Val Ser Gly Leu Val Ala Ala Asp Tyr Phe Ala 65 70 75 80 Pro Gly Tyr Phe Val Trp Ala Val Leu lie Ala Asn Leu Ala -His lie 85 90 95 Gly Tyr Glu Glu Lys Asn Met Tyr Met Ala Ala Tyr Asp Trp Arg Leu 100 105 110 Ser Phe Gln Asn Thr Glu Arg Asp Gln Thr Leu Ser Arg Met Lys Ser 115 120 125 Asn lie Glu Leu Met Val Ser Thr Asn Gly Gly Lys Lys Ala Val lie 130 135 140 Val Pro His Ser Met Gly Val Leu Tyr Phe Leu His Phe Met Lys Trp 145 150 155 160 Val Glu Ala Pro Ala Pro Leu Gly Gly Gly Gly Gly Pro Asp Trp Cys 165 170 175 Ala Lys Tyr lie Lys Ala Val Met Asn lie Gly Gly Pro Phe Leu Gly 180 185 190 Val Pro Lys Ala Val Ala Gly Leu Phe Ser Ala Glu Ala Lys Asp Met 195 200 205 Arg Met Thr Arg Thr Trp Asp Ser Thr Met Ser Met Leu Pro Lys Gly 210 215 220 Gly Asp Thr lie Trp Gly Gly Leu Asp Trp Ser Pro Glu Leu Pro Asn 225 230 235 240 Ala Pro Glu Met Glu lie Tyr Ser Leu Tyr Gly Val Gly lie Pro Thr 245 250 255 Glu Arg Ala Tyr Val Tyr Lys Leu Asn Gln Ser Pro Asp Ser Cys lie 260 265 270 Pro Phe Gln lie Phe Thr Ser Ala His Glu Glu Asp Glu Asp Ser Cys 275 280 285 Leu Lys Ala Gly Val Tyr Asn Val Asp Gly Asp Glu Thr Val Pro Val 290 295 300 Leu Ser Ala Gly Tyr Met Cys Ala Lys Ala Trp Arg Gly Lys "Thr Arg 305 310 315 320 Phe Asn Pro Ser Gly lie Lys Thr Tyr lie Arg Glu Tyr Asn His Ser 325 330 335 Pro Pro Ala Asn Leu Leu Glu Gly Arg Gly Thr Gln Ser Gly Ala His 340 345 350 Val Asp lie Met Gly Asn Phe Ala Leu lie Glu Asp lie Met Arg Val 355 360 365 Ala Ala Gly Gly Asn Gly Ser Asp lie Gly His Asp Gln Val His Ser 370 375 380 Gly lie Phe Glu Trp 385 <210> 19 <211> 1986 <212> AD <213> Saccharomyces cerevisiae <220> <221> CDS <222> (1) .. (1983) <400> 19 atg ggc aca ctg ttt cga aga aat gtc cag aac caa aag agt gat tct 48 Met Gly Thr Leu Phe Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 15 gat gaa aac aat aaa ggg ggt tct gtt cat aac aag cga gag age aga 96 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 aac cae att cat cat caa cag gga tta ggc cat aag aga aga agg ggt 144 Asn His lie His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 40 45 att agt ggc agt gca aaa aga aat gag cgt ggc aaa gat ttc gac agg 192 lie Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 aaa aga gac ggg aac ggt aga aaa cgt tgg aga gat tec aga aga ctg 240 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 att ttc att ctt ggt gca ttc tta ggt gta ctt ttg ceg ttt age ttt 288 lie Phe lie Leu Gly Ala Phe Leu Gly Val Leu Leu Pro Phe Ser Phe 85 90 95 ggc gct tat cat gtt cat aat age gat age gac ttg ttt gac aac ttt 336 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 105 110 gta aat ttt gat tea ctt aaa gtg tat ttg gat gat tgg aaa gat gtt 384 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 115 120 125 etc cea caa ggt ata agt teg ttt att gat gat att cag gct ggt aac 432 Leu Pro Gln Gly lie Ser Ser Phe lie Asp Asp lie Gln Ala Gly Asn 130 135 140 tac tec aca tct tct tta gat gat etc agt gaa aat ttt gee gtt ggt 480 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 145 150 155 160 aaa caa etc tta cgt gat tat aat ate gag gee aaá cat ect gtt gta 528 Lys Gln Leu Leu Arg Asp Tyr Asn lie GLu Ala Lys His Pro Val Val 165 170 175 atg gtt -ect ggt gtc att tct acg gga att gaa age tgg gga gtt att 576 Met Val Pro Gly Val lie Ser Thr Gly lie Glu Ser Trp Gly Val lie 180 185 190 gga gac gat gag tgc gat agt tct gcg cat ttt cgt aaa cgg ctg tgg 624 Gly Asp Asp Glu Cys Asp Ser Ser Ala His Phe Arg Lys Arg Leu Trp 195 200 205 gga agt ttt tac atg ctg aga acá atg gtt atg gat aaa gtt tgt tgg 672 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 ttg aaa cat gta atg tta gat cct gaa ac ggt ctg gac cea ceg aac 720 Leu Lys His Val Met Leu Asp Pro Glu Thr. Gly Leu Asp Pro Pro Asn 225 230 235 240 ttt acg cta cgt gca gca cag ggc ttc gaa tea act gat tat ttc ate 768 Phe Thr Leu Arg Ala Ala Gln Gly Phe Glu Ser Thr Asp Tyr Phe lie 245 250 255 gca ggg tat tgg att tgg aac aaa gtt ttc caá aat ctg gga gta att 816 Ala Gly Tyr Trp lie Trp Asn Lys Val Phe Gln Asn Leu Gly Val lie 260 265 270 ggc tat gaa ecc aat aaa atg acg agt gct gcg tat' gat tgg agg ctt 864 Gly Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 gca tat tta gat cta gaa aga cgc gat agg tac ttt acg aag cta aag 912 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 gaa caá ate gaa ctg ttt cat caá ttg agt ggt gaa aaa gtt tgt tta 960 Glu Gln lie Glu Leu Phe His Gln Leu Ser Gly Glu Lys Val Cys Leu 305 310 315 320 att gga cat tct atg ggt tct cag att ate . ttt tac ttt atg aaa tgg 1008 lie Gly His Ser Met Gly Ser Gln lie lie Phe Tyr Phe Met Lys Trp 325 330 335 gtc gag gct gaa ggc cct ctt tac ggt aat ggt ggt cgt ggc tgg gtt 1056 val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 aac gaa cac ata gat tea ttc att aat gca gca ggg acg ctt ctg ggc 1104 Asn Glu His lie Asp Ser Phe lie Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 gct cea aag gca gtt cea gct cta att agt ggt gaa atg aaa gat acc 1152 Ala Pro Lys Ala Val Pro Ala Leu lie Ser Gly Glu Met Lys Asp Thr 370 375 380 att caá tta aat acg tta gee atg tat ggt ttg gaa aag ttc ttc tea 1200 lie Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 390 395 400 aga att gag aga gta aaa atg tta caá acg tgg ggt ggt ata cea tea 1248 Arg lie Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly lie Pro Ser 405 410 415 atg cta cea aag gga gaa gag gtc att tgg ggg- gat atg aag tea tct 1296 Met Leu Pro Lys Gly Glu Glu Val lie Trp Gly Asp Met Lys Ser Ser 420 425 430 tea gag gat gca ttg aat aac aac act gac acá tac ggc aat ttc att Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe lie 435 440 445 cga ttt gaa agg aat acg age gat gct ttc aac aaa aat ttg acá atg Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 aaa gac gce att aac atg acá tta tcg ata tea cct gaa tgg ctc ca Lys Asp Ala lie Asn Met Thr Leu Ser lie Ser Pro Glu Trp Leu Gln 465 470 475 480 aga aga gta cat gag cag tac tcg ttc ggc tat tcc aag aat gaa gaa Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 gag tta aga aaa aat gag cta cae cae aag cae tgg tcg aat cea acg Glu Leu Arg Lys Asn Glu Leu His His Lys His Trp Ser Asn Pro Met 500 505 510 gaa gta cea ctt cea gaa gct ecc cae atg aaa ate tat tgt ata tac Glu Val Pro Leu Pro Glu Ala Pro His Met Lys lie Tyr Cys lie Tyr 515 520 525 ggg gtg aac aac cea act gaa agg gca tat gta tat aag gaa gag gat Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 gac tcc tet gct ctg aat ttg acc ate gac tac gaa age aag caá cct Asp Ser Ser Ala Leu Asn Leu Thr lie Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 gta ttc ctc acc gag ggg gac gga acc gtt ceg ctc gtg gcg cat tea Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 atg tgt cae aaa tgg gee cag ggt gct tea ceg tac aac cct gee gga Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 att aac gtt act att gtg gaa atg aaa cae cag cea gat cga ttt gat lie Asn Val Thr lie Val Glu Met Lys His Gln Pro Asp Arg Phe Asp 595 600 605 ata cgt ggt gga gca aaa age gee gaa cae gta gac ate ctc ggc age lie Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp lie Leu Gly Ser 610 615 620 gcg gag ttg aac gat tac ate ttg aaa att gca age ggt aat ggc gat Ala Glu Leu Asn Asp Tyr lie Leu Lys lie Ala Ser Gly Asn Gly Asp 625 630 635 640 ctc gtc gag cea cgc caá ttg tet aat ttg age cag tgg gtt tet cag Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 atg ecc ttc cea atg taa Met Pro Phe Pro Met 660 <210> 20 <211> 661 <212> PRT <213> Saccharorayces cerevisiae <400> 20 Mee Gly Thr Leu Phe Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 15 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 Asn His lie His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 -40 45 lie Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 lie Phe lie Leu Gly Ala Phe Leu Gly Val Leu Leu Pro Phe Ser Phe 85 90 95 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 105 110 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 115 120 125 Leu Pro Gln Gly lie Ser Ser Phe lie Asp Asp lie Gln Ala Gly Asn 130 135 140 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 145 150 155 160 Lys Gln Leu Leu Arg Asp Tyr Asn lie Glu Ala Lys His Pro Val Val 165 170 175 Met Val Pro Gly Val lie Ser Thr Gly lie Glu Ser Trp Gly Val lie 180 185 190 Gly Asp Asp Glu Cys Asp Ser Ser Ala His Phe Arg Lys Arg Leu Trp 195 200 205 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 . Leu Lys His Val Met Leu Asp Pro Glu Thr Gly Leu Asp Pro Pro Asn 225 230 235 240 Phe Thr Leu Arg Ala "Ala Gln Gly Phe Glu Ser Thr Asp Tyr Phe lie 245 250 255 Ala Gly Tyr Trp lie Trp Asn Lys Val Phe Gln Asn Leu Gly Val .He 260 265 270 Gly . Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 Glu Gln lie Glu Leu Phe His Gln Leu Ser' Gly Glu Lys Val Cys Leu 305 310 315 320 lie Gly His Ser Met Gly Ser Gln lie lie Phe Tyr Phe Met Lys Trp 325 330 335 Val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 Asn Glu His lie Asp Ser Phe lie Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 Ala Pro Lys Ala Val Pro Ala Leu lie Ser Gly Glu Met Lys Asp Thr 370 375 380 lie Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 390 395 400 Arg lie Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly lie Pro Ser 405 410 415 Met Leu Pro Lys Gly Glu Glu Val lie Trp Gly Asp Met Lys Ser Ser 420 425 430 Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe lie 435 440 445 Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 Lys Asp Ala lie Asn Met Thr Leu Ser lie Ser Pro Glu Trp Leu Gln 465 470 475 480 Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 Glu Leu Arg Lys Asn Glu Leu His His Lys His Trp Ser Asn Pro Met 500 505 510 Glu Val Pro Leu Pro Glu Ala Pro His Met Lys lie Tyr Cys lie Tyr 515 520 525 Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 Asp Ser Ser Ala Leu Asn Leu Thr lie Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 lie Asn Val Thr lie Val Glu Met Lys His Gln Pro Asp Arg Phe Asp 595 600 605 lie Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp lie Leu Gly Ser 610 615 620 Ala Glu Leu Asn Asp Tyr lie Leu Lys lie Ala Ser Gly Asn Gly Asp 625 630 635 640 Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 Met Pro Phe Pro Met 660 <210> 21 <211> 1986 <212> ADN <213> Saccharomyces cerevisiae <220> <221> CDS <222> (1) .. (1983) <400> 21 atg ggc acá ctg ttt cga aga aat gtc cag aac caa aag agt gat tct 48 Met Gly Thr Leu Phe Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 " 15 gac gaa aac aat aaa ggg ggt tct gtt cat aac aag cga gag age aga 96 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 aac cae att cat cat caa cag gga tta ggc cat aag aga aga agg ggt 144 Asn His lie His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 40 45 att agt ggc agt gca aaa aga aat gag cgt ggc aaa gat ttc gac agg 192 lie Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 aaa aga gac ggg aac ggt aga aaa cgt tgg aga gat tec aga aga ctg 240 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 att tt att ctt ggt gca ttc tta ggt gta tt ttg ceg ttt age ttt 288 lie Phe íle Leu Gly Ala Phe Leu Gly Val Leu Leu Pro Phe Ser Phe 85 90 95 ggc gct tat cat gtt cat aat age gat age gac ttg ttt gac aac ttt 336 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 10.5 . 110 gta aat ttt gat tea ctt aaa gtg tat ttg gat gat tgg aaa gat gtt 384 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 1.15 120 125 etc cea caa ggt ata agt teg ttt att gat gat att cag gct ggt' aac 432 Leu Pro Gln Gly lie Ser Ser Phe lie Asp Asp lie Gln Ala Gly Asn 130 135 140 tac tec acá tct tct tta gat gat etc agt gaa aat ttt gee gtt ggt 480 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 145 150 155 160 aaa caa etc tta cgt gat tat aat ate gag gee aaa cat ect gtt gta 528 Lys Gln Leu Leu Arg Asp Tyr Asn lie Glu Ala Lys His Pro Val Val 165 170 175 atg gtt ect ggt gtc att tct acg gga att gaa age tgg gga gtt att 576 Met val Pro Gly val He Ser Thr Gly lie Glu Ser Trp Gly Val lie 180 185 190 gga gac gat gag tgc gat agt tct gcg cat ttt cgt aaa cgg ctg tgg 624 Gly Asp Asp Glu Cys Asp Ser Ser .Ala His Phe Arg Lys Arg Leu Trp 195 200 205 gga agt ttt tac atg ctg aga acá atg gtt atg gat aaa gtt tgt tgg 672 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 ttg aaa cat gta atg tta gat cct gaa acá ggt ctg gac cea ceg aac 720 Leu Lys His Val Met Leu Asp Pro Glu Thr Gly Leu Asp Pro Pro Asn 225 230 235 240 ttt acg cta cgt gca gca cag ggc ttc gaa tea act gat tat ttc ate 768 Phe Thr Leu Arg Ala Ala Gln Gly Phe Glu Ser Thr ??? Tyr Phe lie 245 250 255 gca ggg tat tgg att tgg aac aaa gtt ttc caá aat ctg gga gta att 816 Ala Gly Tyr Trp lie Trp Asn Lys Val Phe Gln Asn Leu Gly Val lie 260 265 270 ggc tat gaa ecc aat aaa atg acg agt gct gcg tat gat tgg agg ctt 854 10 Gly Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 gca tat tta gat cta gaa aga cgc gat agg tac ttt acg aag c a aag 912 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 gaa caá ate gaa ctg ttt cat caá ttg agt ggt gaa aaa gtt tgt tta 960 Glu Gln lie Glu Leu Phe His Gln Leu Ser Gly Glu Lys Val Cys Leu 305 310 315 320 att gga cat tct atg ggt tct cag att ate ttc tac ttt atg aaa tgg 1008 lie Gly His Ser Met Gly Ser Gln lie He Phe Tyr Phe Met Lys Trp ? n 325 330 335 lo gtc gag gct gaa ggc cct ctt tac ggt aat ggt ggt cgt ggc tgg gtt 1056 Val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 aac gaa cae ata gat tea ttc att aat gca gca ggg acg ctt ctg ggc 1104 Asn Glu His lie Asp Ser Phe lie Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 gct cea aag gca gtt cea gct cta att agt ggt gaa atg aaa gat acc 1152 Ala Pro Lys Ala Val Pro Ala Leu lie Ser Gly Glu Met Lys Asp Thr 370 375 380 0 att ca tta aat acg tta gee atg tat ggt ttg gaa aag ttc ttc tea 1200 lie Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 390 395 400 aga att gag aga gta aaa atg tta caá acg tgg ggt ggt ata cea tea 1248 Arg lie Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly lie Pro Ser 405 410 415 atg cta cea aag gga gaa gag gtc att tgg ggg gat atg aag tea tct 1296 Met Leu Pro Lys Gly Glu Glu Val lie Trp Gly Asp Met Lys Ser Ser 420 425 430 tea gag gat gca ttg aat aac aac act gac acá tac ggc aat ttc att 1344 Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe lie 435 440 445 cga ttt gaa agg aat acg age gat gct ttc aac aaa aat ttg acá atg 1392 Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 aaa gac gee att aac atg acá tta teg ata tea ect gaa tgg etc caá 1440 Lys Asp Ala lie Asn Met Thr Leu Ser lie Ser Pro Glu Trp Leu Gln 465 470 475 480 aga aga gta cat gag cag tac teg ttc ggc tat tec aag aat gaa gaa 1488 Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 gag tta aga aaa aat gag cta cae cae aag cae tgg teg aat cea atg 1536 Glu Leu Arg Lys Asn Glu Leu His His Lys His Trp Ser Asn Pro Met 500 505 510 gaa gta cea ctt cea gaa gct ecc cae atg aaa ate tat tgt ata tac 1584 Glu Val Pro Leu Pro Glu Ala Pro His Met Lys lie Tyr Cys lie Tyr 515 520 525 ggg gtg aac aac cea act gaa agg gca tat gta tat aag gaa gag gat 1632 Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 gac tec tet gct ctg aat ttg acc ate gac tac gaa age aag caá ect 1680 Asp Ser Ser Ala Leu Asn Leu Thr lie Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 gta ttc etc acc gag ggg gac gga acc gtt ceg etc gtg gcg cat tea 1728 Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 atg tgt cae aaa tgg gee cag ggt gct tea ceg tac aac ect gee gga 1775 Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 att aac gtt act att gtg gaa atg aaa cae cag cea gat cga ttt gat 1824 lie Asn Val Thr lie Val Glu Met Lys His Gln Pro Asp Arg Phe Asp 595 600 605 ata cgt ggt gga gca aaa age gee gaa cae gta gac ate etc ggc age 1872 lie Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp lie Leu Gly Ser 610 615 620 gcg gag ttg aac gat tac ate ttg aaa att gca age ggt aat ggc gat 1920 Ala Glu Leu Asn Asp Tyr lie Leu Lys lie Ala Ser Gly Asn Gly Asp 625 630 635 640 etc gtc gag cea cgc caá ttg tet aat ttg age cag tgg gtt tet cag 1968 Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 atg ecc ttc cea atg taa 1986 Met Pro Phe Pro Met 660 <210> 22 <211> 661 <212> PRT <213> Sacc aromyces cerevisiae <400> 22 Met Gly Thr Leu Pae Arg Arg Asn Val Gln Asn Gln Lys Ser Asp Ser 1 5 10 15 Asp Glu Asn Asn Lys Gly Gly Ser Val His Asn Lys Arg Glu Ser Arg 20 25 30 Asn His Il.e His His Gln Gln Gly Leu Gly His Lys Arg Arg Arg Gly 35 40 45 lie Ser Gly Ser Ala Lys Arg Asn Glu Arg Gly Lys Asp Phe Asp Arg 50 55 60 Lys Arg Asp Gly Asn Gly Arg Lys Arg Trp Arg Asp Ser Arg Arg Leu 65 70 75 80 lie Phe lie Leu Gly Ala Phe Leu Gly Val Leu Leu Pro Phe Ser Phe 85 90 95 Gly Ala Tyr His Val His Asn Ser Asp Ser Asp Leu Phe Asp Asn Phe 100 105 110 Val Asn Phe Asp Ser Leu Lys Val Tyr Leu Asp Asp Trp Lys Asp Val 115 120 125 Leu Pro Gln Gly lie Ser Ser Phe lie Asp Asp lie Gln Ala Gly Asn 130 135 140 Tyr Ser Thr Ser Ser Leu Asp Asp Leu Ser Glu Asn Phe Ala Val Gly 145 150 155 160 Lys Gln Leu Leu Arg Asp Tyr Asn lie Glu Al.a Lys His Pro Val Val 165 170 175 Met Val Pro Gly Val lie Ser Thr Gly lie Glu Ser Trp Gly Val lie 180 185 190 Gly Asp Asp Glu Cys Asp Ser Ser Ala His Phe Arg Lys Arg Leu Trp 195 200 205 Gly Ser Phe Tyr Met Leu Arg Thr Met Val Met Asp Lys Val Cys Trp 210 215 220 Leu Lys His Val Met Leu Asp Pro Glu Thr Gly Leu Asp Pro Pro Asn 225 230 235 240 Phe Thr Leu Arg Ala Ala Gln Gly Phe Glu Ser Thr Asp Tyr Phe lie 245 250 255 Ala Gly Tyr Trp lie Trp Asn Lys Val Phe Gln Asn Leu Gly Val lie 260 265 270 Gly Tyr Glu Pro Asn Lys Met Thr Ser Ala Ala Tyr Asp Trp Arg Leu 275 280 285 Ala Tyr Leu Asp Leu Glu Arg Arg Asp Arg Tyr Phe Thr Lys Leu Lys 290 295 300 Glu Gln lie Glu Leu Phe His Gln Leu Ser Gly Glu Lys Val Cys Leu 305 310 315 320 lie Gly His Ser Met Gly Ser Gln lie lie Phe Tyr Phe Met Lys Trp 325 330 335 Val Glu Ala Glu Gly Pro Leu Tyr Gly Asn Gly Gly Arg Gly Trp Val 340 345 350 Asn Glu His lie Asp Ser Phe lie Asn Ala Ala Gly Thr Leu Leu Gly 355 360 365 Ala Pro Lys Ala Val Pro Ala Leu lie Ser Gly Glu Met Lys Asp Thr 370 375 380 lie Gln Leu Asn Thr Leu Ala Met Tyr Gly Leu Glu Lys Phe Phe Ser 385 . 390 395 400 Arg lie Glu Arg Val Lys Met Leu Gln Thr Trp Gly Gly lie Pro Ser 405 410 415 Met Leu Pro Lys Gly Glu Glu Val lie Trp Gly Asp Met Lys Ser Ser 420 425 430 Ser Glu Asp Ala Leu Asn Asn Asn Thr Asp Thr Tyr Gly Asn Phe lie 435 440 445 Arg Phe Glu Arg Asn Thr Ser Asp Ala Phe Asn Lys Asn Leu Thr Met 450 455 460 Lys Asp Ala lie Asn Met Thr Leu Ser lie Ser Pro Glu Trp Leu Gln 465 470 475 480 Arg Arg Val His Glu Gln Tyr Ser Phe Gly Tyr Ser Lys Asn Glu Glu 485 490 495 Glu Leu Arg Lys Asn Glu Leu His His Lys His Trp Ser Asn Pro Met 500 505 510 Glu Val Pro Leu Pro Glu Ala Pro His Met Lys lie Tyr Cys lie Tyr 515 520 525 Gly Val Asn Asn Pro Thr Glu Arg Ala Tyr Val Tyr Lys Glu Glu Asp 530 535 540 Asp Ser Ser Ala Leu Asn Leu Thr lie Asp Tyr Glu Ser Lys Gln Pro 545 550 555 560 Val Phe Leu Thr Glu Gly Asp Gly Thr Val Pro Leu Val Ala His Ser 565 570 575 Met Cys His Lys Trp Ala Gln Gly Ala Ser Pro Tyr Asn Pro Ala Gly 580 585 590 lie Asn Val Thr lie Val Glu Met Lys His Gln Pro Asp Arg Phe Asp 595 600 605 lie Arg Gly Gly Ala Lys Ser Ala Glu His Val Asp lie Leu Gly Ser 610 615 620 Ala Glu Leu Asn Asp Tyr lie Leu Lys lie Ala Ser Gly Asn Gly Asp 625 630 635 640 Leu Val Glu Pro Arg Gln Leu Ser Asn Leu Ser Gln Trp Val Ser Gln 645 650 655 Met Pro Phe Pro Met 660 <210> 23 <211> 2312 <212>^DN genómico <213> Schizosaccharoirtyces pombe <400> 23 atggcgtctt ccaagaagag caaaactcat aagaaaaaga aagaagtcaa atctcctatc 60 gactcaccaa attcaaagaa accaactcgc gctttgagtg agcaaccttc agcgtccgaa 120 acacaatctg tctcaaataa atcaagaaaa tctaaatttg gaaaaagatt gaattttata 180 5 ttgggcgcta ttttgggaat atgcggtgct tttttttccg ctgttggaga cgacaatgct 240 gttttcgacc ctgctacgct agataaattt gggaatatgc taggctcttc agacttgttt 300 gatgacatta aaggatacct atcttataat gtgtttaagg atgcaccttt tactacggac 360 aagcctccgc agtctcctag cggaaatgaa gttcaagttg gtcttgatat gtacaatgag 420 ggatatcgaa gtgaccatcc tgttattatg gttcctggtg ttatcagctc aggattagaa 480 agttggtcgt ttaataattg ctcgactcct tactttagga aacgtctttg gggtagctgg 540 tctatgctga aggcaatgtt ccttgacaag caatgctggc ttgaacattt aatgcttgat 600 aaaaaaaccg gcttggatcc gaagggaatt aagctgcgag cagctcaggg gtttgaagca 660 gccgattttt ttatcacggg ctattggatt tggagtaaag taattgaaaa ccttgctgca 720 attggttatg agcctaataa catgtcaagt gcttcttacg attggcggtt atcatatgca 780 aatttagagg aacgtgataa atatttttca aagttaaaaa tgttcattga gtacagcaac 840 attgtacata agaaaaaggt agtgttgatt tctcactcca tgggttcaca ggttacgtac 900 -J^Q tactttttta agtgggttga agctgagggc tacggaaatg gtggaccgac ttgggttaac 960 gatcatattg aagcatttat aaatgtgagt ctcgatggtt gtttgactac gtttctaact 1020 tttgaataga tatcgggatc tttgattgga gcacccaaaa cagtggcagc gcttttatcg 1080 ggtgaaatga aagatacagg tattgtaatt acattaaaca tgttaatatt taatttttgc 1140 taaccgtttt aagctcaatt gaatcagttt tcggtctacg ggtaagcaat aaattgttga 1200 gatttgttac taatttactg tttagtttgg aaaaattttt ttcccgttct gaggtatatt 1260 caaaaataca. aatgtgctct actttttcta acttttaata gagagccatg atggttcgca 1320 ctatgggagg agttagttct atgcttccta aaggaggcga tgttgtatgg ggaaatgcca 1380 gttgggtaag aaatatgtgc tgttaattt.t ttattaatat ttaggctcca gatgatctta 1440 atcaaacaaa tttttccaat ggtgcaatta ttcgatatag agaagacatt gataaggacc 1500 acgatgaatt tgacatagat gatgcattac aatttttaaa aaatgttaca gatgacgatt 1560 ttaaagtcat gctagcgaaa aattattccc acggtcttgc ttggactgaa aaagaagtgt 1620 taaaaaataa cgaaatgccg tctaaatgga taaatccgct agaagtaaga acattaaagt 1680 15 tactaaatta tactaaccca aatagactag tcttccttat gctcctgata tgaaaattta 1740 ttgcgttcac ggggtcggaa aaccaactga gagaggttat tattauacta ataatcctga 1800 g.gggcaacct gtcattgatt cctcggttaa tgatggaaca aaagttgaaa atgtgagaga 1860 atttatgttt caaacattct attaactgtt ttattagggt attgttatgg atgatggtga 1920 tggaacttta ccaatattag cccttggt t ggtgtgcaat aaagtttggc aaacaaaaag 1980 gtttaatcct gctaatacaa gtatcacaaa ttatgaaatc aagcatgaac ctgctgcgtt 2040 tgatctgaga ggaggacctc gctcggcaga acacgtcgat atacttggac attcagagct 2100 aaatgtatgt tcattttacc ttacaaattt ctattactaa ctcttgaaat aaggaaatta 2160 ttttaaaagt ttcatcaggc catggtgact cggtaccaaa ccgttatata tcagatatcc 2220 agtacggaca taagttttgt agattgcaat taactaacta accgaacagg gaaataataa 2280 atgagataaa tctcgataaa cctagaaatt aa 2312 20 <210> 24 <211> 3685 <212> ADN genómico <213> Arabidopsis thaliana <400> 24 acgcccctta ttcatcggaa aaagccgacg gagaaaccat cgacgccgcc atctgaagag 60 gtggtgcacg atgaggattc gcaaaagaaa ccacacgaat cttccaaatc ccaccataag 120 aaatcgaacg gaggagggaa gtggtcgtgc atcgattctt gttgttggtt cattgggtgt 180 gtgtgtgtaa cctggtggtt tcttctcttc ctttacaacg caatgcctgc gagcttccct 240 cagtatgtaa cggagcgaat cacgggtcct tcgcctgacc cgcccggtgt taagctcaaa 300 aaagaaggtc ttaaggcgaa acatcctgtt gtcttcattc ctgggattgt caccggtggg 360 cccgagcttt gggaaggcaa acaatgcgct gatggtctat ttagaaaacg tttgtggggt 420 ggaactcttg gtgaagtcta caaaaggtga gctcaacaat tctcactctt. cctttatatt 480 gggacttgga ttggatctga tgagatcacg cacttgttgc ttcttcaaca tcactcaaac 540 tttaattcca tgtttgtccg tcttactctt tacttttttt tttttttgat gtgaaacgct 600 attttcttaa gagactattt ctgtatgtgt aaggtaagcg ttccaaggac gtaattggct 660 tggactattt ctgtttgatt gttaacttta ggatataaaa tagctgcctt ggaatttcaa 720 gtcatcttat tgccaaatct gttgctagac atgccctaga gtccgttcat aacaagttac 780 ttcctttact gtcgttgcgt gtagatttag cttcgtgtag cgtataatga agtagtgttt 840 tacgttttgt cgggaataga gaagctctaa ctacatctgt ggaaagtgtg tccaggctgt 900 gatagaggac tgttgcttta ttattcaact atgtatatgt gtaattaaag ctagttcctt 960 tctgatcttt cagctcaatg tgcttttctc aatttttttc tcaatttcaa agtttcacac 1020 cgagtttatc cacatgcctc gaattccgtc catcctcgtt ctgttatcca gctttgaact 1080 cctcccgacc ctgctatgga tatattaaaa aaaaagtgtt ttgtgggttg catctttgtt 1140 acgatctgca tcttcttctt tcggcccagt gttcatgttt ttgctatggt agagatgggc 1200 aatgttattg ttgatggtaa cagtggtata gttgatagta tcttaactaa tcaattatct 1260 ctttgattca ggcctctatg ttgggtggaa cacatgtcac ttgacaatga aactgggttg 1320 gatccagctg gtattagact ccgagctgta tcaggactcg tggctgctga ctactttgct 1380 cctggctact ttgtctgggc agtgctgatt gctaaccttg cacatattgg atacgaagag 1440 aaaaatatgt acatggctcc acatgactgg cggccctcgt ttcagaacac agaggttctt 1500 ttctcatcgt tctttctatc attctgttcc atgttacgtt tcttccttca ctacttaagg 1560 cttaaatatg tttcatgttg aactaatagg tacgtgatca gactcttagc cgtatgaaaa 1620 gtaatataga gttgatggtt tctaccaacg gtggaaaaaa agcagotata gttccgcatt 1680 ccatgggggc cttgtatttt ctacatttta tgaagtgggt tgaggckcca gcccctctgg 1740 gtggcggggg tgggccagat tggtgtgcaa agtatattaa ggcggtgatg aacattggtg 1800 gaccatttct tggtgttcca aaagctgttg cagggctttt ctctgctgaa gcaaaggacg 1860 ttgcagttgc caggtattga atatctgctt atacttttga tgatcagaac cttggctctg 1920 gaactcaaag ttattctact aaatatcaat tctaataaca ctgccatatt atcgctgcaa 1980 ctgacactgg ttgattattt ttgctgctta tgtaactgaa actctcttga gattagacaa 2040 atgatgaatc gataattctt acgcattgct ctgtgatgac cagtttctta gcttcgacga 2100 taacatttgt catactgtct tttggagggc attgaatttt gctatggaaa gcgctggagc 2160 ttccatgctt gcattcttta ccaattagcg ttattctgct tctttcaatt ttcttgtata 2220 tgcatctatg gtcttttatt tcttcttaat taaagactcg ttggattagt tgctctatta 2280 gtcacttggt tccttaatat agaactttac tttcttcgaa aattgcagag cgattgcccc 2340 aggattctta gacaccgata tatttagact tcagaccttg cagcatgtaa tgagaatgac 2400 acgcacatgg gactcaacaa tgtctatgtt accgaaggga ggtgacacga tatggggcgg 2460 gcttgattgg tcaccggaga aaggccacac ctgttgtggg aaaaagcaaa agaacaacga 2520 aacttgtggt gaagcaggtg aaaacggagt ttccaagaaa agtcctgtta actatggaag 2580 gatgatatct tttgggaaag aagtagcaga ggctgcgcca tctgagatta ataatattga 2640 ctttcgagta aggacatata aatcataata aaccttgtac attttgtgat tgtatgatga 2700 acatctgtac attttatctg gtgaagggtg ctgtcaaagg tcagagtatc ccaaatcaca 2760 cctgtcgtga cgtgtggaca gagtaccatg acatgggaat tgctgggatc aaagctatcg 2820 ctgagtataa ggtctacact gctggtgaag ctatagatct actacattat gttgctccta 2880 agatgatggc gcgtggtgcc gctcatttct cttatggaat tgctgatgat ttggatgaca 2940 ccaagtatca agatcccaaa tactggtcaa atccgttaga gacaaagtaa gtgatttctt 3000 gattccaact gtatccttcg tcctgatgca ttatcagtct ttttgttttc ggtcttgttg 3060 gatatggttc tcagctcaaa gcttacaaag ctgtttctga gcctttctca aaaaggcttg 3120 ctcagtaata ttgaggtgcc aaagttgata catgtgactc ttgcttataa atcctccgtt 3180 tggtttgttc tgctttttca gattaccgaa tgctcctgag atggaaatct. actcattata 3240 cggagtgggg ataccaacgg aacgagcata cgtatacaag cttaaccagt ctcccgacag 3300 ttgcatcccc tttcagatat tcacttctgc tcacgaggag gacgaagata gctgtctgaa 3360 agcaggagtt tacaatgtgg atggggatga aacagtaccc gtcctaagtg ccgggtacat 3420 gtgtgcaaaa gcgtggcgtg gcaagacaag attcaaccct tccggaatca agacttatat 3480 aagagaatac aatcactctc cgccggctaa cctgttggaa gggcgcggga cgcagagtgg 3540 tgcccatgtt gatatcatgg gaaactttgc tttgatcgaa gatatcatga gggttgccgc 3S00 cggaggtaac gggtctgata taggacatga ccaggtccac tctggcatat ttgaatggtc 3S60 ggagcgtatt gacctgaagc tgtga 3585 <210> 25 <2U> 402 <212> ADNc <213> Arabidopsis thaliana <220> <221> CDS <222> (120) .. (401) <400> 25 agaaacagct ctttgtctct ctcgactgat ctaacaatcc ctaatctgtg ttctaaactc 60 ctggacgaga tttgacaaag tccgtatagc ttaacctggt ttaatttcaa gtgacagat 119 atg ccc ctt att ca cgg aaa aag ccg acg gag aaa cca tcg acg ccg 167 Met Pro Leu lie His Arg Lys Lys Pro Thr Glu Lys Pro Ser Thr Pro 1 5 10 15 cca tct gaa gag gtg gtg cac gat gag gat tcg caa aag aaa cca cac 215 Pro Ser Glu Glu Val Val His Asp Glu Asp Ser Gln Lys Lys Pro His 20 25 30 gaa tct tcc aaa tcc cac cat aag naa tcg aac gga gga ggg aag tgg 263 Glu Ser Ser Lys Ser His His Lys Xaa Ser Asn Gly Gly Gly Lys Trp 35 40 45 tcg tgc ate gat tct tgt tgt tgg ttc att ggg tgt gtg tgt gta acc 311 Ser Cys lie Asp Ser Cys Cys Trp Phe lie Gly Cys Val Cys Val Thr 50 55 60 tgg tgg ttt ctt etc ttc ctt tac aac gca atg cct gcg age ttc cct 359 Trp Trp Phe Leu Leu Phe Leu Tyr Asn Ala Met Fro Ala Ser Phe Pro 65 70 75 80 cag tat gca acg gag ccg aat cac gng tcc ttt gee tta ccc g 402 Gln Tyr Val Thr Glu Pro Asn His Xaa Ser Phe Ala Leu Pro 85 90 <210> 26 <211> 643 <212> ADNc <213> Zea mays <220> <221> CDS <222> (1) .. (402) <400> 26 cgg gag aaa ata gct gct ttg aag ggg ggt gtt tac tta gcc gat ggt 48 Arg Glu Lys lie Ala Ala Leu Lys Gly Gly Val Tyr eu Ala Asp Gly 1 5 10 15 gat gaa act gtt cea gtt ctt agt gcg ggc tac atg tgt gcg aaa gga 96 Asp Glu Thr Val Pro Val Leu Ser Ala Gly Tyr Met Cys Ala Lys Gly 20 25 30 tgg cgt ggc aaa act cgt ttc age ect gcc ggc age aag act tac gtg 144 Trp Arg Gly Lys Thr Arg Phe Ser Pro Ala Gly Ser Lys Thr Tyr Val 35 40 45 aga gaa tac age cat teg cea ecc tet act etc ctg gaa ggc agg ggc 192 Arg Glu Tyr Ser His Ser Pro Pro Ser Thr Leu Leu Glu Gly Arg Gly 50 55 60 acc cag age ggt gca cat gtt gat ata atg ggg aac ttt gct cta att 240 Thr Gln Ser Gly Ala His Val Asp Il-e Met Gly Asn Phe Ala Leu 'lie 65 70 75 80 gag gac gtc ate aga ata gct gct ggg gca acc ggt gag gaa att ggt 288 Glu Asp Val lie Arg lie Ala Ala Gly Ala Thr Gly Glu Glu lie Gly 85 90 ' 95 ggc gat cag gtt tat tea gat ata ttc aag tgg tea gag aaa ate aaa 336 Gly Asp Gln Val Tyr Ser Asp lie Phe Lys Trp Ser Glu Lys lie Lys 100 105 110 ttg aaa ttg taa ect atg gga agt taa aga agt gcc gac ceg ttt att 384 Leu Lys Leu 115 gcg ttc caá agt gtc ctg cctgagtgca actctggatt ttgcttaaat 432 attgtaattt ttcacgcttc attcgtccct ttgtcaaatt tacatttgac aggacgccaa 492 tgcgatacga tgttgtaccg ctattttcag cattgtatat taaactgtac aggtgtaagt 552 tgcatttgcc agctgaaatt gtgtagtcgt tttctttacg atttaatanc aagtggcgga 612 gcagtgcccc aagcnaaaaa aaaaaaaaaa a 643 <21?> 27 <211> 115 <212> PRT <213> Zea mays <400> 30 Arg Glu Lys lie Ala Ala Leu Lys Gly Gly Val Tyr Leu Ala Asp Gly 1 5 10 15 Asp Glu Thr val Pro Val Leu Ser Ala Gly Tyr Mee Cys Ala L s Gly 20 25 30 T.rp Arg Gly Lys Thr Arg Phe Ser Pro Ala Gly Ser Lys Thr Tyr Val 35 40 45 Arg Glu Tyr Ser His Ser Pro Pro Ser Thr Leu Leu Glu Gly Arg Gly 50 55 60 Thr Gln Ser Gly Ala His Val Asp lie Met Gly Asn Phe Ala Leu lie 65 70 75 80 Glu Asp Val lie Arg lie Ala Ala Gly Ala Thr Gly Glu Glu lie Gly 85 90 95 Gly Asp Gln Val Tyr Ser Asp lie Phe Lys Trp Ser Glu Lys lie Lys 100 105 110 Leu Lys Leu 115 <210> 28 <211> 516 <212> ADNc <213> Neurospora crassa <400> 28 ggtggcgaag acganggcgg aagttggagg ctaacgagaa tgacnctcgg agatggatct 60 accctctaga gacacgacta ccnttgcacc cagcctcaag gtntacngtt tntatgggta 120 ggaagccgac ggagcgagcc tacatctatc tggcgcccga tcccgggacg acaacgcatc 180 tttagatgac gatcgatacg actttgactn aggggcacat tgaccacggt gtgattttgg 240 gcgaaggcga tggcacagtg aaccttatga gtttggggta cctgtgcaat aaggggtgga 300 aaatgaagag atacaatcct gcgggctcaa aaataaccgt ggtcgagatg ccgcatgaac 360 cagaacggtt caatccgaga. ggagggccga atacggcgga cttaaátatg tagaaaaggt 420 tgaaatttat gaagagtaat taaatacggc acataggtta ctcaatagta tgactaatta 480 aaaaaaaatt ttttttctaa aaaaaaaaaa aaaaaa 516 <210> 29 <211> 1562 <212> genomico <213> Arabidopsis thaliana <400> 29 atgaaaaaaa tatcttcaca ttattcggta gtcatagcga tactcgttgt ggtgacgatg 60 acctcgatgt gtcaagctgt gggtagcaac gtgtaccctt tgattctggt tccaggaaac 120 ggaggcaacc agctagaggt acggctggac agagaataca agccaagtag tgtctggtgt 180 agcagctggt tatatccgat ccataagaag agtggtggat ggtttaggct atggttcgat 240 gcagcagtgt tattgtctcc cttcaccagg tgcctcagcg atcgaatgat gttgtactat 300 gaccctgatt tggatgacta ccaaaatgct cctggtgtcc aaacccgggt tcctcatttc 360 ggttcgacca aatcacttct atacctcgac cctcgtctcc ggttagtact ttccaagata 420 catcactttg ggacatttcc acaatgaaca aaatagacat aaatttgggg gattattgtt 480 atatcaatat ccatttatat gctagtcggt aatgtgagtg ttatgttagt atagttaatg 540 tgagtgttat gtgattctcc attttaaatg aagctagaaa gttgtcgttt aataatgttg 600 ccatgccacg agaattataa ggacactatg taaatgtagc ttaataataa ggtttgattt 660 gcagagatgc cacatcttac atggaacatt tggtgaaagc tctagagaaa aaatgcgggt 720 atgttaacga ccaaaccatc ctaggagctc catatgattt caggtacggc ctggctgctt 780 cgggccaccc gtcccgtgta gcctcacagt tcctacaaga cctcaaacaa ttggtggaaa 840 aaactagcag cgagaacgaa ggaaagccag tgatactcct ctcccatagc ctaggaggac 900 ttttcgtcct ccatttcctc aaccgtacca ccccttcatg gcgccgcaag tacatcaaac 960 actttgttgc actcgctgcg ccatggggtg ggacgatctc tcagatgaag acatttgctt 1020 ctggcaacac actcggtgtc cctttagtta accctttgct ggtcagacgg catcagagga 1080 cctccgagag taaccaatgg ctacttccat ctaccaaagt gtttcacgac agaactaaac 1140 cgcttgtcgt aactccccag gttaactáca cagcttacga gatggatcgg ttttttgcag 1200 acattggatt ctcacaagga gttgtgcctt acaagacaag agtgttgcct ttaacagagg 1260 agctgatgac tccgggagtg ccagtcactt gcatatatgg gagaggagtt gatacaccgg 1320 aggttttgat gtatggaaaa ggaggattcg ataagcaacc agagattaag tatggagatg 1380 gagatgggac ggttaatttg gcgagcttag cagctttgaa agccgatagc ttgaacaccg 1440 tagagattga tggagtttcg catacatcta tacttaaaga cgagatcgcá cttaaagaga 1500 ttatgaagca gatttcaatt attaattatg aattagccaa tgttaatgcc gtcaatgaat 1560 ga 1562 <2L0> 30 <211> 3896 <212> ADN genómico <213> .Arabidopsis thaliana <400> 30 atgggagcga attcgaaatc agtaacggct tccttcaccg tcatcgccgt ttttttcttg 60 atttgcggtg gccgaactgc ggtggaggat gagaccgagt Ctcacggcga ctactcgaag 120 ctatcgggta taatcattcc gggatttgcg tcgacgcagc tacgagcgtg gtcgatcctt 180 gactgtccat acactccgtt ggacttcaat ccgctcgacc tcgtatggct agacaccact 240 aaggtccgtg atcttcattt ccttcgctcc ttattctgtc ggtcgagtca cttgttgatg 300 aattccaagc gaaatatagc aatgaagcat gtctcgtctc tcttattgat tcgttcatta 360 gtcaacagtg acgcttctga atctgagttt agagtcatat aaaacágctg actcggcgag 420 tgtttcccat cgcttttggt tcgctaaatg tagcgcaatg aatgtgtaat tagtctgcgc 480 tttttattca actagatctg caagtttttc agagtgc ca atagtagtta gaaaatgtta 540 ggtcatttta cttgtgcatt gtgattcttt tggttgttgc ttactgatcg acgtgatgga 600 tggtttacag cttctttctg ctgtcaactg ctggtttaag tgtatggtgc tagatcctta 660 taatcaaaca gaccatcccg agtgtaagtc acggcctgac agtggtcttt cagccatcac 720 agaattggat ccaggtcaca taacaggtag tttcggattt ttctttcttt tgagttttct 780 tcaatttgat atcatcttgt tgtgatataa tatggctaag ttcattaatt tggtcaattt 840 tcaggtcctc tttctactgt ctggaaagag tggcttaagt ggtgtgttga gtttggtata 900 gaagcaaatg caattgtcgc tgttccatac gattggagat tgtcaccaac caaaccggaa 960 gagcgtgacc tctactttca caagctcaag ttagtcctta tcaggctaat gtcttttatc 1020 ttctcttttt atgtaagata agctaagagc tctggtcgtc ttcctttttg caggttgacc 1080 tttgaaactg ctttaaaact ccgtggcggc ccttctatag tatttgccca ttcaatgggt 1140 aataatgtct tcagatactt tctggaatgg ctgaggctag aaattccacc aaaacattat 1200 ttgaagtggc ttgatcagca tacccatgct tatttcgctg ttggtaccgg cctactatcc 1260 ttaagttacc attttatttt ttctctaatt gggggagtta tgttgtgact tactggattg 1320 agctcgatac ctgatttg t gttgatttag gagctcctct tcttggttct gttgaggcaa 1380 tcaaatctac tctctctggt gtaacgtttg gccttcctgt ttctgaggtg acctctgact 1440 tctctttagt tttaagtagt tgatatcaac caggtcttat aactcactgg attttccttt 1500 tgaaagtatt acttttgtta attgaactgc tgtacgcgat atggtatctg tagatcttga 1560 agtgctagtt atcaaagaac atattgtggg tagtatacct gtcagcggcc ttagctaata 1620 caaccaaacc acatgtacac tgatttagtt ttcagattat tatggtagac tttaagttga 1680 gaagaaactt tgactgaaat ctttttattt taataggcta tgatttgttt attgaaatca 1740 tgtgacatat tgacatgcgc ttctcatgtt ttttgctggc aaggcttcag ggaactgctc 1800 ggttgttgtc caattctttt gcgtcgtcat tgtggcttat gccattttca aagaattgca 1860 agggtgataa cacattctgg acgcattttt ctgggggtgc tgcaaagaaa gataagcgcg 1920 tataccactg tgatgaagag gaatatcaat caaaatattc tggctggccg acaaatatta 1980 ttaacattga aattccttcc actagcggtt agactctgta tatgcaactg taacac.taac 2040 aaaagtttca ccaagaatgt tcactctcat atttcgttcc tttgatgtgt atccatcagt 2100 tacagaaaca gctctagtca acatgaccag catggaatgt ggccttccca cccttttgtc 2160 cttcacagcc cgtgaactag cagatgggac tctttccaaa gcaatagaag actatgaccc 2220 agatagcaag aggatgttac accagttaaa gaagtacgta cctttctttg tgataagaaa 2280 tattgctcat cgatcatcac ttgctggctt cttgtacgtc aaattgtttt gtttaaatct 2340 ctatatcaat tgttcatatg ctttgtcttt cttactacaa gaaacaagta taatcagaaa 2400 ccttattatt gattatcagt tctctcctta tattatggaa tgtct'tttc gtttacagtt 2460 atgaatgcaa aagggggtat tttagttgat tgattctctc attctctagt ttgttttgac 2520 taatagcgtc aattttgttt ttctagcaaa tctttgtgaa ttatatataa catgctaact 2580 atacttttca ggttgtatca tgatgaccct gtttttaatc ctctgactcc ttgggagaga 2640 ccacctataa aaaatgtatt ttgcatatat ggtgctcatc taaagacaga ggtatgatgc 2700 attctcaata tcacattatg cgttgacttt gttattatat tccccatttg gtttgcaata 2760 tctttttgaa ttatgattta tcttctccct tgcatcttat gctattaagc gttaaaggta 2820 ctaaatgtat gaagctgtct gtcataggt ggttattact ttgccccaag tggcaaacct 2880 tatcctgata attggatcat cacggatatc atttatgaaa ctgaaggttc cctcgtgtca 2940 aggtaatttt ccgcaatggc agaagtaaaa caggaaggca aagtcttctg tatcagtcta 3000 gtggcatgtt atctcagttg cataagcaaa ttattaaaca actaaaattt aagtactttt 3060 tcatcattcc ctttgagctt agtggatgat cagtggctta aagtgggaag aggtgttgca 3120 tgaaacatga cacttgtatc aaagataact agcaaaacaa aactaaccca tttctgaatt 3130 tcatattatt aggagtagtc gtgcttttaa aaaatttgtt t aagaaacc gaaaaactag 3240 ttcatatctt gattgtgcaa tatctgcagg tctggaactg tggttgatgg gaacgctgga 3300 cctataactg gggatgagac ggtaagctca gaagttggtt ttgaaattat cttcttgcaa 3360 actactgaag actaagataa tacttgcttc tggaacactg cttgctatgt tctctagtac 3420 actgcaatat tgactctccg ctacttttat tgattatgaa attgatctct tataggtacc 3480 ctatcattca ctctcttggt gcaagaa g gctcggacct aaagttaaca taacaatggc 3540 tccccaggta ctctttttta gttcctcacc ttatatagat caaactttaa gtgtactttt 360-0 ctggttatgt gttgatttac ctccaatttg ttctttctaa aaatcatata tctctgtact 3660 cctcaagaac ttgtattaat ctaaacgaga ttctcattgg gaaaataaaa caacagccag 3720 aacacgatgg aagcgacgta catgtggaac taaatgttga tcatgagcat gggtcagaca 3780 tcatagctaa catgacaaaa gcaccaaggg ttaagtacat aaccttttat gaagactctg 3840 agagcattcc ggggaagaga accgcagtct gggagcttga taaaagtggg tattaa 3896 <210> 31 <211> 709 <212> ADNc <213> tomate <400> 31 ctggggccaa aagtgaacat aacaaggaca ccacagtcag agcatgatgt tcagatgtac 60 aagtgcatct aaatatagag catcaacatg gtgaagatat cattcccaat atgacaaagt 120 tacctacaat gaagtacata acctattatg aggattctga aagttttcca gggacaagaa 180 cagcagtttg ggagcttgat aaagcaaatc acaggaacat tgtcagatct ccagctttga 240 tgcgggagct gtggcttgag atgtggcatg atattcatcc tgataaaaag tccaagtttg 300 ttacaaaagg tggtgtccga tcctcactat tttcttctat aaatgtttga gtttgtattg 360 acattgcaag tattgcaaca aaaagcaaag cgtgggcctc tgagggatga -ggactgctat 420 tgggattacg ggaaagctcg atgtgcatgg gctgaacatt gtgaatacag gttagaatat 430 tcaaattata ttttgcaaaa tattctcttt ttgtgtattt aggccacctt tccccggtca 540 caacgatgca gatatgtatt cggggatgtt cacctgggac agagctgcag attgaagagt 600 tctacatctc acatcctgtc acactatgtg tgatatttaa gaaactttgt ttggcggaac 660 aacaag ttg cacaaacatt tgaagaagaa agcgaaatga ttcagagag 709

Claims (1)

  1. REIVINDICACIONES 1. Una enzima designada como fosfolipido : diacilglicerol acetiltransferasa (PDAT) , caracterizada porque cataliza en una reacción independiente de acil-CoA, la transferencia de ácidos grasos a partir difosfolipidos a diacilglicerol en la trayectoria biosintética para la producción de triglicerol y que comprende una secuencia de aminoácido como se expone en la SEC ID No. 2 o un fragmento funcional, derivado, alelo, homólogo o isoenzima de la misma . 2. Una enzima de acuerdo a la reivindicación 1 caracterizada porque comprende una secuencia de aminoácido codificada a través de una secuencia de nucleótido como se expone en la SEC ID No. 1 o una secuencia de nucleótido homologa, la cual es al menos aproximadamente 40% idéntica a la secuencia de nucleótido de la SEC ID No. 1. 3. Una enzima de acuerdo a las reivindicaciones 1 o 2, caracterizada porque comprende una secuencia de aminoácido como se expone en la SEC ID No.16, 20 o 22 o un fragmento funcional, derivado, alelo, homólogo o isoenzima de la misma. 4. Una enzima de acuerdo a las reivindicaciones 1 a 3, caracterizada porque comprende una secuencia de aminoácido seleccionada del grupo que consiste de secuencias como se exponen en las SEC ID No. 6, 8, 13, 14, 15, 17, 18, 25 o 27 o un fragmento funcional, derivado, alelo, homólogo o isoenzima de la misma. 5. Una enzima de acuerdo a las reivindicaciones 1 a 4, caracterizada porque comprende una secuencia de aminoácido que codifica a través de una secuencia de nucleótido, una porción, derivado, alelo u homólogo de la misma, seleccionado a partir del grupo que consiste de las secuencias como se exponen en las SEC ID No. 1, 3, 4, 5, 7, 9, 10, 11, 12, 19, 21, 23, 24, 25, 26, 28, 29, 30 o 31 o un fragmento funcional, derivado, alelo, homólogo o isoenzima de la enzima que codifica a la secuencia de aminoácido . 6. Una secuencia de nucleótido de acuerdo a las reivindicaciones 2 o 5, caracterizada porque se seleccionada a partir del grupo que consiste de secuencias como se exponen en las SEC ID No. 1, 3, 4, 10, 11, 19, 21, 23, 24, 29 o 30 o una porción, derivado, alelo u homólogo de la misma. 7. Una secuencia de nucleótido parcial que corresponde a una secuencia de nucleótido de longitud completa de acuerdo a las reivindicaciones 2, 5 o 6, caracterizada porque se selecciona del grupo que consiste de secuencias como se exponen en la SEC ID No. 5, 7, 9, 12, 25, 26, 28 o 31 o una porción, derivado, alelo u homólogo de la misma. 8. Una secuencia de nucleótido de acuerdo a las reivindicaciones 2 o 5 a 7, caracterizada porque comprende una secuencia de nucleótido la cual es al menos 40% idéntica a una secuencia de nucleótido seleccionada del grupo que consiste de aquellas secuencias mostradas en las SEC ID No. 1, 3, 4, 5, 7, 9, 10, 11, 12, 19, 21, 23, 24, 25, 26, 28, 29, 30 o 31. 9. Un constructo o construcción de gen caracterizado porque comprende una secuencia de nucleótido de acuerdo a las reivindicaciones 2 o 5 hasta 8, ligado operablemente a un ácido nucleico heterólogo. 10. Un vector caracterizado porque comprende una secuencia de nucleótido de acuerdo a las reivindicaciones 2 o 5 hasta 8 o un constructo o construcción de gen de acuerdo a la reivindicación 9. 11. Un vector de acuerdo a la reivindicación 10, caracterizado porque es un vector de expresión. 12. Un vector de acuerdo a las reivindicaciones 10 u 11, caracterizado porque además comprende un gen marcador seleccionable y/o secuencias de nucleótidos para la replicación en una célula hospedera o la integración dentro del genoma de la célula hospedera. 13. Una célula o un organismo transgénico caracterizado porque contiene una secuencia de nucleótido de acuerdo a las reivindicaciones 2 o 5 hasta 8 y/o un constructo o construcción de gen de acuerdo a la reivindicación 9 y/o un vector de acuerdo a las reivindicaciones 10 a 12. 14. Una célula u organismo transgénico de acuerdo a la reivindicación 13, caracterizado porque es una célula u organismo eucariótico. 15. Una célula u organismo transgénico de acuerdo a las reivindicaciones 12 o 13, caracterizado porque es una célula de levadura o una célula de planta o una planta. 16. Una célula u organismo transgénico de acuerdo a las reivindicaciones 12 a 15, que tiene una trayectoria biosintética alterada para la producción de triacilglicerol, caracterizado por la prevención de acumulación de ácidos grasos indeseables, los cuales son nocivos si se presentan en cantidades altas en los lipidos de la membrana. 17. Una célula u organismo transgénico de acuerdo a las reivindicaciones 12 a 16, caracterizado porque tiene un contenido de aceite incrementado, alterado . 18. Una célula u organismo transgénico de acuerdo a las reivindicaciones 12 a 17, en donde la actividad de la PDAT es alterada, caracterizada por una alteración en la expresión del gen, actividad catalítica y/o regulación de la actividad de la enzima. 19. Un proceso para la producción de triacilglicerol, caracterizado porque comprende el crecimiento de una célula u organismo transgénico de acuerdo a las reivindicaciones 13 a 18, bajo condiciones según las cuales dicha secuencia de nucleótido es expresada de acuerdo a las reivindicaciones 2 o 5 hasta 20. Los triacilgliceroles producidos por un proceso de acuerdo a la reivindicación 19. 21. El uso de una secuencia de nucleótido de acuerdo a las reivindicaciones 2 o 5 hasta 8 y/o una enzima de acuerdo a las reivindicaciones 1, 3 o 4 para la producción de triacilglicerol y/o triacilgliceroles con ácidos grasos no comunes, que comprenden ácidos grasos de Cadena media, ácidos grasos hidroxilados , ácidos grasos epoxigenados y ácidos grasos acetilénicos . 22. El uso de una secuencia de acuerdo a las reivindicaciones 2 o 5 a 8 y/o una enzima de acuerdo a las reivindicaciones 1, 3 o 4 para la transformación de cualquier célula u organismo para ser expresado en esta célula u organismo y que resulta en un contenido de aceite preferiblemente incrementado, alterado, de esta célula u organismo.
MXPA01009577A 1999-04-01 2000-03-28 Una nueva clase de enzimas en la trayectoria biosintetica para la produccion de triacilglicerol y moleculas de adn recombinante que codifican estan enzimas. MXPA01009577A (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP99106656 1999-04-01
EP99111321 1999-06-10
US18068700P 2000-02-07 2000-02-07
PCT/EP2000/002701 WO2000060095A2 (en) 1999-04-01 2000-03-28 Enzymes of the biosynthetic pathway for the production of triacylglycerol and recombinant dna molecules encoding these enzymes

Publications (1)

Publication Number Publication Date
MXPA01009577A true MXPA01009577A (es) 2003-07-21

Family

ID=26152952

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA01009577A MXPA01009577A (es) 1999-04-01 2000-03-28 Una nueva clase de enzimas en la trayectoria biosintetica para la produccion de triacilglicerol y moleculas de adn recombinante que codifican estan enzimas.

Country Status (21)

Country Link
US (2) US7427593B1 (es)
EP (1) EP1165803B1 (es)
JP (1) JP2002541783A (es)
CN (1) CN1230541C (es)
AT (1) ATE356213T1 (es)
AU (1) AU777031B2 (es)
BR (1) BR0009510A (es)
CA (1) CA2366187C (es)
CZ (1) CZ20013529A3 (es)
DE (1) DE60033793T2 (es)
ES (1) ES2283294T3 (es)
HU (1) HUP0200480A3 (es)
IL (1) IL145307A (es)
MX (1) MXPA01009577A (es)
NO (1) NO20014716L (es)
PL (1) PL351260A1 (es)
RU (1) RU2272073C2 (es)
SK (1) SK13872001A3 (es)
TR (1) TR200102859T2 (es)
UA (1) UA75041C2 (es)
WO (1) WO2000060095A2 (es)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60045117D1 (de) * 1999-08-30 2010-11-25 Monsanto Technology Llc Pflanzen-Sterol-Acyltransferasen
US7045326B2 (en) 2001-02-23 2006-05-16 The Regents Of The University Of California Mono- and diacylglycerol acyltransferases and methods of use thereof
US20020119138A1 (en) 2001-02-26 2002-08-29 Sylvaine Cases Diacylglycerol o-acyltransferase 2alpha (DGAT2alpha)
US7229815B2 (en) * 2001-08-30 2007-06-12 Indian Institute Of Science Triacylglycerol biosynthesis in the cytosol of eukaryotes
AU2002357298B2 (en) 2001-12-17 2008-07-10 E. I. Du Pont De Nemours And Company Phospholipid:diacylglycerol acyltransferases
AU2003223975A1 (en) * 2002-03-30 2003-10-13 Basf Plant Science Gmbh Expression of phospholipid:diacylglycerine acyltransferase (pdat) for the production of plant storage lipids with polyunsaturated fatty acids
SE0201581D0 (sv) * 2002-05-29 2002-05-29 Scandinavian Biotechnology Res New improved acyltransferase
CA2491234A1 (en) 2002-07-10 2004-01-22 Basf Plant Science Gmbh Use of a gene for increasing the oil content in plants
US7267976B2 (en) 2003-07-02 2007-09-11 E.I. Du Pont De Nemours And Company Acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous yeasts
US7479374B2 (en) 2003-07-09 2009-01-20 National University Of Singapore Triacylglycerol-deficient fission yeast and its uses
US7273746B2 (en) 2004-11-04 2007-09-25 E.I. Dupont De Nemours And Company Diacylglycerol acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms
US7550286B2 (en) 2004-11-04 2009-06-23 E. I. Du Pont De Nemours And Company Docosahexaenoic acid producing strains of Yarrowia lipolytica
JP4803584B2 (ja) * 2006-02-08 2011-10-26 独立行政法人産業技術総合研究所 脂質生産性の高い形質転換微生物
CA2693630C (en) 2006-07-14 2021-08-31 Commonwealth Scientific And Industrial Research Organisation Altering the fatty acid composition of rice
CA2768737A1 (en) 2008-07-21 2010-01-28 Commonwealth Scientific And Industrial Research Organisation Improved vegetable oils and uses therefor
ES2603530T3 (es) 2008-07-21 2017-02-28 Commonwealth Scientific And Industrial Research Organisation Aceite de semilla de algodón mejorado y usos
US8394621B2 (en) 2008-10-23 2013-03-12 Matrix Genetrics, LLC Modified photosynthetic microorganisms for producing triglycerides
US8835137B2 (en) * 2008-12-23 2014-09-16 Matrix Genetics, Llc Modified photosynthetic microorganisms with reduced glycogen and their use in producing carbon-based products
EP2518147B1 (en) 2009-12-21 2017-10-11 Suntory Holdings Limited Diacylglycerole acyltransferase gene, and use thereof
RU2545375C2 (ru) * 2010-02-03 2015-03-27 Сантори Холдингз Лимитед Гомолог глицерол-3-фосфат-ацилтрансферазы и его использование
US8980613B2 (en) 2010-04-06 2015-03-17 Matrix Genetics, Llc Modified photosynthetic microorganisms for producing lipids
FI122886B (fi) 2010-06-24 2012-08-31 Valtion Teknillinen Geneettisesti muokattuja sieniä ja niiden käyttö lipidituotannossa
AU2011274301B2 (en) 2010-06-28 2015-06-11 Nuseed Global Innovation Ltd Methods of producing lipids
JP5800311B2 (ja) * 2011-01-27 2015-10-28 国立大学法人東京工業大学 植物油脂の製造方法
CN102492742A (zh) * 2011-04-27 2012-06-13 北京大学 促进植物营养组织中异位产三酰甘油的培养基及其应用
US8951776B2 (en) * 2011-10-19 2015-02-10 Massachusetts Institute Of Technology Engineered microbes and methods for microbial oil production
US8735111B2 (en) 2011-12-27 2014-05-27 Commonwealth Scientific And Industrial Research Organisation Processes for producing hydrocarbon products
US8809026B2 (en) 2011-12-27 2014-08-19 Commonwealth Scientific And Industrial Research Organisation Processes for producing lipids
US11639507B2 (en) 2011-12-27 2023-05-02 Commonwealth Scientific And Industrial Research Organisation Processes for producing lipids
NZ631696A (en) 2012-04-25 2017-02-24 Grains Res & Dev Corp High oleic acid oils
EP2861728B1 (en) * 2012-06-19 2017-12-27 E. I. du Pont de Nemours and Company Improved production of polyunsaturated fatty acids by coexpression of acyl-coa: lysophosphatidylcholine acyltransferases and phospholipid: diacylglycerol acyltransferases
ES2969618T3 (es) 2014-07-07 2024-05-21 Nuseed Global Innovation Ltd Procesos para producir productos industriales de lípidos vegetales
JP6580912B2 (ja) 2015-09-11 2019-09-25 花王株式会社 脂質の製造方法
US11859193B2 (en) 2016-09-02 2024-01-02 Nuseed Global Innovation Ltd. Plants with modified traits
CN110386966A (zh) * 2018-04-23 2019-10-29 中国科学院大连化学物理研究所 一种含有叶绿体转运肽的基因序列的应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9510927D0 (en) * 1995-05-31 1995-07-26 Ca Nat Research Council Plant and seed oil modification
KR20010013431A (ko) * 1997-06-05 2001-02-26 칼진 엘엘시 디아실글리세롤 아실 트란스페라제 단백질
CA2703147C (en) 1998-12-02 2014-07-29 Karlene H. Butler Plant diacylglycerol acyltransferases
US7157619B1 (en) * 1999-08-30 2007-01-02 Monsanto Technology, L.L.C. Plant sterol acyltransferases
US6791008B1 (en) * 1999-11-12 2004-09-14 Scandinavian Biotechnology Research (Scanbi) Ab Use of a class of enzymes and their encoding genes to increase the oil content in transgenic organisms
CN1294265C (zh) * 1999-11-12 2007-01-10 斯堪的纳维亚生物技术研究公司 应用一类酶及其编码基因增加转基因生物的含油量

Also Published As

Publication number Publication date
CA2366187C (en) 2010-05-25
US20080160592A1 (en) 2008-07-03
JP2002541783A (ja) 2002-12-10
WO2000060095A2 (en) 2000-10-12
US7635582B2 (en) 2009-12-22
CN1362994A (zh) 2002-08-07
UA75041C2 (en) 2006-03-15
DE60033793D1 (de) 2007-04-19
NO20014716D0 (no) 2001-09-28
US7427593B1 (en) 2008-09-23
CN1230541C (zh) 2005-12-07
ATE356213T1 (de) 2007-03-15
WO2000060095A3 (en) 2001-02-01
SK13872001A3 (sk) 2002-06-04
IL145307A0 (en) 2002-06-30
IL145307A (en) 2007-12-03
AU777031B2 (en) 2004-09-30
HUP0200480A3 (en) 2009-08-28
CZ20013529A3 (cs) 2002-02-13
AU3814700A (en) 2000-10-23
DE60033793T2 (de) 2007-12-06
CA2366187A1 (en) 2000-10-12
TR200102859T2 (tr) 2002-01-21
NO20014716L (no) 2001-11-28
EP1165803B1 (en) 2007-03-07
EP1165803A2 (en) 2002-01-02
HUP0200480A2 (hu) 2002-07-29
ES2283294T3 (es) 2007-11-01
PL351260A1 (en) 2003-04-07
BR0009510A (pt) 2002-04-23
RU2272073C2 (ru) 2006-03-20

Similar Documents

Publication Publication Date Title
US7635582B2 (en) Process for the production of triacylglycerols
Xu et al. Cloning and characterization of an acyl‐CoA‐dependent diacylglycerol acyltransferase 1 (DGAT1) gene from Tropaeolum majus, and a study of the functional motifs of the DGAT protein using site‐directed mutagenesis to modify enzyme activity and oil content
Routaboul et al. The TAG1 locus of Arabidopsis encodes for a diacylglycerol acyltransferase
Kajikawa et al. Isolation and characterization of Δ 6-desaturase, an ELO-like enzyme and Δ 5-desaturase from the liverwort Marchantia polymorpha and production of arachidonic and eicosapentaenoic acids in the methylotrophic yeast Pichia pastoris
Bourgis et al. A plastidial lysophosphatidic acid acyltransferase from oilseed rape
US20080145867A1 (en) Genes encoding a novel type of lysophophatidylcholine acyltransferases and their use to increase triacylglycerol production and/or modify fatty acid composition
Guo et al. Two novel diacylglycerol acyltransferase genes from Xanthoceras sorbifolia are responsible for its seed oil content
US8101818B2 (en) Enhancement of hydroxy fatty acid accumulation in oilseed plants
WO2008006207A2 (en) Acyl-coa-dependent diacylglycerol acyltransferase 1 (dgat1 ) gene from tropaeolum majus, protein encoded thereby and uses thereof
EP1230373B1 (en) Use of a class of enzymes and their encoding genes to increase the oil content in transgenic organisms
Slabas et al. Acyltransferases and their role in the biosynthesis of lipids-opportunities for new oils
KR100703113B1 (ko) 트리아실글리세롤 생산을 위한 생합성 경로에 이용되는 신규 효소 및 이를 코딩하는 재조합 dna 분자
US6791008B1 (en) Use of a class of enzymes and their encoding genes to increase the oil content in transgenic organisms
EP1131438A1 (fr) Gene codant pour une acyltransferase de colza, et ses utilisations
Bouvier-Nave et al. Expression in yeast of an acyl-CoA: diacylglycerol acyltransferase cDNA from Caenorhabditis elegans
US20060206960A1 (en) Higher plant cytosolic er-based glycerol-3-phosphate acyltransferase genes

Legal Events

Date Code Title Description
FG Grant or registration