MXPA01007325A - Perfilado molecular para la seleccion de la heterosis. - Google Patents

Perfilado molecular para la seleccion de la heterosis.

Info

Publication number
MXPA01007325A
MXPA01007325A MXPA01007325A MXPA01007325A MXPA01007325A MX PA01007325 A MXPA01007325 A MX PA01007325A MX PA01007325 A MXPA01007325 A MX PA01007325A MX PA01007325 A MXPA01007325 A MX PA01007325A MX PA01007325 A MXPA01007325 A MX PA01007325A
Authority
MX
Mexico
Prior art keywords
plant
expression
progeny
plants
dominant
Prior art date
Application number
MXPA01007325A
Other languages
English (en)
Inventor
Ben Bowen
Original Assignee
Pioneer Hi Bred Int
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred Int filed Critical Pioneer Hi Bred Int
Publication of MXPA01007325A publication Critical patent/MXPA01007325A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

Se dan a conocer metodos para correlacionar la informacion del perfil molecular y la heterosis. La seleccion de marcadores dominantes, aditivos o sub-/sobre-dominantes, suministra una heterosis mejorada. La seleccion del numero de productos de expresion en un perfil de expresion suministra una heterosis mejorada. Se suministran tambien metodos para la identificacion y clonacion de acidos nucleicos enlazados a las caracteristicas heteroticas. Igualmente se suministran metodos para la identificacion de la ascendencia, por la consideracion de los perfiles de expresion.

Description

PERFILADO MOLECULAR PARA LA SELECCIÓN DE LA HETEROSIS La invención se refiere a nuevos métodos de 5 mejorar la selección de cultivos y seleccionar la heterosis, usando técnicas de modelación, de tipo molecular y de computadora .
REFERENCIA CRUZADAA SOLICITUDES RELACIONADAS 10 Esta solicitud es una presentación no provisional y reclama la prioridad de "PERFILADO MOLECULAR PARA LA HETEROSIS", por Ben Bo en et al., USSN 60/116,617 (presentada el 21 de enero de 1999, y "PERFILADO MOLECULAR PARA LA HETEROSIS", por Ben Bowen et al., USSN 60/155,368, 15 presentada el 17 de noviembre de 1999, ANTECEDENTES DE LA INVENCIÓN La descendencia híbrida a menudo supera a sus padres en una variedad de diferentes medidas, que incluyen 20 el rendimiento, adaptabilidad a cambios ambientales, resistencia a enfermedades, resistencia a plagas, y similares. Las propiedades mejoradas del híbrido, en comparación con los padres, se denominan colectivamente como "vigor de híbrido" o "heterosis" . La hibridización entre padres de linaje genético disimilar se ha usado en la cría de animales y especialmente para mejorar cultivos de plantas principales, tal como el maíz, betabel y girasol. En realidad, para algunos cultivos, tal como el 5 maíz ( Zea mays) , la mayoría de los cultivos que crecen son de descendencia híbrida. Debido a que la cruza de estos descendientes híbridos resulta en una pérdida del vigor y carece de uniformidad, la producción de semillas de estos cultivos para la plantación es compleja, utilizando cepas 10 endogámicas que se cruzan para producir semillas con características uniformes. Por ejemplo, el desarrollo de un híbrido del maíz implica típicamente tres etapas: (1) la selección de plantas de varias agrupaciones de germoplasmas para los cruces 15 iniciales de crianza; (2) escoger plantas seleccionadas de los cruces de crianza durante varias generaciones, para producir una serie de líneas endogámicas, las cuales, aunque diferentes entre sí, son una casta verdadera y son altamente uniformes; y (3) cruzar líneas endogámicas seleccionadas con 20 diferentes líneas endogámicas, para producir la progenie híbrida (algunas veces nombrada como híbridos "Fl"). Durante el proceso endogámico en el maíz, el vigor de estas líneas disminuye. El vigor es restaurado cuando dos diferentes líneas endogámicas se cruzan para producir progenie híbrida. 25 Una consecuencia de la homocigosidad y homogeneidad de las ^^|^j líneas endogámicas es que los híbridos producidos por cruzar una pareja definida de endogámicos son uniformes y pronosticables . Una vez que los endogámicos que suministran un híbrido superior se han identificado, la semilla del 5 híbrido se puede reproducir, en tanto se mantenga la homogeneidad de los padres endogámicos. A pesar de los muchos años de investigación y la importancia comercial considerable de la generación de híbridos con las características deseadas, la base molecular 10 de la heterosis es aún esencialmente desconocida. En unos cuantos casos, la pérdida del vigor debido a la endogamia puede ser indicada directamente por una combinación de genes no convenientes (por ejemplo letales o recesivos sub- letales) . Sin embargo, la simple combinación genética de 15 estos genes no es suficiente del todo para explicar el fenómeno de la heterosis. Aún cuando los cruces se optimicen para eliminar estos genes problemáticos, la descendencia resultante aún mostrará una disminución en el vigor cuando es endogámica. Asimismo, muchos rasgos fenotípicos, tal como 20 el rendimiento, son el resultado de varios genes interactivos y no es claro el por qué la combinación de los padres con diferentes antecedentes genéticos resulta en un aumento en el rendimiento. En verdad, no es aún claro si la heterosis es el resultado de uno o pocos mecanismos g á^-_k|^ |^ ^^^^^^^^-genéticos generales, o si es el resultado de muchos procesos interactivos simultáneamente. Debido a la carencia de entendimiento de la base molecular para la heterosis, el desarrollo de cultivos ha dependido de observaciones empíricas de la heterosis para híbridos, que resulta del cruce de cepas de cultivos endogámicos seleccionados (o resultan de cruces de segundo orden, por ejemplo en los cuales dos endogámicos son cruzados, para producir un híbrido, el cual es luego cruzado con una cepa endogámica o híbrida para producir un híbrido heterótico de 3-4 vías subsiguiente) . El proceso laborioso se ha conducido en gran escala, que resulta en aumentos en las medidas convenientes de la heterosis, tal como el rendimiento, de varios porcentajes por año. Los métodos empíricos basados en la teoría genética cuantitativa han resultado en triplicar el rendimiento del maíz híbrido en los últimos 70 daños. Esto ha sido esencial para la seguridad de alimentos y una contribución mayor en la economía de EE.UU. y mundial. Por el año 2020, el banco mundial y otros grupos pronostican que será necesario doblar la producción del maíz y aumentar la producción del arroz y el trigo por el 50%, para apoyar el crecimiento de la población proyectado. Tal aumento no puede ser acompañado por el aumento por hectárea en la producción (es decir, no hay suficientes hectáreas adicionales disponibles) . Es dudoso que un simple acercamiento empírico sea suficiente para aumentar el rendimiento suficientemente rápido para cumplir con la demanda proyectada. Los métodos moleculares se han usado en una extensión limitada para suplementar los programas de crianzas de cultivos para seleccionar endogámicos e híbridos convenientes. En general, estos procedimientos se han usado para identificar los marcadores genéticos que corresponden a un sitio conveniente o no (por ejemplo un "sitio del rasgo cuantitativo" o QTL) , en plantas bajo análisis. Los marcadores genéticos representan (marcas de ubicación de) sitios específicos en el genoma de una especie o especies estrechamente relacionadas, y el muestreo de diferentes genotipos de estos sitios de marcadores revela la variación genética. La variación genética del sitio del marcador puede luego ser descrita y aplicada a los estudios genéticos, crianza comercial, diagnósticos, análisis cladísticos de variancia, o la realización del genotipo de muestras. Debido a que los métodos moleculares son convenientes para el análisis de alta producción y debido a que ellos no requieren la prueba del rendimiento, se pueden usar para acelerar el proceso del desarrollo de cultivos. Sin embargo, aunque estas técnicas son de uso considerable y pueden y aumentan la eficiencia de los programas de crianza de cultivos, ellas no se usan actualmente, o son útiles, como un pronóstico para el mayor fenómeno general de la heterosis . Por lo tanto, existe la necesidad en la técnica de determinar cómo el método molecular u otros métodos de alta producción, o modelos, pueden ser aplicados para predecir la heterosis en organismos individuales y en poblaciones. La presente invención suministra un número de descubrimientos fundamentales que hacen posible correlacionar los métodos moleculares y el fenómeno de la heterosis, al igual que una variedad de aspectos adicionales, que serán evidentes en la revisión completa.
COMPENDIO DE LA INVENCIÓN Se ha descubierto que el número de productos de genes, expresados en niveles óptimos en un organismo, tal como una planta, se correlaciona con el grado de heterosis que el organismo exhibe. Así, por el perfilado de la expresión del ARN o la proteína en un tejido de una planta, es posible predecir el nivel de heterosis que la planta exhibe, si se prueba para un rasgo heterótico, como el rendimiento. El uso de esta correlación permite la selección inicial de los organismos, tal como los cultivos comerciales, sin la prueba real en el campo. Debido a la naturaleza de alta producción de los métodos moleculares, que se pueden usar para la expresión del perfil, esta selección inicial acelera drásticamente el proceso de aumentar los rasgos deseados (y disminuir los rasgos inconvenientes) , que resulta en un aumento en el régimen, por ejemplo, de la mejora de la cosecha. Se ha descubierto adicionalmente que hay una correlación entre el número de los productos de expresión dominantes y aditivos y la heterosis que exhibe un organismo, tal como una planta. Como antes, la determinación del número (y/o relación) de los productos de expresión dominante y/o aditivos, permite la selección de plantas para la heterosis, sin la prueba de campo. En todos los casos, los métodos de perfilado se usan para determinar el número y/o relación relativa de cualquiera o todos los productos de expresión aditivos, dominantes o sub- o sobre-dominantes, proporcionando así métodos para la selección de plantas con heterosis aumentada, con base en los perfiles de expresión observados. Además, son provistos métodos de modelación para pronosticar cuáles cruces de un panel de cruces potenciales son más probables que resulten en aumentos en el número de genes expresados, o el número o relación de los genes aditivos o dominantes, o que reduzcan al mínimo la relación de los genes sub- o sobre-dominantes . Se suministran nuevos métodos de selección para obtener plantas convenientes y las plantas obtenidas por estos métodos.
Se ha descubierto adicionalmente que el gene inactivos juegan un papel en la heterosis. Así, vigilando la inactividad de los genes, es posible identificar cuáles genes son responsables de la heterosis. Así, en un aspecto, el ácido nucleico heterólogo que resulta en la expresión de los productos de expresión de los genes inactivos (por ejemplo, los productos dominantes o aditivos) se introducen en una planta objetivo. Ejemplos de ácidos nucleicos heterólogos apropiados incluyen uno o más de: un factor de trascripción que activa un promotor desde un gene inactivo, un ácido nucleico codificado por el gene inactivo, bajo el control de un promotor heterólogo, y un homólogo del ácido nucleico al gene inactivado con al menos una región de diferencia con este gene inactivo, este ácido nucleico homólogo puede recombinarse con el gene inactivo para producir un gene modificado. Cualquiera de estos ácidos nucleicos puede ser clonado bajo el control de promotores heterólogos y colocado en las plantas objetivo para aumentar la heterosis de las plantas objetivo. En formas de realización convenientes de los presentes métodos, los sistemas integrados, que comprenden bases de datos de computadora, que tienen información del perfil de expresión, pueden ser usados para seleccionar cuáles cruces de padres son más probables resulten en un aumento en el número de productos de expresión (o una optimización de los productos de expresión de una clase seleccionada, es decir, dominante, sub-dominante, sobre- dominante, aditiva o similar) de descendencia. Así la consideración de la información del perfil de expresión 5 suministra no sólo una base para seleccionar híbridos de los cruces, sino, usando los presentes métodos, también identifica los cruces convenientes que se van a hacer. La producción y consideración automática de las bases de datos del perfil de expresión también suministra un mecanismo para 10 la identificación de la fuente genética de los productos de expresión particulares, indicando así la probable ascendencia de los híbridos dados. La invención suministra adicionalmente métodos de clonación y la transducción de plantas o animales objetivos 15 con los genes dominantes, aditivos, sub-dominantes y sobre- dominantes, identificados por al examen comparativo de los perfiles de expresión.
BREVE DESCRIPCIÓN DE LAS FIGURAS 20 La Figura 1 es una proyección dispersa que muestra la correlación entre el grado de heterosis y el porcentaje de relación. La Figura 2 es un conjunto de gráficas de barra, que muestran la clasificación de los patrones de expresión 25 de genes en padres híbridos vs . endogámicos. ^^^^^^g^^^^ m_ á_ ____m__________________ __á__m La Figura 3 es una gráfica de línea que muestra la correlación entre el patrón de la expresión de genes y la heterosis . La Figura 4 es un conjunto de gráficas de barras, 5 que muestra la expresión del ARN dominante, aditiva y sobre- / sub- dominante. La Figura 5 es una gráfica dispersa que muestra la correlación entre los efectos de los padres en la expresión de genes y la heterosis. 10 las Figuras 6a-c es un conjunto de ilustraciones esquemáticas, que muestran los productos dominantes polimórficos y sus secuencias (SEQ ID NOS. 1-23, respectivamente) . 15 DEFINICIONES Un "perfil de expresión" es el resultado de detectar una muestra representativa de los productos de expresión desde un tejido celular o el organismo entero, o una representación (imagen, gráfica, tabla de datos, base de 20 datos, etc.) de la misma. Por ejemplo, muchos productos de expresión del ARN o una célula o tejido, pueden simultáneamente ser detectados en un arreglo de ácido nucleico o por la técnica de la exhibición diferencial o su modificación, tal como la tecnología de "GeneCalling™" de 25 Curagen. Similarmente, los productos de expresión de _¡_a_tlUíííídt__i^j?__u_¡t_. _ . proteína pueden ser probados por varios métodos de detección de proteínas, tal como la hibridización al péptido o arreglos de anticuerpos, o por la clasificación de colecciones de exhibición de fagos. Una "porción" o "sub-porción" de un perfil de expresión o un "perfil parcial", es un subconjunto de los datos provistos por el perfil completo, tal como la información suministrada por un subconjunto del número total de los productos de expresión detectados . Un "producto de expresión" es cualquier producto trascrito en una célula desde un ADN (por ejemplo de un gene) o trasladado de un ARN (por ejemplo, una proteína) . Los productos de expresión de ejemplo incluyen los mAR? y las proteínas. Una "muestra representativa" de los productos de expresión, por ejemplo, de una celda particular, tejido u organismo entero, es un número suficientemente grande de productos de expresión que se puede obtener con la comparación estadística al número real y/o tipo de productos de expresión entre diferentes células, tejidos u organismos completos. Idealmente, al menos un 50% y típicamente un 60%, 70%, 80%, 80%, 95% o 100% de los productos de la expresión total, que se pueden detectar por una técnica dada, constituyen la "muestra representativa" . Esta muestra representativa incluirá típicamente un número grande de productos de expresión, o células, tejidos y organismos, que producen típicamente un número suficientemente grande de productos de expresión. Por ejemplo, una muestra representativa típica de los productos de expresión incluyen entre alrededor de 100 y 20,000 o más de productos de expresión, por ejemplo, alrededor de 100-500, 1,000, 1,500, 2,000, 2,500, 3,000, 3,500, 4,000, 4,500, 5,000, 5,500, 6,000, 6,500, 7,000, 7,500, 8,000, 8,500, 9,000, 9,500, 10,000, 10,500, 11,000, 11,500, 12,000, 12,500, 13,000, 13,500, 14,000, 14,500, 15,000, 15,500, 16,000, 16,500, 17,000, 17,500, 18,000, 18,500, 19,000, 19,500, 20,000 ó 30,000 productos de expresión y similares. El término de "correlación" , a no ser que se indique de otra manera, se usa aquí para indicar que existe una "asociación estadística" entre, por ejemplo un producto de expresión y el gado de heterosis. La expresión de "dominante" para un producto de expresión, se refiere a la situación donde la expresión del producto en una progenie difiere de un padre, pero no del otro, para el producto de expresión. La expresión de "aditivo" para un producto de expresión, se refiere a la situación donde la expresión del producto en la progenie cae dentro del intervalo de los dos padres (y puede o no diferir de ambos padres) . La expresión de "sobre-dominante" o de "sub-dominante, para un producto de expresión se refiere a la situación donde la expresión de un producto de expresión en una progenie difiere de ambos padres y cae fuera del intervalo de los dos padres, o sobre el valor mayor del padre, o bajo el valor menor del padre, respectivamente (Figura 2) . Además, el término de "difiere", cuando se refiere a los valores, es dependiente de las tecnologías que se utilizan. Por ejemplo, cuando se usa la tecnología de "GeneCalling™" de Curagen, cualquier diferencia en el valor menor de aproximadamente 1.5 a 2.0 veces diferente de un padre dado, se considera no difiere. Una "muestra biológica" es una porción del material aislado de una fuente biológica, tal como una planta, un tejido de planta aislado, o una célula de la planta, o una porción del material obtenido de tal fuente, tal como un extracto celular, o similar. Un "promotor" es un arreglo de secuencias de control de ácido nucleico, que dirigen la transcripción de un ácido nucleico. Según se usa aquí, un promotor incluye las secuencias necesarias del ácido nucleico cerca del sitio de partida de la trascripción, tal como, en el caso de un promotor de tipo polimerasa II, un elemento TATA. Un promotor también incluye, opcionalmente, elementos distales de aumento o represión, que pueden estar colocados tanto como varios miles de parejas básicas desde el sitio de partida de la trascripción. Un promotor "constitutivo" es un promotor que es activo en un organismo seleccionado bajo la mayoría de las condiciones ambientales o de desarrollo. Un promotor "inducible" es un promotor que está bajo la regulación ambiental o de desarrollo en un organismo seleccionado. La frase de "plantas híbridas" se refiere a plantas que resultan de un cruce entre individuos diferentes genéticamente . La frase de "cruzada sexualmente" o de "reproducción sexual" en el contexto de las semillas de las plantas de cultivo se refiere a la fusión de gametos para producir, por ejemplo, una semilla por polinización. Un "cruce sexual" es la polinización de una planta por otra. "Propia" es la producción de, por ejemplo, una semilla, por auto-polinización, es decir, donde el polen y el óvulo son de la misma planta. La frase de "padres de prueba" se refiere a un padre que es genéticamente diferente de un conjunto de líneas a las cuales se cruza. El cruce es para fines de evaluar las diferencias entre las líneas en la combinación de cruce superior. El uso de un padre de prueba en un cruce sexual permite a un experto determinar las diferencias genéticas entre las líneas probadas en el rasgo fenotípico con la expresión del sitio de rasgo cuantitativo en una combinación híbrida.
Las frases de "combinación de cruce superior" y "combinación híbrida" se refieren al proceso de cruzar un padre de prueba sencilla con líneas múltiples. El propósito de producir tales cruces es evaluar la capacidad de las líneas en producir fenotipos deseados en la progenie híbrida derivada de la línea por el cruce del probador. La frase de "planta transgénica" se refiere a una planta en la cual los polinucleótidos exógenos se han introducido por cualquier proceso, además del cruce sexual o el cruce propio. Ejemplos de procesos por los cuales se pueden lograr, se describen abajo e incluyen la transformación mediada por Agrobacterium, métodos biolíticos, electroporación, en técnicas de plantas, y similares. Tal planta que contiene los polinucleótidos exógenos se refiere aquí como una planta transgénica de generación Ri . Las plantas transgénicas pueden también surgir del cruce sexual o por el auto-cruce de las plantas transgénicas en las cuales se han introducido los polinucleótidos exógenos.
DESCRIPCIÓN DETALLADA REVISIÓN DE LA SELECCIÓN DE HETEROSIS La mejora de cultivos depende extensamente en el fenómeno de la heterosis. Los endogámicos y/o híbridos se cruzan para producir híbridos heteróticos con rasgos deseados, tal como alta producción, resistencia a enfermedades, resistencia al calor, frío, salinidad, insectos, hongos, herbicidas, pesticidas, etc. Los rasgos deseados secundarios, tal como un tamaño o configuración particular de mazorcas o espigas, contenido de sólidos, contenido de azúcar, contenido de aceite, contenido de agua, etc., pueden también ser afectados por la heterosis. La presente invención establece varias correlaciones entre la expresión de los productos de genes y la heterosis, por ejemplo, con respecto al rendimiento. Ellas incluyen la asociación estadística entre el número de productos de genes y el grado de heterosis exhibido; una asociación estadística entre el número de productos de genes con un patrón de expresión dominante y el grado de heterosis exhibida y una asociación estadística con el número de productos de genes, con un patrón de expresión aditivo y el grado de heterosis exhibido. Además, se descubrió que los genes son inactivos durante la forma endogámica de las plantas. Estas correlaciones suministran nuevos métodos de seleccionar los híbridos heteróticos, sin la necesidad de probar en el campo cada híbrido para vigilar los rasgos heteróticos. En los métodos, la expresión de una primera muestra representativa de primeros productos de expresión (por ejemplo, los ARN o proteínas) se perfila de una primera planta de progenie (por ejemplo, un híbrido resultante del cruce de dos o más líneas de padres) . Los productos de expresión producidos en la primera planta de progenie se cuantifican y/o vigilan por el tipo del producto de expresión (aditivo, dominante, sub-dominante, sobre-dominante, etc.). Como se notó antes, el número de primeros productos de expresión producidos en la primera planta de progenie está asociado estadísticamente con una medida de la heterosis en la primera planta de progenie, como el número de los productos de expresión dominante, aditivo, subdominante o sobre-dominante o inactivo. La planta es luego seleccionada (por ejemplo contra medidas similares para una segunda planta de progenie, o una población de plantas de progenie, o contra la cepa de los padres) para la prueba ulterior basada en el número o tipo de los productos de expresión detectados. Así, la planta puede ser seleccionada de una o más características, que incluyen: un número seleccionado de los productos de expresión, un número seleccionado de los productos de expresión dominantes, una relación seleccionada de los productos de expresión dominantes a los productos de expresión totales, un número deseado de productos de expresión sobre- o sub-dominantes, una relación seleccionada de los productos de expresión sobre- o sub-dominantes a los productos de expresión totales, un número seleccionado de los productos de expresión aditivos, y una relación seleccionada de los productos de expresión aditivos a los productos de expresión totales. Típicamente, la primera planta de progenie se selecciona para llevar al máximo el número de los productos de expresión dominantes y/o llevar al máximo el número de los productos de expresión aditivos, y/o reducir al mínimo el número de los productos de expresión sobre- o subdominantes. Los cruces pueden también ser seleccionados para reducir al mínimo la inactividad en la planta progenie. Las plantas de padres usadas para producir la primera progenie, pueden también ser perfiladas. Los perfiles de expresión resultantes de los padres, sirven a cualquiera de una variedad de propósitos. Los perfiles de expresión de los padres se pueden comparar con el primer perfil de progenie, para ayudar en determinar si la progenie muestra un aumento en el número de los productos de expresión, en comparación con las cepas de padres (indicando así que la progenie va a ser probablemente heterótica) . Además, la comparación entre los perfiles de expresión de padres y el perfil de progenie se usa para determinar si los productos de expresión individuales, representados en el perfil, son dominantes, aditivos, sub-dominantes, sobre-dominantes, o similares. Los perfiles de expresión de los padres pueden también ser colocados en una base de datos para ayudar en determinar cuáles cruces más probablemente producirán híbridos heteróticos. Potencialmente, los cruces deseados entre los miembros de la base de datos se seleccionan identificando las plantas que probablemente producirán plantas de progenie con un número seleccionado de productos de expresión, que son dominantes, sobre-dominantes, sub-dominantes o aditivos. Por ejemplo, los padres se seleccionan para producir la primera planta de progenie seleccionando la expresión complementaria de los productos de expresión dominantes o aditivos, entre los padres, o seleccionando contra la expresión de los productos de expresión sobre-dominantes o sub-dominantes en los padres . Una asociación estadística adicional se refiere a la relación entre las plantas de los padres y progenie. Se descubrió que las plantas que exhiben un perfil de expresión, que es más similar a la planta maternal que a la planta paternal, pueden ser más heteróticas. Por lo tanto, la comparación de los perfiles de expresión maternal, paternal y de progenie, pueden ser usados para vigilar esta relación. Además, múltiples cruces a un solo tipo femenino se pueden hacer (o los resultados pronosticados por la compasión en una base de datos) y clasificados en progenie (o pronosticados) para similaridad al tipo femenino. Como se notó antes, la inactividad se determinó juega un papel significante en la pérdida de la heterosis, debida a la endogamia. Por lo tanto, comparando las plantas de padres y de progenie es posible determinar cuáles genes son inactivos. Estos genes pueden ser rescatados, por ejemplo, clonando los genes inactivos y colocándolos bajo el control de los promotores heterólogos, u otras estrategias mencionadas aquí, y transducir los genes de nuevo en plantas objetivo (por ejemplo, las líneas de padres, los híbridos, o cualquier otra planta) . Además, compilando la información de base de datos por la cual los genes son inactivos en los endogámicos, es posible disminuir la inactivación en híbridos seleccionando los cruces donde los padres tengan padres complementarios. Es también posible usar estos métodos para aumentar el desempeño (por ejemplo, gran rendimiento, capacidad de resistencia, etc.) de las propias líneas endogámicas. La primera planta de progenie seleccionada por cualquier método de la presente, o una planta de progenie subsiguiente, o una planta transgénica, como se describió antes, puede ser sometida a cualquiera de las pruebas de campo apropiadas para vigilar una o más cualidades deseadas. Así, la primera planta de progenie, o su planta de progenie subsiguiente, puede ser probada para una cualidad fenotípica deseada. Esta cualidad fenotípica se puede comparar entre la primera planta de progenie, o una planta de progenie subsiguiente, y una planta híbrida o endogámica seleccionada. El perfil de expresión de la planta híbrida o endogámica seleccionada se puede comparar a un perfil de expresión de la primera planta de progenie, o la planta de progenie subsiguiente. Los ácidos nucleicos, expresados diferencialmente entre las plantas híbridas o endogámicas seleccionadas y la primera planta de progenie o la planta de progenie subsiguiente, se identifican como objetivos para la clonación. Similarmente, los genes que se expresan en los híbridos de alto rendimiento que no son expresados en híbridos de bajo rendimiento, pueden ser determinados por comparaciones de los perfiles de expresión para los híbridos de alto y bajo rendimiento. Los ácidos nucleicos de (o que corresponden a) los genes expresados diferencialmente son clonados por introducción en los ácidos nucleicos objetivo. Después de identificar cuáles productos de expresión de la muestra representativa, que muestran un patrón de expresión aditivo, dominante, sub-dominante o sobre-dominante, para al menos una porción de la muestra representativa, o un ácido nucleico que corresponde al producto de expresión, pueden ser clonados. El ácido nucleico clonado puede luego ser transducido en plantas objetivo para probar si el ácido nucleico codifica a una cualidad útil, o para mejorar las cualidades en la planta objetivo. Detalles adicionales en el perfil de expresión, clonación de ácidos nucleicos, selección de híbridos, sistemas integrados, métodos de clasificación y similares, se indican abajo.
PERFILADO DE EXPRESIÓN Como se indica abajo, se pueden perfilar una variedad de tejidos, con los tejidos inmaduros siendo perfilados preferiblemente. Estos tejidos inmaduros son preferidos debido a que aumentan el régimen en el cual los cultivos pueden ser clasificados, ya que una planta no tiene que crecer hasta la madurez. Sin embargo, esencialmente cualquier tejido, como la planta entera, se puede perfilar. Una variedad de métodos de perfilado están disponibles, que incluyen la hibridización de los ácidos nucleicos amplificados o expresados a un arreglo de ácido nucleico, hibridización de los polipéptidos expresados a un arreglo de proteínas, hibridización de los péptidos o ácidos nucleicos a un arreglo de anticuerpos, hibridización de substracción, exhibición diferencial y otras.
CULTIVOS QUE SE VAN A PERFILAR Las plantas de padres o progenie pueden ser endogámicas o híbridas. Más comúnmente, la planta de progenie es un híbrido, producida por el cruce de dos diferentes líneas endogámicas, o el cruce de una línea endogámica y una línea de híbrido, o el cruce de dos líneas de híbridos (que son el resultado del cruce de líneas endogámicas o híbridas) , o el cruce de más de dos líneas (por ejemplo, para generar plantas poliploides o recombinantes) en un solo cruce. Una vez que un híbrido heterótico deseado se identifica, puede ser tratado como tales híbridos están típicamente en los esquemas de crianza, por ejemplo pueden ser producidos en cantidad como semillas, puede ser un cruce superior a líneas endogámicas para producir una planta híbrida de 3 vías; puede ser auto-cruzada para producir más líneas endogámicas, o similares. La mayoría, si no todas, las plantas y animales muestran el vigor del híbrido. Mucha de la presente discusión se refiere a cultivos valiosos comercialmente, ya que son objetivos importantes de los métodos de la invención. Sin embargo, los métodos son generales y se pueden aplicar a plantas de cultivo no comerciales, hongos, y a la producción de animales, que incluyen las aves de corral, ganado, ovejas, cerdos y similares. Cultivos comerciales importantes incluyen tanto monocotiledóneas como dicotiledóneas. Las monocotiledóneas, tal como las plantas de la familia de los pastos (Gramineae) , tal como las plantas en las subfamilias Fetucoideae y Poacoidae, que juntas incluyen varios cientos de géneros, que incluyen las plantas en los géneros de Agrostis, Phleum, Dactylis, Sorgum, Setaria, Zea (por ejemplo el maíz) , Oryza (por ejemplo el arroz) , Tri ticum (por ejemplo el trigo), Sécale (por ejemplo el centeno), Avena (por ejemplo las avenas) , Hordeum (por ejemplo la cebada) , Saccharum, Poa, Festuca, Stenotaphrum, Cynodon, Coix, las Olyrae, Phareae y muchas otras. Las plantas en la familia de Gramineae son plantas objetivo particularmente preferidas para los métodos de la invención. Objetivos preferidos adicionales incluyen otros cultivos comercialmente importante, por ejemplo de las familias de Composi tae (la familia más grande de plantas vasculares, que incluyen al menos 1,000 géneros, que comprenden los cultivos comerciales importantes, tal como el girasol) , y Leguminosae o "familia de los guisantes", que incluyen varios cientos de géneros, que comprenden muchos cultivos valiosos comercialmente, tal como el guisante, frijol, lenteja, cacahuate, camote, caupí, frijol velludo, soya, trébol, alfalfa, lupino, algarroba, loto, trébol dulce, glicina y guisante dulce. Cultivos comunes aplicables a los métodos de la invención incluyen el maíz (Zea mays) , arroz, soya, sorgo, trigo, avenas, cebada, mijo, girasol y cañóla.
TEJIDOS QUE SE VAN A PERFILAR Como se mencionó antes, una ventaja de la presente invención es que los métodos pueden ser realizados sin la necesidad de la prueba en el campo de la progenie (la prueba en el campo puede, por supuesto, ser usada como parte de, o junto con los otros métodos de la presente) . Una extensión de esta ventaja es que los tejidos inmaduros pueden ser perfilados desde una planta de prueba, que acelera el 5 proceso de prueba. Así, aunque los perfiles de expresión se pueden realizar de cualquier tejido o del organismo completo, en una modalidad preferida, las muestras representativas son de tejidos inmaduros o plantas inmaduras. Por ejemplo, una espiga inmadura de la planta, o 10 una planta total pequeña (o cualquiera de sus tejidos) puede ser perfilada. Se apreciará que cuando se realizan compasiones, ellas se ejecutan típicamente entre los perfiles de expresión, obtenidos del mismo tejido y la etapa de desarrollo (y las condiciones ambientales) para las 15 plantas que se comparan.
PERFILADO DEL ARN En una modalidad preferida, los productos de expresión que se detectan en los métodos de la invención, 20 son ARN, por ejemplo los mARN expresados de genes dentro de una célula de la planta o tejido perfilado. Un número de técnicas están disponibles para detectar los ARN. Por ejemplo, la hibridización de la mancha Northern, es ampliamente usada para la detección del ARN, y 25 se enseña generalmente en una variedad de textos estándar en MMrfMWMiÉÉÍÉaiBlfc.1 r ll i! t » l i i . .i >? - la biología molecular, que incluyen: Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology, volumen 152, Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (2a Ed.). Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") y Current Protocols in Molecular Biology, F. M. Ausubel et al., Eds. Current Protocols, una sociedad entre Greene Publishing Associates Inc, . y John Wiley & Sons, Inc. (suplementada a través de 1998) ("Ausubel")). Asimismo, un experto en la materia apreciará que esencialmente cualquier ARN puede ser convertido en un ADN de cordones dobles, usando una enzima de transcriptasa inversa y una polimerasa. Véase, Ausubel, Sambrook y Berger, antes mencionado. Así, la detección de los mARN puede ser realizada convirtiendo, por ejemplo el mARN en ADN, que son detectados subsiguientemente en, por ejemplo, un formato estándar de la "mancha Southern" . Asimismo, los ADN pueden ser amplificados para ayudar en la detección de moléculas raras por cualquiera de un número de técnicas bien conocidas, que incluyen la reacción de cadena de polimerasa (PCR) , la reacción de cadena de ligasa (LCR) , la amplificación de la Qß-replicasa y otras técnicas mediadas por la polimerasa del ARN (por ejemplo, NASBA) . Ejemplos de estas técnicas se encuentran en Berger, Sambrook y Ausubel, antes mencionados, al igual que en Mullís et al., (1987), patente de EE.UU. No. 4,683,202; PCR Protocols A Guide to Methods and Applications (Innis et al., Eds.Academic Press, Inc., San Diego, CA (1990) (Innis); 5 Arnheim & Levinson (octubre 1, 1990) C&EN 36-47; The Journal of NIH Research (1991) 3, 81-94; Kwoh et al., (1989) Proc Nati, Acad. Sci. USA 86, 1173; Guatelli et al., (1990) Proc. Nati, Acad. Sci. USA 87, 1874; Lomell et al., (1989) J. Clin. Chem. 35, 1826; Landegren et al., (1988) Science 241, 10 1077-1080 ; van Brunt (1990) Biotechnology 8, 291-294 ; Wu y Wallace (1989) Gene 4, 560; Barringer et al., (1990), Gene 89, 117 y Sooknanan y Malek (1995) Biotechnology 13 ; 563- 564. Métodos mejorados de clonación in vi tro de ácidos nucleicos amplificados se describen en Wallace et al . , 15 patente de EE.UU., No. 5,426,039. Métodos mejorados de amplificar ácidos nucleicos grandes por la PCR se resumen en Cheng et al., (1994) Nature 369: 684-685 y las referencias ahí mencionadas, en donde los amplicones de la PCR de hasta 40 kb son generados. Un experto apreciará que esencialmente 20 cualquier ARN se puede convertir en un ADN de cordón doble, adecuado para la digestión de restricción, la expansión de la PCR y la formación de secuencia usando la transcriptasa inversa y una polimerasa. Véase Ausubel, Sambrook y Berger, todos supra . ni T-G - r tf*? ** - Estos métodos generales se pueden usar para el perfilado de expresión. Por ejemplo, los arreglos de sondas pueden ser colocados sobre una superficie y los productos de expresión (o los ácidos nucleicos amplificados in vi tro, que corresponden a los productos de expresión) pueden ser rotulados e hibridizados con el arreglo. Por conveniencia, puede ser útil usar varios arreglos simultáneamente. Se espera que un experto en la materia este familiarizado con la hibridización de ácidos nucleicos. Métodos generales de hibridización se encuentran en Berger, Sambrook y Ausubel, supra , y además en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Acid Probes, por ejemplo parte I, capítulo 2, "Revisión de los principios de hibridización y la estrategia de los ensayos de sonda del ácido nucleico," Elsevier, New York. En una variante útil de estos métodos, los arreglos de fase sólida son adaptados para la detección, rápida y específica, de nucleótidos polimórficos múltiples. Típicamente, una sonde de ácido nucleico se enlaza químicamente a un soporte sólido y un ácido nucleico objetivo (por ejemplo un ARN o el ADN amplificado correspondiente) se hibridiza a la sonda. Cualquiera de la sonda, o el objetivo, o ambos, pueden ser rotulados, típicamente con un fluoróforo. Donde se rotula el objetivo, la hibridización se detecta por detectar la fluorescencia de enlace. Donde la sonda se rotula, la hibridización es detectada típicamente por extinción del rótulo por el ácido nucleico de enlace. Cuando se rotulan tanto la sonda como el objetivo, la detección de la hibridización se ejecuta típicamente vigilando un desplazamiento de señal, tal como un cambio en el color, extinción fluorescente, o similares, que resultan de la proximidad de los dos rótulos de enlace. En una modalidad de este concepto, un arreglo de sondas se sintetizan en un soporte sólido. Usando las tecnologías de enmascarado de fragmentos y la química fotoprotectora, es posible generar arreglos ordenados de sondas de ácido nucleico con grandes números de sondas. Estos arreglos, que son conocidos, por ejemplo como "fragmentos del ADN" o como arreglos de polímeros inmovilizados de escala grande (arreglos "VLSIPS™) pueden incluir millones de regiones de sonda definidas en un substrato, que tiene un área de aproximadamente 1 cm2 hasta varios cm2. Además de las tecnologías fotoenmascaradoras, los arreglos productos químicos, de ácidos nucleicos, de proteínas y similares pueden también ser aprestados sobre un substrato sólido usando las tecnologías de impresión. La construcción y uso de los arreglos de ácidos nucleicos de fase sólida para detectar los ácidos nucleicos objetivo, se describe en la literatura ampliamente. Véase Fodor et al., Science 251 :767 (1991) ; Sheldon, et al, Clin., Chem. 39(4) : 718 (1993) ; Kozal et al., Nature Medicine 2(7) : 753 (1996) y Hubbell, patente de EE.UU., No. 5,571,639. En breve, una estrategia combinatoria permite la síntesis de los arreglos que contienen un gran número de sondas usando un número mínimo de etapas sintéticas. Por ejemplo, es posible sintetizar y unir todos los oligonucleótidos de 8 mer del ADN posibles (48 o 65,536 combinaciones posibles) usando sólo 32 etapas sintéticas químicas. En general, estos procedimientos suministran un método para producir 4n diferentes sondas de oligonucleótidos sobre un arreglo que usa solamente 4n etapas sintéticas. La síntesis combinatoria dirigida por luz de los arreglos de oligonucleótidos sobre la superficie de vidrio se ejecuta con la química de la fosforamidita automática y las técnicas de enmascaramiento de fragmentos, similares a las tecnologías de capas foto-resistentes en la industria de chips de computadora. Típicamente, una superficie de vidrio se derivatiza con un reactivo de silano que contiene un grupo funcional, por ejemplo un hidroxilo (para arreglos de ácido nucleico) o un grupo de amina (para arreglos de péptidos o de péptidos-ácido nucleico) bloqueados por un grupo protector inestable a la luz. La fotolisis a través de la máscara fotolitográfica se usa para exponer selectivamente los grupos funcionales, los cuales están luego listos para reaccionar con las fosforamiditas de nucleósidos 5' -protegidas, Las fosforoamiditas reaccionan solamente con esos sitios que son iluminados (y se exponen así por remoción del grupo bloqueador inestable a la luz) . Así las fosforoamiditas sólo se agregan a esas áreas expuestas selectivamente de la etapa precedente. Estas etapas se repiten hasta que el arreglo deseado de secuencias se ha sintetizado sobre la superficie sólida. La síntesis combinatoria de los diferentes análogos de oligonucleótidos en diferentes ubicaciones en el arreglo, se determina por el patrón de iluminación durante la síntesis y el orden de adición de los reactivos de acoplamiento. La vigilancia de hibridización de los ácidos nucleicos objetivo al arreglo se ejecuta típicamente con microscopios de fluorescencia o microscopios de exploración láser. Además de ser capaces de diseñar, construir y usar los arreglos de sondas, usando técnicas disponibles, un experto en la materia también podrá ordenar los arreglos hechos por el cliente y los dispositivos de lectura de arreglos de los fabricantes especializados en la fabricación de arreglos. Por ejemplo, Affymetrix Corp., en Santa Clara, CA, fabricantes de arreglos de ácidos nucleicos. Se apreciará que ese diseño de sonda es influenciado por la aplicación intentada. Por ejemplo, cuando varias interacciones de sonda-objetivo, específicas de alelos, se van a detectar en un ensayo sencillo, por ejemplo en un fragmento sencillo de ácido nucleico, es conveniente tener temperaturas de fusión similares para todas las sondas. Por lo tanto, la longitud de las sondas se ajusta de modo que las temperaturas de fusión para todas las sondas en el arreglo sean estrechamente similares (se apreciará que diferentes longitudes para diferentes sondas, pueden ser necesarias para lograr una Tm particular, donde diferentes sondas tienen diferentes contenidos de GC. Aunque la temperatura de fusión es una consideración primaria en el diseño de sondas, otros factores son también usados opcionalmente para ajustar más la construcción de la sonda, tal como la eliminación del estado de auto-complementariedad en la sonda (que puede inhibir la hibridización de un nucleótido objetivo) . Las técnicas para diseñar y usar conjuntos de sondas para la clasificación de muchos ácidos nucleicos, tal como los productos de expresión, simultáneamente y para vigilar la expresión en los arreglos de ácido nucleico, se describen en la patente EP 0799 897 Al. Una manera de comparar los productos de expresión entre dos poblaciones de células, es identificar las especies de mARN que son expresadas diferencialmente entre las poblaciones de células (es decir, presentes en diferentes abundancias entre las poblaciones de células) . Además de las técnicas de arreglos, antes mencionadas, otro método preferido es el uso de la hibridización de substracción (lee et al., (1991) Proc. Nati. Acad. Sci. 5 (U. S.A.) 88:2825) o la exhibición diferencial que emplea la reacción en cadena de la polimerasa (PCR) de un apresto arbitrario (Liang y Pardee (1992) Science 257-967) . Cada uno de estos métodos se ha usado por varios investigadores para identificar las especies de mARN expresadas diferencial - 10 mente. Véase, Salesiotis et al., (1995) Cáncer Lett . 92 :47 ; Jiang et al., (1995) Oncogene 10:1855 : Blok et al (1995) Prostate 26 : 213 ; Shinoura et al., (1995) Cáncer Lett. 89 :215 ; Murphy et al., (1993) Cell Growth Differ 4 :715 ; Austruy et al., (1993) Cáncer Res . , 52:2888; Zhang 15 et al., (1933) Mol . Carinog 8:123; y Liang et al., (1992) Cáncer Res. 52:6966) . Los métodos también se han usado para identificar las especies de mARN que son inducidas o reprimidas, por ejemplo por drogas o ciertos nutrientes (Fisicaro et al., (1995) Mol . Immunol . 32:565; Chapman et 20 al., (1995) Mol. Cell. Endocrinol , 108:109; Douglass et al., (1905) J. Neurosci, 15 : 2471 ; Aiello et al., (1994) Proc. Nati. Acad. Sci (U.S.A.) 91:6231. Ace et al (1994) Endocrinology 134:1305. Para la técnica de exhibición diferencial Liang y 25 Paredec (1992) , supra, se suministran cálculos teóricos para *^^g¡§g¡§^ la selección de los aprestos arbitrarios 5' y 3'. La correlación de los resultados observados a la teoría también se suministra. En la práctica, los aprestos 5' de menos de 9 nucleótidos pueden no suministrar la especificidad adecuada 5 (aprestos levemente más cortos de alrededor de 8 a 10 nucleótidos se han usado en los métodos de la PCR para el análisis de los polimorfismos del ADN. Véase también, Williams et al (1991) Nucleic Acids Research 18:6531). Los aprestos comprenden opcionalmente secuencias de la terminal 10 5', que sirven para anclar otros aprestos de la PCR (aprestos distales) y/o que comprenden un sitio de restricción o medio sitio u otro extremo que se puede ligar. Cuando un sitio de restricción o un modelo de amplificación para un segundo apresto se incorpora, los aprestos son 15 opcionalmente más grandes de aquéllos descritos anteriormente por la longitud del sitio de restricción, o el sitio del modelo de amplificación. Los sitios estándar de la enzima de restricción incluyen 4 sitios básicos, 5 sitios básicos, 6 sitios básicos, 7 sitios básicos y 8 sitios 20 básicos. Un sitio de modelo de amplificación para un segundo apresto puede ser esencialmente de cualquier longitud, por ejemplo, el sitio puede tener alrededor de 15-25 nucleótidos de longitud. Los productos amplificados son rotulados 25 opcionalmente y se resuelven típicamente por electroforesis ggg sobre un jul de poliacrilamida; las ubicaciones donde la etiqueta está presente son cortadas y las especies de productos rotulados se recuperan de la porción de gel, típicamente por elusión. Las especies de productos 5 recuperados resultantes, pueden ser subclonadas en un vector duplicable, con o sin la unión de enlazadores, amplificados más y/o detectados, o aún formarlos directamente en secuencias. Los métodos de formación de secuencias se describen en Berger, Sambrookl y Ausubel, supra . La 10 formación directa de secuencia de los amplicones generados de la PCR por incorporar selectivamente los nucleótidos resistentes a la nucleasa boronatada en los amplicones, durante la PCR, y la digestión de estos amplicones con una nucleasa para producir fragmentos de modelos dimensionados, 15 ya también se han propuesto (Porter et al., (1997) Nucleic Acids Research 25(8) :1611) . Se espera que un experto pueda usar, por ejemplo, la exhibición diferencial para el perfil de expresión. Además, las compañías, tal como la CuraGen Corp. (New Haven, 20 CT) suministran perfiles de expresiones robustas con base en las técnicas de exhibición diferencial modificada. Véase, por ejemplo, la patente WO 97/15690 por Rothberg et al. Por lo tanto, un experto puede tener un perfil de expresión ejecutado por las compañías que se especializan en tales 25 técnicas. - — -^f»ttßii*_>8_ __.
PERFILADO DE PROTEINA Además de perfilar los ARN (o los cADN correspondientes) , como se describió antes, es también posible perfilar proteínas. En particular, varias estrategias están disponibles para detectar muchas proteínas simultáneamente. Conforme se aplica a la presente invención, las proteínas detectadas, que corresponden a los productos de expresión, se pueden derivar de uno de al menos dos fuentes. Primera, las proteínas que se detectan pueden ser o directamente aisladas de una célula o tejido, para ser perfiladas, suministrando la detección directa (y, opcionalmente, la cuantificación) de las proteínas presentes en una célula. Segundo, los mARN pueden ser trasladados en las secuencias de cADN, clonados y expresados. Esto aumenta la habilidad de detectar los ARN raros, y hace posible asociar inmediatamente una proteína detectada con su secuencia de codificación. Para fines de la presente invención, no es necesario aún expresar los ácidos nucleicos en el marco de lectura apropiado, como está típicamente la presencia o ausencia de un producto de expresión, es decir, inicialmente, en la emisión. Aun una ausencia del péptido de marco es un indicador de la presencia de un ARN correspondiente .
Una variedad de técnicas de hibridización, que incluyen la mancha Western, ensayos ELISA y similares, están disponibles para la detección de proteínas específicas. Véase, Ausubel, Sambrook y Berger, supra . Véase también Antibodies; A Laboratory Manual, (1988) E. Harlow y D. Lañe, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY. Las técnicas basadas en la no hibridización, tal como la electroforesis de dos dimensiones, pueden también ser usadas para simultánea y específicamente detectar grandes números de proteínas. Una tecnología típica para detectar proteínas específicas implica obtener anticuerpos a las proteínas. Por detectar específicamente la unión de un anticuerpo y una proteína dada, la presencia de la proteína se puede detectar. Además de los anticuerpos disponibles, un experto puede obtener fácilmente anticuerpos usando las técnicas existentes, o modificando esos anticuerpos que están disponibles comercial o públicamente. Además de la técnica antes mencionada, métodos generales de producir los anticuerpos polioclonales y monoclonales se conocen por los expertos en la materia. Véase, por ejemplo, Paul (ed) (1998) Fundamental Immunology, Fourth Edition Raven Press, Ltd. New York Coligan (1991) Current Protocols in Immunology Wiley/Greene, NY, Harlow y Lañe (1989) Antibodies: A Laboratory Manual Cold Spring, Harbor Press, NY.; Stites et al (eds.) Basic and Clinical Immunology (4a Ed.) Lange Medical Publications, Los Altos CA, y las referencias ahí citadas; Goding (1986) Monoclonal Antibodies; Principies and Practice (2a ed.) Academic Press, New York, NY; y Kohler y Milstein (1975), Nature, 256;495-497. Otras técnicas adecuadas para la preparación de anticuerpos incluyen la selección de colecciones de anticuerpos recombinantes en fagos o vectores similares. Véase Huse et al., (1989) Science 246 ; 1275 ; y Ward et al., (1989) Nature 341:544-546. Los anticuerpos monoclonales y policlonales específicos y antisueros se unirán usualmente con un KD de al menos alrededor de 0.1 µM o preferiblemente al menos alrededor de 0.01 µM, o mejor, y más típica y preferiblemente, 0.001 µM o mejor. Según se usa aquí, un "anticuerpo" se refiere a una proteína que consiste de uno o más polipéptidos, substancial o parcialmente codificados por los genes de la inmunoglobulina o fragmentos de genes de la inmunoglobulina. Los genes de la inmunoglobulina reconocidos incluyen los genes de regiones constantes kappa, lambda, alfa, gamma, delta, épsilon y mu, al igual que innumerables genes de regiones variables de la inmunoglobulina. Las cadenas ligeras se clasifican como cualquiera de kappa o lamda. Las cadenas pesadas se clasifican como gamma, mu, alfa, delta o épsilon, que, a su vez, definen las clases de la inmunoglobulina IgG, IgM, IgA, IgD e IgE, respectivamente. Una unidad estructura de inmunoglobulina típica (anticuerpo) se conoce comprende un tetrámero. Cada tetrámero se compone de dos parejas idénticas de cadenas de polipéptido, cada pareja tiene una cadena "ligera" (alrededor de 25 kD) y una cadena "pesada" (alrededor de 50-70 kD) . La terminal N de ada cadena define una región variable de alrededor de 100 a 110 o más aminoácidos, primariamente responsables del reconocimiento del antígeno. Los términos de cadena ligera variable (VL) y cadena pesada variable (VH) se refieren a esas cadenas ligera y pesada, respectivamente. Los anticuerpo existen como inmunoglobulinas intactas o como un número de fragmentos, bien caracterizados, producidos por la digestión con varias peptidasas. Así, por ejemplo, la pepsina digiere un anticuerpo debajo de los enlaces de disulfuro en la región de bisagra para producir F(ab)'2, un dímero de Fab, que por sí mismo es una cadena ligera unida a VH-CHI por un enlace de disulfuro. El F(ab)'2 puede ser reducido bajo condiciones moderadas para romper el enlace de disulfuro en la región de bisagra, convirtiendo así el dímero de (Fab') 2 en un monómero de Fab' . El monómero de Fab' es esencialmente un Fab con parte de la región de bisagra (véase, Fundamental Immunology, W. E. Paul, ed. Raven, Press, N.Y. (1993), para una descripción más detallada de otros fragmentos de anticuerpos) . Mientras varios fragmentos de anticuerpos se definen en términos de la digestión de un anticuerpo intacto, un experto apreciará que tales fragmentos de Fab' pueden ser sintetizados de nuevo, o químicamente o utilizando la metodología del ADN 5 recombinante. Así, el término anticuerpo, según se usa aquí, también incluye fragmentos de anticuerpo o producios por la modificación de los anticuerpos enteros o sintetizados de nuevo usando las metodologías del ADN recombinante. Los anticuerpos incluyen anticuerpos de cadena sencilla, que 10 comprenden los anticuerpos Fv (sFv) de cadena sencilla, en los cuales una cadena pesada variable y ligera variable se unen entre sí (directamente o a través de un enlazador de péptido) para formar un polipéptido continuo. Para los fines de la presente invención, los 15 anticuerpos o fragmentos de anticuerpos pueden ser dispuestos, por ejemplo por acoplamiento, a una parte de amina fija a un arreglo de fase sólida, en una manera similar a la descrita anteriormente para la construcción de arreglos de ácido nucleico. Como antes para las sondas del 20 ácido nucleico, los anticuerpos pueden ser rotulados, o proteínas que corresponden a los productos de expresión pueden ser rotulados. De esta manera, es posible acoplar cientos, o aún miles, de diferentes anticuerpos en un arreglo. ^ ¿& &*®a 0tií& ^^®a^^^^^^^^^^ En una modalidad, la colección de exhibición de anticuerpos de bacteriófago es clasificada con un polipéptido codificado por una célula, u obtenido por la expresión de los mARN, exhibición diferencial, hibridización 5 de substracción o similar. Las colecciones combinatorias de anticuerpos se han generado en sistemas de expresión lambda de bacteriófagos, que se clasifican como placas bacteriófagas o como colonias de lisogenes (Huse et al., (1989), Science 246:1275: Catón y Koprowski (1990) Proc. 10 Nati. Acad. Sci. (U.S.A.) 87:6450; Mullinax et al (1990) Proc Nati. Acad. Sci. (U.S.A.) 87:8095; Persson et al (1991) Proc. Nati. Acad. Sci. (U.S.A.) 88:2432). Varias modalidades de colecciones de exhibición de anticuerpos bacteriófagos y colecciones de expresión de fagos lambda se han descrito 15 (Kang et al., (1991) Proc. Nati. Acad. Sci. (U.S.A.) 88:4363: Clackson et al., (1991) Nature 352:624: McCafferty et al (1990) Nature 348:552, Burton et al. (1991) Proc. Nati. Acad. Sci. (U.S.A.) 88:10134; Hoogenboom et al., (1991) Nucleic Acids Res. 19:4133; Chang et al., (1991 J. Immunol . 20 147:3610: Breitling et al., (1991) Gene 104:147; Marks et al., (1991) J. Mol. Biol. 222/581; Barbas et al., (1992) Proc. Nati. Acad. Sci. (U.S.A.) 89-4457; Hawkins y Winter (1992) J. Immunol . 22:867; Mars et al., (1992) Biotechnology 10 :779 ; Marks et al., (1992) J. Biol. Chem. 267 16007,; * j>ja TirWBfir'Tr • Lowman et al., (1991) Biochemistry 30; 10812; Lerner et al., (1992) Science 258:1313. Los patrones de hibridización que se detectan suministran una indicación de la presencia o ausencia de secuencias de proteínas. En tanto la colección o arreglo contra el cual una población de proteínas se van a clasificar, puede ser correlacionada de un experimento al siguiente (por ejemplo, notando las coordenadas x-y de la colección o el miembro de arreglo) , ninguna información de secuencia se requiere para comparar los perfiles de expresión de una muestra representativa a otra. En particular, la mera presencia o ausencia (o grado) de etiqueta suministra la capacidad de determinar diferencias. Una ventaja de usar las colecciones de anticuerpos para la detección de proteínas es que las colecciones individuales pueden estar sin caracterizar. En tanto los miembros de colección tienen una relación espacial establecida, por ejemplo de rejilla sobre una placa, placas duplicadas pueden ser obtenidas y patrones de etiquetas a la relación espacial establecida determinada. Más generalmente, la hibridización de los péptidos y ácidos nucleicos a los arreglos o colecciones (o aún geles bidimensionales sencillos) pueden ser tratados en una manera análoga a una etiqueta de código de barras. Cualquier colección diversa o arreglo, puede ser usado para clasificar la presencia o ausencia de moléculas complementarias, o de ARN o de ADN, proteínas o sus combinaciones. Midiendo la información de la señal correspondiente entre diferentes fuentes de material de prueba (por ejemplo diferentes plantas híbridas o endogámicas, o diferentes tejidos, o similares) , es posible determinar diferencias en los productos de expresión para las diferentes fuentes. Como se señala abajo, este proceso se facilita por varios sistemas integrados de alta producción señalados abajo. Además los acercamientos basados en arreglos, la espectrometría de masa está en uso para la identificación de granes conjuntos de proteínas en las muestras, y es adecuado para la identificación de muchas proteínas en una manera en secuencia o paralela. Por ejemplo, Hutchens et al., patente de EE.UU., No. 5,719,060, describe métodos y aparatos para la desorción e ionización de analitos para el análisis subsiguiente por la espectroscopia de masa y/o los biosensores. Los medios de presentar muestras con elementos de sonda con "Superficies Aumentadas para la Desorción / Ionización de Láser" (SELDI) descritas en la patente ? 060, es particularmente útil en el contexto de la presente invención; sin embargo, otros acercamientos, descritos en la patente x 060, son también aplicables generalmente a la presente invención.
Dos o tres acercamientos basados en gel, tridimensionales, pueden también ser usados para la identificación específica y simultánea y la cuantificación de gran número de proteínas de las muestras biológicas. La 5 tecnología de gel multi-dimensional es bien conocida y se describe, por ejemplo, en Ausbel, supra . Volumen 2, Capítulo 10. El análisis de imagen de geles de separación de proteínas multi-dimensionales, suministra una indicación de las proteínas que se expresan, por ejemplo en un tipo de 10 célula o tejido. Es valioso notar que la identificación de proteínas particulares no es necesaria; en lugar de ello, la información de posición y del patrón, por ejemplo, del teñido de proteínas o de patrones de fluorescencia, es suficiente para identificar los conjuntos de los productos 15 de expresión de las proteínas. Además de identificar los productos de expresión, tal como las proteínas o el ARN, es también posible clasificar números mayores de metabolitos en las muestras de células o de tejidos. La presencia, ausencia o nivel de un 20 metabolito pueden ser tratados como un carácter para fines de comparación, de la misma manera que los ácidos nucleicos o las proteínas, se discuten aquí. Los metabolitos pueden ser vigilados por cualquiera de los métodos disponibles actualmente, que incluyen la cromatografía, las separaciones iriiTüTil'" -tí""! de geles uni- o multi-dimensionales, la hibridización a moléculas complementarias, o similares La invención suministra métodos de identificar los cruces de plantas con un aumento en la probabilidad para la heterosis en las plantas de progenie. Por ejemplo, en un método preferido, los perfiles de expresión para una pluralidad de plantas se comparan, y los perfiles de expresión son considerados por la comparación en parejas. Los cruces convenientes producen progenie con un número seleccionado u óptimo de los productos de expresión, o progenie, con un número seleccionado o tipo de productos de expresión que exhiben un patrón de expresión dominante, aditivo, sobre-dominante o sub-dominante . Convenientemente, estas comparaciones se realizan en un sistema integrado que incluye una computadora. La generación y el uso de bases de datos de la información del perfil de expresión para realizar una variedad de comparaciones, es una característica de la invención. Debido al gran número de comparaciones entre los perfiles de expresión (que, como se notó antes, comprenden, por ejemplo, la información de detección de aproximadamente 1,000 hasta 20,000 o más productos de expresión), la manera más práctica de ejecutar las compasiones es haciendo entrar la información en una o más bases de datos y usando una computadora para hacer las comparaciones.
Una variedad de métodos comparativos se pueden realizar en un sistema integrado, por ejemplo, para determinar la heterosis (o probable heterosis) de un cruce. Por ejemplo, una medida sencilla que se puede comparar a través de los diferentes cruces reales o potenciales, para determinar la conveniencia de un cruce particular, es determinar la suma de los productos de gene expresados que difieren de una planta progenie en cada una de la primera y segunda planta de padres y el número de productos de gene expresados, que difieren entre la primera y segunda planta de padres. Cuanto mayor sea esta suma, típicamente, más conveniente es el cruce. En los presentes sistemas integrados, es también posible predecir los probables resultados de los cruces entre plantas de padres. En estos métodos, se generan las matrices de posibles combinaciones de perfiles de expresión para plantas. Por ejemplo, los perfiles de expresión se compilan en una base de datos en una computadora y una matriz de posibles combinaciones de perfiles de expresión en parejas para las plantas es generado y averiguado, usando un sistema integrado que comprende una computadora y el software, para generar y comparar matrices. Los subconjuntos de cruces potenciales de todas las posibles comparaciones en parejas, que exhiben un número máximo de diferencias de perfiles de expresión representan un cruce preferido. El software útil ayuda en determinar cuántos genes se expresan, o si los genes expresados son aditivos, dominantes, sobre- dominantes o sub-dominantes. Estas plantas se seleccionan como posibles cruces es a discreción del usuario. Es posible simplemente probar todos los posibles cruces de primer orden en una base de datos. Sin embargo, no es posible probar todos los posibles cruces subsecuentes, ya que el tamaño del conjunto para tal procedimiento es teóricamente infinito. Es decir, después de generar una matriz de progenie de productos de expresión para todos los posibles cruces de padres por parejas, la matriz de progenie se puede usar para generar un posible conjunto teórico de cruces entre la progenie hipotetizada, representada por la matriz de progenie y/o la base de datos original de los perfiles de expresión de padres. Una matriz de perfil de expresión resultante se puede generar para la progenie subsiguiente hipotetizada, la cual puede de nuevo ser comparada a cualquiera de la información de perfil de expresión precedente. En teoría, este proceso puede ser repetido ad infini tum. Más prácticamente, ciertas reglas se pueden llevar a cabo para reducir la cantidad total de cálculos que se van a realizar. Por ejemplo, la información de matriz puede ser limitada a posibles cruces en parejas para plantas de diferentes grupos heteróticos, o del mismo grupo heterótico.
Además, la fidelidad de la información del perfil de expresión varía crecientemente conforme se considera la información de cruce subsiguiente y, por supuesto, el número de posibles cruces aumenta. Por lo tanto, típicamente sólo 5 una de unas cuantas rondas de cruces potenciales se consideran en un momento. En cualquier caso, la selección de un subconjunto de cruces potenciales desde todas las posibles comparaciones en parejas, que exhiben un número máximo de diferencias de perfil de expresión es conveniente. 10 Una variedad de reglas para ejecutar las comparaciones básicas se puede usar. En una realización conveniente, los cruces se identifican en donde la suma de: (i) los productos de expresión producidos en una primera planta de un primer grupo heterótico (Ai) , el cual no se 15 expresa en una segunda planta desde el primer grupo heterótico (A) al cual la primera planta se cruza (Aj) , y los cuales no se expresan en una tercera planta seleccionada desde un segundo grupo heterótico (B) , más (ii) los productos de expresión producidos en Aj , que no producen Ai y 20 los cuales no fueron producidos en B, se optimiza. Los resultados de la optimización en cruces que logran números elevados de productos de expresión como progenie híbrida heterótica, y también en una optimización del número de productos dominantes expresados .
-T mWpr -*- En otro protocolo de optimización, se logra esta optimización determinando todas las posibles combinaciones en parejas desde el primer grupo heterótico e identificando el cruce el cual resulta en la suma mayor de los productos 5 de expresión, o determinando todas las posibles combinaciones en parejas desde el primer grupo heterótico e identificando cruces que resultan en una progenie híbrida (Ai x Aj) con un número máximo de diferencias en comparación a B, o determinando todas las combinaciones posibles en 10 parejas desde el primer grupo heterótico e identificando los cruces que resultan en la progenie híbrida que tiene un número mayor de diferencias con B que el número de diferencias entre B y Ai, o B y A-, . Como antes, esta optimización resulta en cruces que logran elevados números 15 de productos de expresión expresados en la progenie híbrida heterótica, y también en una optimización del número de los productos dominantes expresados . Tales formas de realización se pueden usar para mejorar los métodos de selección de por sí. Por ejemplo, en 20 un método, la progenie auto- o retro-cruzada, derivada de Ai x Aj híbrido, se selecciona la cual o retiene un conjunto de productos de expresión definidos por la suma de los productos de expresión expresados en Ai (pero no en A-, o B) y A-, (pero no en A_. o B) , o que muestran un número mayor de ,„.....«a^^.-,. productos de expresión expresados en el cruce superior con B que Ai o A , cuando hay cruce superior con B . Un acercamiento para comparar perfiles es el análisis anidado en que los perfiles de expresión se agrupan juntos sucesivamente y las muchas diferencias de expresión de genes vistas en las comparaciones individuales en parejas, pueden ser clasificadas jerárquicamente en un proceso de filtración. Este método es útil en identificar los genes expresados en un conjunto de genotipos contra otro, por ejemplo híbridos contra endogámicos o segregantes en volumen de los dos extremos de la distribución de fenotipo cuantitativa. En cualquier caso, los métodos de la invención pueden incluir la entrada de un perfil de expresión para las plantas de progenie o de padres en una base de datos de perfiles de expresión. Esto puede ser realizado manualmente, pero es ejecutado más típicamente en un sistema automático. Las bases de datos de computadora de la información del perfil de expresión puede ser bastante grande, desde unos cuantos hasta varios miles de perfiles en la base de datos. Típicamente, la base de datos tendrá perfiles de productos de expresión de una muestra representativa de los productos de expresión para las plantas de progenie híbridas, que resultan de al menos 10 cruces de plantas endogámicas separados, o al menos 10 perfiles de productos de expresión de plantas endogámicas. La frase de "sistema de computadora" o "sistema integrado" en el contexto de esta invención, se refiere a un sistema en el cual los datos que entran en una computadora corresponden a los objetos físicos o procesos externos a la computadora, por ejemplo la hibridización del ácido nucleico o los datos de unión de proteínas y un proceso que, sin una computadora, causa una transformación física de las señales de entrada a diferentes señales de salida. En otras palabras, el dato de entrada, por ejemplo la hibridización de los productos de expresión en un arreglo específico, es transformado a un dato de salida, por ejemplo, la identificación o cuenta de las comparaciones hibridizadas de secuencia a arreglos similares con diferentes materiales de prueba, la cuenta y categorización de los productos de expresión o similares. El proceso entro de la computadora es un programa por el cual se reconocen las señales de hibridización positivas (o negativas) por el sistema de computadora y atribuido a una región de un arreglo, u otro formato del perfil de expresión (por ejemplo el conteo sencillo de señales del arreglo) . El programa luego determina cuál región del arreglo de los productos de expresión hibridizados se ubica en, y, opcionalmente, las secuencias correspondientes específicas de las cuales la sonda se basa en, las mismas (como se mencionó antes, ninguna información de secuencia se requiere para obtener o evaluar los perfiles de expresión) . La invención suministra sistemas integrados para plantas o la manipulación de células de plantas y el análisis de hibridización. Sistemas típicos incluyen una computadora digital con un software de control de líquido de alta producción, el software de análisis de imágenes y el software de interpretación de datos . Una armadura de control de líquido automática, para transferir las soluciones (por ejemplo los extractos de células de plantas) desde una fuente a un destino, es típicamente operable enlazada a la computadora digital. Un dispositivo de entrada, para entrar los datos a la computadora digital para controlar la transferencia de líquido de alta producción por la armadura de control de líquido automática, y, opcionalmente, para controlar la transferencia por la armadura fija al soporte sólido, es comúnmente una característica del sistema integrado, como un escáner da imágenes, para digitalizar las señales de etiqueta desde la sonda rotulada hibridizada al ADN sobre el soporte sólido, enlazado operablemente a la computadora digital . Las interfaces del escáner de imágenes con el software del análisis de imágenes para suministrar una medida de la intensidad de etiqueta de la sonda, donde la medición de esta intensidad de etiqueta de la sonda se interpreta por el software de interpretación de datos, para mostrar si, y en qué grado, la sonda rotulada hibridiza a una etiqueta. Un número de sistemas automáticos bien conocidos, 5 también se han desarrollado para la química en fase de solución. Estos sistemas incluyen las estaciones de trabajo automáticas, similares al aparato de síntesis automático desarrollado por Takeda Chemicals Industries, LTD (Osaka, Japón) y muchos sistemas automáticos que utilizan brazos 10 automáticos (Zymate lim, Zymate Corporation, Hopkinton, Mass.; Orea, Hewlett-Packard, Palo Alto, Calif.) que semejan las operaciones sintéticas manuales ejecutadas por un científico. Cualquiera de los dispositivos anteriores son adecuados para su uso con la presente invención. La 15 naturaleza y forma de realización de las modificaciones a estos dispositivos (si las hay) así que ellos puedan operar como se discute aquí con referencia al sistema integrado, serán evidentes a las personas expertas en la materia relacionada. 20 Los sistemas de clasificación de alta producción están disponibles comercialmente (véase, por ejemplo, Zymark Corp. Hopkinton MA: Air Technical Industries, Mentor, OH ; Beckman Instruments, Inc. Fullerton CA ; Precisión Systems, Inc., Natick, MA, etc.). Estos sistemas típicamente hacen 25 automáticos todos los procedimientos, que incluyen todas las muestras y reactivos de la pipeta, distribución de líquidos, incubaciones sincrónicas y lecturas finales de la micro placa en detectores apropiados para el ensayo. Estos sistemas configurables suministran alto rendimiento y rápido arranque, al igual que un alto grado de flexibilidad y práctica. Por ejemplo, el paquete de software, actualmente disponible en el comercio, BioWorks®, suministrado por Beckman Instruments, Inc., para controlar y operar el manejo automático de líquidos, Biomek® 2000, soporta una capacidad de guía basada en el dispositivo Tool Command Language (TCL) , disponible públicamente, Beckman tiene incorporado un interpretador TCL en Biomek® 2000 y ha incluido extensiones del TCL (Bioscript®) para permitir el control directo del motor y otros instrumentos funcionalmente. Una solicitud de 16 bits (para operar bajo Microsoft Windows 3.1® y Microsoft Windows 95®, para generar el código de TCL/ Bioscript, puede ser creada, por ejemplo en Microsoft Visual Basic 4.0®. Los fabricantes de tales sistemas suministran protocolos detallados de los varios rendimientos elevados. Así, por ejemplo, Zymark Corp., suministra boletines técnicos que describen sistemas de clasificación para detectar el módulo de la trascripción de genes, unión de ligaduras y similares. Más recientemente, los acercamientos microfluídicos para la manipulación de reactivos se han desarrollado, por ejemplo por Caliper Technologies (Palo Alto, CA) . Las imágenes ópticas vistas (y, opcionalmente, grabadas) por una cámara u otro dispositivo de grabación 5 (por ejemplo un fotodiodo y un dispositivo de almacenamiento de datos) son, opcionalmente, además procesadas en cualquiera de las presentes modalidades, por ejemplo, digitalizando la imagen y/o almacenamiento y analizando la imagen en una computadora. Una variedad de equipo 10 periférico, disponible comercialmente, y software están disponibles para digitalizar, almacenar y analizar un video digital o imagen óptica digital, por ejemplo usando una computadora PC (máquinas basadas en DOS™, OS2™ WINDOWS, WINDOWS NT™ o WINDOWS 95™ compatibles con Intel x86 o 15 pentium -chip) , MACINTOSH™ o UNIX (por ejemplo, una estación de trabajo SUN™) . Un sistema convencional lleva luz desde el campo de espécimen a una cámara de un dispositivo acoplado a la carga, enfriado (CCD), de uso común en el arte. Una cámara 20 CCD incluye un arreglo de elementos de imagen (pixels) . La luz desde el espécimen es representada en imagen en la CCD. Pixels particulares, que corresponden a las regiones del espécimen (por ejemplo, sitios de hibridización individuales en un arreglo de polímeros biológicos) son muestreados para --«^«MMt sa.._¿a_t. obtener lecturas de intensidad de la luz para cada posición. Múltiples pixels son procesados en paralelo para aumentar la velocidad. El aparato y los métodos de la invención se usan fácilmente para ver cualquier muestra, por ejemplo por técnicas microscópicas del campo fluorescente u oscuro. Los sistemas integrados para el análisis de hibridización de la presente invención incluyen típicamente una computadora digital con un software de control de líquido de alto rendimiento, un software de análisis de imagen, un software de interpretación de datos, una armadura automática de control de líquido, para transferir soluciones desde una fuente a un destino enlazado operablemente a la computadora digital, un dispositivo de entrada (por ejemplo, un teclado de computadora) para entrar los datos a la computadora digital para controlar la transferencia de líquido de alto rendimiento por la armadura automática de control de líquido y, opcionalmente, un escáner de imágenes para digitalizar las señales de etiqueta desde la sonda etiquetada hibridizada a los productos de expresión, por ejemplo, en un soporte sólido, enlazado operablemente a la computadora digital . Las interfaces de escáner de imagen con el software de análisis de imagen suministran una medición de la intensidad de etiqueta de la sonda. Típicamente, la medición de la intensidad de la etiqueta de sonda se interpreta por el software de interpretación de datos, para mostrar si la sonda rotulada hibridiza a un ADN en el soporte sólido. El software para ayudar en el proceso de la muestra, puede ser divido en 4 categorías funcionales: 1) el software de control de transferencia de líquido, 2) el software de análisis de imagen, 3) el software de manejo de datos y 4) el software de interpretación de datos. Convenientemente, las aplicaciones pueden compartir información a través de los archivos de datos que las aplicaciones pueden leer y crear. Para flexibilidad y facilidad de uso, los archivos pueden ser formateados como archivos sencillos de texto y/o en Microsoft Excel® u otro formato de una hoja de trabajo. Esto permite ver y editar los archivos a través del uso del software, disponible comercialmente, tal como Microsoft Excel®. Los expertos en la materia reconocerán que este acercamiento es sólo uno posible del conjunto de sistemas que se pueden usar en el soporte y facilitar el proceso de la presente invención. Otros sistemas pueden ser fácilmente designados para adaptarse a las necesidades particulares del usuario en la práctica de la invención. En forma de ejemplo, y no de limitación, una interfaz del usuario de Microsoft Windows® puede ser desarrollada para la mayoría de aplicaciones, que usan Microsoft Visual Basic 4.0®. La mayoría de las aplicaciones se pueden desarrollar para un ambiente de 32 bits para operar bajo Microsoft Windows 95® o98®. Aplicaciones de 16 bits, tal como el software de análisis de imagen, desarrollado por Óptimas Corporation, Óptimas 5.0, puede también ser un componente útil del sistema integrado. 5 CLONACIÓN DE LOS PRODUCTOS DE EXPRESIÓN Cualquier ácido nucleico que codifique un producto de expresión identificado como de interés por las técnicas de perfil de expresión, mencionado, aquí, que incluyen los 10 productos de expresión dominantes, aditivos y sobre- o subdominantes, pueden ser clonados. Se espera que muchos de tales ácidos nucleicos, particularmente los ácidos nucleicos dominantes y aditivos, serán codificados por los sitios responsables para los rasgos cuantitativos convenientes 15 ("QTL", véase Edwards, et al., (1987) en Genetics 115:113). Los QTL incluyen genes que controlan, en algún grado, numerosos rasgos fenotípicos cuantificables numéricamente, tal como la resistencia a enfermedades, rendimiento de cultivos, resistencia a condiciones ambientales extremas, 20 etc. Además de los métodos aquí descritos, otros paradigmas experimentales se pueden usar para identificar, analizar y seleccionar los QTL. Un paradigma implica el cruce de dos líneas endogámicas y el genotipo de múltiples sitios marcadores y evaluar uno o varios rasgos fenotípicos 25 cuantitativos entre la progenie del cruce. Los QTL son luego ^¿jg-jii^j^ identificados y finalmente seleccionados con base en las asociaciones estadísticas significantes entre los valores genotípicos, determinados por la tecnología del marcador genético y la variabilidad fenotípica entre la progenie de segregación. Conforme se aplica a la presente invención, la identificación de ácidos nucleicos particulares, que codifican los productos de expresión dominantes, aditivos o sobre- o sub-dominantes, o que codifican productos de expresión inactivos, son productos potenciales para los QTL u otros genes o sitios de interés. Por lo tanto, es conveniente clonar ácidos nucleicos que sean enlazados genéticamente a los ADN, que codifican estos productos de expresión para la transducción en células (por ejemplo, que codifican secuencias para los productos de expresión, o enlazados genéticamente o que no codifican secuencias) , especialmente para obtener plantas transgénicas. Las secuencias clonadas son también útiles como etiquetas moleculares para cepas de plantas seleccionadas, por ejemplo para identificar parentescos, y son útiles además para codificar productos de expresión, que incluyen los ácidos nucleicos y polipéptidos. A menudo, los productos de expresión que son expresados diferencialmente entre las plantas heteróticas y no heteróticas, se codifican por los QTL y son responsables de los efectos fenotípicos de los QTL. Un ADN enlazado a un sitio que codifica un producto de expresión se introduce en las células de las 5 plantas, o en cultivos o en órganos de una planta, por ejemplo, las hojas, tallos, frutos, semillas, etc. La expresión de ácidos nucleicos naturales o sintéticos, codificados por los ácidos nucleicos enlazados a los ácidos nucleicos que codifican el producto de expresión, puede ser 10 lograda por enlazar operablemente un ácido nucleico clonado de interés, tal como un producto de expresión o un ácido nucleico enlazado genéticamente, a un promotor, que incorpora la construcción en un vector de expresión y la introducción del vector en una célula huésped adecuada. 15 Alternativamente, un promotor endógeno enlazado a los ácidos nucleicos puede ser usado.
Clonación de Secuencias de Productos de Expresión en Huéspedes Bacteriales 20 Existen varios métodos bien conocidos de introducir ácidos nucleicos de productos de expresión en células bacteriales, cualquiera de los cuales se puede usar en la presente invención. Ellos incluyen: la fusión de las células receptoras con protoplastos bacteriales que 25 contienen el ADN, electroporación, bombardeo de proyectiles, Hgj j^ ^g^ e infección con vectores virales, etc. Las células bacteriales son a menudo usadas para amplificar el aumento del número de plasmidas que contienen los constructores del ADN de esta invención. Las bacterias crecen en una fase logarítmica y las plasmidas dentro de las bacterias pueden ser aisladas por una variedad de métodos conocidos en el arte (véase, por ejemplo, Sambrook) . Además, una multitud de equipos están disponibles comercialmente para la purificación de plasmidas desde bacterias. Para su uso propio, siguiendo las instrucciones del fabricante (véase, por ejemplo, EasyPrep™, FlexiPrep™, ambos de Pharmacia Biotech; StrataClean™, de Stratagene; y QIAexpress Expresión System™ de Qiagen) . Las plasmidas aisladas y purificadas son luego manipuladas para producir otras plasmidas, usadas para transfectar células de plantas o incorporadas en los vectores relacionadas de Agrobacterium tumefaciens para infectar plantas. Vectores típicos contienen los terminadores de trascripción y translación, secuencias de iniciación de trascripción y translación y los promotores útiles para la regulación de la expresión del ácido nucleico particular. Los vectores opcionalmente comprenden los casetes de expresión genéricos que contienen al menos una secuencia del terminador independiente, secuencias que permiten la duplicación del cásete en eucariotes, o procariotes, o ambos (por ejemplo, los vectores de lanzadera) y marcadores de selección para tanto sistemas de procariotes como eucariotes. Los vectores son adecuados para la duplicación e integración en procariotes, eucariotes o preferiblemente ambos. Véase, Gilman & Smith, Gene 8:81 (1979): Roberts et al., Nature 328:731 (1987(; Schneider, B., et al., Protein Expr. Purif. 6435: 10(1995), Berger, Sambrook, Ausubet (todos supra) . Un catálogo de bacterias y bacteriófagos útiles para la clonación es suministrado, por ejemplo, por ATCC, tal como The ATCC Catalogue of Bacteria and Bacteriophage (1992), Gherna et al (eds.) publicado por la ATCC. Procedimientos básicos adicionales para la clonación de secuencias y otros aspectos de la biología molecular y las consideraciones teóricas subyacentes son también encontradas en Watson et al (1992) Recombinant DNA, Segunda Edición, Scientific American Books, N.Y.
Transfección y Manipulación de Células de Plantas Los métodos de transducir células de plantas con ácidos nucleicos están generalmente disponibles. Además de Berger, Ausubel y Sambrook, referencias generales útiles para la clonación de células de plantas, cultivo y regeneración, incluyen Payne et al (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc., New York. NY (Payne); y Gamborg y Phillips (eds.) (1995) .. .
Plant Cell, Tissue and Organ Culture: Fundamental Methods Springer Lab. Manual, Springer Verlag (Berlin Heidelberg New York) (Gamborg) . Una variedad de medios de cultivos de células se describen en Atlas y Parks (eds.) The Handbook of 5 Microbiological Media (1993) CRC Press. Boca Raton (Atlas) . Información adicional para el cultivo de células de plantas se encuentra en la literatura comercial disponibles, tal como Life Science Research Cell Culture Catalogue (1998) de Sigma- Aldrich, Inc. (St Louis, MO) (Sigma-LSRCCC) y, por 10 ejemplo, Plant Culture Catalogue y suplemento (1997) también de Sigma.Aldrich, Inc. (St. Louis, MO) (Sigma PCCS) . Los constructores de ácido nucleico de la invención se introducen en células de plantas, o en el cultivo o en los órganos de una planta por una variedad de 15 técnicas convencionales. Por ejemplo, el constructor del ADN puede ser introducido directamente en el ADN genómico de la célula de la planta usando técnicas, tal como la electroporación y microinyección de los protoplastos de la célula de la planta, o los constructores del ADN se pueden 20 introducir directamente a las células de las plantas usando métodos balísticos, tal como el bombardeo de partículas del ADN. Alternativamente, los constructores del ADN se combinan con regiones de flanco de t-ADN adecuadas e introducidas en un vector huésped convencional de Agrobacterium tumefaciens . 25 La función de virulencia del huésped de Agrobacterium ^.^_____i__ _a___u, «¡aü. tumefaciens dirige la inserción del constructor y marcador adyacente en el ADN de la célula de la planta, cuando la célula es infectada por las bacterias. Las técnicas de microinyección son conocidas en el arte y bien descritas en la literatura científica y de patentes. La introducción de los constructores del ADN, que usan la precipitación del polietilen-glicol, se describe en Paszkowski et al., EMBO J . 3:2717 (1984). Las técnicas de electroporación se describen en Fromm et al . , Proc . Nat ' 1 Acad. Sci. USA 82:5824 (1985). Las técnicas de transformación balística se describen en Klein et al Nature 327,-70-73 (1987) . Las técnicas de transformación mediadas por Agrobacterium tumefaciens, que incluyen el desarmado y uso de vectores binarios, son también bien descritas en la literatura científica. Véase, por ejemplo, Horsch et al., Science 233:496-498 (1984) y Fraley et al., Proc . Nat ' 1 Acad. Sci. USA 80:4803 (1983). la transformación mediada por Agrobacterium es un método preferido de transformación de dicotiledóneas. Para usar secuencias aisladas, que corresponden a o enlazadas a los productos de expresión en las técnicas anteriores, los vectores de ADN recombinantes, adecuados para la transformación de células de plantas se preparan. Una secuencia del ADN que codifica el mARN deseado. polipéptido o secuencia no expresada se transduce en la planta. Cuando la secuencia se expresa, la secuencia es combinada opcionalmente con secuencias reguladores de iniciación de trascripción y translación, que dirigirán la 5 trascripción de la secuencia desde el gene en los tejidos intentados de la planta transformada. Los promotores, en ácidos nucleicos enlazados a los sitios identificados por detectar los productos de expresión, se identificaron, por ejemplo, analizando las 10 secuencias 5' corriente arriba de una secuencia codificadora en el desequilibrio de enlace con el sitio. Opcionalmente, tales promotores serán asociados con los QTL. Las secuencias características de secuencias de promotores pueden ser usadas para identificar el promotor. Las secuencias que 15 controlan la expresión del gene eucariótico se han estudiado extensamente. Por ejemplo, los elementos de la secuencia del promotor, incluyen la secuencia de consenso de la caja TATA, (TATAAT) , que es usualmente de 20 a 30 parejas básicas, corriente arriba de un sitio de arranque de trascripción. En 20 muchos casos, la caja TATA ayuda en la iniciación de trascripción exacta. En plantas, además de corriente arriba de la caja TATA, en las posiciones -80 hasta -100, hay típicamente un elemento promotor con una serie de adeninas que rodean al trinucleótido G (o T) , N G. Véase, por 25 ejemplo, J. Mesing, et al., en Genetic Engineering in ^jg^*¡^ Plants, pp. 221-227 (Kosage, Meredith y Hollaender, eds. (1983)) . Un número de métodos se conocen por los expertos en la materia, para identificar y caracterizar regiones de promotores en el ADN genómica de la planta. Véase, por ejemplo, Jordano, et al., Plant Cell 1:855-856 (1989): Bustos, et al., Plant Cell 1: 839-854 (1989); Green, et al., EMBO J. 7:4035-4044 (1988); Meier, et al., Plant Cell 3:309-316 (1991); y Zhang et al., Plant Physiology 110:1069-1079 (1996) . En la construcción de los casetes de expresión recombinantes de la invención, un fragmento del promotor de planta es empleado opcionalmente, el cual dirige la expresión de un ácido nucleico en cualquiera o todos los tejidos de una planta regenerada. Ejemplos, de promotores constitutivos incluyen el virus de mosaico de la coliflor (CaMV) en la región de iniciación de trascripción 35S, el promotor 1'- ó 2' derivado del T-ADN de Agrobacterium tumefaciens, y otras regiones de iniciación de trascripción de varios genes de plantas conocidas por los expertos en la materia. Alternativamente, el promotor de plantas puede dirigir la expresión del polinucleótido de la invención en un tejido específico (promotores específicos del tejido) o pueden de otra manera, bajo el control ambiental más preciso (promotores inducibles) . Ejemplos de promotores específicos de tejidos, bajo el control de desarrollo, incluyen los promotores que inician la trascripción solamente en ciertos tejidos, tal como frutas, semillas o flores. Cualquiera de un número de promotores, que dirigen la trascripción en las células de las plantas, pueden ser 5 adecuados, El promotor puede ser constitutivo o inducible. Además de los promotores antes mencionados, promotores de origen bacterial, que operan en plantas incluyen el promotor de sintasa de octopino, el promotor de sintasa de nopalina y otros promotores derivados de plasmidas nativas Ti. Véase, 10 Herrara-Estrella et al. (1983) Nature, 303:209-213. Promotores virales incluyen los promotores 35S y 19S ARN del virus de mosaico de la coliflor. Véase Odell et al., (1985) Nature 313:810-812. Otros promotores de plantas incluyen el promotor de la subunidad pequeña de la carboxilasa de 15 ribulosa-1, 3-bisfosfato y el promotor de faseolina. La secuencia del promotor del gene E8 y otros genes puede también ser usada. El aislamiento y secuencia del promotor E8 se describe en detalle en Deikman y Fischer, (1988) EMBO J^ 7:3315-3327. 20 Si se desea la expresión de polipéptido, una región de poliadenilación en el extremo 3' de la región codificadora e incluye típicamente. La región de poliadenilación puede ser derivada del gene natural, de una variedad de otros genes de plantas o del T-ADN.
• -*—"«**-'•"»—-"»- El vector que comprende las secuencias (por ejemplo las regiones de promotores o de codificación) de los productos de expresión que codifican genes de la invención típicamente comprenden una subsecuencia de ácido nucleico, que confiere un fenotipo seleccionable en las células de plantas. El vector comprende la secuencia que incluirá típicamente un gene marcador que confiere un fenotipo seleccionable en las células de plantas. Por ejemplo, el marcador puede codificar la tolerancia a biocidas, tolerancia a antibióticos particularmente, tal como la tolerancia a la kanamicina, G418, bleomicina, higromicina o tolerancia a herbicidas, tal como la tolerancia a la clorosulforona o fosfinotricina (el ingrediente activo en los herbicidas Bialaphos y Basta) . Por ejemplo, la selectividad de cosechas a herbicidas específicos puede ser conferida a genes diseñados en cosechas, que codifican enzimas que metabolizan herbicidas apropiados de otros organismos, tal como los microbios. Véase Padgette et al (1996) "Nuevas oportunidades de controlar malas hierbas: Desarrollo de soyas con el gene Round UP Ready™" en Herbicide-Resistant Crops (Duke, ed.) pp 53-84, CRC Lewis Publishers, Boca Raton ("Padgete, 1996") y Vasil (1886) "cosechas resistentes a la fosfinotricina" en Herbicide-Resistant Crops (Duke, ed.) pp 85-91. CRC Lewis Publishers, Boca Raton) (Vasil, 1996) .Las plantas transgénicas se han diseñado para expresar una variedad de genes de tolerancia / que metabolizan herbicidas, de una variedad de organismos. Por ejemplo la sintasa del ácido acetohidroxi, que se ha encontrado obtiene plantas que expresan esta enzima resistente a tipos múltiples de herbicidas, se ha clonado en una variedad de plantas (véase, por ejemplo, Hattori, J. , et al., (1995) Mol. Gen Genet. 246(4) 419. Otros genes que confieren tolerancia a herbicidas incluyen: un gene que codifica una proteína quimérica del citocromo P4507AI de ratas, y la levadura NADPH-citocroma P450 oxidorreductasa (Shiota et al (1994), Plant Physiol, 106(1)17, genes para la reductasa de glutationa y dismutasa de superóxido (Aono, et al., (1995) Plant Mol . Biol . 20(4): 619. Similarmente, la selectividad de cosechas puede ser conferida alterando el gene que codifica para un sitio objetivo de herbicida, así que la proteína alterada ya no se inhibe por el herbicida (Padgette, 1996) . Varias de tales cosechas se han diseñado con enzimas microbiales específicas para conferir selectividad a herbicidas específicos (Vasil, 1996). Además, los ácidos nucleicos que pueden ser clonados e introducidos en plantas, para modificar o complementar la expresión de un gene, que incluye un gene inactivo, un gene dominante y un gene aditivo o similar, pueden ser cualquiera de una variedad de constructores, dependiendo de la aplicación particular. Así, un ácido nucleico que codifica un cADN expresado de un gene identificado, puede ser expresado en una planta bajo el control de un promotor heterólogo. Similarmente, un ácido nucleico que codifica un factor de trascripción, que regula un objetivo identificado por los presentes métodos, o que codifica cualquier parte que afecte la trascripción, puede ser clonado y transducido en una planta. Los métodos de identificación de estos factores son numerosos en la literatura. Para una introducción básica a la regulación genética, véase, Lewin (1995) Genes V, Oxford University Press Inc., NY (Lewin), y las referencias ahí citadas.
Regeneración de Plantas Transgénicas Las células de plantas transformadas que se derivan por cualquiera de las técnicas de transformación anterior, pueden ser cultivadas o regenerada de una planta completa que posee el genotipo transformado y así los fenotipos deseados. Tales técnicas de regeneración dependen de la manipulación de ciertas fitohormonas en un medio de crecimiento de un cultivo de tejido, que depende de un marcador biocida y/o herbicida, que se ha introducido junto con las secuencias de nucleótidos deseadas. La regeneración de la planta de los protoplastos cultivados se describe en Evans et al . , Protoplasts Isolation and Culture. Handbook of Plant Cell Culture pp 124-176. Macmillian Publishing Company, New York, (1983) ; y Binding, Regeneration of Plants, Plant Protoplasts, pp 21-73, CRC Press, Boca Raton, (1985) . La regeneración puede también ser obtenida de callos de plantas, explantes, embriones somáticos (Dandekar et al., J. Tissue Cult. Meth. 12:145 (1989); MacGranahan, et al., Plant Cell Rep. 8:512 (1990)), órganos o sus partes. Tales técnicas de regeneración se describen generalmente en Klee et al., Ann. Rev. of Plant Phys. 38:467-486 (1987). Un experto en la material reconocerá que después que el cásete de expresión se incorpora establemente en las plantas transgénicas y se confirma es operable, puede ser introducido en otras plantas por el cruce sexual . Cualquiera de un número de técnicas de crianza estándar puede ser usada, dependiendo de las especies que se van a cruzar.
INACTIVACIÓN DE GENE Y HETEROSIS Se ha descubierto que los efectos de inactivación y epigenéticos del gene juegan un papel en la depresión endogámica. Como se demuestra aquí, el número de genes en los híbridos con un patrón dominante de la expresión del gene, se correlaciona con el rendimiento del híbrido, un componente del cual es encontrado será aliviado de la depresión endogámica. Otra manera de considerar los genes en esta clase es clasificarlos como genes que expresan los niveles menores en un padre endogámico que en el otro.
Cuando una copia de un gene, que se expresa en niveles bajos en un endogámico, se combina con una copia de otro gene endogámico, un resultado frecuente en el híbrido es un nivel equivalente de expresión a aquél visto con dos copias del 5 gene en uno u otro de los endogámicos de padres (más a menudo, el padre que se expresa más altamente) . El número de genes en la clase dominante se considera como una función del número de híbridos que comparten esos genes, y la distribución de frecuencia indicó 10 que el traslape entre los conjuntos de genes que contribuyen a los patrones dominantes de la expresión del gene en híbridos es esencialmente aleatoria. Esto sugiere que, durante el proceso de la endogamia, la expresión de un subconjunto de genes puede siempre ser alterada (y 15 usualmente reducida) y que la expresión de diferentes subconjuntos aleatorios de genes son inactivados en diferentes endogámicos. Estos resultados están de acuerdo bien con los conceptos de la complementación clásica del equilibrio 20 metabólico y los cuellos de botella fisiológicos (Hageman et al., 1967 "Un acercamiento bioquímico al cultivo del maíz" Advan . Agron . 19:45; Schrader, L. E. 1985 "Selección del equilibrio metabólico en el maíz" pp 79-89 en Explotation of physiological and genetic variability to enhance crop 25 producti ity. Harper J. E. (ed.), Waverly Press. Baltimore; a£Mt8 y Manglesdorf, A. J. 1952 "Interacción de Genes en la Heterosis, páginas 321-329 en Heterosis . Gowen J. (ed.) Iowa State Collage Press, Ames) para explicar la heterosis. Esta hipótesis sugiere que las líneas endogámicas del maíz tienen sistemas metabólicos no equilibrados con algunas enzimas en el nivel óptimo y algunos de los niveles de límite del régimen, o cuellos de botella. Los híbridos de las líneas endogámicas que tienen diferentes sistemas de límite del régimen, pueden superar los cuellos de botella por complementación. Dependiendo del producto del gene, un alelo favorable puede llegar a ser un alelo desfavorable en una diferente etapa de desarrollo, y viceversa. La complementación, por lo tanto, resulta no sólo de los aspectos cuantitativos, es decir la variación en el nivel de expresión, sino también de los aspectos cualitativos, por ejemplo, la variación en la función debida a los polimorfismos de secuencia. Los cruces, relacionados estrechamente, son menos heteróticos debido, primeramente, a que son menores diferencias de banda, o en el nivel de expresión o en el polimorfismo de secuencia, por lo tanto, menores sitios heterócigos que suministran oportunidades potenciales de complementación, Segundo, los sitios de los cruces relacionados estrechamente son más susceptibles de la inactivación de genes. En los cruces relacionados más distantemente, los padres endogámicos tiene un número mayor de bandas diferenciales, y el híbrido resultante tiende a expresar ambos alelos que suministran mejor complementación de los alelos de padres desfavorables. Tal complementación permite la mejor respuesta a los diferentes ambientes o durante diferentes etapas de desarrollo. Sin estar unido a una teoría particular, los epigenéticos suministran una explicación, sencilla y elegante para estos efectos. En la Drosophila y otros organismos, los efectos alélicos (y no alélicos) se han descrito, donde la expresión en los heterócigos es normal, pero en los homócigos ocurre la trans-inactivación de ambos alelos. Estos efectos son mediados por las secuencias reguladoras cis-activas que necesitan estar presentes en más de una copia (por ejemplo, en diferentes homólogos de cromosomas) para mediar el conjunto cooperativo de complejos de proteínas multiméricas, responsables de la inactivación del gene (por ejemplo, las proteínas Polycomb en las proteínas de Drosophila o SIR en la levadura) . En el maíz, las secuencias responsables de estos efectos ocurren más probablemente en las regiones intergénicas fuera de los lazos de la cromatina, flanqueada por MARs que contienen genes. Alrededor del 80% de las secuencias en estas regiones se derivan de los retroelementos que pueden ser inactivados transcripcionalmente a través de la selección natural. Sin embargo, las regiones intergénicas son también donde el maíz exhibe la mayoría del polimorfismo de la secuencia del ADN. Así, la homocigosidad de ciertas regiones intergénicas en los endogámicos puede conducir a la inactivación del gene 5 adyacente, en tanto en los híbridos menos regiones intergénicas serán homócigas para los sitios que pueden ensamblar complejos inactivados, así que más genes serán liberados de la represión. Como nuevos endogámicos se crean de cruces de híbridos, la recombinación es aleatoria en las 10 regiones intergénicas a través del genoma, resultando así en un nuevo subconjunto de genes que son inactivados cuando esas regiones que pueden ensamblar complejos inactivados se hacen homócigas. Este modelo explica por qué los endogámicos expresan menores genes que híbridos (los cuales cuentan en 15 su rendimiento inferior) y por qué el número de genes que exhiben un patrón dominante de la expresión del gene en híbridos aumenta conforme el porcentaje de relación entre los endogámicos disminuye. También puede acomodar fácilmente explicaciones potenciales para la existencia de agrupaciones 20 heteróticas, y el nivel mayor de heterosis visto en el maíz, en comparación con otros cereales (por ejemplo el arroz) los cuales tienen una organización de genoma muy diferente y el nivel del polimorfismo de secuencia. Finalmente, es también posible que en el maíz, donde la endogamia natural ocurre 25 poco frecuentemente, debido a sus características florales, ,_^._,^kt?í&im_*»_x.Mú_ la selección natural puede no actuar para eliminar el gene que se inactiva al mismo régimen como en las especies auto- fertilizantes .
SEGURIDAD MOLECULAR: IDENTIFICACIÓN DE FUENTES PATERNALES POR COMPARACIÓN DE LOS PERFILES DE EXPRESIÓN Un interés general en la industria de la agricultura es las cepas de plantas patentadas u otras fuentes de plasma de gérmenes que pueden, algunas veces ser inadvertidamente, o aún deliberadamente, malversadas. Debido a que el plasma de germen puede ser recombinado con otras fuentes de plasma de germen, antes de producir un producto, tal como una semilla híbrida, no siempre es posible decir que el producto es derivado no apropiadamente de las plantas paternales patentadas, clonas, o similares. La presente invención suministra métodos para identificar los productos de expresión únicos y/o perfiles únicos) . Esta capacidad de identificar productos de expresión únicos, suministra una manera de averiguar el parentesco, que, a su vez, suministra la capacidad de determinar si un híbrido comprende un material patentado. En los métodos, una fuente o las fuentes de una planta de prueba, tal como un híbrido, pueden ser identificadas. En los métodos, una muestra representativa de productos de expresión de la planta de prueba es perfilada y el perfil de la expresión de prueba resultante se compara a una base de datos de perfiles de expresión conocidos para plantas, desde las cepas conocidas endogámicas o híbridas (métodos de obtener tales bases de datos, se describieron antes) . Por ejemplo, los perfiles de expresión para un tejido seleccionado pueden entrar en una base de datos para cualquiera o cada planta patentada (o clona, o cualquier otra fuente de plasma de germen) que es propiedad de una corporación. Perfilando un número de plantas, es posible detectar los productos de expresión únicos y/o los patrones de expresión dentro del perfil de expresión de las plantas específicas. Es también posible generar probablemente los perfiles de expresión por los productos híbridos de los miembros de la base de datos. Cualquiera de estos perfiles de expresión se pueden comparar a un perfil de expresión real para una planta de prueba que se sospecha se ha derivado de una o más plantas patentadas. Por ejemplo, una matriz de comparaciones en parejas para la progenie potencial de los perfiles de expresión en la base de datos, puede ser comparada al perfil de expresión de prueba. 0 todo el perfil de expresión o una sub-porción del perfil de expresión (es decir, una pluralidad de caracteres que corresponden a productos de expresión encontrados en el perfil general) que comprende al menos un marcador de expresión único, pueden ser evaluados.
EJEMPLOS 5 Los siguientes ejemplos se ofrecen en forma de ilustración y no intentan ser limitantes. Un experto en la materia inmediatamente reconocerá una variedad de procedimientos alternativos, composiciones, reactivos y similares, que pueden sustituir a los ejemplificados abajo. 10 EJEMPLO 1 : DIFERENCIAS EN LOS PERFILES DE EXPRESIÓN DEL ARN CORRELACIONADAS CON LA HETEROSIS La heterosis es un término usado para describir el vigor aumentado de la progenie de híbridos en comparación 15 con sus padres. Aunque la heterosis se ha usado ampliamente en el cultivo de plantas, durante muchas décadas, los mecanismos moleculares subyacentes del fenómeno son previamente desconocidos. En este ejemplo, la heterosis se estudió como un fenotipo que usa la tecnología de perfil del 20 ARN del CuraGen (CuraGen Corp., New Haven CT) para examinar diferencias en la expresión del ARN entre híbridos y sus padres no híbridos. Usando este acercamiento, es posible clasificar los fragmentos de cADN en diferentes categorías, dependiendo de sus niveles relativos de expresión en un 25 híbrido dado y sus dos padres. Los datos indicaron una — ._.M___^___^. ^__,.^ .. . „., ,„, _. diferencia en el número de genes en cada categoría (dominante, sub-dominante, sobre-dominante, aditiva) entre los híbridos heteróticos y no heteróticos. Los resultados también sugieren la habilidad de este acercamiento para explicar la base molecular de la heterosis y la aplicación de la información obtenida a los métodos de cultivo de las plantas . El grado de la heterosis varía tremendamente entre los híbridos de diferentes combinaciones paternales. En la práctica actual de cultivo, la selección de las combinaciones de los padres, que da un alto grado de heterosis, depende de las pruebas de rendimiento del cruce superior. En este descripción, nuevos métodos de la vigilancia de la heterosis por la identificación de genes y los patrones de expresión de genes, asociados con la expresión de la heterosis, son suministrados. Los patrones específicos de la expresión de genes, asociados con la heterosis, se identifican antes de la prueba del rendimiento. Esto permite la clasificación de números más grandes de cruces superiores sin tener que realizar todas las combinaciones de la prueba de rendimiento. Similarmente, los genes expresados no óptimamente en los híbridos comerciales existentes, pueden ser identificados y mejorados por la manipulación transgénica o la selección asistida por el perfil de expresión de genes.
Los nombres "PAR" aquí son predesignaciones arbitrarias de los nombres de cepas comerciales y patentadas. Debido a que la invención es aplicable a cualquier cepa de cultivo, las cepas particulares usadas no son críticas, o aún relevantes, a la invención reclamada. Por lo tanto, los números de cepas de cultivos reales no se suministran. Las series de PARi de híbridos usados para el perfil del ARN, se listan en la Tabla 1. En la Tabla 1, estos híbridos varían de un híbrido comercial altamente heterótico (PAR?8 = PARX/PAR2) a los cruces de medios hermanos (por ejemplo PARi /PAR?7) , los cuales tienen mucho menos heterosis. Cada híbrido se deriva de la misma madre (PARi) y un padre con una diferente relación de porcentaje de pedigrí . La correlación entre la relación de heterosis y pedigrí se suministra en la Tabla 1. La Figura 1 representa gráficamente la correlación entre el grado de heterosis y la relación de porcentaje: la relación de porcentaje se designa en el eje de las X; heterosis Fl-MP en bu/LCR se da en el eje de las Y. Los datos se obtienen de 4 ubicaciones en JH97.
Tabla 1 - Padres híbridos y endogámicos seleccionados para el análisis del perfil de mARN En plantitas y espigas inmaduras, el 90-95% de los ARN en cada híbrido Fx se expresaron con los mismos niveles como en los endogámicos de padres. Genéticamente, endogámicos relacionados distantemente, por ejemplo los padres de los híbridos comerciales, tenían menos del 6% de los mARN expresados diferencialmente. El número de bandas de ARN expresadas diferencialmente, entre dos padres endogámicos, se correlacionaron positivamente con el rendimiento del híbrido correspondiente, demostrando que cualquier diferencia de expresión de genes y/o polimorfismo de secuencia del ADN entre padres endogámicos, son importantes para la heterosis. El nivel de la expresión del ARN en el híbrido puede diferir de un padre endogámico o el otro (dominante) , o ambos (aditivo o sobre-/sub-dominante) . La Figura 2 ilustra la clasificación de los patrones de expresión de genes en los híbridos Fl con relación a los padres endogámicos. Los niveles del ARN son provistos en el eje vertical. Las bandas en cada clase exhibieron los siguientes patrones de expresión: (A) clase sobre-/sub-dominante : el nivel de expresión en el híbrido Fl es al menos dos veces mayor o menor que en ambos padres, los cuales tienen niveles o iguales o diferentes de expresión. En el aditivo, la mayoría de las diferencias de niveles de expresión del ARN en ambos tejidos de todos los híbridos analizados estaban en el aditivo (B) y las clases dominantes (C) , los niveles del mARN de los padres endogámicos son diferentes. Clase de Aditivo: el nivel de expresión Fl falla dentro del intervalo de dos padres. Clase Dominante: el nivel de expresión en el híbrido Fl es igual a un padre, pero diferente del otro. Dos tercios de las diferencias observadas exhibieron la expresión del aditivo, y el resto de las diferencias demostraron un patrón de expresión dominante. Asimismo, el número de fragmentos dominantes y aditivos de ARN son correlacionados con los grados de heterosis. Los estudios iniciales de tanto plantitas como espigas inmaduras, demostraron correlaciones entre el número de fragmentos del ARN en la clase sobre-/sub-dominante y el porcentaje de relación entre los padres endogámicos. Cinco híbridos comerciales (PAR19-PAR23) , seleccionados de todos los números superiores que tienen altos rendimientos de las bandas dominante y aditiva, y un número menor de bandas sub-/sobre dominantes . Una nueva métrica que mide la distancia genética entre los dos padres y la frecuencia de los ARN expresados no aditivamente en la clase sobre-/sub-dominante se desarrolló. Esto se define como la relación entre la suma de los números de fragmentos del ARN que difieren del híbrido en cada uno de los dos padres y el número de los AR? que difieren entre los dos padres, [es decir (A-Fl) + (B-Fl) / (A-B) . Los híbridos comerciales de alto rendimiento entre los padres relacionados distantemente y con menores ARN sobre-/sub-dominantes, dan una relación menor, cera de 1.0 (Tablas 2, 3 y 4) . La Figura 3 ilustra la correlación de los 5 patrones de expresión de genes con rendimiento del híbrido. El rendimiento del híbrido en bu/LCR se da en el eje de las X, mientras el porcentaje de bandas en cada clase de expresión se da en el eje de las Y (el porcentaje de bandas diferentes: línea de puntos; porcentaje de bandas de 10 aditivo; línea de guiones; y porcentaje de bandas dominantes: línea sólida).
«^^^ Tabla 2 - El número de genes que exhiben patrones de expresión sobre-/sub-dominantes, aditivos o dominantes en híbridos heteróticos y no heteróticos ND = No determ nado El número de fragmentos del ARN en la clase aditivo fue mayor en todos los híbridos heteróticos, que incluyen cinco híbridos comerciales (PAR?/PAR2 [+PAR19] , PAR20, PAR21, PAR22, PAR23/ PAR?/PAR3) . La misma tendencia también se encontró en tejidos de plantitas de los híbridos seleccionados analizados. Hay también una fuerte correlación entre el número de las bandas de ARN dominantes y el porcentaje de la heterosis de rendimiento (Figura 3) .
Tabla 3. Patrones de expresión de genes de híbridos en relación a la heterosis El número total de bandas ensayadas es de aproximadamente 14,000 para todos los genotipos. El 1% es aproximadamente de 140 bandas, El porcentaje de bandas diferentes (A-B) : & de bandas expresadas diferencialmente cuando se comparan los padres endogámicos de los híbridos correspondientes. % de bandas de aditivo o dominante: % de bandas, donde Fl tiene un patrón de expresión de aditivo o dominante, respectivamente. Los datos de expresión se basan en 3 duplicados de muestra.
Una manera de interpretar estos datos es suponer que para cada gene, hay un nivel óptimo de expresión. Diferentes endogámicos pueden tener subconjuntos de genes que se expresan o debajo o arriba del óptimo, contribuyendo así a su pobre vigor. En híbridos, muchos genes expresados en el padre A, pero no en el padre B, se pueden expresar en el mismo nivel como en el padre A y viceversa. Así, los híbridos tendrán más genes expresados en un nivel óptimo que cualquier padre A o B, y los genes expresados en el nivel óptimo en A y B complementarán aquéllos expresados en el nivel sub- o sobre-óptimo en el otro endogámico. Este arreglo se representa gráficamente en la Figura 4. (El panel A ilustra la clase dominante, paneles B y C ilustran las clases de aditivo y sobre-/sub-dominante, respectivamente. <-»: nivel "óptimo" de la expresión de mARN) . Así, la elevada heterosis está asociada con un aumento en las clases dominante y de aditivo y una disminución de la clase sobre- ~- ***• "^— /sub-dominante. En los cruces entre endogámicos relacionados, la clase de aditivo puede desaparecer ya que la mayoría de los genes probablemente serán iso-alélicos .
Tabla 4 . El número de fragmentos del ARN que difiere entre los padres y entre el padre y el híbrido La pobre correlación entre el nnúmero de genes en la clase sobre-/sub-dominante y el grado de heterosis es sorprendente. Los datos sugieren que cuando los cultivadores seleccionan híbridos altamente heteróticos, ellos pueden también ser seleccionados contra genes que caen en esta clase. La extensión lógica a este argumento será que si los derivados, por ejemplo de PAR19 se seleccionan o diseñan con menores o nada de genes, que caen en esta clase, ellos tendrán un rendimiento mayor que el propio PAR19.
EJEMPLO 2: PRONÓSTICO DE LA HETEROSIS DEL ANÁLISIS DE LAS BANDAS DE ADITIVO COMPARTIDAS: IDENTIFICACIÓN DE LOS GENES INVOLUCRADOS EN LA HETEROSIS El mARN de espigas inmaduras se perfiló desde 10 5 híbridos y sus padres endogámicos respectivos. Los genotipos perfilados incluyeron un número de híbridos comerciales y un conjunto de la "serie de PAR27" , en que se usó el PAR27 como una hembra común con una serie de fenotipos macho que difieren en la relación del porcentaje. Las bandas 10 expresadas diferencialmente entre los híbridos y los padres endogámicos, se categorizaron de acuerdo con si ellos eran aditivos, no aditivos [= sobre-/sub-dominante] o dominante. El análisis de este conjunto de datos de los perfiles de todos los 10 híbridos mostraron lo siguiente. 15 Primero, hay una correlación inversa entre la heterosis y el número de secuencias expresadas no aditivamente. Segundo, el número de fragmentos de ARN en la clase de aditivo fue mayor en todos los híbridos heteróticos analizados, que incluyen cinco híbridos comerciales (PAR?g, 20 PAR20, PAR21, PAR22, PAR23) y PAR24/PAR23 (cruce PAR26) . Tercero, los datos también indican una correlación fuerte entre el número de bandas de ARN dominantes y el grado de heterosis. 25 -w**«fc«*-'h*í-> Tabla 5 ; # de Bandas de Aditivo # de Bandas de Aditivo # de híbridos compartidos 26 5 o más 94 4 mas 262 3 o más 61 2 o más 1635 lomas La identificación y clonación de genes en común a las clases de aditivos y dominantes, entre una serie de 5 híbridos altamente heteróticos que comparten poca relación entre sí por pedigrí es de valor. Al comparar la clase de aditivo de todos los 10 híbridos, las bandas de aditivos que ocurren en uno o más de los 10 híbridos se consideran. Los resultados se muestran en la Tabla 5. 10 Con el número máximo de híbridos, una banda de aditivo ocurrió en siete de 10, Analizando la frecuencia de las bandas que ocurrieron en cada grupo, antes mencionad, en todos los grupos, un patrón constante en las bandas compartidas entre híbridos heteróticos (véase la Tabla 6) se 15 detectó. La predicción de heterosis basada en estos datos dan el siguiente intervalo: 10 > 8 > 2 > 7 > 6 > 1 > 3 > 9 > 4 > 5. Los híbridos correspondientes son: PAR23 > PAR2 PAR27 PAR25 > PAR21 > PAR20 > PAR?9 > PAR27/PAR43 > PAR24/PAR25 > PAR27/PAR37 > PAR27/PAR44. ^¡¡ /m gg&^ comparando con los datos de heterosis de rendimiento real en la tabla 6, . el intervalo es muy estrecho al rendimiento.
Tabla 6; Heterosis / Información Híbrida Correspondiente Los patrones de expresión de los dos híbridos SS x SS, PAR46/PAR48 y PAR4o/PAR47, también fueron informativos. La relación del pedigrí de los dos híbridos fueron similares (23 y 27%, respectivamente) ; sin embargo, los niveles de heterosis son diferentes significantemente, 2.3% para el primero y 36.6% para el último. La diferencia en el número de bandas de aditivo es sorprendente entre los dos (1 y 60) .
EJEMPLO 3: ANÁLISIS DE LA CLASE DE EXPRESIÓN DEL GENE DOMINANTE La observación adicional del análisis ulterior de datos fue que hay una diferencia en el número de bandas dominantes, contribuidas por los padres, masculino vs . hembra, es decir, si el nivel de expresión en Fl es el mismo como aquél del padre masculino o hembra. El número de bandas dominantes contribuidas por el padre masculino son concurrentemente mayores a través de todos los híbridos analizados, independientemente del grado de heterosis. Sin embargo, hay una mejor correlación entre la heterosis de rendimiento y el número de bandas dominantes contribuidas por las madres hembra que los padres masculinos, especialmente con la serie PAR27. Cuando las bandas dominantes se agrupan de acuerdo con si ellas son reguladas en forma ascendente o descendente en el híbrido, es decir, si el híbrido es el mismo como cualquiera del padre mayor o menor, Fl tiende a tener un nivel de expresión más cercano a los padres con la expresión mayor. Esto es especialmente verdadero con las bandas del ARN que son similares entre un híbrido Fl y su padre masculino. La asociación consistente de los números superiores de las bandas del ARN dominantes y de aditivo con híbridos heteróticos, independientemente de los antecedentes genéticos o las etapas de desarrollo, y la tendencia de la expresión del gene regulada ascendentemente de las bandas dominantes en híbridos, sugiere que los genes en los híbridos están en una fase más activa que en los endogámicos. Segundo, más genes están en tal condición activa en los híbridos heteróticos que en los híbridos pobres. Así, los genes son en su mayoría silenciados o inactivados cuando sus elementos reguladores están en una condición homóciga, por ejemplo en los endogámicos, pero reactivados cuando están en la condición heteróciga. Los híbridos derivados de dos endogámicos que tienen complementación óptima entre sí dan lugar a una condición heteróciga para la mayoría de estos elementos reguladores que tienen un número máximo de genes "reactivados" y son, por lo tanto, heteróticos. Los cruces de endogámicos estrechamente relacionados o líneas endogámicas que no tienen tal "complementación óptima" tiene menores genes reactivados y produjo híbridos heteróticos bajos.
Tabla 7. Diferencia en los números de bandas dominantes contribuidas por los padres masculino vs. hembra. Otra correlación (asociación estadística) de este conjunto de datos es que hay una diferencia en el número de bandas dominantes contribuidas por los padres, masculino vs . hembra, es decir, la expresión del nivel de expresión en Fl 5 es el mismo como aquél de los padres masculino o hembra. La cifra % ilustra los efectos paternales en la expresión del gene de los híbridos heteróticos y no heteróticos. El número total de bandas dominantes se calculó para cada híbrido como el 100%. (Fl = masculino o hembra: bandas dominantes donde 10 el híbrido Fl tiene un nivel igual de expresión como el padre masculino o hembra, respectivamente) . El número de bandas dominantes contribuidas por el padre masculino son constantemente superiores a través de todos los híbridos analizados, independientemente de si son o no heteróticos 15 (Tabla 7) . Igualmente, hay una mejor correlación entre la heterosis de rendimiento y el número de bandas dominantes por los padres hembra que los padres masculino, especialmente con la serie PAR27 (Tabla 7) . Por ejemplo, al 20 menos el híbrido heterótico PAR?/PAR17, un cruce consanguíneo, tenía el 96% de bandas dominantes masculino y 4% de bandas dominantes hembra. En tanto el híbrido que exhibe el mayor grado de heterosis PAR?/PAR2 tenía el 60% y 40% de bandas dominantes masculino y hembra, 25 respectivamente. Cuando estas bandas dominantes se agrupan, -"--—~—« de acuerdo con si ellas son reguladas en forma ascendente o descendente en el Fl, es decir, donde el Fl es el mismo como cualquiera de los padres superior o inferior, Fl tiende a tener un nivel de expresión más cercano a los padres con expresión superior. Esto es especialmente verdadero con las bandas de ARN dominantes o los padres masculinos (Tabla 8) .
Tabla 8. Número de bandas de ARN, cuando Fl es regulado en forma ascendente o descendente Padre masculino Padre hembra Híbridos Total (F1 Regulado Regulado Relación Total Regulado Regulado Relación = ascendente descendente (asc./desc (F1 = ascendente descendente (asc./desc.] masculino) (F1 = (F1 = padre hembra) (F1 = (F1 = padre padre inferior) padre inferior) superior) superior) PARj PAR^ 344 258 86 3 1 259 157 102 1.5 PAR> PAR,, 419 304 1 15 2.6.1 227 154 73 2.1 PARj PA j, 299 206 93 2.2:1 163 96 67 1.4: PAREAR,, 133 97 36 2.7:1 108 51 57 0 PA ^AR^ 134 106 28 3.8:1 46 18 28 0.6: PARj/PAR,, 415 274 141 1.9:1 324 152 172 0.
PA EA ,, 417 285 132 2.6: 1 333 189 144 1.3 PAR„/PAR„ 370 251 1 19 2.1: 1 280 195 85 2.3 PARy PAR;s 444 270 174 1.6:1 237 165 72 2.3 PAREAR,, 363 196 167 1.2: 1 204 144 60 2.4 EJEMPLO 4: GENES EXPRESADOS ESPECÍFICAMENTE EN HÍBRIDOS COMERCIALES DE ALTO RENDIMIENTO La mayoría de los análisis relacionados con los datos del perfil del ARN, descritos en el Ejemplo 1, se basan en los patrones de expresión de los híbridos Fl con relación a sus padres endogámicos, tal como las clasificaciones aditivas vs . no aditivas, y las diferencias de estas categorías entre los híbridos heteróticos y no heteróticos. Mientras los resultados fueron informativos, otra manera de analizar este conjunto de datos por la comparación de los niveles de la expresión del ARN de híbridos pobres con híbridos heteróticos sin cualquier intervención de sus padres. Al comparar todos los 10 híbridos, que incluyen los 3 cruces de crianza y 7 híbridos comerciales, una lista de bandas que tiene un nivel de expresión similar entre los híbridos heteróticos, pero diferente de los híbridos no heteróticos (cruces de crianza) se determinaron.
EJEMPLO 5: PERFIL DE EXPRESIÓN QUE USA DIFERENTES TEJIDOS DE HÍBRIDOS Y PADRES Los datos del perfil del RN de conjuntos de híbridos (híbridos y sus padres respectivos) se obtuvieron en el maíz. Cinco otros conjuntos utilizaron tejidos de granos a los 13 días después de la polinización ("DAP") . Un total de 14 conjuntos de híbridos para las espigas inmaduras (V19) , cinco para los granos (R2) y tres para los tejidos de plantitas (V3) se perfilaron. Para los tejidos de espigas inmaduras, los 14 conjuntos de híbridos analizados incluyen siete de la serie PAR27, que cubre un espectro de niveles de heterosis que varía de los híbridos comerciales a los híbridos heteróticos bajos de los cruces consanguíneos; cuatro híbridos comerciales de antecedentes genéticos diversificados, además de la serie de PAR27, y tres cruces entre endogámicos del mismo grupo heterótico, típico de aquéllos que serán útiles para la crianza de nuevos endogámicos .
Tabla 9. Bandas de ARN identificadas (34) que se expresan diferencialmente en híbridos heteróticos vs. no heteróticos (los números son las diferencias N-veces en la expresión de cada híbrido de PAR19) .
PAR„ vs. PAR„ vs. PAR„ vs. PAR,, vs. P?R„ vs. P?Rj/PARy PAR„ vs. PAR„ vs PAR^ Band ID PAREA ,, PARCHAR,, PAR , P?R:„ PARj/PAR,, PAR^/PAR,, (PAR,, cross) PAR„/P?R„ P?R.VPAR* PAR, P?R 010-165.5 0 0 0 0 0 -2.66 -2.19 -6.49 -4.31 dOvO- 123.2 0 0 -2.66 -2.06 0 0 3.54 7.09 5.14 dOvO-172.4 7.8 0 0 0 0 891 18.48 18.44 29.45 10 dOvO-104,4 0 0 0 0 0 0 2.36 2.55 2.45 gOmO-359.8 0 0 0 0 0 0 4 97 2.82 2.09 gln -389.3 0 0 0 2.69 -4 03 0 -2.73 -2.57 -2.98 hOcO- 173.1 0 0 0 0 0 0 2 43 2.85 2.16 hOcO-285.4 2 07 2.64 0 204 0 0 -2.47 -2.1 -2.88 15 hOrO-131.4 0 0 0 0 0 3.85 4.83 4.S1 5.16 iOaO-45.6 0 0 0 0 0 0 -2.49 -2.26 -2.53 iüaO-237.8 0 0 0 0 0 0 2.59 3 3 2.81 ¡OaO-242.8 0 0 0 0 0 0 -2.84 -4.76 -2.87 ¡OaO- 252.1 0 0 0 -274 2.72 0 69 21 29.62 69.23 20 iOcO-95.6 0 0 -2.51 0 0 0 -3.02 -2.2 -2.76 iOcO-203.4 0 0 0 0 ? 0 -2.26 -2.87 -2.04 iOcO-312.1 0 0 0 0 -8 74 0 6 1 1 7.1 1 7.9 ¡OmO-271.5 0 0 0 0 0 0 -2.92 2.39 2.63 lOnO- 140.4 0 0 0 0 -2.03 0 2.55 2.1 2.45 5 10n0-210.5 -2 13 0 -2.21 0 0 1209 13.43 8.82 16.27 mlaO-89.3 0 0 0 0 0 0 3.41 3.74 2.4 mlaO-239.6 -2.54 0 0 0 0 0 -2.8 -4.05 -4.94 mlaO-241.6 0 0 0 0 0 0 -4 -3.14 -2.64 mlaO-425.1 0 0 -2.34 0 0 0 4.59 6.64 6.1 0 rO O- 190.7 0 0 0 0 2.45 0 -2.85 -4.4 -9.01 w9c0-128.3 0 0 4.54 0 0 0 2.53 3.63 3.14 OcO-230.2 0 0 6.83 0 0 0 -2.72 -3.14 -3.13 OcO-267.2 -15.18 0 3.09 0 -5 12 2.62 6.62 6.55 10.73 wOcO-381.3 0 0 0 0 0 0 17.45 39.08 44.17 5 wOhO-251.2 0 0 0 0 0 0 2.64 2.56 2.8 wOhO-406.6 0 0 0 0 0 0 7.34 4.21 7 _ ______Ém¡_í& _í__.
PAR,, vs. P?R„ .s. PAR,, .s. P?R„ .s. P?R„ vs. PAR,, vs. P?R./PAR,, PAR,, \_. PAR„ .s PAR,, vs. Band lD P?R,j/P?R„ PAR^ PAR,, P?R„/P?R;„ P?R./P?R,, AREAR,, (PAR,,, cross) PAR:7/P?R.,% PAR:7 P?R4J PAR.,/ PAR,, O?O-1544 0 0 -204 0 0 0 3 73 3 65 3 8 O?O-265 3 0 0 0 0 0 0 -251 -273 -228 yO?O-1 18 I 0 0 0 0 -2 15 0 4 19 6 57 6 65 yO?O-254 4 0 0 0 0 0 4 21 2 6 6 95 5 32 Los cinco conjuntos de híbridos donde los tejidos de granos se analizaron y los tres conjuntos de híbridos de 5 la serie PAR27, donde los tejidos de plantitas se analizaron fueron de la serie PAR27- Los datos de perfilado de todos estos híbridos de los tres tejidos analizados dieron patrones de expresión „ similares. Sin embargo, el tejido de espigas inmaduras fue 10 más informativo que el tejido de plantitas y menos complicado que el tejido de granos, lo cual se compone con otros efectos debidos a las fuentes de polen , tal como xenia, efectos maternales, etc. El análisis de perfil de todas las muestras mostró consistentemente correlaciones 15 similares entre la información de perfil y la heterosis a aquéllas descritas en los Ejemplos 1, 2 y 3. Las bandas dominantes de todos los 14 híbridos, compartidos por el número de híbridos se presentan en la Figura 2. El número de bandas dominantes compartidas por uno 20 o más híbridos se normalizó al 100%. Los datos muestran que las bandas dominantes compartidas por dos o más híbridos varía de 60 al 80%; las bandas compartidas por tres o más híbridos es de aproximadamente el 40 al 50%, etc. Aunque el número total de bandas dominantes fue importante para obtener un híbrido heterótico, las bandas dominantes compartidas por un número mayor de híbridos puede no contribuir necesariamente a la expresión de heterosis. Puesto que las plantitas muestran la misma tendencia como las espigas inmaduras, no obstante con didferentes genes implicados, es posible seleccionar en la etapa de plantitas combinaciones de híbridos individuales que expresan el número mayor de genes con el patrón de la expresión dominante y que tienen menores genes en la clase sobre-/sub-dominante . Así, números mucho mayores de los cruces superiores F2 se clasifican usando este procedimiento como un primer corte, que pueden ser clasificados por pruebas de rendimiento solas de múltiples sitios. Además de los análisis anteriores, otra manera de analizar los datos del perfil pueden ser usados. En este acercamiento, los niveles de la expresión del ARN de los híbridos pobres y los híbridos heteróticos se comparan sin cualquier implicación de sus padres. Este acercamiento examina si el nivel absoluto de la expresión de un subconjunto de genes es importante para la heterosis, además de los patrones de expresión del aditivo vs . no aditivo ya encontrados. En las bandas expresadas dominantemente, los híbridos Fl tienden a tener los mismos niveles de expresión como el padre superior, es decir que muestran en general una regulación ascendente de la expresión de gene (Tabla 10) . Al comparar todos los híbridos con PAR19, 34 bandas que tienen el nivel de expresión similar entre los híbridos heteróticos, pero diferente del híbrido no heterótico, se identificaron (Tabla 9; las últimas tres columnas son híbridos no heteróticos) . Para estas 34 bandas, los 3 híbridos pobres muestran expresiones o superiores o inferiores que PAR19, en tanto todos los otros híbridos, que son heteróticos, muestran poca o ninguna diferencia en la expresión con relación a PAR19.
Tabla 10 : Predominancia de las bandas reguladas en forma ascendente en los híbridos vs . sus padres Bandas Dominantes Genotipo Total Ascendente Descendente EJEMPLO 6: CORRELACIONES A LOS PADRES MASCULINO VS. HEMBRA Como se indicó previamente, se observó una preponderancia de las bandas dominantes del padre cuando el mARN de las espigas inmaduras se perfiló de híbridos y sus padres endogámicos respectivos, (Figura 5) - Las bandas dominantes del padre se clasificaron para el polimorfismo de secuencia alélica entre los padres endogámicos, de modo que los alelos masculino y hembra se identificaron. Varias bandas exhibieron un polimorfismo alélico entre los dos alelos paternales y estos se probaron además para la expresión mono-o bi-alélica en los híbridos Fl . Los aprestos de la PCR se designaron con base en la información de secuencia y se usaron para amplificar los cADN derivados de los mARN de híbridos Fl . Más de 20 clonas de cADN derivadas de mARN Fl desde un solo sitio, se tomaron aleatoriamente y se formaron en secuencia. Todos los cADN expresados en Fl fueron idénticos al alelo expresado en el padre masculino y ninguno fue idéntico al expresado en el padre hembra. Estos resultados se ilustran en la Figura 6a-c, que muestra una prueba de expresión alélica de una banda dominante masculino (wOhO) clonada de CuraGen. (A) representación esquemática de los productos de amplificación de polimorfismo; B) secuencias de 9 cADN aleatorias de 50% de PARX + 50% de PAR2 mARN usando como un control para la discriminación alélica en la clonación de la PCR; C) secuencias de 10 ADN aleatorios de PAR?/PAR2 mAQRN son todas las mismas como el alelo de PAR2. Este resultado es consistente con la expresión de sólo el alelo derivado del padre y es inactivo en el alelo derivado de la hembra. Para habituar que la amplificación preferida no explique los resultados de la amplificación diferencial, cantidades iguales de mARN de cada genotipo padre se mezclaron y amplificaron por la PCR. De 9 clonas de cADN con secuencia de la reacción de control, 5 fueron del alela del padre masculino y cuatro del alelo de la madre hembra, demostrando que no hay discriminación entre los alelos ocurridos durante la amplificación. Por lo tanto, las exposiciones y descripciones de la presente se intentan sean ilustrativas, pero no limitativas, del ámbito de la invención, el cual se señala en las siguientes reivindicaciones. Un experto en la materia reconocerá que muchas modificaciones, se encuentran dentro del ámbito de las siguientes reivindicaciones. Por ejemplo, todos los métodos y composiciones se pueden usar en diferentes combinaciones para lograr resultados seleccionados por un experto en la materia. Todas las publicaciones y solicitudes de patente, aquí citadas, se incorporan como referencia en su totalidad para todo propósito, como si cada una se indicara específicamente incorporada como referencia.
LISTA DE SECUENCIAS <110> PIONEER HI-BRED INTERNATIONAL, INC. <120> PERFIL MOLECULAR PARA LA SELECCIÓN DE HETEROSIS <130> 04-00102OPC <140> PCT/US00/01422 <141> 2000-01-19 <150> 60/116,617 <151> 1999-01-21 <150> 60/166,368 <151> 1999-11-17 <160> 23 <170> Patentln Ver. 2.1 <210> 1 <211> 59 <212> ADN <213> Zea maize <400> 1 gtcgtcgtcg tcgtggtgta cctcgtacgt gacatgccgt agcacgtacg ctagcagag 59 <210> 2 <211> 51 <212> ADN <213> Zea maize <400> 2 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 3 <211> 59 <212> ADN <213> Zea maize <400> 3 ^^?y gtcgtcgtcg tcgtggtgta cctcgtacgt gacatgccgt agcacgtacg ctagcagag 59 <210> 4 5 <211> 59 <212> ADN <213> Zea maize <400> 4 10 gtcgtcgtcg tcgtggtgta cctcgtacgt gacatgccgt agcacgtacg ctagcagag 59 <210> 5 <211> 59 15 <212> ADN <213> Zea maize <400> 5 gtcgtcgtcg tcgtggtgta cctcgtacgt gacatgccgt agcacgtacg 20 ctagcagag 59 <210> 6 <211> 59 <212> ADN 25 <213> Zea maize <400> 6 gtcgtcgtcg tcgtggtgta cctcgtacgt gacatgccgt agcacgtacg ctagcagag 59 30 <210> 7 <211> 50 <212> ADN <213> Zea maize 35 <400> 7 gtcgtcgtcg gtaccttacg tgacatgctg tagcacgtac gctagcagag 50 40 <210> 8 <211> 51 <212> ADN <213> Zea maize 45 <400> 8 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 9 ^a^^^Stti=i== <211> 51 <212> ADN <213> Zea maize <400> 9 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 10 <211> 51 <212> ADN <213> Zea maize <400> 10 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 11 <211> 51 <212> ADN <213> Zea maize <400> 11 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 12 <211> 59 <212> ADN <213> Zea maize <400> 12 gtcgtcgtcg tcgtggtgta cctcgtacgt gacatgccgt agcacgtacg ctagcagag 59 <210> 13 <211> 59 <212> ADN <213> Zea maize <400> 13 gtcgtcgtcg tcgtggtgta cctcgtacgt gacatgccgt agcacgtacg ctagcagag 59 <210> 14 <211> 51 <212> ADN <213> Zea maize <400> 14 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 5 <210> 15 <211> 51 <212> ADN <213> Zea maize 10 <400> 15 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 16 15 <211> 51 <212> ADN <213> Zea maize <400> 16 20 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 17 <211> 51 25 <212> ADN <213> Zea maize <400> 17 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 30 51 <210> 18 <211> 51 <212> ADN 35 <213> Zea maize <400> 18 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 40 <210> 19 <211> 51 <212> ADN <213> Zea maize 45 <400> 19 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 20 <211> 51 <212> ADN <213> Zea maize 5 <400> 20 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 10 <210> 21 <211> 51 <212> ADN <213> Zea maize 15 <400> 21 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 22 20 <211> 51 <212> ADN <213> Zea maize <400> 22 25 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 51 <210> 23 <211> 51 30 <212> ADN <213> Zea maize <400> 23 gtcgtcgtcg tgtaccttac gtgacatgct gtagcacgta cgctagcaga g 35 51 — - --.•-«----»«*»

Claims (78)

  1. REIVINDICACIONES 1. Un método para clasificar la heterosis en plantas, este método comprende: i . ) perfilar la expresión de una primera muestra 5 representativa de primeros productos de expresión desde una primera planta de progenie, para cuantificar los productos de expresión producidos en la primera planta de progenie, en que el número de los primeros productos de expresión, producidos en la primera planta de 10 progenie, se correlaciona con una medida de la heterosis en la primera planta de progenie; o ii.) perfilar la expresión de una segunda muestra representativa de segundos productos de expresión desde la primera planta de progenie, para cuantificar o 15 identificar los productos de expresión dominantes en la segunda muestra representativa, en que el número de productos de expresión dominantes está correlacionado con una medida de la heterosis en la planta de progenie . 20
  2. 2. El método de la reivindicación 1, que además comprende : seleccionar la planta de progenie perfilada en (i) o (ii) , con base en el número de los primeros productos de expresión en la primera muestra representativa, o con base en el número de segundos productos de expresión en la segunda muestra representativa, que exhibe un patrón de expresión dominante.
  3. 3. Una planta seleccionada por el método de la 5 reivindicación 2.
  4. 4. El método de la reivindicación 1, en que los primeros y segundos productos de expresión se seleccionan independientemente de: los mARN y proteínas.
  5. 5. El método de la reivindicación 1, en que la 10 primera o segunda muestra representativa corresponde entre aproximadamente 1,000 y aproximadamente 20,000 productos de genes .
  6. 6. El método de la reivindicación 1, en que se detecta la expresión de al menos un 50% del primero o 15 segundo productos de expresión producidos en un tejido seleccionado.
  7. 7. El método de la reivindicación 1, en que la expresión se perfila en la etapa (i) o la etapa (ii) , usando una o más técnicas seleccionadas de: hibridización de los 20 ácidos nucleicos amplificados a un arreglo de ácido nucleico, hibridización a un arreglo de proteínas, hibridización a un arreglo de anticuerpos, hibridización de substracción y exhibición diferencial. ¿^¿a*^^.
  8. 8. El método de la reivindicación 1, que además comprende : seleccionar la primera planta de progenie de una o más características, seleccionadas de un número escogido de productos de expresión dominantes, una relación seleccionada de productos de expresión dominantes a los productos de expresión totales, la expresión de un producto de expresión dominante que exhibe un polimorfismo de secuencia alélica, un número deseado de productos de expresión sobre- o sub-dominantes, una relación seleccionada de productos de expresión sobre- o sub-dominantes a los productos de expresión totales, un número seleccionado de los productos de expresión aditivos, y una relación seleccionada de los productos de expresión aditivos a los productos de expresión totales.
  9. 9. El método de la reivindicación 1, que además comprende : identificar cuáles productos de expresión de la primera o segunda muestra representativa muestran un patrón de expresión dominante, aditivo, sub-dominante o sobre-dominante, para al menos una porción de la muestra representativa .
  10. 10. El método de la reivindicación 1, que además comprende : seleccionar la primera planta de progenie para llevar al máximo el número de productos de expresión dominantes o para llevar al máximo el número de productos de expresión aditivos, o para expresar un producto de expresión 5 dominante, que exhibe un polimorfismo de secuencia alélica, o para reducir al mínimo el número de productos de expresión sobre- o sub-dominantes.
  11. 11. El método de la reivindicación 1, que además comprende : 10 clonar al menos un ácido nucleico, que codifica un producto de expresión, seleccionado de: un producto de gene aditivo, un producto de gene dominante, el cual tiene opcionalmente un polimorfismo de secuencia alélica, un producto de gene sobre-dominante, un producto de gene sub- 15 dominante, y el producto de un transgene, derivado de la primera o segunda planta de padres o la primera planta de progenie .
  12. 12. El método de la reivindicación 11, que además comprende tranducir este al menos un ácido nucleico en una 20 planta objetivo, que resulta en un aumento en el número de productos de genes aditivos o dominantes, expresados en la planta objetivo.
  13. 13. El método de la reivindicación 1, que además comprende : "^feaaae-aa*-*"-»--*-• cruzar una primera planta de padres con una segunda planta de padres, para producir la primera planta de progenie .
  14. 14. El método de la reivindicación 13, que además 5 comprende: perfilar los productos de expresión de padres desde cualquiera de la primera o segunda planta de padres .
  15. 15. El método de la reivindicación 13, que además comprende : perfilar la expresión de muestras representativas 10 de padres de los productos de genes desde la primera y segunda planta de padres; y comparar los perfiles de expresión de padres resultantes de la primera y segunda plantas de padres, con un perfil de expresión de la primera planta de progenie. 15
  16. 16. El método de la reivindicación 13, en que la primera planta de padres es una planta femenina y la segunda planta es una planta masculino, este método además comprende : cruzar al menos una tercera planta masculina a la 20 primera planta femenina, para producir al menos una segunda planta de progenie; comparar un perfil de expresión de la primera planta de progenie y un perfil de expresión de la segunda ^^#te planta de progenie a un perfil de expresión de la primera planta femenina; y seleccionar la primera o segunda planta de progenie, con base en la similaridad al perfil de expresión de la primera planta femenina.
  17. 17. El método de la reivindicación 13, que además comprende: identificar los genes que son inactivos en la primera planta de padres, la segunda planta de padres, o la primera planta de progenie.
  18. 18. El método de la reivindicación 13, que además comprende: clonar un ácido nucleico, que codifica un gene inactivo en la primera planta padre, la segunda planta padre o en la primera planta de progenie.
  19. 19. El método de la reivindicación 13, que además comprende: introducir un ácido nucleico heterólogo en la primera planta padre, la segunda planta padre, la primera planta de progenie, o una planta de progenie subsiguiente, derivada de uno o más de: la primera planta padre, la segunda planta padre o la primera planta de progenie, este ácido nucleico heterólogo resulta en una expresión aumentada de un producto de expresión de un gene inactivo.
  20. 20. El método de la reivindicación 13, que además comprende: determinar una relación entre la suma de los productos de gene expresados, que difieren de la planta de progenie en que cada una de la primera y segunda plantas padre y el número de productos de gene expresados que difieren entre la primera y la segunda plantas de padres. 5
  21. 21. El método de la reivindicación 13, que además comprende: cruzar una o más plantas adicionales con la primera o segunda planta de padres, para producir al menos una planta de progenie adicional .
  22. 22. El método de la reivindicación 13, que además 10 comprende: cruzar una o más plantas adicionales con la primera o segunda planta de padres, para producir una o más plantas de progenie adicionales; perfilar la expresión de una muestra 15 representativa de los productos de genes desde esta una o más plantas de progenie; y comparar el perfil de expresión resultante de una o más plantas de progenie adicionales, con un perfil de expresión de la primera planta de progenie. 20
  23. 23. El método de la reivindicación 22, que además comprende: seleccionar una planta de progenie heterótica de un grupo de plantas de progenie, que comprende la primera planta de progenie y esta una o más plantas de progenie adicionales . ^^^g^&^^=^^^
  24. 24. El método de la reivindicación 23, en que la planta de progenie heterótica se selecciona con base en una o más propiedades seleccionables, escogidas de: un número elevado de ARN expresados con relación a una o más plantas de padres; un número elevado de ARN expresados, con relación a las otras plantas de progenie en este grupo de plantas de progenie; un número elevado de ARN expresados, que muestran un patrón de expresión dominante con relación a una o más plantas de padres; un número elevado de productos de genes, que muestran un patrón de expresión dominante, con relación a otras plantas de progenie en el grupo de estas plantas de progenie; un ARN que muestra un polimorfismo de secuencia alélica, con relación a una o más plantas de padres, un ARN que muestra un polimorfismo de secuencia alélica, con relación a las otras plantas de progenie en el grupo de estas plantas de progenie, un número disminuido de productos de genes, que muestran un patrón de expresión de un gene sobre- o sub-dominante, como se compara a una o más plantas de padres; y un número disminuido de productos de gene, que muestran un patrón de expresión sobre- o sub-dominante, comparado con otras plantas de progenie en el grupo de estas plantas de progenie.
  25. 25. El método de la reivindicación 13, en que la primera planta de padres, la segunda planta de padres y la primera planta de progenie se seleccionan, independientemente, de: una planta endogámica y una planta híbrida.
  26. 26. El método de la reivindicación 13, en que la primera planta de padres es una primera planta endogámica, la segunda planta de padres es una segunda planta endogámica, y la planta de progenie es una planta híbrida.
  27. 27. El método de la reivindicación 13, en que la primera o segunda planta de padres es una planta endogámica o híbrida, y la planta de progenie es una planta híbrida, este método además comprende cruzar una pluralidad de primeras plantas adicionales de la misma cepa con la primera planta de padres, con una pluralidad de segundas plantas adicionales de la misma cepa, como la segunda planta de padres, para producir una pluralidad de plantas híbridas de progenie.
  28. 28. El método de la reivindicación 27, que además comprende el cruce superior de al menos una de la pluralidad de plantas híbridas de progenie con una pluralidad de plantas endogámicas, para suministrar una pluralidad de plantaza de cruce superior.
  29. 29. El método de la reivindicación 28, que además comprende el cruce superior de plantas de cruce superior a una planta endogámica, para producir una planta de progenie de cruce superior y, opcionalmente, perfilar la expresión de una muestra representativa del ARN desde la planta de cruce superior o desde la planta de progenie de cruce superior.
  30. 30. El método de la reivindicación 28, que además 5 comprende : cruzar consigo misma una planta de prueba, seleccionada de: la primera planta padre, la segunda planta padre, la primera planta de progenie, una de la pluralidad de las plantas híbridas de progenie, una de la pluralidad de 10 las plantas de cruce superior y una de la pluralidad de plantas de progenie de cruce superior; o cruzar una o más plantas de prueba, seleccionadas de: la primera planta padre, la segunda planta padre, la primera planta de progenie, una de la pluralidad de plantas 15 híbridas de progenie, una de la pluralidad de plantas de cruce superior, y una de la pluralidad de plantas de progenie de cruce superior.
  31. 31. El método de la reivindicación 30, que además comprende: perfilar la expresión de la planta de prueba. 20 32. El método de la reivindicación 30, que además comprende: perfilar la expresión de un tejido inmaduro desde la planta de prueba.
  32. ^.^Al&ffi
  33. 33. El método de la reivindicación 28, que además comprende : perfilar la expresión de un número representativo de productos de expresión de una o más de la pluralidad de 5 plantas de progenie híbridas, o su progenie; y realizar adicionalmente al menos uno de: i . ) determinar el número de productos de expresión en la muestra representativa, desde la pluralidad de plantas de progenie híbridas, o su progenie, en donde el número 10 de productos de expresión en la pluralidad de plantas de progenie híbridas, o su progenie, se correlaciona con una medida de la heterosis en la pluralidad de plantas de progenie híbridas, o su progenie; ii.) determinar el número de productos de expresión en la 15 muestra representativa de los productos de expresión, desde la pluralidad de plantas de progenie híbridas, o su progenie, en donde el número de productos de expresión, que exhibe un patrón de expresión dominante en la pluralidad de plantas de progenie híbridas, o su 20 progenie, se correlaciona con una medida de la heterosis en la pluralidad de plantas de progenie híbridas, o su progenie; y iii.) seleccionar la pluralidad de plantas de progenie híbridas, o su progenie, para plantas que exhiben un 25 número seleccionado de los productos de expresión, o un „,-^---a-a^-.«---*• número seleccionado de productos de expresión dominantes, seleccionando así un aumento en una medida de la heterosis.
  34. 34. El método de la reivindicación 13, en que la primera y segunda plantas de padres son las monocotiledóneas .
  35. 35. El método de la reivindicación 13, en que la primera y segunda planta de padres se seleccionan de las familias de las Graminear, Composi tae y Leguminosae .
  36. 36. El método de la reivindicación 13, en que la primera y segunda plantas de padres se seleccionan de: maíz, arroz, soya, sorgo, trigo, avenas, cebada, mijo, girasol y cañóla.
  37. 37. El método de la reivindicación 13, que además comprende seleccionar la primera y segunda plantas padres para producir la primera planta de progenie, con un número seleccionado de productos de expresión los cuales son dominantes, sobre-dominantes, sub-dominantes o aditivos.
  38. 38. El método de la reivindicación 37, en que los padres se seleccionan para producir la primera planta de progenie, seleccionando la expresión complementaria de productos de expresión dominantes o aditivos, entre estos padres .
  39. 39. El método de la reivindicación 1, que además comprende : iii.) comparar un conjunto de primeros productos de expresión en la primera planta de progenie, a un conjunto de segundos productos de expresión de plantas desde una segunda planta; o iv.) comparar un conjunto de productos de expresión, que exhibe un patrón de expresión dominante en la primera planta de progenie, a un conjunto de productos de expresión que exhibe un patrón de expresión dominante en una segunda planta.
  40. 40. El método de la reivindicación 39, en que la etapa (iii) o la etapa (iv) se realizan usando una computadora .
  41. 41. El método de la reivindicación 39, en que la etapa (iii) o la etapa (iv) se realizan usando una computadora, en que el segundo número de los productos de gene expresados o el segundo número de los productos de gene, que exhiben un patrón de expresión dominante, está presente en una base de datos en la computadora.
  42. 42. El método de la reivindicación 1, en que las etapas de perfilar la expresión se realizan en un sistema integrado, que comprende un microprocesador, con un software para determinar uno o más de: cuántos genes se expresan; si los genes expresados son dominantes; si los genes expresados son aditivos; si los genes expresados son sobre-dominantes y si los genes expresados son sub-dominantes.
  43. 43. El método de la reivindicación 1, que además comprende hacer entrar un perfil de expresión resultante para la primera planta de progenie, en una base de datos de los perfiles de expresión.
  44. 44. El método de la reivindicación 43, en que la base de datos es un sistema integrado que comprende una computadora.
  45. 45. Una base de datos, producida por el método de la reivindicación 43.
  46. 46. La base de datos de la reivindicación 45, en que esta base de datos está presente en una computadora.
  47. 47. La base de datos de computadora de la reivindicación 46, en que esta base de datos comprende perfiles del producto de expresión de una muestra representativa de los productos de expresión para plantas de progenie híbridas, que resultan de al menos 10 cruces separados de plantas endogámicas.
  48. 48. El método de la reivindicación 43, que además comprende seleccionar un perfil de expresión de la base de datos, este perfil suministra un subconjunto único de productos de expresión.
  49. 49. El método de la reivindicación 48, que además comprende : clonar un ácido nucleico, el cual expresa al menos un producto de expresión en el subconjunto único de los productos de expresión; o clonar un ácido nucleico, el cual expresa al menos un producto de expresión en el subconjunto único de productos de expresión y transducir el ácido nucleico en una planta heteróloga; o cruzar una primera planta seleccionada, la cual expresa un subconjunto único de productos de expresión con una segunda planta seleccionada, la cual no expresa el subconjunto único de productos de expresión.
  50. 50. El método de la reivindicación 1, que además comprende: cruzar consigo misma la primera planta de progenie .
  51. 51. El método de la reivindicación 1, que además comprende: cruzar consigo misma la primera planta de progenie y detectar la inactivación de los productos de expresión dominantes en plantas de progenie subsiguiente, las cuales se derivan del autocruce de la primera planta de progenie .
  52. 52. El método de la reivindicación 51, que además comprende: clonar un ácido nucleico inactivado, que codifica un producto de expresión dominante.
  53. 53. El método de la reivindicación 51, que además comprende: introducir un ácido nucleico heterólogo, que resulta en la expresión de los productos de expresión dominantes desde los genes inactivados.
  54. 54. El método de la reivindicación 53, en que el ácido nucleico heterólogo codifica uno o más de: un factor de trascripción, el cual activa un promotor de un gene inactivado; un ácido nucleico codificado por el gene inactivado, bajo el control de un promotor heterólogo; y un homólogo del ácido nucleico al gene inactivado, con al menos una región de diferencia con este gene inactivado, este ácido nucleico homólogo puede recombinarse con el gene inactivado para producir un gene modificado.
  55. 55. El método de la reivindicación 1, que además comprende: probar la primera planta de progenie o su planta de progenie subsiguiente, en una cualidad deseada.
  56. 56. El método de la reivindicación 1, que además comprende : probar la primera planta de progenie, o su planta de progenie subsiguiente, en una cualidad fenotípica deseada; comparar la cualidad fenotípica entre la primera planta de progenie, o la planta de progenie subsiguiente, a una planta híbrida seleccionada; comparar un perfil de expresión de la planta híbrida seleccionada a un perfil de expresión de la primera planta de progenie, o la planta de progenie subsiguiente; y clonar al menos un ácido nucleico, el cual se expresa diferencialmente entre la planta híbrida seleccionada y la primera planta de progenie, o la planta de progenie subsiguiente.
  57. 57. El método de la reivindicación 56, que además comprende transducir este al menos un ácido nucleico en una planta seleccionada, para producir una planta transgénica.
  58. 58. El método de la reivindicación 1, en que la primera y segunda muestras representativas son de un tejido inmaduro de la primera planta de progenie.
  59. 59. El método de la reivindicación 58, en que el tejido inmaduro es una espiga inmadura de las planta, o una plantita.
  60. 60. Un método para identificar cruces de plantas, con un aumento en la probabilidad para la heterosis en plantas de progenie, este método comprende: i.) comparar los perfiles de expresión de una pluralidad de plantas; y ii.) determinar, por las comparaciones en parejas de los perfiles de expresión, cuáles cruces producirán al menos uno de los siguientes: a) progenie con un número seleccionado u óptimo de productos de expresión; o b) progenie con un número seleccionado o tipo de productos de expresión que exhiban un patrón de expresión dominante, aditivo, sobredominante o subdominante .
  61. 61. El método de la reivindicación 60, que además comprende obtener cruces de plantas identificadas para producir plantas de progenie.
  62. 62. El método de la reivindicación 60, que además comprende: obtener cruces de plantas identificadas, para producir plantas de progenie, estas plantas de progenie se prueban para una o más cualidades deseadas.
  63. 63. El método de la reivindicación 60, en que los cruces son identificados, los cuales llevan al máximo el número de productos de expresión en la progenie potencial, o los cuales llevan al máximo el número de productos de expresión dominantes en la progenie potencial, o los cuales llevan al máximo el número de productos de expresión aditivos, en la progenie potencial, o los cuales reducen al mínimo el número de productos de expresión sobre-dominantes en la progenie potencial, o los cuales reducen al mínimo el número de productos de expresión sub-dominantes, en la progenie potencial.
  64. 64. El método de la reivindicación 60, en que: las plantas son plantas endogámicas, plantas híbridas o plantas transgénicas; y las plantas se seleccionan de: plantas de las familias de Gramineae, Composi tae y Leguminosae ; o las plantas se seleccionan de: maíz, arroz, soya, sorgo, trigo, avenas, cebada, mijo, girasol y cañóla.
  65. 65. El método de la reivindicación 60, en que los perfiles de expresión se compilan en una base de datos.
  66. 66. El método de la reivindicación 60, en que se genera una matriz de posibles combinaciones de perfiles de expresión en parejas para las plantas.
  67. 67. El método de la reivindicación 60, en que los perfiles de expresión se compilan en una base de datos en una computadora y una matriz de posibles combinaciones de perfiles de expresión en parejas, para las plantas se considera usando un sistema integrado que comprende una computadora.
  68. 68. El método de la reivindicación 60, que además comprende seleccionar un subconjunto de cruces potenciales desde todas las posibles comparaciones en parejas, las cuales exhiben un número máximo de diferencias del perfil de expresión.
  69. 69. El método de la reivindicación 60, que además comprende seleccionar un subconjunto de cruces potenciales de todas las posibles comparaciones en parejas, que exhiben un número máximo de diferencias de perfiles de expresión, en que al menos una pluralidad de posibles comparaciones en parejas son para plantas de diferentes grupos heteróticos.
  70. 70. El método de la reivindicación 60, en que las comparaciones en parejas se consideran para identificar los cruces del mismo grupo heterótico.
  71. 71. El método de la reivindicación 60, que además comprende : iii) identificar los cruces donde, la suma de: a) los productos de expresión, producidos en una primera planta de un primer grupo heterocíclicos (Aj) que no se expresan en una segunda planta desde el primer grupo heterocíclico (A) , al cual la primera planta se cruza (Ak) y la cual no se expresa en una tercera planta seleccionada desde un segundo grupo heterótico (B) ; más b) los productos de expresión producidos en Ak que no producen Aj y que no se producen en B; son optimizados.
  72. 72. El método de la reivindicación 71, que además comprende obtener un cruce identificado en (iii) .
  73. 73. El método de la reivindicación 71, en que la optimización se obtiene por: determinar todas las posibles combinaciones en parejas, desde el primer grupo heterótico e identificar el cruce el cual resulta en la suma mayor de los productos de expresión; o determinar todas las posibles combinaciones en parejas desde el primer grupo heterótico y los cruces de identificación, que resultan en una progenie híbrida (Ai x Aj) con un número máximo de diferencias en comparación a B; determinar todas las posibles combinaciones en parejas, desde el primer grupo heterótico e identificar los cruces que resultan en la progenie híbrida (Ai x Aj) que tiene un número mayor de diferencias con B, que el número de diferencias entre B y Ai o B y Aj .
  74. 74. El método de la reivindicación 73, que además comprende seleccionar la progenie auto-cruzada o retro- 5 cruzada, derivada del híbrido Ai x Aj que: retiene un conjunto de productos de expresión, definidos por la suma de productos de expresión expresados en Ai (pero no en Aj o en B) , y Aj (pero no en Ai o en B) ; o el cual muestra un número mayor de productos de 10 expresión, expresados en un cruce superior con B, que cualquiera de Ai o Aj cuando hay cruce superior con B.
  75. 75. Un método para identificar una fuente de una planta de prueba, este método comprende: perfilar la expresión de una muestra 15 representativa de los productos de expresión desde la planta de prueba; y comparar el perfil de expresión de prueba resultante a una base de datos de perfiles de expresión conocidos para plantas desde las cepas endogámicas o 20 híbridas conocidas.
  76. 76. El método de la reivindicación 75, en que el perfil de expresión es para un tejido seleccionado y la base de datos de los perfiles de expresión comprenden los -^.-haJMfcaa^, perfiles de expresión para el mismo tejido desde las cepas endogámicas o híbridas conocidas.
  77. 77. El método de la reivindicación 75, en que la base de datos de los perfiles de expresión se usan para 5 suministrar una matriz de compasiones en parejas, para la potencial progenie, desde los perfiles de expresión en la base de datos, esta matriz de las compasiones en parejas se compara al perfil de expresión de la prueba.
  78. 78. El método de la reivindicación 75, en que la 10 fuente identificada es una sub-porción del perfil de expresión total, esta sub-porción corresponde a un marcador único para una cepa específica de los padres. ^^^^^¡ ^^^^8 ^^^^^¡¡^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^.
MXPA01007325A 1999-01-21 2000-01-19 Perfilado molecular para la seleccion de la heterosis. MXPA01007325A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11661799P 1999-01-21 1999-01-21
US16636899P 1999-11-17 1999-11-17
PCT/US2000/001422 WO2000042838A2 (en) 1999-01-21 2000-01-19 Molecular profiling for heterosis selection

Publications (1)

Publication Number Publication Date
MXPA01007325A true MXPA01007325A (es) 2002-06-04

Family

ID=26814421

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA01007325A MXPA01007325A (es) 1999-01-21 2000-01-19 Perfilado molecular para la seleccion de la heterosis.

Country Status (6)

Country Link
EP (1) EP1143787A2 (es)
AU (1) AU2621300A (es)
CA (1) CA2358509A1 (es)
HU (1) HUP0200319A3 (es)
MX (1) MXPA01007325A (es)
WO (1) WO2000042838A2 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000070340A2 (en) * 1999-05-14 2000-11-23 Karolinska Innovations Ab Materials and methods relating to disease diagnosis
WO2003050748A2 (en) * 2001-12-11 2003-06-19 Lynx Therapeutics, Inc. Genetic analysis of gene expression in heterosis
KR20070004668A (ko) * 2004-02-03 2007-01-09 하이브리드 바이오사이언시스 피티와이 엘티디 잡종 강세 및 잡종 약세를 조성하는 유전자의 동정 방법 및그의 용도
US20100050281A1 (en) * 2005-07-29 2010-02-25 Peter Hamilton Kay Identification of Genes and Their Products Which Promote Hybrid Vigour or Hybrid Debility and Uses Thereof
GB2436564A (en) * 2006-03-31 2007-10-03 Plant Bioscience Ltd Prediction of heterosis and other traits by transcriptome analysis
CA2648422A1 (en) * 2006-04-06 2007-10-18 Monsanto Technology Llc Method of predicting a trait of interest
US20080083042A1 (en) * 2006-08-14 2008-04-03 David Butruille Maize polymorphisms and methods of genotyping
CA2724160C (en) 2007-12-28 2017-05-02 Pioneer Hi-Bred International, Inc. Using structural variation to analyze genomic differences for the prediction of heterosis
EP2343966B1 (en) 2008-10-06 2018-12-05 Yissum Research Development Company of The Hebrew University of Jerusalem Ltd. Induced heterosis related mutations
US9842252B2 (en) 2009-05-29 2017-12-12 Monsanto Technology Llc Systems and methods for use in characterizing agricultural products
GB201110888D0 (en) * 2011-06-28 2011-08-10 Vib Vzw Means and methods for the determination of prediction models associated with a phenotype

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1984004758A1 (en) * 1983-05-26 1984-12-06 Plant Resources Inst Process for genetic mapping and cross-breeding thereon for plants

Also Published As

Publication number Publication date
WO2000042838A2 (en) 2000-07-27
HUP0200319A3 (en) 2003-12-29
CA2358509A1 (en) 2000-07-27
WO2000042838A3 (en) 2001-03-29
EP1143787A2 (en) 2001-10-17
HUP0200319A2 (hu) 2002-05-29
AU2621300A (en) 2000-08-07

Similar Documents

Publication Publication Date Title
AU2004303836C1 (en) High lysine maize compositions and methods for detection thereof
US8039686B2 (en) QTL “mapping as-you-go”
US20180371483A1 (en) Molecular markers for low palmitic acid content in sunflower (helianthus annus), and methods of using the same
MXPA01007325A (es) Perfilado molecular para la seleccion de la heterosis.
WO2020036950A1 (en) Molecular markers for blackleg resistance gene rlm1 in brassica napus, and methods of using the same
US10561084B2 (en) Molecular markers for blackleg resistance gene rlm2 in brassica napus and methods of using the same
RU2718584C2 (ru) Молекулярные маркеры гена rlm4 резистентности к черной ножке brassica napus и способы их применения
US20210315177A1 (en) Molecular markers for blackleg resistance gene rlm7 in brassica napus, and methods of using the same
Wu et al. Genome mapping, markers and QTLs
Ranjan et al. Scope and Importance of plant biotechnology in crop improvement
Wilkinson The application and constraints of new technologies in plant breeding
US20050250205A1 (en) Use of associations between at least one nucleic sequence polymorphism of the sh2 gene and at least one seed quality characteristic in plant selection methods
WO2023023419A1 (en) Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops
Molnar et al. Molecular Genetics of Quality in Oats1
Tyagi et al. Inheritance and mapping of transgene in a transgenic ‘ Golden Rice’ line of japonica rice (Oryza sativa) variety ‘ Taipei 309’
MXPA06006574A (es) Composiciones de maiz de alto contenido de lisina, y metodos para la deteccion de las mismas