ES2349573T3 - METHODS OF GENERATING PROTEIN EXPRESSION MATRICES AND THE USE OF THE SAME IN QUICK DETECTION. - Google Patents

METHODS OF GENERATING PROTEIN EXPRESSION MATRICES AND THE USE OF THE SAME IN QUICK DETECTION. Download PDF

Info

Publication number
ES2349573T3
ES2349573T3 ES01902520T ES01902520T ES2349573T3 ES 2349573 T3 ES2349573 T3 ES 2349573T3 ES 01902520 T ES01902520 T ES 01902520T ES 01902520 T ES01902520 T ES 01902520T ES 2349573 T3 ES2349573 T3 ES 2349573T3
Authority
ES
Spain
Prior art keywords
protein
proteins
selection
labeled
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES01902520T
Other languages
Spanish (es)
Inventor
Michelle Anne Mulder
Mitali Samaddar
Roland Z. Sense Proteomic Ltd. KOZLOWSKI
John David Sutherland
Jonathon Michael Sense Proteomic Limited BLACKBURN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sense Proteomic Ltd
Original Assignee
Sense Proteomic Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sense Proteomic Ltd filed Critical Sense Proteomic Ltd
Application granted granted Critical
Publication of ES2349573T3 publication Critical patent/ES2349573T3/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

Un método para generar una selección de proteínas que consiste en: (a)proporcionar un conjunto de moléculas de ADN codificadoras de proteínas que se etiquetan bien en la terminal N o C con una porción de molécula marcadora; (b)expresar las proteínas individuales etiquetadas en un formato especialmente separado; (c) purificar e inmovilizar cada proteína etiquetada en un formato espacialmente definido para producir una selección de proteínas sobre un soporte sólido, y de este modo las interacciones específicas entre la etiqueta y el soporte sólido se usan tanto en la purificación como en la inmovilización.A method of generating a protein selection consisting of: (a) providing a set of protein-encoding DNA molecules that are well labeled in the N or C terminal with a portion of the marker molecule; (b) express the labeled individual proteins in a specially separated format; (c) purify and immobilize each labeled protein in a spatially defined format to produce a selection of proteins on a solid support, and thus the specific interactions between the label and the solid support are used both in purification and in immobilization.

Description

La presente invención hace referencia a nuevos métodos para generar selecciones de expresión de proteínas, así como el uso de dichas selecciones en rápidas revisiones médicas. The present invention refers to new methods for generating protein expression selections, as well as the use of such selections in rapid medical reviews.

Los proyectos relativos al mapeo genómico están revolucionando el proceso de descubrimiento de objetivos terapéuticos y con ello el proceso de descubrimiento de fármacos. A medida que se identifican nuevos objetivos terapéuticos, el análisis de una elevada producción de bibliotecas químicas existentes y combinatorias sugerirá muchos compuestos principales potenciales que son activos contra estos objetivos. Claramente, no resulta económico perseguir todos los compuestos principales incluso a través de ensayos clínicos en la primera fase; sin embargo, actualmente no existen métodos rápidos para evaluar tales compuestos principales en términos de sus perfiles de posible actividad contra todas las proteínas en el organismo. Si estuviera disponible, este método permitiría potenciales perfiles de toxicología de todos los compuestos principales que van a analizarse en una primera fase y esta información mejoraría en gran medida el proceso de decidir qué compuestos buscar y qué compuestos dejar de lado. Projects related to genomic mapping are revolutionizing the process of discovering therapeutic objectives and with it the process of drug discovery. As new therapeutic objectives are identified, the analysis of a high production of existing and combinatorial chemical libraries will suggest many potential major compounds that are active against these objectives. Clearly, it is not economical to pursue all major compounds even through clinical trials in the first phase; However, there are currently no rapid methods to evaluate such major compounds in terms of their profiles of possible activity against all proteins in the body. If available, this method would allow potential toxicology profiles of all major compounds to be analyzed in a first phase and this information would greatly improve the process of deciding which compounds to look for and which compounds to set aside.

Existe una necesidad complementaria en la industria farmacéutica por identificar todos los objetivos de fármacos existentes (ya disponibles en el mercado o aún en desarrollo) y, a partir de ello, definir su mecanismo de acción. La disponibilidad de esta información facilitará enormemente el proceso de conseguir aprobación reguladora para nuevos fármacos ya que está muy claro que los cuerpos reguladores ahora consideran que un conocimiento del mecanismo de acción es de primordial importancia. Además, este tipo de información permitía diseñar mejores fármacos de segunda generación. Esto se deduce porque la mayoría de los fármacos tienen al menos efectos secundarios menores, que probablemente son el resultado de combinar el fármaco o un metabolito del mismo con objetivos no deseados; todas estas proteínas objetivos necesitan ser identificadas con el fin de definir los criterios necesarios para diseñar fármacos mejorados. Sin embargo, en la actualidad, no existen métodos simples para generar esta información y un gran número de fármacos potenciales que cuestan millones de dólares se quedan por el camino simplemente por falta de conocimiento del objetivo de acción. There is a complementary need in the pharmaceutical industry to identify all existing drug targets (already available in the market or still in development) and, based on that, define their mechanism of action. The availability of this information will greatly facilitate the process of obtaining regulatory approval for new drugs since it is very clear that regulatory bodies now consider that a knowledge of the mechanism of action is of paramount importance. In addition, this type of information allowed to design better second generation drugs. This follows because most drugs have at least minor side effects, which are probably the result of combining the drug or a metabolite of the drug with unwanted targets; All of these objective proteins need to be identified in order to define the criteria needed to design improved drugs. However, at present, there are no simple methods to generate this information and a large number of potential drugs that cost millions of dollars stay on the road simply due to lack of knowledge of the objective of action.

Las interacciones proteína-proteína se están reconociendo cada vez más por ser de vital importancia al determinar las respuestas celulares para tensiones tanto internas como externas. Por lo tanto, las interacciones específicas proteína-proteína representan objetivos potenciales para la intervención mediada por fármacos en infecciones y otros estados de enfermedad. Actualmente, el ensayo de doble híbrido en levadura es el único método fiable para evaluar las interacciones proteína-proteína pero los ensayos in vivo de este tipo no serán fácilmente compatibles incluso en un formato de baja productividad con la identificación de agonistas o antagonistas específicos de interacciones proteína-proteína. Las selecciones de expresión proteómica funcional, o “chips de proteoma”, permitirán la especificidad de las interacciones proteína-proteína y la especificidad de cualquier efecto mediado por el fármaco que se determinará en un formato in vitro. Por lo tanto, tendrán un enorme potencial porque simplemente revolucionarán esta área de investigación. Protein-protein interactions are increasingly recognized as being vitally important in determining cellular responses to both internal and external stresses. Therefore, specific protein-protein interactions represent potential targets for drug-mediated intervention in infections and other disease states. Currently, the yeast double hybrid assay is the only reliable method to evaluate protein-protein interactions but in vivo assays of this type will not be easily compatible even in a low productivity format with the identification of specific agonists or antagonists of interactions. protein-protein Functional proteomic expression selections, or "proteome chips", will allow the specificity of protein-protein interactions and the specificity of any drug-mediated effect to be determined in an in vitro format. Therefore, they will have enormous potential because they will simply revolutionize this area of research.

Un modo en el que las selecciones proteómicas funcionales podrían generarse es para individualmente clonar, expresar, purificar e inmovilizar todas las proteínas expresadas en el proteoma específico. Sin embargo, aquí una importante consideración inicial concierne el tamaño absoluto del genoma de interés junto con las consideraciones sobre la disponibilidad de datos secuenciales para el genoma completo. A modo de ilustración de estos puntos, un genoma bacteriano habitual tiene ~5Mbp y ahora se han secuenciado completamente un pequeño número (por ejemplo Helicobacter pylori, Escherichia coli y Mycobacterium tuberculosis); los genomas fúngicos tienen normalmente ~40Mbp, genomas de mamíferos en ~3Gbp y genomas de plantas en ~10GBP. Las estimaciones actuales establecen que la secuencia de genoma humano acabará alrededor de 2003, aunque se cuestiona que mucha de esta información llegue al dominio público. Claramente, no resulta nada práctico esperar que los genomas de elementos diferentes a los organismos que sirven de modelo representativo se encontrarán disponibles en un plazo de tiempo real, ya que desde la perspectiva de proteómica funcional, los organismos modelos solamente tienen un valor limitado. De modo que, mientras en principio durante los próximos cuatro años puede ser posible diseñar y sintetizar cebadores para clonar cada uno de los ~100,000 genes en el genoma humano a partir de bibliotecas de ADN, en la práctica resultará muy caro (el coste sólo de los cebadores ronda varios millones de dólares) y un proceso enormemente laboriosos, incluso si los datos secuenciales necesarios están disponibles. One way in which functional proteomic selections could be generated is to individually clone, express, purify and immobilize all proteins expressed in the specific proteome. However, here an important initial consideration concerns the absolute size of the genome of interest along with considerations about the availability of sequential data for the entire genome. By way of illustration of these points, a usual bacterial genome has ~ 5Mbp and now a small number have been completely sequenced (for example Helicobacter pylori, Escherichia coli and Mycobacterium tuberculosis); fungal genomes normally have ~ 40Mbp, mammalian genomes in ~ 3Gbp and plant genomes in ~ 10GBP. Current estimates establish that the human genome sequence will end around 2003, although it is questioned that much of this information reaches the public domain. Clearly, it is not practical to expect that genomes of elements other than organisms that serve as a representative model will be available in a real time frame, since from the perspective of functional proteomics, model organisms have only limited value. So, while in principle over the next four years it may be possible to design and synthesize primers to clone each of the ~ 100,000 genes in the human genome from DNA libraries, in practice it will be very expensive (the cost of only the primers are around several million dollars) and an enormously laborious process, even if the necessary sequential data is available.

¿Pero qué ocurre con aquellos organismos farmacéuticamente relevantes para los que no se dispondrá datos secuenciales completos? La proteómica funcional no puede simplemente ignorarlos de modo que ¿cuáles son las alternativas? En principio, las bibliotecas de expresión de cADN pueden usarse junto con una inmovilización no específica para crear una selección de proteínas, pero esta tecnología es significativamente limitada debido al hecho de que la inmovilización no específica normalmente se asocia con la pérdida de función porque afecta al pliegue de la proteína. Además, todas las proteínas de células huéspedes también se inmovilizarán lo que, en el mejor de los casos, reducirá notablemente los radios señal-a-ruido, y en el peor de los casos, dará como resultado una confusión de resultados positivos. Por lo tanto, la habilidad para crear una selección de proteoma funcional en el que las proteínas individuales se inmovilicen específicamente y se purifiquen a través de un motivo o etiqueta sin afectar la función y sin requerir conocimientos de la secuencia completa del genoma representará un gran avance en el campo de proteómica funcional. But what happens to those pharmaceutically relevant organisms for which complete sequential data will not be available? Functional proteomics cannot simply ignore them so what are the alternatives? In principle, cDNA expression libraries can be used in conjunction with non-specific immobilization to create a protein selection, but this technology is significantly limited due to the fact that non-specific immobilization is normally associated with loss of function because it affects the protein fold. In addition, all host cell proteins will also be immobilized which, at best, will significantly reduce signal-to-noise radii, and in the worst case, will result in a confusion of positive results. Therefore, the ability to create a functional proteome selection in which individual proteins are specifically immobilized and purified through a motif or label without affecting function and without requiring knowledge of the complete genome sequence will represent a breakthrough. in the field of functional proteomics.

Nosotros hemos desarrollado en la actualidad una nueva técnica que soluciona los problemas anteriormente descritos proporcionando una metodología que permite que cada proteína en un proteoma se etiquete con un marcador común en una posición definida en la proteína sin requerir ningún conocimiento previo sobre la secuencia de ADN de los genes correspondientes. Esta “etiqueta” puede usarse a continuación para dar una similitud y especificidad a la inmovilización que se realiza hacia abajo y a los procedimientos de purificación, lo que a su vez permite la creación de selecciones espacialmente definidas en las que se muestran cientos de proteínas de un proteoma determinado. We have currently developed a new technique that solves the problems described above by providing a methodology that allows each protein in a proteome to be labeled with a common marker at a defined position in the protein without requiring any prior knowledge about the DNA sequence of The corresponding genes. This "tag" can then be used to give similarity and specificity to the immobilization that is carried out downwards and to the purification procedures, which in turn allows the creation of spatially defined selections in which hundreds of proteins of a certain proteome.

Hay que tener en especial consideración el hecho relacionado con el posicionamiento precios de la “etiqueta”. Si la etiqueta se inserta dentro del marco en un gen pero en una posición no definida y arbitraria, existe el riesgo de que la proteína resultante etiquetada se trunque de manera no definida y en la mayoría de los casos se destruirá el correcto pliegue, y por ello la función. La metodología aquí descrita salva este problema insertando la etiqueta inmediatamente después del codón de inicio e inmediatamente antes del codón de parada de un gen determinado de modo que las proteínas individuales etiquetadas y de longitud complete se plieguen correctamente y puedan de este modo conservar la función cuando se inmovilizan específicamente en la selección. Special consideration should be given to the fact related to the price positioning of the "label". If the tag is inserted within the frame in a gene but in an undefined and arbitrary position, there is a risk that the resulting labeled protein will be truncated in an undefined way and in most cases the correct fold will be destroyed, and by It the function. The methodology described here saves this problem by inserting the label immediately after the start codon and immediately before the stop codon of a particular gene so that the labeled and full-length individual proteins fold correctly and thus can retain function when they are specifically frozen in the selection.

Debido a que cada proteína en la selección será completamente funcional, a continuación las selecciones pueden analizarse directamente para identificar los objetivos de los fármacos u otras moléculas biológicamente relevantes. La definición espacial de las selecciones permitirá que el fenotipo de cada proteína pueda relacionarse directamente con su genotipo posibilitando así la identificación de “blancos” o “impactos”. Because each protein in the selection will be fully functional, then the selections can be analyzed directly to identify the objectives of the drugs or other biologically relevant molecules. The spatial definition of the selections will allow the phenotype of each protein to be directly related to its genotype, thus enabling the identification of “targets” or “impacts”.

WO 00/04382 describe selecciones de proteínas, que incluyen proteínas que se inmovilizan en un soporte sólido por medio de una etiqueta que puede localizarse en la terminal N o C. Las proteínas se purifican y a continuación se imprimen en una película orgánica. WO 99/39210 describe la generación de una selección secundaria de anticuerpos a partir de una selección primaria de proteínas. Las proteínas se purifican y a continuación se inmovilizan en la selección por medio de una etiqueta. WO 99/45130 describe un sistema de expresión baculovirus, que incluye un sistema para expresar proteínas etiquetadas. WO 00/04382 describes protein selections, which include proteins that are immobilized on a solid support by means of a label that can be located at the N or C terminal. The proteins are purified and then printed on an organic film. WO 99/39210 describes the generation of a secondary selection of antibodies from a primary protein selection. The proteins are purified and then immobilized in the selection by means of a tag. WO 99/45130 describes a baculovirus expression system, which includes a system for expressing labeled proteins.

Por consiguiente, en un primer aspecto, la presente invención proporciona un método para generar una selección de proteínas que consiste en: Therefore, in a first aspect, the present invention provides a method of generating a protein selection consisting of:

(a)proporcionar un conjunto de moléculas de ADN codificadoras (a) provide a set of coding DNA molecules

de proteínas que se etiquetan bien en la terminal N o C con of proteins that are well labeled in terminal N or C with

una porción de molécula marcadora; a portion of marker molecule;

(b)expresar las proteínas individuales etiquetadas en un formato (b) express the individual proteins labeled in a format

especialmente separado; especially separated;

(c)purificar e inmovilizar en un solo paso cada proteína etiquetada en un formato espacialmente definido para producir una selección de proteínas sobre un soporte sólido, y de este modo las interacciones específicas entre la etiqueta y el soporte sólido se usan tanto en la purificación como en la inmovilización. En algunas realizaciones, el método incluye la clonación y (c) purify and immobilize in each single step each protein labeled in a spatially defined format to produce a selection of proteins on a solid support, and thus the specific interactions between the label and the solid support are used in both purification and in the immobilization. In some embodiments, the method includes cloning and

expresión de una o más proteínas como proteínas de longitud completa que se etiquetan de manera individual en la terminal N o C con una molécula marcadora. expression of one or more proteins as full-length proteins that are labeled individually at the N or C terminal with a marker molecule.

La molécula marcadora puede ser una secuencia de péptido, por ejemplo, una etiqueta hexa-histidina, un epítope de anticuerpo o un imitador de biotina, o incluso una proteína completa, o dominio de proteína, por ejemplo el dominio de proteína que se enlaza con maltosa. La propia molécula marcadora puede modificarse posttranslacionalmente, p. ej., mediante la adición de una biotina o molécula lípida. En una realización preferente, la molécula marcadora también permitirá la purificación de proteínas “etiquetadas”. The marker molecule can be a peptide sequence, for example, a hexa-histidine tag, an antibody epitope or a biotin mimic, or even a complete protein, or protein domain, for example the protein domain that binds to maltose. The marker molecule itself can be modified posttranslationally, e.g. eg, by the addition of a biotin or lipid molecule. In a preferred embodiment, the marker molecule will also allow purification of "tagged" proteins.

Por lo tanto, los métodos de la presente invención permiten la modificación específica, en un recipiente, de cada miembro de una biblioteca de ADN de manera que no es necesario ningún conocimiento sobre la secuencia de genes individuales. En su lugar, se basa en el codón común de inicio y terminación en todos los genes. La modificación se realizará en forma de una precisa inserción, dentro de la estructura, de ADN secuencial adicional y conocido bien inmediatamente después del codón de inicio o inmediatamente precediendo el codón de terminación de cada cADN tal y como se requiera. Therefore, the methods of the present invention allow the specific modification, in a container, of each member of a DNA library so that no knowledge about the sequence of individual genes is necessary. Instead, it is based on the common codon of start and end in all genes. The modification will be carried out in the form of a precise insertion, within the structure, of additional and known sequential DNA either immediately after the start codon or immediately preceding the termination codon of each cDNA as required.

El ADN adicional codificará una fracción marcadora, que se encontrará en el mismo marco de lectura que cada producto individual cADN. Por lo tanto, cada cADN genéticamente producido de acuerdo con los métodos de la presente invención codificará una proteína individual que ahora tiene una fracción común, p. ej., un polipéptido, una “etiqueta” fusionada precisamente con sus terminal N o C. Debido a que todos los miembros de la biblioteca de cADN se modificarán precisamente de la misma manera, el resultado será que todas las proteínas codificadas por la biblioteca cADN estarán ahora etiquetadas con una fracción común en las terminales N o C. The additional DNA will encode a marker fraction, which will be in the same reading frame as each individual cDNA product. Therefore, each genetically produced cDNA according to the methods of the present invention will encode an individual protein that now has a common fraction, e.g. eg, a polypeptide, a "tag" fused precisely with its N or C terminals. Because all members of the cDNA library will be modified in precisely the same way, the result will be that all proteins encoded by the cDNA library they will now be labeled with a common fraction at terminals N or C.

Se describen las selecciones formadas por medio de los métodos aquí descritos. The selections formed by the methods described herein are described.

Dichas selecciones comprenden la biblioteca de expresión con proteína “etiquetada”, inmovilizada, normalmente sobre un soporte sólido. La persona experta en la materia entenderá que existe un rango de posibles soportes sólidos de uso común en el área de selecciones y cualquiera de estos “sustratos” puede utilizarse en la producción de selecciones. Such selections comprise the "tagged" protein expression library, immobilized, usually on a solid support. The person skilled in the art will understand that there is a range of possible solid supports commonly used in the area of selections and any of these "substrates" can be used in the production of selections.

Tal y como aquí se establece, los métodos de la presente invención permiten el etiquetaje de todas las proteínas en un proteoma determinado específicamente en la terminal N o C. Mientras algunas proteínas pueden no tolerar las extensiones de la terminal N y otras pueden no tolerar las extensiones de la terminal C, es probable que la gran mayoría de proteínas toleren una u otra de dichas extensiones. Sin embargo, los métodos existentes para clonar bibliotecas simplemente no pueden tratar este problema ya que clonan genes como cADNs de longitud completa y no modificados o al azar y fusiones casi inevitablemente truncadas con alguna pareja proteica. En comparación con estos, los métodos presentes permiten que bibliotecas de cADN precisas y de longitud completa se creen como fusiones para, por ejemplo, una pareja de péptido deseado. En comparación con los primeros, el método para inmovilizar proteínas en una selección tal y como aquí se describe es a través de interacción específicas en lugar de no específicas, y estas interacciones específicas son una función de la etiqueta añadida a las terminales de cada cADN. Además, los métodos aquí descritos pueden usarse para cribar proteínas purificadas e inmovilizadas que se han expresado en organismos de huéspedes no bacterianos y ayudar al mantenimiento de la función a través de un correcto pliegue y a una modificación post-translacional, mientras que los métodos existentes tales como exposición en fagos o bibliotecas de expresión λ-cADN se limitan a huéspedes bacterianos en los que la mayoría de proteínas eucarióticas se sintetizan en una forma no funcional, debido su pliegue incorrecto o a una modificación posttranslacional incorrecta. As set forth herein, the methods of the present invention allow the labeling of all proteins in a specific proteome specifically in the N or C terminal. While some proteins may not tolerate the extensions of the N terminal and others may not tolerate Terminal C extensions, it is likely that the vast majority of proteins tolerate one or the other of these extensions. However, existing methods for cloning libraries simply cannot address this problem since they clone genes such as full-length and unmodified or random cDNAs and fusions almost inevitably truncated with a protein partner. In comparison with these, the present methods allow precise and full-length cDNA libraries to be created as fusions for, for example, a desired peptide pair. Compared to the former, the method to immobilize proteins in a selection as described herein is through specific rather than non-specific interactions, and these specific interactions are a function of the tag added to the terminals of each cDNA. In addition, the methods described herein can be used to screen purified and immobilized proteins that have been expressed in non-bacterial host organisms and assist in maintaining function through proper folding and post-translational modification, while existing methods such as phage display or λ-cDNA expression libraries are limited to bacterial hosts in which the majority of eukaryotic proteins are synthesized in a non-functional form, due to their incorrect fold or to an incorrect posttranslational modification.

Los métodos de la presente invención tienen una amplia gama de aplicaciones potenciales in vitro que pueden dividirse en términosgenerales en tres áreas principales. Éstas son el estudio de interacciones proteína-ligando, el estudio de interacciones proteína-proteína, y el estudio de interacciones proteína-ADN. Interacciones Proteína-Ligando The methods of the present invention have a wide range of potential in vitro applications that can be broadly divided into three main areas. These are the study of protein-ligand interactions, the study of protein-protein interactions, and the study of protein-DNA interactions. Protein-Ligand Interactions

Los métodos aquí descritos permitirán un rápido diseño de las interacciones entre una nueva entidad química determinada y todas las proteínas en un determinado proteoma. Esto puede conseguirse fácilmente sondando la selección apropiada de proteoma con NCE siguiendo varios rigores en los que puede considerarse una criba inversa de alto rendimiento. La lectura de esta criba será directamente útil en muchas situaciones, algunas de las cuales se describen a continuación. The methods described here will allow a rapid design of the interactions between a new chemical entity and all proteins in a given proteome. This can be easily achieved by probing the appropriate selection of proteome with NCE following several rigors in which a high performance inverse screen can be considered. Reading this screen will be directly useful in many situations, some of which are described below.

Los programas de exploración de alto rendimiento en los que las bibliotecas de compuestos se testan contra células u organismos completos a menudo identifican moléculas iniciales que dan lugar a un cambio fenotípico sin que se conozca el objetivo antes de la exploración. Sin embargo, la posterior identificación del objetivo primario puede resultar un proceso muy laborioso. Los métodos de la presente invención pueden aplicarse directamente a este tipo de problemas ya que será posible cresar una selección de proteomas funcionales para la especie en cuestión y a continuación cribar esta selección con el compuesto principal para identificar a qué proteínas dentro del proteoma se dirige. Esta técnica enormemente paralela para identificar las interacciones proteína-ligando acelerará en gran medida y simplificará la determinación de objetivos primarios de NCEs, y también permitirá la identificación de interacciones secundarias más débiles que también pueden ser importantes. Además, los métodos pueden aplicarse directamente a la cuestión de reactividad cruzada de especies, permitiendo que un potencial compuesto antifúngico, por ejemplo, pueda evaluarse rápidamente en términos de sus interacciones con, por ejemplo, todas las proteínas en un proteoma humano; este tipo de información tiene muchas posibilidades de ser muy útil en cualquier optimización posterior de compuestos principales. High-performance screening programs in which compound libraries are tested against whole cells or organisms often identify initial molecules that give rise to a phenotypic change without the objective being known before the scan. However, the subsequent identification of the primary objective can be a very laborious process. The methods of the present invention can be applied directly to this type of problem since it will be possible to cross a selection of functional proteomes for the species in question and then screen this selection with the main compound to identify which proteins within the proteome it is directed to. This enormously parallel technique to identify protein-ligand interactions will greatly accelerate and simplify the determination of primary NCEs targets, and also allow the identification of weaker secondary interactions that may also be important. In addition, the methods can be applied directly to the issue of cross-reactivity of species, allowing a potential antifungal compound, for example, to be rapidly evaluated in terms of its interactions with, for example, all proteins in a human proteome; This type of information has many possibilities of being very useful in any subsequent optimization of main compounds.

Los métodos de exploración de elevado rendimiento permiten en la actualidad una rápida identificación de pequeñas moléculas que se ligan con una proteína determinada que previamente ha sido reconocida como un potencial objetivo terapéutico. Sin embargo, estos métodos no responden a la pregunta de cómo de selectiva puede ser una interacción, siendo este conocimiento potencialmente crucial para decidir si perseguir un determinado compuesto principal High-performance scanning methods now allow rapid identification of small molecules that bind to a specific protein that has previously been recognized as a potential therapeutic target. However, these methods do not answer the question of how selective an interaction can be, this knowledge being potentially crucial in deciding whether to pursue a particular principal compound.

o no; la sabiduría popular establece que los compuestos que van dirigidos a proteínas sencillas tienen más posibilidades de mostrar menos efectos secundarios que aquellas que también afectan a un gran número de proteínas relacionadas o no relacionadas. or not; Popular wisdom states that compounds that target simple proteins are more likely to show fewer side effects than those that also affect a large number of related or unrelated proteins.

Existe un número de ejemplos de compuestos que han progresado con éxito a lo largo de ensayos clínicos de tercera fase pero que han fallado a la hora de ganar la aprobación reguladora porque se desconoce su mecanismo primario de acción. Los fármacos antidepresivos mianserina y trazodona y el fármaco tenidap de la compañía Pfizer son ejemplos, representando cada uno de ellos inversiones de cientos de millones de dólares que no se han recuperado. Los métodos aquí descritos pueden aplicarse potencialmente a la resurrección de dichos fármacos fallidos ya que si pueden descubrirse los objetivos primarios de estos fármacos y posteriormente verificarse en términos de mecanismo de acción, los datos de ensayos clínicos tan caros ya serán aptos para la aprobación reguladora. There are a number of examples of compounds that have progressed successfully through third-phase clinical trials but have failed to gain regulatory approval because their primary mechanism of action is unknown. The antidepressant drugs mianserin and trazodone and the tenidap drug from the Pfizer company are examples, each representing investments of hundreds of millions of dollars that have not been recovered. The methods described here can potentially be applied to the resurrection of such failed drugs since if the primary objectives of these drugs can be discovered and subsequently verified in terms of the mechanism of action, data from such expensive clinical trials will already be eligible for regulatory approval.

Todos los fármacos existentes tienen efectos secundarios, en mayor o menos medida, siendo aquí el ejemplo, el sino atractivo fármaco clozapina para combatir la esquizofrénico. Si puede determinarse el origen molecular de estos efectos secundarios, se facilitaría en gran medida el diseño de fármacos de futura generación con efectos primarios optimizados combinados con efectos secundarios minimizados. De nuevo, los métodos aquí descritos pueden aplicarse directamente a estos problemas ya que al crear un perfil de las interacciones entre un compuesto y todas las proteínas en un proteoma, las interacciones secundarias aberrantes se identificarán y posteriormente podrán analizarse para saber si están relacionadas con los conocidos efectos secundarios. All existing drugs have side effects, to a greater or lesser extent, here being the example, but the attractive clozapine drug to fight schizophrenic. If the molecular origin of these side effects can be determined, the design of future generation drugs with optimized primary effects combined with minimized side effects would be greatly facilitated. Again, the methods described here can be directly applied to these problems since by creating a profile of the interactions between a compound and all the proteins in a proteome, aberrant secondary interactions will be identified and subsequently analyzed to determine if they are related to Known side effects

Los métodos de la presente invención también pueden usarse para identificar familias de proteínas, como serina proteasas, cribando las selecciones de proteoma con inhibidores genéricos. Esto permitiría el posterior desarrollo de biochips mostrando, por ejemplo, todas las serina proteasas humanas o, de manera alternativa, todas las quinasas o todas las enzimas p450 para una exploración más enfocada de compuestos principales. Un biochip p450, por ejemplo, tendría utilidad en evaluar si un compuesto principal determinado tiene posibilidades de metabolizarse o no, ya que la hidroxilación mediada por p450 a menudo representa el primer paso en este proceso y probablemente es una de las primeras fuentes de la variabilidad paciente-a-paciente en respuesta al fármaco; ahora, de hecho, uno de los objetivos del diseño de fármacos es generar compuestos que no se metabolicen en primer lugar, y aquí, de nuevo, un chip p450 tendría una utilidad potencial significativa. Interacciones Proteína-Proteína The methods of the present invention can also be used to identify families of proteins, such as serine proteases, by screening proteome selections with generic inhibitors. This would allow the subsequent development of biochips showing, for example, all human serine proteases or, alternatively, all kinases or all p450 enzymes for a more focused exploration of major compounds. A biochip p450, for example, would be useful in assessing whether a given main compound has a chance of being metabolized or not, since p450-mediated hydroxylation often represents the first step in this process and is probably one of the first sources of variability. patient-to-patient in response to the drug; Now, in fact, one of the goals of drug design is to generate compounds that are not metabolized in the first place, and here, again, a p450 chip would have significant potential utility. Protein-Protein Interactions

Las interacciones proteína-proteína y los complejos de multiproteínas son de vital importancia en biología celular. Las rutas de señalización, por ejemplo, normalmente se inician con una interacción entre una receptor de superficie celular y un ligando externo, y esto va seguido de una cascada de interacciones proteína-proteína que finalmente dan como resultado la activación de un gen específico. La interacciones proteína-proteína pueden depender de la presencia de un ligando específico o, de manea alternativa, pueden bloquearse por la acción de un ligando específico, mientras que algunos complejos de multiproteínas solamente se formarán de una manera dependiente de ligandos. Protein-protein interactions and multiprotein complexes are vitally important in cell biology. Signaling pathways, for example, normally begin with an interaction between a cell surface receptor and an external ligand, and this is followed by a cascade of protein-protein interactions that ultimately result in the activation of a specific gene. Protein-protein interactions may depend on the presence of a specific ligand or, alternatively, may be blocked by the action of a specific ligand, while some multiprotein complexes will only be formed in a ligand-dependent manner.

Se han identificado cientos de interacciones usando tecnologías de doble híbrido. Los métodos aquí descritos superan las limitaciones de tales métodos y pueden usarse para cribar selecciones de proteomas con proteínas individuales etiquetadas con el fin de identificar no solamente las parejas interactivas sino también las fuerzas relativas de interacciones individuales. Los métodos también pueden aplicarse para la identificación de los componentes de complejos con multiproteínas, incluso cuando su montaje depende del ligando. Hundreds of interactions have been identified using dual hybrid technologies. The methods described herein overcome the limitations of such methods and can be used to screen proteome selections with labeled individual proteins in order to identify not only interactive partners but also the relative forces of individual interactions. The methods can also be applied for the identification of complex components with multiproteins, even when their assembly depends on the ligand.

Un ejemplo del uso de los métodos en el modo en el que identifica las interacciones proteína-proteína sería la identificación de las parejas señalizadoras del dominio citosólico de un receptor particular de superficie celular que se ha implicado en un estado de enfermedad; la identificación de tales parejas señalizadoras sería directamente relevante desde una perspectiva farmacéutica ya que las interacciones proteína-proteína podrían inmediatamente representar posibles objetivos terapéuticos. Interacciones Proteína-ADN An example of the use of the methods in which it identifies protein-protein interactions would be the identification of the signaling partners of the cytosolic domain of a particular cell surface receptor that has been implicated in a disease state; the identification of such signaling partners would be directly relevant from a pharmaceutical perspective since protein-protein interactions could immediately represent possible therapeutic objectives. Protein-DNA interactions

Se ha estimado que aproximadamente el 10% de todos los genes en el genoma humano codifican factores de transcripción aunque solamente un pequeño porcentaje de estos están actualmente identificados. El enlace de factores de transcripción específicos con elementos procesadores de ADN, a menudo en respuesta a estímulos externos, es un prerrequisito para la formación de complejos potenciadores que a continuación activan la expresión del gen. Existen varios puntos en los que la expresión del gen puede en principio estar afectada por la administración de fármacos: un fármaco podría bloquear el enlace de una proteína o molécula pequeña con un receptor de superficie celular y, a causa de ello, bloquear la cascada señalizadora en el inicio; un fármaco podría bloquear una interacción proteína-proteína o inhibir una actividad enzimática dentro de la cascada señalizadora; o de manera alternativa, un fármaco podría bloquear la formación de interacciones específicas proteína-ADN o proteína-proteína en el complejo potenciador. Aquí, a modo de ejemplo, el factor de transcripción NFкB participa en los procesos celulares diversos e inmunes y en respuestas a inflamación, desarrollo de extremidades, shock séptico, asma y producción de propéptidos de VIH. La mayoría de las cascadas señalizadoras intracelulares en la activación de NF-кB son comunes a todos los procesos de modo que no representan objetivos viables para intervenir. Por lo tanto, las diferencias entre las respuestas residen en la interacción original ligando-receptor o en la formación de complejos potenciadores. Se sabe que NF-кB se enlaza al menos con 14 elementos potenciadores diferentes y, por lo tanto, los complejos potenciadores representan objetivos potenciales terapéuticos. Sin embargo, la delineación de un complejo potenciador individual requiere el conocimiento del número de proteínas individuales que se enlazan con ADN y también sus interacciones proteína-proteína entre sí. Los métodos presentes pueden usarse para responder directamente ambas preguntas. Una selección proteómica puede cribarse con sondas específicas de ADN para identificar proteínas nuevas que se enlazan con ADN. De manera alternativa, la selección proteómica puede cribarse con el dominio de transactivación de un factor determinado de transcripción para identificar otras proteínas con las que interactúa. La relación cruzada de estas cribas debería permitir la identificación de nuevos componentes de complejos potenciadores específicos. It has been estimated that approximately 10% of all genes in the human genome encode transcription factors although only a small percentage of these are currently identified. The linking of specific transcription factors with DNA processing elements, often in response to external stimuli, is a prerequisite for the formation of enhancer complexes that then activate gene expression. There are several points where gene expression may in principle be affected by drug administration: a drug could block the binding of a protein or small molecule with a cell surface receptor and, as a result, block the signaling cascade at the beginning; a drug could block a protein-protein interaction or inhibit an enzymatic activity within the signaling cascade; or alternatively, a drug could block the formation of specific protein-DNA or protein-protein interactions in the enhancer complex. Here, by way of example, the NFкB transcription factor participates in various cellular and immune processes and in responses to inflammation, limb development, septic shock, asthma and HIV propeptide production. Most intracellular signaling cascades in the activation of NF-κB are common to all processes so that they do not represent viable targets for intervention. Therefore, the differences between the responses reside in the original ligand-receptor interaction or in the formation of enhancer complexes. It is known that NF-κB binds at least 14 different enhancer elements and, therefore, enhancer complexes represent potential therapeutic targets. However, the delineation of an individual enhancer complex requires knowledge of the number of individual proteins that bind to DNA and also their protein-protein interactions with each other. The present methods can be used to directly answer both questions. A proteomic selection can be screened with specific DNA probes to identify new proteins that bind to DNA. Alternatively, proteomic selection can be screened with the transactivation domain of a particular transcription factor to identify other proteins with which it interacts. The cross relationship of these screens should allow the identification of new components of specific enhancer complexes.

Las selecciones de proteínas generadas por los métodos de la presente invención también permitirán la selección de moléculas, que reconocen cada una de las proteínas mostradas en las selecciones. En una realización preferente, las moléculas seleccionadas serán proteínas de anticuerpos y de elementos similares a anticuerpos y se expondrán en fagos o en ribosomas os Protein selections generated by the methods of the present invention will also allow the selection of molecules, which recognize each of the proteins shown in the selections. In a preferred embodiment, the selected molecules will be antibody proteins and antibody-like elements and will be exposed in phages or ribosomes or

se unirán covalentemente con el mARN codificador. they will covalently bind with the mRNA encoder.

Por lo tanto, una biblioteca de anticuerpos expuesta en fagos puede aplicarse a cada una de las proteínas inmovilizadas en la selección y los anticuerpos que no se combinen se retiran mediante un lavado. A continuación, el fago seleccionado puede recuperarse y usarse para infectar bacterias de acuerdo con procedimientos habituales. Las bacterias infectadas por los fagos pueden producir bien partículas de fago que muestran los anticuerpos seleccionados durante más rondas de selección, o pueden producir fragmentos solubles de anticuerpo para uso directo. Los términos “anticuerpo” o “fragmentos de anticuerpo” aquí hacer referencia a fragmentos Fvs, FAB de cadena sencilla, fragmentos de individuales de cadena ligera Therefore, a phage-exposed antibody library can be applied to each of the immobilized proteins in the selection and the antibodies that do not combine are removed by washing. Then, the selected phage can be recovered and used to infect bacteria according to usual procedures. Phage-infected bacteria can either produce phage particles that show the selected antibodies during more rounds of selection, or they can produce soluble antibody fragments for direct use. The terms "antibody" or "antibody fragments" herein refer to Fvs fragments, single chain FABs, light chain individual fragments

o pesada, derivados de ratón, humano, camello u otros organismos. or heavy, derived from mouse, human, camel or other organisms.

En una realización preferente, la selección de proteínas tendrá un formato de micropozo de modo que, tras el primer paso de selección, las partículas fágicas pueden recuperarse añadiendo células bacterianas apropiadas a cada pozo donde se infectarán por la acción de las partículas fágicas seleccionadas. A continuación, puede añadirse el medio de crecimiento a cada pozo y se deja que las bacterias infectadas crezcan y expresen los fragmentos de anticuerpo, mientras se mantiene la separación física de los fragmentos de anticuerpo seleccionados con respecto a cada proteína inmovilizada en la selección. Si se desea, pueden usarse nuevas partículas fágicas producidas por las bacterias infectadas en rondas posteriores de selección. Estos procedimientos son ahora rutinarios en la selección de fragmentos de anticuerpos policlonales y monoclonales en una única proteína purificada e inmovilizada. A continuación, y en la práctica, las selecciones originales de proteínas que aquí se presentan permitirán la generación de fragmentos de anticuerpos policlonales y monoclonales para cientos de proteínas correctamente plegadas de una manera enormemente paralela mientras que, si no, se usarían los métodos estándar de selección de anticuerpos in vitro. In a preferred embodiment, the protein selection will have a micro-well format so that, after the first selection step, the phage particles can be recovered by adding appropriate bacterial cells to each well where they will be infected by the action of the selected phage particles. Then, the growth medium can be added to each well and the infected bacteria are allowed to grow and express the antibody fragments, while maintaining the physical separation of the selected antibody fragments from each immobilized protein in the selection. If desired, new phage particles produced by infected bacteria can be used in subsequent rounds of selection. These procedures are now routine in the selection of polyclonal and monoclonal antibody fragments in a single purified and immobilized protein. Next, and in practice, the original protein selections presented here will allow the generation of polyclonal and monoclonal antibody fragments for hundreds of correctly folded proteins in a greatly parallel manner whereas, if not, the standard methods of in vitro antibody selection.

Los fragmentos de anticuerpo seleccionados y solublemente expresados de cada pozo de la selección original pueden inmovilizarse ellos mismos en una nueva selección espacialmente definida de modo que los fragmentos de anticuerpo en cada posición de la nueva selección se seleccionaron frente a la proteínas inmovilizadas en una única posición definida en la selección original. Las selecciones de anticuerpo así seleccionadas contendrán en cada posición bien fragmentos de anticuerpo policlonal o monoclonal, dependiendo del número de rondas de selección realizadas antes de la inmovilización de los fragmentos solubles de anticuerpo. The antibody fragments selected and soluble in each well of the original selection can be immobilized themselves in a new spatially defined selection so that the antibody fragments in each position of the new selection were selected against the immobilized proteins in a single position. defined in the original selection. The antibody selections so selected will contain either polyclonal or monoclonal antibody fragments in each position, depending on the number of selection rounds made before immobilization of the soluble antibody fragments.

Estas selecciones de anticuerpo tendrán un número de usos potenciales que incluyen la captura de proteínas individuales de una célula cruda o un lisado celular controlar la expresión diferencial del proteoma relevante. De manera alternativa, las proteínas capturadas por anticuerpo pueden analizarse directamente para la función de enlace con ligando. En general, cualquier anticuerpo monoclonal podría combinarse con la proteína objetivo para bloquear su función, pero otro anticuerpo monoclonal podría combinar pero no bloquear la función. En una técnica muy paralela, claramente no resulta nada práctico evaluar todos los anticuerpos monoclonales con todas las proteínas en un proteoma de manera individual para comprobar su habilidad de enlace sin afectar a la función. En cambio, un conjunto policlonal de anticuerpos para todas las proteínas en un proteoma tiene posibilidades de contener anticuerpos individuales que tienen la habilidad deseada para combinarse pero no para afectar a la función y además, contendrán anticuerpos individuales que reconocen todas las modificaciones post-translacionales de una proteína determinada. Por consiguiente, en general, las selecciones de anticuerpos policlonales en lugar de monoclonales generados tal y como aquí se describe posiblemente presentarán ventajas para cribar proteínas capturadas directamente para la función. These antibody selections will have a number of potential uses that include the capture of individual proteins from a crude cell or a cell lysate controlling the differential expression of the relevant proteome. Alternatively, the proteins captured by antibody can be analyzed directly for ligand binding function. In general, any monoclonal antibody could be combined with the target protein to block its function, but another monoclonal antibody could combine but not block the function. In a very parallel technique, it is clearly not practical to evaluate all monoclonal antibodies with all proteins in a proteome individually to check their binding ability without affecting function. In contrast, a polyclonal set of antibodies for all proteins in a proteome has the potential to contain individual antibodies that have the desired ability to combine but not to affect function and, in addition, will contain individual antibodies that recognize all post-translational modifications of a certain protein Therefore, in general, selections of polyclonal antibodies rather than monoclonal antibodies generated as described herein will possibly present advantages for screening proteins captured directly for function.

En comparación con la selección original de proteínas, las selecciones de anticuerpos creadas por los métodos aquí descritos tendrán la ventaja de que todas las proteínas inmovilizadas en la selección serán estables bajo condiciones similares. Las proteínas capturadas desde la célula cruda o lisado de tejido no serán recombinantes pero se expresarán de manera natural. Además, las proteínas capturadas pueden cribarse para función o enlace con ligando, etc, directamente tras la captura de la célula cruda o lisado de tejido, lo que debería ayudar al mantenimiento de la función. Compared to the original protein selection, antibody selections created by the methods described herein will have the advantage that all proteins immobilized in the selection will be stable under similar conditions. Proteins captured from the crude cell or tissue lysate will not be recombinant but will be expressed naturally. In addition, the captured proteins can be screened for function or linkage with ligand, etc., directly after the capture of the crude cell or tissue lysate, which should help to maintain the function.

(i) (i)
En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto uno o más compuestos con una selección de proteínas como la aquí definida y medir en enlace de uno o más compuestos con las proteínas en la selección; de este modo se analizan uno o más compuestos en busca de actividad biológica. In some embodiments, the method of the invention further comprises the step of contacting one or more compounds with a selection of proteins as defined herein and measuring in bond of one or more compounds with the proteins in the selection; in this way one or more compounds are analyzed for biological activity.

(ii) (ii)
En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto una o más proteínas, p. ej., un receptor de superficie celular con una selección como la aquí definida, y medir el enlace de una o más proteínas específicas con las proteínas de la selección; de este modo se analizan una In some embodiments, the method of the invention further comprises the step of contacting one or more proteins, e.g. eg, a cell surface receptor with a selection as defined herein, and measuring the linkage of one or more specific proteins with the selection proteins; in this way a

o más proteínas para las interacciones específicas proteína-proteína. or more proteins for specific protein-protein interactions.

(iii) En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto una o más sondas de ácido nucleico con una selección como la aquí definida, y medir el enlace de las sondas con las proteínas de la selección; de este modo se analizan una (iii) In some embodiments, the method of the invention further comprises the step of contacting one or more nucleic acid probes with a selection as defined herein, and measuring the linkage of the probes with the selection proteins; in this way a

o más proteínas para las interacciones específicas proteína-ácido nucleico. or more proteins for specific protein-nucleic acid interactions.

(iv) (iv)
Se describe el uso de una selección como la aquí definida en para una rápida selección de un compuesto, proteína o ácido nucleico. The use of a selection as described herein is described for rapid selection of a compound, protein or nucleic acid.

(v) (v)
Se describe el uso de una selección tal y como aquí se define para seleccionar moléculas que reconocen cada proteína en la selección, donde las moléculas son preferiblemente anticuerpos. The use of a selection is described as defined herein to select molecules that recognize each protein in the selection, where the molecules are preferably antibodies.

(vi) (saw)
En algunas realizaciones, el método de la invención comprende además el paso de poner en contacto una selección de proteínas, tal y como aquí se define, con In some embodiments, the method of the invention further comprises the step of contacting a selection of proteins, as defined herein, with

una biblioteca de anticuerpos, de modo que una o más proteínas en la selección de proteínas se enlazan con al menos un anticuerpo en la biblioteca de anticuerpos, retirando todos los anticuerpos que no estén ligados e inmovilizando aquellos anticuerpos que se enlacen con las proteínas en la selección de proteínas, generando de este modo una selección de anticuerpos. an antibody library, so that one or more proteins in the protein selection bind to at least one antibody in the antibody library, removing all unbound antibodies and immobilizing those antibodies that bind to the proteins in the protein selection, thereby generating a selection of antibodies.

(vii) Se describe un método para seleccionar función o abundancia de proteínas que comprende el paso de poner en contacto una selección de anticuerpos como los aquí definidos con una mezcla de una o más proteínas. (vii) A method for selecting protein function or abundance is described which comprises the step of contacting a selection of antibodies such as those defined herein with a mixture of one or more proteins.

Los métodos (i), (ii), (iii) y (vi) también pueden incluir el paso de, en primer lugar, proporcionar la selección de acuerdo con uno o más métodos de la presente invención. Methods (i), (ii), (iii) and (vi) may also include the step of first providing the selection according to one or more methods of the present invention.

Las características preferentes de cada aspecto de la invención son aplicables a cada uno de los aspectos, con los cambios correspondientes. The preferred features of each aspect of the invention are applicable to each of the aspects, with the corresponding changes.

A continuación, la presente invención se describirá con referencia a los siguientes ejemplos, que en ningún caso deberían considerarse como limitativos del alcance de la invención. In the following, the present invention will be described with reference to the following examples, which in no case should be considered as limiting the scope of the invention.

FIGURA 1a: muestra la construcción del vector pMM106H; FIGURE 1a: shows the construction of the vector pMM106H;

FIGURA 1b: muestra los detalles de la amplificación PCR y la digestión de exonucleasa de un gen a modo de ejemplos (GST) antes del etiquetaje; FIGURE 1b: shows the details of PCR amplification and exonuclease digestion of a gene by way of examples (GST) before labeling;

FIGURA 1c: muestra detalles de la ligadura específica y la amplificación PCR para introducir la etiqueta; FIGURA 1d: muestra detalles de la clonación de los productos PCR; y FIGURE 1c: shows details of the specific ligation and PCR amplification to introduce the label; FIGURE 1d: shows details of the cloning of PCR products; Y

FIGURA 1e: muestra la reacción entre Glutationa y 1-cloro-2,4dinitrobenceno catalizado por GST. Ejemplo 1 FIGURE 1e: shows the reaction between Glutathione and 1-chloro-2,4-dithitrobenzene catalyzed by GST. Example 1

(a)Construcción de Vector (ver Figura 1a) (a) Vector Construction (see Figure 1a)

Hemos construido un vector pMM106H derivado de pUC19 que contiene un fuerte promotor híbrido (Ptrc) para conducir la expresión de los genes clonados a un punto Nco I inmediatamente por debajo de la secuencia promotora. Insertamos una secuencia de ADN sin sentido 676 bp como un fragmento de relleno entre el punto Nco I y un punto descendente Hpa I. Hpa I es un cortador con punta desafilada y está ubicado para partir el vector de modo que el ADN descendente codifique un poliasparagina, péptido de hexahistidina si el marco de lectura se encuentra sobre la primera fase de la punta desafilada. Después de la etiqueta de hexahistidina, encontramos un codón de parada ámbar (TAG) seguido del gen codificador de la proteína verde fluorescente (GFP) de la medusa Aequorea victoria. Los genes clonados en pMM106H como fragmentos Nco I/punta desafilada dan como resultado fusiones con la etiqueta His y GFP solamente si el marco de lectura correcto se crea en el punto Hpa I durante la clonación. Aquí, GFP se usa como un gen informador para facilitar la exploración visual de clones que expresan la etiqueta His, mientras que también proporcionan una indicación del correcto pliegue de la proteína de fusión, ya que GFP es solamente activo cuando se pliega en la conformación correcta. El codón de parada ámbar dará como resultado una pequeña cantidad de proteínas de fusión de longitud completa para la visualización de colonias verdes, mientras que la mayor parte de las proteínas de fusión terminarán inmediatamente después de la etiqueta His y pueden usarse para la posterior inmovilización y para ensayos con enzimas. La construcción de pMM106H se confirmó mediante secuencias: We have constructed a pMM106H vector derived from pUC19 that contains a strong hybrid promoter (Ptrc) to drive the expression of the cloned genes to an Nco I point immediately below the promoter sequence. We insert a 676 bp nonsense DNA sequence as a filler fragment between point Nco I and a descending point Hpa I. Hpa I is a cutter with a pointed tip and is located to split the vector so that the descending DNA encodes a polyasparagine , hexahistidine peptide if the reading frame is on the first phase of the dull tip. After the hexahistidine label, we found an amber stop codon (TAG) followed by the green fluorescent protein (GFP) coding gene of the jellyfish Aequorea victoria. The genes cloned in pMM106H as Nco I fragments / blunt tip result in fusions with the His and GFP tag only if the correct reading frame is created at the Hpa I point during cloning. Here, GFP is used as a reporter gene to facilitate visual exploration of clones that express the His tag, while also providing an indication of the correct fold of the fusion protein, since GFP is only active when folded in the correct conformation. . The amber stop codon will result in a small amount of full-length fusion proteins for visualization of green colonies, while most of the fusion proteins will end immediately after the His tag and can be used for subsequent immobilization and for enzyme tests. The construction of pMM106H was confirmed by sequences:

Construimos un segundo vector pGSTN mediante una primera amplificación PCR de gen glutatión S transferasa (GST) de Schistosoma japonicum de pGEX-2T (Pharmacia) bajo condiciones estándar usando cebadores “GSTfwd2” (5’ -ATG CTG CAG ACG TCA ACA GTA TCC ATG GCC CCT ATA CTA GG-3’) y ’GSTHindIII’ (5’ -GCG AGG AAG CTT GTC AAT CAG TCA CGA TGA ATT CCC G-3’). Estos cebadores introducen un lugar de restricción Nco I en el codón de inicio de GST, mutan el segundo residuo de GST de serina a alanina, e introducen un codón de parada en el lugar de clonación múltiples 3’-del gen GST seguido de un lugar de restricción Hin dIII. A continuación, el producto PCR se clona bajo condiciones estándares como un fragmento Nco I/ Hin dIII a pTrcHisA (Invitrogen) previamente digerido con Nco I/ Hin dIII para generar pGSTN. We constructed a second pGSTN vector using a first PCR amplification of Schistosoma japonicum glutathione S transferase (GST) gene from pGEX-2T (Pharmacia) under standard conditions using primers “GSTfwd2” (5 '-ATG CTG CAG ACG TCA ACA GTA TCC ATG GCC CCT ATA CTA GG-3 ') and' GSTHindIII '(5' -GCG AGG AAG CTT GTC AAT CAG TCA CGA TGA ATT CCC G-3 '). These primers introduce an Nco I restriction site in the GST start codon, mutate the second GST residue from serine to alanine, and introduce a stop codon at the 3'-multiple cloning site of the GST gene followed by a place restriction Hin dIII. The PCR product is then cloned under standard conditions as an Nco I / Hin dIII fragment to pTrcHisA (Invitrogen) previously digested with Nco I / Hin dIII to generate pGSTN.

(b) Amplificación PCR y digestión de genes de exonucleasa antes del etiquetado (ver figura 1b) (b) PCR amplification and digestion of exonuclease genes before labeling (see figure 1b)

Amplificamos el gen GST de la construcción pGSTN usando una reacción en cadena de polimerasa con cebadores específicos de vector diseñado a la medida “STdelantero” (5’ -ATG CTG ACG TCA TGA GGC CCA TGG GGC CCG GAT AAC AAT TTC ACA CAG G3’) y ’STtrasero’ (5’-GCG GAT CCT TGC GGC CGC CAG GCA AAT TCT GTT T-3’) que se combinan con el vector 156 bp sobre el codón de inicio y 84 bp bajo el codón de parada, respectivamente. Se llevaron a cabo 30 ciclos de PCR (94ºC 1 min; 57ºC 1 min; 72ºC 2 min) en cuatro reacciones separadas de 100 µl. Cada reacción PCR contenía ~20 ng de plantilla de ADN, 50 pmol de cada cebador y 2.5 unidades de polimerasa Pwo. Cada reacción PCR se realizó en un búfer estándar (10 mM Tris.HCl pH 8.8, 25 mM KCl, 5 mM (NH4)2SO4, 2 mM MgSO4, 10% DMSO). Además, cada una de las cuatro reacciones PCR también contenía una mezcla no estándar de trifosfato deoxinucleótido, del siguiente modo: Reacción 1) 200µM dATP, 200µM dTTP, 200µM dCTP, 150µM dGTP, 50µM α-S-dGTP; Reacción 2) 200µM dATP, 200µM dTTP, 200µM dGTP, 150µM dCTP, 50µM α-S-dCTP; Reacción 3) 200µM dATP, 200µM dGTP, 200µM dCTP, 150µM dTTP, 50µM α-S-dTTP; Reacción 4) 200µM dGTP, 200µM dTTP, 200µM dCTP, 150µM dATP, 50µM α-S-dATP. We amplify the GST gene of the pGSTN construct using a polymerase chain reaction with specific vector primers designed “ST-forward” (5 '-ATG CTG ACG TCA TGA GGC CCA TGG GGC CCG GAT AAC AAT TTC ACA CAG G3') and 'STtrasero' (5'-GCG GAT CCT TGC GGC CGC CAG GCA AAT TCT GTT T-3 ') which are combined with vector 156 bp on the start codon and 84 bp under the stop codon, respectively. 30 cycles of PCR (94 ° C 1 min; 57 ° C 1 min; 72 ° C 2 min) were carried out in four separate 100 µl reactions. Each PCR reaction contained ~ 20 ng of DNA template, 50 pmol of each primer and 2.5 units of Pwo polymerase. Each PCR reaction was performed in a standard buffer (10 mM Tris.HCl pH 8.8, 25 mM KCl, 5 mM (NH4) 2SO4, 2 mM MgSO4, 10% DMSO). In addition, each of the four PCR reactions also contained a non-standard mixture of deoxynucleotide triphosphate, as follows: Reaction 1) 200µM dATP, 200µM dTTP, 200µM dCTP, 150µM dGTP, 50µM α-S-dGTP; Reaction 2) 200µM dATP, 200µM dTTP, 200µM dGTP, 150µM dCTP, 50µM α-S-dCTP; Reaction 3) 200µM dATP, 200µM dGTP, 200µM dCTP, 150µM dTTP, 50µM α-S-dTTP; Reaction 4) 200µM dGTP, 200µM dTTP, 200µM dCTP, 150µM dATP, 50µM α-S-dATP.

La inclusión de un único trifostato deoxinucleótido α-thio en cada mezcla específica PCR da como resultado una incorporación arbitraria pero estadística de α-S-dNTP en el producto final específico PCR. A continuación, las cuatro mezclas individuales PCR se reunieron y se purificaron usando un kit de limpieza QIAquick PCR (Qiagen), bajo condiciones estándares, y se digirieron hasta su finalización con la enzima de restricción Aat II. Posteriormente, los ~1000bp productos PCR resultantes se purificaron con gel. The inclusion of a single α-thio deoxynucleotide triphosphate in each specific PCR mixture results in an arbitrary but statistical incorporation of α-S-dNTP in the specific final PCR product. Next, the four individual PCR mixtures were pooled and purified using a QIAquick PCR cleaning kit (Qiagen), under standard conditions, and digested to completion with the restriction enzyme Aat II. Subsequently, the resulting ~ 1000bp PCR products were gel purified.

5µg de producto PCR digerido se incubó a continuación con 375 unidades de Exonucleasa III durante 45 minutos en una reacción de 50µl. La digestión de Exo III se llevó a cabo en una búfer de reacción estándar (66mM Tris.HCl pH 8.0, 6.6mM MgCl2, 5mM DTT, 50µg/ml albúmina de suero bovino). Estas condiciones aseguran que la digestión por parte de Exo III llegue a su finalización. A continuación, la enzima se desactivó calentándola a 75ºC durante 15 minutos. El producto de la digestión Exo III es un conjunto anidado de eliminaciones desde el extremo 3’ del producto PCR; el extremo 5’ del producto PCR se protege de la digestión puesto que la restricción con Aat II deja un saliente en el punto 3’ que es además resistente a la actividad de Exonucleasa III. 5 µg of digested PCR product was then incubated with 375 units of Exonuclease III for 45 minutes in a 50 µl reaction. Exo III digestion was carried out in a standard reaction buffer (66mM Tris.HCl pH 8.0, 6.6mM MgCl2, 5mM DTT, 50µg / ml bovine serum albumin). These conditions ensure that digestion by Exo III comes to an end. The enzyme was then deactivated by heating it at 75 ° C for 15 minutes. The Exo III digestion product is a nested set of deletions from the 3 ’end of the PCR product; the 5 ’end of the PCR product is protected from digestion since restriction with Aat II leaves a protrusion at point 3’ that is also resistant to Exonuclease III activity.

La exonoucleasa III es una exonucleasa no procesadora 3’-a 5’-que es incapaz de hidrolizar nucleótidos que contienen α-thio por lo que en el presente protocolo, cada vez que Exo III alcanza una base α-thio-deoxinucleótida, el truncamiento progresivo del extremo 3’ empotrado del producto PCR se detiene. Por lo tanto, el resultado de red es un conjunto anidado de eliminaciones como consecuencia de la incorporación arbitraria de cada α-S-dNTP en la fase temprana. El radio de α-S-dNTP con dNTP usado en las amplificaciones de PCR original se determinó empíricamente de manera que el sobre de eliminaciones anidadas abarcaron una ventana 4000bp de tamaños centrados aproximadamente 100bp más cortos que el producto PCR original de longitud completa. Confirmamos esto tomando una porción de la mezcla Exo II y tratando las eliminaciones anidadas con nucleasa de frijol mungo. Este proceso retiró los salientes 5’ y 3’ para producir productos con punta desafilada que a continuación se midieron sobre geles 1% agarosa/TBE, usando una cadena de ADN 100bp como estándar. Exonouclease III is a non-processing 3'-a 5'-exonuclease that is incapable of hydrolyzing nucleotides containing α-thio so in the present protocol, every time Exo III reaches an α-thio-deoxynucleotide base, truncation The progressive 3 'end of the PCR product stops. Therefore, the network result is a nested set of deletions as a result of the arbitrary incorporation of each α-S-dNTP in the early phase. The radius of α-S-dNTP with dNTP used in the original PCR amplifications was determined empirically so that the envelope of nested deletions encompassed a 4000bp window of centered sizes approximately 100bp shorter than the original full-length PCR product. We confirm this by taking a portion of the Exo II mixture and treating the nested deletions with mung bean nuclease. This process removed the 5 'and 3' protrusions to produce products with a pointed tip that were then measured on 1% agarose / TBE gels, using a 100bp DNA chain as standard.

Claramente, se pudieron usar un número de diferentes actividades de nucleasa 3’ y 5’ para generar el conjunto necesario de las eliminaciones empotradas en 3’ en el procedimiento anteriormente descrito; se incluyen aunque no se limitan a Exonucleasa III, polimerasa I de ADN E. coli, polimerasa de ADN T4, polimerasa de ADN T7. Clearly, a number of different nuclease activities 3 ’and 5’ could be used to generate the necessary set of eliminations embedded in 3 ’in the procedure described above; they are included but not limited to Exonuclease III, E. coli DNA polymerase I, T4 DNA polymerase, T7 DNA polymerase.

(c) Ligadura Específica y amplificación PCR para introducir etiquetas (ver figura 1c) (c) Specific ligation and PCR amplification to introduce labels (see figure 1c)

Se diluyeron 5µl de la mezcla de reacción Exo III en búfer de ligasa ADN T4 en presencia de un exceso molar multiplicado por 25 5 de una “mezcla oligo”. La “mezcla oligo” consiste en cualquiera de los 2 subconjuntos de oligonucleótidos. El primer subconjunto, “oligomezclaA”, contiene 12 oligonucleótidos en los que cada uno de los tres posibles codones de parada están representados en el extremo 5’, seguidos inmediatamente por una base degenerada. La 10 región restante de cada uno de los oligos es la misma en los 12 casos y efectivamente es una secuencia arbitraria excepto para dos sitios de enzima de restricción Tipo IIS (Sap I y Bam I), a lo que sigue una secuencia complementaria de reconocimiento para el cebador “LMB2” (5’-GTA AAA CGA CGG CCA GT-3’) en el extremo 3’. Las 5 µl of the Exo III reaction mixture was diluted in T4 DNA ligase buffer in the presence of a molar excess multiplied by 25 of an "oligo mixture". The "oligo mixture" consists of any of the 2 subsets of oligonucleotides. The first subset, "oligomezclaA", contains 12 oligonucleotides in which each of the three possible stop codons are represented at the 5 'end, followed immediately by a degenerate base. The remaining region of each of the oligos is the same in the 12 cases and is indeed an arbitrary sequence except for two restriction enzyme sites Type IIS (Sap I and Bam I), followed by a complementary recognition sequence for primer "LMB2" (5'-GTA AAA CGA CGG CCA GT-3 ') at the 3' end. The

15 secuencias de los 12 oligos son las siguientes: 15 sequences of the 12 oligos are the following:

imagen1image 1

35 Sap I Bam I sitio de unión LMB2 35 Sap I Bam I binding site LMB2

El segundo subconjutno, “oligomezclaB”, consiste en 3 conjuntos de oligonucleótidos, cada uno de los cuales con uno de los 3 codones de parada representados en el extremo 5’, seguido inmediatamente por 6 residuos degenerados. La región restante de cada uno de los oligos es la misma en los 3 conjuntos y contiene dos sitios de enzima de restricción Tipo IIS (Bpm I y Bse RII), a lo que sigue una secuencia complementaria de reconocimiento para el cebador “LMB2” en el extremo 3’. Las secuencias de los 3 conjuntos de oligos son las siguientes: The second subconjutno, "oligomezclaB", consists of 3 sets of oligonucleotides, each of which with one of the 3 stop codons represented at the 5 'end, followed immediately by 6 degenerated residues. The remaining region of each of the oligos is the same in the 3 sets and contains two Type IIS restriction enzyme sites (Bpm I and Bse RII), followed by a complementary recognition sequence for the "LMB2" primer in the 3 'end. The sequences of the 3 sets of oligos are as follows:

imagen2image2

Bse RI Bpm I sitio de unión LMB2 Bse RI Bpm I binding site LMB2

La mezcla Exo III más la oligomezclaA u oligomezcla B se alinearon durante 30 minutos a 16ºC y a continuación se añadieron 400 Unidades de ligasa ADN T4, y posteriormente la reacción se incubó durante la noche a 16ºC. Los productos de ligadura se purificaron usando un kit de limpieza PCR QIAquick (Qiagen) bajo condiciones estándares y se usó como plantilla en una reacción PCR estándar usando polimerasa Pwo con cebadores “STdelantero” y “LMB2”. Se realizaron 30 ciclos de PCR (94ºC, 1 min; 57ºC 1 min; 72ºC 2 min) para generar productos PCR que oscilaran los 1000bp. The Exo III mixture plus the oligomix A or oligomix B was aligned for 30 minutes at 16 ° C and then 400 Units of T4 DNA ligase were added, and the reaction was then incubated overnight at 16 ° C. Ligation products were purified using a QIAquick PCR cleaning kit (Qiagen) under standard conditions and used as a template in a standard PCR reaction using Pwo polymerase with "STdelantero" and "LMB2" primers. 30 cycles of PCR (94 ° C, 1 min; 57 ° C 1 min; 72 ° C 2 min) were performed to generate PCR products that range from 1000bp.

Tanto la oligomezclaA como la oligomezclaB son capaces de alinearse de manera competitiva con las regiones de ADN con una cadena única de la plantilla original expuesta por la hidrólisis Exo II de una cadena del dúplex realizado en el paso precio. Tras el alineamiento, una ligadura correcta entre un oligo y una plantilla requiere que el oligo se ponga en línea con absoluta complementariedad en su extremo 5’ y, además, que el residuo empotrado en 3’ de la plantilla dúplex directamente está contiguo al residuo 5’ del oligo específicamente alineado. PCR que usa el cebador que se enlaza con el oligo recién ligado y un segundo cebador que se enlaza en el extremo 5’ de la plantilla del dúplex de manera selectiva y especificativa amplifica a continuación solamente aquellos dúplex que han sufrido dicha ligadura. El extremo 5’ de cada uno de los 12 oligos en la oligomezclaA corresponde a un codón de parada y por lo tanto, de los 12 oligos contenidos en esta mezcla, solamente uno puede alinearse con absoluta complementariedad en su extremo 5’ con la secuencia de reconocimiento con cuatro pares de base que consiste en el primer codón de parada estructural de GST y base inmediatamente 3 del codón de parada, tal y como se muestra en la Figura 1c. El resto de los 11 oligos pueden alinearse perfectamente en sus extremos 5 en todos los lugares dentro del conjunto anidado de eliminaciones pero estos otros hechos específicos para alinear solamente pueden darse en codones de parada fuera del marco en el gen GST o en codones de parada por debajo del primer codón de parada dentro del marco. Siempre que un oligo recién alineado colinde directamente con el residuo empotrado en 3’ de la plantilla del dúplex, la ligadura tiene lugar. Por lo tanto, PCR en esta fase amplificará no solamente el gen exacto y de longitud completa sino también un conjunto de productos truncados y extendidos. Se espera que los oligos en la oligomezclaB reaccionen de la misma manera. El extremo 5’ de cada uno de los 3 conjuntos de oligos en el subconjunto corresponde a un codón de parada, seguido de 6 residuos que efectivamente son arbitrarios. Por lo tanto, el subconjunto contendrá una permutación en la que el codón de parada y los siguiente 6 residuos coincidirán perfectamente con los de la parte inferior del gen de interés. Este oligo se enlazará con una especificidad mayor en comparación con el oligo correspondiente del subconjunto de 12 oligos, ya que la complementariedad se extiende sobre 9 nucleótidos en lugar de 4. Both oligomix A and oligomix B are capable of competitively aligning with DNA regions with a single chain of the original template exposed by Exo II hydrolysis of a duplex chain performed in the price step. After alignment, a correct ligation between an oligo and a template requires that the oligo be brought in line with absolute complementarity at its 5 'end and, in addition, that the residue embedded in 3' of the duplex template is directly adjacent to residue 5 'of the specifically aligned oligo. PCR that uses the primer that binds with the newly ligated oligo and a second primer that binds at the 5 ’end of the duplex template selectively and specifically amplifies then only those duplexes that have undergone such ligation. The 5 ′ end of each of the 12 oligos in the oligomexclaA corresponds to a stop codon and therefore, of the 12 oligos contained in this mixture, only one can align with absolute complementarity at its 5 ′ end with the sequence of recognition with four base pairs consisting of the first structural stop codon of GST and base immediately 3 of the stop codon, as shown in Figure 1c. The rest of the 11 oligos can be perfectly aligned at their ends 5 in all places within the nested set of eliminations but these other specific facts to align can only occur in stop codons outside the frame in the GST gene or in stop codons by under the first stop codon inside the frame. Whenever a newly aligned oligo directly collides with the residue embedded in 3 ’of the duplex template, ligation takes place. Therefore, PCR in this phase will amplify not only the exact and full-length gene but also a set of truncated and extended products. Oligos in oligomixB are expected to react in the same way. The 5 ’end of each of the 3 sets of oligos in the subset corresponds to a stop codon, followed by 6 residues that are indeed arbitrary. Therefore, the subset will contain a permutation in which the stop codon and the next 6 residues will coincide perfectly with those of the lower part of the gene of interest. This oligo will bind to a higher specificity compared to the corresponding oligo of the subset of 12 oligos, since the complementarity extends over 9 nucleotides instead of 4.

La diferencia teórica entre la oligomezclaA y la oligmezclaB reside en la secuencia que inmediatamente va después del codón de parada en el extremo 5’ de cada oligo. En la oligomezclaA, una base degenerada sencilla es a continuación seguida por una secuencia de ADN sencilla sin sentido pero definida de modo que sea posible que esta región definida pueda influir a la hora de alinear la oligomezcla a favor de codones individuales de “parada” (ya estén dentro o fuera del marco) dentro de cualquier gen determinado proporcionando una complementariedad con la pareja base involuntaria pero adicional más allá de las cuatro interacciones diseñadas con emparejamiento base en el extremo 5’ de cada oligo. Cualquier parcialidad en el alineamiento puede manifestarse en dirección descendente en una desviación hacia clones en los que se ha dado la escisión y reemplazo específico de un codón individual de parada (ya sea dentro o fuera del marco). Dicha desviación en la frecuencia de modificación en diferentes codones de parada podría no ser adecuada y la oligomezclaB se diseña para salvar esta dificultad del siguiente modo. Cualquier codón de parada en un gen individual o biblioteca irá inmediatamente seguido por una secuencia definida aunque desconocida. Los tres codones de parada están representados en la oligomezlcaB y cada uno de ellos está inmediatamente seguido por todas las secuencias posibles de hexanucleótido (es decir, por una secuencia hexámera) de modo que en cualquier codón de parada determinado en un gen o biblioteca, habrá un oligo en oligomezclaB que corresponderá al codón de parada y, exactamente, a su secuencia precisa e inferior, dando como resultado 9 parejas base de total complementariedad. Debido a que esto será cierto para todos los codones de parada, la oligomezclaB no debería sufrir ninguna desviación del tipo que podría ser posible con la oligomezlcaA. The theoretical difference between oligomezclaA and oligmezclaB lies in the sequence that immediately goes after the stop codon at the 5 ’end of each oligo. In oligomix A, a simple degenerate base is then followed by a simple nonsense but defined DNA sequence so that it is possible that this defined region can influence when aligning the oligomix in favor of individual "stop" codons ( whether within or outside the frame) within any given gene providing complementarity with the involuntary but additional base pair beyond the four interactions designed with base matching at the 5 'end of each oligo. Any partiality in the alignment can be manifested in the downward direction in a deviation towards clones in which the specific excision and replacement of an individual stop codon has occurred (either inside or outside the frame). Such a deviation in the frequency of modification in different stop codons may not be adequate and oligomixB is designed to overcome this difficulty as follows. Any stop codon in an individual gene or library will be immediately followed by a defined but unknown sequence. The three stop codons are represented in oligomezlcaB and each of them is immediately followed by all possible hexanucleotide sequences (i.e., by a hexameric sequence) so that at any given stop codon in a gene or library, there will be an oligo in oligomezclaB that will correspond to the stop codon and, exactly, to its precise and inferior sequence, resulting in 9 base pairs of total complementarity. Because this will be true for all stop codons, oligomixB should not suffer any deviation of the type that could be possible with oligomezlcaA.

Hemos descubierto que el proceso global de digestión, recocimiento y ligadura de Exo III de las oligomezclas y la amplificación específica PCR han sido reproducibles en un alto grado. Como controles en este proceso, hemos mostrado que si la Exonucleas II, ligasa ADN T45 o cualquiera de las oligomezclas se omite, no obtenemos absolutamente ningún producto PCR. Esto demuestra que este proceso es altamente selectivo. We have discovered that the overall process of digestion, annealing and ligation of Exo III oligomixes and the specific PCR amplification have been reproducible to a high degree. As controls in this process, we have shown that if Exonucleas II, T45 DNA ligase or any of the oligomixes is omitted, we obtain absolutely no PCR products. This shows that this process is highly selective.

También se apreciará que la ligasa ADN T4 podría sustituirse por un número de diferentes ligasas de ADN, por ejemplo ligasa ADN Taq o ligasa ADN Tsc, que podrían mostrar diferentes especificidades. It will also be appreciated that the T4 DNA ligase could be replaced by a number of different DNA ligases, for example Taq DNA ligase or Tsc DNA ligase, which could show different specificities.

(d) Variación en el procedimiento (d) Variation in the procedure

Claramente, podría usarse un número de diferentes actividades 3’ y 5’ para generar el conjunto necesario de eliminaciones empotradas y anidadas en 3’ en el procedimiento anteriormente descrito; éstas incluyen pero no se restringen a Exonucleasa III, polimerasa I de ADN E. coli, polimerasa de ADN T4, polimerasa de ADN T7. Clearly, a number of different 3 ’and 5’ activities could be used to generate the necessary set of built-in and nested 3 ’eliminations in the procedure described above; these include but are not restricted to Exonuclease III, E. coli DNA polymerase I, T4 DNA polymerase, T7 DNA polymerase.

Una variación obvia en el procedimiento original para producir inserciones de longitud completa con el codón de parada o codón de inicio retirados con precisión implica la producción de un conjunto anidado de eliminaciones empotradas en 5’ en un producto PCR que abarca la secuencia codificadora. Potencialmente, esto podrías llevarse a cabo usando nucleasas tales como exonucleasa λ, polimerasa I de ADN E. coli, polimerasa de ADN Taq, exonucleasa 6 del gen T7. Por lo tanto, el producto PCR original, por ejemplo, podría digerirse con exonucleasa λ, lo que retira los nucleótidos de la cadena de dsADN en una dirección 5’ a 3’. Dibdo a que la enzima solamente reconoce los grupos de fosfato 5’ como sustratos, una de las dos cadenas puede protegerse incorporando un grupo hidroxil en el extremo del cebador apropiado en la amplificación inicial de PCR. Por consiguiente, podría crearse un conjunto anidado de eliminaciones, tal y como se ha descrito anteriormente, para exonucleasa III, salvo que la cadena opuesta se digiera para dejar terminales empotradas en 5’. Una mezcla de oligos en la que el complemento del codón de parada se representa en el extremo 3’ del oligo, está inmediatamente precedida por 6 residuos aleatorios y, antes de ellos, por una secuencia definida que codifica un punto de restricción Tipo IIS que puede a continuación alinearse con las regiones expuestas de la cadena sencilla. Un oligo de la mezcla se alineará específicamente con cada codón de parada expuesto y servirá como un cebador para polimerasa I ADN E. coli, que polimeriza en la dirección 5’ y 3, digiriendo la cadena delante de ella con su actividad de exonucleasa en 5’ y 3’. Este nuevo fragmento dúplex de ADN puede amplificarse de manera específica usando un cebador que se enlaza con el extremo 5’ del producto original PCR y uno que se enlace específicamente con el oligo recién alineado y extendido. En este procedimiento, no es necesario que el extremo 3’ del oligo alineado colinde directamente con el residuo empotrado 5’ de la plantilla dúplex. Los oligos de la mezcla pueden alinearse con cualquier región complementaria sobre la plantilla de ADN expuesta con cadena sencilla de una manera similar a la preparación arbitraria de hexámeros, pero es importante el hecho de que la extensión de la cadena solamente ocurrirá donde el extremo 3’ se haya alineado con absoluta complementariedad y los extremos 3’ de los oligos en la mezcla se diseñan para que solamente sean complementarios con los codones de parada. Por lo tanto, únicamente cuando el extremo 3’ de un oligo se haya enlazado específicamente con el correspondiente codón de parada, la extensión del cebador y la posterior amplificación PCR tendrán lugar. El enlace con codones de parada fuera del marco y aquellos por debajo del verdadero codón de parada del gen de interés también tendrán lugar, dando como resultado la amplificación PCR de no sólo el gen exacto de longitud completa, sino también un conjunto de productos truncados y extendidos. An obvious variation in the original procedure for producing full length inserts with the stop codon or start codon removed accurately involves the production of a nested set of 5 'embedded eliminations in a PCR product that encompasses the coding sequence. Potentially, this could be accomplished using nucleases such as λ exonuclease, E. coli DNA polymerase I, Taq DNA polymerase, T7 gene exonuclease 6. Therefore, the original PCR product, for example, could be digested with λ exonuclease, which removes the nucleotides from the dsDNA chain in a 5 ′ to 3 ′ direction. Because the enzyme only recognizes 5 ’phosphate groups as substrates, one of the two chains can be protected by incorporating a hydroxyl group at the end of the appropriate primer in the initial PCR amplification. Therefore, a nested set of deletions could be created, as described above, for exonuclease III, unless the opposite chain was digested to leave 5 'embedded terminals. A mixture of oligos in which the complement of the stop codon is represented at the 3 'end of the oligo, is immediately preceded by 6 random residues and, before them, by a defined sequence encoding a Type IIS restriction point that can then align with the exposed regions of the single chain. An oligo of the mixture will specifically align with each exposed stop codon and serve as a primer for polymerase I DNA E. coli, which polymerizes in the 5 'and 3 direction, digesting the chain in front of it with its exonuclease activity in 5 'and 3'. This new DNA duplex fragment can be specifically amplified using a primer that binds to the 5 ′ end of the original PCR product and one that specifically binds to the newly aligned and extended oligo. In this procedure, it is not necessary that the 3 ’end of the aligned oligo directly collides with the 5’ recessed residue of the duplex template. The oligos of the mixture can be aligned with any complementary region on the exposed DNA template with a single chain in a manner similar to the arbitrary preparation of hexamers, but it is important that the chain extension will only occur where the 3 'end it has been aligned with absolute complementarity and the 3 'ends of the oligos in the mix are designed to be only complementary to the stop codons. Therefore, only when the 3 ’end of an oligo has been specifically linked to the corresponding stop codon, will the primer extension and subsequent PCR amplification take place. The link with stop codons outside the frame and those below the true stop codon of the gene of interest will also take place, resulting in the PCR amplification of not only the exact full length gene, but also a set of truncated products and extended.

(e) Clonaciónyanálisisdelosproductos PCR (ver figura 1d) (e) Cloning and analysis of PCR products (see figure 1d)

Los productos PCR (~5µg) que oscilan en tamaño desde 800 a 1000 bp se limpiaron usando un kit de purificación PCR QIAquick (Qiagen) y a continuación se digirieron hasta la finalización con la enzima de restricción Bpm I del Tipo IS. Esta enzima corta remotamente pero específicamente 14 bases de sus secuencia de reconocimiento en una cadena y 16bp en la otra cadena dejando un extremo empotrado en 3’. Por consiguiente, esta modificación en la restricción específicamente suprime del producto PCR el codón de parada en el que el extremo 5’ de un oligo individual de la “mezcla oligo” se alineó y ligó de manera exitosa en el paso previo. PCR products (~ 5µg) ranging in size from 800 to 1000 bp were cleaned using a QIAquick (Qiagen) PCR purification kit and then digested to completion with the Bpm I restriction enzyme of Type IS. This enzyme cuts remotely but specifically 14 bases of its recognition sequence in one chain and 16bp in the other chain leaving a 3 'embedded end. Therefore, this modification in the restriction specifically removes from the PCR product the stop codon in which the 5 ’end of an individual oligo of the“ oligo mixture ”was aligned and ligated successfully in the previous step.

Los extremos empotrados en 3’ de los productos digeridos se retiraron a continuación usando nucleasa de frijol mungo bajo condiciones estándares para generar un extremo desafilado en el extremo 3’ de los productos PCR. El ADN se purificó usando un kit de purificación de PCR QIAquick (Qiagen) bajo condiciones estándares y a continuación se digirieron hasta el final con la enzima de restricción Nco I. Los fragmentos restringidos de ADN que oscilaban entre 800bp y 1000bp se purificaron a continuación sobre un gel 1% agarosa/TBE usando un kit de extracción de gel QIAquick (Qiagen). El vector pMM106H (3µg) se digirió hasta su finalización con las enzimas Nco I y Hpa I y el fragmento eje de 2870bp se purificó con gel. El ADN del vector y los productos PCR restringidos se ligaron posteriormente bajo condiciones estándares y la mezcla de la ligadura se usó para transformar células E. coli DH5α que a continuación se recuperaron y colocaron en placas LB que contenían 100µg/ml carbenicilina. The 3 'embedded ends of the digested products were then removed using mung bean nuclease under standard conditions to generate a dull end at the 3' end of the PCR products. The DNA was purified using a QIAquick (Qiagen) PCR purification kit under standard conditions and then digested to the end with restriction enzyme Nco I. Restricted DNA fragments ranging between 800bp and 1000bp were then purified on a 1% agarose / TBE gel using a QIAquick gel extraction kit (Qiagen). The vector pMM106H (3 µg) was digested until its completion with the enzymes Nco I and Hpa I and the 2870bp axis fragment was gel purified. The vector DNA and the restricted PCR products were subsequently ligated under standard conditions and the ligation mixture was used to transform E. coli DH5α cells that were then recovered and placed on LB plates containing 100 µg / ml carbenicillin.

Este procedimiento de clonación se llevó a cabo sobre el conjunto completo de productos PCR obtenidos en el paso previo. Sin embargo, solamente los productos PCR derivados de alinear de manera específica y ligadura de un oligo con el primer codón de parada dentro del marco debería ser capaz de ocasionar fusiones estructurales con la etiqueta de hexahistidina y GFP tras los pasos de clonación por medio de este procedimiento; el resto de productos PCR clonados de esta manera solamente deberían dar lugar a fusiones fuera del marco con la etiqueta de hexahistidina y GFP. Esto ocurre porque la ligadura del extremo desafilado del producto PCR con el extremo desafilado del vector da como resultado una fusión genética en la que el marco de lectura de translación del vector de ADN descendente es dictado por el marco de lectura original del codón de parada suprimido. Si el codón de parada estuviera fuera del marco con respecto al gen GST, la recién agregada secuencia codificadora de hexahistidina también se encontraría fuera del marco con respecto al gen GST, mientras que si el codón de parada estuviera dentro del marco con respecto al gen GST, la recién agregada secuencia codificadora de hexahistidina también se encontraría dentro del marco con respecto al gen GST. Sin embargo, solamente aquellos productos en los que el codón de parada específicamente suprimido fue el primer codón de parada dentro del marco de GST pueden ocasionar a proteína de fusión GST con etiqueta de hexahistidina (y GFP) cuando el aDN se transcribe y traslada. Las únicas proteínas con etiqueta de hexahistidina (y GFP) que pueden surgir del proceso global específico arriba descrito serán consecuentemente y necesariamente fusiones GST de longitud completa con la poliasparagina, etiqueta de hexahistidina. This cloning procedure was carried out on the complete set of PCR products obtained in the previous step. However, only PCR products derived from specifically aligning and ligating an oligo with the first stop codon within the frame should be able to cause structural fusions with the hexahistidine and GFP tag after cloning steps through it. process; The rest of PCR products cloned in this way should only result in fusions outside the frame labeled with hexahistidine and GFP. This occurs because ligation of the dull end of the PCR product with the dull end of the vector results in a genetic fusion in which the translation reading frame of the descending DNA vector is dictated by the original reading frame of the suppressed stop codon. . If the stop codon were outside the frame with respect to the GST gene, the newly added hexahistidine coding sequence would also be outside the frame with respect to the GST gene, while if the stop codon were within the frame with respect to the GST gene , the newly added hexahistidine coding sequence would also be found within the framework with respect to the GST gene. However, only those products in which the specifically suppressed stop codon was the first stop codon within the GST framework can cause a hexahistidine (and GFP) tagged GST fusion protein when the aDN is transcribed and transferred. The only hexahistidine (and GFP) tagged proteins that may arise from the specific global process described above will be consequently and necessarily full length GST fusions with the poliasparagine, hexahistidine tag.

Las colonias obtenidas del procedimiento de clonación arriba descrito se visualizaron en 365nm para identificar colonias verdes fluorescentes. Se recogieron noventa colonias (blancas y verdes) de manera arbitraria, se someten a una replicación en placa y se analizan mediante Western blot de colonias bajo condiciones estándares usando anticuerpos con etiqueta anti-His y anticuerpos anti-GST. El anticuerpo con etiqueta anti-His solamente se ligará a colonias que expresen la proteína etiquetada con hexahistidina de modo que el Western blot dar información directa sobre el número de colonias que expresan fusiones dentro del marco con la etiqueta hexahistidina. Por otro lado, el anticuerpo anti-GST se liga cerca de la terminal C de la proteína GSTE y por lo tanto solamente reconoce colonias que expresan proteínas GST de longitud completa o casi completa. Identificamos aquellas colonas que contenían una proteína que fue reconocida de manera positiva tanto por los anticuerpos con etiqueta anti-His como por los anticuerpos anti-GST. El ADN de estas colonias fue amplificado, purificado y secuenciado. Los datos de la secuenciación confirmaron la presencia de dos fusiones perfectas dentro del marco con GST de longitud completa, es decir, clones en los que el primer codón de parada dentro del marco del gen original GST había sido específicamente suprimido y sustituido por una poliasparagina dentro del marco, etiqueta hexahistidina. Por lo tanto, el índice de modificación exitosa que obtuvimos por medio de este procedimiento global es aproximadamente 2.2%. Los dos clones positivos resultaron ser verdes fluorescentes tras la exposición a luz ultravioleta de onda larga, debido a la expresión de suficientes cantidades de la fusión de longitud completa GSThexahistidina-GFP. Por consiguiente, en experimentos posteriores, solamente se recogieron colonias verdes fluorescentes para analizarlas con Western blot. Hemos descubierto que aproximadamente 70-80% de las colonias fluorescentes expresan proteínas reconocida por el anticuerpo con etiqueta anti-His. Es posible que en el resto del 20-30% de los casos, la traslación se inicie en el primer ATG del gen GFP, independientemente de la etiqueta hexahistidina, posiblemente con la ayuda de un punto de enlace pseudo-ribosoma introducido por la inserción clonada. Colonies obtained from the cloning procedure described above were visualized at 365 nm to identify fluorescent green colonies. Ninety colonies (white and green) were collected arbitrarily, subjected to plaque replication and analyzed by Western blotting of colonies under standard conditions using anti-His tag antibodies and anti-GST antibodies. The anti-His tag antibody will only bind to colonies that express the hexahistidine-tagged protein so that the Western blot give direct information on the number of colonies that express fusions within the framework with the hexahistidine tag. On the other hand, the anti-GST antibody binds near the C-terminal of the GSTE protein and therefore only recognizes colonies that express full-length or almost full-length GST proteins. We identified those colonies that contained a protein that was positively recognized by both the anti-His tag antibodies and the anti-GST antibodies. The DNA of these colonies was amplified, purified and sequenced. Sequencing data confirmed the presence of two perfect fusions within the framework with full-length GST, that is, clones in which the first stop codon within the framework of the original GST gene had been specifically suppressed and replaced by a polyasparagine within of the frame, hexahistidine label. Therefore, the rate of successful modification we obtained through this global procedure is approximately 2.2%. The two positive clones turned out to be fluorescent green after exposure to long-wave ultraviolet light, due to the expression of sufficient amounts of the GSThexahistidine-GFP full-length fusion. Therefore, in subsequent experiments, only fluorescent green colonies were collected for analysis with Western blot. We have discovered that approximately 70-80% of the fluorescent colonies express proteins recognized by the anti-His tag antibody. It is possible that in the rest of 20-30% of cases, the translation begins in the first ATG of the GFP gene, regardless of the hexahistidine tag, possibly with the help of a pseudo-ribosome binding point introduced by the cloned insert .

Hemos amplificado, purificado y secuenciado ADN plásmido de colonias verdes fluorescentes que expresan proteína reconocida tanto por los anticuerpos con etiqueta anti-His como por los anticuerpos anti-GST. Para las inserciones preparadas usando tanto la oligomezclaA como la oligomezclaB, el índice de modificaciones exitosas fue aproximadamente el 25% de todas las colonias verdes. Por lo tanto, el uso del gen GFP como marcador para fusiones dentro del marco aumenta la eficacia, aproximadamente 10 veces, a la hora de detectar los clones correctos. We have amplified, purified and sequenced plasmid DNA from fluorescent green colonies that express protein recognized by both anti-His tag antibodies and anti-GST antibodies. For insertions prepared using both oligomezclaA and oligomezclaB, the rate of successful modifications was approximately 25% of all green colonies. Therefore, the use of the GFP gene as a marker for fusions within the framework increases the efficiency, approximately 10 times, in detecting the correct clones.

También se podrá apreciar que la Nucleasa de Frijol Mungo podría sustituirse por otras nucleasas diferentes de cadena sencilla, por ejemplo, nucleasa S1 o RNasaT, que podrían mostrar diferentes especificidades y que un número de diferentes enzimas de restricción del Tipo IIS adecuadamente posicionadas podrían usarse en lugar de BpmI, por ejemplo SapI. It will also be appreciated that Mungo Bean Nuclease could be replaced by other different single stranded nucleases, for example, S1 or RNasaT nuclease, which could show different specificities and that a number of different properly positioned Type IIS restriction enzymes could be used in BpmI place, for example SapI.

(f) Inmovilización y análisis funcional de proteínas etiquetadas (ver figura 1e) (f) Immobilization and functional analysis of labeled proteins (see figure 1e)

Las células E. coli DH5α se transformaron con uno de los plásmidos GST de longitud completa y con etiqueta de hexahistidina, creados a partir de la metodología arriba mencionada. Una única colonia resistente a la carbenicilina creció en fase logarítmica o exponencial en 10ml de cultivo liquido y a continuación se complementó con 100µM IPTG para provocar la expresión de GST con etiquetad hexahistidina. Tras el crecimiento durante 4 horas más, las células se cosecharon y lisaron mediante congelacióndescongelación/lisozima. SDS-PAGE de lisado crudo mostró una proteína sobreexpresada del tamaño esperado (27kDA), que representó aproximadamente el 20% del total de proteína soluble, así como una pequeña cantidad de la fusión 54 kDa GSThexahistidina-GFP, generada a través de supresión de ámbar. El lisado crudo (500µl; 100µg) se mezcló a continuación con gotas magnéticas Níquel-NTA (50µl; capacidad de enlace 15µg proteína etiquetada con hexahistidina) y las gotas se recuperaron mediante sedimentación bajo un campo magnético. El sobrenadante se descartó y las gotas se lavaron y posteriormente se volvieron a suspender en un búfer de ensayo con glutationa S transferasa que contenía 1 mM respectivamente de glutationa y 1-cloro-2,4dinitrobenceno. En el momento del final del ensayo se recogieron los datos tras 30 minutos a temperatura ambiente midiendo la absorbencia en 340nm; esta longitud de onda corresponde al λmáxdel producto de la reacción catalizada con GST. E. coli DH5α cells were transformed with one of the full length GST plasmids and with hexahistidine tag, created from the above-mentioned methodology. A single carbenicillin-resistant colony grew in a logarithmic or exponential phase in 10ml of liquid culture and was then supplemented with 100µM IPTG to cause GST expression with hexahistidine tagging. After growth for an additional 4 hours, the cells were harvested and lysed by freezing defrosting / lysozyme. SDS-PAGE of crude lysate showed an overexpressed protein of the expected size (27kDA), which represented approximately 20% of the total soluble protein, as well as a small amount of the 54 kDa GSThexahistidine-GFP fusion, generated through amber suppression . The crude lysate (500 µl; 100 µg) was then mixed with magnetic drops Nickel-NTA (50 µl; 15 µg binding capacity protein labeled with hexahistidine) and the drops were recovered by sedimentation under a magnetic field. The supernatant was discarded and the drops were washed and subsequently resuspended in a test buffer with glutathione S transferase containing 1 mM respectively of glutathione and 1-chloro-2,4-dithitrobenzene. At the time of the end of the test, the data was collected after 30 minutes at room temperature by measuring the absorbance at 340 nm; This wavelength corresponds to λmax of the reaction product catalyzed with GST.

Como controles, los cultivos de DH5α que contenía bien el vector matriz (pMM106H) o un plásmido que codifica una proteína con etiqueta His no relacionada (alanina racemasa) fueron cultivados, inducidos, cosechados, lisados y sometidos a ensayo en paralelo. La actividad GST solamente se detectó en las gotas que se habían mezclado con el lisado crudo que contenía GST con etiqueta His, demostrando claramente que la actividad GST observada se debía específicamente al GST con etiqueta His inmovilizado y además que la proteína retenía la actividad sobre la inmovilización específica. As controls, cultures of DH5α that contained either the matrix vector (pMM106H) or a plasmid encoding an unrelated His tag protein (alanine racemase) were cultured, induced, harvested, lysed and tested in parallel. The GST activity was only detected in the drops that had been mixed with the crude lysate containing His tag GST, clearly demonstrating that the observed GST activity was specifically due to the immobilized His tag GST and also that the protein retained the activity on the specific immobilization.

Tras la finalización del ensayo enzimático, la proteína se eluyó de las gotas magnéticas añadiendo búfer que contenía 100mM de imidazola y se analizó con SDS-PAGE. Esto demostró que la muestra que dio como resultado en el ensayo una actividad positiva contenía una única proteína inmovilizada del tamaño exacto que se esperaba para glutationa S transferasa (27kDa), confirmando de este modo que la actividad observada en las gotas se debió solamente a esta proteína recombinante con etiqueta His. Ejemplo 2 After completion of the enzymatic assay, the protein was eluted from the magnetic drops by adding buffer containing 100mM imidazole and analyzed with SDS-PAGE. This showed that the sample that resulted in a positive activity in the assay contained a single immobilized protein of the exact size expected for glutathione S transferase (27kDa), thus confirming that the activity observed in the drops was due solely to this recombinant protein with His tag. Example 2

(a) Modificación, inmovilización, y ensayo de GST usando dos etiquetas diferentes (a) Modification, immobilization, and GST assay using two different labels

Tras el procedimiento descrito en el Ejemplo 1 para modificar glutationa-S-transferasa con etiqueta hexahistidina, hemos demostrado que este procedimiento es independiente de la naturaleza precisas del la etiqueta que se está añadiendo. Following the procedure described in Example 1 to modify glutathione-S-transferase with hexahistidine tag, we have demonstrated that this procedure is independent of the precise nature of the label being added.

En primer lugar, se construyeron dos vectores que fueron idénticos a pMM106H excepto en que el fragmento rellenador de ADNsin sentido Nco I/Hpa I 676bp se sustituyó por un fragmento Nco I/Hpa I 300bp derivado del gen Escherichia coli gdhA y la etiqueta de hexahistidina fue sustituida por el péptido FLAG (una etiqueta de epítope) o la etiqueta Strep II (que se enlaza específicamente y con una elevada afinidad con estreptavidina). Estos vectores se han designado pMM104F y pMM104S, respectivamente. Estos vectores (3µg cada uno) se digirieron por separado hasta su finalización con Nco I y Hpa I y los fragmentos del eje 2870bp se purificaron con gel y se ligaron con los fragmentos GST generados de la oligomezlca A tal y como se describe en el Ejemplo 1. Usando una combinación de anticuerpos anti-FLAG y anti-GST, a lo que siguió la secuenciación, los clones fueron identificados de manera que contenían fusiones perfectas dentro del marco del gen GST de longitud completa con la etiqueta FLAG. De manera similar, usando una combinación de anticuerpos anti-GST y un conjugado de estreptavidina-peroxidasa de rábano que posteriormente se secuenció, se identificaron los clones que contenían fusiones perfectas dentro del marco del gen GST de longitud completa con la etiqueta Strep II. En ambos ejemplos, la frecuencia con la que se encontraron fusiones de longitud completa dentro del marco fue la misma (dentro del error experimental) que la determinada en el Ejemplo I. First, two vectors that were identical to pMM106H were constructed except that the non-sense DNA filler fragment Nco I / Hpa I 676bp was replaced by an Nco I / Hpa I 300bp fragment derived from the Escherichia coli gdhA gene and the hexahistidine tag it was replaced by the FLAG peptide (an epitope tag) or the Strep II tag (which specifically binds and has a high affinity with streptavidin). These vectors have been designated pMM104F and pMM104S, respectively. These vectors (3 µg each) were digested separately until their completion with Nco I and Hpa I and the 2870bp axis fragments were gel purified and ligated with the GST fragments generated from oligomezl A as described in the Example 1. Using a combination of anti-FLAG and anti-GST antibodies, which was followed by sequencing, the clones were identified to contain perfect fusions within the framework of the full-length GST gene labeled FLAG. Similarly, using a combination of anti-GST antibodies and a streptavidin-horseradish peroxidase conjugate that was subsequently sequenced, clones containing perfect fusions were identified within the framework of the full-length GST gene labeled Strep II. In both examples, the frequency with which full length fusions were found within the framework was the same (within the experimental error) as determined in Example I.

Estos clones se usaron en experimentos de inmovilización, esencialmente como se ha descrito en el Ejemplo 1, excepto que los sustratos de inmovilización fueron gotas magnéticas en placas de 96 pozos cubiertas por anticuerpo anti-FLAG y por estreptavidina, respectivamente. Como en el Ejemplo 1, hemos sido capaces de demostrar la inmovilización específica de las proteínas de fusión por medio de estas etiquetas, y además hemos sido capaces de demostrar que la fusión GST conserva su actividad cuando se inmoviliza por medio de la etiqueta FLAG o Strep. Ejemplo 3 These clones were used in immobilization experiments, essentially as described in Example 1, except that the immobilization substrates were magnetic drops in 96-well plates covered by anti-FLAG antibody and streptavidin, respectively. As in Example 1, we were able to demonstrate the specific immobilization of fusion proteins by means of these tags, and we were also able to demonstrate that GST fusion retains its activity when immobilized by means of the FLAG or Strep tag . Example 3

(a) Modificación de una segunda proteína usando la etiqueta de hexahistidina (a) Modification of a second protein using the hexahistidine tag

Siguiendo el procedimiento descrito en el Ejemplo 1 para glutationa-S-transferasa, hemos demostrado que este procedimiento es independiente del gen preciso que se está manipulando. Following the procedure described in Example 1 for glutathione-S-transferase, we have shown that this procedure is independent of the precise gene being manipulated.

Por lo tanto, comenzando con un plásmido que codifica el factor de trascripción humana NF-кB p50 y continuando exactamente con el mismo procedimiento descrito en el Ejemplo 1 (usando oligomezclaA) a menos que se especifique lo contrario, hemos sido capaces de demostrar la modificación de NF-кB p50 de modo que el primer codón de parada dentro del marco haya sido específicamente suprimido y reemplazado por una fusión estructural con ADN que codifica una poliasparagina, etiqueta de hexahistidina. Los Western blots con las colonias que usaron un anticuerpo con etiqueta anti-His permitieron la identificación de clones que expresan proteína etiquetada con hexahistidina. El ADN de estas colonias fue amplificado, purificado y secuenciado. Los datos secuenciales confirmaron que varios clones codificaron perfectas fusiones dentro del marco con NF-кB de longitud completa, es decir, clones en los que el codón de parada ha sido específicamente suprimido y reemplazado por una etiqueta de hexahistidina dentro del marco estructural. La frecuencia con la que se encontraron fusiones de longitud completa dentro del marco en el caso de NF-кB p50 fue 1.1%, que está cerca de, y dentro del error experimental, lo determinado en el Ejemplo 1 para GST. Therefore, starting with a plasmid encoding the human transcription factor NF-кB p50 and continuing with exactly the same procedure described in Example 1 (using oligomix A) unless otherwise specified, we were able to demonstrate the modification of NF-κB p50 so that the first stop codon within the frame has been specifically suppressed and replaced by a structural fusion with DNA encoding a polyasparagine, hexahistidine tag. Western blots with colonies that used an antibody with anti-His tag allowed the identification of clones expressing hexahistidine-tagged protein. The DNA of these colonies was amplified, purified and sequenced. Sequential data confirmed that several clones encoded perfect fusions within the framework with full-length NF-κB, that is, clones in which the stop codon has been specifically suppressed and replaced by a hexahistidine tag within the structural framework. The frequency with which full-length fusions were found within the frame in the case of NF-кB p50 was 1.1%, which is close to, and within the experimental error, what was determined in Example 1 for GST.

(b) InmovilizaciónyanálisisfuncionaldeNF-кB p50 etiquetado con hexahistidina (b) Immobilization and functional analysis of NF-кB p50 labeled with hexahistidine

Las células E. coli DH5α se transformaron con uno de los plásmidos NF-кB de longitud completa y con etiqueta de hexahistidina, creados a partir de la metodología arriba mencionada. Una única colonia resistente a la carbenicilina creció en fase logarítmica o exponencial en 10ml de cultivo liquido y a continuación se complementó con 100µM IPTG para provocar la expresión de NFкB p50 con etiquetad hexahistidina. Tras el crecimiento durante 4 horas más, las células se cosecharon y lisaron mediante sonicación. SDS-PAGE de lisado crudo mostró una proteína sobreexpresada del tamaño esperado (38kDA), que representó aproximadamente el 5% del total de proteína soluble, así como una pequeña cantidad de la fusión 65 kDa NF-кB p50-hexahistidina-GFP, generada a través de supresión de ámbar. E. coli DH5α cells were transformed with one of the full-length NF-κB plasmids and hexahistidine labeled, created from the above-mentioned methodology. A single carbenicillin-resistant colony grew in a logarithmic or exponential phase in 10ml of liquid culture and was then supplemented with 100µM IPTG to cause expression of NFкB p50 with hexahistidine tag. After growth for an additional 4 hours, the cells were harvested and lysed by sonication. SDS-PAGE of crude lysate showed an overexpressed protein of the expected size (38kDA), which represented approximately 5% of the total soluble protein, as well as a small amount of the 65 kDa fusion NF-кB p50-hexahistidine-GFP, generated at Through amber suppression.

imagen3image3

Punto de enlace NF- кB P50 Link point NF- кB P50

Un oligonucleótido dúplex, “motivo кB”, que contiene un punto de enlace palindrómico para NF-кB p50, se etiquetó en las bases 3’ con digoxigenina usando transferasa en terminal 3 bajo condiciones estándares (Boehringer Mannheim). A duplex oligonucleotide, "κB motif", which contains a palindromic binding point for NF-κB50, was labeled in bases 3 ’with digoxigenin using terminal 3 transferase under standard conditions (Boehringer Mannheim).

Los lisados de proteína se prepararon usando el método congelación-descongelación/lisozima en PBS (salina con búfer de fosfato pH 7.5) que contiene 5 mM β-mercaptoetanol. Se aplicaron 200 µl del lisado de proteína soluble de cada clon al micropozo cubierto con Ni-NTA y se incubó a temperatura ambiente durante 45 minutos. Al finalizar el periodo de incubación, los pozos se lavaron tres veces con PBST (PBS que contenía 0.02% Triton X-100) para retirar todas las proteínas no ligadas. Los pozos se lavaron tres veces con búfer que se enlaza con ADN (10 mM Tris.HCl pH 7.4, 75 mM KCl que contenía 5 mM β-mercaptoetanol con un tiempo de remojo de 1 minuto. Se añadió el motivo кB etiquetado con 3’ digoxigenina (2 pmol) a los pozos en 200 µl del búfer que se enlaza con ADN que contiene 1 µg de ADN poli (dI-dC) no específico. Después de otros 30 minutos de incubación, se retiró el ADN no ligado lavando los pozos tres veces con 10 mM Tris.HCl pH 7.4, 25 mM KCl que contenía 0.02% Triton X-100. Un conjugado de fosfatasa alcalina de anticuerpo anti-digoxigenina se diluyó con 150mU/ml en “búfer de dilución de anticuerpo” (10mM Tris.HCl pH 7.4, 25mM cloruro de potasio) complementado con 0.2% albúmina de suero bovino. El anticuerpo diluido (200 µl) se aplicó a continuación a los micropozos. Después de 30 minutos a temperatura ambiente, el anticuerpo no ligado se retiró lavando los micropozos con “bufer de dilución de anticuerpo” (3x350 µl) complementado con 0.02% Triton X-100. A continuación, se añadieron 200µl de un búfer (100mM Tris.HCl pH9.5, 100mM NaCl, 50mM MgCl2) que contenía 250µM fosfato p-nitrofenilo (pNPP), un sustrato de fosfato alcalino se añadieron a los pozos y la reacción se dejó reposar durante la noche a temperatura ambiente, y después la coloración amarilla en cada pozo (correspondiente a la formación de un producto, p-nitrofenol) se cuantificó en 405nm. El índice de fondo de hidrólisis del sustrato pNPP fue bajo de modo que un resultado positivo de ensayo fue claro a partir de la aparición de color amarillo en los pozos. Como controles en este ensayo omitimos el lisado crudo, o el oligonucleótido etiquetado, o el anticuerpo, o añadimos un exceso multiplicado por 20 de oligo dúplex no etiquetado o sustituimos el NF-кB p50 etiquetado con hexahistidina que contenía lisados crudos con cantidades equivalentes de un lisado celular crudo de células DH5α que expresan GST con etiqueta de hexahistidina en el mismo fondo de vector. Protein lysates were prepared using the freeze-thaw / lysozyme method in PBS (phosphate buffer saline pH 7.5) containing 5 mM β-mercaptoethanol. 200 µl of the soluble protein lysate of each clone was applied to the Ni-NTA-coated micro well and incubated at room temperature for 45 minutes. At the end of the incubation period, the wells were washed three times with PBST (PBS containing 0.02% Triton X-100) to remove all unbound proteins. The wells were washed three times with a buffer that binds to DNA (10 mM Tris.HCl pH 7.4, 75 mM KCl containing 5 mM β-mercaptoethanol with a soak time of 1 minute. The кB motif labeled 3 'was added Digoxigenin (2 pmol) to the wells in 200 µl of the buffer that binds to DNA containing 1 µg of non-specific poly (dI-dC) DNA After another 30 minutes of incubation, unbound DNA was removed by washing the wells three times with 10 mM Tris.HCl pH 7.4, 25 mM KCl containing 0.02% Triton X-100. An alkaline phosphatase conjugate of anti-digoxigenin antibody was diluted with 150mU / ml in "antibody dilution buffer" (10mM Tris .HCl pH 7.4, 25mM potassium chloride) supplemented with 0.2% bovine serum albumin The diluted antibody (200 µl) was then applied to the microwells After 30 minutes at room temperature, the unbound antibody was removed by washing the micro wells with "antibody dilution buffer" (3x350 µl) comple Mentioned with 0.02% Triton X-100. Next, 200µl of a buffer (100mM Tris.HCl pH9.5, 100mM NaCl, 50mM MgCl2) containing 250µM p-nitrophenyl phosphate (pNPP), an alkaline phosphate substrate was added they were added to the wells and the reaction was allowed to stand overnight at room temperature, and then the yellow coloration in each well (corresponding to the formation of a product, p-nitrophenol) was quantified at 405 nm. The background rate of hydrolysis of the pNPP substrate was low so that a positive test result was clear from the appearance of yellow in the wells. As controls in this test we omit the crude lysate, or the labeled oligonucleotide, or the antibody, or add an excess multiplied by 20 of unlabeled duplex oligo or replace the NF-кB p50 labeled with hexahistidine containing crude lysates with equivalent amounts of a crude cell lysate of DH5α cells expressing GST with hexahistidine tag on the same vector background.

En este ensayo, NF-кB p50 en primer lugar se enlaza con el oligonucleótido etiquetado por medio del punto de enlace específico. El complejo proteína-ADN se inmoviliza a continuación en los micropozos por medio de la etiqueta hexahistidina y el resto de las proteínas (incluyendo complejos entre el oligo etiquetado y otras proteínas de enlace con ADN presentes en el lisado crudo) junto con otros oligos no ligados y etiquetados se lavan. Debido a que el conjugado de anticuerpo reconoce la etiqueta en el oligo, no la proteína etiquetada con hexahistidina, solamente puede observarse una señal positiva en el ensayo si la interacción NF-кB p50-ADN se mantiene durante la inmovilización de NF-кB p50 por medio de la etiqueta; si esta interacción no se mantiene, el oligo se perderá durante los pasos de lavado y no se observará cambio de color. In this assay, NF-κB p50 first binds to the labeled oligonucleotide through the specific binding point. The protein-DNA complex is then immobilized in the micro wells by means of the hexahistidine tag and the rest of the proteins (including complexes between the labeled oligo and other DNA binding proteins present in the crude lysate) together with other unbound oligos. and tagged wash. Because the antibody conjugate recognizes the label in oligo, not the hexahistidine-labeled protein, a positive signal can only be observed in the assay if the NF-κB p50-DNA interaction is maintained during the immobilization of NF-κB50 by middle of the label; If this interaction is not maintained, the oligo will be lost during the washing steps and no color change will be observed.

Descubrimos que el producto amarillo sólo se detectó en los micropozos que habían contenido el lisado crudo de NF-кB p50 con etiqueta de hexahistidina y el oligonucleótido etiquetado con digoxigenina y al cual el conjugado de fosfatasa alcalina de anticuerpo anti-digoxigenina se había añadido. Esto demostró que el cambio de color observado fue debido específicamente al complejo inmovilizado NF-кB p50-oligonucleótido y además que NF-кB p50 mantuvo la actividad durante la inmovilización específica. We found that the yellow product was only detected in the microwells that had contained the crude lysate of NF-κB p50 with the hexahistidine label and the oligonucleotide labeled with digoxigenin and to which the alkaline phosphatase conjugate of anti-digoxigenin antibody had been added. This showed that the color change observed was specifically due to the immobilized complex NF-κB p50-oligonucleotide and also that NF-κB50 maintained activity during specific immobilization.

Ejemplo 4 Example 4

Un procedimiento alternativo para producir genes de longitud completa o cADNs con el codón de parada eliminado con precisión implica la producción de un conjunto anidad específico de cadena de eliminaciones empotradas en 5’ en un producto PCR que abarca la secuencia codificadora. Potencialmente, esto podría llevarse a cabo usando cualquier exonucleasa 5’-a 3’-como exonucleasa λ, polimerasa I de ADN E. coli, polimerasa ADN Taq, o exonuclesa 6 de gen T7. Una vez que se ha creado el conjunto anidado de eliminaciones empotradas en 5’-, una oligomezcla puede alinearse con las regiones expuestas de la cadena sencilla; esta mezcla de oligos consiste en un conjunto de oligos en el que el complemento de cada codón de parada está representado en el extremo 3’, inmediatamente precedido por 6 residuos arbitrarios y, antes de ello, por una secuencia definida codificadora de un punto de restricción de Tipo IIS y una secuencia complementaria de reconocimiento para el cebador “LMB2” (ver Ejemplo 1). Por lo tanto, la secuencia del conjunto de oligos es la siguiente: An alternative method for producing full-length genes or cDNAs with the stop codon accurately removed involves the production of a specific chain set of 5 ′ embedded deletions in a PCR product that encompasses the coding sequence. Potentially, this could be accomplished using any 5'-a 3'-exonuclease such as λ exonuclease, E. coli DNA polymerase I, Taq DNA polymerase, or T7 gene exonucleus 6. Once the nested set of removals embedded in 5’s has been created, an oligix can be aligned with the exposed regions of the single chain; this mixture of oligos consists of a set of oligos in which the complement of each stop codon is represented at the 3 'end, immediately preceded by 6 arbitrary residues and, before that, by a defined sequence encoding a restriction point Type IIS and a complementary recognition sequence for the "LMB2" primer (see Example 1). Therefore, the sequence of the set of oligos is as follows:

imagen2image2

Un oligo de la mezcla se alineará específicamente cada codón de parada expuesto en la cadena de sentido y servirá como un cebador para la polimerasa de ADN que tiene bien actividad para desplazar la cadena, como polimerasa Taq, o actividad de exonucleasa 5’-o 3’-, como polimerasa I de ADN E. coli. El fragmento dúplex de ADN recién generado puede entonces amplificarse de manera específica usando un cebador que se enlaza con el extremo 5’-del producto PCR original y uno que se enlaza específicamente con el oligo recién alineado y extendido. En este procedimiento, el extremo 3’ del oligo alineado no es necesario para colindar directamente con el residuo empotrado en 5’-de la plantilla dúplex. Los oligos de la mezcla pueden alinearse con una región complementaria sobre la plantilla de ADN expuesta con una única cadena de una manera similar a la preparación arbitraria de hexámeros, pero como hecho importante, la extensión de la cadena solamente ocurrirá en los lugares en los que el extremo 3’ se haya alineado con absoluta complementariedad. Debido a que los extremos 3’ de los oligos en la mezcla están diseñados para ser complementarios con los codones de parada, solamente cuando el extremo 3’-de un oligo se haya unido específicamente con el codón de parada correspondiente tendrán lugar la extensión del cebador y la posterior amplificación PCR. La unión con los codones de parada fuera del marco y aquellos situados bajo el verdadero codón de parada del gen de interés también tendrá lugar, dando como resultado la amplificación PCR de no solamente el gen exacto de longitud completa, sino también de un conjunto de productos truncados y extendidos. Sin embargo, estos productos pueden descartarse fácilmente en sucesivos pasos porque no ocasionarán fusiones estructurales con la etiqueta del péptido. An oligo of the mixture will specifically align each stop codon exposed in the sense chain and serve as a primer for DNA polymerase that has good activity to displace the chain, such as Taq polymerase, or 5'-o 3 exonuclease activity '- as polymerase I from DNA E. coli. The newly generated DNA duplex fragment can then be specifically amplified using a primer that binds to the 5'-end of the original PCR product and one that specifically binds to the newly aligned and extended oligo. In this procedure, the 3 'end of the aligned oligo is not necessary to directly collide with the residue embedded in 5’-of the duplex template. The oligos of the mixture can be aligned with a complementary region on the exposed DNA template with a single chain in a manner similar to the arbitrary preparation of hexamers, but as an important fact, the extension of the chain will only occur in the places where the 3 'end has aligned with absolute complementarity. Because the 3 'ends of the oligos in the mixture are designed to be complementary to the stop codons, only when the 3'-end of an oligo has specifically joined the corresponding stop codon will the extension of the primer take place and subsequent PCR amplification. The union with the stop codons outside the frame and those located under the true stop codon of the gene of interest will also take place, resulting in PCR amplification of not only the exact full length gene, but also a set of products truncated and extended. However, these products can be easily discarded in successive steps because they will not cause structural fusions with the peptide tag.

Realizar el procedimiento de alineamiento y extensión sobre un conjunto anidado de eliminaciones en 5’ tal y como se ha descrito tiene ventajas significativas con respecto a llevar a cabo el procedimiento de alineamiento y extensión sobre una molécula de ADN o ARN con únicamente una cadena que abarca una región completa codificadora. Esto se debe a que el número de puntos con los cuales los cebadores pueden alinearse específicamente antes de la extensión se restringe en gran medida por la presencia de la doble porción de cadena del conjunto anidado de eliminaciones. La porción de cadena sencilla de eliminaciones abarcará principalmente la región no trasladada de 3’-de los genes y tendrá el efecto de influir en gran medida a los productos de extensión a favor de los codones de parada externos a la secuencia codificadora y también a favor de productos más largos de extensión; estos factores actuarán incrementando enormemente la frecuencia en la que el primer codón de parada dentro del marco es específicamente retirado por el procedimiento global. De hecho, hemos intentado alinear y extender los oligos descritos en el paso (b) a continuación usando una plantilla de región codificadora de una sola cadena, y hemos sido capaces de identificar los clones de longitud completa y correctamente modificados a partir del experimento. En comparación, los resultados del experimento descrito en detalle a continuación demuestra claramente que el uso del conjunto anidado de eliminaciones en 5’ como la plantilla para los pasos de alineamiento y extensión es tanto efectivo como eficiente para facilitar la retirada específica del primer codón de parada dentro del marco de la secuencia codificadora para producir fusiones con la etiqueta del polipéptido de longitud completa y dentro del marco. Performing the alignment and extension procedure on a nested set of 5 'deletions as described has significant advantages over carrying out the alignment and extension procedure on a DNA or RNA molecule with only one chain that encompasses a complete coding region. This is because the number of points with which the primers can specifically align before extension is greatly restricted by the presence of the double chain portion of the nested set of eliminations. The single chain portion of deletions will primarily cover the non-translated 3'-region of the genes and will have the effect of greatly influencing extension products in favor of stop codons external to the coding sequence and also in favor of longer extension products; These factors will act greatly increasing the frequency at which the first stop codon within the frame is specifically removed by the overall procedure. In fact, we have tried to align and extend the oligos described in step (b) below using a single chain coding region template, and we have been able to identify the full length and correctly modified clones from the experiment. In comparison, the results of the experiment described in detail below clearly demonstrates that the use of the nested set of 5 'deletions as the template for alignment and extension steps is both effective and efficient to facilitate the specific withdrawal of the first stop codon. within the frame of the coding sequence to produce fusions with the full length polypeptide tag and within the frame.

(a) Amplificación PCR y digestión de exonucleasa de genes antes del etiquetaje (a) PCR amplification and gene exonuclease digestion before labeling

Por lo tanto, en primer lugar realizamos una amplificación PCR inicial de un gen GST exactamente como se ha descrito en el Ejemplo 1, los pasos (a) y (b), excepto que el cebador “STinverso” en la amplificación fuer ahora 5’-fosforalizado. El producto PCR purificado se digirió a continuación con 2.5 unidades de exonucleasa λ (kit de Novagen Strandase) durante 40 minutos a 37ºC en un búfer estándar de reacción (67mM glicina-KOH pH9.4, 2.5mM MgCl2, 50µg/ml albúmina de suero bovino). A continuación, la enzima se desactivó calentándola a 75ºC durante 15 minutos. Debido a que la exonucleasa λ solamente reconoce los grupos de fosfato en 5’ como sustratos, la cadena sentido está protegida de la digestión y el producto de la digestión es por lo tanto un conjunto anidado de eliminaciones del extremo 5’ de la cadena antisentido del producto PCR. Therefore, we first perform an initial PCR amplification of a GST gene exactly as described in Example 1, steps (a) and (b), except that the "STinverse" primer in the amplification is now 5 ' -phosphorized. The purified PCR product was then digested with 2.5 units of λ exonuclease (Novagen Strandase kit) for 40 minutes at 37 ° C in a standard reaction buffer (67mM glycine-KOH pH9.4, 2.5mM MgCl2, 50µg / ml serum albumin bovine). The enzyme was then deactivated by heating it at 75 ° C for 15 minutes. Because the λ exonuclease only recognizes 5 'phosphate groups as substrates, the sense chain is protected from digestion and the digestion product is therefore a nested set of deletions of the 5' end of the antisense chain of the PCR product.

(b) Ligadura específica, extensión y amplificación para introducir la etiqueta (b) Specific binding, extension and amplification to introduce the label

5µl de la mezcla de reacción de exonucleasa λ se diluyeron en búfer de reacción con polimerasa I de ADN de E. coli en presencia de 250µM dNTPs y un exceso molar multiplicado aproximadamente por 25 del siguiente conjunto de oligo degenerado: 5 µl of the λ exonuclease reaction mixture was diluted in reaction buffer with E. coli DNA polymerase I in the presence of 250 µM dNTPs and a molar excess multiplied approximately 25 by the following set of degenerate oligo:

5’-GTA AAA CGA CGG CCA GTC TGG AGG AGG AGA NNN NNN TCA-3’ 5’-GTA AAA CGA CGG CCA GTC TGG AGG AGG AGA NNN NNN TCA-3 ’

Los fragmentos digeridos y los oligos se alinearon durante 30 minutos a 37ºC y, a continuación, 5 unidades de polimerasa I de ADN de E. coli se añadieron y posteriormente la reacción se incubó durante 3 horas a 37ºC. Los productos extendidos se purificaron usando un kit de limpieza de PCR QIAquick (Qiagen) bajo condiciones estándares y se usó como plantilla en una reacción PCR estándar usando polimerasa Pwo con cebadores “STdelantero” y “LMB2”. Se realizaron 30 ciclos de PCR (94ºC, 1 min; 57ºC, 1 min; 72ºC, 2 min) para generar productos PCR que se extendieron hasta 1000bp. The digested fragments and oligos were aligned for 30 minutes at 37 ° C and then 5 units of E. coli DNA polymerase I were added and subsequently the reaction was incubated for 3 hours at 37 ° C. The extended products were purified using a QIAquick PCR cleaning kit (Qiagen) under standard conditions and used as a template in a standard PCR reaction using Pwo polymerase with "STdelantero" and "LMB2" primers. 30 PCR cycles (94 ° C, 1 min; 57 ° C, 1 min; 72 ° C, 2 min) were performed to generate PCR products that ranged up to 1000bp.

Los productos PCR generados a partir del procedimiento arriba descrito se digirieron y clonaron al vector pMM106H tal y como se ha descrito en el paso (e) del Ejemplo 1. Las colonias se obtenidas a partir del proceso de clonación se visualizaron a 365nm para identificar colonias verdes fluorescentes. Se recogieron 73 colonias, se sometieron a la técnica de la réplica en placa y se analizaron por medio de Wester blot de colonias bajo condiciones estándares usando anticuerpos con etiqueta anti-His y anti-GST. El ADN de 15 colonias que fueron positivas con anti-His y anti-GST se amplificó, purificó y secuenció. Los datos secuenciales confirmaron la presencia de 10 fusiones estructurales perfectas con GST de longitud completa, es decir, clones en los que el primer codón de parada dentro del marco del gen original GST ha sido específicamente suprimido y reemplazado por una poliasparagina dentro del marco, etiqueta de hexahistidina. Por lo tanto,el índice de modificación con éxito que obtuvimos por medio de este procedimiento global se cifra en el 39% del número total de colonias verdes fluorescentes. Ejemplo 5 The PCR products generated from the procedure described above were digested and cloned into the vector pMM106H as described in step (e) of Example 1. The colonies obtained from the cloning process were visualized at 365 nm to identify colonies. fluorescent greens 73 colonies were collected, subjected to plaque replication technique and analyzed by means of Wester blot colonies under standard conditions using anti-His and anti-GST labeled antibodies. DNA from 15 colonies that were positive with anti-His and anti-GST was amplified, purified and sequenced. Sequential data confirmed the presence of 10 perfect structural fusions with full-length GST, that is, clones in which the first stop codon within the framework of the original GST gene has been specifically suppressed and replaced by a polyasparagine within the framework, label of hexahistidine. Therefore, the rate of successful modification we obtained through this global procedure is estimated at 39% of the total number of green fluorescent colonies. Example 5

(a) Identificación de una proteína de un pozo de 11 genes (a) Identification of a protein from a well of 11 genes

Hemos aplicado exactamente el mismo proceso que en el Ejemplo 1 excepto en las especificaciones del pozo de 11 genes diferentes listados en la tabla a continuación. Hemos generado selecciones de proteínas resultantes específicamente modificadas de moto que cada posición en la selección corresponda a una única proteína recombinante inmovilizada por medio de la etiqueta agregada como resultado de este procedimiento. A continuación, hemos analizado la selección mediante un ensayo funcional y hemos identificado con éxito componentes individuales proteicos del pozo. We have applied exactly the same process as in Example 1 except in the well specifications of 11 different genes listed in the table below. We have generated selections of specifically modified resulting motorcycle proteins that each position in the selection corresponds to a single recombinant protein immobilized by means of the tag added as a result of this procedure. Next, we have analyzed the selection through a functional assay and have successfully identified individual protein components of the well.

imagen2image2

Inicialmente, los once genes se subclonaron en el mismo eje de vector pTrcHisA ya que, entre otras cosas, este hecho imita la situación en la que se encuentra la biblioteca de ADN. Los cebadores “STdelantero” y “STtrasero” descritos en el Ejemplo 1 se diseñaron para ser cebadores universales para la amplificación de genes codificados en el interior del eje de vector pTrcHisA. Initially, the eleven genes were subcloned in the same pTrcHisA vector axis since, among other things, this fact mimics the situation in which the DNA library is located. The "STdelantero" and "STtrasero" primers described in Example 1 were designed to be universal primers for the amplification of genes encoded within the pTrcHisA vector axis.

El cebador “Stdelantero” se diseñó de tal manera que codificara un número de puntos de restricción tal y como se indica a continuación: The "Stdelantero" primer was designed in such a way as to encode a number of restriction points as indicated below:

imagen2image2

Por lo tanto, cualquiera de las enzimas de restricción Aat II o Sfi I puede usarse para generar salientes en 3’ para fines de protección de exonucleasa. Para fines de clonación direccional al final del proceso de modificación, en este Ejemplo elegimos usar Bsp HI ya que, aunque estadísticamente cortará con más frecuencia en el interior de la biblioteca, genera extremos cohesivos que son compatibles con el punto de clonación de Nco I en el vector con etiqueta pMM106H aquí usado y no corta ninguno de los 11 genes en el pozo presente. Claramente, en principio podría usarse cualquiera de los puntos de restricción codificados del cebador siempre y cuando el vector de etiqueta contenga un lugar de clonación equivalente por debajo del promotor; Sfi I tendría muchas ventajas en este aspecto en un formato más grande de biblioteca porque tiene una secuencia de reconocimiento de 8bp de modo que la frecuencia de incidencia arbitraria de un lugar Sfi I en un gen determinado será mucho más baja (1 en 6.5x104) que para una secuencia de reconocimiento de 6bp como la de Bsp HI (1 en 4.096). Therefore, any of the restriction enzymes Aat II or Sfi I can be used to generate 3 'protrusions for exonuclease protection purposes. For the purposes of directional cloning at the end of the modification process, in this Example we choose to use Bsp HI since, although it will statistically cut more frequently inside the library, it generates cohesive ends that are compatible with the cloning point of Nco I in the vector labeled pMM106H used here and does not cut any of the 11 genes in the present well. Clearly, in principle any of the encoded restriction points of the primer could be used as long as the tag vector contains an equivalent cloning site below the promoter; Sfi I would have many advantages in this regard in a larger library format because it has an 8bp recognition sequence so that the frequency of arbitrary incidence of a Sfi I site in a given gene will be much lower (1 in 6.5x104) than for a 6bp recognition sequence such as Bsp HI (1 in 4,096).

El vector de la etiqueta pMM106H es un vector “ATG”, es decir, el punto de clonación 5’ (Nco I) coincide en parte con el codón de inicio ATG posicionado bajo un punto de unión de ribosoma (RBS) para la expresión de proteínas nativas. Sin embargo, en el procedimiento aquí descrito no dependemos de los genes clonados que tienen un punto de restricción común en sus codones de inicio. En su lugar, simplemente dependemos del promotor codificado por el vector que inicia la transcripción para producir mARN, con las señales necesarias para el inicio translacional que proporcionan los propios genes clonados. Por lo tanto, en este Ejemplo todos los genes en el pozo original tienen un codón de inicio inmediatamente precedido por un RBS, con independencia de la presencia o ausencia de un punto de clonación en ATG. A causa de que el cebador “STdelantero” se enlaza bajo RBS en los once clones iniciales, la posterior clonación post-modificación que usa cualquiera de los puntos de restricción codificados por el cebador introducirá los genes recién modificados en el vector de la etiqueta junto con sus RBS o ATG original de modo que el inicio de la translación estará asegurada. En un formato de biblioteca cADN, se aplica la misma situación en la que todos los cADNs de longitud completa tendrán sus propias regiones 5’ no trasladadas (UTR) que contienen las señales de iniciación translacional eucariótica. Todo esto es necesario para obtener una adecuada iniciación translacional, y en este caso a continuación se clona el cADN modificado junto con sus 5’-UTR a un vector eucariótico lo que produce señales de iniciación translacional una vez más; por lo tanto, puede usarse un conjunto universal de cebadores PCR equivalentes a los que se usan en este Ejemplo. The vector of the pMM106H tag is an "ATG" vector, that is, the 5 'cloning point (Nco I) partly coincides with the ATG start codon positioned under a ribosome binding point (RBS) for the expression of native proteins However, in the procedure described here we do not depend on cloned genes that have a common restriction point in their start codons. Instead, we simply depend on the promoter encoded by the vector that initiates transcription to produce mRNA, with the signals necessary for translational initiation provided by the cloned genes themselves. Therefore, in this Example all genes in the original well have a start codon immediately preceded by an RBS, regardless of the presence or absence of an ATG cloning point. Because the "STdelantero" primer is linked under RBS in the initial eleven clones, subsequent post-modification cloning using any of the restriction points encoded by the primer will introduce the newly modified genes into the tag vector along with your original RBS or ATG so that the start of the translation will be assured. In a cDNA library format, the same situation applies in which all full-length cDNAs will have their own 5 ’non-translated regions (UTRs) that contain eukaryotic translational initiation signals. All this is necessary to obtain an adequate translational initiation, and in this case the modified cDNA is then cloned together with its 5’-UTR to a eukaryotic vector which produces signals of translational initiation once again; therefore, a universal set of PCR primers equivalent to those used in this Example can be used.

El proceso de modificación se llevó a cabo tal y como se describe en el Ejemplo 1 con las siguientes modificaciones. Se uso un pozo equimolar de onces genes como plantilla para la amplificación PCR inicial usando cebadores “STdelantero” y “STtrasero”, y posteriormente los fragmentos se digirieron con Sfi para proteger el extremo 5’ ya que esta encima tiene una secuencia de reconocimiento de 8bp y no corta ninguno de los 11 genes. La oligomezclaA (ver Ejemplo 1) se usó en el paso de alineamiento. Tras la segunda amplificación PCR, los fragmentos modificados se dividieron en 2 fondos que se digirieron por separado con Bpm Iy Sap I. Estadísticamente, una pequeña fracción de genes en las bibliotecas contendrá bien un punto Sap I (secuencia de reconocimiento de 7bp; probabilidad de incidencia arbitraria = 1 en 16.384) o un punto Bpm I (secuencia de reconocimiento de 6bp; probabilidad de incidencia arbitraria = 1 en 4.096) pero solamente una fracción muy pequeña contendrá los dos (probabilidad de incidencia arbitraria = 1 en 6.7x107). Por lo tanto, las dos enzimas de restricción del Tipo II se usaron por separado para asegurar de manera efectiva que la modificación específica de todos los genes de longitud completa no se excluyera por la presencia de uno u otro punto de restricción dentro del gen. The modification process was carried out as described in Example 1 with the following modifications. An equimolar well of eleven genes was used as a template for the initial PCR amplification using "STdelantero" and "STtrasero" primers, and subsequently the fragments were digested with Sfi to protect the 5 'end since it has an 8bp recognition sequence and does not cut any of the 11 genes. The oligonucleotide (see Example 1) was used in the alignment step. After the second PCR amplification, the modified fragments were divided into 2 backgrounds that were digested separately with Bpm I and Sap I. Statistically, a small fraction of genes in the libraries will contain either a Sap I point (7bp recognition sequence; probability of arbitrary incidence = 1 in 16,384) or a Bpm I point (6bp recognition sequence; probability of arbitrary incidence = 1 in 4,096) but only a very small fraction will contain both (probability of arbitrary incidence = 1 in 6.7x107). Therefore, the two Type II restriction enzymes were used separately to effectively ensure that the specific modification of all full-length genes was not excluded by the presence of one or another restriction point within the gene.

Los fragmentos digeridos de los dos pozos se unieron para el tratamiento con nucleasa de frijol mungo y la digestión con Bsp HI. Los fragmentos resultantes se purificaron con gel en 4 rangos de tamaño diferentes y se ligaron por separado al vector pMM106H (se digirieron hasta su finalización con Nco I y Hpa I se purificaron con gel) con el fin de evitar una ligadura preferencial de inserciones más pequeñas. Las células transformadas se visualizaron bajo luz UV (365 nm) y las colonias verdes fluorescentes se seleccionaron de manera visual para someterlas a análisis Western blot. The digested fragments of the two wells were joined for treatment with mung bean nuclease and digestion with Bsp HI. The resulting fragments were gel purified in 4 different size ranges and ligated separately to the pMM106H vector (digested to completion with Nco I and Hpa I gel purified) in order to avoid a preferential ligation of smaller inserts . The transformed cells were visualized under UV light (365 nm) and the green fluorescent colonies were visually selected for Western blot analysis.

Aproximadamente el 30% del número total de las colonias transformadas fueron verde fluorescentes y, de ella, el 73% expresaron proteínas que son reconocidas por anticuerpos con etiqueta anti-His. 190 colonias verdes y His positivas fueron inoculadas en 1.5 ml de medio líquido en bloques con 96 pozos profundos y crecieron durante la noche. Las células se recogieron mediante centrifugación y se lisaron mediante congelacióndescongelación/lisozima. A continuación, los lisados crudos se aplicaron a pozos individuales de una placa con 96 pozos cubierta de Níquel-NTA y las proteínas no ligadas se retiraron mediante lavado, dejando las proteínas recombinantes con etiqueta His inmovilizadas en los pozos. Posteriormente, las proteínas inmovilizadas se sometieron a ensayo para actividades NF-кB usando el ensayo descrito en el Ejemplo 2 y los pozos que contenían “hits” positivos fueron identificados por la aparición de coloración amarilla. Tres clones mostraron actividad positiva de enlace de ADN “кB-motivo”. Una caracterización adicional de los clones positivos mostró que uno codificó fusiones dentro del marco, de longitud completa y precisas del gen p50 NF-кB con la etiqueta de hexahistidina tal como se esperaba. Se descubrió que los otros dos clones codifican proteínas de enlace de ADN relacionadas que son conocidas por compartir la misma especificidad de ADN que p-50 NF-кB, aunque con menores afinidades de enlace. Approximately 30% of the total number of transformed colonies were fluorescent green and, of that, 73% expressed proteins that are recognized by antibodies with anti-His tag. 190 green and His positive colonies were inoculated in 1.5 ml of liquid medium in blocks with 96 deep wells and grew overnight. The cells were collected by centrifugation and lysed by freezing defrosting / lysozyme. Then, the crude lysates were applied to individual wells of a 96-well plate coated with Nickel-NTA and unbound proteins were removed by washing, leaving the His-tagged recombinant proteins immobilized in the wells. Subsequently, immobilized proteins were tested for NF-κB activities using the assay described in Example 2 and wells containing positive “hits” were identified by the appearance of yellowing. Three clones showed positive "κB-motif" DNA binding activity. An additional characterization of the positive clones showed that one encoded full-length and precise fusions within the p50 NF-κB gene with the hexahistidine tag as expected. It was found that the other two clones encode related DNA binding proteins that are known to share the same DNA specificity as p-50 NF-κB, although with lower binding affinities.

Por consiguiente, este resultado demuestra que la interrogación funcional de las selecciones generadas mediante este procedimiento puede identificar tanto interacciones específicas como interacciones más débiles que son sin embargo específicas y biológicamente relevantes. Como consecuencia, hemos usado este procedimiento para crear selecciones de proteínas funcionales en un formato de micropozo y, usando estas selecciones, hemos identificado con éxito proteínas individuales a partir de un pequeño subconjunto en base a una interacción específica proteína-ligando. Therefore, this result demonstrates that the functional interrogation of the selections generated by this procedure can identify both specific interactions and weaker interactions that are however specific and biologically relevant. As a consequence, we have used this procedure to create functional protein selections in a micro-well format and, using these selections, we have successfully identified individual proteins from a small subset based on a specific protein-ligand interaction.

Claims (1)

REIVINDICACIONES 1ª. – Un método para generar una selección de proteínas que consiste en: 1st. - A method to generate a protein selection consisting of: (a)proporcionar un conjunto de moléculas de ADN codificadoras de proteínas que se etiquetan bien en la terminal N o C con una porción de molécula marcadora; (a) providing a set of protein-encoding DNA molecules that are well labeled at the N or C terminal with a portion of the marker molecule; (b)expresar las proteínas individuales etiquetadas en un formato especialmente separado; (b) express the labeled individual proteins in a specially separated format; (c)purificar e inmovilizar cada proteína etiquetada en un formato espacialmente definido para producir una selección de proteínas sobre un soporte sólido, y de este modo las interacciones específicas entre la etiqueta y el soporte sólido se usan tanto en la purificación como en la inmovilización. (c) purify and immobilize each labeled protein in a spatially defined format to produce a selection of proteins on a solid support, and thus the specific interactions between the label and the solid support are used both in purification and in immobilization. 2ª.-El método de la reivindicación 1, donde la porción de molécula marcadora es una secuencia de péptido seleccionada del grupo consistente en: 2nd.- The method of claim 1, wherein the marker molecule portion is a peptide sequence selected from the group consisting of: (a)una etiqueta hexa-histidina; (b)una proteína completa o dominio de proteína; (a) a hexa-histidine tag; (b) a complete protein or protein domain; (c)un epítope de anticuerpo; (d)un imitador de biotina; y (e)dominio de proteína que se enlaza con maltosa. 3ª.-El método de las reivindicaciones previas, donde la porción (c) an antibody epitope; (d) a biotin mimic; Y (e) protein domain that binds with maltose. 3.- The method of the previous claims, wherein the portion de molécula marcadora se modifica post-translacionalmente. 4ª.-El método de la reivindicación 3, done la modificación posttranslacional incluye la adición de una biotina o molécula lípida. The marker molecule is modified post-translationally. 4th.- The method of claim 3, where the posttranslational modification is done includes the addition of a biotin or lipid molecule. 5ª. – El método de las reivindicaciones anteriores, donde las proteínas etiquetadas se pliegan correctamente para mantener la función. 5th. - The method of the preceding claims, wherein the labeled proteins are correctly folded to maintain function. 6ª.-El método de las reivindicaciones previas, donde las proteínas etiquetadas tienen longitud completa. 6th.- The method of the previous claims, wherein the labeled proteins have full length. 7ª. – El método de cualquiera de las reivindicaciones previas, donde las moléculas cADN que codifican proteínas etiquetadas se producen mediante un método que consiste en la inserción de una secuencia adicional y conocida de ADN que codifica la porción de molécula marcadora bien inmediatamente tras un codón de parada o 7th. - The method of any of the previous claims, wherein the cDNA molecules encoding labeled proteins are produced by a method consisting of the insertion of an additional and known sequence of DNA encoding the portion of the marker molecule either immediately after a stop codon. or bien inmediatamente antes de un codón de parada presente en dichas moléculas de ADN que consiste en los siguientes pasos: (a)generar un conjunto de eliminaciones anidadas a partir de dichas moléculas de ADN; (b)alinear y ligar con el conjunto de eliminaciones anidadas un primer y un segundo conjunto de oligonucleótidos; en los que either immediately before a stop codon present in said DNA molecules consisting of the following steps: (a) generate a set of nested deletions from said DNA molecules; (b) align and link with the set of nested deletions a first and a second set of oligonucleotides; in which
(i) (i)
la secuencia o secuencia complementaria de uno o más de los tres posibles codones de parada está representado en la mezcla del primer conjunto de oligonucleótidos, y the sequence or complementary sequence of one or more of the three possible stop codons is represented in the mixture of the first set of oligonucleotides, and
(ii) (ii)
la secuencia o secuencia complementaria de uno o más de los tres principales codones de parada está representado en la mezcla del segundo conjunto de oligonucleótidos the sequence or complementary sequence of one or more of the three main stop codons is represented in the mixture of the second set of oligonucleotides
(c)amplificar de manera específica los productos ligados mediante una reacción de extensión con cebador utilizando un cebador de oligonucleótido elegido por ser complementario con el primer y segundo conjunto de oligonucleótidos. (c) specifically amplifying bound products by a primer extension reaction using an oligonucleotide primer chosen to be complementary to the first and second set of oligonucleotides. 8ª. – El método de cualquiera de las reivindicaciones 1 a 6, que además comprende los pasos de poner en contacto uno más compuestos de la prueba con la selección de proteínas y medir el enlace de uno o más compuestos con las proteínas en la selección, cribando de este modo uno o más compuestos para actividad biológica. 8th. - The method of any one of claims 1 to 6, further comprising the steps of contacting one more test compounds with the protein selection and measuring the bond of one or more compounds with the proteins in the selection, screening thus one or more compounds for biological activity. 9ª. – El método de cualquiera de las reivindicaciones 1 a 6, que además comprende el paso de poner en contacto una o más proteínas, p. ej. Un receptor de superficie celular, con la selección de proteínas y medir el enlace de una o más proteínas específicas con las proteínas de la selección, cribando de este modo una o más proteínas para interacción específicas proteína-proteína. 9th. - The method of any one of claims 1 to 6, further comprising the step of contacting one or more proteins, e.g. ex. A cell surface receptor, with protein selection and measuring the linkage of one or more specific proteins with the selection proteins, thereby screening one or more proteins for specific protein-protein interaction. 10ª. – El método de cualquiera de las reivindicaciones 1 a 6, que además comprende el paso de poner en contacto sondas ácidas con la selección de proteínas, y medir el enlace de las sondas con las proteínas, cribando de este modo una o más proteínas para interacciones específicas proteína-ácido nucleico. 10th. - The method of any of claims 1 to 6, further comprising the step of contacting acidic probes with protein selection, and measuring the linkage of the probes with the proteins, thereby screening one or more proteins for interactions specific protein-nucleic acid. 11ª.-El método de cualquiera de las reivindicaciones 1 a 6, que además comprende el paso de poner en contacto la selección de proteínas con una biblioteca de anticuerpos, de modo que una o más proteínas en la selección de proteínas está ligada con al menos un 11th.- The method of any one of claims 1 to 6, further comprising the step of contacting the protein selection with an antibody library, so that one or more proteins in the protein selection is linked with at least a 5 anticuerpo de la biblioteca de anticuerpos, retirando aquellos anticuerpos que no estén ligados, e inmovilizar aquellos anticuerpos ligados a las proteínas en la selección de proteínas, produciendo de este modo una selección de anticuerpos. 5 antibody from the antibody library, removing those antibodies that are not bound, and immobilizing those antibodies linked to the proteins in the protein selection, thereby producing a selection of antibodies.
ES01902520T 2000-01-31 2001-01-31 METHODS OF GENERATING PROTEIN EXPRESSION MATRICES AND THE USE OF THE SAME IN QUICK DETECTION. Expired - Lifetime ES2349573T3 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB0002215 2000-01-31
GB0002215A GB0002215D0 (en) 2000-01-31 2000-01-31 Method
US196490P 2000-04-12
GB0019888 2000-08-11

Publications (1)

Publication Number Publication Date
ES2349573T3 true ES2349573T3 (en) 2011-01-05

Family

ID=9884689

Family Applications (1)

Application Number Title Priority Date Filing Date
ES01902520T Expired - Lifetime ES2349573T3 (en) 2000-01-31 2001-01-31 METHODS OF GENERATING PROTEIN EXPRESSION MATRICES AND THE USE OF THE SAME IN QUICK DETECTION.

Country Status (2)

Country Link
ES (1) ES2349573T3 (en)
GB (1) GB0002215D0 (en)

Also Published As

Publication number Publication date
GB0002215D0 (en) 2000-03-22

Similar Documents

Publication Publication Date Title
ES2373110T3 (en) SELECTION OF PROTEINS USING ARN-PROTEIN FUSIONS.
AU773236B2 (en) Selection of proteins using RNA-protein fusions
US8207093B2 (en) Selection of proteins using RNA-protein fusions
US20060024791A1 (en) Method
EP1203238B1 (en) Methods of generating protein expression arrays and the use thereof in rapid screening
US7816098B2 (en) Methods of making and using a protein array
ES2349573T3 (en) METHODS OF GENERATING PROTEIN EXPRESSION MATRICES AND THE USE OF THE SAME IN QUICK DETECTION.
US20020108130A1 (en) Extracellular drug-oligonucleotides chimeric molecules
US20040253578A1 (en) Dynamic action reference tools
AU2001279948A1 (en) Rapid profiling of the interactions between a chemical entity and proteins in a given proteome
JP4730804B2 (en) Method
US20240044909A1 (en) Determination of protein information by recoding amino acid polymers into dna polymers
Gold et al. Engineering AKAP-selective regulatory subunits of PKA through structure-based phage selection
US20030091999A1 (en) Compositions and methods for identifying polypeptides and nucleic acid molecules
CA2462732A1 (en) Target assisted iterative screening (tais) : a novel screening format for large molecular repertoires