DE69532127T2

DE69532127T2 - Interaktions-fullensysteme zum nachweis von protein-interaktionen

Info

Publication number: DE69532127T2
Application number: DE69532127T
Authority: DE
Inventors: Roger Brent; M. John MCCOY; H. Timm JESSEN; Wilson Chanxing XU
Original assignee: General Hospital Corp; Genetics Institute LLC
Current assignee: General Hospital Corp; Genetics Institute LLC
Priority date: 1994-07-20
Filing date: 1995-07-20
Publication date: 2004-08-26
Anticipated expiration: 2015-07-21
Also published as: EP0773952A4; JPH10504713A; DE69532127D1; WO1996002561A1; EP1405911A1; US6004746A; ES2210306T3; DK0773952T3; US20090130676A1; US6242183B1; EP0773952A1; EP0773952B1; JP4064452B2; HK1012006A1; ATE254136T1

Description

Hintergrund der Erfindung
Die Erfindung bezieht sich auf Verfahren zum Detektieren von Protein-Interaktionen und zum Isolieren neuer Proteine.
Zusammenfassung der Erfindung
Im Allgemeinen zeichnet sich die Erfindung durch Verfahren zum Detektieren von Interaktionen zwischen Proteinen aus.
Dementsprechend zeichnet sich die Erfindung in einem Aspekt durch ein Verfahren aus zum Bestimmen, ob ein erstes Protein in der Lage ist, mit einem zweiten Protein physisch zu interagieren. Das Verfahren beinhaltet (a) Bereitstellen einer Wirtszelle, enthaltend (i) ein Reportergen, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (ii) ein erstes Fusionsgen, das ein erstes Fusionsprotein exprimiert, wobei das erste Fusionsprotein das erste Protein kovalent gebunden an einen Bindungsanteil umfasst, welcher in der Lage ist, spezifisch an die DNA-Bindungsprotein-Erkennungsstelle zu binden; und (iii) ein zweites Fusionsgen, das ein zweites Fusionsprotein exprimiert, wobei das zweite Fusionsprotein das zweite Protein und einen Genaktivierungsanteil umfasst, wobei das zweite Protein konformationell versteift ist, entweder

– durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder
– durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins,

Vorzugsweise ist das zweite Protein ein kurzes Peptid von mindestens 6 Aminosäuren Länge und es ist von weniger oder gleich 60 Aminosäuren Länge; es schließt eine zufallsgenerierte oder bewusst gestaltete Peptidsequenz ein; oder es ist konformationell versteift als Ergebnis kovalenten Bindens an ein konformationsversteifendes Protein, z. B. Thioredoxin oder ein Thioredoxin-ähnliches Molekül. Wenn das zweite Protein kovalent an ein konformationell versteifendes Protein gebunden ist, weist die Erfindung ein Polypeptid auf, wobei das zweite Protein in das konformationsversteifende Protein, an das Polypeptid auf, wobei das zweite Protein in das konformationsversteifende Protein, an das es kovalent gebunden ist, eingebettet ist. Wenn das konformationsversteifende Protein Thioredoxin ist, weist die Erfindung auch ein zusätzliches Verfahren auf, welches ein zweites Protein einschließt, das konformationell über Disulfidbrücken zwischen Cystein-Resten im Amino-Terminus und im Carboxy-Terminus des zweiten Proteins konformationell versteift ist.
In einem anderen Aspekt weist die Erfindung ein Verfahren zum Finden eines interagierenden Proteins in einer Population von Proteinen auf, welches umfasst: (a) Bereitstellen einer Wirtszelle, welche (i) ein Reportergen enthält, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; und (ii) ein Fusionsgen enthält, welches ein Fusionsprotein exprimiert, wobei das Fusionsprotein ein Testprotein enthält, das kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage ist, spezifisch an die DNA-Bindungsprotein-Erkennungsstelle zu binden; (b) Einführen eines zweiten Fusionsgens, welches ein zweites Fusionsprotein exprimiert, in die Wirtszelle, wobei das zweite Fusionsprotein ein Protein aus besagter Population von Proteinen und einen Genaktivierungsanteil einschließt, wobei das besagte eine Protein aus besagter Population von Proteinen konformationell versteift ist, entweder

– durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder
– durch Verknüpfen der Amino- und Carboxy-Termini des besagten einen Proteins aus besagter Population von Proteinen;

Die Erfindung weist auch ein Verfahren zum Finden eines interagierenden Proteins in einer Population auf, wobei die Population von Proteinen eine Kollektion von zufallsgenerierten oder bewusst gestalteten Peptid-Sequenzen ist, oder wobei die Population von Proteinen durch kovalentes Binden an ein konformationsversteifendes Protein konformationell versteift ist. Wenn die Population von Proteinen durch kovalentes Binden an ein konformationsversteifendes Protein konformationell versteift ist, ist die Population von Proteinen vorzugsweise in das konformationsversteifende Protein eingebettet. Die Erfindung weist ferner ein Verfahren zum Finden eines interagierenden Proteins in einer Population auf, wobei das konformationsversteifende Protein Thioredoxin ist.
Vorzugsweise ist die Population von Proteinen in die Schleife des aktiven Zentrums des Thioredoxins eingefügt.
Die Erfindung weist ferner ein Verfahren auf, wobei jedes aus der Population von Proteinen über Disulfid-Brücken zwischen Cysteinresten im Amino-Terminus und im Carboxy-Terminus des besagten Proteins versteift ist.
In bevorzugten Ausführungsformen von verschiedenen Aspekten ist die Wirtszelle Hefe; die DNA-Bindedomäne ist LexA; und/oder das Reportergen wird über eine Farbreaktion oder über die Zell-Lebensfähigkeit nachgewiesen. In anderen Ausführungsformen kann der Köder Cdk2 oder eine Ras-Proteinsequenz sein. In einem anderen verwandten Aspekt weist die Erfindung ein Verfahren zum Identifizieren eines Kandidaten für ein Interagens auf. Das Verfahren umfasst (a) Bereitstellen eines Reportergens, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b) Bereitstellen eines ersten Fusionsproteins, welches ein erstes Protein einschließt, das kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage ist, spezifisch an die DNA-Bindungsprotein-Erkennungsstelle zu binden; (c) Bereitstellen eines zweiten Fusionsproteins, welches ein zweites Protein und einen Genaktivierungsanteil einschließt, wobei das besagte zweite Protein konformationell versteift ist, entweder

– durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder
– durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins, wobei das zweite Protein in der Lage ist, mit dem besagten ersten Protein zu interagieren;

Die Erfindung weist ein Verfahren zum Identifizieren eines Kandidaten für ein Interagens auf, wobei das erste Fusionsprotein durch Bereitstellen eines ersten Fusionsgens bereitgestellt wird, welches das erste Fusionsprotein exprimiert, und wobei das zweite Fusionsprotein durch Bereitstellen eines zweiten Fusionsgens bereitgestellt wird, welches das besagte zweite Fusionsprotein exprimiert.
(Alternativ sind das Reportergen, das erste Fusionsgen und das zweite Fusionsgen auf einem einzigen Stück DNA eingeschlossen.)
Die Erfindung weist auch ein Verfahren zum Identifizieren eines Kandidaten für ein Interagens auf, wobei das erste Fusionsprotein und das zweite Fusionsprotein vor Kontakt mit besagtem Kandidaten für ein Interagens interagieren dürfen, und ein verwandtes Verfahren, wobei das erste Fusionsprotein und der Kandidat für ein Interagens vor Kontakt mit besagtem zweiten Fusionsprotein interagieren dürfen.
In einer bevorzugten Ausführungsform ist der Kandidat für ein Interagens konformationell versteift, entweder durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder durch Verknüpfen seiner Amino- und Carboxy-Termini. Wenn der Kandidat für ein Interagens ein Antagonist ist, ist die Expression des Reportergens reduziert. Wenn der Kandidat für ein Interagens ein Agonist ist, ist die Reportergen-Expression erhöht. Der Kandidat für ein Interagens ist ein Mitglied, welches aus der Gruppe bestehend aus Proteinen, Polynukleotiden, und kleinen Molekülen ausgewählt ist. Zusätzlich kann der Kandidat für ein Interagens durch ein Mitglied einer cDNA- oder einer synthetischen DNA-Bibliothek kodiert sein. Darüber hinaus kann der Kandidat für ein Interagens eine mutierte Form des besagten ersten Fusionsproteins oder des besagten zweiten Fusionsproteins sein.
In einem verwandten Aspekt weist die Erfindung eine Population von eukaryotischen Zellen auf, wobei jede Zelle ein rekombinantes DNA-Molekül enthält, das ein intrazelluläres Peptid kodiert, welches konformationell versteift ist, entweder

– durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder
– durch Verknüpfen der Amino- und Carboxy-Termini des Peptids, wobei zumindest 100 unterschiedliche rekombinante Moleküle, die für unterschiedliche intrazelluläre, konformationell versteifte Peptide kodieren, in besagter Population vorhanden sind, wobei jedes Molekül in zumindest einer Zelle der besagten Population vorhanden ist.

Vorzugsweise sind die intrazellulären Peptide in der Population von Zellen konformationell versteift, da sie kovalent an ein konformationsversteifendes Protein gebunden sind.
In bevorzugten Ausführungsformen ist das intrazelluläre Peptid in das konformationsversteifende Protein, vorzugsweise Thioredoxin, eingebettet; das intrazelluläre Peptid ist konformationell über Disulfidbrücken zwischen Cystein-Resten im Amino-Terminus und im Carboxy-Terminus des besagten zweiten Proteins versteift; die Population der eukaryotischen Zellen sind Hefezellen; das rekombinante DNA-Molekül kodiert ferner für einen Genaktivierungsanteil, der kovalent an das besagte intrazelluläre Peptid gebunden ist; und/oder das intrazelluläre Peptid interagiert physisch mit einem zweiten rekombinanten Protein innerhalb der besagten eukaryotischen Zellen.
In einem anderen Aspekt weist die Erfindung ein Verfahren zum Nachweisen einer Interaktion zwischen einem ersten Protein und einem zweiten Protein auf. Das Verfahren beinhaltet: (a) Bereitstellen eines Reportergens, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b) Bereitstellen eines ersten Fusionsproteins, das ein erstes Protein einschließt, welches kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage ist spezifisch an die DNA-Bindungsprotein-Erkennungsstelle zu binden; (c) Bereitstellen eines zweiten Fusionsproteins, das ein zweites Protein und einen Genaktivierungsanteil einschließt, wobei das besagte zweite Protein konformationell versteift ist, entweder

– durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder
– durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins;

Die Erfindung weist ferner ein Verfahren zum Nachweisen der Interaktion zwischen zwei Proteinen auf, wobei das erste Fusionsprotein durch Bereitstellen eines ersten Fusionsgens bereitgestellt wird, welches das erste Fusionsprotein exprimiert und wobei das zweite Fusionsprotein durch Bereitstellen eines zweiten Fusionsgens bereitgestellt wird, welches das zweite Fusionsprotein exprimiert.
Die Erfindung bezieht sich ferner auf ein Verfahren zum Isolieren eines Proteins, umfassend:

(a) Bereitstellen einer Wirtszelle, enthaltend:
(i) ein Reportergen, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; und (ii) ein Fusionsgen, welches ein Fusionsprotein exprimiert, wobei das besagte Fusionsprotein ein Testprotein umfasst, das kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage ist, spezifisch an die besagte DNA-Bindungsprotein-Erkennungsstelle zu binden;
(b) Einführen eines zweiten Fusionsgens in die besagte Wirtszelle, welches ein zweites Fusionsprotein exprimiert, wobei das besagte zweite Fusionsprotein umfasst: ein Protein aus einer Population von Proteinen und einen Genaktivierungsanteil, wobei das besagte eine Protein aus besagter Population von Proteinen konformationell versteift ist, entweder
– durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder
– durch Verknüpfen der Amino- und Carboxy-Termini des besagten einen Proteins aus besagter Population von Proteinen,
(c) Messen der Expression des besagten Reportergens, und (d) Isolieren eines Proteins aufgrund seiner Fähigkeit, die Expression des besagten Reportergens zu verändern, wenn es in besagtem zweitem Fusionsprotein vorhanden ist.

Die Erfindung bezieht sich ferner auf ein Verfahren zum Isolieren eines interagierenden Proteins, umfassend: (a) Bereitstellen eines Reportergens, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b) Bereitstellen eines ersten Fusionsproteins, wobei das besagte erste Fusionsprotein ein erstes Protein umfasst, das kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage ist, spezifisch an besagte DNA-Bindungsprotein-Erkennungsstelle zu binden; (c) Bereitstellen eines zweiten Fusionsproteins, wobei das besagte zweite Fusionsprotein ein zweites Protein und einen Genaktivierungsanteil umfasst, wobei das besagte zweite Protein konformationell versteift ist, entweder

– durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder
– durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins, wobei das besagte zweite Protein in der Lage ist, mit besagtem ersten Protein zu interagieren;

In noch einem anderen Aspekt weist die Erfindung ein Protein auf, das die Sequenz Leu-Val-Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe (SEQ ID NO: 1) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Met-Val-Val-Ala-Ala-Glu-Ala-Val-Arg-Thr-Val-Leu-Leu-Ala-Asp-Gly-Gly-Asp-Val-Thr (SEQ ID NO: 2) einschließt; vorzugsweise konformationell versteift; ein Protein, das die Sequenz Pro-Asn-Trp-Pro-His-Gln-Leu-Arg-Val-Gly-Arg-Val-Leu-Trp-Glu-Arg-Leu-Ser-Phe-Glu (SEQ ID NO: 3) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Ser-Val-Arg-Met-Arg-Tyr-Gly-Ile-Asp-Ala-Phe-Phe-Asp-Leu-Gly-Gly-Leu-Leu-His-Gly (SEQ ID NO: 9) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Glu-Leu-Arg-His-Arg-Leu-Gly-Arg-Ala-Leu-Ser-Glu-Asp-Met-Val-Arg-Gly-Leu-Ala-Trp-Gly-Pro-Thr-Ser-His-Cys-Ala-Thr-Val-Pro-Gly-Thr-Ser-Asp-Leu-Trp-Arg-Val-Ile-Arg-Phe-Leu (SEQ ID NO: 10) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Tyr-Ser-Phe-Val-His-His-Gly-Phe-Phe-Asn-Phe-Arg-Val-Ser-Trp-Arg-Glu-Met-Leu-Ala (SEQ ID NO: 11) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Gln-Val-Trp-Ser-Leu-Trp-Ala-Leu-Gly-Trp-Arg-Trp-Leu-Arg-Arg-Tyr-Gly-Trp-Asn-Met (SEQ ID NO: 12) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Trp-Arg-Arg-Met-Glu-Leu-Asp-Ala-Glu-Ile-Arg-Trp-Val-Lys-Pro-Ile-Ser-Pro-Leu-Glu (SEQ ID NO: 13) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Trp-Ala-Glu-Trp-Cys-Gly-Pro-Val-Cys-Ala-His-Gly-Ser-Arg-Ser-Leu-Thr-Leu-Leu-Thr-Lys-Tyr-His-Val-Ser-Phe-Leu-Gly-Pro-Cys-Lys-Met-Ile-Ala-Pro-Ile-Leu-Asp (SEQ ID NO: 17) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Leu-Val-Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe (SEQ ID NO: 18) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Tyr-Arg-Trp-Gln-Gln-Gly-Val-Val-Pro-Ser-Asn-Trp-Ala-Ser-Cys-Ser-Phe-Arg-Cys-Gly (SEQ ID NO: 19) einschließt, vorzugsweise konformationell versteift; ein Protein, das die Sequenz Ser-Ser-Phe-Ser-Leu-Trp-Leu-Leu-Met-Val-Lys-Ser-Ile-Lys-Arg-Ala-Ala-Trp-Glu-Leu-Gly-Pro-Ser-Ser-Ala-Trp-Asn-Thr-Ser-Gly-Trp-Ala-Ser-Leu-Ala-Asp-Phe-Tyr (SEQ ID NO: 20) einschließt, vorzugsweise konformationell versteift; und im Wesentlichen reine DNA, die für die unmittelbar vorangehenden Proteine kodiert.
Die Erfindung schließt ferner neue Proteine und andere Kandidaten für Interaktoren ein, die mit den vorangehenden Methoden identifiziert wurden. Es wird verständlich sein, dass diese Proteine und die Kandidaten für Interaktoren die Reportergenaktivität entweder erhöhen oder erniedrigen können und dass diese Veränderungen mit Testverfahren gemessen werden können, die hier beschrieben oder im Stand der Technik bekannt sind.
Im hier verwendeten Sinne ist mit „Reportergen" ein Gen gemeint, dessen Expression nachgewiesen werden kann; solche Gene schließen ein, ohne darauf beschränkt zu sein, lacZ, Aminosäure-biosynthetische Gene, z. B. die Hefegene LEU2, HIS3, LYS2, TRP1, oder URA3, Nukleinsäure-biosynthetische Gene, das Säugetier-Gen von Chloramphenicol-Transacetylase (CAT) oder ein beliebiges Oberflächenantigen, für welches spezifische Antikörper verfügbar sind. Reportergene können für jedes Protein kodieren, das einen phänotypischen Marker bereitstellt, z. B. ein Protein, das für das Zellwachstum notwendig ist oder ein toxisches Protein, das zu Zelltod führt, oder sie können für ein Protein kodieren, das über einen Farbtest nachweisbar ist, der zur Anwesenheit oder Abwesenheit von Farbe (z. B. fluoreszierende Proteine oder Derivate davon) führt. Alternativ kann ein Reportergen für eine Suppressor-tRNA kodieren, deren Expression einen Phänotyp produziert, der nachgewiesen werden kann. Ein Reportergen gemäß der vorliegenden Erfindung schließt Elemente (z. B. alle Promotor-Elemente) ein, die für die Reportergen-Funktion notwendig sind.
Mit „funktionsfähig verbunden" ist gemeint, dass ein Gen und regulatorische Sequenzen) auf solche Weise verbunden sind, dass sie Genexpression erlauben, wenn die geeigneten Moleküle (z. B. transkriptionelle Aktivatorproteine oder Proteine, welche transkriptionsaktivierende Domänen einschließen) an die regulatorische(n) Sequenzen) gebunden sind.
Mit „kovalent gebunden" ist gemeint, dass zwei Domänen über kovalente Bindungen direkt oder indirekt verbunden sind. Das heißt, dass die „kovalent gebundenen" Proteine oder Protein-Anteile entweder unmittelbar zusammenhängend oder durch Abschnitte von ein oder mehr Aminosäuren innerhalb desselben Fusionsproteins getrennt sind.
Mit „Bereitstellen" ist das Einführen der Fusionsproteine in das Interaktionssystem, sequentiell oder gleichzeitig, und direkt (als Proteine) oder indirekt (als Gene, die diese Proteine kodieren) gemeint.
Mit „Protein" ist eine Sequenz von Aminosäuren beliebiger Länge gemeint, die das gesamte oder einen Teil eines natürlich vorkommenden Polypeptides oder Peptides darstellt, oder ein nicht natürlich vorkommendes Polypeptid oder Peptid darstellt (z. B. eine zufallsgenerierte Peptidsequenz oder eine Sequenz aus einer bewusst gestalteten Kollektion von Peptid-Sequenzen), gemeint.
Mit einem „Bindungsanteil" ist ein Abschnitt von Aminosäuren gemeint, welcher in der Lage ist, das spezifische Binden eines Polypeptides an eine bestimmte DNA-Sequenz (d. h. eine „DNA-Bindungsprotein-Erkennungsstelle") zu dirigieren.
Mit einem „schwachen Genaktivierungsanteil" ist ein Abschnitt von Aminosäuren gemeint, welcher in der Lage ist, die Expression eines Gens an dessen Kontrollregion er gebunden ist, schwach zu induzieren. So wie hier verwendet, bedeutet „schwach" einen Level von Aktivierung unterhalb der Aktivierung, die durch die GAL4 Aktivierungsregion II (Ma und Ptashne, Cell 48: 847, 1987) bewirkt wird, und ist vorzugsweise bei oder unterhalb des Levels an Aktivierung, die durch die B112 Aktivierungsdomäne von Ma und Ptashne (Cell 51: 113, 1987) bewirkt wird. Levels der Aktivierung können durch Verwendung eines beliebigen nachfolgenden Reportergensystems gemessen werden und durch Vergleichen, in parallelen Tests, der Expression, die durch das Polypeptid der GAL4-Region II stimuliert wird, mit dem Level der Expression, die durch das zu testende Polypeptid stimuliert wird.
Mit „Verändern der Expression des Reportergens" ist eine Zunahme oder Abnahme in der Expression des Reportergens in dem Ausmaße gemeint, wie sie für die Detektion einer Veränderung in dem verwendeten Test benötigt wird. Es wird verständlich sein, dass das Maß der Veränderung abhängig von dem Typ des Reportergen-Konstruktes oder des verwendeten Reportergen-Expressionstests variieren wird. Mit „konformationell versteift" ist ein Protein gemeint, dass eine reduzierte strukturelle Flexibilität hat, da seine Amino- und Carboxy-Termini räumlich fixiert sind. Vorzugsweise wird das konformationell versteifte Protein auf eine strukturell steife Weise präsentiert. Konformationelle Versteifung im Sinne der vorliegenden Erfindung kann durch Ausnutzen der Disulfidbindungsfähigkeit eines natürlichen oder rekombinant eingeführten Paares von Cysteinresten herbeigeführt werden, wobei ein Cysteinrest sich an oder nahe dem Aminoterminalen Ende des interessierenden Proteins befindet und der andere an oder nahe dem Carboxy-terminalen Ende. Alternativ kann die konformationelle Versteifung durch Einbetten des interessierenden Proteins in ein konformationsversteifendes Protein erleichtert werden.
Mit „konformationsversteifendem Protein" ist ein beliebiges Peptid oder Polypeptid gemeint, welches in der Lage ist, die Flexibilität der Amino- und/oder Carboxy-Termini eines anderen Proteins zu reduzieren. Vorzugsweise stellen solche Proteine ein starres Gerüst oder eine Plattform für das interessierende Protein bereit. Zusätzlich sind solche Proteine vorzugsweise fähig, einen Schutz gegen proteolytischen Abbau und ähnliches bereitzustellen, und/oder sie sind fähig, Löslichkeit zu verbessern. Beispiele für konformationsversteifende Proteine schließen Thioredoxin und andere Thioredoxinähnliche Proteine ein, Nukleasen (z. B. RNase A), Proteasen (z. B. Trypsin), Proteaseinhibitoren (z. B. Rinderpankreas-Trypsininhibitor (bovine pancreatic trypsin inhibitor)), Antikörper oder strukturell starre Fragmente davon, und Conotoxine. Ein konformationsversteifendes Peptid kann von einer beliebigen angemessen Länge sein und kann sogar ein einziger Aminosäurerest sein.
„Thioredoxin-ähnliche Proteine" sind hier definiert als Aminosäuresequenzen, die im Wesentlichen ähnlich sind, z. B. mindestens 18% Homologie haben, zu der Aminosäuresequenz von E. coli-Thioredoxin über eine Aminosäuresequenzlänge von 80 Aminosäuren. Alternativ ist eine Thioredoxin-ähnliche DNA-Sequenz hier als eine DNA-Sequenz definiert, die für ein Protein oder ein Fragment eines Proteins kodiert, das durch eine dreidimensionale Struktur charakterisiert ist, die im Wesentlichen ähnlich zu derjenigen von humanem oder E. coli-Thioredoxin ist, z. B. Glutaredoxin und optional dadurch gekennzeichnet ist, dass sie eine Schleife für ein aktives Zentrum enthält. Die DNA-Sequenz von Glutaredoxin ist ein Beispiel für ein Thioredaxin-ähnliche DNA-Sequenz, die für ein Protein kodiert, das eine solche wesentliche Ähnlichkeit in der dreidimensionalen Konformation aufweist und die Schleife für ein Cys .... Cys aktives Zentrum enthält. Die Aminosäuresequenz von E. coli-Thioredoxin ist in Eklund et al., EMBO J. 3: 1443–1449 (1984) beschrieben. Die dreidimensionale Struktur von E. coli-Thioredoxin ist in 2 von Holmgren, J. Biol. Chem. 264: 13963–13966 (1989) beschrieben. Eine DNA-Sequenz, die für das E. coli-Thioredoxinprotein kodiert, ist in Lim et al., J. Bacteriol., 163: 311–316 (1985) niedergelegt. Die dreidimensionale Struktur des humanen Thioredoxin ist in Forman-Kay et al., Biochemistry 30: 2685–98 (1991) beschrieben. Ein Vergleich der dreidimensionalen Strukturen von E. coli-Thioredoxin und Glutaredoxin ist in Xia, Protein Science I: 310–321 (1992) publiziert. Diese vier Publikationen sind hier per Referenz einbezogen, mit dem Ziel, Informationen über Thioredoxin-ähnliche Proteine bereitzustellen, die dem Fachmann bekannt ist.
Beispiele für Thioredoxin-ähnliche Proteine sind hier beschrieben.
Mit „Kandidaten für Interagenzien" sind Proteine gemeint („Kandidaten für interagierende Proteine") oder Verbindungen, welche physische mit dem interessierenden Protein interagieren; dieser Begriff umfasst auch Agonisten und Antagonisten. Agonistische Interagenzien sind als Verbindungen oder Proteine bestimmt, die die Fähigkeit haben, die Reportergen-Expression, die durch ein Paar von interagierenden Proteinen vermittelt wird, zu erhöhen. Antagonistische Interagenzien sind als Verbindungen oder Proteine bestimmt, die die Fähigkeit haben, die Reportergenexpression, die durch ein Paar von interagierenden Proteinen vermittelt wird, zu vermindern.
„Verbindungen" beinhalten kleine Moleküle, im Allgemeinen unter 1000 MW, Kohlehydrate, Polynukleotide, Lipide und ähnliches.
Mit „Testprotein" ist eines von einem Paar von interagierenden Proteinen gemeint, wobei der andere Teilnehmer des Paares im Allgemeinen als ein „Kandidat für ein Interagens" Supra) bezeichnet wird.
Mit „zufallsgeneriert" sind Sequenzen gemeint, die keine vorher festgelegte Sequenz haben; dies steht im Gegensatz zu „bewusst gestalteten" Sequenzen, die eine DNA- oder Proteinsequenz oder ein Motiv haben, das vor ihrer Synthese bestimmt wurde.
Mit „mutiert" ist verändert in Sequenz gemeint, entweder durch gezielte (site-directed) Mutagenese oder Zufallsmutagenese. Eine mutierte Form eines Proteins umfasst Punktmutationen genauso wie Insertionen, Deletionen oder Umlagerungen (rearrangements).
Mit „intrazellulär" ist gemeint, dass das Peptid innerhalb der Zelle statt auf der Zelloberfläche lokalisiert ist.
Mit einem „aktivierten Ras" ist eine beliebige mutierte Form von Ras gemeint, die an GTP für einen Zeitabschnitt gebunden bleibt, der länger ist als derjenige, der von der entsprechenden Wildtypform des Proteins gezeigt wird. Mit „Ras" ist eine beliebige Form von Ras-Proteinen gemeint, die, ohne darauf beschränkt zu sein, N-ras, K-ras und H-ras einschließt.
Die Interaktionsfallensysteme, die hier beschrieben sind, haben Vorteile gegenüber konventionelleren Methoden zum Isolieren von interagierenden Proteinen oder Genen, die für interagierende Proteine kodieren.
WO 94/10300 beschreibt ein Verfahren zum Bestimmen, ob ein erstes Protein in der Lage ist, mit einem zweiten Protein physisch zu interagieren. Das Verfahren beinhaltet:

(a) Bereitstellen einer Wirtszelle, enthaltend
(i) ein Reportergen, das funktionsfähig mit einer Proteinbindungsstelle verbunden ist;
(ii) ein erstes Fusionsgen, welches ein erstes Fusionsprotein exprimiert, wobei das erste Fusionsprotein das erste Protein einschließt, das kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage ist, spezifisch an die Proteinbindungsstelle zu binden; und
(iii) ein zweites Fusionsgen, welches ein zweites Fusionsprotein exprimiert, wobei das zweite Fusionsprotein das zweite Protein einschließt, welches kovalent an einen schwachen Genaktivierungsanteil gebunden ist; und
(b) Messen der Expression des Reportergens als ein Maß für die Interaktion zwischen den ersten und den zweiten Proteinen.

Chakraborty et al. (J. Biol. Chem. 207: 17498–17501, 1992) beschreiben ein Verfahren zum Detektieren von Protein-Protein-Interaktionen zwischen HLH-Proteinen in vivo, in welchem die Dimerisation durch das HLH-Motiv einen hybriden Transkriptionsfaktor rekonstruiert, der die DNA-bindende Domäne von Hefe GAL4 an ein HLH-Motiv gebunden enthält und die Aktivierungsdomäne von VP-16 an ein anderes gebunden enthält.
Zum Beispiel stellen die Systeme des Anmelders schnelle und kostengünstige Verfahren bereit, die einen sehr breiten Nutzen zum Identifizieren und Reinigen von Genen haben, die für einen großen Umfang von nützlichen Proteinen kodieren, basierend auf der physischen Interaktion des Proteins mit einem zweiten Polypeptid. Dieser breite Nutzen ergibt sich teilweise aus der Tatsache, dass die Komponenten der Systeme leicht modifziert werden können, um die Detektion von Proteininteraktionen von weit voneinander variierenden Affinitäten zu erleichtern (z. B. durch Verwenden von Reportergenen, die sich quantitativ in ihrer Sensitivität gegenüber Proteininteraktionen unterscheiden). Die induzierbare Natur des verwendeten Promotors zum Exprimieren der interagierenden Proteine vergrößert ebenfalls den Rahmen von Kandidaten für Interagenzien, welche detektiert werden können, da sogar Proteine, deren dauerhafte Expression für die Wirtszelle toxisch ist, einfach durch Induzieren eines kurzen Schubes (engl. burst) der Expression des Proteins und durch Testen auf seine Fähigkeit zu interagieren und die Expression eines Reporeergens zu stimulieren, isoliert werden können.
Wenn gewünscht, kann die Interaktion von den interagierenden Proteinen durch die Verwendung von Anhängen (Tags) von schwachen Genaktivierungsdomänen erreicht werden. Dieser Ansatz vermeidet Beschränkungen auf den Fundus an verfügbaren Kandidaten für interagierende Proteine, welche mit stärkeren Aktivierungsdomänen (z. B. solchen wie GAL4 oder VP16) assoziiert werden können; obwohl der Mechanismus unklar ist, resultiert eine solche Beschränkung anscheinend von niedrigen bis mäßigen Graden an Toxizität auf die Wirtszelle, die von der starken Aktivierungsdomäne vermittelt wird.
Zusätzlich verwenden die beanspruchten Verfahren konformationell versteifte Proteine (d. h. Proteine mit reduzierter Flexibilität aufgrund von Versteifungen an ihren Amino- und Carboxy-Termini). Konformationelle Versteifung kann durch Einbetten des interessierenden Proteins in ein konformationsversteifendes Protein erreicht werden (d. h. ein Protein von angemessener Länge und Aminosäurezusammensetzung, um in der Lage zu sein, den Kandidaten für ein interagierendes Protein in eine bestimmte dreidimensionale Struktur festzulegen). Beispiele für konformationsversteifende Proteine beinhalten, sind aber nicht beschränkt auf, Thioredoxin (oder andere Thioredoxin-ähnliche Proteine), Nukleasen (z. B. RNase A), Proteasen (z. B. Trypsin), Proteaseininhibitoren (z. B. Rinderpankreas-Trypsininhibitor (bovine pancreatic trypsin inhibitor)), Antikörper oder strukturell starre Fragmente davon, und Conotoxine.
Alternativ kann konformationelle Versteifung durch Ausnutzen der Disulfid-bindenden Fähigkeit eines natürlichen oder rekombinant eingeführten Paares von Cysteinresten erreicht werden, wobei sich ein Cysteinrest am Aminoterminus des interessierenden Proteines und der andere an seinem Carboxy-Terminus befindet. Solche Disulfidbindungen legen das Protein in eine starre und daher konformationell versteifte Schleifenstruktur fest. Disulfidbindungen zwischen den Amino-terminalen und Carboxy-terminalen Cysteinresten können z. B. im Zytoplasma von E. coli trxB mutanten Stämmen gebildet werden. Unter bestimmten Bedingungen können Disulfidbindungen auch im Zytoplasma und Kern von höheren Organismen, die äquivalente Mutationen tragen, gebildet werden, zum Beispiel in einem S. cerevisiae YTR4^– mutanten Stamm (Furter et al., Nucl Acids Res. 14: 6357–6373, 1986; GenBank Accession Number P29509). Zusätzlich sind die hier beschriebenen Thioredoxinfusionen (trxA-Fusionen) für diese alternativen Mittel des Einführens konformationeller Versteifung zugänglich, da die Cysteine, die an der Basis der Peptide, die in die Schleife des aktiven Zentrums des Thioredoxins eingefügt werden, in einem passenden Abstand voneinander sind, um Disulfidbrücken unter passenden Bedingungen zu bilden.
Konformationell versteifte Proteine sind als Kandidaten in der Erfindung nützlich, da sie für die Analyse der Tertiärstruktur zugänglich sind, was das Design von einfachen organischen Molekülmimetika mit verbesserten pharmakologischen Eigenschaften erleichtert. Zum Beispiel kann, da Thioredoxin eine bekannte Struktur hat, die Proteinstruktur zwischen den konformationell versteiften Regionen unter Verwendung von Methoden wie NMR und Röntgendifferenzanalyse leichter gelöst werden. Ferner schützen bestimmte konformationsversteifende Proteine das eingebettete Protein vor zellulärem Abbau und/oder Erhöhen die Löslichkeit des Proteins und/oder verändern in anderer Weise die Fähigkeit des Kandidaten für ein Interagens zu interagieren.
Wenn sie einmal isoliert sind, können die interagierenden Proteine ferner unter Verwendung des Interaktionsfallensystems analysiert werden, wobei das Signal, das durch die Interaktion erzeugt wird, ein Anzeichen für eine Veränderung in den Interaktionsfähigkeiten des Proteins darstellt. In einem speziellen Beispiel wird eine Veränderung an einem oder beiden der interagierenden Proteine vorgenommen (z. B. durch Standard in vivo oder in vitro gerichtete oder Zufallsmutagenese-Verfahren) und der Effekt der Veränderungen) wird durch Messen der Reportergenexpression verfolgt. Mit dieser Technik werden interagierende Proteine mit erhöhtem oder verringertem Interaktionspotential isoliert. Solche Proteine sind als therapeutische Moleküle (z. B. Agonisten oder Antagonisten) nützlich oder, wie oben beschrieben, als Modelle zum Design einfacher organischer Molekülmimetika.
Unter Verwendung einer Variation des Interaktionsfallensystems können ferner Proteinagonisten und Antagonisten leicht identifiziert und isoliert werden. Insbesondere wird, sobald eine Protein-Protein-Interaktion registriert worden ist, eine zusätzliche DNA, die für einen Kandidaten für einen Agonisten oder Antagonisten kodiert, oder vorzugsweise, eine Sequenz aus einer Bibliothek für potentielle Agonisten oder Antagonisten kodierenden Sequenzen in die Wirtszelle eingeführt und die Reportergenexpression gemessen. Alternativ werden Kandidaten für interagierende Agonisten- oder Antagonisten-Verbindungen (d. h. einschließlich Polypeptide als auch nicht-proteinische Verbindungen, z. B. einzelsträngige Polynukleotide)in ein in vivo oder in vitro Interaktionsfallensystem gemäß der Erfindung eingeführt und ihre Fähigkeit gemessen, eine Reportergenexpression zu bewirken. Eine Verringerung in der Expression des Reportergens (im Vergleich zu einer Kontrolle, der die Kandidaten-Sequenz oder – Verbindung fehlt) weist auf einen Antagonisten hin. Umgekehrt weist eine Zunahme in Expression des Reportergens (wiederum im Vergleich zu einer Kontrolle) auf einen Agonisten hin. Interaktionsagonisten und Antagonisten sind als therapeutische Agenzien oder als Modelle zum Design einfacher Mimetika nützlich; falls gewünscht, kann ein Agonist- oder Antagonist-Protein konformationell versteift sein, um die Vorteile, die hier beschrieben sind, bereitzustellen. Besondere Beispiele für interagierende Proteine, für welche Antagonisten oder Agonisten identifiziert werden können, schließen ein, sind aber nicht beschränkt auf, das IL-6 Rezeptor-Ligandenpaar, das TGF-β-Rezeptor-Ligandenpaar, das IL-1 Rezeptor-Ligandenpaar und andere Rezeptor-Ligandeninteraktionen, Proteinkinase-Substrat-Paare, interagierende Paare von Transkriptionsfaktoren, interagierende Komponenten von Signaltransduktionswegen (zum Beispiel zytoplasmatische Domänen von bestimmten Rezeptoren und G-Proteinen), Paare von interagierenden Proteinen, die an der Regulation des Zellzyklus beteiligt sind (z. B. p16 und CDK4), und Paare von Neurotransmittern. Ferner sind in der vorliegenden Erfindung Bibliotheken eingeschlossen, die für konformationell versteifte Proteine kodieren. Solche Bibliotheken (welche natürliche genauso wie synthetische DNA-Sequenzsammlungen umfassen können) werden intrazellulär exprimiert oder, optional, in zellfreien Systemen, und sie können zusammen mit einer beliebigen standardgenetischen Selektion oder Screen genutzt werden, oder mit einem beliebigen aus einer Zahl von Interaktionsfallen-Formaten zur Identifikation interagierender Proteine, Agonisten oder Antagonistenproteine oder Proteine, die eine Zelle mit identifizierbaren Charakteristika versehen, z. B. Proteine, die das Fortschreiten des Zellzyklus beeinträchtigen. Dementsprechend können Peptidkodierende Bibliotheken (entweder zufälliger oder gestalteter Art) für Selektionen oder Screens verwendet werden, welche entweder transkriptionsbasiert sind oder nicht. Diese Bibliotheken (welche vorzugsweise mindestens 100 unterschiedliche Peptid-kodierende Spezies und mehr bevorzugt 1000 oder 100000 oder mehr individuelle Spezies einschließen) können in einen beliebigen nützlichen prokaryotischen oder eukaryotischen Wirt transformiert werden, wobei Hefe den bevorzugten Wirt repräsentiert. Alternativ können solche Peptid-kodierenden Bibliotheken in zellfreien Systemen exprimiert werden.
Andere Merkmale und Vorteile der Erfindung werden aus der folgenden detaillierten Beschreibung und aus den Patentansprüchen deutlich werden.
Kurze Beschreibung der Zeichnungen
Die Zeichnungen werden zuerst kurz beschrieben.
1A–1C veranschaulichen einen Interaktionsfallensystem gemäß der Erfindung.
2 ist ein Diagramm des Bibliotheksvektors pJM1.
3A ist eine Photographie, die die Interaktion von Peptidaptameren mit anderen Proteinen zeigt.
3B veranschaulicht die Sequenz von beispielhaften Cdk2 interagierenden Peptiden.
4 veranschaulicht die Kopräzipitation der Peptide 3 und 13 durch Gst-Cdk2. Spur 1. Gst-Kügelchen (beads), der Extrakt enthält TrxA;
Spur 2. Gst-Kügelchen (beads), der Extrakt enthält das TrxA-Peptid 3;
Spur 3. Gst-Kügelchen (beads), der Extrakt enthält TrxA-Peptid 13;
Spur 4. Gst-Cdk2-Kügelchen (beads), der Extrakt enthält TrxA;
Spur 5. Gst-Cdk2-Kügelchen (beads), der Extrakt enthält TrxA-Peptid 3; und
Spur 6. Gst-Cdk2, der Extrakt enthält TrxA-Peptid 13.
5 veranschaulicht den Vektor BRM116-H-Ras(G12V).
6 veranschaulicht den Vektor pEG202-H-Ras(G12V).
Detaillierte Beschreibung
Die Anmelder haben ein neues Interaktionsfallensystem zur Identifikation und Analyse von konformationell versteiften Proteinen entwickelt, welche entweder physisch mit einem zweiten interessierenden Protein interagieren oder welche einer solchen Interaktion entgegenwirken (engl. antagonize) oder sie fördern (engl. agonize). In einer Ausführungsform gehört zu dem System ein eukaryotischer Wirtsstamm (z. B. ein Hefestamm), welcher so konstruiert ist, dass er ein Protein von therapeutischem oder diagnostischem Interesse als ein Fusionsprotein, das an eine bekannte DNA-Bindungsdomäne kovalent gebunden ist, produziert; dieses Protein wird als „Köder"-Protein bezeichnet, da es sein Zweck in dem System ist, nützliche aber noch unbekannte oder uncharakterisierte interagierende Polypeptide (als „Beute" bezeichnet; siehe unten) zu „fangen". Der eukaryotische Wirtsstamm beinhaltet ferner ein oder mehrere „Reportergene", d. h. Gene, deren Transkription als Antwort auf eine Köder-Beute-Interaktion detektiert wird. Köder-Proteine binden über ihre DNA-Bindungsdomäne an ihre spezifische DNA-Erkennungsstelle stromaufwärts von einem Reportergen; die Transkription des Reporters wird jedoch nicht stimuliert, da dem Köder-Protein eine Aktivierungsdomäne fehlt.
Um DNA-Sequenzen zu isolieren, die für neue interagierende Proteine kodieren, werden Mitglieder einer DNA-Expressionsbibliothek (z. B. einer cDNA oder einer synthetischen DNA-Bibliothek, die entweder zufälliger An oder bewusst ausgerichtet (biased) ist) in den Stamm, der das Reportergen und das Köder-Protein enthält, eingeführt; jedes Mitglied der Bibliothek lenkt die Synthese eines Kandidaten für ein interagierendes Protein, das an ein Tag für eine nicht variable Genaktivierungsdomäne fusioniert ist. Diese Bibliothekkodierten Proteine, die physikalisch mit dem promotorgebunden Köder-Protein interagieren, werden als „Beute"-Proteine bezeichnet. Solche gebundenen Beute-Proteine aktivieren (über ihren Aktivierungsdomänen-Tag) nachweisbar die Expression des stromabwärts gelegenen Reportergens und stellen ein fertiges Testsystem zum Identifizieren eines bestimmten DNA-Klones, der für ein interessierendes interagierendes Protein kodiert, bereit. In der vorliegenden Erfindung, ist jeder Kandidat für ein Beute-Protein konformationell versteift (beispielsweise entweder durch Einbetten des Proteins in ein konformationsversteifendes Protein oder durch Verknüpfen der Amino- und Carboxy-Termini des Proteins). Ein solches Protein wird in einer fixierten dreidimensionalen Struktur gehalten, was das Design von Arzneimittelmimetika erleichtert.
Ein Beispiel für ein Interaktionsfallensystem gemäß der Erfindung ist in den 1A-C gezeigt. 1A zeigt einen Leucin-auxotrophen Hefestamm, der zwei Reportergene enthält, LexAop-LEU2 und LexAop-lacZ und ein konstitutiv exprimiertes Gen für ein Beute-Protein. Das Beute-Protein (als Fünfeck dargestellt) ist an eine DNA-Bindungsdomäne (als Kreis dargestellt) fusioniert. Das DNA-Bindungsprotein erkennt und bindet an eine spezifische DNA-Bindungsprotein-Erkennungsstelle (als gefülltes Rechteck dargestellt), welche funktionsfähig mit einem Reportergen verbunden ist. In 1B und 1C enthalten die Zellen zusätzlich Kandidaten für Beute-Proteine (Kandidaten für Interaktoren) (gezeigt als leeres Rechteck in 1B und als leeres Sechseck in 1C), die an eine Aktivierungsdomäne (als gefülltes Quadrat dargestellt) fusioniert sind; jedes Beute-Protein ist in ein konformationsversteifendes Protein (als zwei gefüllte Halbkreise dargestellt) eingebettet. 1B zeigt, dass, wenn der Kandidat für eine Beute-Protein nicht mit dem transkriptionell inerten LexA-Fusionsbeuteprotein interagiert, die Reportergene nicht transkribiert werden; die Zelle kann auf einem leu^–-Medium nicht zu einer Kolonie heranwachsen, und sie ist auf einem Xgal-Medium weiß, da sie keine β-Galaktosidase-Aktivität enthält. 1C zeigt, dass, wenn der Kandidat für ein Beute-Protein mit dem Köder interagiert, beide Reportergene aktiv sind; die Zelle bildet eine Kolonie auf leu^–-Medium und die Zellen in der Kolonie haben β-Galaktosidase-Aktivität und sind blau auf Xgal-Medium. Vorzugsweise ist in diesem System das Köder-Protein (d. h., das Protein, das eine ortsspezifische DNA-Bindungsdomäne enthält) transkriptionell inert, und die Reportergene (welche von dem Köder-Protein gebunden sind) haben im Wesentlichen keine basale Transkription.
Jede Komponente des Systems wird nun detaillierter beschrieben.
Köder-Proteine
Der Wirtsstamm für die Selektion, der in den 1A–C gezeigt ist, enthält eine DNA, die für ein Köder-Protein kodiert, das an eine DNA fusioniert ist, die für einen DNA-Bindungsanteil kodiert, der von dem bakteriellen LexA-Protein abgeleitet ist. Die Verwendung einer LexA-DNA-Bindungsdomäne ergibt bestimmte Vorteile. Zum Beispiel enthält der LexA-Anteil in Hefe keine Aktivierungsfunktion und hat keinen bekannten Effekt auf die Transkription von Hefegenen (Brent und Ptashne, Nature 312: 612–615, 1984; Brent und Ptashne, Cell 43: 729–736, 1985). Zusätzlich erlaubt die Verwendung der LexA eher als beispielsweise der GAL4 DNA-Bindungsdomäne eine konditionale Expression von Beute-Proteinen als Antwort auf Induktion durch Galaktose; dies erleichtert den Nachweis von Beute-Proteinen, die auf die Wirtszelle toxisch sein können, wenn sie kontinuierlich exprimiert werden. Schließlich erlaubt die Verwendung eines wohl definierten Systemes, dass Kenntnis bezüglich der Interaktion zwischen LexA und der LexA-Bindungsstelle (d. h. des LexA-Operators) für den Zweck der Optimierung der Operatorbesetzung und/oder Optimierung der Geometrie des gebundenen Proteins ausgenutzt wird, um eine maximale Genaktivierung zu bewirken.
Vorzugsweise schließt das Köder-Protein ferner eine LexA-Dimerisierungsdomäne ein; diese optionale Domäne erleichtert eine effiziente Bildung des LexA-Dimers. Da LexA an seine DNA-Bindungsstelle als Dimer bindet, optimiert der Einbezug dieser Domäne in das Köder-Protein auch die Effizienz der Besetzung des Operators (Golemis und Brent, Mol. Cell Biol. 12: 3006–3014, 1992).
LexA repräsentiert eine bevorzugte DNA-Bindungsdomäne für die Erfindung. Jedoch kann jede andere transkriptionell inerte oder im Wesentlichen transkriptionell inerte DNA-Bindungsdomäne in dem Interaktionsfallensystem verwendet werden; solche DNA-Bindungsdomänen sind wohlbekannt und schließen die DNA-bindenden Teile der Proteine ACE1 (CUP1), lambda cI, lac-Repressor, jun, fos, GCN4 oder des Tet-Repressors ein. Die GAL4 DNA-Bindungsdomäne repräsentiert einen etwas weniger bevorzugten DNA-Bindungsanteil für die Köder-Proteine.
Köder-Proteine können aus einem beliebigen interessierenden Protein gewählt werden und schließen Proteine unbekannter, bekannter oder vermuteter diagnostischer, therapeutischer oder pharmakologischer Bedeutung ein. Bevorzugte Köder-Proteine umfassen Onkoproteine (solche wie myc, insbesondere der C-Terminus von myc, ras, src, fos, und insbesondere die oligomeren Interaktionsdomänen von fos) oder jegliche anderen Proteine, die an der Regulation des Zellzyklus beteiligt sind (wie Kinasen, Phosphatasen, die zytoplasmatischen Teile von Membran-assoziierten Rezeptoren) ein. Besondere Beispiele für bevorzugte Köder-Proteine schließen cyclin und cyclin-abhängige Kinasen (zum Beispiel Cdk2) oder Rezeptor-Liganden-Paare, oder Neurotransmitterpaare oder Paare anderer Signalproteine ein. In jedem Falle ist das interessierende Protein an eine bekannte DNA-Bindungsdomäne, wie sie im Allgemeinen hier beschrieben ist, fusioniert. Beispiele, bei denen Cdk2- und Ras-Köder verwendet wurden, sind unten dargestellt.
Reporter
Wie in 1B dargestellt, enthält ein bevorzugter Wirtsstamm gemäß. der Erfindung zwei unterschiedliche Reportergene, das LEU2-Gen und das lacZ-Gen, wobei jedes eine stromaufwärts gelegene Bindestelle für das Köder-Protein trägt. Die Reportergene, die in 1B gezeigt sind, schließen jeweils als stromaufwärts gelegene Bindungsstelle ein oder mehrere LexA-Operatoren anstelle der ursprünglichen Upstream Activation Sequences (UASs) ein. Diese Reportergene können in das Chromosom integriert werden oder als autonom replizierende Plasmide (z. B. Hefe 2μ-Plasmide) getragen werden.
Eine Kombination von zwei solchen Reportern ist für die in vivo-Ausführungsformen der Erfindung aus einer Zahl von Gründen bevorzugt. Erstens erlaubt die LexAop-LEU2-Konstruktion Zellen, die interagierende Proteine enthalten, um sich selbst beim Wachstum auf Medium, welchem Leucin fehlt, zu selektieren, was die Untersuchung von großen Zahlen von Zellen, die potentielle Kandidaten für interagierende Proteine enthalten, erleichtert. Zweitens erlaubt der LexAop-ZacZ-Reporter, das LEU⁺-Zellen schnell gescreent werden können, um eine Interaktion zu bestätigen. Und drittens stellt neben anderen technischen Überlegungen der LexAop-LEU2-Reporter eine extrem sensitive erste Selektion bereit, während der LexAop-lacZ-Reporter eine Unterscheidung zwischen Proteinen von unterschiedlichen Interaktionsaffinitäten erlaubt.
Obwohl die hier beschriebenen Reportergene eine bevorzugte Ausführungsform der Erfindung repräsentieren, können andere äquivalente Gene, deren Expression mit Standardtechniken nachgewiesen oder getestet werden kann, ebenfalls in Verbindung mit oder anstelle von den LEU2- und lacZ-Genen verwendet werden. Im Allgemeinen kodieren solche Reportergene für ein Enzym, das einen phänotypischen Marker bereitstellt, beispielsweise ein Protein, das für das Zellwachstum notwendig ist, oder ein toxisches Protein, das zu Zelltod führt, oder sie kodieren für ein Protein, das über einen Farbtest, oder weil seine Expression zur Anwesenheit oder Abwesenheit von Farbe führt, nachweisbar ist. Alternativ kann das Reportergen für eine Suppressor-tRNA kodieren, deren Expression beispielsweise dadurch getestet werden kann, dass sie eine lethale Wirtszellmutation supprimiert. Spezielle Beispiele von anderen nützlichen Genen, deren Transkription nachgewiesen werden kann, schließen Aminosäure- und Nukleinsäurebiosynthetische Gene (wie Hefe HIS3, URA3, TRP1, und LYS2) GALT, E. coli galK (welches das Hefe GAL1-Gen komplementiert), und die Reportergene CAT, GUS, fluoreszierende Proteine und Derivate davon, und jegliches Gen, das ein Zelloberflächenantigen, für welches Antikörper verfügbar sind, kodiert (z. B. CD4), ein. Reportergene können entweder über qualitative oder quantitative Mittel nachgewiesen werden, um Kandidaten für Interaktoren als Agonisten oder Antagonisten zu unterscheiden.
Beute-Proteine
In der hier beschriebenen Selektion wird eine weitere DNA-Konstruktion verwendet, welche für eine Serie von Kandidaten für interagierende Proteine (d. h. Beute-Proteine) kodiert; jedes ist konformationell versteift, entweder durch Einbetten in ein konformationsversteifendes Protein oder weil die Amino- und Carboxy-Termini des Beute-Proteins verbunden sind (d. h. über eine Disulfidbindung). Ein beispielhaftes Beute-Protein schließt einen nicht variablen N-terminalen Anteil ein, der vom Amino- zum Carboxy-Terminus ein ATG für die Proteinexpression trägt, eine optionale Kernlokalisationssequenz, eine schwache Aktivierungsdomäne (z. B. die B112- oder B42-Aktivierungsdomänen von Ma und Ptashne; Cell 51: 113, 1987) und ein optionales Epitop-Tag für einen schnellen immunologischen Nachweis der Synthese des Fusionsproteins. Bibliothekssequenzen, zufällig oder bewusst gestaltete synthetische DNA-Sequenzen, oder Sequenzen, die für konformationell versteifte Proteine kodieren, können stromabwärts von diesem N-terminalen Fragment inseriert werden, um Fusionsgene zu erzeugen, die für Beute-Proteine kodieren.
Auch andere Beute-Proteine als die hier beschriebenen sind in der Erfindung nützlich. Zum Beispiel können cDNAs von einer beliebigen mRNA-Population konstruiert und in einen äquivalenten Expressionsvektor inseriert werden. Eine solche Bibliothek nach Wahl kann de novo unter Verwendung kommerziell erhältlicher Kits (z. B. von Stratagene, La Jolla, CA) oder unter Verwendung gut etablierter, präparativer Verfahren (siehe z. B. Current Protocols in Molecular Biology, New York, John Wiley & Sons, 1987) konstruiert werden. Alternativ ist eine Zahl von cDNA-Bibliotheken (aus einer Zahl von unterschiedlichen Organismen) öffentlich und kommerziell erhältlich; Quellen für Bibliotheken schließen z. B. Clontech (Palo Alto, CA) und Stratagene (La Jolla, CA) ein. Es wird ferner angemerkt, dass die Beute-Proteine keine natürlich vorkommenden full-length Polypeptide sein müssen. In bevorzugten Ausführungsformen werden die Beute-Proteine von synthetischen DNA-Sequenzen kodiert, sind die Produkte von zufallsgenerierten offenen Leserastern, sind offene Leseraster, die mit einer bewussten Sequenztendenz (engl. intentional sequence bias) synthetisiert wurden, oder sind Teile davon. Vorzugsweise kodieren solche kurzen zufallsgenerierten Sequenzen für Peptide zwischen 1 (und vorzugsweise 6) und 60 Aminosäuren Länge. In einem speziellen Beispiel schließt das Beute-Protein nur eine Interaktionsdomäne ein; solch eine Domäne kann als Therapeutikum nützlich sein, um die Aktivität (d. h. als Antagonist oder Agonist) des Köder-Proteins zu modulieren.
In ähnlicher Weise kann eine beliebige Zahl von Aktivierungsdomänen für diesen Teil des Beutemoleküls verwendet werden; solche Aktivierungsdomänen sind vorzugsweise schwache Aktivierungsdomänen, d. h. schwächer als der Anteil der GAL4-Aktivierungsregion II und vorzugsweise nicht stärker als B112 (so wie z. B. durch Vergleich mit der GAL4-Aktivierungsregion II oder B112 in parallelen β-Galaktosidase-Nachweisverfahren unter Verwendung von lacZ-Reportergenen gemessen); eine solche Domäne kann jedoch schwächer sein als B112. Insbesondere erlaubt es die außerordentliche Sensitivität des LEU2 Selektionsschemas, das auch extrem schwache Aktivierungsdomänen im Rahmen der Erfindung verwendet werden können. Beispiele für andere nützliche Aktivierungsdomänen schließen B17, B42, und die amphipathischen Helix (AH)-Domänen ein, die in Ma und Ptashne (Cell 51: 113, 1987), Ruden et al. (Nature 350: 426–430, 1991), und Giniger und Ptashne (Nature 330: 670, 1987) beschrieben sind.
Die Beute-Proteine können, falls gewünscht, andere optionale Kernlokalisationssequenzen einschließen (d. h. solche, die von den GAL4 oder MATα2-Genen abgeleitet sind) oder andere optionale Epitop-Tags (z. B. Teile des c-myc-Proteins oder des Flag-Epitops, das von Immunex erhältlich ist). Diese Sequenzen optimieren die Effizienz des Systems, werden aber für seine Funktion nicht benötigt. Insbesondere optimiert die Kernlokalisationssequenz die Effizienz, mit welcher die Beute-Moleküle das kernlokalisierte Reportergenkonstrukt (e) erreichen, wodurch ihre effektive Konzentration erhöht wird und was es erlaubt, schwächere Proteininteraktionen nachzuweisen. Der Epitop-Tag erleichtert lediglich einen einfachen Immuntest zur Expression des Fusionsproteins.
Der Fachmann wird ferner erkennen, dass die Komponenten des oben beschriebenen Reportergens, der DNA-Bindungsdomäne, und der Genaktivierungsdomäne von einer beliebigen eukaryotischen oder prokaryotischen Quelle abgeleitet werden können, einschließlich Hefe-, Säugerzell-, und prokaryotischen Zell-Genomen oder cDNAs sowie von künstlichen Sequenzen. Obwohl Hefe einen bevorzugten Wirtsorganismus für das Interaktionsfallensystem darstellt (aus Gründen der einfachen Vermehrung, genetischen Manipulation und des Screenings in großem Format), können darüber hinaus auch andere Wirtsorganismen wie Säugetierzellen verwendet werden. Wenn ein Säugersystem gewählt wird, ist das bevorzugte Reportergen das sensitive und leicht nachweisbare CAT-Gen; brauchbare DNA-Bindungsdomänen und Genaktivierungsdomänen können von den oben beschriebenen gewählt werden (z. B. die LexA DNA-Bindungsdomäne und die B42- oder B112-Aktivierungsdomänen).
Konformationsversteifende Proteine
Gemäß einer Ausführungsform der vorliegenden Erfindung ist die DNA-Sequenz, die für das Beute-Protein kodiert, in eine DNA-Sequenz eingebettet, die für ein konformationsversteifendes Protein (d. h. ein Protein, das die Flexibilität der Amino- und Carboxy-Termini des Beute-Proteins verringert) eingebettet. Verfahren zum direkten Verbinden der Amino- und Carboxy-Termini eines Proteins (z. B. durch Disulfidbindung von in passender Weise positionierten Cystein-Resten) sind oben beschrieben. Als Alternative zu diesem Ansatz können konformationsversteifende Proteine verwendet werden. Im Allgemeinen wirken die konformationsversteifenden Proteine als Gerüste oder Plattformen, welche die Zahl der möglichen dreidimensionalen Konfigurationen, die das interessierende Peptid oder Protein annehmen kann, begrenzen. Bevorzugte Beispiele für konformationsversteifende Proteine sind Thioredoxin oder andere Thioredoxin-ähnliche Sequenzen, aber viele andere Proteine sind für diesen Zweck ebenfalls nützlich. Vorzugsweise sind konformationsversteifende Proteine von kleiner Größe (im Allgemeinen weniger als oder gleich 200 Aminosäuren), starr in der Struktur, von bekannter dreidimensionaler Konfiguration, und sie sind in der Lage, Insertionen von interessierenden Proteinen ohne eine unmäßige Störung ihrer Strukturen aufzunehmen. Ein Schlüsselmerkmal solcher Proteine ist die Verfügbarkeit von Stellen auf ihren dem Lösungsmittel exponierten Oberflächen, an welchen Peptidinsertionen durchgeführt werden können (z. B. die Schleife des aktiven Zentrums im Thioredoxin). Es ist ferner bevorzugt, dass die Gene, die ein konformationsversteifendes Protein produzieren, in verschiedenen prokaryotischen und eukaryotischen Wirten oder in passenden zellfreien Systemen hoch exprimierbar sind, und dass die Proteine löslich und widerstandsfähig gegenüber Protease-Abbau sind. Beispiele für konformationsversteifende Proteine, die im Rahmen der Erfindung verwendbar sind, schließen Nukleasen (z. B. RNase A), Proteasen (z. B. Trypsin), Protease-Inhibitoren (z. B. Rinderpankreas-Trypsininhibitor (bovine pancreatic trypsin inhibitor)), Antikörper oder starre Fragmente davon, und Conotoxine ein. Diese Liste ist jedoch nicht beschränkend. Es wird erwartet, dass andere konformationsversteifende Proteine, die Sequenzen haben, die nicht oben genannt wurden, oder die noch nicht identifiziert oder publiziert wurden, aufgrund ihrer strukturellen Stabilität und Starrheit brauchbar sein können.
Wie oben erwähnt, ist ein bevorzugtes konformationsversteifendes Protein gemäß der Erfindung das Thioredoxin oder andere Thioredoxin-ähnliche Proteine. Als ein Beispiel für ein Thioredoxin-ähnliches Protein, das im Rahmen dieser Erfindung verwendbar ist, hat das E. coli-Thioredoxin die folgenden Eigenschaften. E. coli-Thioredoxin ist ein kleines Protein von nur 11,7 kD und kann in großer Menge produziert werden. Die kleine Größe und die Fähigkeit des Proteins in großer Menge synthetisiert zu werden, tragen zu einer hohen intrazellulären Konzentration bei. E. coli-Thioredoxin ist weiterhin durch eine sehr stabile Tertiärstruktur charakterisiert, welche eine Proteinreinigung erleichtern kann.
Die dreidimensionale Struktur von E. coli-Thioredoxin ist bekannt und enthält einige Oberflächenschleifen, einschließlich einer detulichen (engl. distinctive) Cys .... Cys-Schleife des aktiven Zentrums zwischen den Resten Cys33 und Cys36, welche aus dem Körper des Proteins hervorragt. Diese Cys .... Cys-Schleife des aktiven Zentrums ist eine erkennbare, zugängliche Oberflächenschleifenregion und ist nicht an Interaktionen mit dem Rest des Proteins beteiligt, welche zur gesamten strukturellen Stabilität beitragen. Daher ist es ein guter Kandidat für eine Stelle für Beuteprotein-Insertionen. Humanes Thioredoxin, Glutaredoxin, und andere Thioredoxin-ähnliche Moleküle enthalten ebenfalls diese Cys .... Cys-Schleife des aktiven Zentrums. Sowohl die Amino- und Carboxyl-Termini des E. coli-Thioredoxin sind auf der Oberfläche des Proteins und sind ebenfalls für eine Fusionskonstruktion leicht zugänglich. E. coli-Thioredoxin ist auch gegenüber Proteasen stabil, stabil in Hitze bis zu 80°C und stabil gegenüber niedrigem pH.
Andere Thioredoxin-ähnliche Proteine, die durch im Rahmen dieser Erfindung nützliche Thioredoxin-ähnliche DNA-Sequenzen kodiert werden, haben homologe Aminosäuresequenzen und ähnliche physikalische und strukturelle Charakteristika gemeinsam. Daher können DNA-Sequenzen, die für andere Thioredoxin-ähnliche Proteine kodieren, anstelle von E. coli-Thioredoxin gemäß dieser Erfindung verwendet werden. Zum Beispiel sind die DNA-Sequenz, die für das für das Thioredoxin einer anderen Spezies kodieren, z. B. humanes Thioredoxin, geeignet. Humanes Thioredoxin hat eine dreidimensionale Struktur, die der dreidimensionalen Struktur desjenigen von E. coli praktisch überlagert werden kann, so wie es durch Vergleich der NMR-Strukturen der beiden Moleküle festgestellt wurde. Forman-Kay et al., Biochem. 30: 2685 (1991). Humanes Thioredoxin enthält ebenfalls eine Schleife des aktiven Zentrums, die strukturell und funktionell zu der Cys .... Cys-Schleife des aktiven Zentrums, das in dem E. coli-Protein gefunden wird, äquivalent ist. Es kann daher anstelle oder zusätzlich zu E. coli-Thioredoxin für die Produktion von Protein und kleinen Peptiden gemäß dem Verfahren dieser Erfindung verwendet werden. Insertionen in die Schleife des aktiven Zentrums des humanen Thioredoxin und auf den Amino-Terminus können genauso gut toleriert werden wie solche in E. coli-Thioredoxin.
Andere Thioredoxin-ähnliche Sequenzen, welche im Rahmen dieser Erfindung eingesetzt werden können, schließen das gesamte oder Teile der Proteine Glutaredoxin und der Homologen davon aus verschiedenen Spezies ein (Holmgren, supra). Obwohl E. coli-Glutaredoxin und E. coli-Thioredoxin weniger als 20% Aminosäurehomologie gemeinsam haben, haben die zwei Proteine konformationelle und funktionelle Ähnlichkeiten (Eklund et al., EMBO J. 3: 1443–1449 (1984)), und Glutaredoxin enthält eine Schleife des aktiven Zentrums, die strukturell und funktionell äquivalent zu der Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist. Glutaredoxin ist daher ein Thioredoxin-ähnliches Molekül, wie es hier definiert ist.
Außerdem kann die DNA-Sequenz, die für das Proteindisulfid-Isomerase (PDI) kodiert, oder für den Anteil, der die Thioredoxin-ähnliche Domäne enthält, und ihre Homologen aus verschiedenen Spezies (Edman et al., Nature 317: 267–270 (1985)) können ebenfalls als Thioredoxin-ähnliche DNA-Sequenz eingesetzt werden, da eine wiederholte Domäne von PDI mehr als 30% Homologie mit E. coli-Thioredoxin gemeinsam hat und diese wiederholte Domäne eine Schleife des aktiven Zentrums enthält, die strukturell und funktionell äquivalent zu der Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist. Die beiden letzteren Publikationen sind per Referenz hier einbezogen, mit dem Ziel, Information über Glutaredoxin und PDI zur Verfügung zu stellen, welche dem Fachmann bekannt und zugänglich ist.
In ähnlicher Weise kann die DNA-Sequenz, die für die Phosphoinositid-spezifische Phospholipase C (PI-PLC), Fragmente davon und Homologe davon aus verschiedenen Spezies (Bennett et al., Nature, 334: 268–270 (1988)) in der vorliegenden Verwendung als Thioredoxin-ähnliche Sequenz basierend auf der Aminosäuresequenzhomologie mit E. coli-Thioredoxin eingesetzt werden, oder alternativ basierend auf der Ähnlichkeit in der dreidimensionalen Konformation und der Anwesenheit einer Schleife des aktiven Zentrums, die strukturell und funktionell äquivalent zur Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist. Die gesamte oder ein Teil der DNA-Sequenz, die für das Protein des endoplasmatischen Retikulums ERp72, oder Homologe davon aus verschiedenen Spezies, kodieren, sind ebenfalls als Thioredoxin-ähnliche DNA-Sequenzen für die Zwecke dieser Erfindung eingeschlossen (Mazzarelle et al., J. Biol. Chem. 265: 1094–1101 (1990)), basierend auf ihrer Aminosäuresequenzähnlichkeit oder alternativ basierend auf der Ähnlichkeit in der dreidimensionalen Konformation und der Anwesenheit einer Schleife des aktiven Zentrums, die strukturell und funktionell äquivalent zur Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist. Eine andere Thioredoxin-ähnliche Sequenz ist eine DNA-Sequenz, welche den gesamten oder einen Teil des adulten T-Cell Leukemia-Derived Factor (ADF) oder Homologe davon aus anderen Spezies kodieren (Wakasugi et al., Proc. Natl. Acad. Sci. USA, 87: 8282–8286 (1990)). ADF wird nunmehr für das humane Thioredoxin gehalten. In ähnlicher Weise kann das Protein, das verantwortlich ist für die Förderung der Disulfidbindungsbildung im Periplasma von E. coli, das Produkt des dsbA-Gens (Bardwell et al., Cell 67: 581–89, 1991) ebenfalls als eine Thioredoxin-ähnliche Sequenz angesehen werden. Die drei letzteren Publikationen sind per Referenz hier einbezogen mit dem Ziel, Informationen über PI-PLC, ERp72, ADF, und dsbA zur Verfügung stellen, welche dem Fachmann bekannt und zugänglich ist.
Es wird ausgehend von der Definition der Thioredoxin-ähnlichen Sequenzen, die oben verwendet wurde, erwartet, dass andere Sequenzen, die nicht speziell oben identifiziert wurden, oder die vielleicht noch nicht identifiziert oder publiziert wurden, ebenfalls als Thioredoxin-ähnliche Sequenzen basierend auf der Homologie ihrer Aminosäuresequenz zu E. coli-Thioredoxin oder basierend auf dem Vorhandensein von dreidimensionalen Strukturen, die im Wesentlichen ähnlich zu E. coli oder humanem Thioredoxin sind, oder auf dem Vorhandensein einer Schleife des aktiven Zentrums, die funktionell und strukturell äquivalent zu der Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist, brauchbar sein können. Ob ein Molekül diese letzteren zwei Charakteristika hat, kann ein Fachmann durch Vergleichen seiner dreidimensionalen Struktur, wie sie beispielsweise durch Röntgenkristallographie oder zweidimensionale NMR-Spektroskopie analysiert wurde, mit der publizierten dreidimensionalen Struktur für E. coli-Thioredoxin, feststellen und durch Analysieren der Aminosäuresequenz des Moleküls, um zu bestimmen, ob es eine Schleife des aktiven Zentrums enthält, die strukturell und funktionell äquivalent zur Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist. Mit „im Wesentlichen ähnlich" in der dreidimensionalen Struktur oder Konformation ist gemeint, dass es so ähnlich zu E. coli-Thioredoxin ist, wie Glutaredoxin es ist. Darüber hinaus ist ein Vorhersage-Algorithmus beschrieben worden, welcher die Identifizierung von Thioredoxin-ähnlichen Molekülen über computerunterstützte Analyse der Primärsequenz ermöglicht (Ellis et al., Biochemistry 31: 4882–91 (1992)). Basierend auf der obigen Beschreibung wird ein Fachmann in der Lage sein, eine Thioredoxin-ähnliche DNA-Sequenz zur Verwendung im Rahmen dieser Erfindung auszuwählen und zu identifizieren, oder, falls gewünscht, zu modifizieren, ohne dass er auf unmäßiges Experimentieren zurückgreifen muss. Zum Beispiel sind einfache Punktmutationen, die an Teilen des nativen Thioredoxins oder nativer Thioredoxinähnlicher Sequenzen gemacht werden, welche nicht die Struktur des resultierenden Moleküls bewirken (engl. effect), alternative Thioredoxin-ähnliche Sequenzen, genauso wie es allelische Varianten von nativem Thioredoxin oder nativen Thioredoxin-ähnlichen Sequenzen sind.
DNA-Sequenzen, welche mit der Sequenz für E. coli-Thioredoxin oder seinen strukturellen Homologen unter entweder stringenten oder lockeren Hybridisierungsbedingungen hybridisieren, kodieren ebenfalls Thioredoxin-ähnliche Proteine zur Verwendung im Rahmen dieser Erfindung. Ein Beispiel für eine solche stringente Hybridisierungsbedingung ist die Hybridisierung bei 4 × SSC bei 65°C, gefolgt von Waschen in 0,1 × SSC bei 65°C für eine Stunde. Alternativ ist eine beispielhafte stringente Hybridisierungsbedingung in 50% Formamid, 4 × SSC bei 42°C. Beispiele für nicht-stringente Hybridisierungsbedingungen sind 4 × SSC bei 50°C oder Hybridisierung mit 30–40% Formamid bei 42°C. Es wird gedacht, dass die Verwendung aller solcher Thioredoxin-ähnlicher Sequenzen im Rahmen dieser Erfindung umfasst ist.
Aus einer Vielzahl von Gründen kann es bevorzugt sein, dass die Beute-Proteine in die Schleife des aktiven Zentrums von Thioredoxin oder Thioredoxin-ähnlichen Molekülen fusioniert sind. Die Oberfläche des Thioredoxins, die die Schleife des aktiven Zentrums umgibt, hat sich so entwickelt, dass sie in der Lage ist, mit einer Vielzahl von Proteinoberflächen zu interagieren, in Übereinstimmung mit der Hauptfunktion des Proteins als eine nicht spezifische Proteindisulfidoxidoreduktase. Die Schleife des aktiven Zentrums befindet sich zwischen Segmenten von starker Sekundärstruktur und dieses stellt eine starre Plattform bereit, an welche man Beute-Proteine anbinden kann.
Ein kleines Beute-Protein, das in die Schleife des aktiven Zentrums von einem Thioredoxin-ähnlichen Protein inseriert ist, befindet sich in einer Region des Proteins, welche an der Erhaltung der Tertiärstruktur nicht beteiligt ist. Daher ist die Struktur eines solchen Fusionsproteins stabil. In der Tat kann E. coli-Thioredoxin bei einer Position, die sich nahe an der Schleife des aktiven Zentrums befindet, in zwei Fragmente geschnitten werden, und trotzdem bleiben die tertiären Interaktionen, die das Protein stabilisieren, erhalten.
Die Schleife des aktiven Zentrums von E. coli-Thioredoxin hat die Sequenz NH₂ ... Cys₃₃-Gly-Pro-Cys₃₆... COOH. Fusionieren eines ausgewählten Beute-Proteins mit einem Thioredoxin-ähnlichen Protein in dem Teil der aktiven Schleife des Proteins, schränkt die Beute an beiden Enden ein, was die Grade an konformationeller Freiheit des Beute-Proteins reduziert und folglich die Zahl der alternativen Strukturen reduziert, die von der Beute angenommen werden. Das inserierte Beute-Protein ist an jedem Ende durch Cysteinreste gebunden, welche eine Disulfidverknüpfung mit dem jeweils anderen bilden können, wie sie das in nativem Thioredoxin tun, und was weiter die konformationelle Freiheit der inserierten Beute reduziert.
Zusätzlich wird das Beute-Protein dadurch, dass es in der Schleife des aktiven Zentrums positioniert ist, auf der Oberfläche des Thioredoxin-ähnlichen Proteins platziert, was ein Vorteil für die Verwendung im Screening nach bioaktiven Proteinkonformationen und andere Assays ist. Im Allgemeinen ist die Brauchbarkeit von Thioredoxin oder anderen Thioredoxin-ähnlichen Proteinen in McCoy et al., U.S. Pat. No. 5, 270, 181 und in LaVallie et al., Bio/Technology 11: 187–193 (1993) beschrieben. Diese beiden Referenzen sind hiermit per Referenz einbezogen.
Nun folgt eine Beschreibung des Thioredoxin-Interaktionsfallensystems gemäß der Erfindung. Diese Beispiele sind dafür bestimmt, die Erfindung zu veranschaulichen und nicht zu begrenzen.
Thioredoxininteraktionsfallensystem
Interaktionsfallensysteme unter Verwendung von konformationell versteiften Proteinen sind für den Nachweis von Proteininteraktionen, für die Identifizierung und Isolierung von Proteinen, die an solchen Interaktionen teilnehmen und für die Identifizierung und Isolierung von Agonisten und Antagonisten solcher Interaktionen entwickelt worden. Beispielhafte Systeme werden nun beschrieben.
1. Thioredoxininteraktionsfallensystem mit Cdk2-Köder
Das Fortschreiten von eukaryotischen Zellen durch den Zellzyklus erfordert das koordinierte Handeln von einer Zahl von Proteinen, die mit Cdks interagieren und ihre Aktivität regulieren (Sherr, Cell 79: 551–55 (1994)). Diese modulatorischen Proteine beinhalten Cyline, welche die Aktivität von Cdk positiv regulieren, cyclinabhängige Kinaseinhibitoren (Ckis) und eine Zahl von Proteinkinasen und Phosphatasen, von welchen einige, wie z. B. CAK und Cdc25, die Kinaseaktivität positiv regulieren, und von welchen einige, wie z. B. Weel, die Kinaseaktivität inhibieren, und von welchen einige, wie z. B. Cdi1 (Gyuris et al., Cell 75: 791–803 (1993)), Effekte haben, die bisher unbekannt sind (reviewed in Morgan, Nature 374: 131–134 (1995)). Es wird angenommen, das Cdk2 bei höheren Zellen benötigt wird, um von der G1 in die S-Phase voran zu schreiten (Fang & Newport, J. Cell Biol. 66: 731–742 (1991); Pagano et al. J. Cell Biol. 121: 101–111 (1993); van den Heuvel & Harlow, Science 262: 2050–2054 (1993)). Die Aktivität der Cdk2-Kinase wird von Cyclin E und Cyclin A positiv reguliert (Koff et al., Science 257: 1689–1694 (1992); Dulic et al., Science 257: 1958–1961 (1992); Tsai et al., Nature 353: 174–7 (1991)) und negativ von p21, p27 und p57 reguliert wird (Harper et al., Cell 75: 805–816 (1993); Polyak et al., Genes Dev. 8: 9–22 (1994); Toyoshima & Hunter, Cell 78: 67–74 (1994); Matsuoka et al. Genes Dev. 9: 660–662 (1995); Lee et al., Genes Dev. 9: 639–649 (1995)); darüber hinaus komplexiert Cdk2 mit Cdi1 am Übergang von G1 zu S (Gyuris et al., Cell 75: 791–803 (1993)). Hier beschreiben wir die Verwendung eines Hefe Two-Hybrid Systems, um aus kombinatorischen Bibliotheken Moleküle zu selektieren, welche Cdk2 erkennen.
Es wird ein Beutevektor konstruiert, der das E. coli-Thioredoxingen (trxA) enthält. pJG4-4 (Gyuris et al., Cell 75: 791, 1993) wird als Vektorbackbone verwendet und mit EcoRI und XhoI geschnitten. Ein DNA-Fragment, das für die B112-Transkriptionsaktivierungsdomäne kodiert, wird durch PCR-Amplifikation von dem Plasmid LexA-B112 (Doug Ruden, Ph. D. thesis, Harvard University, 1992) erhalten und mit MunI und NdeI geschnitten. Das E. coli trxA-Gen wird von dem Vektor pALTRXA-781 (U.S. Pat. No. 5,292,646; InVitrogen Corp., San Diego, CA) durch Verdau mit NdeI und SalI ausgeschnitten. Die trxA- und B112-Fragmente werden dann mit Standardtechniken in das EcoRI/XhoI-geschnittene pJG 4-4 Backbone ligiert, womit pYENAeTRX gebildet wird. Dieser Vektor kodiert für ein Fusionsprotein, das die SV40-Kernlokalisierungsdomäne, die B112-Transkriptionsaktivierungsdomäne, ein Hemagglutinin-Epitop-Tag, und E. coli-Thioredoxin enthält (2A).
Peptidbibliotheken werden wie folgt konstruiert. Das DNA-Oligomer 5' GACTGACTGGTCCG(NNK)₂GGTCCTCAGTCAGTCAG 3' (mit N = A, C, G, T und K = G, T) (SEQ ID NO: 4) wird synthetisiert und an das zweite Oligomer (5' CTGACTGACTGAGGACC 3') (SEQ ID NO: 5) hybridisiert, um doppelsträngige DNA an dem 3'-Ende des ersten Oligomers zu bilden. Der zweite Strang wird unter Verwendung von Klenow-Enzym enzymatisch vervollständigt, wobei die Synthese durch das zweite Oligomer geprimed wird. Das Produkt wird mit AvaII geschnitten und in das mit RsrII-geschnittene pYENAeTRX inseriert. Nach Ligation wird das Konstrukt verwendet, um E. coli mit Standardmethoden (Ausubel et al., supra) zu transformieren. Die Bibliothek enthielt 2,9 × 109 Mitglieder, von welchen mehr als 109 die Synthese von Peptiden steuert.
Um nach interagierenden Peptiden zu screenen, werden 20 μg der Bibliothek verwendet, um den Hefestamm EGY48 (Matα his3 leu2::2Lexop-LEU2 ura3 trp1 LYS2; Gyuris et al., supra) zu transformieren. Dieser Stamm enthält auch das Reporterplasmid pSH 18–34, ein pLR1Δ1-Derivat, das den Hefereplikationsursprung 2 μ, das URA3-Gen und ein GAL1-lacZ-Reportergen mit den GAL1-Upstream Regulatory Elements, welche durch 4 colE1 LexA-Operatoren ersetzt sind, enthält (West et al., Mol. Cell Biol. 4: 2467, 1984; Ebina et al., J. Biol. Chem. 258: 13258, 1983; Hanes and Brent, Cell 57: 1275, 1989), sowie den Köder-Vektor pLexA202-Cdk2 (Cdk2 kodiert für die humane cylin-abhängige Kinase 2, ein essentielles Zellzyklus-Enzym) (Gyuris et al., supra; Tsai et al., Oncogene 8: 1593, 1993). Etwa 2,5 × 10⁶ Transformanten werden erhalten und vereinigt. Der erste Selektionsschritt, Wachstum auf Leucin-Mangelmedium nach Induktion mit 2% Galaktose/1% Raffinose (Gyuris et al., supra; Guthrie und Fink, Guide to Yeast Genetics and Molecular Biology, Bd. 194, 1991) wird mit einer 8-fachen Redundanz (20 × 10⁶ cfu) der Bibliothek in Hefe durchgeführt, und etwa 900 Kolonien werden nach Wachstum bei 30°C für 5 Tage erhalten. Die 300 größten Kolonien werden durch Ausstreichen gereinigt und für auf die Galaktose-abhängige Expression des LEU2-Genproduktes und des β-Galaktosidase-Genproduktes (kodiert von pSH 18–34) getestet, wobei das letztere in Gegenwart von Xgal im Medium zu blauen Hefekolonien führt (Ausubel et al., supra). Diese Anforderung erfüllen 33 Kolonien, welche, nach Sequenzieren, 14 unterschiedliche Klone einschließen, von welchen alle spezifisch an den LexA-Cdk2-Köder, aber nicht an LexA oder an einen LexA-Cdk3-Köder (Finley et al., Proc. Natl. Acad. Sci., 1994) binden. Die Stärke der Bindung wird gemäß der Intensität der blauen Farbe beurteilt, die von einer Kolonie der Hefe gebildet wird, die das jeweils unterschiedliche Interagens enthält. Mit dieser Hilfe wird jedes Interagens als starker, mittelstarker oder schwacher Binder klassifiziert, welches auf die Menge der blauen Farbe normalisiert wird, die von verschiedenen natürlich vorkommenden Partnerproteinen von Cdk2 in parallelen Paarungsinteraktionstests bewirkt wird. Ein Beispiel für die Peptidsequenz von einem Vertreter von jeder Klasse ist hier angegeben:
Starker Binder: Peptid 3 (SEQ ID NO: 6)

-Gly₃₄-Pro₃₅-Leu-Val-Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe-Gly₃₄-Pro₃₅-

Mittelstarker Binder: Peptid 2 (SEQ ID NO: 7)

-Gly₃₄-Pro₃₅-Met-Val-Val-Ala-Ala-Glu-Ala-Val-Arg-Thr-Val-Leu-Leu-Ala-Asp-Gly-Gly-Asp-Val-Thr-Gly₃₄-Pro₃₅-

Schwacher Binder: Peptid 6 (SEQ ID NO: 8)

-Gly₃₄-Pro₃₅-Pro-Asn-Trp-Pro-His-Gln-Leu-Arg-Val-Gly-Arg-Val-Leu-Trp-Glu-Arg-Leu-Ser-Phe-Glu-Gly₃₄-Pro₃₅-

Kontrollpeptide, welche nicht nachweisbar binden, sind: c4: Arg-Arg-Ala-Ser-Val-Cys-Gly-Pro-Leu-Leu-Ser-Lys-Arg-Gly-Tyr-Gly Pro-Pro-Phe-Tyr-Leu-Ala-Gly-Met-Thr-Ala-Pro-Glu-Gly-Pro-Cys (SEQ ID NO: 14) und c: Arg-Arg-Ala-Ser-Val-Cys-Gly-Pro-Leu-His-Tyr-Trp-Gly-Leu-Gly-Gly-Phe-Val-Asp-Leu-Trp-Gln-Glu-Thr-Thr-Gly-Val-Gly-Pro-Cys (SEQ ID NO: 15).
3A zeigt, dass 5 von den Peptiden stark mit dem LexA-Cdk2-Köder, aber nicht mit einer großen Zahl von nicht verwandten Proteinen reagierten. Keines der Cdk2-Aptamere interagierte mit CDC28 oder Cdc2, welche beide 65% identisch zu Cdk2 sind. Jedoch reagierten zwei der 5 Cdk2-Interagenzien auch mit humanem Cdk3, und einer von den 5 reagierte auch mit Drosophila Cdc2c, was darauf hinweist, dass die Peptide Determinanten erkennen, die diesen Proteinen gemeinsam sind. Sowohl theoretische Überlegung als auch Kalibrierungsexperimente mit dem C-Terminus des Lambda-Repressors deuten darauf hin, dass die Transkription vom pSH18-34-Reporter in EGY48 durch Proteininteraktionen mit Kd's, die so schwach sind wie 10^–6 M, aktiviert werden kann. Die Tatsache, dass die Peptide 3 und 13 robuste Transkription des dieses LexAop-lacZ-Reporters steuern, ist vereinbar mit der Idee, dass sie deutlich enger interagieren können. Die Sequenz dieser Peptide ist in 3B gezeigt. Zwei der Peptide sind länger als die Einheitslänge; beide sind anscheinend Artefakte der in vitro-Manipulationen, die für die Konstruktion der Bibliothek durchgeführt wurden. Kein Peptid zeigte eine signifikante Sequenzähnlichkeit zu bekannten Proteinen und keine zeigten mehr als zufällige Ähnlichkeit zueinander, was darauf hinweist, dass wir die Peptidmotive, die in der Lage sind, Cdk2 zu erkennen, nicht ausgeschöpft haben.
Um die Spezifität der Cdk2-Interaktion zu bestätigen, immobilisierten wir ein Gst-Cdk2-Fusionsprotein auf Glutathion-Sepharose-Kügelchen und verwendeten diese Kügelchen, um zwei bakteriell exprimierte Peptidaptamere spezifisch zu präzipitieren (4). Gst-Cdk2 war in E. coli exprimiert und wurde auf Glutathion-Sepharose wie beschrieben gereinigt (Lee et al., Nature 374: 91–94 (1995)). Die Peptide 3 und 13 wurden wie folgt hergestellt: Fragmente, die die Synthese der Peptide 3 und 13 steuerten, wurden durch PCR-Amplifikation des Inserts, das durch das entsprechende Bibliotheksplasmid kodiert wurde, hergestellt und in pAL-TrxA eingeführt (LaVallie et al., Bio/Technology 11: 187– 193 (1993)). Fusionsproteine wurden exprimiert und in einer French Pressure Cell wie beschrieben lysiert (LaVallie et al., BIO/Technology 11, 187–193 (1993)). Kopräzipitation mit Gst-Sepharose-Kügelchen wurde wie beschrieben durchgeführt (Lee et al., Nature 374, 91–94 (1995)), und die Proben wurden auf einem 15%igen SDS Polyacrylamid-Gel aufgetrennt und auf Nylon-Membranen übertragen. TrxA enthaltende Fusionsproteine wurden sichtbar gemacht durch Sondieren der Membranen mit einem Anti-TrxA Antikörper und durch Entwickeln des immobilisierten Antikörpers mit Peroxidasegekoppelten Anti-Kaninchen IgG Antikörper ECL Reagenzien, gemäß den Anweisungen des Herstellers (Amersham, Arlington Heights, IL).
Diese Experimente demonstrieren, dass die Interaktionen zwischen Cdk2 und den Peptid-Aptameren in vitro beobachtet werden können und daher unabhängig von irgendwelchen aus Hefe stammenden Brückenproteinen sind. Einmal identifiziert, können diese Peptide in Kompetitions-Experimenten verwendet werden.
Die Fähigkeit, TrxA-Peptide auszuwählen, die spezifisch mit bestimmten intrazellulären Ködern interagieren, erlaubt die Herstellung anderer Klassen von intrazellulären Reagenzien. Zum Beispiel können entsprechend derivatisierte TrxA-Peptidfusionen die Herstellung von Antagonisten oder Agonisten (wie oben beschrieben) erlauben. Alternativ erlauben Peptidfusionen die Herstellung von Homodimeren oder Heterodimeren „Matchmakern", welche die Interaktion von bestimmten Proteinpaaren erzwingen. In einem speziellen Beispiel werden zwei Proteine durch Verwenden einer Leucin-Zipper-Sequenz zusammengezwungen, welche an ein konformationsversteifendes Protein angehängt ist, dass einen Kandidaten für ein Interaktionspeptid enthält. Dieses Protein kann an beide Mitglieder eines interessierenden Proteinpaares binden und ihre Interaktion lenken. Alternativ kann der „Matchmaker" zwei unterschiedliche Sequenzen enthalten, wobei die eine Affinität für ein erstes Polypeptid hat und die zweite eine Affinität für ein zweites Polypeptid hat; wiederum ist das Ergebnis eine gelenkte Interaktion zwischen den ersten und zweiten Polypeptiden. Eine weitere praktische Anwendung für die hier beschriebenen Peptidfusionen ist die Herstellung von „Zerstörern", welche ein gebundenes Protein für die Zerstörung durch Proteasen des Wirtes als Ziel kennzeichnen. In einem Beispiel für die Anwendung des Zerstörers wird eine Protease an eine Komponente eines interagierenden Paares fusioniert und es wird dieser Komponente ermöglicht, mit dem Ziel zu interagieren, das zerstört werden soll (z. B. einem Protease-Substrat). Durch diese Methode wird die Protease an ihren erwünschten Handlungsort befördert und ihr proteolytisches Potenzial in wirksamer Weise verstärkt. Noch eine andere Anwendung der hier beschriebenen Fusionsproteine sind als „konformationelle Stabilisatoren", welche Zielproteine dazu veranlassen, eine bestimmte Konformation zu bevorzugen oder diese Konformation zu stabilisieren. In einem besonderen Beispiel hat das ras-Protein eine Konformation, die der Zelle signalisiert, sich zu teilen, und eine weitere Konformation, die der Zelle signalisiert, sich nicht zu teilen. Durch Wahl eines Peptides oder Proteins, das die gewünschte Konformation stabilisiert, kann man beeinflussen, ob eine Zelle sich teilen wird. Andere Proteine die konformationelle Veränderungen durchlaufen, welche die Aktivität erhöhen oder erniedrigen, können ebenfalls an einen entsprechenden „konformationellen Stabilisator" gebunden werden, um die Eigenschaft des gewünschten Proteins zu beeinflussen.
2. Funktionelle Inhibition von Cdk2
Um zu bestimmen, ob Cdk2-interagierende Peptide die Cdk2 Funktion in vivo inhibieren können, haben wir uns die Tatsache zunutze gemacht, dass humanes Cdk2 die temperatursensitiven Allele von Cdc28 komplementieren kann (Elledge und Spottswood, EMBO 10: 2653–2659, 1991; Ninomiya et al., PNAS 88: 9006–9010, 1991; Meyerson et al., EMBO 11: 2909–2917, 1992). Peptid 13 inhibiert die Ausplattierungseffizienz einer Cdk2-abhängigen Hefe. Ein Stamm der die Temperatur-sensitive cdc28-1N-Mutation trägt, kann bei hohen Temperaturen Kolonien bilden, wenn er ein Plasmid trägt, das Cdk2 exprimiert. Bei der restriktiven Temperatur verringert die Expression von Peptid 13 die Plattierungseffizienz dieses Stammes 10-fach im Vergleich zu der Plattierungseffizienz von Hefe, die Kontrollpeptide exprimiert. Sowohl Peptid 3 als auch Peptid 13 haben bei einer Temperatur von 37°C ähnliche Auswirkungen auf die Plattierungseffizienz eines Cdk2(+)-Stammes, der das cdc28-13ts-Allel trägt.
Expression des Peptids 13 verringert die Verdoppelungszeit eines Cdk2(+), cdc28ts-1N-Stammes um einen Faktor von 50%. Mikroskopische Untersuchung der Stämme, die das Peptid exprimieren, offenbarte, dass ein hoher Anteil dieser Zellen eine verlängerte Morphologie hatte, die charakteristisch für cdc28-1N-Zellen bei der restriktiven Temperatur ist, während Zellen, die ein Kontrollpeptid exprimieren, eine normalere Morphologie hatten.
Peptid 13 beeinflusst nicht das Wachstum eines cdc28-1Nts-Stammes bei hoher Temperatur, wenn der Defekt durch ein Plasmid, dass das Wildtyp-Cdc28-Produkt exprimiert, komplementiert wird, und Peptid 13 hat keinen Effekt auf Hefe bei der permissiven Temperatur. Obwohl wir nicht beabsichtigen, durch irgendeine besondere Theorie gebunden zu sein, scheint es, dass dieses Peptid den Fortschritt des Hefezellzyklus dadurch blockiert, dass es an eine Fläche des Cdk2-Moleküls bindet und seine Funktion inhibiert und dadurch mit seiner Fähigkeit interferiert, mit anderen Cyclinen, anderen Partnern, oder mit Substraten zu interagieren.
3. Thioredoxin-Interaktionsfalle mit OncoRas-Köder
Die ras-Proteine sind für viele Signaltransduktionswege essentiell und regulieren zahlreiche physiologische Funktionen einschließlich der Zellproliferation. Die ras-Gene wurden zuerst aus dem Genom des Harvey und Kirsten-Sarcomavirus identifiziert. Die drei Typen von Säugetier ras-Genen (N-, K-ras, und H-ras) kodieren für hochkonservierte membrangebundene Guaninnukleotid-bindende Proteine mit einem Molekulargewicht von 21 kDa, welche zwischen der aktiven (GTP-gebundenen) Form und der inaktiven (GDP-gebundenen) Form wechseln.
In normalen Zellen ist die aktive Form von Ras kurzlebig, da seine intrinsische GTPase-Aktivität das gebundene GTP schnell zu GDP umwandelt. Die GTPase-Aktivität wird 10⁵-fach durch GTPase-aktivierende Proteine (GAPs) stimuliert. GTP-gebundenes Ras interagiert mit GAP, c-Raf, Neurofibromatosis Typ 1 (NF-1) und Ral-Guaninnukleotid-Dissoziationsstimulator (RalGDS).
Mutationsaktivierte RAS-Proteine werden in etwa 30% humaner Tumorzellen gefunden und haben stark verringerte GTPase-Aktivität, welche nicht durch GAPs stimuliert werden kann. Die Mehrheit der bisher untersuchten Mutationen sind auf eine Punktmutation entweder am Rest Gly-12 oder am Rest Gln-61 von Ras zurückzuführen. Diese Ras-Mutanten verbleiben in der aktiven Form und interagieren mit nachgeschalteten Effektoren, was zu Tumorentstehung führt. Es ist gezeigt worden, dass es signifikante konformationelle Unterschiede zwischen GTP-gebundenen Formen der Wildtyp- und der onkogenen Ras-Proteine gibt. Solche konformationellen Unterschiede sind die wahrscheinlichen Ursachen für eine bösartige Transformation, die durch onkogene Ras-Proteine induziert wird. Solche mutationsaktivierten konformationellen Veränderungen in GTP-gebundenen H-ras-Mutanten stellen Ziele für Mitglieder einer konformationell versteiften Bibliothek von zufälligen Peptiden dar. Im vorliegenden Beispiel ist die Bibliothek eine konformationell versteifte Thioredoxinpeptid-Bibliothek, wie sie oben beschrieben wurde. Mitglieder der Bibliothek, welche mit onkogenem Ras interagieren, sind durch eine Veränderung der oben bereitgestellten Interaktionsfallentechnologie identifiziert worden. Die für onkogenes Ras isolierten Peptidaptamere können im Hinblick auf ihre Fähigkeit untersucht werden, die Interaktion von onkogenem Ras mit bekannten Effektoren zu unterbrechen und die zelluläre Transformation zu inhibieren.
Wir haben ein gut charakterisiertes onkogenes H-Ras (G12V) zur Isolierung und Charakterisierung seiner Peptidaptamere verwendet. Peptidaptamere für andere Onkogene können durch Anpassungen des hier bereitgestellten Protokolls isoliert werden.
Köder-Konstruktion
Konstruktion der LexA-Ras(G12V)/pEG202: H-Ras(G12V) DNA wurde durch Verdau von BTM116-H-Ras(G12V) (5) mit BamHI und SalI durchgeführt. H-Ras(G12V)-DNA wurde mit dem pEG202-Backbone (Rückgrat), das mit BamHI und SalI verdaut worden war, ligiert. Das resultierende Plasmid wurde pEG202-H-Ras (G12V) (oder V6) genannt (6).
Screening nach H-Ras (G12Y) Peptid-Aptameren
pEG202-H-Ras (G12V) (V6) wurde in den EGY48-Stamm gemäß einem standardmäßigen Hefe-Transformationsprotokoll transformiert; speziell wurde hier das Protokoll verwendet, das von Zymo Research (Orange County, CA) bereitgestellt wurde. EGY48 wurde in YPD-Medium bis zu einer OD₆₀₀ = 0.2 – 0.7 heranwachsen gelassen. Die Zellen wurden bei 500 × g für 4 min. pelletiert und in 10 ml von EZ1-Lösung (Zymo Research) resuspendiert. Die Zellen wurden dann durch Zentrifugation pelletiert und in 1 ml von EZ2 (Zymo Research) resuspendiert. Aliquote von kompetenten Zellen (50 μl) wurden in einem –70°C-Gefrierschrank gelagert.
Ein Aliquot der kompetenten Zellen wurde mit 0,1 μg von LexA-H-Ras (G12V)/pEG202 und mit 500 μl EZ3-Lösung (Zymo Research) gemischt. Die Mischung wurde bei 30°C für 30 min. inkubiert und auf ein Hefemedium, welchem Histidin und Uracil fehlten, ausplattiert. Eine Kolonie wurde ausgewählt und in 100 ml von Glukose Ura^–His^–-Medium bei 30°C unter Schütteln (150 rpm) inokuliert, bis die OD₆₀₀-Messung 0,96 war. Die Kultur wurde bei 2000 g für 5 min. zentrifugiert und die Zellpellets wurden in 5 ml sterilem LiOAc/TE resuspendiert. Die Zellen wurden erneut wie oben zentrifugiert und in 0,5 ml von sterilem LiOAc/TE resuspendiert.
Aliquote (50 μl) der Zellen wurden dann bei 30°C für 30 min. inkubiert, mit 1 μg Thioredoxinpeptid-Bibliotheks-DNA, 70 μg Lachssperma-DNA, und 300 μl sterilem 40 PEG 4000 in LiOAc/TE. Die Mischungen wurden bei 42°C für 15 min. hitzegeschockt. Jedes Aliquot wurde auf eine 24 cm × 24 cm-Schale ausplattiert, welche Glukose Ura^–His^– Trp^–-Medium enthielt und bei 30°C für 2 Tage inkubiert. Die Transformationseffizienz war typischerweise in einem Bereich von 50 000 bis 100 000 koloniebildenden Einheiten pro μg-Bibliotheks-DNA.
Eine Gesamtmenge von 1,5 Millionen Transformanten wurde erhalten und auf ein Selektionsmedium von Galaktose/Raffinose Leu^–Ura^–His^–Trp^– ausplattiert. Von den 338 gebildeten Kolonien wurden 50 nach dem Zufallsprinzip ausgewählt und in 5 ml von Glukose Leu^–Ura^–His^–Trp^–-Medium für die Präparation von Hefe-Plasmid-DNA inokuliert. Ein halber Milliliter von jeder Hefekultur wurde mit einem gleichen Volumen an säuregewaschenem Sand und Phenol-Chloroform-Isoamyl-Alkohol (24 : 24 : 1) gemischt und in einem Vortexer für 2 min. gevortext. Die Mischung wurde dann für 15 min. zentrifugiert und der Überstand wurde mit Ethanol ausgefällt. DNA-Pellets wurden in 50 μl TE resuspendiert.
Ein μl von jeder Probe wurde verwendet, um E. coli KC8-Zellen durch Elektroporation zu transformieren. Bakterielle Transformanten wurden auf einem Minimal-Agar, der mit Uracil, Leucin, Histidin, und Ampicillin ergänzt worden war, selektiert. Jeder Transformantentyp resultierte letztendlich in Isolierung eines Plasmids mit einem Leucin-Marker, welcher ein DNA-Fragment trägt, das für ein Thioredoxin-Peptid-Fusionsprotein kodiert.
Die Sequenzbestimmung der 50 Isolate wurde gemäß den Anweisungen der fmolDNA^TM-Sequenzierungssysteme (Promega, Madison, WI) ausgeführt, unter Verwendung des Primers 5'-GACGGGGCGATCCTCGTCG-3' (SEQ ID NO: 16). Neun aus 50 Isolaten (bezeichnet als #4, #18, #39, #41, #22, #24, #30, #31, #46) enthielten einmalige (engt. unique) für Peptide kodierende Sequenzen, wie durch Elektrophorese der dT/ddT-Terminationsreaktion bestimmt wurde. Unter ihnen, lautet die vorhergesagte Peptid-Aptamer-Sequenz von #39 wie folgt:
Trp-Ala-Glu-7rp-Cys-Gly-Pro-Val-Cys-Ala-His-Gly-Ser-Arg-Ser-Leu-Thr-Leu-Leu-Thr-Lys-Tyr-His-Val-Ser-Phe-Leu-Gly-Pro-Cys-Lys-Met-Ile-Ala-Pro-Ile-Leu-Asp (SEQ ID No: 17). Nach unseren Ergebnissen scheint es, dass etwa 60 einmalige (engt. unique) H-Ras (G12V) Peptid-Aptamere (338 × 9/50) in der ersten Runde des Screenings isoliert wurden.
Andere Ausführungsformen
Wie oben beschrieben, weist die Erfindung ein Verfahren zum Nachweisen und Analysieren von Protein-Protein-Interaktionen auf. Typischerweise ist in den obigen Experimenten das Köder-Protein an eine DNA-Bindungsdomäne fusioniert, und das Beute-Protein (in Verbindung mit dem konformationsversteifenden Protein) ist an die Genaktivierungsdomäne fusioniert. Die Erfindung kann jedoch leicht an andere Formate angepasst werden. Zum Beispiel umfasst die Erfindung auch eine „umgekehrte" Interaktionsfalle, in welcher das Köder-Protein an eine Genaktivierungs-domäne fusioniert ist, und das Beute-Protein (in Verbindung mit einem konformations-versteifenden Protein) an die DNA-Bindungsdomäne fusioniert ist. Wiederum resultiert die Interaktion zwischen Köder- und Beute-Proteinen in der Aktivierung einer Reportergen-Expression. Solch ein „umgekehrtes" Interaktionsfallensystem ist jedoch auf die Verwendung von Beute-Proteinen angewiesen, welche selbst nicht die Expression des stromabwärts gelegenen Gens aktivieren.
Die Proteininteraktions-Testsysteme, die hier beschrieben sind, können auch in einem zellfreien, in vitro System ausgeführt werden. Solch ein System fängt mit einem DNA-Konstrukt an, welches ein Reportergen umfasst, das funktionell mit einer DNA-Bindungsprotein-Erkennungsstelle verknüpft ist (z. B. eine LexA-Bindungsstelle). Zu dieser DNA wird ein Köder-Protein (z. B. ein beliebiges der hier beschriebenen Köder-Proteine, die an eine LexA-DNA-Bindungsdomäne gebunden sind) und ein Beute-Protein (z. B. eines aus einer Bibliothek von konformationell versteiften Kandidaten für interagierende Beute-Proteine, die an eine Genaktivierungsdomäne gebunden sind) hinzugefügt. Die Interaktion zwischen dem Köder- und Beute-Protein wird durch Messen des Reportergen-Produktes nachgewiesen, entweder als ein RNA-Produkt, als ein in vitro translatiertes Proteinprodukt, oder durch irgendeine enzymatische Aktivität des translatierten Reportergenproduktes. Dieses in vitro-System kann auch zum Identifizieren von Agonisten oder Antagonisten verwendet werden, einfach indem zu einem bekannten Paar von interagierenden Proteinen (in dem oben beschriebenen System) ein Kandidat für ein agonistisches oder antagonistisches Interagens hinzugefügt wird und (jeweils) eine Zunahme oder Abnahme in der Reportergen-Expression nachgewiesen wird, im Vergleich zu einer Kontrollreaktion, der der Kandidat für eine Verbindung oder ein Protein fehlt. Um das Screening im großen Maßstab zu erleichtern, können Kandidaten für Beute-Proteine oder Kandidaten für Agonisten oder Antagonisten zunächst in Pools von beispielsweise 10 oder 20 Kandidaten-Verbindungen oder -Proteinen getestet werden. Von Pools, die ein positives Ergebnis zeigen, wird das jeweilige interagierende Protein oder der Agonist oder Antagonist dann durch individuelles Testen der Komponenten des Pools identifiziert. Solche in vitro-Systeme sind für eine Roboterautomatisierung oder für die Produktion von Kits geeignet. Kits, die Komponenten von irgendeinem der hier beschriebenen Interaktionsfallensysteme enthalten, sind auch von der Erfindung umfasst.
Die Komponenten (z. B. die verschiedenen Fusions-Proteine oder DNA dafür) oder beliebige der in vivo- oder in vitro-Systeme der Erfindung können hintereinander oder gleichzeitig bereitgestellt werden, je nach dem erwünschten experimentellen Design.

Claims

Ein Verfahren zum Bestimmen, ob ein erstes Protein in der Lage ist, mit einem zweiten Protein physisch zu interagieren, umfassend: (a) Bereitstellen einer Wirtszelle welche enthält (i) ein Reportergen, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (ii) ein erstes Fusionsgen, das ein erstes Fusionsprotein exprimiert, das besagtes erstes Protein kovalent an einen Bindungsanteil gebunden umfasst, welcher in der Lage ist, an besagte DNA-Bindungsprotein-Erkennungsstelle zu binden (iii) ein zweites Fusionsgen, welches ein zweites Fusionsprotein exprimiert, wobei das besagte zweite Fusionsprotein das besagte zweite Protein und einen Genaktivierungsanteil umfasst, wobei das besagte zweite Protein konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini, an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins, und (b) Messen der Expression des besagten Reportergens als ein Maß für die Interaktion zwischen besagtem ersten und zweiten Proteinen.
Das Verfahren nach Anspruch 1, wobei das besagte zweite Protein ein Peptid von mindestens 6 Aminosäuren ist.
Das Verfahren nach Anspruch 1, wobei das besagte zweite Protein ein Peptid von weniger oder gleich 60 Aminosäuren Länge ist.
Das Verfahren nach Anspruch 1, wobei das besagte zweite Protein eine zufallsgenerierte oder bewusst gestaltete Peptidsequenz umfasst.
Das Verfahren nach Anspruch 1, wobei das erste Protein Cdk2 ist.
Das Verfahren nach Anspruch 1, wobei das erste Protein Ras oder ein aktiviertes Ras ist.
Das Verfahren nach Anspruch 1, wobei das besagte zweite Protein in das besagte andere Protein eingebettet ist.
Das Verfahren nach Anspruch 1, wobei das besagte andere Protein Thioredoxin ist.
Das Verfahren nach Anspruch 1, wobei das besagte andere Protein ein Thioredoxin-ähnliches Molekül ist.
Das Verfahren nach Anspruch 8, wobei das besagte zweite Protein in die Schleife des aktiven Zentrums des besagten Thioredoxin Proteins eingefügt ist.
Das Verfahren nach Anspruch 1, wobei das besagte zweite Protein über Disulfid-Bindungen zwischen Cystein-Resten im Amino-Terminus und im Carboxy-Terminus des besagten zweiten Proteins konformationell versteift ist.
Das Verfahren nach Anspruch 1, wobei die besagte Wirtszelle Hefe ist.
Das Verfahren gemäß Anspruch 1, wobei die besagte DNA-Bindedomäne LexA ist.
Das Verfahren nach Anspruch 1, wobei das besagte Reportergen über eine Farbreaktion nachgewiesen wird.
Das Verfahren nach Anspruch 1, wobei das besagte Reportergen über die Zell-Lebensfähigkeit nachgewiesen wird.
Ein Verfahren zum Finden eines interagierenden Proteins in einer Population von Proteinen umfassend: (a) Bereitstellen einer Wirtszelle, welche enthält (i) ein Reportergen, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (ii) ein erstes Fusionsgen, welches ein erstes Fusionsprotein exprimiert, das besagtes erstes Protein, kovalent an einen Bindungsanteil gebunden, umfasst, welcher in der Lage ist, an besagte DNA-Bindungsprotein-Erkennungsstelle zu binden, und (b) Einführen eines zweiten Fusionsgenes, welches ein zweites Fusionsprotein exprimiert, in die besagte Wirtszelle, wobei das besagte zweite Fusionsprotein umfasst: ein Protein aus der besagten Population von Proteinen und einen Genaktivierungsanteil, wobei das besagte eine Protein aus besagter Population von Proteinen konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des besagten Proteins aus besagter Population von Proteinen, und (c) Messen der Expression des besagten Reportergens als ein Maß der Interaktion zwischen besagtem Testprotein und besagtem einen Protein aus besagter Population von Proteinen.
Das Verfahren nach Anspruch 16, wobei die besagte Population von Proteinen Peptide mit einer Länge zwischen 1 und 60 Aminosäuren umfasst.
Das Verfahren nach Anspruch 16, wobei die besagte Population von Proteinen eine Kollektion von zufallsgenerierten oder bewusst gestalteten Peptidsequenzen ist.
Das Verfahren gemäß Anspruch 16, wobei ein jedes aus der besagten Population von Proteinen in besagtem anderem Protein eingebettet ist.
Das Verfahren gemäß Anspruch 16, wobei das besagte andere Protein Thioredoxin ist.
Das Verfahren nach Anspruch 20, wobei ein jedes aus besagter Population von Proteinen in die Schleife des aktiven Zentrums des besagten Thioredoxin eingefügt ist.
Das Verfahren gemäß Anspruch 16, wobei ein jedes aus der besagten Population von Proteinen über Disulfid-Bindungen zwischen Cystein-Resten im Amino- Terminus und im Carboxy-Terminus des besagten Proteins konformationell versteift ist.
Das Verfahren nach Anspruch 16, wobei das besagte erste Protein Cdk2 ist.
Das Verfahren nach Anspruch 16, wobei das besagte erste Protein Ras oder ein aktiviertes Ras ist.
Das Verfahren nach Anspruch 16, wobei die besagte Wirtszelle Hefe ist.
Das Verfahren nach Anspruch 16, wobei die besagte DNA-Bindedomäne LexA ist.
Das Verfahren nach Anspruch 16, wobei das besagte Reportergen über eine Farbreaktion nachgewiesen wird.
Das Verfahren nach Anspruch 16, wobei das besagte Reportergen über die Zell-Lebensfähigkeit nachgewiesen wird.
Ein Verfahren zum Identifizieren eines Kandidaten für ein Interagens, umfassend (a) Bereitstellen eines Reportergens, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b) Bereitstellen eines ersten Fusionsproteins, wobei das besagte erste Fusionsprotein ein erstes Protein kovalent an einen Bindungsanteil gebunden umfasst, der in der Lage ist, spezifisch an die besagte DNA-Bindungsprotein-Erkennungsstelle zu binden; (c) Bereitstellen eines zweiten Fusionsproteins das besagtes zweites Protein und einen Genaktivierungsanteil umfasst, wobei das besagte zweite Protein konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins, wobei das besagte zweite Protein in der Lage ist, mit besagtem ersten Protein zu interagieren, (d) Inkontaktbringen des besagten Kandidaten für ein Interagens mit besagtem ersten Protein und/oder besagtem zweiten Protein, und (e) Messen der Expression des besagten Reportergens.
Das Verfahren nach Anspruch 29, wobei das Bereitstellen des besagten ersten Fusionsproteins das Bereitstellen eines ersten Fusionsgenes umfasst, welches das besagte erste Fusionsprotein exprimiert, und wobei das Bereitstellen des zweiten Fusionsproteins das Bereitstellen eines zweiten Fusionsgenes umfasst, welches das besagte zweite Fusionsprotein exprimiert.
Das Verfahren nach Anspruch 29, wobei das besagte erste Fusionsprotein und das besagte Fusionsprotein vor dem Kontakt mit dem besagten Kandidaten für ein Interagens miteinander interagieren dürfen.
Das Verfahren nach Anspruch 29, wobei das besagte erste Fusionsprotein und der besagte Kandidat für ein Interagens vor Kontakt mit besagtem zweiten Fusionsprotein interagieren dürfen.
Das Verfahren nach Anspruch 29, wobei der besagte Kandidat für ein Interagens konformationell versteift ist, entweder durch kovalentes Binden an seinen Amino- und Caboxy-Termini an ein anderes Protein oder Peptid oder durch Verknüpfen seiner Amino- und Carboxy-Termini.
Das Verfahren nach Anspruch 29, wobei der besagte Kandidat für ein Interagens ein Antagonist ist und die Reportergen-Expression reduziert.
Das Verfahren nach Anspruch 29, wobei der besagte Kandidat für ein Interagens ein Agonist ist und die Reportergen Expression erhöht.
Das Verfahren nach Anspruch 29, wobei der besagte Kandidat für ein Interagens ein Mitglied ist, das ausgewählt ist aus der Gruppe bestehend aus Proteinen, Polynucleotiden und kleinen Molekülen.
Das Verfahren nach Anspruch 29, wobei der Kandidat für ein Interagens von einem Mitglied einer cDNA- oder einer synthetischen DNA-Bibliothek kodiert wird.
Das Verfahren nach Anspruch 29, wobei der besagte Kandidat für ein Interagens eine mutierte Form des besagten ersten Fusionsproteins oder des besagten zweiten Fusionsproteins ist.
Das Verfahren nach Anspruch 29, wobei das besagte Reportergen, das besagte erste Fusionsgen und das besagte zweite Fusionsgen auf einem einzigen Stück DNA enthalten sind.
Das Verfahren nach Anspruch 29, wobei das besagte erste Protein Cdk2 ist.
Das Verfahren nach Anspruch 29, wobei das besagte erste Protein Ras oder ein aktiviertes Ras ist.
Eine Population von eukaryotischen Zellen, wobei jede Zelle ein rekombinantes DNA-Molekül enthält, das ein intrazelluläres Peptid kodiert, welches konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des Peptids, wobei zumindest 100 unterschiedliche rekombinante Moleküle, die für unterschiedliche intrazelluläre, konformationell versteifte Peptide kodieren, in besagter Population vorhanden sind, wobei jedes Molekül in zumindest einer Zelle der besagten Population vorhanden ist.
Die Population nach Anspruch 42, wobei das besagte intrazelluläre Peptid in das besagte andere Protein eingebettet ist.
Die Population von eukaryotischen Zellen nach Anspruch 42, wobei das besagte andere Protein Thioredoxin ist.
Die Population von eukaryotischen Zellen nach Anspruch 42, wobei das besagte intrazelluläre Peptid über Disulfid-Bindungen zwischen Cystein-Reste im Amino-Terminus und im Carboxy-Terminus des besagten zweiten Proteins konformationell versteift ist.
Die Population von eukaryotischen Zellen nach Anspruch 42, wobei die besagten Zellen Hefezellen sind.
Die Population von eukaryotischen Zellen nach Anspruch 42, wobei das besagte rekombinante DNA-Molekül desweiteren einen Genaktivierungsanteil kodiert, der kovalent an das besagte intrazelluläre Peptid gebunden ist.
Die Population von eukaryotischen Zellen nach Anspruch 42, wobei das besagte intrazelluläre Peptid physisch mit einem zweiten rekombinanten Protein in der besagten eukaryotischen Zelle interagiert.
Ein Verfahren zum Nachweis einer Interaktion zwischen einem ersten Protein und einem zweiten Protein, umfassend: (a) Bereitstellen eines Reportergens, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b) Bereitstellen eines ersten Fusionsproteins, das besagtes erstes Protein kovalent an einen Bindungsanteil gebunden umfasst, der in der Lage ist, spezifisch an die besagte DNA-Bindungsprotein-Erkennungsstelle zu binden; (c) Bereitstellen eines zweiten Fusionsproteins, das besagtes zweites Protein und einen Genaktivierungsanteil umfasst, wobei das besagte zweite Protein konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins; (d) Zusammenlagern des besagten Reportergens, des besagten ersten Fusionsproteins, und des besagten zweiten Fusionsproteins; und (e) Messen der Expression des besagten Reportergens.
Das Verfahren nach Anspruch 49, wobei das Bereitstellen des besagten ersten Fusionsproteins das Bereitstellen eines Fusionsgenes umfasst, welches das besagte erste Fusionsprotein exprimiert, und wobei das Bereitstellen des besagten zweiten Fusionsproteins das Bereitstellen eines zweiten Fusionsgenes umfasst, welches das besagte zweite Fusionsprotein exprimiert.
Ein Protein umfassend die Sequenz Leu-Val Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe (SEQ ID NO: 1).
Das Protein nach Anspruch 51, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Met-Val-Val-Ala-Ala-Glu-Ala-Val-Arg-Thr-Val-Leu-Leu-Ala-Asp-Gly-Gly-Asp-Val-Thr (SEQ ID NO: 2).
Das Protein nach Anspruch 53, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Pro-Asn-Trp-Pro-His-Gln-Leu-Arg-Val-Gly-Arg-Val-Leu-Trp-Glu-Arg-Leu-Ser-Phe-Glu (SEQ ID NO: 3).
Das Protein nach Anspruch 55, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Ser-Val-Arg-Met-Arg-Tyr-Gly-lle-Asp-Ala-Phe-Phe-Asp-Leu-Gly-Gly-Leu-Leu-His-Gly (SEQ ID No: 9)
Das Protein nach Anspruch 57, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Glu-Leu-Arg-His-Arg-Leu-Gly-Arg-Ala-Leu-Ser-Glu-Asp-Met-Val-Arg-Gly-Leu-Ala-Trp-Gly-Pro-Thr-Ser-His-Cys-Ala-Thr-Val-Pro-Gly-Thr-Ser-Asp-Leu-Trp-Arg-Val-lle-Arg-Phe-Leu (SEQ ID NO: 10).
Das Protein nach Anspruch 59, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Tyr-Ser-Phe-Val-His-His-Gly-Phe-Phe-Asn-Phe-Arg-Val-Ser-Trp-Arg-Glu-Met-Leu-Ala (SEQ ID NO: 11).
Das Protein nach Anspruch 61, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Gln-Val-Trp-Ser-Leu-Trp-Ala-Leu-Gly-Trp-Arg-Trp-Leu-Arg-Arg-Tyr-Gly-Trp-Asn-Met (SEQ ID NO: 12).
Das Protein nach Anspruch 63, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Trp-Arg-Arg-Met-Glu-Leu-Asp-Ala-Glu-Ile-Arg-Trp-Val-Lys-Pro-IIe-Ser-Pro-Leu-Glu (SEQ ID NO: 13).
Das Protein nach Anspruch 65, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassen die Sequenz Trp-Ala-Glu-Trp-Cys-Gly-Pro-Val-Cys-Ala-His-Gly-Ser-Arg-Ser-Leu-Thr-Leu-Leu-Thr-Lys-Tyr-His-Val-Ser-Phe-Leu-Gly-Pro-Cys-Lys-Met-IIe-Ala-Pro-IIe-Leu-Asp (SEQ ID No: 17).
Das Protein nach Anspruch 67, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Leu-Val-Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe (SEQ ID NO: 18).
Das Protein nach Anspruch 69, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Tyr-Arg-Trp-Gln-Gln-Gly-Val-Val-Pro-Ser-Asn-Trp-Ala-Ser-Cys-Ser-Phe-Arg-Cys-Gly (SEQ ID NO: 19).
Das Protein nach Anspruch 71, wobei das besagte Protein konformationell versteift ist.
Ein Protein umfassend die Sequenz Ser-Ser-Phe-Ser-Leu-Trp-Leu-Leu-Met-Val-Lys-Ser-IIe-Lys-Arg-Ala-Ala-Trp-Glu-Leu-Gly-Pro-Ser-Ser-Ala-Trp-Asn-Thr-Ser-Gly-Trp-Ala-Ser-Leu-Ala-Asp-Phe-Tyr (SEQ ID NO: 20).
Das Protein nach Anspruch 73, wobei das besagte Protein konformationell versteift ist.
DNA kodierend für das Protein nach Anspruch 51.
DNA kodierend für das Protein nach Anspruch 53.
DNA kodierend für das Protein nach Anspruch 55.
DNA kodierend für das Protein nach Anspruch 57.
DNA kodierend für das Protein nach Anspruch 59.
DNA kodierend für das Protein nach Anspruch 61.
DNA kodierend für das Protein nach Anspruch 63.
DNA kodierend für das Protein nach Anspruch 65.
DNA kodierend für das Protein nach Anspruch 67.
DNA kodierend für das Protein nach Anspruch 69.
DNA kodierend für das Protein nach Anspruch 71.
DNA kodierend für das Protein nach Anspruch 73.
Eine Verfahren zur Isolierung eines Proteins umfassend: (a) Bereitstellen einer Wirtszelle welche enthält: (i) ein Reportergen, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; und (ii) ein Fusionsgen, welches ein Fusionsprotein exprimiert, wobei das besagte Fusionsprotein ein Testprotein umfasst, das an einen Bindungsanteil kovalent gebunden ist, welcher in der Lage ist, an besagte DNA-Bindungsprotein-Erkennungsstelle spezifisch zu binden; (b) Einbringen eines zweiten Fusionsgenes in besagte Wirtszelle, welches ein zweites Fusionsprotein exprimiert, wobei das zweite Fusionsprotein umfasst: ein Protein einer Population von Proteinen und ein Genaktivierungsanteil, wobei das besagte eine Protein aus besagter Population von Proteinen konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des besagten einen Proteins aus besagter Population von Proteinen, (c) Messen der Expression des besagten Reportergens, und (d) Isolieren eines Proteins aufgrund seiner Fähigkeit, die Expression des besagten Reportergens zu verändern, wenn es in besagtem zweiten Fusionsprotein vorhanden ist.
Eine Verfahren zum Isolieren eines interagierenden Proteins, umfassend: (a) Bereitstellen eines Reportergens das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b) Bereitstellen eines ersten Fusionsproteins, wobei das besagte erste Fusionsprotein ein erstes Protein umfasst, das kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage ist, spezifisch an besagte DNA-Bindungsprotein-Erkennungsstelle zu binden; (c) Bereitstellen eines zweiten Fusionsproteins, wobei das besagte zweite Fusionsprotein ein zweites Protein und einen Genaktivierungsanteil umfasst, wobei das zweite Protein konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins, – wobei das besagte zweite Protein in der Lage ist, mit besagtem ersten Protein zu interagieren; (d) Inkontaktbringen eines Kandidaten für ein interagierendes Protein mit besagtem ersten Protein oder besagtem zweiten Protein; (e) Messen der Expression des besagten Reportergenes, und (f) Isolieren eines interagierenden Proteins aufgrund seiner Fähigkeit, die Expression des besagten Reportergens zu verändern, wenn es zusammen mit besagtem ersten Protein oder besagtem zweiten Protein vorhanden ist.
Ein Verfahren zum Bestimmen, ob ein erstes Protein in der Lage ist, mit einem zweiten Protein physisch zu interagieren, umfassend: (a) Bereitstellen einer Wirtszelle, welche enthält (i) ein Reportergen, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (ii) ein erstes Fusionsgen, welches ein erstes Fusionsprotein exprimiert, welches das besagte erste Protein kovalent gebunden an einen Bindungsanteil umfasst, der in der Lage ist, spezifisch an die besagte DNA-Bindungsprotein-Erkennungsstelle zu binden, wobei das besagte erste Protein konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des zweiten Proteins, und (iii) ein zweites Fusionsgen, welches ein zweites Fusionsprotein exprimiert, wobei das Fusionsprotein das besagte zweite Protein und einen Genaktivierungsanteil umfasst, und (b) Messen der Expression des besagten Reportergens als ein Maß für die Interaktion zwischen den besagten ersten und zweiten Proteinen.
Verwendung einer Population von eukaryotischen Zellen, wobei jede Zelle ein rekombinantes DNA-Molekül hat, das ein intrazelluläres Protein kodiert, welches konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des Proteins, wobei zumindest 100 unterschiedliche rekombinante Moleküle, die für unterschiedliche intrazelluläre, konformationell versteifte Peptide kodieren, in besagter Population sind, wobei jedes Molekül in zumindest einer Zelle der besagten Population ist, in einem intrazellulären Screen zur Identifizierung von interagierenden Proteinen, oder zur Identifizierung von Proteinen, die eine Zelle mit einer identifizierbaren Eigenart versehen.
Verwendung nach Anspruch 90, wobei der intrazelluläre Screen nicht transkriptionsbasiert ist.
Verwendung nach Anspruch 90, wobei die DNA, die für die konformationell versteiften Peptide kodiert, zufallsgeneriert ist.
Verfahren zum Identifizieren, und optional Isolieren, von antagonistischen oder agonistischen Proteinen, umfassend: – Bereitstellen einer Wirtszelle, welche ein Paar von interagierenden Proteinen enthält, und eines Reportergenes, dessen Expressionen durch das Paar von interagierenden Proteinen vermittelt wird, – Einbringen einer DNA, die für einen Kandidaten für ein agonistisches oder ein antagonistisches Protein in besagte Wirtszelle kodiert, wobei der besagte Kandidat für ein agonistisches oder ein antagonistisches Protein konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des Proteins, – Messen der Expression des besagten Reportergens – optional, Isolieren eines Protein-Agonisten, der die Fähigkeit hat, die Reportergen-Expression zu erhöhen, oder eines Protein-Antagonisten, der die Fähigkeit hat, die Reportergen-Expression zu verringern.
Verwendung eines konformationell versteiften Kandidaten für ein interagierendes Protein, um die Reportergen-Aktivität in einer eukaryotischen Zelle zu erhöhen oder zu verringern, wobei das Reportergen für ein Protein kodiert, das einen phänotypischen Marker bereitstellt, und wobei der besagte Kandidat für ein interagierendes Protein konformationell versteift ist, entweder – durch kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder Peptid, oder – durch Verknüpfen der Amino- und Carboxy-Termini des Kandidaten für ein interagierendes Protein.