-
Hintergrund
der Erfindung
-
Die Erfindung bezieht sich auf Verfahren
zum Detektieren von Protein-Interaktionen und zum Isolieren neuer
Proteine.
-
Zusammenfassung
der Erfindung
-
Im Allgemeinen zeichnet sich die
Erfindung durch Verfahren zum Detektieren von Interaktionen zwischen
Proteinen aus.
-
Dementsprechend zeichnet sich die
Erfindung in einem Aspekt durch ein Verfahren aus zum Bestimmen,
ob ein erstes Protein in der Lage ist, mit einem zweiten Protein
physisch zu interagieren. Das Verfahren beinhaltet (a) Bereitstellen
einer Wirtszelle, enthaltend (i) ein Reportergen, das funktionsfähig mit
einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (ii) ein
erstes Fusionsgen, das ein erstes Fusionsprotein exprimiert, wobei
das erste Fusionsprotein das erste Protein kovalent gebunden an einen
Bindungsanteil umfasst, welcher in der Lage ist, spezifisch an die
DNA-Bindungsprotein-Erkennungsstelle zu binden; und (iii) ein zweites
Fusionsgen, das ein zweites Fusionsprotein exprimiert, wobei das
zweite Fusionsprotein das zweite Protein und einen Genaktivierungsanteil
umfasst, wobei das zweite Protein konformationell versteift ist,
entweder
- – durch
kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes
Protein oder Peptid, oder
- – durch
Verknüpfen
der Amino- und Carboxy-Termini des zweiten Proteins,
und
(b) Messen der Expression des Reportergens als ein Maß für eine Interaktion
zwischen besagten ersten und zweiten Proteinen.
-
Vorzugsweise ist das zweite Protein
ein kurzes Peptid von mindestens 6 Aminosäuren Länge und es ist von weniger
oder gleich 60 Aminosäuren Länge; es
schließt
eine zufallsgenerierte oder bewusst gestaltete Peptidsequenz ein;
oder es ist konformationell versteift als Ergebnis kovalenten Bindens
an ein konformationsversteifendes Protein, z. B. Thioredoxin oder
ein Thioredoxin-ähnliches
Molekül.
Wenn das zweite Protein kovalent an ein konformationell versteifendes
Protein gebunden ist, weist die Erfindung ein Polypeptid auf, wobei
das zweite Protein in das konformationsversteifende Protein, an das Polypeptid
auf, wobei das zweite Protein in das konformationsversteifende Protein,
an das es kovalent gebunden ist, eingebettet ist. Wenn das konformationsversteifende
Protein Thioredoxin ist, weist die Erfindung auch ein zusätzliches
Verfahren auf, welches ein zweites Protein einschließt, das
konformationell über
Disulfidbrücken
zwischen Cystein-Resten
im Amino-Terminus und im Carboxy-Terminus des zweiten Proteins konformationell versteift
ist.
-
In einem anderen Aspekt weist die
Erfindung ein Verfahren zum Finden eines interagierenden Proteins
in einer Population von Proteinen auf, welches umfasst: (a) Bereitstellen
einer Wirtszelle, welche (i) ein Reportergen enthält, das
funktionsfähig
mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; und
(ii) ein Fusionsgen enthält,
welches ein Fusionsprotein exprimiert, wobei das Fusionsprotein
ein Testprotein enthält,
das kovalent an einen Bindungsanteil gebunden ist, welcher in der
Lage ist, spezifisch an die DNA-Bindungsprotein-Erkennungsstelle zu
binden; (b) Einführen
eines zweiten Fusionsgens, welches ein zweites Fusionsprotein exprimiert,
in die Wirtszelle, wobei das zweite Fusionsprotein ein Protein aus
besagter Population von Proteinen und einen Genaktivierungsanteil
einschließt,
wobei das besagte eine Protein aus besagter Population von Proteinen
konformationell versteift ist, entweder
- – durch
kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes
Protein oder Peptid, oder
- – durch
Verknüpfen
der Amino- und Carboxy-Termini des besagten einen Proteins aus besagter Population
von Proteinen;
und (c) Messen der Expression des Reportergens
als ein Maß für die Interaktion
zwischen besagtem Testprotein und besagtem einen Protein aus besagter
Population von Proteinen. Vorzugsweise schließt die Population von Proteinen
kurze Peptide von zwischen 1 und 60 Aminosäuren Länge ein.
-
Die Erfindung weist auch ein Verfahren
zum Finden eines interagierenden Proteins in einer Population auf,
wobei die Population von Proteinen eine Kollektion von zufallsgenerierten
oder bewusst gestalteten Peptid-Sequenzen ist, oder wobei die Population
von Proteinen durch kovalentes Binden an ein konformationsversteifendes
Protein konformationell versteift ist. Wenn die Population von Proteinen durch
kovalentes Binden an ein konformationsversteifendes Protein konformationell
versteift ist, ist die Population von Proteinen vorzugsweise in
das konformationsversteifende Protein eingebettet. Die Erfindung
weist ferner ein Verfahren zum Finden eines interagierenden Proteins
in einer Population auf, wobei das konformationsversteifende Protein
Thioredoxin ist.
-
Vorzugsweise ist die Population von
Proteinen in die Schleife des aktiven Zentrums des Thioredoxins
eingefügt.
-
Die Erfindung weist ferner ein Verfahren
auf, wobei jedes aus der Population von Proteinen über Disulfid-Brücken zwischen
Cysteinresten im Amino-Terminus und im Carboxy-Terminus des besagten Proteins
versteift ist.
-
In bevorzugten Ausführungsformen
von verschiedenen Aspekten ist die Wirtszelle Hefe; die DNA-Bindedomäne ist LexA;
und/oder das Reportergen wird über
eine Farbreaktion oder über
die Zell-Lebensfähigkeit
nachgewiesen. In anderen Ausführungsformen
kann der Köder
Cdk2 oder eine Ras-Proteinsequenz sein. In einem anderen verwandten
Aspekt weist die Erfindung ein Verfahren zum Identifizieren eines
Kandidaten für
ein Interagens auf. Das Verfahren umfasst (a) Bereitstellen eines
Reportergens, das funktionsfähig
mit einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b)
Bereitstellen eines ersten Fusionsproteins, welches ein erstes Protein
einschließt,
das kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage
ist, spezifisch an die DNA-Bindungsprotein-Erkennungsstelle
zu binden; (c) Bereitstellen eines zweiten Fusionsproteins, welches
ein zweites Protein und einen Genaktivierungsanteil einschließt, wobei das
besagte zweite Protein konformationell versteift ist, entweder
- – durch
kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes
Protein oder Peptid, oder
- – durch
Verknüpfen
der Amino- und Carboxy-Termini des zweiten Proteins, wobei das zweite
Protein in der Lage ist, mit dem besagten ersten Protein zu interagieren;
(d)
Inkontaktbringen des besagten Kandidaten für ein Interagens mit besagtem
ersten Protein und/oder besagtem zweiten Protein; und (e) Messen
der Expression des besagten Reportergens.
-
Die Erfindung weist ein Verfahren
zum Identifizieren eines Kandidaten für ein Interagens auf, wobei
das erste Fusionsprotein durch Bereitstellen eines ersten Fusionsgens
bereitgestellt wird, welches das erste Fusionsprotein exprimiert,
und wobei das zweite Fusionsprotein durch Bereitstellen eines zweiten
Fusionsgens bereitgestellt wird, welches das besagte zweite Fusionsprotein
exprimiert.
-
(Alternativ sind das Reportergen,
das erste Fusionsgen und das zweite Fusionsgen auf einem einzigen
Stück DNA
eingeschlossen.)
-
Die Erfindung weist auch ein Verfahren
zum Identifizieren eines Kandidaten für ein Interagens auf, wobei
das erste Fusionsprotein und das zweite Fusionsprotein vor Kontakt
mit besagtem Kandidaten für
ein Interagens interagieren dürfen,
und ein verwandtes Verfahren, wobei das erste Fusionsprotein und
der Kandidat für
ein Interagens vor Kontakt mit besagtem zweiten Fusionsprotein interagieren
dürfen.
-
In einer bevorzugten Ausführungsform
ist der Kandidat für
ein Interagens konformationell versteift, entweder durch kovalentes
Binden an seinen Amino- und Carboxy-Termini an ein anderes Protein oder
Peptid, oder durch Verknüpfen
seiner Amino- und Carboxy-Termini.
Wenn der Kandidat für
ein Interagens ein Antagonist ist, ist die Expression des Reportergens
reduziert. Wenn der Kandidat für
ein Interagens ein Agonist ist, ist die Reportergen-Expression erhöht. Der
Kandidat für
ein Interagens ist ein Mitglied, welches aus der Gruppe bestehend
aus Proteinen, Polynukleotiden, und kleinen Molekülen ausgewählt ist.
Zusätzlich
kann der Kandidat für
ein Interagens durch ein Mitglied einer cDNA- oder einer synthetischen
DNA-Bibliothek kodiert sein. Darüber hinaus
kann der Kandidat für
ein Interagens eine mutierte Form des besagten ersten Fusionsproteins oder
des besagten zweiten Fusionsproteins sein.
-
In einem verwandten Aspekt weist
die Erfindung eine Population von eukaryotischen Zellen auf, wobei
jede Zelle ein rekombinantes DNA-Molekül enthält, das ein intrazelluläres Peptid
kodiert, welches konformationell versteift ist, entweder
- – durch
kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes
Protein oder Peptid, oder
- – durch
Verknüpfen
der Amino- und Carboxy-Termini des Peptids, wobei zumindest 100
unterschiedliche rekombinante Moleküle, die für unterschiedliche intrazelluläre, konformationell
versteifte Peptide kodieren, in besagter Population vorhanden sind,
wobei jedes Molekül
in zumindest einer Zelle der besagten Population vorhanden ist.
-
Vorzugsweise sind die intrazellulären Peptide
in der Population von Zellen konformationell versteift, da sie kovalent
an ein konformationsversteifendes Protein gebunden sind.
-
In bevorzugten Ausführungsformen
ist das intrazelluläre
Peptid in das konformationsversteifende Protein, vorzugsweise Thioredoxin,
eingebettet; das intrazelluläre
Peptid ist konformationell über
Disulfidbrücken
zwischen Cystein-Resten im Amino-Terminus und im Carboxy-Terminus
des besagten zweiten Proteins versteift; die Population der eukaryotischen
Zellen sind Hefezellen; das rekombinante DNA-Molekül kodiert
ferner für
einen Genaktivierungsanteil, der kovalent an das besagte intrazelluläre Peptid
gebunden ist; und/oder das intrazelluläre Peptid interagiert physisch
mit einem zweiten rekombinanten Protein innerhalb der besagten eukaryotischen
Zellen.
-
In einem anderen Aspekt weist die
Erfindung ein Verfahren zum Nachweisen einer Interaktion zwischen
einem ersten Protein und einem zweiten Protein auf. Das Verfahren
beinhaltet: (a) Bereitstellen eines Reportergens, das funktionsfähig mit
einer DNA-Bindungsprotein-Erkennungsstelle
verbunden ist; (b) Bereitstellen eines ersten Fusionsproteins, das
ein erstes Protein einschließt,
welches kovalent an einen Bindungsanteil gebunden ist, welcher in
der Lage ist spezifisch an die DNA-Bindungsprotein-Erkennungsstelle zu
binden; (c) Bereitstellen eines zweiten Fusionsproteins, das ein
zweites Protein und einen Genaktivierungsanteil einschließt, wobei
das besagte zweite Protein konformationell versteift ist, entweder
- – durch
kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes
Protein oder Peptid, oder
- – durch
Verknüpfen
der Amino- und Carboxy-Termini des zweiten Proteins;
(d)
Zusammenlagern des Reportergens, des ersten Fusionsproteins und
des zweiten Fusionsproteins; und (e) Messen der Expression des Reportergens.
-
Die Erfindung weist ferner ein Verfahren
zum Nachweisen der Interaktion zwischen zwei Proteinen auf, wobei
das erste Fusionsprotein durch Bereitstellen eines ersten Fusionsgens
bereitgestellt wird, welches das erste Fusionsprotein exprimiert
und wobei das zweite Fusionsprotein durch Bereitstellen eines zweiten
Fusionsgens bereitgestellt wird, welches das zweite Fusionsprotein
exprimiert.
-
Die Erfindung bezieht sich ferner
auf ein Verfahren zum Isolieren eines Proteins, umfassend:
- (a) Bereitstellen einer Wirtszelle, enthaltend:
- (i) ein Reportergen, das funktionsfähig mit einer DNA-Bindungsprotein-Erkennungsstelle
verbunden ist; und (ii) ein Fusionsgen, welches ein Fusionsprotein
exprimiert, wobei das besagte Fusionsprotein ein Testprotein umfasst,
das kovalent an einen Bindungsanteil gebunden ist, welcher in der
Lage ist, spezifisch an die besagte DNA-Bindungsprotein-Erkennungsstelle
zu binden;
- (b) Einführen
eines zweiten Fusionsgens in die besagte Wirtszelle, welches ein
zweites Fusionsprotein exprimiert, wobei das besagte zweite Fusionsprotein
umfasst:
ein Protein aus einer Population von Proteinen und
einen Genaktivierungsanteil, wobei das besagte eine Protein aus
besagter Population von Proteinen konformationell versteift ist,
entweder
- – durch
kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes
Protein oder Peptid, oder
- – durch
Verknüpfen
der Amino- und Carboxy-Termini des besagten einen Proteins aus besagter Population
von Proteinen,
- (c) Messen der Expression des besagten Reportergens, und (d)
Isolieren eines Proteins aufgrund seiner Fähigkeit, die Expression des
besagten Reportergens zu verändern,
wenn es in besagtem zweitem Fusionsprotein vorhanden ist.
-
Die Erfindung bezieht sich ferner
auf ein Verfahren zum Isolieren eines interagierenden Proteins, umfassend:
(a) Bereitstellen eines Reportergens, das funktionsfähig mit
einer DNA-Bindungsprotein-Erkennungsstelle verbunden ist; (b) Bereitstellen eines
ersten Fusionsproteins, wobei das besagte erste Fusionsprotein ein
erstes Protein umfasst, das kovalent an einen Bindungsanteil gebunden
ist, welcher in der Lage ist, spezifisch an besagte DNA-Bindungsprotein-Erkennungsstelle
zu binden; (c) Bereitstellen eines zweiten Fusionsproteins, wobei
das besagte zweite Fusionsprotein ein zweites Protein und einen
Genaktivierungsanteil umfasst, wobei das besagte zweite Protein
konformationell versteift ist, entweder
- – durch
kovalentes Binden an seinen Amino- und Carboxy-Termini an ein anderes
Protein oder Peptid, oder
- – durch
Verknüpfen
der Amino- und Carboxy-Termini des zweiten Proteins, wobei das besagte zweite
Protein in der Lage ist, mit besagtem ersten Protein zu interagieren;
(d)
Inkontaktbringen eines Kandidaten für ein interagierendes Protein
mit besagtem ersten Protein oder besagtem zweiten Protein; (e) Messen
der Expression des besagten Reportergens, und (f) Isolieren eines
interagierenden Proteins aufgrund seiner Fähigkeit, die Expression des
besagten Reportergens zu verändern,
wenn es zusammen mit besagtem ersten Protein oder besagtem zweiten
Protein vorhanden ist.
-
In noch einem anderen Aspekt weist
die Erfindung ein Protein auf, das die Sequenz Leu-Val-Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe
(SEQ ID NO: 1) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Met-Val-Val-Ala-Ala-Glu-Ala-Val-Arg-Thr-Val-Leu-Leu-Ala-Asp-Gly-Gly-Asp-Val-Thr (SEQ
ID NO: 2) einschließt;
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Pro-Asn-Trp-Pro-His-Gln-Leu-Arg-Val-Gly-Arg-Val-Leu-Trp-Glu-Arg-Leu-Ser-Phe-Glu
(SEQ ID NO: 3) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Ser-Val-Arg-Met-Arg-Tyr-Gly-Ile-Asp-Ala-Phe-Phe-Asp-Leu-Gly-Gly-Leu-Leu-His-Gly
(SEQ ID NO: 9) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Glu-Leu-Arg-His-Arg-Leu-Gly-Arg-Ala-Leu-Ser-Glu-Asp-Met-Val-Arg-Gly-Leu-Ala-Trp-Gly-Pro-Thr-Ser-His-Cys-Ala-Thr-Val-Pro-Gly-Thr-Ser-Asp-Leu-Trp-Arg-Val-Ile-Arg-Phe-Leu
(SEQ ID NO: 10) einschließt, vorzugsweise
konformationell versteift; ein Protein, das die Sequenz Tyr-Ser-Phe-Val-His-His-Gly-Phe-Phe-Asn-Phe-Arg-Val-Ser-Trp-Arg-Glu-Met-Leu-Ala
(SEQ ID NO: 11) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Gln-Val-Trp-Ser-Leu-Trp-Ala-Leu-Gly-Trp-Arg-Trp-Leu-Arg-Arg-Tyr-Gly-Trp-Asn-Met
(SEQ ID NO: 12) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Trp-Arg-Arg-Met-Glu-Leu-Asp-Ala-Glu-Ile-Arg-Trp-Val-Lys-Pro-Ile-Ser-Pro-Leu-Glu (SEQ ID NO:
13) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Trp-Ala-Glu-Trp-Cys-Gly-Pro-Val-Cys-Ala-His-Gly-Ser-Arg-Ser-Leu-Thr-Leu-Leu-Thr-Lys-Tyr-His-Val-Ser-Phe-Leu-Gly-Pro-Cys-Lys-Met-Ile-Ala-Pro-Ile-Leu-Asp (SEQ ID NO:
17) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Leu-Val-Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe
(SEQ ID NO: 18) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Tyr-Arg-Trp-Gln-Gln-Gly-Val-Val-Pro-Ser-Asn-Trp-Ala-Ser-Cys-Ser-Phe-Arg-Cys-Gly
(SEQ ID NO: 19) einschließt,
vorzugsweise konformationell versteift; ein Protein, das die Sequenz Ser-Ser-Phe-Ser-Leu-Trp-Leu-Leu-Met-Val-Lys-Ser-Ile-Lys-Arg-Ala-Ala-Trp-Glu-Leu-Gly-Pro-Ser-Ser-Ala-Trp-Asn-Thr-Ser-Gly-Trp-Ala-Ser-Leu-Ala-Asp-Phe-Tyr
(SEQ ID NO: 20) einschließt,
vorzugsweise konformationell versteift; und im Wesentlichen reine DNA,
die für
die unmittelbar vorangehenden Proteine kodiert.
-
Die Erfindung schließt ferner
neue Proteine und andere Kandidaten für Interaktoren ein, die mit den
vorangehenden Methoden identifiziert wurden. Es wird verständlich sein,
dass diese Proteine und die Kandidaten für Interaktoren die Reportergenaktivität entweder
erhöhen
oder erniedrigen können
und dass diese Veränderungen
mit Testverfahren gemessen werden können, die hier beschrieben
oder im Stand der Technik bekannt sind.
-
Im hier verwendeten Sinne ist mit „Reportergen" ein Gen gemeint,
dessen Expression nachgewiesen werden kann; solche Gene schließen ein, ohne
darauf beschränkt
zu sein, lacZ, Aminosäure-biosynthetische
Gene, z. B. die Hefegene LEU2, HIS3, LYS2, TRP1, oder URA3, Nukleinsäure-biosynthetische
Gene, das Säugetier-Gen
von Chloramphenicol-Transacetylase
(CAT) oder ein beliebiges Oberflächenantigen,
für welches
spezifische Antikörper
verfügbar
sind. Reportergene können
für jedes Protein
kodieren, das einen phänotypischen
Marker bereitstellt, z. B. ein Protein, das für das Zellwachstum notwendig
ist oder ein toxisches Protein, das zu Zelltod führt, oder sie können für ein Protein
kodieren, das über
einen Farbtest nachweisbar ist, der zur Anwesenheit oder Abwesenheit
von Farbe (z. B. fluoreszierende Proteine oder Derivate davon) führt. Alternativ
kann ein Reportergen für
eine Suppressor-tRNA kodieren, deren Expression einen Phänotyp produziert,
der nachgewiesen werden kann. Ein Reportergen gemäß der vorliegenden
Erfindung schließt
Elemente (z. B. alle Promotor-Elemente) ein, die für die Reportergen-Funktion notwendig
sind.
-
Mit „funktionsfähig verbunden" ist gemeint, dass
ein Gen und regulatorische Sequenzen) auf solche Weise verbunden
sind, dass sie Genexpression erlauben, wenn die geeigneten Moleküle (z. B.
transkriptionelle Aktivatorproteine oder Proteine, welche transkriptionsaktivierende
Domänen
einschließen) an
die regulatorische(n) Sequenzen) gebunden sind.
-
Mit „kovalent gebunden" ist gemeint, dass zwei
Domänen über kovalente
Bindungen direkt oder indirekt verbunden sind. Das heißt, dass
die „kovalent
gebundenen" Proteine
oder Protein-Anteile entweder unmittelbar zusammenhängend oder
durch Abschnitte von ein oder mehr Aminosäuren innerhalb desselben Fusionsproteins
getrennt sind.
-
Mit „Bereitstellen" ist das Einführen der
Fusionsproteine in das Interaktionssystem, sequentiell oder gleichzeitig,
und direkt (als Proteine) oder indirekt (als Gene, die diese Proteine
kodieren) gemeint.
-
Mit „Protein" ist eine Sequenz von Aminosäuren beliebiger
Länge gemeint,
die das gesamte oder einen Teil eines natürlich vorkommenden Polypeptides
oder Peptides darstellt, oder ein nicht natürlich vorkommendes Polypeptid
oder Peptid darstellt (z. B. eine zufallsgenerierte Peptidsequenz
oder eine Sequenz aus einer bewusst gestalteten Kollektion von Peptid-Sequenzen),
gemeint.
-
Mit einem „Bindungsanteil" ist ein Abschnitt von
Aminosäuren
gemeint, welcher in der Lage ist, das spezifische Binden eines Polypeptides
an eine bestimmte DNA-Sequenz (d. h. eine „DNA-Bindungsprotein-Erkennungsstelle") zu dirigieren.
-
Mit einem „schwachen Genaktivierungsanteil" ist ein Abschnitt
von Aminosäuren
gemeint, welcher in der Lage ist, die Expression eines Gens an dessen
Kontrollregion er gebunden ist, schwach zu induzieren. So wie hier
verwendet, bedeutet „schwach" einen Level von
Aktivierung unterhalb der Aktivierung, die durch die GAL4 Aktivierungsregion
II (Ma und Ptashne, Cell 48: 847, 1987) bewirkt wird, und ist vorzugsweise
bei oder unterhalb des Levels an Aktivierung, die durch die B112
Aktivierungsdomäne
von Ma und Ptashne (Cell 51: 113, 1987) bewirkt wird. Levels der
Aktivierung können
durch Verwendung eines beliebigen nachfolgenden Reportergensystems
gemessen werden und durch Vergleichen, in parallelen Tests, der
Expression, die durch das Polypeptid der GAL4-Region II stimuliert
wird, mit dem Level der Expression, die durch das zu testende Polypeptid
stimuliert wird.
-
Mit „Verändern der Expression des Reportergens" ist eine Zunahme
oder Abnahme in der Expression des Reportergens in dem Ausmaße gemeint, wie
sie für
die Detektion einer Veränderung
in dem verwendeten Test benötigt
wird. Es wird verständlich sein,
dass das Maß der
Veränderung
abhängig
von dem Typ des Reportergen-Konstruktes oder des verwendeten Reportergen-Expressionstests
variieren wird. Mit „konformationell
versteift" ist ein
Protein gemeint, dass eine reduzierte strukturelle Flexibilität hat, da
seine Amino- und
Carboxy-Termini räumlich fixiert
sind. Vorzugsweise wird das konformationell versteifte Protein auf
eine strukturell steife Weise präsentiert.
Konformationelle Versteifung im Sinne der vorliegenden Erfindung
kann durch Ausnutzen der Disulfidbindungsfähigkeit eines natürlichen
oder rekombinant eingeführten
Paares von Cysteinresten herbeigeführt werden, wobei ein Cysteinrest
sich an oder nahe dem Aminoterminalen Ende des interessierenden
Proteins befindet und der andere an oder nahe dem Carboxy-terminalen
Ende. Alternativ kann die konformationelle Versteifung durch Einbetten
des interessierenden Proteins in ein konformationsversteifendes
Protein erleichtert werden.
-
Mit „konformationsversteifendem
Protein" ist ein
beliebiges Peptid oder Polypeptid gemeint, welches in der Lage ist,
die Flexibilität
der Amino- und/oder Carboxy-Termini eines anderen Proteins zu reduzieren.
Vorzugsweise stellen solche Proteine ein starres Gerüst oder
eine Plattform für
das interessierende Protein bereit. Zusätzlich sind solche Proteine vorzugsweise
fähig,
einen Schutz gegen proteolytischen Abbau und ähnliches bereitzustellen, und/oder sie
sind fähig,
Löslichkeit
zu verbessern. Beispiele für konformationsversteifende
Proteine schließen
Thioredoxin und andere Thioredoxinähnliche Proteine ein, Nukleasen
(z. B. RNase A), Proteasen (z. B. Trypsin), Proteaseinhibitoren
(z. B. Rinderpankreas-Trypsininhibitor (bovine pancreatic trypsin
inhibitor)), Antikörper
oder strukturell starre Fragmente davon, und Conotoxine. Ein konformationsversteifendes
Peptid kann von einer beliebigen angemessen Länge sein und kann sogar ein
einziger Aminosäurerest
sein.
-
„Thioredoxin-ähnliche
Proteine" sind hier
definiert als Aminosäuresequenzen,
die im Wesentlichen ähnlich
sind, z. B. mindestens 18% Homologie haben, zu der Aminosäuresequenz
von E. coli-Thioredoxin über
eine Aminosäuresequenzlänge von
80 Aminosäuren.
Alternativ ist eine Thioredoxin-ähnliche
DNA-Sequenz hier als eine DNA-Sequenz
definiert, die für
ein Protein oder ein Fragment eines Proteins kodiert, das durch
eine dreidimensionale Struktur charakterisiert ist, die im Wesentlichen ähnlich zu derjenigen
von humanem oder E. coli-Thioredoxin ist, z. B. Glutaredoxin und
optional dadurch gekennzeichnet ist, dass sie eine Schleife für ein aktives Zentrum
enthält.
Die DNA-Sequenz von Glutaredoxin ist ein Beispiel für ein Thioredaxin-ähnliche
DNA-Sequenz, die
für ein
Protein kodiert, das eine solche wesentliche Ähnlichkeit in der dreidimensionalen
Konformation aufweist und die Schleife für ein Cys .... Cys aktives
Zentrum enthält.
Die Aminosäuresequenz
von E. coli-Thioredoxin ist in Eklund et al., EMBO J. 3: 1443–1449 (1984)
beschrieben. Die dreidimensionale Struktur von E. coli-Thioredoxin ist in 2 von Holmgren, J. Biol.
Chem. 264: 13963–13966
(1989) beschrieben. Eine DNA-Sequenz, die für das E. coli-Thioredoxinprotein
kodiert, ist in Lim et al., J. Bacteriol., 163: 311–316 (1985)
niedergelegt. Die dreidimensionale Struktur des humanen Thioredoxin
ist in Forman-Kay et al., Biochemistry 30: 2685–98 (1991) beschrieben. Ein
Vergleich der dreidimensionalen Strukturen von E. coli-Thioredoxin und
Glutaredoxin ist in Xia, Protein Science I: 310–321 (1992) publiziert. Diese
vier Publikationen sind hier per Referenz einbezogen, mit dem Ziel,
Informationen über
Thioredoxin-ähnliche
Proteine bereitzustellen, die dem Fachmann bekannt ist.
-
Beispiele für Thioredoxin-ähnliche
Proteine sind hier beschrieben.
-
Mit „Kandidaten für Interagenzien" sind Proteine gemeint
(„Kandidaten
für interagierende
Proteine") oder
Verbindungen, welche physische mit dem interessierenden Protein
interagieren; dieser Begriff umfasst auch Agonisten und Antagonisten.
Agonistische Interagenzien sind als Verbindungen oder Proteine bestimmt,
die die Fähigkeit
haben, die Reportergen-Expression, die durch ein Paar von interagierenden
Proteinen vermittelt wird, zu erhöhen. Antagonistische Interagenzien
sind als Verbindungen oder Proteine bestimmt, die die Fähigkeit
haben, die Reportergenexpression, die durch ein Paar von interagierenden
Proteinen vermittelt wird, zu vermindern.
-
„Verbindungen" beinhalten kleine
Moleküle, im
Allgemeinen unter 1000 MW, Kohlehydrate, Polynukleotide, Lipide
und ähnliches.
-
Mit „Testprotein" ist eines von einem
Paar von interagierenden Proteinen gemeint, wobei der andere Teilnehmer
des Paares im Allgemeinen als ein „Kandidat für ein Interagens" Supra) bezeichnet wird.
-
Mit „zufallsgeneriert" sind Sequenzen gemeint,
die keine vorher festgelegte Sequenz haben; dies steht im Gegensatz
zu „bewusst
gestalteten" Sequenzen,
die eine DNA- oder Proteinsequenz oder ein Motiv haben, das vor
ihrer Synthese bestimmt wurde.
-
Mit „mutiert" ist verändert in Sequenz gemeint, entweder
durch gezielte (site-directed) Mutagenese oder Zufallsmutagenese.
Eine mutierte Form eines Proteins umfasst Punktmutationen genauso wie
Insertionen, Deletionen oder Umlagerungen (rearrangements).
-
Mit „intrazellulär" ist gemeint, dass
das Peptid innerhalb der Zelle statt auf der Zelloberfläche lokalisiert
ist.
-
Mit einem „aktivierten Ras" ist eine beliebige mutierte
Form von Ras gemeint, die an GTP für einen Zeitabschnitt gebunden
bleibt, der länger
ist als derjenige, der von der entsprechenden Wildtypform des Proteins
gezeigt wird. Mit „Ras" ist eine beliebige Form
von Ras-Proteinen gemeint, die, ohne darauf beschränkt zu sein,
N-ras, K-ras und H-ras einschließt.
-
Die Interaktionsfallensysteme, die
hier beschrieben sind, haben Vorteile gegenüber konventionelleren Methoden
zum Isolieren von interagierenden Proteinen oder Genen, die für interagierende Proteine
kodieren.
-
WO 94/10300 beschreibt ein Verfahren
zum Bestimmen, ob ein erstes Protein in der Lage ist, mit einem
zweiten Protein physisch zu interagieren. Das Verfahren beinhaltet:
- (a) Bereitstellen einer Wirtszelle, enthaltend
- (i) ein Reportergen, das funktionsfähig mit einer Proteinbindungsstelle
verbunden ist;
- (ii) ein erstes Fusionsgen, welches ein erstes Fusionsprotein
exprimiert, wobei das erste Fusionsprotein das erste Protein einschließt, das
kovalent an einen Bindungsanteil gebunden ist, welcher in der Lage
ist, spezifisch an die Proteinbindungsstelle zu binden; und
- (iii) ein zweites Fusionsgen, welches ein zweites Fusionsprotein
exprimiert, wobei das zweite Fusionsprotein das zweite Protein einschließt, welches
kovalent an einen schwachen Genaktivierungsanteil gebunden ist;
und
- (b) Messen der Expression des Reportergens als ein Maß für die Interaktion
zwischen den ersten und den zweiten Proteinen.
-
Chakraborty et al. (J. Biol. Chem.
207: 17498–17501,
1992) beschreiben ein Verfahren zum Detektieren von Protein-Protein-Interaktionen
zwischen HLH-Proteinen in vivo, in welchem die Dimerisation durch
das HLH-Motiv einen hybriden Transkriptionsfaktor rekonstruiert,
der die DNA-bindende Domäne
von Hefe GAL4 an ein HLH-Motiv gebunden enthält und die Aktivierungsdomäne von VP-16
an ein anderes gebunden enthält.
-
Zum Beispiel stellen die Systeme
des Anmelders schnelle und kostengünstige Verfahren bereit, die
einen sehr breiten Nutzen zum Identifizieren und Reinigen von Genen
haben, die für
einen großen Umfang
von nützlichen
Proteinen kodieren, basierend auf der physischen Interaktion des
Proteins mit einem zweiten Polypeptid. Dieser breite Nutzen ergibt
sich teilweise aus der Tatsache, dass die Komponenten der Systeme
leicht modifziert werden können, um
die Detektion von Proteininteraktionen von weit voneinander variierenden
Affinitäten
zu erleichtern (z. B. durch Verwenden von Reportergenen, die sich quantitativ
in ihrer Sensitivität
gegenüber
Proteininteraktionen unterscheiden). Die induzierbare Natur des
verwendeten Promotors zum Exprimieren der interagierenden Proteine
vergrößert ebenfalls
den Rahmen von Kandidaten für
Interagenzien, welche detektiert werden können, da sogar Proteine, deren dauerhafte
Expression für
die Wirtszelle toxisch ist, einfach durch Induzieren eines kurzen
Schubes (engl. burst) der Expression des Proteins und durch Testen
auf seine Fähigkeit
zu interagieren und die Expression eines Reporeergens zu stimulieren,
isoliert werden können.
-
Wenn gewünscht, kann die Interaktion
von den interagierenden Proteinen durch die Verwendung von Anhängen (Tags)
von schwachen Genaktivierungsdomänen
erreicht werden. Dieser Ansatz vermeidet Beschränkungen auf den Fundus an verfügbaren Kandidaten
für interagierende
Proteine, welche mit stärkeren
Aktivierungsdomänen
(z. B. solchen wie GAL4 oder VP16) assoziiert werden können; obwohl
der Mechanismus unklar ist, resultiert eine solche Beschränkung anscheinend
von niedrigen bis mäßigen Graden
an Toxizität
auf die Wirtszelle, die von der starken Aktivierungsdomäne vermittelt wird.
-
Zusätzlich verwenden die beanspruchten Verfahren
konformationell versteifte Proteine (d. h. Proteine mit reduzierter
Flexibilität
aufgrund von Versteifungen an ihren Amino- und Carboxy-Termini). Konformationelle
Versteifung kann durch Einbetten des interessierenden Proteins in
ein konformationsversteifendes Protein erreicht werden (d. h. ein
Protein von angemessener Länge
und Aminosäurezusammensetzung,
um in der Lage zu sein, den Kandidaten für ein interagierendes Protein
in eine bestimmte dreidimensionale Struktur festzulegen). Beispiele
für konformationsversteifende
Proteine beinhalten, sind aber nicht beschränkt auf, Thioredoxin (oder
andere Thioredoxin-ähnliche
Proteine), Nukleasen (z. B. RNase A), Proteasen (z. B. Trypsin),
Proteaseininhibitoren (z. B. Rinderpankreas-Trypsininhibitor (bovine
pancreatic trypsin inhibitor)), Antikörper oder strukturell starre
Fragmente davon, und Conotoxine.
-
Alternativ kann konformationelle
Versteifung durch Ausnutzen der Disulfid-bindenden Fähigkeit
eines natürlichen
oder rekombinant eingeführten
Paares von Cysteinresten erreicht werden, wobei sich ein Cysteinrest
am Aminoterminus des interessierenden Proteines und der andere an
seinem Carboxy-Terminus befindet. Solche Disulfidbindungen legen
das Protein in eine starre und daher konformationell versteifte
Schleifenstruktur fest. Disulfidbindungen zwischen den Amino-terminalen
und Carboxy-terminalen Cysteinresten können z. B. im Zytoplasma von
E. coli trxB mutanten Stämmen
gebildet werden. Unter bestimmten Bedingungen können Disulfidbindungen auch
im Zytoplasma und Kern von höheren
Organismen, die äquivalente
Mutationen tragen, gebildet werden, zum Beispiel in einem S. cerevisiae
YTR4– mutanten
Stamm (Furter et al., Nucl Acids Res. 14: 6357–6373, 1986; GenBank Accession
Number P29509). Zusätzlich
sind die hier beschriebenen Thioredoxinfusionen (trxA-Fusionen)
für diese
alternativen Mittel des Einführens
konformationeller Versteifung zugänglich, da die Cysteine, die
an der Basis der Peptide, die in die Schleife des aktiven Zentrums des
Thioredoxins eingefügt
werden, in einem passenden Abstand voneinander sind, um Disulfidbrücken unter
passenden Bedingungen zu bilden.
-
Konformationell versteifte Proteine
sind als Kandidaten in der Erfindung nützlich, da sie für die Analyse
der Tertiärstruktur
zugänglich
sind, was das Design von einfachen organischen Molekülmimetika mit
verbesserten pharmakologischen Eigenschaften erleichtert. Zum Beispiel
kann, da Thioredoxin eine bekannte Struktur hat, die Proteinstruktur
zwischen den konformationell versteiften Regionen unter Verwendung
von Methoden wie NMR und Röntgendifferenzanalyse
leichter gelöst
werden. Ferner schützen bestimmte
konformationsversteifende Proteine das eingebettete Protein vor
zellulärem Abbau
und/oder Erhöhen
die Löslichkeit
des Proteins und/oder verändern
in anderer Weise die Fähigkeit
des Kandidaten für
ein Interagens zu interagieren.
-
Wenn sie einmal isoliert sind, können die
interagierenden Proteine ferner unter Verwendung des Interaktionsfallensystems
analysiert werden, wobei das Signal, das durch die Interaktion erzeugt
wird, ein Anzeichen für
eine Veränderung
in den Interaktionsfähigkeiten
des Proteins darstellt. In einem speziellen Beispiel wird eine Veränderung
an einem oder beiden der interagierenden Proteine vorgenommen (z.
B. durch Standard in vivo oder in vitro gerichtete oder Zufallsmutagenese-Verfahren)
und der Effekt der Veränderungen)
wird durch Messen der Reportergenexpression verfolgt. Mit dieser
Technik werden interagierende Proteine mit erhöhtem oder verringertem Interaktionspotential
isoliert. Solche Proteine sind als therapeutische Moleküle (z. B.
Agonisten oder Antagonisten) nützlich
oder, wie oben beschrieben, als Modelle zum Design einfacher organischer
Molekülmimetika.
-
Unter Verwendung einer Variation
des Interaktionsfallensystems können
ferner Proteinagonisten und Antagonisten leicht identifiziert und
isoliert werden. Insbesondere wird, sobald eine Protein-Protein-Interaktion
registriert worden ist, eine zusätzliche DNA,
die für
einen Kandidaten für
einen Agonisten oder Antagonisten kodiert, oder vorzugsweise, eine Sequenz
aus einer Bibliothek für
potentielle Agonisten oder Antagonisten kodierenden Sequenzen in
die Wirtszelle eingeführt
und die Reportergenexpression gemessen. Alternativ werden Kandidaten
für interagierende
Agonisten- oder Antagonisten-Verbindungen (d. h. einschließlich Polypeptide
als auch nicht-proteinische Verbindungen, z. B. einzelsträngige Polynukleotide)in
ein in vivo oder in vitro Interaktionsfallensystem gemäß der Erfindung
eingeführt
und ihre Fähigkeit
gemessen, eine Reportergenexpression zu bewirken. Eine Verringerung
in der Expression des Reportergens (im Vergleich zu einer Kontrolle, der
die Kandidaten-Sequenz oder – Verbindung
fehlt) weist auf einen Antagonisten hin. Umgekehrt weist eine Zunahme
in Expression des Reportergens (wiederum im Vergleich zu einer Kontrolle)
auf einen Agonisten hin. Interaktionsagonisten und Antagonisten sind
als therapeutische Agenzien oder als Modelle zum Design einfacher
Mimetika nützlich;
falls gewünscht,
kann ein Agonist- oder Antagonist-Protein konformationell versteift
sein, um die Vorteile, die hier beschrieben sind, bereitzustellen.
Besondere Beispiele für
interagierende Proteine, für
welche Antagonisten oder Agonisten identifiziert werden können, schließen ein,
sind aber nicht beschränkt
auf, das IL-6 Rezeptor-Ligandenpaar, das TGF-β-Rezeptor-Ligandenpaar, das
IL-1 Rezeptor-Ligandenpaar und andere Rezeptor-Ligandeninteraktionen,
Proteinkinase-Substrat-Paare, interagierende Paare von Transkriptionsfaktoren, interagierende
Komponenten von Signaltransduktionswegen (zum Beispiel zytoplasmatische
Domänen
von bestimmten Rezeptoren und G-Proteinen), Paare von interagierenden
Proteinen, die an der Regulation des Zellzyklus beteiligt sind (z.
B. p16 und CDK4), und Paare von Neurotransmittern. Ferner sind in
der vorliegenden Erfindung Bibliotheken eingeschlossen, die für konformationell
versteifte Proteine kodieren. Solche Bibliotheken (welche natürliche genauso
wie synthetische DNA-Sequenzsammlungen umfassen können) werden
intrazellulär
exprimiert oder, optional, in zellfreien Systemen, und sie können zusammen
mit einer beliebigen standardgenetischen Selektion oder Screen genutzt
werden, oder mit einem beliebigen aus einer Zahl von Interaktionsfallen-Formaten
zur Identifikation interagierender Proteine, Agonisten oder Antagonistenproteine
oder Proteine, die eine Zelle mit identifizierbaren Charakteristika
versehen, z. B. Proteine, die das Fortschreiten des Zellzyklus beeinträchtigen. Dementsprechend
können
Peptidkodierende Bibliotheken (entweder zufälliger oder gestalteter Art)
für Selektionen
oder Screens verwendet werden, welche entweder transkriptionsbasiert
sind oder nicht. Diese Bibliotheken (welche vorzugsweise mindestens
100 unterschiedliche Peptid-kodierende Spezies und mehr bevorzugt
1000 oder 100000 oder mehr individuelle Spezies einschließen) können in
einen beliebigen nützlichen
prokaryotischen oder eukaryotischen Wirt transformiert werden, wobei
Hefe den bevorzugten Wirt repräsentiert.
Alternativ können
solche Peptid-kodierenden Bibliotheken in zellfreien Systemen exprimiert
werden.
-
Andere Merkmale und Vorteile der
Erfindung werden aus der folgenden detaillierten Beschreibung und
aus den Patentansprüchen
deutlich werden.
-
Kurze Beschreibung
der Zeichnungen
-
Die Zeichnungen werden zuerst kurz
beschrieben.
-
1A–1C veranschaulichen einen
Interaktionsfallensystem gemäß der Erfindung.
-
2 ist
ein Diagramm des Bibliotheksvektors pJM1.
-
3A ist
eine Photographie, die die Interaktion von Peptidaptameren mit anderen
Proteinen zeigt.
-
3B veranschaulicht
die Sequenz von beispielhaften Cdk2 interagierenden Peptiden.
-
4 veranschaulicht
die Kopräzipitation der
Peptide 3 und 13 durch Gst-Cdk2. Spur 1. Gst-Kügelchen (beads), der Extrakt
enthält
TrxA;
Spur 2. Gst-Kügelchen
(beads), der Extrakt enthält das
TrxA-Peptid 3;
Spur 3. Gst-Kügelchen (beads), der Extrakt
enthält TrxA-Peptid
13;
Spur 4. Gst-Cdk2-Kügelchen
(beads), der Extrakt enthält
TrxA;
Spur 5. Gst-Cdk2-Kügelchen
(beads), der Extrakt enthält
TrxA-Peptid 3; und
Spur 6. Gst-Cdk2, der Extrakt enthält TrxA-Peptid
13.
-
5 veranschaulicht
den Vektor BRM116-H-Ras(G12V).
-
6 veranschaulicht
den Vektor pEG202-H-Ras(G12V).
-
Detaillierte Beschreibung
-
Die Anmelder haben ein neues Interaktionsfallensystem
zur Identifikation und Analyse von konformationell versteiften Proteinen
entwickelt, welche entweder physisch mit einem zweiten interessierenden
Protein interagieren oder welche einer solchen Interaktion entgegenwirken
(engl. antagonize) oder sie fördern
(engl. agonize). In einer Ausführungsform gehört zu dem
System ein eukaryotischer Wirtsstamm (z. B. ein Hefestamm), welcher
so konstruiert ist, dass er ein Protein von therapeutischem oder
diagnostischem Interesse als ein Fusionsprotein, das an eine bekannte
DNA-Bindungsdomäne kovalent gebunden
ist, produziert; dieses Protein wird als „Köder"-Protein
bezeichnet, da es sein Zweck in dem System ist, nützliche
aber noch unbekannte oder uncharakterisierte interagierende Polypeptide
(als „Beute" bezeichnet; siehe
unten) zu „fangen". Der eukaryotische
Wirtsstamm beinhaltet ferner ein oder mehrere „Reportergene", d. h. Gene, deren
Transkription als Antwort auf eine Köder-Beute-Interaktion detektiert wird. Köder-Proteine
binden über
ihre DNA-Bindungsdomäne
an ihre spezifische DNA-Erkennungsstelle stromaufwärts von
einem Reportergen; die Transkription des Reporters wird jedoch nicht
stimuliert, da dem Köder-Protein
eine Aktivierungsdomäne
fehlt.
-
Um DNA-Sequenzen zu isolieren, die
für neue
interagierende Proteine kodieren, werden Mitglieder einer DNA-Expressionsbibliothek
(z. B. einer cDNA oder einer synthetischen DNA-Bibliothek, die entweder
zufälliger
An oder bewusst ausgerichtet (biased) ist) in den Stamm, der das
Reportergen und das Köder-Protein
enthält,
eingeführt;
jedes Mitglied der Bibliothek lenkt die Synthese eines Kandidaten für ein interagierendes
Protein, das an ein Tag für eine
nicht variable Genaktivierungsdomäne fusioniert ist. Diese Bibliothekkodierten
Proteine, die physikalisch mit dem promotorgebunden Köder-Protein interagieren,
werden als „Beute"-Proteine bezeichnet. Solche
gebundenen Beute-Proteine aktivieren (über ihren Aktivierungsdomänen-Tag)
nachweisbar die Expression des stromabwärts gelegenen Reportergens
und stellen ein fertiges Testsystem zum Identifizieren eines bestimmten
DNA-Klones, der für
ein interessierendes interagierendes Protein kodiert, bereit. In
der vorliegenden Erfindung, ist jeder Kandidat für ein Beute-Protein konformationell versteift (beispielsweise
entweder durch Einbetten des Proteins in ein konformationsversteifendes
Protein oder durch Verknüpfen
der Amino- und Carboxy-Termini
des Proteins). Ein solches Protein wird in einer fixierten dreidimensionalen
Struktur gehalten, was das Design von Arzneimittelmimetika erleichtert.
-
Ein Beispiel für ein Interaktionsfallensystem gemäß der Erfindung
ist in den 1A-C gezeigt. 1A zeigt einen Leucin-auxotrophen
Hefestamm, der zwei Reportergene enthält, LexAop-LEU2 und LexAop-lacZ
und ein konstitutiv exprimiertes Gen für ein Beute-Protein. Das Beute-Protein
(als Fünfeck dargestellt)
ist an eine DNA-Bindungsdomäne (als Kreis
dargestellt) fusioniert. Das DNA-Bindungsprotein erkennt und bindet
an eine spezifische DNA-Bindungsprotein-Erkennungsstelle (als gefülltes Rechteck
dargestellt), welche funktionsfähig
mit einem Reportergen verbunden ist. In 1B und 1C enthalten die
Zellen zusätzlich
Kandidaten für
Beute-Proteine (Kandidaten für
Interaktoren) (gezeigt als leeres Rechteck in 1B und als leeres Sechseck in 1C), die an eine Aktivierungsdomäne (als
gefülltes
Quadrat dargestellt) fusioniert sind; jedes Beute-Protein ist in ein
konformationsversteifendes Protein (als zwei gefüllte Halbkreise dargestellt)
eingebettet. 1B zeigt,
dass, wenn der Kandidat für
eine Beute-Protein nicht mit dem transkriptionell inerten LexA-Fusionsbeuteprotein
interagiert, die Reportergene nicht transkribiert werden; die Zelle
kann auf einem leu–-Medium nicht zu einer
Kolonie heranwachsen, und sie ist auf einem Xgal-Medium weiß, da sie
keine β-Galaktosidase-Aktivität enthält. 1C zeigt, dass, wenn der
Kandidat für
ein Beute-Protein mit dem Köder
interagiert, beide Reportergene aktiv sind; die Zelle bildet eine
Kolonie auf leu–-Medium und die Zellen in der Kolonie
haben β-Galaktosidase-Aktivität und sind blau
auf Xgal-Medium. Vorzugsweise ist in diesem System das Köder-Protein
(d. h., das Protein, das eine ortsspezifische DNA-Bindungsdomäne enthält) transkriptionell
inert, und die Reportergene (welche von dem Köder-Protein gebunden sind)
haben im Wesentlichen keine basale Transkription.
-
Jede Komponente des Systems wird
nun detaillierter beschrieben.
-
Köder-Proteine
-
Der Wirtsstamm für die Selektion, der in den 1A–C gezeigt
ist, enthält
eine DNA, die für
ein Köder-Protein
kodiert, das an eine DNA fusioniert ist, die für einen DNA-Bindungsanteil kodiert, der von dem
bakteriellen LexA-Protein abgeleitet ist. Die Verwendung einer LexA-DNA-Bindungsdomäne ergibt bestimmte
Vorteile. Zum Beispiel enthält
der LexA-Anteil in Hefe keine Aktivierungsfunktion und hat keinen
bekannten Effekt auf die Transkription von Hefegenen (Brent und
Ptashne, Nature 312: 612–615,
1984; Brent und Ptashne, Cell 43: 729–736, 1985). Zusätzlich erlaubt
die Verwendung der LexA eher als beispielsweise der GAL4 DNA-Bindungsdomäne eine
konditionale Expression von Beute-Proteinen als Antwort auf Induktion
durch Galaktose; dies erleichtert den Nachweis von Beute-Proteinen,
die auf die Wirtszelle toxisch sein können, wenn sie kontinuierlich
exprimiert werden. Schließlich
erlaubt die Verwendung eines wohl definierten Systemes, dass Kenntnis
bezüglich
der Interaktion zwischen LexA und der LexA-Bindungsstelle (d. h.
des LexA-Operators) für
den Zweck der Optimierung der Operatorbesetzung und/oder Optimierung
der Geometrie des gebundenen Proteins ausgenutzt wird, um eine maximale
Genaktivierung zu bewirken.
-
Vorzugsweise schließt das Köder-Protein ferner
eine LexA-Dimerisierungsdomäne
ein; diese optionale Domäne
erleichtert eine effiziente Bildung des LexA-Dimers. Da LexA an
seine DNA-Bindungsstelle als Dimer bindet, optimiert der Einbezug
dieser Domäne
in das Köder-Protein
auch die Effizienz der Besetzung des Operators (Golemis und Brent,
Mol. Cell Biol. 12: 3006–3014,
1992).
-
LexA repräsentiert eine bevorzugte DNA-Bindungsdomäne für die Erfindung.
Jedoch kann jede andere transkriptionell inerte oder im Wesentlichen
transkriptionell inerte DNA-Bindungsdomäne in dem
Interaktionsfallensystem verwendet werden; solche DNA-Bindungsdomänen sind
wohlbekannt und schließen
die DNA-bindenden Teile der Proteine ACE1 (CUP1), lambda cI, lac-Repressor, jun,
fos, GCN4 oder des Tet-Repressors ein. Die GAL4 DNA-Bindungsdomäne repräsentiert
einen etwas weniger bevorzugten DNA-Bindungsanteil für die Köder-Proteine.
-
Köder-Proteine
können
aus einem beliebigen interessierenden Protein gewählt werden
und schließen
Proteine unbekannter, bekannter oder vermuteter diagnostischer,
therapeutischer oder pharmakologischer Bedeutung ein. Bevorzugte
Köder-Proteine
umfassen Onkoproteine (solche wie myc, insbesondere der C-Terminus
von myc, ras, src, fos, und insbesondere die oligomeren Interaktionsdomänen von
fos) oder jegliche anderen Proteine, die an der Regulation des Zellzyklus
beteiligt sind (wie Kinasen, Phosphatasen, die zytoplasmatischen
Teile von Membran-assoziierten Rezeptoren) ein. Besondere Beispiele für bevorzugte
Köder-Proteine
schließen
cyclin und cyclin-abhängige
Kinasen (zum Beispiel Cdk2) oder Rezeptor-Liganden-Paare, oder Neurotransmitterpaare
oder Paare anderer Signalproteine ein. In jedem Falle ist das interessierende Protein
an eine bekannte DNA-Bindungsdomäne, wie
sie im Allgemeinen hier beschrieben ist, fusioniert. Beispiele,
bei denen Cdk2- und Ras-Köder
verwendet wurden, sind unten dargestellt.
-
Reporter
-
Wie in 1B dargestellt,
enthält
ein bevorzugter Wirtsstamm gemäß. der Erfindung
zwei unterschiedliche Reportergene, das LEU2-Gen und das lacZ-Gen,
wobei jedes eine stromaufwärts
gelegene Bindestelle für
das Köder-Protein
trägt.
Die Reportergene, die in 1B gezeigt
sind, schließen
jeweils als stromaufwärts
gelegene Bindungsstelle ein oder mehrere LexA-Operatoren anstelle
der ursprünglichen
Upstream Activation Sequences (UASs) ein. Diese Reportergene können in
das Chromosom integriert werden oder als autonom replizierende Plasmide
(z. B. Hefe 2μ-Plasmide)
getragen werden.
-
Eine Kombination von zwei solchen
Reportern ist für
die in vivo-Ausführungsformen
der Erfindung aus einer Zahl von Gründen bevorzugt. Erstens erlaubt
die LexAop-LEU2-Konstruktion
Zellen, die interagierende Proteine enthalten, um sich selbst beim Wachstum
auf Medium, welchem Leucin fehlt, zu selektieren, was die Untersuchung
von großen
Zahlen von Zellen, die potentielle Kandidaten für interagierende Proteine enthalten,
erleichtert. Zweitens erlaubt der LexAop-ZacZ-Reporter, das LEU+-Zellen schnell gescreent werden können, um
eine Interaktion zu bestätigen.
Und drittens stellt neben anderen technischen Überlegungen der LexAop-LEU2-Reporter
eine extrem sensitive erste Selektion bereit, während der LexAop-lacZ-Reporter
eine Unterscheidung zwischen Proteinen von unterschiedlichen Interaktionsaffinitäten erlaubt.
-
Obwohl die hier beschriebenen Reportergene
eine bevorzugte Ausführungsform
der Erfindung repräsentieren,
können
andere äquivalente
Gene, deren Expression mit Standardtechniken nachgewiesen oder getestet
werden kann, ebenfalls in Verbindung mit oder anstelle von den LEU2-
und lacZ-Genen verwendet werden. Im Allgemeinen kodieren solche
Reportergene für
ein Enzym, das einen phänotypischen
Marker bereitstellt, beispielsweise ein Protein, das für das Zellwachstum
notwendig ist, oder ein toxisches Protein, das zu Zelltod führt, oder
sie kodieren für
ein Protein, das über
einen Farbtest, oder weil seine Expression zur Anwesenheit oder
Abwesenheit von Farbe führt,
nachweisbar ist. Alternativ kann das Reportergen für eine Suppressor-tRNA
kodieren, deren Expression beispielsweise dadurch getestet werden
kann, dass sie eine lethale Wirtszellmutation supprimiert. Spezielle
Beispiele von anderen nützlichen
Genen, deren Transkription nachgewiesen werden kann, schließen Aminosäure- und
Nukleinsäurebiosynthetische
Gene (wie Hefe HIS3, URA3, TRP1, und LYS2) GALT, E. coli galK (welches
das Hefe GAL1-Gen komplementiert), und die Reportergene CAT, GUS,
fluoreszierende Proteine und Derivate davon, und jegliches Gen,
das ein Zelloberflächenantigen,
für welches
Antikörper
verfügbar
sind, kodiert (z. B. CD4), ein. Reportergene können entweder über qualitative
oder quantitative Mittel nachgewiesen werden, um Kandidaten für Interaktoren
als Agonisten oder Antagonisten zu unterscheiden.
-
Beute-Proteine
-
In der hier beschriebenen Selektion
wird eine weitere DNA-Konstruktion verwendet, welche für eine Serie
von Kandidaten für
interagierende Proteine (d. h. Beute-Proteine) kodiert; jedes ist
konformationell versteift, entweder durch Einbetten in ein konformationsversteifendes
Protein oder weil die Amino- und Carboxy-Termini des Beute-Proteins verbunden sind
(d. h. über
eine Disulfidbindung). Ein beispielhaftes Beute-Protein schließt einen
nicht variablen N-terminalen Anteil ein, der vom Amino- zum Carboxy-Terminus ein ATG
für die
Proteinexpression trägt, eine
optionale Kernlokalisationssequenz, eine schwache Aktivierungsdomäne (z. B.
die B112- oder B42-Aktivierungsdomänen von
Ma und Ptashne; Cell 51: 113, 1987) und ein optionales Epitop-Tag für einen
schnellen immunologischen Nachweis der Synthese des Fusionsproteins.
Bibliothekssequenzen, zufällig
oder bewusst gestaltete synthetische DNA-Sequenzen, oder Sequenzen,
die für
konformationell versteifte Proteine kodieren, können stromabwärts von
diesem N-terminalen Fragment inseriert werden, um Fusionsgene zu
erzeugen, die für
Beute-Proteine kodieren.
-
Auch andere Beute-Proteine als die
hier beschriebenen sind in der Erfindung nützlich. Zum Beispiel können cDNAs
von einer beliebigen mRNA-Population konstruiert und in einen äquivalenten
Expressionsvektor inseriert werden. Eine solche Bibliothek nach
Wahl kann de novo unter Verwendung kommerziell erhältlicher
Kits (z. B. von Stratagene, La Jolla, CA) oder unter Verwendung
gut etablierter, präparativer
Verfahren (siehe z. B. Current Protocols in Molecular Biology, New
York, John Wiley & Sons, 1987)
konstruiert werden. Alternativ ist eine Zahl von cDNA-Bibliotheken
(aus einer Zahl von unterschiedlichen Organismen) öffentlich
und kommerziell erhältlich;
Quellen für
Bibliotheken schließen
z. B. Clontech (Palo Alto, CA) und Stratagene (La Jolla, CA) ein.
Es wird ferner angemerkt, dass die Beute-Proteine keine natürlich vorkommenden
full-length Polypeptide sein müssen.
In bevorzugten Ausführungsformen
werden die Beute-Proteine von synthetischen DNA-Sequenzen kodiert,
sind die Produkte von zufallsgenerierten offenen Leserastern, sind
offene Leseraster, die mit einer bewussten Sequenztendenz (engl.
intentional sequence bias) synthetisiert wurden, oder sind Teile davon.
Vorzugsweise kodieren solche kurzen zufallsgenerierten Sequenzen
für Peptide
zwischen 1 (und vorzugsweise 6) und 60 Aminosäuren Länge. In einem speziellen Beispiel
schließt
das Beute-Protein nur eine Interaktionsdomäne ein; solch eine Domäne kann
als Therapeutikum nützlich
sein, um die Aktivität
(d. h. als Antagonist oder Agonist) des Köder-Proteins zu modulieren.
-
In ähnlicher Weise kann eine beliebige
Zahl von Aktivierungsdomänen
für diesen
Teil des Beutemoleküls
verwendet werden; solche Aktivierungsdomänen sind vorzugsweise schwache
Aktivierungsdomänen,
d. h. schwächer
als der Anteil der GAL4-Aktivierungsregion
II und vorzugsweise nicht stärker
als B112 (so wie z. B. durch Vergleich mit der GAL4-Aktivierungsregion
II oder B112 in parallelen β-Galaktosidase-Nachweisverfahren
unter Verwendung von lacZ-Reportergenen gemessen); eine solche Domäne kann
jedoch schwächer
sein als B112. Insbesondere erlaubt es die außerordentliche Sensitivität des LEU2
Selektionsschemas, das auch extrem schwache Aktivierungsdomänen im Rahmen
der Erfindung verwendet werden können.
Beispiele für
andere nützliche
Aktivierungsdomänen
schließen
B17, B42, und die amphipathischen Helix (AH)-Domänen ein, die in Ma und Ptashne
(Cell 51: 113, 1987), Ruden et al. (Nature 350: 426–430, 1991),
und Giniger und Ptashne (Nature 330: 670, 1987) beschrieben sind.
-
Die Beute-Proteine können, falls
gewünscht, andere
optionale Kernlokalisationssequenzen einschließen (d. h. solche, die von
den GAL4 oder MATα2-Genen
abgeleitet sind) oder andere optionale Epitop-Tags (z. B. Teile
des c-myc-Proteins oder des Flag-Epitops, das von Immunex erhältlich ist).
Diese Sequenzen optimieren die Effizienz des Systems, werden aber
für seine
Funktion nicht benötigt.
Insbesondere optimiert die Kernlokalisationssequenz die Effizienz,
mit welcher die Beute-Moleküle
das kernlokalisierte Reportergenkonstrukt (e) erreichen, wodurch
ihre effektive Konzentration erhöht
wird und was es erlaubt, schwächere
Proteininteraktionen nachzuweisen. Der Epitop-Tag erleichtert lediglich
einen einfachen Immuntest zur Expression des Fusionsproteins.
-
Der Fachmann wird ferner erkennen,
dass die Komponenten des oben beschriebenen Reportergens, der DNA-Bindungsdomäne, und
der Genaktivierungsdomäne
von einer beliebigen eukaryotischen oder prokaryotischen Quelle
abgeleitet werden können, einschließlich Hefe-,
Säugerzell-,
und prokaryotischen Zell-Genomen oder cDNAs sowie von künstlichen
Sequenzen. Obwohl Hefe einen bevorzugten Wirtsorganismus für das Interaktionsfallensystem
darstellt (aus Gründen
der einfachen Vermehrung, genetischen Manipulation und des Screenings
in großem
Format), können
darüber
hinaus auch andere Wirtsorganismen wie Säugetierzellen verwendet werden.
Wenn ein Säugersystem
gewählt wird,
ist das bevorzugte Reportergen das sensitive und leicht nachweisbare
CAT-Gen; brauchbare DNA-Bindungsdomänen und Genaktivierungsdomänen können von
den oben beschriebenen gewählt werden
(z. B. die LexA DNA-Bindungsdomäne
und die B42- oder B112-Aktivierungsdomänen).
-
Konformationsversteifende
Proteine
-
Gemäß einer Ausführungsform
der vorliegenden Erfindung ist die DNA-Sequenz, die für das Beute-Protein
kodiert, in eine DNA-Sequenz eingebettet, die für ein konformationsversteifendes
Protein (d. h. ein Protein, das die Flexibilität der Amino- und Carboxy-Termini
des Beute-Proteins verringert) eingebettet. Verfahren zum direkten
Verbinden der Amino- und Carboxy-Termini eines Proteins (z. B. durch Disulfidbindung
von in passender Weise positionierten Cystein-Resten) sind oben
beschrieben. Als Alternative zu diesem Ansatz können konformationsversteifende
Proteine verwendet werden. Im Allgemeinen wirken die konformationsversteifenden
Proteine als Gerüste
oder Plattformen, welche die Zahl der möglichen dreidimensionalen Konfigurationen, die
das interessierende Peptid oder Protein annehmen kann, begrenzen.
Bevorzugte Beispiele für
konformationsversteifende Proteine sind Thioredoxin oder andere
Thioredoxin-ähnliche
Sequenzen, aber viele andere Proteine sind für diesen Zweck ebenfalls nützlich.
Vorzugsweise sind konformationsversteifende Proteine von kleiner
Größe (im Allgemeinen
weniger als oder gleich 200 Aminosäuren), starr in der Struktur,
von bekannter dreidimensionaler Konfiguration, und sie sind in der
Lage, Insertionen von interessierenden Proteinen ohne eine unmäßige Störung ihrer
Strukturen aufzunehmen. Ein Schlüsselmerkmal
solcher Proteine ist die Verfügbarkeit
von Stellen auf ihren dem Lösungsmittel
exponierten Oberflächen,
an welchen Peptidinsertionen durchgeführt werden können (z.
B. die Schleife des aktiven Zentrums im Thioredoxin). Es ist ferner
bevorzugt, dass die Gene, die ein konformationsversteifendes Protein produzieren,
in verschiedenen prokaryotischen und eukaryotischen Wirten oder
in passenden zellfreien Systemen hoch exprimierbar sind, und dass
die Proteine löslich
und widerstandsfähig
gegenüber
Protease-Abbau sind. Beispiele für
konformationsversteifende Proteine, die im Rahmen der Erfindung
verwendbar sind, schließen
Nukleasen (z. B. RNase A), Proteasen (z. B. Trypsin), Protease-Inhibitoren
(z. B. Rinderpankreas-Trypsininhibitor (bovine pancreatic trypsin
inhibitor)), Antikörper
oder starre Fragmente davon, und Conotoxine ein. Diese Liste ist
jedoch nicht beschränkend.
Es wird erwartet, dass andere konformationsversteifende Proteine,
die Sequenzen haben, die nicht oben genannt wurden, oder die noch nicht
identifiziert oder publiziert wurden, aufgrund ihrer strukturellen
Stabilität
und Starrheit brauchbar sein können.
-
Wie oben erwähnt, ist ein bevorzugtes konformationsversteifendes
Protein gemäß der Erfindung
das Thioredoxin oder andere Thioredoxin-ähnliche Proteine. Als ein Beispiel
für ein
Thioredoxin-ähnliches
Protein, das im Rahmen dieser Erfindung verwendbar ist, hat das
E. coli-Thioredoxin die folgenden Eigenschaften. E. coli-Thioredoxin
ist ein kleines Protein von nur 11,7 kD und kann in großer Menge
produziert werden. Die kleine Größe und die Fähigkeit
des Proteins in großer
Menge synthetisiert zu werden, tragen zu einer hohen intrazellulären Konzentration
bei. E. coli-Thioredoxin ist weiterhin durch eine sehr stabile Tertiärstruktur
charakterisiert, welche eine Proteinreinigung erleichtern kann.
-
Die dreidimensionale Struktur von
E. coli-Thioredoxin ist bekannt und enthält einige Oberflächenschleifen,
einschließlich
einer detulichen (engl. distinctive) Cys .... Cys-Schleife des aktiven
Zentrums zwischen den Resten Cys33 und Cys36, welche aus dem Körper des
Proteins hervorragt. Diese Cys .... Cys-Schleife des aktiven Zentrums
ist eine erkennbare, zugängliche
Oberflächenschleifenregion und
ist nicht an Interaktionen mit dem Rest des Proteins beteiligt,
welche zur gesamten strukturellen Stabilität beitragen. Daher ist es ein
guter Kandidat für
eine Stelle für
Beuteprotein-Insertionen. Humanes Thioredoxin, Glutaredoxin, und
andere Thioredoxin-ähnliche
Moleküle
enthalten ebenfalls diese Cys .... Cys-Schleife des aktiven Zentrums.
Sowohl die Amino- und Carboxyl-Termini
des E. coli-Thioredoxin sind auf der Oberfläche des Proteins und sind ebenfalls
für eine
Fusionskonstruktion leicht zugänglich. E.
coli-Thioredoxin ist auch gegenüber
Proteasen stabil, stabil in Hitze bis zu 80°C und stabil gegenüber niedrigem
pH.
-
Andere Thioredoxin-ähnliche
Proteine, die durch im Rahmen dieser Erfindung nützliche Thioredoxin-ähnliche
DNA-Sequenzen kodiert werden, haben homologe Aminosäuresequenzen
und ähnliche physikalische
und strukturelle Charakteristika gemeinsam. Daher können DNA-Sequenzen,
die für andere
Thioredoxin-ähnliche
Proteine kodieren, anstelle von E. coli-Thioredoxin gemäß dieser
Erfindung verwendet werden. Zum Beispiel sind die DNA-Sequenz, die
für das
für das
Thioredoxin einer anderen Spezies kodieren, z. B. humanes Thioredoxin,
geeignet. Humanes Thioredoxin hat eine dreidimensionale Struktur,
die der dreidimensionalen Struktur desjenigen von E. coli praktisch überlagert werden
kann, so wie es durch Vergleich der NMR-Strukturen der beiden Moleküle festgestellt wurde.
Forman-Kay et al., Biochem. 30: 2685 (1991). Humanes Thioredoxin
enthält
ebenfalls eine Schleife des aktiven Zentrums, die strukturell und
funktionell zu der Cys .... Cys-Schleife des aktiven Zentrums, das
in dem E. coli-Protein
gefunden wird, äquivalent ist.
Es kann daher anstelle oder zusätzlich
zu E. coli-Thioredoxin
für die
Produktion von Protein und kleinen Peptiden gemäß dem Verfahren dieser Erfindung
verwendet werden. Insertionen in die Schleife des aktiven Zentrums
des humanen Thioredoxin und auf den Amino-Terminus können genauso
gut toleriert werden wie solche in E. coli-Thioredoxin.
-
Andere Thioredoxin-ähnliche
Sequenzen, welche im Rahmen dieser Erfindung eingesetzt werden können, schließen das
gesamte oder Teile der Proteine Glutaredoxin und der Homologen davon
aus verschiedenen Spezies ein (Holmgren, supra). Obwohl E. coli-Glutaredoxin und
E. coli-Thioredoxin weniger als 20% Aminosäurehomologie gemeinsam haben,
haben die zwei Proteine konformationelle und funktionelle Ähnlichkeiten
(Eklund et al., EMBO J. 3: 1443–1449
(1984)), und Glutaredoxin enthält
eine Schleife des aktiven Zentrums, die strukturell und funktionell äquivalent
zu der Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin
ist. Glutaredoxin ist daher ein Thioredoxin-ähnliches Molekül, wie es
hier definiert ist.
-
Außerdem kann die DNA-Sequenz,
die für das
Proteindisulfid-Isomerase (PDI) kodiert, oder für den Anteil, der die Thioredoxin-ähnliche
Domäne enthält, und
ihre Homologen aus verschiedenen Spezies (Edman et al., Nature 317:
267–270
(1985)) können
ebenfalls als Thioredoxin-ähnliche
DNA-Sequenz eingesetzt werden, da eine wiederholte Domäne von PDI
mehr als 30% Homologie mit E. coli-Thioredoxin gemeinsam hat und
diese wiederholte Domäne
eine Schleife des aktiven Zentrums enthält, die strukturell und funktionell äquivalent
zu der Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist.
Die beiden letzteren Publikationen sind per Referenz hier einbezogen,
mit dem Ziel, Information über
Glutaredoxin und PDI zur Verfügung
zu stellen, welche dem Fachmann bekannt und zugänglich ist.
-
In ähnlicher Weise kann die DNA-Sequenz, die
für die
Phosphoinositid-spezifische Phospholipase C (PI-PLC), Fragmente
davon und Homologe davon aus verschiedenen Spezies (Bennett et al.,
Nature, 334: 268–270
(1988)) in der vorliegenden Verwendung als Thioredoxin-ähnliche
Sequenz basierend auf der Aminosäuresequenzhomologie
mit E. coli-Thioredoxin eingesetzt werden, oder alternativ basierend
auf der Ähnlichkeit
in der dreidimensionalen Konformation und der Anwesenheit einer
Schleife des aktiven Zentrums, die strukturell und funktionell äquivalent
zur Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin
ist. Die gesamte oder ein Teil der DNA-Sequenz, die für das Protein
des endoplasmatischen Retikulums ERp72, oder Homologe davon aus
verschiedenen Spezies, kodieren, sind ebenfalls als Thioredoxin-ähnliche
DNA-Sequenzen für
die Zwecke dieser Erfindung eingeschlossen (Mazzarelle et al., J.
Biol. Chem. 265: 1094–1101 (1990)),
basierend auf ihrer Aminosäuresequenzähnlichkeit
oder alternativ basierend auf der Ähnlichkeit in der dreidimensionalen
Konformation und der Anwesenheit einer Schleife des aktiven Zentrums,
die strukturell und funktionell äquivalent
zur Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin
ist. Eine andere Thioredoxin-ähnliche
Sequenz ist eine DNA-Sequenz, welche den gesamten oder einen Teil
des adulten T-Cell Leukemia-Derived Factor (ADF) oder Homologe davon
aus anderen Spezies kodieren (Wakasugi et al., Proc. Natl. Acad. Sci.
USA, 87: 8282–8286
(1990)). ADF wird nunmehr für
das humane Thioredoxin gehalten. In ähnlicher Weise kann das Protein,
das verantwortlich ist für
die Förderung
der Disulfidbindungsbildung im Periplasma von E. coli, das Produkt
des dsbA-Gens (Bardwell et al., Cell 67: 581–89, 1991) ebenfalls als eine
Thioredoxin-ähnliche
Sequenz angesehen werden. Die drei letzteren Publikationen sind
per Referenz hier einbezogen mit dem Ziel, Informationen über PI-PLC, ERp72, ADF,
und dsbA zur Verfügung
stellen, welche dem Fachmann bekannt und zugänglich ist.
-
Es wird ausgehend von der Definition
der Thioredoxin-ähnlichen
Sequenzen, die oben verwendet wurde, erwartet, dass andere Sequenzen,
die nicht speziell oben identifiziert wurden, oder die vielleicht
noch nicht identifiziert oder publiziert wurden, ebenfalls als Thioredoxin-ähnliche
Sequenzen basierend auf der Homologie ihrer Aminosäuresequenz
zu E. coli-Thioredoxin oder basierend auf dem Vorhandensein von
dreidimensionalen Strukturen, die im Wesentlichen ähnlich zu
E. coli oder humanem Thioredoxin sind, oder auf dem Vorhandensein
einer Schleife des aktiven Zentrums, die funktionell und strukturell äquivalent
zu der Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin ist,
brauchbar sein können.
Ob ein Molekül
diese letzteren zwei Charakteristika hat, kann ein Fachmann durch
Vergleichen seiner dreidimensionalen Struktur, wie sie beispielsweise
durch Röntgenkristallographie
oder zweidimensionale NMR-Spektroskopie analysiert wurde, mit der
publizierten dreidimensionalen Struktur für E. coli-Thioredoxin, feststellen
und durch Analysieren der Aminosäuresequenz
des Moleküls,
um zu bestimmen, ob es eine Schleife des aktiven Zentrums enthält, die
strukturell und funktionell äquivalent
zur Cys .... Cys-Schleife des aktiven Zentrums von E. coli-Thioredoxin
ist. Mit „im
Wesentlichen ähnlich" in der dreidimensionalen
Struktur oder Konformation ist gemeint, dass es so ähnlich zu
E. coli-Thioredoxin ist, wie Glutaredoxin es ist. Darüber hinaus ist
ein Vorhersage-Algorithmus beschrieben worden, welcher die Identifizierung
von Thioredoxin-ähnlichen
Molekülen über computerunterstützte Analyse der
Primärsequenz
ermöglicht
(Ellis et al., Biochemistry 31: 4882–91 (1992)). Basierend auf
der obigen Beschreibung wird ein Fachmann in der Lage sein, eine
Thioredoxin-ähnliche
DNA-Sequenz zur Verwendung im Rahmen dieser Erfindung auszuwählen und
zu identifizieren, oder, falls gewünscht, zu modifizieren, ohne
dass er auf unmäßiges Experimentieren
zurückgreifen
muss. Zum Beispiel sind einfache Punktmutationen, die an Teilen
des nativen Thioredoxins oder nativer Thioredoxinähnlicher
Sequenzen gemacht werden, welche nicht die Struktur des resultierenden
Moleküls
bewirken (engl. effect), alternative Thioredoxin-ähnliche
Sequenzen, genauso wie es allelische Varianten von nativem Thioredoxin
oder nativen Thioredoxin-ähnlichen
Sequenzen sind.
-
DNA-Sequenzen, welche mit der Sequenz für E. coli-Thioredoxin
oder seinen strukturellen Homologen unter entweder stringenten oder
lockeren Hybridisierungsbedingungen hybridisieren, kodieren ebenfalls
Thioredoxin-ähnliche
Proteine zur Verwendung im Rahmen dieser Erfindung. Ein Beispiel
für eine
solche stringente Hybridisierungsbedingung ist die Hybridisierung
bei 4 × SSC
bei 65°C,
gefolgt von Waschen in 0,1 × SSC
bei 65°C
für eine
Stunde. Alternativ ist eine beispielhafte stringente Hybridisierungsbedingung
in 50% Formamid, 4 × SSC
bei 42°C.
Beispiele für
nicht-stringente Hybridisierungsbedingungen sind 4 × SSC bei
50°C oder
Hybridisierung mit 30–40%
Formamid bei 42°C.
Es wird gedacht, dass die Verwendung aller solcher Thioredoxin-ähnlicher
Sequenzen im Rahmen dieser Erfindung umfasst ist.
-
Aus einer Vielzahl von Gründen kann
es bevorzugt sein, dass die Beute-Proteine in die Schleife des aktiven
Zentrums von Thioredoxin oder Thioredoxin-ähnlichen Molekülen fusioniert
sind. Die Oberfläche
des Thioredoxins, die die Schleife des aktiven Zentrums umgibt,
hat sich so entwickelt, dass sie in der Lage ist, mit einer Vielzahl
von Proteinoberflächen
zu interagieren, in Übereinstimmung
mit der Hauptfunktion des Proteins als eine nicht spezifische Proteindisulfidoxidoreduktase.
Die Schleife des aktiven Zentrums befindet sich zwischen Segmenten von
starker Sekundärstruktur
und dieses stellt eine starre Plattform bereit, an welche man Beute-Proteine
anbinden kann.
-
Ein kleines Beute-Protein, das in
die Schleife des aktiven Zentrums von einem Thioredoxin-ähnlichen
Protein inseriert ist, befindet sich in einer Region des Proteins,
welche an der Erhaltung der Tertiärstruktur nicht beteiligt ist.
Daher ist die Struktur eines solchen Fusionsproteins stabil. In
der Tat kann E. coli-Thioredoxin bei einer Position, die sich nahe
an der Schleife des aktiven Zentrums befindet, in zwei Fragmente
geschnitten werden, und trotzdem bleiben die tertiären Interaktionen,
die das Protein stabilisieren, erhalten.
-
Die Schleife des aktiven Zentrums
von E. coli-Thioredoxin hat die Sequenz NH2 ... Cys33-Gly-Pro-Cys36 ... COOH. Fusionieren eines ausgewählten Beute-Proteins
mit einem Thioredoxin-ähnlichen
Protein in dem Teil der aktiven Schleife des Proteins, schränkt die
Beute an beiden Enden ein, was die Grade an konformationeller Freiheit
des Beute-Proteins
reduziert und folglich die Zahl der alternativen Strukturen reduziert,
die von der Beute angenommen werden. Das inserierte Beute-Protein
ist an jedem Ende durch Cysteinreste gebunden, welche eine Disulfidverknüpfung mit
dem jeweils anderen bilden können,
wie sie das in nativem Thioredoxin tun, und was weiter die konformationelle
Freiheit der inserierten Beute reduziert.
-
Zusätzlich wird das Beute-Protein
dadurch, dass es in der Schleife des aktiven Zentrums positioniert
ist, auf der Oberfläche
des Thioredoxin-ähnlichen
Proteins platziert, was ein Vorteil für die Verwendung im Screening
nach bioaktiven Proteinkonformationen und andere Assays ist. Im
Allgemeinen ist die Brauchbarkeit von Thioredoxin oder anderen Thioredoxin-ähnlichen
Proteinen in McCoy et al., U.S. Pat. No. 5, 270, 181 und in LaVallie
et al., Bio/Technology 11: 187–193
(1993) beschrieben. Diese beiden Referenzen sind hiermit per Referenz einbezogen.
-
Nun folgt eine Beschreibung des Thioredoxin-Interaktionsfallensystems
gemäß der Erfindung. Diese
Beispiele sind dafür
bestimmt, die Erfindung zu veranschaulichen und nicht zu begrenzen.
-
Thioredoxininteraktionsfallensystem
-
Interaktionsfallensysteme unter Verwendung von
konformationell versteiften Proteinen sind für den Nachweis von Proteininteraktionen,
für die
Identifizierung und Isolierung von Proteinen, die an solchen Interaktionen
teilnehmen und für
die Identifizierung und Isolierung von Agonisten und Antagonisten
solcher Interaktionen entwickelt worden. Beispielhafte Systeme werden
nun beschrieben.
-
1. Thioredoxininteraktionsfallensystem
mit Cdk2-Köder
-
Das Fortschreiten von eukaryotischen
Zellen durch den Zellzyklus erfordert das koordinierte Handeln von
einer Zahl von Proteinen, die mit Cdks interagieren und ihre Aktivität regulieren
(Sherr, Cell 79: 551–55
(1994)). Diese modulatorischen Proteine beinhalten Cyline, welche
die Aktivität
von Cdk positiv regulieren, cyclinabhängige Kinaseinhibitoren (Ckis) und
eine Zahl von Proteinkinasen und Phosphatasen, von welchen einige,
wie z. B. CAK und Cdc25, die Kinaseaktivität positiv regulieren, und von
welchen einige, wie z. B. Weel, die Kinaseaktivität inhibieren,
und von welchen einige, wie z. B. Cdi1 (Gyuris et al., Cell 75:
791–803
(1993)), Effekte haben, die bisher unbekannt sind (reviewed in Morgan,
Nature 374: 131–134
(1995)). Es wird angenommen, das Cdk2 bei höheren Zellen benötigt wird,
um von der G1 in die S-Phase voran zu schreiten (Fang & Newport, J. Cell
Biol. 66: 731–742
(1991); Pagano et al. J. Cell Biol. 121: 101–111 (1993); van den Heuvel & Harlow, Science
262: 2050–2054
(1993)). Die Aktivität
der Cdk2-Kinase wird von Cyclin E und Cyclin A positiv reguliert
(Koff et al., Science 257: 1689–1694 (1992);
Dulic et al., Science 257: 1958–1961
(1992); Tsai et al., Nature 353: 174–7 (1991)) und negativ von p21,
p27 und p57 reguliert wird (Harper et al., Cell 75: 805–816 (1993);
Polyak et al., Genes Dev. 8: 9–22 (1994);
Toyoshima & Hunter,
Cell 78: 67–74
(1994); Matsuoka et al. Genes Dev. 9: 660–662 (1995); Lee et al., Genes
Dev. 9: 639–649
(1995)); darüber
hinaus komplexiert Cdk2 mit Cdi1 am Übergang von G1 zu S (Gyuris
et al., Cell 75: 791–803
(1993)). Hier beschreiben wir die Verwendung eines Hefe Two-Hybrid
Systems, um aus kombinatorischen Bibliotheken Moleküle zu selektieren,
welche Cdk2 erkennen.
-
Es wird ein Beutevektor konstruiert,
der das E. coli-Thioredoxingen (trxA) enthält. pJG4-4 (Gyuris et al.,
Cell 75: 791, 1993) wird als Vektorbackbone verwendet und mit EcoRI
und XhoI geschnitten. Ein DNA-Fragment, das für die B112-Transkriptionsaktivierungsdomäne kodiert,
wird durch PCR-Amplifikation von dem Plasmid LexA-B112 (Doug Ruden,
Ph. D. thesis, Harvard University, 1992) erhalten und mit MunI und
NdeI geschnitten. Das E. coli trxA-Gen wird von dem Vektor pALTRXA-781
(U.S. Pat. No. 5,292,646; InVitrogen Corp., San Diego, CA) durch Verdau
mit NdeI und SalI ausgeschnitten. Die trxA- und B112-Fragmente werden
dann mit Standardtechniken in das EcoRI/XhoI-geschnittene pJG 4-4
Backbone ligiert, womit pYENAeTRX gebildet wird. Dieser Vektor kodiert
für ein
Fusionsprotein, das die SV40-Kernlokalisierungsdomäne, die
B112-Transkriptionsaktivierungsdomäne, ein Hemagglutinin-Epitop-Tag,
und E. coli-Thioredoxin
enthält
(2A).
-
Peptidbibliotheken werden wie folgt
konstruiert. Das DNA-Oligomer 5' GACTGACTGGTCCG(NNK)2GGTCCTCAGTCAGTCAG 3' (mit N = A, C, G, T und K = G, T) (SEQ
ID NO: 4) wird synthetisiert und an das zweite Oligomer (5' CTGACTGACTGAGGACC
3') (SEQ ID NO:
5) hybridisiert, um doppelsträngige
DNA an dem 3'-Ende
des ersten Oligomers zu bilden. Der zweite Strang wird unter Verwendung
von Klenow-Enzym enzymatisch vervollständigt, wobei die Synthese durch
das zweite Oligomer geprimed wird. Das Produkt wird mit AvaII geschnitten
und in das mit RsrII-geschnittene
pYENAeTRX inseriert. Nach Ligation wird das Konstrukt verwendet,
um E. coli mit Standardmethoden (Ausubel et al., supra) zu transformieren.
Die Bibliothek enthielt 2,9 × 109
Mitglieder, von welchen mehr als 109 die Synthese von Peptiden steuert.
-
Um nach interagierenden Peptiden
zu screenen, werden 20 μg
der Bibliothek verwendet, um den Hefestamm EGY48 (Matα his3 leu2::2Lexop-LEU2 ura3
trp1 LYS2; Gyuris et al., supra) zu transformieren. Dieser Stamm
enthält
auch das Reporterplasmid pSH 18–34,
ein pLR1Δ1-Derivat,
das den Hefereplikationsursprung 2 μ, das URA3-Gen und ein GAL1-lacZ-Reportergen
mit den GAL1-Upstream Regulatory Elements, welche durch 4 colE1
LexA-Operatoren ersetzt sind, enthält (West et al., Mol. Cell
Biol. 4: 2467, 1984; Ebina et al., J. Biol. Chem. 258: 13258, 1983;
Hanes and Brent, Cell 57: 1275, 1989), sowie den Köder-Vektor
pLexA202-Cdk2 (Cdk2 kodiert für
die humane cylin-abhängige
Kinase 2, ein essentielles Zellzyklus-Enzym) (Gyuris et al., supra;
Tsai et al., Oncogene 8: 1593, 1993). Etwa 2,5 × 106 Transformanten
werden erhalten und vereinigt. Der erste Selektionsschritt, Wachstum
auf Leucin-Mangelmedium nach Induktion mit 2% Galaktose/1% Raffinose
(Gyuris et al., supra; Guthrie und Fink, Guide to Yeast Genetics
and Molecular Biology, Bd. 194, 1991) wird mit einer 8-fachen Redundanz (20 × 106 cfu) der Bibliothek in Hefe durchgeführt, und etwa
900 Kolonien werden nach Wachstum bei 30°C für 5 Tage erhalten. Die 300
größten Kolonien
werden durch Ausstreichen gereinigt und für auf die Galaktose-abhängige Expression
des LEU2-Genproduktes und des β-Galaktosidase-Genproduktes
(kodiert von pSH 18–34)
getestet, wobei das letztere in Gegenwart von Xgal im Medium zu
blauen Hefekolonien führt
(Ausubel et al., supra). Diese Anforderung erfüllen 33 Kolonien, welche, nach
Sequenzieren, 14 unterschiedliche Klone einschließen, von
welchen alle spezifisch an den LexA-Cdk2-Köder, aber nicht an LexA oder
an einen LexA-Cdk3-Köder
(Finley et al., Proc. Natl. Acad. Sci., 1994) binden. Die Stärke der Bindung
wird gemäß der Intensität der blauen
Farbe beurteilt, die von einer Kolonie der Hefe gebildet wird, die
das jeweils unterschiedliche Interagens enthält. Mit dieser Hilfe wird jedes
Interagens als starker, mittelstarker oder schwacher Binder klassifiziert,
welches auf die Menge der blauen Farbe normalisiert wird, die von
verschiedenen natürlich
vorkommenden Partnerproteinen von Cdk2 in parallelen Paarungsinteraktionstests
bewirkt wird. Ein Beispiel für die
Peptidsequenz von einem Vertreter von jeder Klasse ist hier angegeben:
-
Starker Binder: Peptid
3 (SEQ ID NO: 6)
-
- -Gly34-Pro35-Leu-Val-Cys-Lys-Ser-Tyr-Arg-Leu-Asp-Trp-Glu-Ala-Gly-Ala-Leu-Phe-Arg-Ser-Leu-Phe-Gly34-Pro35-
-
Mittelstarker Binder:
Peptid 2 (SEQ ID NO: 7)
-
- -Gly34-Pro35-Met-Val-Val-Ala-Ala-Glu-Ala-Val-Arg-Thr-Val-Leu-Leu-Ala-Asp-Gly-Gly-Asp-Val-Thr-Gly34-Pro35-
-
Schwacher Binder: Peptid
6 (SEQ ID NO: 8)
-
- -Gly34-Pro35-Pro-Asn-Trp-Pro-His-Gln-Leu-Arg-Val-Gly-Arg-Val-Leu-Trp-Glu-Arg-Leu-Ser-Phe-Glu-Gly34-Pro35-
-
Kontrollpeptide, welche nicht nachweisbar binden,
sind: c4: Arg-Arg-Ala-Ser-Val-Cys-Gly-Pro-Leu-Leu-Ser-Lys-Arg-Gly-Tyr-Gly Pro-Pro-Phe-Tyr-Leu-Ala-Gly-Met-Thr-Ala-Pro-Glu-Gly-Pro-Cys
(SEQ ID NO: 14) und c: Arg-Arg-Ala-Ser-Val-Cys-Gly-Pro-Leu-His-Tyr-Trp-Gly-Leu-Gly-Gly-Phe-Val-Asp-Leu-Trp-Gln-Glu-Thr-Thr-Gly-Val-Gly-Pro-Cys (SEQ ID NO: 15).
-
3A zeigt,
dass 5 von den Peptiden stark mit dem LexA-Cdk2-Köder, aber
nicht mit einer großen
Zahl von nicht verwandten Proteinen reagierten. Keines der Cdk2-Aptamere
interagierte mit CDC28 oder Cdc2, welche beide 65% identisch zu
Cdk2 sind. Jedoch reagierten zwei der 5 Cdk2-Interagenzien auch
mit humanem Cdk3, und einer von den 5 reagierte auch mit Drosophila
Cdc2c, was darauf hinweist, dass die Peptide Determinanten erkennen,
die diesen Proteinen gemeinsam sind. Sowohl theoretische Überlegung
als auch Kalibrierungsexperimente mit dem C-Terminus des Lambda-Repressors
deuten darauf hin, dass die Transkription vom pSH18-34-Reporter
in EGY48 durch Proteininteraktionen mit Kd's, die so schwach sind wie 10–6 M,
aktiviert werden kann. Die Tatsache, dass die Peptide 3 und 13 robuste
Transkription des dieses LexAop-lacZ-Reporters steuern, ist vereinbar
mit der Idee, dass sie deutlich enger interagieren können. Die
Sequenz dieser Peptide ist in 3B gezeigt.
Zwei der Peptide sind länger
als die Einheitslänge;
beide sind anscheinend Artefakte der in vitro-Manipulationen, die
für die
Konstruktion der Bibliothek durchgeführt wurden. Kein Peptid zeigte
eine signifikante Sequenzähnlichkeit
zu bekannten Proteinen und keine zeigten mehr als zufällige Ähnlichkeit
zueinander, was darauf hinweist, dass wir die Peptidmotive, die
in der Lage sind, Cdk2 zu erkennen, nicht ausgeschöpft haben.
-
Um die Spezifität der Cdk2-Interaktion zu bestätigen, immobilisierten
wir ein Gst-Cdk2-Fusionsprotein
auf Glutathion-Sepharose-Kügelchen
und verwendeten diese Kügelchen,
um zwei bakteriell exprimierte Peptidaptamere spezifisch zu präzipitieren (4). Gst-Cdk2 war in E. coli exprimiert und wurde auf
Glutathion-Sepharose wie beschrieben gereinigt (Lee et al., Nature
374: 91–94
(1995)). Die Peptide 3 und 13 wurden wie folgt hergestellt: Fragmente,
die die Synthese der Peptide 3 und 13 steuerten, wurden durch PCR-Amplifikation
des Inserts, das durch das entsprechende Bibliotheksplasmid kodiert
wurde, hergestellt und in pAL-TrxA eingeführt (LaVallie et al., Bio/Technology
11: 187– 193
(1993)). Fusionsproteine wurden exprimiert und in einer French Pressure Cell
wie beschrieben lysiert (LaVallie et al., BIO/Technology 11, 187–193 (1993)).
Kopräzipitation
mit Gst-Sepharose-Kügelchen
wurde wie beschrieben durchgeführt
(Lee et al., Nature 374, 91–94
(1995)), und die Proben wurden auf einem 15%igen SDS Polyacrylamid-Gel
aufgetrennt und auf Nylon-Membranen übertragen. TrxA enthaltende
Fusionsproteine wurden sichtbar gemacht durch Sondieren der Membranen
mit einem Anti-TrxA
Antikörper
und durch Entwickeln des immobilisierten Antikörpers mit Peroxidasegekoppelten
Anti-Kaninchen IgG Antikörper ECL
Reagenzien, gemäß den Anweisungen
des Herstellers (Amersham, Arlington Heights, IL).
-
Diese Experimente demonstrieren,
dass die Interaktionen zwischen Cdk2 und den Peptid-Aptameren in vitro
beobachtet werden können
und daher unabhängig
von irgendwelchen aus Hefe stammenden Brückenproteinen sind. Einmal
identifiziert, können
diese Peptide in Kompetitions-Experimenten verwendet werden.
-
Die Fähigkeit, TrxA-Peptide auszuwählen, die
spezifisch mit bestimmten intrazellulären Ködern interagieren, erlaubt
die Herstellung anderer Klassen von intrazellulären Reagenzien. Zum Beispiel
können
entsprechend derivatisierte TrxA-Peptidfusionen die Herstellung
von Antagonisten oder Agonisten (wie oben beschrieben) erlauben.
Alternativ erlauben Peptidfusionen die Herstellung von Homodimeren oder
Heterodimeren „Matchmakern", welche die Interaktion
von bestimmten Proteinpaaren erzwingen. In einem speziellen Beispiel
werden zwei Proteine durch Verwenden einer Leucin-Zipper-Sequenz zusammengezwungen,
welche an ein konformationsversteifendes Protein angehängt ist,
dass einen Kandidaten für
ein Interaktionspeptid enthält.
Dieses Protein kann an beide Mitglieder eines interessierenden Proteinpaares
binden und ihre Interaktion lenken. Alternativ kann der „Matchmaker" zwei unterschiedliche
Sequenzen enthalten, wobei die eine Affinität für ein erstes Polypeptid hat
und die zweite eine Affinität für ein zweites
Polypeptid hat; wiederum ist das Ergebnis eine gelenkte Interaktion
zwischen den ersten und zweiten Polypeptiden. Eine weitere praktische Anwendung
für die
hier beschriebenen Peptidfusionen ist die Herstellung von „Zerstörern", welche ein gebundenes
Protein für
die Zerstörung
durch Proteasen des Wirtes als Ziel kennzeichnen. In einem Beispiel
für die
Anwendung des Zerstörers
wird eine Protease an eine Komponente eines interagierenden Paares
fusioniert und es wird dieser Komponente ermöglicht, mit dem Ziel zu interagieren,
das zerstört werden
soll (z. B. einem Protease-Substrat). Durch diese Methode wird die
Protease an ihren erwünschten
Handlungsort befördert
und ihr proteolytisches Potenzial in wirksamer Weise verstärkt. Noch
eine andere Anwendung der hier beschriebenen Fusionsproteine sind
als „konformationelle
Stabilisatoren", welche
Zielproteine dazu veranlassen, eine bestimmte Konformation zu bevorzugen
oder diese Konformation zu stabilisieren. In einem besonderen Beispiel hat
das ras-Protein eine Konformation, die der Zelle signalisiert, sich
zu teilen, und eine weitere Konformation, die der Zelle signalisiert,
sich nicht zu teilen. Durch Wahl eines Peptides oder Proteins, das
die gewünschte
Konformation stabilisiert, kann man beeinflussen, ob eine Zelle
sich teilen wird. Andere Proteine die konformationelle Veränderungen
durchlaufen, welche die Aktivität
erhöhen
oder erniedrigen, können
ebenfalls an einen entsprechenden „konformationellen Stabilisator" gebunden werden,
um die Eigenschaft des gewünschten
Proteins zu beeinflussen.
-
2. Funktionelle Inhibition
von Cdk2
-
Um zu bestimmen, ob Cdk2-interagierende Peptide
die Cdk2 Funktion in vivo inhibieren können, haben wir uns die Tatsache
zunutze gemacht, dass humanes Cdk2 die temperatursensitiven Allele
von Cdc28 komplementieren kann (Elledge und Spottswood, EMBO 10:
2653–2659,
1991; Ninomiya et al., PNAS 88: 9006–9010, 1991; Meyerson et al.,
EMBO 11: 2909–2917,
1992). Peptid 13 inhibiert die Ausplattierungseffizienz einer Cdk2-abhängigen Hefe. Ein
Stamm der die Temperatur-sensitive cdc28-1N-Mutation trägt, kann
bei hohen Temperaturen Kolonien bilden, wenn er ein Plasmid trägt, das Cdk2
exprimiert. Bei der restriktiven Temperatur verringert die Expression
von Peptid 13 die Plattierungseffizienz dieses Stammes 10-fach im
Vergleich zu der Plattierungseffizienz von Hefe, die Kontrollpeptide exprimiert.
Sowohl Peptid 3 als auch Peptid 13 haben bei einer Temperatur von
37°C ähnliche
Auswirkungen auf die Plattierungseffizienz eines Cdk2(+)-Stammes,
der das cdc28-13ts-Allel trägt.
-
Expression des Peptids 13 verringert
die Verdoppelungszeit eines Cdk2(+), cdc28ts-1N-Stammes um einen Faktor von 50%. Mikroskopische
Untersuchung der Stämme,
die das Peptid exprimieren, offenbarte, dass ein hoher Anteil dieser
Zellen eine verlängerte
Morphologie hatte, die charakteristisch für cdc28-1N-Zellen bei der restriktiven
Temperatur ist, während
Zellen, die ein Kontrollpeptid exprimieren, eine normalere Morphologie
hatten.
-
Peptid 13 beeinflusst nicht das Wachstum
eines cdc28-1Nts-Stammes bei hoher Temperatur, wenn der Defekt durch
ein Plasmid, dass das Wildtyp-Cdc28-Produkt exprimiert, komplementiert
wird, und Peptid 13 hat keinen Effekt auf Hefe bei der permissiven
Temperatur. Obwohl wir nicht beabsichtigen, durch irgendeine besondere
Theorie gebunden zu sein, scheint es, dass dieses Peptid den Fortschritt
des Hefezellzyklus dadurch blockiert, dass es an eine Fläche des
Cdk2-Moleküls
bindet und seine Funktion inhibiert und dadurch mit seiner Fähigkeit interferiert,
mit anderen Cyclinen, anderen Partnern, oder mit Substraten zu interagieren.
-
3. Thioredoxin-Interaktionsfalle
mit OncoRas-Köder
-
Die ras-Proteine sind für viele
Signaltransduktionswege essentiell und regulieren zahlreiche physiologische
Funktionen einschließlich
der Zellproliferation. Die ras-Gene wurden zuerst aus dem Genom
des Harvey und Kirsten-Sarcomavirus identifiziert. Die drei Typen
von Säugetier
ras-Genen (N-, K-ras, und H-ras) kodieren für hochkonservierte membrangebundene
Guaninnukleotid-bindende Proteine mit einem Molekulargewicht von
21 kDa, welche zwischen der aktiven (GTP-gebundenen) Form und der
inaktiven (GDP-gebundenen)
Form wechseln.
-
In normalen Zellen ist die aktive
Form von Ras kurzlebig, da seine intrinsische GTPase-Aktivität das gebundene
GTP schnell zu GDP umwandelt. Die GTPase-Aktivität wird 105-fach durch GTPase-aktivierende
Proteine (GAPs) stimuliert. GTP-gebundenes Ras interagiert mit GAP,
c-Raf, Neurofibromatosis Typ 1 (NF-1) und Ral-Guaninnukleotid-Dissoziationsstimulator
(RalGDS).
-
Mutationsaktivierte RAS-Proteine
werden in etwa 30% humaner Tumorzellen gefunden und haben stark
verringerte GTPase-Aktivität,
welche nicht durch GAPs stimuliert werden kann. Die Mehrheit der bisher
untersuchten Mutationen sind auf eine Punktmutation entweder am
Rest Gly-12 oder am Rest Gln-61 von Ras zurückzuführen. Diese Ras-Mutanten verbleiben
in der aktiven Form und interagieren mit nachgeschalteten Effektoren,
was zu Tumorentstehung führt.
Es ist gezeigt worden, dass es signifikante konformationelle Unterschiede
zwischen GTP-gebundenen Formen der Wildtyp- und der onkogenen Ras-Proteine
gibt. Solche konformationellen Unterschiede sind die wahrscheinlichen
Ursachen für
eine bösartige
Transformation, die durch onkogene Ras-Proteine induziert wird. Solche mutationsaktivierten
konformationellen Veränderungen
in GTP-gebundenen H-ras-Mutanten stellen Ziele für Mitglieder einer konformationell
versteiften Bibliothek von zufälligen
Peptiden dar. Im vorliegenden Beispiel ist die Bibliothek eine konformationell
versteifte Thioredoxinpeptid-Bibliothek, wie sie oben beschrieben wurde.
Mitglieder der Bibliothek, welche mit onkogenem Ras interagieren,
sind durch eine Veränderung der
oben bereitgestellten Interaktionsfallentechnologie identifiziert
worden. Die für
onkogenes Ras isolierten Peptidaptamere können im Hinblick auf ihre Fähigkeit
untersucht werden, die Interaktion von onkogenem Ras mit bekannten
Effektoren zu unterbrechen und die zelluläre Transformation zu inhibieren.
-
Wir haben ein gut charakterisiertes
onkogenes H-Ras (G12V) zur Isolierung und Charakterisierung seiner
Peptidaptamere verwendet. Peptidaptamere für andere Onkogene können durch
Anpassungen des hier bereitgestellten Protokolls isoliert werden.
-
Köder-Konstruktion
-
Konstruktion der LexA-Ras(G12V)/pEG202: H-Ras(G12V)
DNA wurde durch Verdau von BTM116-H-Ras(G12V) (5) mit BamHI und SalI durchgeführt. H-Ras(G12V)-DNA
wurde mit dem pEG202-Backbone (Rückgrat),
das mit BamHI und SalI verdaut worden war, ligiert. Das resultierende Plasmid
wurde pEG202-H-Ras (G12V) (oder V6) genannt (6).
-
Screening nach H-Ras (G12Y)
Peptid-Aptameren
-
pEG202-H-Ras (G12V) (V6) wurde in
den EGY48-Stamm gemäß einem
standardmäßigen Hefe-Transformationsprotokoll
transformiert; speziell wurde hier das Protokoll verwendet, das
von Zymo Research (Orange County, CA) bereitgestellt wurde. EGY48
wurde in YPD-Medium bis zu einer OD600 = 0.2 – 0.7 heranwachsen
gelassen. Die Zellen wurden bei 500 × g für 4 min. pelletiert und in
10 ml von EZ1-Lösung
(Zymo Research) resuspendiert. Die Zellen wurden dann durch Zentrifugation
pelletiert und in 1 ml von EZ2 (Zymo Research) resuspendiert. Aliquote
von kompetenten Zellen (50 μl)
wurden in einem –70°C-Gefrierschrank
gelagert.
-
Ein Aliquot der kompetenten Zellen
wurde mit 0,1 μg
von LexA-H-Ras (G12V)/pEG202 und mit 500 μl EZ3-Lösung (Zymo Research) gemischt.
Die Mischung wurde bei 30°C
für 30
min. inkubiert und auf ein Hefemedium, welchem Histidin und Uracil fehlten,
ausplattiert. Eine Kolonie wurde ausgewählt und in 100 ml von Glukose
Ura–His–-Medium
bei 30°C unter
Schütteln
(150 rpm) inokuliert, bis die OD600-Messung
0,96 war. Die Kultur wurde bei 2000 g für 5 min. zentrifugiert und
die Zellpellets wurden in 5 ml sterilem LiOAc/TE resuspendiert.
Die Zellen wurden erneut wie oben zentrifugiert und in 0,5 ml von
sterilem LiOAc/TE resuspendiert.
-
Aliquote (50 μl) der Zellen wurden dann bei 30°C für 30 min.
inkubiert, mit 1 μg
Thioredoxinpeptid-Bibliotheks-DNA, 70 μg Lachssperma-DNA, und 300 μl sterilem
40 PEG 4000 in LiOAc/TE. Die Mischungen wurden bei 42°C für 15 min.
hitzegeschockt. Jedes Aliquot wurde auf eine 24 cm × 24 cm-Schale
ausplattiert, welche Glukose Ura–His– Trp–-Medium
enthielt und bei 30°C
für 2 Tage
inkubiert. Die Transformationseffizienz war typischerweise in einem
Bereich von 50 000 bis 100 000 koloniebildenden Einheiten pro μg-Bibliotheks-DNA.
-
Eine Gesamtmenge von 1,5 Millionen
Transformanten wurde erhalten und auf ein Selektionsmedium von Galaktose/Raffinose
Leu–Ura–His–Trp– ausplattiert.
Von den 338 gebildeten Kolonien wurden 50 nach dem Zufallsprinzip
ausgewählt
und in 5 ml von Glukose Leu–Ura–His–Trp–-Medium
für die
Präparation
von Hefe-Plasmid-DNA inokuliert. Ein halber Milliliter von jeder
Hefekultur wurde mit einem gleichen Volumen an säuregewaschenem Sand und Phenol-Chloroform-Isoamyl-Alkohol
(24 : 24 : 1) gemischt und in einem Vortexer für 2 min. gevortext. Die Mischung
wurde dann für
15 min. zentrifugiert und der Überstand
wurde mit Ethanol ausgefällt.
DNA-Pellets wurden in 50 μl
TE resuspendiert.
-
Ein μl von jeder Probe wurde verwendet,
um E. coli KC8-Zellen durch Elektroporation zu transformieren. Bakterielle
Transformanten wurden auf einem Minimal-Agar, der mit Uracil, Leucin,
Histidin, und Ampicillin ergänzt
worden war, selektiert. Jeder Transformantentyp resultierte letztendlich
in Isolierung eines Plasmids mit einem Leucin-Marker, welcher ein DNA-Fragment trägt, das
für ein
Thioredoxin-Peptid-Fusionsprotein kodiert.
-
Die Sequenzbestimmung der 50 Isolate
wurde gemäß den Anweisungen
der fmolDNATM-Sequenzierungssysteme (Promega, Madison,
WI) ausgeführt,
unter Verwendung des Primers 5'-GACGGGGCGATCCTCGTCG-3' (SEQ ID NO: 16).
Neun aus 50 Isolaten (bezeichnet als #4, #18, #39, #41, #22, #24,
#30, #31, #46) enthielten einmalige (engt. unique) für Peptide
kodierende Sequenzen, wie durch Elektrophorese der dT/ddT-Terminationsreaktion
bestimmt wurde. Unter ihnen, lautet die vorhergesagte Peptid-Aptamer-Sequenz von
#39 wie folgt:
Trp-Ala-Glu-7rp-Cys-Gly-Pro-Val-Cys-Ala-His-Gly-Ser-Arg-Ser-Leu-Thr-Leu-Leu-Thr-Lys-Tyr-His-Val-Ser-Phe-Leu-Gly-Pro-Cys-Lys-Met-Ile-Ala-Pro-Ile-Leu-Asp
(SEQ ID No: 17). Nach unseren Ergebnissen scheint es, dass etwa
60 einmalige (engt. unique) H-Ras
(G12V) Peptid-Aptamere (338 × 9/50)
in der ersten Runde des Screenings isoliert wurden.
-
Andere Ausführungsformen
-
Wie oben beschrieben, weist die Erfindung ein
Verfahren zum Nachweisen und Analysieren von Protein-Protein-Interaktionen
auf. Typischerweise ist in den obigen Experimenten das Köder-Protein
an eine DNA-Bindungsdomäne
fusioniert, und das Beute-Protein
(in Verbindung mit dem konformationsversteifenden Protein) ist an
die Genaktivierungsdomäne
fusioniert. Die Erfindung kann jedoch leicht an andere Formate angepasst
werden. Zum Beispiel umfasst die Erfindung auch eine „umgekehrte" Interaktionsfalle,
in welcher das Köder-Protein
an eine Genaktivierungs-domäne
fusioniert ist, und das Beute-Protein (in Verbindung mit einem konformations-versteifenden
Protein) an die DNA-Bindungsdomäne
fusioniert ist. Wiederum resultiert die Interaktion zwischen Köder- und
Beute-Proteinen in der Aktivierung einer Reportergen-Expression.
Solch ein „umgekehrtes" Interaktionsfallensystem
ist jedoch auf die Verwendung von Beute-Proteinen angewiesen, welche selbst
nicht die Expression des stromabwärts gelegenen Gens aktivieren.
-
Die Proteininteraktions-Testsysteme,
die hier beschrieben sind, können
auch in einem zellfreien, in vitro System ausgeführt werden. Solch ein System fängt mit
einem DNA-Konstrukt
an, welches ein Reportergen umfasst, das funktionell mit einer DNA-Bindungsprotein-Erkennungsstelle
verknüpft
ist (z. B. eine LexA-Bindungsstelle). Zu dieser DNA wird ein Köder-Protein
(z. B. ein beliebiges der hier beschriebenen Köder-Proteine, die an eine LexA-DNA-Bindungsdomäne gebunden
sind) und ein Beute-Protein (z. B. eines aus einer Bibliothek von
konformationell versteiften Kandidaten für interagierende Beute-Proteine,
die an eine Genaktivierungsdomäne
gebunden sind) hinzugefügt.
Die Interaktion zwischen dem Köder-
und Beute-Protein wird durch Messen des Reportergen-Produktes nachgewiesen,
entweder als ein RNA-Produkt, als ein in vitro translatiertes Proteinprodukt,
oder durch irgendeine enzymatische Aktivität des translatierten Reportergenproduktes.
Dieses in vitro-System kann auch zum Identifizieren von Agonisten
oder Antagonisten verwendet werden, einfach indem zu einem bekannten
Paar von interagierenden Proteinen (in dem oben beschriebenen System)
ein Kandidat für
ein agonistisches oder antagonistisches Interagens hinzugefügt wird
und (jeweils) eine Zunahme oder Abnahme in der Reportergen-Expression
nachgewiesen wird, im Vergleich zu einer Kontrollreaktion, der der
Kandidat für
eine Verbindung oder ein Protein fehlt. Um das Screening im großen Maßstab zu
erleichtern, können
Kandidaten für
Beute-Proteine oder Kandidaten für
Agonisten oder Antagonisten zunächst
in Pools von beispielsweise 10 oder 20 Kandidaten-Verbindungen oder -Proteinen
getestet werden. Von Pools, die ein positives Ergebnis zeigen, wird
das jeweilige interagierende Protein oder der Agonist oder Antagonist
dann durch individuelles Testen der Komponenten des Pools identifiziert.
Solche in vitro-Systeme sind für eine
Roboterautomatisierung oder für
die Produktion von Kits geeignet. Kits, die Komponenten von irgendeinem
der hier beschriebenen Interaktionsfallensysteme enthalten, sind
auch von der Erfindung umfasst.
-
Die Komponenten (z. B. die verschiedenen Fusions-Proteine
oder DNA dafür)
oder beliebige der in vivo- oder in vitro-Systeme der Erfindung
können hintereinander
oder gleichzeitig bereitgestellt werden, je nach dem erwünschten
experimentellen Design.