-
GEBIET DER ERFINDUNG
-
Die
vorliegende Erfindung betrifft ein Verfahren und ein Kit, welches
Reagenzien und Mittel für
die Identifikation (Feststellung) möglicher Mutationen (SNPs) im
Gen/in Genen oder im Organismusgenom auf der Grundlage der Amplifizierung
einer homologen Sequenz gefolgt von deren Feststellung auf einer
Anordnung aufweist.
-
Die
Erfindung ist besonders geeignet für die gleichzeitige Identifikation
und/oder Quantifizierung multipler Mutationen in derselben Gennukleotidsequenz
oder demselben Organismusgenom.
-
Die
vorliegende Erfindung ist gut für
diagnostische und analytische Assays geeignet.
-
GRUNDLAGEN DER ERFINDUNG UND
STAND DER TECHNIK
-
Zu
den frühen
Verfahren zur Typisierung von Einzelnukleotidpolymorphismen (SNPs – single
nucleotide polymorphisms) zählen
die folgenden Techniken: SSCP, RFLP, AS-PCR, Sequenzierung mittels
Genotypisierungsbeurteilung gekoppelt mit Gelelektrophorese. Diese
Verfahren sind aufgrund der Einschränkung der Feststellungsverfahren
nicht für
großangelegtes
Screening geeignet. Jedoch wurden multiple Analysen von Mutationen
durch die Verwendung eines auf einer DNA-Mikroanordnung basierenden
Verfahrens für
die Untersuchung jeder bestimmten Position, an der Mutationen in
einer bestimmten Sequenz auftreten können, vereinfacht. Die auf
einer Mikroanordnung basierende Mutationsfeststellung kann auch
auf multiple unterschiedliche Sequenzen erweitert werden, wie typische
Exone desselben Gens, welche üblicherweise
aufgrund des Abstands zwischen den Exonen nicht sofort sequenziert
werden können.
-
Beim
gebräuchlichsten
Verfahren wird das Gen oder Genom, das auf eine mögliche Mutation
untersucht wird, zuerst amplifiziert und dann in Ribonukleotidsequenzen
kopiert, um sie in Stücke
schneiden zu können,
die dann auf Oligonukleotidsequenzen, die auf der Anordnung vorliegen,
hybridisiert werden. Das Vorhandensein einer Mutation wird gemäß des Verhältnisses
des Signals des Oligonukleotids, welches die Mutation aufweist,
im Vergleich zum Wildtyp in Betracht gezogen.
-
Es
existieren mehrere Veröffentlichungen
zu dieser Technologie. Eine auf einem allelspezifischen Oligonukleotid
(ASO – allele
specific oligonucleotide) basierende Mikroanordnung wurde für das Screening
von 4 Mutantenallelen von CYP2C9 hergestellt (Wen SY et al. 2003,
World J. Gastroenterol., 9, 1342–1346). Sondenpaare mit einer
Base Differenz für
die SNP-Unterscheidung wurden auf Glasobjektträgern immobilisiert. Der Genotyp
wurde durch Berechnung des Signalverhältnisses von übereinstimmenden
zu nicht übereinstimmenden
Sonden bestimmt. Der Verhältniswert
der Signalintensität über 4 oder
unter 2,5 gilt als ein kritischer Grenzwert für die Genotypisierungsbeurteilung.
Wenn die Verhältniswerte
zwischen 2,5 und 4 lagen, wurden die Proben erneut genotypisiert.
-
Die
US-Patentschrift 6,410,229 stellt
eine Anordnung von Nukleinsäuresonden
für die
SNP-Feststellung in RNA-Transkripten bereit. Die Quantifizierung
der Hybridi sierung wird durch den Vergleich der Bindung von übereinstimmenden
und Kontrollsonden erhalten. Die Patentanmeldung
WO 9729212 stellt ein Verfahren zum
Identifizieren eines Genotyps eines Organismus unter Verwendung
einer Anordnung bereit, welche Erfassungssonden aufweist, die komplementär zu Referenz-DNA-
oder -RNA-Sequenzen eines anderen Organismus sind (zum Beispiel
unter Verwendung von Oligonukleotidsequenzen auf der Grundlage des
Mycobacterium tuberculosis rpoB Gens). Die Genotypisierung basiert
auf einem Gesamt-Hybridisierungmuster
des Ziels zur Anordnung.
-
Die
US-Patentschrift 5,858,659 stellt
eine Anordnung bereit, welche Sondenfeststellungsblöcke aufweist,
wobei jeder Block vier Gruppen von Erfassungssonden zur Untersuchung
einer einzelnen Base beinhaltet (z. B. Verwendung von Blöcken von
40 Oligonukleotiden von 20 Basen zur Untersuchung einer polymorphen
Base). Die erste und zweite Gruppe der Erfassungssonden sind komplementär zu der
Zielnukleinsäuresequenz,
welche die erste und zweite Variante der polymorphen Basen aufweist.
Die dritte und vierte Gruppe der Sonden weisen eine Sequenz auf,
die identisch mit der ersten und zweiten Gruppe der Sonden ist,
außer dass
sie Monosubstitutionen von Positionen in der Sequenz enthalten,
die sich innerhalb von n Basen der polymorphen Base befinden.
-
Wenn
das Verfahren funktioniert, weist es einige Nachteile auf, da unterschiedliche
Erfassungssonden eine unterschiedliche Affinität für Zielsequenzen aufweisen und
die Verhältnisse
zwischen den mutierten und nicht-mutierten Erfassungssonden variieren
sehr von einer Mutation zur anderen. Auch die Festlegung gemeinsamer
Hybridisierungs bedingungen ist bei einigen Erfassungssonden ein
Problem, welche eine bessere Unterscheidung als die anderen aufweisen.
Die Konsequenz ist ein sehr heterogenes Muster von Verhältnissen
und gelegentlich die Schwierigkeit der Bestimmung, ob der Organismus
homozygot oder heterozygot für die
Mutationen an spezifischen Loci ist.
-
Zwei
Verbesserungen wurden jüngst
zu diesem Verfahren vorgeschlagen. Die
US-Patentanmeldung 2005/0089877 stellt
ein Verfahren zur Genotypisierung einer DNA-Sequenz auf Chips mit
einer Wildtyp-perfekten Übereinstimmungssonde
und einer Mutanten-perfekten Übereinstimmungssonde
bereit. Das Verfahren schlägt
einen Genotypisierungsalgorithmus für die Optimierung der Erfassungssonden
und ein statistisch robustes Verfahren bereit. Der Algorithmus basiert
auf der Analyse von Daten, die aus einer Hybridisierung einer identifizierten
Standardnukleinsäure
und aus einer Genotypisierung des unbekannten Ziels stammen, durch die
Substitution von Eingabevektoren in den Genotypisierungsalgorithmus.
-
Die
US-Patentschrift 6,852,488 betrifft
ein Sequenzierungsverfahren einer Zielsequenz, jedoch mit der bestimmten
Feststellung einer Mutation in der Zielsequenz. Das Verfahren basiert
auf der Verwendung einer bekannten Kernsequenz mit hoher Affinität für die Zielsequenz.
Das Verfahren schlägt
eine Auswahl einer Sonde durch Evaluierung der Bindungseigenschaften
aller Sonden vor, welche eine einzelne Nichtübereinstimmung im Vergleich
zu einer Kernsonde aufweisen. Wenn die Einzelbasen-Nichtübereinstimmungssonden
ein charakteristisches Bindungs- oder Affinitätsmuster zeigen, dann ist die
Kernsonde exakt komplemen tär
zu mindestens einem Teil der Zielsequenz. Dieses Verfahren gestattet
die Mutationsfeststellung in einer Zielsequenz durch einen Vergleich
der Bindungsaffinität
einer bekannten Kernsonde für
die Zielsequenz mit der Bindungsaffinität der Sonde, welche eine Einzelnukleotidvariation
aufweist. Dieses Auswahlverfahren der Sonde basiert auf dem experimentellen
Screening von Erfassungssonden durch die Auswahl einer Sonde mit
hoher Affinitätsbindung.
-
Jedoch
erfordern diese beiden Verfahren multiple Experimentschritte und
sind daher kompliziert und zeitaufwändig. Ferner sind sie nicht
geeignet für
die Entwicklung einer großen
Anzahl von Mutationsfeststellungen auf einer Mikroanordnung, da
sie eine experimentelle Optimierung für jede Mutation erfordern und
sie einen unterschiedlichen Berechnungsprozess zum Erhalt eines
abschließenden
Resultates in Bezug auf jede Mutation verwenden. Sie stellen auch
keine A-priori-Lösung
für die
Entwicklung von Biochips für
die Feststellung multipler SNPs in einem Organismusgenom bereit.
-
KURZFASSUNG DER ERFINDUNG
-
Die
vorliegende Erfindung bietet eine originelle und einfache Lösung zur
Bestimmung des Vorhandenseins oder Nichtvorhandenseins von mindestens
3 und vorzugsweise 5 und weiter vorzugsweise 20 Einzelnukleotidpolymorphismen
oder SNP (mutierte Base 1) an bestimmten Loci der Gennukleotidsequenz(en) (3)
eines Organismus (einschließlich
des Menschen), zur Identifikation oder Feststellung mehrerer homologer Sequenzen
(7, 7'),
die in der/den Sequenz(en) (3) vorliegen, welche sich durch
eine Base (1) unterscheiden, welche folgende Schritte umfasst:
- – Amplifizieren
der homologen Gennukleotidsequenzen oder Anteilen davon, welche
unterschiedliche Loci enthalten, zu einem ersten Satz/ersten Sätzen von
Nukleotidzielsequenzen (homologe Sequenzen 7 oder 7') und;
- – Amplifizieren
eines zweiten Fragments der nicht mutierten Gennukleotidsequenz(en)
zu einem zweiten Satz von Nukleotidzielsequenzen (8);
- – Kontaktieren
des ersten Satzes/der ersten Sätze
der Nukleotidzielsequenzen (7 oder 7') mit einer
Anordnung von Erfassungssonden (9, 9', 10)
(die an die Oberfläche
eines festen Trägers
(22) gebunden sind), wobei die Anordnung eine Reihe von
Paaren von Erfassungssonden (9 und 9') aufweist,
welche dieselbe spezifische Hybridisierungssequenz aufweisen, die
zu einem Teil der unterschiedlichen Nukleotidzielsequenzen (7 und 7') komplementär ist, sich
aber durch eine einzelne Base (20), welche zu der in der
zu charakterisierenden Lokussequenz vorhandenen mutierten Base (1)
komplementär
ist, unterscheidet;
- – Kontaktieren
des zweiten Satzes der Nukleotidzielsequenzen (8) mit einer
komplementären
Erfassungssonde (10), welche eine spezifische Hybridisierungssequenz
aufweist, die zu einem Teil der Nukleotidzielsequenz (8)
komplementär
ist, sich aber durch eine einzelne Base (21) unterscheidet;
- – Feststellen
und/oder Quantifizieren des Signalwertes der Hybridisierung des
ersten Satzes der Nukleotidzielsequenzen (7 oder 7') und des Signalwertes
der Hybridisierung des zweiten Satzes von Nukleotidzielsequenzen
(8); und
- – Feststellen
des Vorhandenseins der Nukleotidbase (1) an den unterschiedlichen
Loci, wobei die Signalwerte der Feststellung der Zielsequenz(en)
(7 und/oder 7')
auf ihren entsprechenden Erfassungssonden (9 oder 9') höher sind
als ein bzw. gleich einem Grenzsignalwert, der aus dem Signalwert
der Feststellung des zweiten Satzes der Zielsequenz (8)
auf ihrer entsprechenden spezifischen mutierten Erfassungssonde
(10) berechnet wird, wobei die Erfassungssonden (9, 9' oder 10) ähnliche
physikalische und chemische Eigenschaften aufweisen; und
- – Feststellen
des Vorhandenseins von Einzelnukleotidpolymorphismen (mutierte Base 1)
an den unterschiedlichen Loci.
-
In
dem Verfahren gemäß der Erfindung
ist diese Feststellung besonders geeignet für die Identifikation multipler
Einzelnukleotidpolymorphismen oder multipler Mutationen (multiple
SNPs), die an einem anderen Genlokus vorliegen. Das Verfahren stellt
auch Werkzeuge und Mittel für
die Feststellung bereit, ob ein Organismus an einem bestimmten Genlokus
heterozygot (unterschiedliche Allele) oder homozygot (gleiche Allele) ist.
-
Vorzugsweise
erfolgt die Feststellung oder Charakterisierung auf derselben Anordnung.
Ferner erfolgt der Schritt des Vergleichens des Signalwertes der
Hybridisierung zwischen den unterschiedlichen Sätzen von Zielen und ihren entsprechenden
Erfassungssonden auf derselben Anordnung. Die Erfassungssonden befinden
sich vorzugsweise an spezifischen Positionen der Fläche eines
festen Träges 22,
welcher eine Anordnung bildet.
-
DEFINITION
-
Soweit
nicht anders definiert, haben alle hierin verwendeten technischen
und wissenschaftlichen Begriffe dieselbe Bedeutung wie allgemein
durch einen Durchschnittsfachmann auf dem Gebiet, zu dem diese Erfindung
gehört,
verstanden wird.
-
Die
Begriffe „Nukleotidsequenz,
Anordnung, Ziel-(und
Erfassungs-)Nukleotidsequenz, binden im Wesentlichen, spezifisches
Hybridisieren mit, Hintergrund, Quantifizieren" sind wie in
WO 97/27317 beschrieben, welche hierin
durch Verweis eingefügt
ist.
-
Die
Begriffe „Nukleotidtriphosphat,
Nukleotid, Primersequenz" sind
die in der Europäischen
Patentanmeldung
EP 1096024 beschriebenen,
die hierin durch Verweis eingefügt
ist.
-
Der
Begriff „Gen" steht für eine grundlegende
physikalische und funktionale Vererbungseinheit, die Informationen
von einer Generation zur nächsten
trägt;
ein DNA-Segment,
dass sich an einer spezifischen Stelle auf einem Chromosom befindet,
welches ein spezifisches funktionales Produkt codiert. Das DNA-Segment setzt
sich zusammen aus der transkribierten Region und einer regulatorischen
Sequenz, welche die Transkription möglich macht (Regionen, die
der codierenden DNA vorangehen und auf sie folgen, sowie Introne
zwischen den Exonen).
-
Der
Begriff „Lokus" steht für die Position
des Einzelnukleotidpolymorphismus (SNP) auf der Sequenz des Gens.
-
„Homologe
Sequenzen" steht
für Nukleotidsequenzen,
welche einen Prozentsatz von Nukleotiden, die an entsprechenden
Positionen identisch sind, aufweisen, der höher ist als in reinweg zufälligen Anordnungen. Zwei
Sequenzen gelten als homolog, wenn sie zwischen sich ein Minimum
an Homologie (oder Sequenzidentität) aufweisen, das als der Prozentsatz
identischer Nukleotide definiert ist, die an jeder Position im Vergleich zu
allen Nukleotiden gefunden werden, nachdem die Sequenzen optimal
angeordnet wurden, unter Berücksichtigung
von Additionen oder Deletionen (wie Lücken) in einer der beiden zu
vergleichenden Sequenzen. Das Maß an Homologie (oder Sequenzidentität) kann
sehr variieren, da homologe Sequenzen nur in einem Teil, in wenigen
Teilen oder Abschnitten oder entlang ihrer gesamten Sequenz homolog
sein können.
Nukleotidsequenzen, die sich nur durch eine Base unterscheiden,
sind hoch-homologe
Sequenzen und als Einzelnukleotidpolymorphismen (SNPs) qualifiziert.
Die Teile oder Abschnitte der Sequenzen, die in beiden Sequenzen identisch
sind, bleiben so erhalten. Proteindomains, welche eine erhaltene
dreidimensionale Struktur präsentieren,
werden üblicherweise
durch homologe Sequenzen codiert und häufig sogar durch ein einziges
Exon. Die Sequenzen, die ein hohes Maß an Invarianz in ihren Sequenzen
zeigen, sollen angeblich weitgehend erhalten sein, und sie zeigen
ein hohes Maß an
Homologie.
-
Die
Verfahren der Anordnung von Sequenzen basieren auf lokalen Homologiealgorithmen,
die computerisiert wurden und die wie zum Beispiel (jedoch nicht
darauf beschränkt)
als Clustal® (Intelligenetics,
Mountain Views, Kalifornien) oder GAP®, BESTFIT®,
FASTA® und
TFASTA® (Wisconsin
Genetics Software Package, Genetics Computer Group Madison, Wisconsin,
USA) oder Boxshade® erhältlich sind.
-
Der
Begriff „Consensus-Sequenz" ist eine Sequenz,
die nach der Anordnung mehrerer homologer in Betracht zu ziehender
Sequenzen bestimmt wurde (berechnet als die Base, welche am häufigsten
an jeder Position in den verglichenen, angeordneten, homologen Sequenzen
gefunden wird).
-
Die
Consensus-Sequenz stellt eine Art „Durchschnitts"-Sequenz dar, welche
von allen verglichenen Sequenzen so nah wie möglich ist. Bei hoch-homologen
Sequenzen, oder wenn die Consensus-Sequenz lang genug ist und die
Reaktionsbedingungen nicht zu streng sind, kann sie sich an alle
homologen Sequenzen binden. Dies ist besonders geeignet für eine Amplifizierung
homologer Sequenzen mit denselben Primern, Consensus-Primer genannt.
Experimentell kann die aus den Programmen oben berechnete Consensus-Sequenz angepasst
werden, um eine solche Eigenschaft zu erhalten.
-
„Mikroanordnungen
und Anordnungen" steht
für feste
Träger,
auf denen einzelne Erfassungssonden oder Erfassungssondenspezies
immobilisiert sind, um in der Lage zu sein, sich an das bestimmte
spezifische Protein oder Ziel zu binden. Die häufigsten Anordnungen setzen
sich aus einzelnen Erfassungssondenspezies zusammen, die sich an
vorbestimmten Positionen eines festen Trägers befinden, bei dem es sich
um ein Substrat für
ihre Bindung handelt oder nicht. Die Anordnung ist vorzugsweise
zusammengesetzt aus Punkten von Erfassungssonden, die an einer bestimmten
Position auf der Oberfläche
oder innerhalb des festen Trägers oder
auf dem Substrat, welches den festen Träger bedeckt, aufgetragen sind.
Jedoch können
die Erfassungssonden auf dem festen Träger in verschiedenen Formen
vorliegen, bei denen es sich um Punkte handeln kann, jedoch nicht
darauf beschränkt.
Eine bestimmte Form der Anwendung der Anordnung ist das Vorhandensein von
Erfassungssonden in Wells, welche jede von mehreren unterschiedlichen
Erfassungssonden pro Well aufweisen und Teil des gleichen Trägers sind.
Vorteilhafterweise werden Anordnungen von Erfassungssonden auch
auf unterschiedlichen Trägern
bereitgestellt, solange diese unterschiedlichen Träger spezifische
Erfassungssonden enthalten und voneinander unterschieden werden
können,
um in der Lage zu sein, eine Quantifizierung einer spezifische Zielsequenz
zu gestatten. Dies kann durch Verwendung einer Mischung von Perlen erreicht
werden, welche bestimmte Merkmale aufweisen und voneinander unterschieden
werden können,
um die gebundenen Moleküle
zu quantifizieren.
-
Der
Begriff „Erfassungssonde" betrifft Moleküle, die
in der Lage sind, sich spezifisch an ein bestimmtes Polynukleotid
oder Polypeptid zu binden. Vorzugsweise erfolgt die Polynukleotidbindung
durch Basenpaarung zwischen zwei Polynukleotiden, von denen eines
die immobilisierte Erfassungssonde oder Erfassungssequenz und die
andere das festzustellende Zielmolekül (Sequenz) ist.
-
Der
Begriff „einzelne
Erfassungssondenspezies" ist
eine Zusammensetzung verwandter (Poly)Nukleotide für die Feststellung
einer bestimmten Nukleotidsequenz durch Basenpaarungshybridisierung.
Polynukleotide werden entweder chemisch oder enzymatisch synthetisiert
oder aus Proben aufgereinigt. Jedoch ist die Synthese oder Aufreinigung
nicht immer perfekt und die Erfassungssonde kann durch andere verwandte
Moleküle
wie kürzere
Polynukleotide leicht verunreinigt sein. Die wesentliche Eigenschaft
einer Erfassungsspezies für
die Erfindung ist, dass die Gesamtspezies zum Erfassen eines bestimmten
Zielmoleküls,
vorzugsweise einer bestimmten Nukleotidzielsequenz, verwendet werden
kann.
-
Der
Begriff „Signal,
welches aus einer spezifischen Bindung an einer spezifischen Position
resultiert" steht
für eine
Feststellung, und möglicherweise
eine Quantifizierung, eines einzelnen Hybridisierungsereignisses
zwischen komplementären
Nukleotidsequenzen an dem spezifischen lokalisierten Bereich (Position)
einer festen Erfassungssequenz der festen Trägerfläche (oder innerhalb des festen
Trägers).
Eine komplementäre Hybridisierung
kann durch eine (fluoreszierende, kolorimetrische usw.) Markierung,
die in die Sequenz der Zielsequenz oder an der Extremität der Zielsequenz
(vorzugsweise während
des Kopier- oder
Amplifizierungsschrittes) eingefügt
ist, oder durch eines einer Reihe von Mitteln, die dem Fachmann
auf dem Gebiet gut bekannt sind, festgestellt und möglicherweise
quantifiziert werden, wie in
WO
99/32660 detailliert aufgelistet.
-
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
-
Die
vorliegende Erfindung stellt die eindeutige Feststellung des Vorhandenseins
oder des Nichtvorhandenseins einer bestimmten Base (mutierte Base)
an einem Lokus einer genetischen Sequenz durch Untersuchung des
Signals bereit, welches an einer bestimmten Position einer Anordnung
erhalten wird, die zum Untersuchen (Feststellen) des Vorhandenseins
oder Nichtvorhandenseins der (mutierten) Base an einem bestimmten
Lokus (SNPs) dient.
-
Das
Verfahren gestattet eine gleichzeitige Feststellung von mindestens
3 und besser 5 und noch besser 20 Loci, und dementsprechend kann
der feste Träger
mindestens 6 und besser 10 und noch besser mindestens 40 unterschiedliche
Erfassungssonden enthalten, welche eine spezifische Sequenz aufweisen,
die komplementär
zu den unterschiedlichen zu untersuchenden Zielloci ist und sich
nur durch eine Base (festgestellte SNPs) unterscheidet. Die spezifischen
Hybridisierungssequenzen, die auf den Erfassungssonden vorliegen,
sind komplementär
zu den unterschiedlichen Zielen, denen sie entsprechen, und sie
weisen ähnliche chemische
und physikalische Eigenschaften auf. Vorzugsweise sind diese spezifischen
Sequenzen für
einen Lokus identisch für
das Ziel eines bestimmten Lokus, ausgenommen der zu untersuchenden
Base an dem Lokus.
-
Die
Gennukleotidsequenz(en) kann/können
zunächst
aus einer Probe aus dem Organismus extrahiert werden. Extraktion
bedeutet jede Art der Isolierung genetischen Materials (mRNA, Genom-DNA)
aus einer Probe durch einen physikalischen oder einen chemischen
Prozess. Untersuchungen von (Mikro)Organismen, die aus einer biologischen
Probe oder aus einer klinischen Probe oder einer Zellkultur extrahiert
wurden, erfordern vorzugsweise eine Isolierung von Genom-DNA-Sequenzen.
Die unterschiedlichen Loci befinden sich entweder auf demselben
Exon eines Gens oder auf demselben Gen oder auf unterschiedlichen
Genen, welche zu dem Genom des Organismus gehören. Die Zielsequenzen, die
sich an einem oder an mehreren bestimmten Loci unterscheiden, sind
homologe Sequenzen.
-
Der
in dem Verfahren gemäß der Erfindung
verwendete genetische Amplifizierungsschritt erfolgt durch Amplifizierungsprotokolle,
die in der Technik gut bekannt sind, vorzugsweise durch ein Verfahren
ausgewählt aus
der Gruppe bestehend aus PCR, RT-PCR, LCR, CPT, NASBA, ICR oder
Avalanche-DNA-Techniken.
-
Die
Nukleotidsequenz eines Gens wird unter Verwendung von mindestens
einem Primerpaar (d. h. einem Paar von zwei unterschiedlichen Primern)
amplifiziert. Jedoch werden mehrere Primerpaare entweder für die Amplifizierung
der unterschiedlichen spezifischen Nukleotidsequenzen eines Gens
verwendet, wobei es sich bei diesen Sequenzen vorzugsweise um unterschiedliche
Exone handelt, oder sie werden zur Amplifizierung unterschiedlicher
Gene oder unterschiedlicher Teile eines Zellgenoms verwendet.
-
Vorzugsweise
umfasst jede amplifizierte Zielsequenz mehrere Loci. Alle diese
Loci des Ziels werden dann mit demselben Primerpaar amplifiziert,
bei dem es sich um Consensus-Primer für eine Amplifizierung all dieser
Loci handelt, jedoch wird jeder Lokus auf spezifischen Erfassungssonden
festgestellt.
-
Daher
enthält
die Anordnung Erfassungssonden, die spezifisch für einen oder mehrere Loci für die Hybridisierung
mit (einer) Nukleotidzielsequenz(en) sind, welche die mutierten
Basen (1) umfasst/umfassen, die in jedem Lokus festzustellen
sind, wobei sich die unterschiedlichen mutierten Basen im selben
Exon oder in unterschiedlichen Exonen befinden, die aus demselben
Gen oder aus unterschiedlichen Genen stammen, die vorzugsweise in
derselben Nukleotidsequenz (3) vorliegen. Der Amplifizierungsschritt
dieser mehreren Exone erfolgt vorzugsweise mit unterschiedlichen
Primerpaaren, wobei jedes Primerpaar spezifisch für ein Exon
ist. Die Amplifizierung mehrerer Exone erfolgt vorzugsweise unter
den gleichen Bedingungen für
alle Exone (d. h. im selben Reaktionsgefäß oder in unterschiedlichen
Gefäßen) und
sie werden dann für
die Hybridisierung auf einer Mikroanordnung zusammen gepoolt. Sie
stellen den ersten Zielsatz (7 oder 7') dar.
-
Der
zweite Satz von Nukleotidzielsequenzen (8) wird vorzugsweise
mit denselben Primern amplifiziert, die für den ersten Satz von Zielsequenzen
(7 oder 7')
verwendet werden. In dieser bevorzugten Ausführungsform enthält jede
Zielsequenz, die mit einem Primerpaar (5, 6') amplifiziert
wurde, auch eine Sequenz, die auf dem zweiten Satz der Erfassungssonde
(10) hybridisiert wurde. Jedoch haben die Erfinder herausgefunden, dass
das Vorhandensein des zweiten Satzes von Zielsequenzen auf derselben
amplifizierten Sequenz nicht notwendig ist, solange die Amplifizierungen
beider Zielsequenzen unter Verwendung unterschiedlicher Primerpaare
(5, 5' und 6, 6') ähnlich sind.
Die Ähnlichkeit
der Ergebnisse wird durch den Vergleich der Effizienz der Hybridisierung
beider amplifizierter Sequenzen (7, 7', 8)
auf den entsprechenden Erfassungssonden (9, 9', 10), welche
komplementäre
Sequenzen aufweisen, erhalten. Die Signale müssen identisch sein oder dürfen sich nur
um einen Faktor, der niedriger als 3 und vorzugsweise niedriger
als 2 ist, unterscheiden.
-
Im
nächsten
Schritt des Verfahrens der Erfindung werden die amplifizierten Nukleotidzielsequenzen
(
7 oder
7')
des ersten Schrittes (Amplikone) mit einer Anordnung in Kontakt
gebracht, und zwar unter Bedingungen, welche die Hybridisierung
der amplifizierten Zielsequenzen (
7,
7') mit ihren
komplementären
spezifischen Erfassungsnukleotidsequenzen (
9,
9') (Erfassungssonden),
die auf der Anordnung vorliegen, gestatten. Die im ersten Schritt
erhaltenen Amplikone werden mit denselben oder mit unterschiedlichen
Anordnungen hybridisiert. In einer bevorzugten Ausführungsform
werden diese amplifizierten Sequenzen vor der Hybridisierung mit der
Anordnung bearbeitet (z. B. durch Fragmentierung). Die Fragmentierung
von Doppelstrang-DNA erfolgt unter Verwendung enzymatischer Spaltung
(DNase-Behandlung) oder chemischer Spaltung, vorzugsweise Depurinierung
unter Verwendung von HCL, gefolgt von Wärmedenaturierung, wie in der
US-Patentanmeldung 2005/0095635 beschrieben.
Die Fragmentierung von Ribonukleotidsequenzen erfolgt durch die
Erwärmung
in Gegenwart von Magnesiumionen oder in Gegenwart von KOH, wie entsprechend
in
WO 97/10365 und
WO 98/28444 beschrieben.
-
Teile
(oder Abschnitte) der Gen- oder Genomsequenz (Loci), welche mögliche festzustellende
Mutationen aufweisen, können
zuerst durch PCR amplifiziert werden, und die daraus resultierenden
Amplikone werden durch DNAse-Behandlung
fragmentiert (Grimm et al. 2004, Journal of Clinical Microbioloy,
42, 3766–3774).
In der bevorzugten Ausführungsform
weisen die resultierenden Amplikonfragmente eine Länge zwischen
30 und 70 Basen auf. Die Verteilung der Fragmentgröße, die
nach der Fragmentierung der Amplikone erhalten wird, wird vorteilhafterweise
durch Analyse mittels Kapillar-Elektrophorese (Bioanalyser, Agilent) überprüft und die
durchschnittliche Größenverteilung
der Stücke
liegt vorzugsweise bei einer Länge
zwischen 30 und 70 Basen.
-
Der
spezifische Teil (oder Abschnitt) der Erfassungssonden (Nukleotidsequenzen),
der komplementär zu
der Nukleotidzielsequenz ist, umfasst zwischen etwa 10 und etwa
50 Basen, vorzugsweise zwischen etwa 15 und etwa 40 Basen und bevorzugter
zwischen 18 und 24 Basen. Diese Basen sind vorzugsweise als eine kontinuierliche
Sequenz zugeordnet, die sich an oder nahe der Extremität der Erfassungssonden
(Nukleotidsequenzen) befindet. Diese Sequenz gilt als eine spezifische
Sequenz für
die Feststellung der Nukleotidzielsequenz.
-
Vorzugsweise
liegt die Schmelztemperatur (Tm) der spezifischen Nukleotidsequenzen
der Erfassungssonden (die in der Lage sind, sich an ihre entsprechenden
Nukleotidzielsequenzen zu binden) zwischen 55 und 75°C und bevorzugt
zwischen 62 und 68°C.
Die Tm kleiner Sequenzen kann leicht mit der vereinfachten Gleichung
Tm (°C)
= 4 (G + C) + 2 (A + T) berechnet werden.
-
Vorzugsweise
erfolgt der Hybridisierungsschritt zwischen Erfassungs- und Zielsequenz
unter strengen Bedingungen. Die Temperaturen der Hybridisierung
liegen vorzugsweise zwischen 1 und 10°C und sogar vorzugsweise um
1 bis 4°C
niedriger als die Tm der spezifischen Sequenz der Erfassungssonden.
Die Hybridisierungstemperatur kann entsprechend des Vorhandenseins
von Molekülen
in der Hybridisierungslösung,
welche die Hybridisierungstemperatur beeinflussen, wie DMSO oder
Formamid, angepasst werden.
-
Die
Hybridisierung der Zielsequenzen erfolgt bei einer Temperatur, welche
das beste Signal zusammen mit der geringsten Kreuzreaktion des Ziels
auf den Erfassungssonden, die sich durch eine Base unterscheiden,
abgibt. Die optimierte Temperatur ist abhängig von der Strenge der Lösung, welche
von der Lösungszusammensetzung
und hauptsächlich
von der Salzkonzentration abhängig
ist. In einer bevorzugten Ausführungsform
ist die Hybridisierungslösung
zusammengesetzt aus Phosphatpuffer mit pH 7,4 mit einer Molarität zwischen
0,4 M und 0,8 M, und die Hybridisierungstemperatur unterscheidet
sich von der Tm der spezifischen Sequenzen der Erfassungssonden
(9, 9' und 10)
um nicht mehr als 5°C
und vorzugsweise nicht mehr als 2°C.
In einer bestimmten Ausführungsform
beträgt
die Hybridisierungstemperatur 60°C.
-
Auf
der Anordnung sind Erfassungssonden an vorbestimmten Positionen
mit einer Dichte von mindestens 4, 10, 16, 20, 50, 100, 1.000, 4.000,
10.000 oder mehr unterschiedlichen Erfassungssonden/cm2 auf
der unlöslichen
festen Trägerfläche angeordnet.
Die Erfassungssonden sind vorzugsweise kovalent auf der Oberfläche des
festen Trägers befestigt
(vorzugsweise eine nicht-poröse
feste Trägerfläche), und
zwar an einer ihrer Extremitäten,
vorzugsweise über
ihr 5'-Ende. Die
Sensitivität
kann durch das punktförmige
Auftragen der Erfassungssonden auf der festen Trägerfläche durch einen Roboter mit
hoher Dichte gemäß einer
Anordnung weiter erhöht
werden. Die Menge der Erfassungssonden, die punktförmig auf
der Anordnung aufgetragen werden, liegt vorzugsweise zwischen etwa
0,01 und etwa 5 Pikomol des Sequenzäquivalents/cm2 der
festen Trägerfläche.
-
Die
Erfindung betrifft auch ein Kit für die Feststellung einer Nukleotidbase
an einem bestimmten Lokus einer Gennukleotidsequenz eines Organismus
(zur Charakterisierung des Vorhandenseins eines Einzelnukleotidpolymorphismus)
unter mindestens 2 möglichen
Nukleotidbasen, welches Medien oder Vorrichtungen zum Durchführen des
Verfahrens gemäß der Erfindung
beinhaltet. Das Kit ist vorzugsweise in einer automatischen Vorrichtung
enthalten (welche die meisten Schritte der vorliegenden Erfindung
automatisch durchführt),
wie eine Screening-Vorrichtung mit hohem Durchsatz. Das Kit oder
die Vorrichtung sind für
die Durchführung
aller Schritte oder nur mehrerer spezifischer Schritte des Verfahrens
gemäß der Erfindung
geeignet.
-
Das
Kit umfasst:
- – eine Fläche eines unlöslichen
festen Trägers
(22), vorzugsweise eine nicht-poröse, feste Trägerfläche, umfassend:
- – (a)
mindestens zwei Erfassungssonden (9, 9'), gebunden
an bestimmten Positionen der Fläche
des unlöslichen
festen Trägers
(22), wobei die Erfas sungssonden (9, 9') eine spezifische
Sequenzkomplementarität
zu einem Teil (2) einer Nukleotidzielsequenz (7 oder 7') aufweisen,
die einen ersten Lokus aufweist, und wobei sich jede Erfassungssonde
(9) von der anderen Erfassungssonde (9') durch eine
einzige Base (20) an der Lokusstelle unterscheidet, und
- – (b)
mindestens eine weitere Erfassungssonde (10), die sich
extern zu dem ersten Lokus befindet und ähnliche physikalische und chemische
Eigenschaften wie die anderen beiden Erfassungssonden (9, 9') und eine zu
einem anderen Teil (4) der Nukleotidzielsequenz (8)
komplementäre
Sequenz aufweist, ausgenommen eine Base (21), die nicht
komplementär
ist (die Ziel- und Erfassungsnukleotidsequenz sind komplementäre Sequenzen,
jedoch unterscheidet sich diese Komplementarität durch eine Base), und
- – einen
in das Trägermittel
eingebetteten computerisierten Code zum Bestimmen (Charakterisieren
oder Feststellen) des Vorhandenseins der Nukleotidbase (1)
an einem bestimmten Lokus, wobei ein Signalwert der Feststellung
der Zielsequenz (7 oder 7') auf ihrer spezifischen Erfassungssonde
(9 oder 9')
höher als ein
oder gleich einem Grenzsignalwert ist, der aus dem Signalwert der
Feststellung der Zielsequenz (8) auf ihrer spezifischen
mutierten Erfassungssonde (10) errechnet wird, ein positives
Ergebnis ergibt, welches die Nukleotidbase (1) identifiziert
(deren Vorhandensein feststellt).
-
In
einem weiteren Schritt bestimmt der in das Trägermittel eingebettete computerisierte
Code des Kits, dass der Organismus an einem bestimmten Lokus heterozygot
ist, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen
(
7 und
7')
auf mutierten und nicht-mutierten Erfassungssonden (
9 und
9') beide positiv sind,
und die Signalwerte erfüllen
möglicherweise
die Bedingung, dass der nach der Formel:
berechnete Index (CI-Wert)
kleiner als 1, vorzugsweise kleiner als 0,7 und bevorzugt sogar
kleiner als 0,5 ist; wobei es sich bei N um den durchschnittlichen
Signalwert der Feststellung auf mutierten (
9) bzw. nicht-mutierten
(
9') Erfassungssonden
handelt.
-
Die
feste Trägerfläche enthält mindestens
10 unterschiedliche Erfassungssonden, die als eine Anordnung vorliegen,
welche auf 5 unterschiedliche Loci des Gens/der Gene abzielt, und
besser mindestens 40 unterschiedliche Erfassungssonden, die auf
mindestens 20 unterschiedliche Loci abzielen.
-
In
einer bevorzugten Ausführungsform
umfassen die Erfassungssonden eine spezifische Sequenz für die Bindung
an die Nukleotidzielsequenz, die durch einen Abstandshalter (oder
Linker), der eine physikalische Länge von mindestens etwa 6,8
mm, äquivalent
zum Abstand von mindestens etwa 20 Basenpaar langen Nukleotiden
in Doppelhelixform aufweist, mit der Oberfläche des festen Trägers (22)
verknüpft
ist.
-
In
einer bevorzugten Ausführungsform
ist der Abstandshalter (oder Linker) ein Polynukleotid mit einer Länge von
mindestens etwa 20 Nukleotiden, mindestens etwa 50 oder etwa 70
Nukleotiden und vorzugsweise mindestens etwa 90 Nukleotiden. Der
Abstandshalter (oder Linker) ist eine bestimmte Nukleotidsequenz,
die zu keiner der Genomsequenzen homolog ist (unter Verwendung einer
Identität
von mindestens 10 und besser 5 konsekutiven Basen). Zur Vermeidung
nichtspezifischer Hybridisierung gibt es nicht mehr als etwa 15
konsekutive komplementäre
Basenpaarbindungen zwischen einer Zielpolynukleotid-(oder Nukleotid-)Sequenz und
dem Abstandshalter, vorzugsweise gibt es weniger als 10 solche möglichen
Paarungen, bevorzugter weniger als 5. An sich enthält die Nukleotidsequenz
des Abstandshalters vorzugsweise weniger als 15 Basen und bevorzugter
weniger als 10 und noch bevorzugter weniger als 5 zusammenhängende Basen,
die komplementär
zu den festzustellenden Nukleotidzielsequenzen sind. Die Feststellung
möglicher
konsekutiver Sequenzen erfolgt leicht durch einen Vergleich der
Sequenzen mit einer Moleküldatenbank,
wie sie von Genbank bereitgestellt wird, und unter Verwendung einer
Software wie Nukleotid-Nukleotid-BLAST(blastn)(http://www.ncbi.nlm.nih.gov/BLAST).
-
Die
Gesamtlänge
der Erfassungssonden (Nukleotidsequenzen), einschließlich des
Abstandshalters, liegt zwischen etwa 30 und etwa 300 Basen, vorzugsweise
zwischen etwa 35 und etwa 200 Basen, bevorzugter zwischen etwa 39
und etwa 120 Basen.
-
In
einer anderen bevorzugten Ausführungsform
der Erfindung sind die Erfassungssonden (Nukleotidsequenzen) chemisch
synthetisierte Oligonukleotidsequenzen von etwa 100 Basen, welche
z. B. auf einem programmierten automatischen Synthesizer leicht
hergestellt werden können.
Solche Sequenzen können
eine funktionalisierte Gruppe für
die kovalente Befestigung auf dem Träger mit hohen Konzentrationen
tragen. Längere
Erfassungsnukleotidsequenzen werden vorzugsweise durch PCR-Amplifizierung
einer Sequenz synthetisiert, die in ein Plasmid eingefügt ist,
welches den spezifischen Teil (oder Abschnitt) der Erfassungsnukleotidsequenz
und den nichtspezifischen Teil (oder Abschnitt) (Abstandshalter)
enthält.
-
Chemische
und physikalische Eigenschaften stehen für Merkmale der externen Erfassungssonden (10),
welche eine Hybridisierungseffizienz ähnlich der spezifischen Erfassungssonde
(9 oder 9')
für die
festzustellenden Mutationen verleihen.
-
Die
chemischen und physikalischen Eigenschaften umfassen Folgende: den
spezifischen Teil der Nukleotidsequenz (Länge, Tm), den Prozentsatz des
GC-Gehalts und die Länge
des Abstandshalters.
-
In
einer bevorzugten Ausführungsform
weist die Erfassungssonde (10), die sich außerhalb
des Lokus befindet, die gleichen Merkmale wie die spezifischen Erfassungssonden
(9, 9')
auf.
-
In
einer bevorzugten Ausführungsform
bedeuten ähnliche
physikalische oder chemische Eigenschaften der Nukleotidsequenzen,
dass die spezifischen Nukleotidsequenzen der Erfassungssonden (die
in der Lage sind, sich an die Nukleotidzielsequenzen zu binden)
eine Tm zwischen etwa 55 und etwa 75°C und vorzugsweise zwischen
etwa 62 und etwa 68°C
aufweisen.
-
In
einer weiteren bevorzugten Ausführungsform
weisen die Erfassungssonden (9, 9'), die sich durch eine Base unterscheiden,
in ihren spezifischen Nukleotidsequenzen (die in der Lage sind,
die Nukleotidzielsequenzen spezifisch zu binden) einen GC-Gehalt
zwischen etwa 40 und etwa 70% und vorzugsweise zwischen etwa 45
und etwa 60% auf.
-
Ferner
haben die Erfinder unerwarteterweise herausgefunden, dass eine bessere
Unterscheidung der SNP, die an einem Lokus eines Gens vorliegen,
erhalten wird, wenn sich die festzustellende Nukleotidbase in einem
Abstand von etwa 4 bis etwa 10 Basen und besser 4 bis 6 Basen von
einer Extremität
des zielspezifischen Teils der gebundenen Erfassungssonde befindet.
-
Der
Abstandshalter (Linker) befindet sich vorzugsweise an der 5'-Extremität der Erfassungssonde, welche
durch eine kovalente Verbindung am 5'-Ende oder in dessen Nähe an der
Oberfläche
des festen Trägers
befestigt ist. Die spezifische Nukleotidsequenz für die Bindung
an die Nukleotidzielsequenz befindet sich vorzugsweise am 3'-Ende der Erfassungssonden
(die freie Extremität,
die nicht an den Träger
gebunden ist), an 1 bis 23 Nukleotiden vom Ende.
-
Die
Erfassungssonden (9 oder 9' und 10) unterscheiden
sich vorzugsweise durch eine Base, die sich an 4 bis 10 und vorzugsweise
an 4 bis 6 Basen vom (freien) 3'- Ende des zielspezifischen
Teils (Abschnittes) der gebundenen Erfassungssonde befindet.
-
Die
Anordnung kann spezifische Erfassungsnukleotidsequenzen für jede Base
eines spezifischen festzustellenden Lokus enthalten. Die festzustellenden
Basen befinden sich innerhalb eines oder mehrerer Exone derselben
Gennukleotidsequenz oder aus unterschiedlichen Gennukleotidsequenzen.
-
In
einem bevorzugten Beispiel enthält
die Anordnung spezifische Erfassungssonden (9, 9', 10)
für die Feststellung
von SNP in den humanen Cytochromen P450 2C9, 2C19 und 2D6. Die Cytochrome
p450 2C9 und 2D6 werden vorzugsweise auf einer Anordnung von Erfassungssonden
(9, 9', 10)
festgestellt, welche spezifische Mutationen enthalten, wie in Tabelle
1 bereitgestellt. Die Cytochrome P450 für die Mutationen 2C9*1,2 und
1,8 und für
2C19*1,2 und 1,3 werden vorzugsweise auch auf der Anordnung hinzugefügt, zusammen
mit den in Tabelle 1 bereitgestellten Mutationen.
-
Die
Anordnung kann spezifische Erfassungssonden für die Feststellung mehrerer
SNP in einer Gennukleotidsequenz enthalten, oder die Anordnung kann
spezifische Erfassungssonden für
die Feststellung mehrerer SNP in unterschiedlichen Gennukleotidsequenzen
enthalten.
-
Die
Nukleotidzielsequenzen werden während
des Amplifizierungsschrittes markiert. Die markierten assoziierten
Feststellungen sind zahlreich. Eine Übersicht über die unterschiedlichen Markierungsmoleküle ist in
WO 97/27317 gegeben. Sie
werden unter Verwendung entweder bereits markierter Primer oder
durch den Einschluss markierter Nukleotide während des Amplifizierungsschrittes
erhalten. Die am häufigsten
verwendeten und bevorzugten Markierungen sind Fluorochrome wie Cy3,
Cy5 und Cy7, die für
die Analyse einer Anordnung durch Verwendung im Handel erhältlicher
Anordnungsscanner geeignet sind (General Scanning, Genetic Microsystem,
...).
-
Radioaktive
Markierung, kalte Markierung oder indirekte Markierung mit kleinen
Molekülen,
die danach durch spezifische Liganden erkannt werden (Streptavidin
oder Antikörper)
sind häufig
verwendete Verfahren. Das daraus resultierende Signal der Zielfixierung
auf der Anordnung ist entweder fluoreszent, kolorimetrisch, Diffusion,
elektrolumineszent, bio- oder chemilumineszent, magnetisch, elektrisch,
wie impedometrisch oder voltametrisch (
US-A-5,312,527 ).
-
Ein
bevorzugtes Verfahren basiert auf der Verwendung der Goldmarkierung
des gebundenen Ziels zum Erhalt einer Resonanzlichtstreuungs-(RLS – resonance
light scattering) Feststellung oder Silbereinfärbung, die dann leicht festgestellt
und durch einen Scanner quantifiziert werden kann. Goldpartikel
mit einer Größe von 10–30 nm sind
für die
Silberamplifizierung erforderlich, während Partikel mit einer Größe von 40–80 nm für die direkte
Feststellung von Goldpartikeln durch RLS oder durch Photothermisches Überlagerungs-Imaging
erforderlich sind.
-
In
einem bevorzugten Verfahren werden Goldpartikel mit einer Größe von 10–30 nm durch
Silberanreicherung amplifiziert, vorzugsweise unter Verwendung der
Silver quant-Analyseplattform, einschließlich des Silverquant-Kits
zur Feststellung, des Silverquant-Scanners zum Objektträger-Scannen
und der Silverqaunt-Analysesoftware zur Bildquantifizierung und
Datenanalyse (Eppendorf, Deutschland). Aufgrund der nichtlinearen
Feststellung des Vorhandenseins von Silber erfordert die Datenanalyse
eine Linearisierung der Daten vor der Datenverarbeitung. Die Daten
werden dann gemäß der Erfindung
verarbeitet. Ein Algorithmus der Kurvenanpassung wird auf eine positive
Feststellungskurve angewandt, die punktförmig auf die Anordnung aufgetragen
ist. Dann wird jedes Punktsignal unter Verwendung der Anpassungskurve
in ,Konzentrationseinheiten' linearisiert.
-
Die
Quantifizierung muss nicht nur den Hybridisierungsertrag und den
Feststellungsmaßstab
auf der Anordnung berücksichtigen,
sondern auch den Extraktions-, den Amplifizierungs-(oder den Kopier-)
und den Markierungsschritt.
-
Der
feste Träger
gemäß der Erfindung
wird aus Materialien hergestellt, die ausgewählt sind aus der Gruppe bestehend
aus Gelschichten, Gläsern,
elektronischen Vorrichtungen, Silikon- oder Kunststoffträgern, Polymeren,
CDs, Metallträgern
oder einer Mischung daraus (siehe
EP
0 535 242 ,
US-Patentschrift
Nr. 5,736,257 ,
WO 99/35499 ,
US-Patentschrift Nr. 5,552,270 usw.).
Vorteilhafterweise ist der feste Träger ein einzelner Glasobjektträger, der
zusätzliche
Mittel (Barcodes, Marker usw.) oder Medien zur Verbesserung des Verfahrens
gemäß der Erfindung
aufweisen kann.
-
Im
letzten Schritt des Verfahrens der Erfindung gelten Ergebnisse als
positiv oder negativ gemäß der Tatsache,
dass die Signalintensität
höher oder
niedriger als ein bestimmter Grenzwert ist.
-
Die
Grenzsignalwerte werden vorzugsweise als festgestellte Signalwerte
der externen Erfassungssonde (10) übernommen, welche auf eine
entsprechende Zielsequenz (8) gerichtet ist, und mit einem
Faktor multipliziert.
-
In
einer bevorzugten Ausführungsform
ist der Grenzsignalwert der Signalwert der Feststellung des zweiten
Satzes von Nukleotidzielsequenzen (8) auf ihrer entsprechenden
spezifischen mutierten Erfassungssonde (10), multipliziert
mit einem Faktor zwischen 2 und 5 und vorzugsweise zwischen 3 und
4, bevorzugter noch Faktor 4.
-
In
einer weiteren bevorzugten Ausführungsform
ist der Grenzsignalwert 4 Mal das Signal, welches mit den Erfassungssonden
(10) außerhalb
des festgestellten Lokus erhalten wurde, bei welchem es sich vorzugsweise
um den Mittelwert replizierter Punkte handelt.
-
Vorzugsweise
wird der Grenzsignalwert aus einem durchschnittlichen Signalwert
der Feststellung von mindestens zwei unterschiedlichen Sätzen von
Nukleotidzielsequenzen (8) auf mindestens zwei unterschiedlichen
komplementären
spezifischen mutierten Erfassungssonden (10) berechnet.
-
Die
Signalwerte der Erfassungssonden (7 oder 7'), welche auf
spezifische Zielloci gerichtet sind, werden für eine Berechnung des Grenzsignalwertes
in Betracht gezogen, solange sie die Merkmale externer Erfassungssonden
(10) aufweisen, einschließlich der Unterscheidung vom
Ziel durch eine Base.
-
Vorzugsweise
wird der Grenzsignalwert aus einem durchschnittlichen Signalwert
der Feststellung von mindestens zwei unterschiedlichen Sätzen von
Nukleotidzielsequenzen (7 oder 7') auf mindestens zwei unterschiedlichen
komplementären
spezifischen mutierten Erfassungssonden (9 oder 9') berechnet.
-
Das
Verfahren der Erfindung ist auch für die Feststellung von SNP
in einem Organismus geeignet, der an einem bestimmten Lokus heterozygot
ist. In einer bevorzugten Ausführungsform
gilt der Organismus als an bestimmten Loci heterozygot, wenn die
Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') auf mutierten
und nicht-mutierten
Erfassungssonden (9 und 9') beide positiv sind.
-
Der
Organismus kann auch als an bestimmten Loci heterozygot gelten,
wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen
(
7 und
7')
auf mutierten und nicht-mutierten Erfassungssonden (
9 und
9') beide positive
sind, und ferner wenn die Signalwerte die Bedingung erfüllen, dass
der nach der Formel:
berechnete Index (CI-Wert)
kleiner als 1 ist; wobei es sich bei N um den durchschnittlichen
Signalwert der Feststellung auf mutierten (
9) oder nicht-mutierten
(
9') Erfassungssonden
handelt. In einer noch bevorzugteren Ausführungsform ist der CI-Wert
kleiner als 0,7 und noch besser kleiner als 0,5.
-
In
einer bevorzugten Ausführungsform
gilt der Organismus als an einem bestimmten Lokus homozygot, wenn
nur einer der Signalwerte der Feststellung der Nukleotidzielsequenzen
(7 oder 7')
auf mutierten und nicht-mutierten Erfassungssonden (9 oder 9') positiv ist.
-
Vorteilhafterweise
enthält
die Anordnung auch Erfassungssonden für die spezifische Feststellung des/der
spezifisch amplifizierten Zielgene/s, die sich außerhalb
des Lokus von Interesse befinden. Solche Erfassungssonden werden
vorzugsweise zur Bestätigung
der Identifikation des Gens/der Gene oder zur Unterscheidung zwischen
zwei Genen, die sehr homolog sind, hinzugefügt. Die Erfassungssonde wird
als positive Kontrolle der PCR und Hybridisierung verwendet.
-
Vorteilhafterweise
enthält
die Anordnung auch Punkte mit verschiedenen Konzentrationen (d.
h. 4) markierter Erfassungssonden. Diese markierten Erfassungssonden
werden aus bekannten Konzentrationslösungen punktförmig aufgetragen
und ihre Signale gestatten die Umwandlung der Ergebnisse der Hybridisierung
in absolute Werte. Sie gestatten auch das Testen auf die Reproduzierbarkeit
der Feststellung.
-
In
einer Ausführungsform
wird der feste Träger
(Biochip) in einen Träger
eingeführt,
der mit Eingangs- und Ausgangsröhrchen
verbunden ist und durch einen Automaten gehandhabt wird, welcher
die flüssige
Lösung
kontrolliert, wie sie in der Mikrofluidtechnologie entwickelt wurde.
Durch das Einführen
in ein solches Mikrolaborsystem kann er durch Automaten inkubiert,
erhitzt, gewaschen und markiert werden, selbst bei vorhergehenden
Schritten (wie Extraktion von DNA, Amplifizierung durch PCR) oder
dem folgenden Schritt (Markierung und Feststellung). All diese Schritte
können
auf demselben festen Träger
durchgeführt
werden.
-
Vorzugsweise
umfasst das Kit der Erfindung mindestens einen unlöslichen
festen Träger,
auf dem einige Erfassungssonden gebunden sind (vorzugsweise durch
eine direkte kovalente Verbindung oder durch das Zwischenprodukt
eines Abstandshalters an die Oberfläche des festen Trägers gebunden),
und zwar gemäß einer
Anordnung mit einer Dichte von mindestens 4, vorzugsweise mindestens
10, 16, 20, 50, 100, 1.000, 4.000, 10.000 oder mehr unterschiedlichen
Erfassungssonden/cm2 der Fläche des
unlöslichen
festen Trägers, wobei
die Erfassungssonden vorteilhafterweise eine Länge zwischen etwa 30 und etwa
300 Basen aufweisen (einschließlich
des Abstandshalters) und eine Sequenz von etwa 10 bis etwa 50 Basen
enthalten, wobei die Sequenz spezifisch für das Ziel ist (was bedeutet,
dass die Basen der Sequenz in der Lage sind, eine Bindung mit ihren
komplementären
Basen in der Sequenz des Ziels durch komplementäre Hybridisierung zu bilden).
-
KURZBESCHREIBUNG DER ZEICHNUNGEN
-
1 ist
eine schematische Darstellung eines bevorzugten Verfahrens der Erfindung
für die
Feststellung eines SNP (mutierte Base 1 dargestellt durch
X) an einem bestimmten Lokus der Gennukleotidsequenz (3)
eines Organis mus. Ein Abschnitt der Gennukleotidsequenz wird durch
PCR entweder mittels eines einzelnen Primerpaares (5, 6') oder unterschiedlicher
Primerpaare (5, 5' und 6, 6') in einen ersten
Satz von Nukleotidzielsequenzen (7 oder 7') und einen
zweiten Satz von Nukleotidzielsequenzen (8) amplifiziert,
welche beide markiert sind (Kreis). Die Amplikone werden dann, nach
der Markierung, mit einer Anordnung von Erfassungssonden in Kontakt
gebracht, die auf einem festen Träger (22) immobilisiert
sind, aufweisend: (a) ein Paar von Erfassungssonden (9 und 9') mit derselben
spezifischen Hybridisierungssequenz, die zu einem Abschnitt (2) der
Nukleotidzielsequenz (7 und 7') komplementär ist, sich jedoch durch eine
einzelne Base (20) unterscheidet, welche der mutierten
Base (1) entspricht, welche an dem zu charakterisierenden
Lokus vorliegt; (b) eine Erfassungssonde (10) mit einer
spezifischen Hybridisierungssequenz, die zu einem Abschnitt (4)
der Nukleotidzielsequenz (8) komplementär ist, sich jedoch durch eine
einzelne Base (21) an der Position Y unterscheidet. Das
Vorhandensein von SNP wird bestimmt, wenn der Signalwert der Feststellung
der Zielsequenz (7 und/oder 7') auf ihren entsprechenden Erfassungssonden
(9 oder 9')
höher als
ein oder gleich einem Grenzsignalwert der Feststellung der Zielsequenz
(8) auf ihrer entsprechenden spezifischen mutierten Erfassungssonde
(10) ist. Alle Erfassungssonden weisen ähnliche physikalische und chemische
Eigenschaften auf.
-
Tabelle
1 liefert eine Liste von Sonden für die SNP-Feststellung auf
humanen CYP2D6 und CYP2C9-Genen. Sequenz, Schmelztemperatur (Tm),
GC-Prozentsatz (% GC) und Länge
jeder Sonde sind detailliert aufgeführt. Die substi tuierten Nukleotide
sind unterstrichen; die Punkte stehen für gelöschte Nukleotide.
-
Tabelle
2 liefert das Ergebnis der SNP-Feststellung einer Probe CYP2D6*1/*4
kombiniert mit CYP2C9*1/*3. Die Probe wurde 5 Mal hybridisiert (n
= 5).
-
Tabelle
3 liefert das Ergebnis der SNP-Feststellung einer Probe CYP2C9*9.
Die Probe wurde 3 Mal hybridisiert (n = 3).
-
Beispiele
-
Beispiel 1: Feststellung von 2 Mutationen
in CYP2C9 (Exon 3)
-
Das
CYP2C9-Gen, welches 2 Hauptmutationen in Exon 3 enthält, wird
durch PCR unter Verwendung der folgenden Primer amplifiziert:
-
Die
PCR erfolgte auf Genom-DNA, die mit dem Kit Quiaamp DNA Blood mini
(Qiagen, Venlo, Niederlande) mit einem abschließenden Volumen von 50 μl aus einer
Blutprobe extrahiert wurde, wobei das Kit Folgendes enthielt: 3
mM MgCl2, 10 mM Tris pH 8,4, 50 mM KCl,
125 μM jeden
Primers, 200 μM
dATP, dCTP und dGTP (Roche), 150 μM
dTTP, 50 μM
dUTP, 10 μM
Biotin-11-dATP (PerkinElmer), 10 μM
Biotin-11-dCTP (PerkinElmer),
2,5 U Taq-DNA-Polymerase Ultratools (Labsystems), 25 ng Genom-DNA.
Die Proben wurden zuerst für
5 Min. bei 94°C
denaturiert. Dann erfolgten 40 Zyklen Amplifizierung, bestehend
aus 30 Sek. bei 94°C, 1
Min. bei 63°C
und 1 Min. bei 72°C
und einem abschließenden
Extensionsschritt von 10 Min. bei 72°C. Wasserkontrollen wurden als
negative Kontrollen der Amplifizierung verwendet. Die erwartete
Größe ist 622
bp.
-
Immobilisierung der Erfassungsnukleotidsequenz
-
Das
in
WO 02/18288 beschriebene
Protokoll (Beispiel 1 und 2) wurde befolgt, um einen Aldehyd-derivatisierten
Glasobjektträger
(Diaglass-Objektträger)
zu erhalten. Eine Liste von Erfassungssonden für die SNP-Feststellung auf
humanen CYP2D6- und CYP2C9-Genen liegt in Tabelle 1 vor. Die aminierten
Erfassungnukleotidsequenzen wurden punktförmig auf einen Diaglass-Objektträger aufgetragen,
und zwar gemäß des in
WO 01/77372 beschriebenen
Protokolls (Beispiel 1) mit einer Konzentration von 3000 nM.
-
Fragmentierung
-
Nach
der PCR werden die amplifizierten Sequenzen (Amplikone) aufgereinigt
und quantifiziert. Die amplifizierte DNA wird mit einer DNAse (Promega,
Madison, USA) bei Raumtemperatur für 5 Min quantifiziert. Die
Reaktion wird durch die Zugabe von 3 mM EGTA und Inkubation bei
65°C für 10 Min.
gestoppt (Grimm et al. 2004, Journal of Clinical Microbioloy, 42,
3766–3774).
Die DNAse schneidet die Amplikone zufällig, wodurch Fragmente von
etwa 50 bp entstehen. Die Effizienz der Fragmentierung wird mittels
eines DNA 1000 LabChip® (Agilent Technologies,
Deutschland) geprüft.
-
Hybridisierung
-
Ein
Volumen von 10 μl
NaOH 0,175 N wurde zu 10 μl
fragmentierten Amplikonen, 5 μl
positiver Hybridisierungskontrolle und 10 μl destilliertem Wasser zugegeben.
Die Mischung wurde bei Raumtemperatur für 5 Min. inkubiert. Ein Volumen
von 35 μl
Genomic Hybribuffer (Eppendorf, Deutschland) wurde abschließend zugegeben
und die Lösung
wurde eingeschlossen durch eine Hybridisierungskammer auf die Anordnung
geladen. Die Kammer wurde mit einem Deckglas geschlossen. Die Hybridisierung
erfolgte bei 60° für 2 h. Proben wurden
4 Mal mit Unibuffer (Eppendorf, Deutschland) gewaschen.
-
Kolorimetrische Feststellung
-
Die
Glasproben wurden für
45 Min. bei Raumtemperatur mit kolloidalem goldkonjugiertem IgG
Anti-Biotin 1000 x verdünnt
in Blockierungspuffer inkubiert. Nach 5 Waschungen mit Waschpuffer
diente das Vorhandensein von Gold der Katalyse der Silberreduktion
unter Verwendung des Silverquant-Kits (Eppendorf, Hamburg, Deutschland).
Die Objektträger
wurden 1 Mal für
5 Min. mit der Anzeigemischung aus Silverquant-A- und -B-Lösung inkubiert,
dann mit Wasser gespült,
getrocknet und mittels des Silverquant-Scanners (Eppendorf, Hamburg,
Deutschland) analysiert. Jeder Objektträger wurde dann durch die Silverquant-Analysesoftware analysiert.
Ein Kurvenanpassungsalgorithmus wurde zum Linearisieren der Signalintensitäten verwendet,
welche mit dem Silverquant-Feststellungsverfahren erhalten wurden.
Der Algorithmus verwendete eine positive Feststellungskurve, die
punktförmig
auf die Anordnung aufgetragen wurde.
-
Fluoreszenz-Feststellung
-
Die
Glasproben wurden für
45 Min. bei Raumtemperatur mit dem Cy3-konjugierten IgG Anti-Biotin (Jackson
Immuno Research Laboratories, Inc. #200-162-096) verdünnt 1/1000
X Konjugat-Cy3 in dem Blockierungspuffer inkubiert und vor Licht
geschützt.
Nach dem Waschen wurden die Objektträger getrocknet, bevor sie bei
Raumtemperatur gelagert wurden. Die Feststellung erfolgte im konfokalen
Laserscanner „ScanArray"TM (Packard,
USA). Jeder Objektträger
wurde dann durch die Imagene-Quantifizierungssoftware (Biodiscovery)
quantifiziert.
-
Datenanalyse
-
Die
Signale wurden mit einer Schwellenwert-Erfassungssonde verglichen,
bei welcher es sich um die mutierte externe Hybridisierungssonde
handelt. Wenn das Signal höher
als die Schwellenwertsonde multipliziert mit einem Faktor 4 ist,
gilt das Ergebnis als positiv. Wenn umgekehrt das Signal niedriger
ist, gilt das Ergebnis als negativ.
-
Beispiel 2: Feststellung multipler Mutationen
in CYP2D6 und CYP2C9 (Exone 5 und 7)
-
Das
CYP2D6-Gen, welches 3 Hauptmutationen enthält, und das CYP2C9-Gen, welches
6 Hauptmutationen in den Exonen 5 und 7 enthält, wurden durch PCR unter
Verwendung der folgenden Primer amplifiziert:
-
Die
erwarteten Größen der
Amplikone waren 1014 bp für
CYP2D6, 626 bp für
CYP2C9 Exon 5 und 1114 bp für
CYP2C9 Exon 7.
-
PCRs,
Fragmentierungen, Hybridisierungen und Feststellung erfolgten wie
in Beispiel 1 beschrieben unter Verwendung der Fluoreszenzfeststellung.
Die spezifischen Teile der Erfassungssonden für die Hybridisierung der Ziele
sind in Tabelle 1 aufgelistet. Diese Tabelle umfasst Erfassungssonden
für die
Feststellung von 9 Mutationen sowie die externen Erfassungssonden
(10) der Erfindung (2D6 und 2C9 Externe Sonden), welche
jedem amplifizierten Exon entsprechen. Die Anordnung enthält auch
Kontrollsonden, bei welchen es sich um die nicht-mutierten externen
Sonden der Erfindung handelt (2D6 und 2C9 Kontrollsonden). Die Analyse
erfolgte an mehreren klinischen Proben und die Daten sind in Tabelle
2 und 3 aufgelistet. Die Ergebnisse wurden wie in der Erfindung
vorgeschlagen analysiert und die abschließenden Ergebnisse wurden mit
der Bestimmung der Probenmutationen durch Sequenzierung verglichen.
Es gab eine 100% Korrelation der Ergebnisse.
-
-
-
Tabelle
1: Liste von Sonden für
die SNP-Feststellung auf dem CYP2D6- und CYP2C9-Gen (SEQ. ID. NR.:
9–30).
Sequenz, Schmelztemperatur (Tm), GC-Prozentsatz (% GC) und Länge jeder
Sonde sind aufgeführt.
Die substituierten Nukleotide sind unterstrichen; die Punkte stehen
für gelöschte Nukleotide.
Mutation | Mittelwerte
n = 5 | Standardabweichung | Ergebnisse
der Erfindung | Ergebnisse
der Sequenzierung |
2D6*1,3 | 14769 | 2799 | + | + |
2D6*3 | 130 | 130 | – | – |
2D6*1,4 | 14025 | 2926 | + | + |
2D6*4 | 15354 | 2562 | + | + |
2D6*1,6 | 51862 | 4289 | + | + |
2D6*6 | 1164 | 174 | – | – |
2D6
Kontrollsonde | 20273 | 3595 | + | + |
2D6
Externe Sonde | 729 | 221 | – | – |
| | | | |
2C9*1,9 | 16664 | 2731 | + | + |
2C9*9 | 681 | 111 | – | – |
2C9*1,10 | 20239 | 2929 | + | + |
2C9*10 | 1090 | 140 | – | – |
| | | | |
2C9*1,3
= *1,4 | 33802 | 4299 | + | + |
2C9*3 | 28589 | 2903 | + | + |
2C9*1,4 | 33803 | 4299 | + | + |
2C9*4 | 2342 | 247 | – | – |
2C9*1,5 | 53000 | 9404 | + | + |
2C9*5 | 368 | 111 | – | – |
2C9*1,11 | 65061 | 165 | + | + |
2C9*11 | 1990 | 224 | – | – |
2C9
Kontrollsonde | 65156 | 83 | + | + |
2C9
Externe Sonde | 818 | 183 | – | – |
-
Tabelle
2: Probe CYP2D6*1/*4 kombiniert mit CYP2C9*1/*3.
-
Die
Proben wurden 5 Mal hybridisiert (n = 5).
Mutation | Mittelwerte
n = 3 | Standardabweichung | Ergebnisse
der Erfindung | Ergebnisse
der Sequenzierung |
2D6*1,3 | 16055 | 784 | + | + |
2D6*3 | 795 | 57 | – | – |
2D6*1,4 | 29935 | 334 | + | + |
2D6*4 | 2566 | 196 | – | – |
2D6*1,6 | 44038 | 2992 | + | + |
2D6*6 | 1012 | 115 | – | – |
2D6
Kontrollsonde | 33486 | 1150 | + | + |
2D6
Externe Sonde | 1285 | 51 | – | – |
| | | | |
2C9*1,9 | 437 | 15 | – | – |
2C9*9 | 13084 | 556 | + | + |
2C9*1,10 | 15250 | 1015 | + | + |
2C9*10 | 731 | 87 | – | – |
| | | | |
2C9*1,3
= *1,4 | 41655 | 2258 | + | + |
2C9*3 | 1953 | 73 | – | – |
2C9*1,4 | 41655 | 2258 | + | + |
2C9*4 | 2449 | 171 | – | – |
2C9*1,5 | 53196 | 4270 | + | + |
2C9*5 | 253 | 14 | – | – |
2C9*1,11 | 65048 | 65 | + | + |
2C9*11 | 1619 | 142 | – | – |
2C9
Kontrollsonde | 65172 | 13 | + | + |
2C9
Externe Sonde | 617 | 80 | – | – |
-
Table
3: Probe CYP2C9*9. Die Proben wurden 3 Mal hybridisiert (n = 3). SEQUENZEN