DE602005005333T2

DE602005005333T2 - Verfahren zum Nachweis von homologen Sequenzen, welche sich durch eine Base unterscheiden, auf einem Mikroarray

Info

Publication number: DE602005005333T2
Application number: DE602005005333T
Authority: DE
Inventors: Jose Remacle; Francoise De Longueville; Soumya Pastoret; Vincent Bertholet; Nathalie Zammatteo
Original assignee: Eppendorf Array Technologies SA
Current assignee: Eppendorf Array Technologies SA
Priority date: 2005-09-13
Filing date: 2005-09-13
Publication date: 2008-09-18
Anticipated expiration: 2025-09-14
Also published as: EP1762628B1; ATE389035T1; DE602005005333D1; US20070072219A1; EP1762628A1

Description

GEBIET DER ERFINDUNG
Die vorliegende Erfindung betrifft ein Verfahren und ein Kit, welches Reagenzien und Mittel für die Identifikation (Feststellung) möglicher Mutationen (SNPs) im Gen/in Genen oder im Organismusgenom auf der Grundlage der Amplifizierung einer homologen Sequenz gefolgt von deren Feststellung auf einer Anordnung aufweist.
Die Erfindung ist besonders geeignet für die gleichzeitige Identifikation und/oder Quantifizierung multipler Mutationen in derselben Gennukleotidsequenz oder demselben Organismusgenom.
Die vorliegende Erfindung ist gut für diagnostische und analytische Assays geeignet.
GRUNDLAGEN DER ERFINDUNG UND STAND DER TECHNIK
Zu den frühen Verfahren zur Typisierung von Einzelnukleotidpolymorphismen (SNPs – single nucleotide polymorphisms) zählen die folgenden Techniken: SSCP, RFLP, AS-PCR, Sequenzierung mittels Genotypisierungsbeurteilung gekoppelt mit Gelelektrophorese. Diese Verfahren sind aufgrund der Einschränkung der Feststellungsverfahren nicht für großangelegtes Screening geeignet. Jedoch wurden multiple Analysen von Mutationen durch die Verwendung eines auf einer DNA-Mikroanordnung basierenden Verfahrens für die Untersuchung jeder bestimmten Position, an der Mutationen in einer bestimmten Sequenz auftreten können, vereinfacht. Die auf einer Mikroanordnung basierende Mutationsfeststellung kann auch auf multiple unterschiedliche Sequenzen erweitert werden, wie typische Exone desselben Gens, welche üblicherweise aufgrund des Abstands zwischen den Exonen nicht sofort sequenziert werden können.
Beim gebräuchlichsten Verfahren wird das Gen oder Genom, das auf eine mögliche Mutation untersucht wird, zuerst amplifiziert und dann in Ribonukleotidsequenzen kopiert, um sie in Stücke schneiden zu können, die dann auf Oligonukleotidsequenzen, die auf der Anordnung vorliegen, hybridisiert werden. Das Vorhandensein einer Mutation wird gemäß des Verhältnisses des Signals des Oligonukleotids, welches die Mutation aufweist, im Vergleich zum Wildtyp in Betracht gezogen.
Es existieren mehrere Veröffentlichungen zu dieser Technologie. Eine auf einem allelspezifischen Oligonukleotid (ASO – allele specific oligonucleotide) basierende Mikroanordnung wurde für das Screening von 4 Mutantenallelen von CYP2C9 hergestellt (Wen SY et al. 2003, World J. Gastroenterol., 9, 1342–1346). Sondenpaare mit einer Base Differenz für die SNP-Unterscheidung wurden auf Glasobjektträgern immobilisiert. Der Genotyp wurde durch Berechnung des Signalverhältnisses von übereinstimmenden zu nicht übereinstimmenden Sonden bestimmt. Der Verhältniswert der Signalintensität über 4 oder unter 2,5 gilt als ein kritischer Grenzwert für die Genotypisierungsbeurteilung. Wenn die Verhältniswerte zwischen 2,5 und 4 lagen, wurden die Proben erneut genotypisiert.
Die US-Patentschrift 6,410,229 stellt eine Anordnung von Nukleinsäuresonden für die SNP-Feststellung in RNA-Transkripten bereit. Die Quantifizierung der Hybridi sierung wird durch den Vergleich der Bindung von übereinstimmenden und Kontrollsonden erhalten. Die Patentanmeldung WO 9729212 stellt ein Verfahren zum Identifizieren eines Genotyps eines Organismus unter Verwendung einer Anordnung bereit, welche Erfassungssonden aufweist, die komplementär zu Referenz-DNA- oder -RNA-Sequenzen eines anderen Organismus sind (zum Beispiel unter Verwendung von Oligonukleotidsequenzen auf der Grundlage des Mycobacterium tuberculosis rpoB Gens). Die Genotypisierung basiert auf einem Gesamt-Hybridisierungmuster des Ziels zur Anordnung.
Die US-Patentschrift 5,858,659 stellt eine Anordnung bereit, welche Sondenfeststellungsblöcke aufweist, wobei jeder Block vier Gruppen von Erfassungssonden zur Untersuchung einer einzelnen Base beinhaltet (z. B. Verwendung von Blöcken von 40 Oligonukleotiden von 20 Basen zur Untersuchung einer polymorphen Base). Die erste und zweite Gruppe der Erfassungssonden sind komplementär zu der Zielnukleinsäuresequenz, welche die erste und zweite Variante der polymorphen Basen aufweist. Die dritte und vierte Gruppe der Sonden weisen eine Sequenz auf, die identisch mit der ersten und zweiten Gruppe der Sonden ist, außer dass sie Monosubstitutionen von Positionen in der Sequenz enthalten, die sich innerhalb von n Basen der polymorphen Base befinden.
Wenn das Verfahren funktioniert, weist es einige Nachteile auf, da unterschiedliche Erfassungssonden eine unterschiedliche Affinität für Zielsequenzen aufweisen und die Verhältnisse zwischen den mutierten und nicht-mutierten Erfassungssonden variieren sehr von einer Mutation zur anderen. Auch die Festlegung gemeinsamer Hybridisierungs bedingungen ist bei einigen Erfassungssonden ein Problem, welche eine bessere Unterscheidung als die anderen aufweisen. Die Konsequenz ist ein sehr heterogenes Muster von Verhältnissen und gelegentlich die Schwierigkeit der Bestimmung, ob der Organismus homozygot oder heterozygot für die Mutationen an spezifischen Loci ist.
Zwei Verbesserungen wurden jüngst zu diesem Verfahren vorgeschlagen. Die US-Patentanmeldung 2005/0089877 stellt ein Verfahren zur Genotypisierung einer DNA-Sequenz auf Chips mit einer Wildtyp-perfekten Übereinstimmungssonde und einer Mutanten-perfekten Übereinstimmungssonde bereit. Das Verfahren schlägt einen Genotypisierungsalgorithmus für die Optimierung der Erfassungssonden und ein statistisch robustes Verfahren bereit. Der Algorithmus basiert auf der Analyse von Daten, die aus einer Hybridisierung einer identifizierten Standardnukleinsäure und aus einer Genotypisierung des unbekannten Ziels stammen, durch die Substitution von Eingabevektoren in den Genotypisierungsalgorithmus.
Die US-Patentschrift 6,852,488 betrifft ein Sequenzierungsverfahren einer Zielsequenz, jedoch mit der bestimmten Feststellung einer Mutation in der Zielsequenz. Das Verfahren basiert auf der Verwendung einer bekannten Kernsequenz mit hoher Affinität für die Zielsequenz. Das Verfahren schlägt eine Auswahl einer Sonde durch Evaluierung der Bindungseigenschaften aller Sonden vor, welche eine einzelne Nichtübereinstimmung im Vergleich zu einer Kernsonde aufweisen. Wenn die Einzelbasen-Nichtübereinstimmungssonden ein charakteristisches Bindungs- oder Affinitätsmuster zeigen, dann ist die Kernsonde exakt komplemen tär zu mindestens einem Teil der Zielsequenz. Dieses Verfahren gestattet die Mutationsfeststellung in einer Zielsequenz durch einen Vergleich der Bindungsaffinität einer bekannten Kernsonde für die Zielsequenz mit der Bindungsaffinität der Sonde, welche eine Einzelnukleotidvariation aufweist. Dieses Auswahlverfahren der Sonde basiert auf dem experimentellen Screening von Erfassungssonden durch die Auswahl einer Sonde mit hoher Affinitätsbindung.
Jedoch erfordern diese beiden Verfahren multiple Experimentschritte und sind daher kompliziert und zeitaufwändig. Ferner sind sie nicht geeignet für die Entwicklung einer großen Anzahl von Mutationsfeststellungen auf einer Mikroanordnung, da sie eine experimentelle Optimierung für jede Mutation erfordern und sie einen unterschiedlichen Berechnungsprozess zum Erhalt eines abschließenden Resultates in Bezug auf jede Mutation verwenden. Sie stellen auch keine A-priori-Lösung für die Entwicklung von Biochips für die Feststellung multipler SNPs in einem Organismusgenom bereit.
KURZFASSUNG DER ERFINDUNG
Die vorliegende Erfindung bietet eine originelle und einfache Lösung zur Bestimmung des Vorhandenseins oder Nichtvorhandenseins von mindestens 3 und vorzugsweise 5 und weiter vorzugsweise 20 Einzelnukleotidpolymorphismen oder SNP (mutierte Base 1) an bestimmten Loci der Gennukleotidsequenz(en) (3) eines Organismus (einschließlich des Menschen), zur Identifikation oder Feststellung mehrerer homologer Sequenzen (7, 7'), die in der/den Sequenz(en) (3) vorliegen, welche sich durch eine Base (1) unterscheiden, welche folgende Schritte umfasst:

– Amplifizieren der homologen Gennukleotidsequenzen oder Anteilen davon, welche unterschiedliche Loci enthalten, zu einem ersten Satz/ersten Sätzen von Nukleotidzielsequenzen (homologe Sequenzen 7 oder 7') und;
– Amplifizieren eines zweiten Fragments der nicht mutierten Gennukleotidsequenz(en) zu einem zweiten Satz von Nukleotidzielsequenzen (8);
– Kontaktieren des ersten Satzes/der ersten Sätze der Nukleotidzielsequenzen (7 oder 7') mit einer Anordnung von Erfassungssonden (9, 9', 10) (die an die Oberfläche eines festen Trägers (22) gebunden sind), wobei die Anordnung eine Reihe von Paaren von Erfassungssonden (9 und 9') aufweist, welche dieselbe spezifische Hybridisierungssequenz aufweisen, die zu einem Teil der unterschiedlichen Nukleotidzielsequenzen (7 und 7') komplementär ist, sich aber durch eine einzelne Base (20), welche zu der in der zu charakterisierenden Lokussequenz vorhandenen mutierten Base (1) komplementär ist, unterscheidet;
– Kontaktieren des zweiten Satzes der Nukleotidzielsequenzen (8) mit einer komplementären Erfassungssonde (10), welche eine spezifische Hybridisierungssequenz aufweist, die zu einem Teil der Nukleotidzielsequenz (8) komplementär ist, sich aber durch eine einzelne Base (21) unterscheidet;
– Feststellen und/oder Quantifizieren des Signalwertes der Hybridisierung des ersten Satzes der Nukleotidzielsequenzen (7 oder 7') und des Signalwertes der Hybridisierung des zweiten Satzes von Nukleotidzielsequenzen (8); und
– Feststellen des Vorhandenseins der Nukleotidbase (1) an den unterschiedlichen Loci, wobei die Signalwerte der Feststellung der Zielsequenz(en) (7 und/oder 7') auf ihren entsprechenden Erfassungssonden (9 oder 9') höher sind als ein bzw. gleich einem Grenzsignalwert, der aus dem Signalwert der Feststellung des zweiten Satzes der Zielsequenz (8) auf ihrer entsprechenden spezifischen mutierten Erfassungssonde (10) berechnet wird, wobei die Erfassungssonden (9, 9' oder 10) ähnliche physikalische und chemische Eigenschaften aufweisen; und
– Feststellen des Vorhandenseins von Einzelnukleotidpolymorphismen (mutierte Base 1) an den unterschiedlichen Loci.

In dem Verfahren gemäß der Erfindung ist diese Feststellung besonders geeignet für die Identifikation multipler Einzelnukleotidpolymorphismen oder multipler Mutationen (multiple SNPs), die an einem anderen Genlokus vorliegen. Das Verfahren stellt auch Werkzeuge und Mittel für die Feststellung bereit, ob ein Organismus an einem bestimmten Genlokus heterozygot (unterschiedliche Allele) oder homozygot (gleiche Allele) ist.
Vorzugsweise erfolgt die Feststellung oder Charakterisierung auf derselben Anordnung. Ferner erfolgt der Schritt des Vergleichens des Signalwertes der Hybridisierung zwischen den unterschiedlichen Sätzen von Zielen und ihren entsprechenden Erfassungssonden auf derselben Anordnung. Die Erfassungssonden befinden sich vorzugsweise an spezifischen Positionen der Fläche eines festen Träges 22, welcher eine Anordnung bildet.
DEFINITION
Soweit nicht anders definiert, haben alle hierin verwendeten technischen und wissenschaftlichen Begriffe dieselbe Bedeutung wie allgemein durch einen Durchschnittsfachmann auf dem Gebiet, zu dem diese Erfindung gehört, verstanden wird.
Die Begriffe „Nukleotidsequenz, Anordnung, Ziel-(und Erfassungs-)Nukleotidsequenz, binden im Wesentlichen, spezifisches Hybridisieren mit, Hintergrund, Quantifizieren" sind wie in WO 97/27317 beschrieben, welche hierin durch Verweis eingefügt ist.
Die Begriffe „Nukleotidtriphosphat, Nukleotid, Primersequenz" sind die in der Europäischen Patentanmeldung EP 1096024 beschriebenen, die hierin durch Verweis eingefügt ist.
Der Begriff „Gen" steht für eine grundlegende physikalische und funktionale Vererbungseinheit, die Informationen von einer Generation zur nächsten trägt; ein DNA-Segment, dass sich an einer spezifischen Stelle auf einem Chromosom befindet, welches ein spezifisches funktionales Produkt codiert. Das DNA-Segment setzt sich zusammen aus der transkribierten Region und einer regulatorischen Sequenz, welche die Transkription möglich macht (Regionen, die der codierenden DNA vorangehen und auf sie folgen, sowie Introne zwischen den Exonen).
Der Begriff „Lokus" steht für die Position des Einzelnukleotidpolymorphismus (SNP) auf der Sequenz des Gens.
„Homologe Sequenzen" steht für Nukleotidsequenzen, welche einen Prozentsatz von Nukleotiden, die an entsprechenden Positionen identisch sind, aufweisen, der höher ist als in reinweg zufälligen Anordnungen. Zwei Sequenzen gelten als homolog, wenn sie zwischen sich ein Minimum an Homologie (oder Sequenzidentität) aufweisen, das als der Prozentsatz identischer Nukleotide definiert ist, die an jeder Position im Vergleich zu allen Nukleotiden gefunden werden, nachdem die Sequenzen optimal angeordnet wurden, unter Berücksichtigung von Additionen oder Deletionen (wie Lücken) in einer der beiden zu vergleichenden Sequenzen. Das Maß an Homologie (oder Sequenzidentität) kann sehr variieren, da homologe Sequenzen nur in einem Teil, in wenigen Teilen oder Abschnitten oder entlang ihrer gesamten Sequenz homolog sein können. Nukleotidsequenzen, die sich nur durch eine Base unterscheiden, sind hoch-homologe Sequenzen und als Einzelnukleotidpolymorphismen (SNPs) qualifiziert. Die Teile oder Abschnitte der Sequenzen, die in beiden Sequenzen identisch sind, bleiben so erhalten. Proteindomains, welche eine erhaltene dreidimensionale Struktur präsentieren, werden üblicherweise durch homologe Sequenzen codiert und häufig sogar durch ein einziges Exon. Die Sequenzen, die ein hohes Maß an Invarianz in ihren Sequenzen zeigen, sollen angeblich weitgehend erhalten sein, und sie zeigen ein hohes Maß an Homologie.
Die Verfahren der Anordnung von Sequenzen basieren auf lokalen Homologiealgorithmen, die computerisiert wurden und die wie zum Beispiel (jedoch nicht darauf beschränkt) als Clustal^® (Intelligenetics, Mountain Views, Kalifornien) oder GAP^®, BESTFIT^®, FASTA^® und TFASTA^® (Wisconsin Genetics Software Package, Genetics Computer Group Madison, Wisconsin, USA) oder Boxshade^® erhältlich sind.
Der Begriff „Consensus-Sequenz" ist eine Sequenz, die nach der Anordnung mehrerer homologer in Betracht zu ziehender Sequenzen bestimmt wurde (berechnet als die Base, welche am häufigsten an jeder Position in den verglichenen, angeordneten, homologen Sequenzen gefunden wird).
Die Consensus-Sequenz stellt eine Art „Durchschnitts"-Sequenz dar, welche von allen verglichenen Sequenzen so nah wie möglich ist. Bei hoch-homologen Sequenzen, oder wenn die Consensus-Sequenz lang genug ist und die Reaktionsbedingungen nicht zu streng sind, kann sie sich an alle homologen Sequenzen binden. Dies ist besonders geeignet für eine Amplifizierung homologer Sequenzen mit denselben Primern, Consensus-Primer genannt. Experimentell kann die aus den Programmen oben berechnete Consensus-Sequenz angepasst werden, um eine solche Eigenschaft zu erhalten.
„Mikroanordnungen und Anordnungen" steht für feste Träger, auf denen einzelne Erfassungssonden oder Erfassungssondenspezies immobilisiert sind, um in der Lage zu sein, sich an das bestimmte spezifische Protein oder Ziel zu binden. Die häufigsten Anordnungen setzen sich aus einzelnen Erfassungssondenspezies zusammen, die sich an vorbestimmten Positionen eines festen Trägers befinden, bei dem es sich um ein Substrat für ihre Bindung handelt oder nicht. Die Anordnung ist vorzugsweise zusammengesetzt aus Punkten von Erfassungssonden, die an einer bestimmten Position auf der Oberfläche oder innerhalb des festen Trägers oder auf dem Substrat, welches den festen Träger bedeckt, aufgetragen sind. Jedoch können die Erfassungssonden auf dem festen Träger in verschiedenen Formen vorliegen, bei denen es sich um Punkte handeln kann, jedoch nicht darauf beschränkt. Eine bestimmte Form der Anwendung der Anordnung ist das Vorhandensein von Erfassungssonden in Wells, welche jede von mehreren unterschiedlichen Erfassungssonden pro Well aufweisen und Teil des gleichen Trägers sind. Vorteilhafterweise werden Anordnungen von Erfassungssonden auch auf unterschiedlichen Trägern bereitgestellt, solange diese unterschiedlichen Träger spezifische Erfassungssonden enthalten und voneinander unterschieden werden können, um in der Lage zu sein, eine Quantifizierung einer spezifische Zielsequenz zu gestatten. Dies kann durch Verwendung einer Mischung von Perlen erreicht werden, welche bestimmte Merkmale aufweisen und voneinander unterschieden werden können, um die gebundenen Moleküle zu quantifizieren.
Der Begriff „Erfassungssonde" betrifft Moleküle, die in der Lage sind, sich spezifisch an ein bestimmtes Polynukleotid oder Polypeptid zu binden. Vorzugsweise erfolgt die Polynukleotidbindung durch Basenpaarung zwischen zwei Polynukleotiden, von denen eines die immobilisierte Erfassungssonde oder Erfassungssequenz und die andere das festzustellende Zielmolekül (Sequenz) ist.
Der Begriff „einzelne Erfassungssondenspezies" ist eine Zusammensetzung verwandter (Poly)Nukleotide für die Feststellung einer bestimmten Nukleotidsequenz durch Basenpaarungshybridisierung. Polynukleotide werden entweder chemisch oder enzymatisch synthetisiert oder aus Proben aufgereinigt. Jedoch ist die Synthese oder Aufreinigung nicht immer perfekt und die Erfassungssonde kann durch andere verwandte Moleküle wie kürzere Polynukleotide leicht verunreinigt sein. Die wesentliche Eigenschaft einer Erfassungsspezies für die Erfindung ist, dass die Gesamtspezies zum Erfassen eines bestimmten Zielmoleküls, vorzugsweise einer bestimmten Nukleotidzielsequenz, verwendet werden kann.
Der Begriff „Signal, welches aus einer spezifischen Bindung an einer spezifischen Position resultiert" steht für eine Feststellung, und möglicherweise eine Quantifizierung, eines einzelnen Hybridisierungsereignisses zwischen komplementären Nukleotidsequenzen an dem spezifischen lokalisierten Bereich (Position) einer festen Erfassungssequenz der festen Trägerfläche (oder innerhalb des festen Trägers). Eine komplementäre Hybridisierung kann durch eine (fluoreszierende, kolorimetrische usw.) Markierung, die in die Sequenz der Zielsequenz oder an der Extremität der Zielsequenz (vorzugsweise während des Kopier- oder Amplifizierungsschrittes) eingefügt ist, oder durch eines einer Reihe von Mitteln, die dem Fachmann auf dem Gebiet gut bekannt sind, festgestellt und möglicherweise quantifiziert werden, wie in WO 99/32660 detailliert aufgelistet.
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
Die vorliegende Erfindung stellt die eindeutige Feststellung des Vorhandenseins oder des Nichtvorhandenseins einer bestimmten Base (mutierte Base) an einem Lokus einer genetischen Sequenz durch Untersuchung des Signals bereit, welches an einer bestimmten Position einer Anordnung erhalten wird, die zum Untersuchen (Feststellen) des Vorhandenseins oder Nichtvorhandenseins der (mutierten) Base an einem bestimmten Lokus (SNPs) dient.
Das Verfahren gestattet eine gleichzeitige Feststellung von mindestens 3 und besser 5 und noch besser 20 Loci, und dementsprechend kann der feste Träger mindestens 6 und besser 10 und noch besser mindestens 40 unterschiedliche Erfassungssonden enthalten, welche eine spezifische Sequenz aufweisen, die komplementär zu den unterschiedlichen zu untersuchenden Zielloci ist und sich nur durch eine Base (festgestellte SNPs) unterscheidet. Die spezifischen Hybridisierungssequenzen, die auf den Erfassungssonden vorliegen, sind komplementär zu den unterschiedlichen Zielen, denen sie entsprechen, und sie weisen ähnliche chemische und physikalische Eigenschaften auf. Vorzugsweise sind diese spezifischen Sequenzen für einen Lokus identisch für das Ziel eines bestimmten Lokus, ausgenommen der zu untersuchenden Base an dem Lokus.
Die Gennukleotidsequenz(en) kann/können zunächst aus einer Probe aus dem Organismus extrahiert werden. Extraktion bedeutet jede Art der Isolierung genetischen Materials (mRNA, Genom-DNA) aus einer Probe durch einen physikalischen oder einen chemischen Prozess. Untersuchungen von (Mikro)Organismen, die aus einer biologischen Probe oder aus einer klinischen Probe oder einer Zellkultur extrahiert wurden, erfordern vorzugsweise eine Isolierung von Genom-DNA-Sequenzen. Die unterschiedlichen Loci befinden sich entweder auf demselben Exon eines Gens oder auf demselben Gen oder auf unterschiedlichen Genen, welche zu dem Genom des Organismus gehören. Die Zielsequenzen, die sich an einem oder an mehreren bestimmten Loci unterscheiden, sind homologe Sequenzen.
Der in dem Verfahren gemäß der Erfindung verwendete genetische Amplifizierungsschritt erfolgt durch Amplifizierungsprotokolle, die in der Technik gut bekannt sind, vorzugsweise durch ein Verfahren ausgewählt aus der Gruppe bestehend aus PCR, RT-PCR, LCR, CPT, NASBA, ICR oder Avalanche-DNA-Techniken.
Die Nukleotidsequenz eines Gens wird unter Verwendung von mindestens einem Primerpaar (d. h. einem Paar von zwei unterschiedlichen Primern) amplifiziert. Jedoch werden mehrere Primerpaare entweder für die Amplifizierung der unterschiedlichen spezifischen Nukleotidsequenzen eines Gens verwendet, wobei es sich bei diesen Sequenzen vorzugsweise um unterschiedliche Exone handelt, oder sie werden zur Amplifizierung unterschiedlicher Gene oder unterschiedlicher Teile eines Zellgenoms verwendet.
Vorzugsweise umfasst jede amplifizierte Zielsequenz mehrere Loci. Alle diese Loci des Ziels werden dann mit demselben Primerpaar amplifiziert, bei dem es sich um Consensus-Primer für eine Amplifizierung all dieser Loci handelt, jedoch wird jeder Lokus auf spezifischen Erfassungssonden festgestellt.
Daher enthält die Anordnung Erfassungssonden, die spezifisch für einen oder mehrere Loci für die Hybridisierung mit (einer) Nukleotidzielsequenz(en) sind, welche die mutierten Basen (1) umfasst/umfassen, die in jedem Lokus festzustellen sind, wobei sich die unterschiedlichen mutierten Basen im selben Exon oder in unterschiedlichen Exonen befinden, die aus demselben Gen oder aus unterschiedlichen Genen stammen, die vorzugsweise in derselben Nukleotidsequenz (3) vorliegen. Der Amplifizierungsschritt dieser mehreren Exone erfolgt vorzugsweise mit unterschiedlichen Primerpaaren, wobei jedes Primerpaar spezifisch für ein Exon ist. Die Amplifizierung mehrerer Exone erfolgt vorzugsweise unter den gleichen Bedingungen für alle Exone (d. h. im selben Reaktionsgefäß oder in unterschiedlichen Gefäßen) und sie werden dann für die Hybridisierung auf einer Mikroanordnung zusammen gepoolt. Sie stellen den ersten Zielsatz (7 oder 7') dar.
Der zweite Satz von Nukleotidzielsequenzen (8) wird vorzugsweise mit denselben Primern amplifiziert, die für den ersten Satz von Zielsequenzen (7 oder 7') verwendet werden. In dieser bevorzugten Ausführungsform enthält jede Zielsequenz, die mit einem Primerpaar (5, 6') amplifiziert wurde, auch eine Sequenz, die auf dem zweiten Satz der Erfassungssonde (10) hybridisiert wurde. Jedoch haben die Erfinder herausgefunden, dass das Vorhandensein des zweiten Satzes von Zielsequenzen auf derselben amplifizierten Sequenz nicht notwendig ist, solange die Amplifizierungen beider Zielsequenzen unter Verwendung unterschiedlicher Primerpaare (5, 5' und 6, 6') ähnlich sind. Die Ähnlichkeit der Ergebnisse wird durch den Vergleich der Effizienz der Hybridisierung beider amplifizierter Sequenzen (7, 7', 8) auf den entsprechenden Erfassungssonden (9, 9', 10), welche komplementäre Sequenzen aufweisen, erhalten. Die Signale müssen identisch sein oder dürfen sich nur um einen Faktor, der niedriger als 3 und vorzugsweise niedriger als 2 ist, unterscheiden.
Im nächsten Schritt des Verfahrens der Erfindung werden die amplifizierten Nukleotidzielsequenzen (7 oder 7') des ersten Schrittes (Amplikone) mit einer Anordnung in Kontakt gebracht, und zwar unter Bedingungen, welche die Hybridisierung der amplifizierten Zielsequenzen (7, 7') mit ihren komplementären spezifischen Erfassungsnukleotidsequenzen (9, 9') (Erfassungssonden), die auf der Anordnung vorliegen, gestatten. Die im ersten Schritt erhaltenen Amplikone werden mit denselben oder mit unterschiedlichen Anordnungen hybridisiert. In einer bevorzugten Ausführungsform werden diese amplifizierten Sequenzen vor der Hybridisierung mit der Anordnung bearbeitet (z. B. durch Fragmentierung). Die Fragmentierung von Doppelstrang-DNA erfolgt unter Verwendung enzymatischer Spaltung (DNase-Behandlung) oder chemischer Spaltung, vorzugsweise Depurinierung unter Verwendung von HCL, gefolgt von Wärmedenaturierung, wie in der US-Patentanmeldung 2005/0095635 beschrieben. Die Fragmentierung von Ribonukleotidsequenzen erfolgt durch die Erwärmung in Gegenwart von Magnesiumionen oder in Gegenwart von KOH, wie entsprechend in WO 97/10365 und WO 98/28444 beschrieben.
Teile (oder Abschnitte) der Gen- oder Genomsequenz (Loci), welche mögliche festzustellende Mutationen aufweisen, können zuerst durch PCR amplifiziert werden, und die daraus resultierenden Amplikone werden durch DNAse-Behandlung fragmentiert (Grimm et al. 2004, Journal of Clinical Microbioloy, 42, 3766–3774). In der bevorzugten Ausführungsform weisen die resultierenden Amplikonfragmente eine Länge zwischen 30 und 70 Basen auf. Die Verteilung der Fragmentgröße, die nach der Fragmentierung der Amplikone erhalten wird, wird vorteilhafterweise durch Analyse mittels Kapillar-Elektrophorese (Bioanalyser, Agilent) überprüft und die durchschnittliche Größenverteilung der Stücke liegt vorzugsweise bei einer Länge zwischen 30 und 70 Basen.
Der spezifische Teil (oder Abschnitt) der Erfassungssonden (Nukleotidsequenzen), der komplementär zu der Nukleotidzielsequenz ist, umfasst zwischen etwa 10 und etwa 50 Basen, vorzugsweise zwischen etwa 15 und etwa 40 Basen und bevorzugter zwischen 18 und 24 Basen. Diese Basen sind vorzugsweise als eine kontinuierliche Sequenz zugeordnet, die sich an oder nahe der Extremität der Erfassungssonden (Nukleotidsequenzen) befindet. Diese Sequenz gilt als eine spezifische Sequenz für die Feststellung der Nukleotidzielsequenz.
Vorzugsweise liegt die Schmelztemperatur (Tm) der spezifischen Nukleotidsequenzen der Erfassungssonden (die in der Lage sind, sich an ihre entsprechenden Nukleotidzielsequenzen zu binden) zwischen 55 und 75°C und bevorzugt zwischen 62 und 68°C. Die Tm kleiner Sequenzen kann leicht mit der vereinfachten Gleichung Tm (°C) = 4 (G + C) + 2 (A + T) berechnet werden.
Vorzugsweise erfolgt der Hybridisierungsschritt zwischen Erfassungs- und Zielsequenz unter strengen Bedingungen. Die Temperaturen der Hybridisierung liegen vorzugsweise zwischen 1 und 10°C und sogar vorzugsweise um 1 bis 4°C niedriger als die Tm der spezifischen Sequenz der Erfassungssonden. Die Hybridisierungstemperatur kann entsprechend des Vorhandenseins von Molekülen in der Hybridisierungslösung, welche die Hybridisierungstemperatur beeinflussen, wie DMSO oder Formamid, angepasst werden.
Die Hybridisierung der Zielsequenzen erfolgt bei einer Temperatur, welche das beste Signal zusammen mit der geringsten Kreuzreaktion des Ziels auf den Erfassungssonden, die sich durch eine Base unterscheiden, abgibt. Die optimierte Temperatur ist abhängig von der Strenge der Lösung, welche von der Lösungszusammensetzung und hauptsächlich von der Salzkonzentration abhängig ist. In einer bevorzugten Ausführungsform ist die Hybridisierungslösung zusammengesetzt aus Phosphatpuffer mit pH 7,4 mit einer Molarität zwischen 0,4 M und 0,8 M, und die Hybridisierungstemperatur unterscheidet sich von der Tm der spezifischen Sequenzen der Erfassungssonden (9, 9' und 10) um nicht mehr als 5°C und vorzugsweise nicht mehr als 2°C. In einer bestimmten Ausführungsform beträgt die Hybridisierungstemperatur 60°C.
Auf der Anordnung sind Erfassungssonden an vorbestimmten Positionen mit einer Dichte von mindestens 4, 10, 16, 20, 50, 100, 1.000, 4.000, 10.000 oder mehr unterschiedlichen Erfassungssonden/cm² auf der unlöslichen festen Trägerfläche angeordnet. Die Erfassungssonden sind vorzugsweise kovalent auf der Oberfläche des festen Trägers befestigt (vorzugsweise eine nicht-poröse feste Trägerfläche), und zwar an einer ihrer Extremitäten, vorzugsweise über ihr 5'-Ende. Die Sensitivität kann durch das punktförmige Auftragen der Erfassungssonden auf der festen Trägerfläche durch einen Roboter mit hoher Dichte gemäß einer Anordnung weiter erhöht werden. Die Menge der Erfassungssonden, die punktförmig auf der Anordnung aufgetragen werden, liegt vorzugsweise zwischen etwa 0,01 und etwa 5 Pikomol des Sequenzäquivalents/cm² der festen Trägerfläche.
Die Erfindung betrifft auch ein Kit für die Feststellung einer Nukleotidbase an einem bestimmten Lokus einer Gennukleotidsequenz eines Organismus (zur Charakterisierung des Vorhandenseins eines Einzelnukleotidpolymorphismus) unter mindestens 2 möglichen Nukleotidbasen, welches Medien oder Vorrichtungen zum Durchführen des Verfahrens gemäß der Erfindung beinhaltet. Das Kit ist vorzugsweise in einer automatischen Vorrichtung enthalten (welche die meisten Schritte der vorliegenden Erfindung automatisch durchführt), wie eine Screening-Vorrichtung mit hohem Durchsatz. Das Kit oder die Vorrichtung sind für die Durchführung aller Schritte oder nur mehrerer spezifischer Schritte des Verfahrens gemäß der Erfindung geeignet.
Das Kit umfasst:

– eine Fläche eines unlöslichen festen Trägers (22), vorzugsweise eine nicht-poröse, feste Trägerfläche, umfassend:
– (a) mindestens zwei Erfassungssonden (9, 9'), gebunden an bestimmten Positionen der Fläche des unlöslichen festen Trägers (22), wobei die Erfas sungssonden (9, 9') eine spezifische Sequenzkomplementarität zu einem Teil (2) einer Nukleotidzielsequenz (7 oder 7') aufweisen, die einen ersten Lokus aufweist, und wobei sich jede Erfassungssonde (9) von der anderen Erfassungssonde (9') durch eine einzige Base (20) an der Lokusstelle unterscheidet, und
– (b) mindestens eine weitere Erfassungssonde (10), die sich extern zu dem ersten Lokus befindet und ähnliche physikalische und chemische Eigenschaften wie die anderen beiden Erfassungssonden (9, 9') und eine zu einem anderen Teil (4) der Nukleotidzielsequenz (8) komplementäre Sequenz aufweist, ausgenommen eine Base (21), die nicht komplementär ist (die Ziel- und Erfassungsnukleotidsequenz sind komplementäre Sequenzen, jedoch unterscheidet sich diese Komplementarität durch eine Base), und
– einen in das Trägermittel eingebetteten computerisierten Code zum Bestimmen (Charakterisieren oder Feststellen) des Vorhandenseins der Nukleotidbase (1) an einem bestimmten Lokus, wobei ein Signalwert der Feststellung der Zielsequenz (7 oder 7') auf ihrer spezifischen Erfassungssonde (9 oder 9') höher als ein oder gleich einem Grenzsignalwert ist, der aus dem Signalwert der Feststellung der Zielsequenz (8) auf ihrer spezifischen mutierten Erfassungssonde (10) errechnet wird, ein positives Ergebnis ergibt, welches die Nukleotidbase (1) identifiziert (deren Vorhandensein feststellt).

In einem weiteren Schritt bestimmt der in das Trägermittel eingebettete computerisierte Code des Kits, dass der Organismus an einem bestimmten Lokus heterozygot ist, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') auf mutierten und nicht-mutierten Erfassungssonden (9 und 9') beide positiv sind, und die Signalwerte erfüllen möglicherweise die Bedingung, dass der nach der Formel:
berechnete Index (CI-Wert) kleiner als 1, vorzugsweise kleiner als 0,7 und bevorzugt sogar kleiner als 0,5 ist; wobei es sich bei N um den durchschnittlichen Signalwert der Feststellung auf mutierten (9) bzw. nicht-mutierten (9') Erfassungssonden handelt.
Die feste Trägerfläche enthält mindestens 10 unterschiedliche Erfassungssonden, die als eine Anordnung vorliegen, welche auf 5 unterschiedliche Loci des Gens/der Gene abzielt, und besser mindestens 40 unterschiedliche Erfassungssonden, die auf mindestens 20 unterschiedliche Loci abzielen.
In einer bevorzugten Ausführungsform umfassen die Erfassungssonden eine spezifische Sequenz für die Bindung an die Nukleotidzielsequenz, die durch einen Abstandshalter (oder Linker), der eine physikalische Länge von mindestens etwa 6,8 mm, äquivalent zum Abstand von mindestens etwa 20 Basenpaar langen Nukleotiden in Doppelhelixform aufweist, mit der Oberfläche des festen Trägers (22) verknüpft ist.
In einer bevorzugten Ausführungsform ist der Abstandshalter (oder Linker) ein Polynukleotid mit einer Länge von mindestens etwa 20 Nukleotiden, mindestens etwa 50 oder etwa 70 Nukleotiden und vorzugsweise mindestens etwa 90 Nukleotiden. Der Abstandshalter (oder Linker) ist eine bestimmte Nukleotidsequenz, die zu keiner der Genomsequenzen homolog ist (unter Verwendung einer Identität von mindestens 10 und besser 5 konsekutiven Basen). Zur Vermeidung nichtspezifischer Hybridisierung gibt es nicht mehr als etwa 15 konsekutive komplementäre Basenpaarbindungen zwischen einer Zielpolynukleotid-(oder Nukleotid-)Sequenz und dem Abstandshalter, vorzugsweise gibt es weniger als 10 solche möglichen Paarungen, bevorzugter weniger als 5. An sich enthält die Nukleotidsequenz des Abstandshalters vorzugsweise weniger als 15 Basen und bevorzugter weniger als 10 und noch bevorzugter weniger als 5 zusammenhängende Basen, die komplementär zu den festzustellenden Nukleotidzielsequenzen sind. Die Feststellung möglicher konsekutiver Sequenzen erfolgt leicht durch einen Vergleich der Sequenzen mit einer Moleküldatenbank, wie sie von Genbank bereitgestellt wird, und unter Verwendung einer Software wie Nukleotid-Nukleotid-BLAST(blastn)(http://www.ncbi.nlm.nih.gov/BLAST).
Die Gesamtlänge der Erfassungssonden (Nukleotidsequenzen), einschließlich des Abstandshalters, liegt zwischen etwa 30 und etwa 300 Basen, vorzugsweise zwischen etwa 35 und etwa 200 Basen, bevorzugter zwischen etwa 39 und etwa 120 Basen.
In einer anderen bevorzugten Ausführungsform der Erfindung sind die Erfassungssonden (Nukleotidsequenzen) chemisch synthetisierte Oligonukleotidsequenzen von etwa 100 Basen, welche z. B. auf einem programmierten automatischen Synthesizer leicht hergestellt werden können. Solche Sequenzen können eine funktionalisierte Gruppe für die kovalente Befestigung auf dem Träger mit hohen Konzentrationen tragen. Längere Erfassungsnukleotidsequenzen werden vorzugsweise durch PCR-Amplifizierung einer Sequenz synthetisiert, die in ein Plasmid eingefügt ist, welches den spezifischen Teil (oder Abschnitt) der Erfassungsnukleotidsequenz und den nichtspezifischen Teil (oder Abschnitt) (Abstandshalter) enthält.
Chemische und physikalische Eigenschaften stehen für Merkmale der externen Erfassungssonden (10), welche eine Hybridisierungseffizienz ähnlich der spezifischen Erfassungssonde (9 oder 9') für die festzustellenden Mutationen verleihen.
Die chemischen und physikalischen Eigenschaften umfassen Folgende: den spezifischen Teil der Nukleotidsequenz (Länge, Tm), den Prozentsatz des GC-Gehalts und die Länge des Abstandshalters.
In einer bevorzugten Ausführungsform weist die Erfassungssonde (10), die sich außerhalb des Lokus befindet, die gleichen Merkmale wie die spezifischen Erfassungssonden (9, 9') auf.
In einer bevorzugten Ausführungsform bedeuten ähnliche physikalische oder chemische Eigenschaften der Nukleotidsequenzen, dass die spezifischen Nukleotidsequenzen der Erfassungssonden (die in der Lage sind, sich an die Nukleotidzielsequenzen zu binden) eine Tm zwischen etwa 55 und etwa 75°C und vorzugsweise zwischen etwa 62 und etwa 68°C aufweisen.
In einer weiteren bevorzugten Ausführungsform weisen die Erfassungssonden (9, 9'), die sich durch eine Base unterscheiden, in ihren spezifischen Nukleotidsequenzen (die in der Lage sind, die Nukleotidzielsequenzen spezifisch zu binden) einen GC-Gehalt zwischen etwa 40 und etwa 70% und vorzugsweise zwischen etwa 45 und etwa 60% auf.
Ferner haben die Erfinder unerwarteterweise herausgefunden, dass eine bessere Unterscheidung der SNP, die an einem Lokus eines Gens vorliegen, erhalten wird, wenn sich die festzustellende Nukleotidbase in einem Abstand von etwa 4 bis etwa 10 Basen und besser 4 bis 6 Basen von einer Extremität des zielspezifischen Teils der gebundenen Erfassungssonde befindet.
Der Abstandshalter (Linker) befindet sich vorzugsweise an der 5'-Extremität der Erfassungssonde, welche durch eine kovalente Verbindung am 5'-Ende oder in dessen Nähe an der Oberfläche des festen Trägers befestigt ist. Die spezifische Nukleotidsequenz für die Bindung an die Nukleotidzielsequenz befindet sich vorzugsweise am 3'-Ende der Erfassungssonden (die freie Extremität, die nicht an den Träger gebunden ist), an 1 bis 23 Nukleotiden vom Ende.
Die Erfassungssonden (9 oder 9' und 10) unterscheiden sich vorzugsweise durch eine Base, die sich an 4 bis 10 und vorzugsweise an 4 bis 6 Basen vom (freien) 3'- Ende des zielspezifischen Teils (Abschnittes) der gebundenen Erfassungssonde befindet.
Die Anordnung kann spezifische Erfassungsnukleotidsequenzen für jede Base eines spezifischen festzustellenden Lokus enthalten. Die festzustellenden Basen befinden sich innerhalb eines oder mehrerer Exone derselben Gennukleotidsequenz oder aus unterschiedlichen Gennukleotidsequenzen.
In einem bevorzugten Beispiel enthält die Anordnung spezifische Erfassungssonden (9, 9', 10) für die Feststellung von SNP in den humanen Cytochromen P450 2C9, 2C19 und 2D6. Die Cytochrome p450 2C9 und 2D6 werden vorzugsweise auf einer Anordnung von Erfassungssonden (9, 9', 10) festgestellt, welche spezifische Mutationen enthalten, wie in Tabelle 1 bereitgestellt. Die Cytochrome P450 für die Mutationen 2C9*1,2 und 1,8 und für 2C19*1,2 und 1,3 werden vorzugsweise auch auf der Anordnung hinzugefügt, zusammen mit den in Tabelle 1 bereitgestellten Mutationen.
Die Anordnung kann spezifische Erfassungssonden für die Feststellung mehrerer SNP in einer Gennukleotidsequenz enthalten, oder die Anordnung kann spezifische Erfassungssonden für die Feststellung mehrerer SNP in unterschiedlichen Gennukleotidsequenzen enthalten.
Die Nukleotidzielsequenzen werden während des Amplifizierungsschrittes markiert. Die markierten assoziierten Feststellungen sind zahlreich. Eine Übersicht über die unterschiedlichen Markierungsmoleküle ist in WO 97/27317 gegeben. Sie werden unter Verwendung entweder bereits markierter Primer oder durch den Einschluss markierter Nukleotide während des Amplifizierungsschrittes erhalten. Die am häufigsten verwendeten und bevorzugten Markierungen sind Fluorochrome wie Cy3, Cy5 und Cy7, die für die Analyse einer Anordnung durch Verwendung im Handel erhältlicher Anordnungsscanner geeignet sind (General Scanning, Genetic Microsystem, ...).
Radioaktive Markierung, kalte Markierung oder indirekte Markierung mit kleinen Molekülen, die danach durch spezifische Liganden erkannt werden (Streptavidin oder Antikörper) sind häufig verwendete Verfahren. Das daraus resultierende Signal der Zielfixierung auf der Anordnung ist entweder fluoreszent, kolorimetrisch, Diffusion, elektrolumineszent, bio- oder chemilumineszent, magnetisch, elektrisch, wie impedometrisch oder voltametrisch ( US-A-5,312,527 ).
Ein bevorzugtes Verfahren basiert auf der Verwendung der Goldmarkierung des gebundenen Ziels zum Erhalt einer Resonanzlichtstreuungs-(RLS – resonance light scattering) Feststellung oder Silbereinfärbung, die dann leicht festgestellt und durch einen Scanner quantifiziert werden kann. Goldpartikel mit einer Größe von 10–30 nm sind für die Silberamplifizierung erforderlich, während Partikel mit einer Größe von 40–80 nm für die direkte Feststellung von Goldpartikeln durch RLS oder durch Photothermisches Überlagerungs-Imaging erforderlich sind.
In einem bevorzugten Verfahren werden Goldpartikel mit einer Größe von 10–30 nm durch Silberanreicherung amplifiziert, vorzugsweise unter Verwendung der Silver quant-Analyseplattform, einschließlich des Silverquant-Kits zur Feststellung, des Silverquant-Scanners zum Objektträger-Scannen und der Silverqaunt-Analysesoftware zur Bildquantifizierung und Datenanalyse (Eppendorf, Deutschland). Aufgrund der nichtlinearen Feststellung des Vorhandenseins von Silber erfordert die Datenanalyse eine Linearisierung der Daten vor der Datenverarbeitung. Die Daten werden dann gemäß der Erfindung verarbeitet. Ein Algorithmus der Kurvenanpassung wird auf eine positive Feststellungskurve angewandt, die punktförmig auf die Anordnung aufgetragen ist. Dann wird jedes Punktsignal unter Verwendung der Anpassungskurve in ,Konzentrationseinheiten' linearisiert.
Die Quantifizierung muss nicht nur den Hybridisierungsertrag und den Feststellungsmaßstab auf der Anordnung berücksichtigen, sondern auch den Extraktions-, den Amplifizierungs-(oder den Kopier-) und den Markierungsschritt.
Der feste Träger gemäß der Erfindung wird aus Materialien hergestellt, die ausgewählt sind aus der Gruppe bestehend aus Gelschichten, Gläsern, elektronischen Vorrichtungen, Silikon- oder Kunststoffträgern, Polymeren, CDs, Metallträgern oder einer Mischung daraus (siehe EP 0 535 242 , US-Patentschrift Nr. 5,736,257 , WO 99/35499 , US-Patentschrift Nr. 5,552,270 usw.). Vorteilhafterweise ist der feste Träger ein einzelner Glasobjektträger, der zusätzliche Mittel (Barcodes, Marker usw.) oder Medien zur Verbesserung des Verfahrens gemäß der Erfindung aufweisen kann.
Im letzten Schritt des Verfahrens der Erfindung gelten Ergebnisse als positiv oder negativ gemäß der Tatsache, dass die Signalintensität höher oder niedriger als ein bestimmter Grenzwert ist.
Die Grenzsignalwerte werden vorzugsweise als festgestellte Signalwerte der externen Erfassungssonde (10) übernommen, welche auf eine entsprechende Zielsequenz (8) gerichtet ist, und mit einem Faktor multipliziert.
In einer bevorzugten Ausführungsform ist der Grenzsignalwert der Signalwert der Feststellung des zweiten Satzes von Nukleotidzielsequenzen (8) auf ihrer entsprechenden spezifischen mutierten Erfassungssonde (10), multipliziert mit einem Faktor zwischen 2 und 5 und vorzugsweise zwischen 3 und 4, bevorzugter noch Faktor 4.
In einer weiteren bevorzugten Ausführungsform ist der Grenzsignalwert 4 Mal das Signal, welches mit den Erfassungssonden (10) außerhalb des festgestellten Lokus erhalten wurde, bei welchem es sich vorzugsweise um den Mittelwert replizierter Punkte handelt.
Vorzugsweise wird der Grenzsignalwert aus einem durchschnittlichen Signalwert der Feststellung von mindestens zwei unterschiedlichen Sätzen von Nukleotidzielsequenzen (8) auf mindestens zwei unterschiedlichen komplementären spezifischen mutierten Erfassungssonden (10) berechnet.
Die Signalwerte der Erfassungssonden (7 oder 7'), welche auf spezifische Zielloci gerichtet sind, werden für eine Berechnung des Grenzsignalwertes in Betracht gezogen, solange sie die Merkmale externer Erfassungssonden (10) aufweisen, einschließlich der Unterscheidung vom Ziel durch eine Base.
Vorzugsweise wird der Grenzsignalwert aus einem durchschnittlichen Signalwert der Feststellung von mindestens zwei unterschiedlichen Sätzen von Nukleotidzielsequenzen (7 oder 7') auf mindestens zwei unterschiedlichen komplementären spezifischen mutierten Erfassungssonden (9 oder 9') berechnet.
Das Verfahren der Erfindung ist auch für die Feststellung von SNP in einem Organismus geeignet, der an einem bestimmten Lokus heterozygot ist. In einer bevorzugten Ausführungsform gilt der Organismus als an bestimmten Loci heterozygot, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') auf mutierten und nicht-mutierten Erfassungssonden (9 und 9') beide positiv sind.
Der Organismus kann auch als an bestimmten Loci heterozygot gelten, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') auf mutierten und nicht-mutierten Erfassungssonden (9 und 9') beide positive sind, und ferner wenn die Signalwerte die Bedingung erfüllen, dass der nach der Formel:
berechnete Index (CI-Wert) kleiner als 1 ist; wobei es sich bei N um den durchschnittlichen Signalwert der Feststellung auf mutierten (9) oder nicht-mutierten (9') Erfassungssonden handelt. In einer noch bevorzugteren Ausführungsform ist der CI-Wert kleiner als 0,7 und noch besser kleiner als 0,5.
In einer bevorzugten Ausführungsform gilt der Organismus als an einem bestimmten Lokus homozygot, wenn nur einer der Signalwerte der Feststellung der Nukleotidzielsequenzen (7 oder 7') auf mutierten und nicht-mutierten Erfassungssonden (9 oder 9') positiv ist.
Vorteilhafterweise enthält die Anordnung auch Erfassungssonden für die spezifische Feststellung des/der spezifisch amplifizierten Zielgene/s, die sich außerhalb des Lokus von Interesse befinden. Solche Erfassungssonden werden vorzugsweise zur Bestätigung der Identifikation des Gens/der Gene oder zur Unterscheidung zwischen zwei Genen, die sehr homolog sind, hinzugefügt. Die Erfassungssonde wird als positive Kontrolle der PCR und Hybridisierung verwendet.
Vorteilhafterweise enthält die Anordnung auch Punkte mit verschiedenen Konzentrationen (d. h. 4) markierter Erfassungssonden. Diese markierten Erfassungssonden werden aus bekannten Konzentrationslösungen punktförmig aufgetragen und ihre Signale gestatten die Umwandlung der Ergebnisse der Hybridisierung in absolute Werte. Sie gestatten auch das Testen auf die Reproduzierbarkeit der Feststellung.
In einer Ausführungsform wird der feste Träger (Biochip) in einen Träger eingeführt, der mit Eingangs- und Ausgangsröhrchen verbunden ist und durch einen Automaten gehandhabt wird, welcher die flüssige Lösung kontrolliert, wie sie in der Mikrofluidtechnologie entwickelt wurde. Durch das Einführen in ein solches Mikrolaborsystem kann er durch Automaten inkubiert, erhitzt, gewaschen und markiert werden, selbst bei vorhergehenden Schritten (wie Extraktion von DNA, Amplifizierung durch PCR) oder dem folgenden Schritt (Markierung und Feststellung). All diese Schritte können auf demselben festen Träger durchgeführt werden.
Vorzugsweise umfasst das Kit der Erfindung mindestens einen unlöslichen festen Träger, auf dem einige Erfassungssonden gebunden sind (vorzugsweise durch eine direkte kovalente Verbindung oder durch das Zwischenprodukt eines Abstandshalters an die Oberfläche des festen Trägers gebunden), und zwar gemäß einer Anordnung mit einer Dichte von mindestens 4, vorzugsweise mindestens 10, 16, 20, 50, 100, 1.000, 4.000, 10.000 oder mehr unterschiedlichen Erfassungssonden/cm² der Fläche des unlöslichen festen Trägers, wobei die Erfassungssonden vorteilhafterweise eine Länge zwischen etwa 30 und etwa 300 Basen aufweisen (einschließlich des Abstandshalters) und eine Sequenz von etwa 10 bis etwa 50 Basen enthalten, wobei die Sequenz spezifisch für das Ziel ist (was bedeutet, dass die Basen der Sequenz in der Lage sind, eine Bindung mit ihren komplementären Basen in der Sequenz des Ziels durch komplementäre Hybridisierung zu bilden).
KURZBESCHREIBUNG DER ZEICHNUNGEN
1 ist eine schematische Darstellung eines bevorzugten Verfahrens der Erfindung für die Feststellung eines SNP (mutierte Base 1 dargestellt durch X) an einem bestimmten Lokus der Gennukleotidsequenz (3) eines Organis mus. Ein Abschnitt der Gennukleotidsequenz wird durch PCR entweder mittels eines einzelnen Primerpaares (5, 6') oder unterschiedlicher Primerpaare (5, 5' und 6, 6') in einen ersten Satz von Nukleotidzielsequenzen (7 oder 7') und einen zweiten Satz von Nukleotidzielsequenzen (8) amplifiziert, welche beide markiert sind (Kreis). Die Amplikone werden dann, nach der Markierung, mit einer Anordnung von Erfassungssonden in Kontakt gebracht, die auf einem festen Träger (22) immobilisiert sind, aufweisend: (a) ein Paar von Erfassungssonden (9 und 9') mit derselben spezifischen Hybridisierungssequenz, die zu einem Abschnitt (2) der Nukleotidzielsequenz (7 und 7') komplementär ist, sich jedoch durch eine einzelne Base (20) unterscheidet, welche der mutierten Base (1) entspricht, welche an dem zu charakterisierenden Lokus vorliegt; (b) eine Erfassungssonde (10) mit einer spezifischen Hybridisierungssequenz, die zu einem Abschnitt (4) der Nukleotidzielsequenz (8) komplementär ist, sich jedoch durch eine einzelne Base (21) an der Position Y unterscheidet. Das Vorhandensein von SNP wird bestimmt, wenn der Signalwert der Feststellung der Zielsequenz (7 und/oder 7') auf ihren entsprechenden Erfassungssonden (9 oder 9') höher als ein oder gleich einem Grenzsignalwert der Feststellung der Zielsequenz (8) auf ihrer entsprechenden spezifischen mutierten Erfassungssonde (10) ist. Alle Erfassungssonden weisen ähnliche physikalische und chemische Eigenschaften auf.
Tabelle 1 liefert eine Liste von Sonden für die SNP-Feststellung auf humanen CYP2D6 und CYP2C9-Genen. Sequenz, Schmelztemperatur (Tm), GC-Prozentsatz (% GC) und Länge jeder Sonde sind detailliert aufgeführt. Die substi tuierten Nukleotide sind unterstrichen; die Punkte stehen für gelöschte Nukleotide.
Tabelle 2 liefert das Ergebnis der SNP-Feststellung einer Probe CYP2D6*1/*4 kombiniert mit CYP2C9*1/*3. Die Probe wurde 5 Mal hybridisiert (n = 5).
Tabelle 3 liefert das Ergebnis der SNP-Feststellung einer Probe CYP2C9*9. Die Probe wurde 3 Mal hybridisiert (n = 3).
Beispiele
Beispiel 1: Feststellung von 2 Mutationen in CYP2C9 (Exon 3)
Das CYP2C9-Gen, welches 2 Hauptmutationen in Exon 3 enthält, wird durch PCR unter Verwendung der folgenden Primer amplifiziert:
Die PCR erfolgte auf Genom-DNA, die mit dem Kit Quiaamp DNA Blood mini (Qiagen, Venlo, Niederlande) mit einem abschließenden Volumen von 50 μl aus einer Blutprobe extrahiert wurde, wobei das Kit Folgendes enthielt: 3 mM MgCl₂, 10 mM Tris pH 8,4, 50 mM KCl, 125 μM jeden Primers, 200 μM dATP, dCTP und dGTP (Roche), 150 μM dTTP, 50 μM dUTP, 10 μM Biotin-11-dATP (PerkinElmer), 10 μM Biotin-11-dCTP (PerkinElmer), 2,5 U Taq-DNA-Polymerase Ultratools (Labsystems), 25 ng Genom-DNA. Die Proben wurden zuerst für 5 Min. bei 94°C denaturiert. Dann erfolgten 40 Zyklen Amplifizierung, bestehend aus 30 Sek. bei 94°C, 1 Min. bei 63°C und 1 Min. bei 72°C und einem abschließenden Extensionsschritt von 10 Min. bei 72°C. Wasserkontrollen wurden als negative Kontrollen der Amplifizierung verwendet. Die erwartete Größe ist 622 bp.
Immobilisierung der Erfassungsnukleotidsequenz
Das in WO 02/18288 beschriebene Protokoll (Beispiel 1 und 2) wurde befolgt, um einen Aldehyd-derivatisierten Glasobjektträger (Diaglass-Objektträger) zu erhalten. Eine Liste von Erfassungssonden für die SNP-Feststellung auf humanen CYP2D6- und CYP2C9-Genen liegt in Tabelle 1 vor. Die aminierten Erfassungnukleotidsequenzen wurden punktförmig auf einen Diaglass-Objektträger aufgetragen, und zwar gemäß des in WO 01/77372 beschriebenen Protokolls (Beispiel 1) mit einer Konzentration von 3000 nM.
Fragmentierung
Nach der PCR werden die amplifizierten Sequenzen (Amplikone) aufgereinigt und quantifiziert. Die amplifizierte DNA wird mit einer DNAse (Promega, Madison, USA) bei Raumtemperatur für 5 Min quantifiziert. Die Reaktion wird durch die Zugabe von 3 mM EGTA und Inkubation bei 65°C für 10 Min. gestoppt (Grimm et al. 2004, Journal of Clinical Microbioloy, 42, 3766–3774). Die DNAse schneidet die Amplikone zufällig, wodurch Fragmente von etwa 50 bp entstehen. Die Effizienz der Fragmentierung wird mittels eines DNA 1000 LabChip^® (Agilent Technologies, Deutschland) geprüft.
Hybridisierung
Ein Volumen von 10 μl NaOH 0,175 N wurde zu 10 μl fragmentierten Amplikonen, 5 μl positiver Hybridisierungskontrolle und 10 μl destilliertem Wasser zugegeben. Die Mischung wurde bei Raumtemperatur für 5 Min. inkubiert. Ein Volumen von 35 μl Genomic Hybribuffer (Eppendorf, Deutschland) wurde abschließend zugegeben und die Lösung wurde eingeschlossen durch eine Hybridisierungskammer auf die Anordnung geladen. Die Kammer wurde mit einem Deckglas geschlossen. Die Hybridisierung erfolgte bei 60° für 2 h. Proben wurden 4 Mal mit Unibuffer (Eppendorf, Deutschland) gewaschen.
Kolorimetrische Feststellung
Die Glasproben wurden für 45 Min. bei Raumtemperatur mit kolloidalem goldkonjugiertem IgG Anti-Biotin 1000 x verdünnt in Blockierungspuffer inkubiert. Nach 5 Waschungen mit Waschpuffer diente das Vorhandensein von Gold der Katalyse der Silberreduktion unter Verwendung des Silverquant-Kits (Eppendorf, Hamburg, Deutschland). Die Objektträger wurden 1 Mal für 5 Min. mit der Anzeigemischung aus Silverquant-A- und -B-Lösung inkubiert, dann mit Wasser gespült, getrocknet und mittels des Silverquant-Scanners (Eppendorf, Hamburg, Deutschland) analysiert. Jeder Objektträger wurde dann durch die Silverquant-Analysesoftware analysiert. Ein Kurvenanpassungsalgorithmus wurde zum Linearisieren der Signalintensitäten verwendet, welche mit dem Silverquant-Feststellungsverfahren erhalten wurden. Der Algorithmus verwendete eine positive Feststellungskurve, die punktförmig auf die Anordnung aufgetragen wurde.
Fluoreszenz-Feststellung
Die Glasproben wurden für 45 Min. bei Raumtemperatur mit dem Cy3-konjugierten IgG Anti-Biotin (Jackson Immuno Research Laboratories, Inc. #200-162-096) verdünnt 1/1000 X Konjugat-Cy3 in dem Blockierungspuffer inkubiert und vor Licht geschützt. Nach dem Waschen wurden die Objektträger getrocknet, bevor sie bei Raumtemperatur gelagert wurden. Die Feststellung erfolgte im konfokalen Laserscanner „ScanArray"^TM (Packard, USA). Jeder Objektträger wurde dann durch die Imagene-Quantifizierungssoftware (Biodiscovery) quantifiziert.
Datenanalyse
Die Signale wurden mit einer Schwellenwert-Erfassungssonde verglichen, bei welcher es sich um die mutierte externe Hybridisierungssonde handelt. Wenn das Signal höher als die Schwellenwertsonde multipliziert mit einem Faktor 4 ist, gilt das Ergebnis als positiv. Wenn umgekehrt das Signal niedriger ist, gilt das Ergebnis als negativ.
Beispiel 2: Feststellung multipler Mutationen in CYP2D6 und CYP2C9 (Exone 5 und 7)
Das CYP2D6-Gen, welches 3 Hauptmutationen enthält, und das CYP2C9-Gen, welches 6 Hauptmutationen in den Exonen 5 und 7 enthält, wurden durch PCR unter Verwendung der folgenden Primer amplifiziert:
Die erwarteten Größen der Amplikone waren 1014 bp für CYP2D6, 626 bp für CYP2C9 Exon 5 und 1114 bp für CYP2C9 Exon 7.
PCRs, Fragmentierungen, Hybridisierungen und Feststellung erfolgten wie in Beispiel 1 beschrieben unter Verwendung der Fluoreszenzfeststellung. Die spezifischen Teile der Erfassungssonden für die Hybridisierung der Ziele sind in Tabelle 1 aufgelistet. Diese Tabelle umfasst Erfassungssonden für die Feststellung von 9 Mutationen sowie die externen Erfassungssonden (10) der Erfindung (2D6 und 2C9 Externe Sonden), welche jedem amplifizierten Exon entsprechen. Die Anordnung enthält auch Kontrollsonden, bei welchen es sich um die nicht-mutierten externen Sonden der Erfindung handelt (2D6 und 2C9 Kontrollsonden). Die Analyse erfolgte an mehreren klinischen Proben und die Daten sind in Tabelle 2 und 3 aufgelistet. Die Ergebnisse wurden wie in der Erfindung vorgeschlagen analysiert und die abschließenden Ergebnisse wurden mit der Bestimmung der Probenmutationen durch Sequenzierung verglichen. Es gab eine 100% Korrelation der Ergebnisse.

Tabelle 1: Liste von Sonden für die SNP-Feststellung auf dem CYP2D6- und CYP2C9-Gen (SEQ. ID. NR.: 9–30). Sequenz, Schmelztemperatur (Tm), GC-Prozentsatz (% GC) und Länge jeder Sonde sind aufgeführt. Die substituierten Nukleotide sind unterstrichen; die Punkte stehen für gelöschte Nukleotide.

Mutation	Mittelwerte n = 5	Standardabweichung	Ergebnisse der Erfindung	Ergebnisse der Sequenzierung
2D6*1,3	14769	2799	+	+
2D6*3	130	130	–	–
2D6*1,4	14025	2926	+	+
2D6*4	15354	2562	+	+
2D6*1,6	51862	4289	+	+
2D6*6	1164	174	–	–
2D6 Kontrollsonde	20273	3595	+	+
2D6 Externe Sonde	729	221	–	–

2C9*1,9	16664	2731	+	+
2C9*9	681	111	–	–
2C9*1,10	20239	2929	+	+
2C9*10	1090	140	–	–

2C91,3 = 1,4	33802	4299	+	+
2C9*3	28589	2903	+	+
2C9*1,4	33803	4299	+	+
2C9*4	2342	247	–	–
2C9*1,5	53000	9404	+	+
2C9*5	368	111	–	–
2C9*1,11	65061	165	+	+
2C9*11	1990	224	–	–
2C9 Kontrollsonde	65156	83	+	+
2C9 Externe Sonde	818	183	–	–

Tabelle 2: Probe CYP2D6*1/*4 kombiniert mit CYP2C9*1/*3.

Die Proben wurden 5 Mal hybridisiert (n = 5).

Mutation	Mittelwerte n = 3	Standardabweichung	Ergebnisse der Erfindung	Ergebnisse der Sequenzierung
2D6*1,3	16055	784	+	+
2D6*3	795	57	–	–
2D6*1,4	29935	334	+	+
2D6*4	2566	196	–	–
2D6*1,6	44038	2992	+	+
2D6*6	1012	115	–	–
2D6 Kontrollsonde	33486	1150	+	+
2D6 Externe Sonde	1285	51	–	–

2C9*1,9	437	15	–	–
2C9*9	13084	556	+	+
2C9*1,10	15250	1015	+	+
2C9*10	731	87	–	–

2C91,3 = 1,4	41655	2258	+	+
2C9*3	1953	73	–	–
2C9*1,4	41655	2258	+	+
2C9*4	2449	171	–	–
2C9*1,5	53196	4270	+	+
2C9*5	253	14	–	–
2C9*1,11	65048	65	+	+
2C9*11	1619	142	–	–
2C9 Kontrollsonde	65172	13	+	+
2C9 Externe Sonde	617	80	–	–

Table 3: Probe CYP2C9*9. Die Proben wurden 3 Mal hybridisiert (n = 3). SEQUENZEN

Claims

Verfahren zum Bestimmen des Vorhandenseins oder Nichtvorhandenseins von mindestens 3 Einzelnukleotidpolymorphismen (Single Nucleotide Polymorphisms) bzw. SNP(s) (mutierte Base 1) an bestimmten Loci von (einer) Gennukleotidsequenz(en) (3) eines Organismus, welches folgende Schritte umfasst: – Amplifizieren der homologen Gennukleotidsequenz(en) oder Anteilen davon, welche verschiedene Loci enthalten, zu einem ersten Satz/ersten Sätzen von Nukleotidzielsequenzen (homologe Sequenzen 7 bzw. 7') und; – Amplifizieren eines zweiten Fragments der nicht mutierten Gennukleotidsequenz(en) zu einem zweiten Satz von Nukleotidzielsequenzen (8); – Kontaktieren des ersten Satzes/der ersten Sätze der Nukleotidzielsequenzen (7 bzw. 7') mit einer Anordnung von Erfassungssonden (9, 9', 10), die an die Oberfläche eines festen Trägers (22) gebunden sind, wobei die Anordnung eine Reihe von Paaren von Erfassungssonden (9 bzw. 9') aufweist, welche dieselbe spezifische Hybridisierungssequenz aufweisen, die zu einem Teil (2) der verschiedenen Nukleotidzielsequenzen (7 und 7') komplementär ist, sich aber durch eine einzelne Base (20), welche zu der in der zu charakterisierenden Locussequenz vorhandenen mutierten Base (1) komplementär ist, unterscheidet; – Kontaktieren des zweiten Satzes der Nukleotidzielsequenz (8) mit einer komplementären Erfassungssonde (10), welche eine spezifische Hybridisierungssequenz aufweist, die zu einem Teil (4) der Nukleotidzielsequenz (8) komplementär ist, sich aber durch eine einzelne Base (21) unterscheidet; – Feststellen und/oder Quantifizieren des Signalwertes der Hybridisierung des ersten Satzes der Nukleotidzielsequenzen (7 bzw. 7') und des Signalwertes der Hybridisierung des zweiten Satzes von Nukleotidzielsequenzen (8); – Feststellen des Vorhandenseins der Nukleotidbase (1) an den unterschiedlichen Loci, wobei Signalwerte der Feststellung der Zielsequenz(en) (7 und/oder 7') auf den entsprechenden Erfassungssonden (9 bzw. 9') höher sind als bzw. gleich sind wie ein Grenzsignalwert, der aus dem Signalwert der Feststellung des zweiten Satzes der Zielsequenz (8) auf ihrer entsprechenden spezifischen mutierten Erfassungssonde (10) berechnet wird, wobei die verschiedenen Erfassungssonden (9, 9' und 10) ähnliche physikalische und chemische Eigenschaften aufweisen; und – Feststellen des Vorhandenseins von Einzelnukleotidpolymorphismen (mutierte Base 1) an den verschiedenen Loci.
Verfahren nach Anspruch 1, wobei ähnliche physikalische und chemische Eigenschaften der Erfassungssonden (9, 9' und 10) einen GC-Gehalt zwischen etwa 40 und etwa 70% aufweisen.
Verfahren nach Anspruch 1 oder 2, wobei die Länge der Erfassungssonde (9, 9' und 10) zwischen etwa 15 und etwa 40 Basen umfasst.
Verfahren nach einem der vorherigen Ansprüche, wobei die Erfassungssonden eine Tm zwischen etwa 55°C und etwa 75°C aufweisen.
Verfahren nach einem der vorherigen Ansprüche, wobei die Hybridisierungstemperatur vorzugsweise zwischen 1°C und 10°C niedriger ist als die Schmelztemperatur (Tm) der spezifischen Sequenz der Erfassungssonden (9, 9' und 10).
Verfahren nach einem der vorherigen Ansprüche, wobei die Erfassungssonden über ihr 5'-Ende kovalent an der Oberfläche des festen Trägers befestigt sind.
Verfahren nach einem der vorherigen Ansprüche, wobei sich die Erfassungssonden (9 oder 9' oder 10) durch eine Base unterscheiden, die sich in einem Abstand von etwa 4 bis etwa 10 Basen vom 3'-Ende des zielspezifischen Teils der gebundenen Erfassungssonde entfernt befindet.
Verfahren nach einem der vorherigen Ansprüche, wobei es sich bei dem Grenzsignalwert um den Signalwert der Feststellung des zweiten Satzes von Nukleotidzielsequenzen (8) auf ihrer entsprechenden spezifischen mutierten Erfassungssonde (10), multipliziert mit einem Faktor zwischen 2 und 5, handelt.
Verfahren nach Anspruch 8, wobei der Grenzsignalwert aus einem durchschnittlichen Signalwert der Feststellung von mindestens zwei verschiedenen Sätzen von Nukleotidzielsequenzen (8) auf mindestens zwei verschiedenen komplementären spezifischen mutierten Erfassungssonden (10) berechnet wird.
Verfahren nach Anspruch 8 oder 9, wobei der Grenzsignalwert aus einem durchschnittlichen Signalwert der Feststellung von mindestens zwei verschiedenen Sätzen von Nukleotidzielsequenzen (7 bzw. 7') auf mindestens zwei verschiedenen komplementären spezifischen mutierten Erfassungssonden (9 bzw. 9') berechnet wird.
Verfahren nach einem der vorherigen Ansprüche, wobei der Organismus als an bestimmten Loci heterozygot betrachtet wird, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') sowohl auf mutierten als auch auf nicht-mutierten Erfassungssonden (9 und 9') positiv sind.
Verfahren nach Anspruch 11, wobei der Organismus als an bestimmten Loci heterozygot betrachtet wird, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') sowohl auf mutierten als auch auf nicht mutierten Erfassungssonden (9 und 9') positiv sind und darüber hinaus diese Signalwerte die Bedingung erfüllen, dass der nach der Formel
berechnete Index kleiner ist als 1; wobei es sich bei N um den durchschnittlichen Signalwert der Feststellung auf mutierten (9) bzw. nicht-mutierten (9') Erfassungssonden handelt.
Verfahren nach Anspruch 12, wobei der CI-Wert kleiner ist als 0,7.
Verfahren nach einem der vorherigen Ansprüche, wobei der erste und der zweite Satz von Nukleotidzielsequenzen (7 bzw. 7' und 8) durch Amplifizierung mit demselben Primerpaar (5, 6') erhalten wird.
Verfahren nach einem der Ansprüche 1 bis 13, wobei der erste und der zweite Satz von Nukleotidzielsequenzen (7 bzw. 7' und 8), erhalten durch Amplifizierung mit einem anderen Primerpaar (5, 5' und 6, 6'), ein Feststellungssignal auf ihren spezifischen Erfassungssonden ergeben, das identisch ist oder sich um einen Faktor von weniger als 3 unterscheidet.
Verfahren nach einem der vorherigen Ansprüche zum Feststellen von SNP in den menschlichen Cytochromen P450 2C9, 2C19 und 2D6.
Verfahren nach Anspruch 16, wobei die Cytochrome p450, 2C9 und 2D6 auf einer Anordnung von Erfassungssonden (9, 9', 10) festgestellt werden, die spezifische Sequenzen enthalten, wie sie in Tabelle 1 bereitgestellt sind.
Verfahren nach einem der vorherigen Ansprüche, wobei die Nukleotidzielsequenzen während der Amplifizierung markiert werden.
Verfahren nach einem der vorherigen Ansprüche, wobei die Nukleotidzielsequenzen nach der Amplifizierung fragmentiert werden.
Verfahren nach Anspruch 19, wobei die Nukleotidzielsequenzen durch DNase-Behandlung fragmentiert werden.
Verfahren nach einem der vorherigen Ansprüche, wobei die Erfassungssonden eine spezifische Sequenz für die Bindung an die Nukleotidzielsequenz aufweisen, welche durch einen Abstandshalter mit dem festen Träger (22) verknüpft ist.
Verfahren nach Anspruch 21, wobei der Abstandshalter ein Polynukleotid mit einer Länge von mindestens etwa 20 Nukleotiden ist.
Verfahren nach Anspruch 21 oder 22, wobei der Abstandshalter ein Polynukleotid mit einer Länge von mindestens etwa 90 Nukleotiden ist.
Kit zum Feststellen einer Nukleotidbase (1) an einem bestimmten Locus einer Gennukleotidsequenz (3) eines Organismus, umfassend: – eine Fläche eines unlöslichen festen Trägers (22), vorzugsweise eine nicht-poröse, feste Trägerfläche, umfassend: (a) mindestens zwei Erfassungssonden (9, 9'), gebunden an bestimmten Stellen der Fläche eines unlöslichen festen Trägers (22), wobei die Erfassungssonden (9, 9') eine spezifische Sequenzkomplementarität zu einem Teil (2) einer Nukleotidzielsequenz (7 bzw. 7') aufweisen, die einen ersten Locus aufweist, und wobei sich jede Erfassungssonde (9) von der anderen Erfassungssonde (9') um eine einzige Base (20) an der Locusstelle unterscheidet; (b) mindestens eine weitere Erfassungssonde (10), die sich extern zu dem ersten Locus befindet und ähnliche physikalische und chemische Eigenschaften wie die anderen beiden Erfassungssonden (9, 9') und eine zu einem anderen Teil (4) der Nukleotidzielsequenz (8) komplementäre Sequenz aufweist, ausgenommen eine Base (21), die nicht komplementär ist, und – einen in das Trägermittel eingebetteten computerisierten Code zum Feststellen (Erfassen) des Vorhandenseins der Nukleotidbase (1) an einem bestimmten Locus durch einen Signalwert der Feststellung der Zielsequenz (7 bzw. 7') auf ihrer spezifischen Erfassungssonde (9 bzw. 9'), welcher höher ist als oder gleich ist wie ein Grenzsignalwert, der aus dem Signalwert der Feststellung der Zielsequenz (8) auf ihrer spezifischen mutierten Erfassungssonde (10) errechnet wird, der ein positives Ergebnis ergibt, wodurch die Nukleotidbase (1) identifiziert wird.
Kit nach Anspruch 24, wobei die unlösliche feste Trägerfläche mindestens 10 verschiedene Erfassungssonden (10) enthält, welche gegen 5 verschiedene Genloci gerichtet sind.
Kit nach einem der Ansprüche 24 bis 25, wobei sich die Erfassungssonden (9 bzw. 9' und 10) durch eine Base unterscheiden, die sich 4 bis 10 Basen von einer Extremität des zielspezifischen Teils der gebundenen Erfassungssonde entfernt befindet.
Kit nach einem der Ansprüche 24 bis 26, wobei die Erfassungssonden (9 bzw. 9' und 10) über ihr 5'-Ende kovalent an der Oberfläche des festen Trägers (22) befestigt sind.
Kit nach einem der Ansprüche 24 bis 27, wobei der in das Trägermittel eingebettete computerisierten Code bestimmt, dass der Organismus an einem bestimmten Locus heterozygot ist, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') auf mutierten und nicht-mutierten Erfassungssonden (9 und 9') beide positiv sind.
Kit nach Anspruch 28, wobei der in das Trägermittel eingebettete computerisierte Code bestimmt, dass der Organismus an einem bestimmten Locus heterozygot ist, wenn die Signalwerte der Feststellung der Nukleotidzielsequenzen (7 und 7') auf mutierten und nicht-mutierten Erfassungssonden (9 und 9') beide positiv sind und darüber hinaus die Signalwerte die Bedingung erfüllen, dass der nach der Formel
berechnete Index kleiner ist als 1; wobei es sich bei N um den durchschnittlichen Signalwert der Feststellung auf mutierten (9) bzw. nicht-mutierten (9') Erfassungssonden handelt.