DE69829493T2 - Techniken zur identifizierung, bestätigung, kartierung und kategorisierung von polymeren - Google Patents

Techniken zur identifizierung, bestätigung, kartierung und kategorisierung von polymeren Download PDF

Info

Publication number
DE69829493T2
DE69829493T2 DE69829493T DE69829493T DE69829493T2 DE 69829493 T2 DE69829493 T2 DE 69829493T2 DE 69829493 T DE69829493 T DE 69829493T DE 69829493 T DE69829493 T DE 69829493T DE 69829493 T2 DE69829493 T2 DE 69829493T2
Authority
DE
Germany
Prior art keywords
sample
hybridization
nucleic acids
allele
polymers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69829493T
Other languages
English (en)
Other versions
DE69829493D1 (de
Inventor
Ghassan Ghandour
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affymetrix Inc
Original Assignee
Affymetrix Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affymetrix Inc filed Critical Affymetrix Inc
Publication of DE69829493D1 publication Critical patent/DE69829493D1/de
Application granted granted Critical
Publication of DE69829493T2 publication Critical patent/DE69829493T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism

Description

  • Hintergrund der Erfindung
  • Die Erfindung betrifft das Nachweisen von Unterschieden in Polymeren. Insbesondere betrifft die Erfindung Verfahren zur Erkennung, Bestätigung, Kartierung und Genotypisierung von Nukleinsäuresequenz-Proben.
  • Geräte und Computersysteme zur Bildung und Verwendung von Arrays von Materialien auf einem Chip oder Substrat sind bekannt. Beispielsweise beschreiben die PCT Anmeldungen WO 92/10588 und 95/11995 Verfahren zur Sequenzierung oder Sequenzkontrolle von Nukleinsäuren und andere Materialien. Arrays zur Ausführung dieser Prozesse können entsprechend dieser Verfahren gebildet sein, wie beispielsweise die Pioniertechniken, die in US Patent Nr. 5,445,934, 5,384,261 und 5,571,639 offenbart sind.
  • Gemäß einem Aspekt der darin beschriebenen Verfahren wird ein Array von Nukleinsäuresonden an bekannten Stellen auf einem Chip hergestellt. Eine markierte Nukleinsäure wird dann in Kontakt mit dem Chip gebracht und ein Scanner erzeugt eine Grafik-Datei, die die Stellen anzeigt, wo die markierten Nukleinsäuren an den Chip gebunden sind. Bezogen auf diese Grafik-Dateien und der Arten der Sonden an den bestimmten Stellen wird es möglich, Informationen, wie die Nukleotid- oder Monomersequenz der DNA und RNA zu extrahieren. Solche Systeme sind verwendet worden, um beispielsweise Arrays von DNA zu bilden, die verwendet werden können, um zu untersuchen und nachzuweisen, die wichtig sind für Mutationen, genetische Krankheiten, Tumoren, Infektionskrankheiten, HIV und andere genetische Charakteristika.
  • Die VLSIPSTM Technologie stellt Verfahren zur Herstellung sehr großer Arrays von Oligonukleotidsonden auf sehr kleine Chips bereit. Siehe US Patent Nr. 5,143,843 und PCT Patent Veröffentlichungen Nr. WO 90/15070 und 92/10092. Die Oligonukleotidsonden auf den DNA-Sonden-Array werden zur Entdeckung komplementärer Nukleinsäuresequenzen in einer interessierenden Nukleinsäureprobe (die „Ziel" Nukleinsäure) verwendet.
  • Für Sequenzkontrollverwendungen kann der Chip für eine spezifische Nukleinsäuresequenz ausgelegt sein. Beispielsweise kann der Chip Sonden enthalten, die völlig komplementär zu der Zielsequenz sind und Sonden, die sich von der Zielsequenz durch eine Einzelbasen-Fehlpaarung (single base mismatch) unterscheiden. Für de novo Sequenzierungsanwendungen kann der Chip sämtliche mögliche Sonden einer spezifischen Länge enthalten. Diese Sonden sind auf einem Chip in Reihen und Spalten von Zellen angelegt, wobei jede der Zellen mehrfache Kopien der bestimmten Sonde enthält. Außerdem können Leer-Zellen („blank" cells) auf dem Chip vorliegen, die keine Sonden enthalten. Da die Leer-Zellen keine Sonden enthalten, sollten markierte Zellen nicht spezifisch an den Chip in diesem Bereich binden. Somit stellt eine Leer-Zelle ein Maß für die Hintergrundintensität dar.
  • Während das Human-Genom-Projekt die Herstellung der ersten vollständigen Referenzsequenz der menschlichen Chromosomen versucht, ist die Aufmerksamkeit bereits auf den Sequenzvariationen in Einzelpersonen in den Brennpunkt gerückt. Die genetische Diversität ist von Interesse, weil sie die Basis der erblichen Variation bei der Krankheitsanfälligkeit erläutern kann, als auch eine Aufzeichnung der menschlichen genetischen Migrationen darstellt.
  • Der häufigste Typ der menschlichen genetischen Variation ist der Einzelnukleotid-Polymorhismus (single-nucleotide polymorphism (SNP)), welches eine Position ist, worin zwei alternative Basen in spürbarer Frequenz (z.B. größer als 1%) in der menschlichen Population auftreten. Es gibt viele Verwendungen von SNPs einschließlich der Verwendung als genetischer Marker zur Identifizierung von Krankheitsgenen durch Kopplungs-Studien in Familien, Kopplungs-Ungleichgewicht in isolierten Populationen, Assoziationsanalyse von Patienten und Kontrollen, und Verlust-von-Heterozygotie Studien in Tumoren, um nur einige zu nennen. Es wird angenommen, dass große Sammlungen von kartierten SNPs ein starkes Werkzeug für humane genetische Studien bereitstellen würde. Obwohl individuelle SNPs weniger informativ sein können, als herkömmliche genetische Marker, können SNPs häufiger sein und eine größere Möglichkeit zur Automation haben.
  • Daher besteht ein Bedürfnis nach Innovation von Verfahren zur Identifizierung, Bestätigung, Kartierung und zur Einordnung von Polymeren, wie Nukleinsäuren.
  • WO 99/29212 offenbart ein Verfahren zur Identifizierung des Genotyps eines Organismus, durch Hybridisierung einer Zielnukleinsäuresequenz vom Organismus mit einem Array, welches die Identifizierung der Anwesenheit eines Nukleinsäurepolymorphismus erlaubt.
  • Zusammenfassung der Erfindung
  • Gemäß der vorliegenden Erfindung wird ein Verfahren zur Genotypisierung einer Probe von Nukleinsäuren bereitgestellt.
  • Erzeugen einer Vielzahl von Schätzgrößen des Anteils der ersten und zweiten Allele in einer Vielzahl von Referenzproben von Nukleinsäuren, wobei jede der Schätzgrößen berechnet ist durch Teilen eines ersten Referenz-Hybridisierungswertes, der die Hybridisierungsaffinität der jeweiligen Referenzprobe von Nukleinsäuren an Nukleinsäuresonden bezeichnet, die komplementär zu einem Teil des ersten Allels sind bzw. eines zweiten Referenz-Hybridisierungswertes, der die Hybridisierungsaffinität der jeweiligen Referenzprobe der Nukleinsäuren an Nukleinsäuresonden bezeichnet, die zu einem Teil des zweiten Allels komplementär sind, durch eine Summe des ersten und zweiten Referenz-Hybridisierungswertes; Gruppieren (clustering) der Vielzahl von Schätzgrößen zur Bildung eines Anteilsmusters, wobei jede Gruppe in dem Anteilsmuster einen Genotyp der Referenzproben der Nukleinsäuren darstellt; Berechnen einer Schätzgröße des Anteils der ersten und zweiten Allele in einer Probe von Nukleinsäuren durch ein Verfahren, das die Schritte umfasst:
    Einsetzen eines ersten Hybridisierungswertes, der die Hybridisierungsaffinität der Probe von Nukleinsäuren an Nukleinsäuresonden kennzeichnet, die komplementär zu einem Teil des ersten Allels sind;
    Einsetzen eines zweiten Hybridisierungswertes, der die Hybridisierungsaffinität der Probe von Nukleinsäuren an den Nukleinsäuresonden kennzeichnet, die komplementär zu einem Teil des zweiten Allels sind; und
    Berechnen der Schätzgröße des Anteils der ersten und zweiten Allele in der Probe von Nukleinsäuren durch Teilen des ersten Hybridisierungswertes bzw. des zweiten Hybridisierungswertes durch eine Summe des ersten und zweiten Referenz-Hybridisierungswertes; und
    Genotypisieren der Probe von Nukleinsäuren durch Vergleichen der Schätzgröße des Anteils der ersten und zweiten Allele in der Probe der Nukleinsäuren mit dem Anteilsmuster der Referenzproben.
  • Beispielsweise können die Gruppen (cluster) im Anteilsmuster homozygot für ein erstes Allel, homozygot für ein zweites Allel oder heterozygot für beide Allele dar-stellen.
  • Andere Merkmale und Vorteile der Erfindung erschließen sich unmittelbar durch das das Studium der folgenden ausführlichen Beschreibung in Verbindung mit den begleitenden Zeichnungen.
  • Kurze Beschreibung der Zeichnungen
  • 1 erläutert ein Beispiel eines Computersystems, das zum Ausführen der Software in einer erfindungsgemäßen Ausführungsform verwendet werden kann.
  • 2 erläutert ein Systemblockdiagramm des Computersystems von 1.
  • 3 erläutert ein Gesamtsystem zum Bilden und Analysieren von Arrays von biologischem Material, wie DNA oder RNA.
  • 4 erläutert den Gedanke der Bindung von Sonden auf Chips.
  • 5 erläutert einen Teil einer Ausführungsform eines genotypischen Chips.
  • 6 zeigt ein Ablaufdiagramm eines Verfahrens zur Anteilsschätzung von Polymeren.
  • 7 zeigt ein Ablaufdiagramm eines Verfahrens zur Analyse einer Probe von Nukleinsäuren.
  • 8 ist eine Tabelle von experimentellen Daten und Ergebnissen von einer Ausführungsform der Erfindung.
  • 9A-9C erläutert Fraktionsmuster von der Tabelle von 8.
  • 10 zeigt ein Ablaufdiagramm eines Verfahrens zur Erzeugung eines Genotyps von einem Einzelstrang.
  • 11 zeigt ein Ablaufdiagramm eines Verfahrens zur Kombination von Strang genotypischen Signalen in ein einzelnes Genotypsignal.
  • Ausführliche Beschreibung der bevorzugten Ausführungsformen
  • In der folgenden Beschreibung wird die vorliegende Erfindung in Bezug auf bevorzugte Ausführungsformen, welche die VLSIPSTM Technologie zur Erzeugung sehr großer Arrays von Oligonukleotidsonden auf Chips verwenden, beschrieben. Allerdings ist die Erfindung nicht auf Nukleinsäuren oder auf diese Technologie begrenzt und kann zweckmäßigerweise auf andere Polymere und Herstellungsprozesse angewandt sein. Darum verfolgt die Beschreibung der Ausführungsformen die Absicht von Erläuterungen, jedoch nicht von Begrenzungen.
  • 1 erläutert ein Beispiel eines Computersystems, das zur Ausführung der Software einer erfindungsgemäßen Ausführungsform verwendet werden kann. 1 zeigt ein Computersystem 1, das eine Anzeige 3, einen Bildschirm 5, ein Gehäuse 7, eine Tastatur 9 und eine Maus 11 enthält. Die Maus 11 kann ein oder mehrere Knöpfe zur Interaktion mit einer graphischen Benutzeroberfläche besitzen. Das Gehäuse 7 enthält ein CD-ROM Laufwerk 13, einen Systemspeicher und eine Festplatte (siehe 2), welche zum Speichern und Einladen von Software Programmen verwendet werden können, die Computerkode einführen, der die Erfindung ausführt, Daten zur Verwendung mit der Erfindung, und dergleichen. Obwohl eine CD-ROM 15 als ein exemplarischer Computer lesbares Speicherungsmedium gezeigt ist, können andere computer-lesbare Speichermedien einschließlich Diskette, Band, Flashspeicher, Systemspeicher und Festplatte verwendet werden. Zusätzlich kann ein Daten-Signal in Form einer Trägerwelle (z.B. ein Netzwerk einschließlich Internet) das lesbare Speichermedium im Computer sein.
  • 2 zeigt ein Systemblockdiagramm vom Computersystem 1, das zur Durchführung der Software in einer erfindungsgemäßen Ausführungsform verwendet wird. Wie in 1 umfasst das Computersystem 1 einen Monitor 3 und eine Tastatur 9 und eine Maus 11. Computersystem 1 umfasst zusätzlich Subsysteme, wie ein zentraler Prozessor 51, ein Systemspeicher 53, ein Festspeicher 55 (z.B. Festplatte), ein entnehmbarer Speicher 57 (z.B. CD-ROM Laufwerk), ein Anzeigeadapter 59, eine Soundkarte 61, ein Lautsprecher 63 und ein Netzwerk-Interface 65. Weitere Computersysteme, die zur Verwendung mit der Erfindung geeignet sind, können weitere oder weniger Untersysteme enthalten. Zum Beispiel könnte ein weiteres Computersystem mehr als einen Prozessor 51 (d.h. ein Multiprozessorsystem) oder einen Cache-Speicher enthalten.
  • Die System-Bus-Architektur des Computersystems 1 ist durch Pfeile 67 dargestellt. Allerdings veranschaulichen diese Pfeile jedes Verbindungsschema, das der Verbindung der Untersysteme dient. Beispielsweise könnte ein lokaler Bus zur Verbindung des zentralen Prozessors zum Systemspeicher und Anzeigenadapter verwendet werden. Computersystem 1 in 2 gezeigt, ist jedoch ein Beispiel von einem Computersystem, das zur Verwendung mit der Erfindung geeignet ist. Andere Computerarchitekturen mit verschiedenen anderen Anordnungen von Untersystemen können auch verwendet werden. Zum Zweck der Erläuterung wird die vorliegende Erfindung als Teil eines Computersystems beschrieben, dass eine Chipschablone entwirft, Sonden auf dem Chip herstellt, Nukleinsäuren markiert und die hybridisierten Nukleinsäuresonden misst. Ein derartiges System ist vollständig im US Patent Nr. 5,571,639 beschrieben, dass durch Bezugnahme für sämtliche Zwecke aufgenommen worden ist. Allerdings kann die vorliegende Erfindung getrennt von dem Gesamtsystem für die Datenanalyse verwendet werden, die durch solche Systeme erzeugt werden.
  • 3 erläutert ein computerbasiertes System zum Formen und Analysieren von Arrays von biologischen Materialien, wie RNA oder DNA. Ein Computer 100 wird zum Entwerfen von Arrays biologischer Polymere, wie RNA und DNA, verwendet. Der Computer 100 kann beispielsweise eine geeignete programmierte Sun Workstation oder ein Personalcomputer oder eine Workstation sein, wie ein IBM PC Äquivalenter, einschließlich geeignetem Speicher und einer CPU, wie in 1 und 2 gezeigt. Das Computersystem 100 erhält die Eingabe von einem Benutzer, bezüglich charakteristischer geeigneter Eigenschaften eines interessierenden Gens und weitere Eingaben, bezüglich der gewünschten Merkmale des Arrays. Gegebenenfalls kann das Computersystem Informationen betreffend einer spezifischen interessierenden Gensequenz aus einer externen oder internen Datenbank, wie Genbank erhalten. Die Ausgabe des Computersystems 100 ist ein Satz vom Chip-Entwurf-Computerdateien 104 in der Form, beispielsweise einer Wechselmatrix, wie in der PCT Anmeldung WO 92/10092 beschrieben und andere verknüpfte Computerdateien.
  • Die Chip-Entwurfs-Dateien werden zu einem System 106 ausgestattet, dass die lithographische Schablone entwirft, die zur Herstellung von Arrays von Molekülen, wie DNA, verwendet werden. Das System oder das Verfahren 106 kann die Hardware enthalten, die zur Herstellung der Schablonen 110 notwendig ist und auch die notwendige Computer-Hardware und Software 108, die in effizienter Art und Weise notwendig ist zum Entwurf der Schablonenmuster auf der Schablone. Ebenso wie bei den anderen Merkmalen in 3 kann diese Ausstattung am gleichen Ort sein oder nicht sein, ist jedoch aus Gründen der Vereinfachung zusammen in 3 gezeigt. Das System 106 erzeugt Schablonen 110 oder andere Synthesemuster, wie Chrom-auf-Glas-Schablonen zur Verwendung in der Herstellung von Polymerarrays.
  • Die Schablonen 110, als auch ausgewählte Information in Bezug auf den Entwurf der ausgewählten Chips vom System 100, werden in einem Synthesesystem 112 verwendet. Das Synthesesystem 112 umfasst die notwendige Hardware und Software, die zur Herstellung von Arrays von Polymeren auf einem Substrat oder Chip 114 verwendet wird. Beispielsweise umfasst die Synthese-Einrichtung 112 eine Lichtquelle 116 und eine chemische Flusszelle 118, auf der das Substrat oder der Chip 114 platziert ist. Schablone 110 ist zwischen der Lichtquelle und dem Substrat/Chip angebracht und die beiden werden relativ zueinander zu geeigneten Zeiten zum Entschützen der ausgewählten Regionen des Chips versetzt. Ausgewählte chemische Reagenzien werden durch die Flusszelle 118 zur Koppelung an die entschützten Bereiche geschickt, als auch zum Waschen und weiterer Verfahrensschritte. Sämtliche Verfahrensschritte werden vorzugsweise durch einen geeigneten programmierten Computer 119 gesteuert, der derselbe oder nicht derselbe Computer, wie der Computer/die Computer sein kann, der/die bei dem Schablonenentwurf und Schablonenherstellung verwendet wird/werden.
  • Die Substrate, die durch das Synthesesystem 112 hergestellt wurden, werden gegebenenfalls in kleine Chips geschnitten und gekennzeichneten Zielen aus-gesetzt. Die Ziele können oder können nicht komplementär zu einem oder mehreren Molekülen auf dem Substrat sein. Die Ziele sind mit einem Marker markiert, wie eine Fluoreszein-Markierung (gekennzeichnet durch ein Sternchen in 3) und im Scannersystem 120 platziert. Obwohl die bevorzugten Ausführungsformen Fluoreszenzmarker verwenden, können andere Marker verwendet werden, die Unterschiede in der radioaktiven Intensität, Lichtstreuung, Brechungsindex, Leitfähigkeit, Elektrolumineszenz oder andere große Molekül-Nachweisdaten bereitstellen. Deshalb ist die vorliegende Erfindung nicht auf die Analyse der Fluoreszenzmessungen der Hybridisierung begrenzt, sondern kann ohne weiteres zur Analyse anderer Messungen der Hybridisierung verwendet werden.
  • Das Scannersystem 120 arbeitet wieder unter der Steuerung eines geeigneten programmierten Digital-Computers 122, der derselbe Computer oder nicht derselbe Computer wie der Computer sein kann, die bei der Synthese der Schablonenherstellung und dem Schablonenentwurf verwendet werden. Der Scanner 120 umfasst ein Nachweisgerät 124, wie ein konfukales Mikroskop oder CCD (Ladungsgekoppeltes Gerät (charge-coupled device)), das zum Nachweis des Ortes, wo das markierte Ziel (*) an das Substrat gebunden ist, verwendet wird. Die Ausgabe des Scanners 120 ist eine Grafik-Dateien) 124, die in dem Fall des fluoreszein-markierten Ziels, die Fluoreszenzintensität (Photonenereignisse oder andere verwandte Messungen, wie Spannung) als eine Funktion der Position auf dem Substrat ist. Da höhere Photonenereignisse beobachtet werden, wo das markierte Ziel stärker an den Array der Polymere (z.B. DNA Sonden auf dem Substrat) gebunden hat und da die Monomersequenz der Polymere auf dem Substrat als eine Funktion der Position bekannt ist, wird es möglich die Sequenzen) von Polymer(en) auf dem Substrat zu bestimmen, die komplementär zu dem Ziel sind.
  • Die Grafik-Datei 124 ist als Eingabe zu einem Analysensystem 126 ausgestattet, das das Syntheseintegritäts-Beurteilsverfahren der vorliegenden Erfindung umfasst. Wiederum kann das Analysesystem eines aus der Vielzahl von Computersystemen sein, aber das Analysesystem basiert in einer bevorzugten Ausführungsform auf einem WINDOWS NZ Workstation oder einem Äquivalent. Das Analysesystem kann die Grafik-Datei(en) zur Erzeugung einer passenden Ausgabe 128, wie die Identität von spezifischen Mutationen in einem Ziel analysieren, wie DNA oder RNA.
  • 4 erläutert die Bindung einer speziellen Ziel-DNA an einem Array der DNA-Sonden 114. Wie in diesem einfachen Beispiel gezeigt, werden die nachstehenden Sonden in dem Array gebildet:
    3'-AGAACGT
    AGACCGT
    AGAGCGT
    AGATCGT


  • Wie gezeigt, ist das Fluoreszeinmarkierte (oder auf andere Weise markierte) Ziel 5'-TCTTGCA auf dem Array ausgesetzt, wenn es komplementär nur zu der Sonde 3'-AGAACGT ist und Fluoreszein wird in erster Linie auf der Oberfläche des Chips gefunden, dort wo 3'-AGAACGT lokalisiert ist. Der Chip enthält Zellen die mehrere Kopien einer bestimmten Sonde umfassen und die Zellen können als quadratische Bereiche auf dem Chip sein.
  • In der folgenden Beschreibung wird die Erfindung in Bezug auf SNPs beschrieben. Deshalb können an diesen SNP Positionen die Nukleinsäureproben allgemein eines oder beide der beiden Allele umfassen, welches allgemein als das A-Allel und das B-Allel bezeichnet wird. In einem Pool von Individuen, würde zu erwarten sein, sofern ein SNP an einem Ort ist, das einige Individuen homozygot AA sein würden, einige homozygot BB sein würden und einige. heterozygot AB sein würden. Obwohl die Erfindung in Bezug auf SNPs beschrieben ist, ist die Erfindung nicht darauf begrenzt und kann vorteilhaft zu anderen Polymorphismus-Bedingungen einschließlich Insertionen, Deletionen, Multipositionspolymorhysmen, Mehrfachbasen-Polymorphismen und multiallelische Positionen, verwendet werden.
  • 5 zeigt einen Teil eines angeordneten Chips, der zur Identifikation, zur Bestätigung, zur Kartierung und/oder Genotypisierung von Nukleinsäuren verwendet werden kann. Der Chip umfasst an Nukleinsäuresonden, die auf dem Chip gekoppelt werden, typischerweise Tausende von Zellen. Der Chip kann unterschiedliche Sonden besitzen, die für spezifische Anwendungen auf dem Chip angebracht sind (z.B. Erkennung von Mutationen, die auf eine Veränderung der Resistenz bei einer Arzneimitteltherapie zur HIV-Behandlung hinweisen) oder die Chips können generisch (z.B. sämtliche möglichen 8-mer Sonden besitzen) sein. Außerdem können die Zellen in jeder beliebigen Art und Weise auf dem Chip angeordnet sein. Zum Beispiel können die Zellen an Stellen, die zur Verbesserung der Scandaten durch die Verringerung der Interzell-Wechselwirkung angeordnet sein, um die Kosten der Herstellung, durch Verminderung der Anzahl der verwendeten Schablonen, zu reduzieren, oder zur Vereinfachung der Interpretation der Daten für die Benutzer.
  • Ein bevorzugtes Layout eines Anteils des genotypischen Chips wird in Bezug auf 5 beschrieben. Das Layout ist allgemein aufgebaut, damit es für Benutzer einfacher ist die Daten zu interpretieren und die Strukturen der Sonden auf dem hierin beschriebenen Chip zu verstehen. Allerdings sollte verstanden werden, dass die Erfindung nicht auf ein bestimmtes Chip-Layout oder eine Struktur der Sonden begrenzt ist. Die Erfindung kann ebenso auf andere Chip-Layouts angewandt werden.
  • Vorausgesetzt, dass das A-Allel die Sequenz 5'-CCTCGGCAT und das B-Allel die Sequenz 5'-CCTCAGCAT enthält, wobei das unterstrichene Nukleotid das SNP repräsentiert, unterscheidet die Allele. Zu Diskussionszwecken wird die Position der Nukleotide in den Allelen durch die Variable d spezifiziert, wobei d = 0 für das SNP und d zu der linken Seite des SNP abnimmt und zur rechten Seite des SNP ansteigt. 5 zeigt einen Block 201, der fünf Positionen in der Umgebung des SNP umfasst. Die Anzahl von Positionen, die in Block 201 enthalten sind, sind aus Gründen der Veranschaulichung ausgewählt worden und können abhängig von der Anwendung variiert werden.
  • Entlang der oberen Zeile von 5 ist die Sequenz der Allele gezeigt. Bei d = 0 stellt das Nukleotid, dass als G/A gezeigt ist, den SNP dar, der das A-Allel und das B-Allel unterscheidet. Wie gezeigt, umfasst Block 201 für das angelegte A-Allel vier Reihen von Zellen und für das angelegte B-Allel vier Reihen von Zellen. Die Reihen von Zellen werden durch die Nukleotide T, G, A und A gestaltet, die das Nukleotid an der Abfrageposition der Nukleinsäuresonden in der Reihe darstellen. Block 201 kann weiterhin in die Miniblöcke 203 eingeteilt werden, welche einen Satz von Zellen (und deren korrespondierenden Sonden) darstellen, die perfekte Paarungs-Sonden für die interessierenden Allele und Null oder mehr Fehl-Paarungssonden aufweisen. Obwohl die Miniblöcke als Säulen auf dem Chip in einer Ausführungsform gezeigt sind, erfordern sie keine bestimmte räumliche Anordnung auf dem Chip.
  • Zur Erinnerung, die Sequenz der Allele ist 5'-CCTC?GCAT, wobei das angezeigte Fragezeichen das SNP ist, kann entweder ein G oder ein A sein. Angenommen die Sonden sind mit einer Abfrageposition auf dem Chip 5-mere am zentralen Nukleotid, würden die Sonden auf dem Chip wie folgt sein:
    Figure 00110001
  • Die Abfragepositonsnukleotide sind in den Sonden unterstrichen. Zusätzlich sind die SNP Nukleotide in jeder Probe fett wiedergegeben: C ist im Fall des A-Allels und T ist in Fall des B-Allels. Wie gezeigt, hat der Miniblock an d = 0 zwei identische Hälften, entsprechend würde es möglich sein nur eine Hälfte des Miniblöcks an dem Ort anzulegen.
  • Die gezeigten Miniblöcke umfassen eine perfekte Paarung (d.h. eine Sonde, die perfekt komplementär zu dem Zielallel ist) zu den Zielallelen und mehreren Sonden mit einer Einzelfehlpaarung. Die zentralen Miniblöcke sind darin einzigartig, so dass die Abfrageposition die Gleiche ist wie das SNP. Daher haben die Fehlpaarungssonden des zentralen Miniblocks eine Einzelbasenfehlpaarung aus beiden Allelen. Dieses ist im Gegensatz zu den nichtzentralen Miniblöcken, wobei die Fehlpaarungssonden eine einzelne Basenfehlpaarung zu einem Allel und zwei Basenfehlpaarungen zu dem anderen Allel aufweisen.
  • In Bezug auf 5 werden die Zellen wie folgt markiert:
  • PMa
    – perfekte Paarung zum A-Allel
    PMb
    – perfekte Paarung zum B-Allel
    Ma
    – einzelne Basenfehlpaarung zum A-Allel
    Mb
    – einzelne Basenfehlpaarung zum B-Allel
    M*
    – einzelne Basenfehlpaarung zu beiden A-Allel und B-Allel
  • 5 erläutert, dass die nichtzentralen Miniblöcke zwei perfekte Paarungssonden und vier Fehlpaarungssonden, zwei für jedes Allel, umfassen. Die zentralen Miniblöcke umfassen für jedes Allel perfekte Paarungssonden und zwei Fehlpaarungssonden für beide Allele. In der folgenden Diskussion werden diese Markierungen verwendet, um die erfindungsgemäßen Ausführungsformen zu beschreiben.
  • 6 ist ein Ablaufdiagramm einer Anteilsabschätzung von Polymeren in einer Probe mit mehreren Polymeren. Obwohl in bevorzugten Ausführungsformen die Polymere Nukleinsäuren sind, können andere Polymere einschließlich Peptide, Oligosaccharide und dergleichen verwendet werden. Deshalb ist die Erfindung nicht auf die spezifischen Ausführungsformen, wie hierin beschrieben, begrenzt.
  • In Schritt 301, wird ein erster Hybridisierungswert, der auf die Hybridisierungsaffinität einer Probe von Polymeren gegenüber einem ersten Polymer anzeigt, eingegeben. Die Probe von Polymeren kann mehrere unterschiedliche Sequenzen von Polymeren, einschließlich solcher, die komplementär zu dem ersten Polymer sind, aufweisen. Der zweite Hybridisierungswert, der auf die Hybridisierungsaffinität einer Probe von Polymeren gegenüber einem ersten Polymer hinweist, wird in Schritt 303 eingegeben. Es wird erwartet, dass der erste und zweite Hybridisierungswert mit dem Anteil der Proben von Polymeren variiert, die komplementär zu dem ersten und zweiten Polymer sind.
  • Im Schritt 305 wird ein dritter Hybridisierungswert vom ersten und zweiten Hybridisierungswert subtrahiert. Der dritte Hybridisierungswert kann zur Vereinheitlichung des ersten und zweiten Hybridisierungswertes verwendet werden. Wie nachstehend beschrieben, wird in bevorzugten Ausführungsformen der dritte Hybridisierungswert von fehlgepaarten Nukleinsäuresonden abgeleitet, die das Subtrahieren eines Hintergrundwertes unnötig macht.
  • Eine Schätzgröße des Anteils des ersten und zweiten Polymers in der Probe von Polymeren wird durch Teilen des ersten vereinheitlichten Hybridisierungswertes durch die Summe des ersten und zweiten vereinheitlichten Hybridisierungswertes berechnet. Auf diese Weise wird die Schätzgröße generell zwischen 0 und 1 variieren, wobei 1 eine sehr hohe Konzentration von Polymeren anzeigt, die komplementär zu dem ersten Polymer sind und 0 eine sehr hohe Konzentration von Polymeren anzeigt, die komplementär zu dem zweiten Polymer sind.
  • In den Ausführungsformen, in denen mehr als ein Polymer oder Allel untersucht wird, kann der Nenner drei oder mehr Hybridisierungswerte umfassen. Entsprechend ist die Erfindung nicht auf die Untersuchung von nur zwei Polymeren oder Allelen begrenzt.
  • Zurückkommend auf die Markierungen der Nukleinsäuresonden gemäß einer bevorzugten Ausführungsform, würde zu erwarten sein, dass falls eine Probe von Nukleinsäuresonden aus einem Einzelnen entnommen würde, die homozygot für das A-Allel ist, dann ist PMa > PMb = M* im zentralen Miniblock. In ähnlicher Weise wäre zu erwarten, dass falls eine Probe von Nukleinsäuresonden aus einem Einzelnen entnommen würde, die homozygot für das B-Allel ist, dann ist PMb > PMa = M* im zentralen Miniblock. Falls der Einzelne heterozygot wäre, würde zu erwarten sein, dass PMa = PMb > M* im zentralen Miniblock ist.
  • Die Schätzgröße des Anteils zeigt 6 und kann für jeden der Miniblöcke wie folgt sein: p-hat = (PMa – MM)/[(PMa – MM) + (PMb – MM)],worin p-hat die Schätzgröße des Anteils darstellt und MM von den Fehl-paarungssonden M*, Ma oder Mb abgeleitet ist. Als ein Beispiel kann MM wie folgt berechnet werden:
    MM = min(M*, M*) für die zentralen Miniblöcke.
    MM = max(Mitte(Ma, Ma, Ma), Mitte(Mb, Mb, Mb)) für die nichtzentralen Miniblöcke.
  • Das Minimum wird für die Zentralminiblöcke in einer Ausführungsform verwendet, weil es nur zwei unterschiedliche M* Fehlpaarungssonden gibt und es wünschenswert sein kann, das Einschließen eines sehr großen Wertes zu vermeiden, der aus Kreuzhybridisierungsereignissen resultieren könnte.
  • Die vorstehenden Gleichungen für MM sind beispielhaft für jene, die verwendet werden können, andere können verwendet werden und können vorzugsweise verändert werden, abhängig von der speziellen Anwendung. Als ein Beispiel können Miniblöcke mit nur einer Fehlpaarungssonde angelegt werden. In solchen Fällen kann MM zu der Hybridisierungsaffinität gleich sein, die von Sonden in der Einzelfehlpaarungszelle gemessen wird. Obwohl die Fehlpaarungssonden nicht erforderlich sind, wurde festgestellt, dass sie die Berechnungen stabilisieren.
  • Es wird aus der Betrachtung der vorstehenden Gleichung für p-hat klar, dass falls PMa oder PMb kleiner als MM ist, kann p-hat negativ werden und möglicherweise zu einer Teilung durch Null führen. Daher wird in einigen Ausführungsformen, wenn eine Berechnung von (PMa – MM) oder (PMb – MM) zu einer negativen Zahl führt, das Ergebnis auf Null gleichgesetzt. Daher, wenn Da = max(PMa – MM, 0) und Db = max(PMb – MM, 0) ist, kann die vorstehende p-hat Formel folgendermaßen geschrieben werden: p-hat = Da / (Da + Db)
  • Es wäre weiterhin möglich einen Nenner mit Null zu haben, jedoch wie später im Detail beschrieben wird, kann ein Qualitätsfilter derartiger Daten als schlecht abgesondert werden, so dass die verbotene Wirkung nicht stattfindet. Eine andere Möglichkeiten wäre, ein negatives (oder Null) Ergebnis zu einer kleinen Zahl, wie 0,00001, als Beispiel zu setzen.
  • In einer anderen Ausführungsform kann die Anteilsschätzgröße aus mehreren Miniblöcken berechnet werden. Zum Beispiel kann die Hybridisierungsaffinität der perfekten Paarungssonden PMa aus den Miniblöcken summiert werden und die Hybridierungsaffinität der perfekten Paarungsonden PMb aus den Miniblöcken kann summiert werden. Die Summen werden dann in einer der vorstehenden Formeln, beispielsweise, wie PMa bzw. PMb zur Bildung der Anteilsschätzgrößen p-hat, verwendet. Ein Vorteil dieser Ausführungsform ist, dass die Minblöcke wirkungsvoll entsprechend den Hybridisierungsaffinitäten der perfekten Paarungssonden gewichtet werden, die in einigen Anwendungen erwünscht sein können.
  • 7 zeigt ein Ablaufdiagramm eines Verfahrens zur Analyse einer Probe von mehreren Nukleinsäuren. In einem Schritt 351, werden Qualitätstests auf den Hybridisierungsaffinitätsdaten durchgeführt. Wie in sämtlichen hierin aufgeführten Ablaufdiadagrammen sind viele Schritte, die gestrichen, zugesetzt, kombiniert und modifiziert sein können und sind immer noch im Bereich der Erfindung, wie durch die beigefügten Ansprüche definiert. Qualitative Tests sind nicht in allen Ausführungsformen ertorderlich, aber sie können nützlich sein bei der Entfernung von Hybridisierungsaftinitätsdaten, die Fehler enthalten (z.B. dort ist ein Mangel oder ein Fehlerereignis im Chip, während ein Bereich des hybridisierten Chip gescannt wird). Ein Qualitäts-Test, der verwendet werden kann, besteht darin, dass (PMa – MM) und (PMb – MM) oberhalb eines vorbestimmten Schwellenwertes (z.B. 15 Photonen-ereignisse) sein muss. Ein weiterer Qualitäts-Test kann darin bestehen, dass die höchste Hybridisierungsaffinität von einer perfekten Paarungssonde PMa oder PMb stammen muss.
  • Ein anderer Qualitäts-Test kann darin bestehen, wenn (PMa / max(Ma) >1 und (PMb / max(Mb) < 1 ist, dann versagt der Miniblock. Andere Qualitäts-Tests können entworfen und verwendet werden. Zusätzlich können Qualitäts-Tests so kombiniert sein, dass mehr als einer für die weiteren Prozesse bestanden werden muss. Qualitäts-Teste können auch falls gewünscht auf ganzen Blöcken durchgeführt werden.
  • Mehrere Schätzgrößen des Anteils der Allele in Proben werden in einem Schritt 353 erzeugt. Jede Schätzgröße des Anteils der Nukleinsäuren in einer Probe kann entsprechend berechnet werden zu dem Verfahren wie 6 gezeigt oder wie oben beschrieben. Die Proben können von einer ziemlich großen und verschiedenen Gruppe von Individuen entnommen worden sein. Die multiplen Schätzgrößen des Anteils der Allele in den Proben werden gruppiert zur Bildung eines Anteilsmusters in einem Schritt 355. Das Gruppieren (clustering) kann in herkömmlicher Art und Weise ausgeführt sein einschließlich der Minimum-anstrebenden Gruppierungsverfahren, beschrieben in W.L.G. Koontz et al. IEEE Trans., Comp. C-12, 171 (1972). Andere Gruppierungsverfahren können in Zusammenhang mit der Erfindung verwendet werden. Im Folgenden wird beschrieben, dass das Anteilsmuster anschließend zur Identifizierung, Bestätigung, Kartierung und/oder Genotypisierung von Proben von Nukleinsäuren verwendet werden kann.
  • Im Schritt 357 wird eine Probe analysiert und eine Schätzgröße des Anteils der Allele in der Probe berechnet. Die Schätzgröße kann entsprechend zu dem Verfahren wie 6 gezeigt und oben beschrieben, berechnet werden. Die Schätzgröße des Anteils der Allele wird mit dem Anteilsmuster in Schritt 359 verglichen. Der Vergleich kann zur Identifizierung eines SNPs führen, sein Vorhandensein bestätigen, das Ziel kartieren und/oder die Probe (oder Individuum aus dem sie erhalten wurde) genotypisieren.
  • Es kann hilfreich sein, nun die Daten aus einem Experiment zu beschreiben, das erfindungsgemäß durchführt wurde. Ein Genotypisierungschip mit einer Struktur, die ähnlich zu der in 5 beschriebenen ist, wurde mit Proben aus 41 Individuen hybridisiert. Der Chip umfasste ungefähr 600 SNPs. 8 zeigt eine tabellarische Zusammenfassung der Ergebnisse des Experiments der ersten 45 SNPs.
  • Die Tabelle 375 umfasst mehrere Spalten bei dem die Spalte 376 die Anzahl des SNP ist (hier 1-45), die in der bezeichneten Zeile der Tabelle gezeigt ist. Die Spalte 377 ist der Name des SNPs (oder Marker). Wenn auch, um die Verwirrung zu vermindern, Nukleinsäuren diskutiert wurden mit nur einer Richtung, werden in den bevorzugten Ausführungsformen Proben der Nukleinsäuren und Sonden in Sinn- und Gegensinn-Strängen verwendet. Spalte 378 spezifiziert von welchem Strang die Daten mit „A" als Sinn-Strang und mit „Z" den Gegensinn-Strang präsentieren.
  • Spalte 379 zeigt die Anzahlt der Proben, die nicht für das bestimmte SNP (z.B. die Daten passierten keinen Qualitätsfilter) verwendet wurden. Spalte 380 zeigt die Anzahl von Individuen, die homozygot AA sind, Spalte 381 zeigt die Anzahl der Individuen, die heterozygot AB sind und Spalte 382 zeigt die Anzahl von Individuen an, die homozygot BB sind. Spalte 383 zeigt das Zentrum der Gruppen (cluster) in dem Anteilsmuster, das den Homozygoten AA Individuen entspricht, Spalte 384 zeigt das Zentrum der Gruppen (clusters) in dem Anteilsmuster, das den Heterozygoten AB Individuen entspricht und Spalte 385 zeigt das Zentrum der Gruppen (clusters) in dem Anteilsmuster, das den Homozygoten BB Individuen entspricht. Die Schätzgrößen der Anteile wurden mit 100 multipliziert, um Werte für das Anteilsmuster zu erhalten, die zur Vereinfachung im Bereich von ungefähr 0 bis 100 liegen.
  • Es kann erwartet werden, dass das Zentrum der Gruppen (clusters) für Homozygote AA Individuen bei 100 sein würde, das Zentrum der Gruppen (clusters) für die Heterozygoten AB Individuen bei 50 sein würde und das Zentrum der Gruppen (clusters) für Homozygote BB Individuen bei 0 sein würde. Eine sorgfältige Durchsicht von Tabelle 375 zeigt mit realen Daten, dass dieses selten der Fall ist. Die Reihe 391 zeigt sehr gute Daten in dem Zentrum der Gruppen (clusters) für Spalten 383-385 bei 99,48 und 1 ist, welches sehr nahe, zu dem was man erwarten würde ist. Allerdings umfasst Reihe 393 Daten, bei denen das Zentrum der Gruppen für die Spalten 383-385 bei 97, 71 und 10 ist, welches unterschiedlich ist von dem, was man wahrscheinlich erwarten würde.
  • Daten wie in der Reihe 393 gezeigt, erläutern, dass es möglicherweise nicht völlständig genau sein kann, gemäß einer strengen 100, 50 und 0 Skala zu genotypisieren. Das Anteilsmuster kann einzigartig für jede SNP sein. Zum Beispiel kann das Anteilsmuster das Ergebnis der speziellen Nukleinsäuresequenzen des SNPs, der Wechselwirkung der Nukleinsäuren während der Hybridisierung und dergleichen sein. Um eine Probe (oder ein Individuum) an dem SNP zu genotypisieren, der Reihe 393 entspricht, verwenden erfindungsgemäße Ausführungsformen das Anteilsmuster 97, 71 und 10. Entsprechend, wenn die Schätzgröße des Anteils der Allele in der Probe innerhalb eines vorbestimmten Bereiches von 71 liegt, ist die Probe heterozygot genotypisiert. Damit könnte eine Schätzgröße von 75 in einem Genotyp-Signal von Heterozygot führen, während die Verwendung einer 100, 50 oder 0 Skala wahrscheinlich zu keinem Signal oder falschem Signal führen kann.
  • Das Vorhandensein und die relativen Positionen der drei Gruppen können verwendet werden, um SNPs zu identifizieren und/zu bestätigen. SNPs können auch durch andere Techniken identifiziert und bestätigt werden, einschließlich der herkömmlichen gelbasierten Verfahren.
  • Die Reihe 395 zeigte allein zwei Gruppen (clusters), da es keine Gruppe für homozygot BB gibt. Dieses könnte die Folge davon sein, dass keine Probe eines Individuums, das homozygot BB ist verfügbar war. Allerdings können außergewöhnliche Gruppen-Muster auch zeigen, dass kein SNP an der Position vorliegt oder dass eine komplexere Mutation auftritt. Zum Beispiel kann eine einzelne Gruppe (cluster) anzeigen, dass kein SNP an der Position vorliegt, wohingegen eine Gruppierung (clustering) von mehr als drei Gruppen (cluster) mehr Unterschiede in den Nukleinsäuren als ein einzelner Polymorphismus anzeigen kann.
  • 9A9C erläutern die Anteilsmuster von den Reihen 391, 393 bzw. 395. Wie gezeigt erscheint 9A fast ideal (d.h. wie erwartet) in dem die Gruppen (clusters) deutlich voneinander getrennt sind. Allerdings zeigt 9B ein Anteilsmuster, das nur zwei Gruppen (cluster) aufweist, die ziemlich nahe zusammen sind. Schließlich zeigt 9C ein Anteilsmuster, das allein zwei Gruppen (clusters) hat. Die Größen der Gruppen (clusters) zeigt nicht die relative Anzahl der Proben innerhalb der Gruppe, werden aber dem Leser zur Erläuterung gezeigt, wie unterschiedlich das Zentrum der Gruppen (clusters) sein kann und wie die Anteilsmuster abhängig von dem SNP variieren können Die relative Änderung in den Anteilsmustern bei einem Individuum kann über die Zeit hinaus überwacht werden. Zum Beispiel kann ein SNP verursachender Tumor überwacht werden, um zu bestimmen ob die relativen Konzentrationen des Allels, das als verantwortlich für den Tumor angenommen wird, mit der Therapie abnehmen.
  • 10 zeigt ein Ablaufdiagramm für ein Verfahren zur Herstellung eines Einzelstrang-Genotyp-Signals. Im Schritt 401 kann eine Kontrolle ausgeführt werden, um zu bestimmen, ob zwei oder mehr Miniblöcke schlechte Daten hatten. Zum Beispiel bestanden zwei oder mehr Miniblöcke für das SNP nicht den Qualitätstest von Schritt 351 in 7. Wenn dort zwei oder mehrere Miniblöcke mit schlechten Daten in Schritt 403 vorlagen, ist das Genotypsignal „Versagen" in Schritt 405. Andernfalls kann eine Kontrolle durchgeführt werden, um zu bestimmen, ob das häufigste Genotypsignal aus den Miniblöcken einen Test oder Tests in Schritt 407 besteht. Obwohl die Kontrolle in Schritt 401 mit Bezug auf zwei oder mehr Miniblöcke beschrieben worden sind, kann diese Anzahl in Abhängigkeit von der Anwendung variieren. Allerdings, kann es von Vorteil sein, wenn die Anzahl der Miniblöcke für den Test proportional zu der Anzahl der Miniblöcke variiert wird (d.h. wenn die Anzahl der Miniblöcke zunimmt, so steigt auch die Anzahl, die an der Kontrolle beteiligt ist).
  • Ein Test kann n > (N –s)/2 sein, worin N gleich der Anzahl der Miniblöcke ist, n die Anzahl der Miniblöcke ist, die das häufigste Genotypsignal bilden und s die Anzahl der Miniblöcke mit schlechten Daten ist oder einen Qualitätstest nicht bestanden. Ein anderer Test kann m < 2 sein, wobei m gleich zu der Anzahl der Miniblöcke ist, die das zweithäufigste Genotypsignal bilden. Zusätzlich kann ein Test n – m ≥ (N – 2)/2 sein. Wenn die Miniblöcke nicht einen oder eine Kombination der Tests (z.B. sämtliche Gleichungen sind wahr) in Schritt 409 bestehen, ist das Genotypsignal „kein Signal" in Schritt 411. Andere Teste und Kombinationen von Tests können auch konstruiert und verwendet werden. Wenn die Miniblöcke den Test oder die Tests bestehen, ist das Genotypsignal das häufigste Genotypsignal, das durch die Miniblöcke im Schritt 413 erzeugt wird.
  • 11 zeigt ein Ablaufdiagramm eines Verfahrens zur Kombination von Strang-Genotypsignalen. Die multiplen Strang-Genotypsignale können durch ein in 10 gezeigtes Verfahren erzeugt werden. Zur Einfachheit wird das Ablaufdiagramm von 11 in Bezug auf zwei Stränge beschrieben. Allerdings kann das Verfahren vorteilhaft auf das Kombinieren von Genotypsignalen von mehr als zwei Strängen und auf Ergebnisse aus unterschiedlichen Experimenten angewandt werden.
  • In Schritt 451 kann eine Kontrolle durchgeführt werden, um zu bestimmen, ob beide Stränge ein „kein Signal" erzeugten. Wenn beide Stränge ein „kein Signal" in Schritt 453 erzeugten, ist das kombinierte Signal ein „kein Signal" in Schritt 455. Andernfalls kann eine Kontrolle durchgeführt werden, um zu bestimmen, ob ein Strang ein „kein Signal" erzeugte und der andere ein Genotypsignal (z.B. homozygot AA) erzeugte. Falls die Stränge ein gemischtes „kein Signal" Ergebnis aufwiesen, wird das Genotypsignal in Schritt 461 erzeugt.
  • Eine Kontrolle wird in Schritt 463 durchgeführt, um zu bestimmen, ob beide Stränge ein Genotypsignal erzeugen und im Signal übereinstimmen. Falls beide Stränge nicht das gleiche Genotypsignal erzeugen, ist das Signal ein „kein Signal" in Schritt 467. Andernfalls wird das Genotypsignal für beide Stränge als das übereinstimmende Genotypsignal in Schritt 469 erzeugt.
  • Erfindungsgemäße Ausführungsformen sind verwendet worden, um gleichzeitig 500 SNPs mit einem einzigen Genotypisierungschip zu genotypisieren. Siehe „Large-Scale Idenification, Mapping, and Genotyping of Single-Nucleotide Polymorhisms in the Human Genome," David G. Wang et al., Science, Band 280, Seiten 1077-1082, 15. Mai 1998. Die Ergebnisse zeigten die Durchführbarkeit der Identifizierung und Analyse von SNPs im großen Maßstab mit erfindungsgemäßen Ausführungsformen.
  • Während das vorstehende eine vollständige Beschreibung der bevorzugten Ausführungsformen der Erfindung ist, können verschiedene Alternativen, Modifikationen und Äquivalente verwendet werden. Es sollte offensichtlich sein, dass die Erfindung durch das Durchführen geeigneter Modifikationen der vorstehend beschriebenen Ausführungsformen gleichwertig anwendbar ist. Zum Beispiel ist die Erfindung beschrieben worden in Bezug auf Nukleinsäuresonden, die auf einem Chip synthetisiert worden sind. Allerdings kann die Erfindung vorteilhaft auf andere Monomere (z.B. Aminosäuren und Saccharide) und weitere Hybridisierungsverfahren angewandt werden, einschließlich jener, in denen die Sonden nicht mit einem Substrat verbunden sind. Deshalb sollte die vorstehende Beschreibung nicht als auf den Schutzbereich der Erfindung beschränkend aufgefasst werden, der durch den Umfang der beigefügten Ansprüche definiert wird.

Claims (5)

  1. Verfahren zur Genotypisierung einer Probe von Nukleinsäuren, umfassend: Erzeugen einer Anzahl Schätzgrößen für den Anteil des ersten und des zweiten Allels in einer Anzahl Referenzproben von Nukleinsäuren, wobei jede der Schätzgrößen berechnet wird durch Teilen eines ersten Referenzhybridisierungswerts, der die Hybridisierungsaffinität angibt der jeweiligen Referenzprobe von Nukleinsäuren an Nukleinsäuresonden, die komplementär zu einem Teil des ersten Allels sind bzw. eines zweiten Referenzhybridisierungswerts, der die Hybridisierungsaffinität angibt der jeweiligen Referenzprobe von Nukleinsäuren an Nukleinsäuresonden, die zu einem Teil des zweiten Allels komplementär sind, durch die Summe von ersten und zweiten Referenzhybridisierungswert; Clustern der Anzahl Schätzgrößen und Bildung eines Anteilsmusters, wobei jeder Cluster in dem Anteilsmuster einen Genotyp der Referenzproben der Nukleinsäuren darstellt; Berechnen einer Schätzgröße des Anteils der ersten und zweiten Allele in einer Probe von Nukleinsäuren durch ein Verfahren, welches die Schritte umfasst: Einsetzen eines ersten Hybridisierungswertes, der die Hybridisierungsaffinität der Probe von Nukleinsäuren an Nukleinsäuresonden angibt, die komplementär zu einem Teil des ersten Allels sind; Einsetzen eines zweiten Hybridisierungswertes, der die Hybridisierungsaffinität der Probe von Nukleinsäuren an Nukleinsäuresonden angibt, die komplementär zu einem Teil des zweiten Allels sind; und Berechnen der Schätzgröße des Anteils des ersten und des zweiten Allels in der Probe von Nukleinsäuren durch Teilen des ersten Hybridisierungswertes bzw. des zweiten Hybridisierungswertes durch die Summe des ersten und zweiten Referenzhybridisierungswerts; und Genotypisieren der Probe von Nukleinsäuren durch Vergleichen der Schätzgröße des Anteils des ersten und des zweiten Allels in der Probe der Nukleinsäuren mit dem Anteilsmuster in den Referenzproben.
  2. Verfahren nach Anspruch 1, wobei das Genotypisieren der Probe der Nukleinsäuren umfasst das Bestimmen, ob die Schätzgröße des Anteils der ersten und der zweiten Allele in einer Probe von Nukleinsäuren innerhalb eines vorbestimmten Bereichs einer Gruppe in dem Anteilsmuster ist.
  3. Verfahren nach Anspruch 1, wobei das Anteilsmuster eine Gruppe für ein homozygotes erstes Allel, heterozygote erste und zweite Allele und ein homozygotes zweites Allel umfasst.
  4. Verfahren nach Anspruch 1, das weiterhin das Identifizieren eines einzelnen Nukleotid-Polymorphismus an einer Abfrageposition bezogen auf die Anzahl von Gruppen in dem Anteilsmuster umfasst.
  5. Verfahren nach Anspruch 1, das weiterhin das Bestätigen umfasst, dass ein einzelner Nukleotidpolymorphismus an einer Abfrageposition bezogen auf die Anzahl der Gruppen in dem Anteilsmuster vorliegt.
DE69829493T 1997-09-05 1998-09-08 Techniken zur identifizierung, bestätigung, kartierung und kategorisierung von polymeren Expired - Lifetime DE69829493T2 (de)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US5795797P 1997-09-05 1997-09-05
US57957P 1997-09-05
US14881398A 1998-09-04 1998-09-04
US148813 1998-09-04
US14821098A 1998-09-05 1998-09-05
US148210 1998-09-05
PCT/US1998/018873 WO1999014369A1 (en) 1997-09-05 1998-09-08 Techniques for identifying, confirming, mapping and categorizing polymers

Publications (2)

Publication Number Publication Date
DE69829493D1 DE69829493D1 (de) 2005-04-28
DE69829493T2 true DE69829493T2 (de) 2005-07-28

Family

ID=27369361

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69829493T Expired - Lifetime DE69829493T2 (de) 1997-09-05 1998-09-08 Techniken zur identifizierung, bestätigung, kartierung und kategorisierung von polymeren

Country Status (7)

Country Link
EP (1) EP1019538B1 (de)
JP (1) JP2003532367A (de)
AT (1) ATE291638T1 (de)
AU (1) AU9476998A (de)
CA (1) CA2302193A1 (de)
DE (1) DE69829493T2 (de)
WO (1) WO1999014369A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1910556A4 (de) * 2004-07-20 2010-01-20 Conexio 4 Pty Ltd Verfahren und vorrichtung zur nukleinsäuresequenzanalyse
WO2017070096A1 (en) * 2015-10-18 2017-04-27 Affymetrix, Inc. Multiallelic genotyping of single nucleotide polymorphisms and indels

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5549805A (en) * 1984-03-29 1996-08-27 The Board Of Regents Of The University Of Nebraska Digital DNA typing
IS1355B6 (is) * 1984-11-12 1989-04-19 Lister Institute Of Preventive Medicine Fjölkjarna kannar
US6228575B1 (en) * 1996-02-08 2001-05-08 Affymetrix, Inc. Chip-based species identification and phenotypic characterization of microorganisms

Also Published As

Publication number Publication date
EP1019538A4 (de) 2002-08-21
JP2003532367A (ja) 2003-11-05
EP1019538A1 (de) 2000-07-19
DE69829493D1 (de) 2005-04-28
EP1019538B1 (de) 2005-03-23
CA2302193A1 (en) 1999-03-25
ATE291638T1 (de) 2005-04-15
AU9476998A (en) 1999-04-05
WO1999014369A1 (en) 1999-03-25

Similar Documents

Publication Publication Date Title
DE69827154T2 (de) Polymorphismuserkennung mit hilfe cluster-analyse
DE69627122T2 (de) Nachweis von Polymorphismus
DE69929542T2 (de) Komplexitätsmanagement und analyse genomischer dna
DE69827913T2 (de) Systeme und Verfahren zur Ausrichtung eines abgetasteten Bildes
DE69823206T2 (de) Verfahren zur herstellung einer bio-informatik-datenbank
DE69920032T2 (de) Methoden, software und apparate zur identifizierung genomischer bereiche, die ein gen umfassen, das mit einem nachweisbaren merkmal assoziiert ist
DE69733958T2 (de) Verfahren zur positionierung von klonen mittels molekularen kaemmens
US8204695B2 (en) Techniques for identifying, confirming, mapping, and categorizing polymers
DE69833758T2 (de) Verfahren zur erkennung von genpolymorphismen und allelexpression unter verwendung von sondenchips
DE68929299T3 (de) Multiple genomische DNA-Verstärkung zum Nachweis einer Deletion
DE60128720T2 (de) Mikroarray-verfahren zur genotypisierung mehrerer proben für mehrere loci
DE69535428T2 (de) Verfahren zum Auffinden von differentiel exprimierte Gene
Daw et al. Multipoint oligogenic analysis of age-at-onset data with applications to Alzheimer disease pedigrees
DE69936379T2 (de) Verfahren zur genotypisierung und dna-analyse
DE69830395T2 (de) Iterative resequenzierung
DE112005000293T5 (de) Gendetektions-Feldeffektvorrichtung und Verfahren zum Analysieren einer Genpolymorphie damit
WO1990004040A1 (de) Verfahren zur analyse von längenpolymorphismen in dna-bereichen
DE60038109T2 (de) Verfahren zur Analyse von AFLP Reaktionsmischungen unter Verwendung von Primer Verlängerungstechniken
DE102005015000A1 (de) Verfahren und System zur Analyse von arraybasierten Komparativhybridisierungsdaten
DE69829493T2 (de) Techniken zur identifizierung, bestätigung, kartierung und kategorisierung von polymeren
DE60023496T2 (de) Mathematische analyse für die schätzung von veränderungen des niveaus der gen-expression
DE69432316T2 (de) Automatische erbgut bestimmung
DE102004005497B4 (de) Diagnose von uniparentaler Disomie anhand von Single-Nukleotid-Polymorphismen
Belmont et al. Genome-wide linkage disequilibrium and haplotype maps
DE60103682T2 (de) Systeme und Verfahren zur Genexpressionsanalyse

Legal Events

Date Code Title Description
8364 No opposition during term of opposition