DE60126491T2 - Verfahren zur sequenzanalyse - Google Patents

Verfahren zur sequenzanalyse Download PDF

Info

Publication number
DE60126491T2
DE60126491T2 DE60126491T DE60126491T DE60126491T2 DE 60126491 T2 DE60126491 T2 DE 60126491T2 DE 60126491 T DE60126491 T DE 60126491T DE 60126491 T DE60126491 T DE 60126491T DE 60126491 T2 DE60126491 T2 DE 60126491T2
Authority
DE
Germany
Prior art keywords
sequence
template
reporter
base
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60126491T
Other languages
English (en)
Other versions
DE60126491D1 (de
Inventor
Raj Amersham ODEDRA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GE Healthcare UK Ltd
Original Assignee
GE Healthcare UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GE Healthcare UK Ltd filed Critical GE Healthcare UK Ltd
Publication of DE60126491D1 publication Critical patent/DE60126491D1/de
Application granted granted Critical
Publication of DE60126491T2 publication Critical patent/DE60126491T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf ein Sequenzierverfahren und auf eine Vorrichtung, die eine Fehlerkorrektur während des Sequenzierens individueller Moleküle ermöglicht.
  • Hintergrund der Erfindung
  • Sequenzieren wird routinemäßig ausgeführt durch das Verfahren der Kettentermination und Geltrennung, im wesentlichen wie beschrieben von Sanger, F., S. Nicklen und A. Coulson (Proc. Natl. Acad. Sci. USA, 1977. 74(12); S. 5463–7). Das Verfahren beruht auf der Erzeugung einer gemischten Population von DNA-Fragmenten, die Terminationen an jeder Base in der Sequenz repräsentieren. Die Sequenz wird dann bestimmt durch elektrophoretische Trennung dieser Fragmente.
  • Kürzliche Anstrengungen, um den Durchsatz des Sequenzierens zu vergrößern, resultierten in der Entwicklung alternativer Verfahren, die den elektrophoretischen Trennschritt eliminieren. Eine Anzahl dieser Verfahren nutzen Basen-Extension (d.h. Basen-Addition) und wurden beschrieben z.B. in WO 93/21340, US 5,302,509 und US 5,547,839 . In diesen Verfahren werden die Templates oder Primer auf einer festen Oberfläche immobilisiert, bevor sie Reagenzien ausgesetzt werden zum Sequenzieren. Die immobilisierten Moleküle werden in der Anwesenheit von Nukleotid-Analoga inkubiert, die eine Modifikation am 3'-Kohlenstoff des Zuckerrests besitzen, der die Hydroxylgruppe an jener Position reversibel blockiert. Der Einbau derartiger modifizierter Nukleotide durch eine Polymerase stellt sicher, dass nur ein Nukleotid während jedem Zyklus der Basenextension hinzugefügt wird. Die hinzugefügte Base wird dann aufgrund eines Markers detektiert, das in die 3'-Blockiergruppe eingebaut worden ist. Nach der Detektion wird die Blockiergruppe entfernt (oder „abgespalten"), typischerweise durch photochemische Mittel, um eine freie Hydroxylgruppe freizulegen, die zur Basen-Addition während des nächsten Zyklus verfügbar ist.
  • Im allgemeinen beruhen nicht auf Trennung basierende Ansätze auf der Anwesenheit einer großen Anzahl von Template-Molekülen für jede Zielsequenz, um eine Konsensus-Sequenz von einem gegebenen Ziel zu erzeugen. So können z.B. Basen-Extensions-Reaktionen auf mehrfache Templates angewandt werden durch Abfragen diskreter Spots von Nukleinsäure, von denen jeder eine Mehrzahl von Molekülen umfasst, immobilisiert in einem räumlich adressierbaren Array.
  • Jedoch neigen Reaktionen des/der Terminatoreinbaus/-abspaltung oder der Basen-Exzision zu Fehlern. Zum Beispiel haben, wie oben beschrieben, Basen-Extensions-Strategien im allgemeinen Nukleotid-Analoga genutzt, die die Funktionen eines Reportermoleküls, üblicherweise ein fluoreszierender Stoff, mit jenem eines Terminators kombinieren, der die 3'-Position auf der Zuckereinheit besetzt. Die voluminöse Natur der Gruppe und ihre Position macht diese Verbindung zu hoch-ineffizienten Substraten für Polymerasen. Zusätzlich unterliegt die Abspaltung der Terminatorgruppe, um nachfolgende Additionen zu erlauben, auch Ineffizienzen. Bei Vorhandensein von Tausenden, oder bevorzugt Millionen, von Molekülen für jedes Ziel führen sogar moderate Fehler von weniger als 5% zu einem kumulativen Verlust der Synchronität, zwischen der Vielzahl von Strängen, die jedes Molekül repräsentieren, innerhalb einer kleinen Anzahl von Zyklen. Daher steigt mit jedem Sequenzierzyklus das Untergrundrauschen progressiv mit einer nachfolgenden Verschlechterung des Signals mit jeder Addition. Dies bedeutet, dass die Anzahl von Basen der Sequenzdaten, die erhalten werden können, begrenzt ist, bevor das spezifische Signal ununterscheidbar vom Untergrund wird.
  • Kürzliche Fortschritte in Verfahren der Detektion von einzelnen Molekülen (beschrieben z.B. in Trabesinger, W. et al., Anal. Chem., 1999. 71(1); S. 279–83 und WO 00/06770) machen es möglich, Sequenzierstrategien auf einzelne Moleküle anzuwenden. Jedoch ist das Sequenzieren, wenn es auf klonale Populationen von Mole külen angewandt wird, ein stochastischer Prozess, der zu einigen Molekülen führt, die Reaktionen unterliegen, während andere unmodifiziert bleiben. Daher sind in herkömmlichen Sequenzierverfahren Fehler, wie Fehleinbauten normalerweise von ernsthafter Signifikanz, da die großen Zahlen vorhandener Moleküle sicherstellen, dass ein Konsenus-Signal erhalten wird. Wenn diese Reaktionen auf einzelne Moleküle angewandt werden, sind die Ausbeuten effektiv quantisiert.
  • Ein derartiges Sequenzierverfahren für ein einzelnes Molekül basiert auf Basen-Exzision und ist z.B. beschrieben in Hawkins, G. und L. Hoffman, Nature Biotechnology, 1997, Bd. 15; S. 803–804 und US 5,674,743 . Mit dieser Strategie werden einzelne Template-Moleküle derart erzeugt, dass jede Base mit einem geeigneten Reporter markiert ist. Die Template-Moleküle werden mit Exonuklease verdaut und die exzisierten Basen werden überwacht und identifiziert. Da diese Verfahren stark progressive Enzyme, wie Lambda-Exonuklease, nutzen, gibt es das Potenzial zum Analysieren großer Templates mehrerer Kilobasen in der Länge. Jedoch begrenzt das kontinuierliche Überwachen exzisierter Basen von jedem Template-Molekül in Echtzeit die Anzahl von Molekülen, die parallel analysiert werden können. Zusätzlich gibt es Schwierigkeiten beim Erzeugen eines Templates, wenn jede Base mit einem geeigneten Reporter derart markiert ist, dass exzisierte Basen auf der Basis intrinsischer, optischer oder chemischer Eigenschaften detektiert werden können.
  • Verfahren, die auf Basen-Extension (wie BASS) basieren, wurden auch an einen Einzel-Molekül-Ansatz angepasst.
  • Jedoch neigen diese Techniken zu Fehlern. Insbesondere kann der Einbau modifizierter Nukleotide fehlschlagen, z.B. als das Ergebnis einer verringerten Effizienz der Polymerase-Wirkung mit modifizierten Nukleotiden. Wo das Reportermolekül ein fluoreszierendes Molekül ist, können Fehler auch auftreten aufgrund eines Versagens der Floureszenz, weil der floureszierende Stoff verloren, beschädigt, gebleicht oder nicht angeregt ist. Auf dem Niveau des einzelnen Moleküls werden Fehler wie diese zu einem Fehler beim Erhalten der angemessenen Sequenz führen.
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein Sequenzierverfahren bereitzustellen, das ermöglicht, dass Fehler detektiert werden. Es ist eine weitere Aufgabe der vorliegenden Erfindung, eine Analyse und Fehlerprävention oder -korrektur durch Überwachen des Schicksals individueller Moleküle durch Sequenzierreaktionen zu ermöglichen.
  • Zusammenfassung der Erfindung
  • Die Erfindung ist in ihren verschiedenen Aspekten in den unabhängigen Ansprüchen unten definiert, auf die nun Bezug genommen werden sollte. Vorteilhafte Merkmale sind in den zugehörigen Ansprüchen dargelegt.
  • Kurz gefasst wird in einer bevorzugten Ausführungsform der Erfindung, die die Form eines Verfahrens zum Analysieren einer Nukleotidsequenz annimmt, eine Sequenz von Basen aus einem Template erhalten, und eine Base in der Sequenz wird als eine unbekannte Base identifiziert. Ein „unbekannter" Indikator ist in die Sequenz an der Position eingeschlossen, die der unbekannten Base entspricht, und eine Ausgabesequenz wird erzeugt, die den unbekannten Basen-Indikator enthält. In der bevorzugten Ausführungsform wird die Sequenz von Basen aus dem Template durch Bewertung eines Reporters und Zuordnen von Basen in Übereinstimmung damit erhalten. Eine Bestimmung wird in Bezug darauf ausgeführt, ob der Reporter aus einem vorhergehenden Zyklus der Basenbestimmung stammt, und falls der Reporter von einem vorhergehenden Zyklus der Basenbestimmung stammt, wird die Basenzuordnung verworfen.
  • Die zu analysierende Nukleotidsequenz kann eine RNA- oder DNA-Sequenz sein.
  • Kurze Beschreibung der Zeichnung
  • Die Erfindung wird nun detaillierter mittels eines Beispiels mit Bezugnahme auf die beigefügte Zeichnung beschrieben, in der:
  • 1 ein Flussdiagramm ist, das ein Verfahren zum Analysieren von Daten darstellt, die während einer Reaktion zum Bestimmen der Sequenz eines biologischen Moleküls, wie ein Nukleinsäuremolekül, erhalten werden, und eine bevorzugte Ausführungsform der Erfindung darstellt.
  • Detaillierte Beschreibung der bevorzugten Ausführungsform
  • 1 zeigt ein Flussdiagramm, das ein Verfahren zum Erhalten einer Sequenzinformation aus einem Template veranschaulicht. Das Verfahren berücksichtigt Fehler durch (a) Identifizieren von Basen, die von einem vorhergehenden Zyklus übertragen werden und (b) Detektieren von pausierenden Molekülen, die aus einem Fehler des Markierens oder des Fehleinbaus von Basen auftreten können. Das Datenanalyseverfahren nutzt eine Standard-Sequenzierreaktion, die ausgeführt wird wie folgt. Zuerst wird ein Nukleinsäuremolekül, für das Sequenzdaten erforderlich sind, ein Template, an eine feste Oberfläche, wie einen Objektträger, gebunden. Das Template kann derart markiert werden, dass seine Position bestimmt werden kann, wenn der Träger beispielsweise durch einen Fluoreszenzmikroskopscanner betrachtet wird. Die erste Base oder das erste Nukleotid, d.h. A, C, G oder T in der Sequenz des Templates wird durch eine chemische Reaktion abgefragt, die eine floureszierend markierte Base oder ein Tag hinzufügt, die/das jene Base repräsentiert. Diese kann eine beliebige sein von A, C, G oder T, oder alle vier von diesen, markiert mit vier verschiedenen unterscheidbaren Markern. Die erste Base im Template wird an ihre komplementäre Base in einer gut bekannten Weise binden; das heißt, A bindet an T und C bindet an G und vice versa. Der Baseneinbau kann bewirkt werden durch Strecken des Templates mit einem Polymeraseenzym oder durch Ligieren eines markierten Oligonukleotids mit einer Ligase. Der Einbau der markierten Base wird detektiert und ihre Identität wird bestimmt. Der Marker von jener Base wird dann entfernt. Diese Reihe von Schritten wird dann für die aufeinanderfolgenden Basen im Template wiederholt.
  • Geeignete Standard-Sequenzierreaktionen, die Basen-Addition/-Einbau beinhalten, umfassen Basen-Extensions-Reaktionen, wie jene beschrieben in WO 93/21340, US 5,302,509 und US 5,547,839 und Techniken, wie jene, die beschrieben sind US 5,763,175 , US 5,599,675 , US 5,856,093 und US 5,715,330 , in denen aufeinanderfolgende Runden des Sequenzierens die Basen-Exzision des Templates vor dem Einbau der nachfolgenden Basen beinhaltet.
  • Wenn diese Sequenzierreaktion ausgeführt wird, können Fehler auftreten. Zum Beispiel (i) kann eine Base falsch eingebaut werden, d.h. fehleingebaut werden, oder (ii) es kann fehlschlagen, einen Marker von einem Zyklus zu entfernen, bevor der nächste Zyklus ausgeführt wird, oder (iii) der Einbau einer Base in einem beliebigen Zyklus kann fehlschlagen. In der bevorzugten Ausführungsform der zu beschreibenden Erfindung werden die Daten von Sequenzreaktionen auf eine derartige Weise assimiliert, dass die Effekte dieser Fehler reduziert werden können.
  • Verfahren zur Abscheidung und Fixierung von Molekülen auf festen Phasen sind in der Technik gut bekannt. Verfahren zum Binden von Nukleinsäuren sind z.B. im Überblick zusammengestellt in Schena (Hrsg.), DNA-Microarrays: A Practical Approach, Oxford University Press (1999) ISBN: 0199637768. Typischerweise wird die feste Phase Glas sein, obwohl andere Materialien, wie amorphes oder kristallines Silizium oder Kunststoffe verwendet werden können.
  • Eine Mehrzahl von Molekülen können an die feste Phase in einem geordneten Array angebracht werden, aber bevorzugter können sie in einer willkürlichen Weise angebracht werden. Eine willkürliche Anbringung von Molekülen kann eine beliebige Anzahl von Molekülen umfassen, bevorzugt verteilt bei einer Dichte, die für die optische Auflösung der Sequenzinformation geeignet ist.
  • Eine geeignete Reportereinheit kann eine beliebige von verschiedenen bekannten Reporter-Systemen sein. Sie kann ein Radioisotop sein, mittels dem das eingebaute Nukleosid-Analogon leicht detektierbar gemacht wird, z.B. 32P, 33P, 35S, eingebaut in eine Phosphat- oder Thiophosphat- oder H-Phosphonat-Gruppe oder alternativ 3H oder 1 4C oder ein Iod-Isotop. Sie kann ein Isotop sein, das durch Massenspektrometrie oder NMR detektierbar ist. Sie kann eine Signaleinheit sein, z.B. ein Enzym, Hapten, Fluorophor, Chromophor, chemilumineszente Gruppe, Raman-Marker, elektrochemischer Marker oder eine Signalverbindung, die angepasst ist zur Detektion durch Massenspektrometrie.
  • Jeder Sequenzierschritt wird zum Anbringen von Reportermolekülen an individuellen Templates führen, und die Detektion der eingebauten Reportereinheit wird ermöglichen, die Identität der Base zuzuordnen. Im Falle von fluoreszierenden Reportern werden diese Moleküle dann identifiziert durch z.B. Fluoreszenzmikroskopie (z.B. unter Verwenden eines PMT oder CCD) und die Fluoreszenz-Eigenschaft des Reporters wird die Zuordnung der Identität an die Base erlauben, die in der Sequenzierreaktion eingebaut wurde.
  • Um Daten von sequentiellen Runden der Sequenzierzyklen zu sammeln, muss das Template lokalisiert sein. Dies kann erreicht werden gleichzeitig mit dem ersten Zyklus des Sequenzierens, bei dem das Reportermolekül in der ersten Base eine Template-Position identifiziert, oder das Template und/oder der Primer kann selbst mit einer Reportereinheit derart markiert sein, dass seine Position auf der festen Phase vor der Sequenz-Zyklisierungs-Reaktion detektiert werden kann. Das Bekanntsein der Position jedes Template-Moleküls macht es möglich, den Zustand jedes Moleküls zu überwachen und alle nachfolgenden Ereignisse während der Zyklen des Sequenzierens zu verfolgen. Ein nachfolgendes Fehlschlagen der Addition manifestiert sich beispielsweise selbst durch einen Mangel an Fluoreszenz an einer Position, für die bekannt ist, dass sie ein Template enthält. Ein Fehler des Reporters aufgrund entweder eines Mangels an Stimulus oder einer chemischen Beschädigung kann auch bestimmt werden, sobald die Position des Templates bestimmt worden ist. Diese fehlgeschlagenen Reaktionen können verfolgt und in der Endsequenz behandelt werden als mögliche Lücken aufgrund des Reporter-Fehlers. Falls diese Moleküle die Teilnahme in nachfolgenden Zyklen wieder aufnehmen, kann dies auch ver folgt werden und eine bedeutungsvolle Sequenz erhalten werden. Individuelle Punkte von einzelnen Basenlücken können identifiziert werden, und, wo mehrfache identische Sequenzen auf der festen Oberfläche in einem Array angeordnet worden sind, kann eine Konsensus-Sequenz aufgebaut werden durch Vergleiche mit Referenz-Strängen, wie Sequenzen anderer Kopien von Templates im Sequenzierarray. Alternativ können einzelne Basenlücken identifiziert werden, durch Vergleichen mit einem Referenzstrang, der die bekannte Sequenz sein kann (z.B. in der Anwendung dieser Technik auf Mutationsdetektion).
  • So haben wir anerkannt, dass es in diesem System möglich ist, Fehler zu korrigieren, insbesondere Fehler, die mit einer Sequenzierung von einzelnen Molekülen zusammenhängt. Fehler, die korrigiert werden müssen, sind Fehler der Reporterabspaltung und -eliminierung vor dem nächsten Zyklus, Fehler des Einbaus, ein Schaden am Reporter (z.B. ein Schaden am fluoreszierenden Stoff), und der Fehleinbau.
  • Sobald lokalisiert, werden alle Sequenzierzyklus-Ergebnisse für das lokalisierte Molekül messbar sein. Verwenden zweier Sätze von Nukleotid-Analoga ermöglicht die Identifizierung des Reporters, der von dem vorherigen Zyklus übertragen worden ist. Das Wiederauftreten eines Reporters vom vorherigen Zyklus kann daher identifiziert und überwacht werden.
  • Das Kennen der Position des Template-Moleküls ermöglicht auch die Identifizierung von Templates, die nicht erstreckt worden zu sein scheinen. Wie oben diskutiert, kann ein Fehlschlag des Beobachtens eine Reportermoleküls auf einem Mangel eines Einbaus beruhen, kann aber auch auf einem Schaden an der Reportereinheit beruhen. Jedoch ist, da das Vorhandensein von beschädigten Molekülen effektiv minimiert werden kann durch einen Reinigungsprozess während der Synthese von modifizierten Nukleotiden, wo Abbauprodukte und Produkte von Nebenreaktionen identifiziert und elminiert werden können, die Abwesenheit von Fluoreszenz deshalb wahrscheinlicher ein Ergebnis eines Fehlschlags, ein modifiziertes Nukleotid einzubauen.
  • Falls nach einem beliebigen Sequenzierzyklus ein Template-Molekül mit keinerlei Reportern verbunden ist, wird die Sequenz demgemäß an diesem Punkt markiert, um eine „Pause" anzuzeigen. In der nächsten Runde des Sequenzierens kann das Template-Molekül dann mit einem Reporter verbunden werden, d.h. das „pausierende" Molekül nimmt die Extension wieder auf, und ermöglicht, dass Sequenzdaten erhalten werden. Jedoch kann dem Template-Molekül fortdauernd eine Verbindung mit beliebigen Reportern für mehr als einen Zyklus fehlen, und die Sequenz wird markiert werden als eine Pause für jeden jeweiligen Zyklus.
  • Ein Positionsmarker, der während des Sequenzierens erzeugt wird, wird nützlich sein zum Interpretieren von Lücken in Anordnungen, wenn er mit der Sequenz verglichen wird, die mit Referenzsequenzen erzeugt wird, oder mit anderen Sequenzen, die während der Sequenzierprozedur erzeugt sind unter Verwenden von einem der Anordnungsalgorithmen, die jenen Fachleuten bekannt sind.
  • Es ist möglich, Positionen des Fehleinbaus vorherzusagen unter Bekanntsein der inhärenten Eigenschaften der entsprechenden verwendeten Polymerasen und Ligasen. Zum Beispiel ist es jenen Praktikern in der Technik bekannt, dass Primersequenzen, die eine nicht übereinstimmende terminale Base enthalten, schlechtere Templates für Polymerasen sind, mit Extensions-Effizienzen von zwischen 102 bis 106-fach geringer als übereinstimmende Sequenzen (siehe Huang, M., N. Anheim und M. Goodman, Nucleic Acid Res. 1992. 20(17): S. 4567–73, Tindall KR, K.T., Biobechmistry, 1988. 27(16); S. 6008–13, Esteban, J., M. Salas und L. Blanco, J. Biol. Chem., 1993. 268(4): S. 2719–26. Moleküle, die mehrere Zyklen oder bis zum Ende des Sequenzierprotokolls pausierend bleiben, besitzen deswegen eine höhere Wahrscheinlichkeit, dass sie eine terminale Fehlübereinstimmung enthalten. Templates, die derartige Pausen durchlaufen, werden deshalb an der letzten Basenabrufposition als potentielle Terminationen aufgrund von Fehlübereinstimmungen mit einer Markierung versehen. Die Identifizierung des sequenzierten Fragments wird dann erreicht durch Anordnung an einer Referenzsequenz oder anderen sequenzierten Templates von derselben Probe. Fehlübereinstimmungen, die an markierten Positio nen auftreten, sind wahrscheinlicher das Ergebnis eines Fehleinbaus, als dass sie die wahre Sequenz repräsentieren, und können deshalb dementsprechend interpretiert werden.
  • Die Anzahl von Zyklen, für die ein Template-Molekül pausiert, kann gezählt werden durch aufeinanderfolgende Detektion eines Mangels an eingebautem Reporter. Eine Schwelle für die Wahrscheinlichkeit sukzessiver Pausen, die zufällig resultieren, kann gesetzt werden während der Analyse der Sequenzdaten. Die Schwelle, über der sukzessive Pausen klassifiziert werden können als Ergebnis einer Fehlübereinstimmung, wird abhängen von der Effizienz des Markierens entweder durch Polymerase-abhängige Basen-Extension oder durch Sequenz-abhängige Ligation. Zum Beispiel werden, falls die Schwelle für die Wahrscheinlichkeit sukzessiver Pausen, die zufällig resultieren, auf 1 × 10–6% gesetzt ist, die folgenden Anzahlen von Pausen gezählt werden, was verschiedene Effizienzen des Markierens berücksichtigt, bevor die Pause als eine Fehlübereinstimmung gezählt wird.
    Figure 00110001
  • Für eine größere Sicherheit kann der Schwellenwert angemessen vergrößert werden. Der Grad der erforderlichen Sicherheit wird abhängen von der Toleranz der Sequenzieranwendung; eine weniger stringente Schwelle kann toleriert werden, falls es das Ziel ist, einfach die Template-Fragmente zu identifizieren, eher als Sequenzdifferenzen präzise zu bestimmen. Der Effekt einer geringeren Effizienz des Markereinbaus kann auch verschoben werden durch den Grad der Sequenzierredundanz. Die Wahrscheinlichkeit eines Fehleinbaus wird in diesem Fall statistisch behandelt.
  • Eine Bildgebung und Lokalisierung einzelner Moleküle, hauptsächlich durch Fluoreszenz, ist jenen Fachleuten geläufig (s. Trabesinger, W. et al., Anal. Chem., 1999. 71(1): S. 279-83, Harms, G. et al., Biophys. J. 1999. 177: S. 2864–2870, Deschryver, F., Pure & Appl. Chem, 1998. 70: S. 2147–2156, Bartko, A. und R. Dickson, J. Phys. Chem. B, 1999. 103: S. 11237–11241). Datenfiles, die Information enthalten in Hinblick auf die Position und den Typ des Markers, werden deshalb einfach erzeugt. In einer Ausführungsform der Erfindung wird die Analyse von Sequenzdaten am Ende der Sequenzierprozedur ausgeführt und nachdem all die Sequenzierdaten aufgenommen worden sind. Diese Daten können in einem oder mehreren Files analysiert werden, um die Positionen der Templates zu bestimmen und irgendwelche an diesen Positionen angebrachten Reporter zu identifizieren. Derartige Daten werden dann einer zweiten Analyse unterzogen, um Sequzenzen für alle lokalisierten Templates zu bilden.
  • Bevorzugt werden Zyklen einer Sequenzierreaktion und Datenanalyse gleichzeitig ausgeführt. In diesem Fall werden Daten, die von jedem Zyklus erzeugt werden, analysiert, um Reportermoleküle zu lokalisieren, diese Positionen werden dann mit Positionen der Templates korreliert. Die Sequenzen für jedes lokalisierte Template können dann weitergebildet werden mit jedem sukzessiven Zyklus.
  • Die bevorzugte Prozedur, die die Erfindung verkörpert, wird nun mit Bezugnahme auf 1 beschrieben.
  • In dem System, das in 1 dargestellt ist, sind zu sequenzierende Moleküle auf festen Phasen durch Standardprozeduren fixiert worden, wie in der Technik beschrieben (im Überblick in Schena (Hrsg.), DNA Microarrays: A practical approach, Oxford University Press (1999) ISBN 0199637768). Das Template, gebunden an eine feste Oberfläche, wie ein Objektträger, ist markiert, so dass seine Position bestimmt werden kann, wenn der Träger beispielsweise durch einen Fluoreszenzmikroskopscanner betrachtet wird. Beim Schritt 10 wird ein relevantes Template zuerst lokalisiert.
  • Sequenzierreaktionen, die Basen-Einbau beinhalten, der durch Erstrecken des Templates mit einem Polymerase-Enzym oder durch Ligieren eines markierten Oligonukleotids mit einer Ligase bewirkt werden kann, werden nun ausgeführt (Schritt 12).
  • Wie oben beschrieben wird der Sequenzierschritt zum Anbringen eines Reportermoleküls an der ersten Base in der Sequenz des Templates führen, und die Detektion der Reportereinheit, die eingebaut ist, erlaubt es, die Identität der Base zuzuordnen, Schritt 14. Der nächste Schritt, Schritt 16, dient zum Korrelieren der Basen- und Template-Positionen; bei diesem ersten Zyklus ist dies ein trivialer Schritt. Eine Bestimmung wird dann ausgeführt, ob das Template-Molekül mit einem Reporter verbunden ist. Das soll heißen, in Schritt 18 wird ein Test ausgeführt, ob das betreffende Template einen Reporter besitzt oder nicht. Falls nach dem Sequenzierbetrieb das Template mit einem Reporter verbunden ist, läuft die Prozedur weiter zu Schritt 20. Hier wird ein Test ausgeführt, um zu bestimmen, ob der Reporter aus einem vorherigen Zyklus kommt. Falls nicht, wird er dann identifiziert und eine neue Base zugeordnet, Schritt 22. So ist die Base korrekt identifiziert worden und alles ist gut.
  • Die Prozedur läuft dann zu Schritt 24, bei dem ein Test ausgeführt wird, ob es irgendwelche weiteren Templates gibt. Falls ja, wiederholt sich die Prozedur von Schritt 18.
  • Falls in Schritt 20 bestimmt wird, dass der mit der Base verbundene Reporter aus einem vorherigen Zyklus stammt, wird keine Base zugeordnet, Schritt 26, und die Prozedur geht gleich zu Schritt 24 und zu dem nächsten Template, falls vorhanden.
  • Falls in Schritt 18 gefunden wird, dass das Template keinen Reporter aufweist, wird in Schritt 50 eine Überprüfung ausgeführt, ob das Nicht-Übereinstimmungs-Flag aktiv ist. Das Nicht-Übereinstimmungs-Flag wird aktiviert, wenn die Anzahl von aufeinanderfolgenden Pausen das vorbestimmte Maximum überschreitet, gemäß eines Tests, der bei Schritt 30 ausgeführt wird. Falls das Nicht-Übereinstimmungs-Flag nicht aktiv ist, läuft die Prozedur zu Schritt 28 und eine Pause P wird in die Sequenz eingefügt. Auch wird ein Pausen-Zähler, der die Anzahl von aufeinanderfolgenden Pausen, die auftreten, überwacht, um eins erhöht. Ein Test wird in Schritt 30 ausgeführt, um zu bestimmen, ob die Anzahl von aufeinanderfolgenden Pausen einen vorbestimmten Schwellenwert oder einen vorbestimmten Maximalwert überschreitet. Falls sie es nicht tut, läuft die Prozedur zu Schritt 24, wobei die Pause in der Sequenz belassen wird. Falls die Anzahl von aufeinanderfolgenden Pausen das vorbestimmte Maximum überschreitet, wird die vorhergehende Base als fehlübereinstimmend eingestuft, und das Nicht-Übereinstimmungs-Flag wird aktiviert, Schritt 32, und die Prozedur läuft dann zu Schritt 24.
  • Der Pausenindikator liefert die Funktion des Bereitstellens einer Anzeige einer unbekannten Base. Diese kann sich herausstellen als eine beliebige von den Basen A, C, G und T, oder kann sich tatsächlich herausstellen als überhaupt keine Base. Durch Bereitstellen der Möglichkeit einer unbekannten Base wird die Information für jenes Template nicht vollständig verworfen.
  • Eher wird sie noch verwendet, z.B. mit Bezugnahme auf eine Referenzsequenz, wie in den Beispielen unten beschrieben.
  • Falls in Schritt 20 bestimmt wird, dass der Reporter von einem vorherigen Zyklus stammt, wird in Schritt 52 eine Überprüfung ausgeführt, ob das Nicht-Übereinstimmungs-Flag aktiv ist. Falls das Nicht-Übereinstimmungs-Flag nicht aktiv ist, läuft die Prozedur zu Schritt 22 und eine Base wird zugeordnet. Die Prozedur läuft dann zu Schritt 24, um zu bestimmen, ob es ein anderes Template zur Verarbeitung gibt.
  • Falls das Nicht-Übereinstimmungs-Flag aktiv ist, wird bei Schritt 54 die zuvor zugeordnete Base ersetzt mit einem IUB-Code, der alle anderen Basen repräsentiert, mit Ausnahme jener, die nicht in Übereinstimmung gebracht wurde. Dies beruht darauf, dass, falls die vorherige Base „C"-markiert war, aber als fehlübereinstimmend bekannt ist, es klar ist, dass die Base entweder A, G oder T ist.
  • Wenn es keine weiteren Templates gibt, besitzt der Test bei Schritt 24 das Ergebnis NEIN, und die Prozedur läuft zu Schritt 34, wo eine Bestimmung ausgeführt wird, ob es irgendwelche weiteren zu vervollständigenden Zyklen gibt, d.h. ob es irgendwelche weiteren Base für jenes Molekül gibt. Falls es sie gibt, läuft die Prozedur zu den Daten für den nächsten Zyklus, Schritt 36, nachdem die Verarbeitung wieder von Schritt 16 voranschreitet, mit einer Korrelation der Basen- und Template-Positionen.
  • Schließlich wird der Test bei Schritt 34 das Ergebnis NEIN besitzen, und das führt zum Ende der Prozedur, Schritt 38.
  • Es kann eine nachfolgende Verarbeitung geben, die auf die Sequenz angewandt wird, wie sie vom System der 1 erzeugt ist, z.B., um die Sequenz, die durch das Verfahren gefunden wurde, mit einer Referenzsequenz zu vergleichen. Beispiele davon sind unten beschrieben.
  • Die in 1 gezeigten Schritte, nachfolgend zu den Schritten 10 bis 14, die chemische Reaktionen beinhalten, werden auf einem digitalen Computer, wie einen Personal Computer (PC) implementiert. Zwei Beispiele sind detaillierter mittels eines Pseudocodes im Anhang zu dieser Beschreibung gezeigt. Der erste Pseudocode nimmt an, dass die Nukleotide von einer Mischung aller vier Basen A, C, G und T abgefragt werden, und der zweite Pseudocode ist für eine Verwendung gedacht, wenn die vier Basen getrennt in der Sequenz verwendet werden.
  • Die vorliegende Erfindung besitzt viele Anwendungen, von denen einige hier angegeben sind.
  • Zum Beispiel kann die Sequenz von DNA- und RNA-Genomen bestimmt werden unter Verwenden dieses Verfahrens. Ferner können Sequenz-Variationen in Bereichen von oder gesamte Genome, mRNA-Repräsentationen von Bereichen von oder gesamte Genome oder in künstlich erzeugten Repräsentationen eines Genoms (z.B. PCR-Produkte von Bereichen eines Genoms), die von Substitutionen, Deletionen oder Insertionen einer oder mehrerer Basen resultieren, identifiziert werden.
  • Die vorliegende Erfindung besitzt eine Anwendung im Haplotyping (Bestimmen von Sequenzdifferenzen zwischen Chromosomenpaaren in einem Individuum) und auch in der quantitativen mRNA-Expressionsanalyse, z.B. beim Vergleichen von Niveaus der mRNA-Expression zwischen Proben, die von verschiedenen Zelltypen (Geweben) oder verschieden behandelten Zellen abgeleitet sind. Diese Technik kann auch angewandt werden, um Sequenzen zu identifizieren, die von pathogenen Genomen abgeleitet sind, zur Verwendung in der Pathogen-Detektion und -Identifizierung.
  • Es werden nun Beispiele der Weise angegeben, auf die spezifische Sequenzen durch das System auf eine derartige Weise gehandhabt werden, damit Fehler in der bestimmten Sequenz verringert werden.
  • Beispiel 1
  • Die folgende Sequenz ist erhalten von einer Sequenzierreaktion:
    GATCGGCTGACCATGGAC1
    wobei 1 anzeigt, dass T eingebaut worden ist (und 2=C, 3=A, 4=G).
  • Ein Fehler einer weiteren Erstreckung für die Schwellenzahl von Zyklen führt zum Markieren der Sequenz, um anzuzeigen, dass eine Base fehleingebaut worden ist, vor der Schwellenzahl von Pausen. Hier zeigt 1 (eins) an, dass ein T vor einer Anzahl von Pausen über dem vorbestimmten Schwellenniveau eingebaut worden ist, und daher wahrscheinlich fehleingebaut worden ist. Die Sequenz kann deshalb verworfen werden. Es wird auf 1 Bezug genommen; die Prozedur folgt dem Weg 28, 30 für eine vorbestimmte Anzahl von Schritten, bis ein JA bei Schritt 30 ausgegeben wird, und die vorhergehende Base wird als fehlübereinstimmend in Schritt 32 markiert. Statt einer 1 werden für die anderen Basen 2 oder 3 oder 4 verwendet, wobei 2 ein C anzeigt, 3 ein A anzeigt und 4 ein G anzeigt.
  • Beispiel 2
  • Die folgenden Sequenzen sind erhalten von einer Sequenzierreaktion. Die erste ist eine neu bestimmte Sequenz und die zweite ist eine Referenzsequenz:
    GATCGGCTGACCATGGACC1CTGACAGT
    GATCGGCTGACCATGGACCTCTGACAGT
  • Das Pausieren länger als die Schwellenzahl von Zyklen zeigt eine 1 für T als Fehleinbau. In diesem Fall wurde das Sequenzieren nach der Schwellenzahl von Sequenzen wieder aufgenommen. Wenn die erhaltene Sequenz mit der Referenzsequenz verglichen wird, zeigt eine Sequenzanordnung eine T.1-Anordnung an der Pausenposition. Sie kann deshalb unberücksichtigt gelassen werden als eine tatsächliche Basendifferenz mit der Referenzsequenz. Die Sequenzanordnung repräsentiert eine Stufe zusätzlich zur Verarbeitung, die in 1 dargestellt ist.
  • Beispiel 3
  • Wenn eine Pause während des Sequenzierens gezählt wird, wird ihre Position als P markiert. Falls die folgenden neuen und Referenzsequenzen erhalten werden:
    GATCGGCTGACCATGGAPCCTCTGACAGT
    GATCGGCTGACCATGGACCTCTGACAGT
    zeigt eine Sequenzanordnung mit der Referenzsequenz bei Vorhandensein oder Abwesenheit einer Lücke an der Position, die mit einem P markiert ist, dass sie eine Pause war. Die gesamte Sequenz ist daher kontinuierlich und nützlich. Die Sequenzanordnung repräsentiert wieder eine Stufe zusätzlich zu der in 1 dargestellten Verarbeitung.
  • Beispiel 4
  • Die folgende Sequenz ist erhalten in einer Sequenzierreaktion:
    GATCGGCTGACCATGGPCCTCTGACAGT
    GATCGGCTGACCATGGACCTCTGACAGT
  • Die als P markierte Position ist der Einbau einer Base mit einem fehlerhaften Reporter. Sequenzanordnung mit einer Referenzsequenz bei Vorhandensein oder Abwesenheit einer Lücke an der markierten Position zeigt, dass diese eine Lücke in der Sequenz repräsentiert. Die extrahierte Sequenz bleibt nützlich. In diesem Fall kann das P mit einem „N" substituiert werden, um eine Lücke in der Sequenz zu kennzeichnen. Die Sequenzanordnung repräsentiert wieder eine Stufe zusätzlich zu der in 1 dargestellten Verarbeitung.
  • Anhang Erster Pseudocode
  • Beispiel eines Pseudocodes für eine Sequenzgruppe nach Abschluss der Sequenzierreaktionen.
  • Figure 00190001
  • Zweiter Pseudocode Pseudocode für sequentielles Sequenzieren von einzelnen Basen
    Figure 00200001

Claims (8)

  1. Verfahren zum Bestimmen der Sequenz einer Nukleinsäure, bei dem sequentiell Nukleotide an einen Primer oder ein Template hinzugefügt werden, wobei das Template an einen festen Träger gebunden ist, umfassend die Schritte a) Hybridisieren eines Primers an das Template, wobei das Template die Nukleinsäure umfasst, für die die Sequenz erforderlich ist, um einen Template-Primer-Komplex zu bilden, b) Zuordnen von einem oder mehreren markierten Nukleotiden, umfassend eine oder mehrere von A, C, G oder T, und Strecken des Primers durch eine DNA-Polymerase oder eine Ligase durch Versuchen, die einzeln markierten Nukleotide hinzuzufügen, wobei das Markieren durch eine Reportereinheit bereitgestellt wird, c) Bestimmen des Typs oder der Identität des Reporter-markierten Nukleotids, das an den Primer hinzugefügt wurde, um so ein Nukleotid in der Sequenz des Templates zu identifizieren, d) Entfernen oder Neutralisieren der Reportereinheit, e) Wiederholen der Schritte b) bis d) sequentiell in jedem der folgenden Zyklen und Aufnehmen der Ordnung des Einbaus von Reportermarkierten Nukleotiden, f) Bestimmen, ob eine Reportereinheit detektierbar ist in Schritt c) jedes Zyklus, g) falls die Reportereinheit nicht in Schritt c) jedes Zyklus detektierbar ist, Einführen eines Pausenindikators in der Sequenz, um eine Anzeige einer unbekannten Base bereitzustellen, h) falls die Reportereinheit nicht detektierbar ist, Bestimmen, falls die Anzahl von aufeinanderfolgenden Pausenindikatoren eine vorbestimmte Schwelle überschreitet, und, falls es so ist, Zuordnen eines Nicht-Übereinstimmungs-Flags, i) falls die Reportereinheit in Schritt c) detektierbar ist, und nicht in der vorhergehenden Iteration der Schritte b) bis d) identifiziert worden ist, oder falls kein Nicht-Übereinstimmungs-Flag detektiert wird, Zuordnen der entsprechenden Base zur Sequenz j) falls die Reportereinheit in Schritt c) detektierbar ist und in der vorhergehenden Iteration der Schritte b) bis d) identifiziert worden ist und falls das Nicht-Übereinstimmungs-Flag detektiert wird, Ersetzen der zuvor zugeordneten Base mit einem IUB-Code für alle anderen Basen und k) falls die Reportereinheit nicht in Schritt c) detektierbar ist, und falls die Abwesenheit der Reportereinheit für weniger als eine vorbestimmte Schwellenzahl von einer oder mehreren Iterationen der Schritte b) bis d) beobachtet wird, wird das Nukleotid entsprechend dem Reporter in der aktuellen Iteration der Schritte b) bis d) in die Sequenz fortlaufend an die zuvor eingebaute Base eingebaut.
  2. Verfahren nach Anspruch 1, bei dem ein Positionsmarker an die Sequenz zwischen dem Nukleotid, das in der aktuellen Iteration von b) bis d) eingebaut wird, und dem Nukleotid, das diesem vorangeht, annotiert wird, um eine mögliche Lücke in der Sequenz anzuzeigen.
  3. Verfahren nach Anspruch 1 oder 2, umfassend zusätzlich den Schritt des Bestimmens der Position des Templates durch Detektieren des Ortes der Reportereinheit.
  4. Verfahren nach Anspruch 3, bei dem der Ort des Templates bestimmt wird durch Detektieren einer Reportereinheit, die an das Template gebunden ist.
  5. Verfahren nach Anspruch 3, bei dem der Ort des Templates bestimmt wird durch Detektieren einer Reportereinheit, die an den Primer gebunden ist.
  6. Verfahren nach Anspruch 1, bei dem eine beliebige nachfolgende Addition als eine Fortsetzung der Sequenz bestimmt ist.
  7. Verfahren nach Anspruch 6, bei dem ein Positionsmarker an die Sequenz zwischen dem Nukleotid, das in der aktuellen Iteration von b) bis d) eingebaut wird, und dem Nukleotid, dass diesem vorangeht, annotiert wird, um eine mögliche Lücke in der Sequenz anzuzeigen.
  8. Computerprogrammcode-Mittel zum Ausführen all der Schritte nach einem der Ansprüche 1 bis 7, wenn das Programm auf einem Computer ausgeführt wird.
DE60126491T 2000-07-05 2001-07-02 Verfahren zur sequenzanalyse Expired - Fee Related DE60126491T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB0016472.3A GB0016472D0 (en) 2000-07-05 2000-07-05 Sequencing method and apparatus
GB0016472 2000-07-05
PCT/GB2001/002985 WO2002003305A2 (en) 2000-07-05 2001-07-02 Method and apparatus for sequence analysis

Publications (2)

Publication Number Publication Date
DE60126491D1 DE60126491D1 (de) 2007-03-22
DE60126491T2 true DE60126491T2 (de) 2007-11-15

Family

ID=9895041

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60126491T Expired - Fee Related DE60126491T2 (de) 2000-07-05 2001-07-02 Verfahren zur sequenzanalyse

Country Status (11)

Country Link
US (1) US7133782B2 (de)
EP (1) EP1297484B1 (de)
JP (1) JP2004501669A (de)
AT (1) ATE353455T1 (de)
AU (1) AU2001270760A1 (de)
CA (1) CA2412973A1 (de)
DE (1) DE60126491T2 (de)
ES (1) ES2281426T3 (de)
GB (1) GB0016472D0 (de)
IL (1) IL153472A0 (de)
WO (1) WO2002003305A2 (de)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
AU2002227156A1 (en) 2000-12-01 2002-06-11 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
EP1716254B1 (de) 2004-02-19 2010-04-07 Helicos Biosciences Corporation Verfahren zur analyse von polynukleotidsequenzen
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US7805081B2 (en) * 2005-08-11 2010-09-28 Pacific Biosciences Of California, Inc. Methods and systems for monitoring multiple optical signals from a single source
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
US7405281B2 (en) * 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US7763423B2 (en) * 2005-09-30 2010-07-27 Pacific Biosciences Of California, Inc. Substrates having low density reactive groups for monitoring enzyme activity
US7998717B2 (en) 2005-12-02 2011-08-16 Pacific Biosciences Of California, Inc. Mitigation of photodamage in analytical reactions
US7715001B2 (en) * 2006-02-13 2010-05-11 Pacific Biosciences Of California, Inc. Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US7995202B2 (en) * 2006-02-13 2011-08-09 Pacific Biosciences Of California, Inc. Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US7692783B2 (en) * 2006-02-13 2010-04-06 Pacific Biosciences Of California Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US8364417B2 (en) 2007-02-15 2013-01-29 454 Life Sciences Corporation System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm
EP2578702A1 (de) * 2006-02-16 2013-04-10 454 Life Sciences Corporation System Und Verfahren Zur Korrektur Von Primerextensionsfehlern Bei Nukleinsäuresequenzdaten
US8975216B2 (en) * 2006-03-30 2015-03-10 Pacific Biosciences Of California Articles having localized molecules disposed thereon and methods of producing same
US20080050747A1 (en) * 2006-03-30 2008-02-28 Pacific Biosciences Of California, Inc. Articles having localized molecules disposed thereon and methods of producing and using same
US7563574B2 (en) 2006-03-31 2009-07-21 Pacific Biosciences Of California, Inc. Methods, systems and compositions for monitoring enzyme activity and applications thereof
WO2008027558A2 (en) 2006-08-31 2008-03-06 Codon Devices, Inc. Iterative nucleic acid assembly using activation of vector-encoded traits
US8207509B2 (en) 2006-09-01 2012-06-26 Pacific Biosciences Of California, Inc. Substrates, systems and methods for analyzing materials
EP4220138A1 (de) * 2006-09-01 2023-08-02 Pacific Biosciences of California, Inc. Substrate, systeme und verfahren zur analyse von materialien
US20080080059A1 (en) * 2006-09-28 2008-04-03 Pacific Biosciences Of California, Inc. Modular optical components and systems incorporating same
US20100167413A1 (en) * 2007-05-10 2010-07-01 Paul Lundquist Methods and systems for analyzing fluorescent materials with reduced autofluorescence
US20080277595A1 (en) * 2007-05-10 2008-11-13 Pacific Biosciences Of California, Inc. Highly multiplexed confocal detection systems and methods of using same
US7811810B2 (en) 2007-10-25 2010-10-12 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
US7767441B2 (en) * 2007-10-25 2010-08-03 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
EP3425060B1 (de) 2008-03-28 2021-10-27 Pacific Biosciences of California, Inc. Zusammensetzungen und verfahren zur nukleinsäuresequenzierung
WO2010025310A2 (en) 2008-08-27 2010-03-04 Westend Asset Clearinghouse Company, Llc Methods and devices for high fidelity polynucleotide synthesis
FI3629011T3 (fi) 2008-09-16 2024-01-29 Pacific Biosciences California Inc Integroitu optinen laite
US8501406B1 (en) 2009-07-14 2013-08-06 Pacific Biosciences Of California, Inc. Selectively functionalized arrays
WO2011056872A2 (en) 2009-11-03 2011-05-12 Gen9, Inc. Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly
US9216414B2 (en) 2009-11-25 2015-12-22 Gen9, Inc. Microfluidic devices and methods for gene synthesis
US9217144B2 (en) 2010-01-07 2015-12-22 Gen9, Inc. Assembly of high fidelity polynucleotides
US9646134B2 (en) * 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
EP3657507A1 (de) 2010-05-25 2020-05-27 The Regents of The University of California Bambam: parallele vergleichende analyse von hochdurchsatz-sequenzierungsdaten
EP3290529B1 (de) 2010-06-11 2019-05-22 Life Technologies Corporation Alternative nukleotidflüsse in verfahren zur sequenzierung durch synthese
WO2012021733A2 (en) 2010-08-12 2012-02-16 Pacific Biosciences Of California, Inc. Photodamage mitigation compounds and systems
US10273540B2 (en) 2010-10-27 2019-04-30 Life Technologies Corporation Methods and apparatuses for estimating parameters in a predictive model for use in sequencing-by-synthesis
EP2633470B1 (de) 2010-10-27 2016-10-26 Life Technologies Corporation Prädiktives modell zur verwendung für sequenzierung nach synthese
US10457935B2 (en) 2010-11-12 2019-10-29 Gen9, Inc. Protein arrays and methods of using and making the same
EP3360963B1 (de) 2010-11-12 2019-11-06 Gen9, Inc. Verfahren und vorrichtungen für nukleinsäuresynthese
US9594870B2 (en) 2010-12-29 2017-03-14 Life Technologies Corporation Time-warped background signal for sequencing-by-synthesis operations
EP3582224A1 (de) 2010-12-30 2019-12-18 Life Technologies Corporation Modelle zur analyse von daten aus sequenzierung-mit-synthese-operationen
US10241075B2 (en) 2010-12-30 2019-03-26 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
US20130060482A1 (en) 2010-12-30 2013-03-07 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
EP2694675B1 (de) 2011-04-08 2018-01-24 Life Technologies Corporation Phasenschützende reagenzflussordnungen für die verwendung zur sequenzierung durch synthese
US9752176B2 (en) 2011-06-15 2017-09-05 Ginkgo Bioworks, Inc. Methods for preparative in vitro cloning
LT3594340T (lt) 2011-08-26 2021-10-25 Gen9, Inc. Kompozicijos ir būdai, skirti nukleorūgščių didelio tikslumo sąrankai
US10704164B2 (en) 2011-08-31 2020-07-07 Life Technologies Corporation Methods, systems, computer readable media, and kits for sample identification
KR101295784B1 (ko) * 2011-10-31 2013-08-12 삼성에스디에스 주식회사 목표 유전체 서열 내의 신규서열 생성 장치 및 방법
US9150853B2 (en) 2012-03-21 2015-10-06 Gen9, Inc. Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis
CN111876409A (zh) 2012-04-24 2020-11-03 Gen9股份有限公司 在体外克隆中分选核酸和多重制备物的方法
US9646132B2 (en) 2012-05-11 2017-05-09 Life Technologies Corporation Models for analyzing data from sequencing-by-synthesis operations
CA2877823A1 (en) 2012-06-25 2014-01-03 Gen9, Inc. Methods for nucleic acid assembly and high throughput sequencing
US10329608B2 (en) 2012-10-10 2019-06-25 Life Technologies Corporation Methods, systems, and computer readable media for repeat sequencing
US20140296080A1 (en) 2013-03-14 2014-10-02 Life Technologies Corporation Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood
US9926597B2 (en) 2013-07-26 2018-03-27 Life Technologies Corporation Control nucleic acid sequences for use in sequencing-by-synthesis and methods for designing the same
WO2015051338A1 (en) 2013-10-04 2015-04-09 Life Technologies Corporation Methods and systems for modeling phasing effects in sequencing using termination chemistry
WO2016060974A1 (en) 2014-10-13 2016-04-21 Life Technologies Corporation Methods, systems, and computer-readable media for accelerated base calling
US10978174B2 (en) 2015-05-14 2021-04-13 Life Technologies Corporation Barcode sequences, and related systems and methods
US10619205B2 (en) 2016-05-06 2020-04-14 Life Technologies Corporation Combinatorial barcode sequences, and related systems and methods

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5302509A (en) * 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
EP0450060A1 (de) * 1989-10-26 1991-10-09 Sri International Dns-sequenzierung
AU2674092A (en) 1991-09-09 1993-04-05 Baylor College Of Medicine Method and device for rapid dna or rna sequencing determination by a base addition sequencing scheme
GB9208733D0 (en) 1992-04-22 1992-06-10 Medical Res Council Dna sequencing method
US5552278A (en) * 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage

Also Published As

Publication number Publication date
ATE353455T1 (de) 2007-02-15
EP1297484B1 (de) 2007-02-07
EP1297484A2 (de) 2003-04-02
US20030186276A1 (en) 2003-10-02
CA2412973A1 (en) 2002-01-10
GB0016472D0 (en) 2000-08-23
WO2002003305A2 (en) 2002-01-10
AU2001270760A1 (en) 2002-01-14
JP2004501669A (ja) 2004-01-22
US7133782B2 (en) 2006-11-07
ES2281426T3 (es) 2007-10-01
DE60126491D1 (de) 2007-03-22
IL153472A0 (en) 2003-07-06
WO2002003305A3 (en) 2002-08-01

Similar Documents

Publication Publication Date Title
DE60126491T2 (de) Verfahren zur sequenzanalyse
DE60037584T2 (de) Auf microarrays basierende substraktive hybridisierung
DE69727064T2 (de) Verfahren zum nachweis von polynucleotid-sequenzen mittel massenspektrometrie
DE102008025656B4 (de) Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
DE60133111T2 (de) Verfahren zur erkennung und zum assay von nukleinsäuresequenzen
DE60213803T2 (de) Happier mapping
DE102008061772A1 (de) Verfahren zur Untersuchung von Nukleinsäure-Populationen
EP0438512A1 (de) Verfahren zur analyse von längenpolymorphismen in dna-bereichen
EP1034309A2 (de) Verfahren zur herstellung komplexer dna-methylierungs-fingerabdrücke
DE19633436A1 (de) Verfahren zum Nachweis von Nukleinsäuren unter Ermittlung der Masse
CN109722470A (zh) 品质评价方法、装置、程序、记录介质、及品质管理试样
CN112349346A (zh) 检测基因组区域中的结构变异的方法
CN110129422A (zh) 基于长片段pcr和单分子测序解析多核苷酸重复突变疾病突变结构的方法
DE10159262A1 (de) Identifizieren pharmazeutischer Targets
EP2978858B1 (de) In vitro-verfahren zur prognostischen beurteilung der erfolgsaussichten einer implantation und/oder transplantation
WO2007068305A1 (de) Verfahren zur bestimmung des genotyps aus einer biologischen probe enthaltend nukleinsäuren unterschiedlicher individuen
DE60026830T2 (de) Verfahren zur auswahl von oligonukleotiden mit niedriger kreuzhybridisierung
DE102013200309B3 (de) Verfahren zur Zusammenstellung eines Sets von Nukleinsäure-Barcodes sowie Verfahren zur Zuordnung von Nukleinsäuresequenzen nach der Sequenzierung
EP1332230A1 (de) Verfahren zur kennzeichnung von dna enthaltenden proben mittels oligonukleotiden
DE102008061774A1 (de) Indexierung von Nukleinsäure-Populationen
EP1537246A1 (de) Verfahren zur amplifikation genetischer informationen
DE112012005966T5 (de) Verfahren, System und Kit zur Analyse von Genen
DE19713556A1 (de) Verfahren zur Identifizierung von eukaryontischen und viralen Spezies durch Bestimmung relativer und absoluter Oligonukleotidhäufigkeiten
DE102015206444B3 (de) Verfahren zum Erkennen von Mikroorganismen
WO2001040510A2 (de) Dynamische sequenzierung durch hybridisierung

Legal Events

Date Code Title Description
8381 Inventor (new situation)

Inventor name: ODEDRA, RAJ, AMERSHAM, BUCKINGHAMSHIRE, GB

8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee