DE60220578T2 - Methode und Reagenzien zur Analyse der Nukleotidsequenz von Nukleinsäuren - Google Patents

Methode und Reagenzien zur Analyse der Nukleotidsequenz von Nukleinsäuren Download PDF

Info

Publication number
DE60220578T2
DE60220578T2 DE60220578T DE60220578T DE60220578T2 DE 60220578 T2 DE60220578 T2 DE 60220578T2 DE 60220578 T DE60220578 T DE 60220578T DE 60220578 T DE60220578 T DE 60220578T DE 60220578 T2 DE60220578 T2 DE 60220578T2
Authority
DE
Germany
Prior art keywords
mixture
mer
mass
precursors
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60220578T
Other languages
English (en)
Other versions
DE60220578D1 (de
Inventor
Jeffrey R. Burlingame Sampson
Joel Berkeley Myerson
Anna M. Chicago Tsalenko
Nicholas M. San Jose Sampas
Peter G. Menlo Park Webb
Zohar H. Yakhini
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Application granted granted Critical
Publication of DE60220578D1 publication Critical patent/DE60220578D1/de
Publication of DE60220578T2 publication Critical patent/DE60220578T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00452Means for the recovery of reactants or products
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00452Means for the recovery of reactants or products
    • B01J2219/00454Means for the recovery of reactants or products by chemical cleavage from the solid support
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00527Sheets
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00572Chemical means
    • B01J2219/00581Mass
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00585Parallel processes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00596Solid-phase processes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00599Solution-phase processes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/0061The surface being organic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00612Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports the surface being inorganic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00623Immobilisation or binding
    • B01J2219/00626Covalent
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00632Introduction of reactive groups to the surface
    • B01J2219/00637Introduction of reactive groups to the surface by coating it with another layer
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00639Making arrays on substantially continuous surfaces the compounds being trapped in or bound to a porous medium
    • B01J2219/00641Making arrays on substantially continuous surfaces the compounds being trapped in or bound to a porous medium the porous medium being continuous, e.g. porous oxide substrates
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00659Two-dimensional arrays
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00702Processes involving means for analysing and characterising the products
    • B01J2219/00707Processes involving means for analysing and characterising the products separated from the reactor apparatus
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf ein Gemisch oder einen Satz von Gemischen von X-mer-Vorläufern, ein Verfahren zum Analysieren von Nukleotidsequenzen von Nukleinsäuren und auf einen Bausatz zum Ausführen eines derartigen Verfahrens. Insbesondere bezieht sie sich auf Verfahren zum Analysieren von Nukleotidsequenzen, die Reagenzien verwenden, die Gemische von Oligonukleotid-Vorläufern sind und eine hohe Sequenzbedeckungskomplexität aufweisen und außerdem Markierungen aufweisen, die mittels Massenspektrometrie analysierbar sind und die durch spaltbare Bindungen kovalent an die Oligonukleotide gebunden sind.
  • Ein Bestimmen der Nukleotidsequenz von Nukleinsäuren (DNA und RNA) ist kritisch für das Verständnis der Funktion und Steuerung von Genen und ihrer Beziehung, beispielsweise in Bezug auf Krankheitserkennung und Krankheitsbewältigung. Die Analyse genetischer Informationen spielt bei biologischen Experimenten eine wesentliche Rolle. Dies gilt mittlerweile besonders in Bezug auf Studien, die auf ein Verständnis der grundlegenden genetischen und Umweltfaktoren abzielen, die mit Krankheit und den Auswirkungen potentieller therapeutischer Wirkstoffe auf die Zelle zusammenhängen. Diese Paradigmaverschiebung führte in der Branche der Biowissenschaften zu einem erhöhten Bedarf an sensibleren, präziseren und einen höheren Durchsatz ermöglichenden Technologien zum Durchführen von Analysen an genetischem Material, das von einer Vielzahl biologischer Quellen gewonnen wird.
  • Da ein Sequenzieren der ernorm hohen Anzahl von Nukleinsäuren in jeder menschlichen Zelle notwendigerweise ein zeitaufwendiger Vorgang ist, besteht immer ein dringender Bedarf an schnelleren Analysen mit einem höheren Durchsatz, die nicht zu Lasten der Empfindlichkeit und Genauigkeit gehen. Es wurden bereits eine Reihe von Techniken entwickelt, einschließlich, unter anderem, Elektrophorese, enzymatische und chemische Analyse, Arraytechnologie und Massenspektrometrie, um die Nukleotidsequenz von Nukleinsäuren zu bestimmen.
  • Elektrophoretische Techniken
  • Plattengel- oder Kapillarpolyacrylamidgel-Elektrophoresetechnologien wie z. B. diejenigen, die bei automatisierten DNA-Sequenzierern eingesetzt werden, liefern äußerst genaue De-Novo-Sequenzinformationen für relativ lange (500-700 Reste oder Basen) DNA-Segmente. Obwohl auf Elektrophorese beruhende Techniken viele Informationen pro Probe liefern, erfordern sie lange Probenpräparations- und aufbauzeiten und begrenzen somit den Durchsatz.
  • Enzymatische und chemische Analyse
  • Es gibt eine Reihe von enzymatischen und chemischen Techniken, um die De-Novo-Nukleotidsequenz von Nukleinsäuren zu bestimmen. Jedoch weist jede Technik inhärente Beschränkungen auf. Zum Beispiel offenbaren Maxam und Gilbert [Proc. Nati. Acad. Sci. USA 74: 5.460 (1977)] einen Lösungsansatz einer chemischen Qualitätsverringerung, und Sanger u. a. [Proc. Natl. Acad. Sci. USA 74: 5.463 (1977)] offenbaren ein Kettenabbruchverfahren, das eine Komplementärstrang-Primer-Verlängerung bzw. -Extension bzw. -Ausdehnung verwendet. Jede dieser Techniken verwendet vier getrennte Reaktionsgemische, um einen verschachtelten Satz von Fragmenten zu erzeugen, die sich in ihrer Länge durch ein einziges Nukleotid unterscheiden, wodurch somit eine vollständige Nukleotidsequenz darstellt wird. Eine Auflösung der Fragmente auf der Grundlage ihrer Größe und ihres entständigen Nukleotids wird durchgeführt, um die Reihenfolge der Fragmente und somit die Nukleotidsequenz zu bestimmen.
  • Die Einsträngige-Konformation-Polymorphie-Analyse (SSCP-Analyse, SSCP = single-stranded conformation polymorphism) ist eine nützliche Technik zum Erfassen relativ geringer Unterschiede zwischen ähnlichen Sequenzen. Die Technik ist einfach zu implementieren und kann, wenn sie mit Multifarbstofferfassungs- oder Massenmarkierungsmethodologien kombiniert wird, multiplexiert werden und dadurch den Durchsatz verbessern. Wie auch Techniken, die sich auf ein Erfassen von Heteroduplexen stützen, z. B. Denaturierungs-Gradientengel-Elektrophorese (DGGE – denaturing gradient gel electrophoresis), chemische Spaltung (CCM – chemical cleavage), enzymatische Spaltung (unter Verwendung von Cleavase) von Nichtübereinstimmungen sowie Denaturierungs-Hochleistungs-Flüssigchromatographie (DHPLC – denaturing high performance liquid chromatography), ist die Technik nur qualitativ. Genauer gesagt offenbaren diese Techniken lediglich, ob in der anvisierten bzw. Targetnukleinsäure eine Mutation vorliegt, und liefern minimale Informationen über die Identität und Lage der Mutation.
  • Andere Techniken, die Ligase- und Polymeraseverlängerungsuntersuchungen verwenden, sind nützlich darin, zu bestimmen, ob an einer definierten Stelle in einer ansonsten bekannten anvisierten bzw. Targetnukleinsäuresequenz eine Mutation vorliegt. Beispielsweise offenbart die U.S.-Patentschrift Nr. 4,988,617 ein Verfahren zum Bestimmen, ob an einer definierten Stelle in einer ansonsten bekannten anvisierten bzw. Targetnukleinsäuresequenz eine Mutation vorliegt, indem eine Untersuchung bezüglich der Ligation zweier natürlicher Oligonukleotide durchgeführt wird, die dazu entworfen sind, nebeneinander entlang der anvisierten bzw. Targetsequenz zu hybridisieren. Die U.S.-Patentschrift Nr. 5,494,810 offenbart ein Verfahren, das eine thermostabile Ligase und die Ligasekettenreaktion (LCR) verwendet, um spezifische Nukleotidsubstitutionen, -deletionen, -insertionen und -translokationen in einer ansonsten bekannten Nukleinsäuresequenz unter Verwendung lediglich natürlicher Nukleinsäuren zu erfassen. Die U.S.-Patentschrift Nr. 5,403,709 offenbart ein Verfahren zum Bestimmen der Nukleotidsequenz durch Verwendung eines anderen Oligonukleotids als Verlängerung und eines dritten, Brücken bildenden Oligonukleotids, um die ersten zwei zum Zweck einer Ligation zusammenzuhalten, und die WO 97/35033 offenbart Verfahren zum Bestimmen der Identität eines Nukleotid-3' zu einem definierten Primer unter Verwendung einer Polymeraseverlängerungsuntersuchung. Obwohl die Untersuchungen mit einem relativ hohen Durchsatz durchgeführt werden können, sind sie sequenzspezifisch und erfordern somit für jedes zu analysierende Target einen unterschiedlichen Satz von Reagenzien.
  • Die U.S.-Patentschriften Nrn. 5,521,065 , 4,883,750 und 5,242,794 (Whiteley u. a.) offenbaren Verfahren zum Testen des Vorliegens oder des Nichtvorliegens einer Targetsequenz in einem Gemisch aus Einsträngige-Nukleinsäure-Fragmenten. Das Verfahren beinhaltet, dass ein Gemisch aus Einsträngige-Nukleinsäure-Fragmenten mit einer ersten Sonde, die zu einer ersten Region der Targetsequenz komplementär ist, und mit einer zweiten Sonde, die zu einer zweiten Region der Targetsequenz komplementär ist, zur Reaktion gebracht wird. Die erste und die zweite Targetregion grenzen aneinander an. Es werden Hybridisierungsbedingungen verwendet, bei denen die zwei Sonden auf stabile Weise zu ihren zugeordneten Targetregionen hybridisiert werden. Im Anschluss an die Hybridisierung wird bzw. werden die erste und/oder die zweite Sonde, die zu angrenzenden ersten und zweiten Targetregionen hybridisiert werden, ligiert, und anschließend wird die Probe auf das Vorliegen eines erwarteten Sondenligationsprodukts getestet.
  • Arraytechnologie
  • Techniken, die eine Hybridisierung zu oberflächengebundenen DNA-Sondenarrays verwenden, sind nützlich beim Analysieren der Nukleotidsequenz von Targetnukleinsäuren. Diese Techniken stützen sich auf die inhärente Fähigkeit von Nukleinsäuren, über eine Bildung von Wasserstoffbrücken gemäß Basenpaarungsregeln von Watson-Crick Duplexe zu bilden. In der Theorie, und in gewissem Umfang auch in der Praxis, kann eine Hybridisierung zu oberflächengebundenen DNA-Sondenarrays in einem einzigen Experiment relativ viele Informationen liefern. Beispielsweise hat die Arraytechnologie einzelne Nukleotidpolymorphien innerhalb relativ langer (aus 1.000 Resten oder Basen bestehender) Sequenzen identifiziert (Kozal, M., u. a., Nature Med. 7: 753-759, Juli 1996). Ferner ist die Arraytechnologie für manche Arten der Genexpressionsanalyse nützlich, wobei man sich auf eine komparative Analyse von komplexen Gemischen von mRNA-Targetsequenzen stützt (Lockart, D., u. a., (1996), Nat. Biotech. 14, 1.675-1.680). Obwohl Arraytechnologien den Vorteil bieten, dass sie einigermaßen empfindlich und genau sind, wenn sie für spezifische Anwendungen und für spezifische Sätze von Targetsequenzen entwickelt werden, lassen sie eine generische Implementierung vermissen, die gleichzeitig auf mehrere bzw. unterschiedliche Anwendungen und Targets angewendet werden kann. Dies ist zum großen Teil auf das Erfordernis relativ langer Sondensequenzen zurückzuführen, die die Sonden-/Targetduplexe bilden und anschließend erfassen müssen. Überdies macht es diese Verwendung relativ langer Sonden aufgrund des inhärent geringen thermodynamischen Unterschieds zwischen dem perfekten Komplement und der einzigen Nichtübereinstimmung in dem Sonden-/Targetduplex schwierig, einzelne Nukleotidunterschiede abzufragen. Außerdem hängt eine Erfassung von Lösungsdiffusionseigenschaften und einer Wasserstoffbrückenbindung zwischen komplementären Target- und Sondensequenzen ab.
  • Massenspektrometrie-Techniken
  • Die Massenspektrometrie (MS) ist ein leistungsstarkes Hilfsmittel zum Analysieren von komplexen Gemischen aus Verbindungen, einschließlich Nukleinsäuren. Zusätzlich dazu, dass eine intakte Masse präzise bestimmt wird, können mittels mehrerer unterschiedlicher MS-Strategien Primärstrukturinformationen erhalten werden. Die Verwendung von MS zur DNA-Analyse ist potentiell auf die Erfassung von DNA-Modifikationen, auf eine DNA-Fragmentmassebestimmung und auf eine DNA-Sequenzierung anwendbar (siehe z. B. Fields, G.B., Clinical Chemistry 43, 1.108 (1997)). Zur Identifizierung von DNA-Modifikationsstellen wurden bereits sowohl eine auf einer Bombardierung mit schnellen Atomen (FAB – fast atom bombardment) als auch eine auf Elektrosprayionisierung (ESI – electrospray ionization) beruhende Stoßinduzierte-Dissoziations-/Tandem-MS angewendet.
  • Obwohl die MS ein leistungsstarkes Hilfsmittel zum Analysieren von komplexen Gemischen verwandter Verbindungen, einschließlich Nukleinsäuren, ist, ist ihre Nützlichkeit beim Analysieren der Sequenz von Nukleinsäuren durch verfügbare Ionisierungs- und Erfassungsverfahren begrenzt. Beispielsweise erzeugt die ESI-Spektrometrie eine Verteilung von stark geladenen Ionen, deren Masse-zu-Ladung-Verhältnis im Bereich von im Handel erhältlichen Quadrupolmassenanalysatoren liegt. Obwohl ESI empfindlich ist und lediglich Femtomol-Mengen einer Probe benötigt, stützt sie sich auf mehrere Ladungen, um eine effiziente Ionisierung zu erzielen, und erzeugt sogar für einfache Nukleinsäuren komplexe und schwierig zu interpretierende mehrfach geladene Spektra.
  • Eine matrixunterstützte Laser-Desorption-Ionisierung (MALDI – matrix-assisted laser desorption ionization), die in Verbindung mit einem Flugzeit-Massenanalysator (TOF-Massenanalysator, TOF = time of flight) verwendet wird, weist aufgrund ihrer relativ großen Massenbandbreite, hohen Auflösung (m/Δm < 1,0 bei Masse 5.000) und Abtastrate (bis zu 1 Abtastwert/Sekunde) ein großes Potential zum Sequenzieren von Nukleinsäuren auf. Bei einem Aspekt bietet die MALDI insofern einen potentiellen Vorteil gegenüber ESI und FAB, als Biomoleküle einer großen Masse ohne weiteres ionisiert und analysiert werden können. Ferner erzeugt die MALDI im Gegensatz zur ESI vorwiegend einfach geladene Spezies.
  • Jedoch kann eine MALDI-Analyse einer DNA allgemein eine mangelnde Auflösung von DNA-Fragmenten von hoher relativer Molekülmasse, eine DNA-Instabilität und eine Interferenz seitens Probenherstellungsreagenzien aufweisen. Längere O-ligonukleotide können breitere, weniger intensive Signale liefern, da die MALDI Ionen von höherer relativer Molekülmasse eine größere kinetische Energie verleiht. Obwohl sie zum Analysieren von Nukleinsäuren von hoher relativer Molekülmasse verwendet werden kann, bewirkt MALDI-TOF eine Spaltung der Nukleinsäurehauptkette, was das resultierende Spektrum weiter verkompliziert. Folglich ist die Länge von Nukleinsäuresequenzen, die derzeit mittels MALDI-TOF analysiert werden können, auf etwa 100 Basen oder Reste beschränkt. Wang u. a. ( WO 98/03684 ) nutzten eine „Fragmentierung in der Quelle" („in source fragmentation) und koppelten sie mit Verfahren einer verzögerten gepulsten Ionenextraktion zum Bestimmen der Sequenz von Nukleinsäureanalyten.
  • Es wurden bereits eine Reihe von Verfahren offenbart, die standardmäßige Sequenzierungsverfahren nutzen, um Targetfragmente zur Analyse mittels Massenspektroskopie zu erzeugen. Beispielsweise offenbaren die U.S.-Patentschrift Nr. 5,288,644 (Beavis u. a.); die U.S.-Patentschrift Nr. 5,547,835 (Koster) und die U.S.-Patentschrift Nr. 5,622,824 (Koster) Verfahren zum Bestimmen der Sequenz einer Targetnukleinsäure unter Verwendung von MALDI-TOF von Leitern des Targets, entweder mittels Exonukleaseaufschluss- oder mittels standardmäßiger Sanger-Sequenzierungsverfahren er zeugt. Beavis erörtert ein Verfahren zur DNA-Sequenzierung unter Verwendung verschiedener basenspezifischer Reaktionen, um verschiedene Sätze von DNA-Fragmenten zu verwenden, um ein Stück DNA einer unbekannten Sequenz zu bilden. Jeder der verschiedenen Sätze von DNA-Fragmenten weist einen gemeinsamen Ursprung auf und endet an einer bestimmten Base entlang der unbekannten Sequenz. Die relativen Molekülmassen der DNA-Fragmente in jedem der verschiedenen Sätze werden durch ein MALDI-Massenspektrometer bestimmt, das anschließend verwendet wird, um die Nukleotidsequenz der DNA abzuleiten.
  • Koster verwendet die Sanger-Sequenzierungsstrategie und setzt die Sequenzinformationen mittels einer Analyse der verschachtelten Fragmente, die durch einen basenspezifischen Kettenabbruch erhalten werden, mittels ihrer verschiedenen Molekülmassen unter Verwendung von Massenspektrometrie wie z. B. MALDI- oder ESI-Massenspektrometrie zusammen. Dieses Verfahren wurde bereits mit einem Festphasensequenzierungs-Lösungsansatz gekoppelt, bei dem die Matrize mit Biotin markiert und an mit Streptavidin beschichtete magnetische Kügelchen gebunden wird. Unter Verwendung dieses Verfahrens war es möglich, Exons 5 und 8 des p53-Gens unter Verwendung von 21 definierten Primern zu sequenzieren (Fu u. a., Nat. Biotechnol. 16, 381 (1998)). Der Durchsatz kann erhöht werden, indem Massenmodifikationen in den Oligonukleotid-Primer, in Kettenabbruch-Nukleosid-Triphosphate und/oder in die kettenverlängernden Nukleosid-Triphosphate eingebracht werden, sowie dadurch, dass integrierte Markierungssequenzen verwendet werden, die ein Multiplexieren, mittels Hybridisierung, von markierungsspezifischen Sonden mit massendifferenzierten relativen Molekülmassen ermöglichen ( U.S.-Patentschrift Nr. 5,547,835 ). Es ist jedoch wichtig zu beachten, dass all diese Sequenzierungsverfahren entweder eine gewisse vorherige Kenntnis der Targetsequenz oder eine Einführung einer bekannten Sequenz, die als den Primer bindende Stelle dienen soll, erfordern.
  • Es wurden bereits Anstrengungen unternommen, Massenspektrometrie mit enzymatischen Untersuchungen zu verwenden, um das Vorliegen, die Position und die Identität von Mutationen in ansonsten bekannten Sequenzen zu bestimmen, wobei zumindest manche Informationen über das Vorliegen, die Position und/oder die Identität der Mutation vorab bekannt sind. Beispielsweise offenbart die U.S.-Patentschrift Nr. 5,605,798 ein Verfahren, bei dem ein DNA-Primer, der zu einem bekannten Targetmolekül in einer zu der bekannten interessierenden Region benachbarten Region komplementär ist, in der Gegenwart von massenmarkierten Dideoxynukleotiden mit eine DNA-Polymerase verlängert wird. Die Identität der Mutation wird anschließend bestimmt, indem die Masse des Dideoxy-verlängerten DNA-Primers analysiert wird. Es wird offenbart, dass das Multiplexierungsverfahren dabei nützlich ist, alle möglichen Mutanten/Varianten an einer definierten Stelle gleichzeitig zu erfassen, indem mit einem Dideoxynukleotid verlängert wird und bestimmt wird, welches spezifische Dideoxynukleotid integriert wurde.
  • Die WO 98/31830 offenbart ein Array von Hybridisierungssonden, von denen jede eine Massenkennung aufweist, die an eine bekannte Rasensequenz einer vorbestimmten Länge gebunden ist, wobei jede Massenkennung des Arrays, optional zusammen mit der bekannten Hasensequenz, mittels Massenspektrometrie auf diese Rasensequenz bezogen werden kann.
  • Die WO 98/10095 offenbart die Verwendung der Hybridisierungssonden der WO 98/31830 bei einem Verfahren zum Charakterisieren von DNA.
  • Es wurden Anstrengungen unternommen, einige der zuvor erwähnten Unzulänglichkeiten bei massenspektroskopischen Analysen von Nukleinsäuren anzugehen. Beispielsweise offenbart Gut ( WO 96/27681 ) Verfahren zum Verändern der Ladungseigenschaften der Phosphodiester-Hauptkette von Nukleinsäuren auf eine Art und Weise, die sie für MS-Analysen geeigneter werden lässt. Verfahren zum Einführen modifizierter Nukleotide, die die Nukleinsäure bezüglich einer Fragmentierung stabilisieren, wurden ebenfalls beschrieben (Schneider und Chait, Nucleic Acids Res, 23, 1.570 (1995), Tang u. a., J Am Soc Mass Spectrom, 8, 218-224, 1997).
  • Die Verwendung von nicht-spaltbaren Massemarkierungen wurde ebenfalls genutzt, um manche der zuvor erwähnten Unzulänglichkeiten anzugehen. Beispielsweise offenbart die japanische Patentschrift Nr. 61-11665 einen Massenspektrometerentwurf, der Nukleinsäurefragmente, die durch Elektrophorese, Flüssigchromatographie oder Hochgeschwindigkeits-Gelfiltration getrennt werden, wobei Atome in die Nukleinsäuren integriert wurden, erfasst. Die Atome, die normalerweise nicht in der DNA auftreten, sind Schwefel, Brom, Jod, Silber, Gold, Platin und Quecksilber.
  • Spaltbare Massemarkierungen werden dazu genutzt, manche der Probleme, die mit einer MS-Analyse von Nukleinsäuren verbunden sind, zu umschiffen. Beispielsweise offenbaren Southern u. a. (PCT-Anmeldung WO 95/04160 ) ein indirektes Verfahren zum Analysieren der Sequenz von Targetnukleinsäuren unter Verwendung einer durch ein Target bewirkten Ligation zwischen einer oberflächengebundenen DNA-Sonde und spaltbaren, massemarkierten Oligonukleotiden, die Reportergruppen enthalten, unter Verwendung von massenspektrometrischen Techniken. Die zu bestimmende Sequenz wird zuerst zu einem Oligonukleotid, das an einen Feststoffträger angelagert ist, hybridisiert. Der Feststoffträger, der die oben genannten Hybride trägt, wird mit einer Lösung aus codierten Oligonukleotidreagenzien, die eine Bibliothek bilden, die alle Sequenzen einer gegebenen Länge umfasst, inkubiert. Es wird eine Ligase eingebracht, so dass das Oligonukleotid auf dem Träger zu dem Angehörigen der Bibliothek ligiert wird, der zu dem Target neben dem Oligonukleotid hybridisiert wird. Nicht-ligierte Reagenzien werden mittels Waschen beseitigt. Ein Linker, der Teil des Angehörigen der Bibliothek ist, der zu dem Oligonukleotid ligiert ist, wird gebrochen, um eine Markierung abzulösen, die wiedergewonnen und mittels Massenspektrometrie analysiert wird.
  • Ein gemeinsamer Fokus der obigen Technologien besteht darin, Verfahren zum Erhöhen der Anzahl von Targetstellen (entweder innerhalb von oder zwischen Targets) zu liefern, die bei einer einzelnen Bestimmung abgefragt werden können, wobei ein gewisser Abschnitt der Targetsequenz bekannt ist. Dieses Multiplexierungsthema wird in den Lehren der obigen Patentanmeldungen entweder direkt oder implizit angegeben. Die Verwendung von mehr als einem Oligonukleotid entweder als Hybridisierungssonde oder als Primer zur Erweiterung bzw. Verlängerung bzw. Extension oder Ligation wird durch die Sequenz, die die interessierende Stelle umgibt, und somit durch die spezifische Anwendung definiert. Mit Ausnahme der von Southern offenbarten Massemarkierungstechnologie sind die oben beschriebenen Oligonukleotidreagenzien somit bezüglich der Targetsequenz nicht generisch, sondern müssen für jede definierte Anwendung erzeugt werden. Als solches ist die Anzahl von gesonderten Oligonukleotiden, die bei einer multiplexierten Abfragung verwendet werden, allgemein lediglich eine geringe Teilmenge des theoretischen Sequenz-Vollständig-Satzes. Dieses Verhältnis zwischen der tatsächlichen Sequenzbedeckung, die durch ein bestimmtes Oligonukleotidgemisch geliefert wird, und der theoretischen Bedeckung, die durch den Sequenz-Vollständig-Satz geliefert wird, ist als die Gemischbedeckungskomplexität definiert (siehe nachstehende Erörterung). Beispielsweise variieren bei vielen der beschriebenen Verfahren (d. h. U.S.-Patentschrift Nr. 5,605,798 , WO 92/15712 und WO 97/35033 ) die Sondenlängen je nach der spezifischen Anwendung und dem Erfassungsverfahren zwischen etwa 8 und 20 Nukleotiden. Die Anzahl von Sonden in einem Sequenz-Vollständig-Satz kann durch die Gleichung 4L beschrieben werden, wobei L gleich der Länge der Sonden ist. Für 8-mer-Sonden weist der Sequenz-Vollständig-Satz somit 48 oder 65.536 Angehörige auf. Wenn die Anzahl von Abfragungsstellen bei der multiplexierten Bestimmung etwa 500 beträgt, was für die oben beschrie benen Technologiearten eine vernünftige Obergrenze für die Anzahl von Oligonukleotidsonden bei einer einzigen Bestimmung ist, so wäre die Gemischbedeckungskomplexität (siehe nachfolgende Erörterung) des abfragenden 8-mer-Sonde-Gemischs gleich 500/65.536 oder etwa 1/130. In den meisten Fällen weisen die Sonden jedoch eine Länge von 15-20 Nukleotiden auf. Obwohl diese erhöhte Länge eine Spezifizität der Sonde für eine definierte Targetsequenz gewährleistet, verringert sie die Gemischbedeckungskomplexität des Sondengemischs beträchtlich. Somit ist klar, dass die abfragenden Oligonukleotidgemische für die oben beschriebenen Arten von Multiplexierungsverfahren und -anwendungen nicht dazu entworfen sind, bezüglich der Targetsequenzbedeckung sequenzvollständig zu sein, und somit nicht als generische Reagenzien betrachtet werden könnten.
  • Das Ziel vieler arraybasierter Sequenzierungstechniken besteht darin, den „Kurzwort"-Inhalt, d. h. alle vorliegenden Oligonukleotidteilsequenzen, in der anvisierten Nukleinsäuresequenz zu bestimmen. Beispielsweise ist bei Techniken, die eine Hybridisierung zu oberflächengebundenen DNA-Sondenarrays verwenden, ein Satz von Oligonukleotiden einer bestimmten Länge an räumlich gesonderten Positionen auf einem Substrat angeordnet, um ein Array zu bilden, und die Targetsequenz darf zu dem Array hybridisieren (siehe z. B. U.S.-Patentschrift Nr. 5,202,231 , U.S.-Patentschrift Nr. 5,492,806 und U.S.-Patentschrift Nr. 5,695,940 ). Die Targetsequenz wird sich an Positionen binden, die ein Kurzwort enthalten, das komplementär zu einem der Kurzwörter in ihrer Sequenz ist. Andere haben Verfahren zum Sondieren von oberflächengebundenen Targets mit einem sequentiellen Satz von Oligonukleotidsonden offenbart (siehe z. B. U.S.-Patentschrift Nr. 5202231 , U.S.-Patentschrift Nr. 5492806 und U.S.-Patentschrift Nr. 5695940 ). Dadurch, dass mittels einer Fluoreszenzmessung oder dergleichen die Hybridisierungspositionen identifiziert werden oder die Identität des sondierenden Oligonukleotids bekannt ist, kann theoretisch der genaue Kurzwortinhalt der Targetnukleinsäuresequenz be stimmt werden. Diese Informationen können anschließend dazu verwendet werden, die Sequenz der Targetnukleinsäure zu rekonstruieren (siehe z. B. Pevzner, P.A., J. Biomolecular Structure Dynamics 7, 63 (1989), Pevzner P.A., u.a., J. Biomolecular StructureDynamics 9, 399 (1991), Ukkonen, E., Theoretical Computer Science 92, 191 (1992)). Jedoch ist es wichtig zu betonen, dass relativ sequenzvollständige Sätze von Oligonukleotidsonden benötigt werden, um den Kurzwortinhalt eines unbekannten Targets generisch zu bestimmen.
  • Techniken, die den Kurzwortinhalt der Targetnukleinsäuresequenz identifizieren, eignen sich für Anwendungen wie z. B. De-Novo-Sequenzieren, Neu-Sequenzieren, Mutationserfassung und Mutationsänderungserfassung. Mit zunehmender Länge der Targetsequenz verringert sich die Erfolgsrate oder die Erfolgsrate, mit der die Analyse durchgeführt werden kann. Da manche der Anwendungen lediglich qualitative Informationen benötigen, (z. B. Mutationserfassung), kann die Erfolgsrate in der Regel höher liegen als die Erfolgsrate für eine Anwendung, die quantitative Informationen erfordert, z. B. De-Novo-Sequenzieren. Beispielsweise würde das Vorliegen einiger weniger Kurzwortwiederholungen die Erfolgsrate für ein De-Novo-Sequenzieren beträchtlich verringern, hätte jedoch eine geringere Auswirkung auf die Erfolgsrate bezüglich einer Mutationserfassung. Bei anderen Anwendungen ist ein beträchtliches Maß an Vorab-Informationen verfügbar, um die Interpretation des Kurzwortinhalts zu unterstützen, wodurch die Erfolgsrate der Ergebnisse erhöht wird.
  • Der Zweck der vorliegenden Erfindung besteht darin, den Kurzwortinhalt einer Targetnukleinsäuresequenz unter Verwendung von Massenspektroskopie zu bestimmen. Jedoch erwartet man, dass die Erfolgsrate einer derartigen Analyse relativ gering ist, da das Vorliegen einer bestimmten Masse in dem Massespektrum lediglich zeigt, dass eine von vielen möglichen Nukleinsäuresequenzen vorliegt. Beispielsweise ist unter Verwendung von lediglich natürlichen Nukleotiden die Sequenz GGCTTTA anhand der Masse von der Sequenz GCTTTAG unterscheidbar, und das Vorliegen einer Massenspitze bei 2.142 Atommasseeinheiten zeigt lediglich, dass in dem Gemisch zumindest eine Nukleinsäuresequenz mit 3 Ts, 2 Gs und 1 A und 1 C vorliegt. Durch Massekoinzidenzen wird die Mehrdeutigkeit noch verwirrender. Beispielsweise kann die Massenspitze bei 2.193 Beiträge von Nukleinsäuresequenzen enthalten, die 6 As und 1 T oder 1 A, 2 Cs, 3 Gs und 1 T enthalten. Deshalb besteht ein großer Bedarf an schnellen analytischen Verfahren, die die Mehrdeutigkeit, die Daten aus einer MS-Analyse von Nukleinsäuren eigen ist, verringern.
  • Die vorliegende Erfindung ist auf Reagenzien und Verfahren zum Rekapitulieren einer Targetnukleinsäure in der Kurzwortform gerichtet, die mittels Hochauflösungs-Massenspektrometrie-techniken analysiert werden kann. Die Verfahren und Reagenzien verwenden generische Oligonukleotid-Vorläufer-Gemische (X-mer-Vorläufer-Gemische), die Markierungen umfassen, die durch spaltbare Bindungen kovalent angelagert sind, und enzymatische Prozesse, um die Länge und gleichzeitig die Masse lediglich derjenigen X-mer-Vorläufer innerhalb eines definierten Gemisches zu verändern, die zu der Targetnukleinsäure komplementär sind und somit zu der Targetnukleinsäure hybridisiert haben, um eine enzymatische Bearbeitung zu ermöglichen.
  • Bezüglich eines Aspekts ist die vorliegende Erfindung ein Gemisch oder ein Satz von Teilgemischen, das bzw. der Nukleinsäuren und durch spaltbare Linker kovalent an die Nukleinsäuren angelagerte Markierungen zur direkten Massenspektralanalyse der Markierungen nach einer Freisetzung durch Spaltung der Linker umfasst, wobei die Markierungen mittels Massenspektrometrie unterscheidbar sind und bekannten Sequenzen von X-mer-Vorläufern zugewiesen sind. Das Gemisch umfasst X-mer-Vorläufer, die eine Mindestlänge von 3 Nukleotiden aufweisen. Die minimale Gemischbedeckungskomplexität (CCM) des Gemisches (oder die minimale zusammengesetzte Gemischbedeckungskomplexität des Satzes von Teilge mischen) beträgt 56 dividiert durch N, wobei N die Anzahl von gesonderten X-meren in dem Gemisch ist. Die Länge der X-mer-Vorläufer kann für jeden X-mer-Vorläufer unabhängig ausgewählt werden. Jeder der X-mer-Vorläufer in dem Gemisch wird durch eine einzelne chemische Spezies dargestellt. Jedes Teilgemisch in dem Satz weist relativ zu der zusammengesetzten Gemischbedeckungskomplexität eine verringerte Gemischbedeckungskomplexität auf. Ferner umfasst jedes Teilgemisch eine Mehrzahl von X-mer-Vorläufern.
  • Bezüglich eines anderen Aspekts liefert die vorliegende Erfindung ein Verfahren zum Analysieren einer Targetnukleinsäuresequenz. Bei dem Verfahren umfasst ein Gemisch aus X-mer-Vorläufern (oder ein Teilgemisch aus einem Satz von Teilgemischen) durch spaltbare Linker kovalent an die Nukleinsäuren angelagerte Markierungen zur direkten Massenspektralanalyse der Markierungen nach einer Freisetzung durch Spaltung der Linker umfasst, wobei die Markierungen mittels Massenspektrometrie unterscheidbar sind und bekannten Sequenzen von X-mer-Vorläufern zugewiesen sind. Das Gemisch umfasst X-mer-Vorläufer, die eine Mindestlänge von 3 Nukleotiden aufweisen. Die minimale Gemischbedeckungskomplexität des Gemisches (oder die minimale zusammengesetzte Gemischbedeckungskomplexität des Satzes von Teilgemischen) beträgt 56 dividiert durch N, wobei N die Anzahl von gesonderten X-meren in dem Gemisch ist. Die Länge der X-mer-Vorläufer kann für jeden X-mer-Vorläufer unabhängig ausgewählt werden. Jeder der X-mer-Vorläufer in dem Gemisch wird durch eine einzelne chemische Spezies dargestellt. Jedes Teilgemisch in dem Satz weist relativ zu der zusammengesetzten Gemischbedeckungskomplexität eine verringerte Gemischbedeckungskomplexität auf. Ferner umfasst jedes Teilgemisch eine Mehrzahl von X-mer-Vorläufern.
  • Die X-mer-Vorläufer in dem Gemisch werden zu den Targetnukleinsäuresequenzen hybridisiert, wobei Hybride erzeugt werden. Die Hybride werden bearbeitet, um die Masse der X-mer-Vorläufer-Abschnitte der Hybride in einer mittels einer Targetsequenz bewirkten Reaktion zu verändern. Die Reaktion erfasst Hybridisierungsereignisse zwischen X-mer-Vorläufern und ihren komplementären Sequenzen innerhalb einer Targetnukleinsäure, indem sie die Masse des X-mer-Vorläufers verändert. Folglich werden Sequenzinformationen über die Targetnukleinsäuren durch die bezüglich ihrer Masse veränderten X-mer-Vorläufer rekapituliert. Deshalb werden bezüglich ihrer Masse veränderte X-mer-Vorläufer anschließend von den unveränderten (d.h. nicht-hybridisierten) X-mer-Vorläufern zu Analysezwecken getrennt.
  • Nach der Trennung werden die Markierungen aus den bezüglich ihrer Masse veränderten Nukleinsäure- X-mer-Vorläufern durch Spaltung der Linker freigesetzt. Die isolierten Markierungen, die gereinigt werden können, werden anschließend mittels Massenspektrometrie analysiert. Zusätzlich oder alternativ dazu werden der Schritt des Spaltens der Linker und der Schritt der Analyse mittels Massenspektrometrie in demselben Schritt durchgeführt. Da Markierungen X-mer-Vorläufern zugewiesen bzw. mit X-mer-Vorläufern verbunden sind, deren Nukleotidsequenzen bekannt sind, werden Informationen, die aus der Massenspektralanalyse erhalten werden, anschließend dazu verwendet, die Nukleotidsequenz der Targetnukleinsäure zu bestimmen.
  • Bei einem Ausführungsbeispiel ist die vorliegende Erfindung ein Bausatz zum Ausführen des obigen Verfahrens. Der Bausatz umfasst ein Gemisch oder einen Satz von Teilgemischen, wie es bzw. er oben beschrieben wurde, ein Enzym, das eine DNA-Polymeraseaktivität aufweist, und eine Vielzahl von Kettenabbruch-Nukleotid-Triphosphaten.
  • Eine Anzahl bevorzugter Ausführungsbeispiele der vorliegenden Erfindung werden nun unter Bezugnahme auf die beiliegenden Zeichnungen offenbart, bei denen:
  • 1 ein Massenhistogramm für (A) alle 4.096 natürlichen 6-mere und für (B) die spaltbaren Massemar kierungen (CMTs – cleavable mass tags) ist, wobei 128 CMTs, die Massen zwischen 101 und 356 in 2 Atomare-Masseneinheit-Inkrementen (amu, atomic mass unit) aufweisen, willkürlich allen 4.096 6-meren zugewiesen sind;
  • 2 eine Rekapitulation einer Targetsequenz mittels unterschiedlicher Arten von Sätzen von kurzen X-meren ist. A) Verschachtelter Satz von überlappenden X-meren; (B) Verschachtelter Satz von halb-überlappenden X-meren; (C) Satz von nicht-überlappenden X-meren;
  • 3 ein Diagramm ist, das die Schritte der Polymeraseverlängerungsuntersuchung (PEA – polymerase extension assay) unter Verwendung von spaltbaren Massemarkierungen (CMTs) umreißt (CMT-PEA);
  • 4 ein Diagramm ist, das die Schritte der X-mer-Ligation-Untersuchung (XLA = X-mer ligation assay) unter Verwendung von spaltbaren Massemarkierungen umreißt (CMT-XLA);
  • 5 ein Diagramm ist, das die Schritte der arraybasierten X-mer-Ligation-Untersuchung unter Verwendung von spaltbaren Massemarkierungen umreißt (CMT-AXLA) (AXLA = array-based X-mer ligation assay);
  • 6 ein Diagramm ist, das die Beziehung zwischen einer Erfolgsquote bezüglich der Erfassung einer heterozygoten Mutation und einer Targetlänge für 1000(1), 1500(2), 2000(3), 2500(4), 3000(5), 3500(6) und 4000(7) der 4.096 6-mere zeigt, die willkürlich mit 100 CMTs markiert sind, die unterschiedliche Massen aufweisen;
  • 7 einen verschachtelten Satz von überlappenden 7-mer-PEA-Produkten zeigt, der dem 62-Nukleotid-Fragment der Wildtyp-p53-Sequenz entspricht;
  • 8 Massenspektren einer CMT-PEA-Analyse für (A) den Wildtyp; die (B) G2451C-; und die (C) G2451T-p53-Mutante in dem 62-Nukleotid-Targetfragment zeigt, wobei 100 CMTs verwendet werden, die allen 4.096 6-meren willkürlich zugewiesen sind;
  • 9 ein integriertes (A & B) und ein binäres transformiertes (C & D) Differenzspektrum für den Wildtyp und die G2451C- und die G2451T-p53-Mutante zeigt;
  • 10 Massenspektren einer CMT-PEA-Analyse für (A) den Wildtyp; (B) die G2451C-; und (C) die G2451T-p53-Mutante in dem 62-Nukleotid-Targetfragment unter Verwendung von 400 CMTs, die willkürlich 4.096 6-meren zugewiesen sind, zeigt;
  • 11 integrierte (A & B) und binäre transformiertes (C & D) Differenzspektrum für den Wildtyp und die G2451C- und die G2451T-p53-Mutante zeigt;
  • 12 Massenspektren einer CMT-PEA-Analyse für (A) den Wildtyp; (B) die G-zu-C-; p53-Mutante in einem 378-Nukleotid-Targetfragment unter Verwendung von 100 CMTs, die 4.096 6-meren willkürlich zugewiesen sind, zeigt. (C) zeigt das integrierte Spektrum; (D) zeigt das binäre transformierte Differenz-Spektrum für die G-zu-C-Mutation;
  • 13 Massenspektren einer CMT-PEA-Analyse für (A) den Wildtyp; (B) die G-zu-C-; p53-Mutante in einem 378-Nukleotid-Targetfragment unter Verwendung von 400 CMTs, die 4.096 6-meren willkürlich zugewiesen sind, zeigt. (C) zeigt das integrierte Spekt rum; (D) zeigt das binäre transformierte Differenz-Spektrum für die G-zu-C-Mutation;
  • Definitionen
  • In dieser Spezifikation und in den folgenden Patentansprüchen wird auf eine Anzahl von Begriffen Bezug genommen, die definitionsgemäß die folgende Bedeutung aufweisen sollen:
  • Der Begriff „Polynukleotid" oder „Nukleinsäure" bezieht sich auf eine Verbindung oder Zusammensetzung, die ein polymeres Nukleotid oder ein Nukleinsäurepolymer ist. Das Polynukleotid kann eine natürliche Verbindung oder eine synthetische Verbindung sein. Das Polynukleotid kann von etwa 20 bis 5.000.000 oder mehr Nukleotide aufweisen. Die größeren Polynukleotide liegen allgemein im natürlichen Zustand vor. In einem isolierten Zustand kann das Polynukleotid etwa 30 bis 50.000 oder mehr Nukleotide, üblicherweise etwa 100 bis 20.000 Nukleotide, häufiger 500 bis 10.000 Nukleotide, aufweisen. Somit ist es offensichtlich, dass eine Isolierung eines Polynukleotids aus dem natürlichen Zustand oft zu einer Fragmentierung führt. Es kann nützlich sein, längere Targetnukleinsäuresequenzen, insbesondere RNA, vor einer Hybridisierung zu fragmentieren, um konkurrierende intramolekulare Strukturen zu verringern.
  • Die Polynukleotide umfassen Nukleinsäuren, und Fragmente derselben, von jeglicher Quelle in gereinigter oder ungereinigter Form, einschließlich DNA (dsDNA und ssDNA) und RNA, einschließlich tRNA, mRNA, rRNA, Mitochondrien-DNA und -RNA, Chloroplast-DNA und -RNA, DNA/RNA-Hybride oder Gemische derselben, Gene, Chromosomen, Plasmiden, Cosmiden, der Genome von biologischem Material wie z. B. Mikroorganismen, z. B. Bakterien, Hefen, Phagen, Chromosomen, Viren, Viroiden, Schimmelpilzen, Pilzen, Pflanzen, Tieren, Menschen und dergleichen. Das Polynukleotid kann auch lediglich eine untergeordnete Fraktion eines komplexen Gemisches wie z. B. einer biologischen Probe sein. Ebenfalls enthalten sind Gene, z. B. Hämoglobin-Gen für Sichelzellenanämie, Zystische-Fibrose-Gen, Onkogene, cDNA und dergleichen.
  • Das Polynukleotid kann mittels Prozeduren, die in der Technik hinreichend bekannt sind, aus verschiedenen biologischen Materialien gewonnen werden. Wo es angebracht ist, kann das Polynukleotid gespalten werden, um ein Fragment zu erhalten, das eine Targetnukleotidsequenz enthält, z. B. durch Scheren oder durch eine Behandlung mit einer Restriktionsendonuklease oder anhand eines anderen Verfahrens einer stellenspezifischen chemischen Spaltung.
  • Für die Zwecke der vorliegenden Erfindung ist das Polynukleotid, oder ein aus dem Polynukleotid gewonnenes gespaltenes Fragment, üblicherweise zumindest teilweise denaturiert oder einsträngig, oder es wird behandelt, damit es denaturiert oder einsträngig wird. Derartige Behandlungen sind in der Technik hinreichend bekannt und umfassen z. B. eine Wärme- oder Alkalibehandlung oder einen enzymatischen Aufschluss eines Stranges. Beispielsweise kann dsDNA über einen Zeitraum von etwa 1 bis 10 Minuten bei 90 bis 100°C erhitzt werden, um ein denaturiertes Material zu erzeugen.
  • Die Nukleinsäuren können mittels in-vitro-Replikation und/oder mittels Amplifikationsverfahren wie z. B. Polymerasekettenreaktion (PCR – polymerase chain reaction), der asymmetrischen PCR, der Ligasekettenreaktion (LCR – ligase chain reaction) und so weiter, erzeugt werden. Die Nukleinsäuren können entweder einsträngig oder doppelsträngig sein. Einsträngige Nukleinsäuren sind bevorzugt, da sie keine komplementären Stränge aufweisen, die während des Hybridisierungsschrittes des Verfahrens der Erfindung um die Oligonukleotid-Vorläufer konkurrieren.
  • Der Ausdruck „Targetnukleinsäuresequenz" bezieht sich auf eine Sequenz von Nukleotiden, die zu identifizieren, zu erfassen oder auf andere Weise zu analysieren sind und die üblicherweise in einem Abschnitt eines Polynukleotids oder in einem ganzen Polynukleotid vorliegen. Bei der vorliegenden Erfindung kann die Identität der Targetnukleotidsequenz bekannt sein, muss aber nicht. Die Identität der Targetnukleotidsequenz kann bis zu einem Grad bekannt sein, der ausreichend ist, um eine Herstellung verschiedener Sequenzen, die mit der Targetnukleotidsequenz hybridisierbar sind, und von Oligonukleotiden, z. B. Sonden und Primern, und anderen Molekülen zu ermöglichen, die zum Durchführen von Verfahren gemäß der vorliegenden Erfindung und so weiter notwendig sind. Ein Bestimmen der Sequenz der Targetnukleinsäure beinhaltet in seiner Definition ein Bestimmen der Sequenz der Targetnukleinsäure oder von Sequenzen in Regionen der Targetnukleinsäure, um die Sequenz de novo zu bestimmen, um eine Resequenzierung durchzuführen und um Mutationen und/oder Polymorphien zu erfassen.
  • Üblicherweise enthält die Targetsequenz von etwa 30 bis 5.000 oder mehr Nukleotide, vorzugsweise 50 bis 1.000 Nukleotide. Die Targetnukleotidsequenz ist allgemein ein Anteil eines größeren Moleküls, oder sie kann im Wesentlichen das ganze Molekül sein, z. B. ein Polynukleotid, wie oben beschrieben wurde. Die Mindestanzahl von Nukleotiden in der Targetnukleotidsequenz ist so gewählt, um zu gewährleisten, dass das Vorliegen eines Targetpolynukleotids in einer Probe ein spezifischer Indikator des Vorliegens von Polynukleotid in einer Probe ist. Die maximale Anzahl von Nukleotiden in der Targetnukleotidsequenz wird normalerweise von mehreren Faktoren geregelt: der Länge des Polynukleotids, von dem sie abgeleitet ist, der Tendenz eines derartigen Polynukleotids, während der Isolierung mittels Scheren oder anderer Prozesse gebrochen zu werden, der Effizienz jeglicher Prozeduren, die erforderlich sind, um die Probe für eine Analyse zu präparieren (z. B. Transkription einer DNA-Matrize zu RNA), und der Effizienz einer Identifikation, Erfassung, Amplifikation und/oder einer anderen Analyse der Targetnukleotidsequenz, wo dies angebracht ist.
  • Der Begriff „Oligonukleotid" bezieht sich auf ein Polynukleotid, üblicherweise einsträngig, üblicherweise ein synthetisches Polynukleotid, das jedoch auch ein natürlich vorkommendes Polynukleotid sein kann. Die Länge eines Oligonukleotids wird allgemein durch die jeweilige Rolle desselben, z. B. Sonde, Primer, X-mer und dergleichen, geregelt. Zum Herstellen eines Oligonukleotids können verschiedene Techniken eingesetzt werden. Derartige Oligonukleotide können mittels biologischer Synthese oder mittels chemischer Synthese erhalten werden. Für kurze Oligonukleotide (bis zu etwa 100 Nukleotiden) ist die chemische Synthese im Vergleich zur biologischen Synthese häufig wirtschaftlicher. Zusätzlich zur Wirtschaftlichkeit liefert die chemische Synthese eine zweckmäßige Art und Weise, Verbindungen von niedriger relativer Molekülmasse und/oder modifizierte Basen während spezifischer Syntheseschritte zu integrieren. Ferner ist die chemische Analyse sehr flexibel bei der Wahl der Länge und der Region der Targetpolynukleotidbindungssequenz. Das Oligonukleotid kann mittels standardmäßiger Verfahren synthetisiert werden, z. B. mittels derjenigen, die bei kommerziellen automatisierten Nukleinsäuresynthetisierern verwendet werden. Die chemische Synthese einer DNA auf einem geeignet modifizierten Glas oder Harz kann zu einer kovalent an die Oberfläche gebundenen DNA führen. Dies kann Vorteile bezüglich des Waschens und des Handhabens der Probe bieten. Verfahren der Oligonukleotid-Synthese umfassen Phosphotriester- und Phosphodiester-Verfahren (Narang u. a. (1979), Meth. Enzymol 68: 90) und eine Synthese auf einem Träger (Beaucage u. a. (1981), Tetrahedron Letters 22: 1.859-1.862) sowie Phosphoramidit-Techniken (Caruthers, M. H., u. a., „Methods in Enzymology", Bd. 154, S. 287-314 (1988)). und andere, die bei „Synthesis and Applications of DNA and RNA", S.A. Narang, Herausgeber, Academic Press, New York, 1987 beschrieben sind.
  • Die chemische Synthese mittels eines photolithographischen Verfahrens von räumlich adressierbaren Arrays von Oligonukleotiden, die an Glasoberflächen gebunden sind, wird von A. C. Pease u. a. (Proc. Nat. Acad. Sci. USA 91:5022-5026, 1994) beschrieben.
  • Der Begriff „X-mer" bezieht sich auf ein Oligonukleotid, das eine definierte Länge aufweist, die üblicherweise eine Sequenz einer Länge von zumindest 3 Nukleotiden, vorzugsweise 4 bis 14 Nukleotiden und üblicherweise 5 bis 7 Nukleotiden ist.
  • Der Ausdruck „X-mer-Vorläufer", die manchmal als „Oligonukleotid-Vorläufer" bezeichnet werden, bezieht sich auf eine Nukleinsäuresequenz, die zu einem Abschnitt der Targetnukleinsäuresequenz komplementär ist. Die Oligonukleotid-Vorläufer sind Sequenzen von Nukleosidmonomeren, die mittels Phosphorbindungen (z. B. Phosphodiester, Alkyl- und Arylphosphat, Phosphorthioat, Phosphotriester) oder Nicht-Phosphor-Bindungen (z. B. Peptid, Sulfamat und andere) verbunden werden. Sie können natürliche oder synthetische Moleküle einer einsträngigen DNA und einer einsträngigen RNA mit kreisförmigen, verzweigten oder linearen Formen sein und optional Bereiche bzw. Domänen umfassen, die in der Lage sind, stabile Sekundärstrukturen (z. B. Stamm-und-Schleife- und Schleife-Stamm-Schleife-Strukturen) zu bilden. Die Oligonukleotid-Vorläufer enthalten ein 3'- und ein 5'-Ende. Der Begriff wird durch ein ω bezeichnet.
  • Der Begriff „Gemisch" bezieht sich auf ein physisches Gemisch von zwei oder mehr Substanzen. Der Ausdruck wird durch Ω bezeichnet.
  • Der Ausdruck „Oligonukleotidsonde" bezieht sich auf ein Oligonukleotid, das verwendet wird, um sich an einen Abschnitt eines Polynukleotids wie z. B. ein weiteres Oligonukleotid oder eine Targetnukleotidsequenz zu binden. Der Entwurf und die Herstellung der Oligonukleotidsonden hängen allgemein von der Sequenz ab, an die sie sich binden.
  • Der Ausdruck „Oligonukleotid-Primer" bezieht sich auf ein Oligonukleotid, das üblicherweise bei einer Kettenverlängerung auf einer Polynukleotidmatrize, beispielsweise bei einer Amplifikation einer Nukleinsäure, eingesetzt wird. Der Oligonukleotid-Primer ist üblicherweise ein synthetisches Nukleotid, das einsträngig ist, eine Sequenz an seinem 3'-Ende enthält, die in der Lage ist, mit einer definierten Sequenz des Targetpolynukleotids zu hybridisieren. Normalerweise weist ein Oligonukleotid-Primer eine Komplementarität von zumindest 80%, vorzugsweise 90%, stärker bevorzugt 95%, am stärksten bevorzugt 100%, zu einer definierten Sequenz oder einer Primer-Bindungsstelle auf. Die Anzahl von Nukleotiden in der hybridisierbaren Sequenz eines Oligonukleotid-Primers sollte derart sein, dass Strenge-Bedingungen, die zum Hybridisieren des Oligonukleotid-Primers verwendet werden, eine übermäßige willkürliche nicht-spezifische Hybridisierung verhindern. Üblicherweise ist die Anzahl von Nukleotiden in dem Oligonukleotid-Primer mindestens so groß wie die definierte Sequenz des Targetpolynukleotids, nämlich zumindest zehn Nukleotide, vorzugsweise zumindest 15 Nukleotide und allgemein von etwa 10 bis 200, vorzugsweise 20 bis 50, Nukleotide.
  • Der Ausdruck „Nukleosid-Triphosphate" bezieht sich auf Nukleoside, die einen 5'-Triphosphat-Substituenten aufweisen. Die Nukleoside sind Pentosezuckerderivate von Stickstoffbasen entweder einer Purin- oder einer Pyrimidinableitung, kovalent an den 1'-Kohlenstoff des Pentosezuckers gebunden, der üblicherweise eine Desoxyribose oder eine Ribose ist. Die Purinbasen umfassen Adenin (A), Guanin (G), Inosin (I) und Derivate und Analoga derselben. Die Pyrimidinbasen umfassen Cytosin (C), Thymin (T), Uracil (U) und Derivate und Analoga derselben. Nukleosid-Triphosphate umfassen Desoxyribonukleosid-Triphosphate wie z. B. die vier üblichen Desoxyribonukleosid-Triphosphate dATP, dCTP, dGTP und dTTP und Ribonukleosid-Triphosphate wie Z. B. die vier üblichen Triphosphate rATP, rCTP, rGTP und rUTP. Der Begriff „Nukleosid-Triphosphate" umfasst ferner Derivate und Analoga derselben, die beispielhaft durch diejenigen Derivate veranschaulicht werden, die auf ähnliche Weise wie die nicht-abgeleiteten Nukleosid-Triphosphate erkannt und polymerisiert werden.
  • Der Begriff „Nukleotid" oder „Nukleotidbase" oder „Base" bezieht sich auf eine Base-Zucker-Phosphat-Kombination, die die monomere Einheit von Nukleinsäurepolymeren, d. h. DNA und RNA, ist. Gemäß seiner Verwendung in dem vorliegenden Dokument umfasst der Begriff modifizierte Nukleotide, wie sie nachfolgend definiert werden. Allgemein bezieht sich der Begriff auf jegliche Verbindung, die einen zyklischen Zucker vom Furanosidtyp (β-D-Ribose in RNA und β-D-2'-Desoxyribose in DNA) enthält, der an der 5'-Position phosphoryliert ist und entweder eine Base vom Purintyp oder vom Pyrimidintyp aufweist, die über eine β-Glycosol-C1'-N-Bindung an die C-1'-Zucker-Position angelagert ist. Diese Begriffe sind austauschbar und werden durch ein b bezeichnet. Das Nukleotid kann natürlich oder synthetisch sein, einschließlich eines Nukleotids, das massenmodifiziert wurde, einschließlich, unter anderem, Nukleotiden, die modifizierte Nukleotide mit modifizierten Basen (z. B. 5-Methylcytosin) und modifizierten Zuckergruppen (z. B. 2'-O-Methylribosyl, 2'-O-Methoxyethylribosyl, 2'-Fluorribosyl, 2'-Aminoribosyl und dergleichen) aufweisen.
  • Der Begriff „DNA" bezieht sich auf Desoxyribonukleinsäure.
  • Der Begriff „RNA" bezieht sich auf Ribonukleinsäure.
  • Der Begriff „natürliches Nukleotid" bezieht sich auf diejenigen Nukleotide, die die fundamentalen Baublöcke einer zellulären DNA bilden, die definitionsgemäß Desoxycytidylsäure (pdC), Desoxyadenylsäure (pdA), Desoxyguanylsäure (pdG) und Desoxythymidylsäure (pdT) umfassen, und die die fundamentalen Baublöcke einer zellulären RNA bilden, die definitionsgemäß Desoxycytidylsäure (pdC), Desoxyadenylsäure (pdA), Desoxyguanylsäure (pdG) und Desoxyuridylsäure (pdU) umfassen. pdU wird als natürliches Äquivalent von pdT betrachtet.
  • Der Begriff „natürliche Nukleotidbase" bezieht sich auf Basen vom Purin- und Pyrimidin-Typ, die in zellulärer DNA zu finden sind und Cytosin (C), Adenin (A), Guanin (G) und Thymin (T) umfassen, und die in zellulärer RNA zu finden sind und Cytosin (C), Adenin (A), Guanin (G) und Uracil (U) umfassen. U wird als natürliches äquivalent von T betrachtet.
  • Der Ausdruck „modifiziertes Nukleotid" bezieht sich auf eine Einheit in einem Nukleinsäurepolymer, die eine modifizierte Base-, Zucker- oder Phosphatgruppe enthält oder die in ihrer Struktur einen Nicht-Nukleotid-Anteil enthält. Das modifizierte Nukleotid kann mittels einer chemischen Modifikation des Nukleotids entweder als Teil des Nukleinsäurepolymers oder vor der Integration des modifizierten Nukleotids in das Nukleinsäurepolymer hergestellt werden. Beispielsweise können die oben erwähnten Verfahren zur Synthese eines Oligonukleotids eingesetzt werden. Bei einem anderen Lösungsansatz kann ein modifiziertes Nukleotid hergestellt werden, indem ein modifiziertes Nukleosid-Triphosphat während einer Amplifikationsreaktion in die Polymerkette integriert wird. Beispiele modifizierter Nukleotide umfassen, im Sinne der Veranschaulichung und nicht der Einschränkung, Dideoxynukleotide, Derivate oder Analoga, die biotinyliert, aminmodifiziert, alkyliert, mit Fluorophor markiert und dergleichen werden und ferner Phosphorthioat, Phosphit, ringatommodifizierte Derivate usw. umfassen.
  • Der Ausdruck „Basenpaarung gemäß Watson-Crick" bezieht sich auf die Wasserstoffbrückenbindung zwischen zwei Basen, wobei spezifische Muster von Wasserstoffbrückenbindungsdonatoren und -akzeptoren die standardmäßigen Geometrien aufweisen, die bei „Principles of Nucleic Acid Structure", Wolfram Saenger, Springer-Verlag, Berlin (1984), definiert sind.
  • Der Ausdruck „Basenpaarungsspezifizität" einer Nukleotidbase b bezieht sich auf die Anzahl von natürlichen Nukleotidbasen, mit denen die Base Watson-Crick-Hasenpaare bildet. Der Begriff wird mit Sbp(b) angegeben. Beispielsweise lautet das Sbp(b) für die vier natürlichen Nukleotide wie folgt: Sbp(A) = 1, Sbp(G) = 1, Sbp(O) = 1 und Sbp(T) = 1.
  • Der Ausdruck „natürliches Komplement eines Nukleotids" bezieht sich auf das natürliche Nukleotid, mit dem ein Nukleotid am liebsten ein Hasenpaar gemäß den Watson-Crick-Basenpaarungsregeln bildet. Wenn das Nukleotid mit gleicher Affinität mit mehr als einem natürlichen Nukleotid Basenpaare bilden kann oder sich in verschiedenen Umgebungen am liebsten mit verschiedenen natürlichen Nukleotiden paart, so wird das Nukleotid als mehrere natürliche Nukleotidkomplemente aufweisend betrachtet.
  • Der Ausdruck „natürliches Äquivalent eines Nukleotids" bezieht sich auf das natürliche Komplement des natürlichen Komplements des Nukleotids. In Fällen, in denen ein Nukleotid mehrere natürliche Komplemente aufweist, wird es als mehrere natürliche Äquivalente aufweisend angesehen.
  • Der Ausdruck „natürliches Äquivalent eines Oligonukleotid-Vorläufers" bezieht sich auf einen Oligonukleotid-Vorläufer, bei dem jedes Nukleotid durch sein natürliches Nukleotid-Äquivalent ersetzt wurde. In Fällen, in denen ein oder mehr der ursprünglichen Nukleotide mehrere natürliche Äquivalente aufweist bzw. aufweisen, werden die Oligonukleotid-Vorläufer als mehrere natürliche Äquivalente aufweisend angesehen, wobei Äquivalente aus allen möglichen Ersatzkombinationen ausgewählt werden. Der Ausdruck wird mit NE(ω) angegeben.
  • Der Begriff „Nukleosid" bezieht sich auf eine Base-Zucker-Kombination oder ein Nukleotid, dem ein Phosphatanteil fehlt.
  • Ein „Kettenabbruch-Nukleosid-Triphosphat" ist ein Nukleosid-Triphosphat, das in der Lage ist, in einer Kettenverlängerungsreaktion zu einem Oligonukleotid-Primer hinzugefügt zu werden, jedoch nicht in der Lage ist, einer Kettenverlängerung unterzogen zu werden. Beispiele, die lediglich veranschaulichend und nicht einschränkend sind, umfassen die vier standardmäßigen Dideoxynukleotid-Triphosphate, massenmodifizierte Dideoxynukleotid-Triphosphat-Analoga, Thio-Analoga von natürlichen und massenmodifizierten Dideoxynukleotid-Triphosphaten, Arabanose, 3'-Amino-, 3'-Azido-, 3'-Fluor-Derivate und dergleichen.
  • Der Ausdruck „Dideoxynukleosid-Triphosphat" bezieht sich auf und umfasst die vier natürlichen Dideoxynukleosid-Triphosphate (ddATP, ddGTP, ddCTP und ddTTP für DNA und ddATP, ddATP, ddCTP und ddUTP für RNA) und massenmodifizierten Dideoxynukleosid-Triphosphate. Der Begriff kann durch ddNTP angegeben werden.
  • Der Ausdruck „Verlängerungs-Nukleosid-Triphosphate" bezieht sich auf und umfasst natürliche Desoxynukleosid-Triphosphate, modifizierte Desoxynukleotid-Triphosphate, massenmodifizierte Desoxynukleosid-Triphosphate, 5'(α)-Phosphothioat und 5'-N-(α-Phosphoramidat)-Analoga von natürlichen und massenmodifizierten Desoxy- und Ribonukleosid-Triphosphaten und dergleichen, z. B. diejenigen, die in der U.S.-Patentschrift Nr. 5,171,534 und in der U.S.-Patentschrift Nr. 5,547,835 offenbart sind.
  • Der Ausdruck „Nukleotidpolymerase" bezieht sich auf einen Katalysator, üblicherweise ein Enzym, zum Bilden einer Verlängerung eines Polynukleotids entlang einer DNA- oder RNA-Matrize, wobei die Verlängerung dazu komplementär ist. Die Nukleotidpolymerase ist eine matrizenabhängige Polynukleo tidpolymerase und verwendet Nukleosid-Triphosphate als Baublöcke zum Verlängern des 3'-Endes eines Polynukleotids, um eine zu der Polynukleotidmatrize komplementäre Sequenz zu liefern. Üblicherweise sind die Katalysatoren Enzyme, z. B. DNA-Polymerasen, beispielsweise prokaryotische DNA-Polymerase (I, II oder III), T4-DNA-Polymerase, T7-DNA-Polymerase, E.coli-DNA-Polymerase (Klenow-Fragment, 3'-5'-Exo-), Revertase, Vent-DNA-Polymerase, Pfu-DNA-Polymerase, Taq-DNA-Polymerase, Bst-DNA-Polymerase und dergleichen, oder RNA-Polymerasen, z. B. T3- und T7-RNA-Polymerasen. Polymeraseenzyme können von jeglicher Quelle wie z. B. Zellen, Bakterien wie z. B. E. coli, Pflanzen, Tieren, Viren, thermophilen Bakterien usw., gewonnen werden.
  • Eine „Amplifikation" von Nukleinsäuren oder Polynukleotiden ist jegliches Verfahren, das zur Bildung von einer oder mehr Kopien eines Nukleinsäure- oder Polynukleotidmoleküls (exponentielle Amplifikation) oder zur Bildung von einer oder mehr Kopien lediglich des Komplements eines Nukleinsäure- oder Polynukleotidmoleküls (lineare Amplifikation) führt. Amplifikationsverfahren umfassen die Polymerasekettenreaktion (PCR), die auf wiederholten Denaturierungszyklen, Oligonukleotid-Primer-Tempern und Primer-Verlängerung anhand einer thermophilen matrizenabhängigen Polynukleotidpolymerase beruht, was zur exponentiellen Zunahme von Kopien der gewünschten Sequenz des durch die Primer flankierten Polynukleotidanalyten führt. Die zwei verschiedenen PCR-Primer, die zu gegenüberliegenden Strängen der DNA tempern, sind so positioniert, dass das Polymerasekatalysierte Verlängerungsprodukt eines Primers als Matrizenstrang für den anderen dienen kann, was zur Akkumulierung eines charakteristischen doppelsträngigen Fragments führt, dessen Länge durch den Abstand zwischen den 5-Enden der Oligonukleotid-Primer definiert wird. Die Reagenzien zum Durchführen einer derartigen Amplifikation umfassen O-ligonukleotid-Primer, eine Nukleotidpolymerase und Nukleosid-Triphosphate wie z. B. Desoxyadenosin-Triphosphat (dATP), Desoxyguanosin-Triphosphat (dGTP), Desoxycytidin- Triphosphat (dCTP) und Desoxythymidin-Triphosphat (dTTP). Andere Verfahren zur Amplifikation umfassen eine Amplifikation eines einsträngigen Polynukleotids unter Verwendung eines einzigen Oligonukleotid-Primers, die Ligasekettenreaktion (LCR), die auf einer Nukleinsäuresequenz basierte Amplifikation (NASBA), das Q-Beta-Replikase-Verfahren und 3SR.
  • Die Begriffe „Hybridisierung (Hybridisieren)" und „Binden" im Kontext von Nukleotidsequenzen werden in dem vorliegenden Dokument austauschbar verwendet. Die Fähigkeit zweier Nukleotidsequenzen, miteinander zu hybridisieren, beruht auf dem Grad der Komplementarität der beiden Nukleotidsequenzen, der wiederum auf dem Anteil übereinstimmender komplementärer Nukleotidpaaren beruht. Je mehr Nukleotide in einer gegebenen Sequenz zu einer anderen Sequenz komplementär sind, desto strenger können die Bedingungen für die Hybridisierung sein, und desto spezifischer ist die Bindung der zwei Sequenzen. Eine erhöhte Strenge wird erzielt, indem die Temperatur erhöht, das Verhältnis von Hilfslösungsmitteln erhöht, die Salzkonzentration verringert wird und dergleichen. Hybridisierung umfasst in ihrer Definition auch die unbeständige Hybridisierung zweier komplementärer Sequenzen. Fachleuten wird einleuchten, dass eine nicht-kovalente Bindung zwischen zwei Molekülen, einschließlich Nukleinsäuren, den Massenwirkungsgesetzen gehorcht. Deshalb ist eine Hybridisierung zwischen zwei Nukleotidsequenzen über eine Zeitdauer hinweg, die eine Primer-Verlängerung bzw. -Extension und/oder -Ligation ermöglicht, in dem Schutzumfang der Erfindung enthalten.
  • Der Begriff „komplementär", „Komplement" oder „komplementäre Nukleinsäuresequenz" bezieht sich auf den Nukleinsäurestrang, der anhand der Watson-Crick-Basenpaarungsregeln auf die Rasensequenz in einem anderen Nukleinsäurestrang bezogen ist. Allgemein sind zwei Sequenzen komplementär, wenn sich die Sequenz des Einen in einer antiparallelen Richtung an die Sequenz des Anderen binden kann, wobei sich das 3'- Ende jeder Sequenz an das 5'-Ende der anderen Sequenz bindet, und jedes A, T(U), G und C einer Sequenz anschließend mit T(U), A, C bzw. G der anderen Sequenz ausgerichtet wird. RNA-Sequenzen können auch komplementäre G/U- oder U/G-Basenpaare umfassen.
  • Der Begriff „Hybrid" bezieht sich auf ein doppelsträngiges Nukleinsäuremolekül, das durch eine Wasserstoffbrückenbindung zwischen komplementären Nukleotiden gebildet wird. Der Begriff „Hybridisieren" bezieht sich auf den Prozess, anhand dessen einzelne Stränge von Nukleinsäuresequenzen durch eine Wasserstoffbrückenbindung zwischen komplementären Nukleotiden doppelhelixförmige Segmente bilden.
  • Der Begriff „massenmodifiziert" bezieht sich auf eine Nukleinsäuresequenz, deren Masse entweder durch eine interne Veränderung – d. h. durch eine Addition, eine Deletion oder eine Substitution eines chemischen Anteils – ihrer chemischen Struktur oder durch eine externe Veränderung – d. h. durch die Addition eines chemischen Anteils (Atom oder Molekül), der kovalent angelagert wurde – ihrer chemischen Struktur verändert wurde. Der chemische Anteil wird somit als Massemodifizierungsanteil bezeichnet.
  • Der Ausdruck „Massenzahl eines Atoms" bezieht sich auf die Nukleonenzahl des häufigsten Isotops des interessierenden Elements.
  • Die berichtete Masse für alle Nukleinsäuren (d. h. Nukleotide, Nukleotidvorläufer, Oligonukleotide, X-mer und X-mer-Produkte) wird unter Verwendung der Massenzahlen für die am häufigsten auftretenden Isotope der konstituierenden Atome (d. h. C12, N14, H1, 016, P31, I127) und eines Protonierungszustands, der in einer wässrigen Lösung bei einem pH-Wert von 7 stabil ist, berechnet.
  • Der Ausdruck „Massenzahl eines Oligonukleotid-Vorläufers" bezieht sich auf die Summe der Massenzahlen der konstituie renden Atome der Oligonukleotid-Vorläufer. Der Ausdruck wird mit z(ω) bezeichnet.
  • Der Ausdruck „Massenzahlhistogramm eines Gemischs von Oligonukleotid-Vorläufern" Ω bezieht sich auf eine Funktion h von den natürlichen Zahlen bis zu den natürlichen Zahlen, die durch h(z) definiert sind, wobei h(z) die Anzahl von Oligonukleotid-Vorläufern in dem Gemisch Ω ist, wofür gilt:
    z(ω) = z.
  • Der Ausdruck „durchschnittliche Mehrdeutigkeit eines Gemischs von Oligonukleotid-Vorläufern" (A(Ω)) bezieht sich auf die Summe der Quadrate der Werte des Massenzahlhistogramms des Gemischs von Oligonukleotid-Vorläufern geteilt durch die Anzahl von Oligonukleotid-Vorläufern in dem Gemisch, und kann mathematisch wie folgt ausgedrückt werden: A(Ω) = 1/NΣ zh(z)2
  • Der Ausdruck „Massenzahlkomplexität" (MNC – mass number complexity) bezieht sich auf die Anzahl von Oligonukleotid-Vorläufern in dem Gemisch geteilt durch die durchschnittliche Mehrdeutigkeit des Gemischs von Oligonukleotid-Vorläufern, und kann mathematisch wie folgt definiert werden: MNC(Ω) = N/A(Ω)
  • Der Ausdruck „Oligonukleotid-Bedeckungskomplexität" CCo(ω) kann mathematisch wie folgt ausgedrückt werden:
    Figure 00320001
    wobei L die Anzahl von Nukleotidbasen in dem Oligonukleotid-Vorläufer ist und bi die i-te Einheit des Oligonukleotid-Vorläufers darstellt.
  • Der Ausdruck „Gemischbedeckungskomplexität" (CCM(Ω)) bezieht sich auf die Summe der Bedeckungskomplexitäten jedes der Oligonukleotid-Vorläufer in dem Gemisch und kann mathematisch wie folgt ausgedrückt werden: CCM(Ω) = ΣCCo(ω)
  • Der Begriff „Kategorisierung" bezieht sich auf die Einteilung eines Gemischs in definierte Teilsatzgemische, wobei jedes einzelne Oligonukleotid des Gemischs in zumindest einem Teilsatzgemisch erscheint.
  • Der Ausdruck „zusammengesetzte Gemischbedeckungskomplexität" bezieht sich auf die Bedeckungskomplexität eines Satzes von Gemischen, die durch eine Kategorisierung erzeugt wird und gleich der Gemischbedeckungskomplexität des ursprünglichen, nicht-kategorisierten Gemisches ist.
  • Der Ausdruck „zusammengesetzte Massenzahlkomplexität" bezieht sich auf die Massenzahlkomplexität eines Satzes von Gemischen, die anhand einer Kategorisierung erzeugt wird und die gleich der Summe der Massenzahlkomplexitäten der Teilsatzgemische ist.
  • Der Ausdruck „direkte Massenspektralanalyse" bezieht sich auf ein Verfahren einer Massenspektralanalyse, das entweder die Targetnukleinsäuresequenz selbst oder das Komplement der Targetnukleinsäuresequenz analysiert. Die Targetnukleinsäuresequenz selbst oder ihr Komplement kann massenmodifiziert werden, zusätzliche Nukleotidbasen enthalten oder auf andere Weise modifiziert sein, vorausgesetzt, dass die Targetnukleinsäuresequenz oder ihr Komplement tatsächlich einer Massenanalyse unterzogen wird. Jedoch umfasst der Ausdruck keine Massenspektralanalyse, bei der ein Mas senmarkierungsanteil, der das Vorhandensein einer Targetnukleinsäuresequenz angibt, analysiert wird, z. B. diejenigen indirekten Verfahren, die in der PCT-Anmeldung WO 95/04160 beschrieben sind.
  • Der Begriff „Generizität" oder „generisch bezieht sich, wenn er auf ein Verfahren angewendet wird, auf ein Verfahren einer Massenspektralanalyse, das ohne Bezugnahme auf bestimmte Informationen angewendet werden kann. Der Ausdruck „positionsbezogene Generizität" bezieht sich auf Massenspektralanalyse-Verfahren, die keine Vorab-Informationen über das Vorliegen, die Position oder die Identität von Mutationen in der Targetnukleinsäuresequenz erfordern. Der Ausdruck „Targetgenerizität" bezieht sich auf Massenspektralanalyse-Verfahren, die keine Vorab-Informationen über die Targetnukleinsäure erfordern.
  • Der Begriff „Träger" oder „Oberfläche" bezieht sich auf ein poröses oder nicht-poröses wasserunlösliches Material. Die Oberfläche kann eine beliebige einer Anzahl von Formen aufweisen, z. B. Streifen, Auflage, Platte, Stab, Partikel, einschließlich Kügelchen, und dergleichen. Der Träger kann hydrophil sein oder er kann in der Lage sein, hydrophil gemacht zu werden, und umfasst anorganische Pulver wie z. B. Siliziumdioxid, Magnesiumsulfat und Aluminiumoxid; natürliche polymere Materialien, insbesondere zellulosische Materialien und aus Zellulose gewonnene Materialien, Z. B. faserhaltige Papiere, z. B. Filterpapier, chromatographisches Papier usw.; synthetische oder modifizierte natürlich vorkommende Polymere, z. B. Nitrozellulose, Zelluloseacetat, Poly(vinylchlorid), Polyacrylamid, vernetztes Dextran, Agarose, Polyacrylat, Polyethylen, Polypropylen, Poly(4-methylbuten), Polystyren, Polymethacrylat, Poly(ethylenterephthalat), Nylon, Poly(vinylbutyrat) usw.; die entweder alleine oder in Verbindung mit anderen Materialien verwendet werden; Glas, das als Bioglass erhältlich ist, Keramik, Metalle und dergleichen. Natürliche oder synthetische Vereinigungen wie z. B. Liposome, Phospholi pidbläschen und Zellen können ebenfalls verwendet werden. Ein Binden von Oligonukleotiden an einen Träger oder eine Oberfläche kann anhand von hinreichend bekannten Techniken, die gemeinhin in der Literatur zur Verfügung stehen, bewerkstelligt werden. Siehe z. B. A. C. Pease u. a., Proc. Nat. Acad. Sci. USA, 91: 5.022-5.026 (1994).
  • Der Begriff „Mutation" bezieht sich auf eine auf Nukleotide bezogene Variation zwischen zwei Polynukleotiden, z. B. bei Einzelnukleotid-Polymorphien. Allgemein treten die Variationen von Individuum zu Individuum auf. Die Mutation kann eine Veränderung der Sequenz von Nukleotiden einer auf normale Weise konservierten Nukleinsäuresequenz sein, die zur Bildung einer Mutanten führt, wie sie von der normalen (unveränderten) oder Wildtyp-Sequenz unterschieden wird. Mutationen können allgemein in zwei allgemeine Klassen unterteilt werden, nämlich Basenpaar-Substitutionen und Frameshift-Mutationen. Die Letztgenannten beinhalten die Einfügung oder Deletion von einem bis mehreren Nukleotidpaaren. Eine Differenz eines einzigen Nukleotids kann bedeutend sein, um den Phänotyp von der Normalität zur Abnormalität zu verändern, z. B. im Fall der Sichelzellenanämie.
  • Gemäß der Verwendung in dem vorliegenden Dokument bezieht sich der Begriff „Markierung" allgemein auf einen chemischen Anteil, der dazu verwendet wird, eine Nukleinsäuresequenz zu identifizieren, und vorzugsweise, aber nicht unbedingt, um eine eindeutige Nukleinsäuresequenz zu identifizieren. Genauer gesagt werden „Markierungen" mit unterschiedlichen relativen Molekülmassen, die somit mittels Massenspektrometrie unterscheidbar sind, bei der vorliegenden Erfindung dazu verwendet, die Massenmehrdeutigkeit zwischen zwei oder mehr Nukleinsäuremolekülen mit unterschiedlichen Nukleotidsequenzen, aber mit den identischen relativen Molekülmassen, zu verringern. Vorzugsweise ist die „Markierung" durch einen spaltbaren Linker kovalent an einen X-mer-Vorläufer gebunden. Markierungen der vorliegenden Erfindung sind mittels Massenspektrometrie analysierbar.
  • Die Begriffe „spaltbare Massemarkierungen", „freisetzbare Markierungen" werden austauschbar verwendet, um auf die hierin definierten Markierungen Bezug zu nehmen, die an dem Linker gespalten werden können, um die Markierung aus den Nukleinsäure-Oligonukleotiden freizusetzen.
  • Der Begriff „Linker" ist gemäß seiner Verwendung hierin als direkte kovalente Bindung oder eine vorzugsweise organische chemische Gruppe definiert, die dazu verwendet wird, ein „Markierungs"-Molekül durch eine oder mehrere kovalente Bindungen mit einem Nukleinsäuremolekül zu verbinden. Außerdem ist ein „spaltbarer Linker" eine oder mehrere Direktbindungen, oder eine oder mehrere Bindungen in dem Linker, die unter Bedingungen spaltbar ist bzw. sind, die ermöglichen, dass die Markierung aus dem Nukleinsäuremolekül, an das sie angelagert war, freigesetzt wird.
  • Allgemeine Anmerkungen
  • Die vorliegende Erfindung liefert Verfahren und Reagenzien, um den Bedarf an empfindlicheren, genaueren und einen höheren Durchsatz ermöglichenden Analysen von Targetnukleinsäuresequenzen zu decken. Die Verfahren und Reagenzien können generisch auf allgemein jegliche Targetnukleinsäuresequenz angewendet werden und erfordern keine Vorab-Informationen über das Vorliegen, die Position oder Identität von Mutationen in der Targetnukleinsäuresequenz.
  • Die Reagenzien der Erfindung, die für eine direkte Massenspektralanalyse von Nukleinsäuren und an Nukleinsäuren gebundenen molekularen Markierungen nützlich sind, sind Gemische, die natürliche X-mer-Vorläufer, massenmodifizierte X-mer-Vorläufer oder natürliche und massenmodifizierte X-mer-Vorläufer, wobei die X-mer-Vorläufer eine Mindestlänge von 3 Nukleotiden aufweisen, umfassen. Die minimale Gemischbedeckungskomplexität (CCM) der Gemische ist 56/N, wobei N die Anzahl von gesonderten X-meren in dem Gemisch ist. Die Länge der X-mer-Vorläufer kann für jeden X-mer-Vorläufer unabhängig ausgewählt werden. Jeder der X-mer-Vorläufer in einem Gemisch wird durch eine einzelne chemische Spezies dargestellt.
  • Die Verfahren und Reagenzien der vorliegenden Erfindung verringern die bei der Massenspektralanalyse einer Targetnukleinsäuresequenz vorliegenden Mehrdeutigkeiten und erhöhen somit bei allen Anwendungen, die die Massenspektrometrie verwenden, die Leistungsfähigkeit, die Sequenz der Targetnukleinsäure zu analysieren. Diese Verringerung wird bewerkstelligt, indem ein Gemisch von natürlichen und massenmodifizierten Oligonukleotid-Vorläufern oder ein Gemisch von massenmodifizierten Oligonukleotid-Vorläufern eingesetzt wird, die ein hohes Maß an Massen- und Bedeckungskomplexität aufweisen. Die Verringerung der Mehrdeutigkeit wird auch dadurch bewerkstelligt, dass ein Gemisch von Oligonukleotid-Vorläufern und ein Satz von mittels Massenspektrometrie unterscheidbaren Markierungen verwendet wird, wobei jede Markierung durch einen spaltbaren Linker an zumindest einen Oligonukleotid-Vorläufer kovalent gebunden ist.
  • Die Verringerung der Massenmehrdeutigkeit kann durch ein „Kategorisieren", d.h. ein Verwenden von Teilsätzen der Gemische in zumindest zwei Reaktionsgemischen, weiter verbessert werden. Die Ergebnisse der getrennten Abfrage bei den Teilsatzgemischen könnten dann kombiniert werden. Auf diese Weise wird das Ausmaß einer Massenüberlappung unter den freigesetzten Markierungen für die markierten X-mer-Reaktionsprodukte gemäß der vorliegenden Erfindung bei einer gegebenen Massenanalyse verringert, während gleichzeitig ein hohes Maß einer Gesamtbedeckungskomplexität des Targets aufrechterhalten wird.
  • Die Gemische der Erfindung sind insofern generisch oder universell, als sie bei jeglicher Anwendung verwendet werden können, deren Ziel darin besteht, Sequenzinformationen ei ner Targetnukleinsäure zu bestimmen. Ferner können die Gemische ohne Bezugnahme auf jegliche Vorab-Informationen über die Targetnukleinsäuresequenz, einschließlich z. B. des Vorliegens, der Position oder der Identität einer Mutation, entworfen werden. Dies soll jedoch nicht implizieren, dass die Gemische beim Analysieren von Targetnukleinsäuresequenzen nicht nützlich wären, bei denen manche Informationen über die Sequenz vorab bekannt sind. Noch impliziert dies, dass Vorab-Informationen über das Target bei einer Analyse der sich ergebenden Massenspektra nicht sinnvoll eingesetzt werden können.
  • Allgemein liefern Untersuchungen zum Analysieren von Nukleinsäuren, die mit Massenanalyse gekoppelt sind, keine eindeutigen Informationen bezüglich der Sequenz. Beispielsweise liefert ein Feststellen der relativen Molekülmasse eines Nukleinsäuremoleküls nicht die Reihenfolge von Nukleotiden in der Sequenz, sondern liefert vielmehr das Gesamtgewicht der Nukleotide des Nukleinsäuremoleküls. Somit kann unter Verwendung natürlicher Nukleotide die Sequenz GGCTTTA nicht anhand der Masse von der Sequenz CGTTTAG unterschieden werden. Deshalb offenbart ein Erfassen einer Nukleinsäure mittels Massenspektrometrie mit einer Masse von 2142 Dalton lediglich, dass das Oligonukleotid drei Ts, 2 Gs, 1 A und 1 C aufweist.
  • Die Mehrdeutigkeit wird auch durch das Auftreten von zufälligen Massekoinzidenzen erhöht. Mit anderen Worten weisen unterschiedliche Nukleinsäuremoleküle mit unterschiedlichen Nukleotidzusammensetzungen identische Massen auf. Beispielsweise weisen Oligonukleotide, die entweder [sechs As und ein T] oder [ein A, zwei Cs, drei Gs und ein T] enthalten, allesamt eine relative Molekülmasse von 2193 Dalton auf. Der allgemeine Effekt dieser Mehrdeutigkeiten besteht darin, die Länge der Sequenz, die analysiert werden kann, zu verkürzen, da längere Sequenzen zu mehr Masseüberlappungen (d.h. redundanten relativen Molekülmassen; siehe 1) führen.
  • Die oben erörterten Mehrdeutigkeiten bei relativen Molekülmassen können verringert werden, indem die Masse der einzelnen Oligonukleotid-Vorläufer verändert wird. Verfahren zum Verwenden von Kombinationen modifizierter und natürlicher Nukleotide beim Entwurf der X-mer-Vorläufer sind in der US-Patentschrift 6,218,118 beschrieben, die zu einer größeren Masseverteilung der X-mer-Verlängerungs- und -Ligationsprodukte führen. Beispielsweise ist das längste Nukleinsäuretarget, das mit einer Erfolgsquote von 95% für eine einzige Nukleotidänderung in dem Target unter Verwendung der Polymeraseverlängerungsuntersuchung und eines sequenzvollständigen Gemisches aller natürlichen 6-mere (4.096) abgefragt werden kann, etwa 70 Nukleotide. Unter Verwendung eines sorgfältig entworfenen sequenzvollständigen Gemisches aus 6-meren, die aus den vier natürlichen Nukleotiden (A, G, C und T) und einem modifizierten Äquivalent jedes Nukleotids aufgebaut sind, kann diese Länge jedoch um zumindest einen Faktor von 10 erhöht werden, wie durch die US-Patentschrift 6,218,118 gelehrt wird. Die Mehrdeutigkeit kann ferner dadurch verringert werden, dass die 6-mere strategisch in Teilgemische unterteilt werden und dass für jede Targetsequenz mehrere Polymeraseverlängerungsreaktionen durchgeführt werden, wobei jede Reaktion einen eindeutigen Teilsatz von 6-meren verwendet.
  • Bezüglich eines Aspekts liefert die vorliegende Erfindung Gemische, die X-mer-Vorläufer umfassen, die Massemarkierungen enthalten, die durch einen oder mehrere spaltbare Linker angelagert sind, um die Masseredundanzen für Nukleinsäuremoleküle, die dieselbe relative Molekülmasse, aber unterschiedliche Sequenzen aufweisen, zu verringern oder zu eliminieren. Die Massemarkierung ist über die Nukleotidbase, den Ribosering und/oder die Phosphathauptkette durch eine spaltbare kovalente Bindung an den X-mer-Vorläufer gebunden. Vorzugsweise verändert die Bindung der Massemarkierung an den X-mer-Vorläufer nicht die natürlichen Basenpaa rungseigenschaften der X-mere, und sie beeinträchtigt nicht die Polymeraseverlängerungs- oder -ligasereaktion.
  • Die Spaltung des Linkers, um die Massemarkierung aus dem X-mer freizusetzen, kann anhand verschiedener in der Technik bekannter Verfahren bewirkt werden. Vorzugsweise wird die Spaltung entweder thermisch oder durch eine chemische oder photochemische Reaktion oder durch eine mittels einer Kollision bewirkte Dissoziation bewirkt. Die Spaltungsreaktion wird direkt vor dem Schritt der Massenanalyse der freigesetzten Markierung als separater Schritt durchgeführt. Alternativ oder zusätzlich dazu wird die Spaltungsreaktion in dem Massenspektrometer vor dem oder während des eigentlichen Ionisierungsprozesses der Markierung durchgeführt.
  • Die Verwendung von spaltbaren Massemarkierungen weist mehrere Vorteile auf. Ohne Einschränkung auf diese Vorteile kann die absolute Masse und die resultierende Massebandbreite, die für die Analyse benötigt wird, in der 50 bis 1000 betragenden Masse-Zu-Ladung-Bandbreite (m/z-Bandbreite) gehalten werden, da lediglich der Massemarkierungsabschnitt des markierten X-mers analysiert werden soll. Außerdem können die chemischen Eigenschaften der Massemarkierungen so entworfen sein, dass sie ein hohes Maß an Erfassungssensibilität besitzen. Diese Vorteile einer Verwendung von spaltbaren Massemarkierungen reduzieren die Verhaltensanforderungen der Massenspektrometrie und verringern somit die Kosten der Analyse. Ferner erleichtert die Anzahl von diskreten Massemarkierungen, die benötigt werden, um ein nützliches sequenzvollständiges Gemisch von markierten X-meren zu erzeugen, die Synthesen der Markierungen. Beispielsweise umfassen die 4.096 natürlichen 6-mere lediglich 84 diskrete Massen. Deshalb weist auf Grund eines Markierens aller natürlichen 6-mere mit Markierungen aus einem Satz von 84 Markierungen, die mittels Massenspektrometrie nach der Freisetzung aus den Nukleinsäuren unterscheidbar sind, ein Gemisch, das alle markierten 6- mere umfasst, ein verringertes Maß an Massemehrdeutigkeit auf.
  • Außerdem sind die Sequenzen aller natürlichen 6-mere nicht gleichmäßig unter den 84 möglichen relativen Molekülmassen verteilt, sondern weisen vielmehr eine Gaußsche Verteilung auf, wobei die Spitze der Verteilung Sequenzen entspricht, die die höchste Massenredundanz aufweisen (1). Beispielsweise gibt es 6 diskrete relative Molekülmassen, die jeweils etwa 180 verschiedene 6-mer-Sequenzen aufweisen, die dieser relativen Molekülmasse entsprechen. Diese Redundanz erhöht die insgesamte Mehrdeutigkeit von Daten aus Massenspektrometrieanalysen und verringert somit die Leistungsfähigkeit von Untersuchungen, die MS verwenden.
  • Im Gegensatz dazu sind Nukleinsäureanalysen anhand von MS, die beispielsweise 6-mere verwenden, die mit einer ähnlichen Anzahl von freisetzbaren Massemarkierungen, die diskrete relative Molekülmassen (84 gegenüber 64-128) aufweisen, markiert sind, potentiell leistungsfähiger, da die Markierungen spezifisch einer definierten X-mer-Sequenz zugewiesen sein können, die statt einer Gaußschen Verteilung eine viel gleichmäßigere Masseverteilung ermöglichen kann (1). Beispielsweise können alle 4.096 6-mere gleichmäßig unter 128 diskreten Massemarkierungen verteilt sein. Somit weist ein sequenzvollständiger Satz von 4.096 6-meren, die mit lediglich 128 diskreten Markierungen spezifisch markiert sind, eine Mutationsidentifikationsauflösungsleistungsfähigkeit auf, die größer ist als die Auflösungsleistungsfähigkeit eines Gemisches aus gänzlich natürlichen 6-meren.
  • Reagenzien der Erfindung
  • Oligonukleotid-Vorläufer (X-mer-Vorläufer)
  • Die Oligonukleotid-Vorläufer-Reagenzien (X-mer-Vorläufer-Reagenzien) der Erfindung sind Gemische von natürlichen X-mer-Vorläufern, massenmodifizierten X-mer-Vorläufern oder natürlichen und massenmodifizierten X-mer-Vorläufern, die eine Mindestlänge von drei Nukleotiden und eine Gemischbedeckungskomplexität von etwa 15/16 aufweisen, wenn das Gemisch zumindest 60 gesonderte X-mer-Vorläufer enthält. Die X-mer-Vorläufer sind jeweils durch einen spaltbaren Linker mit einem chemischen Anteil markiert, wobei der chemische Anteil (Markierung) mittels Massenspektrometrie erfassbar ist. Vorzugsweise ist die Anzahl von Markierungen, die anhand von MS unterscheidbar sind, in dem Gemisch ausreichend, um (1) die Massenmehrdeutigkeit des Gemisches zu verringern, und/oder (2) die Komplexität der Massenspektralanalyse zu verringern, indem Anteile zur Analyse in einem Bereich zwischen etwa 50 und 1000 m/z bereitgestellt werden.
  • Wenn die durchschnittliche Länge des X-mer-Vorläufers zunimmt, nimmt auch die Anzahl gesonderter X-mere in den Gemischen der vorliegenden Erfindung zu, und die Gemischbedeckungskomplexität mag abnehmen. Die Untergrenze der Gemischbedeckungskomplexität ist gleich 56 geteilt durch die Anzahl von X-meren in dem Gemisch. Die Länge der X-mer-Vorläufer kann für jeden X-mer-Vorläufer unabhängig ausgewählt werden.
  • Die jeweilige Zusammensetzung des Gemischs wird von Fall zu Fall bestimmt und hängt von den Anforderungen der gegebenen Anwendung ab. Die Zusammensetzung eines Gemischs wird durch die hierin dargelegten Gleichungen definiert. Die Gemischbedeckungskomplexität ist wie folgt definiert: CCM(Ω) = ΣCCo(ω) wobei CCo die Oligonukleotid-Bedeckungskomplexität jedes der Oligonukleotid-Vorläufer in dem Gemisch ist und wie folgt definiert ist:
    Figure 00430001
    wobei L die Anzahl von Nukleotidbasen in dem Oligonukleotid-Vorläufer ist, Sbp die Basenpaarungsspezifizität ist und bi die i-te Einheit des Oligonukleotid-Vorläufers darstellt.
  • Beispiele von Gemischen, die die oben beschriebenen Spezifikationen aufweisen, umfassen veranschaulichungs- und nicht einschränkungshalber: (1) ein Gemisch Ω1, das aus 60 der möglichen 64 3-mere besteht (CCM1) = 15/16, was größer ist als 56/60 = 14/15); (2) ein Gemisch Ω2, das aus 128 der möglichen 256 4-mere besteht (CCM2) = 1/2), was größer ist als 56/128 = 7/16); (3) ein Gemisch Ω3, das aus 256 der möglichen 1.024 5-mere besteht (CCM3) = 1/4), was größer ist als 56/256 = 7/32); (4) ein Gemisch Ω4, das aus 512 der möglichen 4.096 6-mere besteht (CCM4) = 1/8), was größer ist als 56/512 = 7/64); (5) ein Gemisch Ω5, das aus 1.024 der möglichen 4.096 6-mere besteht (CCM5) = 1/4); (6) ein Gemisch Ω6, das aus 48 5-meren und 512 6-meren besteht (CCM6) = 11/64); (7) ein Gemisch Ω7, das aus 128 5-meren, 512 6-meren und 128 7-meren besteht (CCM7) 33/128); (8) ein Gemisch Ω8, das aus 256 5-meren, 1.000 6-meren und 96 7-meren besteht (CCM8) = 1/2).
  • Beispiele von Gemischen, die den obigen Spezifikationen nicht entsprechen, umfassen veranschaulichungs- und nicht einschränkungshalber: (1) ein Gemisch Ω9, das aus 64 der möglichen 256 4-mere besteht (CCM9) = 1/4 < 56/64), (2) ein Gemisch Ω10, das aus 128 der möglichen 1.024 5-mere besteht (CCM10) = 1/8 < 56/128), (3) ein Gemisch Ω11, das aus 384 6-meren und 128 7-meren besteht (CCM11) = 13/128 < 56/512), (4) ein Gemisch Ω12, das aus 64 5-meren, 256 6-meren und 64 7-meren besteht (CCM12) = 33/256 < 56/384).
  • Jeder X-mer-Vorläufer in einem Gemisch oder Satz von Teilgemischen ist mit einem chemischen Anteil markiert, der eine mittels Massenspektrometrie erfassbare Masse aufweist. Markierungen der vorliegenden Erfindung sind durch einen oder mehrere spaltbare Linker kovalent an jeden X-mer-Vorläufer gebunden. Verfahren zum Anlagern freisetzbarer Massemarkierungen an Moleküle und insbesondere Nukleinsäuren sind in der Technik bekannt (siehe USP 6,027,890 ). Wie oben erörtert wurde, weisen X-mer-Vorläufer, die natürliche Nukleotide umfassen, Masseredundanzen auf, die verringert oder eliminiert werden können, indem die Vorläufer mit Molekülen markiert werden, die diskrete relative Molekülmassen aufweisen.
  • Bei einem Ausführungsbeispiel wird die Anzahl von diskreten Markierungen, die in einem Gemisch verwendet werden sollen, als Prozentsatz der Massenzahlkomplexität (MNC – mass number complexity) des Gemisches ohne Markierungen und Linker (d.h. vor dem Markieren), wobei jeder X-mer-Vorläufer um ein Nukleotid verlängert ist (d.h. L + 1), ermittelt.
  • Die Massenzahlkomplexität bezieht sich auf die Anzahl von X-mer-Vorläufern in dem Gemisch geteilt durch die durchschnittliche Mehrdeutigkeit des Gemischs von X-mer-Vorläufern, und kann mathematisch wie folgt definiert werden: MNC(Ω) = N/A(Ω)
  • Die durchschnittliche Mehrdeutigkeit des Gemisches von X-mer-Vorläufern (A(Ω)) bezieht sich auf die Summe der Quadrate der Werte des Massenzahlhistogramms des Gemischs von X-mer-Vorläufern geteilt durch die Anzahl von X-mer-Vorläufern in dem Gemisch, und kann mathematisch wie folgt ausgedrückt werden: A(Ω) = 1/NΣ zh(z)2
  • Das Massenzahlhistogramm eines Gemisches von X-mer-Vorläufern (h(z)) bezieht sich auf eine Funktion h von den natürlichen Zahlen zu den durch h(z) definierten natürlichen Zahlen, wobei h(z) die Anzahl von X-mer-Vorläufern in dem Gemisch Ω ist, wofür gilt: z(ω) = z.
  • Bei dem vorliegenden Ausführungsbeispiel beträgt die Anzahl von Markierungen in dem Satz von Markierungen, die kovalent an X-mer-Vorläufer in dem Gemisch gebunden sind, zumindest 50%, 75%, 90%, 100%, 150%, 200%, 1000% oder 10000% der MNC des Gemisches ohne Markierungen und Linker (d.h. vor dem Markieren), wobei jeder X-mer-Vorläufer um ein Nukleotid verlängert ist (d.h. L + 1), und weniger als die Anzahl von X-mer-Vorläufern in dem Gemisch. Als Veranschaulichungsbeispiel wird die Anzahl von Markierungen, die für ein Gemisch verwendet werden sollen, mit der MNC des Gemisches vor dem Markieren verglichen, wobei das Gemisch gänzlich natürliche 6-mere als X-mer-Vorläufer in durch die vorliegende Erfindung beschriebenen Untersuchungen umfasst.
  • Die MNC eines Gemisches aus gänzlich natürlichen 7-meren beträgt etwa 53. Die 7-mere sind die Polymeraseverlängerungsreaktionsprodukte von gänzlich natürlichen 6-meren + Kettenabbruch-Dideoxynukleotiden (eine Beschreibung der Verfahren folgt in einem späteren Abschnitt). Die durchschnittliche Mehrdeutigkeit von 7-meren beträgt etwa 300. Vereinfacht gesagt beträgt die durchschnittliche Redundanz der relativen Molekülmasse von gänzlich natürlichen 7-meren etwa 300. Deshalb ist, da die MNC die Anzahl von gesonderten X-meren (für 7-mere; 47 = 16384) geteilt durch die durchschnittliche Mehrdeutigkeit (53 = 16384/300) ist, eine sinnvolle Anzahl von diskreten Markierungen vorzugsweise größer als die MNC der Reaktionsprodukte von nicht-markierten X-mer-Vorläufern.
  • Zum Vergleich, nicht-markierte massenmodifizierte X-mer-Vorläufer, wie sie in der US-Patentschrift 6,218,118 beschrieben sind, üblicherweise beträgt die MNC des Gemisches zumindest etwa das Doppelte, noch üblicher zumindest etwa das Zehnfache und am stärksten bevorzugt zumindest etwa das Fünfzigfache der Massenzahlkomplexität jeglichen natürlichen Äquivalents des Gemisches. Beispielsweise weist das Gemisch aller natürlichen 4.096 6-mere eine MNC von 53 auf (siehe nachfolgende Erörterung). Ein Gemisch, das alle 4.096 6-mere enthält, die auf kombinatorische Weise synthetisiert werden, um massenmodifizierte X-mere herzustellen, kann eine MNC von 348 aufweisen, was etwa das 6,5-fache des natürlichen Äquivalents ist. Ein anderes Gemisch, bei dem jedes X-mer individuell synthetisiert wird, kann eine MNC von 559 aufweisen, was etwa das Zehnfache des natürlichen Äquivalents ist. Ein Gemisch, bei dem jedes der 4.096 6-mere eine eindeutige Masse besitzt, würde eine MNC von 4.096 aufweisen, was etwa das 77-fache des natürlichen Äquivalents ist.
  • Es ist wichtig, dass der von Southern ( WO 95/04160 ) offenbarte Lösungsansatz einer spaltbaren Massemarkierung einen „Leitermarkierungs"-Entwurf verwendet, bei dem jede diskrete Oligonukleotidsequenz in dem Gemisch einem „Spektrum" von Massenentitäten zugeordnet ist. Dies steht im Gegensatz zu markierten X-mer-Vorläufern der vorliegenden Erfindung, bei denen ein Gemisch von markierten X-meren so entworfen ist, dass jegliche gegebene Oligonukleotidsequenz in dem Gemisch an vorzugsweise eine einzige Massemarkierung mit einer diskreten relativen Molekülmasse angelagert ist.
  • Bei einem anderen Ausführungsbeispiel wird die Anzahl von diskreten Markierungen (d.h. durch MS unterscheidbar), die bei einem Gemisch verwendet werden sollen, indem die Markierungen kovalent an X-mer-Vorläufer gebunden werden, als Prozentsatz der Anzahl von X-mer-Vorläufern in dem Gemisch ermittelt. Beispielsweise beträgt die MNC eines Gemisches aus gänzlich natürlichen 7-meren etwa 53. Die 7-mere sind die Polymeraseverlängerungsreaktionsprodukte von gänzlich natürlichen 6-meren plus Kettenabbruch-Dideoxynukleotiden (eine Beschreibung der Verfahren folgt in einem späteren Abschnitt). Die durchschnittliche Mehrdeutigkeit von 7-meren beträgt etwa 300. Vereinfacht gesagt beträgt die durchschnittliche Redundanz der relativen Molekülmasse aller natürlichen 7-mere etwa 300. Da die MNC die Anzahl von gesonderten X-meren (für 7-mere; 47 = 16384) geteilt durch die durchschnittliche Mehrdeutigkeit (53 = 16384/300) ist, ist deshalb eine sinnvolle Anzahl von diskreten Markierungen vorzugsweise größer als die MNC der Reaktionsprodukte von nicht-markierten X-mer-Vorläufern. Da die MNC von 53 etwa 1% der Anzahl der Oligonukleotid-Vorläufer aus lauter natürlichen 6-meren beträgt (53/4096 = 1,3%), beträgt eine bevorzugte Anzahl von mittels MS unterscheidbaren Markierungen, die zu verwenden sind, zumindest etwa 0,5%, 1%, 2%, 5%, 10%, 20%, 25%, 50% oder 75% der Anzahl von X-mer-Vorläufern in einem Gemisch und weniger als die Gesamtanzahl von X-mer-Vorläufern in dem Gemisch.
  • Bei einem anderen Ausführungsbeispiel beträgt eine bevorzugte Anzahl von Markierungen in einem Satz, wobei ein Gemisch X-mer-Vorläufer von 3-meren umfasst, auf der Basis der Erörterung von Massezahlkomplexitäten mehr als 10, 20, 30 oder 40; und weniger als die Anzahl von X-mer-Vorläufern in dem Gemisch. Für ein Gemisch, das X-mer-Vorläufer von 4-meren umfasst, beträgt eine bevorzugte Anzahl von Markierungen in einem Satz von Markierungen, die kovalent an die X-mer-Vorläufer gebunden sind, mehr als 10, 20, 30, 40, 50, 75, 100, 150 oder 200; und weniger als die Anzahl von X-mer-Vorläufern in dem Gemisch. Für ein Gemisch, das X-mer-Vorläufer von 5-meren umfasst, beträgt eine bevorzugte Anzahl von Markierungen in einem Satz von Markierungen, die kovalent an die X-mer-Vorläufer gebunden sind, mehr als 10, 20, 30, 40, 50, 75, 100, 150, 200, 250, 500, 750 oder 1000; und weniger als die Anzahl von X-mer-Vorläufern in dem Gemisch. Für ein Gemisch, das X-mer-Vorläufer von 6-meren um fasst, beträgt eine bevorzugte Anzahl von Markierungen in einem Satz von Markierungen, die kovalent an die X-mer-Vorläufer gebunden sind, mehr als 25, 50, 100, 250, 500, 1000, 2000, 3000 oder 4000; und weniger als die Anzahl von X-mer-Vorläufern in dem Gemisch. Auf der Basis dieser Beispiele können Fachleute die Mindestanzahl von mittels MS unterscheidbaren Markierungen, die für ein Gemisch zu verwenden sind, das X-mer-Vorläufer mit bestimmten Nukleotidlängen aufweist, ohne übermäßiges Experimentieren ermitteln.
  • Die bei dem Verfahren der Erfindung nützlichen X-mer-Vorläufer weisen eine Länge von zumindest drei Nukleotideinheiten auf. Vorzugsweise weisen die X-mer-Vorläufer eine Länge von zumindest vier Nukleotideinheiten, stärker bevorzugt zumindest fünf Nukleotideinheiten und am stärksten bevorzugt zumindest sechs Nukleotideinheiten auf. Die Länge des X-mer-Vorläufers kann für jeden X-mer-Vorläufer in dem Gemisch unabhängig ausgewählt werden. Somit ist es möglich, ein einziges Gemisch von X-mer-Vorläufern zu haben, die Längen von fünf, sechs und sieben Nukleotiden aufweisen. Wie aus der obigen Erörterung hervorgeht, nehmen der Wert der Gemischbedeckungskomplexität und somit die Anforderungen an dieselbe mit zunehmender Länge des X-mer-Vorläufers ab. In Fällen, in denen ein einziges Gemisch mehr als eine Länge besitzt, wird die Bedeckungskomplexität des Gemisches erhalten, indem die Bedeckungsindizes der einzelnen Oligonukleotide summiert werden. Somit würde in diesem Fall der Beitrag jedes Oligonukleotids zu der Bedeckungskomplexität des Gemisches von seiner Länge abhängen: kürzere Oligonukleotide tragen mehr bei. Man sollte beachten, dass eine Verwendung von langen Oligonukleotide zu einem Verlust an Generizität führen kann. Niedrigere Gemischbedeckungskomplexitätswerte mögen nur dann verwendet werden, wenn ein Verlust an Generizität toleriert werden kann. Ferner können die Reagenzien einen Satz von Gemischen von Oligonukleotid-Vorläufern umfassen. In diesem Fall kann die Gemischbedeckungskomplexität (gemäß dem Absatz „Definitionen`) eines beliebigen Angehörigen des Satzes niedriger als die oben beschriebene sein, solange die Gesamtkomplexität des Gemisches der obigen Beschreibung entspricht.
  • Die bei dem Verfahren der Erfindung nützlichen X-mer-Vorläufer können jeweils durch eine einzige chemische Spezies dargestellt werden, statt durch eine Anzahl von Varianten von ähnlichen chemischen Spezies dargestellt zu werden, z. B. die Leiter von Reporterprodukten, die verwendet werden, um die Nukleotidsequenz in dem Oligonukleotid darzustellen, das in der PCT-Anmeldung WO 95/04160 (Southern) beschrieben ist. Somit besitzt jeder X-mer-Vorläufer in dem Gemisch der Erfindung eine einzige Masse, wohingegen jedem Oligonukleotid in dem Gemisch der WO 95/04160 ein Spektrum von Massen zugeordnet ist, die die interessierende Nukleotidsequenz darstellen, wie oben erörtert wurde.
  • Um bei den Verfahren der vorliegenden Erfindung nützlich zu sein, ist es wünschenswert und oft notwendig, zu wissen, welche X-mer-Vorläufer in dem Gemisch vorliegen. Jedoch ist es nicht absolut notwendig, den Spiegel jedes X-mer-Vorläufers zu kennen. Trotzdem ist es vorteilhaft, in der Lage zu sein, die Konzentration jedes X-mers in dem Gemisch zu steuern, um Unterschiede bei Doppel-Thermostabilitäten zu kompensieren (siehe nachfolgende Erörterung).
  • MARKIERUNGEN
  • Molekularmarkierungen wurden anhand der USP 6,027,890 an Van Ness et al. beschrieben.
  • Eine Markierung, die bei der vorliegenden Erfindung nützlich ist, besitzt mehrere Attribute:
    • 1) Eine Markierung ist von allen anderen Markierungen unterscheidbar, vorzugsweise mittels Massenspektrometrie.
    • 2) Die Markierung ist in der Lage, erfasst zu werden, wenn sie zu 10–22 bis 10–6 Mol vorliegt.
    • 3) Die Markierung besitzt einen chemischen Griff, durch den sie an ein Nukleotid oder eine Nukleinsäure angelagert werden kann, das bzw. die die Markierung identifizieren soll, vorzugsweise eindeutig, aber nicht unbedingt. Die Anlagerung kann direkt an eine Nukleinsäure oder vorzugsweise indirekt durch eine „Linker"-Gruppe, vorzugsweise einen spaltbaren Linker, erfolgen.
    • 4) Die Markierung ist bezüglich aller Manipulationen, denen sie unterworfen wird, einschließlich einer Anlagerung an und einer Abspaltung von dem Nukleinsäuremolekül, und jeglicher Manipulationen des Nukleinsäuremoleküls, während die Markierung daran angelagert ist, stabil.
    • 5) Die Markierung beeinträchtigt die Manipulationen, die an dem Nukleinsäuremolekül durchgeführt werden, während die Markierung daran angelagert ist, nicht beträchtlich. Wenn beispielsweise die Markierung an ein Oligonukleotid angelagert ist, darf die Markierung jegliche Hybridisierungs- oder enzymatische Reaktionen (z.B. PCR-Sequenzierungsreaktionen), die an dem Oligonukieotid durchgeführt werden, nicht beträchtlich beeinträchtigen.
  • Um mittels Massenspektrometrie analysierbar zu sein, sollte die Markierung ionisierbar sein. Somit besteht ein bevorzugtes Element bei dem Entwurf von MS-lesbaren Markierungen darin, in dieselben eine chemische Funktionalität zu integrieren, die unter Ionisierungsbedingungen in der MS eine positive oder negative Ladung tragen können. Dieses Merkmal verleiht eine verbesserte Effizienz einer Innenbildung und eine größere Erfassungssensibilität insgesamt, vor allem bei der Elektrospray-Ionisation oder der chemischen Ionisation bei Atmosphärendruck (EI oder APCI). Die chemische Funktionalität, die eine ionisierte Ladung trägt, kann von der Markierung oder dem Linker oder von beiden abgeleitet sein. Faktoren, die die relative Sensibilität eines Analyten, der mittels Massenspektrometrie erfasst wird, erhöhen können, sind z.B. bei Sunner et al. Anal. Chem. 60:1300-1307 (1988) erläutert.
  • Eine bevorzugte Funktionalität zum Ermöglichen des Tragens einer negativen Ladung ist eine organische Säure, z.B. Phenolhydroxyl, Carbonsäure, Phosphonat, Phosphat, Tetrazol, Sulfonylharnstoff, Perfluoralkohol und Sulfonsäure. Eine bevorzugte Funktionalität zum Ermöglichen des Tragens einer positiven Ladung unter Ionisationsbedingungen sind aliphatische oder aromatische Amine. Beispiele von aminfunktionellen Gruppen, die eine verbesserte Erfassbarkeit von MS-Markierungen liefern, umfassen quaternäre Amine (d.h. Amine, die vier Bindungen, jede an Kohlenstoffatomen, aufweisen, siehe Aebersold, US-Patentschrift Nr. 5,240,859 ) und tertiäre Amine (d.h. Amine, die drei Bindungen, je an Kohlenstoffatomen, aufweisen, was C=N-C-Gruppen umfasst, wie sie bei Pyridin vorliegen, siehe Hess et al., Anal. Biochem. 224:373, 1995; Bures et al., Anal. Biochem. 224:364, 1995). Tertiäre Amine sind besonders bevorzugt. Tertiäre und quaternäre Amine können Alkyl oder Aryl sein. Ein eine Markierung enthaltender Anteil muss zumindest eine ionisierbare Spezies tragen, kann jedoch mehr als eine ionisierbare Spezies besitzen. Der bevorzugte Ladungszustand ist eine einzige ionisierte Spezies pro Markierung. Dementsprechend ist bevorzugt, dass jeder eine Markierung enthaltende Anteil (und jede markierungsvariable Komponente) lediglich eine einzige Amin- oder Organische-Säure-Gruppe enthält. Nicht einschränkende Beispiele von geeigneten Amin enthaltenden Radikalen, die einen Bestandteil des eine Markierung enthaltenden Anteils bilden, sind durch die USP 6,027,890 beschrieben.
  • Die Identifizierung einer Markierung mittels Massenspektrometrie beruht vorzugsweise auf ihrem Verhältnis zwischen Molekularmasse und Ladung (m/z). Der bevorzugte Molekularmassebereich von MS-Markierungen liegt zwischen etwa 100 und 2.000 Dalton, und vorzugsweise weist der eine Markierung enthaltende Anteil eine Masse von zumindest etwa 250 Dalton, stärker bevorzugt zumindest etwa 300 Dalton, und noch stärker bevorzugt zumindest etwa 350 Dalton, auf.
  • Wie oben erläutert wurde, kann der eine Markierung enthaltende Anteil andere Atome enthalten als diejenigen, die in der markierungsvariablen Komponente vorliegen, und in der Tat andere, als diejenigen, die in der Markierung selbst vorliegen. Demgemäß kann die Masse der Markierung selbst weniger als etwa 250 Dalton betragen, solange der eine Markierung enthaltende Anteil eine Masse von zumindest etwa 250 Dalton aufweist. Somit kann die Masse einer Markierung zwischen 15 (d.h. ein Methylradikal) und etwa 10.000 Dalton liegen, und beträgt vorzugsweise zwischen 100 und etwa 5.000 Dalton, und liegt stärker bevorzugt zwischen etwa 200 und etwa 1.000 Dalton.
  • Es ist relativ schwierig, Markierungen mittels Massenspektrometrie zu unterscheiden, wenn diese Markierungen Atome beinhalten, die mehr als ein Isotop in beträchtlicher Häufigkeit aufweisen. Demgemäß enthalten bevorzugte Markierungsgruppen, die zur massenspektroskopischen Identifikation gedacht sind, Kohlenstoff, zumindest entweder Wasserstoff und/oder Fluorid und optionale Atome, die aus Sauerstoff, Stickstoff, Schwefel, Phosphor und Jod ausgewählt sind. Obwohl andere Atome in der Markierung vorliegen können, kann ihr Vorhandensein eine Analyse der Massenspektraldaten etwas schwieriger machen. Vorzugsweise weisen die Markierungsgruppen zusätzlich zu Wasserstoff und/oder Fluorid lediglich Kohlenstoff-, Stickstoff- und Sauerstoffatome auf. Stärker bevorzugt verwenden die Markierungen isotopisch reine Elemente, um die aus Isotopen resultierende Mehrdeutigkeit bei der MS-Analyse zu verringern. Alternativ oder zusätzlich dazu ist der Isotopengehalt jedes Elements in dem Satz von Markierungen bekannt oder wird ermittelt, so dass Beiträge zu Massespitzen von Isotopen von Elementen in MS-Daten berechnet werden können.
  • Fluorid ist ein Atom, das in einer Markierungsgruppe optional, jedoch bevorzugt vorliegt. Im Vergleich zu Wasserstoff ist Fluorid selbstverständlich viel schwerer. Somit führt das Vorliegen von Fluoridatomen statt Wasserstoffatomen zu Markierungsgruppen einer höheren Masse, was ermöglicht, dass die Markierungsgruppe eine Masse von mehr als 250 Dalton erreicht und überschreitet, was wünschenswert ist, wie oben erläutert wurde. Außerdem verleiht die Ersetzung von Wasserstoff durch Fluorid dem eine Markierung enthaltenden Anteil eine höhere Flüchtigkeit, und eine höhere Flüchtigkeit des Analyten verbessert die Sensibilität, wenn als Erfassungsverfahren die Massenspektrometrie verwendet wird.
  • Die molekulare Formel einer Markierung fällt in den Bereich von C1-500N0-100O0-100S0-10P0-10HαFβIδ, wobei die Summe von α, β und 6 ausreichend ist, die ansonsten nicht erfüllten Valenzen der C-, N-, O-, S- und P-Atome zu erfüllen. Die Bezeichnung C1-500N0-100O0-100S0-10P0-10HαFβIδ bedeutet, dass die Markierung zumindest ein Kohlenstoffatom enthält und eine beliebige Anzahl zwischen 1 und 500 Kohlenstoffatome enthalten kann, zusätzlich dazu, dass sie optional zwischen etwa 0 und 100 Stickstoffatome, zwischen etwa 0 und 100 Sauerstoffatome, zwischen etwa 0 und 10 Schwefelatome und zwischen etwa 0 und 10 Phosphoratome enthält. Die Symbole α, β und δ stellen die Anzahl von Wasserstoff-, Fluorid- und Jodidatomen in der Markierung dar, wobei beliebige zwei dieser Anzahlen null sein können, und wobei die Summe dieser Anzahlen gleich der Gesamtzahl der ansonsten nicht erfüllten Valenzen der C-, N-, O-, S- und P-Atome ist. Vorzugsweise weist die Markierung eine molekulare Formel auf, die in den Bereich von C1-50N0-10O0-10HαFβ fällt, wobei die Summe von α und β gleich der Anzahl von Wasserstoff- bzw. Fluoridatomen, die in dem Anteil vorliegen, ist.
  • LINKER
  • Spaltbare Linker zur Verwendung gemäß der vorliegenden Erfindung sind in der Technik bekannt. Beispielsweise beschreibt die USP 6,027,890 die Verwendung und Synthese von spaltbaren Linkern zur kovalenten Anlagerung an interessierende Nukleinsäuremoleküle.
  • Eine „Linker"-Komponente, wie sie hierin verwendet wird, ist entweder eine direkte kovalente Bindung oder eine organische chemische Gruppe, die dazu verwendet wird, eine „Markierung" durch kovalente chemische Bindungen mit einem X-mer-Vorläufer oder Nukleotid zu verbinden. Außerdem ist bzw. sind die direkte Bindung selbst oder eine oder mehrere Bindungen in der Linkerkomponente unter Bedingungen spaltbar, die ermöglichen, dass die Markierung aus dem die Markierung enthaltenden Anteil und/oder dem Oligonukleotid freigesetzt (d.h. abgespalten) wird. Die markierungsvariable Komponente, die in einer Markierung vorliegt, sollte bezüglich der Spaltbedingungen stabil sein. Vorzugsweise kann die Spaltung rasch, innerhalb einiger weniger Minuten, und vorzugsweise innerhalb von 15 Sekunden oder weniger, bewerkstelligt werden.
  • Allgemein wird ein Linker dazu verwendet, jede eines großen Satzes von Markierungen mit jedem eines gleich großen Satzes von Oligonukleotiden zu verbinden. Üblicherweise kann an jedes Oligonukleotid einer unterschiedlichen Sequenz eine einzelne Markierung-Linker-Kombination (T-L)-Kombination (T = tag, Markierung) angelagert werden. Alternativ oder zusätzlich dazu kann an mehrere Oligonukleotidsequenzen eine einzelne Markierung-Linker-Kombination angelagert werden.
  • Nach verschiedenen Manipulationen des Satzes von markierten X-mer-Vorläufern und Oligonukleotiden werden spezielle che mische und/oder physikalische Bedingungen eingesetzt, um eine oder mehrere kovalente Bindungen in dem Linker zu spalten, was zu der Befreiung der Markierungen aus den Nukleinsäuren führt. Die spaltbare(n) Bindung(en) kann bzw. können manche derselben Bindungen sein, die gebildet wurden, als die Markierung, der Linker und die Nukleinsäuren miteinander verbunden wurden, muss bzw. müssen aber nicht. Die Auslegung des Linkers bestimmt zu einem großen Teil die Bedingungen, unter denen eine Spaltung bewerkstelligt werden kann. Demgemäß können Linker anhand der Spaltungsbedingungen, für die sie besonders empfänglich sind, identifiziert werden.
  • Linker können photolabil (d.h. anfällig für eine Spaltung durch einen Kontakt mit einer aktinischen Strahlung) sein.
  • Linker können auch empfänglich für eine Spaltung anhand einer Säure, einer Base, einer chemischen Oxidation, einer chemischen Reduktion, einer enzymatischen Spaltung, einer elektrochemischen Oxidation oder Reduktion, einer erhöhten Temperatur („thermisch") und eines Thiolaustauschs sein.
  • Bestimmte Linkerarten sind bezüglich eines einzigen Typs einer Spaltungsbedingung labil, wohingegen andere bezüglich mehrer Arten von Spaltungsbedingungen labil sind. Außerdem kann bei Linkern, die in der Lage sind, mehrere Markierungen zu binden, jede der Markierungsbindungsstellen bezüglich verschiedener Spaltungsbedingungen labil sein. Beispielsweise mag bei einem Linker, an den zwei Markierungen gebunden sind, eine der Markierungen lediglich bezüglich einer Base labil sein, und die andere mag lediglich bezüglich einer Photolyse labil sein.
  • Ein Linker, der bei der vorliegenden Erfindung nützlich ist, besitzt mehrere Attribute:
    • 1) Der Linker besitzt einen chemischen Griff, durch den er an einen Oligonukleotid-X-mer-Vorläufer oder an einen Nukleotid-Vorläufer angelagert werden kann.
    • 2) Der Linker besitzt einen zweiten, separaten chemischen Griff, durch den die Markierung an den Linker angelagert ist. Wenn mehrere Markierungen an einen einzigen Linker angelagert sind, dann existiert für jede Markierung ein separater Griff.
    • 3) Der Linker ist gegenüber allen Manipulationen, denen er unterworfen ist, stabil, mit der Ausnahme der Bedingungen, die eine Spaltung ermöglichen, so dass ein eine Markierung enthaltender Anteil aus der restlichen Verbindung freigesetzt wird. Somit ist der Linker während einer Anlagerung der Markierung an den Linker, einer Anlagerung des Linkers an die Nukleinsäuren und jeglicher Manipulationen der Nukleinsäuren, während die Markierung und der Linker daran angelagert sind, stabil.
    • 4) Der Linker beeinträchtigt die Manipulationen, die an den Nukleinsäuren durchgeführt werden, während die T-L daran angelagert ist, nicht beträchtlich. Wenn die T-L beispielsweise an ein Oligonukleotid angelagert ist, darf die T-L jegliche Hybridisation oder enzymatischen Reaktionen, die an dem Oligonukleotid gemäß den Lehren der vorliegenden Erfindung vorgenommen werden, nicht beträchtlich stören.
    • 5) Eine Abspaltung der Markierung von der restlichen Verbindung erfolgt auf äußerst kontrollierte Weise, wobei physikalische oder chemische Prozesse eingesetzt werden, die die Erfassbarkeit der Markierung nicht negativ beeinflussen.
  • Wie oben erläutert wurde, weist ein bevorzugter Linker die Formel Lh-L1-L2-L3-Lh auf, wobei jedes Lh ein reaktiver Griff ist, der dazu verwendet werden kann, den Linker an ein Markierungsreaktans und ein Nukleotid- oder Oligonukleotidreaktans zu binden.
  • L2 ist ein wesentlicher Teil des Linkers, da L2 dem Linker Labilität verleiht. L1 und L3 sind optionale Gruppen, die effektiv dazu dienen, L2 von den Griffen Lh zu trennen.
  • L1 (das per definitionem näher an T liegt als L3) dient dazu, T von dem erforderlichen labilen Anteil L2 zu trennen. Diese Trennung kann nützlich sein, wenn die Spaltungsreaktion besonders reaktive Spezies (z.B. freie Radikale) erzeugt, die zufällige Veränderungen der Struktur des eine Markierung enthaltenden Anteils bewirken können. Wenn die Spaltungsstelle weiter von dem eine Markierung enthaltenden Anteil getrennt wird, besteht eine verringerte Wahrscheinlichkeit, dass an der Spaltungsstelle gebildete reaktive Spezies die Struktur des eine Markierung enthaltenden Anteils stören. Da außerdem die Atome in L1 üblicherweise in dem eine Markierung enthaltenden Anteil vorliegen, können diese L1-Atome dem eine Markierung enthaltenden Anteil eine gewünschte Qualität verleihen.
  • L1- und/oder L3-Gruppen können eine Direktbindung (wobei die Gruppe in diesem Fall effektiv nicht vorhanden ist), eine Hydrocarbylengruppe (z.B. Alkylen, Arylen, Cycloalkylen usw.), -O-Hydrocarbylen (z.B. -O-CH2-O-CH2CH(CH2)- usw.) oder Hydrocarbylen-(O-Hydrocarbylen)w-, wobei w eine Ganzzahl zwischen 1 und etwa 10 ist, (z. B. -CH2-O-Ar-, -CH2-(O-CH2CH2)4- usw.), sein.
  • Mit dem Aufkommen der Festphasensynthese ist eine große Menge an Literatur bezüglich Linkern entstanden, die bezüglich spezifischen Reaktionsbedingungen labil sind. Bei einer typischen Festphasensynthese wird ein fester Träger durch einen labilen Linker an eine reaktive Stelle gebunden, und ein zu synthetisierendes Molekül wird an der reaktiven Stelle erzeugt. Wenn das Molekül vollständig synthe tisiert wurde, wird das Fester-Träger/Linker/Molekül-Konstrukt Spaltungsbedingungen unterworfen, was das Molekül aus dem festen Träger freisetzt. Die labilen Linker, die zur Verwendung in diesem Zusammenhang entwickelt wurden (oder die in diesem Zusammenhang verwendet werden können), können auch ohne weiteres als Linkerreaktans bei der vorliegenden Erfindung verwendet werden.
  • Lloyd-Williams, P., et al., „Convergent Solid-Phase Peptide Synthesis", Tetrahedron Report Nr. 347, 49(48): 11065-11133 (1993) liefert eine umfassende Erörterung von Linkern, die bezüglich einer aktinischen Strahlung (d.h. Photolyse) sowie gegenüber Säure-, Base- und anderen Spaltungsbedingungen labil sind. Zusätzliche Informationsquellen über labile Linker sind in der Technik hinreichend bekannt.
  • Wie oben beschrieben wurde, verleihen unterschiedliche Linkerausgestaltungen unter unterschiedlichen spezifischen physikalischen und chemischen Bedingungen eine Spaltbarkeit („Labilität"). Beispiele von Bedingungen, die dazu dienen, verschiedene Ausgestaltungen von Linkern zu spalten, umfassen Säure-, Base-, Oxidations-, Reduktions-, Fluorid-, Thiolaustausch-, Photolyse- und enzymatische Bedingungen.
  • Beispiele von spaltbaren Linkern, die die allgemeinen Kriterien für Linker, die oben aufgelistet sind, erfüllen, sind in der Technik hinreichend bekannt und umfassen diejenigen, die in dem von Pierce (Rockford, III.) erhältlichen Katalog zu finden sind. Beispiele umfassen:
    Ethylenglykobis(succinimidylsuccinat)(EGS), ein aminreaktives Vernetzungsreagens, das durch Hydroxylamin spaltbar ist (1M bei 37°C über 3-6 Stunden);
    Disuccinimidyltartarat (DST) und Sulfo-DST, die aminreaktive Vernetzungsreagenzien sind, die durch 0,015M-Natriumperiodat spaltbar sind;
    bis[2-(Succinimidyloxycarbonyloxy)ethyl]sulfon (BSOCOES) und Sulfo-BSOCOES, die aminreaktive Vernetzungsreagenzien sind und durch eine Base (pH-Wert 11,6) spaltbar sind;
    1,4-di-[3'-(2'-Pyridyldithio(propionamido)]butan (DPDPB), ein Pyridyldithiol-Vernetzer, der mittels Thiolaustausch oder Reduktion spaltbar ist;
    N-[4-(p-Azidosalicylamido)-butyl]-3'-(2'-pyridydithio)propionamid (APDP), ein Pyridyldithiol-Vernetzer, der mittels Thiolaustausch oder Reduktion spaltbar ist;
    bis-[beta-4-(Azidosalicylamido)ethyl]-disulfid, ein photoreaktiver Vernetzer, der mittels Thiolaustausch oder Reduktion spaltbar ist;
    N-Succinimidyl-(4-azidophenyl)-1,3'dithiopropionat (SADP), ein photoreaktiver Vernetzer, der mittels Thiolaustausch oder Reduktion spaltbar ist;
    Sulfosuccinimidyl-2-(7-azido-4-methylcumarin-3-acetamid)ethyl-1,3'-dithiopropionat (SAED), ein photoreaktiver Vernetzer, der mittels Thiolaustausch oder Reduktion spaltbar ist;
    Sulfosuccinimidyl-2-(m-azido-o-nitrobenzamido)-ethyl-1,3'dithiopropionat (SAND), ein photoreaktiver Vernetzer, der mittels Thiolaustausch oder Reduktion spaltbar ist.
  • Andere Beispiele von spaltbaren Linkern und der Spaltungsbedingungen, die verwendet werden können, um Markierungen freizusetzen, lauten wie folgt. Eine Silylbindungsgruppe kann mittels Fluorid oder unter sauren Bedingungen gespalten werden. Eine 3-, 4-, 5-, oder 6-substituiertes-2-Nitrobenzyloxy- oder 2-, 3-, 5-, oder 6-substituiertes-4-Nitrobenzyloxy-Bindungsgruppe kann mittels einer Photonenquelle gespalten werden (Photolyse). Eine 3-, 4-, 5-, oder 6-substituiertes-2-Alkoxyphenoxy- oder 2-, 3-, 5-, oder 6-substituiertes-4-Alkoxyphenoxy-Bindungsgruppe kann durch Ce(NH4)2(NO3)6 gespalten werden (Oxidation). Ein NCO2-(Urethan-)Linker kann durch Hydroxid (Base), Säure oder Li-AlH4 gespalten werden (Reduktion). Eine 3-Pentenyl-, 2-Butenyl-, oder 1-Butenyl-Bindungsgruppe kann durch O3, OsO4/IO4 , oder KMnO4 gespalten werden (Oxidation). Eine 2-[3-, 4-, oder 5-substituiertes-Furyl]oxy-Bindungsgruppe kann durch O2, Br2, MeOH oder Säure gespalten werden.
  • Bedingungen für die Spaltung anderer labiler Bindungsgruppen umfassen: t-Alkyloxy-Bindungsgruppen können durch Säure gespalten werden; Methyl(dialkyl)methoxy- oder 4-sibstituiertes-2-Alkyl-1,3-Dioxlan-2-yl-Bindungsgruppen können durch H3O gespalten werden; 2-Silylethoxy-Bindungsgruppen können durch Fluorid oder Säure gespalten werden; 2-(X)-Ethoxy-Bindungsgruppen (wobei X=Keto, Esteramid, Cyan, NO2, Sulfid, Sulfoxid, Sulfon) können unter alkalischen Bedingungen gespalten werden; 2-, 3-, 4-, 5-, oder 6-substituiertes-Benzyloxy-Bindungsgruppen können durch Säure oder unter reduktiven Bedingungen gespalten werden; 2-Butenyloxy-Bindungsgruppen können durch (Ph3P)3RhCl(H) gespalten werden, 3-, 4-, 5-, oder 6-substituiertes-2-Bromophenoxy-Bindungsgruppen können durch Li, Mg oder BuLi gespalten werden; Methylthiomethoxy-Bindungsgruppen können durch Hg2+ gespalten werden; 2-(X)-Ethyloxy-Bindungsgruppen (wobei X=ein Halogen) können durch Zn oder Mg gespalten werden; 2-Hydroxyethyloxy-Bindungsgruppen können durch Oxidation (z.B. mit Pb(OAc)4) gespalten werden.
  • Bevorzugte Linker sind diejenigen, die durch Säure oder Photolyse gespalten werden. Mehrere der säurelabilen Linker, die für eine Festphasen-Peptidsynthese entwickelt wurden, sind nützlich bezüglich dessen, Markierungen an Oligonukleotide der vorliegenden Erfindung zu binden. Manche dieser Linker sind in einem kürzlich erschienenen Bericht von Lloyd-Williams et al. (Tetrahedron 49:11065-11133, 1993) beschrieben. Ein nützlicher Linkertyp beruht auf p- Alkoxybenzylalkoholen, von denen zwei, 4-Ydroxymethylphenoxyessigsäure und 4-(4-Hydroxymethyl-3-methoxyphenoxy)buttersäure, von Advanced ChemTech (Louisville, KY) im Handel erhältlich sind. Beide Linker können über eine Esterbindung mit dem Benzylalkohol an eine Markierung und über eine Amidbindung mit der Carbonsäure an ein Amin enthaltendes Molekül angelagert sein. Markierungen, die durch diese Moleküle gebunden sind, können mit verschiedenen Konzentrationen an Trifluoressigsäure aus den Oligonukleotiden freigesetzt werden. Die Spaltung dieser Linker führt zu der Befreiung einer Carbonsäure an der Markierung. Eine Säurespaltung von Markierungen, die durch verwandte Linker angelagert sind, z.B. 2,4-Dimethoxy-4'-(carboxymethyloxy)benzhydrylamin (in FMOC-geschützter Form von Advanced ChemTech erhältlich), führt zu einer Befreiung eines Carboxylamids an der freigesetzten Markierung.
  • Die für die vorliegende Anmeldung nützlichen photolabilen Linker wurden ebenfalls zum größten Teil für die Festphasen-Peptidsynthese entwickelt (siehe Bericht von Lloyd-Williams, oben). Diese Linker beruhen üblicherweise auf 2-Nitrobenzylestern oder 2-Nitrobenzylamiden. Zwei Beispiele von photolabilen Linkern, über die kürzlich in der Literatur berichtet wurde, sind 4-(4-(1-Fmoc-Amino)ethyl)-2-methoxy-5-nitrophenoxy)butansäure (Holmes und Jones, J. Org. Chem. 60:2318-2319, 1995) und 3-(Fmoc-Amino)-3-(2-nitrophenyl)propionsäure (Brown et al., Molecular Diversity 1:4-12, 1995). Beide Linker können über die Carbonsäure an ein Amin an einer Nukleinsäure angelagert werden. Die Anlagerung der Markierung an den Linker wird durchgeführt, indem ein Amid zwischen einer Carbonsäure an der Markierung und dem Amin an dem Linker gebildet wird. Eine Spaltung von photolabilen Linkern wird üblicherweise mit UV-Licht einer Wellenlänge von 350 nm mit einer Intensität und mit Zeitdauern, die Fachleuten bekannt sind, durchgeführt. Eine Spaltung der Linker führt zu einer Befreiung eines primären Amids an der Markierung. Beispiele von photospaltbaren Linkern umfassen Nitrophenylglycinester, Exo- und Endo-2- benzonorborneylchloride und Methansulfonate und 3-Amino-3(2-nitrophenyl)propionsäure. Beispiele einer enzymatischen Spaltung umfassen Esterasen, die Esterbindungen spalten, Nukleasen, die Phosphodiesterbindungen spalten, Proteasen, die Peptidbindungen spalten usw.
  • Linkergriffe und Anlagerungsverfahren sind durch die USP 6,027,890 beschrieben.
  • Ein Ziel der vorliegenden Erfindung besteht darin, entweder vollständige Gemische oder Sätze von Gemischen zu erzeugen, die mittels MS analysierbare freisetzbare Markierungen aufweisen, wobei die Markierungen den verfügbaren Massebereich des Massenspektrometers nutzen, mit dem gleichzeitigen Ziel des Verringerns der Mehrdeutigkeit von Daten aus einer MS-Analyse von Nukleinsäuren, die Oligonukleotiden, die unterschiedliche Basenpaarungsmuster (Sequenzen) aufweisen, eigen ist. Insbesondere besteht ein Ziel der vorliegenden Erfindung darin, entweder vollständige Gemische oder Sätze von Gemischen zu erzeugen, die molekulare Markierungen aufweisen, die durch spaltbare Bindungen an Oligonukleotide angelagert sind, wobei die Markierungen mittels MS analysierbar sind den verfügbaren Massebereich des Massenspektrometers nutzen, mit den gleichzeitigen Zielen, die Massenmehrdeutigkeit von Oligonukleotiden in dem Gemisch oder in den Sätzen von Gemischen zu reduzieren und Sequenzen von Oligonukleotiden, die an die Markierungen gebunden sind, zu identifizieren. Wie aus der vorliegenden Erörterung hervorgehen sollte, gibt die Menge und Art von Informationen, die bei einer gegebenen Analyse gefragt sind, den erforderlichen Typ des X-mer-Gemisches vor.
  • X-mer-Vorläufer, die mit freisetzbaren und mittels MS analysierbaren chemischen Anteilen markiert sind, können natürliche und/oder massenmodifizierte Nukleotide umfassen. Als Nächstes werden drei Verfahren zum Synthetisieren von X-mer-Vorläufer-Gemischen beschrieben. Dies erfolgt veranschaulichungshalber, nicht einschränkungshalber. Jedes der hierin beschriebenen Verfahren weist bestimmte Vorteile auf, je nach dem Grad der synthetischen Kontrolle über die einzelnen Oligonukleotide, die erforderlich ist. Alle drei Verfahren verwenden standardmäßige Phosphoramidit-Chemien oder enzymatische Reaktionen, die in der Technik bekannt sind. Es wird in Betracht gezogen, dass verschiedene Arten von massenmodifizierten Nukleotidvorläufergemischen für definierte Arten von Anwendungen synthetisiert werden können. Beispielsweise kann ein definiertes Gemisch, das problemlos und kostengünstig herzustellen ist, für Untersuchungen vom Typ eines extrem hohen Durchsatzes und einer geringen Auflösung verwendet werden. Komplexere Gemische, die eventuell kostspieliger herzustellen sind, können für Anwendungen vom Typ einer höheren Auflösung reserviert werden.
  • Die X-mer-Vorläufer können anhand konventioneller Techniken unter Verwendung von natürlichen und/oder modifizierten Nukleotidvorläufern synthetisiert werden, einschließlich Verfahren, die Phosphoramidit-Chemie, einschließlich sowohl 5'-bis-3'- als auch 3'-bis-5'-Syntheserouten, einsetzen. Beispielsweise erfordert eine Synthetisierung von gänzlich 6-meren 4.096 separate Synthesen. Um die Synthese der erforderlichen Anzahl von X-meren zu ermöglichen, können Fachleute auch stark parallele Methodologien verwenden, z.B. die in der USP 5,541,314 beschriebenen und andere, ähnliche Verfahren. Diese Verfahren ermöglichen eine vollständige synthetische Kontrolle jedes einzelnen X-mer-Vorläufers bezüglich Zusammensetzung und Länge.
  • X-mere können in situ entweder in der 3'-bis-5'- oder 5'-bis-3'-Richtung unter Verwendung der 3'-β-Cyanoethylphosphoramidite oder 5'-β-Cyanoethyiphosphoramidite und verwandter, in der Technik bekannter Chemien synthetisiert werden. Eine in-situ-Synthese von X-mer-Vorläufern kann auch in der 5'-bis-3'-Richtung unter Verwendung von Nukleotidkopplungschemien, die 3'-photoentfernbare Schutzgruppen verwenden, durchgeführt werden ( US-Patentschrift 5,908,926 ). Alternativ dazu können X-mere unter Verwendung der standardmäßigen 3'-β-Cyanoethylphosphoramidite und verwandter Chemien in der herkömmlicheren 3'-bis-5'-Richtung an dem standardmäßigen Kontrollporenglas (CPG – control Pore glass) synthetisiert werden (Caruthers M. et al., Methods Enzymology, 154:287-313, 1987; und US-Patentschriften 4,415,732 ; 4,458,066 ), und unter Integrierung einer Primäres-Amin- oder thiolfunktionellen Gruppe an den 5'-Terminus des Oligonukleotids (Sproat et al., Nucleic Acid Res., 15:4837, 1987; Connolly und Rider, Nucleic Acid Res., 13:4485, 1985).
  • Eine individuelle Synthese ermöglicht auch eine Qualitätskontrollanalyse (QC-Analyse, QC = quality control) jedes X-mers, das die Herstellung des Endprodukts unterstützt. Wenn man einzelne Proben von X-meren hat, ermöglicht dies auch, dass jedes X-mer einer gewünschten freisetzbaren Markierung zugewiesen und an eine solche gebunden wird. Wenn man einzelne Proben jedes X-mers hat, ermöglicht dies auch eine Erzeugung von definierten Teilsatzgemischen, um die Gesamtauflösung zu erhöhen. Außerdem ermöglicht es, dass jedes X-mer in einer festgelegten Konzentration in dem Gemisch vorliegt. Dies kann beim Kompensieren unterschiedlicher Thermostabilitäten, die für jedes X-mer/Target-Duplex erwartet werden, potentiell hilfreich sein.
  • Die X-mer-Vorläufer können unter Verwendung einer standardmäßigen Fester-Träger-Phosphoramiditchemie und einer definierten Serie von 25%igen Gemischen jedes Typs von A-, C-, G- und T-Phosphoramidit parallel oder in einer einzigen Synthese synthetisiert werden. Beispielsweise kann eine Synthese schrittweise erfolgen, wobei bei einem 25%igen Gemisch jedes 3'-CPG-gebundenen 5'DMT-geschützten A-, G-, C- und T-Nukleosids begonnen wird. Für die Synthese eines Gemisches aller 4.096 6-mere werden fünf Flaschen, die ein 25%iges Gemisch jedes A-, G-, C- und T-Typs von Phosphoramidit enthalten, zur Verwendung in jeder der fünf Kondensationsreaktionen hergestellt. Beispielsweise enthält die Flasche für den ersten Kondensationsschritt ein 25%iges mo lares Äquivalent der Phosphoramidite, die 2'-O-Methyl-2,6-diaminopurin, 2'-O-Methylguanosin, 2'-Desoxy-5-iodocytidin und Thymidin entsprechen. Die Flasche für die zweite Kondensationsreaktion enthält ein 25%iges molares Äquivalent der Phosphoramidite, die 2'-Desoxyadenosin, 2'-Desoxy-7-deazaguanosin, 2'-O-Methyl-5(1-propynyl)cytidin und 2'-Desoxy-5-fluorouridin entsprechen. Ein ähnliches 25%iges Gemisch anderer Arten von modifizierten A-, G-, C- und T-Phosphoramiditen werden für die drei übrigen Kondensationsschritte erzeugt.
  • Außerdem sind Verfahren zum Synthetisieren von Markierungsmolekülen und zum kovalenten Anlagern derselben an Nukleinsäuren in der Technik bekannt. Bevorzugte Synthese- und Anlagerungsverfahren sind in der USP 6,027,890 beschrieben. Kurz gesagt verwendet ein bevorzugtes Verfahren zum Synthetisieren von Markierungen eine kombinatorische Chemie. Die kombinatorische Chemie ist eine Art einer synthetischen Strategie, die zur Herstellung großer chemischer Bibliotheken führt (siehe z.B. PCT-Anmeldung Veröffentlichungsnr. WO 94/08051 ). Diese kombinatorischen Bibliotheken können als Markierungen zur Identifizierung von Nukleinsäuresequenzen und Molekülen gemäß der vorliegenden Erfindung verwendet werden. Die kombinatorische Chemie kann als systematische und repetitive, kovalente Verbindung eines Satzes unterschiedlicher „Bausteine" variierender Strukturen miteinander, um ein großes Array unterschiedlicher molekularer Entitäten zu ergeben, definiert sein. Bausteine können viele Formen aufweisen, sowohl in der Natur vorkommende als auch synthetische, beispielsweise Nukleophile, Elektrophile, Diene, Alkylierungs- oder Acylierungsmittel, Diamine, Nukleotide, Aminosäuren, Zucker, Lipide, organische Monomere, Synthone und Kombinationen der obigen. Chemische Reaktionen, die dazu verwendet werden, die Bausteine zu verbinden, können eine Alkylierung, Acylierung, Oxidation, Reduktion Hydrolyse, Substitution, Eliminierung, Addition, Cyclisierung, Kondensation und dergleichen beinhalten. Dieser Prozess kann Bibliotheken von Verbindungen erzeugen, die oligomer, nicht-oligomer oder Kombinationen derselben sind. Falls sie oligomer sind, können die Verbindungen verzweigt, unverzweigt oder zyklisch sein. Beispiele von oligomeren Strukturen, die anhand von kombinatorischen Verfahren hergestellt werden können, umfassen Oligopeptide, Oligonukleotide, Oligosaccharide, Polylipide, Polyester, Polyamide, Polyurethane, Polyharnstoffe, Polyetter, Poly(phosphorderivate), z.B. Phosphate, Phosphonate, Phosphoramide, Phosphonamide, Phosphate, Phosphinamide usw. und Poly(schwefelderivate), z.B. Sulfone, Sulfonate, Sulfite, Sulfonamide, Sulfenamide usw.
  • Eine häufig vorkommende Art einer oligomeren kombinatorischen Bibliothek ist die Peptid-kombinatorische Bibliothek. Jüngste Innovationen in der Peptidchemie und der Molekularbiologie ermöglichen nun, dass Bibliotheken hergestellt und verwendet werden können, die aus dutzenden bis hunderten von Millionen unterschiedlicher Peptidsequenzen bestehen. Derartige Bibliotheken können in drei grobe Kategorien eingeteilt werden. Eine Kategorie von Bibliotheken beinhaltet die chemische Synthese von löslichen, nicht an einen Träger gebundenen Peptidbibliotheken (z.B. Houghten et al., Nature 354:84, 1991). Eine zweite Kategorie beinhaltet die chemische Synthese von an einen Träger gebundenen Peptidbibliotheken, die auf festen Trägern wie z.B. Kunststoffnadeln, Harzkügelchen oder Baumwolle präsentiert werden (Geysen et al., Mol. Immunol. 23:709, 1986; Lam et al., Nature 354:82, 1991; Eichler und Houghten, Biochemistry 32:11035, 1993). Bei den ersten beiden Kategorien sind die Bausteine üblicherweise L-Aminosäuren, D-Aminosäuren, unnatürliche Aminosäuren oder ein Gemisch oder eine Kombination derselben. Eine dritte Kategorie verwendet Molekularbiologie-Lösungsansätze, um Peptide oder Proteine auf der Oberfläche von Fadenphagenpartikeln oder Plasmiden herzustellen (Scott und Craig, Curr. Opinion Biotech. 5:40, 1994). Lösliche, nicht an einen Träger gebundene Peptidbibliotheken scheinen für eine Anzahl von Anwendungen, einschließlich einer Verwendung als Markierungen, geeignet zu sein.
  • Das verfügbare Repertoire chemischer Diversitäten bei Peptidbibliotheken kann durch Schritte wie z.B. eine Permethylierung erweitert werden (Ostresh et al., Proc. Natl. Acad. Sci., USA 91:11138, 1994). Zahlreiche Varianten von Peptidkombinatorischen Bibliotheken sind möglich, bei denen die Peptidhauptkette modifiziert ist, und/oder die Amidbindungen durch Nachahmergruppen ersetzt wurden. Amidnachahmergruppen, die verwendet werden können, umfassen Harnstoffe, Urethane und Carbonylmethylengruppen. Eine Umstrukturierung der Hauptkette derart, dass aus den Amidstickstoffen jeder Aminosäure, statt der Alpha-Kohlenstoffe, Seitenketten hervorgehen, liefert Bibliotheken von Verbindungen, die als Peptoide bekannt sind (Simon et al., Proc. Natl. Acad. Sci., USA 89:9367, 1992).
  • Eine weitere häufig vorkommende Art einer oligomeren kombinatorischen Bibliothek ist die Oligonukleotidkombinatorische Bibliothek, bei der Bausteine eine Art von in der Natur vorkommenden oder unnatürlichen Nukleotid- oder Polysaccharidderivaten sind, einschließlich des Falles, bei dem verschiedene organische und anorganische Gruppen die Phosphatbindung ersetzen können, und Stickstoff oder Schwefel Sauerstoff in einer Etherbindung ersetzen können (Schneider et al., Biochem. 34:9599, 1995; Freier et al., J. Med:Chem. 38:344, 1995; Frank; J. Biotechnology 41:259, 1995; Schneider et al., Published PCT WO 942052 ; Ecker et al., Nucleic Acids Res. 21:1853, 1993).
  • In jüngerer Zeit wurde die kombinatorische Herstellung von Sammlungen von nicht-oligomeren, aus kleinen Molekülen bestehenden Verbindungen beschrieben (DeWitt et al., Proc. Natl. Acad. Sci., USA 90:690, 1993; Bunin et al., Proc. Natl. Acad. Sci., USA 91:4708, 1994). Strukturen, die zur Weiterentwicklung in Kleinmolekül-Bibliotheken geeignet sind, umfassen eine große Bandbreite von organischen Molekülen, beispielsweise heterozyklische Verbindungen, aromatische Verbindungen, alicyclische Verbindungen, aliphati sche Verbindungen, Steroide, Antibiotika, Enzymhemmer, Liganden, Hormone, Medikamente, Alkaloide, Opioide, Terpene, Porphyrine, Toxine, Katalysatoren sowie Kombinationen derselben.
  • Bei einem anderen Ausführungsbeispiel von Verfahren zum Synthetisieren von Markierungen sind zwei Verfahren zur Herstellung und Verwendung eines diversen Satzes von Amin enthaltenden MS-Markierungen in der USP 6,027,890 beschrieben. Kurz gesagt wird bei beiden Verfahren eine Festphasensynthese verwendet, um eine gleichzeitige parallele Synthese einer großen Anzahl von markierten Linkern unter Verwendung der Technik der kombinatorischen Chemie zu ermöglichen. Bei dem ersten Verfahren führt die letztendliche Abspaltung der Markierung von dem Oligonukleotid zu einer Befreiung eines Carboxylamids. Bei dem zweiten Verfahren erzeugt die Abspaltung der Markierung eine Carbonsäure.
  • Auswirkungen von X-mer-Modifikationen auf massenspektroskopische, thermodynamische und enzymatische Eigenschaften
  • Die Zusammensetzung der X-mer-Vorläufer beeinflusst direkt die Gesamtspezifität und Empfindlichkeit der Untersuchung. Die Kontrolle sowohl über deren Entwurf als auch über deren Synthesemodus zu haben, ermöglicht außerdem die Einbindung von Modifikationen, die bei deren Verwendung bei den Verfahren der Erfindung helfen. Geeignete Modifikationen umfassen ein Integrieren von nicht Brücken bildenden Thiophosphathauptketten, 5'-N-Phosphoamiditinternukleotidbindungen und dergleichen.
  • Die Modifikation kann die thermodynamische Stabilität der Hybride, die zwischen dem X-mer-Vorläufer und dem Targetnukleinsäuresequenzanalyten gebildet werden, erhöhen, um die thermodynamische Stabilität der Hybride in dem Gemisch zu normieren. Beispielsweise bildet 2,6-Diaminopurin stabilere Hasenpaare mit Thymidin, als Adenosin dies tut. Zu sätzlich erhöht ein Integrieren von 2-Fluorthymidin die Stabilität von A-T-Basenpaaren, wohingegen ein Integrieren von 5-Brom- und 5-Methylcytidin die Stabilität von G-C-Basenpaaren erhöht.
  • Außerdem kann die Verwendung von universellen Basen dazu eingesetzt werden, die thermodynamische Stabilität der Hybride zu erhöhen, ohne komplementäre Hybridisierungseigenschaften der X-mer-Vorläufer zu verändern. Beispielsweise kann das universelle Nukleotid 5-Nitroindol zu den 5'-Enden von X-mer-Vorläufern hinzugegeben werden. Man hat gezeigt, dass ein Zugeben von drei oder vier 5-Nitroindolbasen an ihren 5'-Termini von 8-meren ihre Fähigkeit, Sequenzierungsreaktionen auszulösen, beträchtlich verbessern kann (Ball et al. Nucleic Acids Research 26:5225-5227, 1998). Ohne auf eine Theorie beschränkt zu sein, wurde vorgeschlagen, dass die Verbesserung beim Auslösen von Sequenzierungsreaktionen auf eine Erhöhung einer nicht-spezifischen Basenstapelung zwischen den Target- und den 5-Nitroindol-Basen zurückzuführen ist. Die hinzugegebenen universellen Nukleotide erhöhen die Differenz der intrinsischen thermodynamischen Stabilität zwischen Perfekte- und Einfache-Übereinstimmung-Duplexen, die eine Unterscheidung zwischen den weniger gut erkannten terminalen Nichtübereinstimmungen unterstützen könnte (Fotin et al. Nucleic Acids Research 26:1515-1521, 1998).
  • Alternativ oder zusätzlich dazu können universelle Nukleotide (z.B. 5-Nitroindol-Nukleotid) an internen Positionen in den X-meren integriert sein. Eine interne Integration ermöglicht die Erhöhung der effektiven Länge der X-mere, ohne dabei die Gesamtanzahl von X-meren in dem Reaktionsgemisch, die zum Aufrechterhalten eines sequenzvollständigen Gemisches benötigt werden, erhöhen zu müssen. Beispielsweise könnten die vier verwandten 7-mer-Sequenzen AAGACTG, AAGGCTG, AAGTCTG und AAGCCTG durch ein einziges 7-mer AAGZCTG (wobei Z das universelle Nukleotid 5-Nitroindol ist) dargestellt werden. Ein 7-mer-Gemisch, das auf der Ar chitektur NNNZNNN (N ist gleich A, C, G oder T) beruht, weist dieselbe Auflösungsleistungsfähigkeit auf wie ein 6-mer-Gemisch. Desgleichen weist ein 8-mer-Gemisch, das die Architektur NNZNNZNN aufweist, ebenfalls dieselbe Leistungsfähigkeit auf wie das 6-mer-Gemisch. Durch ein Erhöhen der X-mer-Länge unter Verwendung von universellen Basen können somit sowohl die thermodynamische Stabilität als auch der kinetische Vorteil des X-mer/Target-Duplexes ohne das Erfordernis, die Gesamtanzahl von X-meren in dem Reaktionsgemisch zu erhöhen, erhöht werden.
  • Bei einem anderen Ausführungsbeispiel kann die Hybridstabilität zwischen X-mer-Vorläufern und Targetsequenzen unter Verwendung von Kleine-Furche-Bindung-Molekülen (MGB – minor groove binding), die an X-mer-Vorläufern angelagert sind, erhöht werden. Eine Verwendung von MGB erhöht somit die Duplexhybridstabilität, ohne den Sequenzinformationsgehalt der X-mer-Vorläufer und Gemische, die X-mer-Vorläufer umfassen, zu verändern (siehe Kutyavin et al. Nucleic Acids Research 25:3718-3723, 1997). Beispielsweise verwendeten Kutyavin et al. (oben) ein angebundenes Dihydropyrroloindoltripeptid, um die Nukleinsäure-Duplexstabilität bei Duplexen, die das Tripeptid umfassen, um ganze 40-49 Grad C zu erhöhen.
  • Die Massenmodifikation kann die thermodynamische Stabilität der Hybride, die zwischen dem X-mer-Vorläufer und dem Targetnukleinsäuresequenzanalyten gebildet werden, verringern, um die thermodynamische Stabilität der Hybride in dem Gemisch zu normieren. A-T-Hasenpaare können durch ein Integrieren von 2'-Aminonukleosiden destabilisiert werden. Statt Guanosin kann auch Inosin verwendet werden, um G-C-Basenpaare zu destabilisieren. Es hat sich gezeigt, dass die Integration von N-4-Ethyl-2'-desoxycytidin die Stabilität von G-C-Hasenpaaren verringert. Ein Integrieren des Letztgenannten kann die Stabilität einer beliebigen gegebenen Duplexsequenz in einem Umfang normieren, bei dem deren Stabilität von dem A-T- und dem G-C-Gehalt unabhängig ge macht wird (Nguyen u. a., Nucleic Acids Res. 25, 3.095 (1997)).
  • Modifikationen, die die Fragmentierung des Oligonukleotids aufgrund der Ionisierungsprozesse bei der Massenspektrometrie verringern, können ebenfalls eingeführt werden. Beispielsweise ist ein Lösungsansatz eine 7-Deaza-Modifikation von Purinen, um die N-glycosidische Bindung zu stabilisieren und somit die Fragmentierung von Oligonukleotiden während des Ionisierungsprozesses zu verringern (siehe z. B. Schneider und Chait, Nucleic Acids Res 23, 1.570 (1995)). Eine Modifikation der 2'-Position des Riboserings mit einer Elektronen ziehenden Gruppe wie Z. B. Hydroxyl oder Fluor kann verwendet werden, um die Fragmentierung zu verringern, indem die N-glycosidische Bindung stabilisiert wird (siehe z. B. Tang u. a., J Am Soc Mass Spectrom, 8, 218-224, 1997).
  • Massenmarkierte Kettenabbruch-Nukleotide
  • Die Verwendung von Kettenabbruch-Nukleosid-Triphosphaten wie Z. B. Dideoxynukleosid-Trisphosphaten bei der vorliegenden Erfindung für das PEA-Verfahren unterscheidet sich grundlegend von der in der Technik bekannten. Verfahren der vorliegenden Erfindung verwenden Kettenabbruch-Nukleotide als Mittel, Hybridisierungsereignisse zwischen der Targetnukleinsäure und einer Mehrzahl von markierten X-mer-Vorläufern „zu bewerten" (scoring) (oder festzuhalten), indem sie die Masse der resultierenden Verlängerungsprodukte aus dem Massebereich der nicht-verlängerten X-mer-Vorläufer heraus verschieben. Für nicht-markierte X-mer-Vorläufer gibt diese spezifische Funktion vor, dass die X-mer-Vorläufer, die zu Targetnukleinsäuren hybridisiert sind, von nicht-hybridisierenden X-mer-Vorläufern trennbar seien.
  • Mit anderen Worten ist die Reaktion einer Polymeraseverlängerung dazu da, X-mer-Vorläufer, die zu komplementären Tar getnukleinsäuren hybridisieren, zu kennzeichnen. Eine derartige Hybridisierung ist auf Grund von nicht-kovalenten Wasserstoffbrückenbindungsinteraktionen inhärent vorübergehend. Deshalb können dadurch, dass ein oder mehrere Nukleotide, die vorzugsweise ein Kettenabbruch-Nukleotid umfassen, durch die Polymeraseverlängerungsreaktion hinzugefügt werden, diejenigen X-mer-Vorläufer, die zu Targetsequenzen hybridisiert sind, von nicht-hybridisierenden X-mer-Vorläufern getrennt werden, wodurch Sequenzinformationen über das Target bereitgestellt werden.
  • Wenn beispielsweise X-mer-PEA-Reaktionsprodukte anhand der Masse von Vorläufern getrennt werden, liegt der Massebereich für ein X-mer-Vorläufer-Gemisch, das aus lauter 6-meren besteht, die aus den vier natürlichen Desoxynukleotiden erzeugt wurden, zwischen 1.667 atomaren Masseneinheiten (amu) für (C6) und 1.907 amu für (G6). Dies liefert eine Massebereichsdifferenz von 240 amu. Die Massen der einzelnen natürlichen Dideoxynukleotide (die Monophosphatform minus die Masse eines Wassermoleküls) lauten 296, 312, 272 bzw. 287 amu für pddA, pddG, pddC bzw. pddT. Da die absolute Masse jedes Dideoxynukleotids größer ist als der Massebereich für das natürliche 6-mer-Gemisch, sind sie somit ausreichend dafür, die Massen der X-mer-Vorläufer und X+1-mer-Verlängerungsprodukte zu partitionieren. Wenn jedoch der Massebereich der X-mer-Vorläufer erhöht wird, beispielsweise durch die Einführung von Massenmodifikationen oder durch Verwenden von X-meren gemischter Längen, dann ist es wünschenswert, das Kettenabbruch-Nukleotid mit einer Massemarkierung zu versehen, so dass die Massen aller Verlängrungsprodukte größer sind als die aller X-mer-Vorläufer. Dies würde die Trennung der markierten X-mer-Reaktionsprodukte von den nicht zur Reaktion gebrachten markierten X-mer-Vorläufern beim Verwenden von Massenspektrometrie-Trennverfahren unterstützen.
  • Verfahren der Erfindung
  • Erzeugen von Kurzwortinhalt-Darstellungen von Targetnukleinsäuren
  • Die Erfindung ist auf Verfahren und Reagenzien zum Rekapitulieren einer Targetnukleinsäure in Form eines Satzes von Oligonukleotiden (X-meren), die zu der Targetsequenz komplementär sind, und zum Analysieren des Satzes von molekularen Markierungen, die aus den zu der Targetsequenz komplementären X-meren freigesetzt werden, mittels Massenspektroskopie gerichtet. Der Satz von Oligonukleotiden stellt den „Kurzwort"-Inhalt des Targets dar, der definierte Sequenzinformationen über das Target liefert. Der Satz von Oligonukleotiden, die ein Target darstellen, kann einer von drei allgemeinen Typen sein (2). Der verschachtelte Satz von überlappenden X-meren (2a) ist dadurch gekennzeichnet, dass er eine umfassende Überlappung zwischen den X-meren in dem Satz aufweist. Der verschachtelte Satz von halb-überlappenden X-meren (2b) weist eine geringere Überlappung unter den X-meren auf, wohingegen der nicht-überlappende Satz von X-meren (2c) keine Überlappung aufweist. Bei allen drei Arten von Sätzen muss die X-mer-Länge in einem gegebenen Satz nicht konstant sein. Allgemein weisen die X-mere in dem verschachtelten Satz von überlappenden X-meren eine Länge von etwa 3 bis etwa 18, üblicherweise etwa 5 bis etwa 14, Nukleotiden auf. Für diesen Satz umfasst die Überlappung entlang der gesamten Länge der Targetnukleinsäuresequenz alle Nukleotide bis auf eines. Allgemein weisen die X-mere in dem verschachtelten Satz von halb-überlappenden X-meren eine Länge von etwa 3 bis etwa 18, üblicherweise etwa 5 bis etwa 14, Nukleotiden auf. Allgemein weisen die X-mere in dem verschachtelten Satz von nicht-überlappenden X-meren eine Länge von etwa 3 bis etwa 18, üblicherweise etwa 4 bis etwa 14, Nukleotiden auf. Bei allen drei Lösungsansätzen erfassen die X-mere die gesamte Länge der Targetnukleotidsequenz. Die tatsächliche Anzahl von erzeugten X-meren wird allgemein durch die Länge der Targetnukleotidsequenz und das gewünschte Ergebnis bestimmt. Die Anzahl von X-meren sollte ausreichend sein, um die Ziele der definierten Anwendung zu erzielen. Wenn beispielsweise das Ziel darin besteht, eine Mutationserfassung durchzuführen, dann werden ausreichend viele X-mere benötigt, um das X-mer oder den Satz von X-meren, die die Mutation umfassen, zu unterscheiden.
  • Allgemeine Beschreibung der Verfahren
  • Ein Aspekt der vorliegenden Erfindung ist ein Verfahren zum Analysieren einer Targetnukleinsäuresequenz. Ein Gemisch von X-mer-Vorläufern wird zu den Targetnukleinsäuresequenzen hybridisiert. Das Gemisch umfasst natürliche X-mer-Vorläufer, massenmodifizierte X-mer-Vorläufer oder natürliche und massenmodifizierte X-mer-Vorläufer, die eine minimale Länge von drei Nukleotiden aufweisen. X-mer-Vorläufer der vorliegenden Erfindung weisen auch mittels MS analysierbare Markierungen auf, die durch spaltbare Linker kovalent an die X-mer-Vorläufer gebunden sind.
  • Das Gemisch weist eine Gemischbedeckungskomplexität von etwa 15/16 auf, wenn das Gemisch zumindest 60 gesonderte X-mer-Vorläufer, Z.B. für ein Gemisch aus 3-meren, enthält. Mit zunehmender durchschnittlicher Länge des X-mer-Vorläufers nimmt auch die Anzahl von gesonderten X-meren in den Gemischen dieser Erfindung zu, und die Gemischbedeckungskomplexität mag abnehmen. Die Untergrenze der Gemischbedeckungskomplexität für ein Gemisch (oder eine zusammengesetzte Gemischbedeckungskomplexität für ein Teilgemisch) ist gleich 56/N, wobei N die Anzahl von X-meren in dem Gemisch ist. Die Länge der X-mer-Vorläufer kann für jeden X-mer-Vorläufer unabhängig ausgewählt werden.
  • Bei einem Ausführungsbeispiel werden die Hybride dahin gehend bearbeitet, die X-mer-Vorläufer-Abschnitte der Hybride, die zu komplementären Sequenzen hybridisiert sind, in einer durch eine Targetsequenz bewirkten Reaktion, zu kennzeichnen, so dass X-mer-Vorläufer, die zu einer Targetsequenz hybridisiert sind, von nicht-hybridisierenden X-mer-Vorläufern getrennt werden können. Es ist bevorzugt, dass X-mer-Vorläufer, die zu einer komplementären Targetsequenz hybridisiert sind, dahin gehend bearbeitet werden, die hybridisierenden (d.h. komplementären) X-mere von den nicht-hybridisierenden (d.h. nicht-komplementären) X-mer-Vorläufern zu unterscheiden. Die bearbeiteten X-mer-Vorläufer werden von den nicht-bearbeiteten Vorläufern getrennt. Linker der bearbeiteten X-mer-Vorläufer werden gespalten, um die MS-analysierbaren Markierungen freizusetzen. Eine Massenanalyse der Markierungen liefert den X-mer-Vorläufern, die zu komplementären Targetsequenzen hybridisiert sind, Sequenzinformationen. Die Schritte des Verfahrens können in Lösung oder mit oberflächengebundenen Nukleinsäuren wie z. B. in einem Array durchgeführt werden. Lösungsbasierte Systeme können bevorzugt sein, da sie durch standardmäßige Lösungsmassewirkungs- und -diffusionsprozesse geregelt sind.
  • Herstellung des X-mer-Gemisches:
  • Der erste Schritt des Verfahrens der Erfindung ist das Herstellen eines Gemisches aus X-mer-Vorläufern, die eine geeignete Bedeckungskomplexität für die gegebene Anwendung aufweisen, und einen geeigneten Satz von MS-analysierbaren Markierungen, die X-mer-Vorläufern einer bekannten Sequenz zugewiesen sind, so dass Daten aus einer MS-Analyse von freigesetzten Markierungen Sequenzinformationen über X-mer-Vorläufer liefern, die zu komplementären Targetnukleinsäuresequenzen hybridisiert sind. Das X-mer-Vorläufer-Gemisch kann auch die hierin beschriebenen Attribute bezüglich Ionisierung und thermodynamischer Eigenschaften besitzen. Der Entwurf und die Herstellung des X-mer-Vorläufer-Gemischs kann wie hierin beschrieben durchgeführt werden.
  • Verarbeitungsschritt
  • Nach dem Hybridisieren von X-mer-Vorläufern zu Targetnukleinsäuren besteht der zweite Schritt des Verfahrens der Erfindung darin, die Hybride zu verarbeiten, um die X-mer-Vorläufer-Abschnitte der Hybride gemäß der Beschreibung hierin zu kennzeichnen. Die Veränderung kann entweder mittels einer enzymatischen oder einer chemischen Reaktion bewerkstelligt werden. Geeignete enzymatische Techniken umfassen eine Polymeraseverlängerungsuntersuchung, eine Ligaseuntersuchung und dergleichen. Ein Kennzeichnen von X-mer-Vorläufern kann auch durch ein direktes oder indirektes (d.h. Biotinylierung und Binden an Streptavidin; und/oder Digoxigenin) Integrieren eines signalerzeugenden chemischen Anteils, z.B. eines fluoreszierenden oder radioaktiven Markers, bewerkstelligt werden. Die folgende Erörterung ist eine kurze Beschreibung mancher der verschiedenen Prozesse; eine ausführlichere Erläuterung wird nachstehend dargelegt.
  • Polymeraseverlängerungsuntersuchung
  • Für die Polymeraseverlängerungsuntersuchung (PEA) werden die hybridisierten X-mer-Vorläufer verlängert, indem unter Verwendung einer Nukleotidpolymerase ein einzelnes Nukleotid an dem 3'-Ende der hybridisierten X-mer-Vorläufer polymerisiert wird (siehe 3).
  • Ligaseuntersuchung
  • Für die X-mer-Ligationsuntersuchung (XLA) werden benachbarte hybridisierte X-mer-Vorläufer vor einer Analyse unter Verwendung einer Ligase miteinander ligiert (siehe 4). Es ist bevorzugt, dass die X-mer-Vorläufer eine ausreichende Länge aufweisen, um als gute Substrate zur Ligation durch die Ligase dienen, jedoch nicht zu lang sind, um als Schablonen für eine Ligation von komplementären X-mer- Vorläufern in dem Reaktionsgemisch zu dienen. Man sollte beachten, dass, obwohl es zwar vorzuziehen ist, dass alle benachbarten hybridisierten X-mer-Vorläufer ligiert sind, dies kein Erfordernis ist.
  • Für XLA kennzeichnet eine Ligation eines X-mer-Vorläufers an einen benachbarten X-mer-Vorläufer diejenigen X-mer-Vorläufer, die zu einer Targetsequenz hybridisiert sind. Somit liefert eine Trennung von ligierten X-mer-Vorläufern von nicht-ligierten X-mer-Vorläufern und ein Bestimmen der Sequenzen der ligierten Produkte Nukleotidsequenzdaten für Targetnukleinsäuren.
  • Bei einem Ausführungsbeispiel werden X-mer-Vorläufer mit 5'-Phosphatenden und blockierten 3'-Enden (z.B. Nicht-3'-OH- und/oder Nicht-3'-phosphorylierten Enden; chemische Blockierungsgruppen; oder an 3'-Enden angelagerte Markierungen) mit freisetzbaren Markierungen gemäß der vorliegenden Erfindung markiert. Außerdem nicht-markierte X-mer-Vorläufer, die 5'-OH-(oder blockierte 5'-Enden) und 3'-OH-Enden aufweisen, so dass eine Ligation zwischen markierten und nicht-markierten X-mer-Vorläufern bei einer Orientierung erfolgt. Ligierte Produkte können gemäß einer physikalischen Eigenschaft wie z.B. Masse, Affinität, Energieemission (z.B. Licht, Fluoreszenz, Radioaktivität) unter Verwendung hinreichend bekannter Techniken wie z.B. MS, Chromatographie (z.B. HPLC) und Fluoreszenz-aktiviertes Sortieren von nicht-ligierten X-mer-Vorläufern getrennt werden.
  • Das XLA-Verfahren gemäß der vorliegenden Erfindung umfasst folgende Schritte (gemäß der Beschreibung in 4):
    • 1) Hybridisieren von X-mer-Vorläufern in einem Gemisch oder einem Teilgemisch zu einer Targetnukleinsäure;
    • 2) Ligieren von hybridisierenden X-mer-Vorläufern mit der richtigen chemischen Zusammensetzung und Orientierung von 3'- und 5'-Enden;
    • 3) Trennen von ligierten X-mer-Vorläufern von nicht-ligierten X-mer-Vorläufern;
    • 4) Freisetzen von Markierungen aus getrennten ligierten X-mer-Vorläufern durch ein Spalten von Linkern;
    • 5) Analysieren von Markierungen mittels MS, um Sequenzinformationen über die Targetsequenz zu liefern.
  • Die Ligationsuntersuchung kann mit oberflächengebundenen Arrays durchgeführt werden (siehe 5). Die Arrays weisen eine Oberfläche und eine Vielzahl von an dieselbe angelagerten Oligonukleotidsonden auf. Die Sonden enthalten einen Linker, der an der Oberfläche angelagert ist, und eine Nukleinsäuresequenz, die ein 5'-Ende, das an den Linker angelagert ist, und ein endständiges 3'-OH aufweist.
  • Das Verfahren umfasst die folgenden Schritte:
    • (1) Hybridisieren der Targetnukleinsäuresequenz zu den Sonden;
    • (2) Hinzufügen des markierten Gemisches aus X-mer-Vorläufern zu der Targetnukleinsäuresequenz;
    • (3) Ligieren der hybridisierten X-mer-Vorläufer, die zu den Endständiges-3'-OH-Enden benachbart sind, mit der oberflächengebundenen Sonde, um einen Komplex aus hybridisiertem Vorläufer/Sonde zu bilden, wobei die Targetnukleinsäuresequenz daran angelagert ist;
    • (4) Entfernen von nicht-ligierten markierten X-mer-Vorläufern;
    • (5) Freisetzen von Markierungen aus ligierten X-mer-Vorläufern durch ein Spalten von Linkern, die Markierungen an X-mer-Vorläufer anlagern; und
    • (6) Analysieren des Satzes von freigesetzten Markierungen mittels Massenspektrometrie, um Sequenzinformationen über die Targetsequenz zu liefern.
  • Ausführliche Beschreibung der Verfahren
  • Die folgende Beschreibung ist auf allgemeine Verfahren zum Erzeugen von Oligonukleotidsätzen gerichtet, die den Kurzwortinhalt des Targets darstellen. Jedes Verfahren kann je nach den verwendeten Reagenzien einen oder mehr Typen von Oligonukleotidsätzen erzeugen. Diese Beschreibung erfolgt mittels Veranschaulichung und stellt keine Einschränkung dar. Wie oben erwähnt wurde, wird ein Verfahren als „Polymeraseverlängerungsuntersuchung" (PEA) bezeichnet. Ein weiteres Verfahren wird als „X-mer-Ligationsuntersuchung" (XLA) bezeichnet.
  • Alle Verfahren beruhen auf Oligonukleotidgemischen (X-mer-Gemischen), die aus natürlichen und/oder massenmodifizierten Nukleotiden zusammengesetzt sind, die freisetzbare, MS-analysierbare Markierungen enthalten, die durch spaltbare Linker an die X-mere angelagert sind. Man sollte verstehen, dass die unterschiedlichen Sätze von Gemischen entworfen sein können, um die unterschiedlichen Typen von Sätzen zu erzeugen und somit verschiedene Mengen an Targetsequenzinformationen zu liefern. Durch eine Analyse der Massenspitzen, die in den bei den obigen Verfahren erzeugten Massenspektren vorliegen, und mittels einer Korrelation dieser Spitzen mit Informationen über die an die X-mer-Vorläufer in dem Gemisch gebundenen Markierungen, die für jedes Massenspektrum verantwortlich sind, und möglicherweise mit Vorab-Informationen über die Targetsequenz werden die aus dem Target gewünschten Informationen ermittelt.
  • Die PEA ist ein generisches Verfahren zum Erzeugen von verschachtelten Sätzen von überlappenden und halb überlappenden X-meren. Die Schritte des PEA-Verfahrens sind in 3 gezeigt. Es gibt drei grundlegende Schritte bei diesem Verfahren (2). Bei Schritt 1 darf ein Gemisch (oder ein Satz von Gemischen) von X-meren, die entweder alle möglichen X-mer-Sequenzen oder Teilsätze derselben darstellen, an zufälligen Positionen entlang der Targetnukleinsäuresequenz gemäß Watson-Crick-Basenpaarungsregeln hybridisieren. Bei Schritt 2 werden die hybridisierten X-mere unter Verwendung einer Nukleotidpolymerase wie z. B. einer DNA- oder RNA-abhängigen DNA-Polymerase und eines Gemischs aus einem oder mehr Kettenabbruch-Nukleosid-Triphosphaten wie z. B. Dideoxynukleotid-Triphosphaten um ein einziges Nukleotid verlängert. Bei Schritt 3 werden die resultierenden verlängerten X-mere, d. h. X+1-mer-Verlängerungsprodukte, von nicht-verlängerten X-meren getrennt. Bei Schritt 4 werden Markierungen von den getrennten und verlängerten X-mer-Vorläufern (d.h. Reaktionsprodukten) mittels Spaltung der Linker freigesetzt. Bei Schritt 5 wird der Satz freigesetzter Markierungen mittels Massenspektroskopie analysiert, um Sequenzdaten über die Targetnukleinsäure(n) zu liefern.
  • Das Ausmaß der Überlappung zwischen den X+1-mer-Produkten hängt von der Sequenzvollständigkeit des abfragenden X-mer-Gemisches ab. Wenn beispielsweise alle 4.096 6-mere und alle vier ddNTPs in dem abfragenden Gemisch vorliegen, so ist die maximale Überlappung zwischen den resultierenden 7-mer-Produkten möglich. Das Bereitstellen eines Teilsatzes der 4.096 möglichen 6-mere und/oder eines Teilsatzes der vier ddNTPs führt zu einer geringeren Überlappung zwischen den 7-mer-Produkten und potentiellen Zwischenräumen in der Sequenzbedeckung. Alternativ oder zusätzlich dazu kann die PEA, wie sie gemäß der vorliegenden Erfindung eingesetzt wird, mit einem Teilsatz der 4 ddNTP oder vorzugsweise mit einem der vier ddNTPs durchgeführt werden. Somit enthalten PEA-Reaktionsprodukte, wenn sie mittels MS gemäß der vorliegenden Erfindung analysiert werden, zusätzliche Sequenz informationen, da die Identität des verlängerten Nukleotids bekannt ist.
  • Falls die verlängerten Produkte anhand der Masse von den nicht-verlängerten X-mer-Vorläufern getrennt werden, dann ist bevorzugt, dass die Kettenabbruch-Nukleotide eine ausreichende Masse aufweisen, um das X-mer-Vorläufer-Gemisch und X+1-mer-Verlängerungsprodukte auf effektive Weise zu partitionieren. Es sollte beachtet werden, dass, obwohl es vorzuziehen ist, dass alle der hybridisierten X-mer-Vorläufer verlängert sind, dies kein Erfordernis darstellt. Bei der vorliegenden Erfindung ist die Bestimmung um so genauer, je größer die Anzahl von verlängerten hybridisierten X-mer-Vorläufern ist.
  • Die Kombination von Reagenzien ist Bedingungen unterworfen, unter denen die X-mere zu der Targetnukleinsäure hybridisieren und in der Gegenwart eines Kettenabbruch-Nukleosid-Triphosphats, das zu einem Nukleotid des Targets, das neben dem hybridisierten X-mer liegt, komplementär ist, um ein Nukleotid verlängert werden. Allgemein wird ein wässriges Medium verwendet. Es können auch andere polare Hilfslösungsmittel verwendet werden, üblicherweise mit Sauerstoff angereicherte organische Lösungsmittel von 1-6, üblicherweise von 1-4, Kohlenstoffatomen, einschließlich Alkoholen, Ethern und dergleichen. Üblicherweise liegen diese Hilfslösungsmittel, falls sie verwendet werden, zu weniger als etwa 70 Gewichtsprozent, noch üblicher zu weniger als etwa 30 Gewichtsprozent, vor.
  • Der pH-Wert für das Medium liegt üblicherweise im Bereich von etwa 4,5 bis 9,5, noch üblicher im Bereich von etwa 5,5 bis 8, 5, und vorzugsweise im Bereich von etwa 6 bis 8. Es können verschiedene Puffer verwendet werden, um den gewünschten pH-Wert zu erreichen und um den pH-Wert während der Bestimmung aufrechtzuerhalten. Veranschaulichende Puffer umfassen Borat, Phosphat, Carbonat, Tris, Barbital und dergleichen. Der jeweilige verwendete Puffer ist bei dieser Erfindung nicht kritisch, bei einzelnen Verfahren kann jedoch ein Puffer gegenüber einem anderen bevorzugt sein.
  • Die Reaktion wird ausreichend lange durchgeführt, um die verlängerten X+1-mere zu erzeugen, die ein Kettenabbruch-Nukleosid-Triphosphat enthalten. Allgemein beträgt die Zeitdauer zum Durchführen des gesamten Verfahrens zwischen etwa 10 und 200 Minuten. Üblicherweise ist es wünschenswert, den Zeitraum zu minimieren.
  • Die Konzentration der Nukleotidpolymerase wird üblicherweise empirisch bestimmt. Vorzugsweise wird eine Konzentration verwendet, die ausreichend ist, um die meisten, wenn nicht alle, der Vorläufer-X-mere, die spezifisch zu der Targetnukleinsäure hybridisieren, zu verlängern (siehe unten). Die primären Begrenzungsfaktoren sind allgemein die Reaktionszeit und die Kosten des Reagens.
  • Die Anzahl der Targetnukleinsäuremoleküle kann lediglich 106 in einer Probe betragen, kann jedoch allgemein zwischen etwa 106 und 1013, noch üblicher zwischen etwa 108 und 1012 Molekülen in einer Probe, vorzugsweise zumindest 10–13 M in der Probe, variieren und kann 10–13 bis 10–6 M, noch üblicher 10–11 bis 10–7 M, betragen. Allgemein sind die Reagenzien für die Reaktion in Mengen vorgesehen, um eine Verlängerung der hybridisierten X-mere zu erzielen. Die Anzahl jedes X-mer-Vorläufer-Moleküls beträgt allgemein 1010 und üblicherweise etwa 1010 bis etwa 1013, vorzugsweise etwa 1011 bis etwa 1012 für eine Probengröße, die etwa 10 Mikroliter beträgt. Die Konzentration jedes X-mer-Vorläufers kann gemäß seiner Thermostabilität angepasst werden, wie oben erörtert wurde. Das absolute Verhältnis von Target zu X-mer-Vorläufer soll empirisch bestimmt werden. Die Konzentration der Kettenabbruch-Nukleosid-Triphosphate in dem Medium kann je nach der Affinität der Nukleosid-Triphosphate für die Polymerase variieren. Vorzugsweise liegen diese Reagenzien in einer überschüssigen Menge vor. Die Nukleosid- Triphosphate liegen üblicherweise zu etwa 10–7 bis etwa 10–9 M, vorzugsweise etwa 10–6 bis 10–5 M, vor.
  • Je nach der verwendeten Art der Polymerase, den Konzentrationen von Target und X-meren und den thermodynamischen Eigenschaften der X-mere in dem Gemisch kann die Reaktionstemperatur im Bereich zwischen etwa 0°C und etwa 95°C liegen. Beispielsweise können bei 40 nM Targetnukleinsäuresequenz, 40 nM 6-mer und 7 nM Bst Polymerase zwischen 20% und 50% des 6-mers in zwei Stunden bei 5°C verlängert werden, je nach der Sequenz des 6-mers. Ähnliche Verlängerungseffizienzen werden bei 20°C erreicht, was darauf hinweist, dass die Verlängerungseffizienz nicht allein von der Thermodynamik der Wechselwirkung zwischen X-mer und Target abhängig ist. Wichtig ist, dass es nützlich sein kann, die Inkubationstemperatur zyklisch zu durchlaufen. Ein zyklisches Durchlaufen könnte helfen, eine strukturierte Region des Targets für eine X-mer-Bindung und anschließende Verlängerung freizulegen sowie den Stoffumsatz der Verlängerungsprodukte zu erleichtern. Somit könnte die Gesamtempfindlichkeit der PEA deutlich erhöht werden, indem ermöglicht wird, dass ein gegebenes Targetmolekül als Schablone für mehrere X-mer-Eindungs- und anschließende Verlängerungsreaktionen agiert. Gemäß diesem Aspekt der Erfindung kann ein Zyklus etwa 0,1 bis 5 Minuten lang, noch üblicher etwa 0,5 bis 2 Minuten, bei einer Temperatur von etwa 75°C bis etwa 95°C durchgeführt werden, und ein weiterer Zyklus kann etwa 1 bis 20 Minuten lang, noch üblicher etwa 5 bis 15 Minuten lang, bei einer Temperatur von etwa 5°C bis etwa 45°C ausgeführt werden. Die Anzahl der Zyklen kann etwa 2 bis etwa 20 oder mehr betragen. Allgemein sind die Zyklustemperaturen und die Zyklusdauer ausgewählt, um eine Optimierung der Verlängerung des hybridisierten X-mers einer gegebenen Länge zu liefern.
  • Die Reihenfolge des Kombinierens der verschiedenen Reagenzien, um die Kombination zu bilden, kann variieren. Üblicherweise wird die das Targetpolynukleotid enthaltende Pro be mit einer vorab hergestellten Kombination von Kettenabbruch-Nukleosid-Triphosphaten und Nukleotidpolymerase kombiniert. Die X-mere können in der hergestellten Kombination enthalten sein oder können später hinzugegeben werden. Jedoch können eine gleichzeitige Hinzufügung aller obigen Stoffe sowie andere schrittweise oder nacheinander erfolgende Hinzufügungsreihenfolgen eingesetzt werden, vorausgesetzt, dass alle oben beschriebenen Reagenzien vor dem Beginn der Reaktionen kombiniert werden.
  • XLA ist ein weiteres generisches Verfahren zum Erzeugen verschachtelter Sätze von überlappenden und halbüberlappenden X-meren. Die grundlegenden Schritte für dieses Verfahren sind in 4 gezeigt. Bei Schritt 1 dürfen Gemische von X-meren, die entweder alle möglichen X-mer-Sequenzen oder Teilsätze derselben darstellen, an zufälligen Positionen entlang der Targetnukleinsäuresequenz gemäß Watson-Crick-Basenpaarungsregeln hybridisieren. Ein Gemisch weist Oligonukleotide auf, die 3'-OH-Enden und 5'-OH-(oder 5'-blockierte)Enden aufweisen. Vorzugsweise, jedoch nicht notwendigerweise, sind Oligonukleotide dieses Gemisches nicht-markiert. Ein zweites Gemisch umfasst X-mer-Vorläufer, die mit freisetzbaren Markierungen markiert sind und ferner 5'-Phosphatgruppen und blockierte 3'-Enden umfassen, um eine Ligation an dem 3'-Ende zu verhindern. Bei Schritt 2 werden die X-mere, die in der richtigen Orientierung nebeneinander hybridisieren, unter Verwendung eine Ligase, z. B. einer DNA-Ligase, die die Bildung eine Phosphodiesterbindung unterstützt, um zwei benachbarte Basen in separaten Oligonukleotiden zu verbinden, enzymatisch miteinander ligiert. Derartige Ligasen umfassen Z. B. T4-DNA-Ligase, Taq-DNA-Ligase, E.coli-DNA-Ligase und dergleichen. Alternativ dazu können benachbarte X-mer-Vorläufer unter Verwendung eines Kondensationsmittels chemisch ligiert werden. Geeignete Kondensationsmittel umfassen z. B. Carbodiimide, Cyanbromidderivate und dergleichen. Bei Schritt 3 werden die resultierenden ligierten X-mer-Produkte von nicht-ligierten X-meren getrennt. Bei Schritt 4 werden die Markierungen von den ligierten X-meren, die Markierungen aufweisen, mittels Spaltung der spaltbaren Linker freigesetzt. Bei Schritt 5 wird der Satz von freigesetzten Markierungen mittels Massenspektroskopie analysiert, um Informationen über die Sequenz der Targetnukleinsäuren zu liefern.
  • Die Bedingungen zum Durchführen der Reaktionen sind bei diesem Lösungsansatz ähnlich den oben beschriebenen. Der pH-Wert für das Medium liegt üblicherweise im Bereich zwischen etwa 4,5 und 9,5, noch üblicher im Bereich zwischen etwa 5,5 und 8,5 und vorzugsweise im Bereich von etwa 6 bis B.
  • Die Reaktion wird ausreichend lange durchgeführt, um das gewünschte ligierte Produkt zu erzeugen. Allgemein beträgt der Zeitraum zum Durchführen des gesamten Verfahrens zwischen etwa 10 und 200 Minuten. Es ist üblicherweise wünschenswert, den Zeitraum zu minimieren.
  • Je nach der Art der verwendeten Ligase, den Konzentrationen von Target und X-meren und den thermodynamischen Eigenschaften der X-mere in dem Gemisch kann die Reaktionstemperatur von 0°C bis 95°C variieren. Wie im Fall von PEA kann es vorteilhaft sein, die Inkubationstemperatur zyklisch zu durchlaufen, um die strukturierte Region des Targets für eine X-mer-Bindung und anschließende Ligation freilegen zu helfen sowie den Stoffumsatz der ligierten Produkte zu erleichtern.
  • Die Konzentration der Ligase wird üblicherweise empirisch bestimmt. Vorzugsweise wird eine Konzentration verwendet, die ausreichend ist, um die meisten, wenn nicht alle, Vorläufer-X-mere, die spezifisch zu der Targetnukleotidsequenz hybridisieren, zu ligieren. Die wichtigsten einschränkenden Faktoren sind allgemein die Reaktionszeit und die Kosten des Reagens.
  • Die Konzentration jedes X-mer-Vorläufers ist allgemein so, wie dies oben für die PEA beschrieben wurde, und kann gemäß seiner Thermostabilität angepasst werden, wie oben erörtert wurde. Das absolute Verhältnis von Target zu X-mer-Vorläufer soll empirisch bestimmt werden.
  • Der Umfang der Phosphorylierung des 5'-Terminus des X-mer-Gemisches kann das Ausmaß der Ligation (Gesamtzahl ligierter Produkte) und die Länge von Ligationsprodukten (Wert von n) beeinflussen. Das Ausmaß und die Länge der Ligation kann auch dadurch gesteuert werden, dass eine Modifizierung an dem 3'-Terminus des X-mer-Gemisches eingeführt wird, die die Ligation blockiert. Bei einem Lösungsansatz werden zwei Sätze von X-mer-Gemischen zusammen in einem einzigen Ligationsreaktionsgemisch verwendet. Die X-mere in dem ersten X-mer-Gemisch besitzen einen 5'-phosphorylierten Terminus und einen 3'-blockierten Terminus (5'p-y3'), wobei die X-mere mit MS-analysierbaren und freisetzbaren Markierungen markiert sind. Die X-mere in dem zweiten X-mer-Gemisch weisen sowohl 5'- als auch 3'-Hydroxyltermini (5'OH-OH3') auf und sind vorzugsweise, jedoch nicht notwendigerweise, nicht-markiert. Dies führt dazu, dass lediglich 2X-mer-Ligationsprodukte die Form o--o/p--y aufweisen, und deshalb lediglich zu einer Orientierung zwischen den zwei Ligationsvorläufern nach der Ligation. Ein Blockieren des 3'-Terminus kann beispielsweise dadurch bewerkstelligt werden, dass eine Gruppe verwendet wird, die keiner Kondensation unterzogen werden kann, z. B. eine unnatürliche Gruppe wie z. B. 3'-Phosphat, ein 3'-endständiges Dideoxy, ein Polymer oder eine Oberfläche oder ein anderes Mittel zum Hemmen einer Ligation. Dieser Lösungsansatz weist große informationstechnische Vorteile auf, da die zwei Sätze gemeinsam optimiert werden können.
  • PEA und XLA besitzen eine Anzahl wünschenswerter Attribute. Erstens sind sie alle lösungsbasierte Systeme und werden durch standardmäßige Lösungsmassenwirkungs- und Diffusionsprozesse geregelt. Dies steht im Gegensatz zu keine Unter stützung erfahrenden oberflächenbasierten Arrayhybridisierungssystemen, wo die Sonde physisch an der Oberfläche angebracht ist und nicht in der Lage ist, zu diffundieren, wodurch die Kinetik der Hybridisierung verlangsamt wird. Im Gegensatz zu oberflächengebundenen Arrays besteht ein Kennzeichen der vorliegenden Erfindung darin, dass eine hohe Vielzahl von Oligonukleotiden entlang der Targetsequenz bindet. Dies erhöht wahrscheinlich die Gesamteffizienz der X-mer-Bindungs- und der anschließenden enzymatischen Reaktion. Da die X-mer-Vorläufer kurz sind, ist es außerdem weniger wahrscheinlich, dass sie intramolekulare Strukturen bilden.
  • Zweitens nutzen PEA und XLA hochspezifische enzymatische Prozesse. Im Fall von PEA dient der hohe Grad an Spezifität der Polymerase für perfekte Duplexe im Wesentlichen dazu, den Hybridisierungsprozess „Korrektur zu lesen", indem lediglich diejenigen Primer verlängert (und somit für eine Erfassung markiert) werden, die zu der richtigen Targetsequenz hybridisierten. Es ist wahrscheinlich, dass dieses „Korrekturlesen" die Gesamtspezifität der Untersuchung über diejenige, die mittels Hybridisierungsverfahren ohne Unterstützung erzielt werden kann, hinaus erhöht. Es ist wahrscheinlich, dass bei der XLA durch das Ligaseenzym auch sowohl die Hybridisierungseffizienz als auch die Hybridisierungsspezifität erhöht werden.
  • Drittens können PEA und XLA im Gegensatz zu Oberflächenbasis-Arrayhybridisierungssystemen, die sich auf die Erfassung des Hybridisierungsereignisses selbst stützen, sogar übergangsweise stabile Primer-Target-Wechselwirkungen bezüglich einer Erfassung markieren. Die Lebensdauer der Wechselwirkung zwischen den X-mer-Vorläufern und dem Target muss nur lang genug sein, dass sie durch die Polymerase oder Ligase erkannt wird und dass die Polymerase oder Ligase ansprechend darauf agiert. Dies ermöglicht, dass eine gegebene Targetsequenz als Schablone für mehrere Vorläufer-Bindungs- und anschließende -Verlängerungs- oder -Ligationsreaktionen fungiert. Dieses zyklische Durchlaufen (und somit Verstärkung) und die Fähigkeit, Übergangsereignisse zu erfassen, kann die Gesamterfassungssensibilität der Verfahren über die, die unter Verwendung von oberflächenbasierten Hybridisierungsuntersuchungen ohne Unterstützung erzielt werden kann, hinaus erhöhen, indem die Anzahl von X-meren, die sequenzkomplementär sind und somit bis zu einem größeren Verhältnis als 1:1 zu Targetnukleinsäuren hybridisieren, erhöht wird. Wie oben erörtert wurde, könnte diese Art des zyklisch Durchlaufens einer Reaktion extern erleichtert werden, indem die Temperatur während der Verlängerungs- oder Ligationsreaktion künstlich zyklisch durchlaufen wird.
  • Die hierin beschriebenen Verfahren sind auf ein Abfragen von Targets frei in Lösung gerichtet. Es wird jedoch auch in Betracht gezogen, dass die XLA-Methodologie in Verbindung mit oberflächengebundenen Oligonukleotiden, z. B. Arrays von Oligonukleotiden, verwendet werden kann, um die Gesamtauflösungsleistung von Arraysystemen zu erhöhen. Die Arrays beinhalten allgemein eine Oberfläche, die ein Mosaik von verschiedenen Oligonukleotiden enthält, die einzeln zu diskreten, bekannten Bereichen der Oberfläche lokalisiert sind. Derartige geordnete Arrays, die eine große Anzahl von Oligonukleotiden enthalten, wurden als Hilfsmittel für einen hohen Durchsatz umfassende Analysen von Genotyp und Genexpression entwickelt. Oligonukleotide, die auf einem Feststoffträger synthetisiert werden, erkennen eindeutig komplementäre Nukleinsäuren mittels Hybridisierung, und Arrays können entworfen werden, um spezifische Targetsequenzen zu definieren, Genexpressionsmuster zu analysieren oder spezifische allelische Variationen zu identifizieren.
  • Die vorliegende Erfindung kann unter Verwendung von an einen Träger angelagerten Oligonukleotiden praktiziert werden. Unter Bezugnahme auf 5 können bei der vorliegenden Erfindung Arrays von Oligonukleotiden wie z. B. DNA-Arrays erzeugt werden, so dass die DNA-Sonden durch einen Linker an ihrem 5'-Terminus an die Oberfläche angelagert werden. Diese oberflächengebundenen Sonden weisen auch 3'-endständiges Hydroxylgruppen auf.
  • Unter Bezugnahme auf 5 beinhaltet die arraybasierte X-mer-Ligationsuntersuchung (AXLA) folgende Schritte. Bei Schritt 1 wird die Targetprobe unter Bedingungen, die mit der oben beschriebenen Ligationsreaktion kompatibel sind, zu den oberflächengebundenen Sonden des Arrays hybridisiert. Die Targetnukleinsäure kann entweder nicht gekennzeichnet sein oder mit z. B. einer fluoreszierenden Kennzeichnung (an diesen Stellen ist jeweils das Band oder Gerät defekt) gekennzeichnet sein, und so weiter. Bei Schritt 2 werden die Gemisch-X-mere zu dem Array hinzugegeben, und man lässt sie gemäß Watson-Crick-Basenpaarungsregeln entlang dem Target willkürlich hybridisieren. Bei Schritt 3 werden diejenigen X-mere, die benachbart zu den oberflächengebundenen Oligonukleotiden hybridisieren, unter Verwendung einer DNA-Ligase ligiert, wie oben beschrieben. Da lediglich die oberflächengebundenen Oligonukleotide 3'-endständige Hydroxylgruppen aufweisen, erfolgt eine Ligation lediglich zwischen denjenigen X-meren, die neben einer DNA-Sonde hybridisiert werden, und nicht zwischen X-meren, die an anderen Positionen entlang dem Target nebeneinander hybridisiert werden. Bei Schritt 4 werden die ligierten X-mere von den nicht-ligierten X-mer-Vorläufern getrennt. Bei Schritt 5 werden die Markierungen von den getrennten und ligierten X-meren durch Spaltung von spaltbaren Linkern, die die Markierungen an die X-mere anlagern, freigesetzt. Bei Schritt 6 wird der Satz von freigesetzten Markierungen mittels MS analysiert, um Sequenzinformationen über die Targetnukleinsäure zu liefern.
  • Zusätzlich oder alternativ dazu werden die freigesetzten Markierungen mittels MS Merkmal um Merkmal (oder Satz von Merkmalen) entlang des Arrays analysiert. Auf diese Weise werden auch die Sequenzinformationen von der arraybasierten Sonde ermittelt, um mehr Sequenzinformationen über das Tar getnukleinsäuremolekül zu liefern und somit die Leistung der arraybasierten XLA-Untersuchung stark zu steigern. Die Bedingungen zum Durchführen der Ligationsreaktionen sind bei diesem Lösungsansatz ähnlich den oben beschriebenen.
  • Entwurf von Vorläufer-X-mer-Gemischen
  • Die Leistungsfähigkeit der oben beschriebenen Untersuchung(en) hängt von Charakteristika der zum Abfragen der Targetnukleinsäure verwendeten X-mer-Gemische ab. Wie oben erörtert wurde, ist ein hoher Massenüberlappungsgrad zwischen X-meren, die eine unterschiedliche Sequenz aufweisen, eine unausweichliche Konsequenz dessen, dass X-mere aus lediglich vier Bausteinen bestehen (siehe Histogramm der 1). Die Reagenzien der vorliegenden Erfindung sind dahin gehend entworfen, das Problem, das aus der inhärenten relativen Molekülmasse und Sequenzmehrdeutigkeiten, die aus der Massenüberlappung resultieren, stammen, aus der MS-Analyse zu beseitigen und somit die Leistungsfähigkeit bei allen Anwendungen, die Massenspektrometrie verwenden, um die Sequenz der Targetnukleinsäure zu analysieren, zu erhöhen. Diese Verringerung wird bewerkstelligt, indem ein Gemisch (Ω) von natürlichen und/ODER massenmodifizierten X-mer-Vorläufern verwendet wird, die eine hohe Sequenzbedeckungskomplexität (CCM(Ω)) und MS-Markierungen, die durch spaltbare Linker kovalent an die X-mer-Vorläufer gebunden sind, aufweisen. Die Gemische der Erfindung sind insofern generisch oder universell, als sie bei jeglicher Anwendung verwendet werden können, deren Ziel darin besteht, Sequenzinformationen einer Targetnukleinsäure zu bestimmen. Ferner können die Gemische ohne Bezugnahme auf etwaige Vorab-Informationen über die Targetnukleinsäuresequenz, einschließlich z. B. des Vorliegens, der Position oder der Identität einer Mutation, entworfen werden. Jedoch soll dies nicht implizieren, dass die Gemische nicht nützlich darin wären, Targetnukleinsäuresequenzen zu analysieren, bei denen manche Informationen über die Sequenz vorab bekannt wa ren, oder dass Vorab-Informationen bei der Interpretation der Massenspektren nicht hilfreich wären.
  • Der Satz von Markierungen in dem Gemisch ist dahin gehend ausgewählt, die Leistungsfähigkeitsanforderungen an MS dadurch zu verringern, dass gewünschte Ladung-Zu-Masse-Verhältnisse vorliegen, und die Mehrdeutigkeit der MS-Sequenzanalyse von Nukleinsäuren zu verringern. Idealerweise ist jede Sequenz in dem Gemisch mit einer eindeutigen relativen Molekülmasse aus den Markierungen in dem Satz markiert. Jedoch kann die vorliegende Erfindung auch unter Verwendung eines Satzes von Markierungen praktiziert werden, bei dem jede Markierung mehreren X-mer-Vorläufersequenzen zugewiesen ist. Eine Zuweisung der Markierungen zu X-mer-Vorläufersequenzen kann willkürlich sein. Mit anderen Worten kann eine Zuweisung der Markierungen zu mehreren X-mer-Vorläufersequenzen ohne Berücksichtigung von Sequenzen durchgeführt werden.
  • Eine Zuweisung der Markierungen kann auch dadurch durchgeführt werden, dass X-mer-Vorläufer ausgewählt werden, die unterschiedliche Nukleotidzusammensetzungen und -sequenzen aufweisen, die einzeln an MS-Markierungen, die identische relative Molekülmassen aufweisen, markiert werden sollen. Fachleute sind in der Lage, X-mer-Vorläufer mit unterschiedlichen Nukleotidzusammensetzungen und -sequenzen zur Zuweisung zu Markierungen auszuwählen. Auf der Basis theoretischer Berechnungen jedoch verbessert eine Zuweisung bestimmter X-mer-Vorläufersequenzen zu bestimmten Markierungen die Analyse von Daten, die aus einer Nukleinsäureanalyse gemäß der vorliegenden Erfindung (unveröffentlichte Beobachtungen) erhalten werden, nicht enorm.
  • Bei einem Ausführungsbeispiel beträgt die Anzahl von mittels MS unterscheidbaren Markierungen in dem Gemisch zumindest 25%, 50%, 75% oder 100% der Massenzahlkomplexität (MNC – mass number complexity) eines Gemisches, das dieselben X-mer-Vorläufer, jedoch ohne die Markierungen und Linker, aufweist, wobei alle Vorläufer um ein Nukleotid (A, T, C und G) verlängert sind. Für ein Gemisch aus lauter markierten 6-mer-Vorläufern beispielsweise wird die Anzahl von Markierungen mit den PEA-Produkten der 6-mere (d.h. allen möglichen 7-meren) verglichen. Die MNC für ein Gemisch, das alle möglichen 7-mere von natürlichen Nukleotiden umfasst, beträgt etwa 53. Somit weist der Satz von Markierungen vorzugsweise eine Sequenzauflösungsleistungsfähigkeit auf, die zumindest so groß ist wie das Gemisch von natürlichen X-mer-PEA-Produkten. Vorzugsweise beträgt die Anzahl von mittels MS unterscheidbaren Markierungen in dem Gemisch zumindest 100% der MNC eines Gemisches, das dieselben X-mer-Vorläufer, jedoch ohne die Markierungen und Linker, aufweist, wobei alle Vorläufer um ein Nukleotid verlängert sind. Außerdem ist die maximale Anzahl von mittels MS unterscheidbaren Markierungen die Anzahl von anhand der Sequenz unterscheidbaren X-mer-Vorläufern in dem Gemisch (d.h. für alle 6-mere, die natürliche Nukleotide umfassen, beträgt die maximale Anzahl 4.096).
  • Bei einem anderen Ausführungsbeispiel wird die Anzahl von mittels MS unterscheidbaren Markierungen, die in einem Gemisch verwendet werden sollen, als Prozentsatz der Anzahl von X-mer-Vorläufern in dem Gemisch bestimmt. Vorzugsweise beträgt die Anzahl von mittels MS unterscheidbaren Markierungen in einem Gemisch zumindest 0,5%, 1%, 2%, 5%, 10%, 20%, 25%, 50%, 75% oder 90% der Anzahl von X-mer-Vorläufern in dem Gemisch. Als nicht-einschränkendes veranschaulichendes Beispiel führt ein Gemisch aller 4.096 6-mere, die natürliche Nukleotide umfassen, bei einer Verwendung bei einer PEA-Untersuchung zu 7-meren. Die MNC eines Gemisches aus lauter 7-meren beträgt etwa 53. Somit ist es wünschenswert, dass die Anzahl von mittels MS unterscheidbaren Markierungen in einem Gemisch von 6-mer-Oligonukleotid-Vorläufern bei einer PEA-Untersuchung gemäß der vorliegenden Erfindung größer ist als etwa 50 (z.B. 50/4.096 ist etwa 1%).
  • Für spezifische Anwendungen (z.B. Mutationserfassung; siehe Beispiele) kann die Leistungsfähigkeit einer Untersuchung bezüglich der Länge einer Targetnukleinsäure, innerhalb derer das Problem (bei diesem spezifischen Beispiel, Erfassung einer Mutation) mit einer gegebenen Erfolgsquote, z.B. 95%, gelöst werden kann, gemessen werden. Mit zunehmender Leistungsfähigkeit der Untersuchung nimmt die Länge, die mit einer gegebenen Erfolgsquote analysiert werden kann, zu. Dasselbe gilt für die Erfolgsquote, mit der gegebene Längen analysiert werden können. Ein guter Maßstab der Nützlichkeit ist die Länge einer DNA, die an einem automatisierten DNA-Gelelektrophorese-Sequenzer analysiert werden kann, üblicherweise ungefähr 500 Basen. Ein vernünftiges Ziel ist dann die Analyse von 500 Basentargets mit einer Erfolgsquote > 95%.
  • Analysesschritt
  • Nach dem Schritt des Bearbeitens von Hybriden werden die nicht-bearbeiteten X-mer-Vorläufer von den verarbeiteten X-mer-Vorläufern getrennt. Die Trennung kann anhand einer Vielzahl von in der Technik bekannten Verfahren wie z.B. MS, Chromatographie (z.B. HPLC; Affinitätschromatographie; Magnetic Beads) oder Fluoreszenz-aktiviertes Sortieren für Verfahren, die die bearbeiteten Oligonukleotide mit einem fluoreszierenden Marker kennzeichnen, durchgeführt werden. Beispiele von Affinitätsverfahren umfassen ein Verwenden von biotinylierten oder mit Digoxigenin gekennzeichneten Kettenabbruch-Nukleotiden, worauf eine Reinigung von markierten X-mer-Verlängerungsprodukten unter Verwendung von Streptavidin oder Antidigoxigenin-Paar folgt (Kessler, Advances in Mutagenisis, Berlin/Heidelber; Springer-Verlag; 105-152 (1990)). Phenylboronsäurekomplexe können ebenfalls verwendet werden, um andere Hohe-Affinität-Reinigungsverfahren herzustellen ( US-Patentschrift 5,594,151 ).
  • Nach der Trennung der verarbeiteten Hybride werden die Markierungen durch Spaltung der Linker aus dem Nukleinsäureabschnitt der X-mer-Produkte freigesetzt. Die Markierungen werden anschließend mittels Massenspektrometrie analysiert. Die Einzelheiten der Analyse sind in der Technik bekannt und werden hier nicht wiederholt. Geeignete Massenspektrometer sind bei Methods in Enzymology, B. Karger & W. Hancock (Herausgeber), Academic Press, San Diego, V270 (1996) und Methods in Enzymology, J. McCloskey (Herausgeber), Academic Press, San Diego, V193 (1990) beschrieben. Diese umfassen matrixunterstützte Laserdesorption/-ionisierung („MALDI"), Elektrospray-(„ESI"-), chemische Ionisation bei Atmosphärendruck (APCI-, APCI = atmospheric Pressure chemical ionization), Ionenzyklotronresonanz-(„ICR"-, ICR = ion cyclotron resonance), Fourier-Transformations-Typen und verzögerte Innenextraktion und Kombinationen oder Variationen der obigen. Geeignete Massenanalysatoren umfassen magnetische Sektorfeldinstrumente/Magnetische-Ablenkung-Instrumente in/bei Einzel-Quadrupol, Tripel-Quadrupol („MS/MS"-Quadrupol), Fourier-Transformations- und Flugzeit-(„TOF"-) Konfigurationen und dergleichen.
  • Ein bevorzugtes Verfahren ist die Verwendung von MS-MS. Es ist in der Technik bekannt, dass Massenspektrometrie dazu verwendet werden kann, molekulare Ionen zu trennen und anschließend ausgewählte Ionen Fragmentierungsbedingungen in dem Massenspektrometer auszusetzen. Diese zweidimensionale Technik, die als MS-MS bekannt ist, wird üblicherweise in einem Tripel-Quadrupol-, Ionenfallen- oder Q-TOF-Massenspektrometer durchgeführt.
  • Gemäß der vorliegenden Erfindung kann Tripel-Quadrupol-MS-MS dazu verwendet werden, in der ersten Stufe bearbeitete und nicht-bearbeitete X-mer-Vorläufer zu trennen, in der zweiten Stufe die Linker zu spalten, um die Markierer freizusetzen, und in der dritten Stufe eines Tripel-Quadrupol-Massenspektrometers die freigesetzten Markierungen zu analysieren, um Markierungen von bearbeiteten X-meren zu iden tifizieren, um Informationen über die Sequenz der X-mere und somit die Targetnukleinsäure zu liefern.
  • Alternativ oder zusätzlich dazu werden die bearbeiteten X-mere vor einer MS-Analyse von den nicht-bearbeiteten X-meren getrennt, wie oben beschrieben wurde. Deshalb können eine Fragmentierung, um die Markierungen freizusetzen, und eine anschließende MS-Analyse unter Verwendung eines Einzel-Quadrupol-Massenspektrometers statt eines Mehrstufen-Massenspektrometers in einer einzigen Stufe durchgeführt werden. Vorzugsweise ist zum Zweck einer eines Einzel-Quadrupol-MS-Analyse die relative Molekülmasse des Satzes von Markierungen von der relativen Molekülmasse der bearbeiteten X-mere nach der Freisetzung der Markierungen unterscheidbar. Einzelheiten über MS-Verfahren finden sich bei Chernushevich und Thomson ( EP 1006559 ); Verentchikov et al. ( WO00/77823 ); Clemmer und Reilly ( WO00/70335 ); Hager ( WO00/73750 ); WO99/01889 .
  • Datenanalyse
  • Nachdem ein Massenspektrum erhalten wird, wird eine Analyse durchgeführt, um die durch die jeweilige Anwendung definierten Informationen zu liefern. Beispielsweise erfordert eine Mutationserfassung lediglich eine qualitative Analyse der Daten, da diese Arten von Anwendungen allgemein ein Vergleichen der Massenspektren zwischen einer Referenzsequenz und einer unbekannten Variante derselben beinhalten. Wenn Unterschiede bezüglich Massenspitzen vorliegen, dann liegt bei der unbekannten Variante irgendein Mutationstyp (oder Sequenzdifferenztyp) vor.
  • Eine Mutationsidentifikation erfordert eine anspruchsvollere Analyse. Wie dies auch bei der Mutationserfassung der Fall ist, beinhaltet eine Mutationsidentifikation allgemein einen Vergleich zwischen einer Referenzsequenz und einer unbekannten Variante. Um jedoch die genaue Position und I dentität einer heterozygoten Mutation in der Variantensequenz zu identifizieren, wird der folgende Prozess angewendet. Zuerst werden Spitzen identifiziert, die in dem Probenmassenspektrum auftreten, jedoch nicht im Wildtyp-Spektrum. Als Nächstes werden aus der Liste aller möglichen Produktgemisch-X-mere diejenigen identifiziert, deren Massen mit den neuen Spitzen übereinstimmen. Dann werden mögliche Mutationsstellen identifiziert, die dazu führen würden, dass jedes der identifizierten Produktgemisch-X-mere vorliegt. Wenn die Art der Mutation bekannt ist (z. B. Substitution), so können viele mögliche Mutationsstellen zurückgewiesen werden, und somit können viele X-mere zurückgewiesen werden. Schließlich wird das theoretische Spektrum jeder Mutation auf Übereinstimmung mit dem beobachteten Spektrum getestet.
  • Anspruchsvollere Prozesse können verwendet werden, um Mehrdeutigkeiten aufzulösen, die auf Unterschiede bezüglich Verlängerungs- oder Ligationseffizienzen, Ionisierungseffizienzen und Isotopeneffekten zurückzuführen sind. Je nach der CCM und der MNC des Satzes von Markierungen in dem Gemisch nach der Freisetzung können unter Verwendung von Algorithmen, die denjenigen ähneln, die für das Sequenzieren unter Verwendung von Oligonukleotidarrays entwickelt wurden, De-Novo-Sequenzinformationen erhalten werden (siehe z. B.: Pevzner, P.A., J. Biomolecular Structure Dynamics 7, 63 (1989), Pevzner P.A. u. a., J. Biomolecular Structure Dynamics 9, 399 (1991), Ukkonen, E., Theoretical Computer Science 92, 191 (1992)).
  • Bausätze der Erfindung
  • Ein weiterer Aspekt der vorliegenden Erfindung bezieht sich auf Bausätze, die nützlich dafür sind, ein Verfahren gemäß der Erfindung auf zweckmäßige Weise durchzuführen. Um die Vielseitigkeit der vorliegenden Erfindung zu verbessern, können die Reagenzien in einer verpackten Kombination, in demselben oder separaten Behältern vorgesehen sein, so dass das Verhältnis der Reagenzien eine beträchtliche Optimierung des Verfahrens vorsieht. Die Reagenzien können jeweils in separaten Behältern vorliegen, oder es können verschiedene Reagenzien in einem oder mehr Behältern kombiniert sein, je nach der Stabilität der Reagenzien und der Reaktionsfreudigkeit der Reagenzien untereinander.
  • Bei einem Ausführungsbeispiel umfasst ein Bausatz ein Gemisch oder einen Satz von Teilgemischen, das bzw. der Nukleinsäuren und Markierungen, die durch spaltbare Linker kovalent an die Nukleinsäuren angelagert sind, zur direkten Massenspektralanalyse der Markierungen nach Freisetzung durch Spaltung der Linker umfasst, wobei die Markierungen mittels Massenspektrometrie unterscheidbar sind und bekannten Sequenzen von X-mer-Vorläufern zugewiesen sind. Das Gemisch umfasst X-mer-Vorläufer, die eine Mindestlänge von 3 Nukleotiden aufweisen. Die minimale Gemischbedeckungskomplexität (CCM) des Gemisches (oder die minimale zusammengesetzte Gemischbedeckungskomplexität des Satzes von Teilgemischen) beträgt 56 geteilt durch N, wobei N die Anzahl von gesonderten X-meren in dem Gemisch ist. Die Länge der X-mer-Vorläufer kann für jeden X-mer-Vorläufer unabhängig ausgewählt werden. Jeder der X-mer-Vorläufer in dem Gemisch wird durch eine einzige chemische Spezies dargestellt. Jedes Teilgemisch in dem Satz weist relativ zu der zusammengesetzten Gemischbedeckungskomplexität eine verringerte Gemischbedeckungskomplexität auf. Ferner umfasst jedes Teilgemisch eine Mehrzahl von X-mer-Vorläufern.
  • Bei einem anderen Ausführungsbeispiel umfasst ein Bausatz ein Gemisch wie es oben beschrieben wurde, ein Enzym, das eine Nukleotidpolymeraseaktivität aufweist, und eine Vielzahl von Nukleotiden, die aus der Gruppe ausgewählt sind, die aus natürlichen Kettenabbruch-Triphosphaten besteht.
  • Bei einem anderen Ausführungsbeispiel umfasst ein Bausatz ein Gemisch wie es oben beschrieben wurde, ein Enzym, das eine Nukleotidpolymeraseaktivität aufweist, eine Vielzahl von Nukleotiden, die aus der Gruppe ausgewählt sind, die aus natürlichen Kettenabbruch-Triphosphaten und Verlängerungs-Nukleotid-Triphosphaten besteht.
  • Bei einem anderen Ausführungsbeispiel umfasst ein Bausatz ein Gemisch wie es oben beschrieben wurde, ein Enzym, das eine Nukleotidpolymeraseaktivität aufweist, eine Vielzahl von Nukleotiden, die aus der Gruppe ausgewählt sind, die aus massenmodifizierten Kettenabbruch-Triphosphaten und Verlängerungs-Nukleotid-Triphosphaten besteht.
  • Bei einem weiteren Ausführungsbeispiel umfasst ein Bausatz ein Gemisch wie es oben beschrieben wurde und eine DNA-Ligase.
  • Bei einem weiteren Ausführungsbeispiel umfasst ein Bausatz ein Gemisch wie es oben beschrieben wurde und ein Kondensationsmittel.
  • Bei einem anderen Ausführungsbeispiel umfasst ein Bausatz ein Gemisch gemäß der obigen Beschreibung und Reagenzien zur Reinigung von Reaktionsprodukten gemäß der Beschreibung in dem vorliegenden Dokument.
  • Ein weiteres Ausführungsbeispiel der vorliegenden Erfindung ist ein Bausatz zum Durchführen eines Verfahrens, wie es oben beschrieben wurde. Der Bausatz umfasst ein Gemisch, wie es oben beschrieben wurde, eine DNA-Ligase und ein Array, das eine Oberfläche und eine Vielzahl von Nukleinsäuresequenzsonden, die an die Oberfläche angelagert sind, und eine Nukleinsäuresequenz, die ein endständiges 3'-Hydroxylende aufweist, umfasst.
  • Bei einem Aspekt umfasst ein Bausatz ein Kondensationsmittel, ein Array, das eine Oberfläche und eine Vielzahl von Nukleinsäuresequenzsonden umfasst, die ein 3'-Ende und ein endständiges 3'-Hydroxylende aufweisen.
  • Der Bausatz kann ferner andere separat gepackte Reagenzien zum Durchführen des Verfahrens sowie Hilfsreagenzien usw. umfassen. Die relativen Mengen der verschiedenen Reagenzien in den Bausätzen können stark variiert werden, um Konzentrationen der Reagenzien zu liefern, die die Reaktionen, die während des vorliegenden Verfahrens eintreten müssen, im Wesentlichen optimieren. Unter entsprechenden Umständen kann bzw. können ein oder mehr der Reagenzien in dem Bausatz als Trockenpulver, das üblicherweise lyophilisiert ist, einschließlich Bindemitteln, vorgesehen sein, die auf eine Auflösung hin eine Reagenslösung liefern, die die geeigneten Konzentrationen zum Durchführen eines Verfahrens gemäß der vorliegenden Erfindung aufweist. Der Bausatz kann ferner eine schriftliche Beschreibung eines Verfahrens gemäß der vorliegenden Erfindung, wie es oben beschrieben wurde, umfassen.
  • Die Reagenzien, Verfahren und Bausätze der Erfindung sind unter anderem nützlich bei der Mutationserfassung, Mutationsidentifikation, Polymorphieanalyse, Genotypisierung, De-Novo-Sequenzierung, Neusequenzierung, Genexpressionsprofilerstellung, cDNA-Clusterbildung und dergleichen.
  • Man sollte verstehen, dass die obige Beschreibung den Schutzumfang der Erfindung veranschaulichen und nicht einschränken soll. Fachleuten auf dem Gebiet, auf das sich die Erfindung bezieht, werden andere Aspekte, Vorteile und Modifikationen innerhalb des Schutzumfangs der Erfindung einleuchten. Die folgenden Beispiele sind dargelegt, um Fachleuten Beispiele an die Hand zu geben, wie das Verfahren und die Produkte der Erfindung hergestellt und genutzt werden können, und sollen den Schutzumfang dessen, was die Erfinder als ihre Erfindung ansehen, nicht einschränken.
  • Beispiele
  • Die folgenden Beispiele beziehen sich auf die oben beschriebenen Verfahren, die eine Region der menschlichen p53-Gen-Sequenz als Targetnukleinsäure verwenden. 7 zeigt eine 62-Nukleotid-Region des p53-Gens mit einer bekannten Mutationsstelle, die in Fettdruck angegeben ist. Für alle Analysen wird das Komplement der in 7 angegebenen Sequenzen verwendet. Alle Beispiele sind Simulationen. Somit sind die Besonderheiten bezüglich der Reaktionsbedingungen (d. h. Puffer, X-mer- und Targetkonzentrationen, Polymerase- oder Ligasetyp usw.) hier nicht relevant. Eine Interpretation dieser Beispiele hängt lediglich von der Massenkomplexität und der Bedeckungskomplexität der X-mer-Vorläufer, der Targetlänge und -sequenz und der Art der verwendeten Untersuchung ab. Alle Beispiele gehen davon aus, dass die Reaktionen so verlaufen, wie sie in dem ganzen Text beschrieben und in den Figuren angegeben sind. Wichtig ist, dass davon ausgegangen wird, dass in der Tat lediglich diejenigen X-mere, die exakte Komplemente der Targetsequenz sind, verlängert (im Fall von PEA) oder ligiert (im Fall von XLA) werden. Der Hauptzweck aller Beispiele besteht darin, die theoretische Leistungsfähigkeit jeder Untersuchung bezüglich der Art von Massenspektren und des Informationsgehalts, die bzw. den jede Untersuchung erzeugen würde, zu veranschaulichen.
  • Beispiel 1
  • Verstehen der Leistungsfähigkeit von CMT-PEA als Funktion der X-mer-Zusammensetzung und Markierungszahl
  • Die informationsbezogenen Aspekte und die Wirkung verschiedener Entwurfsparameter der vorliegenden Erfindung wurden verwirklicht, indem die Anwendung von PEA unter Verwendung von spaltbaren, massenmarkierten (CMT-, CMT = cleavable mass tagged)X-mer-Vorläufern für eine Erfassung einer hete rozygoten Mutation studiert wurde. Bei dieser Analyse zieht man willkürlich eine Sequenz einer Länge L und verändert (mutiert) willkürlich die mittlere Base. Es stellt sich die Frage, ob die Sequenzvarianten in ihrem theoretischen Untersuchungsspektrum eine Spitze aufweisen, die nicht in dem Spektrum der anderen (Mutanten) erscheint. Eine bejahende Antwort bedeutet, dass, falls dem so wäre, eine Mutation in einer normalen Population erfasst werden könnte, wenn eine Schwellenallelfrequenz und entweder ein integriertes oder binäres (ja oder nein) Lesen der CMT-Massenspektren angenommen wird.
  • Die 6 zeigt Mutationserfassungserfolgsquoten bei einer Verwendung von 6-meren und 100 CMTs. Die verschiedenen Kurven stellen verschiedene Satzgrößen der insgesamt möglichen Anzahl von 4.096 6-meren, die tatsächlich markiert sind, dar. Deshalb stellen die verschiedenen Kurven verschiedene Sequenzbedeckungswerte für das 6-mer-Gemisch dar. Satzgrößen, die abgedeckt sind, liegen zwischen 1000 und 4000, in 500er-Schritten, wobei jeder Angehörige des Satzes willkürlich gewählt wurde. Die Zuweisung der Massemarkierungen zu den 6-mer-Sequenzen ist willkürlich. Wie aus dem Graph hervorgeht, wird eine höhere Erfolgsquote erhalten, wenn eine größere Anzahl von insgesamt möglichen 4.096 6-mer-Sequenzen verwendet wird, wobei ein Idealfall an etwa 3000 6-mere heranreicht. Dass lediglich ein Teilsatz der insgesamt möglichen 4.096 6-mere notwendig ist, um eine ausreichende Sequenzbedeckung zu haben, stimmt mit der Lehre in der US-Patentschrift 6,218,118 überein. Unter Verwendung von ungefähr 3000 6-meren kann eine Mutationserfassung unter Verwendung von Targets einer Länge von ungefähr 100 Nukleotiden mit einer Erfolgsquote von –95% erzielt werden. Mit zunehmender Anzahl von spaltbaren Markierungen (CMTs) nimmt die Mehrdeutigkeit ab, was die Targetlänge, die bei einer gegebenen Erfolgsquote abgefragt werden kann, effektiv erhöht (Daten nicht gezeigt).
  • Beispiel 2
  • Theoretische Analyse eines p53-Gen-Targetfragments unter Verwendung von CMT-PEA
  • Das folgende Beispiel bezieht sich auf das oben beschriebene CMT-PEA-Verfahren unter Verwendung einer Region der Human-p53-Gensequenz als Targetnukleinsäuresequenz. 7 zeigt eine 62-Nukleotid-Region des p53-Gens, wobei bekannte Mutationsstellen fett gedruckt sind.
  • Alle Beispiele sind Simulationen. Somit sind die Besonderheiten bezüglich der Reaktionsbedingungen (d. h. Puffer, X-mer- und Targetkonzentrationen, Polymerase- oder Ligasetyp, Temperatur usw.) hier nicht relevant. Eine Interpretation dieser Beispiele hängt lediglich von Zahl der verwendeten CMTs, der Bedeckungskomplexität der X-mer-Vorläufer, der Targetlänge und -sequenz und der Art der verwendeten Untersuchung ab. Alle Beispiele gehen davon aus, dass die Reaktionen so verlaufen, wie sie in dem ganzen Text beschrieben und in den Figuren angegeben sind. Wichtig ist, dass davon ausgegangen wird, dass in der Tat lediglich diejenigen X-mere, die exakte Komplemente der Targetsequenz sind, verlängert werden. Der Hauptzweck aller Beispiele besteht darin, die theoretische Leistungsfähigkeit jeder Untersuchung bezüglich der Art von Massenspektren und des Informationsgehalts, die bzw. den jede Untersuchung erzeugen würde, zu veranschaulichen.
  • Unter Verwendung des 62-Nukleotid-p53-Fragments als Target und eines sequenzvollständigen Satzes (alle 4.096) von 6-meren, die 100 CMTs aufweisen, wobei dem Gemisch willkürlich ein Massebereich von 101 bis 200 zugewiesen ist, wird eine PEA durchgeführt. 7 gibt den Satz von 56 überlappenden 7-mer-Verlängerungsprodukten an, die für die Wildtyp-p53-Targetsequenz erwartet werden. Die CMT- Massenspektren der 7-mer-PEA-Produkte, die den Wildtyp (Target G) und die einzige G2481C-(Target C) und G2481T-(Target T) Mutante entsprechen, sind in 8 angegeben. Die Integrierte-Differenz-Spektren in 9A & 9B offenbaren, welche CMT-Massen sich zwischen dem Wildtyp und den beiden Mutanten unterscheiden. Positive-Differenz-Spitzen entsprechen Massen, die beim Wildtyp, jedoch nicht bei der Mutante vorliegen, wohingegen Negative-Differenz-Spitzen Massen in der Mutante, jedoch nicht im Wildtyp entsprechen. Diese Spektraldaten werden dann wie oben beschrieben interpretiert. Bei diesem Beispiel beobachtet man eine theoretische maximale Anzahl von Differenzen (6 positive und 6 negative) für die G2481C-Mutante, und weniger als die theoretische maximale Anzahl von Differenzen (5 positive und 5 negative (zwei liegen sehr nahe beieinander)) für die G2481T-Mutante.
  • Jedoch ist es wichtig zu betonen, dass die in den Integrierte-Differenz-Spektren offenbarten Informationen davon ausgehen, dass die Hybridisierungs-, Verlängerungs-, Trennungs-, Ionisierungs- und Erfassungsschritte für alle X-mere und entsprechende CMTs mit gleicher Effizienz erfolgen. Da es unwahrscheinlich ist, dass dieses Quantisierungsniveau der Fall ist, auch nicht bei einer guten Optimierung, werden die einzelnen Spektraldaten auf eine binäre Form reduziert (9C & D). Diese Art der Transformation erfordert dann lediglich, dass die obigen Schritte einen definierten Schwellenpegel erfüllen. Obwohl diese Eliminierung der quantitativen Beschaffenheit der Daten die Gesamtleistungsfähigkeit der Untersuchung schmälern kann, offenbaren die resultierenden Binärdifferenzspektren trotzdem Unterschiede zwischen dem Wildtyp und der Mutante; 3 positive und 3 negative für die G2481C-Mutante und 3 positive und 2 negative für die G2481T-Mutante.
  • Das 62-Nukleotid-p53-Target-Fragment und verwandte Mutanten wurden anschließend mit einem sequenzvollständigen Satz (alle 4.096) von 6-meren, die 400 CMTs aufweisen, abge fragt, wobei dem Gemisch willkürlich ein Massebereich von 101 bis 500 zugewiesen wurde (10). Ein Vergleich der Integrierte- und Binärdifferenzspektren für die G2481C- und die G2481T-Mutante offenbart, dass in dem binären Modus kein Informationsverlust vorliegt (11). Dies ist auf eine Verringerung der Mehrdeutigkeit des CMT-6-mer-Gemisches und eine resultierende verringerte Wahrscheinlichkeit einer Massenüberlappung für die einzelnen CMT-Komponenten (entsprechenden 6-meren), die eine gegebene Targetsequenz reflektieren, zurückzuführen.
  • Um den Effekt eines Erhöhens der Anzahl von CMTs auf die Leistungsfähigkeit einer Untersuchung und eines damit verbundenen Reduzierens der Mehrdeutigkeit einer CMT-Massensignatur und eines Ermöglichens der Abfrage von längeren Targetfragmenten zu zeigen, wurde die CMT-PEA-Untersuchung modelliert, wobei die Wildtyp-p53-Sequenz und die G2481C-Mutante in einem 378 Nukleotide langen Targetfragment eingebettet waren. 12 zeigt die theoretischen CMT-Spektren für (A) den Wildtyp und (B) die G2481C-Mutante unter Verwendung von 100 CMTs. Die Integrierte-Differenz-Spektren (12C) offenbaren alle 12 möglichen Differenzen zwischen dem Wildtyp und der G2481C-Mutante. Jedoch enthüllen die Binärdifferenzspektren keine Unterschiede zwischen den zwei Sequenzen. Wenn jedoch die CMT-PEA-Untersuchung unter Verwendung eines 6-mer-Gemisches (alle 4.096), das 400 CMTs aufweist, durchgeführt wird, enthüllen die Binärdifferenzspektren 7 der 12 möglichen Differenzen (13A-C). Dies ist wiederum auf eine Verringerung der Mehrdeutigkeit des CMT-6-mer-Gemisches zurückzuführen, die die Wahrscheinlichkeit einer Massenüberlappung für die einzelnen CMT-Komponenten, die eine gegebene Targetsequenz reflektieren, verringert.
  • Figure 01050001

Claims (31)

  1. Ein Gemisch oder ein Satz von Teilgemischen, das beziehungsweise der X-mer-Vorläufer umfasst, wobei die X-mer-Vorläufer eine minimale Länge von 3 Nukleotiden aufweisen; wobei das Gemisch eine minimale Gemischbedeckungskomplexität von zumindest 56/N aufweist oder wobei der Satz von Teilgemischen eine zusammengesetzte Gemischbedeckungskomplexität von zumindest 56/N aufweist, wobei N die Anzahl von gesonderten X-mer-Vorläufern in dem Gemisch darstellt; wobei jedes Teilgemisch in dem Satz im Vergleich zu der zusammengesetzten Gemischbedeckungskomplexität eine verringerte Gemischbedeckungskomplexität aufweist; wobei jedes Teilgemisch eine Mehrzahl von X-mer-Vorläufern umfasst; wobei die Länge für jeden X-mer-Vorläufer unabhängig ausgewählt werden kann; wobei das Gemisch oder der Satz von Teilgemischen ferner einen Satz von Markierungen umfasst, wobei jede Markierung, die eine gegebene unterschiedliche Masse aufweist, durch einen spaltbaren Linker kovalent an zumindest einen gesonderten X-mer-Vorläufer gebunden ist; und wobei die Anzahl von Markierungen in dem Satz von Markierungen, die eine gegebene unterschiedliche Masse aufweisen, die nach der Spaltung der Linker mittels Massenspektrometrie unterscheidbar ist, größer ist als die Massenzahlkomplexität des natürlichen Äquivalents eines Gemisches oder Satzes von Teilgemischen von X+1-mer-Vorläufern, die den X-mer-Vorläufern des Gemisches oder des Satzes von Teilgemischen entsprechen, und wobei die Anzahl von Markierungen, die in dem Satz von Markierungen eine gegebene unterschiedliche Masse aufweisen, geringer ist als die Anzahl gesonderter X-mer-Vorläufer in dem Gemisch oder dem Satz von Teilgemischen.
  2. Ein Gemisch oder Satz von Teilgemischen gemäß Anspruch 1, bei dem die X-mer-Vorläufer einsträngig sind.
  3. Ein Gemisch oder Satz von Teilgemischen gemäß Anspruch 1 oder 2, bei dem jeglicher gegebene gesonderte X-mer-Vorläufer in dem Gemisch durch eine einzige Massenmarke markiert ist, die eine diskrete relative Molekülmasse aufweist, so dass jeglicher gegebene X-mer-Vorläufer einer einzigen Masse, wie sie mittels Massenspektrometrie ermittelt wird, zugeordnet ist.
  4. Ein Gemisch oder Satz von Teilgemischen gemäß Anspruch 1, 2 oder 3, bei dem die X-mer-Vorläufer eine ermittelte isotope Zusammensetzung aufweisen.
  5. Ein Gemisch oder Satz von Teilgemischen gemäß einem der vorhergehenden Ansprüche, bei dem das Gemisch eine Gemischbedeckungskomplexität von zumindest etwa ½ aufweist, wenn das Gemisch zumindest 128 gesonderte X-mere enthält, oder bei dem der Satz von Teilgemischen eine zusammengesetzte Gemischbedeckungskomplexität von zumindest etwa ½ aufweist, wenn der Satz von Teilgemischen zumindest 128 gesonderte X-mere enthält.
  6. Ein Gemisch oder Satz von Teilgemischen gemäß einem der vorhergehenden Ansprüche, bei dem das Gemisch eine Gemischbedeckungskomplexität von zumindest etwa auf weist, wenn das Gemisch zumindest 256 gesonderte X-mere enthält, oder bei dem der Satz von Teilgemischen eine zusammengesetzte Gemischbedeckungskomplexität von zumindest etwa aufweist, wenn der Satz von Teilgemischen zumindest 256 gesonderte X-mere enthält.
  7. Ein Gemisch oder Satz von Teilgemischen gemäß einem der vorhergehenden Ansprüche, bei dem die Nukleotidsequenzen der X-mer-Vorläufer des Gemisches oder des Satzes von Teilgemischen bekannt sind.
  8. Ein Gemisch oder Satz von Teilgemischen gemäß einem der vorhergehenden Ansprüche, bei dem die Anzahl von Markierungen in dem Satz von Markierungen, die nach einer Spaltung der Linker mittels Massenspektrometrie unterscheidbar sind, zwischen etwa 10 und 100.000 liegt.
  9. Ein Gemisch oder Satz von Teilgemischen gemäß einem der Ansprüche 1 bis 7, bei dem die Anzahl von Markierungen in dem Satz von Markierungen, die nach einer Spaltung der Linker mittels Massenspektrometrie unterscheidbar sind, zwischen etwa 20 und 5.000 liegt.
  10. Ein Gemisch oder Satz von Teilgemischen gemäß einem der Ansprüche 1 bis 7, bei dem die Anzahl von Markierungen in dem Satz von Markierungen, die nach einer Spaltung der Linker mittels Massenspektrometrie unterscheidbar sind, zumindest 0,5% der Anzahl von gesonderten X-mer-Vorläufern in dem Gemisch oder Satz von Teilgemischen beträgt und geringer ist als die Anzahl von gesonderten X-mer-Vorläufern in dem Gemisch oder Satz von Teilgemischen.
  11. Ein Gemisch oder Satz von Teilgemischen gemäß einem der Ansprüche 1 bis 7, bei dem die Anzahl von Markierungen in dem Satz von Markierungen, die nach einer Spaltung der Linker mittels Massenspektrometrie unter scheidbar sind, zumindest 10% der Anzahl von gesonderten X-mer-Vorläufern in dem Gemisch oder Satz von Teilgemischen beträgt und geringer ist als die Anzahl von gesonderten X-mer-Vorläufern in dem Gemisch oder Satz von Teilgemischen.
  12. Ein Verfahren zum Analysieren einer Targetnukleinsäuresequenz, das folgende Schritte umfasst: (1) Hybridisieren eines Gemisches oder Satzes von Teilgemischen gemäß einem der Ansprüche 1 bis 11 zu einer Targetnukleinsäuresequenz, wobei die X-mer-Vorläufer ein 3'-Ende und ein 5'-Ende umfassen, (2) Verarbeiten der Hybride, um die Masse der X-mer-Vorläuferabschnitte der Hybride in einer durch eine Targetsequenz vermittelten Reaktion zu verändern, um hybridisierte X-mer-Vorläufer von nicht-hybridisierten X-mer-Vorläufern zu unterscheiden; (3) Trennen von X-mer-Vorläufern mit einer veränderten Masse von X-mer-Vorläufern mit einer nicht-veränderten Masse; (4) Spalten der Linker, um die Markierungen freizugeben; (5) Analysieren der freigegebenen Markierungen des Schrittes (4) mittels Massenspektrometrie; und (6) Analysieren der Sequenz der Targetnukleinsäure.
  13. Ein Verfahren gemäß Anspruch 12, das ferner folgenden Schritt umfasst: Reinigen der freigegebenen Markierungen des Schrittes (4) vor der Analyse mittels Massenspektrometrie.
  14. Ein Verfahren gemäß Anspruch 12 oder 13, bei dem die Schritte (1) bis (2) in Lösung durchgeführt werden.
  15. Ein Verfahren gemäß Anspruch 12 oder 13, bei dem die Schritte (1) bis (2) mit einem oberflächengebundenen Gemisch durchgeführt werden.
  16. Ein Verfahren gemäß einem der Ansprüche 12 bis 15, bei dem die freigegebenen Markierungen mittels MS-MS-Massenspektrometrie analysiert werden.
  17. Ein Verfahren gemäß einem der Ansprüche 12 bis 16, bei dem der Verarbeitungsschritt ein Erweitern der hybridisierten X-mer-Vorläufer durch ein Polymerisieren zumindest eines Nukleotids an dem 3'-Ende der hybridisierten X-mer-Vorläufer umfasst.
  18. Ein Verfahren gemäß Anspruch 17, bei dem der Verarbeitungsschritt ein Erweitern der hybridisierten X-mer-Vorläufer durch ein Polymerisieren eines einzigen Nukleotids an dem 3'-Ende der hybridisierten X-mer-Vorläufer umfasst.
  19. Ein Verfahren gemäß Anspruch 18, bei dem das Nukleotid ein Kettenabbruch-Nukleotid-Triphosphat ist, das ein natürliches Dideoxynukleotid-Triphosphat oder ein massenmodifiziertes Dideoxynukleotid-Triphosphat ist, das eine Masse aufweist, die größer ist als die, die durch die Massendifferenz zwischen dem leichtesten und dem schwersten X-mer-Vorläufer in dem Gemisch definiert ist.
  20. Ein Verfahren gemäß Anspruch 12 oder 13, bei dem der Verarbeitungsschritt ein Ligieren von benachbarten X- mer-Vorläufern unter Verwendung einer DNA-Ligase oder eines Kondensationsmittels umfasst.
  21. Ein Verfahren gemäß Anspruch 12, das ferner Folgendes vor dem Schritt (1) aufweist: Hybridisieren einer Targetnukleinsäure zu einer Vielzahl von Nukleinsäuresonden in einem Array, das folgende Merkmale aufweist: (a) eine Oberfläche; und (b) eine Vielzahl von Nukleinsäuresonden, wobei die Sonden 3'-OH-Enden aufweisen, wobei die Sonden an ihren 5'-Enden an die Oberfläche angelagert sind; und wobei Schritt (2) folgende Schritte umfasst: Ligieren der hybridisierten X-mer-Vorläufer, die benachbart zu den endständigen 3'-Hydroxylgruppen der oberflächengebundenen Sonde angeordnet sind, um einen Hybridisierter-Vorläufer/Sonde-Komplex, an den die Targetnukleinsäuresequenz angelagert ist, zu bilden; und wobei Schritt (3) ein Beseitigen von nicht-ligierten X-mer-Vorläufern umfasst.
  22. Ein Verfahren gemäß Anspruch 21, bei dem die hybridisierten X-mer-Vorläufer unter Verwendung einer DNA-Ligase oder eines Kondensationsmittels mit der Sonde ligiert werden.
  23. Ein Verfahren gemäß Anspruch 20 oder 22, bei dem das Kondensationsmittel ein Carbodiimid- oder ein Cyanbromid-Derivat ist.
  24. Ein Verfahren gemäß einem der Ansprüche 12 bis 23, bei dem das Gemisch in zumindest zwei Reaktionsgemischen vorgesehen ist.
  25. Ein Verfahren gemäß einem der Ansprüche 12 bis 24, bei dem der spaltbare Linker ein photospaltbarer Linker oder ein chemischer spaltbarer Linker ist.
  26. Ein Verfahren gemäß einem der Ansprüche 12 bis 25, bei dem die Komplexe mittels MS-MS-Massenspektrometrie analysiert werden.
  27. Ein Bausatz zum Ausführen eines Verfahrens zum Analysieren einer Targetnukleinsäuresequenz, der folgende Merkmale aufweist: a. das Gemisch oder den Satz von Teilgemischen gemäß der Definition in einem der Ansprüche 1 bis 11; und b. ein Enzym, das eine Nukleotidpolymeraseaktivität aufweist.
  28. Ein Bausatz gemäß Anspruch 27, der ferner eine Vielzahl von Nukleotiden umfasst, die natürliche Kettenabbruch-Triphosphate oder modifizierte Kettenabbruch-Triphosphate oder eine Kombination derselben sind.
  29. Ein Bausatz gemäß Anspruch 27, der ferner Ketten-Abbruch-Nukleotide mit einer Affinitätskennung zur Reinigung von Nukleinsäuren umfasst.
  30. Ein Bausatz zum Ausführen eines Verfahrens zum Analysieren einer Targetnukleinsäuresequenz, der folgende Merkmale aufweist: a. das Gemisch oder den Satz von Teilgemischen gemäß der Definition in einem der Ansprüche 1 bis 11; und b. eine DNA-Ligase oder ein Kondensationsmittel.
  31. Ein Bausatz gemäß Anspruch 30 zum Ausführen eines Verfahrens zum Analysieren einer Targetnukleinsäuresequenz, die ein 3'-Ende und ein 5'-Ende aufweist, wobei der Bausatz zusätzlich folgende Merkmale aufweist: c. ein Array, das folgende Merkmale aufweist: (a) eine Oberfläche; und (b) eine Vielzahl von Nukleinsäuresequenzsonden, die folgendes Merkmal aufweisen: (i) eine an die Oberfläche angelagerte Nukleinsäure, wobei die Nukleinsäure ein endständiges 3'-Hydroxylende aufweist und wobei das 5'-Ende direkt oder indirekt an die Oberfläche angelagert ist.
DE60220578T 2001-04-17 2002-04-17 Methode und Reagenzien zur Analyse der Nukleotidsequenz von Nukleinsäuren Expired - Fee Related DE60220578T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US836012 2001-04-17
US09/836,012 US7399844B2 (en) 1998-07-09 2001-04-17 Method and reagents for analyzing the nucleotide sequence of nucleic acids

Publications (2)

Publication Number Publication Date
DE60220578D1 DE60220578D1 (de) 2007-07-26
DE60220578T2 true DE60220578T2 (de) 2008-02-14

Family

ID=25271010

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60220578T Expired - Fee Related DE60220578T2 (de) 2001-04-17 2002-04-17 Methode und Reagenzien zur Analyse der Nukleotidsequenz von Nukleinsäuren

Country Status (3)

Country Link
US (1) US7399844B2 (de)
EP (1) EP1251136B1 (de)
DE (1) DE60220578T2 (de)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
ATE463584T1 (de) 2004-02-19 2010-04-15 Helicos Biosciences Corp Verfahren zur analyse von polynukleotidsequenzen
DE102005012567B4 (de) * 2005-03-04 2008-09-04 Identif Gmbh Markierungslösung, deren Verwendung und Verfahren zu ihrer Herstellung
US20080312092A1 (en) * 2005-07-08 2008-12-18 The University Of Denver Photoinduced Signal Amplification Through Externally Sensitized Photofragmentation in Masked Photosensitizers
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
WO2007070761A2 (en) * 2005-12-12 2007-06-21 Colorado Seminary, Which Owns And Operates The University Of Denver Method for encoding and screening combinatorial libraries
US7655476B2 (en) * 2005-12-19 2010-02-02 Thermo Finnigan Llc Reduction of scan time in imaging mass spectrometry
US20070259347A1 (en) * 2006-05-03 2007-11-08 Agilent Technologies, Inc. Methods of increasing the effective probe densities of arrays
US20080058218A1 (en) * 2006-05-03 2008-03-06 Gordon David B Arrays of compound probes and methods using the same
US20070259346A1 (en) * 2006-05-03 2007-11-08 Agilent Technologies, Inc. Analysis of arrays
US20070259345A1 (en) * 2006-05-03 2007-11-08 Agilent Technologies, Inc. Target determination using compound probes
CN102083998B (zh) 2007-06-19 2016-08-03 斯特拉托斯基因公司 通过展开进行高通量核酸测序
WO2009026313A1 (en) * 2007-08-20 2009-02-26 Colorado Seminary, Which Owns And Operates The University Of Denver Photoinduced signal amplification through externally sensitized photofragmentation in masked photosensitizers and photoamplified fluorescence turn-off system
WO2012003330A2 (en) * 2010-06-30 2012-01-05 Stratos Genomics, Inc Multiplexed identification of nucleic acid sequences
JP6475718B2 (ja) * 2013-07-30 2019-02-27 プレジデント アンド フェローズ オブ ハーバード カレッジ 定量的なdnaベースのイメージング及び超解像イメージング
EP3030682B1 (de) 2013-08-05 2020-06-03 Twist Bioscience Corporation De-novo-synthetisierte genbanken
WO2016126882A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016126987A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Compositions and methods for synthetic gene assembly
WO2016172377A1 (en) 2015-04-21 2016-10-27 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
CN108368482A (zh) 2015-09-18 2018-08-03 特韦斯特生物科学公司 寡核酸变体文库及其合成
KR20180058772A (ko) 2015-09-22 2018-06-01 트위스트 바이오사이언스 코포레이션 핵산 합성을 위한 가요성 기판
US9895673B2 (en) 2015-12-01 2018-02-20 Twist Bioscience Corporation Functionalized surfaces and preparation thereof
EP3500672A4 (de) 2016-08-22 2020-05-20 Twist Bioscience Corporation De-novo-synthetisierte nukleinsäure-bibliotheken
US10417457B2 (en) 2016-09-21 2019-09-17 Twist Bioscience Corporation Nucleic acid based data storage
GB2573069A (en) 2016-12-16 2019-10-23 Twist Bioscience Corp Variant libraries of the immunological synapse and synthesis thereof
WO2018156792A1 (en) 2017-02-22 2018-08-30 Twist Bioscience Corporation Nucleic acid based data storage
EP3595674A4 (de) 2017-03-15 2020-12-16 Twist Bioscience Corporation Variante bibliotheken der immunologischen synapse und synthese davon
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
KR102628876B1 (ko) 2017-06-12 2024-01-23 트위스트 바이오사이언스 코포레이션 심리스 핵산 어셈블리를 위한 방법
SG11202002194UA (en) 2017-09-11 2020-04-29 Twist Bioscience Corp Gpcr binding proteins and synthesis thereof
JP7066840B2 (ja) 2017-10-20 2022-05-13 ツイスト バイオサイエンス コーポレーション ポリヌクレオチド合成のための加熱されたナノウェル
CN112041438A (zh) 2018-01-04 2020-12-04 特韦斯特生物科学公司 基于dna的数字信息存储
SG11202011467RA (en) 2018-05-18 2020-12-30 Twist Bioscience Corp Polynucleotides, reagents, and methods for nucleic acid hybridization
AU2020227802A1 (en) 2019-02-26 2021-10-14 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
KR20210143766A (ko) 2019-02-26 2021-11-29 트위스트 바이오사이언스 코포레이션 Glp1 수용체에 대한 변이체 핵산 라이브러리
CN114729342A (zh) 2019-06-21 2022-07-08 特韦斯特生物科学公司 基于条形码的核酸序列装配

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9315847D0 (en) * 1993-07-30 1993-09-15 Isis Innovation Tag reagent and assay method
US5604097A (en) * 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
GB9618544D0 (en) 1996-09-05 1996-10-16 Brax Genomics Ltd Characterising DNA
CA2277786A1 (en) 1997-01-15 1998-07-23 Brax Group Limited Mass label linked hybridisation probes
US20020042048A1 (en) 1997-01-16 2002-04-11 Radoje Drmanac Methods and compositions for detection or quantification of nucleic acid species
US6607878B2 (en) * 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
GB9823646D0 (en) 1997-12-19 1998-12-23 Brax Genomics Ltd Compounds for mass spectrometry
US6218118B1 (en) * 1998-07-09 2001-04-17 Agilent Technologies, Inc. Method and mixture reagents for analyzing the nucleotide sequence of nucleic acids by mass spectrometry

Also Published As

Publication number Publication date
US7399844B2 (en) 2008-07-15
US20020182601A1 (en) 2002-12-05
EP1251136B1 (de) 2007-06-13
EP1251136A2 (de) 2002-10-23
DE60220578D1 (de) 2007-07-26
EP1251136A3 (de) 2003-03-19

Similar Documents

Publication Publication Date Title
DE60220578T2 (de) Methode und Reagenzien zur Analyse der Nukleotidsequenz von Nukleinsäuren
DE69927343T2 (de) Verfahren und mittel zur analyse der nukleotidsequenz von nukleinsäuren
DE69838519T2 (de) Massenmarkierte Hybridisierungssonden
DE69834056T2 (de) De novo oder &#34;universaler&#34; sequenzierungs-array
DE69433811T2 (de) Dns - sequenzierung durch massenspektronomie
DE60127162T2 (de) Massives Parallelverfahren zur Dekodierung von DNA und RNA
DE69433487T2 (de) Methoden und zusammensetzungen zur effizienten nukleinsaeuresequenzierung
DE60208278T2 (de) System und Verfahren zum Testen von Nukleinsäuremolekülen
DE69814629T2 (de) Verfahren und verbindungen zur analysierung von nukleinsaeuren durch massenspektrometrie
DE69534389T2 (de) Mit PNA- und Amidat-Etiketten bestückte Festphasenträger
DE69701671T3 (de) Verfahren und zusammenstellungen zur sequenzbestimmung von nukleinsäuremolekülen
DE69637285T2 (de) Oligonukleotid-tags zur sortierung und identifizierung
US7052846B2 (en) Methods and compositions for analyzing nucleic acid molecules utilizing sizing techniques
DE69534930T2 (de) Molekulares markierungssystem
EP1725572B1 (de) Makromolekulare nukleotidverbindungen und methoden zu deren anwendung
EP1036202B1 (de) Verfahren zur identifikation von nucleinsäuren durch matrix-assistierte laser desorptions/ionisations massenspektrometrie
DE19824280A1 (de) Mutationsanalyse mittels Massenspektrometrie
DE10108453A1 (de) Massenspektrometrische Mutationsanalyse mit photolytisch spaltbaren Primern
DE10120798A1 (de) Verfahren zur Bestimmung der Genexpression
EP1425417B1 (de) Detektion von wechselwirkungen auf sonden-arrays
DE10112387A1 (de) Massenspektrometrische Genotypisierung
EP1234056B1 (de) Dynamische bestimmung von analyten durch arrays auf inneren oberflächen
EP1242628B1 (de) Verfahren zur analyse von nukleinsäuresequenzen
DE10058915A1 (de) Verfahren zur Bestimmung einer Nucleotidsequenz
US20040248104A1 (en) Methods and reagents for profiling quantities of nucleic acids

Legal Events

Date Code Title Description
8327 Change in the person/name/address of the patent owner

Owner name: AGILENT TECHNOLOGIES, INC. (N.D.GES.D. STAATES, US

8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee