DE69433180T2 - Felder von nukleinsaeuresonden auf biologischen chips - Google Patents

Felder von nukleinsaeuresonden auf biologischen chips Download PDF

Info

Publication number
DE69433180T2
DE69433180T2 DE69433180T DE69433180T DE69433180T2 DE 69433180 T2 DE69433180 T2 DE 69433180T2 DE 69433180 T DE69433180 T DE 69433180T DE 69433180 T DE69433180 T DE 69433180T DE 69433180 T2 DE69433180 T2 DE 69433180T2
Authority
DE
Germany
Prior art keywords
probes
probe
sequence
reference sequence
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69433180T
Other languages
English (en)
Other versions
DE69433180D1 (de
Inventor
Mark Chee
Maureen T. Cronin
Stephen P.A. Fodor
Thomas R. Gingeras
Xiaohua C. Huang
Earl A. Hubbell
Robert J. Lipshutz
Peter E. Lobban
Charles Garrett Miyada
Macdonald S. Morris
Nila Shah
Edward L. Sheldon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affymetrix Inc
Original Assignee
Affymetrix Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affymetrix Inc filed Critical Affymetrix Inc
Publication of DE69433180D1 publication Critical patent/DE69433180D1/de
Application granted granted Critical
Publication of DE69433180T2 publication Critical patent/DE69433180T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y30/00Nanotechnology for materials or surface science, e.g. nanocomposites
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00351Means for dispensing and evacuation of reagents
    • B01J2219/00427Means for dispensing and evacuation of reagents using masks
    • B01J2219/00432Photolithographic masks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00527Sheets
    • B01J2219/00529DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00608DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00623Immobilisation or binding
    • B01J2219/00626Covalent
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00659Two-dimensional arrays
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00709Type of synthesis
    • B01J2219/00711Light-directed synthesis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07BGENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
    • C07B2200/00Indexing scheme relating to specific properties of organic compounds
    • C07B2200/11Compounds covalently bound to a solid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B60/00Apparatus specially adapted for use in combinatorial chemistry or with libraries
    • C40B60/14Apparatus specially adapted for use in combinatorial chemistry or with libraries for creating libraries

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Nanotechnology (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • General Physics & Mathematics (AREA)
  • Materials Engineering (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Composite Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

  • Hintergrund der Erfindung
  • Gebiet der Erfindung
  • Die vorliegende Erfindung stellt Arrays aus Oligonukleotidsonden zur Verfügung, die in mikrogefertigten Mustern auf Siliciumchips immobilisiert sind, um molekulare Wechselwirkungen von biologischem Interesse zu untersuchen. Die Erfindung bezieht sich daher auf verschiedene Gebiete, welche die Natur molekularer Wechselwirkungen beeinflussen, einschließlich Chemie, Biologie, Medizin und medizinische Diagnose.
  • Beschreibung der verwandten Technik
  • Um in einer ausgewählten Nukleinsäure (die "Ziel"-Nukleinsäure), komplementäre Nukleinsäuresequenzen zu detektieren, werden seit langer Zeit Oligonukleotidsonden benutzt. In einigen Assay-Formaten ist die Oligonukleotidsonde an einen festen Träger angebunden, d. h. kovalent verbunden, und auf festen Trägern immobilisierte Arrays aus Oligonukleotidsonden wurden benutzt, um spezifische Nukleinsäuresequenzen in einer Zielnukleinsäure zu detektieren. Siehe z. B. PCT-Patentveröffentlichungen Nr. WO89/10977 und 89/11548. Andere haben die Verwendung einer großen Anzahl von Oligonukleotidsonden vorgeschlagen, um die vollständige Nukleinsäuresequenz einer Zielnukleinsäure bereitzustellen, haben es aber unterlassen, ein Verfahren zur Verfügung zu stellen, das es ermöglicht, Arrays aus immobilisierten Sonden für diesen Zweck zu benutzen. Siehe US-Patente Nr. 5,202,231 und 5,002,867 und PCT-Patentveröffentlichung Nr. WO93/17126.
  • Die Entwicklung der VLSIPS® Technologie hat Verfahren zur Verfügung gestellt, um sehr große Arrays aus Oligonukleotidsonden auf sehr kleinen Arrays herzustellen. Siehe US-Patent Nr. 5,143,854 und PCT-Patentveröffentlichung Nr. WO90/15070 und 92/10092. US-Patent Nr. 6,284,460, am 25. Juni 1993 eingereicht, beschreibt Verfahren zur Herstellung von Arrays aus Oligonukleotidsonden, die verwendet werden können, um die vollständige Sequenz einer Zielnukleinsäure zur Verfügung zu stellen und die Anwesenheit einer Nukleinsäure, die eine spezifische Nukleotidsequenz enthält, zu detektieren. WO92/10588 offenbart verschiedene Verfahren zur Benutzung von Arrays aus immobilisierten Nukleinsäuren, um die Sequenz oder Expression von Zielpolynukleotiden zu untersuchen.
  • Mikrogefertigte Arrays aus einer großen Zahl von Oligonukleotidsonden, "DNA Chips" genannt, bieten großartige Aussichten für eine große Auswahl an Anwendungen. Neue Verfahren und Reagentien sind notwendig, um diese Aussichten zu realisieren, und die vorliegende Erfindung hilft, dieses Bedürfnis zu befriedigen.
  • Zusammenfassung der Erfindung
  • Die Erfindung stellt mehrere Strategien zur Verfügung, die immobilisierte Arrays aus Sonden nutzen, um eine Referenzsequenz von bekannter Sequenz mit einer Zielsequenz zu vergleichen, die wesentliche Ähnlichkeit mit der Referenzsequenz zeigt, sich aber durch die Gegenwart von, z. B. Mutationen, unterscheidet. In einer ersten Ausführungsform stellt die Erfindung eine Tiling-Strategie bereit, die ein Array aus immobiliserten Oligonukleotidsonden nutzt, das minstens zwei Sätze von Sonden umfaßt. Ein erster Sondensatz umfaßt eine Vielzahl von Sonden, wobei jede Sonde einen Abschnitt von mindestens 3 Nukleotiden umfaßt, welche genau komplementär zu einer Teilsequenz der Referenzsequenz sind, und der Abschnitt mindestens eine Abfrageposition beinhaltet, welche komplementär zu einem entsprechenden Nukleotid in der Referenzsequenz ist. Ein zweiter Sondensatz umfaßt eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz, wobei die entsprechende Sonde in dem zweiten Sondensatz identisch mit einer Sequenz ist, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens drei Nukleotiden davon umfaßt, welche die mindestens eine Abfrageposition beinhaltet, außer daß die mindestens eine Abfrageposition in jeder der beiden entsprechenden Sonden aus den ersten und zweiten Sondensätzen von einem unterschiedlichen Nukleotid besetzt ist. Die Sonden in dem ersten Sondensatz weisen mindestens zwei Abfragepositionen auf, die zwei zusammenhängenden Nukleotiden in der Referenzsequenz entsprechen. Eine Abfrageposition entspricht einem der zusammenhängenden Nukleotide, und die andere Abfrageposition dem anderen.
  • In einer zweiten Ausführungsform stellt die Erfindung eine Tiling-Strategie bereit, die einen Array nutzt, das vier Sondensätze umfaßt. Ein erster Sondensatz umfaßt eine Vielzahl von Sonden, wobei jede Sonde einen Abschnitt von mindestens drei Nukleotiden umfaßt, welche genau komplementär zu einer Teilsequenz der Referenzsequenz sind, und der Abschnitt mindestens eine Abfrageposition beinhaltet, welche komplementär zu einem entsprechenden Nukleotid in der Referenzsequenz ist. Zweite, dritte und vierte Sondensätze umfassen für jede Sonde in dem ersten Sondensatz jeweils eine entsprechende Sonde. Die Sonden in den zweiten, dritten und vierten Sondensätzen sind identisch mit einer Sequenz, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens drei Nukleotiden davon umfaßt, welche die mindestens eine Abfrageposition beinhaltet, außer daß die mindestens eine Abfrageposition in jeder der vier entsprechenden Sonden aus den vier Sondensätzen von einem unterschiedlichen Nukleotid besetzt ist. Der erste Sondensatz weist oft mindestens 100 Abfragepositionen auf, die 100 zusammenhängenden Nukleotiden in der Referenzsequenz entsprechen. Manchmal weist der erste Sondensatz eine Abfrageposition auf, die jedem Nukleotid in der Referenzsequenz entspricht. Der komplementäre Abschnitt in dem Sondensatz beträgt üblicherweise etwa 9–21 Nukleotide. Obwohl Sonden zusätzlich zu den 9–21er Sequenzen vorausgehende oder angehängte Sequenzen enthalten können, bestehen viele Sonden ausschließlich aus einem 9–21er komplementären Abschnitt.
  • In einer dritten Ausführungsform stellt die Erfindung immobilisierte Sondenarrays bereit, die für das Tiling mit multiplen Referenzsequenzen ausgelegt sind. Ein solches Array umfaßt mindestens ein Paar erster und zweiter Sondengruppen, wobei, wie in der ersten Ausführungsform definiert, jede Gruppe erste und zweite Sondensätze umfaßt. Jede Sonde in dem ersten Sondensatz aus der ersten Gruppe ist genau komplementär zu einer Teilsequenz einer ersten Referenzsequenz und jede Sonde des ersten Probensatzes aus der zweiten Gruppe ist genau komplementär zu einer Teilsequenz einer zweiten Referenzsequenz. Damit ist die erste Gruppe von Sonden für das Tiling in Beziehung auf eine erste Referenzsequenz und die zweite Gruppe von Sonden in Beziehung auf eine zweite Referenzsequenz ausgelegt. Jede Gruppe von Sonden kann weiterhin dritte und vierte Sondensätze, wie in der zweiten Ausführungsform beschrieben, umfassen. In manchen Arrays dieser Art ist die zweite Referenzsequenz eine mutierte Form der ersten Referenzsequenz.
  • In einer vierten Ausführungsform stellt die Erfindung Arrays für Block-Tiling bereit. Block-Tiling ist eine Art der oben beschriebenen allgemeinen Tiling-Strategien. Die übliche Einheit eines Block-Tiling-Arrays ist eine Gruppe von Sonden, die eine Wildtypsonde, einen ersten Satz von drei mutierten Sonden und einen zweiten Satz von drei mutierten Sonden umfaßt. Die Wildtypsonde umfaßt einen Abschnitt von mindestens drei Nukleotiden, die zu einer Teilsequenz einer Referenzsequenz genau komplementär sind. Der Abschnitt weist mindestens erste und zweite Abfragepositionen auf, die dem ersten und zweiten Nukleotid in der Referenzsequenz entsprechen. Die Sonden in dem ersten Satz von drei mutierten Sonden sind jeweils identisch mit einer Sequenz, welche die Wildtypsonde oder eine Teilsequenz von mindestens drei Nukleotiden davon, einschließlich die ersten und zweiten Abfragepositionen umfaßt, außer an der ersten Abfrageposition, die in jeder der drei mutierten Sonden und der Wildtypsonde durch ein unterschiedliches Nukleotid besetzt ist. Die Sonden in dem zweiten Satz von drei mutierten Sonden sind jeweils identisch zu einer Sequenz, welche die Wildtypsonden oder eine Teilsequenz von mindestens drei Nukleotiden davon, einschließlich die ersten und zweiten Abfragepositionen, umfaßt, außer an der zweiten Abfrageposition, welche in jeder der drei mutierten Sonden und der Wildtypsonde durch ein unterschiedliches Nukleotid besetzt ist.
  • In einer fünften Ausführungsform stellt die Erfindung Verfahren bereit, eine Zielsequenz mit einer Referenzsequenz zu vergleichen, indem man Arrays aus immobiliserten gepoolten Sonden benutzt. Die in diesen Verfahren genutzten Arrays stellen eine weitere Art der allgemeinen, oben erwähnten Tiling-Arrays dar. In diesen Verfahren werden Varianten einer Referenzsequenz identifiziert, die von der Referenzsequenz in mindestens einem Nukleotid abweichen, und jeder Variante wird eine Bezeichnung zugewiesen. Ein Array aus gepoolten Sonden wird bereitgestellt, bei dem jeder Pool eine getrennte Zelle des Arrays besetzt. Jeder Pool umfaßt eine Sonde, die einen Abschnitt genau komplementär zu jeder Variantensequenz, der eine bestimmte Bezeichnung zugeordnet wurde, umfaßt. Das Array wird dann mit einer Zielsequenz in Kontakt gebracht, welche eine Variante der Referenzsequenz umfaßt. Die relativen Hybridisierungsintensitäten der Pools in dem Array gegenüber der Zielsequenz werden bestimmt. Die Identität der Zielsequenz wird von dem Muster der Hybridisierungsintensitäten abgeleitet. Oft wird jeder Variante eine Bezeichnung zugewiesen, die mindestens eine Ziffer und mindestens einen Wert für die Ziffer aufweist. In diesem Fall umfaßt jeder Pool eine Sonde, die einen Abschnitt genau komplementär zu jeder Variantensequenz umfaßt, der ein bestimmter Wert in einer bestimmten Ziffer zugewiesen wurde. Wenn Varianten aufeinanderfolgende Nummern in einem Nummerierungssystem, in dem Base m n Ziffern aufweist, zugewiesen bekommen, werden n × (m – 1) gepoolte Sonden benutzt, um jeder Variante eine Bezeichnung zuzuweisen.
  • In einer sechsten Ausführungsform stellt die Erfindung eine gepoolte Sonde für Gittertiling, eine weitere Art der allgemeinen Tilingstrategien, bereit. Beim Gittertiling wird die Identität eines Nukleotids in einer Zielsequenz durch einen Vergleich der Hybridisierungsintensitäten von 3 gepoolten Gittersonden bestimmt. Eine gepoolte Gittersonde umfaßt einen Abschnitt genau komplementär zu einer Teilsequenz einer Referenzsequenz, außer an einer ersten Abfrageposition, die durch ein gepooltes Nukleotid N besetzt ist, einer zweiten Abfrageposition, die durch ein gepooltes Nukleotid, ausgewählt aus der Gruppe von drei bestehend aus (1) M oder K, (2) R oder Y und (3) S oder W besetzt ist, und einer dritten Abfrageposition, die durch ein zweites, aus dieser Gruppe ausgewähltes gepooltes Nukleotid besetzt ist. Das gepoolte Nukleotid, das die zweite Abfrageposition besetzt, umfaßt ein Nukleotid komplementär zu einem entsprechenden Nukleotid der Referenzsequenz, wenn die gepoolte Sonde und Referenzsequenz maximal aneinander ausgerichtet sind, und das gepoolte Nukleotid, das die dritte Abfrageposition besetzt, umfaßt ein Nukleotid komplementär zu einem entsprechenden Nukleotid aus der Referenzsequenz, wenn die dritte gepoolte Sonde und die Referenzsequenz maximal aneinander ausgerichtet sind. Standard IUPAC-Nomenklatur wird für die Beschreibung der gepoolten Nukleotide genutzt.
  • Beim Gittertiling umfaßt ein Array mindestens erste, zweite und dritte Zellen, entsprechend von ersten, zweiten und dritten gepoolten Sonden besetzt, jeweils nach der allgemeinen Beschreibung oben. Der komplementäre Abschnitt, die Lage der Abfragepositionen und die Auswahl des gepoolten Nukleotids an jeder Abfrageposition kann sich, mit der folgenden Einschrän kung zwischen den drei gepoolten Sonden unterscheiden oder nicht. Eine der drei Abfragepositionen in jeder der drei gepoolten Sonden muß mit dem gleichen entsprechenden Nukleotid in der Referenzsequenz ausgerichtet sein. Diese Abfrageposition muß in einer der gepoolten Sonden von einem N besetzt sein, und in den anderen zwei gepoolten Sonden von einem anderen gepoolten Nukleotid.
  • In einer siebten Ausführungsform stellt die Erfindung Arrays für Brückentiling zur Verfügung. Brückentiling ist eine Art der oben erwähnten allgemeinen Tilingstrategien, in der Sonden des ersten Sondensatzes mehr als einen komplementären Abschnitt enthalten. Beim Brückentiling wird ein Nukleotid in einer Referenzsequenz normalerweise durch einen Vergleich von vier Sonden bestimmt. Eine erste Sonde umfaßt mindestens erste und zweite Abschnitte von jeweils mindestens drei Nukleotiden, jeweils genau komplementär zu ersten und zweiten Teilsequenzen einer Referenzsequenz. Die Abschnitte umfassen mindestens eine Abfrageposition, die einem Nukleotid in der Referenzsequenz entspricht. Entweder (1) die ersten und zweiten Teilsequenzen sind in der Referenzsequenz nicht zusammenhängend oder (2) die ersten und zweiten Teilsequenzen sind benachbart und die ersten und zweiten Abschnitte sind gegenüber den ersten und zweiten Teilsequenzen umgekehrt. Die Arrays umfassen weitere zweite, dritte und vierte Sonden, die identisch zu einer Sequenz sind, welche die erste Sonde oder eine Teilsequenz davon umfaßt, die mindestens drei Nukleotide von jedem der ersten und zweiten Abschnitte umfaßt, außer in der mindestens einen Abfrageposition, welche sich in jeder der Sonden unterscheidet. In einer Art des Brückentilings, die als Deletionstiling bezeichnet wird, werden die ersten und zweiten Teilsequenzen durch ein und zwei Nukleotide in der Referenzsequenz getrennt.
  • In einer achten Ausführungsform stellt die Erfindung Arrays aus Sonden für Multiplextiling zur Verfügung. Multiplextiling ist eine Strategie, bei der die Identität von zwei Nukleotiden in einer Zielsequenz durch einen Vergleich der Hybridisierungsintensitäten von vier Sonden, die jeweils zwei Abfragepositionen aufweisen, bestimmt wird. Jede der Sonden umfaßt einen Abschnitt von mindestens 7 Nukleotiden, der genau komplementär zu einer Teilsequenz einer Referenzsequenz ist, außer daß der Abschnitt an zwei Abfragepositionen genau komplementär sein kann oder nicht. Die Nukleotide, welche die Abfragepositionen besetzen, werden nach den folgenden Regeln ausgewählt: (1) Die erste Abfrageposition wird in jeder der vier Sonden von einem anderen Nukleotid besetzt, (2) die zweite Abfrageposition wird in jeder der vier Sonden von einem anderen Nukleotid besetzt, (3) in den ersten und zweiten Sonden ist der Abschnitt genau komplementär zu der Teilsequenz, außer an nicht mehr als einer der Abfragepositionen, (4) in den dritten und vierten Sonden ist der Abschnitt genau komplementär zu der Teilsequenz, außer an beiden Abfragepositionen.
  • In einer neunten Ausführungsform stellt die Erfindung Arrays aus immobilisierten Sonden bereit, die Helfermutationen einschließen. Helfermutationen sind nützlich um z. B. ein Selbstanlagern von Sonden, die invertierte Wiederholungen aufweisen, zu verhindern. Bei dieser Strategie wird die Identität eines Nukleotids in einer Zielsequenz normalerweise durch einen Vergleich von 4 Sonden bestimmt. Eine erste Sonde umfaßt einen Abschnitt von mindestens 7 Nukleotiden, die genau komplementär zu einer Teilsequenz einer Referenzsequenz sind, außer an ein oder zwei Positionen, wobei der Abschnitt eine Abfrageposition nicht an der einen oder den zwei Positionen beinhaltet. Die eine oder zwei Positionen sind von Helfermutationen besetzt. Die zweiten, dritten und vierten mutierten Sonden sind jeweils identisch zu einer Sequenz, welche die Wildtypsonde oder eine Teilsequenz davon umfaßt, welche die Abfrageposition und die eine oder die zwei Positionen beinhaltet, außer an der Abfrageposition, welche in jeder der vier Sonden durch ein unterschiedliches Nukleotid besetzt ist.
  • In einer zehnten Ausführungsform stellt die Erfindung Arrays aus Sonden bereit, die mindestens zwei Sondensätze umfassen, wobei aber ein Sondensatz fehlt, der Sonden umfaßt, die perfekt mit einer Referenzsequenz übereinstimmen. Solche Arrays werden normalerweise in Verfahren genutzt, in denen sowohl die Referenz- als auch die Zielsequenz mit dem Array hybridisiert werden. Der erste Sondensatz umfaßt eine Vielzahl von Sonden, wobei jede Sonde einen Abschnitt genau komplementär zu einer Teilsequenz von mindestens 3 Nukleotiden einer Referenzsequenz umfaßt, außer in einer Abfrageposition. Der zweite Sondensatz umfaßt eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz, wobei die entsprechende Sonde in dem zweiten Sondensatz identisch zu einer Sequenz ist, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens drei Nukleotiden davon umfaßt, welche die Abfrageposition einschließt, außer daß die Abfrageposition in jeder der beiden entsprechenden Sonden und dem Gegenstück zu der Referenzsequenz durch ein unterschiedliches Nukleotid besetzt ist.
  • In einer elften Ausführungsform stellt die Erfindung Verfahren bereit, eine Zielsequenz mit einer Referenzsequenz zu vergleichen, die eine vorbestimmte Nukleotidsequenz umfaßt, wobei jedes der oben beschriebenen Arrays benutzt werden kann. Die Verfahren umfassen das Hybridisieren der Zielnukleinsäure mit einem Array und das Bestimmen, welche Sonden in dem Array, relativ zu den anderen spezifisch an die Zielnukleinsäure binden. Die relative spezifische Bindung der Sonden gibt an, ob die Zielsequenz mit der Referenzsequenz gleich oder unterschiedlich ist. In einigen solcher Verfahren weist die Zielsequenz in mindestens einer unbestimmten Position ein substituiertes Nukleotid relativ zur Referenzsequenz auf, und die relative spezifische Bindung der Sonden gibt die Lage der Position und das Nukleotid, das die Position in der Zielsequenz besetzt, an. In einigen Verfahren wird auch eine zweite Zielnukleinsäure mit dem Array hybridisiert. Die relative spezifische Bindung der Sonden gibt dann sowohl an, ob die Zielsequenz gleich wie die Referenzsequenz oder unterschiedlich ist und ob die zweite Zielsequenz gleich wie die Referenzsequenz oder unterschiedlich ist. In einigen Verfahren, wenn das Array zwei Gruppen von Sonden, jeweils für das Tiling von ersten und zweiten Referenzsequenzen umfaßt, gibt die relative spezifische Bindung der Sonden in der ersten Gruppe an, ob die Zielsequenz gleich wie die erste Referenzsequenz oder unterschiedlich ist. Die relative spezifische Bindung der Sonden in der zweiten Gruppe gibt an, ob die Zielsequenz gleich wie die zweite Referenzsequenz oder unterschiedlich ist. Solche Verfahren sind besonders nützlich, um heterologe Allele eines Gens zu analysieren. Manche Verfahren bringen es mit sich, sowohl eine Referenzsequenz als auch eine Zielsequenz mit einem der oben beschriebenen Sondenarrays zu hybridisieren. Der Vergleich der relativen spezifischen Bindung der Sonden zu den Referenz- und Zielsequenzen gibt an, ob die Zielsequenz mit der Referenzsequenz gleich oder unterschiedlich ist.
  • In einer zwölften Ausführungsform stellt die Erfindung Arrays aus immobilisierten Sonden bereit, in denen die Sonden für das Tiling einer Referenzsequenz von einem humanen Immunschwächevirus entworfen sind. Von besonderem Interesse sind Referenzsequenzen entweder von dem reverse Transkriptasegen oder Proteasegen von HIV. Manche Chips umfassen weiterhin Arrays aus Sonden für das Tiling einer Referenzsequenz von einer 16S RNA oder DNA, die die 16S RNA eines pathogenen Mikroorganismus kodiert. Die Erfindung stellt weiter Verfahren bereit, die solche Arrays benutzen, um eine HIV Zielsequenz zu analysieren. Die Verfahren sind besonders nützlich, wo die Zielsequenz ein substituiertes Nukleotid relativ zu der Referenzsequenz in mindestens einer Position aufweist, wobei die Substitution Resistenz gegenüber einem Wirkstoff verleiht, der dazu benutzt wird, einen mit HIV-Virus infizierten Patienten zu behandeln. Die Verfahren zeigen die Existenz des substituierten Nukleotids. Die Verfahren sind auch besonders nützlich für das Analysieren einer Mischung mit unbestimmten Verhältnissen von ersten und zweiten Zielsequenzen von unterschiedlichen HIV Varianten. Die relative spezifische Bindung von Sonden gibt die Verhältnisse von ersten und zweiten Zielsequenzen an.
  • In einer dreizehnten Ausführungsform stellt die Erfindung Arrays aus Sonden bereit, die für das Tiling basierend auf Referenzsequenzen eines CFTR Genes angepaßt sind. Ein bevorzugtes Array umfaßt mindestens eine Gruppe von Sonden, die eine Wildtypsonde und 5 Sondensätze von drei mutierten Sonden umfaßt. Die Wildtypsonde ist genau komplementär zu einer Teilsequenz einer Referenzsequenz von einem cystische Fibrose-Gen, wobei der Abschnitt mindestens 5 Abfragepositionen, die 5 zusammenhängenden Nucleotiden in der Referenzsequenz entsprechen, aufweist. Die Sonden in dem ersten Satz von drei mutierten Sonden sind jeweils identisch mit der Wildtypsonde, außer in einer ersten der 5 Abfragepositionen, welche in jeder der drei mutierten Sonden und der Wildtypsonde von einem unterschiedlichen Nukleotid besetzt ist. Die Sonden in dem zweiten Satz von drei mutierten Sonden sind jeweils identisch mit der Wildtypsonde, außer in einer zweiten der 5 Abfragepositionen, welche in jeder der drei mutierten Sonden und der Wildtysonde von einem unterschiedlichen Nukleotid besetzt ist. Die Sonden in dem dritten Satz von drei mutierten Sonden sind jeweils identisch mit der Wildtypsonde, außer in einer dritten der 5 Abfragepositionen, welche in jeder der drei mutierten Sonden und der Wildtypsonde von einem unterschiedlichen Nukleotid besetzt ist. Die Sonden in dem vierten Satz von drei mutierten Sonden sind jeweils identisch mit der Wildtypsonde, außer in einer vierten der 5 Abfragepositionen, welche in jeder der drei mutierten Sonden und der Wildtypsonde von einem unterschiedlichen Nukleotid besetzt ist. Die Sonden in dem fünften Satz von drei mutierten Sonden sind jeweils identisch mit der Wildtypsonde, außer in einer fünften der 5 Abfragepositionen, welche in jeder drei mutierten Sonden und der Wildtypsonde von einem unterschiedlichen Nukleotid besetzt ist. Vorzugsweise umfaßt ein Chip zwei solche Gruppen von Sonden. Die erste Gruppe umfaßt eine Wildtypsonde, die genau komplementär zu einer ersten Referenzsequenz ist, und die zweite Gruppe umfaßt eine Wildtypsonde, die genau komplementär zu einer zweiten Referenzsequenz ist, die eine mutierte Form der ersten Referenzsequenz ist.
  • Die Erfindung stellt weiterhin Verfahren bereit, die erfindungsgemäßen Arrays zu benutzen, um Zielsequenzen von einem CFTR Gen zu analysieren. Diese Verfahren sind in der Lage, gleichzeitig erste und zweite Zielsequenzen, die heterozygote Allele eines CFTR Gens repräsentieren, zu analysieren.
  • In einer vierzehnten Ausführungsform stellt die Erfindung Arrays aus Sonden für das Tiling einer Referenzsequenz von einem p53 Gen, einem hMLH1 Gen und/oder einen MSH2 Gen bereit. Die Erfindung stellt weiterhin Verfahren bereit, die oben beschriebenen Arrays dazu zu benutzen, diese Gene zu analysieren. Die Verfahren sind nützlich, z. B. für die Diagnose von Patienten, die für die Entwicklung von Krebs suszeptibel sind.
  • In einer fünfzehnten Ausführungsform stellt die Erfindung Arrays aus Sonden für das Tiling einer Referenzsequenz von einem mitochondrialen Genom bereit. Die Referenzsequenz kann einen Teil oder die gesamte D-loop-Region umfassen, oder das gesamte oder im wesentlichen das gesamte mitochondriale Genom. Die Erfindung stellt weiterhin Verfahren bereit, die oben beschriebenen Arrays zu nutzen, um Zielsequenzen aus einem mitochondrialen Genom zu analysieren. Die Verfahren sind nützlich zur Identifizierung von Mutationen, die mit Krankheiten assoziiert sind, und für forensische, epidimiologische und evolutionäre Untersuchungen.
  • Kurze Beschreibung der Abbildungen
  • 1 Grundlegende Tilingstrategie. Die Figur illustriert die Beziehung zwischen einer Abfrageposition (I) und einem entsprechenden Nukleotid (n) in der Referenzsequenz, und zwischen einer Sonde des ersten Sondensatzes und entsprechenden Sonden aus zweiten, dritten und vierten Sondensätzen.
  • 2 Komplementärer Abschnitt in einer Sonde des 1. Sondensatzes.
  • 3 Schrittweise Abfolge von Sonden in einer grundlegenen Tilingstrategie. Die Figur zeigt 4 Sondensätze, die jeweils drei Sonden aufweisen. Man beachte, daß sich jede Sonde von ihrem Vorgänger in dem gleichen Satz durch die Hinzufügung eines 5'-Nukleotids und den Verlust eines 3'-Nukleotids, sowie in dem Nukleotid, das die Abfrageposition besetzt, unterscheidet.
  • 4 Beispielhaftes Arrangement von Zeilen auf einem Chip. Der Chip zeigt 4 Sondensätze, wobei jeder 5 Sonden aufweist und jeder insgesamt 5 Abfragepositionen (I1– I5), eine pro Sonde, aufweist.
  • 5 Hybridisierungsmuster eines Chips, dessen Sonden in Zeilen abgelegt sind. Dunkle Flecken weisen auf Hybridisierung hin. Die Sonden in dem unteren Teil der Figur treten in der durch den Pfeil markierten Spalte des Arrays auf, wenn die Länge der Sonden 15 und die Abfrageposition 7 ist.
  • 6 Strategien für die Detektion von Deletions- und Insertionsmutationen. Basen in Klammern können anwesend sein oder nicht.
  • 7 Blocktilingstrategie. Die Sonde des 1. Sondensatz hat 3 Abfragepositionen. Die Sonden der anderen Sondensätzen weisen nur eine dieser Abfragepositionen auf.
  • 8 Multiplextilingstrategie. Jede Sonde hat 2 Abfragepositionen.
  • 9 Helfermutations-Strategie. Der komplementäre Abschnitt unterscheidet sich von seinem Gegenstück in der Referenzsequenz sowohl durch eine Helfermutation als auch durch die Abfrageposition.
  • 10 Anordnung von Sonden auf dem HV407 Chip. Die Figur zeigt aufeinanderfolgende Sequenzreihen, von denen jede in 4 Zeilen unterteilt ist. Die 4 Zeilen entsprechen den A-, C-, G- und T-Zeilen auf dem Chip. Jede Sonde wird durch das Nukleotid, das ihre Abfrageposition besetzt, repräsentiert. Der Buchstabe "N" weist auf eine Kontrollsonde oder eine leere Spalte hin. Die Sonden von unterschiedlicher Größe sind parallel angeordnet. D. h., daß von oben nach unten, auf eine Reihe von 13meren eine Reihe von 15meren folgt, auf die eine Reihe von 17meren folgt, auf die eine Reihe von 19meren folgt.
  • 11 Fluoreszenzmuster der Hybridisierung von HV 407 mit einer Zielsequenz (pPol19), die identisch zu der Referenzsequenz des Chips ist.
  • 12 Von einem HV 407 Chip, der mit pPol19 und 4 MUT18 (in getrennten Experimenten) hybridisiert wurde, abgelesene Sequenz. Die Referenzsequenz ist mit "Wildtyp" beschriftet. Unter der Referenzsequenz befinden sich 4 Sequenzreihen, die von dem Chip, der mit dem pPol19 Ziel hybridisiert wurde, abgelesen sind, wobei die erste Reihe von 13meren abgelesen ist, die zweite Reihe von 15meren, die dritte Reihe von 17meren und die fünfte Reihe von 19meren. Unter diesen Sequenzen sind vier weitere Sequenzreihen, die von dem Chip abgelesen sind, der mit dem HXB2 Ziel hybridisiert wurde. Aufeinanderfolgende Reihen sind von 13meren, 15meren, 17meren und 19meren abgelesen. Jedes Nukleotid einer Reihe wird von den relativen Fluoreszenzintensitäten von Sonden in A-, C-, G- und T-Zeilen abgerufen. Von dem Chip abgelesene mehrdeutige Sequenzregionen sind hervorgehoben. Die Unterschiede der Stämme zwischen der HBX2 Sequenz und der Referenzsequenz, die richtig bestimmt wurden, sind mit (*) bezeichnet und diejenigen, die nicht abgerufen werden konnten, sind mit (o) bezeichnet. (Das Nukleotid in Position 417 wurde in einigen Experimenten richtig gelesen). Die Lage von einigen Mutationen, deren Assoziation mit Wirkstoffresistenz bekannt ist, die in lesbaren Regionen des Chips auftreten, werden oberhalb (Kodonnummer) und unterhalb (mutiertes Nukleotid) der mit "Wildtyp" bezeichneten Sequenz gezeigt. Die Lage der Primer, die zur Amplifizierung der Zielsequenz genutzt wurden, sind durch Pfeile gezeigt.
  • 13 Detektion von gemischten Zielsequenzen. Das mutierte Ziel unterscheidet sich von dem Wildtyp durch eine einzelne Mutation in Kodon 67 des reverse Transkriptasegens. Jede unterschiedlich große Gruppe von Sonden weist eine Spalte von 4 Sonden auf, um das Nukleotid, in dem die Mutatian auftritt, zu lesen. Die vier Sonden, die eine Spalte besetzen, sind in der Figur durch eine einzige Sonde repräsentiert, wobei das Symbol (o) die Abfrageposition kennzeichnet, die in jeder Sonde von einem unterschiedlichen Nukleotid besetzt ist.
  • 14 Fluoreszenzintensitäten von Ziel, das bei unterschiedlichem Verhältnis von mutiertem zu Wildtyp-Ziel, an 13mere und 15mere gebunden ist. Die Fluoreszenzintensitäten stammen von Sonden, die Abfragepositionen aufweisen, um das Nukleotid, in dem sich mutiertes und Wildtyp Ziel unterscheiden, abzulesen.
  • 15 Von einem Proteasechip aus 4 klinischen Proben vor und nach Behandlung mit ddI> abgelesene Sequenz.
  • 16 Blocktilingarray aus Sonden für die Analyse einer CFTR Punktmutation. Jeder gezeigte Sonde stellt tatsächlich 4 Sonden dar, wobei eine Sonde jeweils A, C, G oder T an der Abfrageposition N aufweist. In der gezeigten Reihenfolge ist die 1. Sonde auf der linken an das Tiling der Wildtyp-Referenzsequenz angepaßt, die 2. Probe an die mutierte Sequenz und immer abwechselnd so weiter. Man beachte, daß alle Sonden – außer an der Abfrageposition – identisch sind, welche sich zwischen aufeinanderfolgenden Sonden, die fürs Tiling derselben Referenzsequenz ausgelegt sind, um jeweils eine Position verschiebt (z. B. die ersten, dritten und fünften Sonden in der linken Spalte). Das Raster zeigt die Hybridisierungsintensitäten, wenn das Array mit der Referenzsequenz hybridisert wird.
  • 17 Hybridisierungsmuster bei einem heterozygoten Ziel. Die Figur zeigt das Hybridisierungsmuster, wenn das Array aus der vorigen Figur mit einer Mischung aus mutierter und Wildtyp-Referenzsequenz hybridisiert wird.
  • 18 zeigt in den Feldern A, B und C ein Bild der Region eines DNA Chips, die CFRT Exon 10 Sonden enthält; in Feld A wurde der Chip mit einem Wildtypziel hybridisiert; in Feld C wurde der Chip mit einem mutierten Δ508 Ziel hybridisiert; und in Feld B wurde der Chip mit einer Mischung der Wildtyp und mutierten Ziele hybridisiert.
  • 19 zeigt auf den Blättern 1–3, entsprechend den Feldern A, B und C von 18, Graphen der Fluoreszenzintensität gegenüber der Tilingposition. Die Beschriftungen der horizontalen Achse zeigen die Basen der Wildtypsequenz, die der Substitutionsposition in den entsprechenden Sonden entsprechen. Es sind die Intensitäten aufgetragen, die an den Merkmalen (oder Syntheseorten) beobachtet wurden, die Wildtypsonden enthalten, den Merkmalen, die die Substitutions-Sonden enthalten, die am meisten Ziel gebunden haben ("abgerufen wurden") und den Merkmalen, die die Substitutionssonden enthalten, die das Ziel mit der zweithöchsten Intensität von allen Substitutionssonden gebunden haben, ("Zweithöchstes").
  • 20 zeigt in den Feldern A, B und C ein Bild der Region eines DNA Chips, die CFTR Exon 10 Sonden enthält; in Feld A wurde der Chip mit dem wt 480 Ziel hybridisert; in Feld C wurde der Chip mit dem mu 480 Ziel hybridisiert; und in Feld B wurde der Chip mit einer Mischung der Wildtyp- und mutierten Ziele hybridisiert.
  • 21 zeigt auf den Blättern 1–3, entsprechend den Feldern A, B und C von 20, Graphen der Fluoreszenzintensität gegenüber der Tilingposition. Die Beschriftungen der horizontalen Achse zeigen die Basen der Wildtypsequenz, die der Substitutionsposition in den entsprechenden Sonden entsprechen. Es sind die Intensitäten aufgetragen, die an den Merkmalen (oder Syntheseorten) beobachtet wurden, die Wildtypsonden enthalten, den Merkmalen, die die Substitutions-Sonden enthalten, die am meisten Ziel gebunden haben ("abge rufen wurden"), und den Merkmalen, die die Substitutionssonden enthalten, die das Ziel mit der zweithöchsten Intensität von allen Substitutionssonden gebunden haben, ("Zweithöchstes").
  • 22 zeigt in den Feldern A und B ein Bild einer Region eines DNA Chips, die CFTR Exon 10 Sonden enthält; in Feld A wurde der Chip mit Nukleinsäure hybridisiert, die aus der genomischen DNA eines Individuums mit Wildtyp ΔF508 Sequenzen stammt; in Feld B stammt die Zielnukleinsäure von einem (mit Bezug auf die ΔF 508 Mutation) heterozygoten Individuum.
  • 23 zeigt auf den Blättern 1–2, entsprechend den Feldern A, B von 22, Graphen der Fluoreszenzintensität gegenüber der Tilingposition. Die Beschriftungen der horizontalen Achse zeigen die Basen der Wildtypsequenz, die der Substitutionsposition in den entsprechenden Sonden entsprechen. Es sind die Intensitäten aufgetragen, die an den Merkmalen (oder Syntheseorten) beobachtet wurden, die Wildtypsonden enthalten, den Merkmalen, die die Substitutions-Sonden enthalten, die am meisten Ziel gebunden haben ("abgerufen wurden"), und den Merkmalen, die die Substitutionssonden enthalten, die das Ziel mit der zweithöchsten Intensität von allen Substitutionssonden gebunden haben ("Zweithöchstes").
  • 24 Hybridisierung einer homozygoten Wildtyp (A) und heterozygoten (B) Zielsequenz aus Exon 11 des CFTR Gens mit einem Blocktiling Array, das entworfen wurde, um G551D und Q552X Mutationen in dem CFTR Gen zu detektieren.
  • 25 Hybridisierung von homozygoter Wildtyp (A) und ΔF 508 mutierten (B) Zielsequenzen von Exon 10 des CFTR Gens mit einem Blocktiling Array, das entworfen wurde, um Mutationen ΔF 508, ΔI 507 und F508C zu detektieren.
  • 26 Hybridisierung von heterozygoten mutierten Zielsequenzen ΔF 508/F508C mit dem Array von 25.
  • 27 zeigt das Alignment von einigen der Sonden auf einem p35 DNA Chip mit einer 12mer Modell-Zielnukleinsäure.
  • 28 zeigt einen Satz von 10mer Sonden für einen p53 Exon 6 DNA Chip.
  • 29 zeigt, daß man nach Hybridisierung von p53 DNA Chips mit Zielen, die unterschiedliche 1-Basensubstitutionen aufweisen, sehr unterschiedliche Muster beobachtet. In dem 1. Bild in 29 befinden sich in der 1. Reihe (oben) die 12mer Sonden, die perfekte Übereinstimmung mit dem Wildtypziel aufweisen. Die 12mer Sonden mit einzelnen Basenaustauschen sind in den 2., 3. und 4. Reihen lokalisiert und haben viel geringere Signale.
  • 30 bildet die Daten in 29 in den 2, 3 und 4 graphisch ab. In jeder Abb. gibt die x-Achse die Position der Sonde in ihrer Reihe auf dem Chip an und die y-Achse gibt das Signal an dem Ort dieser Sonde nach der Hybridisierung an.
  • 31 zeigt die Ergebnisse der Hybridisierung von gemischten Zielpopulationen von wt und mutierten p53 Genen mit dem p53 DNA Chip.
  • 32 zeigt in den 14 (s. auch 30) die Hybridisierungseffizienz eines 10mer Sondenarrays verglichen mit einem 12mer Sondenarray.
  • 33 zeigt ein Bild eines p53 DNA Chips, der mit einer Ziel-DNA hybridisiert ist.
  • 34 illustriert, wie die tatsächliche Sequenz von dem Chip, der in 33 abgebildet ist, abgelesen wurde. Lücken in der Sequenz von Buchstaben in den wt Reihen entsprechen Kontrollsonden oder Orten. Positionen, an denen Basen falsch abgerufen werden, werden in Zellen, die Sonden entsprechen, in denen die Wildtypbasen durch andere Basen ersetzt wurden, durch kursive Buchstaben dargestellt.
  • 35 zeigt das humane mitochondriale Genom; "OH" gibt den Beginn der Replikation des H Stranges an, und Pfeile zeigen die klonierte, nicht schattierte Sequenz.
  • 36 zeigt, das bei der Applikation einer Probe von mitochondrialer DNA abgeleiteter Nukleinsäure (von der mt4 Probe) auf einen DNA Chip beobachtete Bild.
  • 37 ähnelt 36, zeigt aber das bei der mt5 Probe beobachtete Bild.
  • 38 zeigt das basierend auf Nicht-Übereinstimmung zwischen den beiden zwei Proben und der Referenzsequenz vorhergesagte Differenzbild zwischen den mt4 und mt5 Proben auf dem DNA Chip.
  • 39 zeigt das tatsächliche Differenzbild, das für die mt4 und mt5 Proben erhalten wurde.
  • 40 zeigt auf den Blättern 1 und 2 einen Plot der normalisierten Intesitäten über die Reihen 10 und 11 des Arrays und eine Tabelle der detektierten Mutationen.
  • 41 zeigt die mit dem Chip erhaltene Unterscheidung zwischen Wildtyp und mutierten Hybriden. Ein Median der 6 normalisierten Hybridiserungswerte für jede Sonde wurde errechnet; der Graph trägt das Verhältnis des Medianwertes zu dem normalisierten Hybridisierungswert gegenüber den mittleren Zählungen auf. Ein Verhältnis von 1,6 und mittlere Zählungen über 50 ergibt keine falsche Positiven.
  • 42 zeigt, wie die Identität der Nicht-Übereinstimmung der Base die Fähigkeit, mutierte und Wildtypsequenzen zu unterscheiden mehr als die Position der Nicht-Übereinstimmung in einer Oligonukleotidsonde beeinflussen kann. Die Position der Nicht-Übereinstimmung ist in der Sondenlänge von dem 3'Ende aus ausgedrückt. Der Basenaustausch ist in dem Graphen angezeigt.
  • 43 stellt eine Liste der 5' bis 3' Sequenz von einem Ziel, entsprechend den Sonden auf dem Chip, bereit. X ist eine Kontrollsonde. In dem Ziel abweichende Positionen (also solche, die mit der Sonde an der bestimmten Stelle nicht übereinstimmen) sind fett gedruckt.
  • 44 zeigt das Fluoreszenzbild, das durch Scannen des in 17 beschriebenen, mit einer Probe hybridisierten Chips hergestellt wurde.
  • 45 zeigt die Detektion von vier Transitionen in der Zielsequenz gegenüber den Wildtypsonden auf dem Chip in 44.
  • 46 VLSIPS Technologie, angewendet auf die lichtgesteuerte Synthese von Oligonukleotiden. Licht (hv) scheint durch eine Schablone (M1), um funktionelle Gruppen (-OH) auf einer Oberfläche durch das Entfernen einer Schutzgruppe (X) zu aktivieren. An die aktivierten Re gionen werden Nukleosid-Baublöcke mit durch Licht entfernbaren Schutzgruppen (T-X, C-X) gekoppelt. Indem die Bestrahlungs- und Kopplungsschritte wiederholt werden, können sehr komplexe Arrays aus Oligonukleotiden hergestellt werden.
  • 47 Verwendung des VLSIPS® Verfahrens zur Herstellung von "Nukleosidkombinatorik" oder Oligonukleotiden, die durch Kopplung von allen vier Nukleosiden zu Dimeren, Trimeren usw. synthetisiert wurden.
  • 48 Schutzgruppenentfernung, Kopplungs- und Oxidationsschritte eines Festphase DNA Syntheseverfahrens.
  • 49 Eine veranschaulichende Synthesestrategie für die Nukleosid-Baublöcke, die bei dem VLSIPS® Verfahren verwendet werden.
  • 50 Eine bevorzugte durch Licht entfernbare Schutzgruppe, MeNPOC, und Herstellung der Gruppe in aktiver Form.
  • 51 Detektionssystem für das Scannen eines DNA Chips.
  • Detailierte Beschreibung der Erfindung
  • Die Erfindung stellt eine Anzahl von Strategien bereit, um ein Polynukleotid bekannter Sequenz (eine Referenzsequenz) mit Varianten dieser Sequenz (Zielsequenzen) zu vergleichen. Dieser Vergleich kann auf dem Niveau von ganzen Genomen, Chromosomen, Genen, Exons oder Introns durchgeführt werden oder sich auf individuelle mutierte Orte und direkt anschließende Basen fokussieren. Die Strategien erlauben die Detektion von Variationen, wie Mutationen oder Polymorphismen, in der Zielsequenz unabhängig davon, ob eine bestimmte Variante vorher cha rakterisiert worden ist. Die Strategien bestimmen sowohl die Art einer Variante als auch ihre Lokalisierung in einer Zielsequenz.
  • Die Strategien nutzen Arrays aus auf einem festen Träger immobilisierten Oligonukleotidsonden. Zielsequenzen werden analysiert, indem das Ausmaß der Hybridisierung an bestimmten Sonden in dem Array bestimmt wird. Die Strategie der Auswahl der Sonden erleichtert die Unterscheidung zwischen perfekt übereinstimmenden Sonden und Sonden, die in einzelnen Basen oder in einem anderen Grad Nicht-Übereinstimmungen zeigen. Diese Strategie bringt es normalerweise mit sich, jedes Nukleotid von Interesse in einer Zielsequenz mehrfach zu testen, wodurch ein hoher Grad des Vertrauens in seine Identität erreicht wird. Dieser Grad des Vertrauens wird weiter erhöht, indem auch dem Nukleotid von Interesse benachbarte Basen in der Zielsequenz untersucht werden. Die Zahl der Sonden auf dem Chip kann recht groß sein (z. B. 105–106). Normalerweise ist jedoch nur ein kleiner Anteil der Gesamtanzahl von Sonden einer bestimmten Länge vertreten. Einige Vorteile der Verwendung von nur einem kleinen Anteil von allen möglichen Sonden einer bestimmten Länge schließen ein: (i) jede Position in dem Array ist noch informativ, ob Hybridisierung auftritt oder nicht; (ii) unspezifische Hybridisierung wird minimiert; (iii) es ist unkompliziert, Unterschiede in der Hybridisierung mit Unterschieden der Sequenz zu korrelieren, besonders in Bezug auf die Hybridisierungsmuster eines bekannten Standards; und (iv) die Möglichkeit, während der Synthese jede Sonde unabhängig anzusprechen, indem Photolithographie in hoher Auflösung benutzt wird, erlaubt eine Auslegung und eine Optimierung des Arrays für jede Sequenz. z. B. kann die Länge jeder Sonde unabhängig von den anderen variiert werden.
  • Die vorliegenden Tilingstrategien ergeben Verfahren zur Sequenzierung und zum Vergleich, die für Routineausübung im großen Maßstab geeignet sind und einen hohen Grad von Vertrauen in das Sequenzergebnis mit sich bringen.
  • I. Allgemeine Tiling Strategien
  • A. Auswahl der Referenzsequenz
  • Die Chips sind entworfen, um Sonden zu enthalten, die komplementär zu einer oder mehr ausgewählten Referenzsequenzen sind, deren Sequenz bekannt ist. Die Chips werden benutzt, um eine Zielsequenz zu lesen, die entweder die Referenzsequenz selbst oder Varianten dieser Sequenz umfaßt. Zielsequenzen können sich von der Referenzsequenz in ein oder mehreren Positionen unterscheiden, zeigen aber einen insgesamt hohen Grad der Sequenzidentität mit der Referenzsequenz (z. B. mindestens 75, 90, 95, 99, 99,9 oder 99,99%). Jedes Polynukleotid mit bekannter Sequenz kann als Referenzsequenz ausgewählt werden. Interessierende Referenzsequenzen schließen Sequenzen ein, von denen bekannt ist, daß sie Mutationen oder Polymorphismen enthalten, die mit phänotypischen Änderungen assoziiert sind, die klinische Bedeutung in menschlichen Patienten haben. Z. B. wurden das CFTR Gen und p53 Gen in Menschen als der Ort von mehreren Mutationen identifiziert, die zu cystischer Fibrose bzw. Krebs führen. Andere interessierende Referenzsequenzen schließen solche ein, die dazu dienen, pathogene Mikroorganismen zu identifizieren und/oder den Ort von Mutationen, durch die solche Mikroorganismen Wirkstoffresistenz erwerben (z. B. das HIV Reverse Transkriptase Gen), zu identifizieren. Andere interessierende Referenzsequenzen schließen Regionen ein, in denen bekanntermaßen polymorphe Variationen vorkommen (z. B. die D-loop Region von mitochondrialer DNA). Diese Referenzsequenzen sind nützlich, z. B. für forensische oder epidemiologische Untersuchungen. Andere interessierende Referenzsequenzen schließen p34 (verwandt mit p53), p56 (in Verbindung gebracht mit Brust-, Prostata- und Leberkrebs), und DNA Abschnitte ein, die für Cytochrom p450 kodieren (s. Meyer et al., Pharmac. Ther. 46, 349–355 (1990)). Andere interessierende Referenzsequenzen sind solche aus dem Genom von pathogenen Viren (z. B. Hepatitis (A, B, oder C), Herpesvirus (z. B. VZV, HSV-1, HAV-6, HSV-II, und CMV, Epstein Barr Virus), Adenovirus, Influenzavirus, Flavi Viren, Echovirus, Rhinovirus, Coxsacki Virus, Corno Virus, Respiratorischer Syncytischer Virus, Mumps-Virus, Rota-Virus, Masernvirus, Rubellavirus, Parvovirus, Vaccinia virus, HTLV Virus, Dengue-Virus, Papillomavirus, Moluscumvirus, Poliovirus, Tollwutvirus, JC Virus und Arboviraler Enzephalitis-Virus. Andere interessierende Referenzsequenzen stammen aus den Genomen oder Episomen pathogener Bakterien, besonders aus Regionen, die Wirkstoffresistenz übertragen oder die phylogene Charakterisierung des Virus erlauben (z. B. 16S rRNA oder entsprechende DNA). Solche Bakterien beinhalten z. B. Clamydien, Rikettsien, Mykobakterien, Staphylococci, Streptococci, Pneumococci, Meningococci und Conococci, Klepsiella, Proteus, Serratia, Pseudomonas, Legionellen, Diphteria, Salmonella, Bacilli, Cholera, Tetanus, Botulismus, Anthrax, Pest, Leptospirose, und Lyme Borreliose-Bakterien. Andere interessierende Referenzsequenzen schließen solche ein, in denen Mutationen zu den folgenden autosomal rezessiven Störungen führen: Sichelzellanämie, β-Thalassämie, Phenylketonurie, Galaktosämie, Morbus Wilson, Haemochromatose, schwere kombinierte Immunodefizienz, α-1-Antitrypsindefizienz, Albinismus, Alkaptonurie, lysosomale Speicherkrankheiten und Ehlers-Danlos-Syndrom. Andere interessierende Referenzsequenzen schließen solche ein, in denen Mutationen zu x-chromosomalen rezessiven Störungen führen: Hämophilie, Glucose-6-phosphat-dehydrogenase, α-gamma-Glubolinämie, Diabetes insipidus, Lesch-Nyhan Syndrom, Muskeldystrophie, Wiskott-Aldrich-Syndrom, Morbus Fabry und Fragile X-Syndrom. Andere interessierende Referenzsequenzen schließen solche ein, in denen Mutationen zu den folgenden autosomalen dominanten Störungen führen. Familiäre Hypercholesterinämie, Polycystische Nierenerkrankung, Morbus Huntingtdon, erbliche Spherocytose, Marfansyndrom, Morbus von Willebrand, Neurofibromatose, tuberöse Sklerose, erbliche haemorrhagische Telangiec tasie, familiäre Polyposis coli, Ehler-Danlos-Syndrom, myotonische Dysthrophie, Muskeldystrophie, Osteogenesis imperfecta, akute intermittierende Porphyrie und von Hippel-Landau Syndrom.
  • Die Länge einer Referenzsequenz kann sich stark unterscheiden, von einem Genom in voller Länge zu einem individuellen Chromosom, Episom, Gen, Teil eines Gens, wie z. B. ein Exon, Intron oder eine regulatorische Sequenz, zu wenigen Nukleotiden. Eine Referenzsequenz von zwischen etwa 2, 5, 10, 20, 50, 100, 5000, 1000, 5000 oder 10000, 20000 oder 100000 Nukleotiden ist üblich. Manchmal sind nur bestimmte Regionen einer Sequenz (z. B. die Exons eines Gens) von Interesse. In solchen Situationen können, beliebig wählbar, die bestimmten Regionen entweder als getrennte Referenzsequenzen oder als Teile einer einzigen Referenzsequenz betrachtet werden.
  • Jede natürlich vorkommende, mutierte, Konsensus- oder rein hypothetische Sequenz von Nukleotiden, RNA oder DNA, kann eine Referenzsequenz sein. Z. B. können Sequenzen von Computerdatenbanken oder Publikationen erhalten werden oder können de novo bestimmt oder erdacht werden. Normalerweise wird eine Referenzsequenz ausgewählt, um einen hohen Grad von Sequenzidentität zu ins Auge gefaßten Zielsequenzen zu zeigen. Oft wird mehr als eine Referenzsequenz ausgewählt, besonders wo ein signifikanter Grad der Divergenz zwischen Zielsequenzen vorausgeahnt wird. In mehreren Anwendungen der Tiling Strategie werden Kombinationen von Wildtyp und mutierten Referenzsequenzen genutzt.
  • B. Chip Design
  • 1. Grundlegende Tiling-Strategie
  • Die grundlegende Tiling-Strategie stellt ein Array aus immobilisierten Sonden zur Analyse von Zielsequenzen zur Verfügung, die einen hohen Grad der Sequenzidentität zu einer oder mehr ausgewählten Referenzsequenzen aufweisen. Die Strategie wird zunächst für ein Array erläutert, das in 4 Sondensätze unterteilt ist, obwohl gezeigt werden wird, daß in einigen Situationen befriedigende Ergebnisse auch mit nur zwei Sondensätzen erhalten werden. Ein 1. Sondensatz umfaßt eine Vielzahl von Sonden, die genau komplementär zu einer ausgewählten Referenzsequenz sind. Die genaue Komplementarität besteht normalerweise auf der ganzen Länge der Sonde. Es können jedoch auch Sonden verwendet werden, die einen Abschnitt oder Abschnitte von genauer Komplementarität aufweisen, der oder die von vorausgehenden oder angehängten Sequenzen flankiert werden, denen eine Komplementarität zu der Referenzsequenz fehlt. In einem komplementären Abschnitt weist jede Sonde in dem ersten Sondensatz mindestens eine Abfrageposition auf, die einem Nukleotid in der Referenzsequenz entspricht. D. h. daß die Abfragepositionen an dem entsprechenden Nukleotid in der Referenzsequenz ausgerichtet ist, wenn die Sonde und die Referenzsequenz aneinander ausgerichtet sind, um die Komplementarität zwischen den beiden zu maximieren. Wenn eine Sonde mehr als eine Abfrageposition aufweist, entspricht jede einem jeweiligen Nukleotid der Referenzsequenz. Die Identität einer Abfrageposition und des entsprechenden Nukleotids in einer bestimmten Sonde in dem 1. Sondensatz kann nicht festgestellt werden, indem einfach die Sonde in dem 1. Satz untersucht wird. Wie gezeigt werden wird, wird die Abfrageposition und das entsprechende Nukleotid im Vergleich der Struktur der Sonden des 1. Sondensatzes und der entsprechenden Sonden von zusätzlichen Sondensätzen definiert.
  • Im Prinzip könnte eine Sonde eine Abfrageposition in jeder Position in dem Abschnitt haben, der komplementär zu der Referenzsequenz ist. Manchmal liefern Abfragepositionen genauere Daten, wenn sie entfernt von den Enden eines komplementären Abschnittes lokalisiert sind. Daher enthält typischerweise eine Sonde, die einen komplementären Abschnitt einer Länge x aufweist, nicht mehr als x – 2 Abfragepositionen. Da Sonden typischerweise 9–21 Nukleotide aufweisen, und normalerweise die gesamte Sonde komplementär ist, hat eine Sonde üblicherweise 1– 19 Abfragepositionen. Oft enthalten die Sonden eine einzige Abfrageposition, in dem Zentrum oder nahe dem Zentrum der Sonde.
  • Für jede Sonde in dem 1. Satz gibt es, für den Zweck der vorliegenden Erläuterung, 3 entsprechende Sonden von drei zusätzlichen Sondensätzen, s. l. Daher gibt es 4 Sonden, die jedem Nukleotid von Interesse in der Referenzsequenz entsprechen. Jede der 4 entsprechenden Sonden weist eine Abfrageposition auf, die an diesem Nukleotid von Interesse ausgerichtet ist. Normalerweise sind die Sonden der 3 zusätzlichen Sondensätze mit einer Ausnahme identisch mit der entsprechenden Sonde des 1. Sondensatzes. Die Ausnahme ist, daß mindestens 1 (und oft nur 1) Abfrageposition, die in jeder der 4 entsprechenden Sonden der 4 Sondensätze auftritt, in den 4 Sondensätzen von einem unterschiedlichen Nukleotid besetzt ist. Zum Beispiel ist bei einem A-Nukleotid in der Referenzsequenz die Abfrageposition der entsprechenden Sonde des ersten Sondensatzes von einem T besetzt, und die entsprechenden Sonden der 3 zusätzlichen Sondensätze haben ihre jeweiligen Abfragepositionen durch A, C oder G, ein unterschiedliches Nukleotid in jeder Sonde, besetzt. Wenn eine Sonde des ersten Sondensatzes vorausgehende oder flankierende Sequenzen ohne Komplementarität zu der Referenzsequenz aufweist (siehe 2), müssen diese Sequenzen nicht in den entsprechenden Sonden von den drei zusätzlichen Sätzen vorhanden sein. Genauso können die entsprechenden Sonden der drei zusätzlichen Sätze vorausgehende oder angehängte Sequenzen außerhalb des komplementären Abschnittes enthalten, die in der entsprechenden Sonde des ersten Sondensatzes nicht vorliegen. Manchmal sind die Sonden der zusätzlichen drei Sondensätze (mit der Ausnahme der Abfrageposition(en)) identisch mit einer zusammenhängenden Teilsequenz des gesamten komplementären Abschnitts der entsprechenden Sonde des ersten Sondensatzes. In diesem Fall enthält die Teilsequenz die Abfrageposition und unterscheidet sich normalerweise von der Sonde in der ganzen Länge nur in dem Weglassen von einem oder beiden terminalen Nukleotiden von den Enden des komplementären Abschnitts. Das heißt, dass, wenn eine Sonde des ersten Sondensatzes einen komplementären Abschnitt der Länge n aufweist, die entsprechenden Sonden von den anderen Sätzen normalerweise eine Teilsequenz des Abschnittes mit einer Länge von mindestens n – 2 einschließen. Daher ist die Teilsequenz normalerweise mindestens 3, 4, 7, 9, 15, 21 oder 25 Nukleotide lang, am typischsten in dem Bereich von 9–21 Nukleotiden. Die Teilsequenz sollte ausreichend lang sein, dass sie es einer Sonde erlaubt, messbar stärker an eine Variante der Referenzsequenz zu binden, die an der Abfrageposition mutiert ist, als an die Referenzsequenz.
  • Die Sonden können Oligodesoxyribonukleotide oder Oligoribonukleotide sein, oder jede modifizierte Form dieser Polymere, die in der Lage ist, mit einer Zielnukleinsäuresequenz durch komplemetäre Basenpaarung zu hybridisieren. Komplementäre Basenpaarung bedeutet sequenzspezifische Basenpaarung, was z. B. Watson-Crick Basenpaarung genau wie andere Arten der Basenpaarung wie Hoogsteen Basenpaarung einschließt. Modifizierte Formen schließen 2'-O-methyl-Oligoribonukleotide und sogenannte PNAs ein, in denen Oligodeoxyribonukleotide durch Peptidbindungen anstelle von Phosphodiesterbindungen verbunden sind. Die Sonden können durch jede Verbindung an einen Träger angeheftet sein (z. B. 3', 5' oder über die Base). 3'-Anheftung ist üblicher, da diese Orientierung mit der bevorzugten Chemie der Festphasesynthese von Oligonukleotiden kompartibel ist.
  • Die Zahl der Sonden in dem ersten Sondensatz (und folglich die Zahl der Sonden in zusätzlichen Sondensätzen) hängt von der Länge der Referenzsequenz, der Zahl der Nukleotide von Interesse in der Referenzsequenz und der Zahl der Abfragepositionen pro Sonde ab. Im allgemeinen bedarf jedes Nukleotid von Interesse in der Referenzsequenz der gleichen Abfrageposition in den vier Sondensätzen. Man betrachte als Beispiel eine Referenzsequenz von 100 Nukleotiden, von denen 50 von Interesse sind, und Sonden, die jeweils eine einzige Abfrageposition aufweisen. In dieser Situation sind für den ersten Sondensatz 50 Sonden notwendig, wobei jede eine Abfrageposition entsprechend einem Nukleotid von Interesse in der Referenzsequenz aufweist. Die zweiten, dritten und vierten Sondensätze weisen jeweils eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz auf, und somit enthält jede insgesamt 50 Sonden. Die Identität von jedem Nukleotid von Interesse in der Referenzsequenz wird durch den Vergleich der relativen Hybridisierungssignale bei den vier Sonden, die Abfragepositionen entsprechend diesem Nukleotid in den vier Sondensätzen haben, bestimmt.
  • In einigen Referenzsequenzen ist jedes Nukleotid von Interesse. In anderen Referenzsequenzen sind nur bestimmte Abschnitte, in den Varianten (z. B. Mutationen oder Polymorphismen) konzentriert sind, von Interesse. In anderen Referenzsequenzen sind nur bestimmte Mutationen oder Polymorphismen und direkt benachbarte Nukleotide von Interesse. Normalerweise weist der erste Sondensatz Abfragepositionen auf, die so ausgewählt sind, daß sie mindestens einem Nukleotid (das z. B. eine Punktmutation darstellt) und einem direkt benachbartem Nukleotid entsprechen. Normalerweise weisen die Sonden in dem ersten Satz Abfragepositionen auf, die mindestens 3, 10, 50, 100, 1.000 oder 20.000 aufeinander folgenden Nukleotiden entsprechen. Die Sonden haben normalerweise Abfragepositionen, die mindestens 5, 10, 30, 50, 75, 90, 99 oder manchmal 100% der Nukleotide in einer Referenzsequenz entsprechen. Oft erstrecken sich die Sonden in dem ersten Sondensatz über die komplette Referenzsequenz und überlappen miteinander in Bezug auf die Referenzsequenz. Zum Beispiel unterscheidet sich in einem häufigen Arragement jede Sonde in dem ersten Sondensatz von einer anderen Sonde in diesem Satz durch das Weglassen einer 3'-Base, die komplementär zu der Referenzsequenz ist, und das Hinzufügen einer 5'-Base, die komplementär zu der Referenzsequenz ist: Siehe 3.
  • Um der konzeptionellen Einfachheit halber sind die Sonden in einem Satz normalerweise in der Reihenfolge der Sequenz in einer Zeile über dem Chip angeordnet. Eine Zeile umfasst eine Serie von überlappenden Sonden, die die ausgewählte Referenzsequenz darstellen oder über sie ein Tiling legen, (siehe 3). Die Komponenten der vier Sondensätze werden normalerweise in vier parallelen Zeilen angebracht, die kollektiv eine Reihe in horizontaler Richtung und eine Serie von Viererspalten in vertikaler Richtung darstellen. Entsprechende Sonden von den vier Sondensätzen (d. h. komplementär zu der gleichen Untersequenz der Referenzsequenz) besetzen eine Spalte. Jede Sonde in einer Zeile unterscheidet sich normalerweise von der vorhergehenden Sonde in der Zeile durch das Weglassen einer Base an einem Ende und den Einschluss einer zusätzlichen Base am anderen Ende, wie in 3 gezeigt. Diese ordentliche Abfolge der Sonden kann jedoch durch den Einschluss von Kontrollsonden oder das Weglassen von Sonden in bestimmten Spalten des Arrays unterbrochen werden. Solche Spalten dienen als Kontrollen zur Ausrichtung des Chips, oder zur Anzeige des Hintergrunds, der Zielsequenzen beinhalten kann, die unspezifisch an dem Chip gebunden haben.
  • Die Sondensätze sind normalerweise so in Zeilen angebracht, dass alle Sonden mit einer Abfrageposition, die mit einem A besetzt ist, eine A-Zeile bilden, alle Sonden mit einer Abfrageposition, die von einem C besetzt ist, eine C-Zeile bilden, alle Sonden mit einer Abfrageposition, die mit einem G besetzt ist, eine G-Zeile bilden und alle Sonden mit einer Abfrageposition, die mit einem T (oder U) besetzt ist, eine T-Zeile (oder eine U-Zeile) bilden. Es ist zu beachten, dass in dieser Anordnung keine einzigartige Entsprechung zwischen Sondensätzen und Zeilen besteht. Damit ist die Sonde des ersten Sondensatzes bei den fünf Spalten in 4 in der A-Zeile, C-Zeile, A-Zeile, A-Zeile und C-Zeile angeordnet. Die Abfrageposition in einer Spalte von Sonden entspricht der Position in der Zielsequenz, deren Identität durch die Analyse der Hybridisierung mit den Sonden in dieser Spalte bestimmt wird. Damit entsprechen I1–I5 jeweils N1–N5 in 4. Die Abfrageposition kann irgendwo in einer Sonde sein, ist jedoch üblicherweise an oder nahe der zentralen Positionen der Sonde, um differentielle Hybridisierungssignale zwischen einer perfekten Übereinstimmung und einer 1-Basenpaar-Nichtübereinstimmung zu maximieren. Für eine 11mer Sonde z. B. ist die zentrale Position das sechste Nukleotid.
  • Obwohl das Sondenarray normalerweise wie oben beschrieben in Reihen und Spalten angelegt ist, ist eine solche physikalische Anordnung von Sonden auf dem Chip nicht essentiell. Solange die Lokalisation jeder Sonde in einem Array im Raum bekannt ist, können die Daten von den Sonden unabhängig von der physischen Anordnung der Sonden auf einem Chip gesammelt und verarbeitet werden, um die Sequenz eines Ziels zu ergeben. Wie auch immer die physische Anordnung der Sonden auf dem Chip sein mag, bei der Datenverarbeitung können die Hybridisierungssignale von den entsprechenden Sonden in jegliches gedankliche Array umsortiert werden, das für eine folgende Datenreduktion erwünscht ist.
  • Eine Auswahl an Sonden-Längen kann auf den Chips benutzt werden. Wie oben festgestellt, kann eine Sonde ausschließlich aus einem komplementären Abschnitt bestehen oder eine oder mehrere komplementäre Abschnitte angrenzend an flankierende, angehängte und/oder dazwischen geschobene Abschnitte aufweisen. In diesem Fall ist die Gesamtlänge des komplementären Abschnitts (der komplementären Abschnitte) wichtiger als die Länge der Sonde. Funktionell ausgedrückt sollte der komplementäre Abschnitt (die komplementären Abschnitte) der ersten Sondensätze ausreichend lang sein, um der Sonde zu erlauben, stärker mit einer Referenzsequenz zu hybridisieren als mit einer Variante der Referenzsequenz, die eine Mutation einer einzelnen Base in dem Nukleotid enthält, das der Abfrageposition der Sonde entspricht. Gleichermaßen sollte der komplementäre Abschnitt (die komplementären Abschnitte) in den entsprechenden Sonden von zusätzlichen Sondensätzen ausreichend lang sein, um einer Sonde zu erlauben, stärker mit einer Variante der Referenzsequenz, die einen einzelnen Nukleotidaustausch in der Abfrageposition im Vergleich zu der Referenzsequenz hat, zu hybridisieren. Eine Sonde hat normalerweise einen einzigen komplemetären Abschnitt, der eine Länge von mindestens drei Nukleotiden, und noch üblicher mindestens 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 oder 30 Basen aufweist, die zu der Referenzsequenz genau komplementär sind (außer möglicherweise an der Abfrageposition (den Abfragepositionen) abhängig von dem Sondensatz). Bei Brückenstrategien, bei denen mehr als ein komplementärer Abschnitt vorliegt, stellt jeder Abschnitt mindestens drei zu der Referenzsequenz komplementäre Nukleotide bereit, und die kombinierten Abschnitte stellen mindestens zwei Abschnitte von drei oder insgesamt sechs komplementären Nukleotiden bereit. Wie bei den anderen Strategien ist die kombinierte Länge der komplementären Abschnitte typischerweise 6–30 Nukleotiden, und bevorzugt ca. 9–21 Nukleotide lang. Die zwei Abschnitte haben oft ungefähr die gleiche Länge. Oft haben die Sonden (oder der komplementäre Abschnitt in den Sonden) eine ungerade Anzahl von Basen, so dass eine Abfrageposition in dem genauen Zentrum der Sonde auftreten kann.
  • Beim manchen Chips haben alle Sonden die gleiche Länge. Andere Chips benutzen unterschiedliche Gruppen von Sondensätzen, wobei die Sonden innerhalb einer Gruppe die gleiche Größe haben, sich aber zwischen verschiedenen Gruppen unterscheiden. Zum Beispiel gibt es auf einigen Chips eine Gruppe, die wie oben beschrieben, vier Sondensätze umfasst, in denen alle Sonden 11mere sind, zusammen mit einer zweiten Gruppe, die vier Sondensätze umfasst, in denen alle Sonden 13mere sind. Selbstverständlich können zusätzliche Sondengruppen hinzugefügt werden. Somit enthalten manche Chips z. B. vier Gruppen von Sonden mit Größen von 11meren, 13meren, 15meren und 17meren. Andere Chips haben Sonden unterschiedlicher Größe innerhalb der gleichen Gruppe von vier Sondensätzen. Bei diesen Chips können die Sonden in dem ersten Satz in ihrer Länge unabhängig voneinander variieren. Sonden in den anderen Sätzen haben normalerweise die gleiche Länge wie die Sonde, die die gleiche Spalte in dem ersten Satz besetzt. Eine gelegentlich unterschiedliche Länge der Sonden kann jedoch an der gleichen Spaltenposition in den vier Zeilen eingeschlossen sein. Sonden unterschiedlicher Länge sind eingeschlossen, um Hybridisierungssignale von Sonden auszugleichen, unabhängig davon ob A-T- oder C-G-Bindungen an der Abfrageposition gebildet werden.
  • Die Länge einer Sonde kann für die Unterscheidung zwischen einer perfekt übereinstimmenden Sonde und Sonden, die in einer einzigen Base nicht mit der Zielsequenz übereinstimmen, wichtig sein. Die Unterscheidung ist normalerweise bei kurzen Sonden größer. Kürzere Sonden sind normalerweise auch weniger dazu geneigt, Sekundärstrukturen auszubilden. Die absolute Menge der gebundenen Zielsequenz, und damit das Signal, ist jedoch größer für längere Sonden. Die Sondenlänge, die den optimalen Kompromiss zwischen diesen wettstreitenden Überlegungen darstellt, kann unter anderem von dem G-C-Gehalt einer bestimmten Region der Ziel-DNA-Sequenz, der Sekundärstruktur, der Syntheseeffizienz und Kreuzhybridisierungen abhängen. Abhängig von den Bedingungen der Hybridisierung können in einigen Regionen des Ziels kurze Proben (z. B. 11mere) Information liefern, die von längeren Sonden (z. B. 19meren) nicht gewonnen werden kann, und umgekehrt. Maximale Sequenzinformation kann ausgelesen werden, wenn, wie oben beschrieben, mehrere Gruppen von unterschiedlich großen Sonden auf dem Chip enthalten sind. Für viele Regionen der Zielsequenz liefert eine solche Strategie jedoch redundante Informationen, da die gleiche Sequenz mehrere Male durch unterschiedliche Gruppen von Sonden gelesen wird. Die gleiche Information kann auch von einer einzigen Gruppe von Sonden unterschiedlicher Größe gewonnen werden, in der die Größen ausgewählt sind, um in bestimmten Regionen der Zielsequenz die lesbare Sequenz zu maximieren. Die angemessene Größe der Sonden in unterschiedlichen Regionen der Zielsequenz kann, z. B. aus 12 bestimmt werden, die die Lesbarkeit von Sonden unterschiedlicher Größe in unterschiedlichen Regionen eines Ziels vergleicht. Die Strategie, in einer einzigen Gruppe von Sondensätzen die Sondenlänge anzupassen, minimiert die Gesamtzahl von Sonden, die notwendig ist, um eine bestimmte Zielsequenz zu lesen. Dies läßt dem Chip ausreichend Kapazität, um Sonden für andere Referenzsequenzen zu enthalten.
  • Die Erfindung stellt einen Optimierungsblock zur Verfügung, der eine systematische Variation der Sondenlänge und Abfrageposition erlaubt, um die Auswahl von Sonden für die Analyse eines bestimmten Nukleotids in einer Referenzsequenz zu optimieren. Der Block enthält abwechselnd Spalten von Sonden komplementär zu dem Wildtypziel und Sonden komplementär zu einer spezifischen Mutation. Zwischen den Spalten ist die Abfrageposition variiert und die Sondenlänge wird innerhalb einer Spalte variiert. Die Hybridisierung des Chips mit der Referenzsequenz oder der mutierten Form der Referenzsequenz identifiziert die Sondenlänge und Abfrageposition, die das größte differentielle Hybridisierungssignal ergibt.
  • Die Sonden sind entworfen, um zu jedem der Stränge der Referenzsequenz komplementär zu sein (z. B. kodierend oder nicht kodierend). Einige Chips enthalten getrennten Gruppen von Sonden, eine komplementär zu dem kodierenden Strang, die andere komplementär zu dem nicht kodierenden Strang. Die unabhängige Analyse der kodierenden und nicht kodierenden Stränge stellt in großen Teilen redundante Information zur Verfügung. Beim Lesen des kodierenden Stranges mehrdeutige Regionen sind jedoch nicht immer die gleichen wie beim Lesen des nicht kodierenden Stranges. Somit erhöht die Kombination der Informationen von kodierenden und nicht kodierenden Strängen die Gesamtgenauigkeit der Sequenzierung.
  • Einige Chips enthalten zusätzliche Sonden oder Gruppen von Sonden, die entworfen sind, um zu einer zweiten Referenzsequenz komplementär zu sein. Die zweite Referenzsequenz ist oft eine Teilsequenz der ersten Referenzsequenz, die eine oder mehrere üblicherweise vorkommende Mutation(en) oder Variation zwischen Stämmen enthält. Die zweite Gruppe von Sonden ist nach den gleichen Grundsätzen wie oben beschrieben entworfen, außer daß die Sonden komplementär zu der zweiten Referenzsequenz sind. Der Einschluß einer zweiten Gruppe ist besonders nützlich für die Analyse von kurzen Teilsequenzen der primären Referenzsequenz, in denen erwartet wird, daß mehrere Mutationen innerhalb einer kurzen Entfernung, die mit der Länge der Sonden zusammenfällt, auftreten (d. h. zwei oder mehr Mutationen innerhalb von 9–21 Basen). Selbstverständlich kann das gleiche Prinzip ausgedehnt werden, um Tips zur Verfügung zu stellen, die Gruppen von Sonden für jegliche Zahl von Referenzsequenzen enthalten. Alternativ können die Chips eine zusätzliche Sonde (zusätzliche Sonden) enthalten, die nicht Teil eines oben beschriebenen Tiling Arrays sind, sondern eher als Sonde(n) für einen konventionellen Reversen Dot Blot dienen. Z. B. kann das Vorhandensein einer Mutation durch die Bindung einer Zielsequenz zu einer einzigen oligomeren Sonde, die die Mutation umfaßt, bestimmt werden. Vorzugsweise ist als Kontrolle eine zusätzliche Sonde eingeschlossen, die die Region äquivalent zu der Wildtyp Sequenz enthält.
  • Die Chips werden durch den Vergleich der Intensitäten von markiertem Ziel, das an die Sonden in einem Array gebunden ist, gelesen. Ein Vergleich wird besonders zwischen jeder Zeile von Sonden (z. B. A, C, G und T Zeilen) an jeder Spaltenposition (physisch oder konzeptionell) durchgeführt. Für eine bestimmte Spaltenposition wird die Zeile mit dem größten Hybridisierungssignal als das an der Position in der Zielsequenz anwesende Nukleotid, das der Abfrageposition in der Sonde entspricht, abgerufen, siehe 5. Die entsprechende Position in der Zielsequenz ist jene, die an der Abfrageposition in den entsprechenden Sonden ausgerichtet ist, wenn die Sonden und das Ziel aneinander ausgerichtet sind, um eine maximale Komplementärität zu erreichen. Nur eine der 4 Sonden in einer Spalte kann eine genaue Übereinstimmung mit der Zielsequenz aufweisen, während die anderen normalerweise mindestens in einem Basenpaar eine Nichtübereinstimmung aufweisen. Die Sonde mit einer perfekten Übereinstimmung liefert normalerweise ein deutlich größeres Hybridisierungssignal als die anderen drei Sonden in der Spalte und wird dadurch leicht identifiziert. In manchen Regionen der Zielsequenz jedoch ist die Unterscheidung zwischen einer perfekten Übereinstimmung und einer Nichtübereinstimmung von einer Base weniger klar. Daher wird ein Abfrageverhältnis etabliert, um das Verhältnis des Signals von der am besten hybridisierten Sonde zu der am zweitbesten hybridisierenden Sonde zu definieren, das überschritten werden muß, damit eine bestimmte Zielposition von den Sonden abgelesen werden kann. Ein hohes Abrufverhältnis macht es sicher, daß, wenn überhaupt, wenige Fehler beim Abrufen der Zielnukleotide gemacht werden, kann aber dazu führen, daß einige Nukleotide als mehrdeutig gewertet werden, die tatsächlich genau gelesen werden könnten. Ein geringeres Abrufverhältnis ergibt weniger mehrdeutige Abrufe, kann aber in mehr fehlerhaften Abrufen resultieren. Es wurde entdeckt, daß bei einem Abrufverhältnis von 1,2 nahezu alle Abrufe genau sind. Eine kleine, aber signifikante Anzahl von Basen (z. B. bis zu etwa 10%) kann als mehrdeutig gewertet werden müssen.
  • Obwohl kleine Regionen der Zielsequenz manchmal mehrdeutig sein können, treten diese Regionen normalerweise in unterschiedlichen Zielsequenzen in den gleichen oder ähnlichen Abschnitten auf. Somit ist es für vorher charakterisierte Mutationen im Voraus bekannt, ob diese Mutationen wahrscheinlich innerhalb einer Region von eindeutig bestimmbarer Sequenz auftritt.
  • Ein Array von Sonden ist besonders hilfreich, um die Referenzsequenz, nach der die Sonden entwickelt wurden und Varianten dieser Sequenz, die substantielle Sequenzähnlichkeit mit der Referenzsequenz aufweisen, zu analysieren (z. B. mehrere Mutationen einzelner Basen über die Referenzsequenz verteilt).
  • Wenn ein Array benutzt wird, um die exakte Referenzsequenz, nach der es entwickelt wurde, zu analysieren, weist eine Sonde eine genaue Übereinstimmung mit der Referenzsequenz auf und die anderen drei Sonden in der gleichen Spalte weisen Nichtübereinstimmungen in einer Base auf. Die Unterscheidung zwischen den Hybridisierungssignalen ist daher normalerweise hoch und eine genaue Sequenz wird erhalten. Man erhält auch eine hohe Genauigkeit, wenn ein Array zur Analyse einer Zielsequenz benutzt wird, die eine Variante der Referenzsequenz umfaßt, die eine einzige Mutation im Vergleich zu der Referenzsequenz oder mehrere Mutationen in großem Abstand in Bezug auf die Referenzsequenz aufweist, analysiert wird. An verschiedenen mutierten Loci weist eine Sonde eine perfekte Übereinstimmung mit dem Ziel auf, und die anderen drei Sonden, die die gleiche Spalte besetzen, weisen Nichtübereinstimmungen in einzelnen Basen auf, wobei der Unterschied (in Bezug auf die Analyse der Referenzsequenz) in der Zeile liegt, in der die perfekte Übereinstimmung auftritt.
  • Bei Zielsequenzen, die einen hohen Grad der Abweichung von dem Referenzstamm zeigen oder mehrere dicht beieinanderliegende Mutationen gegenüber dem Referenzstamm enthalten, wird eine einzige Gruppe von Sonden (d. h. entwickelt in Bezug auf eine einzige Referenzsequenz) nicht immer die genaue Sequenz für die hochvariable Region dieser Sequenz liefern. An einigen besonderen Spaltenpositionen kann es vorkommen, daß keine einzige Sonde perfekt komplementär zu dem Ziel ist und daß jeder Vergleich auf unterschiedlichem Grad der Nichtübereinstimmung zwischen den vier Sonden basieren muß. Ein solcher Vergleich erlaubt nicht immer den Abruf des Zielnukleotids, das jener Spaltenposition entspricht. Deletionen in Zielsequenzen können durch den Verlust des Signals von Sonden mit Abrufpositionen, die von der Deletion betroffen sind, detektiert werden. Es kann jedoch auch das Signal von Sonden verloren gehen, die Abfrageposition sehr dicht an der Deletion haben, was dazu führt, daß einige Regionen der Zielsequenz nicht gelesen werden können.
  • Zielsequenzen, die Insertionen tragen, werden auch kurze Regionen, einschließend und nahe zu der Insertion, aufweisen, die normalerweise nicht gelesen werden können.
  • Die Anwesenheit von kurzen Regionen von schwierig zu lesendem Ziel wegen Mutationen in kurzem Abstand, Insertionen oder Deletionen verhindert nicht die Bestimmung der restlichen Sequenz des Ziels, da unterschiedliche Regionen einer Zielsequenz unabhängig voneinander bestimmt werden. Darüber hinaus können solche Mehrdeutigkeiten, die aus der Analyse verschiedener Varianten mit einer einzigen Gruppe von Sonden resultieren, vermieden werden, indem multiple Gruppen von Sondensätzen auf einem Chip enthalten sind. Z. B. kann das Design einer Gruppe von Sonden auf der Referenzsequenz in ganzer Länge basieren, und das Design der anderen Gruppen auf Teilsequenzen der Referenzsequenz, die häufig auftretende Mutationen oder Variationen zwischen Stämmen einschließen.
  • Ein besonderer Vorteil der vorliegenden Sequenzierungsstrategie gegenüber konventionellen Sequenzierungsverfahren ist die Fähigkeit, gleichzeitig multiple Zielsequenzen zu detektieren und ihr Verhältnis zu bestimmen. Eine solche Fähigkeit ist z. B. für die Diagnose von Patienten wertvoll, die in Bezug auf ein Gen heterozygot sind oder die mit einem Virus wie HIV infiziert sind, das normalerweise in mehreren polymorphen Formen vorliegt. Eine solche Fähigkeit ist auch nützlich für die Analyse von Zielen aus Biopsien von Tumorzellen und umgebendem Gewebe. Die Anwesenheit von mehreren Zielsequenzen wird aus den relativen Signalen der vier Sonden in den Arrayspalten bestimmt, die den unterschiedlichen Zielnukleotiden entsprechen, an denen Diversität auftritt. Die relativen Signale an den vier Sonden für die getestete Mischung werden mit den entsprechenden Signalen von einer homogenen Referenzsequenz verglichen. Die Zunahme des Signals von einer Sonde, die mit der Referenzsequenz nicht übereinstimmt, und eine entsprechende Abnahme des Signals der Sonde, die mit der Referenzsequenz übereinstimmt, signalisieren die Anwesenheit eines mutierten Stammes in der Mischung. Das Ausmaß der Verschiebung der Hybridisierungssignale der Sonden hat einen Bezug zu den Verhältnissen der Zielsequenz in der Mischung. Verschiebungen in den relativen Hybridisierungssignalen können quantitativ in Beziehung zu den Verhältnissen der Referenz- und der mutierten Sequenz gesetzt werden, indem vorher der Chip mit hergestellten Mischungen der mutierten und der Referenzsequenz kalibriert wird. Dadurch kann ein Chip verwendet werden, um Varianten oder mutierte Stämme zu detektieren, die nur 1, 5, 20 oder 25% einer Mischung von Stämmen ausmachen.
  • Ähnliche Prinzipien erlauben die gleichzeitige Analyse von multiplen Zielsequenzen, sogar wenn keine mit der Referenzsequenz identisch ist. Z. B. würde bei einer Mischung von zwei Zielsequenzen, die erste und zweite Mutationen tragen, gegenüber dem Hybridisierungsmuster mit der Referenzsequenz in den Hybridisierungsmustern von Sonden mit Abfragepositionen, die den ersten und zweiten Mutationen entsprechen, eine Variation auftreten. In jeder Position würde eine der Sonden mit einer nichtübereinstimmenden Abfrageposition in Bezug auf die Referenzsequenz eine Zunahme im Hybridisierungssignal zeigen, und die Sonde mit einer übereinstimmenden Abfrageposition in Bezug auf die Referenzsequenz würde eine Abnahme des Hybridisierungssignals zeigen. Die Anlayse des Hybridisierungsmusters der Mischung der mutierten Zielsequenzen, vorzugsweise im Vergleich mit dem Hybridisierungsmuster der Referenzsequenz, gibt die Anwesenheit von zwei mutierten Zielsequenzen, die Position und Art der Mutation in jedem Stamm und die relativen Verhältnisse jedes Stammes an.
  • In einer Abwandlung des oben beschriebenen Verfahrens werden die unterschiedlichen Komponenten einer Mischung von Zielsequenzen verschieden markiert, bevor sie auf das Array gegeben werden. Z. B. steht eine Auswahl von fluoreszierenden Markern, die bei unterschiedlichen Wellenlängen emittieren, zur Verfü gung. Die Benutzung von unterschiedlichen Markern erlaubt die unabhängige Analyse von verschiedenen Zielen, die gleichzeitig an das Array gebunden sind. z. B. erlauben die Verfahren den Vergleich von Zielsequenzen, die von einem Patienten in verschiedenen Stadien einer Krankheit erhalten wurden.
  • 2. Das Weglassen von Sonden
  • Die allgemeine, oben beschriebene Strategie nutzt vier Sonden, um jedes Nukleotid von Interesse in einer Zielsequenz zu lesen. Eine Sonde (von dem ersten Sondensatz) zeigt eine perfekte Übereinstimmung mit der Referenzsequenz und die anderen drei Sonden (von den zweiten, dritten und vierten Sondensätzen) weisen eine Nichtübereinstimmung mit der Referenzsequenz und eine perfekte Übereinstimmung mit einer Zielsequenz, die eine Mutation an dem Nukleotid von Interesse trägt, auf. Die Bereitstellung von drei Sonden von den zweiten, dritten und vierten Sondensätzen erlaubt die Detektion von jeder der drei möglichen Nukleotidsubstitutionen von jedem Nukleotid von Interesse. Bei einigen Referenzsequenzen oder Regionen von Referenzsequenzen ist es jedoch bereits im voraus bekannt, dass wahrscheinlich nur bestimmte Mutationen auftreten. Somit kann z. B. bekannt sein, dass an einem Ort ein Nukleotid A in der Referenzsequenz in einigen Zielsequenzen als T-Mutante auftreten kann, aber wahrscheinlich nicht als C- oder G-Mutante auftritt. Entsprechend kann man für die Analyse dieser Region der Referenzsequenz nur die ersten und zweiten Sondensätze einschließen, wobei der erste Sondensatz eine perfekte Komplementarität zu der Referenzsequenz aufweist und der zweite Sondensatz eine Abfrageposition aufweist, die von einem unveränderlichen A-Rest besetzt ist (um die T-Mutante zu detektieren). In anderen Fällen kann man die ersten, zweiten und dritten (aber nicht die vierten) Sondensätze für die Detektion eines Wildtyp-Nukleotids in der Referenzsequenz und zweier mutierter Varianten davon in den Zielsequenzen einschließen. Auf manchen Chips werden Son den, die stille Mutationen (d. h. solche, die die Aminosäuresequenz nicht beeinflussen) weggelassen.
  • Bei manchen Chips werden die Sonden des ersten Sondensatzes weggelassen, die manchen oder allen Positionen der Referenzsequenz entsprechen. Solche Chips umfassen mindestens zwei Sondensätze. Der erste Sondensatz weist eine Vielzahl von Sonden auf. Jede Sonde umfasst einen genau zu einer Teilsequenz einer Referenzsequenz komplementären Abschnitt, außer in mindestens einer Abfrageposition. Ein zweiter Sondensatz weist eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz auf. Die entsprechende Sonde in dem zweiten Sondensatz ist identisch mit einer Sequenz, die die entsprechende Sonde des ersten Sondensatzes oder eine Teilsequenz davon umfasst, die mindestens eine (und normalerweise nur eine) Abfrageposition enthält, außer dass die mindestens eine Abfrageposition in jeder der zwei entsprechenden Sonden aus den ersten und zweiten Sondensätzen durch ein unterschiedliches Nukleotid besetzt ist. Ein dritter Sondensatz, wenn vorhanden, umfasst auch eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz, außer an der mindestens einen Abfrageposition, die sich in den entsprechenden Sonden von den drei Sätzen unterscheidet. Das Weglassen von Sonden, die einen Abschnitt aufweisen, der perfekt komplementär zu der Referenzsequenz ist, führt zu dem Verlust von Kontrollinformationen, d. h. der Detektion von Nukleotiden in einer Zielsequenz, die die gleichen wie jene in der Referenzsequenz sind. Ähnliche Information kann jedoch dadurch erhalten werden, dass ein Chip, dem Sonden von dem ersten Sondensatz fehlen, mit sowohl den Ziel- als auch Referenzsequenzen hybridisiert wird. Die Hybridisierung kann in Folge oder gleichzeitig durchgeführt werden, wenn Ziel und Referenz unterschiedlich markiert sind. In dieser Situation wird die Anwesenheit einer Mutation durch eine Verschiebung in der Hintergrund-Hybridisierungsintensität der Referenzsequenz mit einem perfekt übereinstimmenden Hybridisierungssignal der Zielsequenz detektiert, anstelle durch einen Vergleich der Hybridisierungsintensitäten von Sonden des ersten Satzes mit entsprechenden Sonden von den zweiten, dritten und vierten Sätzen.
  • 3. Die Wildtyp-Sondenzeile
  • Wenn die Chips, wie oben diskutiert, vier Sondensätze umfassen, und die Sondensätze in vier Zeilen angeordnet sind, einer A-Zeile, einer C-Zeile, einer G-Zeile und einer T- oder U-Zeile, dann unterscheidet sich zwischen den vier Zeilen von einer Spalte zur anderen die Sonde, die einen Abschnitt mit perfekter Komplementarität zu der Referenzsequenz aufweist. Dies stellt für die Computeranalyse der Daten von dem Chip keine signifikante Schwierigkeit dar. Die visuelle Inspektion des Hybridisierungsmusters des Chips wird jedoch manchmal durch das zur Verfügung stellen einer Extrazeile von Sonden erleichtert, in der jede Sonde einen Abschnitt aufweist, der perfekt komplementär zu der Referenzsequenz ist. Siehe 4. Dieser Abschnitt ist identisch mit einem Abschnitt von einer der Sonden in den anderen vier Zeilen (mit welcher Zeile, hängt von der Spaltenposition ab). Die Extrazeile von Sonden (Wildtyp-Zeile genannt) hybridisiert mit der Zielsequenz an allen Nukleotidpositionen außer jenen, in denen Abweichungen von der Referenzsequenz auftreten. Das Hybridisierungsmuster der Wildtyp-Zeile stellt damit einen einfachen visuellen Hinweis auf Mutationen zur Verfügung.
  • 4. Deletions-, Insertions- und multiple Mutations-Sonden
  • Manche Chips stellen einen zusätzlichen Sondensatz, der besonders für die Analyse von Deletionsmutationen entworfen ist, bereit. Der zusätzliche Sondensatz umfasst eine Sonde, die jeder Sonde in dem ersten Sondensatz, wie oben beschrieben, entspricht. Eine Sonde des zusätzlichen Sondensatzes unterscheidet sich jedoch von der entsprechenden Sonde in dem ersten Sondensatz dadurch, dass das Nukleotid, das die Abfrageposition besetzt, in der Sonde des zusätzlichen Sondensatzes deletiert ist. Siehe 6. Optional trägt die Sonde des zusätzlichen Sondensatzes im Vergleich zu der entsprechenden Sonde des ersten Sondensatzes ein zusätzliches Nukleotid an einem seiner Enden. Die Sonde des zusätzlichen Sondensatzes wird stärker als die entsprechende Sonde des ersten Sondensatzes mit einer Zielsequenz hybridisieren, die eine einzelne Basendeletion an dem Nukleotid, das der Abfrageposition entspricht, aufweist. Zusätzliche Sondensätze werden bereitgestellt, in denen nicht nur die Abfragepositionen, sondern auch ein benachbartes Nukleotid detektiert werden.
  • Ähnlich stellen andere Chips zusätzliche Sondensätze für die Analyse von Insertionen zur Verfügung. Zum Beispiel weist ein zusätzlicher Sondensatz eine Sonde auf, die jeder Sonde in dem ersten Sondensatz, wie oben beschrieben, entspricht. Die Sonde in dem zusätzlichen Sondensatz weist jedoch ein Extra-T-Nukleotid auf, das benachbart zu der Abfrageposition eingefügt ist. Siehe 6. Optional weist die Sonde im Vergleich zu der entsprechenden Sonde des ersten Sondensatzes ein Nukleotid weniger an einem seiner Enden auf. Die Sonde des zusätzlichen Sondensatzes hybridisiert stärker als die entsprechende Sonde des ersten Sondensatzes mit einer Zielsequenz mit einem eingefügten A-Nukleotid in einer Position, die der Position benachbart ist, die der Abfrageposition entspricht. Ähnlich werden zusätzliche Sondensätze konstruiert, die C-, G- oder T/U-Nukleotide benachbart zu der Abfrageposition eingefügt haben. Normalerweise werden vier solcher Sondensätze, einer für jedes Nukleotid, in Kombination benutzt.
  • Andere Chips stellen zusätzliche Sonden (multiple Mutationssonden) für die Analyse von Zielsequenzen mit multiplen, nahe beieinander liegenden Mutationen, zu Verfügung. Eine multiple Mutationssonde ist normalerweise identisch mit einer entsprechenden Sonde des ersten Sondensatzes, wie oben beschrieben, außer an der Base, die die Abfrageposition besetzt, und außer an einer oder mehreren zusätzlichen Positionen, die Nukleotiden entsprechen, bei denen in der Referenzsequenz Substitutionen auftreten können. Die eine oder mehrere zusätzliche(n) Positionen in der multiplen Mutationssonde werden von Nukleotiden besetzt, die komplementär mit den Nukleotiden sind, die entsprechende Positionen in der Referenzsequenz besetzen, wenn mögliche Substitutionen aufgetreten sind.
  • 5. Block Tiling
  • Wie in der Diskussion der allgemeinen Tiling-Strategie bemerkt, weist eine Sonde in dem ersten Sondensatz manchmal mehr als eine Abfrageposition auf. In dieser Situation paßt eine Sonde des ersten Sondensatzes manchmal mit multiplen Gruppen von mindestens einer und normalerweise drei zusätzlichen Sondensätzen zusammen, siehe 7. Drei zusätzliche Sondensätze werden verwendet, um die Detektion der drei möglichen Nukleotidsubstitutionen an jeder Position zu ermöglichen. Wenn nur bestimmte Arten der Substitution (z. B. Transitionen) wahrscheinlich auftreten, sind nur ein oder zwei zusätzliche Sondensätze notwendig (analog zu der Benutzung von Sonden in der grundlegenden Tiling-Strategie). Um die Situation zu erläutern, in der eine Gruppe drei zusätzliche Sondensätze umfasst, eine erste solche Gruppe umfasst zweite, dritte und vierte Sondensätze, wobei jeder davon eine Sonde, die jeder Sonde in dem ersten Sondensatz entspricht, aufweist. Die entsprechenden Sonden aus den zweiten, dritten und vierten Sondensätzen unterscheiden sich von der entsprechenden Sonde des ersten Satzes in der ersten der Abfragepositionen. Damit zeigen die relativen Hybridisierungssignale der entsprechenden Sonden von den ersten, zweiten, dritten und vierten Sondensätzen die Identität des Nukleotids in einer Zielsequenz, die der ersten Abfrageposition entspricht, an. Eine zweite Gruppe von drei Sondensätzen (als fünfte, sechste und siebte Sondensätze bezeichnet) weist auch jeweils eine Sonde, die jeder Sonde des ersten Sondensatzes entspricht, auf. Diese entsprechenden Sonden unterscheiden sich von denjenigen in dem ersten Sondensatz an einer zweiten Ab frageposition. Die relativen Hybridisierungssignale von entsprechendem Sonden aus den ersten, fünften, sechsten und siebten Sondensätzen geben die Identität des Nukleotids der Zielsequenz an, das der zweiten Abfrageposition entspricht. Wie oben bemerkt, haben die Sonden des ersten Sondensatzes oft sieben oder mehr Abfragepositionen. Wenn sieben Abfragepositionen vorhanden sind, gibt es sieben Gruppen von drei zusätzlichen Sondensätzen, wobei jede Gruppe von drei Sondensätzen der Identifizierung des Nukleotids dient, das einer der sieben Abfragepositionen entspricht.
  • Jeder Block von Sonden erlaubt das Lesen einer kurzen Region einer Zielsequenz. Zum Beispiel können bei einem Block von Sonden mit sieben Abfragepositionen sieben Nukleotide in der Zielsequenz gelesen werden. Selbstverständlich kann ein Chip jegliche Anzahl von Blöcken enthalten, abhängig davon, wieviele Nukleotide des Ziels von Interesse sind. Die Hybridisierungssignale für jeden Block können unabhängig von jedem anderen Block analysiert werden. Die Block-Tiling-Strategie kann auch mit anderen Tiling-Strategien kombiniert werden, wobei unterschiedliche Teile der gleichen Referenzsequenz für das Tiling mit anderen Strategien angepasst sein können.
  • Die Block-Tiling-Strategie bietet zwei Vorteile gegenüber der grundlegenden Strategie, in der jede Sonde des ersten Sondensatzes eine einzige Abfrageposition aufweist. Ein Vorteil ist, dass die gleiche Sequenzinformation von weniger Sonden erhalten werden kann. Ein zweiter Vorteil ist, dass jede der Sonden, die einen Block darstellen (d. h. eine Sonde aus dem ersten Sondensatz und eine entsprechende Sonde aus jedem der anderen Sondensätze) identische 3'- und 5'-Sequenzen haben kann, wobei die Variation auf einen zentralen Abschnitt, der die Abfragepositionen enthält, beschränkt sein kann. Die Identität einer 3'-Sequenz zwischen unterschiedlichen Sonden erleichtert die Strategie für die Festphasesynthese der Sonden auf dem Chip und ergibt eine gleichmäßigere Ablagerung der verschiedenen Sonden auf dem Chip, was wiederum die Gleichmäßigkeit des Verhältnisses von Signal zu Hintergrund für unterschiedliche Regionen des Chips erhöht. Ein dritter Vorteil ist, dass eine größere Gleichmäßigkeit des Signals innerhalb eines Blocks erreicht wird.
  • 6. Multiplex-Tiling
  • Bei der oben diskutierten Block-Tiling-Strategie wird die Identität eines Nukleotids einer Ziel- oder Referenzsequenz durch den Vergleich von Hybridisierungsmustern von einer Sonde, die einen Abschnitt mit perfekter Übereinstimmung zeigt, mit denen von mehreren Sonden (normalerweise drei anderen Sonden) mit einer Nichtübereinstimmung von einer Base, bestimmt. Bei einem Multiplex-Tiling wird die Identität von mindestens zwei Nukleotiden einer Referenz- oder Zielsequenz durch den Vergleich der Intensität der Hybridisierungssignale von vier Sonden bestimmt, von denen zwei einen Abschnitt perfekter Komplementarität oder eine Nichtübereinstimmung von einer Base gegenüber der Referenzsequenz aufweisen, und von denen zwei einen Abschnitt mit perfekter Komplementarität oder eine Nichtübereinstimmung von zwei Basen mit einem Abschnitt aufweisen. Die 4 Sonden, deren Hybridisierungsmuster verglichen werden sollen, weisen jeweils einen Abschnitt auf, der genau komplementär zu einer Referenzsequenz ist, außer an zwei Abfragepositionen, an denen der Abschnitt zu der Referenzsequenz komplementär sein kann oder nicht. Die Abfragepositionen entsprechen den Nukleotiden in einer Referenz- oder Zielsequenz, die durch den Vergleich der Intensitäten bestimmt werden. Die Nukleotide, die die Abfragepositionen in den 4 Sonden besetzen, werden nach der folgenden Regel ausgewählt. Die erste Abfrageposition wird in jeder der 4 Sonden durch ein unterschiedliches Nukleotid besetzt. Die zweite Abfrageposition ist auch durch ein unterschiedliches Nukleotid in jeder der 4 Sonden besetzt. In 2 der 4 Sonden, genannt die ersten und zweiten Sonden, ist der Abschnitt genau komplementär zu der Referenzsequenz außer an nicht mehr als einer der zwei Abfragepositionen. Mit anderen Worten ist eine der Abfragepositionen durch ein Nukleotid besetzt, das komplementär zu dem entsprechenden Nukleotid aus der Referenzsequenz ist, und die andere Abfrageposition kann so besetzt sein oder nicht. In den anderen 2 der 4 Sonden, dritte und vierte Sonden genannt, ist der Abschnitt genau komplementär zu der Referenzsequenz, außer daß beide Abfragepositionen von Nukleotiden besetzt sind, die nicht komplementär zu den jeweiligen entsprechenden Nukleotiden in der Referenzsequenz sind.
  • Es gibt eine Anzahl von Arten, diese Bedingungen zu erfüllen, abhängig davon, ob die zwei Nukleotide in der Referenzsequenz, die den zwei Abfragepositionen entsprechen, gleich oder unterschiedlich sind. Wenn diese zwei Nukleotide in der Referenzsequenz unterschiedlich sind (Wahrscheinlichkeit 3/4), werden die Bedingungen dadurch erfüllt, daß jede der zwei Abfragepositionen in jeder vorgegebenen Sonde von dem gleichen Nukleotid besetzt ist. Z. B. wären in der 1. Sonde die zwei Abfragepositionen beide A, in der 2. Sonde wären beide C, in der 3. Sonde wären beide G und in der 4. Sonde wären beide T oder U. Wenn die beiden Nukleotide in der Referenzsequenz, die den zwei Abfragepositionen entsprechen, unterschiedlich sind, werden die oben beschriebenen Bedingungen erfüllt, wenn jede der Abfragepositionen in jeder der vier Sonden von komplementären Nukleotiden besetzt ist. Z. B. könnten die Abfragepositionen in der ersten Sonde durch A und T besetzt sein, in der 2. Sonde durch C und G, in der 3. Sonde durch G und C und in der 4. Sonde durch T und A. Siehe (8).
  • wenn die 4 Sonden mit einem Ziel hybridisiert werden, das gleich ist wie die Referenzsequenz oder von der Referenzsequenz an einer (aber nicht beiden) Abfragepositionen abweicht, weisen 2 der 4 Sonden eine zweifache Nichtübereinstimmung mit dem Ziel und 2 Sonden eine einfache Nichtübereinstimmung auf. Die Identität der Sonden, die diesen unterschiedlichen Grad der Nichtübereinstimmung zeigen, kann aus den unterschiedlichen Hybri disierungssignalen bestimmt werden. Aus der Identität der Sonden, die den unterschiedlichen Grad der Nichtübereinstimmung zeigen, können die Nukleotide, die beide Abfragepositionen in der Zielsequenz besetzen, abgeleitet werden.
  • Um der Einfachheit der Erläuterung willen, wurde die Multiplexstrategie anfänglich für die Situation beschrieben, in der zwei Nukleotide von Interesse in einer Referenzsequenz vorhanden sind und nur vier Sonden in einem Array. Selbstverständlich kann die Strategie ausgedehnt werden, um jegliche Anzahl von Nukleotiden in einer Zielsequenz durch die Benutzung von zusätzlichen Sonden zu analysieren. In einer Variation wird jedes Paar von Abfragepositionen von einer einzigartigen Gruppe von 4 Sonden gelesen. In einer Blockvariation, weisen unterschiedliche Gruppen von 4 Sonden den gleichen komplementären Abschnitt wie die Referenzsequenz auf, aber die Abfragepositionen verschieben sich innerhalb eines Blocks. Die Block- und Standard-Multiplex-Tilingvarianten können selbstverständlich in Kombination für verschiedene Regionen einer Referenzsequenz benutzt werden. Eine oder beide der Varianten können auch in Kombination mit jeder der anderen beschriebenen Tilingstrategie benutzt werden.
  • 7. Helfermutationen
  • Manchmal führt in kleinen Regionen einer Referenzsequenz das Anlagern der Sonden nur zu einem geringen Hybridisierungssignal. Die Hybrisisierung innerhalb der Sonde verringert die Menge an Sonde, die effektiv für die Hybridisierung mit den Ziel verfügbar ist. Obwohl solche Regionen des Ziels im allgemeinen klein sind und die Verringerung des Hybridisierungssignals normalerweise nicht so substantiell ist, daß die Sequenz dieser Region unklar wird, kann dieses Problem durch die Nutzung von Sonden, die Helfermutationen beinhalten, vermieden werden. Die Helfermutation (N) dienen dazu, Regionen der internen Komplementarität innerhalb einer Sonde aufzubrechen und damit die Anlagerung zu verhindern. Normalerweise sind ein oder zwei Helfermutationen zu diesem Zweck durchaus ausreichend. Die Verwendung von Helfermutationen kann in jeder der oben erwähnten Tiling-Strategien von Vorteil sein. Im allgemeinen weist jeder Sonde mit einer bestimmten Abfrageposition die gleiche Helfermutation (die gleichen Helfermutationen) auf. Somit haben solche Proben einen gemeinsamen Abschnitt, der perfekt komplementär zu einer Referenzsequenz ist, außer daß der Abschnitt mindestens eine Helfermutation (die gleiche in jeder der Sonden) und mindestens eine Abfrageposition (unterschiedlich in jeder der Sonden) enthält. Z. B. umfaßt in der grundlegenden Tilingstrategie eine Sonde des 1. Sondensatzes einen Abschnitt, der eine Abfrageposition enthält und perfekt komplementär zu einer Referenzsequenz ist, außer einer oder zwei Helfermutationen. Die entsprechenden Sonden der 2., 3. und 4. Sondensätze umfassen normalerweise den gleichen Abschnitt (oder manchmal eine Teilsequenz davon), die die Helfermutation (n) und Abfrageposition enthält), außer daß die Base, die die Abfrageposition besetzt, sich in jeder Sonde unterscheidet, siehe 9.
  • Normalerweise wird die Helfermutations-Tilingstrategie gemeinsam mit einer der oben beschriebenen Tilingstrategien benutzt. Die Sonden, die Helfermutationen enthalten, werden für das Tiling von Regionen einer Referenzsequenz genutzt, die ansonsten ein geringes Hybridisierungssignal abgibt (z .B. wegen Selbstkomplementarität), und für das Tiling dazwischenliegender Regionen wird die alternative Tilingstrategie genutzt.
  • 8. Poolingstrategien
  • Poolingstrategien nutzen auch Arrays aus immobilisierten Sonden. Sonden werden in Zellen eines Arrays immobilisiert, und das Hybridisierungssignal jeder Zelle kann unabhängig von jeder anderen Zelle bestimmt werden. Eine bestimmte Zelle kann von gepoolten Mischungen von Sonden besetzt sein. Obwohl die Iden tität von jeder Sonde in der Mischung bekannt ist, können die einzelnen Sonden in dem Pool nicht getrennt angesprochen werden. Damit ist das Hybridisierungssignal einer Zelle die Gesamtsumme des Signals der unterschiedlichen Sonden, die die Zelle besetzen. Im allgemeinen wird eine Zelle als mit der Zielsequenz hybridisierend gewertet, wenn mindestens eine Sonde, die die Zelle besetzt, einen Abschnitt mit perfekter Komplementarität zu der Zielsequenz umfaßt.
  • Eine einfache Möglichkeit, die verstärkte Leistung von Poolingstrategien gegenüber Standardtiling zu zeigen, ist, 3 Zellen herzustellen, die jeweils eine gepoolte Sonde enthalten, die eine einzige gepoolte Position aufweist, wobei die gepoolte Position in jeder der gepoolten Sonden die gleiche ist. An der gepoolten Position gibt es zwei mögliche Nukleotide, was der gepoolten Sonde erlaubt, mit zwei Zielsequenzen zu hybridisieren. In der Terminologie des Tiling ist die gepoolte Position jeder Sonde eine Abfrageposition. Wie deutlich werden wird, offenbart der Vergleich der Hybridisierungsintensitäten der gepoolten Sonden aus den drei Zellen die Identität des Nukleotids in der Zielsequenz, das der Abfrageposition entspricht (d. h., das der Abfrageposition zugeordnet ist, wenn die Zielsequenz und die gepoolten Sonden für maximale Komplementarität aneinander ausgerichtet sind).
  • Den drei Zellen werden Sondenpools zugeordnet, die perfekt komplementär zu der Zielsequenz sind, außer an der gepoolten Position, die in jeder Sonde durch ein unterschiedliches gepooltes Nukleotid besetzt sind, und zwar wie folgt:
    [AC] = M, [GT] = K, [AG] = R
    als Substitutionen in der Sonde IUPAC Standard Mehrdeutigkeitsnotation
    X = Abfrageposition
    Figure 00520001
  • Mit drei gepoolten Sonden werden alle 4 möglichen Zustände eines einzelnen Basenpaars (Wild- und 3 Mutanten) detektiert. Ein Pool hybridisiert mit einem Ziel, wenn in diesem Pool enthaltene Sonde komplementär mit diesem Ziel ist.
  • Hybridisierung
    Figure 00520002
  • Eine Zelle, die ein Paar (oder mehr) Oligonukleotide enthält, leuchtet auf, wenn ein zu einem Oligonukleotid in der Zelle komplementäres Ziel anwesend ist. Bei der Benutzung der einfachen Strategie ergibt jedes der vier möglichen Ziele (Wild und 3 Mutanten) ein einzigartiges Hybridisierungsmuster in den 3 Zellen.
  • Da für jedes mögliche Nukleotid in der Zielsequenz, das der gepoolten Abfrageposition in den Sonden entspricht, ein unterschiedliches Muster von hybridisierenden Pools erhalten wird, kann die Identität des Nukleotids aus den Hybridisierungsmustern der Pools bestimmt werden. Wo für ein Standardtiling 4 Zellen notwendig sind, um mögliche Einzelbasensubstitutionen an einem Ort zu detektieren und zu identifizieren, bedarf diese einfache Poolingstrategie nur dreier Zellen.
  • Eine effizientere Poolingstrategie für die Sequenzanalyse ist die "Gitter" Strategie. Bei dieser Strategie weist jede gepoolte Sonde einen zu einer Referenzsequenz perfekt komplementären Abschnitt auf, außer an drei gepoolten Positionen. Eine gepoolte Position ist ein N-Pool. Die drei gepoolten Positionen können in einer Sonde zusammenhängend sein oder nicht. Die anderen zwei gepoolten Positionen sind aus einer Gruppe von drei Pools ausgewählt, bestehend aus (1) M oder K, (2) R oder Y und (3) W oder S, wobei die einzelnen Buchstaben IUPAC-Standard-Mehrdeutigkeitscodes sind. Die Sequenz einer gepoolten Sonde hat damit die Form XXXN [(M/K) oder (R/Y) oder (W/S)] [(M/K) oder (R/Y) oder (W/S)] XXXXX, wobei XXX Basen, die zur Referenzsequenz komplementär sind, darstellt. Die drei gepoolten Positionen können in jeder Reihenfolge sein, und können zusammenhängend oder durch dazwischengeschobene Nukleotide getrennt sein. Für die zwei Positionen, die durch [(M/K) oder (R/Y) oder (W/S)] besetzt sind, müssen zwei Entscheidungen getroffen werden. Zum ersten muß man eins der folgenden drei Paare von gepoolten Nukleotiden auswählen (1) M/K, (2) R/Y und (3) W/S. Das eine, ausgewählte von drei gepoolten Nukleotiden kann an den zwei gepoolten Positionen gleich oder unterschiedlich sein. Zum zweiten muß man, wenn man annimmt, man wählt M/K an einer Position, sodann zwischen M oder K wählen. Diese Wahl sollte zur Auswahl eines gepoolten Nukleotids führen, das ein Nukleotid umfaßt, das komplementär zu dem entsprechenden Nukleotid in einer Referenzsequenz ist, wenn die Sonde und Referenzsequenz maximal aneinander ausgerichtet sind. Dasselbe Prinzip regelt die Auswahl zwischen R und Y und zwischen W und S. Eine Gitterpool-Sonde weist eine gepoolte Position mit 4 Möglichkeiten auf, und zwei gepoolte Positionen jeweils mit zwei Möglichkeiten. Damit umfaßt eine Gitterpool-Sonde eine Mischung von 16 (4 × 2 × 2) Sonden. Da jede der gepoolten Positionen ein Nukleotid enthält, das zu dem entsprechenden Nukleotid der Referenzsequenz komplementär ist, hat eine dieser 16 Sonden einen Abschnitt, der genau komplementär zu der Referenzsequenz ist. Eine Zielsequenz, die die gleiche wie die Referenzsequenz ist (d. h. ein Wildtyp-Ziel), führt zu einem Hybridisierungssignal bei jeder Sondenzelle. Hierbei sollte, wie bei den anderen Tiling-Verfahren, der komplementäre Abschnitt ausreichend lang sein, um zu erlauben, dass die spezifische Hybridisierung einer gepoolten Sonde mit einer Referenzsequenz im Verhältnis zu einer Variante dieser Referenzsequenz detektiert werden kann. Typischerweise weist der komplementäre Abschnitt etwa 9–21 Nukleotide auf.
  • Eine Zielsequenz wird durch den Vergleich von Hybridisierungsintensitäten an drei gepoolten Sonden analysiert, wobei jede die oben beschriebene Struktur aufweist. Die in den drei gepoolten Sonden vorhandenen, zu der Referenzsequenz komplementären Abschnitte zeigen etwas Überlappung. Manchmal sind die Abschnitte identisch (außer an den Abfragepositionen). Dies muss jedoch nicht der Fall sein. Zum Beispiel können die Abschnitte für das Tiling über eine Referenzsequenz in Schritten von einem Nukleotid angepasst sein (d. h. eine gepoolte Sonde unterscheidet sich von der nächsten durch die Hinzunahme eines Nukleotids an dem 5'-Ende und den Verlust eines Nukleotids an dem 3'-Ende). Die drei Abfragepositionen können an der gleichen relativen Position in jeder gepoolten Sonde auftreten oder nicht (d. h. Abstand vom Ende einer Sonde). Es ist alleine notwendig, daß eine der drei Abfragepositionen von jeder der drei gepoolten Sonden an dem gleichen Nukleotid in der Referenzsequenz ausgerichtet ist, und dass diese Abfrageposition in jeder der drei Sonden durch ein unterschiedliches gepooltes Nukleotid besetzt ist. In einer der drei Sonden wird die Abfrageposition durch ein N besetzt. In den anderen zwei gepoolten Sonden wird die Abfrageposition durch entweder (M/K) oder (R/Y) oder (W/S) besetzt.
  • In der einfachsten Form der Gitterstrategie werden drei gepoolte Sonden benutzt, um ein einziges Nukleotid in der Referenzsequenz zu analysieren. Eine ökonomisch bessere Verwendung der Sonden wird erreicht, wenn mehr gepoolte Sonden in einem Array eingeschlossen werden. Zum Beispiel bedenke man ein Array von fünf gepoolten Sonden, die jeweils die oben beschriebene allgemeine Struktur aufweisen. Drei dieser gepoolten Sonden haben eine Abfrageposition, die mit dem gleichen Nukleotid der Referenzsequenz ausgerichtet sind und zum Lesen dieses Nukleotids benutzt werden. Eine andere Kombination von drei Sonden weist eine Abfrageposition auf, die mit einem anderen Nukleotid in der Referenzsequenz ausgerichtet ist. Der Vergleich der Intensitäten dieser drei Sonden erlaubt die Analyse dieses zweiten Nukleotids. Noch eine weiter Kombination von drei gepoolten Sonden aus dem Satz von fünf weist eine Abfrageposition auf, die mit einem dritten Nukleotid in der Referenzsequenz ausgerichtet ist und diese Sonden werden zur Analyse dieses Nukleotids genutzt. Damit werden drei Nukleotide in der Referenzsequenz mit nur fünf gepoolten Sonden gänzlich analysiert. Im Vergleich würde die grundlegende Tiling-Strategie 12 Sonden für eine ähnliche Analyse benötigen.
  • Als Beispiel ist eine gepoolte Sonde für die Analyse einer Zielsequenz durch die Gitterstrategie unten gezeigt:
    Figure 00550001
  • Die gepoolte Sonde umfasst tatsächlich 16 individuelle Sonden:
    Figure 00560001
  • Die Gitterstrategie nutzt ein Array aus Sonden, die mindestens drei Zellen aufweisen, von denen jede, wie oben beschrieben, von einer gepoolten Sonde besetzt ist.
  • Man bedenke die Nutzung von drei solcher gepoolten Sonden für die Analyse einer Zielsequenz, bei der eine Position irgendeine Substitution einer einzigen Base im Vergleich zur Referenzsequenz enthalten kann (d. h. es gibt vier mögliche Zielsequenzen, die unterschieden werden müssen). Drei Zellen sind durch gepoolte Sonden besetzt, die eine gepoolte Abfrageposition aufweisen, die der Position der möglichen Substitution in der Zielsequenz entspricht, eine Zelle mit einem "N", eine Zelle mit entweder "M" oder "K", und eine Zelle mit "R" oder "Y". Eine Abfrageposition entspricht einem Nukleotid in der Zielsequenz, wenn es bei der Ausrichtung zu diesem Nukleotid benachbart ist, wenn die Sonde und Zielsequenz aneinander ausgerichtet sind, um maximale Komplementarität zu erreichen. Man beachte dass, obwohl jede der gepoolten Sonden zwei andere gepoolte Positionen aufweist, diese Positionen für die vorliegende Erläuterung nicht relevant sind. Die Positionen sind nur relevant, wenn mehr als eine Position in der Zielsequenz gelesen werden soll, ein Umstand, der später bedacht werden wird. Für den vorliegenden Zweck leuchtet die Zelle mit dem "N" in der Abfrageposition bei der Wildtyp-Sequenz und jeder der drei Substitutionen von einzelnen Basen der Zielsequenz auf. Die Zelle mit M/K in der Abfrageposition leuchtet bei der Wildtyp-Sequenz und einer der Substitutionen von einzelnen Basen auf. Die Zelle mit R/Y in der Abfrageposition leuchtet bei der Wildtyp-Sequenz und einer zweiten der Substitutionen von einzelnen Basen auf. Damit hybridisieren die vier möglichen Zielsequenzen mit den drei Pools von Sonden in vier unterschiedlichen Mustern, und die vier möglichen Zielsequenzen können unterschieden werden.
  • Um dies weiter zu erläutern, stelle man sich vier mögliche Zielsequenzen vor (die sich an einer einzelnen Position unterscheiden) und eine gepoolte Sonde mit drei gepoolten Positionen, N, K und Y, wobei die Y-Position die Abfrageposition ist (d. h. mit der variablen Position in der Zielsequenz ausgerichtet ist)
    Figure 00570001
  • Die 16 einzelnen Teil-Sonden der gepoolten Sonde hybridisieren mit den vier möglichen Zielsequenzen wie folgt:
    Figure 00570002
  • Die gepoolte Sonde hybridisiert abhängig von der Gesamtsumme ihrer Komponenten:
    Figure 00580001
  • Damit kann, wie oben festgestellt, gezeigt werden, dass eine gepoolte Sonde mit einem y an der Abfrageposition mit dem Wildtyp-Ziel und einer der Mutanten hybridisiert. Ähnliche Tabellen können aufgestellt werden, um die Hybridisierungsmuster von Sondenpools mit anderen gepoolten Nukleotiden an der Abfrageposition zu erläutern.
  • Die oben geschilderte Strategie, gepoolte Sonden zu nutzen, um eine einzige Base in einer Zielsequenz zu analysieren, kann einfach auf die Analyse jeglicher Anzahl von Basen ausgedehnt werden. An dieser Stelle wird der Zweck dessen, drei gepoolte Positionen in jeder Sonde zu haben, klar werden. In dem folgenden Beispiel können zehn Pools von Sonden, wobei jede drei gepoolte Sondenpositionen enthält, zur Analyse von jeweils einer zusammenhängenden Sequenz von acht Nukleotiden in einer Zielsequenz benutzt werden.
  • Figure 00580002
  • In diesem Beispiel sind die unterschiedlichen gepoolten Sonden für das Tiling über die Referenzsequenz angepasst, wobei jede gepoolte Sonde sich von der nächsten durch Schritte von einem Nukleotid unterscheidet. Für jedes der lesbaren Nukleotide in der Referenzsequenz gibt es drei Sondenpools, die eine gepoolte Abfrageposition aufweisen, die an dem lesbaren Nukleotid ausgerichtet ist. Zum Beispiel ist das zwölfte Nukleotid von der linken in der Referenzsequenz mit der gepoolten Abfrageposition in den gepoolten Sonden 8, 9 und 10 ausgerichtet. Der Vergleich der Hybridisierungsintensitäten dieser gepoolten Sonden offenbart die Identität des Nukleotids, das in einer Zielsequenz Position 12 besetzt.
  • Figure 00590001
  • Beispiel-Intensitäten:
    Figure 00590002
  • Somit weiß man z. B., wenn die Pools 8, 9 und 10 alle aufleuchten werden, dass die Zielsequenz Wildtyp ist. Wenn die Pools 9 und 10 aufleuchten werden, hat die Zielsequenz eine C-Mutante an Position 12. wenn die Pools 8 und 10 aufleuchten, hat die Zielsequenz eine G-Mutante an Position 12. Wenn nur Pool 10 erleuchtet wird, hat die Zielsequenz eine t-Mutante an Position 12.
  • Die Identität von anderen Nukleotiden in der Zielsequenz wird durch einen Vergleich von anderen Sätzen von drei gepoolten Sonden bestimmt. Zum Beispiel wird die Identität des 13. Nukleotids in der Zielsequenz durch den Vergleich des Hybridis ierungsmusters der Sondenpools, die 9, 10 und 11 benannt sind, bestimmt. Ähnlich wird die Identität des 14. Nukleotids in der Zielsequenz durch Vergleichen der Hybridisierungsmuster der Sondenpools, die mit 10, 11 und 12 benannt sind, bestimmt.
  • In dem obigen Beispiel sind aufeinanderfolgende Sonden für das Tiling über die Referenzsequenz in Schritten von einem Nukleotid angepasst, und jede Sonde weist drei Abfragepositionen auf, die in jeder Sonde die gleiche Position in Bezug auf das Ende der Sonde besetzen (d. h. die 7., 8. und 9. Positionen in Bezug auf das 3'-Ende). Es ist für die Gitterstrategie jedoch nicht notwendig, dass Sonden für das Tiling in Schritten von 1 angepasst sind oder das die Abfrageposition an der gleichen Position in jeder Sonde auftritt. In einer Variante des Gitter-Tilings, die als "loop"-Tiling bezeichnet wird, wird ein Nukleotid von Interesse in einer Zielsequenz durch den Vergleich von gepoolten Sonden gelesen, die jeweils eine gepoolte Abfrageposition entsprechend dem Nukleotid von Interesse aufweisen, in denen aber der Abstand der Abfrageposition in der Sonde von Sonde zu Sonde unterschiedlich ist. Analog zu dem Block-Tiling-Ansatz erlaubt dies, dass mehrere Nukleotide von einer Zielsequenz durch eine Sammlung von Sonden abgelesen werden können, die, außer an der Abfrageposition, identisch sind. Die Identität der Sequenz der Sonden, besonders an ihrem 3'-Ende, erleichtert die Synthese des Arrays und ergibt eine gleichmäßigere Sondendichte pro Zelle.
  • Um die Loop-Strategie zu erläutern, stelle man sich eine Referenzsequenz vor, von der die vierten, fünften, sechsten, siebten und achten Nukleotide (von dem 3'-Ende aus) gelesen werden sollen. Jedes der vier möglichen Nukleotide an jeder dieser Positionen kann durch den Vergleich der Hybridisierungsintensitäten von fünf gepoolten Sonden gelesen werden. Man beachte, dass die gepoolten Positionen in den Sonden unterschiedlich sind (z. B. sind in Sonde 55 die gepoolten Positionen vier, fünf und sechs und in Sonde 56 fünf, sechs und sieben).
  • Figure 00610001
  • Jede ausgewählte Position in der Referenzsequenz wird gelesen, indem die Hybridisierungsintensitäten für die drei Sondenpools, die eine Abfrageposition aufweisen, die mit dem Nukleotid von Interesse in der Referenzsequenz ausgerichtet ist, verglichen werden. Zum Beispiel stellen für das Lesen des vierten Nukleotids der Referenzsequenz die Sonden 55, 58 und 59 Pools an der vierten Position bereit. Ähnlich stellen die Sonden 55, 56 und 59 Pools an der fünften Position bereit, um das fünfte Nukleotid in der Referenzsequenz zu lesen. Wie in der vorherigen Gitterstrategie weist eine der drei verglichenen Sonden ein N an der gepoolten Position auf und die andere beiden (1) M oder K und (2) R oder Y und (3) W oder S.
  • Unten ist das Hybridisierungsmuster von fünf gepoolten Sonden an Zielsequenzen, die jede mögliche Nukleotidsubstitution an fünf Positionen in der Referenzsequenz darstellen, gezeigt. Jede mögliche Substitution führt zu einem einmaligen Hybridisierungsmuster an den drei gepoolten Sonden, und die Identität des Nukleotids in dieser Position kann von dem Hybridisierungsmuster abgeleitet werden.
  • Figure 00620001
  • Viele Variationen zu dem Loop- und Gitter-Tiling können hergestellt werden. Die einzige Voraussetzung ist, dass es für jede Position der Sequenz eine Sonde mit einem "N", eine Sonde, die entweder R/Y, M/K oder W/S enthält, und eine Sonde, die ein von diesem Satz unterschiedliches Pool enthält und an dieser Position komplementär zu dem Wildtyp-Ziel ist, und mindestens eine Sonde, in der an dieser Position gar kein Pool ist, gibt. Diese Kombination erlaubt, dass alle Mutationen an dieser Position eindeutig detektiert und identifiert werden können.
  • Eine weitere Klasse von Strategien, die mit gepoolten Proben verbunden sind, werden kodierende Strategien genannt. Diese Strategien ordnen Codewörter von einigen Nummern-Sätzen Varianten einer Referenzsequenz zu. Eine jegliche Anzahl von Varianten kann codiert werden. Die Varianten können multiple Substitutionen dicht beieinander, Deletionen oder Insertionen einschließen. Die Buchstabebezeichnungen oder anderen Symbole, die jeder Variante zugeordnet werden, können jeglicher zufälliger Satz von Zahlen in jeglicher Reihenfolge sein. Zum Beispiel wird oft ein binärer Code verwendet, aber Codes mit anderen Basen sind voll verwendbar. Die Zahlen sind oft so zugeordnet, dass jede Variante eine Bezeichnung hat, die mindestens eine Ziffer und mindestens eine Nicht-Nullwert für diese Ziffer aufweist. Zum Beispiel hat in einem binären System eine Variante, der die Nummer 101 zugeordnet wird, eine Bezeichnung mit drei Ziffern, mit einem möglichen Nichtnullwert für jede Ziffer.
  • Die Bezeichnungen der Varianten werden in einem Array von gepoolten Sonden kodiert, das eine gepoolte Sonde für jeden Nicht-Nullwert von jeder Ziffer in den Nummern, die Varianten zugeordnet sind, umfaßt. Z. B. würde, wenn den Varianten aufeinanderfolgende Nummern in einem Nummerierungssystem mit der Basis m zugeordnet werden und die höchste einer Variante zugeordnete Nummer n Ziffern hat, ein Array etwa nx (m – 1) gepoolte Sonden aufweisen. Im allgemeinen sind logm (3N + 1) Sonden nötig, um alle Varianten von N Orten in einer Referenzsequenz zu analysieren, wobei jede Sonde drei mögliche mutierte Substitutionen aufweist. Z. B. können bei Benutzung eines binären kodierenden Systems 10 Basenpaare einer Sequenz mit nur 5 gepoolten Sonden analysiert werden. Jede gepoolte Sonde weist einen genau zu der Referenzsequenz komplementären Abschnitt auf, außer das bestimmte Positionen gepoolt sind. Der Abschnitt sollte ausreichend lang sein, um spezifische Hybridisierung der gepoolten Sonde mit der Referenzsequenz im Vergleich zu einer mutierten Form der Referenzsequenz zu erlauben. Wie in anderen Tilingstrategien sind Abschnitte mit der Länge von 9–21 Nukleotiden typisch. Oft weist die Sonde keine anderen Nukleotide als das 9–21er Nukleotidsegment auf. Die gepoolten Positionen umfassen Nukleotide, die der gepoolten Sonde erlauben, mit jeder Variante, die einem bestimmten Nicht-Nullwert in einer bestimmten Ziffer zugeordnet ist, zu hybridisieren. Normalerweise umfassen die gepoolten Positionen weiterhin ein Nukleotid, das der gepoolten Sonde erlaubt, mit der Referenzsequenz zu hybridisieren. Damit ist ein Wildtypziel (oder eine Referenzsequenz) sofort dadurch erkennbar, daß alle gepoolten Sonden aufleuchten.
  • Wenn ein Ziel mit den Pools hybridisiert wird, leuchten nur solche Pools auf, die eine Teilprobe umfassen, die einen genau zu dem Ziel komplementären Abschnitt aufweist. Die Identität des Ziels wird dann aus dem Muster der hybridisierenden Pools dekodiert. Jedes aufleuchtende Pool ist mit einem bestimmten wert in einer bestimmten Ziffer korreliert. Somit offenbart die Gesamtsumme der Hybridisierungsmuster jedes aufleuchtenden Pools den Wert von jeder Ziffer in dem Code, der die Identität des Ziels definiert, mit dem das Array hybridisert wird.
  • Als Beispiel stelle man sich eine Referenzsequenz vor, die 4 Positionen aufweist, von denen jede von drei möglichen Mutationen besetzt sein kann. Damit gibt es insgesamt 4 × 3 mögliche Variante Formen der Referenzsequenz. Jeder Variante wird eine binäre Nummer 0001-1100 und der Wildtypreferenzsequenz die Binärnummer 1111 zugeordnet.
  • Figure 00640001
  • Eine erste gepoolte Sonde wird entworfen, indem Sonden eingeschlossen werden, die genau komplementär zu jeder Variante sind, die eine 1 in der ersten Ziffer aufweisen.
  • Figure 00650001
  • Die zweiten, dritten und vierten gepoolten Sonden werden dann jeweils entworfen, so daß sie Teilsonden enthalten, die mit jeder Variante, die eine 1 in der zweiten, dritten und vierten Ziffer aufweist, hybridisieren.
  • Figure 00650002
  • Die gepoolten Sonden hybridisieren wie folgt mit Zielvarianten:
    Figure 00650003
  • Die Identität einer Zielvariante (d. h. Mutante) wird direkt aus dem Hybridisierungsmuster der gepoolten Sonden gelesen. Z. B. ergibt der der Nummer 0001 zugeordnete Mutante ein Hybridisierungsmuster von NNNY, jeweils in Bezug auf die Sonden 4, 3, 2 und 1, respektive.
  • In dem obigen Beispiel werden Varianten aufeinanderfolgende Nummern in einem Nummerierungssystem zugeordnet. In anderen Ausführungsformen können Sätze von Nummern wegen ihrer Eigenschaften ausgewählt werden. Wenn die Codewörter von einem Fehlerkontrollcode ausgewählt werden, gehen die Eigenschaften dieses Codes auf die Sequenzanalyse über. Ein Fehlercode ist ein Nummerierungssystem, in dem einigen Bezeichnungen Varianten zugeordnet sind und andere Bezeichnungen dazu dienen, Fehler, die im Hybridisierungsverfahren aufgetreten sind, aufzuzeigen. Z. B. kann, wenn alle Codewörter eine ungerade Zahl von Nicht-Nullziffern haben, ("binäre Kodierung + Fehlerdetektion") jeder einzelne Fehler bei der Hybridisierung detektiert werden, da eine gerade Anzahl von Pools aufleuchtet wird.
  • Figure 00660001
  • Eine 5. Sonde kann hinzugefügt werden, um die Anzahl von Pools, die mit jeder einzelnen Mutation hybridisieren, ungerade zu machen.
  • Pool 5(c): ATTGdhsmGTGCCC = 36 Sonden (2 × 2 × 3 × 3)
  • Hybridisierung der gepoolten Sonden an Ziele
    Figure 00670001
  • 9. Brückenstrategie
  • Sonden, die teilweise Übereinstimmungen mit zwei getrennten (d. h. nicht zusammenhängenden) Teilsequenzen einer Zielsequenz enthalten, hybridisieren oft stark mit der Zielsequenz. In einigen Fällen haben solche Sonden stärkere Signale generiert als Sonden der gleichen Länge, die perfekte Übereinstimmung zu der Zielsequenz zeigen. Es wird angenommen (ist aber nicht notwendig für die Erfindung), daß diese Beobachtung aus Wechselwirkungen einer einzigen Zielsequenz mit zwei oder mehr Sonden gleichzeitig resultiert. Diese Erfindung nutzt diese Beobachtung aus, um Arrays von Sonden bereitzustellen, die mindestens erste und zweite Abschnitte aufweisen, die jeweils komplementär zu ersten und zweiten Teilsequenzen einer Referenzsequenz sind. Optional kann die Sonde eine dritte oder mehr komplementäre Abschnitte aufweisen. Diese Sonden können in jeder der oben beschriebenen Strategien benutzt werden. Die zwei Abschnitte einer solchen Sonde können komplementär zu zerlegten Teilsequenzen der Referenzsequenz oder zusammenhängenden Teilsequenzen sein. Im späteren Fall sind die zwei Ab schnitte in der Sonde relativ zu der Reihenfolge der Komplementarität der Referenzsequenz invertiert. Die zwei Teilsequenzen der Referenzsequenz umfassen jeweils typischerweise etwa 3 bis 30 zusammenhängende Nukleotide. Die Teilsequenzen der Referenzsequenz sind manchmal durch 0, 1, 2, oder 3 Basen getrennt. Oft sind die Sequenzen benachbart und überlappen nicht.
  • Z. B. wird eine Wildtypsonde hergestellt, indem zwei Sektionen einer Referenzsequenz (bezeichnet durch Tiefstellung und Hochstellung) komplementär ergänzt werden und ihre Reihenfolge umgekehrt wird. Die Abfrageposition ist mit (*) bezeichnet und wird durch den Vergleich der Struktur der Wildtypsonde mit den drei mutierten Sonden klar. Das entsprechende Nukleotid der Referenzsequenz ist das "a" in dem hochgestellten Abschnitt.
  • Figure 00680001
  • Die erwarteten Hybridisierungen sind:
    Figure 00680002
  • Brückentilings werden unter Benutzung einer Bezugnahme bezeichnet, welche die Länge der zwei Bestandteile und die relative Position der Abfrageposition angibt. Die Bezeichnung "n/m" gibt einen Abschnitt komplementär zu einer Region der Referenzsequenz an, der sich über n Basen erstreckt und so lokalisiert ist, daß die Abfrageposition die mte Base von 5'Ende aus ist. Wenn m größer als b ist, gibt dies an, daß der ganze Abschnitt auf der 5' Seite der Abfrageposition ist. Wenn m negativ ist, gibt es an, daß die Abfrageposition der absolute Wert von m Basen 5' der ersten Base des Segments ist (m kann nicht 0 sein). Sonden, die mehrere Abschnitte umfassen, wie z. B. n/m + a/b + ... weisen einen ersten Abschnitt an dem 3'Ende der Sonde und zusätzliche Abschnitte, die in Bezug auf den 1. Abschnitt 5' hinzugefügt sind, auf. Z. B. besteht ein 4/8 Tiling aus einem komplementärem Abschnitt von 4 Basen (von dem 3'Ende der Sonde aus), der 7 Basen 5' der Abfrageposition anfängt, gefolgt von einer Region von 6 Basen in der die Abfrageposition an der 3. Base lokalisiert ist. Zwischen diesen zwei Abschnitte wird eine Base aus der Referenzsequenz ausgelassen. In dieser Notation ist der oben gezeigte Satz ein 5/3 + 5/8 Tiling. Viele verschiedene Tilings sind mit diesem Verfahren möglich, da die Länge beider Abschnitte variiert werden kann, genau wie ihre relative Position (sie können in jeder Reihenfolge sein und zwischen ihnen kann eine Lücke sein) und ihre Lokalisation in Bezug auf die Abfrageposition.
  • Als Beispiel wurde ein 16mer Oligoziel mit einem Chip, der alle 410 Sonden der Länge 10 enthält, hybridisiert. Der Chip schließt kurze Tilings sowohl von Standard als auch Brückentypen ein. Die Daten von einem Standard 10/5 Tiling wurden mit Daten von einem 5/3 + 5/8 Brückentiling verglichen (s. Tabelle 1). Sondenintensitäten (durchschnittliche Zählungen/Pixel) werden gemeinsam mit den Verhältnissen der Unterscheidung gezeigt (richtige Sondenintensität/höchste unrichtige Sondenintensität). Fehlende Intensitätswerte sind weniger als 50 Zählungen. Man beachte, daß für jede gezeigte Base das Brückentiling einen höheren Unterscheidungswert hat.
  • Tabelle 1: Vergleich von Standard und Brückentiling
    Figure 00700001
  • Die Brückenstrategie bietet die folgenden Vorteile:
    • (1) Größere Unterscheidung zwischen übereinstimmenden und nicht übereinstimmenden Sonden,
    • (2) die Möglichkeit, längere Sonden in einem Brückentiling zu verwenden, wodurch die Spezifität der Hybridisierung erhöht wird, ohne Unterscheidung zu opfern,
    • (3) die Verwendung von Sonden, in denen eine Abfrageposition sehr entfernt vom Zentrum in Bezug auf die Regionen der Komplementarität mit dem Ziel lokalisiert ist. Das kann von besonderem Vorteil sein, wenn, z. B., eine um eine Region des Ziel zentrierte Sonde ein geringes Hybridisierungssignal abgibt. Das geringe Signal wird überwunden, indem eine Sonde verwendet wird, die um eine benachbarte Region zentriert ist, die ein höheres Hybridisierungssignal ergibt.
    • (4) Die Unterbrechung von Sekundärstrukturen, die zur Anlagerung von bestimmten Sonden führen könnten (s. vorherige Diskussion von Helfermutationen).
  • 10. Deletionstiling
  • Deletionstiling ist sowohl mit Brücken- als auch Helfermutantenstrategien, die oben beschrieben sind, verwandt. Bei der Deletionstrategie werden Vergleiche zwischen Sonden durchgeführt, die eine gemeinsame Deletion teilen, sich aber voneinander an eine Abfragepositin, die außerhalb der Deletion lokalisiert ist, unterscheiden. Z. B. umfaßt eine Sonde erste und zweite Abschnitte, jeweils genau komplementär zu jeweiligen ersten und zweiten Teilsequenzen einer Referenzsequenz, wobei die ersten und zweiten Teilsequenzen der Referenzsequenz durch einen kleinen Abstand (z. B. ein oder zwei Nukleotide) getrennt sind. Die Reihenfolge der ersten und zweiten Abschnitte in der Sonde ist normalerweise die gleiche wie die Reihenfolge komplementär zu den ersten und zweiten Teilsequenzen in der Referenzsequenz. Die Abfrageposition ist normalerweise davon getrennt. Der Vergleich wird mit drei anderen Sonden durchgeführt, die identisch mit der ersten Sonde sind, außer an einer Abfrageposition, die in jeder Sonde unterschiedlich ist.
  • Referenz: ... AGTACCAGATCTCTAA ...
  • Sondensatz: CATGGNC AGRGA (N = Abfrageposition).
  • Solche Tilings bieten manchmal eine überlegene Unterscheidung der Hybridisierungsintensitäten zwischen der Sonde, die eine zu dem Ziel komplementäre Abfrageposition aufweist und anderen Sonden. Thermodynamisch ist der Unterschied zwischen der Hybridisierung mit übereinstimmenden oder nicht übereinstimmenden Zielen für den oben gezeigten Sondensatz der Unterschied zwischen der Aufwölbung einer einzelnen Base und einer großen asymmetrischen Schleife (z. B. 2 Basen des Ziels, eine der Sonde). Dies führt oft zu einem größeren Unterschied in der Stabilität als der Vergleich einer perfekt übereinstimmenden Sonde mit einer Sonde, die eine Nichtübereinstimmung einer Base in der grundlegenden Tiling-Strategie zeigt.
  • Die überlegene Unterscheidung, die Deletionstiling bietet, wird durch Tabelle 2 erläutert, die Hybridisierungsdaten eines Stan dard 10/5 Tilings mit einem (4/8 + 6/3) Deletionstiling der Referenzsequenz vergleicht. (Die Numeratoren geben die Länge der Abschnitte an und die Denominatoren den Abstand der Deletion von dem weiter entfernten Ende des Abschnitts). Die Sondenintensitäten (durchschnittliche Zählungen/Pixel) sind neben den Verhältnissen der Unterscheidung angegeben (richtige Sondenintensität/höchste nicht richtige Sondenintensität). Man beachte, dass für jede gezeigte Phase das Deletions-Tiling eine höheren Unterscheidungswert als jedes der gezeigten Standard-Tilings hat.
  • Tabelle 2. Vergleich von Standard- und Deletions-Tiling
    Figure 00720001
  • Die Verwendung von Deletions- oder Brückensonden ist recht allgemein. Diese Sonden können in jeder der Tiling-Strategien der Erfindung genutzt werden. Sie bieten nicht nur überlegene Unterscheidung, die Benutzung von Deletions- oder Brückenstrategien ist auch vorteilhaft für bestimmte Sonden, um Selbsthybridisierung zu vermeiden (entweder innerhalb einer Sonde oder zwischen zwei Sonden der gleichen Sequenz).
  • C. Herstellung von Zielproben
  • Das Zielnukleotid, dessen Sequenz bestimmt werden soll, wird normalerweise aus einer Gewebeprobe isoliert. Wenn das Ziel genomisch ist, kann die Probe von jedem Gewebe stammen (außer ausschließlich rote Blutkörperchen). Zum Beispiel sind ganzes Blut, periphere Blutlymphozyten oder PBMC, Haut, Haare oder Samen bequeme Quellen für klinische Proben. Diese Quellen sind auch geeignet, wenn das Ziel RNA ist. Blut und andere Körperflüssigkeiten sind auch bequeme Quellen für die Isolierung von viralen Nukleinsäuren. Wenn das Ziel mRNA ist, wird die Probe von einem Gewebe erhalten, in dem die mRNA exprimiert wird. Wenn das Polynukleotid der Probe RNA ist, wird es normalerweise durch Reverse Transkription in DNA überführt. DNA-Proben oder durch Reverse Transkription erhaltene cDNA werden normalerweise amplifiziert, z. B. durch PCR. Abhängig von der Auswahl der Primer und amplifizierenden Enzyms (Enzyme), kann das Amplifizierungsprodukt RNA oder DNA sein. Paarweise Primer werden ausgewählt, um die Grenzen eines Zielnukleotids von Interesse zu flankieren. Mehr als ein Ziel kann gleichzeitig durch Multiplex-PCR amplifiziert werden, in der multiple paarweise Primer genutzt werden. Das Ziel kann an einem oder mehreren Nukleotiden während oder nach der Amplifizierung markiert werden. Für manche Zielnukleotide (abhängig von der Größe der Probe), z. B. episomale DNA, ist ausreichend DNA in der Gewebeprobe vorhanden, um ohne den Amplifizierungsschritt auszukommen.
  • Wenn der Zielstrang, wie bei der Herstellung von Ziel-RNA, in einzelsträngiger Form hergestellt wird, sollte der Sinn des Stranges selbstverständlich komplementär zu dem der Sonden auf dem Chip sein. Dies wird durch eine angemessene Auswahl von Primern erreicht. Das Ziel wird bevorzugt vor der Applikation auf den Chip fragmentiert, um die Bildung von Sekundärstrukturen in dem Ziel zu reduzieren oder eliminieren. Die durchschnittliche Größe von Zielabschnitten nach der Hybridisierung ist normalerweise größer als die Größe der Sonde auf dem Chip.
  • II. Veranschaulichende Chips
  • A. HIV Chip
  • HIV hat eine große und sich vergrößernde Zahl von Menschen infiziert, was zu massiven Kosten im Gesundheitswesen führt. HIV kann schnell resistent gegen Wirkstoffe werden, die zur Behandlung der Infektion verwendet werden, vor allem wegen der Wirkung des heterodimeren Proteins (51 kDa und 66 kDa) HIV Reverse Transkriptase (RT), dessen beide Untereinheiten von dem 1,7 kp pol Gen kodiert werden. Man glaubt, dass die hohe Fehlerrate (5–10 pro Runde) des RT-Proteins für die Hypermutabilität von HIV verantwortlich ist. Die Nukleosidanaloga, d. h. AZT, ddI, ddC und d4T, die im allgemeinen verwendet werden um HIV-Infektion zu behandeln, werden in dem Cytoplasma von infizierten Zellen durch sequenzielle Phosphorylierung in Nukleotidanaloga umgewandelt, wobei Einbau des Analogons in virale DNA zur Termination der viralen Replikation führt, da die 5' -> 3' Phosphodiesterbindung nicht vervollständigt werden kann. Nach etwa 6 Monaten bis einem Jahr der Behandlung oder weniger, mutiert HIV jedoch typischerweise das RT-Gen, so dass es unfähig wird, das Analogon einzubauen und damit resistent gegen die Behandlung wird. Verschiedene Mutationen, von denen bekannt ist, dass sie mit der Wirkstoffresistenz assoziiert sind, sind in der Tabelle unten gezeigt. Nachdem ein Virus, das durch Mutation eine Wirkstoffresistenz hat, vorherrschend wird, leidet der Patient an dramatisch erhöhter viraler Last, sich verschlechternden Symthomen (typischerweise häufigere und schwer zu behandelnde Infektionen), und letztendlich Tod. Der Wechsel zu einer unterschiedlichen Behandlungsform, sobald ein resistenter mutierter Virus sich durchsetzt, kann ein wichtiger Schritt im Patientenmanagement sein, der das Leben des Patienten verlängert und die Morbidität während des Lebens verringert.
  • Tabelle 3 Einige mit der Wirkstoffresistenz assoziierte RT-Mutationen
    Figure 00750001
  • Zu beachten: Andere Mutationen verleihen Resistenz gegen andere Wirkstoffe.
  • Ein weiteres wichtiges therapeutisches Ziel für Anti-HIV-Wirkstoffe ist das Aspartylproteaseenzym, das im HIV-Genom kodiert ist, dessen Funktion für die Bildung von infektiösen Nachkommen benötigt wird. Siehe Robbins & Plattner, J. Acquired Immune Dificiency Syndromes 6, 162–170 (1993); Kozal et al., Curr. Op. Infect. Dis. 7: 72–81 (1994). Die Protease wirkt bei der Prozessierung von viralen Precursor-Polypeptiden zu ihrer aktiven Form. Wirkstoffe, die gegen dieses Enzym gerichtet sind, hemmen keine endogenen humanen Proteasen, wodurch ein hoher Grad der selektiven Toxizität erreicht wird. Darüber hinaus wird die Protease während des Lebenszyklus später als die Reverse Transkriptase exprimiert, und bietet damit die Möglichkeit einer kombinierten Attacke auf HIV an zwei unterschiedlichen Zeiten in seinem Lebenszyklus. Wie bei Wirkstoffen, die gegen die Reverse Transkriptase gerichtet sind, kann die Administration von Wirkstoffen gegen die Protease zu dem Erwerb von Wirkstoffresistenz durch Mutation der Protease führen. Durch Überwachung des Proteasegens von Patienten ist es möglich, das Auftreten von Mutationen zu detektieren und dadurch angemessene Anpassung bei den (m) angewendeten Wirkstoff(en) durchzuführen.
  • Zusätzlich zu der Infektion mit HIV sind Aidspatienten oft auch mit einer großen Vielfalt von anderen infektiösen Agentien infiziert, was zu einer komplexen Folge von Symthomen führt. Oft sind Diagnose und Behandlung schwierig, da viele verschiedene Pathogene (manche lebensbedrohlich, andere Routine) ähnliche Symptome bewirken. Manche dieser Infektionen, sogenannte opportunistische Infektionen, werden durch bakterielle, fungale, protozoische oder virale Pathogene verursacht, die normalerweise in kleinen Mengen in dem Körper vorhanden sind, aber durch das Immunsystem in Schach gehalten werden. Wenn das Immunsystem in Aidspatienten versagt, können diese normalerweise latente Pathogene wachsen und ungezügelte Infektionen hervorbringen. Bei der Behandlung solcher Patienten wäre es wünschenswert, gleichzeitig die Anwesenheit oder Abwesenheit einer Auswahl der tödlichsten allgemein vorkommenden Infektionen und das effektivste therapeutische System gegen HIV Virus zu bestimmen, und den Gesamtstatus der Infektion des Patienten zu überwachen.
  • Die vorliegende Erfindung stellt DNA-Chips bereit, um die multiplen Mutationen in HIV-Genen, die mit Resistenz gegen unterschiedliche Medikamente assoziiert sind, zu detektieren. Diese DNA-Chips erlauben es Ärzten, die Mutationen über die Zeit hinweg zu überwachen und Therapeutika zu wechseln, wenn sich Resistenz entwickelt. Manche Chips stellen auch Sonden für die Diagnose von pathogenen Mikroorganismen bereit, die typischerweise in Aidspatienten auftreten.
  • Die als Referenzsequenz ausgewählte Sequenz kann von einem beliebigen Ort in dem HIV-Genom stammen, sollte aber bevorzugt eine Region des HIV-Genoms umfassen, in der mit Wirkstoffresistenz assoziierte Mutationen bekanntermaßen auftreten. Eine Referenzsequenz ist normalerweise zwischen etwa 5, 10, 20, 50, 100, 5000, 1000, 5000 oder 10000 Basen lang, und ist bevorzugt etwa 100–1700 Basen lang. Manche Referenzsequenzen umschließen mindestens einen Teil der Reverse Transkriptase-Sequenz, die durch das Pol-Gen kodiert wird. Bevorzugt umfasst die Referenzsequenz die Gesamtheit, oder im wesentlichen die Gesamtheit (d. h. etwa 75 oder 90%) des Reverse Transkriptase-Gens. Reverse Transkriptase ist das Ziel von mehreren Wirkstoffen und die kodierende Sequenz ist – wie oben erwähnt – der Ort von vielen Mutationen, die mit Wirkstoffresistenz assoziiert sind. Auf manchen Chips enthält die Referenzsequenz die gesamte Region, die Reverse Transkriptase kodiert (850 bp), und auf anderen Chips Unterfragmente davon. Auf manchen Chips schließt die Referenzsequenz andere Teilfragmente des Pol-Gens ein, die HIV-Protease oder Endonuklease kodieren, anstelle von oder zusätzlich zu dem Abschnitt, der Reverse Transkriptase kodiert. Auf manchen Chips schließt die Referenzsequenz auch andere HIV-Gene wie env oder gag ein, genauso wie oder anstelle von dem Reverse Transkriptase-Gen. Bestimmte Regionen der gag- und env- Gene sind relativ gut konserviert, und ihre Detektion stellt ein Mittel für die Identifizierung und Quantifizierung der Menge von HIV bereit, die einen Patienten infiziert. Auf manchen Chips umfasst die Referenzsequenz ein ganzes HIV-Genom.
  • Es ist nicht kritisch, von welchem Stamm von HIV die Referenzsequenz erhalten wurde. HIV-Stämme werden als HIV-I, HIV-II oder HIV-III klassifiziert, und innerhalb dieser allgemeinen Gruppierungen gibt es mehrere Stämme und polymorphe Varianten von jedem davon. BRU, SF2, HXB2 und HXB2R sind Beispiele für HIV-I-Stämme, deren Sequenzen von Genbank erhältlich sind. Die Reverse Transkriptase-Gene der BRU- und SF2-Stämme unterscheiden sich in 23 Nukleotiden. Die HXB2- und HXB2R-Stämme weisen die gleiche Reverse Transkriptase-Gensequenz auf, welche sich von der des BRU-Stammes in vier Nukleotiden unterscheidet, und von der von SF2 in 27 Nukleotiden. Auf manchen Chips entspricht die Referenzsequenz genau der Reverse Transkriptase-Sequenz der Wildtyp-Version eines Stammes. Auf anderen Chips entspricht die Referenzsequenz einer Consensus-Sequenz von mehreren HIV-Stämmen. Auf manchen Chips entspricht die Referenzsequenz einer mutierten Form eines HIV-Stammes.
  • Chips werden entsprechend der oben beschriebenen Tiling-Strategien entworfen. Die Sonden sind entworfen, um entweder zu dem kodierenden oder nicht kodierenden Strang der HIV-Referenzsequenz komplementär zu sein. wenn nur ein Strang gelesen werden soll, ist es bevorzugt, den kodierenden Strang zu lesen. Der größere Anteil von A-Resten in diesem Strang im Vergleich zu dem nicht kodierenden Strang ergibt im Allgemeinen weniger Regionen mit mehrdeutiger Sequenz.
  • Einige Chips enthalten zusätzliche Sonden oder Gruppen von Sonden, die entworfen sind, um zu einer zweiten Referenzsequenz komplementär zu sein. Diese zweite Referenzsequenz ist oft eine Teilsequenz der ersten Referenzsequenz, die eine oder mehrere häufig vorkommende HIV-Mutationen oder Variationen zwischen den Stämmen trägt (z. B. in Codons 67, 70, 215 oder 219 des Reverse Transkriptase-Gens). Der Einschluss einer zweiten Gruppe ist besonders nützlich für die Analyse von kurzen Teilsequenzen der primären Referenzsequenz, in denen das Auftreten von mehreren Mutationen innerhalb einer kurzen Entfernung, die die gleiche Länge wie die Länge der Sonde misst (d. h. zwei oder mehr Mutationen innerhalb von 9–21 Basen) vermutet wird.
  • Die absolute Zahl der Sonden auf dem Chip hängt von der Tiling-Strategie, der Länge der Referenzsequenz und der in Bezug auf den Einschluss von mehreren Sondenlängen und sekundären Gruppen von Sonden, um Belege für die Existenz von häufigen Mutationen bereitzustellen, ausgewählten Möglichkeiten ab. Um einen Großteil oder die Gesamtheit des HIV Reverse Transkriptase-Gens (857 b für den BRU-Stamm) zu lesen, enthalten Chips für das Tiling mit der grundlegenden Strategie typischerweise mindestens 857 × 4 = 3428 Sonden.
  • Das Ziel-HIV-Polynukleotid, dessen Sequenz bestimmt werden soll, wird normalerweise aus Blutproben (periphere Blutlymphocyten oder PBMC) in der Form von RNA isoliert. Die RNA wird zu DNA revers transkribiert und das DNA-Produkt wird dann amplifiziert. Abhängig von der Auswahl der Primer und des amplifizierenden Enzyms kann das Amplifizierungsprodukt RNA oder DNA sein. Passende Primer für die Amplifizierung des Ziels sind in der Tabelle unten gezeigt.
  • Tabelle 4 Amplifizierung von Ziel
    Figure 00790001
  • Figure 00800001
  • In einem anderen Aspekt der Erfindung werden Chips für die gleichzeitige Detektion von HIV und Mikroorganismen, die häufig bei Aidspatienten parasitieren, bereitgestellt (z. B. Cytalo megalovirus (CMV), Pneumocystis Carini (PCP), Fungi (Candida albicans), Mykobakteria). Nicht HIV-virale Pathogene werden detektiert und ihre Wirkstoffresistenz unter Benutzung einer ähnlichen Strategie wie für HIV bestimmt. Das heißt, daß Gruppen von Sonden dafür angepaßt sind, Komplementarität zu einer Zielsequenz aus einer Region des Genom eines nichtviralen Pathogens zu zeigen, von dem bekannt ist, daß es mit dem Erwerb von Wirkstoffresistenz assoziiert ist. Z. B. unterliegen CMV und HSV Viren, die oft in AIDS Patienten coparasitieren, Mutationen, um Resistenz gegen Acyclovir zu erwerben.
  • Für die Detektion von nichtviralen Pathogenen enthalten die Chips ein Array aus Sonden, die die Bestimmung der vollständigen Sequenz von 16S ribosomaler RNA oder entsprechender genomischer DNA des Pathogens erlauben. Die zusätzlichen Sonden sind nach den gleichen, oben beschriebenen Grundsätzen entworfen, außer daß die Zielsequenz eine variable Region von der 16S RNA (oder entsprechenden DNA) eines pathogenen Mikroorganismus ist. Alternativ kann die Zielsequenz eine Consensus-Sequenz von variablen 16S rRNA Regionen von mehreren Organismen sein. 16S ribosomale DNA und RNA liegt in allen Organismen vor (außer Viren) und die Sequenz der DNA oder RNA hat eine enge Beziehung zu der evolutionären genetischen Entfernung zwischen jeder von zwei Spezies. Somit teilen Organismen die recht nahe in ihrer Art sind (z. B. alle Mycobakterien) eine gemeinsame Region der 16S rDNA und unterscheiden sich in anderen Regionen (variable Regionen) der 16S rRNA. Diese Unterschiede können ausgenutzt werden, um die Identifizierung von unterschiedlichen Unterarten-Stämmen zu erlauben. Die volle Sequenz der 16S ribosomalen RNA oder DNA, die von dem Chip abgelesen wird, wird mit einer Datenbank der Sequenz von tausenden von bekannten Pathogenen verglichen, um unzweideutig die meisten nicht viralen Pathogene, die AIDS Patienten infizieren, zu typisieren.
  • In einer weiteren Ausführungsform stellt die Erfindung Chips bereit, die auch Sonden für die Detektion von bakteriellen Genen, die Antibiotikaresistenz verleihen, enthalten. Ein Antibiotikaresistenz-Gen kann durch Hybridisierung mit einer einzigen Sonde detektiert werden, die in einem reversen Dot Blot Format benutzt wird. Alternativ kann eine Gruppe von Sonden nach den gleichen, oben diskutierten Grundsätzen entworfen werden, um die Gesamtheit oder einen Teil der DNA Sequenz, die für ein Antibiotikaresistenz-Gen kodiert, zu lesen. Analoge Sondengruppen werden für das Lesen von anderen Antibiotikaresistenz-Genen entworfen. Antibiotikaresistenz liegt oft in einem von den folgenden Genen in Mikroorganismen, die AIDS Patienten coparasitieren, begründet: rpoB (kodierend für RNA Polymerase), KatG (kodierend für Katalase Peroxidase) und DNA Girase A und B Gene.
  • Der Einschluß von Sonden für Kombinationen von Tests auf einem einzigen Chip simuliert den klinischen Diagnosebaum, dem ein Arzt basierend auf der Präsentation eines gegebenen Syndroms folgen würde, das durch jegliche Zahl von möglichen Pathogenen verursacht sein könnte. Solche Chips erlauben die Identifizierung der Anwesenheit und des Titers von HIV in einem Patienten, die Identifizierung des HIV Stammtyps und von Wirkstoffresistenz, die Identifizierung von opportunistischen Pathogenen und die Identifizierung von Wirkstoffresistenz solcher Pathogene. Damit wird der Arzt gleichzeitig von dem vollen Spektrum der den Patienten infizierenden Pathogene und den effektivsten Behandlungen dafür in Kenntnis gesetzt.
  • Beispielhafte HIV Chips
  • (a) HV273
  • Der HV273 Chip enthält ein Array aus Oligonukleotidsonden für die Analyse eines 857 Basen HIV Amplicons zwischen den Nukleotiden 2090 und 2946 (HIB BRU Stamm-Nummerierung). Der Chip enthält vier Gruppen von Sonden: 11mere, 13mere, 15mere und 17mere. von oben nach unten ist der HV 273 Chip von Reihen von 11meren, gefolgt von Reihen von 13meren, gefolgt von Reihen von 15meren, gefolgt von Reihen von 17meren besetzt. Die Abfrageposition ist jeweils Nukleotid 6, 7, 8, und 9 in den unterschiedlich großen Chips. Dieses Arrangement der unterschiedlich großen Sonden wird als "in Serie" bezeichnet. Innerhalb jeder Größengruppe gibt es vier Sondensätze, die in einer A-Zeile, einer C-Zeile, einer G-Zeile und einer T-Zeile angeordnet sind. Jede Zeile enthält einer überlappende Folge von Sonden mit einer Sonde für jedes Nukleotid in der 2090–2946 HIV Reverse Transkriptase Referenzsequenz (d. h. 857 Sonden pro Zeile). Die Zeilen enthalten auch einige Spaltenpositionen, die leer oder von Kontrollsonden besetzt sind. Diese Positionen dienen dazu, den Chip zu orientieren, die Hintergrundfluoreszenz zu bestimmen und unterschiedliche Teilsequenzen innerhalb des Ziels zu unterbrechen. Der Chip hat eine Fläche von 1,28 × 1,28 cm, innerhalb der die Sonden eine 130 × 135 Matrix ausbilden (17550 Zellen insgesamt). Die von jeder Sonde (d. h. einer Sondenzelle) besetzte Fläche ist etwa 98 × 95 μ groß.
  • Der Chip wurde auf seine Fähigkeit getestet, ein Reverse Transkriptase Fragment des HIV Stammes SF2 zu sequenzieren. Ein 831 by RNA Fragment (pPol19 genannt), das den Großteil der HIV Reserve Transkriptase kodierenden Sequenz umspannt, wurde durch PCR amplifiziert, wobei mit T3 und T7 Promotersequenzen verbundene Primer genutzt wurden. Die Primer, bezeichnet als RT#$1-T3 und 89-391 T7 sind in Tabelle 4 gezeigt; s. auch Gingeras et al., J. Infl. Dis. 164, 1066–1074 (1991). RNA wurde durch den Einbau von fluoreszierenden Nukleotiden markiert. Die RNA wurde durch Erhitzen fragmentiert und für 40 Minuten bei 30° mit dem Chip hybridisert. Hybridisierungssignale wurden durch Fluoreszenzimaging quantifiziert.
  • Indem die besten Daten der vier Sondensätze bei jeder Position in der Zielsequenz verwendet wurden, wurden 715 von 821 Basen korrekt gelesen (87%). (Vergleiche basieren auf der durch konventionelle Dideoxyverfahren als identisch mit SF2 bestimmten Sequenz von pPol19). Im allgemeinen ergaben die Sonden längerer Größe mehr Sequenz als die kürzeren Sonden. Von den 21 Positionen, an denen der SF2 und BRU Stamm sich innerhalb des Ziels unterscheiden, wurden 19 korrekt gelesen.
  • Viele der kurzen mehrdeutigen Regionen in dem Ziel entstehen in Abschnitten des Ziels, die die Punkte, an denen SF2 und BRU Sequenzen sich unterscheiden, flankieren. Diese Mehrdeutigkeiten entstehen, weil in diesen Regionen der Vergleich der Hybridisierungssignale nicht zwischen perfekt übereinstimmenden und in einer Base nicht übereinstimmenden Sonden, sondern zwischen einer in einfach nicht übereinstimmenden Sonde und 3 Sonden mit 2 Nichtübereinstimmungen gezogen wird. Diese Mehrdeutigkeiten beim Lesen einer SF2 Sequenz würden die Fähigkeit des Chips, eine BRU Sequenz entweder alleine oder in der Mischung mit einer SF2 Zielsequenz zu lesen, nicht vermindern.
  • In einer Abwandlung des obigen Verfahrens wurde der Chip nach der Hybridisierung des pPol19 Ziels mit den Sonden mit RNase behandelt. Das Hinzufügen der RNase verdaut nichtübereinstimmendes Ziel und vergrößert damit das Verhältnis von Signal zu Hintergrundrauschen. Die Behandlung mit RNase vergrößerte die Zahl der korrekt gelesenen Basen zu 743 von 821 oder 90% (wobei die Daten von den vier Gruppen von Sonden kombiniert wurden).
  • In einer weiteren Abwandlung wurde das RNA Ziel durch ein DNA Ziel, das den gleichen Abschnitt des HIV Genoms enthält, ersetzt. Die DNA Sonde wurde durch lineare Amplifikation unter Benutzung von Taq Polymerase, RT#1-T3 Primer und Fluorescein-dUTP Markierung hergestellt. Die DNA Sonde wurde mit Uracil-DNA-Glykosylase und Hitzebehandlung fragmentiert. Das Hybridisierungsmuster auf dem Array und der Prozentsatz der lesbaren Sequenz waren ähnlich zu den mit einem RNA Ziel erhaltenen. Es gab jedoch wenige Sequenzregionen, die von dem RNA Ziel abgelesen werden konnten, die nicht mit dem DNA Ziel abgelesen werden konnten, und umgekehrt.
  • (b) HV 407 Chip
  • Der 407 Chip wurde nach den gleichen Grundsätzen wie der HV 273 Chip entworfen, unterscheidet sich aber in mehreren Aspekten. 1. sind die Oligonukleotidsonden auf diesem Chip entworfen, um perfekte Sequenzidentität (mit der Ausnahme der Abfragepositionen bei jeder Sonde) zu dem HIV Stamm SF2 zu zeigen (statt mit dem BRU Stamm, wie es der Fall für den HV273 Chip war). 2. enthält der 407 Chip 13mere, 15mere, 17mere und 19 mere (mit Abfragepositionen jeweils an Nukleotid 7, 8, 9 und 10), anstelle der 11mere, 13mere, 15mere und 17mere auf den HV273 Chip. 3. sind die unterschiedlich großen Gruppen von Oligomeren parallel angeordnet anstelle von der in Serie Anordnung auf dem HV273 Chip. In der parallelen Anordnung enthält der Chip von oben nach unten eine Reihe von 13meren, eine Reihe von 15meren, eine Reihe von 17meren, eine Reihe von 19 meren, gefolgt von einer weiteren Reihe von 13meren, einer Reihe von 15meren, einer Reihe von 17meren, einer Reihe von 19meren, gefolgt von einer Reihe von 13meren usw. Jede Reihe enthält 4 Zeilen von Sonden, eine A Zeile, eine C Zeile, eine G Zeile und eine T Zeile, wie oben beschrieben. Die Sonden in jeder Zeile sind für das Tiling über die Referenzsequenz angepaßt. Das Layout der Sonden auf dem HV 407 Chip ist in 10 gezeigt.
  • Der 407 Chip wurde getrennt auf seine Fähigkeit, zwei Ziele zu sequenzieren, getestet, pPol19 RNA und 4MUT18 RNA. pPol19 enthält ein 831 by Fragment des SF2 Reverse Transkriptase Gens, das perfekte Komplementärität zu den Sonden auf dem 407 Chip aufweist (außer selbstverständlich an den Abfragepositionen in 3 der Sonden in jeder Spalte). 4MUT18 unterscheidet sich von der Referenzsequenz an 31 Positionen innerhalb des Ziels, einschließlich 5 Positionen in den Kodons 67, 70, 215 und 219, die mit dem Erwerb von Wirkstoffresistenz assoziiert sind. Ziel RNA wurde wie oben beschrieben hergestellt, markiert und fragmentiert und mit dem HV 407 Chip hybridisiert. Das Hybridisierungsmuster für das pPol19 Ziel ist in 11 gezeigt.
  • Die für die pPol19 und 4MUT18 Ziele von dem Chip abgelesenen Sequenzen sind beide in 12 gezeigt (obwohl die zwei Sequenzen in unterschiedlichen Experimenten bestimmt wurden). Die in der Abbildung als Wildtyp markierte Sequenz ist die Referenzsequenz. Die vier Zeilen der Sequenz direkt unter der Referenzsequenz sind die jeweils von den vier nach Größen geordneten Gruppen von Sonden für das pPol19 Ziel gelesenen Sequenzen (von oben nach unte 13mere, 15mere, 17mere und 19mere). Die nächsten vier Sequenzzeilen sind die von den vier nach Größe geordneten Gruppen von Sonden für das 4MUT18 Ziel gelesenen Sequenzen (von oben nach unten in der gleichen Reihenfolge). Die in normalem Schriftsatz gezeigten Sequenzregionen sind jene, die unmehrdeutig von dem Chip gelesen werden konnten. Regionen, in denen die Sequenz nicht genau gelesen werden konnte, sind hervorgehoben. Einige Sequenzregionen, die nicht von einem Sondensatz mit einer Größe gelesen werden konnten, konnten von einem anderen gelesen werden.
  • Bei Verwendung der besten Ergebnisse von den vier nach Größen geordneten Gruppen von Sonden an jeder Spaltenposition wurden etwa 97% der Basen in der pPol19 Sequenz und etwa 90% der Basen in der 4MUT18 Sequenz genau gelesen. Von dem Unterschied von 31 Nukleotiden zwischen 4MUT18 und der Referenzsequenz wurden 27 korrekt gelesen, einschließlich 3 der Nukleotidaustausche, die mit dem Erwerb der Wirkstoffresistenz assoziiert sind. Die meisten der mehrdeutigen Regionen in der 4MUT18 Sequenzbestimmung traten in den 4MUT18 Abschnitten auf, die zwischen der 4MUT18 und Referenzsequenz abweichende Punkte flankieren. Bemerkenswerterweise treten die meisten der häufigen Mutationen in HIV Reverse Transkriptase, die mit Wirkstoffresistenz assoziiert sind (s. Tabelle 3) an Sequenzpositionen auf, die von dem Chip gelesen werden können. Damit können die meisten der häufig auftretenden Mutationen mit einem Chip detektiert werden, der ein Array aus Sonden basierend auf einer einzigen Referenzsequenz enthält.
  • Der Vergleich der von Sonden unterschiedlicher Größe abgelesenen Sequenz ist nützlich bei der Bestimmung von Sonden optimaler Größe, die für verschiedene Regionen des Ziel verwendet werden. Die Strategie, innerhalb einer einzelnen Gruppe von Sondensätzen die Sondenlänge anzupassen, minimiert die Gesamtzahl von Sonden, die notwendig ist, eine bestimmte Zielsequenz zu lesen. Dies läßt dem Chip viel Kapazität, Sonden für andere Referenzsequenzen (z. B. 16S RNA für pathogene Mikroorganismen), wie unten diskutiert, zu beinhalten.
  • Der HV 407 Chip wurde auch auf seine Fähigkeit getestet, Mischungen von unterschiedlichen HIV Stämmen zu bestimmen. Die Mischung umfaßt variierende Anteile von zwei Zielsequenzen; eine einen Abschnitt eines Reverser Transkriptase-Gens von einem Wildtyp SF2 Stamm, die andere einen entsprechenden Abschnitt von einem SF2 Stamm, der eine Kodon 67 Mutation trägt. s. 13. Die Abbildung stellt auch die Sonden auf dem Chip dar, die eine Abfrageposition zum Lesen des Nukleotids, in dem die Mutation auftritt, aufweisen. Eine einzige Sonde in der Abbildung repräsentiert 4 Sonden auf dem Chip, wobei das Symbol (o) die Abfrageposition kennzeichnet, die sich in jeder der vier Sonden unterscheidet. 14 zeigt die Fluoreszenzintensität für die vier 13mere und die vier 15mere, die eine Abfrageposition zum Lesen des Nukleotids in der Zielsequenz, an dem die Mutation auftritt, aufweisen. Wo der Prozentsatz des mutivierten Ziels zunimmt, nimmt die Fluoreszenzintensität der Sonde, die perfekte Komplementarität mit dem Wildtypziel aufweist, ab, und die Intensität der Sonde, die perfekte Komplementarität zu der mutierten Sequenz aufweist, nimmt zu. Die Intensitäten der anderen 2 Sonden verändern sich nicht merklich. Daraus wird geschlossen, daß der Chip verwendet werden kann, um gleichzeitig eine Mischung von Stämmen zu analysieren, und daß ein Stamm, der nur 10% einer Mischung umfaßt, leicht detektiert werden kann.
  • C. Protease Chip
  • Ein Proteasechip wurde unter Benutzung der grundlegenden Tiling Strategie konstruiert. Der Chip um faßt 4 Sonden für das Tiling über eine Spanne von 382 Nukleotiden, einschließlich 297 Nukleotiden der Protease-kodierenden Sequenz. Die Referenzsequenz war eine Consensus Clay-B HIV Proteasesequenz. Unterschiedliche Sondenlängen wurde für das Tiling unterschiedlicher Regionen der Referenzsequenz genutzt. Die Sondenlängen waren 11, 14, 17 und 20 Nukleotide mit Abfragepositionen an oder benachbart zu dem Zentrum jeder Sonde. Die Längen waren nach vorherigen Hybridisierungsdaten optimiert, bei denen ein Chip mit mehreren Tilings, jedes mit einer unterschiedlichen Sondenlänge, benutzt wurde.
  • Der Chip wurde mit 4 unterschiedlichen einzelsträngigen DNA Protease Zielsequenzen hybridisert (HXB2, SF2, NY5, pPol4mutl8). Sowohl Sense- als auch Antisense-Stränge wurden sequenziert. Daten von dem Chip wurden mit jenen von einem ABI Sequenziergerät verglichen. Die Gesamtgenauigkeit der Sequenzierung der 4 Ziele ist in der Tabelle 5 unten erläutert. Tabelle 5
    Figure 00880001
  • ABI (Sense)
    99,5%
    Chip (Sense)
    98,1%
    ABI (Antisense)
    98,6%
    Chip (Antisense)
    99,1%
  • Die Kombination der Daten von Sense und Antisense-Strängen, sowohl von Chip und ABI Sequenzierungsgerät stellt für alle Sequenzen von allen 4 Klonen 100% genaue Daten zur Verfügung.
  • In einem weiteren Test wurde der Chip mit Protease-Zielsequenzen aus viralen Isolaten, die von 4 Patienten vor und nach ddI Behandlung erhalten wurden, hybridisiert. Die von dem Chip gelesene Sequenz ist in 15 gezeigt. Mehrere Mutationen (markiert durch Pfeile) sind in den nach der Behandlung erhaltenen Proben entstanden. Besonders bemerkenswert war die Fähigkeit des Chips, eine g/a Mutation an dem Nukleotid 207 zu lesen, trotz der Anwesenheit von 2 zusätzlichen Mutationen (gt) in benachbarten Positionen.
  • B. Cystische Fibrose-Chips
  • Vor einigen Jahren wurde gezeigt, daß cystische Fibrose, die häufigste ernste autosomal rezessive Störung bei Menschen, mit Mutationen in einem Gen, das danach als Cystic Fibrosis Transmembrane Conductance Regulator (CFTR) Gen bezeichnet wurde, assoziiert ist. Das CFTR Gen hat eine Größe von etwa 250 kb und weist 27 Exons auf. Die Wildtyp genomische Sequenz ist für alle Exon-Regionen und Exon/Intron Grenzen erhältlich (Zielensky et al., Genomics 10, 214–228 (1991). The ganze Länge der Wildtyp cDNA Sequenz wurde auch beschrieben (s. Riordan et al., Science 245, 1069–1065 (1989). Mehr als 400 Mutationen wurden kartiert (s. Tsui et al., Hu. Mutat. 1, 197–203 (1992). Viele der häufigeren Mutationen sind in Tabelle 6 gezeigt. Die häufigste Mutation bei cystischer Fibrose ist eine 3 Basen-Deletion, die zur Auslassung der Aminosäure #508 des CFTR Proteins führt. Die Frequenz von Mutationen unterscheidet sich stark in Populationen von unterschiedlicher geographischer oder ethnischer Abstammung (s. Spalte 4 von Tabelle 6). Etwa 90% von allen Mutationen mit phänotypischen Auswirkungen treten in kodierenden Regionen auf.
  • Die Detektion von CFTR Mutationen ist in mehreren Beziehungen nützlich. z. B. kann die Reihenuntersuchung von Populationen asymptomatische heterozygote Individuen identifizieren. Solche Individuen tragen das Risiko, betroffene Nachkommen zu verursachen, die an cystischer Fibrose leiden, wenn sie sich mit anderen solchen Individuen reproduzieren. In utero Reihenuntersuchung von Feten ist auch nützlich zur Identifizierung von Feten, die zwei CFTR Mutationen tragen. Die Identifizierung solcher Mutationen bietet die Möglichkeit der Abtreibung oder Gentherapie. Bei Paaren, bei denen bekannt ist, daß sie das Risiko haben, betroffene Nachkommenschaft zu verursachen, kann die Diagnose mit in vitro Reproduktionsverfahren kombiniert werden, um vor der Implantation einen Embryo zu identifizieren, der mindestens ein Wildtyp CF Allel aufweist. Die Reihenunter suchung von Kindern kurz nach der Geburt ist auch wertvoll für die Identifizierung von solchen, die 2 Kopien des defekten Gens tragen. Eine frühe Detektion erlaubt die Anwendung von angemessener Behandlung (z. B. Pulmozym Antibiotika, Pertussive Therapie), was die Lebensqualität verbessert und vielleicht die Lebenserwartung eines Individuums verlängert.
  • Die Quelle für Ziel-DNA, um CFTR Mutationen zu detektieren, ist normalerweise genomisch. Bei Erwachsenen können Proben bequem aus Blut oder aus Mundwaschungen erhaltenen Epithelzellen erhalten werden. Bei Feten können Proben mit mehreren konventionellen Techniken wie Amniocentese, Chorionzottenbiopsie oder Probenentnahme von fetalem Blut erhalten werden. Bei der Geburt ist Blut aus der Nabelschnur eine nützliche Gewebequelle.
  • Die Ziel DNA wird normalerweise durch PCR amplifiziert. Einige angemessene Paare von Primern für die Amplifizierung von Abschnitten der DNA, die die Orte von bekannten Mutationen enthalten, sind in den Tabellen 5 und 6 aufgeführt.
  • Tabelle 7
    Figure 00900001
  • Figure 00910001
  • Andere Primer können leicht nach den bekannten genomischen und cDNA Sequenzen von CFTR erdacht werden. Die Auswahl von Primern hängt selbstverständlich von den Regionen der Zielsequenz ab, die untersucht werden sollen. Die Wahl der Primer hängt auch von dem Strang ab, der amplifiziert werden soll. Für einige Regionen des CFTR Gens macht es nur einen kleinen Unterschied in dem Hybridisierungssignal aus, ob der kodierende oder nicht kodierende Strang benutzt werden. In anderen Regionen kann ein Strang eine bessere Unterscheidung der Hybridisierungssignale zwischen übereinstimmenden und nicht übereinstimmenden Sonden ergeben als der andere. Die obere Grenze der Länge eines Abschnitts, der mit einem Paar von PCR Primern amplifiziert werden kann, ist etwa 50 kB. Daher ist es für die Analyse von Mutanten in dem gesamten oder einem Großteil des CFTR Gens oft wünschenswert, mit mehreren gepaarten Primern mehrere Abschnitte zu amplifizieren. Die unterschiedlichen Abschnitte können aufeinander folgend oder gleichzeitig mit Multiplex PCR amplifiziert werden. Oft werden 15 oder mehr Abschnitte des CFTR Gens gleichzeitig durch PCR amplifiziert. Die Primer und Amplifikationsbedingungen werden bevorzugt ausgewählt, um DNA Ziele zu generieren. Bevorzugt ist eine asymmetrische Markierungsstrategie, die fluoreszenzmarkierte dNTPs für zufällige Markierung und dUTPs für die Fragmentierung des Ziels zu einer durchschnittlichen Länge von weniger als 60 Basen einbaut. Die Verwendung von dUTP und Fragmentierung mit Uracil N-Glycosylase hat den zusätzlichen Vorteil, zwischen Proben übertragene Verunreinigungen zu eliminieren.
  • Mutationen in dem CFTR Gen können durch jede der oben erwähnten Tiling-Strategien detektiert werden. Die Blocktiling Strategie ist ein besonders nützlicher Ansatz. B.ei dieser Strategie wird eine Gruppe oder (oder ein Block) von Sonden zur Analyse eines kurzen Abschnittes von zusammenhängen Nukleotiden (z. B. 3, 5, 7 oder 9) von einem CFTR Gen, die um den Ort einer Mutation zentriert sind, genutzt. Die Sonden einer Gruppe werden manchmal so bezeichnet, daß sie einen Block darstellen, weil alle Sonden in der Gruppe normalerweise identisch sind, außer an ihrer Abfrageposition. Wie oben erwähnt, können die Sonden sich auch in der Anwesenheit von führenden oder angehängten Sequenzen, die komplementäre Regionen flankieren, unterscheiden. Für die Leichtigkeit der Erläuterung wird jedoch angenommen, daß solche Sequenzen nicht anwesend sind. Um, als Beispiel, einen Abschnitt von 5 zusammenhängenden Nukleotiden des CFTR Gens zu analysieren, die den Ort einer Mutation (wie eine der Mutationen in Tabelle 6) einschließen, enthält ein Block von Sonden normalerweise mindestens eine Wildtypsonde und 5 Sätze von mutierten Sonden, wobei jeder drei Sonden aufweist. Die Wildtypsonde weist 5 Abfragepositionen auf, die den 5 Nukleotiden, die in der Referenzsequenz analysiert werden, entsprechen. Die Identität der Abfragepositionen wird jedoch nur klar, wenn die Struktur der Wildtypsonde mit der der Sonden in den 5 mutierten Sondensätzen verglichen wird. Der erste mutierte Sondensatz umfaßt drei Sonden, von denen jede identisch mit der Wildtypsonde ist, außer an der ersten Abfrageposition, die sich in jeder der drei mutierten Sonden und der Wildtypsonde unterscheidet. Die 2.–5. mutierten Sondensätze sind ähnlich zusammengesetzt, außer daß die Unterschiede zu der Wildtypsonde jeweils in der 2.–5. Abfrageposition auftreten. Man beachte, daß in der Praxis manchmal jeder Satz von mutierten Sonden auf dem Chip neben einer assoziierten Wildtypsonde angeordnet wird. In dieser Situation würde ein Block 5 Wildtypsonden umfassen, die jede effektiv die gleiche Information liefert. Jedoch wird die visuelle Inspektion und die Analyse des Vertrauens in den Chip durch die größtenteils redundante Information, die durch die 5 Wildtypsonden bereitgestellt wird, erleichtert.
  • Nach der Hybridisierung mit einem markierten Ziel werden die relativen Hybridisierungssignale von den Sonden abgelesen. Der Vergleich der Intensitäten der drei Sonden in dem ersten mutierten Sondensatz mit denen der Wildtypsonde ergibt die Identität des Nukleotids in der Zielsequenz, das der 1. Ab frageposition entspricht. Der Vergleich der Intensitäten der drei Sonden in dem zweiten mutierten Sondensatz mit denen der Wildtypsonde ergibt die Identität des Nukleotids in der Zielsequenz, das der 2. Abfrageposition entspricht, usw. In ihrer Gesamtheit geben die relative Hybridisierungsintensitäten die Identität von jedem der 5 zusammenhängenden Nukleotide in der Referenzsequenz an.
  • In einer bevorzugten Ausführungsform ist eine 1. Gruppe (oder Block) von Sonden für das Tiling basierend auf einer Wildtypreferenzsequenz und eine 2. Gruppe für das Tiling basierend auf einer mutierten Version der Wildtypreferenzsequenz angepaßt. Die Mutation kann eine Punktmutation, Insertion oder Deletion oder eine Kombination von jeder davon sein. Die Kombination der 1. und 2. Gruppe von Sonden erleichtert die Analyse, wenn mehrere Zielsequenzen gleichzeitig auf dem Chip gegeben werden, wie es der Fall ist, wenn ein diagnostizierter Patient für das CFTR Allel heterozygot ist.
  • Die obige Strategie ist in 16 erläutert, die zwei Gruppe von Sonden für das Tiling einer Wildtypreferenzsequenz und einer Punktmutation davon zeigt. Die 5 mutierten Sondensätze für die Wildtypreferenzsequenz sind als wt1–5 bezeichnet und die 5 mutierten Sondensätze für die mutierte Referenzsequenz sind mit m1–5 bezeichnet. Der Buchstabe N gibt die Abfrageposition an, die sich in aufeinanderfolgenden Sondensätzen der gleichen Gruppe um eine Position verschiebt. Die Fig. erläutert das Hybridisierungsmuster, das erhalten wird, wenn der Chip mit einer homozygoten Wildtypzielsequenz hybridisiert wird, die die Nukleotide n – 2 bis n + 2 umfaßt, wobei n der Ort der Mutation ist. Für die Gruppe von Sonden für das Tiling basierend auf der Referenzsequenz werden 4 Sonden an jeder Abfrageposition verglichen. An jeder Position weist eine der 4 Sonden eine perfekte Übereinstimmung mit dem Ziel auf, und die anderen drei weisen eine Nichtübereinstimmung von einer Base auf. Für die Gruppe von Sonden für das Tiling basierend auf der mutierten Referenzsequenz werden wiederum 4 Sonden an jeder Abfrageposition verglichen. An Position n weist eine Sonde eine perfekte Übereinstimmung auf und drei Sonden weisen eine Nichtübereinstimmung von einer Base auf. Die Hybridisierung mit einer homozygoten Mutante ergibt ein analoges Muster, außer daß die jeweiligen Hybridisierungsmuster von Sonden für das Tiling bei Wildtyp und mutierten Referenzsequenzen umgekehrt sind.
  • Das Hybridisierungsmuster ist sehr anders, wenn der Chip mit einer Probe von einem Patienten, der für das mutierte Allel heterozygot ist, hybridisert wird (s. 17). Für die Gruppe von Sonden, deren Tiling auf der Wildtypsequenz basiert, weist eine Sonde an allen Positionen außer n eine perfekte Übereinstimmung an jeder Abfrageposition auf, und die anderen drei Sonden weisen eine Nichtübereinstimmung von einer Base auf. An der Position n weisen 2 Sonden eine perfekte Übereinstimmung (eine für jedes Allel) auf, und die anderen Sonden weisen Nichtübereinstimmung von einer Base auf. Für die Gruppe von Sonden für das Tiling der mutierten Sequenz wird das gleiche Ergebnis erhalten. Damit kann die heterozygote Punktmutation leicht durch die Identität des Hybridisierungsmusters der zwei Gruppen von Sonden sowohl von dem homozygoten Wildtyp als auch von der mutierten Formen unterschieden werden.
  • Typischerweise umfaßt ein Chip mehrere gepaarte Gruppen von Sonden, jedes Paar für die Detektion einer bestimmten Mutation. Z. B. enthalten manche Chips 5, 10, 20, 40 oder 100 gepaarte Gruppen von Sonden für die Detektion der entsprechenden Zahl von Mutationen. Manche Chips sind dafür angepaßt, gepaarte Gruppen von Sonden für die Detektion aller häufigen Mutationen in bestimmten Populationen zu enthalten (s. Tabelle 6). Chips enthalten normalerweise auch Kontrollsonden um zu verifizieren, daß eine korrekte Amplifikation stattgefunden hat und daß das Ziel angemessen markiert ist.
  • Das Ziel der oben beschriebenen Tiling-Strategie ist es, sich auf kurze Regionen der CFTR Region, die die Orte bekannter Mutationen flankieren, zu konzentrieren. Andere Tiling-Strategien analysieren viel größere Regionen des CFTR Gens, und sind für die Lokalisierung und Identifizierung von bisher uncharakterisierten Mutationen angemessen. Z. B. kann ein Tiling des ganzen genomischen CFTR Gens (250 kB) mit der grundlegenden Tiling-Strategie mit einem Array von etwa einer 1 Million Sonden durchgeführt werden. Die Synthese und das Scannen eines solchen Arrays von Sonden ist ganz und gar machbar. Andere Tilingstrategien, wie das Blocktiling, Multiplextiling oder Pooling können mit weniger Sonden das gesamte Gen abdecken. Einige Tilingstrategien analysieren manche oder alle Komponenten des CFTR Gens, wie die cDNA kodierende Sequenz oder individuelle Exons. Die Analyse der Exons 10 und 11 ist besonders informativ, weil diese der Ort von vielen häufigen Mutationen, einschließlich der ΔF508 Mutation sind.
  • Beispielhafte CFTR Chips
  • Ein erläuternder Chip trägt ein Array von 1296 Sonden, die die gesamte Länge des Exons 10 des CFTR Gens abdecken, angeordnet in einem 36 × 36 Array von 356 μm Elementen. Die Sonden in dem Array können jede Länge haben, vorzugsweise in dem Bereich von 10–18 Resten, und sie können benutzt werden, um jede einzelne Basensubstitution und jede Deletion innerhalb des 192 Basen-Exons, einschließlich der 3 Basen-Deletion, die als ΔF508 bekannt ist, zu detektieren und sequenzieren. Wie im Detail unten beschrieben, führt die Hybridisierung von Nanomolaren Konzentrationen an Wildtyp und ΔF508 Oligonukleotid Zielnukleinsäuren, die mit Fluorescein markiert sind, mit diesen Arrays zu hochspezifischen Signalen (zu detektieren mit konfokaler Scanning Fluoreszenzmikroskopie), die die Unterscheidung zwischen mutierten und Wildtyp-Zielsequenzen in sowohl homozygoten als auch heterozygoten Fällen erlauben.
  • Sätze von Sonden mit einer bestimmten Länge in dem Bereich von 10–18 Basen und komplementär zu Teilsequenzen der bekannten Wildtyp CFTR Sequenz werden, beginnend an einer Position einige Basen innerhalb des Introns auf der 5'Seite von Exon 10 und endend einige Basen innerhalb des Introns auf der 3'Seite, synthetisiert. Es gibt eine Sonde für jede mögliche Teilsequenz eines vorgegebenen Abschnitts des Gens, und die Sonden sind so in einer "Zeile" angeordnet, daß das Verfolgen der Zeile von der oberen linken Ecke des Chips zu der unteren rechten Ecke dem Verfolgen des Gensegments, von Base zu Base, von dem 5'Ende aus entspricht. Die Zeile, die diesen Sondensatz enthält, wird, wie oben bemerkt, "Wildtyp-Zeile" genannt.
  • Mit Bezug zu der Wildtyp-Zeile wurde eine "Substitutions"-Zeile, "A-Zeile" genannt, auf dem Chip synthetisiert. Die Sonden der A-Zeile waren in ihrer Sequenz identisch zu einer benachbarten (direkt unter der entsprechenden) Wildtypsonde, enthielten aber, unabhängig von der Sequenz der Wildtypsonde, einen dA Rest an Position 7 (von dem 3'Ende gezählt). In ähnlicher Art wurden Substitutions-Zeilen mit den Ersatzbasen dC, dG, und dT jeweils in einer "C-Zeile", einer "G-Zeile", und einer "T-Zeile" auf dem Chip angeordnet. Eine 6. Zeile auf dem Chip bestand aus Sonden, die identisch zu denen in der Wildtypzeile waren, außer der Deletion der Base in Position 7 und der Wiederherstellung der ursprünglichen Sondenlänge durch Hinzufügen der Base am 5'Ende, die komplementär zu dem Gen an dieser Position ist.
  • Die vier Substitutions-Zeilen ermöglichen es einem, die Sequenz einer Ziel Exon 10 Nukleinsäure von den relativen Intensitäten abzuleiten, mit denen das Ziel mit den Sonden in den verschiedenen Zeilen abzuleiten. Verschiedene Versionen von solchen Exon 10 DNA Chips wurden, wie oben beschrieben, mit Sonden in einer Länge von 15 Basen hergestellt, genau wie Chips mit Sonden einer Länge von 10, 14 und 18 Basen. Für die unten be schriebenen Ergebnisse waren die Sonden 15 Basen lang und die Position der Substitution war 7 vor dem 3'Ende.
  • Die Sequenzen von mehreren wichtigen Sonden sind unten gezeigt. In jedem Fall steht der Buchstabe "X" für die Abfrageposition in einem bestimmten Spaltensatz, so daß jede der Sequenzen tatsächlich 4 Sonden repräsentiert, jeweils mit A, C, G und T anstelle des "X". Durch das Entfernen von bis zu 5 Basen von dem 5'Ende von jeder Sonde von den unten gezeigten Sätzen abgeleitete Sätze von kürzeren Sonden, und von diesem Satz durch das Hinzufügen von bis zu 3 Basen aus der Exon 10 Sequenz zu dem 5'Ende jeder Sonde hergestellte Sätze von längeren Sonden sind auch nützlich und werden durch die Erfindung bereitgestellt.
  • Figure 00980001
  • Um die Fähigkeit des Chips, die Δ508 Mutation von dem Wildtyp zu unterscheiden zu zeigen, wurden zwei synthetische Zielnukleinsäuren hergestellt. Die erste, ein 39mer komplementär zu einer Teilsequenz von Exon 10 des CFTR Gens, das die 3 Basen die an der ΔF508 Mutation beteiligt sind, nahe seinem Zentrum aufweist, wird "Wildtyp" oder wt508 Ziel genannt, entspricht den Positionen 111–149 des Exons und weist die unten gezeigte Sequenz auf:
    Figure 00980002
  • Die zweite, eine von dem Wildtyp Ziel durch das Entfernen dieser drei Basen abgeleitete 36mer Sonde, wird das "mutierte" Ziel oder mu508 Ziel genannt und hat die unten gezeigte Sequenz, zunächst mit Bindestrichen, um auf die deletierten Basen hinzuweisen, und dann ohne Bindestriche, aber mit einer unterstrichenen Base (um auf die durch die T-Zeilen Sonde detek- tierte Base hinzuweisen, wie unten diskutiert):
    Figure 00990001
  • Beide Ziele waren an dem 5'Ende mit Fluorescein markiert.
  • In 3 getrennten Experimenten wurden das Wildtypziel, das mutierte Ziel und eine äquimolare Mischung beider Ziele (jeweils 0,1 nM wt508, 0,1 nM mu508 und 0,1 nM wt508 + 0,1 nM mu508 in einer mit der Nukleinsäurehybridisieurng kompatiblen Lösung) einem CF Chip ausgesetzt. Die Hybridisierungsmischung wurde über Nacht bei Raumtemperatur inkubiert, und dann wurde der Chip auf einem Lesegerät gescannt (einem konfokalen Fluoreszenzmikroskop im Photonenzählungsmodus); Bilder des Chips wurden mit den Photonenzählungen bei mehreren schrittweise höheren Temperaturen, immer noch in Kontakt mit der Ziel-Lösung konstruiert. Nach jeder Temperaturänderung wurde vor dem Scannen eine Äquilibrierung des Chips für etwa ½ Stunde erlaubt. Nach jedem Satz von Scans wurde der Chip denaturierendem Lösungsmittel und Wasch-Bedingungen ausgesetzt, d. h. an den Chip gebundenes Ziel wurde entfernt, so daß das nächste Experiment mit einem sauberen Chip durchgeführt werden konnte.
  • Die Ergebnisse der Experimente sind in 18, 19, 20 und 21 gezeigt. 18 zeigt auf den Feldern A, B und C ein von der CFTR Exon 10 Sonden enthaltenden Region eines DNA Chip hergestellten Bild; in Feld A wurde der Chip mit einem Wildtyp Ziel hybridisiert; in Feld C wurde der Chip mit einem mutierten ΔF508 Ziel hybridisiert und in Feld B wurde der Chip mit einer Mischung von Wildtyp und mutiertem Ziel hybridisiert. 19 zeigt auf den Blättern 1–3, entsprechend den Feldern A, B und C von 3, Graphen der Fluoreszenzintensität gegenüber der Tilingposition. Die Markierungen auf der horizontalen Achse zeigen die Basen in der Wildtypsequenz, die der Position der Substitution in den entsprechenden Sonden entsprechen. Eingezeichnet sind die Intensitäten, die von den Merkmalen (oder Syntheseorten), die Wildtypsonden enthalten, beobachtet wurden, den Merkmalen, die Substitutionssonden enthalten, die das meiste Ziel gebunden haben ("abgerufen wurden") und dem Merkmal, das die Substitutionssonden enthält, die das Ziel mit der zweithöchsten Intensität aller Substitutionssonden gebunden hat ("Zweithöchstes").
  • Diese Abbildungen zeigen, daß bei dem Wildtypziel und der äquimolaren Mischung der Ziele die Substitutionssonde mit einer der entsprechenden Wildtypsonde entsprechenden Nukleotidsequenz das meiste Ziel gebunden hat, was eine unzweideutige Zuordnung der Zielsequenz erlaubt, wie von den Buchstaben nahe den Punkten der Kurve gezeigt. Das Ziel wt508 hybridisierte damit mit den Sonden in der Wildtypzeile des Chips, obwohl die Stärke der Hybrdisierung sich von Sonde zu Sonde unterschied, wahrscheinlich wegen Unterschieden in der Schmelztemperatur. Die Sequenz des größten Teils des Ziels kann damit direkt von dem Chip gelesen werden, durch Ableitung aus den Hybridisierungsmustern in den Zeilen der Substitutions-Sonden (wenn das Ziel am intensivsten mit der Sonde in der A-Zeile hybridisiert, dann leitet man daraus ab, daß das Ziel ein T in der Position der Substitution aufweist, usw.).
  • Bei dem mutierten Ziel konnte die Sequenz ähnlich auf der 3'Seite der Deletion abgerufen werden. Die Intensität der Bindung nahm jedoch bei der Annäherung von dem 3'Ende des Ziels an den Ort der Deletion steil ab, so daß die Bindungsintensität der Wildtypsonde, deren Substitutionspunkt dem T an dem 3'-Ende der Deletion entspricht, sehr nahe am Hintergrund war. Diesem Muster folgend band die Wildtypsonde, deren Substitutionspunkt der mittleren Base (auch ein T) der Deletion entspricht, noch weniger Ziel. Die Sonde in der T-Zeile dieses Spaltensatzes band das Ziel jedoch sehr gut. Die Untersuchung der Sequenzen der 2 Ziele offenbart, daß die Deletion ein A an dieser Position plaziert, wenn die Sequenzen an ihren 3'-Enden aneinander ausgerichtet sind, und daß die T-Zeilen Sonde komplementär mit dem mutierten Ziel ist, aber mit zwei Nicht-Übereinstimmungen nahe einem Ende (unten in Kleinbuchstaben gezeigt, mit dem Ort der Substitution unterstrichen):
    Figure 01010001
  • Damit ruft die Sonde der T-Zeile in diesem Spaltensatz die korrekte Base der mutierten Sequenz ab. Man beachte, daß in dem Graph für die äquimolare Mischung der zwei Ziele die Sonde der T-Zeile fast so viel Ziel bindet wie die Sonde der A-Zeile in dem gleichen Spaltensatz, während in den anderen Spaltensätzen die Sonden, die keine Wildtypsequenz aufweisen, keinesfalls genauso gut Ziel binden. Damit detektiert dieser eine Spaltensatz, und insbesondere die Sonde der T Zeile innerhalb dieses Satzes, die Δ508 Mutation unter Bedingungen, die den homozygoten Fall simulieren und auch unter Bedingungen, die den heterozygoten Fall simulieren.
  • Obwohl in diesem Beispiel die Sequenz nahe den Enden des Ziels nicht zuverlässig abgeleitet werden konnte, wo es nicht genug Überlappung zwischen dem Ziel und der Sonde gibt, um eine effektive Hybridisierung zu ermöglichen, und um das Zentrum der Sonde, wo die Hybridisierung aus einem anderen Grund schwach war, vielleicht hohen AT-Gehalt, zeigen die Ergebnisse, daß das erfindungsgemäße Verfahren und die erfindungsgemäßen Sonden genutzt werden können, um die Mutation von Interesse zu detektieren. Das mutierte Ziel ergab ein Hybridisierungsmuster, das an den Enden sehr ähnlich zu dem des wt508 Ziels war, wo die beiden eine gemeinsame Sequenz teilen, und sehr unterschiedlich in der Mitte, wo die Deletion lokalisiert ist. Wenn man das Bild von rechts nach links überblickt, nimmt die Intensität der Hybridisierung des Ziels zu den Sonden in der Wildtypzeile nahe dem Zentrum des Bildes viel schneller für mu508 als für wt508 ab; zusätzlich gibt es eine Sonde in der T-Zeile, die intensiv mit mu508 und kaum mit wt508 hybridisert. Die Ergebnisse mit der äquimolaren Mischung der zwei Ziele, die den Fall darstellen, den man bei dem Testen eines für die Mutation heterozygoten Individuums finden würde, sind eine Mischung der Ergebnisse für die getrennten Ziele, was die Fähigkeit der Erfindung, eine Wildtypzielsequenz von einer, die die ΔF508 Mutation enthält, zu unterscheiden, und eine Mischung der zwei Sequenzen zu bestimmen, zeigt.
  • Die obigen Ergebnisse zeigen klar, wie die erfindungsgemäßen DNA Chips benutzt werden können, um eine Deletionsmutation, ΔF508 zu detektieren; ein anderes Modellsystem wurde genutzt um zu zeigen, daß die Chips auch benutzt werden können, um genauso eine Punktmutation zu detektieren. Eine Mutation in dem CFTR Gen ist G480C, was einen Ersatz des G in Position 46 von Exon 10 durch ein T beinhaltet, und die Substitution eines Cysteins für das Glycin, das normalerweise in Position #480 des CFTR Proteins ist, zum Ergebnis hat. Die Modellzielsequenzen beinhalteten die 21mer Sonde wt480, um die Wildtyp-Sequenz an den Positionen 37–55 des Exons 10 darzustellen:
    5'-CCTTCAGAGGGAAAATTAAG, und die 21-mer Sonde mu480, um die mutierte Sequenz darzustellen:
    5'-CCTTCAGAGTGAAAATTAAG.
  • In unterschiedlichen Experimenten wurde ein DNA-Chip jeweils mit jedem der Ziele wt480 und mu480 hybridisiert, und dann mit einem konvokalen Mikroskop gescannt. 20 zeigt auf den Feldern A, B und C ein von der CFTR-Exon-10 Sonden enthaltenen Region eines DNA-Chip gemachtes Bild; in Feld A wurde der Chip mit wt480 Ziel hybridisiert; in Feld C wurde der Chip mit mu480 Ziel hybridisiert; und in Feld B wurde der Chip mit einer Mischung der Wildtyp- und mutierten Ziele hybridisiert. 21 zeigt auf den Blättern 1–3, entsprechend den Feldern A, B und C von 20, Graphen der Fluoreszenzintensität gegenüber der Tiling-Position. Die Beschriftungen auf der horizontalen Achse zeigen die Basen der Wildtyp-Sequenz entsprechend der Substitutionspositionen in den jeweiligen Sonden. Aufgetragen sind die Intensitäten, die von den Merkmalen (oder Syntheseorten), die Wildtypsonden enthalten beobachtet wurden, den Merkmalen, die die Substitutionssonden enthalten, die das meiste Ziel gebunden haben ("abgerufen wurden"), und dem Merkmal, das die Substitutionssonden enthält, die mit der zweithöchsten Intensität von allen Substitutionssonden Ziel gebunden haben ("Zweithöchstes").
  • Diese Abbildungen zeigen, dass der Chip benutzt werden konnte, um einen Abschnitt von 16 Basen von dem Zentrum des Ziels wt480 zu sequenzieren, und das die Unterscheidung von Nichtübereinstimmungen innerhalb der sequenzierten Region ziemlich gut ist. Wenn der DNA-Chip dem Ziel mu480 ausgesetzt war, band nur eine Sonde in dem gezeigten Teil des Chips das Ziel gut: Die Sonde in dem Sondensatz, der dazu bestimmt ist, die Base an Position 46 in Exon 10 zu bestimmen, die ein A in der Substitutionsposition aufweist und somit genau komplementär zu dem zentralen Teil des mutierten Ziels ist. Alle anderen Sonden in dieser Region des Chips weisen mindestens eine Nichtübereinstimmung mit dem mutierten Ziel auf und binden daher viel weniger davon. Trotz dieser Tatsache kann die Sequenz von mu480 für mehrere Positionen auf beiden Seiten der Mutation von dem Chip abgelesen werden, allerdings mit deutlich reduzierten Intensitäten im Vergleich zu den bei dem Wildtypziel beobachteten.
  • Die Ergebnisse zeigen auch, dass, wenn die zwei Ziele miteinander gemischt und dem Chip ausgesetzt wurden, die beobachteten Hybridisierungsmuster eine Kombination der anderen beiden Muster waren. Die Wildtyp-Sequenz konnte leicht von dem Chip gelesen werden, aber die Sonde, die das mu480-Ziel so gut band, wenn nur mu480-Ziel anwesend war, band es auch gut, wenn sowohl mutiertes als auch Wildtypziel in einer Mischung anwesend waren, was das Hybridisierungsmuster leicht von dem des Wildtyp-Ziels alleine unterscheidbar machte. Diese Ergebnisse zeigen wieder die Fähigkeit der erfindungsgemäßen DNA-Chips, Punktmutationen sowohl in homo- als auch heterozygoten Indidivuen zu detektieren.
  • Um die klinische Anwendung der erfindungsgemäßen DNA-Chips zu demonstrieren, wurden die Chips benutzt, um Mutationen in Nukleinsäuren aus genomischen Proben zu untersuchen und zu bestimmen. Genomische Proben von einem Individuum, das nur das Wildtypgen trägt, und einem für ΔF508 heterozygoten Individuum wurden mit PCR amplifiziert, unter Benutzung von Exon 10 Primern, die den Promotor für T7 RNA-Polymerase enthielten. Beispielhafte erfindungsgemäße Primer sind unten gezeigt.
  • Figure 01040001
  • Diese Primer können zur Amplifizierung von Exon 10 oder Exon 11 Sequenzen genutzt werden, in einer anderen Ausführungsform wird Multiplex-PCR verwendet, wobei zwei oder mehr Paare von Primern benutzt werden, um mehr als ein Exon gleichzeitig zu amplifizieren.
  • Das Produkt der Amplifikation wurde dann als Template für die RNA-Polymerase genutzt, in Anwesenheit von fluoresceiniertem UTP, um das RNA-Produkt zu markieren. Nachdem ausreichend RNA hergestellt wurde, wurde diese fragmentiert und für 15 Minuten mit einem Exon 10-DNA-Chip in Kontakt gebracht, danach wurde der Chip mit Hybridisierungspuffer gewaschen und mit dem Fluoreszenzmikroskop gescannt. Eine nützliche, auf vielen CF Exon 10-Chips enthaltene Positivkontrolle ist das 8mer 3'-CGCCGCCG-5'. 22 zeigt auf den Feldern A und B ein Bild von einer CFTR Exon 10 Sonden enthaltenden Region eines DNA-Chips; in Feld A wurde der Chip mit Nukleinsäuren hybridisiert, die von der genomischen DNA eines Individuums mit Wildtyp ΔF508 Sequenzen abgeleitet wurden; in Feld B stammte die Zielnukleinsäure von einem (in Bezug auf die ΔF508-Mutation) heterozygotem Individuum. 23 zeigt auf den Feldern 1 und 2, entsprechend den Feldern A und B von 22, Graphen der Fluoreszenzintensität gegenüber der Tiling-Position.
  • Diese Figuren zeigen, dass die Sequenz der Wildtyp-RNA für die meisten Basen nahe der Mutation abgerufen werden kann. In dem Falle des ΔF508 heterozygoten Trägers bindet eine bestimmte Sonde, die gleiche, die in dem oben beschriebenen Modellsystem so klar zwischen dem Wildtyp- und mutierten Oligonukleotid-Zielen unterschied, eine große Menge RNA, während die gleiche Sonde wenig RNA von dem Wildtyp-Individuum bindet. Diese Ergebnisse zeigen, dass die erfindungsgemäßen DNA-Chips in der Lage sind, die ΔF508-Mutation in einem heterozygoten Träger zu detektieren.
  • Weitere Chips wurden unter Benutzung der Block-Tiling-Strategie konstruiert, um ein Array von Sonden für die Analyse einer CFTR-Mutation bereitzustellen. Das Array umfasste 93 mm × 96 μm Merkmale, in 11 Spalten und vier Reihen (44 Sonden insgesamt) angeordnet. Sonden in fünf dieser Spalten waren aus vier Sondensätzen für das Tiling basierend auf der Wildtyp-CFTR-Sequenz und mit Abfragepositionen, die dem Ort einer Mutation und zwei Basen auf jeder Seite entsprechen. Fünf der restlichen Spalten enthielten vier Sondensätze, für das Tiling basierend auf der mutierten Version der CFTR-Sequenz. Diese Sondensätze wiesen auch Abfragepositionen entsprechend dem Ort der Mutation an zwei Nukleotiden auf jeder Seite auf. Die 11. Spalte enthielt vier Zellen für Kontrollsonden.
  • Durch PCR-Amplifikation wurden fluoreszenzmarkierte Hybridisierungsziele hergestellt. 100 μg genomischer DNA, 0,4 μM von jedem Primer, 50 μM jeweils von dATP, dCTP, dCTP und dUTP (Pharmacia) n 10 mM Tris-Cl, pH 8,3, 50 mM KCl, 2,5 mM MgCl2 und 2 U Taq Polymerase (Perkin-Elmer) wurden in einem Perkin-Elmer 9600 Thermocycler bei den folgenden Zeiten und Temperaturen 36 Zyklein behandelt: 95°C, 10 Sek., 55°C, 10 Sek., 72°C, 30 Sek. 10 μl dieses Reaktionsprodukt wurden in einer zweiten asymetrischen PCR-Reaktion als Matrize genutzt. Die Bedingungen beinhalteten 1 μM assymetrischen PCR-Primer, 50 μM jeweils dATP, dCTP, TTP, 25 μM Fluorescein-dGTP (DuPont), 10 mM Tris-Cl, pH 9,1, 75 mM KCl, 3,5 mM MgCl2. Die Reaktion wurde unter den folgenden Bedingungen für fünf Zyklen durchgeführt: 95°C, 10 Sek., 60°C, 10 Sek., 55°C, 1 Min. und 72°C, 1,5 Min. Darauf folgten sofort 20 weitere Zyklen mit den folgenden Bedingungen: 95°C, 10 Sek., 60°C, 10 Sek., 72°C, 1,5 Min.
  • Die Amplifikationsprodukte wurden durch Behandlung mit 2 U Uracil-N-Glycosylase (Gibco) bei 30°C für 30 Min. fragmentiert, gefolgt durch Hitzedenaturation bei 95°C für 5 Min. Schließlich wurde das markierte fragmentierte PCR-Produkt in Hybridisierungspuffer, aus 5 × SSPE und 1 mM Cetyltrimethylammuniumbromid (CTAB) hergestellt, verdünnt. Der Verdünnungsfaktor war im Bereich von 10 × bis 25 ×, wobei 40 μl Probe in 0, 4 ml–1 ml Hybridisierungslösung verdünnt wurden.
  • Die Hybridisierung des Ziels wurde im Allgemeinen ausgeführt, indem der Chip in einem kleinen Gefäß, das 500 μl–1 ml Gesamtvolumen Hybridisierungslösung enthielt, geschüttelt wurde.
  • Alle Hybridisierungen wurden bei einer konstanten Temperatur von 30°C durchgeführt. Alternativ wurden einige Hybridisierungen ausgeführt, während die Chips in eine Plastikpackung eingeschlossen waren, wobei der 1 cm × 1 cm Chip so aufgeklebt war, dass er einer 250 μl-Flüssigkeitskammer gegenüberliegt. 250–350 μl Hybridisierungslösung wurden eingeführt und unter Benutzung einer Spritzenpumpe gemischt. Die Temperatur wurde kontrolliert, indem die Rückseite der Packung mit einer Peltier-Heiz/Kühlungsapparatur in Kontakt gebracht wurde. Nach der Hybridisierung wurden die Chips mit 5 × SSPE, 0,1% Triton X-100 bei 25°C–30°C gewaschen, bevor das Fluoreszenzbild hergestellt wurde.
  • Hybridisierte gewaschene DNA-Chips wurden mit einem Stage-Scanning konvokalen Epifluoreszenzmikroskop und Exitation mit einem 488 nm Argonionenlaser gescannt. Immitiertes Licht wurde mit einem bei 530 nm zentrierten Bandpass-Filter gesammelt. Das entstehende Fluoreszenzbild wurde im Raum rekonstruiert und die Intensitätsdaten dann analysiert. Die Merkmale mit der höchsten Fluoreszenzintensität in jeder Spalte wurden identifiziert und jeweils mit der Signalintensität an den restlichen in einzelnen Basen nicht übereinstimmenden Sondenorten in der gleichen Spalte verglichen. Die Sequenzen der Merkmale mit den höchsten Intensitäten wurden dann über alle 10 Spalten jedes Unterarrays verglichen, um zu bestimmen, ob die höchsten Intensitätswerte für die Wildtypsequenz und die mutierte Sequenz gleich oder signifikant unterschiedlich waren. Diese Ergebnisse wurden zur Generierung des Genotyp-Abrufs des Wildtyps benutzt (Signale hoher Intensität nur in Wildtypsondenspalten), Mutanten (Signale hoher Intensitäten nur in den mutierten Sondenspalten) oder Heterozygoten (Signale hoher Intensität sowohl in Wildtyp- als auch mutierten Sondenspalten).
  • 24 (Feld a) zeigt ein Bild der Fluoreszenzsignale von Arrays, die entworfen wurden, um die G551D (G > A) und Q552X (C > T) CFTR-Mutationen zu detektieren. Das hybridisierende Ziel ist ein Exon 11 Amplikon, das aus Wildtyp genomischer DNA hergestellt wurde. Wildtyp-Hybridisierungsmuster sind an beiden Stellen offensichtlich. Kein signifikantes Fluoreszenzsignal ergab sich an irgendeinem der Merkmale mit zu mutierten oder nicht übereinstimmenden Sequenzen komplementären Sonden. Die relativen Fluoreszenzintensitäten waren sechsmal heller für perfekt übereinstimmende Wildtypmerkmale verglichen mit Hintergrundsignalintensitäten an mutierten und nicht übereinstimmenden Merkmalen. Zusätzlich kann die Sequenz an diesen Loci jeweils als AGGTC und GTCAA bestätigt werden, wobei fetter Schrifttyp die Mutations-Orte anzeigt. 24 (Feld b) zeigt die Merkmale des gleichen Sondenarrays nach Hybridisierung mit einem fluoreszierenden Ziel, das aus für die G551D-Mutation heterozygoter DNA hergestellt wurde. Wildtyp und mutierte Sondenspalten haben beide Merkmale mit signifikanter Fluoreszenzintensität, was auf die Hybridisierung von sowohl Wildtyp- als auch mutierten CFTR-Allelen an diesem Ort hinweist. In dem Q552X-Unterarray hybridisierten nur Wildtypsonden mit einem signifikanten Fluoreszenzsignal, was auf eine Wildtypzielsequenz hinweist. Ein zusätzliches Merkmal, das in dem ersten Experiment nicht hybridisierte, zeigt jedoch in diesem Experiment eine signifikante Fluoreszenzintensität. Weil die G551D- und Q552X-Mutationen nur zwei Basen voneinander entfernt sind, hat die A-Sondensequenz in dem zusätzlichen Merkmal eine perfekt übereinstimmende 12-mer-Überlappung mit dem mutierten G551D-Ziel.
  • 25 (Felder A und B) illustrieren die Mutationsanalyse für ΔF508, eine 3-Basenpaardeletion in Exon 10 des CFTR-Gens. Im Gegensatz zu dem mit Basenaustauschmutationen beobachteten Hybridisierungsmuster zeigen Sondenarrays bei Mutationen, bei denen Basen insertiert oder deletiert werden, ein unterschiedlichen Hybridisierungsmuster. An den zwei zentralen Spalten von Basensubstitutionsarrays werden identische Sonden synthetisiert. Im Ergebnis führen sowohl Hybridisierungen von mutiertem oder Wildtyp-Ziel zu zwei nebeneinanderliegenden Merkmalen (ein Doublett) mit hoher Fluoreszenzintensität im Zentrum des Arrays. Bei einer heterozygoten Hybridisierung treten zwei Sätze von Doubletts, eins übereinstimmend mit der Wildtypsequenz und eins mit der mutierten Sequenz, auf ( 24, Feld b). Im Gegensatz dazu sind die Spaltensequenzen von Wildtyp- und mutierter Sonde um die Deletions- und Insertionsmutationen voneinander abgesetzt und Hybridisierungsdoubletts werden nicht beobachtet. Anstelle der sechs Signale hoher Intensität mit einem Doublett charakterisieren fünf unabhängige Merkmale in abwechselnden Spalten einen Homozygoten, und zehn Merkmale, eins in jeder Spalte, werden bei heterozygoten Zielen positiv sein. Dies wird aus dem ΔF508-Hybridisierungsmuster in 25, Feld A, klar. Obwohl ein Wildtypziel hybridisiert wurde und die Merkmale höchster Intensität die Wildtypsequenz (ATCTT) bestätigen, gibt es eine zusätzliche Hybridisierung in der ersten mutierten Spalte. Die Analyse dieser Sondensequenz zeigt eine perfekte Übereinstimmung von 10 Basen mit der mutierten Sequenz.
  • Das Bild in 25, Feld B, ergibt sich aus der Hybridisierung eines DNA-Chips mit einem Ziel, das homozygot for ΔF508 ist. Auf diesem Bild zeigen fünf Merkmale, alle mit Sondensequenzen, die zu der Mutante komplementär sind, ein signifikantes Signal. Die Mutationssequenz, die den Ort der Deletion überbrückt, ATTGG, wird bestätigt. Ähnlich zu dem, was in dem Beispiel der G551D-Mutation gesehen wurde, gibt es in benachbarten Subarrays, die zur Detektion der ΔI507- und F508C-Mutationen entworfen sind, zusätzliche Informationen. Dies wird erwartet, da sie sich in solch großer Nähe zu ΔF508 befinden, dass ihre Sondensätze signifikant mit den ΔF508-Sonden überlappen. Das ΔF508 homozygote Ziel weist keine perfekte Übereinstimmung mit Wildtyp oder mutierten Sonden in den ΔI507- und F508C-Unterarrays auf. Es gibt jedoch innerhalb dieser zwei Blöcke von Sonden einige Signale geringer Intensität. Das F507C-Array weist ein Doublett auf, das mit elf Basen des mutierten ΔF508-Ziels übereinstimmt. Gleichermaßen beruht die Hybridisierung in der achten Spalte des ΔI507-Arrays auf einer Sonde, die in 13/14 Basen mit dem Ziel übereinstimmt.
  • 26 zeigt die Hybridisierung eines heterozygoten doppelten Mutanten ΔF508/F508C mit dem gleichen, oben beschriebenen Array. Ein konventioneller reverser Dotblot würde diese Probe als homozygote ΔF508-Mutante bewerten. In den vorliegenden Assays werden die ΔF508 und F508C-Allele durch die jeweiligen Subarrays, die für die Detektion dieser Mutationen entworfen sind, getrennt detektiert.
  • C. Chips für die Diagnose von Krebs
  • Es gibt mindestens zwei Arten von Genen, die oft in Krebszellen verändert sind. Die erste Art Gen ist ein Onkogen, wie ein Gen für die Reparatur von Nichtübereinstimmungen, und die zweite Art von Gen ist ein Tumorsuppressorgen, wie ein Transkriptionsfaktor. Beispiele von Onkogenen zur Reparatur von Nichtübereinstimmungen schließen hMSH2 (Fishel et al., Cell 75, 1027–1038 (1993)) und hMLH1 (Papadopoulos et al., Sciences 263, 1625–1628 (1994)) ein. Das am besten bekannte Beispiel eines Tumorsuppressorgens ist das p53 Proteingen (Buchman et al., Gene 70, 245–252 (1988). Indem der Status von sowohl Onkogenen als auch Tumorsuppressorgenen (individuell und in Kombination) in einem Patienten überwacht wird, ist es möglich, die individuelle Suszeptibilität gegenüber Krebs und die Prognose eines Patienten bei der Krebsdiagnose zu bestimmen und die Therapie effizienter auszurichten.
  • Das p53-Gen überspannt bei Menschen 20 kbp und weist elf Exons auf, von den zehn für Protein kodieren (siehe Tominaga et al., 1992, Critical Reviews in Oncogenesis 3: 257–282). Das Gen produziert ein 53 kDa Phosphoprotein, das die DNA-Replikation reguliert. Das Protein wirkt darauf hin, die Replikation an der G1/S-Grenze des Zellzyklus zu stoppen und es wird angenommen, dass es als "molekularer Polizist" wirkt, indem es die Repli kation beendet, wenn die DNA beschädigt ist, oder die Reproduktion von DNA-Viren blockiert (siehe Lane, 1992, Nature 358: 15–16). Der p53-Transkriptionsfaktor ist Teil eines Weges, der das Zellwachstum kontrolliert. Wildtyp p53 kann das Zellwachstum stoppen oder in manchen Fällen zu programmiertem Zelltod führen (Apoptose). Solche tumorsupprimierenden Effekte sind in einer Vielzahl von bekannten p53-Genmutationen nicht vorhanden. Darüber hinaus entziehen die p53-Mutanten nicht nur einer Wildtypzelle die p53-Tumorsuppression, sie können auch abnormales Zellwachstum anregen.
  • In Tumorzellen ist p53 das am häufigsten mutierte Gen, das bisher entdeckt wurde (siehe Levine et al., 1991, Nature 351: 453– 456, und Hollstein et al., 1991, Science 253: 49–53). Mehr als die Hälfte der 6,5 Millionen Patienten, deren Krebs jährlich diagnostiziert wird, besitzen in ihren Tumorzellen p53-Mutationen. Bei den häufigen Tumoren enthalten etwa 70% der Fälle von kolorektalem Krebs, 50% von Lungenkrebs und 40% von Brustkrebs p53-Mutationen. Insgesamt wurde für mehr als 51 Arten humaner Tumoren dokumentiert, dass sie p53-Mutationen besitzen, einschließlich Blasen-, Gehirn-, Brust-, Cervix-, Kolon-, Oesophagus-, Larynx-, Leber-, Lungen-, Eierstock, Pankreas-, Prostata-, Haut-, Magen- und thyroiden Tumoren (Culotta & Koshland, Science 262, 1958–1961 (1993); Rodrigues et al., 1990, PNAS 87: 7555–7559). Gemäß Daten, die von David Sidransky (1992 San Diego Konferenz) präsentiert wurden, sind mehr als 400 Mutationen in p53 bekannt. Die Anwesenheit einer p53-Mutation in einem Tumor wurde auch mit der Prognose eines Patienten korreliert. Patienten, die p53-Mutationen besitzen, haben eine niedrigere 5-Jahres-Überlebensrate.
  • Eine richtige Diagnose der Form von p53 in Tumorzellen ist kritisch für Kliniker, um eine angemessene therapeutische Kur zu verschreiben. Zum Beispiel haben Patienten mit Brustkrebs, die keine Invasion naher Lymphknoten zeigen, im Allgemeinen keine Rückfälle nach standardmäßiger chirurgischer Behandlung und Chemotherapie. Bei den 25%, die nach Chirugie und Chemotherapie einen Rückfall haben, ist zusätzliche Chemotherapie angemessen. Im Moment gibt es keinen klaren Weg um festzustellen, welche Patienten aus einer solchen zusätzlichen Chemotherapie vor dem Rückfall Nutzen ziehen werden. Ein Korrelieren von p53-Mutationen mit der Tumorigenizität und Metastasen stellt Klinikern jedoch eine Möglichkeit zur Verfügung um festzustellen, ob solche zusätzlichen Behandlungen berechtigt sind.
  • Zusätzlich zur Erleichterung der konventionellen Chemotherapie stellt eine angemessene Diagnose von p53-Mutationen Klinikern die Fähigkeit zur Verfügung, Individuen zu identifizieren, die den größten Nutzen aus Gentherapietechniken ziehen werden, bei denen a gemessene funktionierende p53-Kopien wieder an den Ort des Tumors gebracht werden. Klinische p53-Gentherapieversuche werden im Moment vorgenommen (Culotta & Koshland, supra).
  • Die Analyse von p53-Mutationen kann auch genutzt werden, um zu identifizieren, welche Karzinogene zu bestimmten Tumoren führen (Harris, Science 262, 1980–1981 (1993)). Zum Beispiel ist die Exposition gegenüber Aflatoxin B1 in der Nahrung mit G:C zu T:A Transversionen an Rest 249 von p53 in hepatozellulären Karzinoma assoziiert (Hsu et al., Nature 350, 427 (1991); Bressac et al., Nature 350, 429 (1991); Harris, supra).
  • Während die meisten der beschriebenen p53-Mutationen in ihrem Ursprung somatisch sind, sind manche Arten von Krebs mit Mutationen von p53 in der Keimbahn assoziiert. Zum Beispiel ist das Li-Fraumeni-Syndrom ein erblicher Zustand, in dem Individuen mutierte p53-Allele erhalten, was zu dem frühen Ausbruch von verschiedenen Krebsarten führt (Harris, supra); Frebourg et al., PNAS 89, 6413–6417 (1992); Malkin et al., Science 250, 1233 (1990)). Diese Mutationen sind mit Instabilität in den Rest des Genoms assoziiert und führen zu multiplen genetischen Änderungen, und schließlich zu Krebs.
  • hMLH1 und hMSH2 sind Gene zur Reparatur von Nichtübereinstimmungen, die bei heriditärem nichtpolypösem kolorektalem Krebs in Individuen mit mutierten hMLH1 oder hMSH2-Allelen kausative Agentien sind (Fishel et al., supra, und Papadopoulos et al., supra). Heriditärer nichtpolypöser kolorektaler Krebs ist eine häufige genetische Störung, die etwa 1 von 200 Individuen betrifft (Lynch et al., Gastroenterologie 104, 1535 (1993)). Die Detektion von hMLH1 und hMSH2-Mutationen in der Bevölkerung erlaubt die Diagnose von für nichtpolypösen kolorektalen Krebs suszeptiblen Individuen vor der Manifestierung der Erkrankung. Dies erlaubt die Implementation von besonderen Reihenuntersuchungs-Programmen für krebssuszeptible Individuen, um eine frühe Detektion des Krebses zu sichern und damit die Überlebensraten von betroffenen Individuen zu verbessern. Zusätzlich können genetische Ratgeber die von hMLH1 und hMSH2-Chips abgeleitete Information benutzen, um Familienplanung zu verbessern, wie für cystische Fibrose-Chips beschrieben. Die Bestimmung von Mutationen in hMLH1 und hMSH2, individuell oder in Kombination mit p53, kann auch durch Kliniker benutzt werden, um die Prognose und Art der Behandlung von Krebs zu testen. Schließlich kann die Information benutzt werden, um angemessene Individuen für die Gentherapie ins Auge zu fassen.
  • Das gesamte hMLH1-Gen hat eine Länge von weniger als 85 kbp, umfassend 2268 kodierende Nukleotide (Papadopoulos et al., supra). Sequenzen aus dem Gen sind bei der GenBank hinterlegt (Zugangsnummer U07418). Mutationen, die mit heriditärem nichtpolypösem kolorektalem Krebs assoziiert sind, beinhalten die Deletion von Exon 5 (Codons 578–632), eine 4-Basenpaardeletion der Codons 727 und 728, die zu einer Verschiebung des Leserasters des Gens führt, eine 4-Basenpaarinsertion an den Codons 755 und 756, die zu einer Erweiterung des COOH-Terminus führt, eine 371-Basenpaardeletion und zur Verschiebung des Leserasters führende Mutation an Position 347 und eine Transversion, die eine Veränderung von Codon 252 verursacht, die zu der Insertion eines Stoppcodons führt (dasselbe).
  • hMSH2 ist ein humanes Homolog der bakteriellen Muts und S. cerevisiae MSH Gene zur Reparatur von Nichtübereinstimmungen. MSH2 ist, wie hMLH1, mit heriditärem nicht-polypösem Krebs assoziiert. Obwohl nur wenige MSH2 Genproben aus Tumorgewebe charakterisiert wurden, zeigen mindestens einige Tumorproben eine T zu C Transitionsmutation an Position 2020 der cDNA-Sequenz, die zu dem Verlust einer Intron-Exon-Spleiß-Akzeptor-Stelle führt.
  • Im Lichte der Rolle von Mutationen in p53, MSH2 und/oder hMLH1 bei der erblichen Prädisposition für Krebs, für Ereignisse der neoplastischen Transformation, die zu Krebs führen, und für die Krebsprognose ist es wichtig, Individuen zu untersuchen, um zu bestimmen, ob sie mutierte Allele besitzen, und genau zu Identifizieren, welche Mutationen die Individuen besitzen. Da viele Mutationen Punktmutationen oder extrem kleine Insertionen der Deletionen sind, die im Allgemeinen durch Standard Southern Analyse nicht detektierbar sind, bedarf eine genaue Diagnose einer Fähigkeit, ein Gen Nukleotid pro Nukleotid zu untersuchen.
  • Mutationen in den hMSH2, hMLH1 oder p53-Genen können, unabhängig davon, ob sie vorher charakterisiert wurden, durch jede der oben beschriebenen Tiling-Strategien detektiert werden. Referenzsequenzen von Interesse beinhalten genomische Sequenzen ganzer Länge und cDNA-Sequenzen von jedem dieser Gene und Teilsequenzen davon, wie Exons und Introns. Zum Beispiel kann jedes Nukleotid in der 20 kb genomischen Sequenz von p53 für das Tiling verwendet werden, indem man die grundlegende Strategie mit einem Array von etwa 80.000 Sonden benutzt. Wie in dem CFTR-Chip sind manche Referenzsequenzen vergleichsweise kurze Sequenzen, die den Ort einer bekannten Mutation und einige wenige flankierende Nukleotide einschließen. Einige Chips sind für das Tiling von Referenzsequenzen angepasst, die "Hot Spots" von Mutationen beinhalten. Zum Beispiel bindet eine Vielzahl von zellulären und onkoviralen Proteinen an bestimmte Regionen von p53, einschließlich Mdm2, SV40 T Antigen, E1b aus Adenovirus und E6 aus humanem Papillomavirus. Diese Bindungsorte korrelieren zu einem bestimmten Grad mit Regionen von p53, in denen somatische Mutationen mit hoher Frequenz beobachtet wurden, die in Tumorzellen von Krebspatienten gefunden wurden (siehe Harris et al., supra). Hot Spots schließen die Exons 2, 3, 5, 6, 7 und 8 und die Intron-Regionen zwischen Exons 2 und 3, 3 und 4 und 4 und 5 ein. Fragmente des hMLH1-Gens von besonderem Interesse schließen jene ein, die für die Codons 578–632, 727, 728, 347, 252 kodieren. Manche Chips sind so für das Tiling angepasst, dass sie Mutationen in jedem der hMSH2, hMLH1 und p53 Gene lesen, sowohl Wildtyp- als auch mutierte Versionen.
  • Standard oder asymetrische PCR kann benutzt werden, um die in den oben beschriebenen Tiling-Assays benutzte Ziel-DNA zu generieren. Im Allgemeinen wird PCR genutzt, um hMSH2, hMLH1 oder p53-Sequenzen von einem Gewebe von Interesse, wie einem Tumor, zu amplifizieren. Auch gemischte PCR-Reaktionen können benutzt werden, um in einer einzigen Reaktionsmischung gleichzeitig hMSH2, hMLH1 oder p53-Sequenzen zu generieren. Jede der kodierenden oder nicht kodierenden Sequenzen der Gene kann für die Benutzung in den oben beschriebenen Block-Tiling-Assays amplifiziert werden.
  • Tabelle 8 unten stellt Beispiele von Primern, die nützlich für die Synthese bestimmter Regionen von hMSH2, hMLH1 und p53 sind, zur Verfügung. Andere Primer können leicht von den bekannten genomischen und cDNA-Sequenzen der Gene entwickelt werden. Die in Tabelle 8 beschriebenen für die p53-Amplifikation spezifischen Primer haben Enden, die zugeschnitten sind, um das Klonieren in Standardrestriktionsenzym-Klonierungsstellen zu erleichtern.
  • Tabelle 8: Beispiele von PCR Primern, die nützlich für die Amplifizierung von Regionen von p53, hMHH1 und hMSH2 sind.
    Figure 01160001
  • Nach der PCR Amplifikation des Zielsamplikons kann ein Strang des Amplikons isoliert werden, d. h., indem ein biotinylierter Primer genutzt wird, der das Einfangen des unerwünschten Stranges auf Streptavidin-Kügelchen erlaubt. Alternativ kann asymmetrische PCR benutzt werden, um ein einzelsträniges Ziel herzustellen. Ein anderer Ansatz beinhaltet die Herstellung von einzelsträngiger RNA aus dem PCR Produkt durch den Einbau eines T7 oder anderen RNA Polymerase Promoters in einem der Primer. Das einzelsträngige Material kann optional fragmentiert werden, um kleinere Nukleinsäuren mit weniger signifikanter Sekundärstruktur als die längeren Nukleinsäuren herzustellen.
  • Bei einem solchen Verfahren wird die Fragmentierung mit Markierung kombiniert. Um dies zu erläutern, werden degenerierte 8mere oder andere degenerierte kurze Oligonukleotide mit dem einzelsträngigen Zielmaterial hybridisiert. In dem nächsten Schritt wird eine DNA Polymerase mit den 4 verschiedenen Dideoxynukleotiden hinzugefügt, jedes mit einem anderen Fluorphor markiert. Fluorophor markierte Dideoxynukleotide sind von einer Vielzahl von kommerziellen Lieferanten erhältlich. Hybridisierte 8mere werden durch ein markiertes Dideoxynukleotid erweitert. Nach einem optionalen Aufreinigungsschritt, d. h. mit einer Größenausschlußsäule werden die markierten 9mere mit dem Chip hybridisiert. Andere Verfahren der Zielfragmentierung können genutzt werden. Die einzelsträngige DNA kann durch partielle Degradation mit einer DNAse oder partielle Depurinierung mit Säure fragmentiert werden. Eine Markierung kann in einem getrennten Schritt erreicht werden, d. h. Fluorophor markierte Nukleotide können vor dem Fragmentierungsschritt eingebaut werden, oder ein DNA bindendes Fluorophor, wie Ethidium Homodimer, wird nach der Fragmentierung mit dem Ziel verbunden.
  • Beispielhafte Chips
  • a. Exon VI Chip
  • Um den Wert der erfindungsgemäßen DNA Chips in einem solchen Verfahren zu erläutern, wurde ein DNA Chip mit der VLSIPS Verfahren synthetisiert, um ein Array von überlappenden Sonden bereitzustellen, die eine 60 Basenregion von Exon 6 des p53 Gens repräsentieren oder für das Tiling anpassen. Um die Fähigkeit, Substitutionsmutationen mit dem Ziel zu detektieren, zu demonstrieren, waren 12 unterschiedliche einzelne Substitutionsmutationen (Wildtyp und 3 unterschiedliche Substitutionen an jeder von drei Positionen) auf dem Chip, neben dem Wildtyp repräsentiert. Jede dieser Mutationen wurde durch eine Serie von 12mer Oligonukleotidsonden repräsentiert, die zu dem Wildtypziel komplementär waren, außer an der einen substituierten Base. Jede der 12 Sonden war zu einer unterschiedlichen Region des Ziels komplementär und enthielt die mutierte Base an einer unterschiedlichen Position, z. B. wenn die Substitution bei Base 32 war, wäre der Sondensatz – mit der Ausnahme von Base 32 – zu den Regionen des Ziels 21–32, 22–33 und 32–43, komplementär. Dies erlaubte die Untersuchung der Auswirkung der Substitutionsposition innerhalb der Sonde. Die Ausrichtung einiger der Sonden mit einer 12mer Modellzielnukleinsäure ist in 27 gezeigt.
  • Um die Wirkung von Sondenlänge zu demonstrieren, wurde eine zusätzliche Serie von 10mer Sonden für jede Mutation eingeschlossen (s. 28). In der Nähe der substituierten Positionen wurde die Wildtypsequenz durch jede mögliche überlappende 12mer und 10mer Sonde dargestellt. Um Vergleiche zu erleichtern, waren die Sonden, die jeder variierten Position entsprechen, auf dem Chip in rechteckigen Regionen mit der folgenden Struktur angeordnet: Jede Reihe von Zellen stellt eine Substitution dar, wobei die oberste Reihe den Wildtyp darstellt. Jede Spalte enthält Sonden, die zu der gleichen Region des Ziels komplementär sind, wobei Sonden, die zu dem 3'Ende des Ziels komplementär sind, auf der Linken, und Sonden, die zu dem 5'Ende des Ziels komplementär sind, auf der Rechten sind. Der Unterschied zwischen zwei benachbarten Spalten ist eine Verschiebung um eine einzige Base in der Position der Sonden. Wann immer es möglich war, wurden die Serien von 10mer Sonden in 4 Reihen direkt untereinander angeordnet und mit den 4 Reihen von 12mer Sonden für die gleiche Mutation ausgerichtet.
  • Um Modellziele zur Verfügung zu stellen, wurden 5' fluroesceinierte 12mere, die in der ersten Position von Codon 192 alle möglichen Substitutionen enthalten, synthetisiert (s. die mit * gekennzeichnete Position in dem Ziel in 27). 10 nM Ziel DNA in 6 × SSPE, 0,25 Triton X-100 enthaltende Lösungen wurden bei Raumtemperatur für mehrere Stunden mit dem Chip hybridisiert. Während Zielnukleinsäure mit dem Chip hybridisiert war, wurden die Fluorophoren auf dem Chip mit Licht von einem Argon Laser angeregt, und der Chip wurde mit einem autofokussierenden konfokalen Mikroskop gescannt. Die emittierten Signale wurden von einem PC verarbeitet, um mit Bildanalysesoftware ein Bild zu erstellen. Nach 1–3 Stunden hatte das Signal ein Plateau erreicht; um das hybridisierte Ziel zu entfernen und die Hybridisierung mit einem anderen Ziel zu erlauben, wurde der Chip mit 60% Formamid, 2 × SSPE bei 17°C für 5 Min. gestrippt. Der Waschpuffer und die Temperatur können sich unterscheiden, aber der Puffer enthält typischerweise 2–3 × SSPE, 10–60% Formamid (man kann mehrere Waschschritte benutzen, wobei die Formamidkonzentration bei jedem Waschschritt um 10% erhöht wird, und zwischen Waschschritten scannen, um festzustellen, wann die Waschung vollständig ist), und optional einen kleinen Anteil von Triton X-100, und die Temperatur ist typischerweise in dem Bereich von 15–18°C.
  • Nach Hybridisierung mit Zielen mit 1-Basensubstitutionen und Visualisierung mit einem konfokalen Mikroskop und Softwareanalyse, wie in 29 gezeigt, wurden sehr unterschiedliche Muster beobachtet. Im allgemeinen erzeugen Sonden, die perfekte Übereinstimmungen mit dem Ziel aufweisen, das höchste Signal. Zum Beispiel sind in dem ersten Bild die 12mer Sonden, die perfekte übereinstimmende Paare mit dem Wildtyp (wt) Ziel bilden, in der ersten Reihe (oben). Die 12mer Sonden mit Nichtübereinstimmungen einer Base sind in den 2., 3. und 4 Reihen lokalisiert und weisen viel geringere Signale auf. Die Daten sind auch graphisch in 30 dargestellt. In jedem Graph ist die x-Ordinate die Position der Sonde in ihrer Reihe auf dem Chip und die y-Ordinate das Signal an dem Ort dieser Sonde nach der Hybridisierung. Wenn ein Ziel mit einer unterschiedlichen 1-Basensubstitution hybridisiert wird, weist der komplementäre Sondensatz das höchste Signal auf (s. Bilder 2, 3, und 4 in 29 und Graphen 2, 3 und 4 in 30). In jedem Fall hat der Sondensatz ohne Nichtübereinstimmungen mit dem Ziel das die höchsten Signale. Innerhalb eines 12mer Sondensatzes war das Signal an Position 6 oder 7 am höchsten. Die Graphen zeigen, daß die Signaldifferenz zwischen 12mer Sonden an der gleichen x-Ordinate dazu tendierte, an Positionen 5 und 8 am größten zu sein, wenn das Ziel und die komplementären Sonden jeweils 10 Basenpaare und 11 Basenpaare ausbildeten. Da Tumoren oft sowohl wt als auch mutierte p53 Gene haben, wurden auch gemischte Zielpopulationen mit dem Chip hybridisiert, wie in 31 gezeigt. Wenn die Hybridisierungslösung aus einer 1 : 1 Mischung von wt 12mer und einem 12mer mit einer Substitution in Position 7 des Ziels bestand, zeigten die Sondensätze, die perfekt mit beiden Zielen übereinstimmten, höhere Signale als die anderen Sondensätze.
  • Die Hybridisierungseffizienz eines 10mer Sondenarrays im Vergleich zu einem 12mer Sondenarray wurde auch verglichen. Die 10mer und 12mer Sondenarrays ergaben vergleichbare Signale (s. Graphen 1 bis 4 in 30 und Graphen 1 bis 4 in 32). Die 10mer Sondensätze in den Reihen 5 bis 8 (s. Bilder in 29) schienen jedoch, konsistent mit der Erwartung, daß Nicht-Übereinstimmungen einer Base für 10mere mehr destabilisierend als für 12mere sind, in diesem Modellsystem besser bei der Auflösung eines Ziels von dem anderen zu sein als die 12mer Sondensätze. Hybridisierungsergebnisse mit perfekt mit dem Ziel übereinstimmenden Sondensätzen folgten auch der Erwartung, daß das Signal dest höher war, je mehr Übereinstimmungen die individuelle Sonde mit dem Ziel ausbildete. Duplexe mit 2 am 3' herabhängenden Basen (s. 30, Position 6 in Graphen 1–4) weisen etwa soviel Signal wie die Sonden auf, die an ihrer ganzen Länge übereinstimmen (s. 30, Position 7 in Graphen 1–4).
  • Dieses beispielshafte Modellsystem zeigt, daß 12mer Ziele, die sich in 1-Basensubstitutionen unterscheiden, einfach mit dem durch die Erfindung bereitgestellten neuen Sondenarrray voneinander unterschieden werden können und daß die Auflösung der verschiedenen 12mer Ziele etwas besser mit den 10mer Sondensätzen als mit den 12mer Sondensätzen war.
  • b. Exon V Chip
  • Um die DNA aus Exon 5 des p53 Tumorsuppressorgens zu analysieren, wurde auf einem Chip ein Satz von überlappenden 17mer Sonden synthetisiert. Die Sonden für das Wildtypallel wurden für das Tiling über das gesamte Exon mit Überlappungen einzelner Basen zwischen Sonden synthetisiert. Für jede Wildtypsonde wurden Sätze von 4 zusätzlichen Sonden, eine für jede mögliche Basensubstutition an Position 7, synthetisiert und in einer Spalte in Bezug auf die Wildtypsonde angeordnet. Exon 5 DNA wurde durch PCR mit das Exon flankierenden Primern amplifiziert. Einer der Primer war mit Fluorescein markiert; der andere Primer war mit Biotin markiert. Nach der Amplifizierung wurde der biotinylierte Strang durch Bindung an Streptavidin-Kügelchen entfernt. Der fluoresceinierte Strang wurde bei der Hybridisierung verwendet.
  • Etwa 1/3 der amplifizierten einzelsträngigen Nukleinsäure wurde über Nacht in 5 × SSPE bei 60°C mit dem Sondenchip (unter einem Deckgläschen) hybridisiert. Nach Waschen mit 6 × SSPE wurde der Chip unter Benutzung von konfokaler Mikroskopie gescannt. 33 zeigt ein Bild des p53 Chips, hybridisiert mit der Ziel-DNA. Eine Analyse der Intensitätsdaten zeigte, daß 93,5% der 184 Basen von Exon 5 in Übereinstimmung mit der wt Sequenz abgerufen wurden (s. Buchmann et al., 1988, Gene 70: 245–252). Die falsch abgerufenen Basen stammten von Positionen, an denen die Signalintensitäten der Sonden unentschieden waren (1,6%) und wo nicht wt Sonden die höchste Signalintensität aufwiesen (4,9%). 34 illustriert, wie die tatsächliche Sequenz gelesen wurde. Lücken in der Folge von Buchstaben in den wt Reihen entsprechen Kontrollsonden oder -orten. In Zellen, die Sonden entsprechen, in denen die Wildtypbasen durch andere Basen substitutiert wurden, werden Positionen, an denen Basen falsch abgerufen wurden, durch Buchstaben in kursivem Schrifttyp dargestellt.
  • Wie das Diagramm zeigt, stammen die falsch abgerufenen Basen von der Region niedriger Intensität des Bildes, was wegen Sekundärstrukturen im Ziel oder Sonden, die intermolekulare Hybridisierung verhindern, sein mag. Um die Effekte wegen Sekundärstrukturen zu verringern, kann man kürzere Ziele nutzen (d. h. durch Zielfragementierung) oder stringentere Hybridisierungsbedingungen nutzen. Zusätzlich kann die Benutzung eines Sondensatzes, der durch Tiling über den anderen Strang eines Duplexziels synthetisiert wurde, auch Sequenzinformationen bereitstellen, die in der Sekundärstruktur des anderen Stranges vergraben ist. Es sollte jedoch anerkannt werden, daß das Muster von Regionen niedriger Intensität, das sich als Ergebnis von Sekundärstruktur in dem Ziel bildet, selbst ein Mittel bereitstellt, um festzustellen, daß eine bestimmte Zielsequenz in einer Probe vorliegt. Andere Faktoren, die zu geringen Signalintensitäten beitragen können, beinhalten Unterschiede in der Dichte und Hybridisierungsstabilität der Sonden.
  • Diese Ergebnisse demonstrieren die durch die erfindungsgemäßen DNA Chips bereitgestellten Vorteile für die genetische Analyse. Als anderes Beispiel werden im Moment heterozygote Mutationen durch ein arbeitsaufwendiges Verfahren sequenziert, das Klonierung und Wiederreinigung von DNA beinhaltet. Der Klonierungsschritt ist notwendig, da Gelsequenzierungssysteme schlecht darin sind, selbst eine 1 : 1 Mischung von DNA aufzulösen. Zum ersten wird die Ziel-DNA mit Primern durch PCR amplifiziert, die eine leichte Ligation in einen Vektor erlauben, welcher durch Transformation von E. coli aufgenommen wird, was wiederum kultiviert werden muß, typischerweise über Nacht auf Platten. Nach dem Wachsen der Bakterien wird DNA in einem Verfahren gereinigt, das typischerweise etwa 2 Stunden dauert; dann werden die Sequenzierungsreaktionen durchgeführt, was mindestens eine weitere Stunde in Anspruch nimmt, und die Proben werden für mehrere Stunden auf einem Gel laufen gelassen, wobei die Dauer von der Länge des zu sequenzierenden Fragments abhängt. Im Gegensatz dazu stellt die vorliegende Erfindung nach kurzen Transkriptions- und Fragmentierungsschritten eine direkte Analyse des PCR-amplifizierten Materials bereit, was Tage von Zeit und Arbeit spart.
  • D. Mitochondriale Genom-Chips
  • Eine humane Zelle kann mehrere Hundert Mitochondrien enthalten, jedes mit mehr als einer Kopie von mtDNA. Es gibt eine Asymmetrie in der Basenzusammensetzung der Stränge, wobei ein Strang (schwer) relativ G-reich ist und der andere Strang (leicht) C-reich ist. Der L-Strang besteht aus 30,9% aus A, 31,2% aus C, 13,1 aus G und 24,7% aus T. Humane mtDNA ist informationsreich und kodiert einige 22 tRNAs, 125 und 16S rRNAs und 13 bei der oxidativen Phosphorylierung beteiligte Polypeptide. Es wurden keine Introns detektiert. RNAs werden durch Spaltung an tRNA-Sequenzen prozessiert und posttranskriptionell polyadenyliert. Bei einigen Transkripten stellt Polyadenylierung auch das Stoppcodon her, was die Sparsamkeit der Kodierung illustriert. In manchen Individuen kann mtDNA als haploid behandelt werden. Manche Individuen sind jedoch heteroplasmisch (haben mehr als eine mtDNA-Sequenz), und der Grad der Heteroplasmität kann sich von Gewebe zu Gewebe unterscheiden. Die Rate der Replikation von mtDNAs kann sich auch unterscheiden, und zusammen mit zufälliger Teilung während der Zellteilung kann dies zu Veränderungen der Heteroplasmität über die Zeit hinweg führen.
  • Das humane mitochondriale Genom ist 16.569 Nukleotide lang. Die Sequenz des L-Stranges wird beliebig ab der MboI-5/7-Grenze in der D-Loop-Region numeriert. Die gesamte Sequenz des humanen mitochondrialen Genoms wurde publiziert. Siehe Anderson et al., Nature 290, 457–465 (1981). Mitochondriale DNA wird mütterlicherseits vererbt, und hat eine Mutationsrate, die als zehnmal höher als nukleäre DNA in einfacher Kopie geschätzt wird (Brown et al., Proc. Natl. Acad. Sci. USA 76, 1967–1971 (1979)). Humane mtDNAs unterscheiden sich durchschnittlich durch etwa 70 Basensubstitutionen (Wallace, Ann. Rev. Biochem. 61, 1175–1212 (1992)). Mehr als 80% der Substitutionen sind Transitionen (d. h. Pyrimidin-Pyrimidin oder Purin-Purin).
  • Die Analyse von mitochondrialer DNA dient mehreren Zwecken. Die Detektion von Mutationen in den mitochondrialen Genom erlaubt die Diagnose einer Anzahl an Erkrankungen. Das mitochondriale Genom wurde als Locus von mehreren Mutationen, die mit humanen Erkrankungen assoziiert sind, identifiziert. Einige der Mutationen ergeben Stoppcodons in strukturellen Genen. Solche Mutationen wurden kartiert und mit Erkrankungen assoziiert, wie Leber'sche hereditäre Optikusneuropathie, neurogener Muskelschwäche, Ataxia und Retinitis pigmentosa. Andere Mutationen (Nukleotidsubstitutionen) treten in tRNA-kodierenden Sequenzen auf, und verursachen vermutlich konformationelle Schäden in transkribierten tRNA-Molekülen. Solche Mutationen wurden ebenfalls kartiert und mit Krankheiten wie myoklonischer Epilepsie und Ragged Red Fiber-Erkrankung assoziiert. Eine andere Art der Mutation, die häufig gefunden wird, sind Deletionen und/oder Insertionen. Einige Deletionen überspannen Abschnitte von mehreren kb. Solche Mutationen wurden wiederum kartiert und mit Erkrankungen assoziiert, z. B. okularer Myopathie und Person-Syndrom. Siehe Wallace, Ann. Rev. Biochem. 61-1175-1212 (1992). Eine frühe Detektion solcher Erkrankungen erlaubt die Administration von metabolischer oder genetischer Therapie, bevor unwiderruflicher Schaden aufgetreten ist. Dasselbe. Analyse mitochondrialer DNA ist auch für forensische Reihenuntersuchun gen wichtig. Da die das mitochondriale Genom ein Ort hoher Variabilität zwischen Indidviduen ist, stellt die Sequenzierung einer nennenswerten Länge von mitochondrialen DNA einen Fingerabdruck zur Verfügung, der hochspezifisch für ein Individuum ist. Analyse mitochondrialer DNA ist auch für evolutionäre und epidemologische Studien wichtig.
  • Die Referenzsequenz kann ein ganzes mitochondriales Genom oder jegliches Fragment davon sein. Für forensische und epidemologische Studien ist die Referenzsequenz oft das Ganze oder ein Teil der D-Loop-Region, in der die Variabilität zwischen Individuen am größten ist (z. B. von 16024–16401 und 29–408). Für die Detektion von Mutationen ist die Analyse des ganzen Genoms als Referenzsequenz nützlich, aber kürzere Abschnitte, einschließlich der Orte von bekannten Mutationen und etwa 1–20 flankierenden Basen, sind auch nützlich. Einige Chips haben Sonden für das Tiling von gepaarten Referenzsequenzen, die Wildtyp- und mutierte Versionen einer Sequenz darstellen. Das Tiling einer zweiten Referenzsequenz ist besonders nützlich für die Detektion einer Insertionsmutation, die in 30–50% der Okularen Myopathie- und Pearson-Syndrom-Patienten auftritt, welche aus direkten Wiederholungen der Sequenz ACCTCCCTCACCA besteht. Einige Chips beinhalten Refernzsequenzen von mehr als einem mitochondrialen Genom.
  • Michochondriale Referenzsequenzen können für das Tiling unter Benutzung jeder der oben erwähnten Strategien verwendet werden. Die Block-Tiling-Strategie ist besonders nützlich für die Analyse von kurzen Referenzsequenzen oder bekannten Mutationen. Entweder die Blockstrategie oder die grundlegende Strategie ist für die Analyse von langen Referenzsequenzen angemessen. In vielen der Tiling-Strategien ist es möglich, verglichen mit der Anzahl, die bei anderen Chips verwendet wird, weniger Sonden ohne signifikanten Verlust von Sequenzinformation zu benutzen. Wie oben bemerkt, sind die meisten Punktmutationen in mitochondrialer DNA Transitionen, so dass für jedes Wildtypnukleotid einer Referenzsequenz eine von drei möglichen Nukleotidsubstitutionen wahrscheinlicher ist als die anderen beiden. Demgemäß kann in der grundlegenden Tiling-Strategie z. B. eine Referenzsequenz für das Tiling mit nur zwei Sondensätzen angepasst werden. Ein Sondensatz umfasst eine Vielzahl an Sonden, wobei jede Sonde einen Abschnitt aufweist, der genau komplementär zu der Referenzsequenz ist. Der zweite Sondensatz umfasst eine entsprechende Sonde für jede Sonde in dem ersten Satz. Eine Sonde in dem zweiten Sondensatz unterscheidet sich von der entsprechenden Sonde des ersten Sondensatzes jedoch in einer Abfrageposition, in der die Sonde des zweiten Sondensatzes die Transition des in dieser Position der Sonde des ersten Sondensatzes vorliegenden Nukleotids einschließt.
  • Mitochondriale Ziel-DNA kann vor der Hybridisierung unter Benutzung der gleichen, für andere Chips beschriebenen Verfahren amplifiziert, markiert und fragmentiert werden. Die Benutzung von mindestens zwei markierten Nukleotiden ist erwünscht, um eine gleichmäßige Markierung zu erreichen. Einige beispielhafte Primer sind unten beschrieben und andere Primer können mit der bekannten Sequenz der mitochondrialen DNA entworfen werden. Da mitochondriale DNA in mehreren Kopien pro Zelle vorliegt, kann sie auch direkt, ohne vorherige Amplifikation, mit einem Chip hybridisiert werden.
  • Beispielhafte Chips
  • Die Erfindung stellt einen DNA-Chip für die Analyse von Sequenzen bereit, die in einem 1,3 kb Fragment humaner mitochondrialer DNA aus der "D-Loop"-Region enthalten sind, der am stärksten polymorphen Region der humanen mitochondrialen DNA. Ein solcher Chip umfasst einen Satz von 269 überlappenden Oligonukleotidsonden unterschiedlicher Länge in dem Bereich von 9–14 Nukleotiden mit unterschiedlichen Überlappungen, angeordnet in 600 × 600 micron Merkmalen oder Syntheseorten in einem Array der Größe 1 cm × 1 cm. Die Sonden auf dem Chip sind unten in Spaltenform gezeigt. Ein beispielhafter erfindungsgemäßer mitochondrialer DNA-Chip umfasst die folgenden Sonden (X, Y Koordinaten sind gezeigt, gefolgt von der Sequenz; "DL3" stellt das 3'-Ende der Sonde dar, das kovalent mit der Oberfläche des Chips verbunden ist.)
  • Figure 01270001
  • Figure 01280001
  • Figure 01290001
  • Keine Sonden waren in den Positionen X, Y = 0, 12 – X, Y = 4, 12; X, Y = 0, 13 – X, Y = 4, 13; X, Y = 0, 14 – X, Y = 4, 14; X, Y = 0, 15 – X, Y = 4, 15; X, Y = 0, 16 – X, Y = 4, 16; anwesend. Die Länge jeder der Sonden auf dem Chip war variabel, um Unterschiede der Schmelztemperatur und des Potentials für Kreuzhybridisierung zu minimieren. Jede Position in der Sequenz wurde von mindestens einer Sonde dargestellt und die meisten Positionen wurden durch zwei oder mehr Sonden dargestellt. Wie oben erwähnt, unterschied sich die Menge der Überlappung zwischen den Oligonukleotiden von Sonde zu Sonde. 35 zeigt das menschliche mitochondriale Genom; "OH" ist der Origin of Replication des H-Stranges und und Pfeile weisen auf die klonierte nicht schattierte Sequenz hin.
  • DNA wurde aus Haarwurzeln von sechs humanen Spendern (mt1–mt\ 6) hergestellt, und dann durch PCR amplifiziert und in M13 kloniert; die sich ergebenden Klone wurden unter Benutzung von Kettenterminatoren sequenziert, um zu verifizieren, dass die erwünschten spezifischen Sequenzen anwesend waren. DNA der sequenzierten M13-K1one wurde durch PCR amplifiziert, in vitro transkribiert und mit Fluorescein-UTP unter Benutzung der T3 RNA-Polymerase markiert. Die 1,3 kb RNA-Transkripte wurden fragmentiert und mit dem Chip hybridisiert. Die Ergebnisse zeigten, dass jedes unterschiedliche Individuum DNA aufwies, die einen einzigartigen Hybridierungsfingerabdruck auf dem Chip produzierte, und dass die Unterschiede in dem beobachteten Muster mit Unterschieden in der klonierten genomischen DNA-Sequenz korreliert werden konnten. Die Ergebnisse zeigten auch, dass sehr lange Sequenzen einer Zielnukleinsäure in ihrer Gesamtheit als ein spezifischer Satz von überlappenden Oligonukleotiden dargestellt werden kann, und dass Arrays aus solchen Sondensätzen nützlicherweise bei der genetischen Analyse angewendet werden können.
  • Die Nukleinsäure der Probe wurde in einer aus 6 × SSPE, 0,1 Triton-X 100 bestehenden Lösung für 60 Minuten bei 15°C mit dem Chip hybridisiert. Der Chip wurde dann mit konfokaler Scanning-Fluoreszenzmikroskopie gescannt. Die individuellen Merkmale auf dem Chip maßen 588 × 588 Microns, aber die Merkmale in den unteren linken 5 × 5 Quadrat in dem Array enthielten keine Sonden. Um die Daten zu quantifizieren, wurden innerhalb jedes Syntheseorts Pixelzählungen gemessen. Pixel repräsentieren 50 × 50 Microns. Die Fluoreszenzintensität für jedes Merkmal wurde in ihrem Maßstab einem Durchschnitt angepasst, der von 27 hellen Merkmalen bestimmt wurde. Nach dem Scannen wurde der Chip gestrippt und rehybridisiert; alle sechs Proben wurden mit dem selben Chip hybridisiert. 36 zeigt das mit der mt4-Probe auf dem DNA-Chip beobachtete Bild. 37 zeigt das mit der mt5-Probe auf dem DNA-Chip beobachtete Bild. 38 zeigt das vorhergesagte Differenzbild zwischen den mt4 und mt5-Proben auf dem DNA-Chip, basierend auf Nichtübereinstimmungen zwischen den zwei Proben und der Referenzsequenz (siehe Anderson et al., supra). 39 zeigt das tatsächlich beobachtete Differenzbild.
  • Die Ergebnisse zeigen, dass in fast allen Fällen nicht übereinstimmende Sonden/Zielhybride zu geringeren Fluoresceinzintensitäten als perfekt übereinstimmende Hybride führten. Dennoch bestimmten manche Sonden Mutationen (oder bestimmte Sequenzen) besser als andere, und in mehreren Fällen waren die Unterschiede innerhalb des Niveaus an Hintergrundrauschen. Verbesserungen können durch eine Erhöhung der Menge der Überlappung zwischen Sonden und damit der Gesamtsondendichte, und für Duplex-DNA-Ziele durch die Verwendung eines zweiten Sondensatzes, der dem zweiten Strang des Ziels entspricht, realisiert werden, entweder auf dem gleichen oder einem getrennten Chip. 40 zeigt auf Blättern 1 und 2 eine Auftragung der normalisierten Intensitäten über die Reihen 10 und 11 des Arrays und eine Tabelle der detektierten Mutationen.
  • 41 zeigt die mit diesem Chip erhaltene Unterscheidung zwischen Wildtyp und mutierten Hybriden. Der Median der sechs normalisierten Hybridisierungswerte für jede Sonde wurde errechnet. Der Graph trägt das Verhältnis des Median-Wertes zu den normalisierten Hybridisierungswerten gegenüber mittleren Zählungen auf. Auf diesem Graph ergibt ein Verhältnis von 1,6 und durchschnittliche Zählungen über 50 keine falsch Positiven, und während es klar ist, dass die Detektion mancher Mutanten verbessert werden kann, wird hervorragende Unterscheidung erreicht, wenn man die kleine Größe des Arrays betrachtet. 42 illustriert, wie die Identität der Nichtübereinstimmung der Base die Fähigkeit, mutierte und Wildtypsequenzen zu unterscheiden, mehr beeinflussen kann als die Position der Nichtübereinstimmung innerhalb einer Oligonukleotidsonde. Die Position der Nichtübereinstimmung ist in % der Sondenlänge von dem 3'-Ende aus angegeben. Der Basenaustausch ist auf dem Graph angegeben. Die Ergebnisse zeigen, dass der DNA-Chip die Kapazität des Standard-Reversen Dot Blots um Größenordnungen erhöht, was die Stärken dieses Ansatzes vielfach ausdehnt, und daß die erfindungsgemäßen Verfahren effizienter und leichter zu automatisieren sind als gelbasierende Verfahren der Nukleinsäuresequenz- und Mutationsanalyse.
  • Um diese Vorteile weiter zu erläutern, wurde ein zweiter Chip für die Analyse eines längeren Abschnittes aus humaner mitochondrialer DNA (mtDNA) vorbereitet. Der Chip ist für das Tiling durch 648 Nukleotide einer Referenzsequenz, umfassend humane H-Strang-mt DNA der Positionen 16280 – 356, angepasst und erlaubt die Analyse jeden Nukleotids in der Referenzsequenz. Die Sonden in dem Array sind 15 Nukleotide lang, und jede Position der Zielsequenz wird durch einen Satz von vier Sonden dargestellt (A, C, G, T Substitutionen), welche sich voneinander an Position 7 von dem 3'-Ende aus unterschieden. Das Array besteht aus 13 Blöcken von 4 × 50 Sonden: Jeder Block scannt durch 50 Nukleotide fortlaufender mtDNA-Sequenz. Die Blöcke sind durch leere Reihen getrennt. Die vier Eckspalten enthalten Kontrollsonden; es gibt insgesamt 2.600 Sonden in einer quadratischen Region von 1,28 cm × 1,28 cm (Merkmal) und jede Region ist 256 × 196 Micron groß.
  • Ziel-RNA wurde wie oben hergestellt. Die RNA wurde fragmentiert und mit dem Oligonukleotidarray in einer Lösung bestehend aus 6 × SSPE, 0,1% Triton X-100 für 60 Minuten bei 18°C hybridisiert. Nicht hybridisiertes Material wurde mit Puffer weggewaschen und der Chip wurde mit 25 Mikron Pixel Auflösung gescannt.
  • 43 stellt eine 5'- bis 3'-Sequenzliste von einem Ziel, das den Sonden auf dem Chip entspricht, bereit. X ist eine Kontrollsonde. Positionen, die sich in dem Ziel unterscheiden, sind fett gedruckt (d. h. die mit der Sonde an dem bestimmten Ort nicht übereinstimmen). 44 zeigt das durch Scannen des Chips bei Hybridierung mit dieser Probe produzierte Bild. Etwa 95% der Sequenz konnten korrekt von nur einem Strang der ursprünglichen Duplex-Zielnukleinsäure abgelesen werden. Obwohl einige Sonden keine hervorragende Unterscheidung bereitstellten und einige Sonden nicht effizient mit dem Ziel zu hybridisieren schienen, wurden hervorragende Ergebnisse erreicht. Die Zielsequenz unterschied sich von dem Sondensatz an sechs Positionen: vier Transitionen und zwei Insertionen. Alle vier Transitionen wurde detektiert, und bestimmte Sonden konnten leicht in das Array eingebaut werden, um Insertionen oder Deletionen zu detektieren. 45 illustriert die Detektion von vier Transitionen in der Zielsequenz relativ zu den Wildtypsonden auf dem Chip.
  • Ein weiterer Chip, der Sonden für das Tiling über die gesamte D-Loop-Region (1,3 kb) der mtDNA-Sequenzen von zwei Menschen umfasst, wurde konstruiert. Die Sonden wurden unter Benutzung der grundlegenden Tiling-Strategie für das Tiling in Reihen von vier angepasst. Die Sonden waren überlappende 15mere, die eine Abfrageposition sieben Nukleotide von dem 3'-Ende aus aufwiesen. Die gesamte Gruppe von Sonden für das Tiling der Re ferenzsequenz des ersten Individuums, als mt1 bezeichnet, besetzte die obere Hälfte des Chips. Die untere Hälfte des Chips enthielt ein ähnliches Arragement basierend auf einem zweiten Klon, mt2. Die Sonden wurden in einer Region von 1,28 × 1,28 cm synthetisiert, welche eine Matrix von 115 × 120 Zellen enthielt. Der Chip enthielt eine Gesamtheit von 10.488 mtDNA-Sonden.
  • Sechs Proben von Ziel-DNA wurden aus Haarwurzeln von sechs Individuen extrahiert. Die 1,3 kb-Region, die Positionen 15935 – 667 der humanen mtDNA umspannt, wurde mit PCR amplifiziert, in den Bakteriophagen M13 kloniert und mit konventionellen Verfahren sequenziert. Die 1,3 kb-Region wurde aus dem Phagenklon unter Benutzung der Primer L15935-T3, 5'CTCGGAATTAACCCTCACTAAAGGAAACCTTTTTCCAAGGA und H667-T7, 5'TAATACGACTCACTATAGGGAGAGGCTAGGACCAAACCTATT mit angehängten T3- und T7-RNA-Polymerasepromotersequenzen reamplifiziert. Markierte RNA wurde durch in vitro-Transkription unter Benutzung der T3-RNA-Polymerase und fluoresceinierter Nukleotide hergestellt, fragmentiert und mit dem Chip für die Resequenzierung der mtDNA-Kontrollregion bei Raumtemperatur für 60 Minuten in 6X SSPE + 0,05% Tritan X-100 hybridisiert. 6 Waschschritte wurden bei Raumtemperatur ausgeführt, indem 6 × SSPE + 0,005% Triton X-100 verwendet wurden, und der Chip wurde gelesen. Die Signalintensitäten underschieden sich merklich über den Chip hinweg, aber der große dynamische Bereich des Detektionssystems erlaubte die genaue Quantifizierung der Intensitäten über mehrere Größenordnungen hinweg. Sogar relativ niedrige Signalintensitäten ergaben genaue Ergebnisse.
  • Fünf unterschiedliche Klone (mt1–5) wurden hybridisiert, jeweils mit einem getrennten Chip. Die Referenzsequenz wurde auch für vergleichende Zwecke hybridisiert. Die durchschnittlichen Zählungen pro Sondenzelle wurden bestimmt und durch automatisierte Software für das Abrufen von Basen benutzt, um die Sequenz zu lesen. Die Genauigkeit der von dem Chip abgelesenen Sequenz ist wie folgt zusammengefasst. Der Chip las insgesamt 6.310 Nukleotide, wenn die Daten der fünf analysierten Ziele kombiniert wurden. 55 dieser Nukleotide in den Zielsequenzen waren verschieden von der Referenzsequenz (durch konventionelle Sequenzierung beurteilt) (41 dieser 55 Nukleotide wurden sowohl korrekt von dem Chip detektiert als auch abgelesen). Sechs von 55 Nukleotiden wurden als mehrdeutig bestimmt, aber ihre Identität konnte nicht gelesen werden. Zwei von 55 Nukleotiden wurden als Mutationen bestimmt, aber ihre Identität wurde falsch abgerufen. Sechs von 55 Nukleotiden wurden fälschlicherweise als Wildtyp abgerufen. Von den 6.255 Nukleotiden in der Zielsequenz, die identisch mit der Referenzsequenz waren, wurden nur 36 (0,57% falsch abgerufen oder als mehrdeutig gewertet).
  • Ein weiterer Chip wurde konstruiert, der Sonden für das Tiling über eine Referenzsequenz umfasst, die ein gesamtes mitochondriales Genom umfasst. Bei diesem Chip wurde eine Block-Tiling-Strategie benutzt. Jeder Block wurde entworfen, um sieben Nukleotide einer Zielsequenz zu analysieren. Jeder Block bestand aus vier Sondensätzen, wobei die Sondensätze jeweils sieben Sonden aufwiesen. Ein Block war auf dem Chip in sieben Spalten von vier Sonden angeordnet. Die obere Sonde war in jeder Spalte die gleiche, wobei dies eine genau zu einer Teilsequenz der Referenzsequenz komplementäre Sonde ist. Die drei anderen Sonden in jeder Spalte waren identisch mit der oberen Sonde, außer an einer Abfrageposition, die von einer unterschiedlichen Base in jeder der vier Sonden in der Spalte besetzt war. Die Abfrageposition verschob sich zwischen aufeinanderfolgenden Spalten um eine Position. Damit waren, außer an den sieben Abfragepositionen, eine in jeder der Spalten von Sonden, alle Sonden, die einen Block besetzten, identisch. Das Array umfasste viele solcher Blöcke, jeder für das Tiling von aufeinanderfolgenden Teilsequenzen der mitochondrialen DNA-Referenzsequenz. Insgesamt war der Chip für das Tiling von 15.569 Nukleotiden der Referenzsequenz angepasst, mit doppeltem Tiling an 42 Positionen. 66.276 Sonden besetzten einen Array von 304 × 315 Zellen, wobei jede Zelle eine Fläche von 42 × 41 Micron aufwies.
  • Der Chip wurde mit den gleichen Zielsequenzen wie für die D-Loop-Region beschrieben hybridisiert, außer dass die Hybridisierung bei 15°C für zwei Stunden stattfand. Der Chip wurde bei einer Auflösung von 5 Mikron gescannt, um ein Bild mit etwa 64 Pixeln pro Zelle zu ergeben. Für Sondenblöcke für das Tiling über die D-Loop-Region wurde ein sequenzspezifisches Hybridisierungsmuster erhalten. Für andere Blöcke wurde nur Hintergrundhybridisierung beobachtet.
  • Diese Ergebnisse illustrieren, dass längere Sequenzen unter Verwendung der erfindungsgemäßen DNA-Chips und Verfahren gelesen werden können, verglichen mit konventionellen Sequenzierungsverfahren, bei denen die Länge des Ablesens durch die Auflösung der Gelelektrophorese limitiert ist. Die Hybridisierung und Signaldetektion benötigt weniger als eine Stunde und kann leicht durch angemessene Wahl von Puffern, Temperaturen, Sonden und Reagenzien verkürzt werden.
  • III. Arten, die Erfindung anzuwenden
  • A. VLSIPSTM Technologie
  • Wie oben bemerkt, wird die VLSIPSTM Technologie in einer Anzahl von Patentpublikationen beschrieben und ist für die Herstellung der erfindungsgemäßen Oligonukleotidarrays bevorzugt. In diesem Beispiel und den begleitenden Figuren wird eine kurze Beschreibung, wie diese Technologie benutzt werden kann, um DNA-Chips herzustellen und zu untersuchen, bereitgestellt. Bei dem VLSIPSTM Verfahren scheint Licht durch eine Schablone, um auf der Oberfläche eines festen Trägers funktionelle (bei Oligonukleotiden typischerweise -OH) Gruppen, die mit einer durch Licht entfernbaren Schutzgruppe geschützt sind, zu aktivieren. Nach der Lichtaktivierung wird ein Nukleosidbaublock, selbst mit einer durch Licht entfernbaren Schutzgruppe (an dem 5'-OH) geschützt, mit den aktivierten Regionen des Trägers gekoppelt. Das Verfahren kann unter Verwendung verschiedener Schablonen oder Orientierungen von Schablonen und Baublöcken wiederholt werden, um sehr dichte Arrays von vielen unterschiedlichen Oligonukleotidsonden herzustellen. Das Verfahren wird in 46 illustiert; 47 illustriert, wie das Verfahren genutzt werden kann, um "Nucleosid Kombinatorik" oder Oligonukleotide, die durch Kopplung aller vier Nukleoside zur Bildung von Dimeren, Trimeren und so weiter synthetisiert wurden, herzustellen.
  • Neue Verfahren für die kombinatorische chemische Synthese von Peptid-, Polykarbamat-, und Oligonukleotidarrays wurden vor Kurzem berichtet (siehe Fodor et al., 1991, Science 251: 767– 773; Cho et al., 1993, Science 261: 1303–1305; und Southern et al., 1992, Genomics 13: 1008–10017). Diese Arrays oder biologischen Chips (siehe Fodor et al., 1993, Nature 364: 555–556) beherbergen bestimmte chemische Verbindungen an präzisen Lokalisationen in einem hochdichten, informationsreichen Format und sind ein mächtiges Werkzeug für die Untersuchung von biologischen Erkennungsprozessen. Eine besonders aufregende Anwendung der Arraytechnologie liegt in dem Feld der DNA-Sequenzanalyse. Das Hybridisierungsmuster eines DNA-Ziel mit einem Array von kürzeren Oligonukleotidsonden wird benutzt, um Primärstrukturinformation des DNA-Ziels zu gewinnen. Dieses Format hat wichtige Anwendungen bei der Sequenzierung durch Hybridisierung, DNA-Diagnostik und bei der Aufklärung der thermodynamischen Parameter, die Nukleinsäureerkennung beeinflussen.
  • Konventionelle DNA-Sequenzierungstechnologie ist eine arbeitsaufwendige Prozedur, die elektrophoretische Größenauftrennung von markierten DNA-Fragmenten voraussetzt. Ein alternativer Ansatz, Sequenzierung durch Hybridisierung (SBH) genannt, wurde vorgeschlagen (Lysov et al., 1988, Dokl. Akad. Nauk SSSR 303: 1-508–1511; Bains et al., 1988, J. Theor. Biol. 135: 303–307; und Drmanac et al., 1989, Genomics 4: 114–128). Dieses Verfahren nutzt einen Satz von kurzen Oligonukleotidsonden definierter Sequenz, um komplementäre Sequenzen auf einem längeren Zielstrang von DNA zu suchen. Das Hybridisierungsmuster wird genutzt, um die Ziel-DNA-Sequenz zu rekonstruieren. Man stellt sich vor, dass die Hybridisierungsanalyse einer großen Anzahl von Sonden benutzt werden kann, um lange Abschnitte von DNA zu sequenzieren. Bei sofortigen Anwendungen dieser Hybridisierungsmethodologie kann eine kleine Anzahl von Sonden benutzt werden, um lokale DNA-Sequenzen abzufragen.
  • Die Strategie des SBH kann durch das folgende Beispiel illustriert werden. Eine 12-mer Ziel-DNA-Sequenz, AGCCTAGCTGAA wird mit einem kompletten Satz von Oktanukleotidsonden gemischt. Wenn man nur perfekte Komplementarität betrachtet, werden fünf der 65.536 Oktamersonden – TCGGATCG, CGGATCGA, GGATCGAC, GATCGACT und ATCGACTT mit dem Ziel hybridisieren. Die Ausrichtung der überlappenden Sequenzen der hybridisierenden Sonden rekonstruiert das Gegenstück des ursprünglichen 12-mer Ziels:
  • Figure 01380001
  • Die Hybridisierungsmethodologie kann durch die Verknüpfung von Ziel-DNA mit einer Oberfläche ausgeführt werden. Das Ziel wird mit einem Satz von Oligonukleotidsonden abgefragt, eine zur Zeit (siehe Strezoska et al., 1991, Proc. Natl. Acad. Sci. USA 88: 10089–10093, und Drmanac et al., 1993, Science 260: 1649– 1652, die jeweils durch die Referenz hier aufgenommen werden). Dieser Ansatz kann mit gut etablierten Verfahren der Immobilisierung und Detektion von Hybridisierung implementiert werden, beinhaltet aber eine große Zahl von Manipulationen. Zum Beispiel müssen für die Analyse einer Sequenz unter Nutzung eines vollen Satzes von Oktanukleotiden zehntausende von Hybridi sierungsreaktionen durchgeführt werden. Alternativ kann SBH durch das Anknüpfen von Sonden an eine Oberfläche in einem Array-Format durchgeführt werden, bei dem die Identität der Sonden an jedem Ort bekannt ist. Die Ziel-DNA wird dann zu dem Sondenarray hinzugefügt. Das in einem einzigen Experiment bestimmte Hybridisierungsmuster offenbart direkt die Identität aller komplementären Sonden.
  • Wie oben bemerkt, beinhaltet ein bevorzugtes Verfahren der Oligonukleotidsonden-Array-Synthese die Nutzung von Licht, um die Synthese der Oligonukleotidsonden in hochdichten miniaturisierten Arrays zu steuern. Photolabile 5'-geschützte N'-acyl-deoxynukleosidphosphoramidite, Oberflächenlinkerchemie und vielseitige kombinatorische Synthesestrategien wurden für diese Technologie entwickelt. Matrices aus räumlich definierten Oligonukleotidsonden wurden hergestellt, und die Fähigkeit, diese Arrays zur Identifizierung von komplementären Sequenzen zu nutzen, wurde demonstriert, indem fluoreszenzmarkierte Oligonukleotide mit den durch die Verfahren hergestellten DNA-Chips hybridisiert wurden. Das Hybridisierungsmuster zeigt einen hohen Grad der Basenspezifität und offenbart die Sequenz von Oligonukleotidzielen.
  • Die grundlegende Strategie für lichtgesteuerte Oligonukleotidsynthese (1) wird in 46 umrissen. Die Oberfläche eines festen, mit photolabilen Schutzgruppen (X) modifierten Trägers wird durch eine photolithographische Schablone illuminiert, was reaktive Hydroxylgruppen in der illuminierten Region ergibt. Ein mit 3'-O-phosphoramidit aktiviertes Deoxynukleosid (an dem 5'-Hydroxyl mit einer photolabilen Gruppe geschützt) wird dann der Oberfläche ausgesetzt und Kopplung tritt an Orten auf, die dem Licht exponiert waren. Nach Capping und Oxidation wird das Substrat abgespült und die Oberfläche durch eine zweite Schablone illuminiert, um zusätzliche Hydroxylgruppen für die Kopplung zu exponieren. Ein zweites 5'-geschütztes, 3'-O-Phosphoramidit-aktiviertes Deoxynukleosid wird der Oberfläche ausgesetzt. Die selektive Photoentschützung und die Kopplungszyklen werden wiederholt, bis der gewünschte Satz an Produkten erhalten wird.
  • Lichtgesteuerte chemische Synthese kann für hocheffiziente Synthesestrategien verwendet werden, die eine maximale Anzahl von Verbindungen in einer minimalen Anzahl von chemischen Schritten herstellen werden. Zum Beispiel kann der komplette Satz von 4n Polynucleotiden (Länge n) oder jede Untergruppe dieses Satzes in nur 4 × n chemischen Schritten produziert werden siehe 47. Das Muster der Beleuchtung und die Reihenfolge der chemischen Reaktanden definieren schließlich die Produkte und ihre Lokalisierung. Da Photolitographie verwendet wird, kann das Verfahren miniaturisiert werden, um hochdichte Arrays aus Oligonukleotidsonden herzustellen. Als Beispiel für die Nomenklatur, die für die Beschreibung solcher Arrays nützlich ist, wird ein Array, das alle möglichen Oktanukleotide von dA und dT enthält, als (A + T)8 geschrieben. Die Expansion dieses Polynoms offenbart die Identität von allen 256 Oktanukleotidsonden von AAAAAAAA bis TTTTTTTT. Ein DNA Array, das komplette Sätze von Dinukleotiden umfaßt, wird mit einer Komplexität von 2 bezeichnet. Das Array, das sich aus (A + T + C + G)8 ergibt, ist das volle 65.536 Oktanukleotidarray der Komplexität 4. Computer gestützte Verfahren des Niederlegens von vorher entworfenen Arrays von Sonden unter Benutzung der VLSIPS Technologie sind in der gemeinsam zugeordneten ebenfalls anhängigen Anmeldung USSN 08/249,188, eingereicht am 24. Mai 1994, beschrieben (hierin in ihrer Gesamtheit für alle Zwecke durch die Referenz aufgenommen).
  • Um die Hybridisierung von DNA Zielen mit dem Sondenarray durchzuführen, werden die Arrays in eine thermostatisch kontrollierte Hybridisierungskammer eingebracht. Fluorescein markierte DNA Ziele werden in die Kammer injiziert und Hybridisierung findet für 4 Min. bis 24 Stunden statt. Die Oberfläche der Matrix wird mit einem Epifluoreszenzmikroskop gescannt (Zeiss Axioskop 20), das mit Elektronik zur Zählung von Photonen ausgestattet ist, unter Benutzung einer Anregung von 50–100 μW bei 488 nm durch einen Argonionenlaser (Spectra Physics Model 2020). Messungen können durchgeführt werden, wenn die Ziellösung in Kontakt mit der Sondenmatrix ist oder nach Waschen. Die Photonenzählungen werden gespeichert und Bilddateien werden nach der Konvertierung in einer 8 bit Bildformat darstellt. siehe 51
  • Bei der Hybridisierung eines DNA Ziels mit einem Oligonukleotidarray werden N = Lt – (Lp – 1) komplementäre Hybride erwartet, wobei N die Anzahl der Hybride, Lt die Länge des DNA Ziels und Lp die Länge der Oligonukleotidsonden auf dem Array ist. Zum Beispiel ist für ein 11mer Ziel, das mit einem Oktanukleotidarray hybridisiert wird, N = 4. Hybridisierungen mit Nichtübereinstimmungen an Positionen, die sich 2–3 Reste von einem der Ende der Sonden befinden, werden detektierbare Signale generieren. Indem man den obigen Ausdruck für N modifiziert, kommt man zu einer Beziehung, die die Anzahl der detektierbaren Hybridisierungen (Nd) für ein DNA Ziel der Länge Lt und ein Array der Komplexität C abschätzt. Bei der Annahme eines Durchschnitts von 5 Positionen, die Signale über dem Hintergrund ergeben: Nd = (1 + 5 (C – 1))[Lt – (Lp – 1)].
  • Arrays aus Oligonukleotiden können durch lichtgesteuerte Synthese effizient hergestellt werden und können benutzt werden, um die Identität von DNA Zielsequenzen zu bestimmen. Da kombinatorische Strategien benutzt werden, steigt die Anzahl der Verbindungen exponentiell, während die Zahl der chemischen Kopplungszyklen nur linear steigt. Zum Beispiel wird die Synthese des kompletten Satzes von 48 (65.536) Oktanukleotiden nur 4 Stunden zu der Synthese für die 16 zusätzlichen Zyklen hinzufügen. Weiterhin können kombinatorische Synthesestrategien zur Herstellung von Arrays jeder gewünschten Zusammensetzung verwendet werden. Da der gesamte Satz von Dodecameren (412) in 48 Photolyse- und Kopplungszyklen (b × n Zyklen sind für bn Verbindungen nötig) produziert werden kann, kann z. B. jede Untergruppe der Dodecamere (einschließlich jeder Untergruppe von kürzeren Oligonucleotiden) mit dem richtigen lithographischen Schablonendesign in 48 oder weniger chemischen Kopplungsschritten konstruiert werden. Zusätzlich wird die Zahl der Verbindungen in einem Array nur durch die Dichte der Syntheseorte und die gesamte Arraygröße limitiert. Kürzliche Experimente haben die Hybridisierung an Sonden gezeigt, die in 25 um Orten synthetisiert wurden. Bei dieser Auflösung kann der gesamte Satz von 65.536 Octanukleotiden in einem Array, das 0,64 m2 mißt, angeordnet werden, und der Satz von 1.048.576 Dodecanukleotiden bedarf nur eines 2,56 cm Arrays.
  • Projekte zur Sequenzierung des Genoms werden schließlich durch Technologien zur Sequenzierung von DNA limitiert sein. Aktuelle Sequenzierungsmethologien sind stark von komplexen Verfahren abhängig und bedürfen beachtlichen manuellen Aufwandes. Sequenzierung durch Hybridisierung hat das Potential, viel des manuellen Aufwandes in effizientere und automatisierte Formen zu überführen. Lichtgesteuerte Synthese ist ein effizientes Mittel für die Produktion von miniaturisierten Arrays für SBH in großem Maßstab. Die Oligonukleotidarrays sind nicht auf primäre Sequenzierungsanwendungen beschränkt. Da Austausch von einzelnen Basen mehrere Veränderungen in den Hybridisierungsmustern verursacht, stellen die Oligonukleotidarrays ein leistungsfähiges Mittel bereit, um die Genauigkeit von bereits aufgeklärter DNA Sequenz zu prüfen oder Änderungen innerhalb einer Sequenz zu suchen. In dem Fall von Octanukleotiden führt ein einziger Basenaustausch in der Ziel DNA zu dem Verlust von 8 Komplementen und führt zu 8 neuen Komplementen. Das Vergleichen von Hybridisierungsmustern kann für die Aufklärung von Mehrdeutigkeiten der Sequenzierung aus Standardgeltechniken oder für die schnelle Detektion von DNA-Mutationsereignissen nützlich sein. Der möglicherweise sehr hohe Informationsgehalt von lichtgesteuerten Oligonukleotidarrays wird die genetische diagnostische Testung verändern. Sequenzvergleiche von Hunderten bis Tausenden von unterschiedlichen Genen werden gleichzeitig anstelle des aktuellen Formates von gleichzeitig einem oder wenigen getestet werden. Maßgeschneiderte Arrays können auch hergestellt werden, so daß sie genetische Marker für die schnelle Identifizierung eines großen Spektrums an pathogenen Organismen enthalten.
  • Oligonukleotidarrays können auch zur Untersuchung der Sequenzspezifität von RNA oder Protein-DNA Wechselwirkungen verwendet werden. Experimente können entworfen werden, um die Regeln der Spezifität von nicht-Watson-Crick Oligonukleotidstrukturen aufzuklären oder die Benutzung von neuartigen synthetischen Nukleosidanaloga für Antisense- oder Tripelhelix-Anwendungen zu erforschen. Für die Synthese von RNA können angemessen geschützte RNA Monomere benutzt werden. Die Oligonukleotidarrays sollten eine breite Anwendung bei der Ableitung der thermodynamischen und kinetischen Regeln, welche die Bildung und Stabilität von Oligonukleotidkomplexen steuern, gewinnen.
  • Außer der Verwendung von mit Licht entfernbaren Schutzgruppen ist die Nukleosidkopplungschemie sehr ähnlich zu der, die heute routinemäßig für die Oligonukleotidsynthese verwendet wird. 48 zeigt die Entschützungs-, Kopplungs- und Oxidationsschritte eines Verfahrens zur Festphase DNA Synthese. 49 zeigt eine beispielhafte Syntheseroute für die Nukleotsidbaublöcke, die in dem Verfahren verwendet werden. 50 zeigt eine bevorzugte durch Licht entfernbare Schutzgruppe, MeNPOC, und wie diese Gruppe in aktiver Form herstellbar ist. Die unten beschriebenen Verfahren zeigen, wie diese Reagentien herzustellen sind. Die Nukleotisdbaublöcke sind
    Figure 01430001
  • PHENOYACETYL-DEOXYADENOSIN-3'-OCEP. 1. Herstellung von 4,5-Methylendioxy-2-nitroacetophenon
    Figure 01440001
  • Eine Lösung von 50 g (0,305 Mol) 3,4-Methylendioxy-acetophenon (Aldrich) in 200 ml Eisessig wurde tropfenweise innerhalb von 30 Min. zu 700 ml kaltem (2–4°C) 70%igem HNO3 unter Rühren hinzugefügt (MAN BEMERKE: die Reaktion wird sich ohne externe Kühlung durch ein Eisbad überhitzen, was gefährlich sein kann und zu Nebenprodukten führen kann). Bei Temperaturen unter 0°C kann die Reaktion jedoch schleppend ablaufen. Eine Temperatur von 3–5°C scheint optimal zu sein). Die Mischung wurde für weitere 60 Min. bei 3–5°C Rühren gelassen, und nährt sich dann an Raumtemperatur an. Die Analyse durch TLC (25% EtOAc in Hexan) wies auf die komplette Umsetzung des Startmaterials innerhalb von 1–2 Stunden hin. Wenn die Reaktion abgelaufen war, wurde die Mischung in 3 lzerstoßenes Eis geschüttet, und der entstehende gelbe Feststoff wurde abfiltriert, mit Wasser gewaschen und dann unter Absaugen getrocknet. Die Ausbeute war 53 g (84%), die ohne weitere Reinigung verwendet wurden.
  • 2. Herstellung von 1-(4,5-Methylendioxy-2-nitrophenyl)ethanol
    Figure 01440002
  • Natrimborohydrid (10 g; 0,27 Mol) wurde langsam zu einer kalten, gerührten Suspension von 53 g (0,25 Mol) 4,5-Methylendioxy-2-nitroacetophenon in 400 ml Methanol hinzugefügt. Die Temperatur wurde durch langsames Hinzufügen des NaBH4 und externe Kühlung mit einem Eisbad unter 10°C gehalten. Es wurde bei Raumtemperatur weitere 2 Stunden gerührt, zu diesem Zeitpunkt gab TLC (CH2Cl2) eine komplette Umwandlung des Ketons an. Die Mischung wurde in 1 l Eiswasser geschüttet und die sich ergebende Suspension mit Ammoniumchlorid neutralisiert und dann 3 × mit 400 ml CH2Cl2 oder EtOAc extrahiert (Das Produkt kann durch Filtrierung und Waschen an diesem Schritt gesammelt werden, ist jedoch etwas in Wasser löslich, was zu einer Ausbeute von nur 60% führt). Die vereinigten organischen Extraktionen wurden mit Lauge gewaschen, dann mit MgSO4 getrocknet und verdampft. Das Rohprodukt wurde von dem Hauptnebenprodukt gereinigt, indem es in einem minimalen Volumen von CH2Cl2 oder THF (175 ml) gelöst, und dann durch langsames Hinzufügen von Hexan (1000 ml) unter Rühren präzipitiert wurde (Ausbeute 51 g; 80% insgesamt). Es kann auch rekristallisiert werden (z. B. Toluen/Hexan), dies reduziert jedoch die Ausbeute.
  • 3. Herstellung von 1-(4,5-Methvlendioxy-2-nitrophenyl)ethyl Chloroformat (MeNPOC-Cl)
    Figure 01450001
  • Phosgen (500 ml, 20% w/v in Toluen von Fluka: 965 mmol; 4 Äq.) wurde langsam zu einer kalten, gerührten Lösung von 50 g (237 mmol; 1 Äq.) von 1-(4,5-Methylendioxy-2-nitrophenyl)ethanol in 400 ml trockenem THF hinzugefügt. Die Lösung wurde über Nacht bei Raumptemperatur gerührt, zu diesem Zeitpunkt gab TLC (20% Et2O/Hexan) > 95%ige Umwandlung an. Die Mischung wurde verdampft (es wird eine ölfreie Pumpe mit einer unterhalb liegenden wässrigen NaOH Falle empfohlen, um den Überschuß an Phosgen zu entfernen), was ein viskoses braunes Öl ergab. Die Reinigung wurde durch Flash Chromatographie auf einer kurzen (9 × 13 cm) Silicagelsäule durchgeführt und es wurde mit 20% Et2O Hexan eluiert. Typischerweise wurden mit diesem Verfahren 55 g (85% des festen gelben McNPOC-Cl erhalten. Das Rohmaterial wurde auch in 2–3 Portionen aus 1 : 1 Ether/Hexan umkristallisiert. In dieser Größenordnung werden 100 ml für die erste Portion benutzt, einige% THF hinzugefügt, um die Lösung zu fördern, und dann eine Abkühlung über Nacht bei –20°C (dieses Verfahren wurde nicht optimiert). Das Produkt sollte bei –20°C trocken gelagert werden.
  • 4. Synthese von 5'-Menpoc-2'-deoxynukleosid-3'-(N,N-diisopropyl 2-cyanoethylphosphoramiditen (a.) 5'-NeNPOC-Nukleoside
    Figure 01460001
  • Base = THYMIDIN (T); N-4-ISOBUTYRYL 2'-DESOXYCYTIDINE (ibu-dC);
    N-2-PHENOXYACETYL 2'DEOXYGUANOSIN (PAC-dG); und
    N-6-PHENOXYACETYL 2'DEOXYADENOSIN (PAC-dA)
  • Alle vier 5'-McNPOC-Nukleoside wurden mit dem folgenden Verfahren aus den an der Base geschützten 2'-Deoxynukleosiden hergestellt. Das geschützte 2'-Deoxynukleosid (90 mmol) wurden durch zweimaliges Co-Verdampfen mit 250 ml wasserfreiem Pyridin getrocknet. Das Nukleosid wurde dann unter Argon in 300 ml wasserfreiem Pyridin gelöst (oder 1 : 1 Pyridin/DMF für das dGPAC Nukleosid) und bis 2°C in einem Eisbad abgekühlt. Eine Lösung. von 24,6 g (90 mmol) McNPOC-Cl in 100 ml trockenem THF wurde dann unter Rühren innerhalb von 30 Minuten hinzugefügt. Das Eisbad wurde entfernt und die Lösung über Nacht bei Raumtemperatur Rühren gelassen (TLC: 5–10% McOH in CH2Cl2; 2 Diastereomere). Nach dem Verdampfen der Lösungsmittel unter Vakuum wurde das Rohmaterial in 250 ml Ethylacetat aufgenommen und mit gesättigtem wässrigem NaHCO3 und Lauge extrahiert. Die organische Phase wurde dann über Na2SO4 getrocknet, filtriert und verdampft, um einen gelben Schaum zu erhalten. Die Rohprodukte wurden schließlich durch Flash-Chromatographie gereinigt (9 × 30 cm Silicagelsäule, eluiert mit einem schrittweisem Gradienten von 2%–6% MeOH in CH2Cl2). Die Ergebnisse der gereinigten diastereomeren Mischungen sind in dem Bereich von 65–75%.
  • (b.) 5'-Menpoc-2'-deoxynukleosid-3'-(N,N-diisopropyl2-cyanoethylphosphoramidite)
    Figure 01470001
  • Die vier Deoxynukleoside wurden unter Verwendung von entweder 2-cyanoethyl-N,N-diisopropyl chlorophosphoramidit oder 2-cyanoethyl-N,N,N',N'-tetraisopropylphosphorodiamiditphosphytiliert. Das folgende ist ein typisches Verfahren. Man füge 16,6 g (17,4 ml; 55 mmol) 2-Cyanoethyl-N,N,N',N'-tetraisopropylphosphorodiamidit zu einer Lösung von 50 mmol 5'-McNPOC-Nukleosid und 4,3 g (25 mmol) Diisopropylammoniumtetrazolid in 250 ml trockenem CH2Cl2 unter Argon bei Raumtemperatur hinzu. Man rühre für weitere 4–16 Stunden (unter Überwachung der Reaktion durch TLC: 45 : 45 : 10 Hexan/CH2Cl2/Et3N). Man wasche die organische Phase mit gesättigtem wässrigen NaHCO3 und Lauge, trockne dann über Na2SO4 und verdampfe zur Trockenheit. Man reinige das Roh-Amidit durch Flash-Chromatograhie (9 × 25 cm Silicagelsäule, eluiert mit Hexan/CH2Cl2/TEA – 45 : 45 : 10 für A, C, T; oder 0 : 90 : 10 für G). Der Ertrag an gereinigtem Amidit ist etwa 90%.
  • B. Herstellung von markierter DNA/Hybridisierung mit dem Array 1. PCR
  • PCR-Amplifikationsreaktionen werden typischerweise in einer Mischung durchgeführt, pro Reaktion bestehend aus: 1 μl genomische DNA; 10 μl jedes Primers (10 pmol/μl Vorrat); 10 μl 10 × PCR Puffer (100 mM Tris.Cl pH 8,5, 500 mM KCl, 15 mM MgCl2); 10 μl 2 mM dNTPs (hergestellt aus 100 mM dNTP Vorräten); 2,5 U Taq Polymerase (Perkin Elmer AmpliTagTM, 5 U/μl); und Wasser ad 100 μl. Die PCR-Bedingungen sind normalerweise 40 Zyklen (94°C 45 Sek., 55°C 30 Sek., 72°C 60 Sek.), es kann jedoch nötig sein, sie von Probenart zu Probenart deutlich zu variieren. Diese Bedingungen gelten für 0,2 ml Dünnwandröhrchen in einem Perkin Elmer 9600 Thermocycler. Siehe Perkin Elmer 1992/93 Katalog für 9600 Zyklus-Zeit Information. Das Ziel, die Länge der Primer und die Zusammensetzung der Sequenz können neben anderen Faktoren die Parameter beeinflussen.
  • Für Produkte in dem Größenbereich von 200–1000 Basenpaaren überprüfe man 2 μl der Reaktion auf einem 1,5% 0,5 × TBE Agarosegel unter Verwendung eines Standards angemessener Größe (phiX174, geschnitten mit HaeIII ist geeignet). Die PCR-Reaktion sollte mehrere Picomol Produkt ergeben. Es ist hilfreich, eine Negativkontrolle einzuschließen (d. h. 1 μl TE anstelle von genomischer DNA), um mögliche Kontamination zu überprüfen. Um Kontaminationen zu vermeiden, bewahre man PCR-Produkte aus vorherigen Experimenten getrennt von späteren Reaktionen auf und verwende, wie angemessen, Filterspitzen. Es ist hilfreich, einen Satz von Arbeitslösungen zu benutzen und getrennt davon Masterlösungen aufzubewahren, solange man nicht die Mastervorratslösungen kontaminiert.
  • Für einfache Amplifikationen von kurzen Fragmenten genomischer DNA ist es im Allgemeinen unnötig, Mg2+-Konzentrationen zu optimieren. Ein gutes Verfahren ist das Folgende: Man stelle ein Mastermix ohne Enzym her; verteile die genomischen DNA-Proben auf die einzelnen Röhrchen oder Reaktionsgefäße; füge Enzym zu dem Mastermix hinzu und mische und verteile die Masterlösung auf jedes Gefäß, jedesmal unter Benutzung einer neuen Filterspitze.
  • 2. Aufreinigung
  • Die Entfernung von nicht eingebauten Nukleotiden und Primern aus den PCR-Proben kann unter Benutzung des Promega Magic PCR Preps DNA-Reinigungskits erreicht werden. Man kann die ganze Probe reinigen, indem man den mit dem Kit gelieferten Anweisungen folgt (ab Abschnitt III B "Probenherstellung für direkte Aufreinigung aus PCR-Reaktionen"). Nach der Elution des PCR-Produkts in 50 μl TE oder H2O zentrifugiert man das Eluat für 20 Sek. bei 12.000 rpm in einer Mikrofuge und überführt vorsichtig 45 μl in ein neues Zentrifugenröhrchen, wobei man jeden Sichtbaren Niederschlag vermeidet. Manchmal wird während des Elutionsschrittes Harz hinübergetragen. Dieser Transfer verhindert versehentliche Kontamination der linearen Amplifizierungsreaktion mit "Magic PCR" Harz. Andere Verfahren, z. B. Größenausschlusschromatographie, können auch genutzt werden.
  • 3. Lineare Amplifikation
  • In einer 0,2 ml Dünnwand-PCR-Röhrchenmischung: 4 μl gereinigtes PCR-Produkt, 2 μl Primer (10 pmol/μl); 4 μl 10 × PCR Puffer; 4 μl dNTPs (2 mM dA, dC, dG, 0,1 mM dT); 4 μl 0,1 mM dUTP; 1 μl 1 mM Fluorescein dUTP (Amersham RPN 2121); 1 U Taq-Polymerase (Perkin Elmer, 5 U/μl); und H2O ad 40 μl. Man führe 40 PCR-Zyklen durch (92°C 30 Sek., 55°C 30 Sek., 72°C 90 Sek.). Diese Bedingungen wurden benutzt, um ein 300 Nukleotide langes mitochondriales DNA-Fragment zu amplifizieren, sind aber auch für andere Fragmente anwendbar. Selbst in der Abwesenheit einer sichtbaren Bande von Produkt auf einem Agarosegel sollte immer noch genug Produkt vorhanden sein, um ein leicht detektierbares Hybridisierungssignal zu ergeben. Wenn man die DNA nicht mit Uracil-DNA-Glykosylase (siehe Abschnitt 4) behandelt, kann dUTP aus der Reaktion weggelassen werden.
  • 4. Fragmentierung
  • Man reinige das lineare Amplifikationsprodukt unter Benutzung des Promega Magic PCR Preps DNA-Reinigungskits, wie in Abschnitt 2 oben. In einem 0,2 ml Dünnwall-PCR-Röhrchen-Mix: 40 μl gereinigte markierte DNA; 4 μl 10 × PCR-Puffer; und 0,5 μl Uracil-DNA-Glykosylase (BRL 1U/μl). Man inkubiere die Mischung 15 Min. bei 37°C, dann 10 Min. bei 97°C; lagere bei –20°C bis zur Benutzung.
  • 5. Hybridisierung, Scannen und Strippen
  • Ein Leerscan des Objektträgers in dem Hybridisierungspuffer alleine ist hilfreich, um zu überprüfen, ob der Objektträger für die Benutzung bereit ist. Der Puffer wird aus der Flusszelle entfernt und durch 1 ml (fragmentierter) DNA in Hybridisierungspuffer ersetzt und gut gemischt. Der Scan wird in der Anwesenheit von markiertem Ziel durchgeführt. 51 illustriert ein erläuterndes Detektionssystem für das Scannen eines DNA-Chips. Eine Folge von Scans in 30 Min.-Intervallen unter Benutzung einer Hybridisierungstemperatur von 25°C ergibt ein sehr klares Signal, normalerweise in mindestens 30 Min. – 2 Stunden, es kann aber erwünscht sein, länger zu hybridisieren, z. B. über Nacht. Unter Benutzung einer Leistung des Lasers von 50 μW und 50 μm Pixeln sollte man bei einem neuen Objektträger maximale Zählungen in dem Bereich von Hunderten bis niedrigen Tausenden pro Pixel erhalten. Wenn man fertig ist, kann der Objektträger mit 50% Formamid gestrippt werden. Man spüle gut in deionisiertem H2O, blase trocken und lagere bei Raumtemperatur.
  • C. Herstellung von markierter RNA/Hybridisierung mit dem Array
  • 1. Primer mit angehängten Sequenzen
  • Für die Amplifizierung der Zielnukleinsäure verwendete Primer sollten Promotersequenzen aufweisen, wenn man wünscht, mit der amplifizierten Nukleinsäure RNA zu produzieren. Geeignete Promotersequenzen sind unten gezeigt und beinhalten:
    Figure 01510001
  • Die erwünschte Promotorsequenz wird dem 5'-Ende des PCR-Primers hinzugefügt. Es ist bequem, jedem Primer eines PCR-Primerpaares einen unterschiedlichen Promotor hinzuzufügen, so dass jeder Strang von einem einzigen PCR-Produkt transkribiert werden kann.
  • Man synthetisiere PCR-Primer so, dass die DMT-Gruppe belassen wird. Diese DMT-on Aufreinigung ist für die PCR unnötig, scheint jedoch für die Transkription wichtig zu sein. Man füge vor dem Sammeln der Oligonukleotide 25 μl 0,5 M NaOH zu dem Sammlungsgefäß hinzu, um die DMT-Gruppe zu belassen. Man entschütze unter Benutzung von Standardchemie – 55°C über Nacht ist angemessen.
  • HPLC-Reinigung wird durch Trocknen der Oligonukleotide, Resuspendierung in 1 ml 0,1 M TEAA (man verdünne 2,0 M Vorratslösung in deionisiertem Wasser, filtere durch 0,2 Mikronfilter) und Filtrierung durch 0,2 Mikronfilter erreicht. Man lade 0,5 ml auf reverse Phase HPLC (die Säule kann eine Hamilton PRP-1 semi-prep, #79426) sein. Der Gradient ist 0 -> 50% CH3CN in 25 Min. (Program 0.2 μmol.prep.0–50, 25 min). Man vereinige die gewünschten Fraktionen, trockne, resuspendiere in 200 μl 80 HAc. 30 Min. bei Raumtemperatur. Man füge 200 μl EtOH hinzu und trockne. Man resuspendiere in 200 μl H2O + 20 μl NaAc pH 5,5, 600 μl EtOH. Man lasse 10 Min. auf Eis; zentrifugiere bei 12000 rpm für 10 Min. in einer Mikrofuge. Man schütte den Überstand ab. Man spüle den Niederschlag mit 1 ml EtOH, trockne, resuspendiere in 200 μl H2O. Man messe A260, stelle eine 10 pmol/μl Lösung in TE her (10 mM Tris.Cl pH 8,0, 0,1 mM EDTA). Nach der HPLC-Reinigung eines 42-mers, ist eine Ausbeute in dem Bereich von 15 nmol aus einem 0,2 μmol Synthesemaßstab typisch.
  • 2. Genomische DNA-Herstellung
  • Man füge zu der Probe 500 μl (10 mM Tris.Cl pH 8,0, 10 mM EDTA; 100 mM NaCl, 2% (w/v) SDS, 40 mM DDT, mit Filter sterilisiert) hinzu. Man füge 1,25 μl 20 mg/ml Proteinase K (Boehringer) hinzu. Man inkubiere bei 55°C für 2 Stunden, wobei man ein- oder zweimal vortext. Man führe zweimal mit 0,5 ml 1 : 1 Phenol : CHCl3 Extraktionen durch. Nach jeder Extraktion zentrifugiere man bei 12.000 RPM 5 Min. in einer Mikrofuge und verwende 0,5 ml Überstand weiter. Man füge 35 μl NaAc pH 5,2 + 1 ml ETOH hinzu. Man stelle die Proben 45 Min. auf Eis, zentrifugiere dann 30 Min. bei 12.000 rpm, spüle, trockne an der Luft für 30 Min. und resuspendiere in 100 μl TE.
  • 3. PCR
  • PCR wird in einer Mischung durchgeführt, die pro Reaktion enthält: 1 μl genomische DNA; 4 μl jedes Primers (10 pMol/μl Vorratslsg.); 4 μl 10 × PCR Puffer (100 mM Tris.Cl pH 8,5, 500 mM KCl, 15 mM MgCl2); 4 μl 2 mM dNTPs (hergestellt aus 100 mM dNTP Vorratslsg.); 1 U Taq Polymerase (Perkin Elmer, 5 U/μl); H2O ad 40 μl. Es werden etwa 40 Zyklen durchgeführt (94°C 30 Sek., 50°C 30 Sek., 72°C, 30 Sek), aber es kann notwendig sein, die Bedingungen der Zyklen zu ändern. Diese Bedingungen sind für 0,2 ml Dünnwandgefäße im Perkin Elmer 9600. Für Produkte in dem Größenbereich von 200 bis 1000 bp, überprüfe man 2 μl der Reaktion auf einem 1,5% 0,5 × TBE Agarosegel unter Benutzung eines angemessenen Größenstandards. Für größere oder kleinere Volumina (20–100 μl) kann man die gleiche Menge genomischer DNA verwenden, die anderen Zutaten jedoch entsprechend anpassen.
  • 4. In vitro Transkription
  • Mix: 3 μl PCR Produkt; 4 μl 5 × Puffer; 2 μl DTT; 2,4 μl mMolar rNTPs (100 mM Lösungen von Pharmacia); 0,48 μl 10 mM Fluorescein-UTP (Fluorescein-12-UTP, 10 mM Lösung von Boehringer Mannheim); 0,5 μl RNA Polymerase (Promega T3 oder T7 RNA Polymerase); und H2O ad 20 μl. Man inkubiere 3 Stunden bei 37°C. Man überprüfe unter Benutzung eines Größenstandards 2 μl der Reaktion auf einem 1,5%igen 0,5 × TBE Agarosegel. 5 × Puffer = 200 mM Tris pH 7,5, 30 mM MgCl2, 10 mM Spermidin, 5 0 mM NaCl und 100 mM DTT (mit Enzym geliefert). Das PCR Produkt bedarf keiner Reinigung und kann direkt zu der Transkriptionsmischung hinzugefügt werden. Für ein anfängliches Testexperiment und Hybridisierung wird eine 20 μl Reaktion vorgeschlagen; eine 100 μl Reaktion wird als "präparativer" Maßstab betrachtet (die Reaktion kann maßstäblich vergrößert werden, um mehr Ziel zu erhalten). Die Menge des hinzuzufügenden PCR-Produkts ist variabel; typischerweise wird eine PCR Reaktion mehrere pMol DNA ergeben. Wenn die PCR Reaktion nicht so viel Ziel produziert, sollte man die Menge an DNA, die zu der Transkriptionsreaktion hinzugefügt wird, vergrößern (und die PCR optimieren). Das oben vorgeschlagene Verhältnis von Fluorescein-UTP zu UTP ist 1 : 5, aber Verhältnisse von 1 : 3 bis 1 : 10 funktionieren alle gut. Man kann auch mit Biotin-UTP markieren und mit Streptavidin-FITC detektieren, um ähnliche Ergebnisse wie mit Fluorescein-UTP Detektion zu erhalten.
  • Bei nicht denaturierender Agarosegel Elektrophorese von RNA beachte man, daß die RNA-Bande normalerweise etwas schneller wandern wird als die Bande der DNA Matrize, obwohl manchmal die beiden Banden miteinander wandern werden. Die Temperatur des Gels kann die Wanderung der RNA Bande beeinflussen. Die aus der in vitro Transkription hergestellte RNA ist ziemlich stabil und kann für Monate (mindestens) bei –20°C ohne jedes Anzeichen der Degradation gelagert werden. Sie kann in unsterilisiertem 6 × SSPE 0,1% Triton X-100 bei –20°C für Tage (mindestens) gelagert werden und 2 × (mindestens) für Hybridisierung wiederverwendet werden, ohne irgendwelche besonderen Vorsichtsmaßnahmen bei der Herstellung oder während der Benutzung zu treffen. Kontamination mit RNase sollte selbstverständlich vermieden werden. Bei der Extraktion von RNA aus Zellen ist es bevorzugt, sehr schnell zu arbeiten und stark denaturierende Bedingungen zu benutzen. Man vermeide die Benutzung von Glasgefäßen, die vorher mit RNasen kontaminiert wurden. Die Benutzung von neuen Einwegplastikgefäßen (nicht notwendigerweise steril) ist bevorzugt, da neue Plastikröhrchen, Spitzen etc. im wesentlichen RNase frei sind. Behandlung mit DEPC oder Autoklavierung ist normalerweise nicht notwendig.
  • 5. Fragmentierung
  • Man erhitze die Transkriptionsmischung für 40 Min. bei 94°. Das Ausmaß der Fragmentierung wird durch Variation der Mg2+ Konzentration (30 mM ist typisch), Temperatur und Dauer des Erhitzens kontrolliert.
  • 6. Hybridisierung, Scannen und Strippen
  • Ein Leerscan des Objektträgers in Hybridisierungspuffer alleine ist hilfreich, um zu überprüfen, daß der Objektträger für die Benutzung bereit ist. Der Puffer wird aus der Flußzelle entfernt und mit 1 ml (hydrolysierter) RNA in Hybridisierungspuffer ersetzt und gut gemischt. Man inkubiere für 15 bis 30 Min. bei 18°C. Man entferne die Hybridisierungslösung, die für Folgeexperimente aufgewahrt werden kann. Man spüle die Flußzelle 4–5 × mit jeweils frischem 6 × SSPE/0,1% Triton X-100, bei 18°C äquilibriert. Die Spülungen können schnell durchgeführt werden, aber es ist wichtig, die Flußzelle vor jeder neuen Spülung zu leeren und die Flüssigkeit in der Zelle gründlich zu mischen. Eine Folge von Scans in 30 Min. Intervallen bei einer Hybridisierungstemperatur von 25°C ergibt ein sehr klares Signal, normalerweise in mindestens 30 Min. bis 2 Stunden, es kann aber erwünscht sein, länger zu hybridisieren, d. h. über Nacht. Bei Verwendung eines Lasers der Leistung 50 μW und 50 μm Pixeln sollte man bei einem neuen Objektträger maximale Zählungen in dem Bereich von Hunderten bis niedrigen Tausenden/Pixel erhalten. Wenn man fertig ist, kann der Objektträger mit Verwendung von warmem Wasser gestrippt werden.
  • Diese Bedingungen sind beispielhaft und gehen von einer Sondenlänge von 15 Nukleotiden aus. Die vorgeschlagenen Strippingbedingungen sind ziemlich harsch, aber etwas Signal kann auf dem Objektträger bleiben, wenn das Waschen nicht stringent ist. Dennoch sollte die nach dem waschen verbleibenden Zählungen im Vergleich zu dem Signal in Anwesenheit von Ziel RNA sehr gering sein. In einigen Fällen sind viel sanftere Stripping-Bedingungen effektiv. Je niedriger die Hybridisierungstemperatur ist, und je länger die Hybridisierung dauert, desto schwieriger ist es, den Objektträger zu strippen. Längere Ziele können schwieriger zu strippen sein als kürzere Ziele.
  • 7. Amplifizierung des Signals
  • Eine Vielzahl von Verfahren kann benutzt werden, um die Detektion von markiertem Ziel, das an eine Sonde auf dem Array gebunden ist, zu verbessern. Bei einer Ausführungsform wird das Protein Muts (aus E. coli) oder äquivalente Proteine, wie Hefe MSH1, MSH2 und MSH3; Maus Rep-3 und Streptococcus Hex-A, in Verbindung mit Hybridisierung des Ziels verwendet werden, um Sonden-Ziel-Komplexe zu detektieren, die nicht übereinstimmende Basenpaare enthalten. Das Protein, direkt oder indirekt markiert, kann zu dem Chip während oder nach der Hybridisierung der Zielnukleinsäure hinzugefügt werden und bindet unterschiedlich an Homo- oder Heteroduplexnukleinsäure. Eine große Vielzahl an Farbstoffen und anderen Markierungen kann für ähnliche Zwecke verwendet werden. Z. B. ist bekannt, daß der Farbstoff YOYO-1 bevorzugt an Nukleinsäuren bindet, die Sequenzen enthalten, die Folgen von 3 oder mehr G-Resten umfassen.
  • 8. Detektion von Wiederholungs-Sequenzen
  • Unter manchen Umständen, d. h. Zielnukleinsäuren mit wiederholten Sequenzen oder mit hohem Gehalt an G/C, werden manchmal sehr lange Sonden für eine optimale Detektion benötigt. In einer Ausführungsform für die Detektion von spezifischen Sequenzen in einer Zielnukleinsäure mit einem DNA Chip, werden Wiederholungs-Sequenzen wie folgt detektiert. Der Chip umfaßt Sonden einer Länge, die ausreicht, variierende Entfernungen von jedem Ende in die sich wiederholende Region hineinzureichen. Die Probe wird vor der Hybridisierung mit einem markierten Oligonukleotid behandelt, das komplementär zu einer Wiederholungsregion ist, aber kürzer als die Gesamtlänge der Wiederholung. Die Zielnukleinsäure ist mit einer zweiten, unterschiedlichen Markierung markiert. Nach der Hybridisierung wird der Chip auf Sonden gescannt, die sowohl das markierte Ziel als auch die markierte Oligonukleotidsonde gebunden haben; die Anwesenheit solcher gebundener Sonden zeigt, daß mindestens zwei Wiederholungs-Sequenzen anwesend sind.

Claims (39)

  1. Array aus Oligonukleotidsonden, die auf einem festen Träger immobilisiert sind, z. B. an den Träger über einen Spacer gebunden sind, dadurch gekennzeichnet, daß das Array mindestens zwei Sätze von Oligonukleotidsonden umfasst, (1) ein erster Sondensatz umfassend eine Vielzahl von Sonden, wobei jede Sonde einen Abschnitt von mindestens sechs Nukleotiden umfasst, welche genau komplementär zu einer Teilsequenz einer Referenzsequenz sind, und der Abschnitt mindestens eine Abfrageposition beinhaltet, welche komplementär zu einem entsprechenden Nukleotid in der Referenzsequenz ist, (2) ein zweiter Sondensatz umfassend eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz, wobei die entsprechende Sonde in dem zweiten Sondensatz identisch mit einer Sequenz ist, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfasst, welche die mindestens eine Abfrageposition beinhaltet, außer daß mindestens eine Abfrageposition in jeder der beiden entsprechenden Sonden aus den ersten und zweiten Sondensätzen von einem unterschiedlichen Nukleotid besetzt ist; wobei die Sonden in dem ersten Sondensatz jeweils mindestens zwei Abfragepositionen aufweisen, die jedem von zwei benachbarten Nukleotiden in der Referenzsequenz entsprechen.
  2. Array aus Oligonukleotidsonden nach Anspruch 1, das weiterhin einen dritten und vierten Sondensatz umfasst, dadurch gekennzeichnet, daß der zweite, dritte und vierte Sondensatz jeweils eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz umfasst, wobei die Sonden in dem zweiten, dritten und vierten Sondensatz identisch mit einer Sequenz sind, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfasst, welche die mindestens eine Abfrageposition beinhaltet, außer dass die mindestens eine Abfrageposition durch ein abweichendes Nukleotid in jedem der vier entsprechenden Sonden aus den vier Sondensätzen besetzt ist.
  3. Array nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß das Array zwischen 100 und 100.000 Sonden umfasst.
  4. Array nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Sonden des ersten Sondensatzes einen Abschnitt von 9 bis 21 Nukleotiden umfassen, der genau komplementär zu einer Teilsequenz einer Referenzsequenz ist, wobei der Abschnitt mindestens eine Abfrageposition beinhaltet, welche komplementär zu einem entsprechenden Nukleotid in der Referenzsequenz ist.
  5. Array nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß es ferner einen fünften Sondensatz umfasst, der eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz umfasst, wobei die entsprechende Sonde aus dem fünften Sondensatz identisch mit einer Sequenz ist, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfasst, welche die mindestens eine Abfrageposition beinhaltet, außer wenn die mindestens eine Abfragepostion in der entsprechenden Sonde aus dem fünften Sondensatz deletiert wurde.
  6. Array nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß es ferner einen sechsten Sondensatz umfasst, der eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz umfasst, wobei die entsprechende Sonde aus dem sechsten Sondensatz identisch mit einer Sequenz ist, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfasst, welche die mindestens eine Abfrageposition beinhaltet, außer dass ein zusätzliches Nukleotid benachbart an die mindestens eine Abfrageposition in der entsprechenden Sonde aus dem ersten Sondensatz eingefügt wurde.
  7. Array nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß entweder (a) der erste Sondensatz jeweils mindestens 50 Abfragepositionen aufweist, die jedem der 50 benachbarten Nukleotide in einer Referenzsequenz entsprechen; oder (b) der erste Sondensatz eine Abfrageposition aufweist, die jedem der Nukleotide in der Referenzsequenz entspricht.
  8. Array nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß es ferner einen fünften, sechsten und siebenten Sondensatz umfasst, wobei der Abschnitt jeder Sonde in dem ersten Sondensatz mindestens zwei Abfragepositionen beinhaltet, die jeweils einem Nukleotid in der Referenzsequenz entsprechen, die zweiten, dritten und vierten Sondensätze jeweils eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz umfassen, wobei die entsprechenden Sonden in dem zweiten, dritten und vierten Sondensatz identisch mit einer Sequenz sind, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfasst, welche eine erste Abfrageposition beinhaltet, außer dass die erste Abfrageposition durch ein abweichendes Nukleotid in jedem der vier entsprechenden Sonden aus den vier Sondensätzen besetzt ist; die fünften, sechsten und siebenten Sondensätze jeweils eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz umfassen, wobei die Sonden in den fünften, sechsten und siebenten Sondensätzen identisch mit einer Sequenz sind, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfasst, welche eine zweite Abfrageposition beinhaltet, außer dass die zweite Abfrageposition durch ein abweichendes Nukleotid in jeder der vier entsprechenden Sonden aus den vier Sondensätzen besetzt ist.
  9. Array nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß jede Sonde in dem ersten Sondensatz ferner einen zweiten Abschnitt von mindestens sechs Nukleotiden genau komplementär zu einer zweiten Teilsequenz der Referenzsequenz umfasst, und die Sonden aus den zweiten, dritten und vierten Sondensätzen die entsprechende Sonde aus dem ersten, Sondensatz oder eine Teilsequenz davon umfassen, welche die ersten und zweiten Abschnitte außer der mindestens einen Abfrageposition umfassen.
  10. Array nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß es ferner einen fünften Sondensatz, der mindestens eine Sonde umfasst, die einen Abschnitt von mindestens sieben Nukleotiden genau komplementär zu einer Teilsequenz der Referenzsequenz außer in ein oder zwei Positionen umfassen, wobei der Abschnitt mindestens eine Abfrageposition beinhaltet, welche einem Nukleotid in der Referenzsequenz entspricht, aber nicht an der einen oder den zwei Positionen in denen entweder (1) die ersten und zweiten Teilsequenzen nicht benachbart sind, oder (2) die ersten und zweiten Teilsequenzen benach bart sind und die ersten und zweiten Abschnitte relativ zu dem Gegenstück der ersten und zweiten Teilsequenzen in der Referenzsequenz invertiert vorliegen, sechste, siebte und achte Sondensätze umfasst, die jeweils eine Sonde für jede Sonde in dem fünften Sondensatz umfassen, wobei die entsprechenden Sonden aus den sechsten, siebenten und achten Sondensätzen identisch mit einer Sequenz sind, welche die entsprechende Sonde aus dem fünften Sondensatz oder eine Teilsequenz von mindestens neun Nukleotiden davon einschließlich der mindestens einen Abfrageposition und der einen oder den zwei Positionen umfassen, außer in der mindestens einen Abfrageposition, die durch ein abweichendes Nukleotid in jeder der vier Sonden besetzt ist.
  11. Array nach einem der Ansprüche 1 bis 10, dadurch gekennzeichnet, daß die ersten und zweiten Teilsequenzen durch ein oder zwei Nukleotide in der Referenzsequenz getrennt sind.
  12. Array nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die Sonden auf dem Substrat so angeordnet sind, dass der erste Sondensatz in einer Reihe auf dem Substrat in einer Reihenfolge angeordnet ist, welche die Überlappung zwischen den Sonden und der Referenzsequenz widerspiegelt, und zusätzliche Sondensätze in Spalten relativ zu den Sonden in dem genannten ersten Satz angeordnet sind, so dass sich Sonden mit der gleichen Abfrageposition in der gleichen Spalte befinden und so dass jede Spalte mindestens vier Sonden umfasst.
  13. Array aus auf einem festen Träger immobilisierten Oligonukleotidsonden, dadurch gekennzeichnet, daß das Array mindestens ein Paar von ersten und zweiten Sondengruppen umfasst, wobei jede Gruppe einen ersten und zweiten Satz aus Oligonukleotidsonden wie in Anspruch 1 definiert umfasst; bei dem jede Sonde in dem ersten Sondensatz aus der ersten Gruppe genau komplementär zu einer Teilsequenz einer ersten Referenzsequenz und jede Sonde in dem ersten Sondensatz aus der zweiten Gruppe genau komplementär zu einer Teilsequenz einer zweiten Referenzsequenz ist.
  14. Array nach Anspruch 13, dadurch gekennzeichnet, daß die zweite Referenzsequenz eine mutierte Form der ersten Referenzsequenz ist.
  15. Array nach Anspruch 13 oder 14, dadurch gekennzeichnet, daß jede Gruppe ferner dritte und vierte Sondensätze umfasst, die jeder eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz umfassen, wobei die Sonden in den zweiten, dritten und vierten Sondensätzen identisch mit einer Sequenz sind, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfassen, welche die Abfrageposition beinhaltet, außer dass die Abfrageposition durch abweichende Nukleotide in jeder der vier entsprechenden Sonden aus den vier Sondensätzen besetzt ist.
  16. Array nach einem der Ansprüche 13 bis 15, dadurch gekennzeichnet, daß das Array mindestens fünf Paare von ersten und zweiten Sondengruppen umfasst, wobei die Sonden in den ersten Sondensätzen aus den ersten Gruppen der fünf Paare genau komplementär zu Teilsequenzen von fünf unterschiedlichen respektive ersten Referenzsequenzen sind.
  17. Array aus auf einem festen Träger immobilisierten Oligonukleotidsonden, dadurch gekennzeichnet, daß das Array mindestens eine Sondengruppe umfassend eine Wildtypsonde, die einen Abschnitt von mindestens sechs Nukleotiden genau komplementär zu einer Teilsequenz einer Referenzsequenz umfasst, wobei der Ab schnitt mindestens erste und zweite Abfragepositionen aufweist, welche ersten und zweiten Nukleotiden in der Referenzsequenz entsprechen, ein erster Satz von drei mutierte Sonden, die jeweils identisch mit einer Sequenz sind, welche die Wildtypsonde oder eine Teilsequenz von mindestens sechs Nukleotiden davon einschließlich der ersten und zweiten Abfragepositionen umfasst, außer in der ersten Abfrageposition, welche durch ein abweichendes Nukleotid in jeder der drei mutierte Sonden und der Wildtypsonde besetzt ist; ein zweiter Satz aus drei mutierte Sonden, die jeweils identisch mit einer Sequenz sind, welche die Wildtypsonde oder eine Teilsequenz von mindestens sechs Nukleotiden davon einschließlich der ersten und zweiten Abfragepositionen umfasst, außer in der zweiten Abfrageposition, die durch ein abweichendes Nukleotid in jeder der drei mutierte Sonden und der Wildtypsonde besetzt ist.
  18. Array aus auf einem festen Träger immobilisierten Sonden, dadurch gekennzeichnet, daß es zwei Sondengruppen, von denen jede Gruppe wie in Anspruch 17 definiert ist, umfasst, wobei eine erste Gruppe eine Wildtypsonde, welche einen Abschnitt genau komplementär zu einer Teilsequenz von einer ersten Referenzsequenz umfasst, und eine zweite Gruppe eine Wildtypsonde umfasst, welche einen Abschnitt genau komplementär zu einer Teilsequenz von einer zweiten Referenzsequenz umfasst.
  19. Verfahren zum Vergleichen einer Zielsequenz mit einer Referenzsequenz, dadurch gekennzeichnet, daß das Verfahren Schritte umfasst, bei denen man Varianten einer Referenzsequenz identifiziert, die von der Referenzsequenz in mindestens einem Nukleotid abweichen; jeder Variante eine Bezeichnung zuweist, ein Array aus gepoolten Sonden bereitstellt, bei dem jeder Pool eine separate Zelle auf dem Array besetzt, wobei jeder Pool eine Sonde umfasst, die einen Abschnitt genau komplementär zu jeder Variantensequenz, der eine bestimmte Bezeichnung zugeordnet wurde, umfasst; das Array mit einer Zielsequenz in Kontakt bringt, welche eine Variante von der Referenzsequenz umfasst; die relativen Hybridisierungsintensitäten der Pools in dem Array gegenüber der Zielsequenz bestimmt; die Zielsequenz aus den relativen Hybridisierungsintensitäten der Pools bestimmt.
  20. Gepoolte Sonde, umfassend einen Abschnitt genau komplementär zu einer Teilsequenz einer Referenzsequenz außer an einer ersten Abfrageposition, die durch ein gepooltes Nukleotid N besetzt ist, einer zweiten Abfrageposition, die durch ein gepooltes Nukleotid ausgewählt aus der Gruppe von drei bestehend aus (1) M oder K; (2) R oder Y und (3) S oder W besetzt ist, und einer dritten Abfrageposition, die durch ein zweites gepooltes Nukleotid ausgewählt aus dieser Gruppe besetzt ist, umfasst, wobei das gepoolte Nukleotid, das die zweite Abfrageposition besetzt, ein Nukleotid komplementär zu einem entsprechenden Nukleotid der Referenzsequenz umfasst, wenn die gepoolte Sonde und Referenzsequenz maximal abgeglichen sind, und das gepoolte Nukleotid, das die dritte Abfrageposition besetzt, ein Nukleotid komplementär zu einem entsprechenden Nukleotid aus der Referenzsequenz umfasst, wenn die gepoolte Sonde und die Referenzsequenz maximal abgeglichen sind, worin N A, C, G oder T (U) ist, K G oder T (U) ist, M A oder C ist, R A oder G ist, Y C oder T (U) ist, W A oder T (U) ist und S G oder C ist.
  21. Array aus auf einem festen Träger immobilisierten Oligonukleotidsonden, dadurch gekennzeichnet, daß das Array erste, zweite und dritte Zellen jeweils besetzt von ersten, zweiten und dritten gepoolte Sonden wie in Anspruch 20 definiert umfasst, vorausgesetzt, dass eine von den drei Abfragepositionen in jeder von den drei gepoolte Sonden mit dem gleichen entsprechenden Nukleotid in der Referenzsequenz abgeglichen ist, wobei diese Abfrageposition durch ein N in einer der gepoolte Sonden und einem abweichenden gepoolten Nukleotid in jeder der beiden anderen gepoolten Sonden besetzt ist, worin N A, C, G oder T(U) ist, K G oder T(U) ist, M A oder C ist, R A oder G ist, Y C oder T(U) ist, W A oder T(U) ist und S G oder C ist.
  22. Array nach Anspruch 21, dadurch gekennzeichnet, daß das Array ferner vierte und fünfte Zellen jeweils besetzt, von vierten und fünften gepoolten Sonden, wobei jede gepoolte Sonde wie in Anspruch 21 definiert ist, umfasst, bei denen eine von den drei Abfragepositionen in den zweiten, dritten und vierten gepoolten Sonden mit dem gleichen entsprechenden Nukleotid in der Referenzsequenz abgeglichen wurde, wobei diese Abfrageposition durch ein N in einer der gepoolten Sonden und ein abweichendes gepooltes Nukleotid in jeder der beiden anderen gepoolten Sonden besetzt ist, bei denen eine von den drei Abfragepositionen in den dritten, vierten und fünften gepoolten Sonden mit dem gleichen entsprechenden Nukleotid in der Referenzsequenz abgeglichen ist, wobei diese Abfrageposition durch ein N in einer der gepoolten Sonden und ein abweichendes gepooltes Nukleotid in jeder der beiden anderen gepoolten Sonden besetzt ist.
  23. Array aus Oligonukleotidsonden nach Anspruch 2, dadurch gekennzeichnet, daß der erste Sondensatz eine Sonde umfasst, die erste und zweite Abschnitte umfasst, jede mit mindestens sechs Nukleotiden und genau komplementär zu ersten und zweiten Teilsequenzen der Referenzsequenzen, wobei die Abschnitte mindestens eine Abfrageposition entsprechend einem Nukleotid in der Referenzsequenz beinhalten, worin entweder (1) die ersten und zweiten Teilsequenzen nicht benachbart oder (2) die ersten und zweiten Teilsequenzen benachbart sind und die ersten und zweiten Abschnitte relativ zu dem Gegenstück der ersten und zweiten Teilsequenzen in der Referenzsequenz invertiert vorliegen; und die zweiten, dritten und vierten Sondensätze entsprechende Sonden umfassen, die identisch mit einer Sequenz sind, welche die erste Sonde oder eine Teilsequenz davon umfassen, die mindestens sechs Nukleotide von jedem der ersten und zweiten Abschnitte umfasst, außer in der mindestens einen Abfrageposition, welche in jeder der Sonden abweicht.
  24. Array von Oligonukleotidsonden nach Anspruch 2, dadurch gekennzeichnet, daß der erste Sondensatz eine Sonde umfasst, die einen Abschnitt von mindestens sieben Nukleotiden genau komplementär zu einer Teilsequenz der Referenzsequenz außer einer oder zwei Positionen umfasst, wobei der Abschnitt eine Abfrageposition nicht an der einen oder den zwei Positionen beinhaltet; die zweiten, dritten und vierten Sondensätze entsprechende Sonden umfassen, die jeweils identisch zu einer Sequenz sind, welche die Wildtypsonde oder eine Teilsequenz davon umfassen, welche die Abfrageposition und die eine oder die zwei Positionen beinhaltet, außer in der Abfrageposition, welche durch ein abweichendes Nukleotid in jeder der vier Sonden besetzt ist.
  25. Array aus auf einem festen Träger immobilisierten Oligonukleotidsonden, dadurch gekennzeichnet, daß das Array mindestens zwei Sätze von Oligonukleotidsonden umfasst, (1) einen ersten Sondensatz, der eine Vielzahl von Sonden umfasst, wobei jede Sonde einen Abschnitt genau komplementär zu einer Teilsequenz von mindestens sechs Nukleotiden einer Referenzsequenz außer in einer Abfrageposition umfasst, (2) einen zweiten Sondensatz, der eine entsprechende Sonde für jede Sonde in dem ersten Sondensatz umfasst, wobei die entsprechende Sonde in dem zweiten Sondensatz identisch zu einer Sequenz ist, welche die entsprechende Sonde aus dem ersten Sondensatz oder eine Teilsequenz von mindestens sechs Nukleotiden davon umfasst, welche die Abfrageposition einschließt, außer wenn die Abfrageposition durch ein abweichendes Nukleotid in jeder der beiden entsprechenden Sonden und dem Gegenstück zu der Referenzsequenz besetzt ist, wobei die Sonden in dem ersten Sondensatz jeweils mindestens drei Abfragepositionen entsprechend jedem von drei aufeinanderfolgenden Nukleotiden in der Referenzsequenz aufweisen.
  26. Verfahren zum Vergleichen einer, Zielnukleinsäure mit einer Referenzsequenz, die eine vorbestimmte Nukleotidsequenz umfasst, dadurch gekennzeichnet, daß das Ver fahren die Hybridisierung der Zielnukleinsäure an ein Array aus auf einem festen Träger immobilisierten Oligonukleotidsonden wie in den Ansprüchen 1–18 oder 21 –25 definiert umfasst.
  27. Verfahren nach Anspruch 26, dadurch gekennzeichnet, daß die Zielsequenz ein substituiertes Nukleotid relativ zur Referenzsequenz in mindestens einer unbestimmten Position aufweist, und die relative spezifische Bindung der Sonden die Lokalisierung der Position und das Nukleotid, das diese Position in der Zielsequenz besetzt, angibt.
  28. Verfahren nach Anspruch 26 oder 27, dadurch gekennzeichnet, daß die Referenzsequenz von dem humanen Immunschwäche-Virus stammt.
  29. Verfahren nach den Ansprüchen 26 bis 28, dadurch gekennzeichnet, daß die Zielsequenz von einem zweiten humanen Immunschwäche-Virus stammt, z. B. worin die Zielsequenz ein substituiertes Nukleotid relativ zu der Referenzsequenz an mindestens einer Position aufweist, wobei die Substitution dem Erreger der erworbenen Immunschwäche AIDS Wirkstoffresistenz verleiht und die relative spezifische Bindung der Sonden die Substitution aufdeckt.
  30. Verfahren einem der Ansprüche 26 bis 29, dadurch gekennzeichnet, daß die Bestimmung Schritte umfasst, bei denen man (1) die relativen spezifischen Bindung von vier entsprechenden Sonden aus den ersten, zweiten, dritten und vierten Sondensätzen vergleicht; (2) ein Nukleotides in der Zielsequenz als das Gegenstück zu der Abfrageposition von der Sonde mit der größten spezifischen Bindung bestimmt; (3) (1) und (2) wiederholt bis jedes Nukleotid von Interesse in der Zielsequenz bestimmt worden ist.
  31. Verfahren zum Vergleichen einer Zielnukleinsäure mit einer Referenzsequenz, die eine vorbestimmte Nukleotidsequenz umfasst, nach Anspruch 26 dadurch gekennzeichnet, daß man die Zielsequenz auf ein Array nach den Ansprüchen 13 oder 14 hybridisiert und das Verfahren ferner Schritte umfasst, bei denen man d ie Sonden in der ersten Gruppe bestimmt, welche relativ zueinander an die Zielsequenz hybridisieren, wobei die relative spezifische Bindung der Sonden angibt, ob die Zielsequenz gleich oder abweichend von der ersten Referenzsequenz ist; die Sonden in der zweiten Gruppe bestimmt, welche relativ zueinander an die Zielsequenz hybridisieren, wobei die relative spezifische Bindung der Sonden angibt, ob die Zielsequenz die gleiche oder abweichend von der zweiten Referenzsequenz ist.
  32. Verfahren zum Vergleichen einer Zielnukleinsäure mit einer Referenzsequenz, die eine vorbestimmte Nukleotidsequenz umfasst, nach Anspruch 26 dadurch gekennzeichnet, daß die Zielsequenz auf ein Array von auf einem festen Träger immobilisierten Oligonukliotidsonden wie in den Ansprüchen 1–18 oder 21–25 definiert hybridisiert wird und das Verfahren ferner Schritte umfaßt, bei denen man (a) die Referenzsequenz an das Array von Oligonukleotidsonden hybridisiert; (b) die Sonden bestimmt, welche relativ zu den anderen in dem Array spezifisch an die Referenzsequenz binden; (c) die Sonden bestimmt, welche relativ zu den anderen in dem Array spezifisch an die Zielsequenz binden; wobei die relative spezifische Bindung der Sonden an die Referenz- und Zielsequenz angibt, ob die Referenzsequenz die gleiche oder verschieden von der Zielsequenz ist.
  33. Verfahren nach Anspruch 32, dadurch gekennzeichnet, daß die Referenzsequenz eine erste Markierung und eine zweite Referenzsequenz eine zweite Markierung aufweist, welche sich von der ersten Markierung unterscheidet, und die Schritte (a) und (c) gleichzeitig durchgeführt werden.
  34. Array nach einem der Ansprüche 1 bis 18 oder 21 bis 25, dadurch gekennzeichnet, daß die Referenzsequenz von dem humanen Immunschwäche-Virus stammt, d. h. ein reverse Transkriptase-Gen oder ein Protease-Gen des humanen Immunschwäche-Virus ist.
  35. Array nach Anspruch 34, dadurch gekennzeichnet, daß die Referenzsequenz ein Reverse-Transkriptase-Gen vollständiger Länge ist.
  36. Array nach Anspruch 13 oder 14, dadurch gekennzeichnet, daß die erste Referenzsequenz von einem Reverse-Transkriptase-Gen eines humanen Immunschwäche-Virus ist, und entweder die zweite Referenzsequenz eine Teilsequenz der ersten Referenzsequenz mit einer Substitution von mindestens einem Nukleotid ist, welche einem humanen Immunschwäche-Virus, welcher die zweite Referenzsequenz umfasst, Wirkstoffresistenz verleiht, oder die zweite Referenzsequenz aus einer 16S-RNA oder DNA, die für die 16S-RNA kodiert, aus einem pathogenen Mikroorganismus ist.
  37. Array nach Anspruch 13 oder 14, dadurch gekennzeichnet, daß die ersten und zweiten Referenzsequenzen aus dem Reverse-Transkriptase-Gen aus einem ersten oder zweiten Stamm des humanen Immunschwäche-Virus sind.
  38. Array nach einem der Ansprüche 1–18 oder 21–25, dadurch gekennzeichnet, daß die Referenzsequenz von einem CFTR-Gen, einem p53-Gen, einem hMLH1-Gen, einem MSH2-Gen, einem mitochondrialem Genom ist.
  39. Array nach Anspruch 38, dadurch gekennzeichnet, daß die Referenzsequenz ein D-Loop-Bereich oder ein P450-Gen ist.
DE69433180T 1993-10-26 1994-10-26 Felder von nukleinsaeuresonden auf biologischen chips Expired - Lifetime DE69433180T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14331293A 1993-10-26 1993-10-26
US143312 1993-10-26
US28406494A 1994-08-02 1994-08-02
US284064 1994-08-02
PCT/US1994/012305 WO1995011995A1 (en) 1993-10-26 1994-10-26 Arrays of nucleic acid probes on biological chips

Publications (2)

Publication Number Publication Date
DE69433180D1 DE69433180D1 (de) 2003-10-30
DE69433180T2 true DE69433180T2 (de) 2004-06-24

Family

ID=26840907

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69433180T Expired - Lifetime DE69433180T2 (de) 1993-10-26 1994-10-26 Felder von nukleinsaeuresonden auf biologischen chips

Country Status (5)

Country Link
EP (1) EP0730663B1 (de)
JP (1) JPH09507121A (de)
AU (1) AU8126694A (de)
DE (1) DE69433180T2 (de)
WO (1) WO1995011995A1 (de)

Families Citing this family (397)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5858659A (en) 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US7115364B1 (en) 1993-10-26 2006-10-03 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US6027880A (en) 1995-08-02 2000-02-22 Affymetrix, Inc. Arrays of nucleic acid probes and methods of using the same for detecting cystic fibrosis
US20020048749A1 (en) * 1998-04-15 2002-04-25 Robert J. Lipshutz Methods for polymorphism identifcation and profiling
US6401267B1 (en) 1993-09-27 2002-06-11 Radoje Drmanac Methods and compositions for efficient nucleic acid sequencing
US6045996A (en) * 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US6309823B1 (en) 1993-10-26 2001-10-30 Affymetrix, Inc. Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same
US20060229824A1 (en) 1993-10-26 2006-10-12 Affymetrix, Inc. Arrays of nucleic acid probes for analyzing biotransformation genes
US7375198B2 (en) 1993-10-26 2008-05-20 Affymetrix, Inc. Modified nucleic acid probes
US6741344B1 (en) 1994-02-10 2004-05-25 Affymetrix, Inc. Method and apparatus for detection of fluorescently labeled materials
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5807522A (en) * 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
GB9417211D0 (en) * 1994-08-25 1994-10-12 Solicitor For The Affairs Of H Nucleotide sequencing method
US6974666B1 (en) 1994-10-21 2005-12-13 Appymetric, Inc. Methods of enzymatic discrimination enhancement and surface-bound double-stranded DNA
US5795716A (en) 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
US6600996B2 (en) 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US6720149B1 (en) 1995-06-07 2004-04-13 Affymetrix, Inc. Methods for concurrently processing multiple biological chip assays
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
AU751557B2 (en) * 1995-09-15 2002-08-22 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6380434B1 (en) 1995-10-26 2002-04-30 Long Y. Chiang Fullerene derivatives
US6953663B1 (en) 1995-11-29 2005-10-11 Affymetrix, Inc. Polymorphism detection
US6300063B1 (en) 1995-11-29 2001-10-09 Affymetrix, Inc. Polymorphism detection
US6660233B1 (en) 1996-01-16 2003-12-09 Beckman Coulter, Inc. Analytical biochemistry system with robotically carried bioarray
US20010018514A1 (en) 1998-07-31 2001-08-30 Mcgall Glenn H. Nucleic acid labeling compounds
US7423143B2 (en) 1996-01-23 2008-09-09 Affymetrix. Inc. Nucleic acid labeling compounds
US6965020B2 (en) 1996-01-23 2005-11-15 Affymetrix, Inc. Nucleic acid labeling compounds
US6864059B2 (en) 1996-01-23 2005-03-08 Affymetrix, Inc. Biotin containing C-glycoside nucleic acid labeling compounds
US7282327B2 (en) 1996-01-23 2007-10-16 Affymetrix, Inc. Nucleic acid labeling compounds
US7291463B2 (en) 1996-01-23 2007-11-06 Affymetrix, Inc. Nucleic acid labeling compounds
US7527928B2 (en) 1996-11-29 2009-05-05 Third Wave Technologies, Inc. Reactions on a solid surface
US7432048B2 (en) 1996-11-29 2008-10-07 Third Wave Technologies, Inc. Reactions on a solid surface
WO1997029212A1 (en) * 1996-02-08 1997-08-14 Affymetrix, Inc. Chip-based speciation and phenotypic characterization of microorganisms
EP1728875A3 (de) 1996-02-08 2007-05-09 Affymetrix, Inc. Speziesbestimmung und phenotypische Charakterisierung von Mikroorganismen auf der Basis eines Chips
US6924094B1 (en) 1996-02-08 2005-08-02 Affymetrix, Inc. Chip-based species identification and phenotypic characterization of microorganisms
CA2244891C (en) * 1996-02-09 2008-12-30 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
US6361937B1 (en) 1996-03-19 2002-03-26 Affymetrix, Incorporated Computer-aided nucleic acid sequencing
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
ZA973367B (en) 1996-04-19 1997-11-18 Innogenetics Nv Method for typing and detecting HBV.
WO1997043611A1 (en) 1996-05-16 1997-11-20 Affymetrix, Inc. Systems and methods for detection of labeled materials
US5858666A (en) * 1996-08-29 1999-01-12 Biotechnology Research And Development Corporation Apparatus and method of detection employing an AC frequency sensor array
US6391550B1 (en) 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
AU4495497A (en) * 1996-09-19 1998-04-14 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
US20050202499A1 (en) 1996-10-31 2005-09-15 Billing-Medel Patricia A. Reagents and methods useful for detecting diseases of the breast
GB9622665D0 (en) * 1996-10-31 1997-01-08 Zeneca Ltd Methods
ATE234674T1 (de) * 1996-11-14 2003-04-15 Affymetrix Inc Chemische amplifizierung zur synthese von musterordnungen
EP1007969A4 (de) * 1996-12-17 2006-12-13 Affymetrix Inc Herstellung lithographischer masken und synthese verschiedener sonden auf einemsubstrat
US7144699B2 (en) 1997-03-20 2006-12-05 Affymetrix, Inc. Iterative resequencing
US6308170B1 (en) 1997-07-25 2001-10-23 Affymetrix Inc. Gene expression and evaluation system
US6420108B2 (en) 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
US7068830B2 (en) 1997-07-25 2006-06-27 Affymetrix, Inc. Method and system for providing a probe array chip design database
CA2267642A1 (en) * 1997-07-31 1999-02-11 Yoshihide Hayashizaki Methods for detecting mutation in base sequence
CA2299625A1 (en) 1997-08-15 1999-02-25 Affymetrix, Inc. Polymorphism detection utilizing clustering analysis
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
US6322968B1 (en) 1997-11-21 2001-11-27 Orchid Biosciences, Inc. De novo or “universal” sequencing array
US6013449A (en) * 1997-11-26 2000-01-11 The United States Of America As Represented By The Department Of Health And Human Services Probe-based analysis of heterozygous mutations using two-color labelling
US6087102A (en) 1998-01-07 2000-07-11 Clontech Laboratories, Inc. Polymeric arrays and methods for their use in binding assays
US6289229B1 (en) 1998-01-20 2001-09-11 Scimed Life Systems, Inc. Readable probe array for in vivo use
US6342351B1 (en) 1998-03-16 2002-01-29 Millennium Pharmaceuticals, Inc. Methods and compositions for diagnosing and treating chromosome-18p related disorders
US6077673A (en) * 1998-03-31 2000-06-20 Clontech Laboratories, Inc. Mouse arrays and kits comprising the same
US6692909B1 (en) 1998-04-01 2004-02-17 Whitehead Institute For Biomedical Research Coding sequence polymorphisms in vascular pathology genes
AU3659199A (en) * 1998-04-20 1999-11-08 Affymetrix, Inc. Methods for reducing non-specific binding to a nucleic acid probe array
US6525185B1 (en) 1998-05-07 2003-02-25 Affymetrix, Inc. Polymorphisms associated with hypertension
WO1999058721A1 (en) * 1998-05-12 1999-11-18 Whitehead Institute For Biomedical Research Multiplex dna amplification using chimeric primers
US6322976B1 (en) * 1998-05-28 2001-11-27 Medical Research Council Compositions and methods of disease diagnosis and therapy
US6699659B2 (en) 1998-06-01 2004-03-02 Affymetrix, Inc. Products and methods for analyzing nucleic acids including identification of substitutions, insertions and deletions
US6872521B1 (en) 1998-06-16 2005-03-29 Beckman Coulter, Inc. Polymerase signaling assay
US6235473B1 (en) 1998-07-02 2001-05-22 Orchid Biosciences, Inc. Gene pen devices for array printing
US6245507B1 (en) 1998-08-18 2001-06-12 Orchid Biosciences, Inc. In-line complete hyperspectral fluorescent imaging of nucleic acid molecules
US6306643B1 (en) 1998-08-24 2001-10-23 Affymetrix, Inc. Methods of using an array of pooled probes in genetic analysis
FR2783000B1 (fr) * 1998-09-04 2002-07-05 Genolife Procede d'amplification de la totalite des fragments d'adn d'un echantillon
US6461812B2 (en) 1998-09-09 2002-10-08 Agilent Technologies, Inc. Method and multiple reservoir apparatus for fabrication of biomolecular arrays
US6475440B1 (en) 1998-09-16 2002-11-05 Clontech Laboratories, Inc. Applicator for use in deposition of fluid samples onto a substrate surface
US6185561B1 (en) 1998-09-17 2001-02-06 Affymetrix, Inc. Method and apparatus for providing and expression data mining database
US6489096B1 (en) 1998-10-15 2002-12-03 Princeton University Quantitative analysis of hybridization patterns and intensities in oligonucleotide arrays
JP2002528096A (ja) * 1998-10-27 2002-09-03 アフィメトリックス インコーポレイテッド ゲノムdnaの複雑性制御および分析
US6670464B1 (en) 1998-11-17 2003-12-30 Curagen Corporation Nucleic acids containing single nucleotide polymorphisms and methods of use thereof
US6087112A (en) * 1998-12-30 2000-07-11 Oligos Etc. Inc. Arrays with modified oligonucleotide and polynucleotide compositions
WO2000039344A2 (en) * 1998-12-31 2000-07-06 Gene Logic Inc. Assay device comprising mixed probes
EP1144684B1 (de) * 1999-01-06 2009-08-19 Callida Genomics, Inc. Verbesserte sequenzierung mittels hybridisierung durch verwendung von sondengemischen
US7005256B1 (en) 1999-03-10 2006-02-28 Cold Spring Harbor Laboratory Gene chip technology for determining memory genes
GB9906833D0 (en) * 1999-03-24 1999-05-19 Clatterbridge Cancer Res Trust Genetic analysis
WO2000056923A2 (en) * 1999-03-24 2000-09-28 Clatterbridge Cancer Research Trust Genetic analysis
US6824866B1 (en) 1999-04-08 2004-11-30 Affymetrix, Inc. Porous silica substrates for polymer synthesis and assays
US6518056B2 (en) 1999-04-27 2003-02-11 Agilent Technologies Inc. Apparatus, systems and method for assaying biological materials using an annular format
ATE225940T1 (de) * 1999-05-19 2002-10-15 Advanced Array Technologies S Verfahren zur identifizierung und/oder quantifizierung einer zielverbindung
EP1054259A1 (de) * 1999-05-19 2000-11-22 Remacle, José Verfahren zur Identifizierung von einer Zielverbindung
US20020086289A1 (en) * 1999-06-15 2002-07-04 Don Straus Genomic profiling: a rapid method for testing a complex biological sample for the presence of many types of organisms
US6346423B1 (en) 1999-07-16 2002-02-12 Agilent Technologies, Inc. Methods and compositions for producing biopolymeric arrays
EP1078993A1 (de) * 1999-08-24 2001-02-28 Biomerieux Verfahren zur Biochip-Datenanalyse
US6844151B1 (en) 1999-09-29 2005-01-18 Oligos Etc. Inc. Methods for production of arrays with modified oligonucleotide and polynucleotide compositions
WO2001025481A1 (fr) 1999-10-04 2001-04-12 Olympus Optical Co., Ltd. Procede de detection d'acide nucleique
AU1075701A (en) 1999-10-08 2001-04-23 Protogene Laboratories, Inc. Method and apparatus for performing large numbers of reactions using array assembly
US6171797B1 (en) 1999-10-20 2001-01-09 Agilent Technologies Inc. Methods of making polymeric arrays
US6423535B1 (en) 1999-11-24 2002-07-23 Incyte Genomics, Inc. Normalization control for hybridization reactions
US6448013B1 (en) 1999-11-24 2002-09-10 Incyte Genomics, Inc. Duplex probes for hybridization reactions
US6489114B2 (en) 1999-12-17 2002-12-03 Bio Merieux Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby
US6902891B2 (en) 1999-12-17 2005-06-07 Bio Merieux Process for labeling a nucleic acid
EP1111069A1 (de) * 1999-12-22 2001-06-27 BioChip Technologies GmbH Modifizierte Nukleinsäuren und deren Verwendung
CA2398104C (en) * 2000-01-31 2015-03-10 Epidauros Biotechnologie Ag Polymorphisms in the human cyp2d6 gene promoter region and their use in diagnostic and therapeutic applications
GB0004312D0 (en) 2000-02-23 2000-04-12 Oxagen Limited Test and model for inflammatory disease
EP1294934A2 (de) 2000-03-08 2003-03-26 Complexe Hospitalier de la Sagamie Polimorphismen des very-low-density-lipoproteinrezeptors und deren verwendung
AU2001248352A1 (en) * 2000-03-15 2001-09-24 Epigenomics Ag Diagnosis of diseases associated with the cell cycle
US6316608B1 (en) * 2000-03-20 2001-11-13 Incyte Genomics, Inc. Combined polynucleotide sequence as discrete assay endpoints
EP1136566A1 (de) * 2000-03-24 2001-09-26 Facultés Universitaires Notre-Dame de la Paix Methode und Kit zum Nachweis und/oder Quantifizierung von homologen Sequenzen mittels Arrays
US7875442B2 (en) 2000-03-24 2011-01-25 Eppendorf Array Technologies Identification and quantification of a plurality of biological (micro)organisms or their components
US7205104B2 (en) 2000-03-24 2007-04-17 Eppendorf Array Technologies Sa (Eat) Identification of biological (micro) organisms by detection of their homologous nucleotide sequences on arrays
US7829313B2 (en) 2000-03-24 2010-11-09 Eppendorf Array Technologies Identification and quantification of a plurality of biological (micro)organisms or their components
WO2001077164A2 (en) 2000-04-06 2001-10-18 Epigenomics Ag Diagnosis of diseases associated with apoptosis by means of assessing the methylation status of genes associated with apoptosis
EP1268856A2 (de) * 2000-04-07 2003-01-02 Epigenomics AG Detektion von snp's und cytosin-methylierungen
WO2001081633A1 (en) * 2000-04-25 2001-11-01 Whitehead Institute For Biomedical Research Association of protein kinase c zeta polymorphisms with diabetes
US20030031675A1 (en) 2000-06-06 2003-02-13 Mikesell Glen E. B7-related nucleic acids and polypeptides useful for immunomodulation
WO2002000926A2 (en) * 2000-06-30 2002-01-03 Epigenomics Ag Diagnosis of diseases associated with signal transduction
US6984522B2 (en) 2000-08-03 2006-01-10 Regents Of The University Of Michigan Isolation and use of solid tumor stem cells
AU2001290178A1 (en) 2000-08-17 2002-02-25 Tripep Ab A hepatitis c virus non-structural ns3/4a fusion gene
US6858590B2 (en) 2000-08-17 2005-02-22 Tripep Ab Vaccines containing ribavirin and methods of use thereof
US6803211B2 (en) 2000-08-25 2004-10-12 Pfizer Inc. Methods and compositions for diagnosing and treating disorders involving angiogenesis
JP3467004B2 (ja) 2000-08-31 2003-11-17 キヤノン株式会社 核酸の塩基配列の解析方法
JP2002071687A (ja) 2000-08-31 2002-03-12 Canon Inc 変異遺伝子のスクリーニング方法
CA2835978C (en) 2000-09-01 2016-10-11 Gen-Probe Incorporated Amplification of hiv-1 sequences for detection of sequences associated with drug-resistance mutations
AU2002212187A1 (en) * 2000-09-01 2002-03-13 Epigenomics Ag Diagnosis of illnesses or predisposition to certain illnesses
KR100870486B1 (ko) * 2000-09-01 2008-12-11 에피제노믹스 아게 게놈 디엔에이 시료의 서열 콘택스트 5'-씨피쥐-3'에서 특정 시토신의 메틸화 정도 측정방법
US6849409B2 (en) 2000-10-16 2005-02-01 Axxima Pharmaceuticals Ag Cellular kinases involved in Cytomegalovirus infection and their inhibition
US6706867B1 (en) 2000-12-19 2004-03-16 The United States Of America As Represented By The Department Of Health And Human Services DNA array sequence selection
US6376225B1 (en) 2001-01-05 2002-04-23 Pe Corporation (Ny) Isolated human phosphodiesterase proteins, nucleic acid molecules encoding human phosphodiesterase proteins, and uses thereof
WO2002057283A1 (en) * 2001-01-19 2002-07-25 Baylor College Of Medecine Methods and compositions in breast cancer diagnosis and therapeutics
CA2440615A1 (en) 2001-03-12 2002-09-19 Affymetrix, Inc. Nucleic acid labeling compounds
FR2822476B1 (fr) 2001-03-23 2004-04-02 Aventis Pharma Sa Procedes de purification et de detection de sequences cibles d'adn double brin par interaction triple helice
US7115726B2 (en) 2001-03-30 2006-10-03 Perlegen Sciences, Inc. Haplotype structures of chromosome 21
AU785425B2 (en) 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
WO2002090599A1 (en) 2001-05-09 2002-11-14 Genetic Id, Inc. Universal microarray system
EP1925672A1 (de) 2001-06-22 2008-05-28 Syngeta Participations AG Auf abiotischen Stress ansprechende Polynukleotide und Polypeptide
FR2828208A1 (fr) * 2001-08-01 2003-02-07 Cytomics Systems Acides nucleiques codant de nouvelles proteines a boite f, leurs utilisations en diagnostic et en therapie
US7285631B2 (en) 2001-08-10 2007-10-23 Serono Genetics Institute S.A. Human cDNAs and proteins and uses thereof
JP4393867B2 (ja) 2001-08-14 2010-01-06 センティジェン・バイオサイエンシーズ・インコーポレイテッド 昆虫Or83b嗅覚レセプター遺伝子の核酸およびタンパク質ならびにその使用
US6799122B2 (en) 2001-08-31 2004-09-28 Conagra Grocery Products Company Method for identifying polymorphic markers in a population
RU2316591C2 (ru) 2001-11-09 2008-02-10 Джорджтаун Юниверсити Новые изоформы ингибитора роста васкулярных эндотелиальных клеток
ES2364037T3 (es) 2001-12-10 2011-08-23 Novartis Ag Métodos de tratamiento de psicosis y esquizofrenia basados en polimorfismos del gen del cntf.
US7858297B2 (en) 2001-12-18 2010-12-28 Centre National De La Recherche Scientifique Cnrs Chemokine-binding protein and methods of use
DE10208770A1 (de) * 2002-02-28 2003-09-04 Febit Ag Erhöhung der Sensitivität und Spezifität von Hybridisierungsexperimenten mit Nukleinsäure-Chips
CA2478104A1 (en) * 2002-03-04 2003-09-18 The Texas A & M University System Quantitative trait loci and somatostatin
AU2003233451A1 (en) 2002-03-26 2003-10-13 Massachusetts Institute Of Technology Targets, methods, and reagents for diagnosis and treatment of schizophrenia
ATE358182T1 (de) * 2002-09-05 2007-04-15 Plant Bioscience Ltd Genomteilung
FR2846339B1 (fr) * 2002-10-28 2007-09-07 Ipsogen Procede d'analyse d'un etat biologique complexe d'un biosysteme et support permettant son interpretation directe
EP2474632B1 (de) 2002-12-20 2015-08-12 Celera Corporation Mit einem Myokardinfarkten assoziierte genetische Polymorphismen, Nachweisverfahren und deren Verwendungen
US20080187911A1 (en) * 2003-01-30 2008-08-07 Research Development Foundation Methods and compositions for analysis of mitochondrial-related gene expression
FR2850669A1 (fr) * 2003-02-05 2004-08-06 Centre Nat Rech Scient Procede pour preparer une collection de moyens de detection de genes inductibles par un mediateur de l'inflammation, et applications.
WO2004104040A1 (en) 2003-05-21 2004-12-02 Ares Trading S.A. Tnf-like secreted protein
US20050014168A1 (en) * 2003-06-03 2005-01-20 Arcturus Bioscience, Inc. 3' biased microarrays
US20040259100A1 (en) 2003-06-20 2004-12-23 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
WO2005001125A1 (ja) * 2003-06-27 2005-01-06 Olympus Corporation 核酸の変異及び多型の判定方法
WO2005001091A1 (ja) * 2003-06-27 2005-01-06 Olympus Corporation 核酸の変異及び多型の検出用プローブセット、それを固相化したdnaアレイ、並びにそれらを用いた変異及び多型の検出方法
AP2006003513A0 (en) 2003-07-14 2006-02-28 Internat Levestock Res Inst Il East coast fever vaccine based on ctl-specific schizont antigens.
US7329490B2 (en) 2003-09-15 2008-02-12 Bristol-Myers Squibb Company Methods for diagnosing schizophrenia by detecting a polymorphism in the KalphaM1 gene
US7964344B2 (en) * 2003-09-17 2011-06-21 Canon Kabushiki Kaisha Stable hybrid
CA2541473A1 (en) 2003-10-10 2005-04-21 Yissum Research Development Company Of The Hebrew University Of Jerusale M Method and kit for assessing anxiety or disposition thereto in a subject
EP1711622A2 (de) 2003-11-26 2006-10-18 Applera Corporation Mit kardiovaskulären erkrankungen und dem ansprechen auf medikation in zusammenhang stehende genpolymorphismen, methoden zu deren nachweis und deren verwendung
JPWO2005056834A1 (ja) * 2003-12-10 2007-07-05 オリンパス株式会社 核酸配列解析方法
CN1961074A (zh) * 2003-12-24 2007-05-09 三星电子株式会社 包含与ⅱ型糖尿病有关的单核苷酸多态性的多核苷酸、包含该多核苷酸的微阵列和诊断试剂盒以及使用它们分析多核苷酸的方法
GB0403039D0 (en) * 2004-02-11 2004-03-17 Health Prot Agency TB resistance assay
WO2005113815A2 (en) * 2004-04-26 2005-12-01 Uab Research Foundation Polymorphisms in the fcgr2b promoter and uses thereof
JP5236286B2 (ja) 2004-05-07 2013-07-17 セレラ コーポレーション 肝線維症に関連する遺伝的多型、その検出方法および使用
EP1598428A1 (de) 2004-05-18 2005-11-23 Georg Dewald Verfahren und Kits zum Nachweis von erblichen angioedema typ III
EP2471922A1 (de) 2004-05-28 2012-07-04 Asuragen, Inc. Verfahren und Zusammensetzungen mit microRNA
US7338763B2 (en) 2004-06-02 2008-03-04 Eppendorf Array Technologies S.A. Method and kit for the detection and/or quantification of homologous nucleotide sequences on arrays
US7702466B1 (en) 2004-06-29 2010-04-20 Illumina, Inc. Systems and methods for selection of nucleic acid sequence probes
US20060003345A1 (en) 2004-06-30 2006-01-05 Pfizer Inc RNA bioassay
US20070212715A1 (en) * 2004-08-04 2007-09-13 Mikiko Yamanaka Bacteria detection device, bacteria detection method and bacteria detection kit
GB0417887D0 (en) 2004-08-11 2004-09-15 Ares Trading Sa Protein
EP1802775B1 (de) 2004-09-14 2010-05-26 The Regents of the University of Colorado Auf genetischem targeting basierendes verfahren zur behandlung mit bucindolol
FI20041204A0 (fi) 2004-09-16 2004-09-16 Riikka Lund Menetelmät immuunivälitteisiin sairauksiin liittyvien uusien kohdegeenien hyödyntämiseksi
FR2877013A1 (fr) 2004-10-27 2006-04-28 Assist Publ Hopitaux De Paris Indentification d'une mutation de jak2 impliquee dans la polyglobulie de vaquez
US8173611B2 (en) 2004-11-12 2012-05-08 Asuragen Inc. Methods and compositions involving miRNA and miRNA inhibitor molecules
EP2194144B1 (de) 2004-11-16 2015-01-07 Trustees of Boston University Anti-Dual Endothelin-1/Angiotensin II-Rezeptor (DEAR) Antikörper zur Hemmung von Krankheit-assozierter oder pathologischer Angiogenese.
JP4882074B2 (ja) 2005-02-28 2012-02-22 国立大学法人東京工業大学 オリゴヌクレオチド誘導体、遺伝子検出用プローブ及びdnaチップ
EP2113572B1 (de) 2005-03-11 2012-12-05 Celera Corporation Mit koronarer Herzkrankheit assoziierte genetische Polymorphismen, Nachweisverfahren und deren Verwendungen
EP1885738A4 (de) * 2005-03-16 2008-11-12 Univ Guelph Rinder-cast-gen-snp und fleischzärte
EP1896607A4 (de) * 2005-05-10 2009-12-16 Synergenz Bioscience Ltd Verfahren und zusammensetzungen zur beurteilung der lungenfunktion und von lungenerkrankungen
EP1888751A2 (de) 2005-05-25 2008-02-20 Tripep Ab Nichtstrukturelles ns3/4a-fusionsgen des hepatitis-c-virus
EP3492602A1 (de) 2005-06-15 2019-06-05 Complete Genomics, Inc. Einzelne molekülarrays für genetische und chemische analyse
US7807361B2 (en) * 2005-07-13 2010-10-05 Wisconsin Alumni Research Foundation Dairy cattle breeding for improved milk production traits in cattle
US7897749B2 (en) * 2005-07-13 2011-03-01 Wisconsin Alumni Research Foundation Dairy cattle breeding for improved milk production traits in cattle
ATE526398T1 (de) 2005-08-19 2011-10-15 Commw Scient Ind Res Org Arachnocampa-luciferasen
US7666584B2 (en) 2005-09-01 2010-02-23 Philadelphia Health & Education Coporation Identification of a pin specific gene and protein (PIN-1) useful as a diagnostic treatment for prostate cancer
US7799530B2 (en) 2005-09-23 2010-09-21 Celera Corporation Genetic polymorphisms associated with cardiovascular disorders and drug response, methods of detection and uses thereof
US20100292339A1 (en) * 2005-10-05 2010-11-18 Zeisel Steven H Genetic Polymorphisms Predictive of Nutritional Requirements for Choline in Subjects
US20100222415A1 (en) * 2005-10-14 2010-09-02 The Regents Of The University Of California Method to Diagnose, Predict Treatment Response and Develop Treatment for Psychiatric Disorders Using Markers
US8440695B2 (en) 2005-11-09 2013-05-14 St Jude Children's Research Hospital Use of chloroquine to treat metabolic syndrome
KR20080073748A (ko) 2005-11-16 2008-08-11 노파르티스 아게 척수 손상에서의 항-nogo-a 항체 치료를 위한바이오마커
WO2007056825A1 (en) 2005-11-21 2007-05-24 Simons Haplomics Limited Method and probes for identifying a nucleotide sequence
JP5394069B2 (ja) 2005-11-29 2014-01-22 ケンブリッジ エンタープライズ リミテッド 乳癌についてのマーカー
EP1981985A4 (de) * 2006-01-05 2009-11-11 Simons Haplomics Ltd Mikroarray-verfahren
JP2009524440A (ja) 2006-01-27 2009-07-02 アテナ ダイアグノスティックス,インコーポレイテッド アタキシア−オキュラー・アプラキシア2(ataxia−ocularapraxia2)(aoa2)に関連した突然変異を検出する方法
US9445025B2 (en) 2006-01-27 2016-09-13 Affymetrix, Inc. System, method, and product for imaging probe arrays with small feature sizes
US10522240B2 (en) 2006-05-03 2019-12-31 Population Bio, Inc. Evaluating genetic disorders
US7702468B2 (en) 2006-05-03 2010-04-20 Population Diagnostics, Inc. Evaluating genetic disorders
US7759062B2 (en) 2006-06-09 2010-07-20 Third Wave Technologies, Inc. T-structure invasive cleavage assays, consistent nucleic acid dispensing, and low level target nucleic acid detection
EP2377953A1 (de) * 2006-06-23 2011-10-19 Myriad Genetics, Inc. Varianten des DPYD-Gens und ihre Verwendung
US7642049B2 (en) 2006-06-30 2010-01-05 Bristol-Myers Squibb Company Method for identifying HIV-1 protease inhibitors with reduced metabolic affects through detection of human resistin polymorphisms
EP2115138A2 (de) 2006-09-19 2009-11-11 Asuragen, Inc. Bei pankreatischen erkrankungen differentiell exprimierte mikro-rnas und verwendungen davon
CA2663962A1 (en) 2006-09-19 2008-03-27 Asuragen, Inc. Mir-15, mir-26, mir-31,mir-145, mir-147, mir-188, mir-215, mir-216, mir-331, mmu-mir-292-3p regulated genes and pathways as targets for therapeutic intervention
EP2069377A4 (de) 2006-09-27 2009-11-11 Univ California Verfahren und zusammensetzungen zur behandlung von hautkrankheiten und hautfunktionsstörungen
AU2007307171B2 (en) 2006-10-04 2012-01-19 Third Wave Technologies, Inc. Snap-back primers and detectable hairpin structures
WO2008051511A2 (en) 2006-10-20 2008-05-02 Applera Corporation Genetic polymorphisms associated with venous thrombosis, methods of detection and uses thereof
BRPI0721009B1 (pt) 2006-12-21 2019-08-20 Agriculture Victoria Services Pty Limited Método de seleção artificial em uma população não humana de plantas ou animais que possui um pequeno tamanho populacional efetivo menor do que 1000 indivíduos, uso dométodo, processo para produção de ganho genético em uma população, e método de seleção artificial em pecuária
US8642295B2 (en) 2007-01-11 2014-02-04 Erasmus University Medical Center Circular chromosome conformation capture (4C)
US20090203011A1 (en) * 2007-01-19 2009-08-13 Epigenomics Ag Methods and nucleic acids for analyses of cell proliferative disorders
EP2520668B1 (de) 2007-01-31 2014-12-24 Celera Corporation Molekulare Prognosesignatur zur Prognose entfernter Brustkrebsmetastasen und Anwendungen davon
EP2155907B1 (de) * 2007-04-30 2015-05-27 Decode Genetics EHF Für die risikobeurteilung von koronarer herzkrankheit und myokardinfarkt geeignete genetische varianten
US8200440B2 (en) 2007-05-18 2012-06-12 Affymetrix, Inc. System, method, and computer software product for genotype determination using probe array data
AU2008255641B2 (en) 2007-05-31 2014-03-13 Board Of Regents Of The University Of Texas System Diagnostic markers for ankylosing spondylitis and uses thereof
US20120115131A1 (en) 2007-05-31 2012-05-10 Yale University Genetic lesion associated with cancer
WO2008157834A1 (en) * 2007-06-21 2008-12-24 University Of South Florida Materials and methods for diagnosis of asthma
CA2691166A1 (en) 2007-06-27 2008-12-31 Liu Dongxu Polypeptides and polynucleotides for artemin and related ligands, and methods of use thereof
US8685642B2 (en) * 2007-07-30 2014-04-01 Agilent Technologies, Inc. Allele-specific copy number measurement using single nucleotide polymorphism and DNA arrays
EP2185726B1 (de) 2007-08-06 2014-01-08 Orion Genomics, LLC Neue einzelnukleotid-polymorphismen und kombinationen neuer und bekannter polymorphismen zur bestimmung der allelspezifischen expression des igf2-gens
EP2185195A2 (de) 2007-08-16 2010-05-19 Tripep Ab Immunogen-plattform
US9388457B2 (en) 2007-09-14 2016-07-12 Affymetrix, Inc. Locus specific amplification using array probes
MX340736B (es) 2007-09-25 2016-07-22 Pastoral Greenhouse Gas Res Ltd * Vacunas y componentes de vacunas para inhibicion de celulas microbianas.
US8039212B2 (en) 2007-11-05 2011-10-18 Celera Corporation Genetic polymorphisms associated with liver fibrosis, methods of detection and uses thereof
US8338098B2 (en) * 2007-11-07 2012-12-25 Wisconsin Alumni Research Foundation Methods and compositions for improved cattle longevity and milk production
WO2009064973A2 (en) * 2007-11-14 2009-05-22 Medtronic Inc. Diagnostic kits and methods for scd or sca therapy selection
US20110143345A1 (en) * 2007-11-14 2011-06-16 Medtronic, Inc. Genetic Markers for SCD or SCA Therapy Selection
EP2227556B1 (de) 2007-11-19 2014-08-27 Celera Corporation Lungenkrebs-marker und deren verwendungen
WO2009089120A2 (en) 2008-01-02 2009-07-16 Suregene Llc Genetic markers of mental illness
AU2009205920A1 (en) 2008-01-17 2009-07-23 Suregene Llc Genetic markers of mental illness
US8003328B2 (en) * 2008-02-01 2011-08-23 The Board Of Trustees Of The University Of Arkansas Bovine polymorphisms and methods of predicting bovine traits
US20090221620A1 (en) 2008-02-20 2009-09-03 Celera Corporation Gentic polymorphisms associated with stroke, methods of detection and uses thereof
US20110104687A1 (en) * 2008-02-27 2011-05-05 Bruce Grahn Methods and Kits for Detecting Congenital Stationary Night Blindness and Selecting Different Coat Patterns
US9074244B2 (en) 2008-03-11 2015-07-07 Affymetrix, Inc. Array-based translocation and rearrangement assays
US8067171B2 (en) * 2008-04-18 2011-11-29 Wisconsin Alumni Research Foundation Methods and compositions for improved fertilization and embryonic survial
WO2009137807A2 (en) 2008-05-08 2009-11-12 Asuragen, Inc. Compositions and methods related to mirna modulation of neovascularization or angiogenesis
US20110111417A1 (en) * 2008-05-14 2011-05-12 Millennium Pharmaceuticals, Inc. Methods and kits for monitoring the effects of immunomodulators on adaptive immunity
US20110152340A1 (en) 2008-05-16 2011-06-23 Bristol-Myers Squibb Company Methods for Identifying Subjects With an Increased Likelihood of Responding to DPP-IV Inhibitors
EP2878680B1 (de) 2008-07-09 2016-06-08 Celera Corporation Mit kardiovaskulären Krankheiten assoziierte, genetische Polymorphismen, Verfahren zum Nachweis und Verwendungen davon
AU2009273277A1 (en) * 2008-07-24 2010-01-28 Merck Serono S.A. Use of genetic markers for identifying the response to interferon treatment in Multiple Sclerosis patients
EP2172563A1 (de) * 2008-09-24 2010-04-07 bioMérieux S.A. Verfahren zur Verringerung der Abhängigkeit von Sequenzvariationen eines Nukleinsäuretargets in einem diagnostischen Hybridisierungs-Assay
EP2344672B8 (de) * 2008-09-25 2014-12-24 SureGene LLC Genetische marker zur optimierung einer schizophreniebehandlung
WO2010077832A1 (en) 2008-12-15 2010-07-08 Wisconsin Alumni Research Foundation Methods and compositions for testing and breeding cattle for improved fertility and embryonic survival
JP5748672B2 (ja) * 2009-02-11 2015-07-15 オリオン ゲノミクス エルエルシー Igf2の対立遺伝子特異的な発現を判定するための多型の組み合わせ
EP2221387A1 (de) 2009-02-19 2010-08-25 Université de la Méditerranée Fibroseanfälligkeitsgen und Verwendungen davon
EP2425240A4 (de) 2009-04-30 2012-12-12 Good Start Genetics Inc Verfahren und zusammensetzung zur bewertung genetischer marker
US20120165202A1 (en) * 2009-04-30 2012-06-28 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
CN102575287B (zh) * 2009-05-15 2016-11-16 因赛特遗传学公司 用于诊断和治疗癌症的涉及alk融合物的方法和组合物
MX2011012913A (es) 2009-06-01 2012-02-21 Genetic Technologies Ltd Métodos para evaluar el riesgo de cáncer de mama.
EP2264183B1 (de) 2009-06-09 2016-12-07 Gendiag.exe, S.L. Risikomarker für kardiovaskuläre Krankheit
US8367334B2 (en) 2009-06-18 2013-02-05 The Penn State Research Foundation Methods, systems and kits for detecting protein-nucleic acid interactions
JP5817038B2 (ja) * 2009-06-22 2015-11-18 洋孝 松尾 尿酸トランスポーター、並びに、尿酸輸送関連疾患素因及び炎症関連疾患素因の評価方法及び評価キット、検査体及び薬
JP2012531210A (ja) 2009-06-25 2012-12-10 イェール ユニバ−シティ− Brca1における一塩基多型および癌のリスク
WO2011006169A1 (en) 2009-07-10 2011-01-13 Portola Pharmaceuticals, Inc. Methods for diagnosis and treatment of thrombotic disorders mediated by cyp2c19*2
US9416409B2 (en) 2009-07-31 2016-08-16 Ibis Biosciences, Inc. Capture primers and capture sequence linked solid supports for molecular diagnostic tests
AR077992A1 (es) 2009-08-27 2011-10-05 Pastoral Greenhouse Gas Res Ltd Secuencia del genoma completo del metanogeno methanobrevibacter ruminantium
WO2011027219A1 (en) 2009-09-04 2011-03-10 Progenika Biopharma, S.A. High throughput detection of small genomic deletions and insertions
US9512481B2 (en) 2009-09-11 2016-12-06 The Regents Of The University Of Colorado, A Body Corporate Polymorphisms in the PDE3A gene
WO2011044162A1 (en) 2009-10-06 2011-04-14 Shire Human Genetic Therapies Assays for agents affecting megakaryocyte development
US7972793B2 (en) 2009-11-04 2011-07-05 Suregene, Llc Methods and compositions for the treatment of psychotic disorders through the identification of the SULT4A1-1 haplotype
US8501122B2 (en) 2009-12-08 2013-08-06 Affymetrix, Inc. Manufacturing and processing polymer arrays
FR2954349A1 (fr) 2009-12-22 2011-06-24 Agronomique Inst Nat Rech Sulfatase modifiant selectivement les glycosaminoglycanes
US20130071408A1 (en) 2010-02-01 2013-03-21 Atul J. Butte Methods for Diagnosis and Treatment of Non-Insulin Dependent Diabetes Mellitus
WO2011108930A1 (en) 2010-03-04 2011-09-09 Interna Technologies Bv A MiRNA MOLECULE DEFINED BY ITS SOURCE AND ITS DIAGNOSTIC AND THERAPEUTIC USES IN DISEASES OR CONDITIONS ASSOCIATED WITH EMT
WO2011128096A1 (en) 2010-04-16 2011-10-20 Roche Diagnostics Gmbh Polymorphism markers for predicting response to interleukin-6 receptor-inhibiting monoclonal antibody drug treatment
US20110269735A1 (en) 2010-04-19 2011-11-03 Celera Corporation Genetic polymorphisms associated with statin response and cardiovascular diseases, methods of detection and uses thereof
US20130203054A1 (en) * 2010-05-04 2013-08-08 Universite D'aix-Marseille Antiviral treatment susceptibility gene and uses thereof
EP2576834A4 (de) * 2010-05-26 2013-11-20 Philadelphia Children Hospital Zusammensetzungen und verfahren zur diagnose und behandlung des primären insulin-wachstumsfaktor-mangels und von idiopathischem kleinwuchs
ES2647612T3 (es) 2010-06-04 2017-12-22 Chronix Biomedical Biomarcadores de ácidos nucleicos en circulación asociados al cáncer de próstata
EP2576824A2 (de) 2010-06-07 2013-04-10 Roche Diagnostics GmbH Genexpressionsmarker zur vorhersage der reaktion auf eine behandlung mit einem interleukin-6-hemmenden monoklonalen antikörper
WO2011159942A1 (en) 2010-06-18 2011-12-22 Illumina, Inc. Conformational probes and methods for sequencing nucleic acids
US8530157B2 (en) 2010-07-01 2013-09-10 Agilent Technologies, Inc. SNP-dependent end labeling method
NZ605420A (en) 2010-07-06 2015-02-27 Interna Technologies Bv Mirna and its diagnostic and therapeutic uses in diseases or conditions associated with melanoma, or in diseases or conditions associated with activated braf pathway
EP2580325A4 (de) 2010-07-16 2013-11-20 Tocagen Inc Retrovirenerkennung
EP2601609B1 (de) 2010-08-02 2017-05-17 Population Bio, Inc. Zusammensetzungen und verfahren zur erkennung der verursachenden mutationen in genetischen erkrankungen
WO2012027302A2 (en) * 2010-08-21 2012-03-01 The Regents Of The University Of California Systems and methods for detecting antibiotic resistance
CA2819230A1 (en) 2010-10-28 2012-05-03 Yale University Methods and compositions for assessing and treating cancer
US20120108651A1 (en) 2010-11-02 2012-05-03 Leiden University Medical Center (LUMC) Acting on Behalf of Academic Hospital Leiden (AZL) Genetic polymorphisms associated with venous thrombosis and statin response, methods of detection and uses thereof
US10150999B2 (en) 2010-11-17 2018-12-11 Interpace Diagnostics, Llc miRNAs as biomarkers for distinguishing benign from malignant thyroid neoplasms
WO2012071525A2 (en) 2010-11-24 2012-05-31 Yale University Compositions and methods for diagnosing and treating diseases and disorders associated with d-dt
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
WO2012090073A2 (en) 2010-12-30 2012-07-05 The Netherlands Cancer Institute Methods and compositions for predicting chemotherapy sensitivity
EP2474617A1 (de) 2011-01-11 2012-07-11 InteRNA Technologies BV MIR zur Behandlung von Neoangiogenese
EP2673381A4 (de) 2011-02-07 2014-10-15 Univ Toronto Biosonden und verfahren zu ihrer verwendung
US20140057295A1 (en) 2011-02-28 2014-02-27 Barbara J. Stegmann Anti-mullerian hormone changes in pregnancy and prediction of adverse pregnancy outcomes and gender
PL2694959T3 (pl) * 2011-04-01 2020-05-18 Genentech, Inc. Biomarkery do przewidywania wrażliwości w leczeniu nowotworu złośliwego
EP2694677A2 (de) 2011-04-04 2014-02-12 Netherland Cancer Institute Verfahren und zusammensetzungen zur vorhersage der resistenz gegenüber einer antikrebsbehandlung mit proteinkinasehemmern
AU2012240246A1 (en) 2011-04-04 2013-05-09 Netherlands Cancer Institute Methods and compositions for predicting resistance to anticancer treatment with protein kinase inhibitors
KR102007444B1 (ko) 2011-04-25 2019-08-06 어드밴스드 바이오사이언스 라보라토리즈, 인코포레이티드 절단형 hiv 피막 단백질(env), 이와 관련된 방법 및 조성물
DK2739748T3 (da) 2011-08-05 2019-06-24 Univ Aix Marseille Il22ra2-gen med fibrosefølsomhed og anvendelser deraf
WO2013030168A1 (en) 2011-08-31 2013-03-07 F. Hoffmann-La Roche Ag Method for predicting risk of hypertension associated with anti-angiogenesis therapy
JP2014526900A (ja) 2011-08-31 2014-10-09 エフ・ホフマン−ラ・ロシュ・アクチェンゲゼルシャフト 血管新生阻害剤に対する応答性
EP2763540A4 (de) 2011-09-09 2015-04-22 Univ Yale Zusammensetzungen und verfahren zur beurteilung und behandlung von entzündlichen krankheiten und erkrankungen
WO2013040251A2 (en) 2011-09-13 2013-03-21 Asurgen, Inc. Methods and compositions involving mir-135b for distinguishing pancreatic cancer from benign pancreatic disease
WO2013045505A1 (en) 2011-09-28 2013-04-04 Novartis Ag Biomarkers for raas combination therapy
US20130090329A1 (en) 2011-10-07 2013-04-11 Suregene, Llc Methods and Compositions for the Treatment of Psychotic Disorders Through the Identification of the Olanzapine Poor Response Predictor Genetic Signature
US10221454B2 (en) 2011-10-10 2019-03-05 The Hospital For Sick Children Methods and compositions for screening and treating developmental disorders
CA2852665A1 (en) 2011-10-17 2013-04-25 Good Start Genetics, Inc. Analysis methods
PL2768985T3 (pl) 2011-10-21 2019-10-31 Chronix Biomedical Biomarkery będące krążącymi kwasami nukleinowymi związane z rakiem jelita grubego
US20130157884A1 (en) 2011-10-26 2013-06-20 Asuragen, Inc. Methods and compositions involving mirna expression levels for distinguishing pancreatic cysts
EP2771487A1 (de) 2011-10-27 2014-09-03 Asuragen, INC. Mirnas als diagnostische biomarker zur unterscheidung gutartiger von bösartigen tumoren in der schilddrüse
US11180807B2 (en) 2011-11-04 2021-11-23 Population Bio, Inc. Methods for detecting a genetic variation in attractin-like 1 (ATRNL1) gene in subject with Parkinson's disease
CN104066852A (zh) 2011-11-23 2014-09-24 霍夫曼-拉罗奇有限公司 对血管发生抑制剂的响应性
WO2013087789A1 (en) 2011-12-13 2013-06-20 Glykos Finland Ltd. Antibody isoform arrays and methods thereof
FR2984360B1 (fr) * 2011-12-20 2017-11-24 Biomerieux Sa Procede pour le diagnostic ou le pronostic in vitro du cancer du colon
WO2013112676A1 (en) 2012-01-24 2013-08-01 THE UNITED STATES OF AMERECA, as represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES Schizophrenia-related isoform of knch2 and development of antipsycotic drugs
DK2812452T3 (da) 2012-02-09 2020-06-29 Population Bio Inc Fremgangsmåder og sammensætninger til screening og behandling af udviklingsforstyrrelser
US20150045249A1 (en) 2012-02-27 2015-02-12 Toray Industries, Inc. Nucleic acid detection method
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
EP2834371B1 (de) 2012-04-05 2019-01-09 The Regents of The University of California Genexpressionspaneel für brustkrebsprognose
US8812422B2 (en) 2012-04-09 2014-08-19 Good Start Genetics, Inc. Variant database
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
ES2426517B1 (es) * 2012-04-20 2014-05-14 Genetracer Biotech S.L Método para predecir la seguridad de un tratamiento farmacológico
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
WO2014007623A1 (en) 2012-07-03 2014-01-09 Interna Technologies B.V. Diagnostic portfolio and its uses
US20140066316A1 (en) 2012-08-28 2014-03-06 The Chinese University Of Hong Kong DACH1 as a Biomarker for Diabetes
EP2895621B1 (de) 2012-09-14 2020-10-21 Population Bio, Inc. Verfahren und zusammensetzungen zur diagnose, prognose und behandlung neurologischer erkrankungen
WO2014049588A1 (en) 2012-09-27 2014-04-03 University College Dublin, National University Of Ireland, Dublin A method for treatment of pulmonary fibrosis and diagnosis or prognosis of an aggressive pulmonary fibrosis phenotype
US10233495B2 (en) 2012-09-27 2019-03-19 The Hospital For Sick Children Methods and compositions for screening and treating developmental disorders
US20140100124A1 (en) 2012-10-04 2014-04-10 Asuragen, Inc. Diagnostic mirnas for differential diagnosis of incidental pancreatic cystic lesions
US20150299801A1 (en) * 2012-11-06 2015-10-22 The Trustees Of Columbia University In The City New York Techniques for Treating Acute Lymphoblastic Leukemia (ALL)
CA2899020C (en) 2013-02-01 2023-10-03 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
EP2971159B1 (de) 2013-03-14 2019-05-08 Molecular Loop Biosolutions, LLC Verfahren zur analyse von nukleinsäuren
CA2907377A1 (en) 2013-03-15 2014-09-18 Baylor Research Institute Tissue and blood-based mirna biomarkers for the diagnosis, prognosis and metastasis-predictive potential in colorectal cancer
EP3366785A3 (de) 2013-03-15 2018-09-19 Baylor Research Institute Marker für mit colitis ulcerosa (uc) assoziierten kolorektalen neoplasien
WO2014144666A2 (en) 2013-03-15 2014-09-18 The University Of Chicago Methods and compositions related to t-cell activity
BR112015022448B1 (pt) 2013-03-15 2020-12-08 Illumina Cambridge Limited molécula de nucleotídeo ou nucleosídeo modificado, métodos para preparar o crescimento de polinucleotídeo complementar a polinucleotídeo alvo de fita simples em reação de sequenciação e para determinar a sequência de polinucleotídeo alvo de fita simples e kit
EP3005200A2 (de) 2013-06-03 2016-04-13 Good Start Genetics, Inc. Verfahren und systeme zur speicherung von sequenzlesedaten
ES2899618T3 (es) 2013-07-01 2022-03-14 Illumina Inc Funcionalización de superficie exenta de catalizador e injerto de polímero
EP3058096A1 (de) 2013-10-18 2016-08-24 Good Start Genetics, Inc. Verfahren zur beurteilung eines genomischen bereichs einer person
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
DK3511422T3 (da) 2013-11-12 2023-02-06 Population Bio Inc Fremgangsmåder og sammensætninger til diagnosticering, prognose og behandling af endometriose
CN105874385B (zh) 2013-12-19 2021-08-20 Illumina公司 包括纳米图案化表面的基底及其制备方法
US20150184251A1 (en) * 2014-01-02 2015-07-02 Institute For Cancer Research D/B/A The Research Institute Of Fox Chase Cancer Center Methods for screening muscle invasive bladder cancer patients for neoadjuvant chemotherapy responsiveness
GB201403820D0 (en) * 2014-03-04 2014-04-16 Isis Innovation Assay
WO2015148919A2 (en) 2014-03-27 2015-10-01 Yale University Circulating micrornas as biomarkers for endometriosis
EP3140429B1 (de) 2014-05-05 2020-02-19 Medtronic Inc. Verfahren zur scd-, crt-, crt-d- oder sca-therapieidentifizierung und/oder auswahl
US11053548B2 (en) 2014-05-12 2021-07-06 Good Start Genetics, Inc. Methods for detecting aneuploidy
EP4219710A3 (de) 2014-08-01 2023-08-16 Dovetail Genomics, LLC Markierung von nukleinsäuren für sequenzassemblierung
GB201414098D0 (en) 2014-08-08 2014-09-24 Illumina Cambridge Ltd Modified nucleotide linkers
US20160046994A1 (en) * 2014-08-13 2016-02-18 Regents Of The University Of Minnesota Novel cd177 haplotypes, their role in hna-2 deficiency, and methods of using
US9982250B2 (en) 2014-08-21 2018-05-29 Illumina Cambridge Limited Reversible surface functionalization
WO2016033439A2 (en) 2014-08-28 2016-03-03 Yale University Compositions and methods for the treating an inflammatory disease or disorder
GB2558326B (en) 2014-09-05 2021-01-20 Population Bio Inc Methods and compositions for inhibiting and treating neurological conditions
WO2016040446A1 (en) 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
WO2016042067A1 (en) 2014-09-17 2016-03-24 Vito Nv Methods and tools for analyzing hybridization
EP3224595A4 (de) 2014-09-24 2018-06-13 Good Start Genetics, Inc. Prozesssteuerung für erhöhte robustheit von genetischen assays
AU2015327756B2 (en) 2014-09-30 2018-01-04 Genetic Technologies Limited Methods for assessing risk of developing breast cancer
PL3212684T3 (pl) 2014-10-31 2020-10-19 Illumina Cambridge Limited Polimery i powłoki z kopolimeru DNA
CN107109494B (zh) 2014-11-10 2023-10-27 豪夫迈·罗氏有限公司 Il-33介导型疾病的治疗方法和诊断方法
EP3226869A4 (de) 2014-12-03 2018-07-18 Auckland UniServices, Ltd. Kinasehemmer-prodrug zur behandlung von krebs
CA3010579A1 (en) 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
WO2016134034A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
WO2016154540A1 (en) 2015-03-26 2016-09-29 Dovetail Genomics Llc Physical linkage preservation in dna storage
TWI582240B (zh) 2015-05-19 2017-05-11 鄭鴻鈞 以基因體預後評估試劑組預測乳癌患者局部區域復發風險及放射治療有效性的方法、用途及裝置
US20180207920A1 (en) 2015-07-17 2018-07-26 Illumina, Inc. Polymer sheets for sequencing applications
EP3365445B1 (de) 2015-10-19 2023-05-31 Dovetail Genomics, LLC Verfahren für genomassemblierung, haplotyp-phasing und zielunabhängigen nukleinsäurenachweis
EP3420108A4 (de) 2016-02-23 2019-11-06 Dovetail Genomics LLC Erzeugung von phasengesteuerten lesesätzen für die genomanordnung und haplotyp-phasenregelung
US20190078152A1 (en) * 2016-03-17 2019-03-14 Vito Nv Methods for detecting nucleotide variants
AU2017263810B2 (en) 2016-05-13 2023-08-17 Dovetail Genomics Llc Recovering long-range linkage information from preserved samples
KR102171865B1 (ko) 2016-05-18 2020-10-29 일루미나, 인코포레이티드 패턴화된 소수성 표면을 사용한 자가 조립된 패터닝
US11725232B2 (en) 2016-10-31 2023-08-15 The Hong Kong University Of Science And Technology Compositions, methods and kits for detection of genetic variants for alzheimer's disease
WO2018098241A1 (en) 2016-11-22 2018-05-31 University Of Rochester Methods of assessing risk of recurrent prostate cancer
GB201701719D0 (en) 2017-02-02 2017-03-22 Neumann Diagnostics Ltd Method of assessing risk
US10240205B2 (en) 2017-02-03 2019-03-26 Population Bio, Inc. Methods for assessing risk of developing a viral disease using a genetic test
EP3601602B1 (de) 2017-03-29 2024-04-10 Crown Bioscience, Inc. (Taicang) System und verfahren zur bestimmung der cetuximab-sensitivität bei magenkrebs
EP3625358A4 (de) 2017-05-17 2021-02-24 Microbio Pty Ltd Biomarker und verwendungen davon
WO2019043656A1 (en) 2017-09-01 2019-03-07 Genus Plc METHODS AND SYSTEMS FOR ASSESSING AND / OR QUANTIFYING POPULATIONS OF SPERMATOZOIDS WITH SEXUAL ASYMMETRY
WO2019086603A1 (en) 2017-11-03 2019-05-09 Interna Technologies B.V. Mirna molecule, equivalent, antagomir, or source thereof for treating and/or diagnosing a condition and/or a disease associated with neuronal deficiency or for neuronal (re)generation
KR102417088B1 (ko) 2018-02-09 2022-07-07 제넨테크, 인크. 비만 세포 매개 염증성 질환에 대한 치료 및 진단 방법
HRP20221504T1 (hr) 2018-08-08 2023-03-31 Pml Screening, Llc Postupci procjene rizika od razvoja progresivne multifokalne leukoencefalopatije uzrokovane john cunningham virusom pomoću genetskog testiranja
WO2020053808A1 (en) 2018-09-12 2020-03-19 Georg Dewald Method of diagnosing vasoregulatory disorders
US11293061B2 (en) 2018-12-26 2022-04-05 Illumina Cambridge Limited Sequencing methods using nucleotides with 3′ AOM blocking group
US11421271B2 (en) 2019-03-28 2022-08-23 Illumina Cambridge Limited Methods and compositions for nucleic acid sequencing using photoswitchable labels
EP3952849A4 (de) 2019-04-12 2023-03-01 The Regents Of The University Of California Zusammensetzungen und verfahren zur erhöhung der muskelmasse und des oxidativen stoffwechsels
WO2021180858A1 (en) 2020-03-13 2021-09-16 Medimmune Limited Therapeutic methods for the treatment of subjects with risk alelles in il33
BR112022026056A2 (pt) 2020-06-22 2023-03-07 Illumina Cambridge Ltd Nucleosídeos e nucleotídeos com grupo bloqueador 3? acetal
US11981964B2 (en) 2020-07-28 2024-05-14 Illumina Cambridge Limited Substituted coumarin dyes and uses as fluorescent labels
CN111961763A (zh) * 2020-09-17 2020-11-20 生捷科技(杭州)有限公司 一种新型冠状病毒检测基因芯片
US20220195196A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Alkylpyridinium coumarin dyes and uses in sequencing applications
US20220195516A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Methods, systems and compositions for nucleic acid sequencing
US20220195517A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Long stokes shift chromenoquinoline dyes and uses in sequencing applications
US20220195518A1 (en) 2020-12-22 2022-06-23 Illumina Cambridge Limited Methods and compositions for nucleic acid sequencing
EP4334327A1 (de) 2021-05-05 2024-03-13 Illumina Cambridge Limited Fluoreszierende farbstoffe mit kondensierten bis-bor-heterocyclen und verwendungen in der sequenzierung
CA3216735A1 (en) 2021-05-20 2022-11-24 Patrizia IAVICOLI Compositions and methods for sequencing by synthesis
US20230016633A1 (en) 2021-06-15 2023-01-19 Illumina, Inc. Hydrogel-free surface functionalization for sequencing
CN117813391A (zh) 2021-07-23 2024-04-02 因美纳有限公司 制备用于dna测序的基底表面的方法
AU2022371198A1 (en) 2021-10-20 2024-05-02 Illumina, Inc. Methods for capturing library dna for sequencing
US20230330659A1 (en) 2022-03-22 2023-10-19 Illumina Cambridge Limited Substrate with orthogonally functional nanodomains
CA3223115A1 (en) 2022-03-28 2023-10-05 Xiaolin Wu Labeled avidin and methods for sequencing
WO2023186819A1 (en) 2022-03-29 2023-10-05 Illumina Cambridge Limited Chromenoquinoline dyes and uses in sequencing
WO2023194369A1 (en) 2022-04-08 2023-10-12 Fundació Institut Mar D'investigacions Mèdiques (Imim) Genetic markers for severe covid-19
WO2023232829A1 (en) 2022-05-31 2023-12-07 Illumina, Inc Compositions and methods for nucleic acid sequencing
WO2024003087A1 (en) 2022-06-28 2024-01-04 Illumina, Inc. Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing
WO2024028794A1 (en) 2022-08-02 2024-02-08 Temple Therapeutics BV Methods for treating endometrial and ovarian hyperproliferative disorders
WO2024039516A1 (en) 2022-08-19 2024-02-22 Illumina, Inc. Third dna base pair site-specific dna detection
WO2024068889A2 (en) 2022-09-30 2024-04-04 Illumina, Inc. Compositions and methods for reducing photo damage during sequencing
WO2024123748A1 (en) 2022-12-07 2024-06-13 Illumina, Inc. Etch-free photoresist patterning in multi-depth nanowells

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8311018D0 (en) * 1983-04-22 1983-05-25 Amersham Int Plc Detecting mutations in dna
US5202231A (en) * 1987-04-01 1993-04-13 Drmanac Radoje T Method of sequencing of genomes by hybridization of oligonucleotide probes
GB8810400D0 (en) * 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
US5002867A (en) * 1988-04-25 1991-03-26 Macevicz Stephen C Nucleic acid sequence determination by multiple mixed oligonucleotide probes
EP1231282A3 (de) * 1990-12-06 2005-05-18 Affymetrix, Inc. Verfahren und Zussamensetzungen für den Nachweis von Polymeren
DE69333650T2 (de) * 1992-02-19 2006-01-12 The Public Health Research Institute Of The City Of New York, Inc. Neue anordnungn von oligonukleotiden und ihr nutzen zum sortieren, isolieren, sequenzieren und manipulieren von nukleinsäuren

Also Published As

Publication number Publication date
EP0730663A4 (de) 2000-02-23
JPH09507121A (ja) 1997-07-22
EP0730663B1 (de) 2003-09-24
AU8126694A (en) 1995-05-22
DE69433180D1 (de) 2003-10-30
EP0730663A1 (de) 1996-09-11
WO1995011995A1 (en) 1995-05-04

Similar Documents

Publication Publication Date Title
DE69433180T2 (de) Felder von nukleinsaeuresonden auf biologischen chips
US5837832A (en) Arrays of nucleic acid probes on biological chips
US6027880A (en) Arrays of nucleic acid probes and methods of using the same for detecting cystic fibrosis
US5861242A (en) Array of nucleic acid probes on biological chips for diagnosis of HIV and methods of using the same
DE69918130T2 (de) Verwendung von vereinigten sonden zur genetischen analyse
DE3687287T3 (de) Verfahren zur Amplifikation von Nukleinsäuresequenzen.
US6309823B1 (en) Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same
DE3789679T2 (de) Genetische Sonden.
DE60031589T2 (de) Gleichzeitige Messung der Genexpression und genomischer Abweichungen mittels Nukleinsäuremikromatrizen
DE60128720T2 (de) Mikroarray-verfahren zur genotypisierung mehrerer proben für mehrere loci
DE69433487T2 (de) Methoden und zusammensetzungen zur effizienten nukleinsaeuresequenzierung
DE3687537T2 (de) Verfahren zur amplifikation, zum nachweis und/oder zur klonierung von nukleinsaeuresequenzen.
DE69920032T2 (de) Methoden, software und apparate zur identifizierung genomischer bereiche, die ein gen umfassen, das mit einem nachweisbaren merkmal assoziiert ist
DE69929542T2 (de) Komplexitätsmanagement und analyse genomischer dna
DE69434314T2 (de) Polymorphismus von mononukleotiden und ihre verwendung in der genanalyse
DE69432586T2 (de) Methode zum generieren von einzelsträngigen dna molekülen
DE69837913T2 (de) Verfahren zur vervielfältigung von nukleinsäure
DE69936379T2 (de) Verfahren zur genotypisierung und dna-analyse
US7115364B1 (en) Arrays of nucleic acid probes on biological chips
US7846659B2 (en) Arrays of nucleic acid probes for analyzing biotransformation genes
DE60213803T2 (de) Happier mapping
EP3488012B1 (de) Dna-sonden für eine in-situ hybridisierung an chromosomen
DE60038109T2 (de) Verfahren zur Analyse von AFLP Reaktionsmischungen unter Verwendung von Primer Verlängerungstechniken
Dear Genome mapping
ES2394881T3 (es) Procedimiento basado en la AFLP para la integración de mapas físicos y genéticos

Legal Events

Date Code Title Description
8364 No opposition during term of opposition