JP2001514906A - Methods and compositions for detecting or quantifying nucleic acid species - Google Patents

Methods and compositions for detecting or quantifying nucleic acid species

Info

Publication number
JP2001514906A
JP2001514906A JP2000509878A JP2000509878A JP2001514906A JP 2001514906 A JP2001514906 A JP 2001514906A JP 2000509878 A JP2000509878 A JP 2000509878A JP 2000509878 A JP2000509878 A JP 2000509878A JP 2001514906 A JP2001514906 A JP 2001514906A
Authority
JP
Japan
Prior art keywords
probe
probes
nucleic acid
sequence
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000509878A
Other languages
Japanese (ja)
Inventor
ドルマナック,ラドジェ
ドルマナック,スネザナ
バイドヤ,ナラヤン
Original Assignee
ハイセック,インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/912,885 external-priority patent/US6383742B1/en
Priority claimed from US08/947,779 external-priority patent/US20020034737A1/en
Application filed by ハイセック,インコーポレーテッド filed Critical ハイセック,インコーポレーテッド
Publication of JP2001514906A publication Critical patent/JP2001514906A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00279Features relating to reactor vessels
    • B01J2219/00306Reactor vessels in a multiple arrangement
    • B01J2219/00313Reactor vessels in a multiple arrangement the reactor vessels being formed by arrays of wells in blocks
    • B01J2219/00315Microtiter plates
    • B01J2219/00317Microwell devices, i.e. having large numbers of wells
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00511Walls of reactor vessels
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00608DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/0061The surface being organic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00612Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports the surface being inorganic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00614Delimitation of the attachment areas
    • B01J2219/00617Delimitation of the attachment areas by chemical means
    • B01J2219/00619Delimitation of the attachment areas by chemical means using hydrophilic or hydrophobic regions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00614Delimitation of the attachment areas
    • B01J2219/00621Delimitation of the attachment areas by physical means, e.g. trenches, raised areas
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00623Immobilisation or binding
    • B01J2219/00626Covalent
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00623Immobilisation or binding
    • B01J2219/0063Other, e.g. van der Waals forces, hydrogen bonding
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00632Introduction of reactive groups to the surface
    • B01J2219/00637Introduction of reactive groups to the surface by coating it with another layer
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00639Making arrays on substantially continuous surfaces the compounds being trapped in or bound to a porous medium
    • B01J2219/00641Making arrays on substantially continuous surfaces the compounds being trapped in or bound to a porous medium the porous medium being continuous, e.g. porous oxide substrates
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00646Making arrays on substantially continuous surfaces the compounds being bound to beads immobilised on the solid supports
    • B01J2219/00648Making arrays on substantially continuous surfaces the compounds being bound to beads immobilised on the solid supports by the use of solid beads
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00659Two-dimensional arrays
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B60/00Apparatus specially adapted for use in combinatorial chemistry or with libraries
    • C40B60/14Apparatus specially adapted for use in combinatorial chemistry or with libraries for creating libraries

Abstract

(57)【要約】 本発明は、基体に固定されたプローブのアレイおよび多数の標識プローブを用いて標的核酸種を検出する方法を提供する。本発明はまた、物理的性質に基づいて多数のセットに分類できる離散粒子に結合されたオリゴヌクレオチドプローブに関する。異なるプローブがそれぞれのセットの離散粒子に結合され、プローブの正体は離散粒子をその物理的性質から同定することで決定される。本発明はさらに、相補的ポリヌクレオチド鎖の結合を不安定にする(結合エネルギーを低下させる)薬剤または相補的ポリヌクレオチド鎖間の結合の安定性を高める(結合エネルギーを増大させる)薬剤を使用する方法に関する。図面はプローブアレイを大量生産するための装置の概略図である。 (57) Abstract The present invention provides an array of probes immobilized on a substrate and a method for detecting a target nucleic acid species using a large number of labeled probes. The present invention also relates to oligonucleotide probes attached to discrete particles that can be classified into multiple sets based on physical properties. Different probes are bound to each set of discrete particles, and the identity of the probe is determined by identifying the discrete particles from their physical properties. The invention further employs agents that destabilize (reduce binding energy) binding of complementary polynucleotide strands or increase the stability of binding (increase binding energy) between complementary polynucleotide strands. About the method. The drawing is a schematic view of an apparatus for mass-producing a probe array.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】 関係出願へのクロス参照 本出願は、1997年8月15日出願された米国特許出願第08/912,885号の一部継続 、かつ1997年10月9日出願された米国特許出願第08/947,779号の一部継続、かつ1
997年7月14日出願された米国特許出願第08/892,503号の一部継続、かつ1997年3 月4日出願された米国特許出願第08/812,951号の一部継続、かつ1997年1月16日出
願された米国特許出願第08/784,747号の一部継続である。
This application is a continuation-in-part of US patent application Ser. No. 08 / 912,885, filed Aug. 15, 1997, and US patent application Ser. / Part of 947,779, and 1
Partial continuation of U.S. patent application Ser.No. 08 / 892,503 filed on Jul. 14, 997, and part continuation of U.S. patent application Ser. This is a continuation-in-part of US Patent Application No. 08 / 784,747, filed on the 16th.

【0002】 発明の分野 本発明は全体的には核酸分析のための方法および装置(apparatus)に関し、 特定的には核酸分析の方法および装置(apparati)に関する。FIELD OF THE INVENTION [0002] The present invention relates generally to methods and apparatus for nucleic acid analysis, and more particularly to methods and apparatus for nucleic acid analysis.

【0003】 背景 核酸サンプル中の4種の核酸の配列を決定する速度は、分子生物学、医薬、お
よび生物工学の一層の進歩にとって主な技術的障害である。ゲル中で核酸分子を
分離する核酸配列決定法は、1978年以来使われている。核酸配列決定のための他
の実証された方法はハイブリダイゼーションによる配列決定(SBH)である。
BACKGROUND The speed of sequencing four nucleic acids in a nucleic acid sample is a major technical obstacle to further advances in molecular biology, medicine, and biotechnology. Nucleic acid sequencing, which separates nucleic acid molecules in gels, has been used since 1978. Another proven method for nucleic acid sequencing is sequencing by hybridization (SBH).

【0004】 ヌクレオチド配列(すなわち、サンプルのA、G、CおよびTヌクレオチドの順序
)を決定する伝統的な方法は、無作為な末端をもち、異なる標識を付した核酸断
片の混合物を調製し、特異的なヌクレオチドで分解し、または複製鎖のジデオキ
シ鎖末端によって行われる。その後、1〜500bpの範囲の得られた核酸断片をゲル
上で分離して、隣接サンプルが1個のヌクレオチドだけ長さが異なるバンドのラ
ダーを作製する。
[0004] The traditional method of determining the nucleotide sequence (ie, the order of A, G, C and T nucleotides in a sample) is to prepare a mixture of nucleic acid fragments having random ends and different labels, Degradation at specific nucleotides or done by the dideoxy chain ends of the replicating strand. The resulting nucleic acid fragments ranging from 1 to 500 bp are then separated on a gel to create a ladder of bands where adjacent samples differ by one nucleotide in length.

【0005】 SBHのアレイに基くアプローチは、核酸分子の分離、分解、合成またはイメー ジングにおける単一塩基分解を必要としない。長さがK塩基の短いオリゴヌクレ オチドの誤対合を識別するハイブリダイゼーションを使って、標的核酸に対して
構成K-merオリゴヌクレオチドのリストを決定することができる。標的核酸に対 する配列を、ユニークにオーバーラップしてスコアされるオリゴヌクレオチドに
より構築することができる。
[0005] The array-based approach of SBH does not require single base digestion in the separation, degradation, synthesis or imaging of nucleic acid molecules. Hybridization that identifies mismatches in short oligonucleotides of K bases in length can be used to determine the list of constituent K-mer oligonucleotides for a target nucleic acid. The sequence for the target nucleic acid can be constructed with oligonucleotides that are scored as uniquely overlapping.

【0006】 ハイブリダイゼーションにより配列決定を達成するために複数のアプローチを
利用できる。SBHフォーマット1と呼ぶプロセスでは、核酸サンプルをアレイし 、標識プローブをサンプルとハイブリダイズさせる。同じサンプル核酸のセット
をもつレプリカ膜(replica membranes)をいくつかのプローブの平行スコアリ ングに使うことができるし、そして/またはプローブを多重化することができる
。核酸サンプルをナイロン膜または他の適当な支持体上でアレイしてハイブリダ
イズさせることができる。それぞれの膜アレイを何回も再使用することができる
。フォーマット1は、多数のサンプルのバッチ処理用に特に効率的である。
[0006] Several approaches are available to achieve sequencing by hybridization. In a process called SBH format 1, nucleic acid samples are arrayed and labeled probes are hybridized to the samples. Replica membranes with the same set of sample nucleic acids can be used for parallel scoring of several probes and / or probes can be multiplexed. Nucleic acid samples can be arrayed and hybridized on a nylon membrane or other suitable support. Each membrane array can be reused many times. Format 1 is particularly efficient for batch processing of large numbers of samples.

【0007】 SBHフォーマット2では、プローブをそれぞれの配列に対応する基体上の位置 にアレイし、標識した核酸サンプル断片をアレイしたプローブにハイブリダイズ
させる。この場合、ある断片に関する配列情報を、全アレイ配列プローブとの同
時ハイブリダイゼーション反応で決定することができる。他の核酸断片を配列決
定するために、同じオリゴヌクレオチドアレイを再使用することができる。該ア
レイはスポットすることにより、またはプローブのin situ合成によって作製す ることができる。
In the SBH format 2, probes are arrayed at positions on the substrate corresponding to the respective sequences, and a labeled nucleic acid sample fragment is hybridized to the arrayed probes. In this case, sequence information for a fragment can be determined by a simultaneous hybridization reaction with all array sequence probes. The same oligonucleotide array can be reused for sequencing other nucleic acid fragments. The array can be made by spotting or by in situ synthesis of probes.

【0008】 SBHフォーマット3では、2セットのプローブを使う。1つの実施様態では、 1つのセットは既知の位置をもつプローブのアレイの形であることができ、そし
て他の標識したセットはマルチウエルプレート中に貯えることができる。この場
合、標的核酸を標識する必要はない。標的核酸および1つ以上の標識プローブを
アレイしたプローブセットに加える。もし1つの結合されたプローブと1つの標
識プローブが両方とも標的核酸に近接してハイブリダイズすれば、それらは共有
結合により連結反応し、連結反応したプローブの長さの合計に等しい検出配列を
生成する。該プロセスにより、長い核酸断片、例えば完全な細菌ゲノムを、核酸
が小片にサブクローニングすることなく配列決定することが可能になる。
[0008] In SBH format 3, two sets of probes are used. In one embodiment, one set can be in the form of an array of probes with known locations, and the other labeled set can be stored in a multi-well plate. In this case, there is no need to label the target nucleic acid. A target nucleic acid and one or more labeled probes are added to the arrayed probe set. If one bound probe and one labeled probe both hybridize in close proximity to the target nucleic acid, they ligate covalently to produce a detection sequence equal to the sum of the ligated probe lengths. I do. The process allows long nucleic acid fragments, such as the entire bacterial genome, to be sequenced without the nucleic acid subcloning into small pieces.

【0009】 本発明において、SBHは、1つ以上の核酸サンプルの効率的な同定および配列 決定に応用される。該方法は、核酸診断、法医学、および遺伝子マッピングに多
くの応用がある。それはまた、遺伝子障害および他の形質に関連する変異を同定
し、生物多様性を評価し、そして核酸配列に依存する多くの他の型のデータを作
るために使うことができる。
In the present invention, SBH has applications in the efficient identification and sequencing of one or more nucleic acid samples. The method has many applications in nucleic acid diagnostics, forensics, and gene mapping. It can also be used to identify mutations associated with genetic disorders and other traits, assess biodiversity, and generate many other types of data that depend on nucleic acid sequence.

【0010】 発明の概要 本発明は、標的核酸種を検出する方法であって、基体に固定されたプローブの
アレイと多数の標識されたプローブを用意し、ここに各標識プローブは標的核酸
の第1部分に相補的である第1核酸配列を有するものが選択され、そしてここに
基体に固定された少なくとも1つのプローブの核酸配列は標的核酸配列の第2部
分に相補的でありかつ該第2部分は該第1部分に隣接しており;プローブ配列を
相補的配列とハイブリダイゼーションするのに適当な条件下で、標的核酸をアレ
イに添加し;標識プローブをアレイに導入し;基体に固定したプローブを標的核
酸とハイブリダイズさせ;標識プローブを標的核酸にハイブリダイズさせ;標識
プローブを、アレイ中の隣接してハイブリダイズしたプローブに固定させ;そし
てアレイ中のプローブに固定した標識プローブを検出するステップを含む上記方
法を提供する。本発明の好ましい方法によると、基体に固定されたプローブのア
レイはプローブの普遍的セットを含む。本発明の他の好ましい様態では、基体に
固定された少なくとも2つのプローブが標的核酸配列のオーバーラップする配列
を定義し、さらに好ましくはすくなくとも2つの標識プローブが標的核酸配列の
オーバーラップする配列を定義する。そしてさらに本発明の他の様態によると、
既知配列の標的核酸を検出する方法であって、核酸サンプルを固体基体に結合し
た固定オリゴヌクレオチドプローブの1セットとハイブリダイゼーション条件下
で接触させ、ここに該固定プローブは上記標的核酸配列の異なる部分と特異的ハ
イブリダイゼーションの能力があり;標的核酸を溶液中の標識オリゴヌクレオチ
ドプローブの1セットとハイブリダイゼーション条件下で接触させ、ここに該標
識プローブは固定プローブに隣接した上記標的核酸配列の異なる部分と特異的ハ
イブリダイゼーションする能力があり;該固定プローブを、標的配列上の固定プ
ローブにすぐ隣接する標識プローブに(例えばリガーゼで)共有結合で接続し;
連結反応してない標識プローブを除去し;標的核酸の存在を固定プローブに結合
された上記標識プローブの存在を検出することによって検出するステップを含ん
でなる上記方法が提供される。本発明はまた、細胞型、組織または組織混合物内
に部分的または完全に配列決定された遺伝子のセットのメンバーの発現を決定す
る方法であって、配列決定された遺伝子に特異的な固定されかつ標識されたプロ
ーブの対を定義し;非標識の核酸サンプルと対応する標識プローブを1つ以上の
固定したプローブのアレイとハイブリダイズさせ;隣接するハイブリダイズした
標識されかつ固定されたプローブ間に共有結合を形成させ;連結反応してないプ
ローブを除去し;そして、アレー中の予め特定した位置に結合した標識プローブ
の検出により配列決定された遺伝子の存在を決定するステップを含んでなる上記
方法を提供する。本発明のこの様態の好ましい実施様態では、標的核酸は感染剤
の存在を同定するであろう。
SUMMARY OF THE INVENTION [0010] The present invention is a method for detecting a target nucleic acid species, comprising providing an array of probes immobilized on a substrate and a number of labeled probes, wherein each labeled probe is a target nucleic acid species. One having a first nucleic acid sequence that is complementary to a portion is selected, and wherein the nucleic acid sequence of at least one probe immobilized on a substrate is complementary to a second portion of the target nucleic acid sequence and The portion is adjacent to the first portion; the target nucleic acid is added to the array under conditions suitable for hybridizing the probe sequence with the complementary sequence; the labeled probes are introduced into the array; and immobilized on a substrate. Allowing the probe to hybridize to the target nucleic acid; hybridizing the labeled probe to the target nucleic acid; immobilizing the labeled probe to an adjacent hybridized probe in the array; It provides the above method comprises detecting the labeled probe fixed to the probe in the array by. According to a preferred method of the present invention, the array of probes immobilized on a substrate comprises a universal set of probes. In another preferred aspect of the invention, at least two probes immobilized on the substrate define overlapping sequences of the target nucleic acid sequence, and more preferably at least two labeled probes define overlapping sequences of the target nucleic acid sequence. I do. And according to yet another aspect of the invention,
A method for detecting a target nucleic acid of known sequence, comprising contacting a nucleic acid sample with a set of immobilized oligonucleotide probes bound to a solid substrate under hybridization conditions, wherein the immobilized probes comprise different portions of the target nucleic acid sequence. Contacting a target nucleic acid with a set of labeled oligonucleotide probes in solution under hybridization conditions, wherein the labeled probe is a different portion of the target nucleic acid sequence adjacent to an immobilized probe. Is capable of specific hybridization with the probe; covalently connecting the immobilized probe (eg, with a ligase) to a labeled probe immediately adjacent to the immobilized probe on the target sequence;
Removing the unligated labeled probe; detecting the presence of the target nucleic acid by detecting the presence of the labeled probe bound to an immobilized probe. The present invention also relates to a method of determining the expression of a member of a set of partially or completely sequenced genes in a cell type, tissue or tissue mixture, comprising: Defining a pair of labeled probes; hybridizing an unlabeled nucleic acid sample and corresponding labeled probes to an array of one or more immobilized probes; sharing between adjacent hybridized labeled and immobilized probes. Forming a bond; removing unligated probes; and determining the presence of the sequenced gene by detecting a labeled probe bound to a pre-specified position in the array. provide. In a preferred embodiment of this aspect of the invention, the target nucleic acid will identify the presence of an infectious agent.

【0011】 さらに、本発明は、ナイロン膜(該ナイロン膜上にオリゴヌクレオチドプロー
ブの複数のサブアレイがあり、該サブアレイは複数の個別スポットを含んでなり
、ここに各スポットは同じ配列の複数のオリゴヌクレオチドプローブを含んでな
る);および複数の疎水性バリアー(ナイロン膜上のサブアレイ間に位置し、そ
れにより隣接サブアレイ間の交叉汚染を防止する)を含んでなるオリゴヌクレオ
チドプローブのアレイを提供する。
Further, the present invention relates to a nylon membrane (a plurality of sub-arrays of oligonucleotide probes on the nylon membrane, the sub-array comprising a plurality of individual spots, wherein each spot comprises a plurality of oligonucleotides having the same sequence). And an array of oligonucleotide probes comprising a plurality of hydrophobic barriers (located between the subarrays on the nylon membrane, thereby preventing cross-contamination between adjacent subarrays).

【0012】 さらに、本発明は、標的核酸の第1末端および第2末端を有する反復配列の配
列を決定する方法であって、(a)複数の様々な長さのスペーサーオリゴヌクレオ チドであって、該反復配列を含んでなるスペーサーオリゴヌクレオチドを用意し
、;(b)反復配列の第1末端に隣接することが知られている第1オリゴヌクレオ チドを用意し;(c)その1つが反復配列の第2末端に隣接する複数の第2オリゴ ヌクレオチドであって、標識されている複数の第2オリゴヌクレオチドを用意し
;(d)第1および複数の第2オリゴヌクレオチド、ならびに複数のスペーサーオ リゴヌクレオチドの1つを、標的核酸にハイブリダイズすること;(e)ハイブリ ダイゼーションしたオリゴヌクレオチドを連結反応させること;(f)連結反応し たオリゴヌクレオチドを連結反応してないオリゴヌクレオチドから分離すること
;そして(g)連結反応したオリゴヌクレオチド中の標識を検出するステップを含 んでなる上記方法を提供する。
Further, the present invention provides a method for determining the sequence of a repetitive sequence having a first end and a second end of a target nucleic acid, comprising: (a) a plurality of spacer oligonucleotides of various lengths; Providing a spacer oligonucleotide comprising said repeat sequence; (b) providing a first oligonucleotide known to be adjacent to the first end of the repeat sequence; Providing a plurality of second oligonucleotides adjacent to the second end of the sequence, the plurality of second oligonucleotides being labeled; (d) the first and plurality of second oligonucleotides, and the plurality of spacer oligonucleotides; Hybridizing one of the lignonucleotides to the target nucleic acid; (e) ligating the hybridized oligonucleotide; (f) ligating the oligonucleotide. Separating the tide from the unligated oligonucleotide; and (g) detecting a label in the ligated oligonucleotide.

【0013】 そしてさらに、本発明は、標的核酸内の第1末端および第2末端を有する分枝
点(branch point)配列の配列決定する方法であって、(a)分枝点配列の第1部 分と相補的である第1オリゴヌクレオチドを用意し、ここに該第1オリゴヌクレ
オチドは分枝点配列の第1末端から少なくとも1つのヌクレオチドだけ伸長し;
(b)標識されかつ分枝点配列の第2部分と相補的である複数の第2オリゴヌクレ オチドを用意し、ここに複数の第2オリゴヌクレオチドは分枝点配列の第2末端
から少なくとも1つのヌクレオチドだけ伸長し、かつここに分枝点配列の第2末
端から伸長する第2オリゴヌクレオチドの該部分は分枝点配列から生じる複数の
配列と相補的である配列を含んでなり;(c)第1オリゴヌクレオチドおよび複数 の第2オリゴヌクレオチドの1つを標的DNAとハイブリダイズし、;(d)ハイブリ
ダイズしたオリゴヌクレオチドを連結反応させ;(e)連結反応したオリゴヌクレ オチドを連結反応していないオリゴヌクレオチドから分離し;そして(f)連結反 応したオリゴヌクレオチドの標識を検出するステップを含んでなる上記方法を提
供する。
[0013] Still further, the invention is a method for sequencing a branch point sequence having a first end and a second end within a target nucleic acid, comprising: Providing a first oligonucleotide that is complementary to the moiety, wherein the first oligonucleotide extends at least one nucleotide from a first end of the branch point sequence;
(b) providing a plurality of second oligonucleotides that are labeled and are complementary to the second portion of the branch point sequence, wherein the plurality of second oligonucleotides are at least one from the second end of the branch point sequence; (C) the portion of the second oligonucleotide extending by nucleotides and extending from the second end of the branch point sequence, comprising a sequence that is complementary to a plurality of sequences that result from the branch point sequence; Hybridizing the first oligonucleotide and one of the plurality of second oligonucleotides with the target DNA; (d) ligating the hybridized oligonucleotide; (e) not ligating the ligated oligonucleotide. Separating from the oligonucleotide; and (f) detecting the label of the ligated oligonucleotide.

【0014】 そしてさらに、本発明は、標的核酸にネガティブであると予測されるプローブ
を使って配列を確める方法を提供する。その場合、標的の配列は、標的核酸を「
ネガティブ」プローブとハイブリダイズさせてこれらのプローブが標的核酸と完
全な対合を形成しないことを確めることによって、確められる。
[0014] Further, the present invention provides a method for confirming a sequence using a probe predicted to be negative for a target nucleic acid. In that case, the sequence of the target will
By hybridizing with "negative" probes to ensure that these probes do not form a perfect match with the target nucleic acid.

【0015】 そしてさらに、本発明は、プローブを配列情報を失うことなくハイブリダイゼ
ーション反応において多重化できるように、異なる標識と複合体化したオリゴヌ
クレオチドプローブを使って核酸を分析する方法を提供する(すなわち、異なる
プローブの標的とのハイブリダイゼーションを識別できるように、異なるプロー
ブは異なる標識を有する)。好ましい実施様態では、該標識は放射性同位体、ま
たは蛍光分子、または酵素、または電気泳動質量標識である。さらに好ましい実
施様態では、異なる標識を付したオリゴヌクレオチドプローブをフォーマットII
I SBHで使用し、多重プローブ(2つ以上で、1つのプローブは固定したプロー ブである)をお互いに連結反応させる。
[0015] Still further, the present invention provides a method for analyzing nucleic acids using oligonucleotide probes complexed with different labels so that the probes can be multiplexed in a hybridization reaction without losing sequence information ( That is, different probes have different labels so that hybridization of the different probes to the target can be distinguished). In a preferred embodiment, the label is a radioisotope, or a fluorescent molecule, or an enzyme, or an electrophoretic mass label. In a further preferred embodiment, differently labeled oligonucleotide probes are formatted II
Used in the ISBH, ligate multiple probes (two or more, one probe is a fixed probe) to each other.

【0016】 そしてさらに、本発明は、サンプル中に標的が相同的な核酸と比較して非常に
小量で存在するとき、既知の配列を有する標的核酸の存在を検出する方法を提供
する。好ましい実施様態では、該標的核酸は、多数のソース由来の核酸を有する
サンプル中に非常に低頻度で存在する対立遺伝子である。代りの好ましい実施様
態では、該標的核酸は変異配列を有し、かつ核酸のサンプル内に非常に低頻度で
存在する。
[0016] Still further, the present invention provides a method for detecting the presence of a target nucleic acid having a known sequence when the target is present in a sample in a very small amount compared to a homologous nucleic acid. In a preferred embodiment, the target nucleic acid is an allele that is very infrequently present in a sample having nucleic acids from multiple sources. In an alternative preferred embodiment, the target nucleic acid has a mutated sequence and is very rarely present in a sample of nucleic acids.

【0017】 そしてさらに、本発明は、シングルパスのゲル配列決定を使って標的核酸の配
列を確める方法を提供する。シングルパスのゲル配列決定のためのプライマーは
、SBHにより得た配列から誘導し、これらのプライマーを標準サンガー(Sanger )配列決定反応に使って標的核酸のゲル配列情報を提供する。その後、シングル
パスゲル配列決定により得た配列をSBHで誘導した配列と比較して、該配列を確 める。
[0017] Still further, the invention provides a method for confirming the sequence of a target nucleic acid using single-pass gel sequencing. Primers for single-pass gel sequencing are derived from sequences obtained by SBH and these primers are used in a standard Sanger sequencing reaction to provide gel sequence information of the target nucleic acid. The sequence obtained by single pass gel sequencing is then compared to the sequence derived with SBH to confirm the sequence.

【0018】 そしてさらに、本発明は、シングルパスゲル配列決定を使って分枝点を解明す
る方法を提供する。シングルパスゲル配列決定反応のためのプライマーをSBH配 列決定の第1ラウンド後に得たSfsの末端から同定し、そしてこれらのプライマ ーを標準サンガー配列決定反応に使って、Sfsの分枝点を通過するゲル配列決定 情報をあたえる。その後、Sfsを、分枝点を通過するサンガー配列決定結果をSfs
と比較して整列させ、隣接するSfsを同定する。
[0018] Still further, the invention provides a method for elucidating branch points using single-pass gel sequencing. Primers for single-pass gel sequencing reactions were identified from the ends of Sfs obtained after the first round of SBH sequencing, and these primers were used in a standard Sanger sequencing reaction to determine the branch points of Sfs. Gives gel sequencing information to pass. After that, the Sanger sequencing result passing through the branch point was
Align with and identify adjacent Sfs.

【0019】 そしてさらに、本発明は、SBH反応の前に該PCR産物を精製しないで、PCRによ り標的核酸を含むサンプルを調製する方法を提供する。SBHフォーマットIで、粗
PCR産物を前精製することなく基体に添加し、標識プローブの導入前に該基体を 洗浄することができる。
Further, the present invention provides a method for preparing a sample containing a target nucleic acid by PCR without purifying the PCR product before the SBH reaction. SBH format I, coarse
The PCR product can be added to the substrate without pre-purification and the substrate can be washed before introducing the labeled probe.

【0020】 そしてさらに、本発明は、標的核酸を分析する方法および装置を提供する。該
装置は、所望の時間、一緒に混合した核酸の2つのアレイを含んでなる。好まし
い実施様態では、1つのアレーの核酸は標識される。さらに好ましい実施様態で
は、ある材料を2つのアレイ間に配置し、この材料がアレイ中の核酸の混合を防
止する。この材料を取除くかまたは浸透できるようにすると、2つのアレイの核
酸はお互いに混合される。代りの好ましい実施様態では、1つのアレイの核酸は
標的核酸であり、他のアレイの核酸はオリゴヌクレオチドプローブである。他の
好ましい実施様態では、両アレイの核酸はオリゴヌクレオチドプローブである。
他の好ましい実施様態では、1つのアレイの核酸はオリゴヌクレオチドプローブ
および標的核酸であり、他のアレイの核酸はオリゴヌクレオチドプローブである
。他の好ましい実施様態では、両アレイの核酸はオリゴヌクレオチドプローブお
よび標的核酸である。
Further, the present invention provides a method and an apparatus for analyzing a target nucleic acid. The device comprises two arrays of nucleic acids mixed together for a desired time. In a preferred embodiment, the nucleic acids of one array are labeled. In a further preferred embodiment, a material is placed between the two arrays, which prevents mixing of the nucleic acids in the arrays. Once this material is removed or allowed to penetrate, the nucleic acids of the two arrays are mixed together. In an alternative preferred embodiment, the nucleic acids of one array are target nucleic acids and the nucleic acids of another array are oligonucleotide probes. In another preferred embodiment, the nucleic acids on both arrays are oligonucleotide probes.
In another preferred embodiment, the nucleic acids of one array are oligonucleotide probes and target nucleic acids, and the nucleic acids of another array are oligonucleotide probes. In another preferred embodiment, the nucleic acids on both arrays are oligonucleotide probes and target nucleic acids.

【0021】 上に記載の装置を使う本発明の1つの方法は、基体に固定された核酸のアレイ
を用意し、核酸の第2アレイを用意し、第2アレイ中の核酸が固定されたアレイ
の核酸と接触することを可能にする条件をあたえ、ここに核酸のアレイの1つは
標的核酸であり他のアレイはオリゴヌクレオチドプローブであり、そして該ハイ
ブリダイゼーション結果を分析するステップを含んでなる。好ましい実施様態で
は、固定されたアレイは標的核酸であり、第2アレイは標識オリゴヌクレオチド
プローブである。さらに好ましい実施様態では、2つのアレイ間に配置されたあ
る材料があり、該材料を取除くかまたは核酸へ浸透できるようにするまで核酸の
混合を防止する。
One method of the present invention using the apparatus described above comprises providing an array of nucleic acids immobilized on a substrate, providing a second array of nucleic acids, and an array having the nucleic acids in the second array immobilized thereon. Providing conditions to allow contact with the nucleic acid, wherein one of the arrays of nucleic acids is the target nucleic acid and the other is an oligonucleotide probe, and analyzing the hybridization results. . In a preferred embodiment, the immobilized array is a target nucleic acid and the second array is a labeled oligonucleotide probe. In a further preferred embodiment, there is some material disposed between the two arrays to prevent mixing of the nucleic acids until the material is removed or allowed to penetrate the nucleic acids.

【0022】 上に記載の装置を使う本発明の第2の方法は、核酸プローブの2つのアレイを
用意し、プローブの2つのアレイがお互いにおよび標的核酸と接触することを可
能にする条件をあたえ、標的核酸上で隣接しているプローブを一緒に連結反応さ
せ、そして該結果を分析するステップを含んでなる。好ましい実施様態では、1
つのアレイのプローブは固定されかつ他のアレイのプローブは標識されている。
さらに好ましい実施様態では、2つのアレイの間に配置されたある材料があり、
該材料を取除くかまたはプローブへ浸透できるようにするまでプローブの混合を
防止する。
A second method of the present invention using the above-described device provides for two arrays of nucleic acid probes and conditions that allow the two arrays of probes to contact each other and the target nucleic acid. And flanking adjacent probes on the target nucleic acid together and analyzing the results. In a preferred embodiment, 1
One array of probes is immobilized and the other array of probes is labeled.
In a further preferred embodiment, there is some material located between the two arrays,
Prevent mixing of the probe until the material is removed or allowed to penetrate the probe.

【0023】 そしてさらに、本発明は、その上にオリゴヌクレオチドプローブが固定されて
いる基体を提供し、ここに各プローブは隣接プローブからサンプル溶液の流動に
抵抗する物理的バリアーにより分離されている。好ましい実施様態では、該物理
的バリアーは疎水性材料で作られている。
[0023] Still further, the invention provides a substrate having oligonucleotide probes immobilized thereon, wherein each probe is separated from adjacent probes by a physical barrier that resists the flow of the sample solution. In a preferred embodiment, the physical barrier is made of a hydrophobic material.

【0024】 そしてさらに、本発明は、物理的バリアーにより分離されたオリゴヌクレオチ
ドプローブのアレイを作る方法を提供する。好ましい実施様態では、材料を添加
するインクジェットヘッドを使って基体にグリッドを添加し、アレイの反応容積
を削減する。
[0024] Still further, the invention provides a method of making an array of oligonucleotide probes separated by a physical barrier. In a preferred embodiment, a grid is added to the substrate using a material adding inkjet head to reduce the reaction volume of the array.

【0025】 そしてさらに、本発明は、その上にオリゴヌクレオチドを固定して3次元アレ
イを形成する基体を提供する。3次元アレイは、プローブ結果を読取る高分解(
各レベルは比較的低密度のプローブ/cm2を有する)と3次元空間の高情報含量 (多重レベルまたはプローブ)を合わせもつ。
Further, the present invention provides a substrate on which an oligonucleotide is immobilized to form a three-dimensional array. The three-dimensional array has a high resolution (
Each level has a relatively low density of probes / cm 2 ) and a high content of information in three dimensional space (multiple levels or probes).

【0026】 そしてさらに、本発明は、オリゴヌクレオチドプローブを固定する基体を提供
し、ここに該オリゴヌクレオチドプローブはスペーサーを有し、そしてここに該
スペーサーは基体とオリゴヌクレオチドプローブの情報部分(例えば、標的と結
合し配列情報を与えるオリゴヌクレオチドプローブの部分)の間の距離を増加す
る。好ましい実施様態では、スペーサーはリボース糖類およびホスフェートを含
んでなり、ここに該ホスフェートはリボース糖類と5'および3'ヒドロキシル基を
介してエステルを形成することによりリボース糖類をポリマーに共有結合で結合
している。
[0026] Still further, the invention provides a substrate to which the oligonucleotide probe is immobilized, wherein the oligonucleotide probe has a spacer, and wherein the spacer comprises a substrate and an information portion of the oligonucleotide probe (eg, (The part of the oligonucleotide probe that binds to the target and gives sequence information). In a preferred embodiment, the spacer comprises a ribose sugar and a phosphate, wherein the phosphate covalently attaches the ribose sugar to the polymer by forming an ester with the ribose sugar via the 5 'and 3' hydroxyl groups. ing.

【0027】 そしてさらに、本発明は、単独の代表的クローンを配列決定の各群から選択で
きるように、cDNAクローンを類似または同一配列の群中にクラスター化する方法
を提供する。好ましい実施様態では、クラスター化の方法は、複数のクローンの
配列決定に使われ、各クローンを複数のオリゴヌクレオチドプローブに照会し;
各クローンと結合するプローブおよび各プローブのシグナル強度を決定し;類似
のプローブに類似の強度で結合するクローンを同定することによって、クローン
を複数の群にクラスター化し;そして各群から少なくとも1つのクローンを配列
決定するステップを含んでなる。さらに好ましい実施様態では、複数のプローブ
は約50〜約500の異なるプローブを含んでなる。他のさらに好ましい実施様態で は、複数のプローブは約300の異なるプローブを含んでなる。最も好ましい実施 様態では、複数のクローンは複数のcDNAクローンである。
[0027] Still further, the invention provides a method of clustering cDNA clones into groups of similar or identical sequences so that a single representative clone can be selected from each group of sequencing. In a preferred embodiment, the method of clustering is used for sequencing a plurality of clones, wherein each clone is queried for a plurality of oligonucleotide probes;
Clustering the clones into multiple groups by determining the probes that bind to each clone and the signal strength of each probe; identifying clones that bind with similar strength to similar probes; and at least one clone from each group . In a more preferred embodiment, the plurality of probes comprises from about 50 to about 500 different probes. In another more preferred embodiment, the plurality of probes comprises about 300 different probes. In a most preferred embodiment, the plurality of clones are a plurality of cDNA clones.

【0028】 そしてさらに、本発明は、離散粒子と(共有結合でまたは非共有結合で)複合
体化されたオリゴヌクレオチドプローブに関係し、該粒子は物理的性質に基いて
複数のセットに分類される。好ましい実施様態では、異なるプローブを各セット
の離散粒子に結合させ、プローブの同一性を離散粒子の物理的性質を同定するこ
とにより決定する。代りの実施様態では、プローブをプローブの物理的性質に基
いて同定する。物理的性質は、離散粒子を識別することに使うことができるどの
物理的性質も含み、例えば、サイズ、蛍光性、放射能、電磁荷、または吸光度を
含み、または標識を染料、放射性核種、またはEMLのような粒子に結合させるこ とができる。好ましい実施様態では、離散粒子は粒子のサイズ、電荷、蛍光、ま
たは吸光度を検出するフローサイトメーター(flow cytometer)により分離され
る。
[0028] Still further, the invention relates to oligonucleotide probes complexed (covalently or non-covalently) with discrete particles, wherein the particles are classified into sets based on physical properties. You. In a preferred embodiment, different probes are bound to each set of discrete particles, and the identity of the probes is determined by identifying the physical properties of the discrete particles. In an alternative embodiment, the probe is identified based on the physical properties of the probe. Physical properties include any physical property that can be used to identify discrete particles, including, for example, size, fluorescence, radioactivity, electromagnetic charge, or absorbance, or labeling a dye, radionuclide, or It can be attached to particles like EML. In a preferred embodiment, the discrete particles are separated by a flow cytometer that detects the size, charge, fluorescence, or absorbance of the particles.

【0029】 本発明はまた、離散粒子と複合体化したプローブを使って標的核酸を分析する
方法にも関係する。これらのプローブは、上に記載のどの方法にでも、離散粒子
の物理的性質によりプローブを同定する修正をして使うことができる。これらの
プローブはまた、フォーマットIIIアプローチを使うことができ、この場合、「 遊離した(free)」プローブは標識により同定し、そして離散粒子に複合したプ
ローブは物理的性質により同定する。好ましい実施様態では、該プローブは、SB
Hを使い標的核酸の配列決定をするために使う。
The present invention also relates to a method of analyzing a target nucleic acid using a probe complexed with a discrete particle. These probes can be used in any of the methods described above with modifications to identify the probe by the physical properties of the discrete particles. These probes can also use a Format III approach, where "free" probes are identified by label and probes conjugated to discrete particles are identified by physical properties. In a preferred embodiment, the probe is SB
Used to sequence the target nucleic acid using H.

【0030】 本発明はまた、相補的ポリヌクレオチド鎖の結合を不安定化する(結合エネル
ギーを低下させる)か、または相補的ポリヌクレオチド鎖間の結合を安定化する
(結合エネルギーを増加する)薬剤を使う方法に関係する。好ましい実施様態で
は、該薬剤はトリアルキルアンモニウム塩、塩化ナトリウム、リン酸塩、ホウ酸
塩、ホルムアミド、グリコール、ジメチルスルホキシド、およびジメチルホルム
アミドのような有機溶媒、尿素、グアニジニウム、ベタインのようなアミノ酸類
似体、スペルミジンおよびスペルミンのようなポリアミン、またはホスフェート
骨格の負電荷を中和する他の正に荷電した分子、ドデシル硫酸塩ナトリウムおよ
びナトリウムラウリルサルコシネートのような洗剤、小溝/主溝(minor/major
groove)結合剤、正に荷電したポリペプチド、およびアクリジンのようなインタ
ーカレート剤(intercalating agent)、エチジウムブロミド、ならびにアント ラシンである。好ましい実施様態では、相補的ポリヌクレオチドの対のTmを低下
または上昇させるために薬剤を使う。さらに好ましい実施様態では、相補的ポリ
ヌクレオチドの対のTmを低下または上昇させるために該薬剤の混合物を使う。最
も好ましい実施様態では、相補的ポリヌクレオチドの誤対合と完全な対合との区
別を向上させるために薬剤もしくは薬剤の混合物を使う。好ましい実施様態では
、AT塩基対からの結合エネルギーがGC塩基対の結合エネルギーとほぼ等しくなる
ように単数または複数の薬剤を加える。これらの相補的ポリヌクレオチドの結合
のエネルギーは、ポリヌクレオチド骨格のホスフェート基の負電荷を中和もしく
は遮蔽する薬剤を加えることによって、増加させることができる。
The present invention also relates to an agent that destabilizes (reduces binding energy) binding of complementary polynucleotide strands or stabilizes binding (increases binding energy) between complementary polynucleotide strands. Is related to how to use. In a preferred embodiment, the agent is an organic solvent such as a trialkylammonium salt, sodium chloride, phosphate, borate, formamide, glycol, dimethylsulfoxide, and dimethylformamide, or an amino acid analog such as urea, guanidinium, betaine. Body, polyamines such as spermidine and spermine, or other positively charged molecules that neutralize the negative charge of the phosphate backbone, detergents such as sodium dodecyl sulfate and sodium lauryl sarcosinate, minor / major groove (minor / major
groove) binders, positively charged polypeptides, and intercalating agents such as acridine, ethidium bromide, and anthracin. In a preferred embodiment, an agent is used to reduce or increase the Tm of a pair of complementary polynucleotides. In a further preferred embodiment, the mixture of agents is used to reduce or increase the Tm of a pair of complementary polynucleotides. In a most preferred embodiment, an agent or mixture of agents is used to improve the discrimination between complementary and perfect mismatches of complementary polynucleotides. In a preferred embodiment, one or more agents are added such that the binding energy from the AT base pair is approximately equal to the binding energy of the GC base pair. The energy of binding of these complementary polynucleotides can be increased by adding an agent that neutralizes or masks the negative charge of the phosphate groups on the polynucleotide backbone.

【0031】 好ましい実施様態の詳細な説明 SBHフォーマット1は、大きいサンプルのセットの同時分析に適している。膜 の小片を使って、大アレイ上の数千のサンプルの平行スコアリングを、数千の独
立したハイブリダイゼーション反応で実施することができる。DNAの同定は、1 反応当り1〜20個のプローブに関わりうるし、ある場合には、変異の同定は各サ ンプルに対して特定的に選択されたまたは設計された1000以上のプローブに関わ
りうる。変異DNAセグメントの性質の同定のために、ハイブリダイゼーションの 第1ラウンドで検出した各変異に対して特定のプローブを合成または選択するこ
とがありうる。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS SBH format 1 is suitable for the simultaneous analysis of large sample sets. Using small pieces of membrane, parallel scoring of thousands of samples on a large array can be performed in thousands of independent hybridization reactions. DNA identification can involve 1-20 probes per reaction, and in some cases, mutation identification can involve more than 1000 probes specifically selected or designed for each sample. . To identify the nature of the mutated DNA segment, it may be possible to synthesize or select a particular probe for each mutation detected in the first round of hybridization.

【0032】 DNAサンプルを、適当なスペーサーで分離した小アレイ中で調製することがで き、そしてマルチウエルプレートにアレイすることができるオリゴヌクレオチド
のセットから選択されるプローブで、該DNAサンプルを同時に試験することがで きる。小アレイは1つ以上のサンプルからなることができる。それぞれの小アレ
イ中のDNAサンプルは、変異体または個別の配列サンプルを含むことができる。 継続した小アレイをさらに大きいアレイに組織することができる。このような、
さらに大きいアレイは同じ小アレイの複製物を含むことができるし、または異な
るDNA断片サンプルのアレイを含むことができる。プローブの普遍的セットは、D
NA断片を予め規定した精度で(例えば各塩基対(「bp」)を読むことの重複性(
redundancy)について)分析するために十分なプローブを含む。これらのセット
は、1つの特定の断片に必要であるより多いプローブを含むことができるが、数
千の異なる配列のDNAサンプルを試験するに必要であるより少ないプローブを含 むことができる。
[0032] DNA samples can be prepared in small arrays separated by suitable spacers, and the DNA samples can be simultaneously analyzed with a probe selected from a set of oligonucleotides that can be arrayed in a multiwell plate. Can be tested. A small array can consist of one or more samples. The DNA samples in each small array can include variants or individual sequence samples. Subsequent small arrays can be organized into larger arrays. like this,
Larger arrays can include duplicates of the same small array, or can include arrays of different DNA fragment samples. The universal set of probes is D
The redundancy of reading NA fragments with predefined accuracy (eg, each base pair ("bp")
redundancy)) contains enough probes to analyze. These sets can include more probes than are needed for one particular fragment, but can contain fewer probes than are needed to test DNA samples of thousands of different sequences.

【0033】 DNAもしくは対立遺伝子同定および診断配列決定プロセスは、 1) 手のこんだ、代表的なまたは普遍的なセットから、複数の小アレイのそれ
ぞれとハイブリダイズさせるプローブのサブセットの選択; 2) 平行して分析するアレイのそれぞれの各サブアレイに、第1プローブを加
えること; 3) ハイブリダイゼーションを実施し、ハイブリダイゼーション結果のスコア
リングをすること; 4) 先に使ったプローブを脱離させること; 5) スコアリングする残りのプローブに対して、ハイブリダイゼーション、ス
コアリング、脱離のステップを繰返すこと; 6) 取得した結果を処理して、最終分析を得るかまたはハイブリダイズする追
加のプローブを決定すること; 7) ある特定のサブアレイについて追加のハイブリダイゼーションを実施する
こと;および 7) データの完全なセットを処理し、最終分析を得ること のステップを含むことができる。
The DNA or allele identification and diagnostic sequencing process includes: 1) selecting a subset of probes from each elaborate, representative or universal set that hybridizes to each of a plurality of small arrays; 2) Adding a first probe to each sub-array of each of the arrays to be analyzed in parallel; 3) performing hybridization and scoring the hybridization results; 4) desorbing previously used probes. 5) repeating the steps of hybridization, scoring, and desorption for the remaining probes to be scored; 6) processing the obtained results to obtain additional probes to obtain a final analysis or to hybridize. 7) Perform additional hybridization for a particular subarray ; And 7) processes the complete set of data may include the steps of obtaining a final analysis.

【0034】 本アプローチは、1つの型(例えば、DNA、RNA)の少数の核酸サンプルの迅速
な同定と配列決定を提供し、また予め合成した管理可能なサイズのプローブセッ
トを使って、サブアレイの形の多くのサンプル型の平行分析を提供する。2つの
アプローチを組み合わせて、DNA同一性の決定用、DNA診断用、および変異体同定
用の、効率的で用途の広いプロセスを作ることができる。
The present approach provides for the rapid identification and sequencing of small numbers of nucleic acid samples of one type (eg, DNA, RNA), and the use of pre-synthesized, manageable-size probe sets to subarray Provides parallel analysis of many sample types of shapes. The two approaches can be combined to create an efficient and versatile process for determining DNA identity, for DNA diagnostics, and for mutant identification.

【0035】 既知配列の同定のために、より短いプローブの小セットをより長いユニークな
プローブの代りに使うことができる。このアプローチで、スコアすべきプローブ
はより多いが、プローブの普遍的セットをどのタイプの配列もカバーするように
合成することができる。例えば、6-merのフルセットは、4096プローブだけを含
み、7-merの完全セットは16,384プローブだけを含む。
For the identification of known sequences, a smaller set of shorter probes can be used instead of longer unique probes. With this approach, more probes to score, but a universal set of probes can be synthesized to cover any type of sequence. For example, a full set of 6-mers contains only 4096 probes, and a complete set of 7-mers contains only 16,384 probes.

【0036】 DNA断片の完全配列決定は、2つのレベルのハイブリダイゼーションで実施す ることができる。1つのレベルは、少なくとも1回どの塩基もみなカバーするに 十分なプローブセットのハイブリダイゼーションである。この目的のために、標
準サンプル用にある特定のプローブセットを合成することができる。このような
プローブセットによるハイブリダイゼーションの結果は、非標準サンプルで変異
(相異)が起っているかどうか、およびどこで起っているかを明らかにする。さ
らに、このプローブセットは、「ポジティブ」プローブのハイブリダイゼーショ
ン結果を確めるための「ネガティブ」プローブを含む。変化の同一性を決定する
ために、追加の特異的プローブを該サンプルにハイブリダイズさせることができ
る。この追加のプローブセットは「ポジティブ」(変異配列)および「ネガティ
ブ」の両方のプローブを有し、そして配列変化はポジティブプローブにより同定
され、かつネガティブプローブにより確められるであろう。
[0036] Complete sequencing of DNA fragments can be performed at two levels of hybridization. One level is sufficient hybridization of the probe set to cover all bases at least once. To this end, a specific set of probes for a standard sample can be synthesized. The results of hybridization with such a probe set will reveal whether and where a mutation (difference) has occurred in the non-standard sample. In addition, the probe set includes "negative" probes to confirm the hybridization results of "positive" probes. Additional specific probes can be hybridized to the sample to determine the identity of the change. This additional probe set has both "positive" (mutated sequences) and "negative" probes, and sequence changes will be identified by positive probes and confirmed by negative probes.

【0037】 他の実施様態では、普遍的セットからの全プローブをスコアすることができる
。普遍的プローブセットにより、2ステップのプロセスで、時間の望ましくない
消費をすることなく、サンプル当り比較的小数のプローブのスコアリングが可能
になる。ハイブリダイゼーションプロセスは、最初にハイブリダイズするプロー
ブの最適サブセットを計算する第1ステップ、そして、その後、得られた結果に
基いて、普遍的セットのプローブの中からスコアする追加のプローブを決定する
第2ステップの逐次的プロービングによることができる。両方のプローブセット
は、セット中にポジティブプローブを確めるための「ネガティブ」プローブを有
する。さらに、その後、得られた配列は、該サンプルをSBH結果から同定した「 ネガティブ」プローブセットとハイブリダイズすることにより、別のステップで
確めることができる。
In another embodiment, all probes from the universal set can be scored. The universal probe set allows the scoring of a relatively small number of probes per sample in a two-step process without undesired consumption of time. The hybridization process first computes an optimal subset of hybridizing probes, and then, based on the results obtained, determines additional probes to score from a universal set of probes. It can be by two-step sequential probing. Both probe sets have "negative" probes to identify positive probes in the set. Furthermore, the sequence obtained can then be confirmed in another step by hybridizing the sample with a “negative” probe set identified from the SBH results.

【0038】 SBH配列の構築において、分析したDNA断片中に機会または生物学的理由により
繰返し存在するK-1オリゴヌクレオチドは、特別な考慮がなされるべきであろう 。もしさらなる情報がなければ、全ての塩基対が数回読まれるように、DNAの比 較的小さい断片を完全に構築することができる。
In the construction of SBH sequences, special consideration should be given to K-1 oligonucleotides that are repeatedly present in the analyzed DNA fragments for opportunity or biological reasons. Without further information, relatively small fragments of DNA can be completely constructed so that every base pair is read several times.

【0039】 比較的長い断片の構築においては、ポジティブにスコアされるK-1配列のプロ ーブセット(すなわち、プローブ長より短い配列)が反復して存在するために曖
昧さが生じうる。この問題は、もし変異または類似の配列を決定する場合は存在
しない(すなわち、K-1配列は同一に繰返されない)。1つの配列の知識をテン プレートとして使い、ポジティブプローブをアレイして未知配列が該テンプレー
トにベストフィットを示すことにより、類似であることがわかっている配列(例
えば、データベース中のその存在より)を正しく構築することができる。
In the construction of longer fragments, ambiguity may arise due to the repeated presence of a probe set of K-1 sequences that score positively (ie, sequences shorter than the probe length). This problem does not exist if mutations or similar sequences are determined (ie, the K-1 sequence is not identically repeated). Using knowledge of one sequence as a template, arraying positive probes and showing the best fit of the unknown sequence to the template allows sequences that are known to be similar (eg, from their presence in the database) to be similar. Can be built correctly.

【0040】 サンプルのアレイの使用により、1つのシングルサンプルについてまたは小さ
いセットのサンプルについての多くのオリゴヌクレオチドの継続的スコアリング
を回避することができる。このアプローチにより、ただ1つの物理的オブジェク
トの操作によって、平行してより多くのプローブのスコアリングが可能になる。
1000bp長さのDNAサンプルのサブアレイを比較的短い時間に配列決定することが できる。もし該サンプルを1アレイに50サブアレイでスポットし、該アレイを10
回再プローブすると、500プローブをスコアすることができる。変異の存在のた めのスクリーニングでは、各塩基を3回カバーするに十分なプローブを使うこと
ができる。もし変異が存在すれば、いくつかのカバーするプローブが影響を受け
るであろう。ネガティブプローブの同一性の情報を使うと、2塩基精度で変異を
マッピングすることができる。この方法でマッピングした1つの塩基の変異を解
明するために、さらに15プローブを用いることができる。これらのプローブは、
(欠失と挿入が関ってないと仮定して)2つの疑問ある位置に対するどの塩基組
合わせもカバーする。これらのプローブを、1サイクルに所与のサンプルを含有 する50サブアレイについてスコアリングさせる。多重標識カラースキーム(すな
わち多重化)の実施では、異なる蛍光染料のような異なる標識をそれぞれ有する
2〜6プローブをプールとして使い、それによりハイブリダイゼーションのサイク
ル数を削減し、配列決定プロセスを短縮することができる。
The use of an array of samples can avoid continuous scoring of many oligonucleotides for one single sample or for a small set of samples. This approach allows the scoring of more probes in parallel by manipulating only one physical object.
A 1000 bp long DNA sample subarray can be sequenced in a relatively short time. If the sample is spotted on one array with 50 subarrays, the array is
Re-probing twice can score 500 probes. In screening for the presence of a mutation, sufficient probe can be used to cover each base three times. If the mutation is present, some covering probes will be affected. Using the information on the identity of the negative probe, the mutation can be mapped with a precision of two bases. An additional 15 probes can be used to elucidate the mutation of one base mapped by this method. These probes are
It covers any base combination for the two questionable positions (assuming the deletion and insertion are not involved). These probes are scored for 50 subarrays containing a given sample per cycle. In implementing a multi-label color scheme (ie, multiplexing), each has a different label, such as a different fluorescent dye.
Two to six probes can be used as a pool, thereby reducing the number of hybridization cycles and shortening the sequencing process.

【0041】 さらに複雑な事例では、2つの近接した変異または挿入がありうる。それらは
もっと多いプローブで扱うことができる。例えば、3塩基挿入は64プローブで解
決することができる。最も複雑な場合は、数ステップのハイブリダイゼーション
でアプローチし、前のハイブリダイゼーションの結果に基いて新しいプローブセ
ットを選択することができる。
In more complex cases, there may be two close mutations or insertions. They can be handled with more probes. For example, a three base insertion can be resolved with 64 probes. In the most complex case, a few steps of hybridization can be approached and a new probe set selected based on the results of previous hybridizations.

【0042】 もし分析するサブアレイが数十または数百の1つの型のサンプルを含むならば
、それらのいくつかは1つ以上の変化(変異、挿入、または欠失)を含有しうる
。変異が存在する各セグメントに対して、特定のプローブセットをスコアするこ
とができる。サンプルの1つの型に対してスコアすべきプローブの全数は数百で
ありうる。複製アレイの平行スコアリングにより、比較的少ないサイクル数で数
百のプローブのスコアリングが可能になる。さらに、適合性のあるプローブをプ
ールすることができる。ポジティブハイブリダイゼーションを、特定のDNAセグ メントをチェックするために選択されたプローブに割りあてることができる。何
故なら、これらのセグメントは通常、構成塩基の75%が異なるからである。
If the subarray to be analyzed contains dozens or hundreds of one type of sample, some of them may contain one or more changes (mutations, insertions or deletions). For each segment where the mutation is present, a particular probe set can be scored. The total number of probes to score for one type of sample can be hundreds. Parallel scoring of replica arrays allows scoring of hundreds of probes with relatively few cycles. In addition, compatible probes can be pooled. Positive hybridization can be assigned to selected probes to check for a particular DNA segment. This is because these segments usually differ by 75% of the constituent bases.

【0043】 より大きいより長いプローブセットを使うことにより、より長い標的を分析す
ることができる。これらの標的はエキソンクローンのプールのような断片のプー
ルを代表することができる。
By using larger, longer probe sets, longer targets can be analyzed. These targets can represent a pool of fragments, such as a pool of exon clones.

【0044】 特異的ハイブリダイゼーションスコアリング法を用いて、二倍体染色体セット
からの配列決定すべきゲノムセグメント中の変異体の存在を定義することができ
る。2つの変形があり;i)1つの染色体からの配列は既知の対立遺伝子を表し、
他の染色体からの配列は新しい変異を表す場合;または、ii)染色体の両方とも 新しいが異なる変異体である場合である。両ケースとも、変化をマッピングする
よう設計された走査ステップは、変異位置で2倍の最大シグナル差を与える。さ
らに、該方法を使って、ある遺伝子のどの対立遺伝子が個体(individual)によ
り運ばれ、そして該個体はその遺伝子に対してホモ接合性かヘテロ接合性かを同
定することができる。
The specific hybridization scoring method can be used to define the presence of a variant in the genomic segment to be sequenced from a set of diploid chromosomes. There are two variants; i) sequences from one chromosome represent known alleles;
Sequences from other chromosomes represent new mutations; or ii) both chromosomes are new but different variants. In both cases, a scanning step designed to map the change gives a two-fold maximum signal difference at the mutation location. In addition, the method can be used to identify which allele of a gene is carried by an individual and whether the individual is homozygous or heterozygous for that gene.

【0045】 第1のケースで要求される2倍のシグナル差のスコアリングは、対応シグナル
をホモ接合性およびヘテロ接合性対照と比較することにより効率的に実施するこ
とができる。このアプローチにより、所与のサンプルの各特定プローブに対する
ハイブリダイゼーションシグナルの相対的減少を決定することが可能になる。こ
れは、同じ完全な対合標的を有する異なる核酸断片とハイブリダイズした特定の
プローブに対して、ハイブリダイゼーション効率が2倍以上変化しうるので、重
要である。さらに、異なる変異部位は、オリゴヌクレオチドプローブの数に依存
して1つ以上のプローブに影響を与えることができる。2〜4個の継続的プロー
ブに対するシグナルの低下は、変異部位のさらに著しい徴候を与える。結果は、
選択されたプローブの小さいセットで試験してチェックすることができ、その中
で誤対合を含有する二本鎖から来るシグナルより平均で8倍強い完全な対合シグ ナルを与える1つまたは少数のプローブが選択される。
The scoring of the two-fold signal difference required in the first case can be performed efficiently by comparing the corresponding signal to homozygous and heterozygous controls. This approach allows one to determine the relative decrease in hybridization signal for each particular probe in a given sample. This is important because for a particular probe hybridized to a different nucleic acid fragment having the same perfect matching target, the hybridization efficiency can vary by more than two-fold. In addition, different mutation sites can affect one or more probes, depending on the number of oligonucleotide probes. Decreased signal for 2-4 consecutive probes gives more pronounced indications of the mutation site. Result is,
One or a few that can be tested and checked on a small set of selected probes, giving a perfect match signal on average 8 times stronger than the signal coming from the duplex containing the mismatch Probes are selected.

【0046】 分配した膜により、所与の配列型を表す比較的多数のサンプルまたは比較的小
数のサンプルで表される多くの異なる型のサンプルに適合する、非常に柔軟性の
ある実験組織が可能になる。4〜256サンプルの範囲を特に効率的に取扱うことが
できる。この範囲内のドット数のサブアレイを、オリゴヌクレオチドの貯蔵と標
識付けのために使う標準マルチウエルプレートの構造とサイズに整合するように
設計することができる。サブアレイのサイズを、異なるサンプル数に調節するか
、または少数の標準サブアレイサイズを使うことができる。もしある型の全ての
サンプルが1つのサブアレイに適合しないのであれば、追加のサブアレイまたは
膜を使って同じプローブで処理することができる。さらに、各サブアレイに対す
る複製数を調節して、同定または配列決定の完了のための時間を変えることがで
きる。
The distributed membrane allows for a very flexible experimental organization that can accommodate a relatively large number of samples representing a given sequence type or many different types of samples represented by a relatively small number of samples. become. A range of 4 to 256 samples can be handled particularly efficiently. Subarrays of dot numbers within this range can be designed to match the structure and size of standard multiwell plates used for oligonucleotide storage and labeling. The size of the subarray can be adjusted to a different number of samples, or a small number of standard subarray sizes can be used. If all samples of a type do not fit into one subarray, they can be processed with the same probe using additional subarrays or membranes. In addition, the number of replicates for each subarray can be adjusted to change the time for identification or sequencing completion.

【0047】 本明細書で使われる「中間断片(intermediate fragment)」は、長さで5〜10
00塩基、そして好ましくは長さで10〜40bpのオリゴヌクレオチドを意味する。
As used herein, an “intermediate fragment” is between 5 and 10 in length.
It means an oligonucleotide of 00 bases, and preferably 10 to 40 bp in length.

【0048】 フォーマット3では、既知配列のオリゴヌクレオチドプローブの第1セットは
、それらがそれぞれ相補的な配列を有する核酸とハイブリダイズすることを許容
する条件下で、固体支持体上に固定する。標識した、第2のオリゴヌクレオチド
プローブセットは溶液で用意される。該プローブは、セット内およびセット間の
両方とも、同じ長さまたは異なる長さであってよい。配列決定される核酸または
それらの中間断片は、2本鎖形で(特にrecAタンパク質が存在して非変性条件下
のハイブリダイゼーションが可能なとき)または1本鎖で、そして様々な相補性
の程度のハイブリッドを可能とする条件下で(例えば、フル対合と1塩基対誤対
合ハイブリッドの間の区別を可能とする条件下で)、第1プローブセットに添加
することができる。配列決定される核酸またはそれらの中間断片は、第1プロー
ブセットに、第2のプローブセットの前、後、または同時に添加することができ
る。標的の隣接部位に結合するプローブを一緒に結合させる(例えば、スタッキ
ング相互作用によって、またはリガーゼもしくは隣接プローブ間に化学結合を形
成する他の方法によって)。隣接プローブを結合させた後、表面に第1のプロー
ブセットのメンバーへの化学結合によって固定化されない断片およびプローブは
、例えばハイブリッドを融解する高温(100℃以下)洗浄液を使って洗浄除去さ れる。その後、第2セットからの結合したプローブは、用いた標識(例えば、化
学発光、蛍光、放射性、酵素、濃度測定、または電気泳動質量の標識であること
ができる)に適した方法を使って検出することができる。
In format 3, a first set of oligonucleotide probes of known sequence is immobilized on a solid support under conditions that allow them to hybridize to nucleic acids each having a complementary sequence. A labeled, second oligonucleotide probe set is provided in solution. The probes may be the same length or different lengths, both within and between sets. The nucleic acids to be sequenced or their intermediate fragments can be in double-stranded form (especially when the recA protein is present to allow hybridization under non-denaturing conditions) or single-stranded, and with varying degrees of complementarity. Can be added to the first probe set under conditions that allow for hybridisation (e.g., under conditions that allow discrimination between full and single base pair mismatched hybrids). The nucleic acids to be sequenced or their intermediate fragments can be added to the first probe set before, after or simultaneously with the second probe set. Probes that bind to adjacent sites on the target are bound together (eg, by stacking interactions or by ligase or other methods of forming a chemical bond between adjacent probes). After binding of the adjacent probes, fragments and probes that are not immobilized on the surface by chemical binding to the members of the first probe set are washed away using, for example, a high temperature (100 ° C. or lower) washing solution that melts the hybrid. The bound probe from the second set is then detected using a method appropriate for the label used (which can be, for example, a label for chemiluminescence, fluorescence, radioactivity, enzymes, densitometry, or electrophoretic mass). can do.

【0049】 本明細書で、ヌクレオチド塩基は、もしそれらが、規定した条件下で水素結合
により安定な2本鎖を形成すれば、「対合する(match)」かまたは「相補的(c
omplementary)」である。例えば、ハイブリダイゼーションアッセイで共通して
用いられる条件下で、アデニン(「A」)はチミン(「T」)と対合するが、グア
ニン(「G」)またはシトシン(「C」)とは対合しない。同様に、GはCと対合す
るが、AまたはTとは対合しない。イノシンまたは普遍的塩基(Universal Base)
(「M」塩基, Nicholsら, 1994)のようなより低い特異性によって水素結合をす
る他の塩基、またはメチル化した塩基(methylated bases)のような他の修正し
た塩基は、例えば、規定した条件下でそれらが安定な2本鎖を形成する塩基と相
補的である。プローブは、もし該プローブ中の各塩基が核酸中の塩基と水素結合
により2本鎖を形成してワットソン・クリック(Watson and Crick)塩基対形成
ルール(すなわち、周辺の配列影響がなく、形成された2本鎖が特定のプローブ
に対して最大の結合エネルギーをもつ)により配列されれば、「完全に相補的(
perfectly complementary)」であると言われるかまたは「完全な対合(perfect
match)」であると言われる。「完全に相補的」および「完全な対合」はまた、
類似体または修正したヌクレオチドを有するプローブを包含することを意味する
。類似体または修正ヌクレオチドに対する「完全な対合」は、類似体または修正
ヌクレオチドに対して選択される「完全な対合ルール」(例えば、特定の類似体
または修正ヌクレオチドに対して最大結合エネルギーをもつ結合対)により判断
される。「ルール」による結合対を形成しないプローブ中の各塩基は、規定され
たハイブリダイゼーション条件下で「誤対合(mismatch)」であると言われる。
As used herein, nucleotide bases are “matched” or “complementary (c) if they form a stable duplex through hydrogen bonding under defined conditions.
omplementary) ". For example, under conditions commonly used in hybridization assays, adenine ("A") pairs with thymine ("T"), but not with guanine ("G") or cytosine ("C"). Do not match. Similarly, G pairs with C, but not with A or T. Inosine or Universal Base
Other bases that hydrogen bond with lower specificity, such as (“M” bases, Nichols et al., 1994), or other modified bases, such as methylated bases, may be, for example, Under conditions they are complementary to bases that form stable duplexes. A probe is formed if each base in the probe forms a duplex by hydrogen bonding with a base in the nucleic acid to form a Watson and Crick base pairing rule (ie, without any peripheral sequence effects). If the two strands are arranged by the two strands having the maximum binding energy for a particular probe, they are "perfectly complementary (
said to be "perfectly complementary" or "perfectly complementary"
match) ". "Completely complementary" and "perfect pairing"
It is meant to include probes with analogs or modified nucleotides. A "perfect match" for an analog or modified nucleotide is a "perfect matching rule" selected for the analog or modified nucleotide (e.g., having the highest binding energy for a particular analog or modified nucleotide) Binding pair). Each base in the probe that does not form a binding pair according to the "rule" is said to be "mismatched" under defined hybridization conditions.

【0050】 各プローブが配列決定される核酸に完全な対合であるプローブのリストを構築
することができる。その後、このリスト上のプローブを分析して最大オーバーラ
ップ順に整列させる。この整列は、第1プローブをリスト上の他のプローブのそ
れぞれと比較することにより実施して、どのプローブが第2プローブの5'末端の
塩基の配列と同一の塩基の最長配列をもつ3'末端を有するかを決定することがで
きる。その後、第1および第2プローブをオーバーラップさせることができ、そ
して該プロセスを繰返すことができ、第2プローブの5'末端を全ての残りのプロ
ーブの3'末端と比較しかつ第1プローブの3'末端を全ての残りのプローブの5'末
端と比較する。該プロセスは、他のプローブとオーバーラップしていないリスト
上のプローブが無くなるまで続けることができる。あるいは、1つ以上のプロー
ブをポジティブプローブのリストから選択することができ、1セット以上のオー
バーラップしたプローブ(「配列核(sequence nucleus)」)を平行して作製す
ることができる。配列構築のどちらものこのようなプロセスに対するプローブの
リストは、配列決定される核酸に完全に相補的であるプローブの全てのリストで
あることができ、またはそれらのどれかのサブセットであることができる。
A list of probes can be constructed where each probe is a perfect match for the nucleic acid to be sequenced. Then, the probes on this list are analyzed and arranged in the order of maximum overlap. This alignment is performed by comparing the first probe with each of the other probes on the list, where each probe has a 3 'having the longest sequence of bases identical to the sequence of the base at the 5' end of the second probe. It can be determined whether it has a terminus. Thereafter, the first and second probes can be overlapped and the process can be repeated, comparing the 5 'end of the second probe with the 3' end of all remaining probes and of the first probe. The 3 'end is compared to the 5' end of all remaining probes. The process can continue until there are no more probes on the list that do not overlap with other probes. Alternatively, one or more probes can be selected from a list of positive probes, and one or more sets of overlapping probes ("sequence nucleus") can be made in parallel. The list of probes for any such process of sequence construction can be a complete list of probes that are completely complementary to the nucleic acid to be sequenced, or can be a subset of any of them. .

【0051】 プローブの5'および3'末端をオーバーラップさせてさらに長い配列の伸展部(
stretches)を作製することができる。プローブ構築のこのプロセスを、分枝点 (あるプローブが該断片中で繰返される)、プローブより長い反復配列、または
非クローニングセグメントのために曖昧さが起るまで続ける。2つの曖昧さの間
の配列の伸展部を、サブクローン配列(Sfs)の断片とよぶ。プローブとの適当 な代替オーバーラップが利用可能なために配列構築に曖昧さが起ると、オーバー
ラップ代替物の部位をまたがるさらに長いプローブによるハイブリダイゼーショ
ン、競争ハイブリダイゼーション、代替物末端と曖昧さの部位をまたがるプロー
ブの末端対との連結反応、またはシングルパスゲル分析(Sfsの曖昧な整列をつ くるために)を使うことができる。
The 5 ′ and 3 ′ ends of the probe overlap to extend the longer sequence extension (
stretches). This process of probe construction continues until ambiguity arises due to branch points (some probes are repeated in the fragment), repetitive sequences longer than probes, or uncloned segments. The stretch of sequence between the two ambiguities is called a fragment of the subclone sequence (Sfs). When ambiguity in sequence construction occurs due to the availability of suitable alternative overlaps with the probe, hybridization with longer probes across the site of the overlap alternative, competitive hybridization, and the terminus of the alternative Ligation of the probe with end pairs across sites, or single-pass gel analysis (to create a fuzzy alignment of Sfs) can be used.

【0052】 以上の方法を用いることにより、ハイブリダイゼーションのパターン(核酸サ
ンプルの同一性に関係し得て、核酸サンプルを同定するサインの役割を果す)か
ら、オーバーラップまたは非オーバーラッププローブまで、さらに、構築された
Sfsを経て、そして中間断片またはソースDNA分子全体(例えば、染色体)に対す
る完全配列までの所望のレベルの配列を得ることができる。
Using the above method, from the pattern of hybridization (which can be related to the identity of the nucleic acid sample and serves as a signature to identify the nucleic acid sample) to overlapping or non-overlapping probes, ,It was constructed
Desired levels of sequence can be obtained via Sfs and up to the complete sequence for the intermediate fragment or the entire source DNA molecule (eg, chromosome).

【0053】 配列決定は、一般に以下の工程を含む: (a)その断片が相補的配列を有する固定化プローブとの第1複合体形成を可能 にするのに有効な条件下に、固定化オリゴヌクレオチドプローブのアレイ(arra
y)と核酸断片とを接触させ; (b)第1複合体が標識プローブにハイブリダイズし、それによって、その断片 が固定化プローブ及び標識プローブの両者によってハイブリダイズされる第2複
合体を形成することを可能にするのに有効な条件下の溶液中で、この第1複合体
を標識オリゴヌクレオチドプローブのセットとを接触させ; (c)第2複合体から、固定化プローブに隣接してハイブリダイズしない任意の 標識プローブを除去し; (d)隣接する標識及び非標識プローブの存在を、標識の存在を検出することに よって検出し;そして (e)固定化標識プローブの既知配列と連結することによって、その断片のヌク レオチド配列を決定する。
Sequencing generally involves the following steps: (a) under conditions effective to allow the fragment to form a first complex with an immobilized probe having a complementary sequence, Array of nucleotide probes (arra
(b) contacting the nucleic acid fragment with the nucleic acid fragment; (b) the first complex hybridizes to the labeled probe, thereby forming a second complex in which the fragment is hybridized by both the immobilized probe and the labeled probe. Contacting the first complex with a set of labeled oligonucleotide probes in a solution under conditions effective to allow the binding of the first complex to the second complex; (D) detecting the presence of adjacent labeled and unlabeled probes by detecting the presence of the label; and (e) linking to the known sequence of the immobilized labeled probe. By doing so, the nucleotide sequence of the fragment is determined.

【0054】 ハイブリダイゼーション及び洗浄条件は、実質的に完全対合(match)ハイブ リッド(例えば、断片及びプローブが7つの部位のうち6つでハイブリダイズする
ものなど)を検出するように選択されるか、完全対合及び1塩基対誤対合の相違 を許容するように選択されるか、又は完全対合ハイブリッドのみの検出を許容す
るように選択され得る。
Hybridization and washing conditions are selected to detect substantially perfect hybrids (eg, those in which fragments and probes hybridize at six of seven sites, etc.). Or may be selected to allow for differences between perfect pairing and single base pair mismatches, or to allow detection of only perfect pairing hybrids.

【0055】 好適なハイブリダイゼーション条件は、最適化手順又は試験的検討(studies )によって日常的に決定され得る。そのような手順及び検討は、研究室で用いら
れるプロトコールを確立するために、当業者によって日常的に行われる。例えば
、参照によって本明細書中に組み入れられる、Ausubelら、Current Protocols i
n Molecular Biology, Vol. 1-2, John Wiley & Sons (1989);Sambrookら、Mol
ecular Cloning A Laboratory Manual, 第2版, Vols. 1-3, Cold Springs Harbo
r Press (1989);及びManiatisら、Molecular Cloning: A Laboratory Manual,
Cold Spring HarborLaboratory Corl Spring Harbor, New York (1982)を参照さ
れたい。例えば、温度、構成要素(components)の濃度、ハイブリダイゼーショ
ン及び洗浄時間、バッファー構成要素、並びにそれらのpH及びイオン強度などの
条件を、変化させることができる。
[0055] Suitable hybridization conditions can be determined routinely by optimization procedures or experimental studies. Such procedures and reviews are routinely performed by those skilled in the art to establish protocols used in the laboratory. For example, Ausubel et al., Current Protocols i, incorporated herein by reference.
n Molecular Biology, Vol. 1-2, John Wiley & Sons (1989); Sambrook et al., Mol.
ecular Cloning A Laboratory Manual, 2nd edition, Vols. 1-3, Cold Springs Harbo
r Press (1989); and Maniatis et al., Molecular Cloning: A Laboratory Manual,
See Cold Spring Harbor Laboratory Corl Spring Harbor, New York (1982). For example, conditions such as temperature, component concentrations, hybridization and washing times, buffer components, and their pH and ionic strength can be varied.

【0056】 標識固定化プローブが物理的又は化学的に結合されない実施態様では、検出は
制御ストリンジェンシーの洗浄工程のみに依存し得る。そのような条件下では、
隣接プローブは、隣接プローブの間での積み重ね相互作用(stacking interacti
ons)のため、高い結合親和性を有する。条件は、上記のように工程を最適化す るために変化させ得る。
In embodiments where the labeled immobilized probe is not physically or chemically attached, detection may rely solely on controlled stringency washing steps. Under such conditions,
Adjacent probes are used for stacking interactions between adjacent probes.
ons) and has a high binding affinity. Conditions can be varied to optimize the process as described above.

【0057】 固定化標識プローブが連結されている実施態様では、連結は、化学連結試薬(
例えば、水溶性カルボジイミド又は臭化シアン)によって行うことができるか、
又はリガーゼ酵素、商業的に入手可能なT4 DNAリガーゼを利用することができる
。洗浄条件は、隣接プローブに対する非隣接プローブの安定性の差を利用して、
隣接標識固定化プローブに対して非隣接標識固定化プローブを識別するように選
択できる。
In embodiments where the immobilized labeled probe is ligated, the linkage may be a chemical ligation reagent (
Water-soluble carbodiimide or cyanogen bromide),
Or a ligase enzyme, can be utilized commercially available T 4 DNA ligase. Washing conditions utilize the difference in stability of non-adjacent probes relative to adjacent probes,
A choice can be made to distinguish non-adjacent labeled immobilized probes relative to adjacent labeled immobilized probes.

【0058】 オリゴヌクレオチドプローブは、蛍光染料、化学発光系、放射活性標識(例え
ば、35S、3H、32P又は33P)又は質量分析法によって検出し得る同位体によって 標識できる。
The oligonucleotide probes can be labeled with a fluorescent dye, a chemiluminescent system, a radioactive label (eg, 35 S, 3 H, 32 P or 33 P) or an isotope that can be detected by mass spectrometry.

【0059】 未知配列の核酸分子が約45又は50 bpより長い場合、その分子を断片化して、 その断片の配列を決定できる。断片化は、制限酵素消化、切断(shearing)又は
NaOHによって達成できる。断片は、サイズで分離され(例えば、ゲル電気泳動に
よって)、約10〜40 bpの長さの好ましい断片を得ることができる。
If a nucleic acid molecule of unknown sequence is longer than about 45 or 50 bp, the molecule can be fragmented and the fragment sequenced. Fragmentation can be accomplished by restriction digestion, shearing or
Can be achieved by NaOH. The fragments can be separated in size (eg, by gel electrophoresis) to obtain a preferred fragment of about 10-40 bp in length.

【0060】 オリゴヌクレオチドは、当業者に公知の多数の方法(例えば、ヌクレオシドホ
スホロアミダイト(phosphoramidite)又はリン酸水素化ヌクレオシド(nucleos
ide hydrogen phosphorate)などの試薬を用いて、リン酸基を介してレーザー活
性化光脱保護アタッチメント(laser-activated photodeprotection attachment
))によって固定化できる。ガラス、ナイロン、珪素及びフッ素化炭素支持体を
使用できる。
[0060] Oligonucleotides can be prepared in a number of ways known to those skilled in the art, for example, nucleoside phosphoramidites or hydrogenated nucleosides.
Laser-activated photodeprotection attachment via a phosphate group using reagents such as ide hydrogen phosphorate
)). Glass, nylon, silicon and fluorinated carbon supports can be used.

【0061】 オリゴヌクレオチドは、アレイ中に組み込まれ、これらのアレイは、全て若し
くは所与の長さの全プローブのサブセットか、又は選択された長さのプローブの
セットを含むことができる。疎水性分割(partitions)は、プローブ又はプロー
ブのサブアレイを分離するのに使用できる。アレイは、多様なアプチケーション
(例えば、マッピング、部分配列決定、診断目的の標的領域の配列決定、mRNA配
列決定及び大容量配列決定)のために設計できる。特異的チップは、基質上のプ
ローブの組み合わせ及び配列を選択することによって、特定のアプリケーション
専用に設計できる。
Oligonucleotides are incorporated into arrays, which can include all or a subset of all probes of a given length, or a set of probes of a selected length. Hydrophobic partitions can be used to separate probes or subarrays of probes. Arrays can be designed for a variety of applications (eg, mapping, partial sequencing, sequencing of target regions for diagnostic purposes, mRNA sequencing, and bulk sequencing). Specific chips can be designed for specific applications by choosing the combination and sequence of probes on the substrate.

【0062】 例えば、長さ5塩基対の全オリゴヌクレオチドプローブの1024個の固定化プロ ーブアレイ(各アレイは1024個の異なるプローブを含む)が構築できる。この例
のプローブは、情報提供センス中の5-mer(それらは実際にはより長いプローブ であり得る)である。1024個の5-merプローブの第2のセットは、標識され、各 標識プローブの1つは、配列決定されるべき断片を伴った固定化プローブのアレ
イに適用され得る。この例では、1024個のアレイが大きなスーパーアレイ、又は
「スーパーチップ」に結合されるだろう。標識プローブ及び標識プローブの1つ
が核酸断片に沿って末端−末端(end-to-end)でハイブリダイズするこれらの例
では、2つのプローブは、例えば、連結反応によって結合され、未結合標識を除
去後、サンプル断片に相補的な10-merが、既知配列の標識プローブが適用される
既知配列の固定化プローブを有するアレイ中のポイントでの標識の存在の相関関
係によって検出される。サンプル断片の配列は、単純に標識プローブの配列中に
連続する固定化プローブの配列である。このように、全ての100万個の可能な10-
merは、5-merのみを使用し、従ってオリゴヌクレオチド合成の労力量の1000分の
1を含む組み合わせ(combinatorial)工程によって試験できる。
For example, 1024 immobilized probe arrays of all oligonucleotide probes of 5 base pairs in length (each array containing 1024 different probes) can be constructed. The probes in this example are 5-mers in the informative sense (they may actually be longer probes). A second set of 1024 5-mer probes is labeled, and one of each labeled probe can be applied to an array of immobilized probes with the fragment to be sequenced. In this example, 1024 arrays would be combined into a large superarray, or "superchip." In those instances where the labeled probe and one of the labeled probes hybridize end-to-end along the nucleic acid fragment, the two probes are combined, for example, by a ligation reaction to remove unbound label. Later, a 10-mer complementary to the sample fragment is detected by correlation of the presence of the label at a point in the array with the known sequence of immobilized probes to which the known sequence of the labeled probe is applied. The sequence of the sample fragment is simply the sequence of the immobilized probe contiguous with the sequence of the labeled probe. Thus, all one million possible 10-
The mer uses only the 5-mer, and thus has a thousandth of the labor of oligonucleotide synthesis.
It can be tested by a combinatorial process involving 1.

【0063】 好ましい実施態様では、オリゴヌクレオチドプローブのアレイを支持する基体
は、アレイ中の各プローブが、例えば、疎水性材料であり得る物理的バリアーに
よって隣接プローブから分離されるように、部分に仕切られる。好ましい実施態
様では、物理的バリアーは、100μm〜30μmの幅を有する。より好ましい実施態 様では、各プローブの中心から任意の隣接プローブの中心までの距離は325μmで
ある。これらのプローブアレイは、動かない(nonmoving)固定化基体又はイン クジェットデポジション(deposition)装置、例えば、微小滴液量ヘッド、及び
好適なロボットシステム、例えば、アノラドガントリー(anorad gantry)を有 する回転ドラム又はプレートに固定された基体を用いて「大量生産」できる。
In a preferred embodiment, the substrate supporting the array of oligonucleotide probes is partitioned such that each probe in the array is separated from adjacent probes by a physical barrier, which can be, for example, a hydrophobic material. Can be In a preferred embodiment, the physical barrier has a width between 100 μm and 30 μm. In a more preferred embodiment, the distance from the center of each probe to the center of any adjacent probe is 325 μm. These probe arrays have a nonmoving immobilized substrate or inkjet deposition device, such as a microdroplet head, and a suitable robotic system, such as an anorad gantry. It can be "mass-produced" using a substrate fixed to a rotating drum or plate.

【0064】 別の好ましい実施態様では、オリゴヌクレオチドプローブは、3次元アレイに
固定される。3次元アレイは、多数の層から構成され、各層は、他の層から離れ
て個別に分析できる。3次元アレイは、、多数の形態をとり得、例えば、次の形
態を含む:くぼみの中の異なる深さにプローブが位置している多数のくぼみを有
する基体上に配置され得る(各平面は、くぼみ内の同様の深さのプローブで構成
されている)を含むか;又は、アレイはくぼみの底、若しくはくぼみ又は幾つか
のピークの組み合わせを分割するピークにプローブが位置している異なる深さの
くぼみを有する基体上に配置され、くぼみを用いることができる(各平面は一定
の深さで全てのプローブから構成されている)か;又はアレイは、積層されて3
次元アレイを形成する多数のシートで構成される基体上に配置され得る。
[0064] In another preferred embodiment, the oligonucleotide probes are immobilized on a three-dimensional array. A three-dimensional array is composed of a number of layers, each of which can be analyzed separately from the other layers. A three-dimensional array can take a number of forms, including, for example, the following forms: a probe can be located on a substrate having a number of depressions located at different depths within the depressions (each plane is The array is composed of probes of similar depth within the cavity); or the array has different depths where the probe is located at the bottom of the cavity, or at a peak that divides the cavity or a combination of several peaks. Either placed on a substrate with depressions, depressions can be used (each plane is composed of all probes at a constant depth); or the array is stacked 3
It can be placed on a substrate composed of multiple sheets forming a dimensional array.

【0065】 これらのアレイ中のプローブは、基体表面とプローブの情報提供部分との間の
距離を増すスペーサーを含むことができる。スペーサーは、炭素、珪素、酸素、
硫黄、リンなどの少なくとも2価の結合を形成し得る原子から構成され得るか、 又は糖−リン酸基、アミノ酸、ペプチド、ヌクレオシド、ヌクレオチド、糖、炭
化水素、芳香環、炭化水素環、直鎖及び分岐炭化水素などの少なくとも2価の結 合を形成し得る分子から構成され得る。
The probes in these arrays can include spacers that increase the distance between the substrate surface and the information providing portion of the probe. Spacers are carbon, silicon, oxygen,
Sulfur, may be composed of atoms capable of forming at least a divalent bond such as phosphorus, or a sugar-phosphate group, amino acid, peptide, nucleoside, nucleotide, sugar, hydrocarbon, aromatic ring, hydrocarbon ring, linear And a molecule capable of forming at least a divalent bond such as a branched hydrocarbon.

【0066】 配列決定される核酸サンプルは、断片化又はそれと異なる処理(例えば、recA
の使用によって)をされてサンプル中の第2構造によるハイブリダイゼーション
の妨害を避けることができる。サンプルは、例えば、Cviなどの制限酵素による 消化、物理的切断(例えば、超音波によって)、又はNaOH処理によって断片化で
きる。得られた断片は、ゲル電気泳動によって分離でき、約10 bp〜約40 bpの間
などの適切な長さの断片をゲルから抽出できる。好ましい実施態様では、核酸サ
ンプルの「断片」は、プール中の他の断片と連結できない。そのような断片のプ
ールは、断片化された核酸をホスファターゼ(例えば、仔ウシ腸ホスファターゼ
)で処理することによって得られる。あるいは、サンプル核酸の非連結性断片は
、サンプル核酸によるSanger−デオキシシークエンシング反応において、ランダ
ムプライマー(例えば、N5-N9、ここでN=A、G、T、又はC)を用いることによっ て得られる。これは、標的核酸に相補的な配列を有し、他の断片に連結できない
ジデオキシ残基で停止しているDNA断片を製造するだろう。
The nucleic acid sample to be sequenced can be fragmented or otherwise processed (eg, recA).
To avoid interference with hybridization by the second structure in the sample. The sample can be fragmented, for example, by digestion with a restriction enzyme such as Cvi, physical cleavage (eg, by sonication), or NaOH treatment. The resulting fragments can be separated by gel electrophoresis, and fragments of appropriate length, such as between about 10 bp and about 40 bp, can be extracted from the gel. In a preferred embodiment, "fragments" of the nucleic acid sample cannot be ligated to other fragments in the pool. A pool of such fragments is obtained by treating the fragmented nucleic acid with a phosphatase (eg, calf intestinal phosphatase). Alternatively, non-ligated fragments of a sample nucleic acid can be prepared by using random primers (eg, N 5 -N 9 , where N = A, G, T, or C) in a Sanger-deoxy sequencing reaction with the sample nucleic acid. Is obtained. This will produce a DNA fragment that has a sequence complementary to the target nucleic acid and is terminated by a dideoxy residue that cannot be ligated to another fragment.

【0067】 再利用できるフォーマット3 SBHアレイは、固定化プローブと標識プローブの 間に開裂可能な結合を導入し、次いでフォーマット3分析のラウンドが終了した 後にこの結合を開裂することによって製造できる。標識プローブは、リボヌクレ
オチド類又はリボヌクレオチドであり、標識プローブ中の結合塩基として使用で
き、このプローブは、続いて例えば、RNAse又はウラシル−DNAグリコシル化処理
、又はNaOH処理によって除去され得る。さらに、化学連結反応によって製造され
る結合は、選択的に開裂され得る。
Reusable Format 3 SBH arrays can be made by introducing a cleavable bond between the immobilized probe and the labeled probe, and then cleaving this bond after the round of Format 3 analysis has been completed. Labeled probes are ribonucleotides or ribonucleotides and can be used as binding bases in labeled probes, which can be subsequently removed by, for example, RNAse or uracil-DNA glycosylation, or NaOH treatment. In addition, bonds made by chemical ligation can be selectively cleaved.

【0068】 他のバリエーションは、特異性又は効率を増加させる修飾オリゴヌクレオチド
の使用、例えば、標識プローブの第1セットに最適に選択された条件(例えば、
温度)下にハイブリダイゼーションサイクルを行い、次いで標識プローブの第2
セットに最適に選択された条件下にハイブリダイゼーションすることによる、ハ
イブリダイゼーションシグナルを増加する循環(cycling)ハイブリダイゼーシ ョンを含む。リーディングフレームのシフトは、それぞれ4つのヌクレオチド塩 基A、T、C及びGで終わるプローブの混合物(好ましくは等モル量の混合物)を使
用することによって決定できる。
Other variations include the use of modified oligonucleotides to increase specificity or efficiency, such as conditions optimally selected for the first set of labeled probes (eg,
Temperature), followed by a second hybridization of the labeled probe.
Includes cycling hybridization that increases the hybridization signal by hybridizing under conditions optimally selected for the set. The reading frame shift can be determined by using a mixture (preferably an equimolar mixture) of probes ending with each of the four nucleotide bases A, T, C and G.

【0069】 分岐点は、断片の規則正しい配列に関して曖昧さを生じさせる。配列情報はSB
Hによって決定されるけれども、そのような曖昧さ(「分岐点」)がある場合、 ハイブリダイゼーションデータを整理するために、(i)完全ゲル配列決定のコス ト(cost)画分(fraction)での長い読み出し長さの単一パスゲル配列決定;又
は(ii)関連配列との比較のいずれかを使用することができる。分岐点を介する単
一パスゲル配列決定のためのプライマーは、SBH配列情報から、又は既知ベクタ ー配列、例えば、ベクター挿入部位に隣接する配列から同定し、サンプル核酸に
関して、標準Sanger−シークエンシング反応を行う。この単一パスゲル配列決定
から得られた配列を、分岐点からの読み込み、読み出し(read into and out of
the branch points)、Sfsの順序を同定するSfsと比較する。あるいは、Sfsは 、Sfsの配列を関連配列と比較し、Sfsを整列して、関連配列に最も近い配列を製
造することによって整列することができる。
Branch points create ambiguity regarding the ordered arrangement of fragments. Sequence information is SB
If there is such an ambiguity (“branch point”), as determined by H, then to organize the hybridization data, (i) the cost fraction of complete gel sequencing Long read length single pass gel sequencing; or (ii) comparison with related sequences can be used. Primers for single pass gel sequencing through branch points were identified from SBH sequence information or from known vector sequences, e.g., sequences adjacent to the vector insertion site, and used for standard Sanger-sequencing reactions on sample nucleic acids. Do. The sequence obtained from this single pass gel sequencing was read into and out of the branch point.
the branch points), and compare the Sfs order with Sfs to identify. Alternatively, Sfs can be aligned by comparing the sequence of Sfs to related sequences, aligning Sfs, and producing the sequence closest to the related sequence.

【0070】 さらに、標的断片中の縦列反復核酸セグメントの数は、シングル−パスゲル配
列決定によって決定できる。縦列反復は、遺伝子のタンパク質コード部分中で稀
に起きるので、ゲル配列決定工程はこれらの非コード領域の1つが特別に興味あ
るものとして同定される場合(例えば、それが重要な制御領域である場合)にの
み行われるであろう。
Furthermore, the number of tandemly repeated nucleic acid segments in a target fragment can be determined by single-pass gel sequencing. Because tandem repeats occur infrequently in the protein-coding portion of a gene, the gel sequencing step is performed when one of these non-coding regions is identified as of particular interest (eg, it is an important regulatory region). Case) will only take place.

【0071】 たった約200個のオリゴヌクレオチドプローブのセットが示すハイブリダイゼ ーションの程度についての情報を得ることにより、各遺伝子の特有のサイン(si
gnature)を定義し、ライブラリーからのcDNAの分類に使用でき、ライブラリー が同じ遺伝子の多数のコピーを含んでいるか否かを決定できる。そのようなサイ
ンによって、同一、類似及び異なるcDNAが区別でき、目録を作成できる。
By obtaining information about the degree of hybridization exhibited by a set of only about 200 oligonucleotide probes, the unique signature of each gene (si
gnature) can be used to classify cDNA from the library and determine whether the library contains multiple copies of the same gene. Such signatures can distinguish identical, similar and different cDNAs and create an inventory.

【0072】 核酸及び核酸を単離し、クローニングし、配列決定する方法は、当業者に周知
である。例えば、参照によって本明細書中に組み込まれる、Ausubelら、Current
Protocols in Molecular Biology, Vol. 1-2, John Wiley & Sons (1989);及 びSambrookら、Molecular Cloning A Laboratory Manual, 第2版、Vols. 1-3, C
old Springs Harbor Press (1989)を参照されたい。
[0072] Methods for isolating, cloning and sequencing nucleic acids and nucleic acids are well known to those skilled in the art. For example, Ausubel et al., Current, which is incorporated herein by reference.
Protocols in Molecular Biology, Vol. 1-2, John Wiley & Sons (1989); and Sambrook et al., Molecular Cloning A Laboratory Manual, 2nd edition, Vols. 1-3, C
See old Springs Harbor Press (1989).

【0073】 SBHは、当業者に知られている多数の方法によって実施され得る非常に発達し た技術である。特に、以下の文献のハイブリダイゼーションによる配列決定に関
連する技術は、参照によって本明細書中に組み込まれる:Drmanacら、1993年4月
13日発行の米国特許第5,202,231号(これによって参照によって本明細書に組み 込まれる);Drmanacら、Genomics, 4, 114-128 (1989),Drmanacら、Proceeding
s of the First Int'l. Conf. Electrophoresis Supercomputing Human Genome,
Cantorら編集、World Scientific Pub. Co., Singapore, 47-59 (1991);Drman
acら、Science, 260, 1649-1652 (1993);Lehrachら、Genome Analysis: Geneti
c and Physical Mapping, 1, 39-81 (1990), Cold Spring Harbor Laboratory P
ress;Drmanacら、Nucl. Acids Res., 4691 (1986);Stevanovicら、Gene, 79 1
39 (1989);Panuskuら、Mol. Biol. Evol., 1, 607 (1990);Nizeticら、Nucl.
Acids Res., 19 182 (1991);Drmanacら、J. Biomol. Struct. Dyn., 5, 1085 (
1991);Hoheiselら、Mol. Gen., 4, 125-132 (1991);Strezoskaら、Proc. Nat'
l. Acad. Sci. (USA), 88, 10089 (1991);Drmanacら、Nucl. Acids Res., 19,
5839 (1991);及びDrmanacら、Int. J. Genome Res., 1, 59-79 (1992)。
[0073] SBH is a highly developed technology that can be implemented by a number of methods known to those skilled in the art. In particular, techniques related to sequencing by hybridization in the following references are incorporated herein by reference: Drmanac et al., April 1993.
U.S. Patent No. 5,202,231, issued 13th, which is hereby incorporated by reference; Drmanac et al., Genomics, 4, 114-128 (1989), Drmanac et al., Proceeding.
s of the First Int'l.Conf.Electrophoresis Supercomputing Human Genome,
Edited by Cantor et al., World Scientific Pub. Co., Singapore, 47-59 (1991); Drman
ac et al., Science, 260, 1649-1652 (1993); Lehrach et al., Genome Analysis: Geneti.
c and Physical Mapping, 1, 39-81 (1990), Cold Spring Harbor Laboratory P
ress; Drmanac et al., Nucl. Acids Res., 4691 (1986); Stevanovic et al., Gene, 79 1
39 (1989); Panusku et al., Mol. Biol. Evol., 1, 607 (1990); Nizetic et al., Nucl.
Acids Res., 19 182 (1991); Drmanac et al., J. Biomol. Struct. Dyn., 5, 1085 (
1991); Hoheisel et al., Mol. Gen., 4, 125-132 (1991); Strezoska et al., Proc. Nat '.
l. Acad. Sci. (USA), 88, 10089 (1991); Drmanac et al., Nucl. Acids Res., 19,
5839 (1991); and Drmanac et al., Int. J. Genome Res., 1, 59-79 (1992).

【0074】 本発明を以下の実施例で説明する。本明細書の開示を考慮すれば、当業者であ
れば、本発明の範囲内で、多くの他の実施態様及びバリエーションを為すことが
できることを認識するであろう。従って、本発明のより広い側面は以下の実施例
の開示に限定されることは意図されていない。
The present invention is described in the following examples. In view of the disclosure herein, one skilled in the art will recognize that many other embodiments and variations can be made within the scope of the present invention. Therefore, the broader aspects of the present invention are not intended to be limited to the disclosure of the following examples.

【0075】実施例1 プローブセットの調製 2タイプのプローブの普遍的セットが調製できる。第1は比較的短いプローブ の完全セット(又は少なくとも非相補的サブセット)、例えば、全4096個(又は
約2000個の非相補的)の6-mer、又は全16,384個(又は約8,000個の非相補的)の
7-merである。全非相補的8-merサブセット及びより長いプローブは、それらが32
,000個以上のプローブを含むためより便利ではない。
Example 1 Preparation of a Probe Set A universal set of two types of probes can be prepared. The first is a complete set (or at least a non-complementary subset) of relatively short probes, such as a total of 4096 (or about 2000 non-complementary) 6-mers, or a total of 16,384 (or about 8,000 non-complementary). Complementary)
7-mer. All non-complementary 8-mer subsets and longer probes have 32
Less convenient because it contains more than 2,000 probes.

【0076】 第2タイプのプローブセットは、少なくとも1個のプローブによる任意の配列 のいずれのbp(塩基対)をも読み出す(reading)のに依然十分なプローブの小 さなサブセットとして選択される。例えば、16個の2-merのうちの12個で十分で
ある。二本鎖DNAの配列決定のための7-mer、8-mer及び9-merの小さなサブセット
は、それぞれ約3,000個、10,000個及び30,000個のプローブであり得る。
[0076] The second type of probe set is selected as a small subset of probes that is still sufficient to read any bp (base pairs) of any sequence by at least one probe. For example, 12 out of 16 2-mers are sufficient. A small subset of 7-mers, 8-mers and 9-mers for sequencing double-stranded DNA can be about 3,000, 10,000 and 30,000 probes, respectively.

【0077】 プローブセットはまた、既知配列の標的核酸を同定、及び/又は既知配列によ
る標的核酸の対立遺伝子又は突然変異体を同定するために選択することもできる
。そのようなプローブセットは、標的核酸のいずれのヌクレオチド位置も少なく
とも1度読み出されるように、十分なプローブを含んでいる。対立遺伝子又は突
然変異体は、「プラス(positive)」プローブの1つの結合が失われることによ
って同定される。これらの対立遺伝子又は突然変異体の特定配列は、次いで標的
核酸と、これらのプローブ位置でのいずれかの可能なヌクレオチド交換及び交換
の組み合わせを含む、プローブセットとのインターロゲーション(interrogatin
g)によって決定される。
[0077] Probe sets can also be selected to identify target nucleic acids of known sequence and / or to identify alleles or mutants of the target nucleic acid with known sequences. Such a probe set contains sufficient probes so that any nucleotide position of the target nucleic acid is read at least once. Alleles or mutants are identified by the loss of binding of one of the "positive" probes. The specific sequences of these alleles or mutants are then interrogated with the target nucleic acid and probe sets, including any possible nucleotide exchanges and combinations of exchanges at these probe positions.
g).

【0078】 プローブセットはまた、50個のプローブからプローブの普遍的セット(特定長
の全プローブ)までで構成されることができ、より好ましくはセットは、100-50
0個のプローブから構成され、最も好ましい実施態様では、プローブセットは300
個のプローブを含む。好ましい実施態様では、プローブセットは6〜9個の長さの
ヌクレオチドであり、cDNAクローンを類似又は同一配列のグループに集める(cl
uster)のに使用され、単一の代表クローンは配列決定のための各グループから 選択できる。
The probe set can also consist of from 50 probes to a universal set of probes (all probes of a specific length), more preferably the set is 100-50
Consisting of zero probes, in a most preferred embodiment, the probe set is 300
Probes. In a preferred embodiment, the probe set is 6-9 nucleotides in length, and the cDNA clones are assembled into groups of similar or identical sequences (cl
a single representative clone can be selected from each group for sequencing.

【0079】 プローブは、1〜3個の非特定の(混合されたA、T、C及びG)又は末端の普遍的
な(例えば、M塩基又はイノシン)塩基による標準化学法を用いて調製できる。 放射標識が用いられるならば、プローブは放射標識されたリン酸基による基質活
性化(kinasing)のために5'末端にOH基を有することができる。あるいは、任意
の互換性のあるシステム、例えば蛍光染料などによって標識されたプローブを用
いることができる。プローブの他のタイプ、例えばPNA(タンパク質核酸)、又 は二本鎖安定性を変化させる修飾塩基を含むプローブも使用できる。
Probes can be prepared using standard chemistry with 1-3 non-specific (mixed A, T, C and G) or terminal universal (eg, M base or inosine) bases. . If a radiolabel is used, the probe can have an OH group at the 5 'end for substrate kinasing by the radiolabeled phosphate group. Alternatively, any compatible system can be used, such as a probe labeled with a fluorescent dye or the like. Other types of probes may also be used, such as PNAs (protein nucleic acids), or probes containing modified bases that alter duplex stability.

【0080】 プローブはバーコードの付された多数ウエルプレートに貯蔵できる。少数のプ
ローブには、96−ウエルプレートを使用でき、10,000個以上のプローブには、38
4-又は864−ウエルプレートでの貯蔵が好ましい。5〜50プレートの積み重ねで、
全プローブを貯蔵するのに十分である。およそ5 pgのプローブで、1つのDNAサ ンプルでのハイブリダイゼーションに十分であり得る。このように、プローブ当
たり約50 mgの小さな合成から、1,000万個のサンプルが分析できる。各プローブ
がいつも第3サンプルに使用され、各サンプルが長さ1000 bpであるなら、その ときは、300億個を越える塩基(10人のヒトのゲノム)が、5,000個のプローブセ
ットによって配列決定され得る。
The probes can be stored in multiple well plates with bar codes. For a small number of probes, a 96-well plate can be used; for 10,000 or more probes, 38
Storage in 4- or 864-well plates is preferred. With a stack of 5-50 plates,
Enough to store all probes. Approximately 5 pg of probe may be sufficient for hybridization with one DNA sample. Thus, from a small synthesis of about 50 mg per probe, 10 million samples can be analyzed. If each probe is always used for a third sample and each sample is 1000 bp in length, then more than 30 billion bases (10 human genomes) are sequenced with 5,000 probe sets. Can be done.

【0081】実施例2 修飾されたオリゴヌクレオチドを有するプローブ 修飾オリゴヌクレオチドは、それに適切な条件下にハイブリダイゼーションプ
ローブ中に導入され、使用され得る。例えば、C5−位にハロゲンを有するピリミ
ジン類は、塩基積み重ね(stack)に影響を及ぼすことにより二本鎖安定性を改 善するのに使用できる。2,6−ジアミノプリンは、チミンとの塩基の対合の第3 水素結合を提供するのに使用でき、それによってDNA2本鎖を熱的に安定化させ ることができる。2,5−ジアミノプリンの使用は2本鎖安定性を増加させ、アニ ーリングのよりストリンジェントな条件を可能にし、それによって2本鎖形成の
特異性を改善し、バックグラウンドの問題を抑え、より短いオリゴマーの使用を
可能にする。
Example 2 Probes Having Modified Oligonucleotides A modified oligonucleotide can be introduced into a hybridization probe and used under appropriate conditions. For example, C 5 - pyrimidines having a halogen in position, the duplex stability by affecting the base stack (stack) can be used to improve. 2,6-Diaminopurine can be used to provide a tertiary hydrogen bond for base pairing with thymine, thereby thermally stabilizing the DNA duplex. The use of 2,5-diaminopurine increases duplex stability and allows for more stringent conditions of annealing, thereby improving the specificity of duplex formation and reducing background problems, Allows for the use of shorter oligomers.

【0082】 これらの修飾ヌクレオチド類の3リン酸化体の合成は、Hoheisel & Lehrach (1
990)によって開示されている。
The synthesis of tri-phosphorylated forms of these modified nucleotides is described in Hoheisel & Lehrach (1
990).

【0083】 Nicholsら(1994)によってデザインされた、非識別性(non-discriminatory) 塩基アナログ、又は普遍的塩基も使用できる。この新規なアナログ、1−(2−デ
オキシ−D−リボフラノシル)−3−ニトロピロール(Mと呼ぶ)は、遺伝子コー ドの縮重の結果として起きるか、又は断片化されたペプチド配列データのみしか
利用できない場合のデザインの問題を解消するためにオリゴヌクレオチドプロー
ブ及びプライマー中で用いるために作り出された。このアナログは、積み重ねを
最大化する一方、DNA2本鎖を立体的に(sterically)崩壊させることなく、水 素結合相互作用を最小化する。
[0083] Non-discriminatory base analogs, or universal bases, designed by Nichols et al. (1994) can also be used. This new analog, 1- (2-deoxy-D-ribofuranosyl) -3-nitropyrrole (referred to as M), results from the degeneracy of the gene code or only fragmented peptide sequence data. Created for use in oligonucleotide probes and primers to eliminate design issues when not available. This analog maximizes stacking while minimizing hydrogen binding interactions without sterically disrupting the DNA duplex.

【0084】 Mヌクレオシドアナログは、ヘテロ芳香環に結合した中性極性置換基を用いて 積み重ね相互作用を最小化するようにデザインされ、鎖内及び鎖間の積み重ね相
互作用を高めて塩基の対合の水素結合の役割を小さくした。Nicholsら(1994)は 、その誘導体が2本鎖DNAの最小の既知挿入物の1つである、p−ニトロアニリン
との構造的及び電子的類似性故に3−ニトロピロール 2−デオキシリボヌクレオ
シドを奨励した。
The M nucleoside analogs are designed to minimize stacking interactions using neutral polar substituents attached to the heteroaromatic ring to enhance intrachain and interchain stacking interactions to enhance base pairing. Reduced the role of hydrogen bonding. (1994) encouraged 3-nitropyrrole 2-deoxyribonucleoside because of its structural and electronic similarity to p-nitroaniline, a derivative of which is one of the smallest known inserts of double-stranded DNA. did.

【0085】 ヌクレオシドMのジメトキシトリチル保護されたホスホロアミダイトはまた、 配列決定及びポリメラーゼ連鎖反応(PCR)のためのプライマーとして用いられ るヌクレオチド中に組み入れるのにも利用できる。Nicholsら(1994)は、相当な 数のヌクレオチドが、プライマーの特異性を低下させることなく、Mによって置 換できることを示した。The dimethoxytrityl protected phosphoramidites of nucleoside M can also be used to incorporate into nucleotides used as primers for sequencing and polymerase chain reaction (PCR). Nichols et al. (1994) have shown that a significant number of nucleotides can be replaced by M without reducing the specificity of the primer.

【0086】 Mのユニークな特性は、連続したヌクレオシドの長い糸(strings)を置換し、
また、機能的配列決定用プライマーを産出するその能力である。3、6及び9個のM
置換を有する配列は、全て読み出し可能な(readable)配列決定用ラダー(ladd
ers)を与えると報告されており、3個の異なるM−含有プライマーによるPCRは、
全て、正しい産物の増幅をもたらした(Nicholsら、1994)。
The unique property of M is that it replaces long strings of contiguous nucleosides,
Also, its ability to generate functional sequencing primers. 3, 6 and 9 M
Sequences with substitutions are all readable sequencing ladders (ladd
ers), and PCR with three different M-containing primers
All resulted in the amplification of the correct product (Nichols et al., 1994).

【0087】 3−ニトロピロール含有オリゴヌクレオチドのプライマーとして機能する能力 は、2本鎖構造が、相補的な鎖によって形成されているに違いないことを強く示
唆する。オリゴヌクレオチド対d(5−C2−T5XT5G2−3)及びd(5−C2A5YA5G2−3
)(ここで、X及びYは、A、C、G、T又はMであり得る)に対して得られる視覚的 な(optical)熱プロフィールは、DNA2本鎖から1本鎖への転移に対して観察さ れる正常なS字パターンと一致することが報告された。XM塩基対(ここで、Xは、
A、C、G又はTであり、YはMである)を含むオリゴヌクレオチドのTm値は、全て、
3℃の範囲内に入ることが報告された(Nicholsら、1994)。
The ability of the 3-nitropyrrole-containing oligonucleotide to function as a primer strongly suggests that the double-stranded structure must be formed by complementary strands. Oligonucleotide pair d (5-C 2 -T 5 XT 5 G 2 -3) and d (5-C 2 A 5 YA 5 G 2 -3
) (Where X and Y can be A, C, G, T or M), the optical thermal profile obtained for DNA double-stranded to single-stranded transitions Was reported to be consistent with the normal sigmoid pattern observed. XM base pairs (where X is
A, C, G, or T, and Y is M).
It was reported to fall within the 3 ° C. range (Nichols et al., 1994).

【0088】実施例3 プローブの選択及び標識付け サブアレイのアレイが作製されると、各ハイブリダイゼーションサイクル中で
各サブアレイにハイブリダイズされるプローブセットが規定される。例えば、38
4個のプローブセットは、普遍的セットから選択でき、96のプロービングを各4サ
イクルで行うことができる。1つのサイクル中でハイブリダイズされるように選
択されたプローブは、好ましくは類似のG+C含量を有する。
Example 3 Probe Selection and Labeling Once an array of subarrays has been created, a set of probes to be hybridized to each subarray during each hybridization cycle is defined. For example, 38
Four probe sets can be selected from the universal set, and 96 probings can be performed in each of four cycles. Probes selected to hybridize in one cycle preferably have similar G + C content.

【0089】 各サイクルのために選択されたプローブを96ウエルプレートに移し、次いで貯
蔵される前にそれらが(例えば、安定な蛍光染料によって)標識されていないな
ら、キナージング(kinasing)によって標識するか、又は、他の標識手順によっ
て標識する。
Transfer the probes selected for each cycle to a 96-well plate and then label them by kinasing if they have not been labeled (eg, with a stable fluorescent dye) before storage. Or by other labeling procedures.

【0090】 ハイブリダイゼーションの第1ラウンドに基づいて、新たなプローブセットが
、さらなるサイクルのための各サブアレイに対して規定できる。一部のアレイは
、幾つかのサイクルで使用できない。例えば、64の患者サンプルのうちたった8 つしか突然変異を示さず、8個のプローブが各突然変異に対して最初に評価され るならば、そのときは、64全てのプローブが1つのサイクルで評価され、32のサ
ブアレイは使用しない。これらの未使用のサブアレイは、フィルターの乾燥を防
ぐためハイブリダイゼーションバッファーで処理してもよい。
Based on the first round of hybridization, a new set of probes can be defined for each subarray for further cycles. Some arrays cannot be used in some cycles. For example, if only eight out of 64 patient samples show mutations and eight probes are evaluated initially for each mutation, then all 64 probes will be in one cycle. Evaluated, 32 subarrays not used. These unused subarrays may be treated with a hybridization buffer to prevent the filters from drying out.

【0091】 プローブは、貯蔵プレートから任意の便利なアプローチ、例えば単一チャンネ
ルピペッティング装置、又はロボットステーション、例えばBeckman Biomek 100
0(Beckman Instruments, Fullerton, California)又はMega Twoロボット(Meg
amation, Lawrencevill, New Jersey)、などによって回収できる。ロボットス テーションは、データ分析プログラム及びプローブ管理プログラムによって統合
され得る。これらのプログラムのアウトプットは、1つ以上のロボットステーシ
ョンにインプットされ得る。
Probes can be prepared from the storage plate by any convenient approach, such as a single channel pipetting device, or a robotic station such as the Beckman Biomek 100
0 (Beckman Instruments, Fullerton, California) or Mega Two Robot (Meg
amation, Lawrencevill, New Jersey). The robot station can be integrated with a data analysis program and a probe management program. The output of these programs can be input to one or more robot stations.

【0092】 プローブは、1つずつ回収され、ハイブリダイゼーションバッファーによって
被覆されているサブアレイに添加することができる。好ましくは、回収プローブ
が新たなプレートに配置され、標識されるか又はハイブリダイゼーションバッフ
ァーと混合される。好ましい回収方法は、貯蔵プレート1つずつにアクセスして
、十分な量のそれぞれ各プレートから選択されたプローブを中継プレート中の特
定ウエルにピペッティングする(又は金属ピンによって移す)ことによる。個々
にアドレス指定可能なピペット又はピンからなるアレイは、回収工程をスピード
アップするのに使用できる。
The probes can be collected one by one and added to a subarray covered by a hybridization buffer. Preferably, the collection probe is placed on a new plate, labeled or mixed with a hybridization buffer. A preferred method of recovery is by accessing one storage plate at a time and pipetting (or transferring by metal pins) a sufficient amount of each selected probe from each plate to a particular well in the relay plate. Arrays of individually addressable pipettes or pins can be used to speed up the collection process.

【0093】実施例4 標識プローブの製造 オリゴヌクレオチドプローブは、自動合成によって製造でき、そしてそれは当
業者にとって日常のことであり、例えば、Applied Biosystemsのシステムを使用
する。あるいは、プローブは、多孔性テフロン(Teflon)ウエーハの積層を用い
るGenosys Biotechnologies Inc.法を用いて製造できる。
Example 4 Preparation of Labeled Probes Oligonucleotide probes can be prepared by automated synthesis, and are routine for those skilled in the art, for example, using the system of Applied Biosystems. Alternatively, probes can be manufactured using the Genosys Biotechnologies Inc. method using a stack of porous Teflon wafers.

【0094】 オリゴヌクレオチドプローブは、例えば、100-200 μm又は100-400 μmスポッ
トを有するアレイに対して放射性標識(35S、32Pであり、好ましくは33P);非 放射性同位体(Jacobsenら、1990);又は発蛍光団(Brumbaughら、1988)によ って標識できる。全てのそのような標識方法は、Sambrookら(1989)中の適切な セクションによって及びSchubertら(1990)、Murakamiら(1991)及びCateら(1991
)などのさらなる文献によって例示されるように、当業界で日常的であり、そし てこれらの全ての文献は参照によって本明細書中に特定的に組み込まれる。
Oligonucleotide probes can be radiolabeled (eg, 35 S, 32 P, preferably 33 P) for arrays with 100-200 μm or 100-400 μm spots; non-radioactive isotopes (Jacobsen et al.). , 1990); or a fluorophore (Brumbaugh et al., 1988). All such labeling methods are described by the appropriate sections in Sambrook et al. (1989) and by Schubert et al. (1990), Murakami et al. (1991) and Cate et al. (1991).
) Are routine in the art, as exemplified by additional references such as) and all of these references are specifically incorporated herein by reference.

【0095】 放射性標識付けに関して、普通の方法は、T4ポリヌクレオチドキナーゼを用い
る末端標識化又はKlenow又はT7ポリメラーゼを用いる高比放射能標識化である。
これらを以下に説明する。
For radiolabeling, common methods are end labeling using T4 polynucleotide kinase or high specificity radiolabeling using Klenow or T7 polymerase.
These are described below.

【0096】 合成オリゴヌクレオチドは、それらの5'末端にリン酸基を含まないで合成され
、それ故、酵素バクテリオファージT4ポリヌクレオチドキナーゼを用いる[-32P]
ATP又は[-33P]ATPからの-32P又は-33Pの転移によって容易に標識される。反応が
効率的に行われるならば、そのようなプローブの比放射能は、その[-32P]ATP又 は[-33P]ATPそれ自身の比放射能と同じくらい高くなり得る。下記反応は、10 pm
oleのオリゴヌクレオチドを高い比放射能で標識するためにデザインされる。異 なる量のオリゴヌクレオチドの標識化は、反応サイズを増加又は減少して、全て
の構成要素の濃度を一定に維持することによって容易に達成できる。
Synthetic oligonucleotides are synthesized without a phosphate group at their 5 ′ end, and therefore use the enzyme bacteriophage T4 polynucleotide kinase [ -32 P].
ATP or [- 33 P] from ATP - 32 P or - 33 are easily labeled by transfer of P. Provided that the reaction is carried out efficiently, the specific activity of such probes, the [- 32 P] ATP or [- 33 P] can be as high as ATP itself specific activity. The following reaction is 10 pm
Designed to label ole oligonucleotides with high specific activity. Labeling of different amounts of oligonucleotide can be easily achieved by increasing or decreasing the size of the reaction and keeping the concentration of all components constant.

【0097】 反応混合物は、10μlのオリゴヌクレオチド(10 pmole/μl);2.0μlの10× バクテリオファージT4ポリヌクレオチドキナーゼバッファー;5.0μlの[-32P]AT
P又は[-33P]ATP(比放射能5000 Ci/mmole;水溶液中10 mCi/ml)(10 pmole);
及び11.4μlの水を用いて作られるであろう。8単位(約1μl)のバクテリオファ ージT4ポリヌクレオチドキナーゼを、反応混合物に添加し、37℃で45分間インキ
ュベートする。反応物を68℃で10分間加熱し、バクテリオファージT4ポリヌクレ
オチドキナーゼを不活性化する。
[0097] The reaction mixture, 10 [mu] l of the oligonucleotide (10 pmole / μl); 10 × bacteriophage T4 polynucleotide kinase buffer 2.0 .mu.l; of 5.0μl [- 32 P] AT
P or [- 33 P] ATP (specific activity 5000 Ci / mmole; 10 mCi / ml in aqueous solution) (10 pmole);
And 11.4 μl of water. Eight units (about 1 μl) of bacteriophage T4 polynucleotide kinase are added to the reaction mixture and incubated at 37 ° C. for 45 minutes. The reaction is heated at 68 ° C. for 10 minutes to inactivate bacteriophage T4 polynucleotide kinase.

【0098】 32P又は33Pのオリゴヌクレオチドへの転移効率及びその比放射能を次いで測定
する。プローブの比放射能が許容可能であれば、それを精製する。比放射能が低
すぎるなら、追加の8単位の酵素を添加し、酵素を不活性化するために反応物を6
8℃で10分間加熱する前に、さらに37℃で30分間インキュベートする。
The transfer efficiency of 32 P or 33 P to the oligonucleotide and its specific activity are then determined. If the specific activity of the probe is acceptable, purify it. If the specific activity is too low, add an additional 8 units of enzyme and add 6 reactants to inactivate the enzyme.
Incubate at 37 ° C for another 30 minutes before heating at 8 ° C for 10 minutes.

【0099】 放射標識オリゴヌクレオチドの精製は、例えば、エタノールによる沈殿;臭化
セチルピリジニウムによる沈殿;バイオ−ゲルP-60によるクロマトグラフィー;
若しくはSep-Pak C18カラムでのクロマトグラフィー、又はポリアクリルアミド ゲル電気泳動によって達成できる。
Purification of the radiolabeled oligonucleotide includes, for example, precipitation with ethanol; precipitation with cetylpyridinium bromide; chromatography on Bio-Gel P-60;
Alternatively, it can be achieved by chromatography on a Sep-Pak C18 column, or by polyacrylamide gel electrophoresis.

【0100】 より高い比放射能を有するプローブは、大腸菌DNAポリメラーゼIのKlenow断片
を用いて合成オリゴヌクレオチドに相補的なDNA鎖を合成することによって得ら れる。短いプライマーを、配列が所望の放射標識プローブの相補体(complement
)であるオリゴヌクレオチド鋳型にハイブリダイズさせる。そして、プライマー
を、大腸菌DNAポリメラーゼIのKlenow断片を用いて鋳型指令法(template-direc
ted manner)で[-32P]dNTP又は[-33P]dNTPを導入することによって伸長する。反
応後、鋳型及び生成物を、変性し、変性条件下でのポリアクリルアミドゲルによ
る電気泳動によって分離する。この方法によれば、オリゴヌクレオチド分子当た
り幾つかの放射活性原子を含むオリゴヌクレオチドプローブを作製することが可
能である。
Probes with higher specific radioactivity are obtained by using the Klenow fragment of E. coli DNA polymerase I to synthesize a DNA strand complementary to the synthetic oligonucleotide. A short primer is used to complement the radiolabeled probe whose sequence is desired.
) Is hybridized to the oligonucleotide template. Then, the primer was used as a template-directing method (template-direc) using the Klenow fragment of E. coli DNA polymerase I.
In ted manner) [- 32 P] dNTP or [- 33 P] extended by introducing dNTPs. After the reaction, the template and the product are denatured and separated by electrophoresis on a polyacrylamide gel under denaturing conditions. According to this method, it is possible to produce an oligonucleotide probe containing several radioactive atoms per oligonucleotide molecule.

【0101】 この方法を利用するには、所望の比放射能を達成し、全ての鋳型鎖の合成を完
了させるのに十分な計算量の[a-32P]dNTP又は[a-33P]dNTPを、微小遠心管中で混
合する。次いで、この管に適当量のプライマー及び鋳型DNAを、プライマーを鋳 型よりも3〜10倍モル過剰にして添加する。
To utilize this method, a sufficient amount of [a- 32 P] dNTP or [a- 33 P] is used to achieve the desired specific activity and complete the synthesis of all template strands. The dNTPs are mixed in a microcentrifuge tube. Then, appropriate amounts of primer and template DNA are added to the tube in a 3 to 10-fold molar excess of the primer over the mold.

【0102】 次いで、0.1倍容量の10×Klenowバッファーを添加し、よく混合する。次に、2
-4単位の大腸菌DNAポリメラーゼIのKlenow断片を反応容量5μlごとに添加し、混
合し、4℃で2-3時間インキュベートする。所望ならば、反応の進行を、少量の(
0.1μl)アリコートを取り出し、10%トリクロロ酢酸(TCA)によって沈殿可能に
なる放射活性の割合を測定することによってモニターできる。
Next, 0.1 volume of 10 × Klenow buffer is added and mixed well. Then, 2
Add -4 units of the Klenow fragment of E. coli DNA polymerase I in 5 μl reaction volumes, mix and incubate at 4 ° C. for 2-3 hours. If desired, the progress of the reaction is monitored by a small amount of (
0.1 μl) aliquots can be removed and monitored by measuring the percentage of radioactivity that can be precipitated by 10% trichloroacetic acid (TCA).

【0103】 反応物は、ゲルローディング(gel-loading)バッファーの等容量によって希 釈し、80℃へ3分間加熱し、次いで全サンプルを変性ポリアクリルアミドゲル上 にローディングする。電気泳動に続き、ゲルをオートラジオグラフィーにかけ、
プローブを局在化し、ゲルから除去する。蛍光プローブ標識付けの多様な方法も
また利用でき、例えば、Brumbaughら(1988)は、蛍光的に標識されたプライマー の合成を記載している。C-5位に結合している12個の原子からなる第1アミンの 「リンカーアーム(linker arm)」を有するデオキシウリジン類似体を合成する
。類似体の合成は、有機金属中間体を介して2−デオキシウリジンを誘導して5- (メチルプロペニル)-2-デオキシウリジンを得ることからなる。塩化ジメトキ シトリチル生成物による反応は、対応する5-ジメトキシトリチル付加生成物を生
成する。このメチルエステルを加水分解し、活性化し、適切にモノアシル化され
たアルキルジアミンと反応させる。精製後、得られたリンカーアームヌクレオシ
ドを化学オリゴヌクレオチド合成に好適なヌクレオシド類似体に変換する。
The reaction is diluted with an equal volume of gel-loading buffer, heated to 80 ° C. for 3 minutes, and then the entire sample is loaded on a denaturing polyacrylamide gel. Following electrophoresis, the gel was subjected to autoradiography,
The probe is localized and removed from the gel. Various methods of fluorescent probe labeling are also available, for example, Brumbaugh et al. (1988) describe the synthesis of fluorescently labeled primers. A deoxyuridine analog is synthesized having a "linker arm" of a primary amine consisting of 12 atoms attached to the C-5 position. The synthesis of analogs consists of deriving 2-deoxyuridine via an organometallic intermediate to give 5- (methylpropenyl) -2-deoxyuridine. Reaction with the dimethoxytrityl chloride product produces the corresponding 5-dimethoxytrityl addition product. The methyl ester is hydrolyzed, activated and reacted with an appropriately monoacylated alkyl diamine. After purification, the resulting linker arm nucleoside is converted to a nucleoside analog suitable for chemical oligonucleotide synthesis.

【0104】 1又は2個のリンカーアーム塩基を含むオリゴヌクレオチドは、次いで修飾ホス
ホリダイト化学法を用いて作られる。500 mM炭酸ナトリウム(pH 9.4)25μl中 の50 nmolリンカーアームオリゴヌクレオチドの溶液に、ジメチルスルホキシド 中300 mM FITCの20μlを添加する。混合物を室温で6時間攪拌する。1×30 cmセ ファデックス(Sephadex)G-25カラムから20 mM酢酸アンモニウム(pH 6)で溶 出し、第1のUV吸収ピークの画分を合わせることによって、オリゴヌクレオチド
を遊離のFITCから分離する。
[0104] Oligonucleotides containing one or two linker arm bases are then made using modified phosphoridite chemistry. To a solution of 50 nmol linker arm oligonucleotide in 25 μl of 500 mM sodium carbonate (pH 9.4), add 20 μl of 300 mM FITC in dimethyl sulfoxide. The mixture is stirred at room temperature for 6 hours. Oligonucleotides are separated from free FITC by elution from a 1 x 30 cm Sephadex G-25 column with 20 mM ammonium acetate (pH 6) and combining the fractions of the first UV absorption peak. .

【0105】 一般に、その5'末端でのオリゴヌクレオチドの蛍光標識は、2つの工程を含む
。第1は、N−保護アミノアルキルホスホルアミダイト誘導体を、自動核酸合成 の間にオリゴヌクレオチドの5'末端に付加する。全ての保護基を除去した後、適
切な蛍光染料のNHSエステルを5'−アミノ基と一晩カップリングし、次いで逆相H
PLC又はPAGEを用いて過剰の染料から標識オリゴヌクレオチドを精製する。
In general, fluorescent labeling of an oligonucleotide at its 5 ′ end involves two steps. First, an N-protected aminoalkyl phosphoramidite derivative is added to the 5 'end of the oligonucleotide during automated nucleic acid synthesis. After removal of all protecting groups, the NHS ester of the appropriate fluorescent dye was coupled with the 5'-amino group overnight and then reversed phase H
Purify the labeled oligonucleotide from excess dye using PLC or PAGE.

【0106】 Schubertら(1990)は、フルオレセインによって標識されたオリゴヌクレオチ ドが自動DNA合成の間に製造されるのを可能にするホスホルアミダイトの合成を 報告した。[0106] Schubert et al. (1990) reported the synthesis of phosphoramidites, which allows oligonucleotides labeled with fluorescein to be produced during automated DNA synthesis.

【0107】 Murakamiらも、フルオレセイン標識オリゴヌクレオチドの製造を報告した。 Cateら(1991)は、プローブ検出を可能にする直接化学発光基質(AMPPD)との 組み合わせでアルカリホスファターゼに直接コンジュゲートされるオリゴヌクレ
オチドプローブの使用を報告している。
Murakami et al. Also reported the production of fluorescein-labeled oligonucleotides. Cate et al. (1991) report the use of oligonucleotide probes that are directly conjugated to alkaline phosphatase in combination with a direct chemiluminescent substrate (AMPPD) that allows probe detection.

【0108】 標識プローブは、合成するよりもむしろ、GENSETを含めて多様な商業的ソース
から容易に購入できるだろう。
Labeled probes will be readily available for purchase from a variety of commercial sources, including GENSET, rather than being synthesized.

【0109】 他の標識は、標識抗体に特異的に結合するメンバーとして働くことができるリ
ガンド、化学発光体、酵素、標識リガンドに対する特異的結合対メンバーとして
働くことができる抗体などを含む。広く多様な標識は、容易に利用できるイムノ
アッセイで用いられてきた。また、他の標識は、抗原、特異的な反応性を有する
基、及び電気化学的に検出可能な成分を含む。
Other labels include ligands that can serve as members that specifically bind to the labeled antibody, chemiluminescers, enzymes, antibodies that can serve as specific binding pair members for the labeled ligand, and the like. A wide variety of labels have been used in readily available immunoassays. Other labels include antigens, groups with specific reactivity, and components that are electrochemically detectable.

【0110】 一般に、エレクトロフォア質量標識(electrophore mass labels: EML)によ る核酸の標識は、例えば、Xuら、J. Chromatography 764:95-102 (1997)に記載 されている。エレクトロフォアは、電子捕獲質量分光分析(EC-MS)によって高 い感度で検出できる化合物である。EMLは、ヌクレオチドを可逆的に修飾するた めに当業界で周知の化学(例えば、周知のヌクレオチド合成化学は、分子を保護
基としてのヌクレオチドに結合するための多様な方法を教示している)を用いて
プローブに結合できる。EMLは、多様な周知の電子捕獲質量分光分析装置(例え ば、Finnigan Corporationによって販売されている装置)を用いて検出される。
さらに、EMLの検出に使用できる技術は、例えば、高速原子ボンバードメント(f
ast atomic bombardment)質量分析(例えば、Kosterら、Biomedical Environ,
Mass Spec. 14:111-116 (1987)を参照);プラズマ脱着質量分析;エレクトロス
プレー/イオンスプレー法(例えば、Fennら、J. Phys. Chem. 88:4451-59 (198
4)、国際出願第WO90/14148、Smithら、Anal. Chem. 62:882-89 (1990)を参照さ れたい);及びマトリックス補助レーザー脱着/イオン化法(Hillenkampら、"M
atorix Assisted UV-Laser Desorption/Ionization: A New Approach to Mass S
pectrometry of Large Biomolecules." Biological Mass Spectrometry (Burlin
game及びMacCloskey編集)、Elsevier Science Publishers, Amsterdam, pp. 49
-60, 1990);Huth-Fehreら、"Matrix Assisted Laser Desorption Mass Spectr
ometry of Oligodeoxythymidylic Acids", Rapid Communications in Mass Spec
trometry, 6:209-13 (1992))を含む。
In general, labeling of nucleic acids by electrophore mass labels (EML) is described, for example, in Xu et al., J. Chromatography 764: 95-102 (1997). Electrophores are compounds that can be detected with high sensitivity by electron capture mass spectrometry (EC-MS). EML is a well-known chemistry in the art for reversibly modifying nucleotides (eg, well-known nucleotide synthesis chemistry teaches a variety of methods for attaching molecules to nucleotides as protecting groups). Can be used to bind to the probe. EML is detected using a variety of well-known electron capture mass spectrometers (eg, those sold by Finnigan Corporation).
In addition, techniques that can be used to detect EML include, for example, fast atom bombardment (f
ast atomic bombardment) mass spectrometry (eg, Koster et al., Biomedical Environ,
Mass Spec. 14: 111-116 (1987)); plasma desorption mass spectrometry; electrospray / ion spray method (eg, Fenn et al., J. Phys. Chem. 88: 4451-59 (198)
4), International Application No. WO 90/14148, Smith et al., Anal. Chem. 62: 882-89 (1990)); and matrix-assisted laser desorption / ionization method (Hillenkamp et al., "M.
atorix Assisted UV-Laser Desorption / Ionization: A New Approach to Mass S
pectrometry of Large Biomolecules. "Biological Mass Spectrometry (Burlin
game and MacCloskey), Elsevier Science Publishers, Amsterdam, pp. 49
Huth-Fehre et al., "Matrix Assisted Laser Desorption Mass Spectr.
ometry of Oligodeoxythymidylic Acids ", Rapid Communications in Mass Spec
trometry, 6: 209-13 (1992)).

【0111】 好ましい実施態様では、EMLは光感受性の共有結合によってプローブに結合さ れている。EMLは、標的核酸とのハイブリダイゼーション後、レーザー又は所望 の波長の光を発する他の光源によってプローブから放出される。EMLは、次いでG
C-MS(ガスクロマトグラフ−質量分析計)又は他の適切な装置に送り込まれ、そ
の質量によって同定される。
[0111] In a preferred embodiment, the EML is linked to the probe by a light-sensitive covalent bond. After hybridization with the target nucleic acid, the EML is released from the probe by a laser or other light source that emits light of the desired wavelength. EML then G
It is sent to a C-MS (gas chromatograph-mass spectrometer) or other suitable device and identified by its mass.

【0112】実施例5 配列決定用チップ及びアレイの作製 基本的な実施例では、20×20 cmのアレイを得るために組み合わせることがで きる3×3 mmの寸法のチップを得るために50ミクロン表面に結合された6-merを使
用する。もう1つの実施例では、5×5 mmの寸法の9-merチップ(そのようなチッ
プの4000単位が30×30 cmアレイを作るのに使用される)を作る10×10ミクロン 表面に結合された9-merオリゴヌクレオチドを使用する。4,000〜16,000個のオリ
ゴチップを含むアレイは、正方形のアレイに配列される。描写されるような、プ
レート、又は管の収集物は、配列決定用キットの一部としてアレイとともにパッ
ケージすることができる。
Example 5 Preparation of Sequencing Chips and Arrays In a basic example, a 50 micron chip was used to obtain a 3 × 3 mm chip that could be combined to obtain a 20 × 20 cm array. Use a 6-mer attached to the surface. In another embodiment, a 9 × mer chip of 5 × 5 mm size (4000 units of such a chip is used to make a 30 × 30 cm array) bonded to a 10 × 10 micron surface A 9-mer oligonucleotide is used. Arrays containing 4,000 to 16,000 oligo chips are arranged in a square array. The plate or tube collection, as depicted, can be packaged with the array as part of a sequencing kit.

【0113】 アレイは、互いに物理的に又は疎水性表面によって分離できる。疎水性ストリ
ップ(strip)分離を利用するための1つの可能な方法は、QA Laboratories, Tr
onto, Canadaによって製造されたIso-Grid Microbiology Systemなどの技術を使
用することである。
The arrays can be separated from each other physically or by hydrophobic surfaces. One possible way to utilize hydrophobic strip separation is to use QA Laboratories, Tr.
using technologies such as the Iso-Grid Microbiology System manufactured by onto, Canada.

【0114】 疎水性グリッド(grid)膜フィルター(HGMF)は、それらが拡張された数値範
囲及びコロニーの自動計数というユニークな魅力(attractions)を示す場合、 約10年間分析食品微生物学で用いられてきた。1つの商業的に入手可能なグリッ
ドは、その上に1600個(40×40)の正方形のセルからなる黒色の疎水性インクグ
リッドが印刷された、ポリスルホンポリマー(Gelman Tuffryn HT-450, 0.45μ ポアサイズ)の正方形(60×60 cm)からなるQA Laboratories Ltd. (Toronto,
Canada)のISO-GRID(登録商標)である。HGMFは、吸引濾過によって細菌懸濁液 と共に予め植え付けられ、選択された(of choice)、異なる又は選択的な培地 上でインキュベートされる。
[0114] Hydrophobic grid membrane filters (HGMF) have been used in analytical food microbiology for about 10 years if they exhibit the unique attraction of extended numerical range and automatic colony counting. Was. One commercially available grid is a polysulfone polymer (Gelman Tuffryn HT-450, 0.45μ pore size) on which is printed a black hydrophobic ink grid of 1600 (40 × 40) square cells. ) Square (60 x 60 cm) QA Laboratories Ltd. (Toronto,
Canada) ISO-GRID®. HGMF is pre-inoculated with the bacterial suspension by suction filtration and incubated on a choice of different or selective media.

【0115】 微生物生育は、膜上の既知の位置及びサイズを有するグリッドセルに制限され
るので、HGMF機能は従来のプレート又は膜フィルターよりもMPN装置に類似して いる。Peterkinら(1987)は、HGMFレプリケータと共に使用する場合、これらの
HGMFがゲノムライブラリーを増やして貯蔵するのに使用できることを報告した。
1つのそのような器具は、ISO-GRIDの1600個の各セルから増殖(growth)を複製
し、作られるマスターHGMFの多くのコピーを可能にする(Peterkinら、1987)。
The HGMF function is more similar to an MPN device than a conventional plate or membrane filter because microbial growth is limited to grid cells with known locations and sizes on the membrane. Peterkin et al. (1987) suggest that when used with an HGMF replicator, these
We reported that HGMF can be used to expand and store genomic libraries.
One such device replicates the growth from each of the 1600 cells of ISO-GRID, allowing many copies of the master HGMF to be made (Peterkin et al., 1987).

【0116】 Sharpeら(1989)はまた、QA Laboratories からのISO-GRID HGMFおよび自動H
GMF計数器(MI-100インタプリタ)及びRP-100レプリケータを使用した。彼らは 、多くの微生物培養物を維持し、スクリーニングする技術を報告した。
[0116] Sharpe et al. (1989) also reported that ISO-GRID HGMF and Auto H
A GMF counter (MI-100 interpreter) and RP-100 replicator were used. They reported techniques for maintaining and screening many microbial cultures.

【0117】 Peterkin及び同僚は、疎水性グリッド膜フィルター(Peterkinら、1989)を使
用したDNAプローブのスクリーニング方法を後に報告した。これらの著者は、HGM
F上での効率のよい直接コロニーハイブリダイゼーション方法を報告した。以前 は、HGMFが上にプリントされたエポキシスルホンポリマーの低いDNA結合能のた めに、貧弱な結果しか得られなかった。しかしながら、Peterkinら(1989)は、
膜表面へのDNAの結合が、DNAに接触する前に、複製されインキュベートされたHG
MFをポリエチレンイミン、ポリカチオンによって処理することによって改善され
ることを報告した。この初期の研究は、細胞性DNA結合を使用し、本発明とは異 なる目的を有しているが、記載された方法は、フォーマット3 SBHに容易に適用 できる。
Peterkin and colleagues later reported a method for screening DNA probes using a hydrophobic grid membrane filter (Peterkin et al., 1989). These authors, HGM
An efficient direct colony hybridization method on F was reported. Previously, poor results were obtained due to the low DNA binding capacity of the epoxy sulfone polymer on which HGMF was printed. However, Peterkin et al. (1989)
HG replicated and incubated before binding of DNA to the membrane surface contacted the DNA.
It was reported that MF was improved by treating with polyethyleneimine and polycation. This early work uses cellular DNA binding and has a different purpose than the present invention, but the method described is readily applicable to format 3 SBH.

【0118】 有用な配列を迅速に同定するために、Peterkinら(1989)は、種々のクローン
由来の放射標識プラスミドDNAを使用し、製造されたHGMF上のDNAに対するその特
異性を試験した。この方法では、組換えプラスミド由来のDNAは、容易にそして 再現性をもって製造できるHGMF上の100個の微生物に対するコロニーハイブリダ イゼーションによって迅速にスクリーニングされた。
To quickly identify useful sequences, Peterkin et al. (1989) used radiolabeled plasmid DNA from various clones and tested its specificity for DNA on HGMF produced. In this method, DNA from recombinant plasmids was rapidly screened by colony hybridization to 100 microorganisms on HGMF, which can be easily and reproducibly produced.

【0119】 小さな(2-3 mm)チップを用いた操作、および数千の反応の平行実施。本発明
の解決策は、チップ及びプローブを対応するアレイ中に維持することである。1
つの実施例では、250,000個の9-merを含むチップを、中間に1 mMの溝を有する8 ×12フォーマット(96個のチップ)で整列された、8×8 mMプレート(15μM/オ
リゴヌクレオチド、Peaseら、1994)の形状のシリコンウエハー上に合成する。 プローブを、多チャンネルピペット又はピンアレイのいずれかによって、1つの
チップ上に1つのプローブを添加する。全ての4000個の6-merを評価するために は、異なるものを使用するか、又はチップアレイの1つのセットを何回も再使用
するかのいずれかによって、42のチップアレイを使用しなければならない。
Operation with small (2-3 mm) tips and parallel runs of thousands of reactions. The solution of the present invention is to keep the chips and probes in a corresponding array. 1
In one example, a chip containing 250,000 9-mers was placed in an 8 × 8 mM plate (15 μM / oligonucleotide, 15 μM / oligonucleotide, aligned in an 8 × 12 format (96 chips) with a 1 mM groove in the middle. (Pease et al., 1994). Probes are added, one probe on one chip, either by a multi-channel pipette or a pin array. To evaluate all 4000 6-mers, 42 chip arrays must be used, either using different ones or reusing one set of chip arrays many times. Must.

【0120】 上記の場合には、本出願の当初の命名法を使用すると、F=9;P=6;及びF+P=15
である。チップは、式BxNn(ここで、xは特定塩基Bの数であり;nは非特定塩基 の数であり、その結果x=4〜10であり、n=1〜4である)で示されるプローブを有 することができる。より効率的なハイブリダイゼーションを達成し、かつ任意の
支持(support)オリゴヌクレオチドの潜在的な影響を避けるためには、特定塩 基を非特定塩基で囲むことができ、従って、(N)nBx(N)mなどの式で表すことがで
きる。
In the above case, using the original nomenclature of the present application, F = 9; P = 6; and F + P = 15
It is. The chip is represented by the formula BxNn, where x is the number of specific bases B; n is the number of non-specific bases, so that x = 4-10 and n = 1-4. It can have a probe. To achieve more efficient hybridization and to avoid the potential effects of any support oligonucleotide, certain bases can be surrounded by non-specific bases, and thus (N) nBx ( N) m and the like.

【0121】 チップのもう1つの実施態様では、オリゴヌクレオチドプローブのアレイを支
持する基体は、セクションに区分されており、アレイ中の各プローブは、例えば
、疎水性材料であり得る物理的バリアーによって隣のプローブから分離されてい
る。好ましい実施態様では、物理的バリアーは、幅300μm〜30μmを有し、各物 理的バリアーの中心から隣の物理的バリアーの中心の間の距離は、少なくとも32
5μmである。
In another embodiment of the chip, the substrate supporting the array of oligonucleotide probes is partitioned into sections, each probe in the array being adjacent by a physical barrier, which can be, for example, a hydrophobic material. Are separated from the probe. In a preferred embodiment, the physical barriers have a width between 300 μm and 30 μm, and the distance between the center of each physical barrier and the center of the next physical barrier is at least 32
5 μm.

【0122】 好ましい実施態様では、疎水性材料は、基体上に配置され、適切なロボットシ
ステムに結合された、インクジェットヘッドを使用して所望の幅のバリアーを形
成する。例えば、所望の疎水性材料(例えば、溶媒が蒸発した後にバリアーを形
成する油系材料)の懸濁液又は溶液をアプライするのに適合する、微小滴液量ヘ
ッドは、アノラドガントリー(anorad gantry)システムと結合でき、適切なハ ウジング及び分配システムにはめ込むことができ、疎水性材料のグリッドは、基
体上に多数のウエルを形成する所望の基体上に適用できる。疎水性材料のグリッ
ドを形成した後、グリッド形成に使用されたが、プローブの溶液又は懸濁液をア
プライするのに適用したロボットシステムと類似のロボットシステムを使用して
、異なるプローブが各ウエル上にスポットされる(又はプローブの混合物を各ウ
エルにアプライする)。1つの実施態様では、同じロボットシステムが、疎水性
グリッド及びプローブに適用するために使用される。この実施態様では、分配シ
ステムは、疎水性グリッドがアプライされた後に水で洗い流され、次いでプロー
ブの送達のためにプライムされる(primed)。
In a preferred embodiment, the hydrophobic material is placed on a substrate and forms a barrier of a desired width using an inkjet head, coupled to a suitable robotic system. For example, a microdroplet head adapted to apply a suspension or solution of a desired hydrophobic material (eg, an oil-based material that forms a barrier after the solvent evaporates) is an anodrad gantry. A) a grid of hydrophobic material can be applied on the desired substrate to form multiple wells on the substrate, which can be combined with a suitable housing and dispensing system. After forming a grid of hydrophobic material, a different probe was placed on each well using a robotic system similar to that used for grid formation but applied to apply the solution or suspension of the probe. (Or a mixture of probes is applied to each well). In one embodiment, the same robotic system is used to apply the hydrophobic grid and probe. In this embodiment, the dispensing system is flushed with water after the hydrophobic grid has been applied and then primed for probe delivery.

【0123】実施例6 支持体結合オリゴヌクレオチドの製造 オリゴヌクレオチド、すなわち、小さな核酸セグメントは、例えば、自動オリ
ゴヌクレオチド合成装置を使用して普通に実施される、化学手段によってオリゴ
ヌクレオチドを直接合成することによって容易に製造できる。
Example 6 Preparation of Support-Bound Oligonucleotides Oligonucleotides, ie, small nucleic acid segments, are synthesized directly by chemical means, eg, by chemical means, commonly performed using, for example, an automated oligonucleotide synthesizer. Easy to manufacture.

【0124】 一般に、オリゴヌクレオチドは、適切な反応基によって支持体に結合できる。
そのような基は、当業界で周知であり、例えば、アミノ(−NH2);ヒドロキシ ル(−OH);又はカルボキシル(−CO2H)基を含む。支持体に結合されたオリゴ
ヌクレオチドは、ガラス、ポリスチレン又はテフロンなどの任意の好適な支持体
を使用した当業者に公知の任意の方法によって製造できる。1つの方法は、標準
合成装置によって合成されたオリゴヌクレオチドを正確にスポットすることであ
る。固定化は、例えば、受動吸着(passive adsorption)を使用して(Inouye &
Hondo, 1989):UV光を使用して(Nagataら、1985;Dahlenら、1987;Morriey 及びCollins、1989):若しくは塩基修飾DNAの共有結合による(Kellerら、1988
;1989);又はプローブと支持体の間のアミド基の形成による(Wallら、1995;
Chebabら、1992;及びZhangら、1991);(全ての文献は本明細書中に特定的に 組み入れられる)方法を含む多くの方法によって達成できる。
In general, oligonucleotides can be attached to a support by a suitable reactive group.
Such groups are well known in the art, for example, amino (-NH 2); containing or carboxyl (-CO 2 H) group; hydroxylation (-OH). Oligonucleotides attached to a support can be prepared by any method known to those skilled in the art using any suitable support, such as glass, polystyrene or Teflon. One method is to accurately spot oligonucleotides synthesized by a standard synthesizer. Immobilization can be performed, for example, using passive adsorption (Inouye &
Hondo, 1989): Using UV light (Nagata et al., 1985; Dahlen et al., 1987; Morriey and Collins, 1989): or by covalent attachment of base-modified DNA (Keller et al., 1988).
1989); or by formation of an amide group between the probe and the support (Wall et al., 1995;
Chebab et al., 1992; and Zhang et al., 1991); can be achieved by a number of methods, including the method of which all references are specifically incorporated herein.

【0125】 利用できるもう1つの方法は、リンカーとしての強いビオチン−ストレプトア
ビジン相互作用の使用である。例えば、Broudeら(1994)は、それらは二本鎖プ
ローブであるが、ストレプトアビジン被覆磁性ビーズ上に固定されたビオチン化
プローブの使用を報告している。ストレプトアビジン被覆ビーズは、Dynal、Osl
oから購入することができるのはもちろん、この同じ結合化学方法は、ストレプ トアビジンによる任意の表面をコーティングするのに適用できる。ビオチン化プ
ローブは、例えば、Operon Technologies(Alameda, CA)などの種々の供給源か
ら購入できる。
Another method that can be used is the use of strong biotin-streptavidin interaction as a linker. For example, Broude et al. (1994) report the use of biotinylated probes immobilized on streptavidin-coated magnetic beads, although they are double-stranded probes. Streptavidin coated beads are available from Dynal, Osl
This same conjugation chemistry, of course, can be purchased from o, but can be applied to coat any surface with streptavidin. Biotinylated probes can be purchased from various sources, such as, for example, Operon Technologies (Alameda, CA).

【0126】 Nunc Laboratories (Naperville, IL)も、使用できる好適な材料を販売してい
る。Nunc Laboratoriesは、DNAがコバリンクNH(Covalink NH)と呼ばれるミク ロウエル表面に共有結合できる方法を開発した。コバリンクNHは、さらなる共有
結合のための架橋ヘッドとして働く2級アミノ基(>NH)によってグラフト化さ
れたポリスチレン表面である。コバリンクモジュール(CovaLink Modules)は、
Nunc Laboratoriesから購入できる。DNA分子は、ホスホロアミデート結合によっ
て5'末端でコバリンクに独占的に結合でき、1 pmolを超えるDNAの固定化を可能 にする(Rasmussenら、1991)。
Nunc Laboratories (Naperville, IL) also sells suitable materials that can be used. Nunc Laboratories has developed a method by which DNA can be covalently attached to a microwell surface called Covalink NH. Kovarin NH is a polystyrene surface grafted with secondary amino groups (> NH) that serves as a crosslinking head for further covalent attachment. CovaLink Modules are
Available from Nunc Laboratories. DNA molecules can be exclusively attached to Kovarin at the 5 'end by phosphoramidate linkage, allowing immobilization of more than 1 pmol of DNA (Rasmussen et al., 1991).

【0127】 5'末端でのDNA分子の共有結合のためのコバリンクNHストリップの使用が報告 されている(Rasmussenら、1991)。この技術では、ホスホルアミダイト結合が 利用される(Chuら、1983)。単共有結合のみを使用する固定化が好ましいので 、これは有益である。ホスホルアミダイト結合は、DNAを、2 nmの長さのスペー サーアームによってポリスチレン表面上に共有的にグラフト化されるスペーサー
アームの末端に位置するコバリンクNHの2級アミノ基に結合させる。オリゴヌク レオチドをホスホルアミデート結合を介してコバリンクNHに結合させるには、オ
リゴヌクレオチド末端は5'末端リン酸基を有していなければならない。恐らく、
ビオチンが、コバリンクに共有結合され、次いでストレプトアビジンがプローブ
を結合するのに使用されることでさえ可能であろう。
The use of Kovarinc NH strips for covalent attachment of DNA molecules at the 5 'end has been reported (Rasmussen et al., 1991). This technique utilizes phosphoramidite linkages (Chu et al., 1983). This is advantageous because immobilization using only a single covalent bond is preferred. The phosphoramidite linkage attaches the DNA to the secondary amino group of Kovarin NH, which is located at the end of a spacer arm that is covalently grafted onto the polystyrene surface by a 2 nm long spacer arm. In order for the oligonucleotide to be linked to Kovarin NH via a phosphoramidate linkage, the oligonucleotide terminus must have a 5 'terminal phosphate group. perhaps,
It would even be possible for biotin to be covalently linked to Kovalin and then streptavidin used to bind the probe.

【0128】 より詳細には、結合方法は、DNAを水(7.5 ng/μl)中に溶解し、95℃で10分 間変性させ、氷の上で10分間冷却することを含む。次いで、氷冷された0.1 M 1 −メチルイミダゾール、pH 7.0(1-MeIm7)を添加して最終濃度10 mM 1-Melm7
する。次いで、ss DNA溶液を氷上に置かれたコバリンクNHストリップ上に分注す
る。
More specifically, the binding method involves dissolving the DNA in water (7.5 ng / μl), denaturing at 95 ° C. for 10 minutes, and cooling on ice for 10 minutes. Then, ice-cooled 0.1 M 1-methylimidazole, pH 7.0 (1-MeIm 7 ) is added to a final concentration of 10 mM 1-Melm 7 . The ss DNA solution is then dispensed onto Kovarink NH strips placed on ice.

【0129】 10 mM 1-Melm7中に溶解したカルボジイミド、0.2 M 1−エチル−3−(3−ジメ
チルアミノプロピル)−カルボジイミド(EDC)を新たに調製し、ウエル当たり2
5μl添加する。ストリップを50℃で5時間インキュベートする。インキュベーシ ョン後、ストリップを、例えば、ヌンク−イムノウオッシュ(Nunc-Immuno Wash
)を使用して洗浄する。すなわち、最初にウエルを3回洗浄し、次いで洗浄液で5
分間浸し、最後に3回洗浄する(ここで、洗浄液は、50℃に加熱された0.4 N NaO
H, 0.25% SDSを含む)。
A fresh preparation of carbodiimide, 0.2 M 1-ethyl-3- (3-dimethylaminopropyl) -carbodiimide (EDC), dissolved in 10 mM 1-Melm 7 , was made up to 2 per well.
Add 5 μl. Incubate the strip at 50 ° C. for 5 hours. After the incubation, the strips are for example washed with Nunc-Immuno Wash.
Wash using). That is, first wash the wells three times and then wash with
Immersion for 3 min and finally 3 washes (where the wash solution is 0.4 N NaO heated to 50 ° C)
H, including 0.25% SDS).

【0130】 本発明による使用のためのさらに好適な方法は、参照によって本明細書中に組
み入れられる、PCT特許出願第WO90/03382号(Southern及びMaskos)に記載のも のであると考えられる。支持体に結合されたオリゴヌクレオチドを製造する方法
は、共有ホスホジエステル結合によりリン酸基を介してヌクレオシド3'−試薬を
、支持体に担持されている脂肪族ヒドロキシル基に結合することを含む。次に、
オリゴヌクレオチドは、支持されたヌクレオシド上で合成され、支持体からオリ
ゴヌクレオチドが切断されない標準条件下に合成オリゴヌクレオチド鎖から保護
基を除去する。好適な試薬は、ヌクレオシドホスホルアミダイト及びヌクレオシ
ド水素ホスホレートを含む。
Further suitable methods for use according to the invention are believed to be those described in PCT Patent Application No. WO 90/03382 (Southern and Maskos), which is incorporated herein by reference. A method for producing a support-bound oligonucleotide comprises coupling a nucleoside 3'-reagent to a support-supported aliphatic hydroxyl group via a phosphate group via a covalent phosphodiester bond. next,
Oligonucleotides are synthesized on a supported nucleoside and remove protecting groups from the synthetic oligonucleotide chain under standard conditions that do not cleave the oligonucleotide from the support. Suitable reagents include nucleoside phosphoramidites and nucleoside hydrogen phosphorates.

【0131】 DNAプローブアレイの製造用のDNAプローブの作製のためのオンチップ方法(on
-chip strategy)が利用できる。例えば、アドレス指定可能なレーザー活性化光
脱保護(photodeprotection)は、参照によって本明細書中に組み込まれる、Fod
orら(1991)によって報告された、ガラス表面上での直接的なオリゴヌクレオチ
ド化学合成において利用できる。プローブはまた、Van Nessら(1991)によって
報告されたようにナイロン支持体上に固定化するか;又はDuncan及びCavalier(
1988)の方法を使用してテフロンに結合することもでき、これら全ての文献は、
本明細書中に特定的に組み入れられる。
An on-chip method for producing DNA probes for the production of DNA probe arrays (on
-chip strategy) is available. For example, addressable laser-activated photodeprotection is described in Fod, incorporated herein by reference.
(1991) can be used in direct oligonucleotide chemical synthesis on glass surfaces. Probes may also be immobilized on nylon supports as reported by Van Ness et al. (1991); or Duncan and Cavalier (
1988) can also be conjugated to Teflon using all of these references.
It is specifically incorporated herein.

【0132】 Van Nessら(1991)によって報告された、ナイロン支持体へのオリゴヌクレオ
チドの結合は、アルキル化によるナイロン表面の活性化及び塩化シアヌルによる
オリゴヌクレオチドの5'−アミンの選択的活性化を必要とする。
The binding of the oligonucleotide to the nylon support, reported by Van Ness et al. (1991), activated the nylon surface by alkylation and the selective activation of the 5'-amine of the oligonucleotide by cyanuric chloride. I need.

【0133】 支持体に結合されたオリゴヌクレオチドを製造するための1つの特別な方法は
、参照によって本明細書中に組み入れられる、Peaseら(1994)によって報告さ れた光発生(light-generated)合成を利用することである。これらの著者は、 現在の写真平版技術を使用して、固定化オリゴヌクレオチドプローブアレイ(DN
Aチップ)を作り出した。光を使用して高密度微小アレイ中のオリゴヌクレオチ ドプローブの合成を誘導するこれらの方法は、光不安定性5'−保護N−アシル-デ
オキシヌクレオシドホスホルアミダイト、表面リンカー化学及び多方面にわたる
組み合わせ合成方法を利用する。256個の空間的に規定されたオリゴヌクレオチ ドプローブのマトリックスは、この方法で作ることができ、そして本明細書記載
の有利なフォーマット3配列決定で使用できる。
One particular method for making support-bound oligonucleotides is the light-generated method reported by Pease et al. (1994), which is incorporated herein by reference. The use of composition. These authors use current photolithographic techniques to create immobilized oligonucleotide probe arrays (DN
A chip). These methods of using light to direct the synthesis of oligonucleotide probes in high-density microarrays are based on photolabile 5'-protected N-acyl-deoxynucleoside phosphoramidites, surface linker chemistry and versatile combinatorial synthesis. Take advantage of the method. A matrix of 256 spatially defined oligonucleotide probes can be made in this way and used in the advantageous Format 3 sequencing described herein.

【0134】 もちろん、上記の光活性化チップの1つなどのDNAチップを商業的供給源から 容易に購入できるだろう。この点については、Santa Clara, CA 95051のAffymet
riox及びBeckmanと連絡をとることができる。
Of course, DNA chips, such as one of the photoactivated chips described above, would be readily available from commercial sources. In this regard, see Affymet of Santa Clara, CA 95051.
You can contact riox and Beckman.

【0135】 好ましい実施態様では、本発明のプローブは、情報提供部分(標的核酸にハイ
ブリダイズし、配列情報を与える部分)、基体(固体支持体)に結合される反応
基、及びランダム化された位置(すなわち、4つの塩基のうちの幾つかがこれら の位置で見出される)を含む。好ましいプローブは、配列5'−(T)6−(N)3−(B)5 (ここで、T=チミン(固相支持体に結合する)、N=A、C、G又はT(ランダム化さ
れた位置)、及びB=プローブの5個の情報提供位置(情報提供部分)である)を 有する。最も好ましい実施態様では、プローブは、支持体に結合し、スペーサー
部分がプローブの末端又はプローブの内部で(N)3の5'側に見出される。スペーサ
ーは、炭素、珪素、酸素、硫黄、リンなどの少なくとも2つの共有結合を形成で きる原子から構成できるか、又は糖−リン酸基、アミノ酸、ペプチド、ヌクレオ
シド、ヌクレオチド、糖、炭水化物、芳香環、炭化水素環、線状及び分岐状炭化
水素などの少なくとも2つの共有結合を形成できる分子から構成できる。
In a preferred embodiment, the probes of the present invention comprise an information providing moiety (a moiety that hybridizes to a target nucleic acid and provides sequence information), a reactive group attached to a substrate (solid support), and a randomized Positions (ie, some of the four bases are found at these positions). Preferred probes have the sequence 5 ′-(T) 6- (N) 3- (B) 5 (where T = thymine (attached to the solid support), N = A, C, G or T (random) B = 5 information providing positions (information providing portions) of the probe). In a most preferred embodiment, the probe is bound to a support and the spacer moiety is found 5 'to (N) 3 at the end of the probe or within the probe. The spacer may be composed of atoms capable of forming at least two covalent bonds, such as carbon, silicon, oxygen, sulfur, and phosphorus, or may be a sugar-phosphate group, an amino acid, a peptide, a nucleoside, a nucleotide, a sugar, a carbohydrate, or an aromatic ring. , Hydrocarbon rings, linear and branched hydrocarbons and the like, which can form at least two covalent bonds.

【0136】実施例7 核酸断片の製造 配列決定されるべき核酸は、cDNA、ゲノムDNA、染色体DNA、微細切断された染
色体バンド、コスミド又はYACインサート、及びいかなる増幅工程もないmRNAを 含むRNAなどの、任意の適切な供給源から得られる。例えば、Sambrookら(1989 )は、哺乳類細胞由来の高分子量DNAの単離のための3つのプロトコールを報告し
ている(p. 9.14-9.23)。
Example 7 Production of Nucleic Acid Fragments Nucleic acids to be sequenced include cDNA, genomic DNA, chromosomal DNA, finely truncated chromosomal bands, cosmids or YAC inserts, and RNA including mRNA without any amplification steps. Obtained from any suitable source. For example, Sambrook et al. (1989) report three protocols for the isolation of high molecular weight DNA from mammalian cells (p. 9.14-9.23).

【0137】 標的核酸断片は、M13、プラスミド又はλベクター中のクローンとして製造で き、及び/又はPCR又は他の増幅方法によってゲノムDNA又はcDNAから直接に製造
できる。サンプルをマルチウエルプレート中で調製又は分注してもよい。約100-
1000 ngのDNAサンプルが最終容量2-500 mlで調製される。PCRによって製造され た標的核酸は、精製することなく、フォーマット1 SBHの基体に直接アプライで きる。標的核酸が一旦基体に固定されれば、基体を洗浄でき、又はプローブと直
接アニーリングさせることもできる。
[0137] Target nucleic acid fragments can be produced as clones in M13, plasmid or lambda vectors, and / or can be produced directly from genomic DNA or cDNA by PCR or other amplification methods. The sample may be prepared or dispensed in a multiwell plate. About 100-
A 1000 ng DNA sample is prepared in a final volume of 2-500 ml. The target nucleic acid produced by PCR can be directly applied to a format 1 SBH substrate without purification. Once the target nucleic acid is immobilized on the substrate, the substrate can be washed or can be directly annealed with the probe.

【0138】 次に、核酸は、例えば、Sambrookら(1989)の9.24-9.28に記載の制限酵素の 使用、超音波及びNaOH処理による切断を含む当業者に公知の任意の方法で断片化
されるだろう。
The nucleic acid is then fragmented by any method known to those of skill in the art, including, for example, the use of restriction enzymes as described in Sambrook et al. (1989) 9.24-9.28, sonication and NaOH treatment. right.

【0139】 Schrieferら(1990)(参照によって本明細書中に組み入れられる)によって 報告された、低圧切断も適している。この方法では、DNAサンプルは、低圧から 中圧の様々な圧力の小さなフレンチ(French)圧力セルを通過する。レバー装置
によってセルにかける低圧から中圧の圧力の制御が可能である。これらの研究の
結果は、低圧切断が超音波及び酵素的DNA断片化方法の代わりとして有用である ことを示している。
The low pressure cleavage reported by Schriefer et al. (1990), which is incorporated herein by reference, is also suitable. In this method, a DNA sample is passed through a small French pressure cell at various pressures, from low to medium. Control of low to medium pressure applied to the cell by the lever device is possible. The results of these studies indicate that low pressure cleavage is a useful alternative to ultrasonic and enzymatic DNA fragmentation methods.

【0140】 DNAの断片化に特に好適な1つの方法は、Fitzgeraldら(1992)によって報告 された、2塩基認識エンドヌクレアーゼ、CviJIを使用したものであると考えられ
る。これらの著者は、迅速な断片化及びショットガンクローニング及び配列決定
に好適であると考えられる特定サイズにDNAを断片化するためのアプローチを報 告した。本発明者は、これもまた、本配列決定技術での使用のための、ランダム
であるが比較的小さいDNA断片を作製するのに特に有用であろうと考えている。
One particularly suitable method for DNA fragmentation would be to use the two base recognition endonuclease, CviJI, reported by Fitzgerald et al. (1992). The authors reported an approach for fragmenting DNA to specific sizes that would be suitable for rapid fragmentation and shotgun cloning and sequencing. We believe that this will also be particularly useful for generating random but relatively small DNA fragments for use in the present sequencing technology.

【0141】 制限エンドヌクレアーゼCviJIは通常、GとCの間の認識配列PuGCPyを開裂して 平滑末端を残す。この酵素(CviJI**)の特異性を変化させる、典型的な反応条 件は、DNA断片の準ランダム分布を与え、小分子pUC19(2688塩基対)を形成する
。Fitzgeraldら(1992)は、高速ゲル濾過法によってサイズ分画されたpUC19のC
viJI**消化を使用して、この断片化方法のランダム性を定量的に評価し、末端修
復することなく、Lac ZマイナスM13クローニングベクターに直接連結した。76個
のクローンの配列分析は、CviJI**が、PuGCPy部位に加え、pyGCPy及びPuGCPuを 制限すること、及び新たな配列データがランダム断片化と一致する速度で蓄積さ
れることを示した。
[0141] The restriction endonuclease CviJI usually cleaves the recognition sequence PuGCPy between G and C, leaving a blunt end. Typical reaction conditions that alter the specificity of this enzyme (CviJI **) give a quasi-random distribution of DNA fragments, forming the small molecule pUC19 (2688 base pairs). Fitzgerald et al. (1992) reported that the size-fractionated pUC19 C
Using viJI ** digestion, the randomness of this fragmentation method was assessed quantitatively and ligated directly to Lac Z minus M13 cloning vector without end repair. Sequence analysis of the 76 clones showed that CviJI ** restricted pyGCPy and PuGCPu in addition to the PuGCPy site, and that new sequence data accumulated at a rate consistent with random fragmentation.

【0142】 文献中に報告されているように、超音波処理及びアガロースゲル分画と比較し
たこのアプローチの利点は、より少量のDNAを必要とすること(2-5μgに対して0
.2-0.5μg);及び工程数が少ないこと(前ライゲーション、末端修復、化学抽 出、又はアガロースゲル電気泳動及び溶出の必要がない)を含む。これらの利点
はまた、フォーマット3による配列決定のためにDNAを調製する時にも有用である
ことが提案されている。
As reported in the literature, the advantage of this approach over sonication and agarose gel fractionation is that it requires less DNA (0 to 2-5 μg).
.2-0.5 μg); and low number of steps (no need for pre-ligation, end repair, chemical extraction, or agarose gel electrophoresis and elution). These advantages have also been proposed to be useful when preparing DNA for sequencing by Format 3.

【0143】 好ましい実施態様では、核酸サンプルの「断片」は、それらが互いに連結され
得ないように調製される。そのような断片のプールは、酵素消化又は物理的切断
によって得られた断片化核酸をホスファターゼ(例えば、仔ウシ腸ホスファター
ゼ)で処理することによって得られる。あるいは、サンプル核酸の非連結断片は
、サンプル核酸によるSanger−ジデオキシシークエンシング反応中のその5'末端
にリン酸を有しない、ランダムプライマー(例えば、N5-N9、ここでN=A、G、T、
又はC)を使用して得られる。これは、標的核酸に相補的な配列を有し、ジデオ キシ残基で停止しており、他の断片に連結できない、DNA断片をもたらすだろう 。
[0143] In a preferred embodiment, "fragments" of the nucleic acid sample are prepared such that they cannot be ligated together. A pool of such fragments is obtained by treating fragmented nucleic acids obtained by enzymatic digestion or physical cleavage with a phosphatase (eg, calf intestinal phosphatase). Alternatively, a non-ligated fragment of the sample nucleic acid is a random primer (eg, N 5 -N 9 , where N = A, G , T,
Or C). This will result in a DNA fragment that has a sequence complementary to the target nucleic acid, is terminated at a dideoxy residue, and cannot be ligated to other fragments.

【0144】 核酸断片を得る方法又は製造する方法にかかわりなく、DNAを変性させて、ハ イブリダイゼーションに利用できる1本鎖断片を与えることは重要である。これ
は、DNA溶液を89-90℃で2-5分間インキュベートすることによって達成される。 次いで、溶液を、2℃まで急速に冷却し、チップと接触する前のDNA断片の再生を
防ぐ。
Regardless of the method by which the nucleic acid fragment is obtained or produced, it is important to denature the DNA to provide a single-stranded fragment that can be used for hybridization. This is achieved by incubating the DNA solution at 89-90 ° C for 2-5 minutes. The solution is then rapidly cooled to 2 ° C. to prevent regeneration of the DNA fragment before contacting the chip.

【0145】実施例8 DNAアレイの製造 アレイは、ナイロン膜などの支持体上にDNAサンプルをスポットすることによ って製造できる。スポッティングは、金属ピンのアレイ(マイクロタイタープレ
ート中のウエルのアレイに対応する位置)を使用して、ナイロン膜に約20 nlのD
NA溶液を移すことを繰り返して行うことができる。オフセット印刷によって、ウ
エルの密度よりも高いドットの密度が達成される。1〜25個のドットは、使用さ れる標識のタイプによって、1 mm2中に収容できる。幾つかの予め選択された数 の縦列及び横列でのスポッティングを避けることによって、独立サブセット(サ
ブアレイ)を形成できる。1つのサブアレイ中のサンプルは、異なる個体由来の
同じゲノム(又は同じ遺伝子)のDNAセグメントであり得るか、又は異なる、オ ーバーラップしたゲノムクローンであり得る。1つの実施例では、選択された遺
伝子セグメントは、64人の患者から増幅され得る。各患者に対して、増幅遺伝子
セグメントは、1つの96ウエルプレート中にある(全ての96ウエルが同じサンプ
ルを含む)。64人の患者のそれぞれに対するプレートが製造される。96ピン装置
を使用することによって、全てのサンプルが1つの8×12 cm膜上にスポットでき
る。サブアレイは、各患者から1つで、64のサンプルを含むことができる。96サ
ブアレイが同一である場合は、ドット間隔(span)を1 mm2とし、サブアレイ間 を1 mmの間隔とすることができる。
Example 8 Production of DNA Array An array can be produced by spotting a DNA sample on a support such as a nylon membrane. Spotting is performed using an array of metal pins (corresponding to the array of wells in a microtiter plate) to a nylon membrane with approximately 20 nl of D.
The transfer of the NA solution can be repeated. Offset printing achieves a higher dot density than the well density. 1-25 dots, depending on the type of label used, can be accommodated in 1 mm 2. By avoiding spotting in some preselected number of columns and rows, independent subsets (sub-arrays) can be formed. The samples in one subarray can be DNA segments of the same genome (or the same gene) from different individuals, or can be different, overlapping genomic clones. In one example, the selected gene segments can be amplified from 64 patients. For each patient, the amplified gene segments are in one 96-well plate (all 96 wells contain the same sample). Plates are manufactured for each of the 64 patients. By using a 96-pin device, all samples can be spotted on one 8x12 cm membrane. The subarray may contain 64 samples, one from each patient. If the 96 subarrays are identical, the dot spacing (span) can be 1 mm 2 and the spacing between subarrays can be 1 mm.

【0146】 もう1つのアプローチは、例えば、膜を覆うように成形されたプラスチックグ
リッド(グリッドはマルチウエルプレートの底に適用される膜の種類に類似する
)、又は疎水性ストリップなどの物理的スペーサーによって分割できる膜又はプ
レート(NUNC, Naperville, Illinoisから入手可能)を使用することである。固
定された物理的スペーサーは、平らなホスホル-ストレージ-スクリーン(phospho
r-storage screen)又はX線フィルムに暴露することによるイメージングには好ま
しくない。
Another approach is, for example, a physical grid such as a plastic grid molded over the membrane (the grid is similar to the type of membrane applied to the bottom of a multiwell plate), or a hydrophobic strip. Using a membrane or plate (available from NUNC, Naperville, Illinois) that can be divided by The fixed physical spacer is a flat phosphor-storage-screen (phospho
It is not preferred for imaging by exposure to r-storage screen) or X-ray film.

【0147】実施例9 ハイブリダイゼーションおよび評価過程 標識プローブを、ハイブリダイゼーション緩衝液と混合し、(好ましくは多チ ャネルピペットによって)サブアレイにピペットしてもよい。サブアレイ間のプ ローブの混合を防ぐため(疎水性の帯または物理的バリアーが膜に印されていな い場合)、プラスチック、金属またはセラミックからなる対応するグリッドを膜 に固定するように圧着してもよい。また、緩衝液の容量を1mm2あたり約1ml以 下に減らしてもよい。使用するプローブの濃度およびハイブリダイゼーション条
件は、既に記載されているようなものでよいが、洗浄用緩衝液は多数のサブアレ
イに素早く注いで、プローブの迅速な希釈を促して有意なクロスハイブリダイゼ
ーションを防ぐ。同様の理由のために、最小濃度のプローブを使用し、ハイブリ
ダイゼーション時間を実用レベルで最長の時間まで延長してもよい。DNA検出お よび配列決定のために、「通常」配列の知識により連続積み重なり相互作用現象を
使用してシグナルを増強することができる。標識プローブに加えて、標識プロー
ブと連続的にハイブリダイズする別の非標識プローブをハイブリダイゼーション
反応に加えてもよい。ハイブリッドの量は数倍に増加してもよい。プローブはラ
イゲーションにより連結してもよい。この方法は、「圧縮状態(compression)」を 形成するDNA領域を分解するのに重要となり得る。
Example 9 Hybridization and Evaluation Process Labeled probes may be mixed with hybridization buffer and pipetted into a subarray (preferably by a multichannel pipette). To prevent mixing of the probes between the subarrays (when no hydrophobic bands or physical barriers are marked on the membrane), a corresponding grid of plastic, metal or ceramic is crimped to secure the membrane to the membrane. Is also good. Further, the volume of the buffer may be reduced to about 1 ml or less per 1 mm 2 . The probe concentrations and hybridization conditions used may be as described above, but the wash buffer is quickly poured over a number of subarrays to facilitate rapid dilution of the probes and significant cross-hybridization. prevent. For similar reasons, the lowest concentration of probe may be used and the hybridization time extended to the longest at practical levels. For DNA detection and sequencing, knowledge of the "normal" sequence can enhance the signal using the phenomenon of continuous stacking interactions. In addition to the labeled probe, another unlabeled probe that continuously hybridizes with the labeled probe may be added to the hybridization reaction. The amount of hybrid may increase several times. Probes may be linked by ligation. This method can be important for breaking down DNA regions that form "compression".

【0148】 放射能標識されたプローブの場合、好ましくは蛍光ストレージ(phosphorstora
ge)技術により、フィルターの画像を得ることができる。CCDカメラ、共焦点顕微
鏡などで蛍光標識の評価ができる。異なるハイブリダイゼーション実験において
正確に評点し、データを正確にまとめるために、各ドットごとの標的量に基づい
て生シグナルを標準化する。ドットごとの標的DNAの量の差は、各プローブのシ グナルを、1つのドット上にある評価した全てのプローブの平均シグナルで割る
ことによって補正できる。標準化したシグナルを、評点(通常1〜100)して、異
なる実験のデータを比較する。また、各サブアレイにおいていくつかの対照DNA を使用して、完全に対合した標的を含まないサンプルの平均バックグラウンドシ
グナルを決定できる。二倍体(倍数体)評価により得られたサンプルには、ホモ接
合体対照を用いて、サンプル中のヘテロ接合体を認識できる。
In the case of radiolabeled probes, preferably fluorescent storage
ge) The technique makes it possible to obtain an image of the filter. Fluorescent labeling can be evaluated with a CCD camera, confocal microscope, etc. The raw signal is normalized based on the target amount for each dot in order to accurately score and summarize the data in different hybridization experiments. Differences in the amount of target DNA from dot to dot can be corrected by dividing the signal for each probe by the average signal of all probes evaluated on one dot. The normalized signal is scored (usually 1-100) to compare data from different experiments. Also, several control DNAs in each subarray can be used to determine the average background signal of a perfectly matched target-free sample. For a sample obtained by diploid (ploid) evaluation, a heterozygote in the sample can be recognized using a homozygous control.

【0149】実施例10 オリゴヌクレオチドでのハイブリダイゼーション オリゴヌクレオチドは、Genosys Inc., Houston, Texasより購入するか、また
はApplied Biosystems 381A DNA合成器により作製した。使用したプローブのほ とんどは、HPLCまたはゲル電気泳動によって精製しなかった。例えば、プローブ
は、インターフェロン中の921 bp EcoRI-BglIIヒトB1-インターフェロン断片を 含むM13クローン[OhnoおよびTaniguchi, Proc. Natl. Acad. Sci. 74:4270-4274
(1981)]中の完全に相補的な単一の標的、ならびにM13ベクター自体において末端
塩基誤対合を有する少なくとも1つの標的の両方を有するように設計した。
Example 10 Hybridization with Oligonucleotides Oligonucleotides were purchased from Genosys Inc., Houston, Texas, or prepared on an Applied Biosystems 381A DNA synthesizer. Most of the probes used were not purified by HPLC or gel electrophoresis. For example, the probe is an M13 clone containing a 921 bp EcoRI-BglII human B1-interferon fragment in interferon [Ohno and Taniguchi, Proc. Natl. Acad. Sci. 74: 4270-4274.
(1981)], as well as a single target that is completely complementary, as well as at least one target that has a terminal base mismatch in the M13 vector itself.

【0150】 オリゴヌクレオチドの末端標識は、記載されているように[Maniatisら、Molec
ular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Cold Sp
ring Harbor, New York (1982)]、T4-ポリヌクレオチドキナーゼ(5単位、Amers
ham)、γ32P-ATP(3.3pM、10mCi Amersham 3000 Ci/mM)、およびオリゴヌクレオ チド(4pM、10ng)を含む10ml中で行った。プローブの比活性は2.5-5×109 cpm/nM
であった。
End-labeling of oligonucleotides was performed as described [Maniatis et al., Molec.
ular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Cold Sp
ring Harbor, New York (1982)], T4-polynucleotide kinase (5 units, Amers
ham), γ 32 P- ATP (3.3 pM, 10 mCi Amersham 3000 Ci / mM), and oligonucleotides (4 pM, 10 ng) in 10 ml. Specific activity of the probe is 2.5 -5 × 10 9 cpm / nM
Met.

【0151】 一本鎖DNA(0.5NaOH、1.5M NaCl溶液中に2〜4ml)を、同溶液で湿らせたGene Sc
reen膜にスポットした。フィルターは0.05 M Na2HPO4(pH 6.5)で中和し、80℃に
て60分間炉で焼成し、1分間紫外線照射した。次いで、フィルターをハイブリダ イゼーション溶液(0.5M Na2HPO4(pH 7.2)、7%ナトリウムラウロイルサルコシ ン(sodium lauroyl sarcosine))中で室温にて5分間インキュベートし、プラス チック製のペトリ皿の表面に置いた。4nMの濃度の32P末端標識オリゴマープロ ーブを含むハイブリダイゼーション溶液(10ml、0.5M Na2HPO4(pH 7.2)、7%ナ トリウムラウロイルサルコシン)を1滴ずつ、フィルターごとに1〜6ドット滴 下し、正方形のポリエチレン片(約1×1cm)を被せ、湿性チャンバ中で所定の温
度にて3時間インキュベートした。フィルターを6X SSC洗浄用溶液に0℃にて3
×5分間入れて、ハイブリダイズしていないプローブを除去して、ハイブリダイ
ゼーションを停止した。フィルターを乾燥させるか、または所定の時間および温
度にてさらに洗浄するかして、オートラジオグラフィーにかけた。識別測定のた
めに、オートラジオグラフィー[蛍光画像化装置 (Molecular Dynamics, Sunnyva
le, California)が使用できる]後の乾燥フィルターからドットを切り出し、液体
シンチレーションカクテルに入れ、数を数えた。IFドットおよびM13ドットの未 補正cpm比はDとする。
Single-stranded DNA (2-4 ml in a 0.5 NaOH, 1.5 M NaCl solution) was wetted with Gene Sc
Spotted on reen membrane. The filter was neutralized with 0.05 M Na 2 HPO 4 (pH 6.5), baked in a furnace at 80 ° C. for 60 minutes, and irradiated with ultraviolet light for 1 minute. The filters were then incubated in a hybridization solution (0.5 M Na 2 HPO 4 (pH 7.2), 7% sodium lauroyl sarcosine) for 5 minutes at room temperature, and the surface of a plastic Petri dish was removed. Placed. One drop of a hybridization solution (10 ml, 0.5 M Na 2 HPO 4 (pH 7.2), 7% sodium lauroyl sarcosine) containing 4 nM concentration of 32 P-end labeled oligomer probe, 1 to 6 dots per filter The solution was dropped, covered with a square piece of polyethylene (about 1 × 1 cm), and incubated at a predetermined temperature in a humid chamber for 3 hours. Put the filter in 6X SSC washing solution at 0 ° C for 3 times.
The hybridization was stopped by removing the non-hybridized probe for 5 minutes. The filters were dried or further washed at the given times and temperatures and autoradiographed. For discrimination measurement, autoradiography [fluorescence imager (Molecular Dynamics, Sunnyva
le, California) can be used] and the dots were cut out of the dry filter afterwards, placed in a liquid scintillation cocktail, and counted. The uncorrected cpm ratio of IF dot and M13 dot is D.

【0152】 本明細書中で報告する条件は、非常に短いオリゴヌクレオチドでのハイブリダ
イゼーションが可能でかつ標的核酸に対して相補的であるために、結合する対合
オリゴヌクレオチドと誤対合オリゴヌクレオチドとの識別を確実にするようなも
のである。ハイブリッド中の完全に相補的な標的と、単一の誤対合を有する不完
全に相補的な標的との識別(D)の程度に基づく短い特異的配列のハイブリダイゼ
ーションの有効な検出に影響を及ぼす因子は定義されている。実験検査において
、膜フィルターに結合した2つのM13クローンまたはモデルオリゴヌクレオチド への、6〜8ヌクレオチドの長さの28のプローブのドットブロットハイブリダイ
ゼーションを達成した。実験過程の指針となる原理を以下に記載する。
The conditions reported herein are based on the ability to hybridize with very short oligonucleotides and to be complementary to the target nucleic acid, so that binding and mismatched oligonucleotides bind. It is like ensuring the distinction. Influence the effective detection of hybridization of short specific sequences based on the degree of discrimination (D) between perfectly complementary targets in a hybrid and incompletely complementary targets with a single mismatch. The influencing factors are defined. In experimental testing, dot blot hybridization of 28 probes, 6-8 nucleotides in length, to two M13 clones or model oligonucleotides bound to a membrane filter was achieved. The principles that guide the experimental process are described below.

【0153】 プローブ過剰条件下で、膜結合した標的核酸(プローブよりも数ヌクレオチド
長い)へのオリゴヌクレオチドハイブリダイゼーションは、標的濃度に関する疑
似一次反応である。この反応は: St/S0=e-kh[OP]t によって定義される。式中、StおよびSoは、それぞれ時間tおよびt0におけ る標的配列濃度である。(OP)はプローブ濃度であり、tは温度である。ハイブリ
ッド形成の速度定数khは、0℃〜30℃の範囲でわずかに増加する(Porschkeおよ びEigen、J.Mol.Biol. 62:361(1971); Craigら, J.Mol. Biol. 62:383 (1971)) 。ハイブリッド溶解は、以下の式で表わされるハイブリッド濃度に関する一次反
応である(膜結合状態のため質量に置き換わる): Ht/H0=e-kmt
Under probe-over conditions, oligonucleotide hybridization to a membrane-bound target nucleic acid (a few nucleotides longer than the probe) is a pseudo-primary reaction with respect to target concentration. This reaction: is defined by S t / S 0 = e -kh [OP] t. Wherein, S t and S o are the target sequence concentration that put each time t and t 0. (OP) is the probe concentration and t is the temperature. Rate constant k h hybridization is slightly increased in the range of 0 ℃ ~30 ℃ (Porschke and Eigen, J.Mol.Biol 62:.. 361 (1971); Craig et al., J. Mol Biol. 62 : 383 (1971)). Hybrid dissolution is a first order reaction for the hybrid concentration (replaced by mass due to membrane-bound state): H t / H 0 = e −kmt

【0154】 式中、HtおよびH0は、それぞれ時間tおよびt0におけるハイブリッド濃度 であり、kmは、温度および塩濃度に依存する、ハイブリッド溶解の速度定数で ある[Ikutaら、Nucl. Acids Res. 15:797(1987);PorsclikeおよびEigen、J.Mol
.Biol. 62:361(1971);Craigら、J.Mol.Biol.62:303(1971)]。鎖会合過程である ハイブリダイゼーションの間、逆反応、溶解反応、または鎖解離反応も生じる。
つまり、時間内に形成されるハイブリッドの量は、正反応および逆反応の結果と
して生じる。プローブ濃度を上げて、および/または温度を下げて、平衝をハイ ブリッド形成に向かわせることができる。しかし、大容量の緩衝液中での洗浄サ
イクルにおいては溶解反応が優性であり、プローブがないために逆反応ハイブリ
ダイゼーションは有意ではない。この分析は、作用可能な短オリゴヌクレオチド
ハイブリダイゼーション(SOH)条件要件が、プローブ濃度または温度について変 化できることを示す。
[0154] In the formula, H t and H 0 is a hybrid concentration at each time t and t 0, k m is dependent on temperature and salt concentration, which is the rate constant of the hybrid dissolution [described by Ikuta et al., Nucl. Acids Res. 15 : 797 (1987); Porsclike and Eigen, J. Mol.
Biol. 62 : 361 (1971); Craig et al., J. Mol. Biol. 62 : 303 (1971)]. During hybridization, the strand association process, reverse reactions, lysis reactions, or strand dissociation reactions also occur.
That is, the amount of hybrid formed in time results from forward and reverse reactions. Increasing the probe concentration and / or decreasing the temperature can direct the equilibrium to hybrid formation. However, in the wash cycle in large volumes of buffer, the lysis reaction is dominant and the reverse reaction hybridization is not significant due to the absence of the probe. This analysis shows that operable short oligonucleotide hybridization (SOH) condition requirements can be varied with probe concentration or temperature.

【0155】 Dあるいは識別は式4によって定義される: D=Hp(tw)/Hi(tw) Hp(tw)およびHi(tw)はそれぞれ、同量の完全相補的二重鎖および不完全相
補的二重鎖について、洗浄時間twの後に残るハイブリッドの量である。識別D は、所定の温度において、10の長さの洗浄時間に応じて変化し、式5においてH i =Bの際に最大値に到達する。
D or identification is defined by equation 4: D = Hp(tw) / Hi(tw) Hp(tw) And Hi(tw) Indicates the same amount of perfect complementary duplex and incomplete phase, respectively.
For complementary duplexes, the washing time twIs the amount of hybrid remaining after The discrimination D 1 varies at a given temperature according to a length of cleaning time of 10; i The maximum value is reached when = B.

【0156】 バックグラウンドBは、系において検出可能な最も低いハイブリダイゼーショ
ンシグナルを表わす。それ以上低下したHiは検査できない可能性があるため、 続けて洗浄するとDは増加する。twを超える洗浄は、Bに対するHpを減少させ
るのみであり、Dの減少として現れる。不完全ハイブリッドの最適洗浄時間tw は、式3および式5から: tw=-In(B/Hi(t0))/Km.i である。
Background B represents the lowest hybridization signal detectable in the system. Since the more reduced H i may not be inspected, D is increased and washed in succession. washed more than t w is only reduces the H p for B, manifested as a decrease in D. Optimum cleaning time t w incomplete hybrid, from Equation 3 and Equation 5: t w = -In (B / H i (t 0)) is / K mi.

【0157】 Hpも同じtwだけ洗浄されるため、式を組み合わせると以下の最適な識別関数
が得られる: D=eIn(B/Hi(t0))km,p/km,iXHp(t0)/B Tの関数としてのDの変化は、最適洗浄温度の選択のために重要である。これ
は、Arheniusの式: K-=Ae-Ea/RT を、先の式に代入して最終的な式: D=Hp((t0)/BX(B/Hi(t0)))(Ap/Ai)e(Ea,i-Ea,p)/RT を得る。
Since H p is also cleaned by the same t w , combining the equations yields the following optimal discriminant function: D = e In (B / Hi (t0)) km, p / km, i XH p The change in D as a function of (t 0 ) / BT is important for selecting the optimal cleaning temperature. This is obtained by substituting the Arhenius equation: K− = Ae− Ea / RT into the above equation, and obtaining the final equation: D = H p ((t 0 ) / BX (B / H i (t 0 )) ) Obtain (Ap / Ai) e (Ea, i-Ea, p) / RT .

【0158】 式中、BはHi(t0)よりも低い。Where B is lower than H i (t 0 ).

【0159】 完全ハイブリッドの活性エネルギーEa,p、および不完全ハイブリッドの活性 エネルギーEa,iは、同等またはEa,i<Ea,pのいずれかであり、従ってそれぞ れの場合においてDは温度に無関係か、または温度の上昇と共に減少する。この
結果は、SOHにおける良好な識別のためのストリンジェントな温度条件を調べる ことが不当であることを示している。低温度で洗浄すれば、同等またはより良好
な識別が得られるが、温度低下に従って洗浄時間が指数関数的に長くなる。Hp(
0)に対してHi(t0)が増える場合、識別はTと共により激しく減少する。
The activation energy E a, p of the perfect hybrid and the activation energy E a, i of the incomplete hybrid are either equal or E a, i <E a, p , and therefore in each case D is independent of temperature or decreases with increasing temperature. This result indicates that it is inappropriate to examine stringent temperature conditions for good discrimination in SOH. Washing at lower temperatures gives equivalent or better discrimination, but the washing time increases exponentially with decreasing temperature. H p (
If H i (t 0 ) increases with respect to t 0 ), the discrimination decreases more strongly with T.

【0160】 低温度におけるDは、Hp(t0)/Hi(t0)比よりもHp(t0)/B比の方により依
存する。この結果は、この工程において得られる識別とは無関係に、ハイブリダ
イゼーションにおいて十分な量のHpを得る方がより良いことを示す。洗浄によ ってより良好な識別が得られる。なぜなら完全ハイブリッドの量が多ければ、差
異溶解が効果を示すための時間がより長くなるからである。同様に、より多くの
量の標的核酸は、Km,pとKm,iとの差が小さくても、必要な識別が得られる。
D at low temperatures is more dependent on the H p (t 0 ) / B ratio than on the H p (t 0 ) / H i (t 0 ) ratio. This result is independent of the identity obtained in this step indicates that it is better to obtain a sufficient amount of H p in the hybridization. Better identification can be obtained by washing. Because the higher the amount of complete hybrid, the longer it takes for differential lysis to take effect. Similarly, higher amounts of target nucleic acid will provide the necessary discrimination even if the difference between K m, p and K m, i is small.

【0161】 この単純なモデルで扱っているものよりも複雑な状況を推定した場合、所与の
核酸標的において多くの末端誤対合を有するプローブのハイブリダイゼーション
の場合、識別を得るために低温度における洗浄がより重要となる。
When estimating situations that are more complex than those covered by this simple model, in the case of hybridization of probes with many end mismatches at a given nucleic acid target, low temperatures are required to obtain discrimination. Cleaning becomes more important.

【0162】 実験指針として記載した理論的原理を使用すると、信頼できるハイブリダイゼ
ーションは6〜8ヌクレオチドの長さのプローブで得られる。全ての実験は、フ
ィルター上にハイブリダイゼーション溶液のフィルムを張った浮遊プラスチック
シートで行った。この方法は、プローブの量を最大限に低くするため、ドットブ
ロットハイブリダイゼーションにおける標識のコストが低くなる。ホスフェート
ハイブリダイゼーション緩衝液中のナトリウムラウロイルサルフェートの代わり
に高濃度のナトリウムラウロイルサルコシンを用いると、反応を室温から12℃に
まで下げることができる。同様に、4-6×SSC、10%ナトリウムラウロイルサルコ
シン緩衝液により、2℃の低温度におけるハイブリダイゼーションが可能になる
。これらの緩衝液中の界面活性剤は、最高40nMまでの濃度の標識プローブで許容
できるバックグラウンドを得るためのものである。短オリゴヌクレオチドハイブ
リッドの熱安定性の初期特性を、50%のG+C含量を有するプロトタイプ8-mer(
即ち、配列TGCTCATGのプローブ)で決定した。理論上の予想では、このプローブ はより不安定な8-merの1つである。このプローブの遷移エンタルピーは、より
安定な7-merのそれに近く、6ヌクレオチドの長さのプローブにさえも近い(Bre
sslauerら、Proc.Natl.Acad.Sci. U.S.A. 83:3746(1986))。パラメーターTd(1
分の単位時間においてハイブリッドの50%が溶解する温度)は18℃である。結果 は、8bpのハイブリッドのTdが、11bpの二重らせんのTdよりも15℃低いことを
示す[Wallaceら、Nucleic Acids Res.6:3543(1979)]。
Using the theoretical principles described as experimental guidelines, reliable hybridization is obtained with probes 6-8 nucleotides in length. All experiments were performed on floating plastic sheets with the hybridization solution filmed on filters. This method minimizes the amount of probe, thus reducing the cost of labeling in dot blot hybridizations. Using high concentrations of sodium lauroyl sarcosine instead of sodium lauroyl sulphate in the phosphate hybridization buffer can reduce the reaction from room temperature to 12 ° C. Similarly, 4 −6 × SSC, 10% sodium lauroyl sarcosine buffer allows hybridization at a low temperature of 2 ° C. Detergents in these buffers are for obtaining acceptable background with labeled probes at concentrations up to 40 nM. The initial properties of the thermal stability of short oligonucleotide hybrids were determined by using a prototype 8-mer with a G + C content of 50% (
That is, a probe of the sequence TGCTCATG). Theoretically, this probe is one of the more unstable 8-mers. The transition enthalpy of this probe is close to that of the more stable 7-mer, even to a 6 nucleotide long probe (Bre
Sslauer et al., Proc. Natl. Acad. Sci. USA 83 : 3746 (1986)). The parameter T d (1
The temperature at which 50% of the hybrid dissolves per unit time per minute) is 18 ° C. The result is a hybrid of the T d of 8bp indicates that lower 15 ℃ than T d of the double helix of 11 bp [Wallace et al., Nucleic Acids Res 6:. 3543 (1979)].

【0163】 モデルオリゴヌクレオチドでの実験に加えて、短オリゴヌクレオチドハイブリ
ダイゼーションの実施証明用の系としてM13ベクターを選択した。主な目的は、 本発明の方法の種々の応用において使用される標的に類似した標的を用いて有用
な末端誤対合識別を示すことであった。M13モデルのためのオリゴヌクレオチド プローブは、M13ベクター自体が末端誤対合塩基を含むように選択された。ベク ターIF(921bpのヒトインターフェロン遺伝子挿入体を含むM13組換体)は、単一の
完全対合標的を担持する。従って、IFは、M13ベクター自体と比べて同数または より多数の誤対合標的を有する。
In addition to experiments with model oligonucleotides, the M13 vector was selected as a system for proving the performance of short oligonucleotide hybridizations. The primary objective was to demonstrate useful end-pair mismatch discrimination using targets similar to those used in various applications of the method of the present invention. Oligonucleotide probes for the M13 model were selected such that the M13 vector itself contained terminal mismatched bases. Vector IF (M13 recombinant containing the 921 bp human interferon gene insert) carries a single perfect-matched target. Thus, IF has the same or more mismatched targets than the M13 vector itself.

【0164】 低温度条件およびドットブロットを使用すれば、完全対合標的および誤対合標
的を含むドットと、誤対合標的のみを含むドットとの間で、ハイブリダイゼーシ
ョンシグナルの十分な差が得られる。これは、6-merオリゴヌクレオチド、なら
びに大きいIF-M13対の核酸にハイブリダイズした7-merおよび8-merオリゴヌク
レオチドについても当てはまった。
Using low temperature conditions and dot blots, a sufficient difference in hybridization signal can be obtained between dots containing perfectly matched and mismatched targets and dots containing only mismatched targets. It is. This was also true for 6-mer oligonucleotides, as well as 7-mer and 8-mer oligonucleotides that hybridized to large IF-M13 paired nucleic acids.

【0165】 ハイブリダイゼーションシグナルは、プローブと反応できる、フィルター上の
標的の量に依存する。対照は、2つのドットにおけるサイン強度の差が核酸の量
の差を反映するものでないことを示すために必要である。IFおよびM13の両方に おいて同じ数および種類の標的を有するプローブでのハイブリダイゼーションは
、ドット中に同量のDNAが存在することを示す。ハイブリッド形成の有効性はハ イブリッドの長さと共に向上するため、ヌクレオチドを6つ有する二重らせんの
シグナルは、フィルターに結合した高質量のオリゴヌクレオチド標的で最も良好
に検出できた。標的として機能する大きい分子の核酸と比べて分子量が低いオリ
ゴヌクレオチド標的分子の方がより多く所定の表面積に結合することができる。
[0165] The hybridization signal depends on the amount of target on the filter that can react with the probe. Controls are needed to show that the difference in signature strength between the two dots does not reflect the difference in the amount of nucleic acid. Hybridization with a probe having the same number and type of targets in both IF and M13 indicates that the same amount of DNA is present in the dot. Since the efficiency of hybridization increases with the length of the hybrid, the signal of a double helix with six nucleotides was best detected with a high mass oligonucleotide target bound to the filter. Oligonucleotide target molecules with lower molecular weights can bind more to a given surface area than nucleic acids of larger molecules that function as targets.

【0166】 未精製DNAでの検出の感度を測定するため、様々な量のファージ上清をフィル ター上にスポットし、32P標識8-merとハイブリダイズした。たった0.5ngのDNA を含む最小5000万の未精製ファージから検出可能なシグナルが得られ、短オリゴ
ヌクレオチドハイブリダイゼーション方法の感度が十分であることを示した。実
用面では、反応時間が短かいことを付け加える。
To determine the sensitivity of detection on unpurified DNA, various amounts of phage supernatants were spotted on filters and hybridized with 32 P-labeled 8-mers. Detectable signals were obtained from a minimum of 50 million crude phages containing only 0.5 ng of DNA, demonstrating that the short oligonucleotide hybridization method was sensitive enough. On the practical side, it adds that the reaction time is short.

【0167】 上記理論の節で記載したように、ハイブリッドの平衡収率は、プローブ濃度お
よび/または反応温度に依存する。例えば、13℃での4nM8-merでの場合、標的 のシグナルレベルは、プローブ濃度が40nMの場合の同量の標的シグナルレベルよ
りも3倍低く、ハイブリダイゼーション温度を25℃まで上昇すると4.5倍低くな る。
As described in the theory section above, the equilibrium yield of the hybrid depends on the probe concentration and / or the reaction temperature. For example, with 4 nM 8-mer at 13 ° C., the signal level of the target is 3 times lower than the same amount of target signal at 40 nM probe concentration, and 4.5 times lower when the hybridization temperature is raised to 25 ° C. Become.

【0168】 最大限の識別を得るために低温度で洗浄することは実証されている。現象を明
確に可視化するために、IFドットと比べて50倍のDNAをM13ドットに加えて、ベク
ター特異的プローブでのハイブリダイゼーションを用いた。このようにして、実
際のプローブでのハイブリダイゼーション工程後のシグナルは、対合の場合より
も誤対合の場合に強くした。Hp/Hi比は1:4であった。7℃で時間延長して 洗浄すると、完全なハイブリッドを大量に失うことなく、2:1の比でシグナル
強度の逆転を得た。逆に、25℃ではいかなる識別も得ることは不可能であった。
なぜなら、2分間の洗浄で対合標的シグナルは既にバックグラウンド値にまで下 がる一方、誤対合ハイブリッド由来のシグナルは検出可能なままであるからであ
る。13℃での識別の損失は7℃の場合と比べるとそれほど大きくはないが明らか
に目で見えるものである。7℃での90分の時点と13℃での15分の時点とを考慮す
ると、誤対合ハイブリッドシグナルが、それぞれの条件における最適洗浄時間を
表わすバックグラウンド値に近い場合、13℃よりも7℃において量が数倍多いこ
とは明白である。このことについてさらに例示するために、2つの温度における
同量の出発ハイブリッドの洗浄による時間経過に伴う識別の変化は、より低い温
度においてより高い最大Dを示す。これらの結果から、温度、および洗浄工程の
開始時点における2種のハイブリッドの量の比に応じたDの変化の傾向を確認で
きる。
Washing at low temperatures to obtain maximum discrimination has been demonstrated. To clearly visualize the phenomenon, 50 times more DNA was added to the M13 dot compared to the IF dot, and hybridization with a vector-specific probe was used. In this way, the signal after the hybridization step with the actual probe was stronger in the case of mismatch than in the case of pairing. The Hp / Hi ratio was 1: 4. Washing for an extended period of time at 7 ° C. provided a reversal of signal intensity at a 2: 1 ratio without losing large amounts of complete hybrid. Conversely, it was not possible to obtain any discrimination at 25 ° C.
This is because a two minute wash will already bring the paired target signal down to background values, while the signal from the mismatched hybrid will remain detectable. The loss of discrimination at 13 ° C. is less significant than at 7 ° C., but is clearly visible. Considering the 90 min time point at 7 ° C. and the 15 min time point at 13 ° C., if the mismatched hybrid signal is close to the background value representing the optimal wash time in each condition, it will be more than 7 ° C. It is clear that the amount is several times higher at ° C. To further illustrate this, the change in discrimination over time due to washing of the same amount of starting hybrid at two temperatures indicates a higher maximum D at lower temperatures. From these results, it is possible to confirm the tendency of the change of D according to the temperature and the ratio of the amounts of the two hybrids at the start of the washing step.

【0169】 短オリゴヌクレオチドハイブリダイゼーション条件の一般的な利用性を示すた
めに、本発明者らの簡易M13系において、4つの7-mer、10の8-mer、および14 の最長12ヌクレオチドの長さのプローブのハイブリダイゼーションを観察した。
これらは、GC含量の2つの極値を表わす9-merGTTTTTTAAおよび8-merGGCAGGC
Gを含む。GC含量および配列は、短いハイブリッドの安定性に影響を及ぼすと 予想されるが[Bresslauerら、Proc. Natl. Acad. Sci. U.S.A. 83:3746 (1986)]
、低温度の短オリゴヌクレオチド条件は検査した全てのプローブに対して、十分
な識別を得るために適用できた。13ヌクレオチドの長さのプローブで得られた最
良の識別値は20であり、配列変化による数倍の低下は容易に許容できる。
To demonstrate the general utility of short oligonucleotide hybridization conditions, in our simplified M13 system, four 7-mers, ten 8-mers, and 14 up to 12 nucleotides in length were used. Hybridization of the probe was observed.
These represent the two extremes of GC content, 9-merGTTTTTTAA and 8-merGGCAGGC.
Including G. GC content and sequence are expected to affect the stability of short hybrids [Bresslauer et al., Proc. Natl. Acad. Sci. USA 83 : 3746 (1986)].
Low temperature, short oligonucleotide conditions could be applied to all probes tested to obtain sufficient discrimination. The best discriminating value obtained with a 13 nucleotide long probe is 20, and a several-fold reduction due to sequence changes is readily acceptable.

【0170】 M13系は、標的DNAの複雑性が識別レベルに及ぼす影響を示す利点を有する。誤
対合標的が0または5であり、1つのGC対のみ異なる2つの8-merについては
、それぞれ観察された識別は18.3および1.7であった。
The M13 system has the advantage of indicating the effect of target DNA complexity on the level of discrimination. For the two 8-mers that had 0 or 5 mismatched targets and differed only by one GC pair, the discrimination observed was 18.3 and 1.7, respectively.

【0171】 本方法の有用性を示すために、8ヌクレオチドの長さのプローブを3本、Blue
scriptベクターのライブラリーから作製された51プラスミドDNAドットの集合上 で検査した。プローブの1つは、Bluescriptベクターに存在し、同ベクターに対
して特異的であったが、M13では不在であった。その他の2つのプローブは、既 知配列挿入体である標的を有していた。この系では、それぞれのプローブに対し
て陰性または陽性の対照DNAでのハイブリダイゼーションを行うことができる。 このプローブ配列(CTCCCTTT)は、インターフェロン挿入体中にも相補的標的を有
していた。M13ドットは陰性であり、M13またはBluescript中のインターフェロン
挿入体は陽性であるため、ハイブリダイゼーションは配列特異的であった。同様
に、プローブは、51の挿入体のうちたった1つにある標的配列を検出し、対照で
は検査挿入体において標的配列を全く検出せず、適切な標的がクローン中に存在
すればハイブリダイゼーションが生じたであろうことを確認した。
To demonstrate the usefulness of this method, three 8-nucleotide long probes were used
Tests were performed on a set of 51 plasmid DNA dots generated from a library of script vectors. One of the probes was present and specific for the Bluescript vector, but was absent for M13. The other two probes had targets that were known sequence inserts. In this system, hybridization with negative or positive control DNA for each probe can be performed. This probe sequence (CTCCCTTT) also had a complementary target in the interferon insert. Hybridization was sequence specific because the M13 dot was negative and the interferon insert in M13 or Bluescript was positive. Similarly, the probe detects the target sequence in only one of the 51 inserts, the control does not detect any target sequence in the test insert, and the hybridization is successful if the appropriate target is present in the clone. It was confirmed that it would have occurred.

【0172】 6〜8ヌクレオチドの長さの非常に短いオリゴヌクレオチドハイブリッドにつ
いての熱安定性曲線は、11〜12ヌクレオチドの長さのハイブリッドよりも少なく
とも15℃低い[図1およびWallaceら, Nucleic Acids Res. 6:3543-3557 (1979)]
。しかし、低温度にて、かつ非常に実用的な0.4〜40nMの濃度のオリゴヌクレオ チドプローブにおいてハイブリダイゼーション反応を行うことにより、既知また
は未知の核酸標的中の相補的な配列の検出が可能になる。未知の核酸配列を完全
に決定するために、65,535の8-merプローブを含む完全セットを使用することが
できる。この目的のために十分な量の核酸が、都合の良い生物学的サンプル(例
えば数マイクロリットルのM13培養物、10mlの細菌培養物から得たプラスミド調 製物または単一コロニーの細菌、1ml未満の標準PCR反応液など)中に存在する 。
Thermal stability curves for very short oligonucleotide hybrids of 6-8 nucleotides in length are at least 15 ° C. lower than hybrids of 11-12 nucleotides in length [FIG. 1 and Wallace et al., Nucleic Acids Res. . 6 : 3543-3557 (1979)]
. However, performing the hybridization reaction at low temperatures and with a very practical concentration of 0.4-40 nM oligonucleotide probes allows detection of complementary sequences in known or unknown nucleic acid targets. To completely determine the unknown nucleic acid sequence, a complete set containing 65,535 8-mer probes can be used. A sufficient amount of nucleic acid for this purpose can be obtained from any convenient biological sample (eg, microliters of M13 culture, plasmid preparation or single colony bacteria from 10 ml of bacterial culture, less than 1 ml). In standard PCR reactions).

【0173】 6〜10ヌクレオチドの長さの短いオリゴヌクレオチドから、優れた識別が得ら
れる。単一末端誤対合によるハイブリッド安定性の相対的な減少は、長いプロー
ブよりも大きい。8-merTGCTCATGから得られる結果がこの結論を裏付ける。実験
において、G/T末端誤対合を有する標的、この種の誤対合を有する標的へのハ イブリダイゼーションは他の全ての種のオリゴヌクレオチドの中で最も安定して
いる。得られた識別は、19塩基対二重らせんにおける内部G/T誤対合と同一かま たは大きい[Ikutaら、Nucl. Acids res. 15:797(1987)]。短オリゴヌクレオチド
のための記載されているハイブリダイゼーション条件を用いてこれらの識別特性
を活用すれば、オリゴヌクレオチド標的の非常に正確な決定が可能である。完全
ハイブリッドと不完全ハイブリッドとの識別を検出の簡便性に対して、非常に短
いオリゴヌクレオチドを用いる上で存在する問題は十分な量のハイブリッドを調
製することである。実際には、HpとHiとを識別する必要性は、ドット中のDNA 量および/またはプローブ濃度を上昇すること、またはハイブリダイゼーション 温度を下げることによって補助される。しかし、高いプローブ濃度は、通常バッ
クグラウンドを上げる。また、実用面での標的核酸の量には限度がある。この問
題は、4nMのプローブで有効なバックグラウンドをもたらす界面活性剤サルコシ
ルの濃度を高くすることによって解決された。プローブが非特異的にフィルター
に結合するのを防ぐための競合相手を使用すること、またはハイブリダイゼーシ
ョン支持体材料を変えることで更に改良できる。さらに、45Kcal/mol未満のEa を有するプローブ(例えば、多くの7-merおよび主な6-mer)については、改変オ
リゴヌクレオチドの方が、改変されていない相当物よりも安定なハイブリッドが
得られる[Asselineら、Proc. Natl. Acad. Sci. 81:3297 (1984)]。本発明に記 載されている、低温度を利用する短いオリゴヌクレオチドでのハイブリダイゼー
ションのためのハイブリダイゼーション条件により、全ての配列および二重らせ
んハイブリッドインプットに対してより良好な識別が得られる。異なる配列に対
してハイブリダイゼーション条件の均一性を得るための唯一の代償は、洗浄時間
が配列によって数分から最長で24時間長くなることである。また、洗浄時間は、
塩濃度を下げることによってさらに短くすることができる。
Excellent discrimination is obtained from oligonucleotides as short as 6 to 10 nucleotides in length. The relative decrease in hybrid stability due to single-terminal mismatches is greater than for longer probes. The results obtained from 8-merTGCTCATG support this conclusion. In experiments, hybridization to targets with G / T end mismatches, targets with this type of mismatch, is the most stable of all other species of oligonucleotides. The resulting discrimination is the same or greater than the internal G / T mismatch in a 19 base pair duplex (Ikuta et al., Nucl. Acids res. 15: 797 (1987)). Exploiting these discriminating properties using the described hybridization conditions for short oligonucleotides allows very accurate determination of the oligonucleotide target. For the ease of detecting the distinction between perfect and incomplete hybrids, the problem that exists with using very short oligonucleotides is to prepare sufficient quantities of hybrids. In fact, the need to identify the H p and H i is aided by lowering to increase the amount of DNA and / or probe concentration in the dot or the hybridization temperature. However, high probe concentrations usually increase background. In addition, there is a practical limit on the amount of target nucleic acid. This problem was solved by increasing the concentration of the detergent sarkosyl, which provided an effective background with 4 nM probe. Further improvements can be made by using competitors to prevent non-specific binding of the probe to the filter, or by changing the hybridization support material. Further, the probe (e.g., a number of 7-mer and major 6-mer) having the E a of less than 45 kcal / mol for the direction of modified oligonucleotides, unmodified equivalents resulting stable hybrid than [Asseline et al., Proc. Natl. Acad. Sci. 81 : 3297 (1984)]. The hybridization conditions described in the present invention for hybridization with short oligonucleotides utilizing low temperatures provide better discrimination for all sequences and duplex hybrid inputs. The only trade-off for obtaining uniformity of hybridization conditions for different sequences is that the wash time can be increased from a few minutes up to 24 hours depending on the sequence. The cleaning time is
It can be further shortened by lowering the salt concentration.

【0174】 短オリゴヌクレオチドハイブリダイゼーションは、誤対合ハイブリッドに対し
て1つの対合ハイブリッドを識別する点で優れているが、誤対合ハイブリッド由
来のシグナルも存在する。この誤対合ハイブリッドの多くは末端誤対合によるも
のである。これにより、特定の長さのプローブで有効に検査されうる挿入体の大
きさが限定される可能性がある。
Although short oligonucleotide hybridization is excellent in discriminating one paired hybrid against a mismatched hybrid, signals from mismatched hybrids are also present. Many of these mismatched hybrids are due to terminal mismatches. This can limit the size of the insert that can be effectively tested with a particular length of probe.

【0175】 配列の複雑性の識別に対する影響は無視できない。しかし、複雑性の影響は、
短オリゴヌクレオチドでのハイブリダイゼーションにより特異的かつ非ランダム
な配列について配列情報を定義する場合により有意であり、(適切なプローブの
長さ)対(標的の長さ)の比を用いることによって克服できる。長さ比は、統計
に基づいて、識別を消去するか、識別を間違って反転してしまうようないくつか
の末端誤対合を有する特異的配列が発生する可能性を無くすように選択する。結
果から、0.6、2.5、および10kb未満の標的核酸挿入体に対して、それぞれ6、7
、および8ヌクレオチドの長さのオリゴヌクレオチドの使用が示唆される。
The impact of sequence complexity on identification is not negligible. But the impact of complexity is
Hybridization with short oligonucleotides is more significant when defining sequence information for specific and non-random sequences and can be overcome by using the ratio of (appropriate probe length) to (target length) . The length ratios are chosen based on statistics to eliminate the possibility of generating specific sequences with some end mismatches that either eliminate the identification or incorrectly reverse the identification. The results show that for target nucleic acid inserts smaller than 0.6, 2.5, and 10 kb,
, And the use of oligonucleotides 8 nucleotides in length is suggested.

【0176】実施例11 DNAの配列決定 複数のサブアレイからなるアレイにより、反復されたサブアレイの形で並べら
れたサンプルの小さなセットの効率的な配列決定が可能になる。例えば、64個の
サンプルを8×8mmのサブアレイ上に並べて、16×24個のサブアレイを15×23cm
の膜上に1mm幅間隔で反復させもよい。幾つかのレプリカ膜を作製してもよい。
たとえば、3072の7-merからなる1つのユニバーサルセットからのプローブを、
32個の96ウェルプレートに分け、キナーゼにより標識することができる。4つの
膜を1サイクルのハイブリダイゼーションの間に並行処理してもよい。各膜上で
、384のプローブを評点してもよい。全てのプローブを2サイクルのハイブリダ イゼーションで評点してもよい。ハイブリダイゼーション強度を評点し、配列を
以下のようにアセンブルすることができる。
Example 11 DNA Sequencing An array of multiple subarrays allows for efficient sequencing of small sets of samples arranged in repeated subarrays. For example, 64 samples are arranged on an 8 × 8 mm sub-array, and a 16 × 24 sub-array is 15 × 23 cm.
May be repeated at 1 mm width intervals on the film. Several replica films may be made.
For example, a probe from one universal set consisting of 3072 7-mers,
It can be divided into 32 96-well plates and labeled with kinase. Four membranes may be processed in parallel during one cycle of hybridization. 384 probes may be scored on each membrane. All probes may be scored in two cycles of hybridization. The hybridization intensity is scored and the sequences can be assembled as follows.

【0177】 単一のまたは複数のサンプルのサブアレイが幾つかの未知物質を含む場合、特
に似たようなサンプルを使用する場合、先に評点したプローブの結果に基づいて
プローブを賢く選択すれば、より少ないプローブで十分である。例えば、プロー
ブAAAAAAAが陽性でない場合、8つのオーバーラッププローブのうちのいずれか が陽性である可能性は低い。AAAAAAAが陽性であれば、通常2つのプローブが陽 性である。この場合、アンカーの順番および各アンカー間のギャップのサイズお
よびタイプについて最も可能性の高い仮説のうちの1つを確認する配列決定プロ
セスは、まずオーバーラップが最小であるプローブからなるサブセットをハイブ
リダイズして陽性アンカーを定義したあと、プローブを選択することからなる。
この第2段階において、各プローブが、そのプールからの他のプローブに対して
陽性であると期待されるサンプルとは異なるたった1つのDNAサンプルにおいて のみ陽性であるように選択された場合、2〜10プローブからなるプールを使用す
ることができる。
If the sub-array of single or multiple samples contains several unknowns, especially if similar samples are used, judicious selection of the probes based on the results of the previously scored probes, Fewer probes are sufficient. For example, if the probe AAAAAAA is not positive, it is unlikely that any of the eight overlapping probes is positive. If the AAAAAAA is positive, usually the two probes are positive. In this case, the sequencing process, which identifies one of the most likely hypotheses about the order of the anchors and the size and type of gap between each anchor, first hybridizes a subset of probes with minimal overlap. And then selecting the probe after defining the positive anchor.
In this second step, if each probe was selected to be positive in only one DNA sample different from the sample expected to be positive for other probes from the pool, A pool of 10 probes can be used.

【0178】 このサブアレイ方法により、分岐問題を解明するためのプローブの競合(オー
バーラッププローブ)またはプローブの協働(プローブの連続的なスタッキング
)の効率的な実施が可能となる。プローブのユニバーサルセットをハイブリダイ
ズしたあと、配列アセンブリプログラムにより候補配列のサブ断片(SF)を決定
する。SFのさらなるアセンブリのために、(DNA断片のオーバーラップ配列、類 似配列、単一パスゲル配列、また他のハイブリダイゼーションもしくは制限地図
データからの)追加情報を提供しなければならない。分岐点を通る単一パスゲル
配列決定のためのプライマーを、SBH配列情報または既知のベクター配列(例え ばベクター挿入部位のフランキング配列)から同定し、標準的なサンガーの配列
決定反応をサンプルDNAに対して行う。この単一パスゲル配列決定から得た配列 を、分岐点の中に読みこまれたもしくはそこから読み出されたSfと比較し、Sfの
順番を同定する。さらに、単一パスゲル配列決定をSBHと組み合わせて、核酸を 新たに配列決定するかまたは再配列決定することができる。
This subarray method allows efficient implementation of probe competition (overlapping probes) or probe cooperation (continuous probe stacking) to resolve branching problems. After hybridizing the universal set of probes, a subfragment (SF) of the candidate sequence is determined by a sequence assembly program. Additional information must be provided (from overlapping sequences of DNA fragments, analogous sequences, single pass gel sequences, and other hybridization or restriction map data) for further assembly of the SF. Primers for single-pass gel sequencing through the branch point are identified from SBH sequence information or from known vector sequences (eg, flanking sequences at vector insertion sites), and standard Sanger sequencing reactions are performed on sample DNA. Do it for The sequence obtained from this single pass gel sequencing is compared to the Sf read into or read from the branch point to identify the order of the Sf. In addition, single pass gel sequencing can be combined with SBH to newly sequence or resequence nucleic acids.

【0179】 また、競合ハイブリダイゼーションおよび連続的なスタッキング相互作用を使
用してSfをアセンブルすることもできる。これらの方法は、SBHでは均一なアレ イを使用する場合に標識されたプローブをアレイに固定されたサンプルに適用す
るため、大量のサンプルを配列決定するための商業的価値に限界がある。幸運に
も、レプリカサブアレイを用いた少量サンプルの分析により両方の方法の効率的
な実施が可能になる。各レプリカサブアレイ上で、プローブのプールを用いて、
同じサブアレイの中にスポットされた異なるサンプルの中の突然変異配列を解明
するときと同じように(上記参照)、1つの分岐点を1以上のDNAサンプルにつ いて検査することができる。
Sf can also be assembled using competitive hybridization and continuous stacking interactions. These methods have limited commercial value for sequencing large samples because SBH applies labeled probes to samples immobilized on the array when using a homogeneous array. Fortunately, analysis of small samples using replica subarrays allows for efficient implementation of both methods. On each replica subarray, using a pool of probes,
One branch point can be tested on one or more DNA samples in the same way as elucidating mutant sequences in different samples spotted in the same subarray (see above).

【0180】 この実施例に記載した64サンプルの各々には100の分岐点があり、8サンプル を各サブアレイで並行して分析する場合は、少なくとも800のサブアレイプロー ビングにより全ての分岐点を解明する。これは、3072の塩基プロービングのため
にはさらに800のプロービング(25%)が使用されることを意味する。より好ま しくは、2つのプロービングを1つの分岐点で使用する。サブアレイがより小さ
い場合、追加使用するプロービングはこれより少ない。例えば、サブアレイが16
個のサンプルからなる場合、200の追加プロービングが評点される(6%)。7-
merプローブ(N1-2B7N1-2)を用いることにより、および競合的もしくは共同的 な分岐点解明方法またはその両方を用いて、約1000bpの断片を約4000のプロービ
ングによりアセンブルすることができる。さらに、8-merプローブ(NB8N)を用
いて4kbもしくはこれより長い断片を12000のプロービングでアセンブルすること
ができる。途切れたプローブ(gapped probe)、例えばNB4NB3NもしくはNB4NB4N
を使用して分岐点の数を減少させることができる。
Each of the 64 samples described in this example has 100 bifurcation points, and if 8 samples are analyzed in parallel on each subarray, at least 800 subarray probing will resolve all bifurcation points. . This means that an additional 800 probings (25%) are used for 3072 base probings. More preferably, two probings are used at one branch point. If the subarray is smaller, less probing is used. For example, if the subarray is 16
When consisting of 200 samples, 200 additional probings are scored (6%). 7-
Assembling a fragment of about 1000 bp by probing about 4000 using a mer probe (N 1-2 B 7 N 1-2 ) and using competitive or collaborative branch point resolution methods or both. Can be. In addition, 4 kb or longer fragments can be assembled with 12000 probing using an 8-mer probe (NB 8 N). Gapped probe, eg NB 4 NB 3 N or NB 4 NB 4 N
Can be used to reduce the number of branch points.

【0181】実施例12 プローブの一時的なサブアレイへの結合によるDNA解析および標識プローブのラ イゲーション [0181] ra DNA analysis and labeled probe by binding to a temporary subarray of Example 12 Probe Igeshon

【0182】 情報提供の長さを4から40塩基有するオリゴヌクレオチドプローブを、標準的
な化学により合成し、試験管またはマルチウェルプレート中に保存する。1から
10,000プローブから成る特定のプローブセットを、別個の支持体またはよ り大きな支持体の異なる部分への沈降、またはin situ 合成により整列させる 。後者の場合、その部分またはサブアレイは、物理的または疎水性のバリアーに
よって分離してもよい。このプローブアレイは、in situ合成によって調整して もよい。適当なサイズのサンプルDNAを、一つかそれ以上の特定アレイでハイブ リダイズする。サンプルの多くは同じサブアレイにおけるプールとして、または
一つの支持体内に異なるサブアレイを有するものをそれぞれ個別に、コンピュー
タにかけてもよい。サンプルと同時に、またはそれに続いて、単一の標識プロー
ブ、または標識プローブのプールを一つ、各サブアレイに加える。結合および標
識したプローブを、サンプルDNA中の相補的な標的に背中合わせにハイブリダイ ズすると、それらは連結される。ライゲーションの発生は、プローブから標識を
検出することによって測定する。
Oligonucleotide probes having an informative length of 4 to 40 bases are synthesized by standard chemistry and stored in test tubes or multiwell plates. A particular probe set consisting of 1 to 10,000 probes is aligned by sedimentation on a separate support or a different portion of a larger support, or by in situ synthesis. In the latter case, the portions or subarrays may be separated by a physical or hydrophobic barrier. This probe array may be prepared by in situ synthesis. Hybridize the appropriately sized sample DNA in one or more specific arrays. Many of the samples may be computerized as pools in the same subarray, or each with a different subarray in one support. Simultaneously with or following the sample, a single labeled probe, or one pool of labeled probes, is added to each subarray. When the bound and labeled probes are hybridized back-to-back to complementary targets in the sample DNA, they are ligated. The occurrence of ligation is measured by detecting the label from the probe.

【0183】 この手順は、DNAサンプルが支持体に永久的に結合されない、記載のDNA解析方法
とは異なる方法である。一時的な結合は、支持体に固定したプローブによっても
たらされる。この場合、標的DNAアレイの方法は必要ない。さらに、ライゲーシ ョンにより、短い固定プローブを伴う短い標識プローブを結合することによって
、より長いオリゴヌクレオチド配列の検出が可能になる。
This procedure differs from the described DNA analysis method in that the DNA sample is not permanently bound to the support. Temporary binding is provided by a probe immobilized on a support. In this case, there is no need for a target DNA array method. In addition, ligation allows detection of longer oligonucleotide sequences by conjugating a short labeled probe with a short immobilized probe.

【0184】 この方法はいくつかのユニークな特色をもつ。基本的に、標的の一時的結合によ
り、その再利用が可能になる。ライゲーションが起きた後、標的を放出してもよ
く、標識は支持体に共有結合したままとなる。この特色により、標的のサイクリ
ングおよび少量の標的で検出できる信号の産生が可能になる。最適条件下では、
標的を増幅する必要はない。例えば、DNAサンプルの天然源を、診断および配列 決定を目的として、直接使用してもよい。効率のよいハイブリダイゼーションと
効率のよい二重らせんの融解との間で温度をサイクリングすることによって、標
的を放出させてもよい。成分の温度と濃度は、遊離標的とハイブリッド中に入っ
た標的との間で均衡をもつように(およそ50:50%)定義してよい。この場合、 連結した産物が連続して産生される。目的が異なる場合は、最適均衡比が異なっ
てくる。
This method has several unique features. Basically, the temporary binding of the target allows its reuse. After ligation has occurred, the target may be released and the label remains covalently attached to the support. This feature allows cycling of the target and production of a signal that can be detected with small amounts of target. Under optimal conditions,
There is no need to amplify the target. For example, a natural source of a DNA sample may be used directly for diagnostic and sequencing purposes. The target may be released by cycling the temperature between efficient hybridization and efficient duplex melting. The temperature and concentration of the components may be defined to have a balance (approximately 50: 50%) between the free target and the target in the hybrid. In this case, the linked product is produced continuously. For different purposes, the optimal equilibrium ratio will be different.

【0185】 電場を、標的の利用を高めるために使用してもよい。まず始めに、各サブアレイ
内の水平フィールドパルシング(horizontal field pulsing)を、より早く標的
を選別するために使用してよい。この段階で、均衡がハイブリッド形成に動き、
非標識プローブが使用できる。標的を選別する段階を経た後に、適当な洗浄(垂
直電場でサンプルの動きを制限することでやりやすくなる)を実施してよい。識
別するハイブリッド融解、ハイブリダイゼーションによる標的の収穫、未使用標
的のライゲーションおよび除去の、いくつかのサイクルを、特異性を増すために
導入してもよい。次の段階では、標識したプローブを加え、垂直電気パルスを用
いてもよい。温度を上昇させて、最適な遊離標的とハイブリダイズした標的との
比が得られる。垂直電場は選別した標的の拡散を防ぐ。
An electric field may be used to enhance target utilization. First, horizontal field pulsing within each sub-array may be used to target faster. At this stage, the equilibrium moves to hybrid formation,
Unlabeled probes can be used. After going through the target selection step, a suitable wash may be performed, which may be facilitated by restricting the movement of the sample with a vertical electric field. Several cycles of discriminating hybrid melting, harvesting the target by hybridization, ligation and removal of unused target may be introduced to increase specificity. In the next step, labeled probes may be added and vertical electrical pulses may be used. The temperature is increased to obtain the optimal free to hybridized target ratio. The vertical electric field prevents diffusion of the sorted target.

【0186】 固定プローブのサブアレイおよび標識プローブのセット(特に設計するかまたは
一般的なプローブセットから選択する)は、有効でフレキシブルな配列決定およ
び診断方法を可能にするべく、様々にアレンジしてよい。例えば、細菌ゲノムの
短いフラグメント(約100−500bp)を部分的にまたは完全に配列決定す る場合は、既知の配列の塩基上に設計したプローブの小さなアレイ(5−30塩
基長)を使用してよい。サブアレイ毎、すなわちそれぞれ10個のプローブを有
する10のサブアレイ毎に、10の標識プローブからなる別個のプールを調べる
と、ライゲーションで連結された2塩基を評価すると仮定して、200塩基確認 できる。ハイブリッドを通じて誤対合を識別する条件下で、プローブは一つ以上
の塩基と置き換えて、同数のプローブをもつより長い標的をカバーしてもよい。
長いプローブを用いることにより、サンプル中の残りのDNAから増幅または単離 せずに、直接調べることができる。また、いくつかの標的を同時に一つのサンプ
ル中で分析(スクリーニング)してもよい。得られた結果が突然変異(または病
原体)の発生を示唆する場合、その突然変異のタイプまたは病原体のサブタイプ
を検出するために、プローブの追加プールを使用してもよい。これはこの方法の
特色であり、ほんの一部の患者のみが感染または突然変異を有すると考えられる
場合の予防的診断において費用対効果が優れている。
The set of immobilized probe subarrays and labeled probes (particularly designed or selected from common probe sets) may be variously arranged to allow for efficient and flexible sequencing and diagnostic methods. . For example, to partially or completely sequence short fragments (about 100-500 bp) of the bacterial genome, use a small array of probes (5-30 bases long) designed on bases of known sequence. May be. Examining a separate pool of 10 labeled probes per subarray, ie, every 10 subarrays with 10 probes each, can identify 200 bases, assuming that 2 bases linked by ligation are evaluated. Under conditions that identify mismatches through hybrids, the probe may be replaced with one or more bases to cover a longer target with the same number of probes.
The use of long probes allows direct interrogation without amplification or isolation from the remaining DNA in the sample. Also, several targets may be analyzed (screened) in one sample at the same time. If the results obtained indicate the occurrence of a mutation (or pathogen), additional pools of probes may be used to detect the type of mutation or subtype of pathogen. This is a feature of this method and is cost-effective in prophylactic diagnosis where only a few patients are considered to have the infection or mutation.

【0187】 実施例で述べた方法においては、いろいろな検出方法を使用してよい。例えば、
放射性標識、蛍光標識、酵素または抗体(化学発光)、光分散または光の干渉を
利用する方法で検出可能な大きな分子または粒子があげられる。
In the methods described in the embodiments, various detection methods may be used. For example,
Large molecules or particles that can be detected by methods that utilize radiolabels, fluorescent labels, enzymes or antibodies (chemiluminescence), light scattering or light interference.

【0188】実施例13 8-merおよび9-merを用いた標的の配列決定 8-merおよび9-merのオリゴヌクレオチドのハイブリダイゼーションから得られ
るデータは、ハイブリダイゼーションによる配列決定が非常に精度が高いことを
示している。この実験では、隣接してオーバーラップする成分の8-merおよび9
-merのオリゴヌクレオチドを推定するために、既知の配列を使用した。
Example 13 Target Sequencing Using 8-mers and 9-mers The data obtained from hybridization of 8-mer and 9-mer oligonucleotides shows that sequencing by hybridization is very accurate. It is shown that. In this experiment, the 8-mer and 9-mer of adjacent overlapping components
The known sequence was used to deduce the -mer oligonucleotide.

【0189】 完全に対合するオリゴヌクレオチドに加えて、誤対合のオリゴヌクレオチド、内
部または末端誤対合がオリゴヌクレオチドにより形成された二重らせん中に発生
する誤対合のオリゴヌクレオチド、ならびに標的を調べた。この分析では、ハイ
ブリダイゼーション形成を最大限にするために、最も低い実温度を用いた。誤対
合 対 対合オリゴヌクレオチド/標的ハイブリダイゼーションの最大解離率を
用いて、必ず最大限の識別ができるように、上記と同じ温度またはより低い温度
で洗浄を行った。絶対ハイブリダイゼーション収率は配列に依存して示してある
が、上記の条件は、全ての配列に適用できるように示してある。
In addition to perfectly matched oligonucleotides, mismatched oligonucleotides, mismatched oligonucleotides in which internal or terminal mismatches occur in the duplex formed by the oligonucleotide, and target Was examined. In this analysis, the lowest actual temperature was used to maximize hybridization formation. Washing was performed at the same or lower temperature as above to ensure maximum discrimination using the maximum dissociation rate of mismatched paired oligonucleotide / target hybridization. Absolute hybridization yields are shown as sequence dependent, but the above conditions are shown as applicable to all sequences.

【0190】 不安定さが最小であると仮定できる誤対合は、単一端の誤対合であるので、ハイ
ブリダイゼーションによる配列決定の試験とは、すなわち完全に対合するオリゴ
ヌクレオチド/標的二重らせんを、末端が誤対合したオリゴヌクレオチド/標的
二重らせんから識別する能力である。
Since the mismatch that can be assumed to have minimal instability is a single-ended mismatch, testing for sequencing by hybridization means that a perfectly matched oligonucleotide / target duplex The ability to distinguish a helix from a mismatched oligonucleotide / target duplex at the ends.

【0191】 ドットブロットフォーマット(dot blot format)中102から105のハイブ リダイズするオリゴヌクレオチドについて、識別を示す値は、精度の高い配列生
成を可能とする、2より大きかった。このシステムはまたハイブリダイゼーショ
ン形成に及ぼす配列の効果ならびにハイブリダイゼーションの不安定性の分析も
可能にする。
For the 102 to 105 hybridizing oligonucleotides in the dot blot format, the value indicating discrimination was greater than 2, which allowed for accurate sequence generation. The system also allows for the analysis of the effect of sequences on hybridization formation as well as hybridization instability.

【0192】 既知の配列の105のオリゴヌクレオチドプローブの標的核酸への、ハイブリダ
イゼーションにより得られたデータを用いて、例えば100bpの標的配列のPCR
で調製したヒトインターフェロン遺伝子の既知の部分の100の塩基対を生成し
た。使用したオリゴヌクレオチドプローブは、その配列が完全に標的と相補的な
配列である、72の8-merと21の9-merのオリゴヌクレオチドを含んでいた。93の
プローブセットにより、一つか二つの塩基をずらした標的配列の連続してオーバ
ーラップするフレームが提供された。
Using data obtained by hybridization of 105 oligonucleotide probes of known sequence to a target nucleic acid, for example, PCR of a 100 bp target sequence
Generated 100 base pairs of the known portion of the human interferon gene prepared in. The oligonucleotide probes used included 72 8-mer and 21 9-mer oligonucleotides whose sequences were completely complementary to the target. 93 probe sets provided a contiguous overlapping frame of target sequence shifted by one or two bases.

【0193】 誤対合の影響を評価するために、100bpの試験標的配列へハイブリダイズし
た際に、少なくとも一端の誤対合を含む12の追加プローブについて、ハイブリ
ダイゼーションを調べた。また、選んだその他4つの対照核酸配列と末端が誤対
合する標的をもつ12のプローブのハイブリダイゼーションを試験したところ、
形成した12のオリゴヌクレオチドは、四つの対照DNAをともなう二重らせんハ イブリッドと完全に対合した。こうして、オリゴヌクレオチドと標的の、内部の
誤対合、末端誤対合、完全に対合する二重らせん対のハイブリダイゼーションを
、試験で使用したオリゴヌクレオチドそれぞれについて評価した。絶対DNA標的 濃度が、試験の8-merと9-merのオリゴヌクレオチドを用いるハイブリダイゼー
ションに及ぼす影響を、共増幅したプラスミドDNA内の単一で発生する非標的部 位への異なるオリゴヌクレオチドプローブのハイブリダイゼーションを検出し、
標的DNA濃度を定義することによって決定した。
To assess the effect of the mismatch, the hybridization was examined for 12 additional probes containing at least one mismatch when hybridized to a 100 bp test target sequence. We also tested the hybridization of 12 probes with targets that end mismatched with the other four selected control nucleic acid sequences,
The 12 oligonucleotides formed were perfectly paired with a duplex hybrid with four control DNAs. Thus, internal mismatches, terminal mismatches, and hybridization of perfectly matched double helix pairs of oligonucleotide and target were evaluated for each of the oligonucleotides used in the test. The effect of absolute DNA target concentration on hybridization using the 8-mer and 9-mer oligonucleotides of the test was determined by the use of different oligonucleotide probes to a single occurring non-target site in co-amplified plasmid DNA. Detecting hybridization,
It was determined by defining the target DNA concentration.

【0194】 この試験の結果により、標的に完全に対合する相補的な配列を含むオリゴヌクレ
オチド全て、または対照DNAが、誤対合を有するオリゴヌクレオチドよりも強く ハイブリダイズしたことが示された。この結論にいたるため、各プローブについ
てHpおよびD値を調べた。Hpは試験標的とオリゴヌクレオチドプローブとの間に
形成されたハイブリッド二重らせん量を定義する。0から10の間の値を105
のプローブについて得られたハイブリダイゼーションに当てたところ、105の
プローブの68.5%が2より大きいHpであることが明らかとなった。
The results of this test indicated that all oligonucleotides containing complementary sequences that perfectly matched the target, or control DNA, hybridized more strongly than the oligonucleotides with the mismatch. To reach this conclusion, the Hp and D values for each probe were examined. Hp defines the amount of hybrid duplex formed between the test target and the oligonucleotide probe. 105 between 0 and 10
Exposure to the hybridization obtained for probe No. 6 revealed that 68.5% of the 105 probes had an Hp greater than 2.

【0195】 1)試験オリゴヌクレオチドと標的または対照核酸との間に形成された完全に対
合した二重らせんをひとつ含むドットと、2)同じオリゴヌクレオチドと標的ま
たは対照核酸内の異なる部位との間に形成された誤対合二重らせんをひとつふく
むドット、との間の信号強度の比として定義して、識別(D)値を得た。D値の変
動は、1)バックグラウンドから信号の視覚化を可能にする、ハイブリダイゼー
ションの有効性の摂動、または2)試験オリゴヌクレオチドと標的との間に見ら
れた誤対合のタイプ、のどちらかによりもたらされる。この試験で得られたD値 は、試験をした105のオリゴヌクレオチドプローブのうち102について、2
から40の間であった。102のオリゴヌクレオチドを全体とした群について、
D値を計算したところ、平均10.6であった。
1) Dots containing one perfectly matched double helix formed between the test oligonucleotide and the target or control nucleic acid; and 2) the same oligonucleotide and different sites within the target or control nucleic acid. The discrimination (D) value was obtained by defining the ratio of the signal strength between the dot containing one mispaired double helix formed between it and the dot. Variations in D-values can be attributed to 1) a perturbation of the effectiveness of hybridization, which allows visualization of the signal from the background, or 2) the type of mismatch found between the test oligonucleotide and the target. Brought by either. The D value obtained in this test was 2 for 102 of the 105 oligonucleotide probes tested.
To 40. For a group consisting of 102 oligonucleotides as a whole,
When the D value was calculated, the average was 10.6.

【0196】 オリゴヌクレオチド/標的二重らせんが末端誤対合を示したのは20例であった
。このうち5例では、Dは10より大きかった。この場合の大きいD値は、最も安
定的な(G/TおよびG/A)末端の誤対合以外により引き起こされる、ハイブリダ
イゼーションの不安定性によるのではないかと考えられる。その他の可能性とし
ては、オリゴヌクレオチドまたは標的のどちらかの配列にエラーがあったことが
あげられる。
The oligonucleotide / target duplexes showed terminal mismatch in 20 cases. In five of these, D was greater than 10. The large D value in this case is likely due to hybridization instability caused by other than the most stable (G / T and G / A) end mismatches. Other possibilities include errors in the sequence of either the oligonucleotide or the target.

【0197】 低いHpのプローブの標的におけるエラーの可能性は、このようなエラーがその他
8つのオーバーラップするオリゴヌクレオチドそれぞれのハイブリダイゼーショ
ンに影響したと考えられるため、除外した。その他のオーバーラップするオリゴ
ヌクレオチドについて配列の誤対合による明らかな不安定性が見られなかったこ
とは、標的配列が正しかったことを示すものである。オリゴヌクレオチド配列中
のエラーの可能性は、7つの新しく生成したオリゴヌクレオチドを再度調べた後
に除外した。7つのオリゴヌクレオチドのうち一つのみが、よりよいD値をもた らした。低いハイブリッド形成値は、ハイブリッドの不安定性またはハイブリッ
ド二重らせんの形成の無能力からもたらされる可能性がある。ハイブリッド二重
らせんの形成の無能力、1)選んだプローブの自己相補性または2)標的/標的
自己ハイブリダイゼーションのどちらかより起こりえる。プローブが自己相補性
であった場合、オリゴヌクレオチド/オリゴヌクレオチド二重らせん形成のほう
が、オリゴヌクレオチド/標的ハイブリッド二重らせん形成よりも有利となる可
能性がある。同様に、標的が自己相補的であった場合には、標的/標的結合が有
利となるか、または内部パリンドロームを形成する可能性がある。これらの可能
性を評価したところ、問題のあるプローブが、自身とハイブリッドを形成しなか
ったことは、プローブ分析から明らかであった。さらに、標的/標的ハイブリダ
イゼーションの貢献度を検討したところ、問題のあるオリゴヌクレオチドプロー
ブの一つが、同じ標的を含む二つの異なるDNAで非効率的にハイブリダイズした ことが決定された。二つの異なるDNAが同じ標的配列について自己相補的な領域 をもつ可能性が低いということは、標的/標的ハイブリダイゼーションが低いハ
イブリダイゼーション形成には寄与しなかったという結論を導き出す。したがっ
て、こうした結果は、ハイブリッド形成の無能力ではなく、ハイブリッドの不安
定性が、特定のオリゴヌクレオチドに観察された低いハイブリッド形成の原因で
あったことを示唆している。またこうした結果は、低いハイブリッド形成が、一
定のオリゴヌクレオチドの特定の配列によるものであることをも示唆している。
さらにこうした結果は、8-merおよび9-merのオリゴヌクレオチドを使用すれば
、配列を生成するのに信頼できる結果が得られるだろうことを示唆している。
The possibility of errors in the target of the low Hp probe was ruled out, as such errors would have affected the hybridization of each of the other eight overlapping oligonucleotides. The lack of apparent instability due to sequence mismatch for the other overlapping oligonucleotides indicates that the target sequence was correct. Possible errors in the oligonucleotide sequence were ruled out after re-examining the seven newly generated oligonucleotides. Only one of the seven oligonucleotides gave better D values. Low hybridization values can result from hybrid instability or inability to form hybrid duplexes. Inability to form hybrid duplexes can occur either from 1) self-complementarity of the chosen probe or 2) target / target self-hybridization. If the probe was self-complementary, oligonucleotide / oligonucleotide duplex formation may be more advantageous than oligonucleotide / target hybrid duplex formation. Similarly, if the targets were self-complementary, target / target binding could be advantageous or could form an internal palindrome. Upon evaluation of these possibilities, probe analysis revealed that the problematic probe did not hybridize to itself. In addition, examination of the contribution of target / target hybridization determined that one of the problematic oligonucleotide probes hybridized inefficiently with two different DNAs containing the same target. The low probability that two different DNAs have self-complementary regions for the same target sequence leads to the conclusion that target / target hybridization did not contribute to low hybridization formation. Thus, these results suggest that the instability of the hybrid, rather than the inability to hybridize, was responsible for the low hybridization observed for certain oligonucleotides. These results also suggest that low hybridization is due to the specific sequence of certain oligonucleotides.
Furthermore, these results suggest that the use of 8-mer and 9-mer oligonucleotides would provide reliable results for generating sequences.

【0198】 これらの結果は、記載した方法を用いることで、どんな特定の標的核酸の長い配
列も、構成するオリゴヌクレオチドの最大限かつユニークなオーバーラップによ
り生成されるであろうことを示している。このような配列決定方法は、その頻度
や位置とは無関係で、個々の構成オリゴマーの内容に依存する。
These results indicate that using the described method, long sequences of any particular target nucleic acid will be produced with maximal and unique overlap of the constituent oligonucleotides. . Such sequencing methods are independent of their frequency or position and depend on the content of the individual constituent oligomers.

【0199】 下記のアルゴリズムを使って生成する配列は、精度が高い。4つ低い信頼値が含
まれる、105のハイブリダイゼーション値から生成する配列が正しかったとい
う事実に示されるとおり、このアルゴリズムは、ハイブリダイゼーションドット
からの誤った正の信号を許容する。ハイブリダイゼーションによる配列決定にお
ける正確さは、短いオリゴヌクレオチドハイブリダイゼーションの「一か八か(
all or none)」の動態、ならびに完全に対合した二重らせんと誤対合した二重 らせんとの間の二重らせんの安定性の違いによる。対合した二重らせんおよび末
端が誤対合した二重らせんの二重らせん安定性の比は、二重らせん長の減少につ
れて増す。さらに、結合エネルギーは、二重らせん長の減少につれ低下し、より
低いハイブリダイゼーション効率をもたらす。ただし、こうした結果は、オクタ
マーハイブリダイゼーションが、二重らせんの安定性に影響する因子の平均化、
ならびにハイブリダイゼーションにより配列決定する精度の高い方法を生み出す
ための識別を、可能にすることを示す。その他実施例における結果は、6,7、
または8つのヌクレオチドであるオリゴヌクレオチドは、0.5kb(ヘキサマ
ー)、2kb(セプタマー)、6kb(オクタマー)である標的に、信頼できる
配列を生成するのに、有効に利用できることが示された。長いフラグメントの配
列は、完全なゲノム配列を生成するため、オーバーラップしてもよい。
An array generated using the following algorithm has high accuracy. This algorithm allows for false positive signals from the hybridization dots, as indicated by the fact that the sequence generated from the 105 hybridization values, including four lower confidence values, was correct. Accuracy in sequencing by hybridization is less than "one or eight" of short oligonucleotide hybridizations.
all or none) "as well as differences in stability of the duplex between perfectly paired and mispaired duplexes. The ratio of duplex stability to paired and terminally mismatched duplexes increases with decreasing duplex length. In addition, the binding energy decreases as the duplex length decreases, resulting in lower hybridization efficiency. However, these results indicate that octamer hybridization averages factors that affect duplex helix stability,
As well as discrimination to produce a more accurate method of sequencing by hybridization. The results in other examples are 6,7,
Alternatively, oligonucleotides of eight nucleotides have been shown to be useful for generating reliable sequences for targets of 0.5 kb (hexamer), 2 kb (septamer), and 6 kb (octamer). The sequences of the long fragments may overlap to generate a complete genomic sequence.

【0200】実施例14 得られたデータの解析 イメージファイルを、DOTSプログラム(Drmanacら, 1993)のようなイメージ解 析プログラムで解析し、例えばSCORESプログラム(Drmanacら, 1994)中に含まれ る統計的機能でスケールして評価した。シグナルの分布から、シグナルを+/-ア ウトプットに変換するために最適閾値を決定する。検出された標識の位置から、
断片からのF+Pヌクレオチド配列が標識位置に対応する標識プローブと固定化プ ローブの既知配列を組み合わせることで決定されよう。その後、ヒト染色体など
の元の分子の完全な核酸配列または配列サブフラグメントはコンピュータ演繹法
により決定されたオーバーラップするF+P配列からアセンブルされるだろう。
Example 14 Analysis of Data Obtained An image file was analyzed by an image analysis program such as the DOTS program (Drmanac et al., 1993). The evaluation was performed by scaling with the objective function. From the signal distribution, determine the optimal threshold for converting the signal to +/- output. From the position of the detected sign,
The F + P nucleotide sequence from the fragment will be determined by combining the labeled probe corresponding to the labeling position with the known sequence of the immobilized probe. Thereafter, the complete nucleic acid sequence or sequence subfragment of the original molecule, such as the human chromosome, will be assembled from overlapping F + P sequences determined by computer deduction.

【0201】 一つの選択肢は、配列アセンブリ過程でハイブリダイゼーションシグナル(例
えば、スコア)を+/-アウトプットに変換することである。この場合に、アセン ブリは非常に高いスコアをもつF+P配列、例えばF+P配列 AAAAAATTTTTT から出発
するだろう。4つ全ての可能なオーバーラップするプローブ AAAAATTTTTA、AAAA
ATTTTTT、AAAAATTTTTTCおよびAAAAATTTTTTG、および冒頭で異なる3つの追加の プローブ(TAAAAATTTTTT; CAAAAATTTTTT; GAAAAATTTTTT)のスコアを比較すると、
3つの結果が規定される。すなわち、(i) 出発プローブと4つのオーバーラップ
するプローブのうちの1つだけが他の6つのプローブに対して有意に正のスコア
を有する。この場合には、AAAAAATTTTTT配列が右側に1ヌクレオチドだけ伸長さ
れる;(ii)出発プローブを除いてどのプローブも有意に正のスコアをもたない。
アセンブリは停止し、例えばAAAAAATTTTT配列が配列決定されるDNA分子の最後に
くる;(iii) オーバーラップするプローブおよび/または他の3つのプローブの
中に有意に正のスコアが2以上存在する。エラーまたは枝分かれのためにアセン
ブリが停止される(Drmanacら, 1989)。
One option is to convert the hybridization signal (eg, score) to +/- output during the sequence assembly. In this case, the assembly will start from the F + P sequence with a very high score, for example the F + P sequence AAAAAATTTTTT. All four possible overlapping probes AAAAATTTTTA, AAAA
Comparing the scores of ATTTTTT, AAAAATTTTTTC and AAAAATTTTTTG, and three additional probes that differ at the beginning (TAAAAATTTTTT; CAAAAATTTTTT; GAAAAATTTTTT)
Three results are defined. That is, (i) only one of the four overlapping probes with the starting probe has a significantly positive score relative to the other six probes. In this case, the AAAAAATTTTTT sequence is extended to the right by one nucleotide; (ii) none of the probes except the starting probe have a significantly positive score.
Assembly stops, eg, the AAAAAATTTTT sequence comes to the end of the DNA molecule to be sequenced; (iii) there are two or more significantly positive scores among the overlapping probes and / or the other three probes. Assembly is stopped due to errors or branching (Drmanac et al., 1989).

【0202】 コンピュータ演繹法では、既存のアルゴリズムを用いるコンピュータプログラ
ムが利用されるだろう(例えば、Pevzner, 1989; Drmanacら, 1991; Labat & Dr
manacら, 1993を参照のこと;それぞれを参考としてここに組み入れる)。
In computer deduction methods, computer programs using existing algorithms will be used (eg, Pevzner, 1989; Drmanac et al., 1991; Labat & Dr.
manac et al., 1993; each of which is incorporated herein by reference).

【0203】 F+Pのほかに、F(スペース1)P、F(スペース2)P、F(スペース3)PまたはF(スペー
ス4)Pが決定される場合は、アルゴリズムを用いて全てのデータセットをマッチ させることにより、起こりうるエラーを修正したり、枝分かれの問題が存在する
事例を解明できるだろう(例えば、Drmanacら, 1989; Bainsら, 1988;それぞれ
を参考としてここに組み入れる)。
If F (space 1) P, F (space 2) P, F (space 3) P or F (space 4) P is determined in addition to F + P, all Matching the datasets will correct possible errors and clarify instances where branching problems exist (eg, Drmanac et al., 1989; Bains et al., 1988; each of which is incorporated herein by reference).

【0204】実施例15 ツーステップハイブリダイゼーションにより配列決定を行う 本発明者により意図される配列決定法の実施を記載するいくつかの実施例に続
いて、最初に、全チップを1億bp(1本のヒト染色体)ほどに複雑なDNAの混合 物とハイブリダイズさせる。ハイブリダイゼーションを実施するためのガイドラ
インは、Drmanacら (1990); Khrapkoら (1991); Broudeら (1994) などの文献に
載っている。これらの文献は、フォーマット3 SBHの初期ステップで使用するの に適するハイブリダイゼーションの温度範囲、緩衝液および洗浄ステップを教示
している。
Example 15 Following several examples describing the implementation of the sequencing method contemplated by the present inventors for performing sequencing by two-step hybridization , first, the entire chip was converted to 100 million bp (1 (A human chromosome in a book). Guidelines for performing hybridization are given in documents such as Drmanac et al. (1990); Khrapko et al. (1991); Broude et al. (1994). These references teach suitable hybridization temperature ranges, buffers and washing steps to use in the initial steps of Format 3 SBH.

【0205】 本発明者は、特に、提供され得る標的DNAの濃度が比較的低いために、ハイブ リダイゼーションを高塩濃度にて低温(-2〜5℃)で最大数時間にわたり実施す ることを意図している。そのために、10℃で析出するリン酸ナトリウム緩衝液の
代わりにSSC緩衝液を使用する(Drmanacら, 1990)。洗浄は第2ステップのために
十分である必要はなく(2,3分)、高度に複雑なDNAサンプルの配列決定のためにハ
イブリダイゼーションサイクリングを使用する場合には完全に排除することがで
きる。ハイブリダイゼーションステップと洗浄ステップで同一の緩衝液を用いる
と、標識プローブを用いる第2ハイブリダイゼーションステップと続行させるこ
とができる。
The inventor has determined that hybridisation should be carried out at high salt concentrations at low temperatures (−2 to 5 ° C.) for up to several hours, especially because of the relatively low concentrations of target DNA that can be provided. Is intended. For that, an SSC buffer is used instead of a sodium phosphate buffer that precipitates at 10 ° C. (Drmanac et al., 1990). Washing need not be sufficient for the second step (a few minutes) and can be completely eliminated when using hybridization cycling for sequencing highly complex DNA samples. If the same buffer is used in the hybridization step and the washing step, the second hybridization step using the labeled probe can be continued.

【0206】 各アレイ(例えば、8 x 8mm アレイ)に対して単純なロボットデバイスを使用
する適切な洗浄を行った後に、1つの標識プローブ(例えば、6-mer)を添加す る。96-チップまたは96-ピンデバイスを用いて、これを42回実施する。この場合
も、科学文献に記載されるような、ある範囲の差別的条件が採用されるだろう。
After appropriate washing using a simple robotic device for each array (eg, an 8 × 8 mm array), one labeled probe (eg, a 6-mer) is added. This is performed 42 times using a 96-chip or 96-pin device. Again, a range of discriminatory conditions will be employed, as described in the scientific literature.

【0207】 本発明者は、特に、次の条件を採用することを意図している。最初に、標識プ
ローブを添加して、低温(0〜5℃)で(添加オリゴヌクレオチドの高濃度のため)
数分間だけインキュベートした後、F+P長さに応じて温度を3〜10℃に上げ、洗浄
緩衝液を添加する。この時に用いる洗浄緩衝液はどのようなライゲーション反応
にも適合しうるもの(例えば、100 mMの塩濃度範囲)である。リガーゼを添加し
た後、迅速なライゲーションおよび完全対合と誤対合ハイブリッドのさらなる識
別を可能とするために温度を再度15〜37℃に上げる。
The inventor specifically intends to employ the following conditions. First, add the labeled probe and at low temperature (0-5 ° C) (due to the high concentration of added oligonucleotide)
After incubating for only a few minutes, raise the temperature to 3-10 ° C., depending on the F + P length, and add wash buffer. The washing buffer used at this time is compatible with any ligation reaction (for example, a salt concentration range of 100 mM). After the addition of ligase, the temperature is raised again to 15-37 ° C to allow for rapid ligation and further discrimination of perfect and mismatched hybrids.

【0208】 Pontius & Berg (1991, 参考としてここに組み入れる)に記載されるように、
カチオン界面活性剤の使用が、フォーマット3 SBHでも意図される。これらの著 者は、2種の単純なカチオン界面活性剤、ドデシル- およびセチルトリメチルア
ンモニウムブロミド(DTABおよびCTAB)をDNA再結合において使用することを記述 している。
As described in Pontius & Berg (1991, incorporated herein by reference):
The use of a cationic surfactant is also contemplated in Format 3 SBH. These authors describe the use of two simple cationic surfactants, dodecyl- and cetyltrimethylammonium bromide (DTAB and CTAB) in DNA recombination.

【0209】 DTAB およびCTABは、第四級アミンであるテトラメチルアンモニウムブロミド(
TMAB)の変異体で、メチル基の1つが12炭素アルキル基(DTAM)または16炭素アル キル基(CTAB)のいずれかで置換されている。TMABはテトラメチルアンモニウムイ
オンの臭化物塩であり、融解温度のG-C含量バイアスを低下させるための核酸再 結合実験で用いる試薬である。DTABおよびCTABは構造的にドデシル硫酸ナトリウ
ム(SDS)に類似しており、SDSの負に荷電した硫酸基が正に荷電した第四級アミン
に置き換わっている。SDSは非特異的結合を減少させかつヌクレアーゼを阻害す るためにハイブリダイゼーション緩衝液中で普通に用いられるが、再結合速度に
は大きな影響を与えない。
DTAB and CTAB are the quaternary amines tetramethylammonium bromide (
TMAB), in which one of the methyl groups has been replaced with either a 12-carbon alkyl group (DTAM) or a 16-carbon alkyl group (CTAB). TMAB is a bromide salt of tetramethylammonium ion, a reagent used in nucleic acid recombination experiments to reduce the GC content bias in melting temperature. DTAB and CTAB are structurally similar to sodium dodecyl sulfate (SDS), where the negatively charged sulfate group of the SDS is replaced by a positively charged quaternary amine. SDS is commonly used in hybridization buffers to reduce non-specific binding and inhibit nucleases, but does not significantly affect rebinding rates.

【0210】 ライゲーション法を使用するとき、酵素は標識プローブと共に、またはバック
グラウンドを低下させる適切な洗浄ステップの後に添加されるだろう。SBH法で の使用についてこれまで提案されたことはないが、リガーゼ技法は分子生物学の
分野で十分に確立されている。例えば、Hoodと共同研究者はリガーゼ媒介遺伝子
検出法(Landegrenら, 1988)を記載しており、この方法はフォーマット3 SBHでの
使用のために容易に適合させることができる。Wu & Wallaceもまた、2つの隣接
した短い合成オリゴヌクレオチドを連結するためにバクテリオファージT4 DNAリ
ガーゼの使用を記載している。彼らのオリゴライゲーション反応は、50 mM Tris
HCl pH7.6, 10 mM MgCl2, 1 mM ATP, 1 mM DTTおよび5% PEG中で実施された。 ライゲーション反応物を100℃に5〜10分加熱し、続いて0℃に冷却してからT4 DN
Aリガーゼ(1単位; Bethesda Research Laboratory)を添加した。大方のライゲー
ション反応は30℃で実施し、100℃で5分間加熱して終結させた。
When using the ligation method, the enzyme will be added with the labeled probe or after an appropriate washing step to reduce background. Although not previously suggested for use in the SBH method, the ligase technique is well established in the field of molecular biology. For example, Hood and co-workers have described a ligase-mediated gene detection method (Landegren et al., 1988), which can be readily adapted for use in Format 3 SBH. Wu & Wallace also describes the use of bacteriophage T4 DNA ligase to ligate two adjacent short synthetic oligonucleotides. Their oligo ligation reaction was performed with 50 mM Tris
HCl pH 7.6, 10 mM MgCl 2 , 1 mM ATP, 1 mM DTT and 5% PEG. Heat the ligation reaction to 100 ° C. for 5-10 minutes, then cool to 0 ° C. before T4 DN
A ligase (1 unit; Bethesda Research Laboratory) was added. Most ligation reactions were performed at 30 ° C. and terminated by heating at 100 ° C. for 5 minutes.

【0211】 その後、ハイブリダイズした隣接する、またはライゲートされた、長さ(F+P) のオリゴヌクレオチドの識別検出に適する最終洗浄を行う。この洗浄ステップは
、ライゲートされていない全ての標識プローブと他の全ての化合物を洗い流して
バックグラウンドを最小に低減させるために、40〜60℃の水の中で数分間実施す
る。共有結合で結合された標識オリゴヌクレオチドのため、検出は単純化される
(時間および低温を強制されない)。
Thereafter, a final wash suitable for the differential detection of hybridized adjacent or ligated, length (F + P) oligonucleotides is performed. This washing step is performed for several minutes in water at 40-60 ° C. to wash away all unligated labeled probes and all other compounds to minimize background. Because of the covalently linked labeled oligonucleotide, detection is simplified (time and cold are not forced).

【0212】 用いた標識に応じて、チップのイメージングは異なる装置を用いて行う。放射
性標識の場合は、ホスホル・ストレージ・スクリーン技術とスキャナーとしての
PhosphorImagerを使用することができる(Molecular Dynamics, Sunnyvale, CA)
。チップをカセットの中に置き、リンスクリーンでカバーする。1〜4時間の暴露
後、スクリーンをスキャンして、イメージファイルをコンピュータのハードディ
スクに記憶させる。蛍光標識の検出の場合は、CCDカメラとエピ蛍光または同焦 点顕微鏡を使用する。CCDカメラの画素上に直接作製されたチップについては、E
ggersら(1994, 参考としてここに組み入れる)が記載するとおりに検出を行うこ
とができる。
Depending on the label used, imaging of the chip is performed using different devices. In the case of radioactive labels, phosphor storage screen technology and scanner
PhosphorImager can be used (Molecular Dynamics, Sunnyvale, CA)
. Place the chips in the cassette and cover with a phosphor screen. After 1-4 hours of exposure, scan the screen and store the image file on the computer's hard disk. For detection of fluorescent labels, use a CCD camera and epifluorescence or confocal microscope. For chips fabricated directly on the pixels of a CCD camera, E
Detection can be performed as described by Gggers et al. (1994, incorporated herein by reference).

【0213】 電荷結合デバイス(charge-coupled device: CCD)検出器は、プローブに基づい
たアッセイで標識標的分子を定量的に検出して、その分布をイメージする活性固
相支持体として働く。これらのデバイスは、高度にパラレルなアッセイ、超高感
度検出、ハイスループット、統合データ獲得およびコンピュータ計算に適合する
マイクロエレクトロニクスの固有の特徴を使用している。Eggersら(1994)は、本
発明のフォーマット3 SBHなどのプローブに基づいたアッセイと共に使用するた めのCCDを記述しており、このCCDは採用した高感度および直接結合のために数秒
以内での定量的評価を可能にする。
[0213] Charge-coupled device (CCD) detectors serve as active solid supports that quantitatively detect labeled target molecules in a probe-based assay and image their distribution. These devices use the unique features of microelectronics that are compatible with highly parallel assays, ultrasensitive detection, high throughput, integrated data acquisition and computation. Eggers et al. (1994) describe a CCD for use with a probe-based assay, such as the format 3 SBH of the present invention, which is within a few seconds due to the high sensitivity and direct binding employed. Enable quantitative evaluation.

【0214】 統合CCD検出法はチップ上での分子結合イベントの検出を可能にする。この検 出器はサンプルをユニークに特徴づける二次元パターンを速やかに作成する。CC
Dに基づく分子検出器の特定的な操作においては、個別の生物学的プローブがCCD
の画素上に直接固定されるか、またはCCD表面上に置かれた使い捨てカバースリ ップに結合させてもよい。サンプル分子は放射性同位体、化学発光物質または蛍
光タグで標識することができる。
The integrated CCD detection method allows for the detection of molecular binding events on the chip. The detector quickly creates a two-dimensional pattern that uniquely characterizes the sample. CC
In a specific operation of a molecular detector based on D, individual biological probes are
It may be fixed directly on the pixel of interest, or coupled to a disposable cover slip placed on the CCD surface. Sample molecules can be labeled with radioisotopes, chemiluminescent or fluorescent tags.

【0215】 CCDに基づくプローブアレイにサンプルを暴露すると、フォーマット3の場合に
は、サンプルが2つの相補的なプローブに結合された画素位置で光子または放射 性同位体の崩壊産物が発生する。その後、荷電粒子または標識サンプルからの放
射線がCCDゲートに入射すると、電子−穴対が形成される。次に、電子が隣接す るCCDゲートの下に集められ、ディスプレイモジュールで順次読み取られる。そ れぞれの画素で生成された光電子の数は、このような接近している分子結合イベ
ントの数に直接比例している。その結果、分子結合を定量的に測定することがで
きる(Eggersら, 1994)。
Exposure of a sample to a CCD-based probe array generates, in the case of format 3, photon or radioisotope decay products at pixel locations where the sample is bound to two complementary probes. Thereafter, when radiation from charged particles or labeled sample is incident on the CCD gate, electron-hole pairs are formed. Next, electrons are collected under the adjacent CCD gate and read sequentially by the display module. The number of photoelectrons generated at each pixel is directly proportional to the number of such nearby molecular binding events. As a result, molecular binding can be measured quantitatively (Eggers et al., 1994).

【0216】 イメージングアレイをサンプルに接近して配置することにより、収集効率が従
来のCCDカメラに見られるようなレンズに基づく技術よりも少なくとも10倍向上 する。すなわち、サンプル(エミッタ)を検出器(イメージングアレイ)と近く
で接触しており、このことがレンズやミラーなどの従来のイメージングオプチッ
クスを排除する。
Placing the imaging array in close proximity to the sample increases the collection efficiency by at least 10 times over lens-based techniques as found in conventional CCD cameras. That is, the sample (emitter) is in close contact with the detector (imaging array), which eliminates conventional imaging optics such as lenses and mirrors.

【0217】 放射性同位体がレポーター基として標的分子に結合される場合は、エネルギー
粒子が検出される。さまざまなエネルギーの粒子を発生する数種のレポーター基
が微細加工検出器と共に使用されて成功を収めており、32P、33P、35S、14Cおよ
125Lなどがある。32P由来のような高エネルギー粒子は最高の分子検出感度を 提供するが、35S由来のような低エネルギー粒子はより良い解像度を提供する。 それゆえ、放射性同位体レポーターは要求に合わせて選択することができる。い
ったん特定の放射性同位体標識が選択されると、Eggersら(1994)が記載するよう
に、シグナル対ノイズ比(SNR)を計算することで検出性能を推定することができ る。
If a radioisotope is attached to the target molecule as a reporter group, energetic particles are detected. And successful with several reporter group capable of generating a variety of energy of the particles is used with microfabrication detector, and the like 32 P, 33 P, 35 S , 14 C and 125 L. High energy particles, such as from 32 P, provide the highest molecular detection sensitivity, while low energy particles, such as from 35 S, provide better resolution. Therefore, the radioisotope reporter can be selected according to requirements. Once a particular radioisotope label has been selected, detection performance can be estimated by calculating the signal-to-noise ratio (SNR), as described by Eggers et al. (1994).

【0218】 別の発光検出法は、標的分子に結合された蛍光または化学発光レポーター基の
使用を含む。蛍光標識は共有結合でまたは相互作用を介して結合させることがで
きる。エチジウムブロミドなどの蛍光染料は、強力な吸収バンドがUV(300〜350
nm)域付近にあり、また、主な発光バンドが可視(500〜650 nm)域にあって、用い
るCCDデバイスに最も適している。なぜなら、量子効率が蛍光シグナル波長でよ りも励起波長で数桁分低いからである。
Another luminescence detection method involves the use of a fluorescent or chemiluminescent reporter group attached to the target molecule. Fluorescent labels can be attached covalently or via interaction. Fluorescent dyes such as ethidium bromide have strong absorption bands in the UV (300-350
nm) and the main emission band is in the visible (500-650 nm) range, making it most suitable for the CCD device used. This is because the quantum efficiency is several orders of magnitude lower at the excitation wavelength than at the fluorescence signal wavelength.

【0219】 ルミネッセンスを検出する視点からは、ポリシリコンCCDゲートはUV域の入射 光の寄与を濾過するためのビルトイン容量を有し、しかも蛍光レポーター基によ
って発生した可視ルミネッセンスに対して非常に感度がよい。UV励起に対するこ
のような大きい固有の識別は、Eggersら(1994)により提案されたCCDで大きなSNR
(100より大)を達成することを可能にする。
From the perspective of detecting luminescence, the polysilicon CCD gate has a built-in capacity to filter the contribution of incident light in the UV range and is very sensitive to visible luminescence generated by the fluorescent reporter group. Good. Such a large unique discrimination for UV excitation is due to the large SNR in the CCD proposed by Eggers et al. (1994).
(Greater than 100).

【0220】 検出器へのプローブの固定化のために、ハイブリダイゼーションマトリックス
を安価なSiO2ウェーハ上に作製することができ、次にこれがハイブリダイゼー ションおよび乾燥後にCCDの表面に配置される。このフォーマットは経済的に効 率がよい。というのは、DNAのハイブリダイゼーションが安価な使い捨てSiO2ウ
ェーハ上で実施され、したがって、比較的高価なCCD検出器の再利用を可能にす るからである。あるいはまた、CCD上に直接プローブを固定化してプローブマト リックスを作製してもよい。
For immobilization of the probe to the detector, a hybridization matrix can be made on an inexpensive SiO 2 wafer, which is then placed on the surface of the CCD after hybridization and drying. This format is economically efficient. This is because DNA hybridization is performed on inexpensive disposable SiO2 wafers, thus allowing the reuse of relatively expensive CCD detectors. Alternatively, a probe matrix may be prepared by immobilizing a probe directly on a CCD.

【0221】 SiO2コーティング上にプローブを固定するために、エポキシ-シラン試薬と標 準的なSiO2修飾化学を用いて、フィルム表面に均一なエポキシド層を結合させる
。次に、アミン修飾オリゴヌクレオチドプローブを、エポキシド環との第二級ア
ミン形成によりSiO2表面に結合させる。得られる結合により、オリゴヌクレオチ
ドの3塩基とSiO2表面とを隔離する17の回転可能な結合が提供される。完全なア ミンの脱プロトン化を確実にし、かつ結合中の二次構造体の形成を最小限とする
ために、反応を0.1 M KOH 中で実施し、37℃で6時間インキュベートする。
To immobilize the probe on the SiO 2 coating, a uniform epoxide layer is attached to the film surface using epoxy-silane reagents and standard SiO 2 modification chemistry. Next, the amine-modified oligonucleotide probes are bound to the SiO 2 surface by secondary amines formation of epoxide ring. The resulting linkage provides 17 rotatable linkages that separate the three bases of the oligonucleotide from the SiO 2 surface. The reaction is performed in 0.1 M KOH and incubated at 37 ° C. for 6 hours to ensure complete amine deprotonation and to minimize the formation of secondary structure during binding.

【0222】 一般的にフォーマット3 SBHでは、シグナルが莫大な数の地点のそれぞれにつ き評価される。全てのアレイ、例えば4000の5x5 mmを一度にハイブリダイズさせ
る必要はなく、より少ない数のアレイの使用も可能である。
Generally, in format 3 SBH, the signal is evaluated at each of a vast number of points. It is not necessary to hybridize all arrays, for example 4000 5x5 mm, at a time, and a smaller number of arrays can be used.

【0223】 サイクリングハイブリダイゼーションはハイブリダイゼーションシグナルを増
強させうる1つの方法である。1サイクルにおいて、固定プローブの大部分が標
識プローブに非相補的なテイル配列をもつDNA断片とハイブリダイズするだろう 。温度を上げることにより、これらのハイブリッドが融解される。次のサイクル
では、それらの一部(約0.1%)が適切なDNA断片とハイブリダイズし、追加の標識 プローブがライゲートされる。この場合には、両方のプローブセットに対して同
時にミスマッチをもつDNAハイブリッドの示差的融解が起こる。
[0223] Cycling hybridization is one method that can enhance the hybridization signal. In one cycle, most of the immobilized probe will hybridize to a DNA fragment having a tail sequence that is non-complementary to the labeled probe. Increasing the temperature melts these hybrids. In the next cycle, some of them (approximately 0.1%) hybridize to the appropriate DNA fragment and additional labeled probes are ligated. In this case, differential melting of DNA hybrids with mismatches for both probe sets simultaneously occurs.

【0224】 サイクルハイブリダイゼーションにおいては、サイクリングを開始する前に、
全成分を、T4の場合には37℃で、耐熱性リガーゼの場合はより高い温度で添加す
る。その後温度を15〜37℃に低下させ、チップを最大10分間インキュベートし、
次に温度を37℃またはそれ以上に数分間上昇させ、その後再度低下させる。サイ
クルを10回まで繰り返すことができる。ある変法では、サイクリングを行わずに
より高い最適温度(10〜50℃)を使用して、より長いライゲーション反応(1〜3時 間)を行うことができる。
In cycle hybridization, before starting cycling,
All components are added at 37 ° C. for T4 and at higher temperatures for thermostable ligase. Then reduce the temperature to 15-37 ° C, incubate the chip for up to 10 minutes,
The temperature is then raised to 37 ° C. or higher for a few minutes and then lowered again. The cycle can be repeated up to 10 times. In one variation, longer ligation reactions (1-3 hours) can be performed using higher optimal temperatures (10-50 ° C) without cycling.

【0225】 ここに記載する方法は、標準的な合成および精確なオリゴヌクレオチドのスポ
ッティングを用いて複雑なチップの製造を可能とするが、それは、必要なオリゴ
ヌクレオチドが比較的少数であるからである。例えば、全て7-merのオリゴ(1638
4のプローブ)を合成する場合には、2億5600万個の14-merのリストを測定するこ とができる。
The method described here allows the production of complex chips using standard synthesis and precise oligonucleotide spotting, since relatively few oligonucleotides are required. . For example, all 7-mer oligos (1638
In the case of synthesizing (4 probes), a list of 246 million 14-mers can be measured.

【0226】 本発明方法の1つの重要な変法は、ベースアレイにつき2以上の異なって標識
されたプローブを使用することである。これは2つの目的を意図して実施される
。すなわち、多重化することで、別個にハイブリダイズされるアレイの数を減少
させること、または3x6または3x7などのさらに長いオリゴ配列のリストを測定す
ることである。この場合に、2つの標識を用いるならば、3つの連続したオリゴ
ヌクレオチドの特異性は、陽性部位が両方の標識の十分なシグナルをもたねばな
らないので、ほぼ絶対的でありうる。
One important variation of the method of the invention is to use two or more differently labeled probes per base array. This is performed for two purposes. That is, multiplexing reduces the number of separately hybridized arrays, or measures a longer list of oligo sequences, such as 3x6 or 3x7. In this case, if two labels are used, the specificity of the three consecutive oligonucleotides can be almost absolute, since the positive site must have sufficient signal for both labels.

【0227】 さらなる追加の変法は、BxNyプローブ(yは1〜4)を含むチップを使用すること である。これらのチップは異なるフレームでの配列解読を可能とする。これは適
切なセットの標識プローブを用いても達成することができ、また、FプローブとP
プローブの両方がいくつかの非特定化末端位置(すなわち、末端縮重のいくつか
のエレメント)をもつことができる。また、特定配列のプローブを固相支持体に
結合させるためのリンカーの一部として普遍的(万能)な塩基を使用してもよい
。これにより、プローブはハイブリダイゼーションに一層利用可能となり、構築
物がより安定になる。プローブが5個の塩基をもつ場合、例えば、3個の普遍的
塩基をリンカーとして使用することができる。
A further additional variation is to use a chip containing a BxNy probe (y is 1-4). These chips allow sequencing in different frames. This can also be achieved with an appropriate set of labeled probes, and the F probe and P
Both probes can have several non-specific terminal positions (ie, some elements of terminal degeneracy). Further, a universal base may be used as a part of a linker for binding a probe having a specific sequence to a solid support. This makes the probe more available for hybridization and makes the construct more stable. If the probe has five bases, for example, three universal bases can be used as a linker.

【0228】実施例16 ハイブリダイゼーションデータからの配列の決定 所定のオーバーラップする(N-1)merが2回以上繰り返される場合には、配列ア
センブリが中断されうる。そのときには、最後のヌクレオチドが異なる2つのN-
merのいずれかを配列の伸長に用いることができる。この枝分かれ地点は配列の 明確なアセンブリを制限する。
Example 16 Determination of Sequence from Hybridization Data If a given overlapping (N-1) mer is repeated more than once, sequence assembly may be interrupted. Then, two N- nucleotides with different last nucleotides
Any of the mer can be used for sequence extension. This branch point limits the distinct assembly of the sequence.

【0229】 標的核酸にハイブリダイズして標的核酸の完全な配列を生成する既知オリゴヌ
クレオチドの配列の再アセンブリングは、いくつかの場合には達成され得ない。
というのは、ハイブリッド形成に使用するオリゴヌクレオチドのサイズに対して
適切なサイズの断片中に標的核酸が存在しない場合は、いくらかの情報が失われ
るからである。失われる情報の量は配列決定しようとする標的の長さに比例する
。しかし、十分に短い標的を用いるならば、その配列は明確に決定されるだろう
[0229] Reassembly of the sequence of a known oligonucleotide that hybridizes to the target nucleic acid to produce the complete sequence of the target nucleic acid cannot be achieved in some cases.
This is because some information is lost if the target nucleic acid is not present in a fragment of the appropriate size for the size of the oligonucleotide used for hybridization. The amount of information lost is proportional to the length of the target being sequenced. However, if a sufficiently short target is used, its sequence will be unambiguously determined.

【0230】 ある長さのDNAに沿って分布している、配列アセンブリを妨害しうる重複配列 の予想される頻度は計算することが可能である。この誘導には、配列組織化を処
理しなければならないパラメーターの定義を導入する必要がある。すなわち、配
列サブフラグメント(SF)である。配列サブフラグメントは、標的核酸の配列の任
意の一部が標的配列内で2回以上反復されている(N-1)merから出発してそれで終
わるときに結果として生じる。かくして、サブフラグメントは本発明方法による
配列アセンブリの過程で2つの枝分かれ点の間に生じる配列である。全てのサブ
フラグメントを合計した長さは、オーバーラップする短い末端のため、実際の標
的核酸よりも長い。一般には、サブフラグメントは追加の情報がないと直鎖型に
アセンブリされ得ない。なぜならば、それらは末端部および開始部で(N-1)merを
共有するからである。反復(N-1)merの数に応じて各核酸標的について異なる数の
サブフラグメントが得られる。その数はN-1の値と標的の長さに依存する。
[0230] The expected frequency of overlapping sequences that can interfere with sequence assembly, distributed along a length of DNA, can be calculated. This derivation requires the introduction of definitions of the parameters that must be processed for sequence organization. That is, it is a sequence subfragment (SF). Sequence subfragments result when any part of the sequence of the target nucleic acid starts and ends with an (N-1) mer that is repeated more than once in the target sequence. Thus, a subfragment is a sequence that occurs between two branch points during sequence assembly according to the method of the present invention. The combined length of all subfragments is longer than the actual target nucleic acid due to the overlapping short ends. In general, subfragments cannot be assembled in a linear fashion without additional information. Because they share a (N-1) mer at the end and at the start. A different number of subfragments is obtained for each nucleic acid target depending on the number of repeat (N-1) mers. The number depends on the value of N-1 and the length of the target.

【0231】 確率の計算は2つのファクターの相互関係を推定することができる。陽性のN-
merの順序付けが長さN-1のまたはAoの平均距離のオーバーラップ配列を使用する
ことで達成される場合、N-1個のLf塩基長の断片は次の方程式により示される。 Nsf = 1 + Ao X K X P(K, Lf) ここで、Kは2より大きいか2に等しく、P(K, Lf)はLf塩基長の断片上にK回存在
するN-merの確率を表す。また、所定の配列についてN-merの含量からサブ断片を
形成することができるコンピュータプログラムは以下の実施例18において説明す
る。
The calculation of probabilities can estimate the interrelation of the two factors. Positive N-
If mer ordering is achieved using overlapping sequences of length N-1 or an average distance of Ao, a fragment of N-1 Lf base lengths is given by the following equation: N sf = 1 + Ao XKXP (K, L f ) where K is greater than or equal to 2 and P (K, L f ) is the number of N-mers present K times on the L f base fragment Represents the probability. Also, a computer program capable of forming a subfragment from the N-mer content for a given sequence is described in Example 18 below.

【0232】 サブ断片の数は所定の長さのプローブの場合に断片の長さの増加とともに増加
する。得られた断片はそれら自体の中でユニークに順序付けられ得ない。完全で
はないものの、この情報は比較配列分析および機能的配列特徴の認識にとって非
常に有用である。このタイプの情報は部分配列と呼ばれる。部分配列を得るため
の別の方法は、所定の長さのオリゴヌクレオチドプローブのサブセットのみを使
用することである。
The number of subfragments increases with increasing fragment length for probes of a given length. The resulting fragments cannot be uniquely ordered within themselves. Although not complete, this information is very useful for comparative sequence analysis and recognition of functional sequence features. This type of information is called a subarray. Another method for obtaining subsequences is to use only a subset of oligonucleotide probes of a given length.

【0233】 理論により推定された配列とランダムDNA配列のコンピュータシュミレーショ ンとの間には比較的良好な一致が見られる。例えば、N-1=7 [8-merまたは5'(A,T
,C,G) B8 (A,T,C,G)3'のタイプの16の10-merの群を使用] の場合、200塩基の標 的核酸は平均3つのサブ断片をもつだろう。しかし、平均付近のばらつきのため
、標的核酸のライブラリーは、2000の標的のうち1未満が3より多いサブ断片を
もつように500 bpのインサートをもつべきである。かくして、ランダム配列の長
い核酸の配列決定の理想的なケースでは、標的核酸の十分に短いインサートを含
む代表的ライブラリーが使用される。このようなインサートの場合は、本発明の
方法により個々の標的を再構築することが可能である。その後、特定された個々
のインサート配列を重ね合わせることにより大きな核酸の全配列が得られる。
There is relatively good agreement between the theoretically deduced sequence and the computer simulation of the random DNA sequence. For example, N-1 = 7 [8-mer or 5 '(A, T
, C, G) B 8 (A, T, C, G) 3 'type of 16 10-mers used], a target nucleic acid of 200 bases would have an average of 3 subfragments . However, due to near-average variability, the library of target nucleic acids should have a 500 bp insert so that less than 1 out of 2000 targets has more than 3 subfragments. Thus, in the ideal case of sequencing long nucleic acids of random sequence, a representative library containing sufficiently short inserts of the target nucleic acid is used. In the case of such inserts, it is possible to reconstruct individual targets by the method of the present invention. Thereafter, the entire sequence of the large nucleic acid is obtained by superimposing the specified individual insert sequences.

【0234】 非常に短い断片(例えば、8-merプローブについては50塩基)の必要性を減ず るためには、クローニングのようなランダムDNA断片化方法またはランダムPCRに
おいて存在するオーバーラップ断片中に含まれる情報が使用される。また、短い
物理的核酸断片のプールを使用することも可能である。1メガベースの配列決定
のために8-merまたは11-mer、例えば5'(A,T,C,G) N8 (A,T,C,G)3'を使用すると 、20,000の50 bp断片を必要とする代わりに、たった2,100のサンプルで十分であ
る。この数は700個の7 kbクローン(基本ライブラリー)、500 bpの20個のクロ ーンの1250のプール(サブ断片順序付けライブラリー)およびジャンピング(ま
たは類似の)ライブラリーからの150個のクローンから成る。開発されたアルゴ リズム(実施例18参照)により、これらの記載されたサンプルのハイブリダイゼ
ーションデータを用いて配列が再構成される。
To reduce the need for very short fragments (eg, 50 bases for an 8-mer probe), random DNA fragmentation methods such as cloning or overlapping fragments present in random PCR The information contained is used. It is also possible to use pools of short physical nucleic acid fragments. 1 8-mer for sequencing megabase or 11-mer, for example, 5 '(A, T, C , G) N 8 (A, T, C, G) 3' With, 20,000 50 bp fragment Instead of requiring only 2,100 samples are sufficient. This number includes 700 7 kb clones (basic library), 1250 pools of 20 clones of 500 bp (subfragment ordered library) and 150 clones from the jumping (or similar) library. Consists of The algorithm developed (see Example 18) reconstructs the sequence using the hybridization data of these described samples.

【0235】実施例17 アルゴリズム この実施例は、開始核酸配列の最小数のランダムに決めた個々の断片において
構成成分であるk-タプルのワードから4文字のアルファベットで書かれる長い 配列を生じさせるアルゴリズムについて記載する(ここで、kはオリゴヌクレオ チドプローブの長さである)。このアルゴリズムは主としてハイブリダイゼーシ
ョン(SBH)プロセスによる配列決定での使用を意図したものである。このアルゴ リズムはサブ断片(SF)、情報提供断片(IF)および情報提供断片を定義するのに物
理的核酸配列のプールを使用できることに基づいている。
Example 17 Algorithm This example is an algorithm for generating a long sequence written in four-letter alphabets from the constituent k-tuple words in a minimum number of randomly determined individual fragments of the starting nucleic acid sequence. Where k is the length of the oligonucleotide probe. This algorithm is primarily intended for use in sequencing by the hybridization (SBH) process. This algorithm is based on the ability to use a pool of physical nucleic acid sequences to define subfragments (SF), informative fragments (IF) and informative fragments.

【0236】 記載のように、サブ断片は標的核酸k-1オリゴマー配列の反復によるものであ るアセンブリプロセスにおいて分岐点によって引き起こされうる。サブ断片は配
列中に生じる長さK-1の任意の2つの反復ワードの間に見られる配列断片である。
K-1ワードの多重発生は、配列形成プロセスにおけるK-ワードのオーバーラップ の整列の中断の原因である。中断により配列はサブ断片の形態のままとなる。こ
のように、その順序が独自に決定される分岐点間の明白なセグメントは配列サブ
断片と呼ばれる。
As noted, subfragments can be caused by branch points in the assembly process that are due to repetition of the target nucleic acid k-1 oligomer sequence. A subfragment is a sequence fragment that occurs between any two repeated words of length K-1 that occurs in the sequence.
Multiple occurrences of the K-1 word cause breaks in the alignment of the K-word overlaps in the alignment process. The interruption leaves the sequence in the form of subfragments. Thus, the distinct segments between the branch points, whose order is uniquely determined, are called sequence sub-fragments.

【0237】 情報提供断片はオーバーラップした物理的配列断片の最も近い末端によって決
定される配列の断片として定義される。
An informational fragment is defined as a fragment of the sequence determined by the closest end of the overlapping physical sequence fragment.

【0238】 ある数の物理的断片は、情報提供断片を定義できる可能性を失わずにプールさ
れうる。ランダムにプールされた断片の全長は配列決定プロセスで使用されるk
-タプルの長さに依存する。
A certain number of physical fragments can be pooled without losing the possibility of defining information providing fragments. The total length of the randomly pooled fragments is the k used in the sequencing process.
-Depends on tuple length.

【0239】 このアルゴリズムは2つのメインユニットからなる。第1の部分は、配列中に含
まれるk-タプルのセットからサブ断片を生じさせるのに使用される。サブ断片 はあるサイズの物理的核酸配列のコード領域内、または長い核酸配列内で定義さ
れる情報提供断片内で形成され得る。両種の断片は基本ライブラリーに属するも
のである。このアルゴリズムでは、この基本ライブラリーの情報提供断片のk- タプルの内容の決定、すなわち配列形成プロセスで使用される情報提供断片の製
造段階については記載しない。
This algorithm consists of two main units. The first part is used to generate sub-fragments from the set of k-tuples contained in the sequence. Subfragments can be formed within the coding region of a physical nucleic acid sequence of a certain size, or within an informational fragment defined within a long nucleic acid sequence. Both types of fragments belong to the basic library. This algorithm does not describe the determination of the contents of the k-tuples of the informational fragments of this basic library, ie the stage of production of the informational fragments used in the sequence formation process.

【0240】 このアルゴリズムの第2の部分は基本ライブラリーの核酸断片の完全配列を再 形成する目的で得られたサブ断片の直線上の順序を決定する。この目的のため、
ランダムにプールされた開始配列の断片からなる第2の整列ライブラリーが使用 される。このアルゴリズムは、全メガベースプラス配列を再形成するための塩基
断片の配列を組み合わせるステップを含まない。これは情報提供断片形成の必要
条件である基本ライブラリーの断片の連結を用いて達成してもよい。あるいは、
通常の末端配列の存在に基づき、それらのオーバーラップに関する検索を使用し
、このアルゴリズムにより基本ライブラリーの断片の配列を形成した後これを達
成してもよい。
The second part of the algorithm determines the linear order of the sub-fragments obtained for the purpose of reforming the complete sequence of the nucleic acid fragments of the basic library. For this purpose,
A second aligned library of randomly pooled fragments of the starting sequence is used. The algorithm does not include the step of combining the sequences of the base fragments to recreate the entire megabase plus sequence. This may be achieved using the ligation of fragments of the basic library, a requirement for informative fragment formation. Or,
Based on the presence of normal terminal sequences, a search for their overlap may be used, and this algorithm may achieve this after forming the sequence of fragments of the basic library.

【0241】 このアルゴリズムは基本および整列ライブラリーの核酸配列における所定のk
-タプルの出現数を知る必要もないし、k-タプルのワードの情報が断片の末端に
存在するという情報も必要としない。アルゴリズムは、種々の長さのk-タプル のワードの混合内容物を用いて実行される。このアルゴリズムのコンセプトによ
り、偽陽性および偽陰性のk-タプルを含むk-タプルセットを用いた演算が可能
となる。特殊な場合にのみ偽k-タプルの内容は主として生じた配列の完全性お よび正確性に影響を及ぼす。このアルゴリズムはシミュレーション実験における
パラメーターの最適化、ならびに実際のSBH実験における配列形成、例えばゲノ ムDNA配列の形成にも使用してよい。パラメーターの最適化において、実際の
便宜な断片のためのオリゴヌクレオチドプローブ(k-タプル)の選択、ならび に/または定義されたプローブのための最適な長さおよび断片数の選択は特に重
要である。
[0241] This algorithm uses the predefined k
-It is not necessary to know the number of occurrences of the tuple, nor is it necessary to know that the information of the word of the k-tuple exists at the end of the fragment. The algorithm is implemented with a mixed content of k-tuple words of various lengths. The concept of this algorithm allows operations using k-tuple sets that include false positive and false negative k-tuples. Only in special cases, the content of the pseudo k-tuple mainly affects the integrity and correctness of the resulting sequence. This algorithm may be used to optimize parameters in simulation experiments, as well as in sequence formation in actual SBH experiments, for example in the formation of genomic DNA sequences. In optimizing parameters, the choice of oligonucleotide probes (k-tuples) for practical and convenient fragments and / or the choice of optimal length and number of fragments for defined probes is of particular importance. .

【0242】 このアルゴリズムの部分は、k-タプルの内容から配列を形成するプロセスに 中心的な役割を持つ。これは、最大のオーバーラップによるk-タプルの固有の 整列に基づくものである。配列の形成における主な障害は、特異的な反復配列と
偽陽性および/または偽陰性のk-タプルである。このアルゴリズムの部分の目 的は、正しい配列を持つ最小の数のできるだけ最長のサブ断片を得ることである
。このアルゴリズムの部分は1つの基本ステップといくつかの制御ステップから
なる。ある情報はすべての一次サブ断片の形成後にのみ使用できるので、二段階
のプロセスが必要である。
This part of the algorithm plays a central role in the process of forming an array from the contents of the k-tuple. This is based on the inherent alignment of k-tuples with maximum overlap. The major obstacles to sequence formation are specific repeats and false positive and / or false negative k-tuples. The purpose of this part of the algorithm is to obtain the smallest number of longest possible subfragments with the correct sequence. The part of this algorithm consists of one basic step and several control steps. Since some information is only available after the formation of all primary sub-fragments, a two-step process is required.

【0243】 配列形成の主な問題は、定義によっては個々のk-タプルの発生数に関する情 報を持たないワード内容から反復配列を得ることである。アルゴリズム全体のコ
ンセプトはこの問題を解決するという基本によっている。原則として2つの相対 するアプローチがあり、それは1)反復配列がpSFの形成プロセスの最初に得られ るか、または2)反復配列がその後のサブ断片の最終整列プロセスで得られるかで
ある。第1の場合、pSFは過剰な配列を含み、第2の場合では、それらは配列の配
列の欠損を含む。第1のアプローチは形成された過剰な配列の削除が必要であり 、第2の場合では、配列の最終アセンブリのプロセスでいくつかのサブ断片の多
重的な使用を許容する必要がある。
The main problem with array formation is to obtain repetitive arrays from word contents that, by definition, have no information about the number of occurrences of individual k-tuples. The whole algorithm concept relies on the basics of solving this problem. In principle, there are two opposing approaches: 1) the repetitive sequence is obtained at the beginning of the pSF formation process, or 2) the repetitive sequence is obtained in the subsequent subfragment final alignment process. In the first case, the pSF contains excess sequences; in the second case, they contain sequence deletions in the sequences. The first approach requires the elimination of excess sequences formed, and the second case requires the multiple use of several sub-fragments in the process of final assembly of the sequences.

【0244】 K-タプルの固有のオーバーラップの法則の厳格さの程度におけるこの2つの アプローチの違い。あまり厳格でない法則は、k-タプルXは、k-タプルXの最も
右側のk-1末端がk-タプルYの最も左側の末端にしか存在しない場合に、またそ の場合だけに、明確にk-タプルYと最大限にオーバーラップするということであ
る。この法則によって、反復配列の形成および余剰配列の形成が可能となる。
The difference between the two approaches in the degree of rigor of the inherent overlap law of K-tuples. A less strict rule is that k-tuple X is unambiguous if, and only if, the rightmost k-1 end of k-tuple X is only at the leftmost end of k-tuple Y. That is, it overlaps the k-tuple Y as much as possible. This rule allows the formation of repetitive sequences and the formation of redundant sequences.

【0245】 第2のアプローチで使用されるより厳格な法則はさらなる警告を持ち、k-タプ
ルXは、k-タプルXの最も右側のk-1末端がk-タプルYの最も左側の末端にだけ存
在する場合、またその場合だけに、かつ、k-タプルYの最も左側のk-1末端が他 のいすれかのk-タプルの最も右側には存在しない場合に明確に最大限にk-タプ
ルオーバーラップする。より厳格な法則に基づくアルゴリズムはより単純で、こ
れが本明細書に記載される。
The stricter rule used in the second approach has a further caveat: k-tuple X has the rightmost k-1 end of k-tuple X at the leftmost end of k-tuple Y. , And only in that case, and if the leftmost k-1 end of k-tuple Y is not present on the rightmost of any other k-tuple, -Overlap tuples. Algorithms based on stricter rules are simpler and are described herein.

【0246】 所定のサブ断片の伸長プロセスは、含まれる最後のk-タプルの右側のk-1末端
がいずれかのk-タプルの左側に存在しないか、または2個の以上のk-タプルに 存在する場合に停止する。もしそれがあるk-タプルに存在すれば、この法則の2
番目の部分が試験される。さらにこれまでに含まれたものとは異なるk-タプル があれば、所定のサブ断片の構築物は最初の最も左側の位置でしか終結しない。
もしこの付加的なk-タプルが存在しなければ、この条件は固有のk-1オーバーラ
ップに適合し、所定のサブ断片は右側で1つの構成要素だけ伸長する。
The process of elongation of a given sub-fragment may be such that the k-1 end to the right of the last k-tuple involved is not present on the left of any k-tuple, or that two or more k-tuples are present. Stop if present. If it exists in a k-tuple, this rule of 2
The second part is tested. Furthermore, given a different k-tuple than previously included, the construction of a given subfragment will only terminate at the first leftmost position.
If this additional k-tuple were not present, this condition would fit a unique k-1 overlap and a given sub-fragment would extend one component on the right.

【0247】 この基本法則の他、種々の長さのk-タプルの使用を可能にするため、補足的 なものが使用される。最大のオーバーラップは、オーバーラップ対のより短いk
-タプルのk-1の長さでなる。PSFの形成は、k-タプルが核酸配列におけるそれら
の順序からランダムかつ独立して表示されるファイルから得られる最初のk-タ プルから始まって遂行される。従って、ファイルのk-タプルは、配列の開始に も、特定のサブ断片の開始にも必ずしも必要ではない。サブ断片形成のプロセス
は、記載の法則によって定義された固有のオーバーラップによりk-タプルを整 列することによって行われる。使用された各々のk-タプルはそのファイルから 消去される。含まれる最後のものと明確にオーバーラップするk-タプルがそれ 以上ないという時点で、サブ断片の構築が終わり、別のpSFの構築が始まる。大 多数のサブ断片の形成はそれらの実際の開始から始まるわけではないので、形成
されたpSFはk-タプルのファイルに加えられ、より長いk-タプルと考えられる 。もう1つの可能性としては、開始時のk-タプルから両方向に進行するサブ断 片を形成することである。このプロセスは、さらなるオーバーラップ、すなわち
サブ断片のいずれもの伸長が可能でない場合に終了する。
In addition to this basic rule, supplements are used to allow the use of k-tuples of various lengths. The maximum overlap is the shorter k of the overlap pair
-Consists of the length of tuple k-1. PSF formation is performed starting from the first k-tuple obtained from a file in which k-tuples are randomly and independently displayed from their order in the nucleic acid sequence. Thus, the k-tuple of the file is not necessary at the start of the sequence nor at the start of a particular sub-fragment. The process of subfragmentation is performed by aligning k-tuples with unique overlaps defined by the rules described. Each k-tuple used is deleted from the file. At the point when there are no more k-tuples that clearly overlap the last one included, the construction of the subfragment is over and the construction of another pSF begins. Since the formation of the majority of subfragments does not start from their actual onset, the formed pSF is added to a file of k-tuples and is considered a longer k-tuple. Another possibility is to form sub-segments that proceed in both directions from the starting k-tuple. The process ends when no further overlap, ie, extension of any of the sub-fragments, is possible.

【0248】 pSFは次の3つのグループに分けられる、1)正しいk-タプルセットの場合の最 長かつ正しい配列のサブ断片;2)不完全なセットおよび/または偽陽性のk-タ プルをいくつか有するセットに対する最大かつ明確なオーバーラップ法則の使用
によって形成された短いサブ断片;および3)不正確な配列のpSF。2)のセットの 不完全性はハイブリダイゼーション実験の偽陰性の結果、ならびに不正確なk- タプルのセットの使用によって生じる。これらは偽陽性および偽陰性のk-タプ ルによって形成され、a)誤って連結したサブ断片;b)誤った末端を有するサブ断
片;およびc)最小限の誤ったサブ断片として現れる偽陽性のk-タプルである可 能性がある。
The pSF is divided into three groups: 1) the longest and correct sequence subfragment in the case of the correct k-tuple set; 2) the incomplete set and / or false positive k-tuples. Short sub-fragments formed by the use of the largest and clearest overlap rule for sets with some; and 3) pSF with incorrect sequence. The incompleteness of the set of 2) results from false negative results of hybridization experiments, as well as the use of incorrect k-tuple sets. These are formed by false positive and false negative k-tuples, a) misligated subfragments; b) subfragments with incorrect ends; and c) false positives that appear as minimal false subfragments. It may be a k-tuple.

【0249】 偽陽性のk-タプルを考慮すると、誤った塩基を1より多く含むか、または中央
部のどこかに1つの誤った塩基を含むk-タプルが存在する可能性、ならびに末 端に誤った塩基を有するk-タプルである可能性がある。短いか、誤りを有する か、または誤って連結したサブ断片は後者のk-タプルによって生じるものであ る。前者2種のk-タプルは、k-タプルの長さに等しい長さを有する誤ったpSF を表す。
Given the false positive k-tuples, the possibility that there are k-tuples containing more than one wrong base or one wrong base somewhere in the middle, and at the end It may be a k-tuple with the wrong base. Short, erroneous or mis-ligated subfragments are those caused by the latter k-tuple. The former two k-tuples represent an erroneous pSF having a length equal to the length of the k-tuple.

【0250】 ある偽陰性のk-タプルの場合では、最大のオーバーラップが不可能なためにp
SFが生じる。最も左側または最も右側の末端に誤った塩基を有する、1つの偽陽
性のk-タプルが存在する場合には、明確なオーバーラップが不可能なためpSFが
生じる。共通のk-1配列を有する偽陽性および偽陰性双方のk-タプルがファイル に存在する場合はpSFが生じ、これらのpSFの1つは関連した末端に偽k-タプル を含む。
In the case of one false-negative k-tuple, p
SF occurs. If there is one false-positive k-tuple with the wrong base at the left most or right most end, pSF occurs because no clear overlap is possible. If both false-positive and false-negative k-tuples with a common k-1 sequence are present in the file, a pSF results, one of these pSFs containing a false k-tuple at the relevant end.

【0251】 配列に誤りを持つサブ断片を修正して明確に連結したpSFを連結するプロセス は、サブ断片の形成後およびサブ断片の整列プロセス中に行われる。誤って連結
したpSFを切除し、pSFの明確な連結により最終的なサブ断片を得ることからなる
第1のステップを下記に記載する。
The process of correcting sequence-corrected subfragments to ligate the clearly ligated pSF occurs after the formation of the subfragments and during the subfragment alignment process. The first step, which consists of excision of misligated pSF and obtaining the final subfragment by unambiguous ligation of pSF, is described below.

【0252】 誤って結合されたサブ断片の形成のためには2つのアプローチがある。第1に
は、長さk-1の反復配列の構築点に偽k-タプルが見られる場合に誤りが生じる。
第2には、反復配列はk-1より短い。これらの状況は各々2つの変異型に生じ得 る。第1の変異型では、反復配列の1つは断片の末端を表す。第2の変異型では
、反復配列は断片内のいずれの位置でも生じる。第1の可能性に関しては、誤っ
た結合を形成するには、ファイルにk-タプルが存在しないことが(偽陰性)要 求される。第2の可能性では、ファイルに偽陰性および偽陽性双方のk-タプル が存在する必要がある。K-1配列の反復を考慮すると、どちらかの末端が内部に 反復を持つ場合には1つのk-タプルを欠くだけで十分である。厳密には内部の 反復には2つ欠如することが必要である。この理由は、配列の末端が、情報科学
的には、偽陰性のk-タプルのエンドレスの直鎖状アレイとみなされるからであ る。「k-1の場合よりも小さい」ということから、2つまたは3つの特異的な偽k-
タプルを要する、k-2の長さの反復配列だけが考慮されよう。これらは実際の実 験で検出される唯一のケースであって、その他のものはそれほど頻繁ではない可
能性が高い。
There are two approaches for the formation of mislinked subfragments. First, an error occurs when a pseudo k-tuple is found at the construction point of a repeat sequence of length k-1.
Second, the repeats are shorter than k-1. Each of these situations can occur in two variants. In the first variant, one of the repeats represents the end of the fragment. In the second variant, the repeat sequence occurs at any position within the fragment. With regard to the first possibility, the formation of a false bond requires that the file has no k-tuple (false negative). The second possibility requires that both false negative and false positive k-tuples be present in the file. Considering K-1 sequence repeats, it is sufficient to lack one k-tuple if either end has internal repeats. Strictly speaking, the inner repetition needs to lack two. The reason for this is that the ends of the sequence are informatively regarded as endless, linear arrays of false-negative k-tuples. From "smaller than k-1", two or three specific pseudo k-
Only k-2 length repeats requiring tuples would be considered. These are the only cases that will be detected in actual experiments; others are likely to be less frequent.

【0253】 誤って結合されたサブ断片の認識は、その断片の末端に反復配列が見られない
場合により厳密に定義される。この状況においては、さらに2つのサブ断片を検 出でき、そのうち1つは最も左側の末端に、もう一方は最も右側の末端にk-2配列
を含み、これは誤って結合されたサブ断片にも存在する。反復配列が断片の末端
にある場合、その最も左側または最も右側の端部でのサブ断片の形成に誤りが生
じるk-2配列を含む唯一のサブ断片が存在する。
Recognition of misligated subfragments is more precisely defined when no repetitive sequence is found at the end of the fragment. In this situation, two additional subfragments can be detected, one containing the k-2 sequence at the leftmost end and the other at the rightmost end, which is Also exists. If the repeat sequence is at the end of the fragment, there is only one subfragment containing the k-2 sequence that will erroneously form the subfragment at its leftmost or rightmost end.

【0254】 切除による誤って結合されたサブ断片の除去は一般的な法則に従って行われる
。すなわち、いずれかのサブ断片のk-2の長さの最も左側または最も右側の配列 が他のいずれかのサブ断片に存在すれば、そのサブ断片は切断されて、その各々
がk-2配列を含む2つのサブ断片となる。この法則は、反復k-1配列の点で1つより
多い偽陰性のk-タプルが存在するという、反復末端のまれな状況を包含しない 。この種の誤って結合されたサブ断片は、オーバーラップした断片、または基本
ライブラーおよび整列ライブラリーの双方の情報提供断片からの情報情報を用い
て認識できる。さらに、誤って結合されたサブ断片は、同一のk-1配列を含む両 方の位置で2以上の偽陰性のk-タプルが生じたときには、そのままである。それ
は特異的な偽k-タプルを少なくとも4つ要するので、これは極めてまれな状況で
ある。もし、あるサブ断片の余端および他の断片の開始部分から得たk-2より短 い配列の組合せにより所定の配列が得られるならば、長さkの配列上でこれらの サブ断片を切除するためにさらなる法則を導入することができる。
The removal of mislinked subfragments by excision is performed according to general rules. That is, if the leftmost or rightmost sequence of the k-2 length of any subfragment is present in any other subfragment, that subfragment is truncated and each of them is a k-2 sequence. Into two sub-fragments. This rule does not cover the rare situation of repeated ends where there is more than one false-negative k-tuple in terms of repeated k-1 sequences. Such mislinked sub-fragments can be identified using overlapping fragments or informational information from the informative fragments of both the basic library and the aligned library. In addition, misligated subfragments remain when more than one false-negative k-tuple occurs at both positions containing the same k-1 sequence. This is a very rare situation because it requires at least four specific pseudo k-tuples. If a given sequence can be obtained by combining sequences shorter than k-2 from the remainder of one subfragment and the beginning of another fragment, these subfragments are excised on the sequence of length k. Additional rules can be introduced to do this.

【0255】 記載の法則の厳密な適用により、出力の精度を保証するには幾分完全性が失わ
れる。いくつかのサブ断片は、誤って結合されたサブ断片のパターンに適合する
ので、連結に誤りがないのに切除される。この種のものにはいくつかの状況があ
る。例えば、断片が少なくとの2つの同一のk-1配列の他にk-1由来のk-2配列のい
ずれかを含み、あるいは断片は少なくとも2回反復するk-2配列と、中央部に所定
のk-2配列を含む少なくとも1つの偽陰性k-タプルとを含む、等。
Due to the strict application of the described rules, some integrity is lost to guarantee the accuracy of the output. Some sub-fragments will be excised without error in ligation as they will match the pattern of mis-ligated sub-fragments. There are several situations with this kind. For example, a fragment may include at least two identical k-1 sequences plus any of the k-1 derived k-2 sequences, or the fragment may have at least two repeated k-2 sequences and a central At least one false negative k-tuple containing the predetermined k-2 sequence, and so on.

【0256】 このアルゴリズム部分の目的は、pSFの数を減らして、正しい配列を有するよ り長いサブ断片を最小数にすることである。特異なより長いサブ断片または完全
な配列の形成は2つの状況下で可能となる。第1の状況は反復するk-1ワードの特 定順序に関するものである。最大限に伸長したpSF(第1のグループのpSF)のい くつかまたはすべてが固有の順序を持つ場合がある。例えば、断片S-R1-a-R2-b-
R1-c-R2-E(ここで、SよびEは断片の開始点および終結点であり、a、bおよびcは
個々のサブ断片に特異的な異なる配列であり、R1およびR2はタンデムに反復する
2つのk-1配列である)では、5つのサブ断片が形成される(S-R1、R1-a-R2、R2-B-
R1、R1-c-R2、およびR-E)。これらは、前記のオリジナル配列またはS-R1-c-R-b-
R1-a-R-Eの2通りで整列され得る。これに対し、順序は異なるが同じ数およびタ イプの反復配列を有する断片、すなわちS-R1-a-R1-b-R-c-R-Eでは、すべてサブ 断片を含むそれ以外の配列はない。このタイプの例はpSFの形成プロセスの後に しか認識できない。それらはpSF形成プロセスの2つのステップの必要性を表すも
のである。ファイルが偽陰性および/または偽陽性のk-タプルを含む場合、非 反復k-1配列の位置での誤った短いサブ断片の形成の第2の状況はより重要である
The purpose of this part of the algorithm is to reduce the number of pSF to minimize the number of longer sub-fragments with the correct sequence. The formation of unique longer sub-fragments or complete sequences is possible under two circumstances. The first situation concerns a particular order of repeating k-1 words. Some or all of the maximally expanded pSF (the first group of pSF) may have a unique order. For example, the fragment S-R1-a-R2-b-
R1-c-R2-E (where S and E are the start and end of the fragment, a, b and c are different sequences specific to individual subfragments, and R1 and R2 are tandem Repeat
With two k-1 sequences), five subfragments are formed (S-R1, R1-a-R2, R2-B-
R1, R1-c-R2, and RE). These are the original sequences or S-R1-cRb-
R1-aRE can be aligned in two ways. On the other hand, in a fragment having a different order but the same number and type of repetitive sequences, that is, S-R1-a-R1-bRcRE, there is no other sequence including all subfragments. This type of example can only be recognized after the pSF formation process. They demonstrate the need for two steps in the pSF formation process. If the file contains false negative and / or false positive k-tuples, the second situation of the formation of erroneous short subfragments at the position of the non-repetitive k-1 sequence is more important.

【0257】 PSFの両グループについては状況は2つの部分からなっている。まず、最小のサ
ブ断片の不在として現れる偽陽性のk-タプルが除去される。最大数の連結の形 成を可能にするには、いずれかの末端にオーバーラップを持たない長さkの、一 方の末端でk-aより長く、かつ他方のでk-bより長い長さのk-タプルのサブ断片 のすべては除去される。発明者らの実験では、aとbがそれぞれ2と3の値であれば
、十分な数の偽陽性のk-タプルが十分除去されると考えられた。
For both groups of PSF, the situation consists of two parts. First, false positive k-tuples that appear as the absence of the smallest subfragment are removed. To allow for the formation of the maximum number of linkages, k-tuples of length k with no overlap at either end, longer than ka at one end and longer than kb at the other end All of the subfragments are removed. In our experiments, it was thought that if a and b were 2 and 3, respectively, a sufficient number of false positive k-tuples would be sufficiently eliminated.

【0258】 固有に連結され得るサブ断片の組込み(merging)は第2のステップで達成される
。連結法則は、2つのサブ断片の適した終結点または開始点にあるオーバーラッ プ配列が他のいずれかのサブ断片の開始点および/または終結点に存在しなけれ
ば、またその場合にのみ2つのサブ断片が明確に連結するというものである。
[0258] Merging of subfragments that can be uniquely linked is achieved in a second step. The ligation rule states that an overlapping sequence at a suitable end or start of two sub-fragments is not present at the start and / or end of any other sub-fragment, and only then. The two subfragments are clearly linked.

【0259】 考慮される対に由来する1つのサブ断片が同一の開始点および終結点を有して
いる場合は除外される。この場合、同一の終結点を有する別のサブ断片がファイ
ルに存在していたとしても連結は可能である。ここでの主な問題は、オーバーラ
ップ配列の正確な定義である。もし、1対のサブ断片だけに特異的であるオーバ ーラップ配列がk-2より短いか、同じか、または長いが、k-4より長いいずれかの
長さのオーバーラップ配列とともにさらなるサブ断片が存在していれば連結は許
容されない。また、pSFの正しい両末端および1つの(または数個の)最後の塩基
を除いた後の末端も、オーバーラップ配列とみなされる。
Excludes cases where one subfragment from the pair under consideration has the same start and end point. In this case, concatenation is possible even if another sub-fragment having the same end point exists in the file. The main problem here is the precise definition of the overlapping sequence. If an overlapping sequence that is specific to only one pair of subfragments is shorter than, the same as, or longer than k-2, but additional lengths of overlap sequences of any length longer than k-4 are If present, concatenation is not allowed. Also, the correct ends of pSF and the end after removing one (or several) last base are also considered overlapping sequences.

【0260】 このステップの後、いくつかの偽陽性のk-タプル(最小のサブ断片として) および誤った末端を有するいくつかのサブ断片が残る。さらに、ある数の幾分か
特異的な偽k-タプルが同時に存在するという極めてまれな場合では、誤った連 結が起こり得る。これらのケースはサブ断片整列プロセスで、また切除されなか
った「誤って結合された」サブ断片の取扱いを伴うさらなる制御ステップで検出
および解明される。
After this step, some false positive k-tuples (as the smallest subfragment) and some subfragments with incorrect ends remain. Furthermore, in the very rare case where a certain number of somewhat specific pseudo k-tuples are present at the same time, incorrect coupling can occur. These cases are detected and resolved in the subfragment alignment process and in a further control step involving the handling of unremoved "misbound" subfragments.

【0261】 得られた短いサブ断片には2種類がある。通常の場合、これらのサブ断片は、 反復するk-1配列が分布しているのでそれら自身の間で明確に連結され得る。 これはpSFの形成プロセス後に行われてもよく、pSFの形成プロセスに2つのステ ップが必要であることのよい例である。偽陽性および/または偽陰性のk-タプ ルを含むファイルを用いる場合、非反復k-1配列の部位に短いpSFが得られる。偽
陽性のk-タプルを考慮すると、k-タプルは誤った塩基を1個より多く含み(あ るいは中央部のどかかに1個の誤った塩基を含む)、さらにその末端にk-タプル
を含みうる。短い、誤った(または誤って結合された)サブ断片の形成は、後者
のk-タプルによって引き起こされる。前者の種のk-タプルは、k-タプルの長 さに等しい長さを有する誤ったpSFを表す。
There are two types of short subfragments obtained. Usually, these sub-fragments can be clearly linked between themselves due to the distribution of the repeating k-1 sequence. This may be done after the pSF formation process and is a good example of the fact that the pSF formation process requires two steps. When using a file containing false positive and / or false negative k-tuples, a short pSF is obtained at the site of the unique k-1 sequence. Considering false-positive k-tuples, k-tuples contain more than one wrong base (or contain one wrong base somewhere in the middle), and a k-tuple at the end. May be included. The formation of short, incorrect (or incorrectly linked) subfragments is caused by the latter k-tuple. A k-tuple of the former kind represents an erroneous pSF having a length equal to the length of the k-tuple.

【0262】 アルゴリズムのpSF部分を組み込む目的は、pSFの数を、正確な配列を有する長
いサブ断片の最小限の数まで減少させることである。最大限に連結できるよう、
一方の末端のk-aより長く、かつ他方のk-bより長い、いずれの末端上でもオーバ
ーラップしないk-タプルのサブ断片をすべて排除する。このように、偽陽性の k-タプルの大部分は棄却される。連結の法則は、2個のサブ断片が明確に連結さ
れ得るか、さらに2個のサブ断片の関連する終結または開始点のオーバーラップ 配列がいずれの他のサブ断片の開始および/または終結部分に存在しないかどう
かだけである。例外は同一の開始および終結点を有するサブ断片である。その場
合、ファイルに存在する同じ末端を有するもう1個のサブ断片があるという条件 で連結がなされる。ここでの主要な問題は、オーバーラップ配列の正確な定義で
ある。偽陽性のおよび偽陰性のk-タプルの連結とともに、k-1またはk-2配列の 反復点の少なくとも2種の特異な偽陰性のk-タプルの存在が消失し、またいくつ
かのオーバーラップ配列が「マスク」され、pSFの誤りのない明確な連結が生じ 得る。これを防ぐために、k-2より短い末端配列上で、さらにk-4より長い特別な
オーバーラップ配列の存在下ではその連結はなされない。オーバーラップ配列は
pSFの末端から明らかにされており、すなわち1個、またはごく少数の最終の塩 基が除去されている。
The purpose of incorporating the pSF portion of the algorithm is to reduce the number of pSF to a minimal number of long subfragments with the correct sequence. For maximum connection,
All sub-fragments of the k-tuple that are longer than ka at one end and longer than the other kb and do not overlap on either end are eliminated. Thus, the majority of false positive k-tuples are rejected. The rule of ligation is that two subfragments can be unambiguously ligated, or that the overlapping termination sequence of the two subfragments is associated with the start and / or termination portion of any other subfragment. It just doesn't exist. Exceptions are subfragments that have identical start and end points. In that case, the concatenation is made provided there is another subfragment with the same end present in the file. The main problem here is the precise definition of the overlapping sequence. With the ligation of false positive and false negative k-tuples, the presence of at least two unique false negative k-tuples at k-1 or k-2 sequence repeats disappears, and some overlap Sequences may be "masked" resulting in error-free and clear concatenation of pSF. To prevent this, the ligation is not performed on terminal sequences shorter than k-2 and in the presence of special overlapping sequences longer than k-4. The overlap array is
It is revealed from the end of pSF, ie one or only a few final bases have been removed.

【0263】 極めてまれな状況では、一定数のある種の偽陽性のおよび偽陰性のk-タプル の存在により、誤りのある末端を有するあるサブ断片が残存し、ある偽陽性のk
-タプル(最小限のサブ断片として)が残存し得る、すなわち誤った連結が起こ り得る。これらの問題はサブ断片整列プロセスで、および未切断の、誤って連結
したサブ断片の管理とともにある、さらなる制御ステップで認められ、解決され
る。
In very rare situations, the presence of a certain number of certain false-positive and false-negative k-tuples will leave some sub-fragments with erroneous ends and some false-positive k-tuples.
-Tuples (as minimal sub-fragments) may remain, ie misligations may occur. These problems are identified and resolved in the subfragment alignment process and in a further control step, along with the management of uncut, mislinked subfragments.

【0264】 サブ断片整列プロセスは、それらの形成プロセスに類似している。サブ断片を
長いk-タプルと考えるならば、末端のオーバーラップによるそれらの明確な連 結により整列がなされる。明確な連結のための情報提供基盤は、基本ライブラリ
ーの断片で発生するサブ断片の、それらの断片のセグメントに相当するグループ
への分割である。その方法は、関連連結配列を有する長いオリゴヌクレオチドと
のハイブリダイゼーションに基づくこの問題の生化学的解決法に類似している。
その連結配列は基本ライブラリー断片の、適当なk-タプルセットのセグメント を用いてサブ断片として形成される。関連するセグメントは基本ライブラリーの
各断片とオーバーラップする整列ライブラリーの断片により明確にされる。最も
短いセグメントが整列ライブラリーの情報提供断片である。最も長いものは、隣
接するいくつかの情報提供断片または整列および基本ライブラリーに対応する断
片の全オーバーラップ部分である。分離されるサンプル数を減らすために、整列
ライブラリーの断片をランダムにプールし、さらに特異なk-タプル内容を決定 する。
The subfragment alignment process is similar to their formation process. If one considers the subfragments as long k-tuples, the alignment is achieved by their distinct connection by terminal overlap. The information platform for unambiguous ligation is the division of the subfragments that occur in the fragments of the basic library into groups corresponding to the segments of those fragments. The method is similar to a biochemical solution to this problem based on hybridization with a long oligonucleotide having an associated linking sequence.
The linking sequence is formed as a sub-fragment using the appropriate k-tuple set segment of the basic library fragment. Relevant segments are defined by aligned library fragments that overlap each fragment of the base library. The shortest segment is the informative fragment of the aligned library. The longest is the entire overlapping portion of several adjacent informative fragments or fragments corresponding to the alignment and base library. To reduce the number of samples to be separated, the fragments of the aligned library are randomly pooled and the unique k-tuple content is determined.

【0265】 整列ライブラリーの多数の断片を用いることにより、非常に短いセグメントが
形成され、よってサブ断片の形成の原因であるk-1配列の多くの出現の機会が減 少する。さらに、最も長いセグメントは基本ライブラリーの所定の断片の様々な
領域からなり、反復するk-1配列を全く含んでいない。あらゆるセグメントで、 連結配列(連結サブ断片)が所定の断片の一定のサブ断片対に形成される。整列
プロセスは3つのステップ:(1)各セグメントに含まれるk-タプルの形成;(2)各
セグメントのサブ断片の形成;および(3)セグメントのサブ断片との連結からな る。第1のセグメントは、基本ライブラリーの所定の断片のk-タプル内容と整列
ライブラリープールのk-タプル内容との重要な共通部分および相違部分と定義 される。第2の(短い)セグメントは第1のセグメントのk-タプル内容の共通部 分と相違部分と定義される。
By using multiple fragments of the aligned library, very short segments are formed, thus reducing the chance of many occurrences of the k-1 sequence responsible for the formation of subfragments. Furthermore, the longest segments consist of various regions of a given fragment of the basic library and do not contain any repeating k-1 sequences. In every segment, a joining sequence (joining sub-fragment) is formed into certain sub-fragment pairs of a given fragment. The alignment process consists of three steps: (1) formation of a k-tuple contained in each segment; (2) formation of a sub-fragment of each segment; and (3) ligation of the segment with a sub-fragment. The first segment is defined as the significant intersection and difference between the k-tuple content of a given fragment of the base library and the k-tuple content of the aligned library pool. The second (short) segment is defined as the common and different parts of the k-tuple contents of the first segment.

【0266】 共通部分および相違部分両方に、偽陽性のおよび偽陰性のk-タプル両方を集 積する問題がある。偽陽性のk-タプルが関連オーバーラップ領域でない両方の 配列にランダムに発生するとともに、開始配列の偽陰性のk-タプルは共通部分 (オーバーラップ部分)に集積する。他方、開始配列のいずれかの大部分の偽陽
性のk-タプルは共通部分に取り上げられない。このことはそれらとオーバーラ ップする断片からの情報を用いて個々の断片からの実験誤差を小さくする例であ
る。偽k-タプルは別の理由で相違部分に集積する。オリジナル配列の偽陰性の もののセットは、共通部分の偽陽性のものに、および誤って共通部分に含まれな
い、すなわち共通部分には偽陰性であるそれらのk-タプルに対して偽陽性のも ののセットに拡張される。開始配列が10%偽陰性のデータを含んでいるならば、 第1および第2の共通部分はそれぞれ19%および28%の偽陰性のk-タプルを含んで いるだろう。他方、基本断片およびプールがそれぞれ500bpおよび10,000bpの長 さを有するならば、期待値77の偽陽性のものが推測されよう。しかしながら、「
失った」k-タプルの大部分を再生する可能性および偽陽性のk-タプルの大部分
を排除する可能性がある。
[0266] Both the intersection and the difference have the problem of aggregating both false positive and false negative k-tuples. False-positive k-tuples occur randomly in both sequences that are not the relevant overlap region, and false-negative k-tuples in the starting sequence accumulate in the intersection (overlap). On the other hand, most false-positive k-tuples of any of the starting sequences are not covered by the intersection. This is an example of using information from overlapping fragments to reduce experimental errors from individual fragments. False k-tuples accumulate in the differences for another reason. The set of false negatives in the original sequence is included in the false positives in the intersection and false positives for those k-tuples that are not accidentally included in the intersection, i.e., the intersection is false negative in the intersection. Extended to a set of If the starting sequence contains 10% false negative data, the first and second intersections will contain 19% and 28% false negative k-tuples, respectively. On the other hand, if the base fragment and pool had a length of 500 bp and 10,000 bp, respectively, a false positive with an expected value of 77 would be expected. However,"
It is possible to regenerate most of the "lost" k-tuples and to eliminate most of the false positive k-tuples.

【0267】 まず、所定の対のk-タプル内容の共通部分として所定のセグメントのk-タプ
ル基本内容を決定する必要がある。これに次いで、一方の末端にk-1を、他方の 末端に基本セットの2種のk-タプルの末端に生ずるk-+配列を含んでいる共通部 分の開始k-タプル内容の全k-タプルを含んでいることを調べる。よってそのプ
ロセスで偽陽性のものの集積を妨げる相違部分が発生する前にこれがなされる。
その後、同一タイプのk-タプル拡張セットを、借りてきたものが共通部分のか らのものであるという相違を有する相違部分に当てはめる。借りてこられる全k
-タプルは偽陽性のものとして共通部分ファイルから排除される。
First, it is necessary to determine the basic content of a k-tuple of a predetermined segment as a common part of the content of a predetermined pair of k-tuples. This is followed by the start k-tuple contents of the common part containing k-1 at one end and the k- + sequences occurring at the ends of the two k-tuples of the basic set at the other end. -Check that it contains tuples. This is done before the process creates differences that prevent the accumulation of false positives.
Then we apply the same type of k-tuple extension set to the different parts with the difference that the borrowed one is from the common part. All k borrowed
-Tuples are excluded from the common file as false positives.

【0268】 共通部分、すなわち共通なk-タプルのセットがそれぞれの対(基本断片)X(
整列ライブラリーのプール)に対して定義される。そのセットのk-タプル数が 有意であるならば、記載の法則に従い、偽陰性のものにより増大される。第1の 相違部分セットは、所定の基本断片セットから得られた共通セットを減ずること
で得られる。偽陰性のk-タプルは、記載の法則に従って共通セットから借りて きて、相違セットにあてはめ、同時に偽陽性のk-タプルとして共通セットから 取り除かれる。基本断片がプールされる断片より長い場合、この相違部分はさら
なるステップにおける有用性を幾分減ずる2つの異なるセグメントを意味するで
あろう。第1のセグメントはかなりの数のk-タプルを含む対(基本断片)X(整 列ライブラリーのプール)の共通部分および相違部分を生ずるすべてである。第
2のセグメントのk-タプルセットは、第1のセグメントのすべての起こりうる対 のk-タプルセットの比較により得られる。2つの相違部分はかなりの数のk-タ プルとの共通部分を生ずるそれぞれの対から定義される。オーバーラップされる
断片から入手できる情報の大部分が、共通部分および相違部分を形成する第3の ラウンドより得られるものがほとんどないようにこのステップで回収される。
The intersection, ie, the set of common k-tuples, consists of each pair (basic fragment) X (
Pool of aligned libraries). If the number of k-tuples in the set is significant, it is increased by false negatives according to the rules described. The first set of differences is obtained by subtracting the common set obtained from the given base fragment set. False-negative k-tuples are borrowed from the common set according to the rules described, applied to the difference set, and simultaneously removed from the common set as false-positive k-tuples. If the base fragment is longer than the pooled fragment, this difference would mean two different segments that would somewhat reduce its utility in further steps. The first segment is all that yields the intersection and divergence of pairs (basic fragments) X (pool of ordered library) containing a significant number of k-tuples. No.
The k-tuple set of the second segment is obtained by comparing all possible pairs of k-tuple sets of the first segment. The two differences are defined from each pair resulting in an intersection with a significant number of k-tuples. Most of the information available from the overlapped fragments is recovered in this step so that little is gained from the third round forming the intersection and dissimilarity.

【0269】 (2)セグメントのサブ断片の形成は基本ライブラリーの断片に関する記載と同 様に行われる。(2) The formation of the sub-fragments of the segments is performed in the same manner as described for the fragments of the basic library.

【0270】 (3)サブ断片との連結法は、いくつかのオーバーラップされる末端を有する所 定の基本ライブラリー断片のサブ断片のうち、正確に連結するサブ断片対を連続
的に決定することをからなる。関連する4個の断片(そのうち2個が同一の開始部
分を含み、2個が同一終結部分を有する)の場合では、異なる4対の連結され得る
サブ断片がある。一般に、2個は正確であり、2個は誤りである。正確なものを 見つけるために、各対の連結配列の存在が、所定の基本断片のすべての第1およ び第2のセグメントから生ずるサブ断片で試験される。連結配列の長さおよび位 置は、偶然に起こる配列による妨害を避けるよう選択される。それらはk+2であ るか、またはより長く、さらに所定の対の両サブ断片のオーバーラップ配列のそ
ばに少なくとも1つのエレメント2を含んでいる。2つの連結配列が見い出され、 残りの2つが存在しない場合にのみ、連結がなされる。その2個の連結したサブ断
片はファイル中の先のサブ断片を戻し、さらにプロセスを周期的に繰り返す。
(3) The method of ligation with sub-fragments determines successively the sub-fragment pairs that are correctly ligated among the sub-fragments of a given basic library fragment having several overlapping ends. Consisting of things. In the case of four related fragments, two of which contain the same start and two have the same termination, there are four different pairs of ligable subfragments. In general, two are correct and two are incorrect. To find the correct one, the presence of each pair of joining sequences is tested on the sub-fragments resulting from all the first and second segments of a given basic fragment. The length and position of the linking sequence are chosen to avoid accidental sequence interference. They are either k + 2 or longer and additionally contain at least one element 2 by the overlapping sequence of both subfragments of a given pair. Ligation is only made if two ligation sequences are found and the other two are not present. The two concatenated sub-fragments return the previous sub-fragment in the file, and the process repeats periodically.

【0271】 反復配列はこのステップで形成される。これはいくつかのサブ断片が1度なら
ず連結されるサブ断片に含まれることを意味している。それらは2個の異なるサ ブ断片に関して1個のサブ断片と連結する関連連結配列を見い出すことで認識さ れよう。
[0271] Repetitive sequences are formed in this step. This means that several sub-fragments are included in the sub-fragments that are ligated more than once. They will be recognized by finding related ligation sequences that link one sub-fragment with respect to two different sub-fragments.

【0272】 pSFを構築するプロセスおよびpSFを組み込むプロセスで生ずる誤って結合され
た認識は所定の基本ライブラリーのサブ断片の配列がその断片のセグメントで形
成されるサブ断片の配列に存在するかどうかの試験に基づいている。誤って連結
された位置の配列は誤って結合されたサブ断片を示すことではわからないであろ
う。
The mislinked recognition resulting from the process of constructing pSF and incorporating pSF depends on whether the sequence of a subfragment of a given base library is present in the sequence of the subfragment formed by a segment of that fragment. Based on the test. Sequences at misligated positions will not be known to indicate misligated subfragments.

【0273】 より完全な配列を誤りなく形成するためには、サブ断片を整列する記載の3ス テップに加えて、さらなるいくつかの対照ステップまたは特定の配列に適用でき
るステップが必要であろう。
In order to form a more complete sequence without errors, in addition to the described three steps of aligning the subfragments, some additional control steps or steps applicable to a particular sequence may be required.

【0274】 セグメントおよびサブ断片中のk-タプル内容の比較により、どのサブ断片が どのセグメントに属しているのかの決定がなされる。k-タプル内容中の誤差( プール中の第1の誤差および頻繁なk-タプルの発生による統計的誤差による)の
ため、サブ断片の正確な分割が不可能である。よって、「全か無か」の分割の代
わりに、各サブ断片ついての所定のセグメントから生ずる機会が決定される。こ
の可能性はk-タプルの長さ、サブ断片の長さ、整列ライブラリーの断片の長さ 、プールのサイズ、およびファイル中の偽k-タプルのパーセンテージの関数で ある: P(sf,s)=(Ck-F)/Lsf, (式中、Lsfはサブ断片の長さであり、Ckは所定のサブ断片/セグメント対の共 通k-タプル数であり、Fはk-タプルの長さ、基本ライブラリーの断片、プール のサイズ、および誤差%間の関係を含むパラメーターである)。
By comparing the contents of the k-tuples in segments and sub-fragments, a determination is made as to which sub-fragment belongs to which segment. Due to errors in the k-tuple contents (due to the first error in the pool and statistical errors due to frequent k-tuple occurrences), exact segmentation of sub-fragments is not possible. Thus, instead of an "all or nothing" split, the opportunity arising from a given segment for each sub-fragment is determined. This probability is a function of the length of the k-tuple, the length of the sub-fragments, the length of the fragments of the aligned library, the size of the pool, and the percentage of false k-tuples in the file: P (sf, s ) = (Ck-F) / Lsf, where Lsf is the length of the sub-fragment, Ck is the number of common k-tuples for a given sub-fragment / segment pair, and F is the length of the k-tuple. Parameters including the relationship between the base library fragments, pool size, and% error).

【0275】 特定のセグメントのサブ断片は冗長な短いpSFとして処理され、明確な連結の プロセスを受ける。オーバーラップ末端をため、明確な連結の決定はこの場合、
わずかに異なる。なお、明確な連結の精度は他のセグメントのこれらのサブ断片
連結に従い制御される。異なるセグメントの連結後、得られたすべてのサブ断片
は一緒に組み込まれ、長いサブ断片に含まれる短いものは排除され、さらに残る
ものは通常の連結プロセスを受ける。明確な連結の後、その配列が完全に再生さ
れない場合、特定のセグメントに属する確率についての同一のまたは厳密さを欠
いた基準でサブ断片の分割および連結プロセスが繰り返される。
[0275] Sub-fragments of a particular segment are treated as redundant short pSFs and undergo a well-defined concatenation process. Because of the overlapping ends, a clear ligation decision is in this case
Slightly different. Note that the precision of explicit concatenation is controlled according to these sub-fragment concatenations of other segments. After ligation of the different segments, all the resulting sub-fragments are incorporated together, the shorter ones of the longer sub-fragments are eliminated, and the remaining ones undergo the usual ligation process. If, after explicit ligation, the sequence is not completely reconstructed, the sub-fragment segmentation and ligation process is repeated with the same or less stringent criteria for the probability of belonging to a particular segment.

【0276】 明確なオーバーラップを定義するための厳密な基準を用いる場合、いくつかの
情報は用いられない。完全な配列の代わりに、所定の断片に対する多くの可能性
を定義するいくつかのサブ断片が得られる。厳密さを欠いた基準を用いる場合、
正確かつ完全な配列がもたらされる。一定の状況、例えば誤った連結では、完全
ではあるが不的確な配列を、またはそれらの間に連結のない「巨大な」サブ断片
をもたらし得る。従って、基本ライブラリーの各断片は、a)正確であるという点
で可能性あるいくつかの解式およびb)最も有望な正確な解式が得られる。また非
常に稀な場合、サブ断片形成プロセス中の誤りにより、または属する見込みにつ
いての一定比率により明確な解式が生まれ、または1つ、すなわち最も有望な解 式が生ずる。これらの場合は不完全配列としてあり、または明確な解式は基本ラ
イブラリーの他のオーバーラップされた断片をこれらのデータをものと比較する
ことで得られる。
Some information is not used when using strict criteria to define a clear overlap. Instead of the complete sequence, several sub-fragments are obtained that define many possibilities for a given fragment. When using less stringent criteria,
An accurate and complete sequence is provided. Certain situations, such as incorrect ligation, can result in complete but incorrect sequences, or "large" subfragments with no linkage between them. Thus, each fragment of the basic library yields a) several possible solutions in terms of accuracy and b) the most promising accurate solution. Also, in very rare cases, errors during the subfragmentation process, or a fixed percentage of likelihood to produce, yield a definite solution, or one, the most promising solution. In these cases, the sequences are incomplete, or a clear solution can be obtained by comparing these overlapping data with other overlapped fragments of the basic library.

【0277】 記載されたアルゴリズムを、ランダムに形成された、ヒトゲノムのGC内容を
シミュレートした40%GCを含む50kb配列に対して試験した。この配列の中間部分 には、約4kbの全長を有する様々なすべての、およびいくつか他の反復配列が挿 入された。in vitro SBH試験をシミュレートするために、次の操作を行い適当な
データを用意した。
The described algorithm was tested on a randomly generated 50 kb sequence containing 40% GC simulating the GC content of the human genome. In the middle of this sequence, all various and some other repetitive sequences with a total length of about 4 kb were inserted. In order to simulate the in vitro SBH test, the following operations were performed to prepare appropriate data.

【0278】 -60個の5kbオーバーラップ「クローン」の位置をランダムに定義して、基本ライ
ブラリーの調製をシミュレーションした: -1000個の500bp「クローン」の位置をランダムに定義して、整列ライブラリーの
作製をシミュレーションした。これらの断片はその配列から得た。20の断片のラ
ンダムプールを作製し:プールのk-タプルセットを決定して、ハードディスク に入れた。これらのデータはサブ断片整列段階で使用した:同一密度のクローン
の代わりに、基本ライブラリーの400万クローンおよび整列ライブラリーの300万
クローンをヒト全ゲノムに使用する。全数700万のクローンは、ほとんどすべて のゲノムDNAのランダムクローニングおよびゲルに基づく方法による配列決定用 の数kbの長さのクローン数より数倍低い。
The position of -60 5kb overlapping "clones" was randomly defined to simulate the preparation of the basic library:-The positions of 1000 500bp "clones" were randomly defined and aligned live The production of the rally was simulated. These fragments were obtained from the sequence. A random pool of 20 fragments was generated: the pool k-tuple set was determined and placed on the hard disk. These data were used in the subfragment alignment step: instead of clones of the same density, 4 million clones of the base library and 3 million clones of the aligned library are used for the whole human genome. A total of 7 million clones are several times lower than clones several kb long for random cloning of almost all genomic DNA and sequencing by gel-based methods.

【0279】 5kb断片の開始部分および終結部分のデーターから、117個の「情報提供断片」
がその配列にあることが決定された。この後、シグナル「情報提供断片」を構成
するオーバーラップk-タプルのセットが決定された。予め決定されたリストに あるk-タプルのサブセットのみ使用した。そのリストには8-mer65%、9-mer30%
および10ないし12-mer5%が含まれていた。これらのデータに基づいて、サブ断片
の形成および整列プロセスを行った。
From the data at the beginning and end of the 5 kb fragment, 117 “informational fragments”
Was determined to be in the sequence. After this, the set of overlapping k-tuples that make up the signal "informational fragment" was determined. Only a subset of the k-tuples in the predetermined list were used. The list includes 8-mer 65%, 9-mer 30%
And 5% from 10 to 12-mer. Based on these data, a subfragment formation and alignment process was performed.

【0280】 アルゴリズムの試験はシミュレートした2つの試験のデータに基づいて行った 。100%正確なデータセット(20,000bpを超える)、および10%偽k-タプル(5%陽性
および5%陰性のもの)を含む26個の情報提供断片(約10,000bp)を含む50個の情報
提供断片の配列を再生した。
Testing of the algorithm was based on data from two simulated tests. 50 pieces of information, including 26 informational fragments (approximately 10,000 bp), including 100% accurate datasets (> 20,000bp) and 10% pseudo k-tuples (5% positive and 5% negative) The sequence of the donated fragment was regenerated.

【0281】 第1の試験では、すべてのサブ断片が正確であり、50個の情報提供断片のうち1
個だけ配列が完全には再生されず、5個のサブ断片のまま残った。整列ライブラ リーのオーバーラップ断片の位置の分析により、それらが5個のサブ断片の特異 な整列の情報を欠いていることが示された。サブ断片はオーバーラップ末端に基
づく2通り、1-2-3-4-5および1-4-3-2-5に連結され得る。唯一の相違点は、サブ 断片2および4の位置が取り換えられることである。サブ断片2、3、および4は比 較的短い(すべて約100bp)ため、この場合、すなわちサブ断片3領域で開始、ま
たは終結される整列ライブラリーの断片がない場合に比較的多くの機会が存在し
、起こった。
In the first test, all sub-fragments were correct and 1 in 50 informative fragments
Only one sequence was not completely regenerated and remained as five subfragments. Analysis of the position of the overlapping fragments in the alignment library indicated that they lacked information on the specific alignment of the five subfragments. The subfragments can be ligated in two ways based on the overlapping ends, 1-2-3-4-5 and 1-4-3-2-5. The only difference is that the positions of subfragments 2 and 4 are interchanged. Because subfragments 2, 3, and 4 are relatively short (all about 100 bp), there are relatively many opportunities in this case, ie, when there are no fragments of the aligned library starting or ending at the subfragment 3 region. Existed and happened.

【0282】 実際の配列決定をシミュレートするために、多くの試験ではいくつかの誤った
(「ハイブリダイゼーション」)データがインプットとして含められた。オリゴ
マーハイブリダイゼーション試験では、目的の条件下で、信頼できないデータを
生み出す唯一の事態が誤対合対完全適合ハイブリダイゼーションである。それゆ
え、シミュレーションで、いずれかの末端の1つのエレメントが実際のものと異 なっているそれらのk-タプルだけが偽陽性のものと考えられた。これらの「誤 った」セットは次のように作製される。情報提供断片のk-タプルの原セットに 対し、5%偽陽性のk-タプルのサブセットを添加する。偽陽性のk-タプルはその
セットからk-タプルをランダムに選択し、それをコピーして、さらにその開始 または終結部分のヌクレオチドを部分的に変えることにより作製される。この後
、ランダムに選択された5% k-タプルのサブセットを除く。このように、正確な
k-タプルが末端に誤った塩基を有するk-タプルと置き換えられるという最も複
雑な事態が統計的推測数で生ずる。
In order to simulate actual sequencing, many tests included some erroneous (“hybridization”) data as input. In oligomeric hybridization tests, the only event that produces unreliable data under the conditions of interest is mismatched versus perfectly matched hybridization. Therefore, in simulations, only those k-tuples in which one element at either end was different from the real one were considered false positives. These “wrong” sets are made as follows. A subset of 5% false positive k-tuples is added to the original set of k-tuples of the informative fragment. False positive k-tuples are created by randomly selecting a k-tuple from the set, copying it, and then partially changing the nucleotides at its start or end. After this, we remove a randomly selected subset of the 5% k-tuple. Thus, the most complicated situation in which the correct k-tuple is replaced by a k-tuple having the wrong base at the end occurs with a statistically guessed number.

【0283】 記載のk-タプルセットの形成により、10%の誤ったデータとなる。この値はコ
ピーされ、変えられ、消去されるk-タプルがランダムに選択されるため、あら ゆる場合に応じて変化する。それにもかかわらず、このパーセンテージは実際の
ハイブリダイゼーション試験での信頼できないデータ量を3ないし4倍超えている
。導かれた10%の誤りが結局、基本ライブラリーの断片(基本ライブラリー情報 提供断片)およびセグメントの両方におけるサブ断片数が2倍増加することにな る。最終サブ断片の約10%は、偽陽性のものを含むk-タプルセットで予測される
(第1のサブ断片の形成を参照)ように、末端に誤った塩基を有する。サブ断片 が誤った連結をする事例もサブ断片が誤った配列を有する事例も見られなかった
。整列プロセスで試験された26個のうち4個の情報提供断片で完全な配列が再生 されなかった。4つの事例すべてにおいて、配列は同一配列に含まれた数個の長 いサブ断片および数個の短いサブ断片として得られた。この結果が、アルゴリズ
ム原理がパーセンテージの高い誤ったデータを動かしていることを示している。
The formation of the described k-tuple set results in 10% incorrect data. This value changes in every case because the k-tuple to be copied, changed, and deleted is randomly selected. Nevertheless, this percentage exceeds the unreliable data volume in actual hybridization tests by three to four times. The 10% error derived will result in a two-fold increase in the number of sub-fragments in both the basic library fragment (the basic library information providing fragment) and the segment. Approximately 10% of the final subfragment has the wrong base at the end, as expected in a k-tuple set including false positives (see formation of the first subfragment). There were no cases where the sub-fragments were misligated or the sub-fragments had the wrong sequence. Four of the 26 informative fragments tested in the alignment process did not reproduce the complete sequence. In all four cases, the sequences were obtained as several long and several short subfragments contained in the same sequence. This result indicates that the algorithm principle is driving a high percentage of incorrect data.

【0284】 k-タプル含有物からの配列形成の成功は、完全性と正確さに関して記載され る。形成プロセスでは、2つの特別な状況:1)ある情報部分が生じた配列中では 落とされているが、不明確なものがどこにあり、それらがどのタイプに属するの
かは分かっている、および2)得られた再生配列が、そこからk-タプル含有物を 生じる配列に適合せず、その誤りが検出できない、が明確にされ得る。アルゴリ
ズムが理論上の限界まで展開されると仮定すれば、正確なk-タプルを使用する ように第1のシミュレーションだけ行われ得る。その点で、不完全さにより一定 数のサブ断片が明確に整列されなくなり、さらに単配列の正確な長さ、すなわち
完全な縦列反復数の決定の問題が起こる。
[0284] Successful sequence formation from k-tuple inclusions is described in terms of completeness and accuracy. In the formation process, two special situations are: 1) some information pieces are dropped in the resulting sequence, but it is known where the ambiguities are and what types they belong to, and 2) It can be clarified that the regenerated sequence obtained does not match the sequence from which the k-tuple content is generated, and that the error cannot be detected. Assuming that the algorithm expands to the theoretical limit, only the first simulation can be performed to use the correct k-tuple. At that point, the imperfection causes a certain number of subfragments to become unclearly aligned, and furthermore to the problem of determining the exact length of a single sequence, ie, the number of complete tandem repeats.

【0285】 偽k-タプルにより、不正確な配列が生じると考えられる。誤りの原因はアル ゴリズム不足にではなく、所定のk-タプル含有物が最初のものとは異なる配列 を明確に表しているという事実にある。ファイル中に存在する偽k-タプルの種 類に基づいて、誤りは3つに定義され得る。偽陰性のk-タプル(偽陽性のものを
伴わない)は「欠失」を引き起こす。偽陽性のk-タプルは「延長(不等交差) 」を引き起こしている。偽陰性のものを伴う偽陽性のものは、単独または「欠失
」を組み合わせての「挿入」が起こる原因である。欠失は、サブ断片の2つの可 能な開始部分間のすべてのk-タプル(またはそれらの大部分)が偽陰性のもの である場合に引き起こされる。配列のあらゆる位置がk-タプルにより明確にさ れるため、一般的な場合、欠失が起こる場合にはkの連続した偽陰性のものが必 要である。(偽陰性のもの10%およびk=8で、各108エレメントの後にこの状況が 起こる)この状況は非常に稀に、10ゲノム等量を含むランダムなライブラリーを
用いる哺乳類ゲノム配列決定にさえある。
It is believed that the false k-tuple results in an incorrect sequence. The error is not due to the lack of algorithm, but to the fact that certain k-tuple inclusions clearly represent sequences that differ from the first. Based on the type of spurious k-tuple present in the file, three errors can be defined. False negative k-tuples (without false positives) cause "deletions". False positive k-tuples cause "extensions (unequal crossings)". False positives with false negatives are responsible for "insertions", alone or in combination with "deletions". Deletions are caused when all k-tuples (or most of them) between the two possible starting portions of a subfragment are false negative. Since every position in the sequence is defined by a k-tuple, in the general case k consecutive false negatives are required if a deletion occurs. (This situation occurs after each 108 elements, with 10% false negatives and k = 8.) This situation is very rare, even in mammalian genome sequencing using a random library containing 10 genomic equivalents. .

【0286】 偽陽性のk-タプルにより引き起こされる配列の延長は、その配列の末端が偽 陰性のk-タプルの循環直線アレイと考えられ得るため、「挿入」の特殊な例で ある。1つのk-タプルより長いサブ断片を生ずる偽陽性のk-タプルの群と考え られる。整列ライブラリーのランダムな物理的断片のようなオーバーラップ断片
でサブ断片が形成されるならば、この種の状況が検出されよう。偽陽性および偽
陰性のk-タプルの特殊な組合わせの結果として、挿入または欠失の代わりの挿 入が起こり得る。第1の場合では連続した偽陰性のk-タプル数がkより低い。両 方の場合に、数個のオーバーラップ偽陽性のk-タプルが必要である。数および 偽k-タプルの特異性における必要条件は、非常に単純であるため、挿入および 欠失は実際のかなり大きな影響もなく、概ね理論的に可能性がある。
A sequence extension caused by a false-positive k-tuple is a special case of “insertion” because the ends of the sequence can be considered a circulating linear array of false-negative k-tuples. It is considered a group of false positive k-tuples that yield subfragments longer than one k-tuple. Such a situation would be detected if subfragments were formed in overlapping fragments, such as random physical fragments of an ordered library. Insertions in place of insertions or deletions can occur as a result of the special combination of false positive and false negative k-tuples. In the first case, the number of consecutive false negative k-tuples is lower than k. In both cases, several overlapping false positive k-tuples are required. Since the requirements on the number and specificity of the pseudo k-tuple are so simple, insertions and deletions are largely theoretically feasible, without any real significant impact.

【0287】 偽陽性のおよび/または偽陰性のものの種類が最小数であるという理論的な必
要条件に合わないその他すべての状況では、k-タプル含有物の誤りが生じた配 列の完全性を低下させると思われる。
In all other situations where the number of false positives and / or false negatives does not meet the theoretical requirement of a minimum number, the integrity of the erroneous sequence of k-tuple inclusions is reduced. It seems to lower.

【0288】 SBH、核酸サンプルは、サンプルを既知の配列の支持体結合プローブ、および 標識プローブまたは溶解プローブに曝して配列決定される。プローブリガーゼが
プローブおよびサンプルの混合物に導入される場合、すなわち支持体がサンプル
に沿って背中合わせにハイブリダイズされた結合プローブおよび標識プローブを
有する場合、2つのプローブはリガーゼの作用で化学的に結合されよう。洗浄後 、化学的に結合した支持体結合および標識プローブだけを標識プローブの存在に
より検出する。アレイの特定の位置の支持体結合プローブの同一性および標識プ
ローブの同一性を知ることで、サンプルの配列の一部を3つの基体サンプルを有 するフォーマットにおけるアレイのポイントの標識の存在により決定できる。偶
然でもなく仕向けたわけでもないが(not chances not working)、結合プローブ 対のすべての配列が最大限にオーバーラップし、サンプルの配列が再構築されよ
う。配列決定されないサンプルは、核酸断片または10塩基対("bp")のオリゴヌ
クレオチドであろう。そのサンプルは、好ましくは4ないし1000塩基の長さであ る。
SBH, nucleic acid samples are sequenced by exposing the sample to a support-bound probe of known sequence, and a labeled or lysed probe. If probe ligase is introduced into the probe and sample mixture, i.e., if the support has bound and labeled probes hybridized back to back along the sample, the two probes are chemically bound by the action of ligase. Like. After washing, only chemically bound support binding and labeled probes are detected by the presence of labeled probes. Knowing the identity of the support-bound probe and the identity of the labeled probe at a particular location in the array, a portion of the sample sequence can be determined by the presence of the label at the point of the array in a format with three substrate samples. . Not by chance and not by chance, but not all sequences of the bound probe pair will overlap maximally and the sequence of the sample will be reconstructed. The unsequenced sample will be a nucleic acid fragment or a 10 base pair ("bp") oligonucleotide. The sample is preferably between 4 and 1000 bases in length.

【0289】 プローブの長さは、10塩基未満の長さの断片であり、好ましくは4ないし9間の
塩基の長さである。このように、支持体結合プローブのアレイは所定の長さのす
べてのオリゴヌクレオチドを有するか、または特定の試験用に選択されるオリゴ
ヌクレオチドだけを有するであろう。所定の長さのすべてのオリゴヌクレオチド
を使用する場合、中央のオリゴヌクレオチド数は4N(Nはプローブの長さである )により算出されるであろう。
The length of the probe is a fragment with a length of less than 10 bases, preferably between 4 and 9 bases. Thus, an array of support-bound probes will have all oligonucleotides of a given length, or only those oligonucleotides selected for a particular test. When using predetermined lengths of all the oligonucleotides, the center of the oligonucleotide number 4 N (N is the length of the probe) will be calculated by.

【0290】実施例18 配列決定用チップの使用に関して 配列決定法においてライゲーションが採用される場合、通常のオリゴヌクレオ
チドチップを直ちに再使用するわけにはいかない。本発明者は、この問題をいろ
いろなやり方で克服できると考える。
Example 18 Use of a Sequencing Chip If ligation is employed in the sequencing method, ordinary oligonucleotide chips cannot be immediately reused. We believe that this problem can be overcome in various ways.

【0291】 第2のプローブであるプローブPのためにリボヌクレオチドを使用することが でき、その結果としてこのプローブをその後のRNAse処理で除去することができ る。RNAse処理では、ピリミジン残基の3'側の一本鎖RNAを特異的に攻撃して隣接
ヌクレオチドへのリン酸エステル結合を切断するエンドリボヌクレアーゼ RNAse
Aを使用する。最終産物はピリミジン3リン酸と末端ピリミジン3リン酸をもつオ
リゴヌクレオチドである。RNAse A は補因子と二価カチオンの非存在下で働く。
Ribonucleotides can be used for the second probe, Probe P, so that the probe can be removed in a subsequent RNAse treatment. In RNAse treatment, an endoribonuclease that specifically attacks single-stranded RNA 3 'to the pyrimidine residue and cleaves the phosphate bond to adjacent nucleotides
Use A. The final product is an oligonucleotide with pyrimidine triphosphate and terminal pyrimidine triphosphate. RNAse A works in the absence of cofactors and divalent cations.

【0292】 RNAseを使用するためには、一般的に、Sambrookら(1989;参考としてここに組 み入れる)に記載されるように、適切なRNAse含有緩衝液中でチップをインキュ ベートする。8x8 mmまたは9x9 mmアレイにつき30〜50μlのRNAse含有緩衝液を37
℃で10〜60分間使用することが好ましい。その後ハイブリダイゼーション緩衝液
で洗浄する。
To use RNAse, the chip is generally incubated in a suitable RNAse-containing buffer as described in Sambrook et al. (1989; incorporated herein by reference). 37-50 μl RNAse-containing buffer per 8x8 mm or 9x9 mm array
It is preferred to use at 60C for 10-60 minutes. Thereafter, it is washed with a hybridization buffer.

【0293】 広範には適用可能でないが、Craigら(1989;参考としてここに組み入れる)に 記載されるように、特定の実施形態においてウラシル塩基を使用することができ
る。ライゲートされたプローブ組合せ物の破壊(再使用可能なチップをもたらす
)は、E. coli 修復酵素であるウラシル-DNAグリコシラーゼ(DNAからウラシル を除去する)で消化することにより達成される。
Although not broadly applicable, uracil bases can be used in certain embodiments, as described in Craig et al. (1989; incorporated herein by reference). Disruption of the ligated probe combination (resulting in a reusable chip) is achieved by digestion with the E. coli repair enzyme uracil-DNA glycosylase (removing uracil from DNA).

【0294】 また、プローブ間に特異的に開裂可能な結合を形成させて、検出後にその結合
を切断することもできる。例えば、これは、Shabarovaら(1991)およびDolinnaya
ら(1988)(両文献とも参考としてここに組み入れる)に記載されるような化学的 ライゲーションにより達成できる。
[0294] Alternatively, a bond that can be specifically cleaved can be formed between the probes, and the bond can be cleaved after detection. For example, this is described in Shabarova et al. (1991) and Dolinnaya
(1988) (both references are hereby incorporated by reference).

【0295】 Shabarovaら(1991)は、縮合剤として臭化シアンを用いてオリゴデオキシリボ ヌクレオチドを縮合させることを記載している。彼らのワンステップ化学ライゲ
ーション反応では、オリゴヌクレオチドを97℃に加熱し、0℃まで徐々に冷却し 、その後アセトニトリル中の10 mM BrCNを1 μl添加する。
[0295] Shabarova et al. (1991) describe condensing oligodeoxyribonucleotides using cyanogen bromide as a condensing agent. In their one-step chemical ligation reaction, the oligonucleotide is heated to 97 ° C., gradually cooled to 0 ° C., and then 1 μl of 10 mM BrCN in acetonitrile is added.

【0296】 Dolinnayaら(1988)は、DNA二本鎖中にホスホルアミダイトおよびピロホスフェ
ートヌクレオチド間結合を如何に組み込むかを記載している。彼らはまた、カッ
プリング剤として水溶性カルボジイミド(CDI)を用いて、DNAの糖リン酸骨格を修
飾するための化学的ライゲーション法を使用している。ホスホルアミダイト結合
の選択的切断には、15% CH3COOHと95℃で5分接触させる必要がある。ピロホスフ
ェート結合の選択的切断には、ピリジン−水混合物(9:1)および新たに蒸留した(
CF3CO)2Oとの接触が必要がある。
[0296] Dolinnaya et al. (1988) describe how to incorporate phosphoramidites and pyrophosphate internucleotide linkages into DNA duplexes. They have also used chemical ligation methods to modify the sugar phosphate backbone of DNA using water-soluble carbodiimide (CDI) as the coupling agent. Selective cleavage of the phosphoramidite bond requires contact with 15% CH 3 COOH at 95 ° C. for 5 minutes. For selective cleavage of the pyrophosphate bond, a pyridine-water mixture (9: 1) and freshly distilled (
Contact with CF 3 CO) 2 O is required.

【0297】実施例19 既知の突然変異の診断-スコアリングまたは完全遺伝子の再配列決定 簡単な場合には、選択された既知の突然変異がDNAセグメント中で起こるか否 かを発見することが目的であってもよい。この目的には12個未満のプローブで十
分であり、例えば、一方の対立遺伝子に陽性のプローブが5個、もう一方に陽性 のものが5個、そして両方に陰性のものが2個である。サンプルごとにスコアリン
グされるプローブの数が少ないため、多数のサンプルを平行して分析することが
可能である。例えば、12個のプローブを3回のハイブリダイゼーションサイクル に用いれば、64人の患者からの96個の異なるゲノム遺伝子座または遺伝子セグメ
ントを1枚の6×9インチ膜で分析することができる。この膜には12×24のサブア レイが含まれており、各サブアレイは、64人の患者由来の同一DNAセグメントを 示す64個のドットを有する。本実施例では、64枚の96ウェルプレートでサンプル
を調製してもよい。プレート1枚につき患者1人とし、ウェル1個につき分析す
べきDNAセグメント1つとすることができる。64枚のプレートからのサンプルを 、同じ膜の4分の1ごとにスポットして4つのレプリカとしてもよい。
Example 19 Diagnosis of Known Mutations-Scoring or Resequencing of the Complete Gene In simple cases, the goal was to find out if a selected known mutation occurred in a DNA segment. It may be. Less than 12 probes are sufficient for this purpose, for example, 5 probes positive for one allele, 5 positive for the other, and 2 negative for both. Because the number of probes scored for each sample is small, it is possible to analyze many samples in parallel. For example, using 12 probes in three hybridization cycles, 96 different genomic loci or gene segments from 64 patients can be analyzed on a single 6x9 inch membrane. The membrane contains a 12x24 sub-array, each sub-array having 64 dots representing the same DNA segment from 64 patients. In this example, a sample may be prepared in 64 96-well plates. There can be one patient per plate and one DNA segment to be analyzed per well. Samples from 64 plates may be spotted every quarter of the same membrane to make four replicas.

【0298】 12個のプローブのセットは、96個のセグメントの各々に対して単一チャネルピ
ペッティングまたは単一ピン移送(transferring)装置(または個別に制御される ピペットもしくはピンのアレイ)によって選択することができ、選択したプロー ブを12枚の96ウェルプレート中に配列させることができる。プローブが予備標識
されていない場合には標識してもよく、次いで4枚のプレートから得たプローブ をハイブリダイゼーション緩衝液と混合し、96チャネルピペッティング装置によ
って優先的にサブアレイに添加すればよい。ハイブリダイゼーションを1サイク ル行った後、膜を37℃〜55℃にて好ましくは未希釈のハイブリダイゼーション緩
衝液もしくは洗浄緩衝液中でインキュベートすることにより、先に適用したプロ
ーブを除去することが可能である。
A set of 12 probes is selected by single channel pipetting or a single pin transfer device (or an array of individually controlled pipettes or pins) for each of the 96 segments. The selected probes can be arranged in twelve 96-well plates. If the probe is not pre-labeled, it may be labeled, and the probes from the four plates may then be mixed with the hybridization buffer and preferentially added to the subarray by a 96-channel pipetting device. After one cycle of hybridization, the previously applied probe can be removed by incubating the membrane at 37 ° C to 55 ° C, preferably in undiluted hybridization or wash buffer. It is.

【0299】 一方の対立遺伝子に陽性のプローブが陽性であり、もう一方の対立遺伝子に陽
性のプローブが陰性である確率を利用して、2つの対立遺伝子のいずれが存在す
るのかを判定することができる。この重複スコアリングスキームでは、各プロー
ブのハイブリダイゼーションにおいて一定レベル(約10%)のエラーが許容可能で
ある。
The probability that a probe positive for one allele is positive and a probe positive for the other allele is negative can be used to determine which of the two alleles is present. it can. This duplication scoring scheme allows for a certain level of error (about 10%) in the hybridization of each probe.

【0300】 特に、より少ない重複度で十分な場合 (例えば、1または2個のプローブによっ
て2つの対立遺伝子の一方がサンプルに含まれるか否かが証明される場合)には、
プローブの不完全なセットを使用して多くの対立遺伝子のスコアリングを行うこ
ともできる。例えば、4000個の8-merのセットを用いると、無作為に選択した遺 伝子座について2つの対立遺伝子の一方に対して陽性であるプローブを少なくと も1つ見出す確率は91%である。プローブの不完全なセットを、被験サンプルの G+C含量および他の偏り(bias)を反映するように最適化してもよい。
In particular, where less redundancy is sufficient (eg, if one or two probes demonstrate whether one of the two alleles is included in the sample)
Many alleles can also be scored using an incomplete set of probes. For example, using a set of 4000 8-mers, there is a 91% chance of finding at least one probe that is positive for one of the two alleles for a randomly selected locus. . An incomplete set of probes may be optimized to reflect the G + C content and other bias of the test sample.

【0301】 完全遺伝子を配列決定する場合には、遺伝子を適切な数のセグメントで増幅す
ればよい。各セグメントごとに、プローブのセット(2〜4塩基当たり約1個のプロ
ーブ)を選択してハイブリダイズさせればよい。これらのプローブによって、被 験セグメントの何処に突然変異が存在するのかが確認できる。1つ以上の突然変 異部位が検出されるセグメント(即ち、これらのセグメントを含有するサブアレ イ)は追加のプローブとハイブリダイズし、突然変異部位において正確な配列を 見出すことができる。DNAサンプルを第2の6-merの各々で試験した際に、陽性に ハイブリダイズしたプローブTGCAAAおよびTATTCCによって包囲され、かつ3個の 陰性プローブCAAAAC、AAACTAおよびACTATTによって覆われる位置に突然変異が局
在化していれば、突然変異ヌクレオチドは、正常な配列のその位置に存在するA および/またはCのはずである。この変化は、単一塩基突然変異によって、また は塩基AA、ACもしくはCT間において1つもしくは2つのヌクレオチドが欠失したり
挿入されたりすることによって生じる。
When sequencing a complete gene, the gene may be amplified with an appropriate number of segments. A probe set (about one probe per 2 to 4 bases) may be selected and hybridized for each segment. These probes can determine where in the test segment the mutation is. Segments in which one or more mutation sites are detected (ie, subarrays containing these segments) can hybridize to additional probes and find the correct sequence at the mutation site. When the DNA sample was tested with each of the second 6-mers, the mutation was localized at a position surrounded by the positively hybridized probes TGCAAA and TATTCC and covered by the three negative probes CAAAAC, AAACTA and ACTATT. If so, the mutated nucleotide should be A and / or C present at that position in the normal sequence. This change may be caused by a single base mutation or by the deletion or insertion of one or two nucleotides between bases AA, AC or CT.

【0302】 一つのアプローチは、陽性にハイブリダイズしたプローブTGCAAAをヌクレオチ
ド1個分右側へ伸長させたプローブと、同じく陽性にハイブリダイズしたプロー ブTATTCCをヌクレオチド1個分左側へ伸長させたプローブを選択するというもの である。これらの8個のプローブ(GCAAAA、GCAAAT、GCAAAC、GCAAAGおよびATATTC
、TTATTC、CTATTC、GTATTC)を用いて、2つの問題のヌクレオチドを判定する。
One approach is to select a probe in which the positively hybridized probe TGCAAA has been extended to the right by one nucleotide and a probe in which the positively hybridized probe TATTCC has also been extended to the left by one nucleotide. It is to do. These eight probes (GCAAAA, GCAAAT, GCAAAC, GCAAAG and ATATTC
, TTATTC, CTATTC, GTATTC) are used to determine the two nucleotides in question.

【0303】 突然変異に関して最も可能性の高い推測を求めることができる。例えば、AがG
に突然変異することが判る。これらの結果を満たす解釈には2つある。一つは、
AをGで置換えることを唯一の変化とするものであり、もう一つは、この変化の他
にも、新たに判定されたGとそれに続くCの間に一定数の塩基が挿入されるという
ものである。架橋プローブを用いた結果が陰性の場合には、まず突然変異位置を
含む少なくとも1個の架橋プローブ(AAGCTA)によって、次いで追加の8個のプロー
ブCAAAGA、CAAAGT、CAAAGC、CAAAGGおよびACTATT、TCTATT、CCTATT、GCTATTを用
いてこれらの選択肢を確認すればよい。突然変異解明プローブを選択するには、
他にも多くの方法がある。
The most likely guess for the mutation can be determined. For example, A is G
It turns out that it mutates to. There are two interpretations that satisfy these results. one,
The only change is to replace A with G. In addition to this change, a certain number of bases are inserted between newly determined G and subsequent C. That is. If the result with the cross-linking probe is negative, first by at least one cross-linking probe containing the mutation position (AAGCTA), then by an additional 8 probes CAAAGA, CAAAGT, CAAAGC, CAAAGG and ACTATT, TCTATT, CCTATT , GCTATT may be used to confirm these options. To select a mutation elucidation probe,
There are many other ways.

【0304】 二倍体の場合には、試験サンプルとホモ接合体対照についてスコアを個別に比
較することで、ヘテロ接合体を同定することができる(上記参照)。連続するプロ
ーブで覆われるセグメントが2本の染色体の一方で突然変異している場合には、 これらの連続プローブのいくつかは約2分の1のシグナルを有するものと予測され
る。
In the case of diploid, heterozygotes can be identified by comparing the scores individually for the test sample and the homozygous control (see above). If the segment covered by a contiguous probe is mutated on one of the two chromosomes, then some of these contiguous probes are expected to have about one-half the signal.

【0305】実施例20 遺伝障害および他の形質の原因となる遺伝子(突然変異)の同定 長鎖プローブ(8-merまたは9-mer)の普遍的なセットをサンプルの固定化アレイ
上で使用すれば、サブクローニングをしなくても5〜20kb程度のDNA断片を配列決
定することができる。さらに、配列決定の速度は容易に約10,000,000bp/日/ハイ
ブリダイゼーション装置になり得る。この性能により、科学的または医学的に興
味のある個人に由来する大規模画分のヒト遺伝子またはヒトゲノムを繰返し再配
列決定することが可能となる。ヒト遺伝子の50%を再配列決定するためには、約
100,000,000bpの塩基対がチェックされるが、比較的短い期間に妥当なコストで 実施することができる。
Example 20 Identification of Genes (Mutations) That Cause Genetic Disorders and Other Traits A universal set of long probes (8-mer or 9-mer) is used on an immobilized array of samples. Thus, a DNA fragment of about 5 to 20 kb can be sequenced without subcloning. In addition, the speed of sequencing can easily be about 10,000,000 bp / day / hybridizer. This capability allows iterative resequencing of a large fraction of human genes or human genomes from individuals of scientific or medical interest. To resequence 50% of human genes,
100,000,000 bp base pairs are checked, but can be performed at a reasonable cost in a relatively short period of time.

【0306】 この優れた再配列決定能力を複数の方法に利用して、突然変異および/または
障害もしくは任意の他の形質をコードする遺伝子を同定することができる。基本
的には、特定の障害を有する患者の特定の組織またはゲノムDNAに由来するmRNA(
cDNAに変換し得るもの)を出発材料として使用すればよい。両方のDNA供給源から
、クローニング手法またはin vitro増幅手法(例えば、PCR)によって、適切な長 さの異なる遺伝子またはゲノム断片を調製することができる。クローニングを利
用する場合に、分析すべきクローンの最小限のセットをライブラリーから選択し
、次いでクローニングを行えばよい。この操作は、特に、5kbよりも長い少数の クローンを選別しようとする場合には、少数のプローブをハイブリダイゼーショ
ンさせればよいので効率的である。クローニングを行うことでハイブリダイゼー
ションのデータ量を約2倍に増やすことができるが、何万ものPCRプライマーを必
要とするわけではない。
This superior resequencing ability can be used in several ways to identify genes encoding mutations and / or disorders or any other trait. Basically, mRNA from a specific tissue or genomic DNA of a patient with a specific disorder (
which can be converted to cDNA) may be used as a starting material. Genes or genomic fragments of appropriate length can be prepared from both DNA sources by cloning or in vitro amplification techniques (eg, PCR). When using cloning, a minimal set of clones to be analyzed may be selected from the library and then cloned. This operation is efficient when a small number of clones longer than 5 kb are selected, since only a small number of probes need to be hybridized. Cloning can approximately double the amount of hybridization data, but does not require tens of thousands of PCR primers.

【0307】 改良を加えた手順の1つでは、DNAをGACGC(N5')/CTGCG(N10')のように切断する
HgaI等の酵素による制限切断によって遺伝子断片またはゲノム断片を調製するこ
とができる。5塩基からなる突出末端は断片ごとに異なる。1種類の酵素では、一
定数の遺伝子に対して決まった断片が生じる。cDNAまたはゲノムDNAを複数の酵 素で別々の反応にて切断することにより、目的の各遺伝子を適切に切り出すこと
ができる。1つのアプローチでは、切断されたDNAをサイズごとに分画する。この
ように調製したDNA断片(さらに、3'末端からヌクレオチドを1個ずつ除去し、か つ末端の長さと特異性を増加させるエキソヌクレアーゼIIIで任意に処理したも の)を、チューブまたはマルチウェルプレートに分配してもよい。共通部分と適 切な長さの可変突出末端とを有するDNAアダプターの比較的少数のセットから、 増幅させる必要のある遺伝子断片ごとにアダプター対を選択することができる。
これらのアダプターをライゲートし、次いで普遍的プライマーでPCRを行う。100
0個のアダプターから1,000,000対を生成させることができ、従って、アダプター
の共通末端に相補的な普遍的プライマー対によって、同一の条件下で1,000,000 通りの異なる断片を特異的に増幅させることが可能である。
In one refined procedure, DNA is cut like GACGC (N5 ′) / CTGCG (N10 ′)
Gene fragments or genomic fragments can be prepared by restriction cleavage with an enzyme such as HgaI. The overhang consisting of 5 bases differs for each fragment. One enzyme produces a fixed fragment for a certain number of genes. By cleaving cDNA or genomic DNA with a plurality of enzymes in separate reactions, each target gene can be appropriately cut out. In one approach, the cut DNA is fractionated by size. The DNA fragment prepared in this manner (and additionally treated with exonuclease III, which removes nucleotides one by one from the 3 'end and increases the length and specificity of the end), is added to a tube or multiwell. It may be distributed on a plate. From a relatively small set of DNA adapters with common portions and variable length overhangs, adapter pairs can be selected for each gene fragment that needs to be amplified.
These adapters are ligated and then PCR is performed with universal primers. 100
It is possible to generate 1,000,000 pairs from zero adapters, and thus, it is possible to specifically amplify 1,000,000 different fragments under the same conditions with a universal primer pair complementary to the common end of the adapter. is there.

【0308】 DNAの相違が複数の患者で繰り返し見出されるのであれば、このような配列変 化はナンセンスであるか、または対応するタンパク質の機能を変化させ得るもの
であり、従って、突然変異した遺伝子によって障害が引き起こされる可能性があ
る。特定の形質を有する有意数の個人を分析することにより、特定の遺伝子の機
能的対立遺伝子変異体を特定の形質と関連付けることができる。
If the DNA difference is found repeatedly in multiple patients, such sequence changes may be nonsense or may alter the function of the corresponding protein, and therefore, the mutated gene Can cause disability. By analyzing a significant number of individuals with a particular trait, functional allelic variants of a particular gene can be associated with a particular trait.

【0309】 このアプローチを使用すれば、広範な家系に対して高コストの遺伝子マッピン
グを行う必要がなくなり、また、このような遺伝子データまたは遺伝子材料がな
くても特定の有用性が認められる。
Using this approach, there is no need for expensive genetic mapping for a wide range of families, and certain utilities are found without such genetic data or genetic material.

【0310】実施例21 遺伝子マッピングにおける単一ヌクレオチド多型性のスコアリング この出願に開示される技術は、単一ヌクレオチド多型性(SNUP)を有するゲノム
断片の効率的な同定に適している。10人の個人において、クローニングまたはin
vitro増幅によって増幅可能な既知の配列の多数のゲノム断片に、記載の配列決
定法を適用することにより、SNUPを有する十分な数のDNAセグメントを同定する ことができる。多型性を有する断片をSNUPマーカーとしてさらに使用する。これ
らのマーカーは既にマッピングされているものでもよく(例えば、マッピングさ れたSTSに該当)、または下記のスクリーニング手法によってマッピングしてもよ
い。
Example 21 Scoring of Single Nucleotide Polymorphism in Gene Mapping The technique disclosed in this application is suitable for efficient identification of genomic fragments having single nucleotide polymorphism (SNUP). Cloning or in 10 individuals
By applying the described sequencing method to a large number of genomic fragments of a known sequence that can be amplified by in vitro amplification, a sufficient number of DNA segments with SNUP can be identified. Fragments with polymorphism are further used as SNUP markers. These markers may be already mapped (for example, corresponding to the mapped STS), or may be mapped by the screening method described below.

【0311】 該当する家族または集団に属する個人ごとに、マーカーを増幅してサブアレイ
のアレイ形状に配列させることによってSNUPをスコアリングすることが可能であ
る。サブアレイには、被験個人から増幅された同一のマーカーが含まれる。各マ
ーカーごとに、既知の突然変異の診断の場合と同様、一方の対立遺伝子に陽性の
6個以下のプローブと、もう一方の対立遺伝子に陽性の6個以下のプローブとから
なるセットを選択してスコアリングすることができる。1個のマーカーまたはマ ーカー群と障害とを有意に関連付けることによって、原因遺伝子の染色体位置を
決定することができる。ハイスループットでかつ低コストのため、何千ものマー
カーを何千もの個人についてスコアリングすることができる。このようなデータ
量のため、1,000,000bp未満の分解能レベルで遺伝子の位置を決定することがで き、さらに多遺伝子性疾患に関与する遺伝子の位置を決定することができる。該
当する正常な個人および疾患状態の個人に由来する特定の領域を配列決定して突
然変異をスコアリングすることにより、局在する遺伝子を同定することができる
[0311] SNUP can be scored by amplifying markers and arranging them in an array of subarrays for each individual belonging to the relevant family or population. The subarray contains the same markers amplified from the subject. For each marker, as in the diagnosis of known mutations,
A set consisting of no more than six probes and no more than six probes positive for the other allele can be selected and scored. By significantly associating a single marker or group of markers with a disorder, the chromosomal location of the causative gene can be determined. Due to high throughput and low cost, thousands of markers can be scored for thousands of individuals. Because of this amount of data, the location of genes can be determined at a resolution level of less than 1,000,000 bp, and the locations of genes involved in polygenic diseases can be determined. By sequencing specific regions from affected normal and diseased individuals and scoring for mutations, localized genes can be identified.

【0312】 ゲノムDNA由来のマーカーの増幅にはPCRが好ましい。各々のマーカーには、特
異的なプライマー対が必要である。既存のマーカーを転用するか、またはHgaIタ
イプの制限酵素でゲノムDNAを切断し、アダプター対とライゲートすることによ って調製し得る新しいマーカーを規定してもよい。
For amplification of a marker derived from genomic DNA, PCR is preferred. Each marker requires a specific primer pair. Existing markers may be diverted or new markers may be defined that can be prepared by cutting genomic DNA with an HgaI type restriction enzyme and ligating with an adapter pair.

【0313】 SNUPマーカーを増幅したり、プールとしてスポットすることにより、独立した
増幅反応の数を減らすことができる。この場合、1サンプル当たりより多くのプ ローブがスコアリングされる。4個のマーカーを12個のレプリカ膜上にプールお よびスポットする場合には、48個のプローブ(マーカー当たり12個)を4サイクル でスコアリングできる。
Amplifying the SNUP marker or spotting as a pool can reduce the number of independent amplification reactions. In this case, more probes are scored per sample. If 4 markers are pooled and spotted on 12 replica membranes, 48 probes (12 per marker) can be scored in 4 cycles.

【0314】実施例22 DNA断片の正体の検出および検証 制限切断、クローニングまたはインビトロにおける複数回の増幅(例えば、P
CR)によって作製したDNAを実験で同定できる。同定は、ゲル電気泳動分析
の結果特定サイズのDNAバンドが存在するかどうかを検証することによって実
施できる。または、特定のオリゴヌクレオチドを作製して、ハイブリダイゼーシ
ョンによって問題のDNA試料を検証するために使用できる。本明細書において
開発された手法により、各断片ごとに特定のオリゴヌクレオチドを作製すること
なく、大多数の試料をより効率的に同定することが可能になる。陽性プローブお
よび陰性プローブのセットは、既知の配列に基づいて、各断片の普遍的セットか
ら選択できる。陽性であると選択されるプローブは、通常、1つまたは数個のオ
ーバーラップ基を形成でき、陰性プローブは全挿入部位に拡散する。
Example 22 Detection and Verification of Identity of DNA Fragments Restriction cleavage, cloning or multiple amplifications in vitro (eg, P
CR) can be identified experimentally. Identification can be performed by verifying whether a DNA band of a specific size is present as a result of gel electrophoresis analysis. Alternatively, specific oligonucleotides can be made and used to verify the DNA sample in question by hybridization. The approach developed herein allows more efficient identification of a large number of samples without having to create a specific oligonucleotide for each fragment. The set of positive and negative probes can be selected from a universal set of each fragment based on the known sequence. Probes that are selected to be positive can usually form one or several overlapping groups, while negative probes diffuse to all insertion sites.

【0315】 本発明の技術は、YACクローンのマッピング過程の際にSTSsを同定する
ために使用できる。約100個のYACクローンまたはYACクローンのプール
についてSTSsの各々を試験することができる。これら100の反応によって
得られたDNAを1つのサブアレイにスポットする。異なるSTSsは逐次的な
サブアレイであってもよい。数サイクルのハイブリダイゼーションにおいて、D
NA試料の各々について、所定のYACクローン中に特定のSTSが存在するか
どうかをある程度の信頼性をもって証明する、または証明しない識別特性が形成
され得る。
The techniques of the present invention can be used to identify STSs during the process of mapping YAC clones. Each of the STSs can be tested on about 100 YAC clones or a pool of YAC clones. The DNA obtained from these 100 reactions is spotted on one subarray. The different STSs may be sequential sub-arrays. In several cycles of hybridization, D
For each of the NA samples, a discriminating characteristic can be formed that proves with certainty or does not prove whether a particular STS is present in a given YAC clone.

【0316】 個々のPCR反応の数または個々のスポット試料の数を減らすために、それぞ
れ、数個のSTSsを1つの反応において同時に増幅してもよく、またはPCR
試料を混合してもよい。この場合には、1ドットあたりより多くのプローブがス
コアリングされなければならない。STSs貯蔵は貯蔵中のYACsとは独立し
ており、1つのYACsまたはYACsのプールに対して使用できる。異なる色
で標識したいくつかのプローブを一緒にハイブリダイゼーションする場合には、
この案は特に魅力的である。
In order to reduce the number of individual PCR reactions or the number of individual spot samples, respectively, several STSs may be amplified simultaneously in one reaction, or
Samples may be mixed. In this case, more probes must be scored per dot. STSs storage is independent of YACs being stored and can be used for one YACs or a pool of YACs. When several probes labeled with different colors are hybridized together,
This proposal is particularly attractive.

【0317】 試料中にDNA断片が存在するかどうかを確認する以外に、いくつかの別個の
プローブまたはプローブの1つ以上のプールのハイブリダイゼーションの強度を
使用してDNAの量を推定できる。得られた強度を既知量のDNAを有する対照
試料の強度と比較することによって、スポットした全ての試料中のDNA量が同
時に求められる。DNA断片の同定にはほんの数プローブしか必要なく、塩基の
長さがN塩基のDNAに使用できるプローブをN個と思われるので、本発明の用
途では、任意のDNAセグメントを同定するのに十分なプローブは多くのセット
を必要としない。1000個の8-merから、平均で約30個の全長の対合プロー
ブを1000bp断片のために選択できる。
In addition to determining whether a DNA fragment is present in a sample, the intensity of hybridization of several separate probes or one or more pools of probes can be used to estimate the amount of DNA. By comparing the intensity obtained with that of a control sample having a known amount of DNA, the amount of DNA in all spotted samples is determined simultaneously. Since only a few probes are required to identify a DNA fragment, and N probes can be used for DNA having a base length of N bases, it is sufficient for the use of the present invention to identify any DNA segment. A simple probe does not require many sets. From the 1000 8-mers, an average of about 30 full-length matching probes can be selected for a 1000 bp fragment.

【0318】実施例23 感染性病原生物およびそれらの変種の同定 患者のウィルス、細菌、真菌および他の寄生性生物を検出するためのDNAに
基づいた試験は、通常、他の方法より信頼性が高く、安価である。DNA試験の
主要な利点は特定の菌株および変種を同定でき、最終的には、より効果的な治療
を適用できる。
Example 23 Identification of Infectious Pathogens and Variants Thereof DNA-based tests for detecting viruses, bacteria, fungi and other parasites in patients are usually more reliable than other methods. High and cheap. A major advantage of DNA testing is the ability to identify specific strains and variants, and ultimately to apply more effective treatments.

【0319】 細菌感染症において12種の既知の抗生物質耐性遺伝子が存在することはこれ
らの遺伝子を増幅することによって試験できる。128人の患者の増幅産物を2
つのサブアレイにスポットし、次いで、12種の遺伝子の24のサブアレイを8
×12cmの膜で4回反復することができる。各遺伝子について、陽性および陰
性スコアリングのために12種のプローブを選択できる。ハイブリダイゼーショ
ンは3サイクルの条件で実施することができる。これらの試験では、かなり小規
模のセットのプローブが普遍的である可能性が最も高い。例えば、1000個の
8-merから、平均で30個のプローブが1000bpの断片では陽性であり、1
0個の陽性プローブは信頼性の高い同定のためには通常十分である。実施例9に
記載するように、いくつかの遺伝子を一緒に増幅および/またはスポットし、所
定のDNA量を求めることができる。増幅した遺伝子の量は感染レベルの指標と
して使用することができる。
The presence of 12 known antibiotic resistance genes in bacterial infections can be tested by amplifying these genes. 2 amplification products from 128 patients
Spotted on one subarray, then 24 subarrays of 12 genes were
It can be repeated four times with a x12 cm membrane. For each gene, 12 probes can be selected for positive and negative scoring. Hybridization can be performed under three cycles. In these tests, a fairly small set of probes is most likely universal. For example, out of 1000 8-mers, an average of 30 probes are positive for the 1000 bp fragment and 1
Zero positive probes are usually sufficient for reliable identification. As described in Example 9, several genes can be amplified and / or spotted together to determine a given amount of DNA. The amount of the amplified gene can be used as an indicator of the level of infection.

【0320】 別の例は、HIVウィルスの1つの遺伝子またはゲノム全体の配列決定の可能
性に関係する。多様化の速さのために、このウィルスは最適な治療法の選択に多
大な困難を呈する。64人までの患者から単離したウィルス由来のDNA断片を
増幅して、記載されている手法によって再度配列決定することができる。得られ
た配列に基づいて、最適な治療法を選択することができる。一方が(異型接合型
の場合と同様の)基本配列を有する2種のウィルス種の混合物が存在する場合に
は、そのハイブリダイゼーションスコアを他の試料、特に基本的なウィルス種だ
けを含有する対照試料のスコアと定量比較することによって同定することができ
る。試料中に存在する2種のウィルス種の一方の変異部位をカバーする3〜4つ
のプローブでは2倍程度のスコアが得られる(上記を参照)。
Another example concerns the possibility of sequencing one gene or the whole genome of the HIV virus. Due to the speed of diversification, this virus presents great difficulties in selecting the optimal treatment. DNA fragments from viruses isolated from up to 64 patients can be amplified and resequenced by the described techniques. Based on the sequence obtained, the optimal treatment can be selected. If there is a mixture of two viral species, one of which has the basic sequence (as in the case of the heterozygous type), the hybridization score is determined by comparing the hybridization score with the other samples, especially the control containing only the basic viral species. It can be identified by quantitative comparison with the sample score. About 3 times the score is obtained with 3 to 4 probes covering one mutation site of the two virus species present in the sample (see above).

【0321】実施例24 法医学的同定および親子の同定 配列の多形性は個々のゲノムDNAを独自なものにしている。これにより、犯
罪現場から採取した血液または他の体液または組織の分析および犯罪容疑者の試
料との比較が可能になる。多形部位が十分な数であれば試料の独自の識別特性を
形成するようにスコアリングされる。SBHは1つのヌクレオチド多形を容易に
スコアリングしてこのような識別特性を生ずる。
Example 24 Forensic identification and parent-child identification Polymorphisms in the sequence make each genomic DNA unique. This allows analysis of blood or other bodily fluids or tissues taken from crime scenes and comparison with samples of suspected criminal. A sufficient number of polymorphic sites are scored to form a unique signature of the sample. SBH readily scores single nucleotide polymorphisms to produce such discriminating properties.

【0322】 試料および容疑者由来の1セットのDNA断片(10〜1000)を増幅する
ことができる。1つの断片を提示する試料および容疑者由来のDNAsを1つま
たはいくつかのサブアレイにスポットし、各サブアレイを4回複製することがで
きる。3サイクルで、12個のプローブが各DNA座について容疑者を含む試料
の各々に対立遺伝子AまたはBが存在することを判定できる。試料および容疑者
のパターンを対合させることにより、その犯罪の容疑者を発見することができる
One set of DNA fragments (10-1000) from a sample and a suspect can be amplified. Samples representing one fragment and DNAs from suspects are spotted on one or several subarrays, and each subarray can be replicated four times. In three cycles, twelve probes can determine the presence of allele A or B in each of the samples containing suspects for each DNA locus. By matching the sample and the pattern of the suspect, the suspect of the crime can be found.

【0323】 同じ手法を子供の親の正体の証明に適用することができる。DNAを調製し、
子供と大人由来の多形性を示す遺伝子座を増幅し;各々についてハイブリダイゼ
ーションすることによって対立遺伝子AまたはBのパターンを求めることができ
る。得られたパターン並びに陽性および陰性対照の比較は家族関係を決定する際
の助力となる。この場合には、同定には対立遺伝子の意義ある部分だけが一方の
親と対合する必要がある。遺伝子座のスコアリング数が多いと、この手法の統計
誤差またはデノボ変異の遮蔽効果の回避を可能にする。
The same approach can be applied to proof of the identity of a child's parent. Prepare DNA,
Allelic A or B patterns can be determined by amplifying polymorphic loci from children and adults; hybridization for each. The patterns obtained and the comparison of the positive and negative controls will help determine family relationships. In this case, identification requires that only the significant portion of the allele be paired with one parent. A high number of scoring loci allows avoiding the statistical error of this approach or the shielding effect of de novo mutations.

【0324】実施例25 集団または種の遺伝的多様性および生態学的地位の生物的多様性の評価 かなりの数の遺伝子座(例えば、いくつかの遺伝子またはミトコンドリアDN
A全体)について対立遺伝子変異の頻度を測定することにより、1つの集団の遺
伝子型、歴史および進化または疾患もしくは絶滅の可能性等に対する環境の影響
に関する結果などの種々の種類の結果が得られる。特定の既知の対立遺伝子を試
験することによって、または小さな変異または環境における変異原の存在を明ら
かにすることができるデノボ変異を形成することができるようにいくつかの遺伝
子座の全長を再度配列決定することによってこれらの評価を実施することができ
る。
EXAMPLE 25 Assessing Genetic Diversity of Populations or Species and Biodiversity of Ecological Status A significant number of loci (eg, some genes or mitochondrial DN
By measuring the frequency of allelic variation for A), various types of results can be obtained, such as those relating to the genotype, history and evolution of one population or the effects of the environment on disease or potential for extinction. Resequencing the full length of several loci by testing for certain known alleles or to form small mutations or de novo mutations that can reveal the presence of mutagens in the environment By doing so, these evaluations can be performed.

【0325】 または、リボソームRNAsの遺伝子または高度に保存されているタンパク質
の遺伝子などの進化的に保存されているDNA配列を再度配列決定することによ
って、微生物界における生物多様性を調査することができる。環境からDNAを
調製し、保存配列に対応するプライマーを使用して特定の遺伝子を増幅すること
ができる。DNA断片は、好ましくは、プラスミドベクターにクローニングされ
る(または、マルチウェルプレートの1ウェルあたり1分子の濃度まで希釈され
、次いで、インビトロで増幅される)。この方法で作製したクローンを上記のよ
うに再度配列決定することができる。2種類の情報が得られる。その最初として
、異なる種の一覧表を形成することができると同時に、各種の個体の密度を規定
することができる。別の情報を使用して、生態的因子または汚染が生態系に与え
る影響を測定することができる。いくつかの種が根絶するかどうか、または種の
発生量比が汚染によって変更されるかどうかが明らかになる。本発明の方法はま
た、化石のDNAsを配列決定するのに適用できる。
Alternatively, biodiversity in the microbial world can be investigated by resequencing an evolutionarily conserved DNA sequence, such as the gene for ribosomal RNAs or the gene for highly conserved proteins. . DNA can be prepared from the environment and specific genes can be amplified using primers corresponding to the conserved sequences. The DNA fragment is preferably cloned into a plasmid vector (or diluted to a concentration of one molecule per well of a multiwell plate and then amplified in vitro). Clones generated in this manner can be resequenced as described above. Two types of information are obtained. As a first step, a list of different species can be formed, while the densities of the various individuals can be defined. Other information can be used to determine the impact of ecological factors or pollution on ecosystems. It becomes clear whether some species will be eradicated or if the abundance ratio of species will be altered by contamination. The method of the present invention is also applicable for sequencing fossil DNAs.

【0326】実施例26 核酸種の検出または定量 基体に固定した未標識プローブまたは溶液中の標識プローブを含むプローブ対
を使用して、DNAまたはRNA種を検出および定量することができる。標識プ
ローブおよびリガーゼの存在下で未標識プローブに暴露することによって種を検
出および定量することができる。具体的には、標識および未標識プローブの連結
によって試料の核酸骨格に伸長プローブが形成されることは、検出対象の種が存
在することを示す。このように、未連結の標識プローブを除去後、基体上のアレ
イの特定の箇所に標識が存在することは試料の種の存在を示すと同時に、標識の
定量は種の発現量を示す。
Example 26 Detection or Quantification of Nucleic Acid Species DNA or RNA species can be detected and quantified using an unlabeled probe immobilized on a substrate or a probe pair containing a labeled probe in solution. Species can be detected and quantified by exposure to unlabeled probe in the presence of labeled probe and ligase. Specifically, the formation of an extended probe on the nucleic acid skeleton of the sample by the ligation of the labeled and unlabeled probes indicates that the species to be detected is present. Thus, after removal of the unligated labeled probe, the presence of the label at a particular location on the array on the substrate indicates the presence of the species in the sample, while the quantification of the label indicates the expression level of the species.

【0327】 または、1つ以上の未標識プローブを、溶液で導入する予定の1つ以上の標識
プローブとの対の第1のメンバーとして基体上に配列することができる。一方法
によると、アレイ上の標識のマルチプレクシングは、識別可能な波長で蛍光を発
する染料を使用して実施することができる。この方法では、アレイに適用される
cDNAと被同定種に特異的な標識および未標識プローブの対との混合物は、c
DNA種の存在および発現量について調査することができる。好ましい実施態様
によると、本発明の方法を実施して、被検出cDNAの配列とオーバーラップす
る配列を含む未標識および標識プローブ対を選択することによって、cDNAs
の一部を配列することができる。
Alternatively, one or more unlabeled probes can be arranged on a substrate as a first member of a pair with one or more labeled probes to be introduced in solution. According to one method, multiplexing of the labels on the array can be performed using a dye that fluoresces at an identifiable wavelength. In this method, the mixture of the cDNA applied to the array and the pair of labeled and unlabeled probes specific for the species to be identified is c
The presence and expression level of the DNA species can be investigated. According to a preferred embodiment, the method of the present invention is performed to select cDNA and unlabeled probe pairs that contain sequences that overlap the sequence of the cDNA to be detected.
Can be arranged.

【0328】 プローブを選択して、標的病原生物ゲノムにのみ組み合わせた状態で存在する
選択されたプローブ対を組成物中に含むことによって、特定の病原生物ゲノムの
存在を検出し、定量することができる。このように、1つのプローブ対は必ずし
も病原生物ゲノムに特異的でなくてもよいが、対の組み合わせは特異的である。
同様に、cDNAsを検出または配列決定する際には、特定のプローブがcDN
Asまたは他の種類の種に特異的ではないことが生じるかもしれない。にもかか
わらず、特定の種の存在および定量は、別個のアレイ位置に選択されたプローブ
の組み合わせが配置されるということが特定の種の存在を示すという結果によっ
て判定される。
By selecting a probe and including a selected probe pair present in the composition in combination only with the target pathogen genome in the composition, the presence of the particular pathogen genome can be detected and quantified. it can. Thus, one probe pair need not be specific to the genome of a pathogenic organism, but the combination of pairs is specific.
Similarly, when detecting or sequencing cDNAs, certain probes may be identified as cDNs.
It may happen that it is not specific to As or other species. Nevertheless, the presence and quantification of a particular species is determined by the result that placement of the selected probe combination at a separate array location indicates the presence of the particular species.

【0329】 約10kb以上のDNAを有する感染菌は、ポリメラーゼ連鎖反応(PCR)
または他の標的増幅手法を使用しないで、支持体結合検出チップを使用して検出
することができる。他の方法によると、細菌およびウィルスを含む感染菌のゲノ
ムは、PCRによって1つの標的ヌクレオチド配列を増幅し、標的配列に特異的
な標識プローブのハイブリダイゼーションによって標的の存在を検出することに
よってアッセイされる。このようなアッセイは1つの標的配列だけに特異的であ
るために、検出可能なシグナルとなる十分な標的を提供するために、PCRなど
の方法によって遺伝子を増幅することが必要である。
Infectious bacteria having about 10 kb or more of DNA can be analyzed by polymerase chain reaction (PCR).
Alternatively, detection can be performed using a support-bound detection chip without using other target amplification techniques. According to another method, the genome of infectious bacteria, including bacteria and viruses, is assayed by amplifying one target nucleotide sequence by PCR and detecting the presence of the target by hybridization of a labeled probe specific for the target sequence. You. Because such assays are specific to only one target sequence, it is necessary to amplify the gene by a method such as PCR to provide sufficient target for a detectable signal.

【0330】 この実施例によると、関心のある感染菌に特異的な多重の異なる固定されたオ
リゴヌクレオチドプローブのアレイを含む固相検出チップが調製される、フォー
マット3-型反応による感染菌に特徴的なヌクレオチド配列を検出する改善され た方法が提供される。標的核酸に相補的な多くの未標識プローブの混合物を含む
1つのドットは、1つの位置における種に特異的な標識を濃縮しており、それに
よって拡散またはシングルプローブ標識法よりも感度が改善される。このような
多重プローブは標的ヌクレオチド配列のオーバーラップ配列であってもよいが、
非オーバーラップ配列並びに非隣接配列であってもよい。このようなプローブは
、好ましくは、約5〜12のヌクレオチド長を有する。
According to this example, a solid phase detection chip comprising an array of multiple different immobilized oligonucleotide probes specific to the infectious agent of interest is prepared, characterized by infectious agents by format 3-type reaction. An improved method for detecting a specific nucleotide sequence is provided. One dot containing a mixture of many unlabeled probes complementary to the target nucleic acid enriches the species-specific label at one location, thereby improving sensitivity over diffusion or single probe labeling methods. You. Such multiple probes may be overlapping sequences of the target nucleotide sequence,
Non-overlapping sequences as well as non-adjacent sequences may be used. Such probes preferably have a length of about 5 to 12 nucleotides.

【0331】 試料中に存在するプローブアレイおよび標的配列に暴露された核酸試料は多重
固定プローブとハイブリダイゼーションする。ついで、固定プローブに隣接する
標的配列に特異的に結合するように選択された多重標識プローブのプールを試料
と共に未標識オリゴヌクレオチドプローブ混合物のアレイに適用する。次いで、
リガーゼ酵素をチップに適用して、隣接プローブを試料に連結する。次いで、検
出チップを洗浄して、プローブと試料核酸のハイブリダイゼーションしなかった
ものおよび連結しなかったものを除去して、標識の有無によって試料核酸の存在
を求めることができる。この方法は試料薬剤のモル濃度が約1000倍低下した
信頼性の高い試料検出法を提供する。
The nucleic acid sample exposed to the probe array and the target sequence present in the sample hybridizes with the multiple immobilized probes. The pool of multi-labeled probes selected to specifically bind to the target sequence adjacent to the immobilized probe is then applied along with the sample to an array of unlabeled oligonucleotide probe mixtures. Then
A ligase enzyme is applied to the chip to ligate adjacent probes to the sample. Next, the detection chip is washed to remove the non-hybridized and non-ligated probe and sample nucleic acid, and the presence of the sample nucleic acid can be determined based on the presence or absence of the label. This method provides a reliable sample detection method in which the molar concentration of the sample drug is reduced by about 1000 times.

【0332】 本発明のさらに別の態様として、それ自体発色多重標識、酵素多重標識または
放射性多重標識を含む、またはそれ自体、多重標識されているさらに別のプロー
ブ剤による特異的な結合を受けやすい遊離プローブと共通の末端を提供するなど
によって標識プローブシグナルを増幅することができる。この方法では、第2回
目のシグナル増幅を実施することができる。標識または未標識プローブを第2回
目の増幅に使用することができる。この第2回目の増幅では、多重標識を有する
DNA試料が長いと増幅強度シグナルが10〜100倍増加し、総増幅シグナル
は100,000倍となる。この実施例の両態様を使用することにより、約10
0,000倍の強度シグナルによってプローブ-DNA連結の陽性の結果を得る ことができる。
In yet another embodiment of the present invention, which comprises a chromogenic multilabel, an enzymatic multilabel or a radioactive multilabel per se, or as such is susceptible to specific binding by another multilabeled probe agent. The labeled probe signal can be amplified, such as by providing a common end with the free probe. In this method, the second signal amplification can be performed. Labeled or unlabeled probes can be used for a second round of amplification. In the second amplification, if the DNA sample having a multiplex label is long, the amplification intensity signal increases by 10 to 100 times, and the total amplification signal increases by 100,000 times. By using both aspects of this example, about 10
A positive result of probe-DNA ligation can be obtained with a 0000-fold intensity signal.

【0333】 本発明のさらに別の態様により、完全なセットのプローブ、例えば4096個
の6-merプローブからなるアレイまたはスーパーアレイを作製することができる
。この種類のアレイは、任意の核酸種の同定、または一部には任意の核酸種の配
列決定を完成することができるという意味において普遍的である。アレイ中の個
々のスポットは1つのプローブ種またはプローブの混合物、例えば、1つの反応
で合成されるN(1-3)B(4-6)N(1-3)種の混合物を含有してもよい (Nは4ヌクレオチド全てを示し、Bは1つの特異的なヌクレオチドを示し、関
連する数字は塩基の数の範囲である、すなわち、1-3は「1〜3個の塩基」を 意味する。)これらの混合物は、同じ長い核酸種分子の異なる部分からシグナル
を採取することにより、低濃度で存在する核酸種のより強い信号を提供する。普
遍的なセットのプローブは多数のサブセットに小分割され、ハイブリダイゼーシ
ョン緩衝液の拡散を防止するバリアによって分離されたユニットアレイとして試
料および標識プローブとともにスポットされる。
According to yet another aspect of the invention, an array or superarray consisting of a complete set of probes, for example, 4096 6-mer probes, can be generated. Arrays of this type are universal in the sense that any nucleic acid species can be identified, or partially sequenced, of any nucleic acid species. Each spot in the array contains one probe species or a mixture of probes, eg, a mixture of N (1-3) B (4-6) N (1-3) species synthesized in one reaction. (N indicates all four nucleotides, B indicates one specific nucleotide, and the associated numbers are in the range of the number of bases, ie, 1-3 means "1-3 bases" These mixtures provide a stronger signal of nucleic acid species present at low concentrations by collecting signals from different parts of the same long nucleic acid species molecule. The universal set of probes is subdivided into a number of subsets and spotted with the sample and labeled probes as a unit array separated by a barrier that prevents diffusion of the hybridization buffer.

【0334】 既知の配列を有する核酸種を同定するために、未標識固定プローブおよび標識
プローブ溶液の両者を含む1種以上のオリゴヌクレオチド配列を選択することが
できる。標識プローブを合成するか、または予め合成しておいた完全なセットの
例えば、7-merから選択する。リガーゼの添加の結果、プローブが共有結合され
るように、固定および標識プローブの対を標的配列に隣接してハイブリダイゼー
ションするように、標識プローブを対応するユニットアレイの固定プローブに添
加する。 ユニットアレイが、所定の核酸種において陽性である(分離されたスポットと
して、または同じスポット内で)2つ以上の固定プローブを含有する場合には、
全ての対応する標識プローブを同じユニットアレイに混合および添加することが
できる。核酸種の混合物を試験する場合には、標識プローブの混合物がさらによ
り重要である。核酸種の複雑な混合物の一例は1つの細胞または組織中のmRN
Asである。
To identify nucleic acid species having a known sequence, one or more oligonucleotide sequences can be selected that include both an unlabeled immobilized probe and a labeled probe solution. The labeled probes are synthesized or selected from a complete set of pre-synthesized, eg, 7-mers. Labeled probes are added to the immobilized probes of the corresponding unit array such that the addition of the ligase results in the covalent attachment of the probes and hybridization of the pair of immobilized and labeled probes adjacent to the target sequence. If the unit array contains two or more immobilized probes that are positive for a given nucleic acid species (as separate spots or within the same spot),
All corresponding labeled probes can be mixed and added to the same unit array. When testing mixtures of nucleic acid species, mixtures of labeled probes are even more important. One example of a complex mixture of nucleic acid species is mRN in one cell or tissue.
As.

【0335】 本発明の一実施態様によると、固定プローブのユニットアレイにより、全ての
可能な固定プローブと比較的小数の標識プローブの溶液を使用することができる
。マルチプレックス標識法を実施する場合には、標識プローブのさらに複雑な溶
液を使用することができる。好ましいマルチプレクシング方法は異なる蛍光染料
または質量分析計で分離できる分子量標識を使用することができる。
According to one embodiment of the present invention, a unit array of immobilized probes allows the use of a solution of all possible immobilized probes and a relatively small number of labeled probes. When performing the multiplex labeling method, more complex solutions of labeled probes can be used. Preferred multiplexing methods can use different fluorescent dyes or molecular weight labels that can be separated by a mass spectrometer.

【0336】 または、本発明の好ましい実施態様によると、多数の核酸配列に高頻度でハイ
ブリダイゼーションする比較的短い固定プローブを選択することができる。この
ような短いプローブを、少なくとも1つの標識プローブが固定プローブの各々に
対応するように作製することができる標識プローブの溶液と併用して使用する。
好ましい溶液は、標識プローブのどれも2つ以上の固定プローブに対応しないも
のである。
Alternatively, in accordance with a preferred embodiment of the present invention, relatively short immobilized probes can be selected that hybridize frequently to a large number of nucleic acid sequences. Such short probes are used in combination with a solution of labeled probes that can be made such that at least one labeled probe corresponds to each of the immobilized probes.
Preferred solutions are those in which none of the labeled probes corresponds to more than one immobilized probe.

【0337】 実施例27全ての可能な10-merを用いたHIVウィルスセグメントの審問 フォーマットIII SBHのこの実施例では、全ての可能な結合5-mer(1
024個の可能なペンタマー)のアレイをナイロン膜(例えば、ジーンスクリー
ン(Gene Screen))上に作製した。5‘-TTTTTT-NNN-3 ’(N=4種全ての塩基A、C、G、Tで、反応のこの段階では、等しいモル両
の4種全ての塩基を添加する)の5‘末端を有する結合5-merオリゴヌクレオチ
ドを合成する。これらのオリゴヌクレオチドをナイロン膜に正確にスポットし、
スポットを乾燥させ、UV光線で乾燥させたスポットを処理することによってオ
リゴヌクレオチドを固定した。
Example 27 Interrogation of HIV Virus Segments Using All Possible 10-mers Format III In this example of SBH, all possible linked 5-mers (1
An array of 024 possible pentamers) was made on a nylon membrane (eg, GeneScreen). 5′-TTTTTT-NNN-3 ′ (N = all four bases A, C, G, T, at this stage of the reaction, adding an equal molar amount of all four bases) A conjugated 5-mer oligonucleotide is synthesized. Spot these oligonucleotides accurately on a nylon membrane,
The oligonucleotide was immobilized by drying the spot and treating the spot dried with UV light.

【0338】 アレイ中のサブアレイを、各サブアレイが隣接サブアレイによる交差汚染をう
けることなく、ハイブリダイゼーションすることを可能にする疎水性ストリップ
のような物理的バリアによって互いに分配される。好ましい実施態様において、
疎水性ストリップは適当な(このような溶媒は当技術上周知である)溶媒中でシ
リコーン溶液(例えば、家庭用シリコーンのりおよびシールのり)から作製され
る。シリコーングリースのこの溶液をサブアレイ間に適用して、溶媒留去後に細
胞を分離する疎水性ストリップとして作用するラインを形成する。
The subarrays in the array are separated from each other by a physical barrier, such as a hydrophobic strip, that allows each subarray to hybridize without being cross-contaminated by adjacent subarrays. In a preferred embodiment,
The hydrophobic strip is made from a silicone solution (eg, household silicone paste and seal paste) in a suitable solvent (such solvents are well known in the art). This solution of silicone grease is applied between the subarrays to form a line that acts as a hydrophobic strip separating cells after evaporation.

【0339】 このフォーマットIIIの例では、遊離または溶液(未結合)5-めcrsを 5‘-NN-3’(N=は4種全ての塩基A、C、G、T)の3‘末端を用いて合
成した。この実施態様において、遊離の5-merおよび結合5-merを組み合わせて
、20kbより少ない既知のDNA配列を配列決定するために可能な全ての10
-merを作製する。20kbの2本鎖を40kbの1本さDNAに変性する。この
40kbのss DNAは全ての可能な10-merの約4%とハイブリダイゼーシ
ョンする。10-mer結合配列および既知の標的配列の低い頻度により、配列情報
を損失することなく、各サブアレイを処理するための遊離または溶液(未結合)
5-merをプールすることが可能になる。好ましい実施態様において、16のプロ
ーブを各アレイについてプールし、すべの可能な5-merを遊離の5-merの合計6
4のプールで表わす。従って、全ての可能な10-merを、1024個のサブアレ
イを使用してDNA試料に対してプローブ化することができる(遊離の5-merの
各プールについて16サブアレイ)。
In this format III example, the free or solution (unbound) 5-crs is replaced by the 5′-NN-3 ′ (N = the 3 ′ end of all four bases A, C, G, T) Was synthesized using In this embodiment, the free 5-mer and the bound 5-mer are combined to allow all possible 10-mer sequences of less than 20 kb to be sequenced.
Make -mer. The 20 kb double strand is denatured to 40 kb single strand DNA. This 40 kb ss DNA hybridizes to about 4% of all possible 10-mers. Free or solution (unbound) for processing each subarray without loss of sequence information due to the low frequency of 10-mer binding sequences and known target sequences
It becomes possible to pool 5-mers. In a preferred embodiment, 16 probes are pooled for each array, and all possible 5-mers are free 5-mers for a total of 6
Expressed as pool 4. Thus, all possible 10-mers can be probed for DNA samples using 1024 subarrays (16 subarrays for each free 5-mer pool).

【0340】 この実施態様における標的DNAはHIVウィルスの2つの600bpセグメ
ントを示す。これらの600bpセグメントは60のオーバーラップする30-m
erのプールによって示される(30-merが20ヌクレオチドごとに各隣接30-m
erとオーバーラップする)。30-merのプールは、当技術上周知の技法を使用し
て処理して標的DNAを切断、消化および/またはランダムPCRして、非常に
小さいの断片のランダムプールを作製した標的DNAに類似している。
The target DNA in this embodiment represents two 600 bp segments of the HIV virus. These 600 bp segments have 60 overlapping 30-m
er (represented by a 30-mer every 20 nucleotides of each adjacent 30-m
er). The 30-mer pool is similar to target DNA that has been processed using techniques well known in the art to cut, digest, and / or random PCR the target DNA to create a random pool of very small fragments. ing.

【0341】 先のフォーマットIIIの例に上記するように、遊離の5-merを放射性同位体
、ビオチン、蛍光染料等で標識する。標識した遊離5-merを結合5-merと共に標
的DNAにハイブリダイゼーションし、連結する。好ましい実施態様において、
300〜1000単位のリガーゼを反応液に添加する。ハイブリダイゼーション
条件は、先の実施例の技法に準じて実施した。標的DNAおよび過剰の遊離のプ
ローブを連結し、除去後、(上記の実施例に記載する技法を使用して)アレイを
アッセイして、標識プローブの位置を決定する。
The free 5-mer is labeled with a radioisotope, biotin, a fluorescent dye, etc., as described above in the Format III example above. The labeled free 5-mer is hybridized with the bound 5-mer to the target DNA and ligated. In a preferred embodiment,
Add 300-1000 units of ligase to the reaction. Hybridization conditions were performed according to the technique of the previous example. After ligation and removal of the target DNA and excess free probe, the array is assayed (using the techniques described in the Examples above) to determine the location of the labeled probe.

【0342】 各サブアレイ中の標的の既知のDNA配列、並びに既知の遊離および結合5-m
erは、どの結合5-merが各サブアレイ中の標識遊離5-merに連結するかを予測す
る。これらの予測ドットの20由来のシグナルは損失し、予測配列由来の標的D
NA中の各変化について20の新たなシグナルが得られる。これらの10の新た
なドットにおける結合5-merのオーバーラップ配列は、どの遊離の標識5-merが
各新たなドット中に結合するかを同定する。
The known DNA sequence of the target in each subarray and the known free and bound 5-m
er predicts which binding 5-mer will link to the labeled free 5-mer in each subarray. The signal from 20 of these predicted dots is lost and the target D from the predicted sequence is lost.
Twenty new signals are obtained for each change in NA. The overlapping sequence of the binding 5-mer in these 10 new dots identifies which free labeled 5-mer binds in each new dot.

【0343】 上記の方法を使用して、遊離の標識5-mer、試験HIVDNA配列のアレイお
よびプールに全ての可能な10-merをプローブ処理する。このフォーマットII
I方法を使用して、本発明社らは、試験したセグメントの「野生型」配列並びに
これらの配列に導入されたいくつかの配列「変異体」を正しく同定した。
Using the method described above, probe the free labeled 5-mer, arrays of test HIV DNA sequences and pools with all possible 10-mers. This format II
Using Method I, we correctly identified the "wild-type" sequences of the tested segments, as well as some of the sequence "variants" introduced into these sequences.

【0344】実施例28 反復DNA配列の配列決定 位置実施態様において、標的DNAにおける反復DNA配列を改良したフォー
マットIII方法における「スペーサーオリゴヌクレオチド」を用いて配列決定
する。種々の長さの反復DNA配列のスペーサーオリゴヌクレオチド(反復配列
は1回めのSBH操作で同定される)を、第1の既知の隣接するオリゴヌクレオ
チドおよび第2の既知のまたはスペーサーの他方の端に隣接する可能なオリゴヌ
クレオチドの群(1回めのSBH操作により周知)とともに標的DNAにハイブ
リダイゼーションする。反復DNAセグメントの長さに一致するスペーサーを標
的にハイブリダイゼーションする場合、2つの隣接するオリゴヌクレオチドをス
ペーサーに連結することができる。第1の既知のオリゴヌクレオチドを基体に固
定し、第2の既知の、または可能なオリゴヌクレオチドを標識する場合には、適
切な長さのスペーサーが標的DNAにハイブリダイゼーションするときに、標識
した第2の既知のまたは可能なオリゴヌクレオチドを含む結合連結産物を形成す
る。
[0344] In sequencing position embodiment of Example 28 repeated DNA sequences and sequenced using "spacer oligonucleotide" in format III method with improved repetitive DNA sequence in the target DNA. Spacer oligonucleotides of various lengths of the repetitive DNA sequence (the repetitive sequence is identified in a first round of SBH manipulation) are combined with a first known adjacent oligonucleotide and the other end of a second known or spacer. Hybridizes to the target DNA with a group of possible oligonucleotides flanked by (known well by the first round of SBH operation). When hybridizing to the target a spacer corresponding to the length of the repetitive DNA segment, two adjacent oligonucleotides can be ligated to the spacer. When a first known oligonucleotide is immobilized on a substrate and a second known or possible oligonucleotide is labeled, the appropriate length of the spacer will hybridize to the target DNA when the labeled second oligonucleotide is hybridized to the target DNA. A ligated product comprising two known or possible oligonucleotides is formed.

【0345】実施例29 フォーマットIIISBHを用いた分岐点による配列決定 一実施態様において、標的DNA中の分岐点を、第3のセットのオリゴヌクレ
オチドと改良フォーマットIII方法を使用して配列決定する。1回目のSBH
操作の後に、配列がコンパイルされるときに、いくつかの分岐点を同定すること
ができる。分岐点に至る既知の配列の1つと部分的にオーバーラップするオリゴ
ヌクレオチドをハイブリダイゼーションし、次いで、標識され、分岐点を生ずる
配列の1つに相当する追加のオリゴヌクレオチドを標的にハイブリダイゼーショ
ンすることによってこれは解決される。適切なオリゴヌクレオチドが標的DNA
にハイブリダイゼーションされると、標識オリゴヌクレオチドは他と連結するこ
とができる。好ましい実施態様において、1から数ヌクレオチドごとに分岐点か
らオフセットされる第1のオリゴヌクレオチドを選択し(分岐配列の1つに読み
込まれるように)、第1の配列から分岐点の配列に読み込まれる第2のオリゴヌ
クレオチドを選択し、1から数ヌクレオチドごとに分岐点の配列のオーバーラッ
プを有する全ての可能な分岐配列に対応する第3のオリゴヌクレオチドのセット
(第1のオリゴヌクレオチドに対応する)を選択する。これらのオリゴヌクレオ
チドを標的DNAにハイブリダイゼーションし、適切な分岐配列を有する第3の
オリゴヌクレオチド(第1のオリゴヌクレオチドの分岐配列と一致する)だけが
第1および第2のオリゴヌクレオチドとの連結産物を産生する。
Example 29 Sequencing by Branching Point Using Format III SBH In one embodiment, branching points in target DNA are sequenced using a third set of oligonucleotides and a modified Format III method. First SBH
After the operation, when the array is compiled, some branch points can be identified. Hybridizing an oligonucleotide that partially overlaps one of the known sequences leading to the branch point, and then hybridizing to the target an additional oligonucleotide that is labeled and corresponds to one of the sequences that gives rise to the branch point. This will be solved. The appropriate oligonucleotide is the target DNA
When hybridized, the labeled oligonucleotide can be ligated to another. In a preferred embodiment, the first oligonucleotide that is offset from the branch point by one to several nucleotides is selected (as it is read into one of the branch sequences) and read from the first sequence into the sequence at the branch point. A second set of oligonucleotides (corresponding to the first oligonucleotide) corresponding to all possible branch sequences having an overlap of the sequence of the branch point every one to several nucleotides with the selection of the second oligonucleotide Select These oligonucleotides are hybridized to the target DNA, and only the third oligonucleotide having the appropriate branch sequence (which matches the branch sequence of the first oligonucleotide) is ligated to the first and second oligonucleotides. To produce

【0346】実施例30 標的核酸を分析するためのマルチプレクシングプローブ この実施例において、セットの各プローブがセット中の他のプローブから識別
されるように、プローブのセットを異なる標識で標識する。従って、プローブセ
ットを、任意のプローブ情報を損失することなく、1つのハイブリダイゼーショ
ン反応において標的核酸と接触させることができる。好ましい実施態様において
、異なる標識は異なる放射性同位体または異なる蛍光標識または異なるEMLs
である。これらのプローブセットをフォーマットI、フォーマットIIまたはフ
ォーマットIIISBHにおいて使用することができる。
Example 30 Multiplexing Probes for Analyzing Target Nucleic Acid In this example, a set of probes is labeled with a different label such that each probe of the set is distinguished from the other probes in the set. Thus, the probe set can be contacted with the target nucleic acid in one hybridization reaction without losing any probe information. In a preferred embodiment, the different labels are different radioisotopes or different fluorescent labels or different EMLs
It is. These probe sets can be used in Format I, Format II or Format III SBH.

【0347】 フォーマットISBHにおいて、異なるように標識したプローブセットを完全
な対合と1塩基対の誤対合とを識別できる条件下で基体に固定した標的核酸にハ
イブリダイゼーションする。標的核酸に結合する特異的プローブは、異なる標識
によって同定され、完全な対合は、少なくとも一部には、この結合情報によって
判定される。
In the format ISBH, differently labeled probe sets are hybridized to target nucleic acids immobilized on a substrate under conditions that allow discrimination between perfect pairing and single base pair mismatches. Specific probes that bind to the target nucleic acid are identified by different labels, and perfect matching is determined, at least in part, by this binding information.

【0348】 フォーマットIISBHにおいて、標的核酸を異なるプローブで標識して、プ
ローブアレイにハイブリダイゼーションする。プローブに結合する特異的な標的
核酸は、これらの異なる標識によって同定され、完全な対合は、少なくとも一部
には、この結合情報によって判定される。
In format IISBH, target nucleic acids are labeled with different probes and hybridized to a probe array. Specific target nucleic acids that bind to the probe are identified by these different labels, and perfect matching is determined, at least in part, by this binding information.

【0349】 フォーマットIIISBHにおいて、異なるように標識したプローブセットお
よび固定プローブを完全な対合と1塩基対の誤対合とを識別できる条件下で標的
核酸にハイブリダイゼーションする。標識上で、固定プローブに隣接する標識プ
ローブを固定プローブに結合し、これらの産物を検出し、異なる標識によって識
別する。
In format III SBH, differently labeled probe sets and immobilized probes are hybridized to the target nucleic acid under conditions that allow discrimination between perfect pairing and single base pair mismatches. On the label, a labeled probe adjacent to the immobilized probe is bound to the immobilized probe, and these products are detected and distinguished by different labels.

【0350】 好ましい実施態様において、異なる標識は、電子捕獲型質量分析計(EC- MS)で検出することができるEMLsである。EMLsは、ある種の芳香族骨
格が特に好ましい種々の骨格分子から作製される。例えば、Xuら、J.Chr
omatog.764:95-102(1997)を参照。EMLは可逆的で安 定な方法で結合され、プローブが標的核酸にハイブリダイゼーションされると、
EMLはプローブから除去され、標準的なEC-MS(例えば、EC-MSはガス
クロマトグラフ-質量分析計によって実施される)によって同定される。
In a preferred embodiment, the different labels are EMLs that can be detected on an electron capture mass spectrometer (EC-MS). EMLs are made from various backbone molecules where certain aromatic backbones are particularly preferred. See, for example, Xu et al. Chr
omatog. 764: 95-102 (1997). EML is bound in a reversible and stable manner, and when the probe is hybridized to the target nucleic acid,
EML is removed from the probe and identified by standard EC-MS (eg, EC-MS is performed by a gas chromatograph-mass spectrometer).

【0351】実施例31 低頻度標的核酸の検出 フォーマットIII SBHは、サンプル中に類似の配列の99対1の割合で
存在する、1個のヌクレオチドが異なる配列を同定する十分な識別力を有する。
したがって、フォーマットIIIは核酸サンプル、例えば血液由来のサンプル中
に、非常に低濃度で存在する核酸を同定するために用いることができる。
Example 31 Detection Format for Low Frequency Target Nucleic Acids III SBH has sufficient discriminating power to identify sequences differing by one nucleotide that are present in the sample at a ratio of 99: 1 of similar sequences.
Thus, Format III can be used to identify nucleic acids that are present at very low concentrations in nucleic acid samples, eg, samples from blood.

【0352】 一つの態様において、2つの配列は嚢胞性線維症の配列であり、これらは互い
に3個のヌクレオチド欠失により異なっている。2つの配列のプローブは以下の
通りであった。野生型からの欠失を識別するプローブは基質に固定されており、
標識した近接プローブは両方に共通であった。これらの標的およびプローブを用
いて、欠失突然変異体が野生型の99分の1で存在する場合に、これをフォーマ
ットIII SBHにより検出することができた。
In one embodiment, the two sequences are cystic fibrosis sequences, which differ from each other by a deletion of three nucleotides. The two sequence probes were as follows: The probe that identifies the deletion from the wild type is fixed to the substrate,
The labeled proximity probe was common to both. Using these targets and probes, the deletion mutant, when present in 1 / 99th of the wild type, could be detected by format III SBH.

【0353】実施例32 標的核酸を分析するためのポラロイド器具および方法 核酸を分析するための器具を、2つの核酸アレイと、2つのアレイの核酸の混
合が望まれるまで混合しないようにする任意の物質とを用いて構成することがで
きる。器具のアレイは、ナイロンメンブレン、ニトロセルロースメンブレン、ま
たは前述の他の物質を含む様々な基質で支持することができるが、これらに制限
されることはない。好ましい態様において、基質の一つは疎水性ストリップによ
り複数のセクターに分けられた膜、またはゲルもしくはスポンジを含むウェルを
備える適当な支持物質である。この態様において、プローブは膜のセクター上、
またはウェル、ゲル、もしくはスポンジ中に位置し、溶液(標的核酸を含む、ま
たは含まない)を膜またはウェルに加えてプローブを可溶化する。次いで、可溶
化したプローブを含む溶液を第二の核酸アレイに接触させる。この核酸はオリゴ
ヌクレオチドプローブまたは標的核酸でもよいが、これらに制限されることはな
く、プローブまたは標的核酸は標識されていてもよい。核酸は、放射性同位体、
蛍光標識またはエレクトロフォアマス標識を含む当技術分野において通常用いら
れるいかなるラベルで標識されていてもよいが、これらに制限されることはない
Example 32 Polaroid Instruments and Methods for Analyzing Target Nucleic Acids Any instrument for analyzing nucleic acids may be used to mix the two nucleic acid arrays and the nucleic acids of the two arrays until mixing is desired. It can be configured using a substance. The array of devices can be supported on a variety of substrates including, but not limited to, a nylon membrane, a nitrocellulose membrane, or other of the foregoing. In a preferred embodiment, one of the substrates is a membrane divided into multiple sectors by a hydrophobic strip, or a suitable support material with wells containing gels or sponges. In this embodiment, the probe is located on a sector of the membrane,
Alternatively, located in a well, gel, or sponge, a solution (with or without the target nucleic acid) is added to the membrane or well to solubilize the probe. Next, the solution containing the solubilized probe is brought into contact with the second nucleic acid array. The nucleic acid may be, but is not limited to, an oligonucleotide probe or a target nucleic acid, and the probe or the target nucleic acid may be labeled. Nucleic acids are radioisotopes,
It may be labeled with any label commonly used in the art, including, but not limited to, a fluorescent label or an electrophoretic label.

【0354】 核酸の混合を妨げる物質は、物質を除去した時に2つのアレイの核酸が混合す
るような方法で、2アレイ間に配置することができる。この物質はシート、膜、
または他の障壁の形でもよく、また、この物質は拡散の混合を妨げるいかなる物
質からなっていてもよい。
A substance that interferes with nucleic acid mixing can be placed between the two arrays in such a way that the nucleic acids of the two arrays mix when the substance is removed. This substance can be used in sheets, membranes,
Or it may be in the form of other barriers, and the material may be made of any material that prevents the mixing of diffusion.

【0355】 この器具は下記の通りフォーマットI SBHにおいて用いることができる。
すなわち、器具の第一のアレイは基質に固定された標的核酸を有し、器具の第二
のアレイは標識された核酸プローブを有していて、除去すると第一アレイの核酸
に応答指令信号を送ることができる。2つのアレイは、プローブが標的核酸と接
触するのを妨げる物質のシートにより任意に分離されており、シートを除去する
とプローブが標的に応答指令信号を送ることができる。適当なインキュベーショ
ンと、(任意の)洗浄段階の後、標的アレイを「読み取り」、どのプローブが標
的と完全な対を形成したかを調べることができる。この読み取りは自動化するこ
ともでき、または手動で(例えば、オートラジオグラムを用いた目による読み取
り)実施することもできる。フォーマットII SBHでは、以下の手順は標的
を標識し、プローブを固定する他は、前述の手順と同様であろう。
This device can be used in Format I SBH as described below.
That is, a first array of instruments has target nucleic acids immobilized on a substrate, a second array of instruments has labeled nucleic acid probes, and upon removal, sends a responsive signal to the nucleic acids of the first array. Can be sent. The two arrays are optionally separated by a sheet of material that prevents the probes from contacting the target nucleic acid, and removal of the sheet allows the probes to send a responsive signal to the target. After appropriate incubation and (optional) washing steps, the target array can be "read" to see which probes have formed a perfect pair with the target. This reading can be automated or performed manually (eg, by eye reading using an autoradiogram). For Format II SBH, the following procedure will be similar to the previous one, except that the target will be labeled and the probe will be immobilized.

【0356】 または、器具は下記の通りフォーマットIII SBHにおいて用いることが
できる。すなわち、核酸プローブの2アレイを形成し、いずれか、または両方の
アレイの核酸プローブを標識してもよく、アレイの一方をその基質に固定しても
よい。2アレイはプローブを混合しないようにする物質のシートで分離する。フ
ォーマットIIの反応を、標的核酸を加え、シートを除去してプローブをお互い
に、および標的と混合させることにより、開始する。標的の隣接する部位に結合
するプローブは相互に結合し(例えば、塩基積み重ね相互作用または骨格の共有
結合による連結により)、結果を読み取ってどのプローブが隣接部位の標的に結
合しているかを調べる。一組のプローブを基質に固定する場合、固定したアレイ
を読み取って、もう一方のアレイのどのプローブが固定したプローブと結合する
かを調べることができる。前述の方法と同様に、この読み取りは自動化(例えば
、ELISA読みとり機を用いて)してもよく、または手動で(例えば、オート
ラジオグラムを用いた目による読み取り)実施することもできる。
Alternatively, the device can be used in Format III SBH as described below. That is, two arrays of nucleic acid probes may be formed, one or both arrays of nucleic acid probes may be labeled, and one of the arrays may be immobilized on its substrate. The two arrays are separated by a sheet of material that keeps the probes from mixing. A Format II reaction is started by adding the target nucleic acid, removing the sheet and mixing the probes with each other and with the target. Probes that bind to adjacent sites on the target bind to each other (eg, by base-stacking interactions or covalent ligation of the backbone), and the results are read to determine which probes are binding to targets at adjacent sites. When a set of probes is immobilized on a substrate, the immobilized array can be read to determine which probes of the other array bind to the immobilized probes. As with the methods described above, this reading can be automated (eg, using an ELISA reader) or can be performed manually (eg, eye reading using an autoradiogram).

【0357】実施例33 プローブの3次元アレイ 好ましい実施態様において、オリゴヌクレオチドプローブを3次元アレイに固
定する。各層が他の層とは別個に、間隔をおいて分析され、または3次元アレイ
の層の全てが同時に分析されるように、3次元アレイは多数の層を含む。これら
の3次元アレイには、例えば、プローブがくぼみの異なる深さの位置に配置され
る多数のくぼみを有する基体に配置されたアレイ(各レベルはくぼみの同じ深さ
の位置のプローブから作られる);または、プローブがくぼみの底部、くぼみを
分離するピーク部またはピークとくぼみをくみあわせたところに配置される異な
る深さのくぼみを有する基体に配置されたアレイ(各レベルはある種の深さの全
てのプローブから作られる);または、層を形成して3次元アレイを形成する多
数のシートを含む基体に配置されたアレイを含む。
Example 33 Three-Dimensional Array of Probes In a preferred embodiment, oligonucleotide probes are immobilized on a three-dimensional array. A three-dimensional array includes multiple layers, such that each layer is analyzed separately from the other layers, at intervals, or all of the layers of the three-dimensional array are analyzed simultaneously. These three-dimensional arrays include, for example, arrays arranged on a substrate having multiple indentations in which the probes are located at different depths of the indentation (each level is made up of probes at the same indentation depth). Or an array arranged on a substrate with different depths of depressions where the probe is located at the bottom of the depression, the peak separating the depressions or the peak and depression indentations (each level being of a certain depth). Or made up of all probes); or an array disposed on a substrate that includes multiple sheets forming layers to form a three-dimensional array.

【0358】 これらの3次元アレイを合成するための方法は当技術上周知であり、プローブ
アレイの支持体と同じくらい適当であると本明細書において先に引用した材料を
含む。また、オリゴヌクレオチドプローブを支持することができ、好ましくは可
撓性である他の好適な材料を基体として使用することができる。
Methods for synthesizing these three-dimensional arrays are well known in the art and include the materials cited herein above as suitable as the support for the probe array. Also, other suitable materials, which can support oligonucleotide probes and are preferably flexible, can be used as substrates.

【0359】実施例34 cDNAクローンをクラスター化するための識別特性配列 標準的なpcr、SGH配列識別特性分析およびサンガー(Sanger)の
配列決定法を使用して、cDNAライブラリーから複数の別個の核酸配列を得た
。ライブラリーの挿入部は、挿入部に隣接するベクター配列に特異的なプライマ
ーを使用したpcrを用いて増幅した。これらの試料をナイロン膜にスポットし
、好適な数のオリゴヌクレオチドプローブを用いて調査し、陽性結合プローブの
強度を配列の識別特性を与えることによって測定した。クローンを同様のまたは
同一の配列の識別特性にクラスター化し、ゲル配列決定のためにクローンを代表
するシグナルを各群から選択した。典型的なサンガー(Sanger)の配列決
定プロトコールにおいて逆M13配列決定用プライマーを使用して増幅した挿入
物の5‘配列を推定する。PCR産物を精製し、蛍光染料ターミネーターサイク
ル配列決定を実施した。377アプライド バイオシステムズ(Applied
Biosystems(ABI)シークエンサーを使用してシングルパスゲル
配列決定を実施した。この方法によって選択され、配列決定されたクローンの大
半は、互いに他と異なる配列を有し、同じ配列を有したのはごく少数であった。
Example 34 Discriminating Sequences for Clustering cDNA Clones Multiple discrete nucleic acids from a cDNA library using standard pcr, SGH sequence discriminating characterization and Sanger sequencing methods. The sequence was obtained. The library insert was amplified using pcr using primers specific to the vector sequence adjacent to the insert. These samples were spotted on nylon membranes, probed with a suitable number of oligonucleotide probes, and the strength of the positive binding probe was determined by providing sequence signatures. Clones were clustered into similar or identical sequence signatures, and a signal representative of the clone was selected from each group for gel sequencing. The 5 'sequence of the amplified insert is deduced using reverse M13 sequencing primers in a typical Sanger sequencing protocol. The PCR product was purified and fluorescent dye terminator cycle sequencing was performed. 377 Applied Biosystems (Applied
Single-pass gel sequencing was performed using a Biosystems (ABI) sequencer. Most of the clones selected and sequenced by this method had sequences that differed from each other and only a few had the same sequence.

【0360】実施例35 チップの高スループット生産 好適な実施の形態において、プローブのアレイを大量生産するための装置は、
インクジェット蒸着装置に結合した回転ドラムもしくはプレート(例えばミクロ
ドロップ注入ヘッドなど)と、好適なロボットシステム(例えばアノラド・ガン
トリー(anorad gantry))と、を含む。この装置の特に好適な実施形態は、図 1〜3を参照して記載される。
Example 35 High Throughput Production of Chips In a preferred embodiment, the apparatus for mass producing an array of probes is:
It includes a rotating drum or plate (eg, a microdrop injection head, etc.) coupled to an inkjet deposition apparatus, and a suitable robotic system (eg, an anorad gantry). A particularly preferred embodiment of this device is described with reference to FIGS.

【0361】 該装置は、好適な基体が固定されたシリンダー(1)を含む。この基体は、プ
ローブのアレイに好適であるものとして先に記載した材料のいずれからできてい
てもよい。好適な実施の形態において、該基体はフレキシブルな物質であり、ア
レイは該基体上に直接作製される。他の実施形態においては、フレキシブルな基
体を該シリンダーに固定し、個々のチップを該基体上に固定させる。つぎに該ア
レイを個々の各チップ上に作製する。
The device comprises a cylinder (1) to which a suitable substrate has been fixed. The substrate may be made of any of the materials described above as suitable for the array of probes. In a preferred embodiment, the substrate is a flexible material and the array is made directly on the substrate. In another embodiment, a flexible substrate is secured to the cylinder and individual chips are secured on the substrate. The array is then made on each individual chip.

【0362】 好適な実施形態において、物理的バリアーを基体またはチップ上に設け、ウェ
ルのアレイを画定する。この物理的バリアーは、該装置により基体またはチップ
に設けても良いし、あるいはこの物理的バリアーは、シリンダー(1)に固定す
る前にチップまたは基体上に設けてもよい。つぎに、オリゴヌクレオチドプロー
ブの1スポットを各ウェルに入れるが、このとき個々のウェルに配置したプロー
ブは全て同じ配列を有してもよいし、または個々のウェルにスポットされたプロ
ーブは異なる配列を有していてもよい。より好適な実施形態において、1つのア
レイの中の個々の各ウェルにスポットされた1以上のプローブは、そのアレイの
他のウェルにスポットされたプローブと異なる。つぎに、複数のアレイを含む配
列決定チップをこれらのアレイから組立てることができる。
In a preferred embodiment, a physical barrier is provided on the substrate or chip to define an array of wells. The physical barrier may be provided on the substrate or chip by the device, or the physical barrier may be provided on the chip or substrate before being fixed to the cylinder (1). Next, one spot of the oligonucleotide probe is placed in each well, and the probes arranged in each well may have the same sequence, or the probe spotted in each well may have a different sequence. You may have. In a more preferred embodiment, the one or more probes spotted on each individual well in an array are different from the probes spotted on other wells of the array. Next, a sequencing chip containing a plurality of arrays can be assembled from these arrays.

【0363】 基体または基体とチップをシリンダー(1)に固定させたあと、モーター(図
示せず)により該シリンダーを回転させる。このシリンダーの回転速度は、当分
野で公知の任意の方法(例えば固定型光学センサーおよびシリンダーと共に回転
する光源を用いた方法など)により正確に測定される。分配装置(3)はアーム
(2)に沿って移動し、上記のように計算した正確な回転速度を使用して、分配
チップ(dispensing tip)(8)を介してプローブや他の試薬を当分野で公知の
方法により基体またはチップ上の正確な位置に送達することができる。該分配装
置は、リザーバー(6)から供給ライン(7)を介してプローブや試薬を受け取
る。リザーバー(6)は、アレイを作製するのに必要なプローブおよび他の試薬
全てを収容する。
After fixing the base or the base and the chip to the cylinder (1), the cylinder is rotated by a motor (not shown). The rotational speed of the cylinder is accurately measured by any method known in the art, such as using a stationary optical sensor and a light source that rotates with the cylinder. The dispensing device (3) moves along the arm (2) and applies probes and other reagents via a dispensing tip (8) using the exact rotational speed calculated as described above. It can be delivered to a precise location on a substrate or chip by methods known in the art. The distributor receives probes and reagents from a reservoir (6) via a supply line (7). The reservoir (6) contains all the probes and other reagents needed to make the array.

【0364】 分配装置は図3に図示されている。該分配装置は、1つまたは複数の分配チッ
プ(14および8)を有することができる。各分配チップは、サンプルウェル(13
)を本体(12)の中に有し、該サンプルウェル(13)は、サンプルライン(10)
を介してプローブや他の試薬を受け取る。圧力ライン(11)は、分配チップ(14
および8)を介してプローブや試薬を移動させるのに十分なpsiまでチャンバー (9)を加圧する。サンプルライン(10)、ウェル(13)および分配チップ(14
および8)は、プローブまたは試薬の交換の度毎に各交換の間に洗浄しなければ
ならない。サンプルライン(10)または任意の専用洗浄ライン(図示せず)を介
して適切な洗浄用緩衝液をサンプルウェル(13)に供給する。あるいは、任意で
、チャンバー(9)の一部または全てを洗浄用緩衝液で充填してもよい。つぎに
必要であれば、洗浄用緩衝液を、排出ライン(図示せず)により、またはサンプ
ルライン(10)および分配チップ(14および8)を介して、サンプルウェル(13
)およびチャンバー(9)から除去する。
The dispensing device is shown in FIG. The dispensing device can have one or more dispensing tips (14 and 8). Each dispensing tip contains sample wells (13
) In the body (12), and the sample well (13) has a sample line (10).
Receive probes and other reagents through. The pressure line (11) is connected to the dispensing tip (14
And pressurize chamber (9) to psi sufficient to move probes and reagents through 8). Sample line (10), well (13) and distribution tip (14
And 8) must be washed between each change of probe or reagent between each change. An appropriate wash buffer is supplied to the sample well (13) via the sample line (10) or any dedicated wash line (not shown). Alternatively, optionally, part or all of the chamber (9) may be filled with a washing buffer. Then, if necessary, the wash buffer was added to the sample well (13) via the drain line (not shown) or via the sample line (10) and dispensing tips (14 and 8).
) And chamber (9).

【0365】 分配手段がプローブを各アレイもしくはチップ中の全ての適切な位置に当てが
ったら、基体(チップ付きまたはチップなし)をシリンダーから取り出し、新し
い基体をシリンダーに固定させる。
Once the dispensing means has applied the probe to all appropriate locations in each array or chip, the substrate (with or without tip) is removed from the cylinder and a new substrate is fixed to the cylinder.

【0366】実施例36 離散粒子と複合体化したプローブを用いた標的核酸の分析 この実施形態において、標的核酸を、複数の離散粒子と(共有結合または非共
有結合により)複合体形成するプローブ用いて調べる。該離散粒子は、物理的性
質(または複数の物理的性質の組合せ)に基づいてそれぞれを識別することがで
き、該物理的性質により区別した粒子を、異なるプローブと複合体形成させる。
好適な実施形態において、プローブは、既知の配列および長さを有するオリゴヌ
クレオチドである。従って、プローブは、離散粒子の物理的性質により同定する
ことが可能である。この実施形態に好適であるプローブには、先の節で記載した
全てのプローブ(全長プローブよりも情報提供部分が短いプローブを含む)が含
まれる。
Example 36 Analysis of Target Nucleic Acid Using Probes Complexed with Discrete Particles In this embodiment, a target nucleic acid is used to form a complex (covalently or non-covalently) with a plurality of discrete particles. To find out. The discrete particles can be individually identified based on physical properties (or a combination of a plurality of physical properties), and the particles distinguished by the physical properties are complexed with different probes.
In a preferred embodiment, the probe is an oligonucleotide having a known sequence and length. Thus, the probe can be identified by the physical properties of the discrete particles. Probes suitable for this embodiment include all of the probes described in the previous section, including those with a shorter informative portion than the full length probe.

【0367】 離散粒子の物理的性質は、粒子を幾つかのセットに分けることができる、当分
野で公知である任意の特性でよい。例えば、粒子は、そのサイズ、蛍光、吸光度
、電磁的電荷または重量に基づいて幾つかのセットに分けることができる。ある
いは、色素、放射性核種、またはEMLにより粒子を標識することができる。他
の好適な標識としては、標識された抗体に特異的に結合するメンバーとして機能
することができるリガンド、化学発光物質、酵素、標識されたリガンドに特異的
に結合して対をなすメンバーとして機能することができる抗体等が挙げられる。
イムノアッセイにおいて、簡単に使用することができる多様な標識が使用されて
きた。更に他の標識として、抗原、特異的反応性を有する基、および電気化学的
に検出可能な成分が挙げられる。更に他の標識としては、先の節に記載した標識
のいずれもが挙げられる。これらの標識および特性を、当分野で公知の方法(例
えば先の節で記載したこれらの方法を含む)により定量的に測定し、およびシグ
ナル強度またはシグナルタイプに基づいて粒子を区別することができる(標識の
1つとして、例えば異なる色素強度、または異なるタイプの色素を粒子に適用し
てもよい)。好適な実施形態において、幾つかの物理的性質を組み合わせ、この
特性の様々な組合せにより粒子の区別を可能とする(例えば10種類のサイズと
10種類の色を組み合わせて100の粒子グループに分けるなど)。
The physical properties of the discrete particles can be any properties known in the art that can divide the particles into several sets. For example, particles can be divided into several sets based on their size, fluorescence, absorbance, electromagnetic charge or weight. Alternatively, the particles can be labeled with a dye, radionuclide, or EML. Other suitable labels include ligands that can function as members that specifically bind to the labeled antibody, chemiluminescent substances, enzymes, and members that specifically bind to and bind to the labeled ligand. And the like.
A variety of easily used labels have been used in immunoassays. Still other labels include antigens, groups with specific reactivity, and components that are electrochemically detectable. Still other labels include any of the labels described in the previous section. These labels and properties can be measured quantitatively by methods known in the art, including, for example, those described in the previous section, and can distinguish particles based on signal intensity or signal type. (As one of the labels, for example, different dye strengths or different types of dyes may be applied to the particles). In a preferred embodiment, several physical properties are combined, and various combinations of these properties allow for the distinction of particles (e.g., combining 10 sizes and 10 colors into 100 particle groups, etc.). ).

【0368】 粒子-プローブにより、例えば約2000の反応容器を用いて全ての可能な10-mer を合成することができるような、標準的な組合せ方法の活用が可能となる。1024
反応からなる最初の第1セットを行って、1024の異なるように標識した粒子上に
全ての可能な5-merを合成する。得られたプローブ-粒子を混合し、1024の反応 容器からなる他のセットに分ける。これらのサンプルを用いて反応の第2セット
を行い、粒子のプールの中のプローブ上に全ての可能な5-mer伸長物を合成する
。この物理的性質は、各プローブの最初の5ヌクレオチドを同定し、反応容器は
全てのプローブの第2の5ヌクレオチドを同定する。こうして、2048の反応容器
を使用して全ての可能な10-merプローブを合成する。この方法は、種々のプロー
ブ長のための全ての可能なn--merを作製するために簡単に修飾される。
The particle-probe allows the use of standard combinatorial methods, such as the ability to synthesize all possible 10-mers using about 2000 reaction vessels. 1024
An initial first set of reactions is performed to synthesize all possible 5-mers on 1024 differently labeled particles. The resulting probe-particles are mixed and divided into another set of 1024 reaction vessels. A second set of reactions is performed with these samples to synthesize all possible 5-mer extensions on probes in a pool of particles. This physical property identifies the first 5 nucleotides of each probe, and the reaction vessel identifies the second 5 nucleotides of all probes. Thus, all possible 10-mer probes are synthesized using 2048 reaction vessels. This method is simply modified to generate all possible n-mers for different probe lengths.

【0369】 好適な実施形態において、粒子をその粒子の蛍光強度により幾つかのセットに
分ける。各セットの中の粒子は、蛍光標識の強度を変えて調製されるので、これ
らの粒子は異なる蛍光強度を有する。フルオレセインの蛍光強度は、1:300〜 1:300,000の範囲にかけて濃度に関連し(Lockhartら、1986)、1:3000〜1 :300,000の間には一次関係がある(つまり、フルオレセイン強度は約1〜300の
範囲にかけて線形である)。検出の線形範囲において、256セットの粒子をフル オレセインで標識する(例えば3〜259)。256セットの粒子により、全ての可能
な4-merを異なるセットの粒子に結合させることができる。該粒子をプールする
ことにより、全ての可能な5-merを、全ての可能な4-merからなる4つのプール
を持たせ、つぎに各プールの中のプローブをA、G、CまたはTだけ伸長することに
より、作製することができる。同様に、全ての可能な6-merは、全ての可能な4
-merからなる16個のプールを持たせ、この中で4-merの各プールを、A、G、C およびTからなる16種類の可能な2塩基順列のうちの1つ分だけ伸長させるこ とにより、作製することができる(また、例えば7-merの場合は64プール、8
-merの場合は256プールというように)。
In a preferred embodiment, the particles are divided into several sets according to the fluorescence intensity of the particles. Since the particles in each set are prepared with varying intensities of the fluorescent labels, these particles have different fluorescent intensities. The fluorescence intensity of fluorescein is related to concentration over the range of 1: 300 to 1: 300,000 (Lockhart et al., 1986), with a linear relationship between 1: 3000 and 1: 300,000 (ie, fluorescein intensity is about 1 Linear over the range of ~ 300). In the linear range of detection, 256 sets of particles are labeled with fluorescein (eg, 3-259). With 256 sets of particles, all possible 4-mers can be linked to different sets of particles. By pooling the particles, all possible 5-mers have four pools of all possible 4-mers, and then the probes in each pool are only A, G, C or T It can be produced by stretching. Similarly, all possible 6-mers are all possible 4
-mer pools, in which each 4-mer pool is extended by one of the 16 possible 2-base permutations consisting of A, G, C and T. (For example, in the case of a 7-mer, 64 pools, 8 pools)
For example -256 pool for -mer).

【0370】 5-merプローブ(4つのプール中)を使用して、標的核酸を調べる。標的核酸
を他の蛍光色素、または他の異なる標識(上記記載)で標識する。標識した標的
を4つのプールと混合し、各プールの中の相補的なプローブは、該標的核酸にハ
イブリダイズする。これらのハイブリダイゼーション複合体を、当分野で公知の
方法により検出したあと、ハイブリダイズした陽性プローブを、粒子の蛍光強度
を検出することにより同定する。多くの好適な実施形態において、プローブ-粒 子と標的核酸との混合物をフロー・サイトメーターまたは他の分離装置を介して
1回に1粒子ずつ供給し、粒子標識および標的を測定して、どのプローブが標的
核酸と相補的であるかを決定する。
The target nucleic acid is examined using a 5-mer probe (in 4 pools). The target nucleic acid is labeled with another fluorescent dye, or another different label (described above). The labeled target is mixed with the four pools, and the complementary probes in each pool will hybridize to the target nucleic acid. After detecting these hybridization complexes by methods known in the art, the hybridized positive probes are identified by detecting the fluorescence intensity of the particles. In many preferred embodiments, the mixture of probe-particles and target nucleic acid is supplied one particle at a time via a flow cytometer or other separation device, and the particle label and target are measured to determine Determine if the probe is complementary to the target nucleic acid.

【0371】 他の実施形態において、1セットの遊離プローブを他の蛍光色素または他の標
識(上記)で標識し、個々の遊離プローブを5-merプローブの各プール(4プー
ル)と混合して、この混合物を標的核酸とハイブリダイズさせる。薬剤を加えて
遊離プローブを5-merプローブに共有結合させると(上記の好適な薬剤の説明の
節を参照のこと)、遊離プローブが標的核酸上の、5-merプローブが結合する部
位に隣接する部位に結合する(遊離プローブ部位は、連結することができる5-m
erプローブの端部に隣接していなければならない)。次に、当分野で公知の方法
により粒子をアッセイし、どの粒子が遊離プローブに共有結合したか(すなわち
遊離プローブ標識を有する粒子)を決定し、5-merプローブを粒子の蛍光強度に
より同定する。最も好適な実施形態において、プローブ-粒子、遊離プローブお よび標的核酸の混合物をフロー・サイトメーターを介して1回に1粒子ずつ供給
し、粒子標識と遊離プローブ標識を測定してどのプローブが標的核酸に相補的で
あるかを決定する。
In another embodiment, one set of free probes is labeled with another fluorescent dye or other label (as described above), and individual free probes are mixed with each pool of 5-mer probes (4 pools). This mixture is hybridized with the target nucleic acid. When the drug is added and the free probe is covalently linked to the 5-mer probe (see the description of the preferred drug above), the free probe is adjacent to the site on the target nucleic acid where the 5-mer probe binds. (A free probe site is a 5-m
er probe must be adjacent to the end). The particles are then assayed by methods known in the art to determine which particles have been covalently attached to the free probe (ie, the particles having a free probe label) and the 5-mer probe is identified by the fluorescence intensity of the particle. . In a most preferred embodiment, a mixture of probe-particles, free probe and target nucleic acid is provided one particle at a time via a flow cytometer and particle label and free probe label are measured to determine which probe is the target. Determine whether it is complementary to the nucleic acid.

【0372】 好適な実施形態において、単一の装置が、プローブ-粒子複合体を用いた標的 核酸の分析操作の全てまたは大部分を備える。該装置は1以上の試薬チャンバー
を有し、該チャンバーには緩衝液と標識された標的核酸が完全に混合されている
(標的核酸は、手動で加えても自動的に加えてもよい)。該混合物を試薬チャン
バーから複数の反応チャンバーに等分し、各反応チャンバーはプローブ-粒子複 合体のプールを1つ有する。プローブ-粒子と標的核酸は、標的核酸に相補的な プローブを結合させるような条件下において反応する。過剰な標的核酸(すなわ
ち結合しなかった核酸)を、反応チャンバーから(例えば洗浄により)除去し、
標的核酸に結合した粒子を標的核酸標識と粒子との会合により同定し、該プロー
ブを、粒子の物理的性質により同定する。好適な実施形態において、過剰な標的
を除去したあと、該粒子は1列で反応チャンバーから検出装置までチャネルを通
って移動する。単一粒子が検出装置を通過するとき、これらの装置は標的標識お
よび粒子の物理的性質を測定する。他の好適な実施形態において、過剰な標的を
除去する前または除去した後に、粒子を例えばサイズ別に(例えば排除クロマト
グラフィー)、電荷により(例えばイオン交換クロマトグラフィー)、および/
または密度-重量別に、これらの物理的性質の1つまたはこれらの組み合わせを 用いてセットに分ける。これらの分画した粒子をつぎに検出装置によりアッセイ
する。
In a preferred embodiment, a single device comprises all or most of the operations for analyzing a target nucleic acid using a probe-particle complex. The device has one or more reagent chambers in which the buffer and the labeled target nucleic acid are thoroughly mixed (target nucleic acid may be added manually or automatically). The mixture is aliquoted from the reagent chamber into a plurality of reaction chambers, each reaction chamber having one pool of probe-particle complexes. The probe-particle and the target nucleic acid react under conditions such that a probe complementary to the target nucleic acid is bound. Removing excess target nucleic acid (ie, unbound nucleic acid) from the reaction chamber (eg, by washing);
The particles bound to the target nucleic acid are identified by association of the target nucleic acid label with the particles, and the probe is identified by the physical properties of the particles. In a preferred embodiment, after removing excess target, the particles travel in a single row through the channel from the reaction chamber to the detector. As single particles pass through the detection devices, these devices measure the physical properties of the target label and the particles. In other preferred embodiments, before or after removing excess target, the particles can be sorted, for example, by size (eg, exclusion chromatography), by charge (eg, ion exchange chromatography), and / or
Or, by density-weight, divide into sets using one or a combination of these physical properties. These fractionated particles are then assayed by the detector.

【0373】 この実施形態の代替として、主要な試薬チャンバーに、緩衝液、標的核酸、プ
ローブ-粒子複合体のプール、および化学的もしくは酵素的な連結試薬を供給す る。これらの成分を完全に混合し、次に試薬チャンバーから複数の反応チャンバ
ーに等分する。各反応チャンバーは1個の標識された遊離プローブを有する。或
いは、プローブ粒子複合体のプールを、試薬チャンバーに加える代わりに、遊離
プローブと共に反応チャンバーの中に入れてもよい。さらに、遊離プローブを試
薬チャンバーに加えてプローブ粒子のプールを該反応チャンバーに加えることも
できる。プローブ-粒子、標的核酸、および遊離プローブは、遊離プローブおよ び粒子-プローブが、標的核酸上の隣接部位で結合するような条件下で反応し、 これにより、遊離プローブはプローブ粒子に連結される。過剰な遊離プローブ(
すなわち連結していないプローブ)、および標的核酸を、反応チャンバーから(
洗浄により)除去し、連結されたプローブを、遊離プローブ標識と粒子との会合
により同定し、粒子と複合体形成したプローブをその粒子の物理的性質により同
定する。好適な実施形態において、過剰なプローブと標的を除去したあと、該粒
子は1列で反応チャンバーから検出装置までチャネルを通って移動する。単一粒
子が検出装置を通過するとき、該装置は粒子に共有結合した遊離プローブ標識、
および粒子の物理的性質を測定する。他の好適な実施形態において、過剰プロー
ブおよび標的を除去する前または除去した後に、粒子をその物理的性質を用いて
、例えばサイズ毎に(例えば排除クロマトグラフィー)、電荷により(例えばイ
オン交換クロマトグラフィー)、および/または密度・重量毎に、セットに分け
る。これらの分画した粒子を検出装置によりアッセイする。
As an alternative to this embodiment, the primary reagent chamber is supplied with buffer, target nucleic acid, pool of probe-particle complexes, and chemical or enzymatic ligation reagents. The components are thoroughly mixed and then aliquoted from the reagent chamber into multiple reaction chambers. Each reaction chamber has one labeled free probe. Alternatively, instead of adding the pool of probe particle complexes to the reagent chamber, the pool may be placed into the reaction chamber with the free probe. Further, a free probe can be added to the reagent chamber and a pool of probe particles can be added to the reaction chamber. The probe-particle, target nucleic acid, and free probe react under conditions such that the free probe and the particle-probe bind at adjacent sites on the target nucleic acid, thereby linking the free probe to the probe particle. You. Excess free probe (
That is, the unligated probe) and the target nucleic acid are removed from the reaction chamber (
Removed (by washing), the ligated probe is identified by the association of the free probe label with the particle, and the probe complexed with the particle is identified by the physical properties of the particle. In a preferred embodiment, after removing excess probe and target, the particles travel in a single row through the channel from the reaction chamber to the detector. When a single particle passes through the detection device, the device is free probe label covalently attached to the particle,
And the physical properties of the particles. In other preferred embodiments, before or after removing excess probe and target, the particles can be charged using their physical properties, eg, by size (eg, exclusion chromatography), by charge (eg, ion exchange chromatography). ) And / or density and weight. These fractionated particles are assayed by a detector.

【0374】 好適な実施形態において、該装置の中には第2の反応チャンバーのセットがあ
り、プローブ-粒子のプールを第2反応チャンバーの中に配置する。標的および 緩衝液を試薬チャンバーの中で混合し、これらを、標識された遊離プローブの入
った第1反応チャンバーの中に入れる。プローブと標的を混合し、任意でプロー
ブを標的にハイブリダイズさせることができる。つぎに、この標識されたプロー
ブと標的の混合物を、プローブ-粒子のプールが入った第2反応チャンバーに送 る。遊離プローブおよびプローブ-粒子は標的にハイブリダイズし、適当なプロ ーブを第2反応チャンバーの中で連結させる。連結剤は、試薬チャンバーで、ま
たはいずれかの反応チャンバーの中で加えても良く、好ましくは、連結剤は、第
2反応チャンバーの中で添加する。第2反応チャンバーの中のプローブ-粒子ハ イブリダイゼーション生成物を上記のように分析する。
In a preferred embodiment, there is a second set of reaction chambers in the device, where the pool of probe-particles is located in the second reaction chamber. The target and buffer are mixed in a reagent chamber and these are placed in a first reaction chamber containing a labeled free probe. The probe and target can be mixed and, optionally, the probe can be hybridized to the target. The labeled probe-target mixture is then sent to a second reaction chamber containing the probe-particle pool. The free probe and probe-particle hybridize to the target and the appropriate probe is ligated in the second reaction chamber. The linking agent may be added in the reagent chamber or in any of the reaction chambers, preferably, the linking agent is added in the second reaction chamber. The probe-particle hybridization products in the second reaction chamber are analyzed as described above.

【0375】 1つの実施の形態において、標的核酸は、分析前に(PCRにより、またはλラ イブラリーなどのベクターにより)増幅しない。好ましくは、この実施の形態に
おいてより長い遊離プローブおよび粒子プローブを使用する。というのは、サン
プルの配列がより複雑であるためである(即ちバックグラウンドに対して陽性で
あるものを区別するため)。
In one embodiment, the target nucleic acid is not amplified (by PCR or by a vector such as the λ library) prior to analysis. Preferably, longer free and particle probes are used in this embodiment. This is because the sequence of the sample is more complex (ie to distinguish those that are positive against the background).

【0376】 この実施例に記載されたプローブ-粒子の実施形態は、先述の用途(上記診断 および配列決定用途を含むがこれらに限定されない)のいずれにも有用である。
さらに、これらのプローブ粒子の実施形態は、上記変更および改変により修飾す
ることができる。
The probe-particle embodiments described in this example are useful for any of the foregoing applications, including but not limited to the diagnostic and sequencing applications described above.
In addition, embodiments of these probe particles can be modified by the above changes and modifications.

【0377】実施例37 ポリヌクレオチド間の結合を修飾する薬剤の存在下における相補的なポリヌクレ オチドの相互作用 この実施形態において、相補的なポリヌクレオチドの結合における誤対合から
の完全な対合の識別は、1以上の薬剤の添加により調節される。好適な実施形態
において、相補的なポリヌクレオチドは、標的ポリヌクレオチドおよびポリヌク
レオチドプローブである。誤対合からの完全な対合の識別は、薬剤の添加により
調節することができる。この薬剤は、トリアルキルアンモニウム塩(例えばTMAC
、Ricelliら、Nucl. Acids Res. 21: 3785-3788(1993))、塩化ナトリウム、リ ン酸塩およびホウ酸塩などの塩、ホルムアミド、グリコール、ジメチルスルフォ
キシド、およびジメチルホルムアミドなどの有機溶媒、尿、グアニジニウム、ベ
タインなどのアミノ酸類似体(Henkeら、Nucl. Acids Res. 19: 3957-3958(1997
); Reesら、Biochemistry 32: 137-144(1993))、スペルミジンおよびスペルミ ンなどのポリアミン(Thomasら、Nucl. Acids Res. 25: 2396-2402(1997))、ま
たはホスフェート骨格の負電荷を中和する他の正に荷電した分子、ドデシル硫酸
ナトリウム、およびナトリウムラウリルサルコシネート等の界面活性剤、主溝/
小溝結合剤、正に荷電したポリペプチド、およびインターカレート剤(例えばア
クリジン、臭化エチジウム、およびアントラセンなど)である。好適な実施形態
において、薬剤の混合物をハイブリダイゼーション反応に加えて、誤対合からの
完全な対合の識別を調節する。これらの薬剤の幾つかは、2つの相補鎖の間の溶
解のエントロピーを低減することにより識別を行う。
[0377] In the interaction this embodiment of the complementary polynucleotide in the presence of the agent that modifies the binding between Example 37 polynucleotide, the perfect match from mismatch in binding complementary polynucleotides Discrimination is adjusted by the addition of one or more drugs. In a preferred embodiment, the complementary polynucleotides are a target polynucleotide and a polynucleotide probe. The discrimination of a perfect match from a mismatch can be adjusted by the addition of the drug. The drug is a trialkylammonium salt (eg, TMAC
Ricelli et al., Nucl. Acids Res. 21: 3785-3788 (1993)), salts such as sodium chloride, phosphate and borate, and organic solvents such as formamide, glycol, dimethylsulfoxide, and dimethylformamide. , Urine, guanidinium, betaine and other amino acid analogs (Henke et al., Nucl. Acids Res. 19: 3957-3958 (1997
Rees et al., Biochemistry 32: 137-144 (1993)), polyamines such as spermidine and spermine (Thomas et al., Nucl. Acids Res. 25: 2396-2402 (1997)), or the negative charge of the phosphate backbone. Other positively charged molecules to be incorporated, surfactants such as sodium dodecyl sulfate, and sodium lauryl sarcosinate;
Minor groove binders, positively charged polypeptides, and intercalating agents such as acridine, ethidium bromide, and anthracene. In a preferred embodiment, a mixture of agents is added to the hybridization reaction to regulate the discrimination of a perfect match from a mismatch. Some of these agents distinguish by reducing the entropy of lysis between the two complementary strands.

【0378】 好適な実施形態において、誤対合からの完全な対合の識別を、1以上の薬剤に
より改善する。例えば、ホルムアミド(一般的に使用される変性剤)は、フォー
マットIIIの反応における(誤対合):(完全な対合)を選択的に不安定化する ことが分かった。上記のように、フォーマットIIIの反応を開始し、次にホルム アミドを量を変えて添加した(0%、10%、20%、30%、40%および50%)。0
%では、完全な対合シグナルが検出され、バックグラウンド(誤対合)は高かっ
た。ホルムアミド10%では、良好な完全対合シグナルがあり、バックグラウンド
/誤対合シグナルは減少した。ホルムアミド20%では、完全対合シグナルは(検
出可能であったが)減少し、バックグラウンド/誤対合シグナルは無くなった。
ホルムアミド30%〜50%では、完全対合シグナルもバックグラウンド/誤対合シ
グナルも無かった。
In a preferred embodiment, the discrimination of a perfect match from a mismatch is improved by one or more agents. For example, formamide (a commonly used denaturant) was found to selectively destabilize (mispairing): (perfect pairing) in Format III reactions. As described above, the format III reaction was started, then varying amounts of formamide were added (0%, 10%, 20%, 30%, 40% and 50%). 0
In%, a perfect match signal was detected and the background (mismatch) was high. At 10% formamide, there was a good perfect match signal and the background / mismatch signal was reduced. At 20% formamide, the perfect match signal was reduced (albeit detectable) and the background / mismatch signal was abolished.
Between 30% and 50% formamide, there was no perfect match signal and no background / mismatch signal.

【0379】 他の実施形態において、薬剤を使用して1対の相補的ポリヌクレオチドのTm
上下させる。より好適な実施形態において、薬剤の混合物を使用して1対の相補
的ポリヌクレオチドのTmを上下させる。薬剤は、種々の方法でTmを変更させるこ
とができる。本発明を限定するわけではないが、2つの例として、(1)2つの
相補的ポリヌクレオチドの塩基間の水素結合を切断する薬剤(Goodman, Proc. N
at'l Acad. Sci. 94: 10493-10495 (1997); Moranら、Proc. Nat'l Acad. Sci.
94: 10506-10511(1997); Nguyenら、Nucl. Acids Res. 25: 3059-3065(1997)) 、および(2)ポリヌクレオチドの糖リン酸骨格の中のリン酸の負電荷を中和も
しくは遮蔽する薬剤(Thomasら、Nucl. Acids Res. 25: 2396-2402(1997))が挙
げられる。(1)および/または(2)を強化したりまたは弱めたりすることに
より、1対の相補的なポリヌクレオチドのTmを調節することが可能である。
[0379] In another embodiment, using a drug to lower the T m of a complementary polynucleotide of the pair. In a more preferred embodiment, to lower the T m of a complementary polynucleotide of the pair using a mixture of agents. The drug can alter the Tm in various ways. Without limiting the invention, two examples include (1) agents that break hydrogen bonds between bases of two complementary polynucleotides (Goodman, Proc. N
at'l Acad. Sci. 94: 10493-10495 (1997); Moran et al., Proc. Nat'l Acad. Sci.
94: 10506-10511 (1997); Nguyen et al., Nucl. Acids Res. 25: 3059-3065 (1997)) and (2) neutralizing or neutralizing the negative charge of the phosphate in the sugar phosphate backbone of the polynucleotide. Drugs that block (Thomas et al., Nucl. Acids Res. 25: 2396-2402 (1997)). By enhancing or weakening (1) and / or (2), it is possible to regulate the Tm of a pair of complementary polynucleotides.

【0380】 最も好適な実施形態において、GC塩基対の結合エネルギーを弱めたり、AT塩基
対の結合エネルギーを強化したり、またはその両方を行うために1以上の薬剤を
加える。好適な実施形態において、1以上の薬剤を加えてAT塩基対からの結合エ
ネルギーをGC塩基対の結合エネルギーとほぼ同じにする。このように、これらの
相補的ポリヌクレオチド間の結合エネルギーは、長さに全く依存する。これらの
相補的ポリヌクレオチドの結合エネルギーは、ポリヌクレオチド骨格中のリン酸
基の負電荷を中和または遮蔽する薬剤を加えることにより、増大させることがで
きる。
In the most preferred embodiments, one or more agents are added to reduce the binding energy of GC base pairs, enhance the binding energy of AT base pairs, or both. In a preferred embodiment, one or more agents are added to make the binding energy from the AT base pair approximately equal to the binding energy of the GC base pair. Thus, the binding energy between these complementary polynucleotides depends entirely on the length. The binding energy of these complementary polynucleotides can be increased by adding agents that neutralize or mask the negative charge of the phosphate groups in the polynucleotide backbone.

【0381】 本発明は、例示した実施形態によりその範囲を制限するものではなく、これら
の実施の形態は本発明の態様を例示することを意図するものであって、機能的に
同等な組成物および方法は、本発明の範囲内とする。実際に、本明細書の好適な
実施形態を考慮すれば、当業者であれば、本発明の実施に際し、様々な改変およ
び変更が思いつくことが予想される。従って、本発明の範囲を限定するのは、請
求の範囲に記載されたもののみである。 本明細書中の本体に記載された全ての参考文献は、本明細書中に参考としてそ
の全体が組み込まれるものとする。
The present invention is not intended to limit its scope by the illustrated embodiments, which are intended to illustrate aspects of the present invention and provide functionally equivalent compositions. And methods are within the scope of the present invention. Indeed, various modifications and changes will occur to those skilled in the art in practicing the present invention in light of the preferred embodiments herein. Accordingly, the scope of the invention is limited only by the claims. All references cited in the body of the specification are hereby incorporated by reference in their entirety.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 図1は、大量生産プローブアレイ用の装置の平面図である。FIG. 1 is a plan view of an apparatus for a mass-produced probe array.

【図2】 図2は、大量生産プローブアレイ用の装置の側面図である。FIG. 2 is a side view of an apparatus for a mass-produced probe array.

【図3】 図3は、大量生産プローブアレイ用の装置の給液ユニット(dispensing unit )の断面側面図である。FIG. 3 is a cross-sectional side view of a dispensing unit of a device for mass-produced probe arrays.

───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 08/959,365 (32)優先日 平成9年10月28日(1997.10.28) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SZ,UG,ZW),EA(AM ,AZ,BY,KG,KZ,MD,RU,TJ,TM) ,AL,AM,AU,AZ,BA,BB,BG,BR, BY,CA,CN,CU,CZ,EE,GE,HR,H U,ID,IL,IS,JP,KG,KP,KR,KZ ,LC,LK,LR,LT,LV,MD,MG,MK, MN,MX,NO,NZ,PL,RO,RU,SG,S I,SK,SL,TJ,TM,TR,TT,UA,US ,UZ,VN,YU (72)発明者 バイドヤ,ナラヤン アメリカ合衆国 94086 カリフォルニア 州、サニーベール、ヘレン アベニュー ナンバー1 966 Fターム(参考) 4B024 AA01 AA11 AA20 CA01 CA09 CA11 HA11 HA14 HA19 4B063 QA01 QA13 QA17 QA18 QA19 QQ06 QQ07 QQ08 QQ10 QQ42 QQ52 QR31 QR41 QR48 QR49 QR50 QR51 QR56 QR62 QR66 QR84 QS02 QS25 QS34 QS39 QX01 QX02 QX07 4B064 AF27 CA21 DA13 ──────────────────────────────────────────────────続 き Continued on the front page (31) Priority claim number 08/959, 365 (32) Priority date October 28, 1997 (Oct. 28, 1997) (33) Priority claim country United States (US) ( 81) Designated countries EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE), OA (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG), AP (GH, GM, KE, LS, MW, SD, SZ, UG, ZW), EA (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), AL, AM, AU, AZ, BA, BB, BG, BR, BY, CA, CN, CU, CZ, EE, GE, HR, H U, ID, IL, IS, JP, KG, KP, KR, KZ, LC, LK, LR, LT, LV, MD, MG, MK, MN, MX, NO, NZ, PL, RO, RU, SG , SI, SK, SL, TJ, TM, TR, TT, UA, US, UZ, VN, YU 4B024 AA01 AA11 AA20 CA01 CA09 CA11 HA11 HA14 HA19 4B063 QA01 QA13 QA17 QA18 QA19 QQ06 QQ07 QQ08 QQ10 QQ42 QQ52 QR31 QR41 QR48 QR49 QR50 QR51 QR56 QR62 QR66 QR84 QS02 QS25 QS34 Q02X13 AF01

Claims (64)

【特許請求の範囲】[Claims] 【請求項1】 多数のオリゴヌクレオチドプローブのアレイであって、 基体と、 物理的バリアーを形成している材料で、該基体の上に配置されていて多数のウ
ェルを有するグリッドを形成している該材料、 を含み、多数のオリゴヌクレオチドプローブが多数のウェル中にアレイを形成す
るように配列されており、各ウェルが該基体上に固定されたプローブの1スポッ
トを含むものである、上記アレイ。
Claims: 1. An array of multiple oligonucleotide probes, comprising a substrate and a material forming a physical barrier, forming a grid having a number of wells disposed on the substrate. Wherein the plurality of oligonucleotide probes are arranged to form an array in a number of wells, each well comprising one spot of the probe immobilized on the substrate.
【請求項2】 個々の各スポットが前記アレイの他のスポット中の他のプロ
ーブと異なる配列をもつプローブを有する、請求項1記載のアレイ。
2. The array of claim 1, wherein each individual spot has a probe with a different sequence than other probes in other spots of the array.
【請求項3】 個々の各スポット中のプローブが同一の配列を有する、請求
項2記載のアレイ。
3. The array of claim 2, wherein the probes in each individual spot have the same sequence.
【請求項4】 あるスポットの中心と隣接スポットの中心間の距離が少なく
とも325μmである、請求項1記載のアレイ。
4. The array of claim 1, wherein the distance between the center of one spot and the center of an adjacent spot is at least 325 μm.
【請求項5】 多数の請求項1記載のアレイを含んでなる配列決定用チップ
5. A sequencing chip comprising a plurality of arrays according to claim 1.
【請求項6】 多数の請求項2記載のアレイを含んでなる配列決定用チップ
6. A sequencing chip comprising a plurality of arrays according to claim 2.
【請求項7】 多数の請求項3記載のアレイを含んでなる配列決定用チップ
7. A sequencing chip comprising a plurality of arrays according to claim 3.
【請求項8】 オリゴヌクレオチドプローブが情報提供部分と反応性基を含
み、該反応性基により該プローブが基体に結合されている、請求項1記載のアレ
イ。
8. The array according to claim 1, wherein the oligonucleotide probe comprises an information providing moiety and a reactive group, and the probe is bound to the substrate by the reactive group.
【請求項9】 オリゴヌクレオチドプローブがさらに少なくとも1つのラン
ダム化された位置を含む、請求項8記載のアレイ。
9. The array of claim 8, wherein the oligonucleotide probe further comprises at least one randomized position.
【請求項10】 オリゴヌクレオチドプローブがさらにスペーサーを含む、
請求項9記載のアレイ。
10. The oligonucleotide probe further comprises a spacer.
An array according to claim 9.
【請求項11】 多数のオリゴヌクレオチドプローブのアレイであって、多
数の平面を有する基体を含み、多数のプローブが該基体の多数の平面に固定され
ている、上記アレイ。
11. An array of multiple oligonucleotide probes, comprising a substrate having multiple planes, wherein the multiple probes are immobilized on multiple planes of the substrate.
【請求項12】 各平面を個別に分析することができる、請求項11記載の
アレイ。
12. The array according to claim 11, wherein each plane can be analyzed individually.
【請求項13】 多数の平面を同時に分析することができる、請求項11記
載のアレイ。
13. The array according to claim 11, wherein multiple planes can be analyzed simultaneously.
【請求項14】 オリゴヌクレオチドプローブが情報提供部分と反応性基を
含み、該反応性基により該プローブが基体に結合されている、請求項11記載の
アレイ。
14. The array of claim 11, wherein the oligonucleotide probe comprises an information providing moiety and a reactive group, wherein the probe is bound to the substrate by the reactive group.
【請求項15】 オリゴヌクレオチドプローブがさらに少なくとも1つのラ
ンダム化された位置を含む、請求項14記載のアレイ。
15. The array of claim 14, wherein the oligonucleotide probe further comprises at least one randomized location.
【請求項16】 オリゴヌクレオチドプローブがさらにスペーサーを含む、
請求項15記載のアレイ。
16. The oligonucleotide probe further comprises a spacer.
An array according to claim 15.
【請求項17】 標的核酸を分析する方法であって、 標的核酸を多数のオリゴヌクレオチドプローブに接触させ(ただし、該プロー
ブは物理的性質に基づいて互いに識別できる多数の異なる離散粒子と複合体化さ
れていて、異なるプローブがそれぞれのタイプの離散粒子に結合している)、 標的核酸に対して相補的であるプローブを検出し、そして 相補的プローブのセットから標的核酸を分析する、 各ステップを含む上記方法。
17. A method for analyzing a target nucleic acid, comprising contacting the target nucleic acid with a number of oligonucleotide probes, provided that the probes are complexed with a number of different discrete particles that can be distinguished from each other based on physical properties. Different probes are attached to each type of discrete particle), detecting the probes that are complementary to the target nucleic acid, and analyzing the target nucleic acid from the set of complementary probes. Including the above method.
【請求項18】 離散粒子を分離して画分を得るステップをさらに含み、そ
の際、離散粒子を物理的性質に基づいて分離する、請求項17記載の方法。
18. The method of claim 17, further comprising the step of separating the discrete particles to obtain a fraction, wherein the discrete particles are separated based on physical properties.
【請求項19】 相補的プローブのセットがオーバーラップする少なくとも
2つのプローブを有する、請求項18記載の方法。
19. The method of claim 18, wherein the set of complementary probes has at least two overlapping probes.
【請求項20】 標的核酸の配列が分析ステップにおいて1つにまとめられ
る、請求項18記載の方法。
20. The method according to claim 18, wherein the sequences of the target nucleic acids are combined in an analysis step.
【請求項21】 相補的プローブが離散粒子の物理的性質により同定される
、請求項18記載の方法。
21. The method of claim 18, wherein the complementary probes are identified by physical properties of the discrete particles.
【請求項22】 物理的性質が色素、放射性ヌクレオチド、EMLおよび蛍光 分子からなる群より選択される分子と関連している、請求項18記載の方法。22. The method of claim 18, wherein the physical property is associated with a molecule selected from the group consisting of a dye, a radionucleotide, an EML, and a fluorescent molecule. 【請求項23】 物理的性質がサイズ、電荷、吸光度および重量からなる群
より選択される、請求項18記載の方法。
23. The method of claim 18, wherein the physical property is selected from the group consisting of size, charge, absorbance, and weight.
【請求項24】 物理的性質が物理的性質の強度と関連している、請求項2
3記載の方法。
24. The physical property is associated with the strength of the physical property.
3. The method according to 3.
【請求項25】 物理的性質が多数の異なる分子と関連している、請求項2
3記載の方法。
25. The method of claim 2, wherein the physical properties are associated with a number of different molecules.
3. The method according to 3.
【請求項26】 プローブの情報提供部分が全長プローブより短い、請求項
18記載の方法。
26. The method of claim 18, wherein the information providing portion of the probe is shorter than the full length probe.
【請求項27】 標的核酸が標識を含み、相補的プローブが標的核酸上の標
識により検出される、請求項18記載の方法。
27. The method of claim 18, wherein the target nucleic acid comprises a label and the complementary probe is detected by a label on the target nucleic acid.
【請求項28】 検出ステップが、個々の粒子を検出器に通すことにより、
個々の離散粒子に対して行われる、請求項17記載の方法。
28. The detecting step, wherein the individual particles are passed through a detector.
18. The method of claim 17, performed on individual discrete particles.
【請求項29】 相補的プローブのセットがオーバーラップする少なくとも
2つのプローブを有する、請求項28記載の方法。
29. The method of claim 28, wherein the set of complementary probes has at least two overlapping probes.
【請求項30】 標的核酸の配列が分析ステップにおいて1つにまとめられ
る、請求項28記載の方法。
30. The method of claim 28, wherein the sequences of the target nucleic acids are combined in an analysis step.
【請求項31】 相補的プローブが離散粒子の物理的性質により同定される
、請求項28記載の方法。
31. The method of claim 28, wherein the complementary probes are identified by physical properties of the discrete particles.
【請求項32】 物理的性質が色素、放射性ヌクレオチド、EMLおよび蛍光 分子からなる群より選択される分子と関連している、請求項28記載の方法。32. The method of claim 28, wherein the physical property is associated with a molecule selected from the group consisting of a dye, a radionucleotide, an EML, and a fluorescent molecule. 【請求項33】 物理的性質がサイズ、電荷、吸光度および重量からなる群
より選択される、請求項28記載の方法。
33. The method of claim 28, wherein the physical property is selected from the group consisting of size, charge, absorbance, and weight.
【請求項34】 物理的性質が物理的性質の強度と関連している、請求項3
3記載の方法。
34. The physical property is associated with the strength of the physical property.
3. The method according to 3.
【請求項35】 物理的性質が多数の異なる分子と関連している、請求項3
3記載の方法。
35. The physical property associated with a number of different molecules.
3. The method according to 3.
【請求項36】 プローブの情報提供部分が全長プローブより短い、請求項
28記載の方法。
36. The method of claim 28, wherein the information providing portion of the probe is shorter than the full length probe.
【請求項37】 標的核酸が標識を含み、相補的プローブが標的核酸上の標
識により検出される、請求項28記載の方法。
37. The method of claim 28, wherein the target nucleic acid comprises a label and the complementary probe is detected by a label on the target nucleic acid.
【請求項38】 標的核酸を多数の遊離オリゴヌクレオチドと接触させ、そ
して標的核酸上のある部位に結合した相補的な遊離プローブを、遊離プローブが
結合した部位に隣接する標的核酸上の部位に結合している離散粒子の相補的プロ
ーブに共有結合で結合させるステップをさらに含み、 検出ステップが離散粒子のプローブに共有結合で結合している遊離プローブを
同定する、請求項28記載の方法。
38. Contacting a target nucleic acid with a number of free oligonucleotides and binding a complementary free probe bound to a site on the target nucleic acid to a site on the target nucleic acid adjacent to the site to which the free probe was bound 29. The method of claim 28, further comprising the step of covalently binding to a complementary probe of the discrete particle, wherein the detecting identifies a free probe covalently bound to the probe of the discrete particle.
【請求項39】 相補的な共有結合プローブのセットがオーバーラップする
少なくとも2つの共有結合プローブを有する、請求項38記載の方法。
39. The method of claim 38, wherein the set of complementary covalent probes has at least two overlapping covalent probes.
【請求項40】 標的核酸の配列が分析ステップにおいて1つにまとめられ
る、請求項38記載の方法。
40. The method of claim 38, wherein the sequences of the target nucleic acids are combined in an analysis step.
【請求項41】 離散粒子と複合体化されたプローブが離散粒子の物理的性
質により同定される、請求項38記載の方法。
41. The method of claim 38, wherein the probe complexed with the discrete particles is identified by the physical properties of the discrete particles.
【請求項42】 離散粒子を分離して画分を得るステップをさらに含み、そ
の際、離散粒子を物理的性質に基づいて分離する、請求項38記載の方法。
42. The method of claim 38, further comprising separating the discrete particles to obtain a fraction, wherein the discrete particles are separated based on physical properties.
【請求項43】 フローサイトメーターで離散粒子を分離して画分を得る、
請求項42記載の方法。
43. Separating the discrete particles with a flow cytometer to obtain a fraction,
43. The method of claim 42.
【請求項44】 物理的性質が色素、放射性ヌクレオチド、EMLおよび蛍光 分子からなる群より選択される分子と関連している、請求項38記載の方法。44. The method of claim 38, wherein the physical property is associated with a molecule selected from the group consisting of a dye, a radionucleotide, an EML, and a fluorescent molecule. 【請求項45】 物理的性質がサイズ、電荷、吸光度および重量からなる群
より選択される、請求項38記載の方法。
45. The method of claim 38, wherein the physical property is selected from the group consisting of size, charge, absorbance, and weight.
【請求項46】 物理的性質が物理的性質の強度と関連している、請求項4
5記載の方法。
46. The physical property is related to the strength of the physical property.
5. The method according to 5.
【請求項47】 物理的性質が多数の異なる分子と関連している、請求項4
5記載の方法。
47. The method of claim 4, wherein the physical properties are associated with a number of different molecules.
5. The method according to 5.
【請求項48】 遊離プローブの情報提供部分が全長プローブより短い、請
求項38記載の方法。
48. The method of claim 38, wherein the informative portion of the free probe is shorter than the full length probe.
【請求項49】 離散粒子と複合体化されたプローブの情報提供部分が全長
プローブより短い、請求項38記載の方法。
49. The method of claim 38, wherein the information providing portion of the probe complexed with the discrete particles is shorter than the full length probe.
【請求項50】 遊離プローブの情報提供部分および離散粒子と複合体化さ
れたプローブの情報提供部分が全長プローブより短い、請求項38記載の方法。
50. The method of claim 38, wherein the informative portion of the free probe and the informative portion of the probe complexed with the discrete particles are shorter than the full length probe.
【請求項51】 標的核酸を分析する方法であって、 標的核酸とプローブとを、完全な対合と誤対合との識別を可能とする条件下(
ここでは、完全な対合と誤対合との識別を向上させる薬剤を添加する)で接触さ
せ、そして 該プローブが標的核酸に対して相補的であるかどうかを検出する、 各ステップを含む上記方法。
51. A method for analyzing a target nucleic acid, comprising the steps of: combining a target nucleic acid with a probe under a condition enabling complete discrimination between a perfect match and a mismatch;
Wherein an agent is added to improve the discrimination between perfect and mispaired) and detecting whether the probe is complementary to the target nucleic acid. Method.
【請求項52】 前記薬剤が塩、有機溶媒、尿素、グアニジニウム、アミノ
酸類似体、ポリアミン、ホスフェート骨格の負電荷を中和する正に荷電した他の
分子、界面活性剤、小溝/主溝結合剤、正に荷電したポリペプチドおよびインタ
ーカレート剤からなる群より選択される、請求項51記載の方法。
52. The drug may be a salt, organic solvent, urea, guanidinium, amino acid analog, polyamine, other positively charged molecule that neutralizes the negative charge of the phosphate backbone, surfactant, minor groove / major groove binder. 52. The method of claim 51, wherein the method is selected from the group consisting of: a positively charged polypeptide and an intercalating agent.
【請求項53】 前記塩がトリアルキルアンモニウム塩、塩化ナトリウム、
リン酸塩およびホウ酸塩からなる群より選択される、請求項52記載の方法。
53. The salt according to claim 53, wherein the salt is a trialkylammonium salt, sodium chloride,
53. The method of claim 52, wherein the method is selected from the group consisting of phosphate and borate.
【請求項54】 前記有機溶媒がホルムアミド、グリコール、ジメチルスル
ホキシドおよびジメチルホルムアミドからなる群より選択される、請求項52記
載の方法。
54. The method of claim 52, wherein said organic solvent is selected from the group consisting of formamide, glycol, dimethylsulfoxide and dimethylformamide.
【請求項55】 前記アミノ酸類似体がベタインである、請求項52記載の
方法。
55. The method of claim 52, wherein said amino acid analog is betaine.
【請求項56】 前記ポリアミンがスペルミジンおよびスペルミンからなる
群より選択される、請求項52記載の方法。
56. The method of claim 52, wherein said polyamine is selected from the group consisting of spermidine and spermine.
【請求項57】 前記界面活性剤がドデシル硫酸ナトリウムおよびナトリウ
ムラウリルサルコシネートからなる群より選択される、請求項52記載の方法。
57. The method of claim 52, wherein said surfactant is selected from the group consisting of sodium dodecyl sulfate and sodium lauryl sarcosinate.
【請求項58】 前記インターカレート剤がアクリジン、エチジウムブロミ
ドおよびアントラシンからなる群より選択される、請求項52記載の方法。
58. The method of claim 52, wherein said intercalating agent is selected from the group consisting of acridine, ethidium bromide and anthracin.
【請求項59】 複数の薬剤が添加される、請求項51記載の方法。59. The method of claim 51, wherein a plurality of drugs are added. 【請求項60】 前記薬剤が塩、有機溶媒、尿素、グアニジニウム、アミノ
酸類似体、ポリアミン、ホスフェート骨格の負電荷を中和する正に荷電した他の
分子、界面活性剤、小溝/主溝結合剤、正に荷電したポリペプチドおよびインタ
ーカレート剤からなる群より選択される、請求項59記載の方法。
60. The drug may be a salt, organic solvent, urea, guanidinium, amino acid analog, polyamine, other positively charged molecule that neutralizes the negative charge of the phosphate backbone, surfactant, minor groove / major groove binder. 60. The method of claim 59, wherein the method is selected from the group consisting of: a positively charged polypeptide and an intercalating agent.
【請求項61】 標的核酸を分析する方法であって、 多数の固定されたオリゴヌクレオチドプローブのアレイを用意し、 多数の標識されたオリゴヌクレオチドプローブのアレイを用意し、 標的核酸と固定プローブおよび標識プローブとを、標的核酸と完全な対合を形
成するプローブと、標的核酸と1塩基誤対合で結合したプローブとの識別を可能
とする条件下(ここでは、完全な対合と1塩基誤対合との識別を向上させる薬剤
を添加する)で接触させ、 標的核酸のある部位に結合した固定プローブを、固定プローブが結合された部
位に隣接する標的核酸の部位にハイブリダイズしている標識プローブに共有結合
で結合させ、そして 共有結合で結合された固定プローブと標識プローブを同定する、 各ステップを含む上記方法。
61. A method for analyzing a target nucleic acid, comprising: providing an array of a number of immobilized oligonucleotide probes; providing an array of a number of labeled oligonucleotide probes; The probe is used under conditions that enable the discrimination between a probe that forms a perfect pair with the target nucleic acid and a probe that binds to the target nucleic acid by a single base mismatch (here, a perfect match and a single base mismatch). A label that hybridizes the immobilized probe bound to a site on the target nucleic acid to a site on the target nucleic acid adjacent to the site to which the immobilized probe is bound. The above method comprising the steps of: covalently binding to a probe; and identifying immobilized and labeled probes covalently bound.
【請求項62】 前記薬剤が塩、有機溶媒、尿素、グアニジニウム、アミノ
酸類似体、ポリアミン、ホスフェート骨格の負電荷を中和する正に荷電した他の
分子、界面活性剤、小溝/主溝結合剤、正に荷電したポリペプチドおよびインタ
ーカレート剤からなる群より選択される、請求項61記載の方法。
62. The drug may be a salt, organic solvent, urea, guanidinium, amino acid analog, polyamine, other positively charged molecule that neutralizes the negative charge of the phosphate backbone, surfactant, minor groove / major groove binder. 62. The method of claim 61, wherein the method is selected from the group consisting of: a positively charged polypeptide and an intercalating agent.
【請求項63】 前記薬剤がホルムアミドである、請求項61記載の方法。63. The method of claim 61, wherein said agent is formamide. 【請求項64】 複数の薬剤が添加される、請求項61記載の方法。64. The method of claim 61, wherein a plurality of drugs are added.
JP2000509878A 1997-08-15 1998-08-14 Methods and compositions for detecting or quantifying nucleic acid species Pending JP2001514906A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US08/912,885 US6383742B1 (en) 1997-01-16 1997-08-15 Three dimensional arrays for detection or quantification of nucleic acid species
US08/912,885 1997-08-15
US08/947,779 1997-10-09
US08/947,779 US20020034737A1 (en) 1997-03-04 1997-10-09 Methods and compositions for detection or quantification of nucleic acid species
US95936597A 1997-10-28 1997-10-28
US08/959,365 1997-10-28
PCT/US1998/016966 WO1999009217A1 (en) 1997-08-15 1998-08-14 Methods and compositions for detection or quantification of nucleic acid species

Publications (1)

Publication Number Publication Date
JP2001514906A true JP2001514906A (en) 2001-09-18

Family

ID=27420630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000509878A Pending JP2001514906A (en) 1997-08-15 1998-08-14 Methods and compositions for detecting or quantifying nucleic acid species

Country Status (6)

Country Link
EP (1) EP1012335A4 (en)
JP (1) JP2001514906A (en)
CN (1) CN1273609A (en)
AU (1) AU8908198A (en)
CA (1) CA2300940A1 (en)
WO (1) WO1999009217A1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005537799A (en) * 2002-09-09 2005-12-15 バイオアレイ ソリューションズ リミテッド Gene analysis and authentication methods
JP2010117167A (en) * 2008-11-11 2010-05-27 Sharp Corp Electrophoretic system and constituent instrument thereof
JP2018533965A (en) * 2015-11-16 2018-11-22 リヴィア バイオセンサーズ,エルエルシー System and method for identifying and distinguishing genetic samples
WO2023238921A1 (en) * 2022-06-10 2023-12-14 壽文 池田 Peptide nucleic acid (pna) sensor chip and method for producing same
US11939638B2 (en) 2017-05-09 2024-03-26 Revere Biosensors, Llc Systems and methods for identifying and distinguishing genetic samples

Families Citing this family (161)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE366418T1 (en) 1996-04-25 2007-07-15 Bioarray Solutions Ltd LIGHT-REGULATED, ELECTROKINETIC COMPOSITION OF PARTICLES ON SURFACES
EP2145963A1 (en) 1999-01-06 2010-01-20 Callida Genomics, Inc. Enhanced sequencing by hybridization using pools of probes
WO2000056937A2 (en) * 1999-03-25 2000-09-28 Hyseq, Inc. Solution-based methods and materials for sequence analysis by hybridization
JP3911909B2 (en) 1999-06-09 2007-05-09 株式会社日立製作所 DNA sample preparation method and DNA sample preparation apparatus
WO2001000875A2 (en) * 1999-06-25 2001-01-04 Motorola, Inc. Novel methods and products for arrayed microsphere analysis
AU2001241474A1 (en) 2000-02-11 2001-08-20 The Texas A And M University System Biosensor compositions and methods of use
US9709559B2 (en) 2000-06-21 2017-07-18 Bioarray Solutions, Ltd. Multianalyte molecular analysis using application-specific random particle arrays
JP2002153271A (en) 2000-11-17 2002-05-28 Jeol Ltd Method for determining base sequence of dna or rna and dna sequencer
US7419833B2 (en) 2000-11-17 2008-09-02 Nagayama Ip Holdings Llc Method for nucleic acid sequencing
WO2003014398A2 (en) * 2001-01-03 2003-02-20 Transgenomic, Inc. Methods and compositions for mutation detection by liquid chromatography
CA2441006A1 (en) * 2001-03-08 2002-09-19 Hyseq, Inc. Methods and materials relating to fibulin-like polypeptides and polynucleotides
WO2002090599A1 (en) 2001-05-09 2002-11-14 Genetic Id, Inc. Universal microarray system
US7262063B2 (en) 2001-06-21 2007-08-28 Bio Array Solutions, Ltd. Directed assembly of functional heterostructures
CN100494395C (en) 2001-10-15 2009-06-03 生物芯片技术有限公司 polymorphic locus multiplexed analysis by concurrent probing and enzyme-mediated detection
US6916621B2 (en) 2002-03-27 2005-07-12 Spectral Genomics, Inc. Methods for array-based comparitive binding assays
JP2005523019A (en) 2002-04-19 2005-08-04 ダイヴァーサ コーポレイション Phospholipases, nucleic acids encoding them, and methods for making and using them
US7226771B2 (en) 2002-04-19 2007-06-05 Diversa Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
WO2004047007A1 (en) 2002-11-15 2004-06-03 Bioarray Solutions, Ltd. Analysis, secure access to, and transmission of array images
CN1791682B (en) 2003-02-26 2013-05-22 凯利达基因组股份有限公司 Random array DNA analysis by hybridization
US20060182655A1 (en) * 2003-03-04 2006-08-17 Fanglin Zou Integrating analysis chip with minimized reactors and its application
CN1208622C (en) * 2003-03-04 2005-06-29 成都夸常科技有限公司 Biological chip with minimized reactor isolation structure height and its preparation method
CN102618564B (en) 2003-03-06 2014-10-29 维莱尼姆公司 Amylases, nucleic acids encoding them and methods for making and using them
CA2515583C (en) 2003-03-07 2015-07-14 Diversa Corporation Hydrolases, nucleic acids encoding them and methods for making and using them
DK1613733T3 (en) 2003-04-04 2015-08-31 Basf Enzymes Llc PEKTATLYASER, nucleic acids encoding them, and methods for making and using the
JP2007529993A (en) 2003-07-02 2007-11-01 シンジェンタ パーティシペーションズ アーゲー Glucanases, nucleic acids encoding them and methods for making and using them
CA2535526C (en) 2003-08-11 2015-09-29 Diversa Corporation Laccases, nucleic acids encoding them and methods for making and using them
EP1664722B1 (en) 2003-09-22 2011-11-02 Bioarray Solutions Ltd Surface immobilized polyelectrolyte with multiple functional groups capable of covalently bonding to biomolecules
EP1692298A4 (en) 2003-10-28 2008-08-13 Bioarray Solutions Ltd Optimization of gene expression analysis using immobilized capture probes
EP1696920B8 (en) 2003-12-19 2015-05-06 Plexxikon Inc. Compounds and methods for development of ret modulators
WO2005059553A1 (en) * 2003-12-19 2005-06-30 Chengdu Kuachang Medical Industrial Limited The biochip assay and its relative equipment
CN101031293A (en) 2004-05-06 2007-09-05 普莱希科公司 Pde4b inhibitors and uses therefor
EP1766061B1 (en) 2004-05-20 2013-07-17 Quest Diagnostics Investments Incorporated Single label comparative hybridization
CN103173282A (en) 2004-06-16 2013-06-26 帝斯曼知识产权资产管理有限公司 Compositions and methods for enzymatic decolorization of chlorophyll
US7498342B2 (en) 2004-06-17 2009-03-03 Plexxikon, Inc. Compounds modulating c-kit activity
US7848889B2 (en) 2004-08-02 2010-12-07 Bioarray Solutions, Ltd. Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification
CA2583428A1 (en) 2004-09-03 2006-03-09 Plexxikon, Inc. Bicyclic heteroaryl pde4b inhibitors
WO2006081353A2 (en) 2005-01-27 2006-08-03 Quest Diagnostics Investments Incorporated Rapid comparative genome hybridization
WO2006099207A2 (en) 2005-03-10 2006-09-21 Diversa Corporation Lyase enzymes, nucleic acids encoding them and methods for making and using them
CA2861310A1 (en) 2005-03-15 2006-09-28 Bp Corporation North America Inc. Cellulases, nucleic acids encoding them and methods for making and using them
MX2007014377A (en) 2005-05-17 2008-02-06 Plexxikon Inc Pyrrol (2,3-b) pyridine derivatives protein kinase inhibitors.
GB0515323D0 (en) * 2005-07-26 2005-08-31 Electrophoretics Ltd Mass labels
US8076074B2 (en) 2005-11-29 2011-12-13 Quest Diagnostics Investments Incorporated Balanced translocation in comparative hybridization
EP2216403A3 (en) 2006-02-02 2010-11-24 Verenium Corporation Esterases and related nucleic acids and methods
CN103602692A (en) 2006-02-10 2014-02-26 维莱尼姆公司 Cellulolytic enzymes, nucleic acids encoding them and methods for making and using them
TR201809912T4 (en) 2006-02-14 2018-07-23 Bp Corp North America Inc Xylanases, nucleic acids encoding them, and methods for making and using them.
EP1994161A2 (en) 2006-03-07 2008-11-26 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
EA019971B1 (en) 2006-03-07 2014-07-30 Верениум Корпорейшн Aldolases, nucleic acids encoding them and methods for making and using them
CA3020590A1 (en) 2006-08-04 2009-02-12 Bp Corporation North America Inc. Glucanases, nucleic acids encoding them and methods for making and using them
CN113789316A (en) 2006-09-21 2021-12-14 巴斯夫酶有限责任公司 Phytases, nucleic acids encoding them and methods of making and using them
AR062947A1 (en) 2006-09-21 2008-12-17 Verenium Corp NUCLEIC ACID PHOSPHOLIPASSES CODING THEM AND METHODS TO PREPARE AND USE THEM
US8618248B2 (en) 2006-10-31 2013-12-31 President And Fellows Of Harvard College Phosphopeptide compositions and anti-phosphopeptide antibody compositions and methods of detecting phosphorylated peptides
WO2008063888A2 (en) 2006-11-22 2008-05-29 Plexxikon, Inc. Compounds modulating c-fms and/or c-kit activity and uses therefor
US8343747B2 (en) 2006-12-21 2013-01-01 Verenium Corporation Amylases and glucoamylases, nucleic acids encoding them and methods for making and using them
BRPI0807132A2 (en) 2007-01-30 2018-12-04 Syngenta Participations Ag enzymes for the treatment of lignocellulosics, nucleic acids encoding them, and methods and use thereof
WO2008109176A2 (en) 2007-03-07 2008-09-12 President And Fellows Of Harvard College Assays and other reactions involving droplets
AU2008245611B2 (en) 2007-04-27 2014-09-18 University Of California Plant CO2 sensors, nucleic acids encoding them, and methods for making and using them
SG183036A1 (en) 2007-07-17 2012-08-30 Plexxikon Inc Compounds and methods for kinase modulation, and indications therefor
US7507539B2 (en) 2007-07-30 2009-03-24 Quest Diagnostics Investments Incorporated Substractive single label comparative hybridization
AU2008307371B2 (en) 2007-10-03 2015-05-28 Bp Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
US9797010B2 (en) 2007-12-21 2017-10-24 President And Fellows Of Harvard College Systems and methods for nucleic acid sequencing
US8709772B2 (en) 2008-01-03 2014-04-29 Verenium Corporation Transferases and oxidoreductases, nucleic acids encoding them and methods for making and using them
US8198062B2 (en) 2008-08-29 2012-06-12 Dsm Ip Assets B.V. Hydrolases, nucleic acids encoding them and methods for making and using them
ES2581774T3 (en) 2008-08-29 2016-09-07 Janssen Biotech, Inc. Markers and methods of evaluation and treatment of ulcerative colitis and related disorders using a panel of 20 genes
US20110218123A1 (en) 2008-09-19 2011-09-08 President And Fellows Of Harvard College Creation of libraries of droplets and related species
US20120052066A1 (en) 2008-11-07 2012-03-01 Cesar Calderon Markers and methods for assessing and treating lupus patients susceptible to photoprovocation
US8748094B2 (en) 2008-12-19 2014-06-10 President And Fellows Of Harvard College Particle-assisted nucleic acid sequencing
KR101979188B1 (en) 2009-03-09 2019-05-16 바이오아트라, 엘엘씨 Mirac proteins
MX349923B (en) 2009-04-03 2017-08-21 Hoffmann La Roche Propane- i-sulfonic acid {3- [5- (4 -chloro-phenyl) -1h-pyrrolo [2, 3-b] pyridine-3-carbonyl] -2, 4-difluoro-pheny l } -amide compositions and uses thereof.
HUE030948T2 (en) 2009-05-21 2017-06-28 Basf Enzymes Llc Phytases, nucleic acids encoding them and methods for making and using them
CN102630250A (en) 2009-09-25 2012-08-08 基因诊断测试公司 Multiplex (+/-) stranded arrays and assays for detecting chromosomal abnormalities associated with cancer and other diseases
UA109884C2 (en) 2009-10-16 2015-10-26 A POLYPEPTIDE THAT HAS THE ACTIVITY OF THE PHOSPHATIDYLINOSYTOL-SPECIFIC PHOSPHOLIPASE C, NUCLEIC ACID, AND METHOD OF METHOD
UA111708C2 (en) 2009-10-16 2016-06-10 Бандж Ойлз, Інк. METHOD OF OIL REFINING
US9056289B2 (en) 2009-10-27 2015-06-16 President And Fellows Of Harvard College Droplet creation techniques
ES2633317T3 (en) 2009-11-06 2017-09-20 Plexxikon, Inc. Compounds and methods for kinase modulation, and indications for it
JP5660910B2 (en) * 2010-03-30 2015-01-28 富士フイルム株式会社 Method for manufacturing grid for radiographic imaging
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
BR112013008347A2 (en) 2010-10-06 2016-06-14 Bp Corp North America Inc cbh variant polypeptides i
MY162950A (en) 2011-02-07 2017-07-31 Plexxikon Inc Compounds and methods for kinase modulation, and indications therefor
TWI558702B (en) 2011-02-21 2016-11-21 普雷辛肯公司 Solid forms of a pharmaceutically active substance
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
RU2631487C2 (en) 2011-05-17 2017-09-22 Плексксикон Инк. Kinases modulation and indications for its use
US9150570B2 (en) 2012-05-31 2015-10-06 Plexxikon Inc. Synthesis of heterocyclic compounds
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9388465B2 (en) 2013-02-08 2016-07-12 10X Genomics, Inc. Polynucleotide barcode generation
CN113528634A (en) 2012-08-14 2021-10-22 10X基因组学有限公司 Microcapsule compositions and methods
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9567631B2 (en) 2012-12-14 2017-02-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9267171B2 (en) 2013-02-28 2016-02-23 New York University DNA photolithography with cinnamate crosslinkers
WO2014210225A1 (en) 2013-06-25 2014-12-31 Prognosys Biosciences, Inc. Methods and systems for determining spatial patterns of biological targets in a sample
US10395758B2 (en) 2013-08-30 2019-08-27 10X Genomics, Inc. Sequencing methods
WO2015069634A1 (en) 2013-11-08 2015-05-14 President And Fellows Of Harvard College Microparticles, methods for their preparation and use
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
MX2016013156A (en) 2014-04-10 2017-02-14 10X Genomics Inc Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same.
EP3143138B1 (en) 2014-05-13 2022-03-23 BioAtla, Inc. Conditionally active biological proteins
CN113249435A (en) 2014-06-26 2021-08-13 10X基因组学有限公司 Methods of analyzing nucleic acids from individual cells or cell populations
SG11201610691QA (en) 2014-06-26 2017-01-27 10X Genomics Inc Processes and systems for nucleic acid sequence assembly
AU2015308818B2 (en) 2014-08-28 2021-02-25 Bioatla Llc Conditionally active chimeric antigen receptors for modified T-cells
US11111288B2 (en) 2014-08-28 2021-09-07 Bioatla, Inc. Conditionally active chimeric antigen receptors for modified t-cells
JP2017532019A (en) 2014-09-03 2017-11-02 バイオアトラ、エルエルシー Discovery and production of conditionally active biological proteins in the same eukaryotic cell production host
AU2015339148B2 (en) 2014-10-29 2022-03-10 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequencing
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
KR102321863B1 (en) 2015-01-12 2021-11-08 10엑스 제노믹스, 인크. Method and system for preparing nucleic acid sequencing library and library prepared using same
KR20170106979A (en) 2015-01-13 2017-09-22 10엑스 제노믹스, 인크. System and method for visualizing structure variation and phase adjustment information
SG11201705996PA (en) 2015-02-09 2017-09-28 10X Genomics Inc Systems and methods for determining structural variation and phasing using variant call data
EP4286516A3 (en) 2015-02-24 2024-03-06 10X Genomics, Inc. Partition processing methods and systems
MX2017010795A (en) 2015-02-24 2018-04-11 Bioatla Llc Conditionally active biological proteins.
EP3936619A1 (en) 2015-02-24 2022-01-12 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
WO2016164641A1 (en) 2015-04-08 2016-10-13 Plexxikon Inc. Compounds and methods for kinase modulation, and indications therefor
EP3901281B1 (en) 2015-04-10 2022-11-23 Spatial Transcriptomics AB Spatially distinguished, multiplex nucleic acid analysis of biological specimens
US10829484B2 (en) 2015-07-28 2020-11-10 Plexxikon Inc. Compounds and methods for kinase modulation, and indications therefor
EP3362032A4 (en) 2015-10-13 2019-05-01 President and Fellows of Harvard College Systems and methods for making and using gel microspheres
EP3882357B1 (en) 2015-12-04 2022-08-10 10X Genomics, Inc. Methods and compositions for nucleic acid analysis
MX2018006856A (en) 2015-12-07 2018-08-01 Plexxikon Inc Compounds and methods for kinase modulation, and indications therefor.
CN108779491B (en) 2016-02-11 2021-03-09 10X基因组学有限公司 Systems, methods, and media for de novo assembly of whole genome sequence data
EP4122958A1 (en) 2016-05-13 2023-01-25 BioAtla, Inc. Anti-ror2 antibodies, antibody fragments, their immunoconjugates and uses thereof
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
TW201815766A (en) 2016-09-22 2018-05-01 美商普雷辛肯公司 Compounds and methods for IDO and TDO modulation, and indications therefor
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
JP7193460B2 (en) 2016-12-23 2022-12-20 プレキシコン インコーポレーテッド Compounds and methods for CDK8 modulation and indications thereof
EP4310183A3 (en) 2017-01-30 2024-02-21 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
EP3625715A4 (en) 2017-05-19 2021-03-17 10X Genomics, Inc. Systems and methods for analyzing datasets
US20180340169A1 (en) 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
EP4230746A3 (en) 2017-05-26 2023-11-01 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
WO2018226846A1 (en) 2017-06-07 2018-12-13 Plexxikon Inc. Compounds and methods for kinase modulation
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
CN108728330A (en) * 2018-06-19 2018-11-02 东台德缘生物科技有限公司 A kind of kit for mammalian cell gene editor's vector construction
WO2020123319A2 (en) 2018-12-10 2020-06-18 10X Genomics, Inc. Methods of using master / copy arrays for spatial detection
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020243076A1 (en) * 2019-05-31 2020-12-03 Illumina, Inc. System and method for storage
CN110716040B (en) * 2019-10-31 2022-06-14 福建师范大学 Preparation and application of MXene nanosheet photo-thermal amplification-based adjacent hybridization dual-mode immunosensor
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
SG11202106899SA (en) 2019-12-23 2021-09-29 10X Genomics Inc Methods for spatial analysis using rna-templated ligation
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
WO2021216708A1 (en) 2020-04-22 2021-10-28 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
EP4153775A1 (en) 2020-05-22 2023-03-29 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
CN116034166A (en) 2020-06-25 2023-04-28 10X基因组学有限公司 Spatial analysis of DNA methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
AU2021409136A1 (en) 2020-12-21 2023-06-29 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
CN113008595B (en) * 2021-02-26 2023-07-07 中冶东方工程技术有限公司 Comprehensive robot sampling and preparing system and method in metallurgical industry
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
CN116153411B (en) * 2023-04-18 2023-06-30 北京携云启源科技有限公司 Design method and application of multi-pathogen probe library combination

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5002867A (en) * 1988-04-25 1991-03-26 Macevicz Stephen C Nucleic acid sequence determination by multiple mixed oligonucleotide probes
NO164622C (en) * 1988-05-11 1990-10-24 Tore Lindmo BINAER IMMUNOMETRIC PARTICLE-BASED METHOD FOR MEASURING SPECIFIC SERUM ANTIGENS USING LIQUID FLOW MICROPHOTOMETRY AND A PREPARED TARGET SET UP THEREOF.
AU4181089A (en) * 1988-08-01 1990-03-05 George D. Cimino Identification of allele specific nucleic acid sequences by hybridization with crosslinkable oligonucleotide probes
EP0834576B1 (en) * 1990-12-06 2002-01-16 Affymetrix, Inc. (a Delaware Corporation) Detection of nucleic acid sequences
US5474796A (en) * 1991-09-04 1995-12-12 Protogene Laboratories, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
US5503980A (en) * 1992-11-06 1996-04-02 Trustees Of Boston University Positional sequencing by hybridization
EP0723598B1 (en) * 1993-09-27 2004-01-14 Arch Development Corporation Methods and compositions for efficient nucleic acid sequencing
JPH09510614A (en) * 1994-03-24 1997-10-28 ガメラ・バイオサイエンス・コーポレイション DNA melt meter and method of using the same
ATE174066T1 (en) * 1994-04-04 1998-12-15 Ciba Corning Diagnostics Corp HYBRIDIZATION-LIGITATION METHOD FOR DETECTING SPECIFIC DNA SEQUENCES
US5545531A (en) * 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005537799A (en) * 2002-09-09 2005-12-15 バイオアレイ ソリューションズ リミテッド Gene analysis and authentication methods
JP4741233B2 (en) * 2002-09-09 2011-08-03 バイオアレイ ソリューションズ リミテッド Gene analysis and authentication methods
JP2010117167A (en) * 2008-11-11 2010-05-27 Sharp Corp Electrophoretic system and constituent instrument thereof
JP2018533965A (en) * 2015-11-16 2018-11-22 リヴィア バイオセンサーズ,エルエルシー System and method for identifying and distinguishing genetic samples
JP2022023083A (en) * 2015-11-16 2022-02-07 リヴィア バイオセンサーズ,エルエルシー Systems and methods for identifying and distinguishing genetic samples
JP7315326B2 (en) 2015-11-16 2023-07-26 リヴィア バイオセンサーズ,エルエルシー Systems and methods for identifying and differentiating genetic samples
US11725233B2 (en) 2015-11-16 2023-08-15 Revere Biosensors, Llc Systems and methods for identifying and distinguishing genetic samples
JP7434243B2 (en) 2015-11-16 2024-02-20 リヴィア バイオセンサーズ,エルエルシー Systems and methods for identifying and differentiating genetic samples
US11939638B2 (en) 2017-05-09 2024-03-26 Revere Biosensors, Llc Systems and methods for identifying and distinguishing genetic samples
WO2023238921A1 (en) * 2022-06-10 2023-12-14 壽文 池田 Peptide nucleic acid (pna) sensor chip and method for producing same

Also Published As

Publication number Publication date
CA2300940A1 (en) 1999-02-25
EP1012335A4 (en) 2004-06-09
AU8908198A (en) 1999-03-08
EP1012335A1 (en) 2000-06-28
CN1273609A (en) 2000-11-15
WO1999009217A1 (en) 1999-02-25

Similar Documents

Publication Publication Date Title
JP2001514906A (en) Methods and compositions for detecting or quantifying nucleic acid species
US6383742B1 (en) Three dimensional arrays for detection or quantification of nucleic acid species
US6297006B1 (en) Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
US6309824B1 (en) Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
US20020034737A1 (en) Methods and compositions for detection or quantification of nucleic acid species
US6355419B1 (en) Preparation of pools of nucleic acids based on representation in a sample
US8034566B2 (en) Enhanced sequencing by hybridization using pools of probes
US6401267B1 (en) Methods and compositions for efficient nucleic acid sequencing
EP0723598B1 (en) Methods and compositions for efficient nucleic acid sequencing
Chetverin et al. Oligonucleotide arrays: New concepts and possibilities
US7399584B2 (en) Method of comparing a target nucleic acid and a reference nucleic acid
US20030073623A1 (en) Novel nucleic acid sequences obtained from various cDNA libraries
US20130296173A1 (en) Pre-anchor wash
WO2007106509A2 (en) Methods and means for nucleic acid sequencing
US20030036084A1 (en) Nucleic acid detection method employing oligonucleotide probes affixed to particles and related compositions
KR20010022917A (en) Methods and compositions for detection or quantification of nucleic acid species
WO1999036567A2 (en) Enhanced discrimination of perfect matches from mismatches using a modified dna ligase
CZ254699A3 (en) Processes and compositions suitable for detection of quantification of types of nucleic acids