JPH10512745A - Dna塩基配列決定およびdna同定の方法および装置 - Google Patents

Dna塩基配列決定およびdna同定の方法および装置

Info

Publication number
JPH10512745A
JPH10512745A JP8517814A JP51781496A JPH10512745A JP H10512745 A JPH10512745 A JP H10512745A JP 8517814 A JP8517814 A JP 8517814A JP 51781496 A JP51781496 A JP 51781496A JP H10512745 A JPH10512745 A JP H10512745A
Authority
JP
Japan
Prior art keywords
nucleic acid
probes
probe
sequence
hybridization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP8517814A
Other languages
English (en)
Inventor
ドルマナック,ラドジェ,ティー.
Original Assignee
ハイセック インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ハイセック インコーポレイテッド filed Critical ハイセック インコーポレイテッド
Publication of JPH10512745A publication Critical patent/JPH10512745A/ja
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J19/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J19/0046Sequential or parallel reactions, e.g. for the synthesis of polypeptides or polynucleotides; Apparatus and devices for combinatorial chemistry or for making molecular arrays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00279Features relating to reactor vessels
    • B01J2219/00306Reactor vessels in a multiple arrangement
    • B01J2219/00313Reactor vessels in a multiple arrangement the reactor vessels being formed by arrays of wells in blocks
    • B01J2219/00315Microtiter plates
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00351Means for dispensing and evacuation of reagents
    • B01J2219/00364Pipettes
    • B01J2219/00367Pipettes capillary
    • B01J2219/00369Pipettes capillary in multiple or parallel arrangements
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00351Means for dispensing and evacuation of reagents
    • B01J2219/00378Piezoelectric or ink jet dispensers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00351Means for dispensing and evacuation of reagents
    • B01J2219/00387Applications using probes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00504Pins
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00513Essentially linear supports
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00527Sheets
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00659Two-dimensional arrays
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B60/00Apparatus specially adapted for use in combinatorial chemistry or with libraries
    • C40B60/14Apparatus specially adapted for use in combinatorial chemistry or with libraries for creating libraries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/582Recycling of unreacted starting or intermediate materials

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Saccharide Compounds (AREA)

Abstract

(57)【要約】 ハイブリダイゼーションによる配列決定(SBH)法および装置は、多数試料を個別的に多数プローブ分析するために細区分されたフィルタを用いるもので、DNA同定およびDNA配列決定に用いることができる。区画化されたフィルタを調製する。この区画化されたフイルタのセグメントに試料を添え、またハイブリダイゼーションの判定を行うために各扇形を単一のプローブまたは多重プローブを用いて調べる。相補性、SBHによる部分的シークエンシング、またはSBHによる完全なシークエンシングについて、ハイブリダイゼーションデータを分析する。

Description

【発明の詳細な説明】 DNA塩基配列決定およびDNA同定の方法および装置 発明の分野 本発明は、核酸分析に関し、特にDNA塩基配列決定の方法および装置に関する 。 背景技術 DNA試料に含まれる4種類のヌクレオチド配列を決定する速度は、分子生物 学、医学、及びバイオテクノロジーの進歩にとって重要な技術的課題である。ゲ ル上でDNA分子の分離を必要とする核酸配列決定法は1978年から利用され ている。核酸の配列を決定する定評のある方法としては、ハイブリダイゼーショ ン法による塩基配列決定法(SBH)が唯一の方法である。 SBHの配列(array)にもとづいたアプローチは、DNA分子の分離、分解 、合成、およびイメージングに際して単一塩基の分析を必要としない。この方法 でもっとも一般的に議論される変形例では、長さがK塩基である短いオリゴヌク レオチドの不適合(mismatch)弁別(discriminative)ハイブリダイゼーション を用いて構成K量体(k-mer)オリゴヌクレオチドのリストをターゲットDNA について決定することができよう。このシークエンス(sequence)は、判定され た(scored)オリゴヌクレオチドが独特に重なり合ってアセンブルされている。 SBHシークエンスのアセンブリでは、分析したDNAフラグメントで偶然に 、または生物学的理由により繰り返して生ずるK−1オリゴヌクレオチドに対し て特に検討する必要があるかもしれない。もし追加の情報がないとするならば、 すべての塩基対(bp)が数回読み取られることからDNAの相対的に小さなフラ グメントを完全に組み合わせてもよい。相対的に長めのフラグメントからなる組 み合わせでは、K−1ヌクレオチドが繰 り返して生ずることから曖昧さが生ずる。この問題は、変異を起こした、あるい は類似のシークエンスを決定すなければならない場合には起こらない。一つのシ ークエンスについての知識は、同様のシークエンスを正確に組み立てるテンプレ ートとして用いられる。 ハイブリダイゼーション法による塩基配列決定法にはいくつかのアプローチの 仕方がある。SBHフォーマット1では、DNA試料を配列し、該DNA試料に 標識プローブをハイブリダイズさせる。試料DNAの同一セットを保持するレプ リカ膜を用いて、いくつかのプローブを平行して判定(スコアリング)する際に 利用してもよく、さらに(あるいは)プローブを増やしてもよい。ナイロン膜上 にDNA試料を配列し、かつハイブリダイズさせることについては、開発が十分 進んでいる。各配列の再利用を数多く行うこともできよう。フォーマット1は、 大量の試料をバッチ処理する上で特に有効である。 SBHフォーマット2では、プローブを配列し、さらに標識DNA試料フラグ メントをこの配列されたプローブにハイブリダイズさせる。この場合、一フラグ メントの完全なシークエンスが、並んだプローブとの同時ハイブリダイゼーショ ン反応によって決定される。他のDNAの塩基配列を決定する場合、同じオリゴ ヌクレオチド配列を再利用してもよい。このような配列をフォーマット2のスポ ッティングまたはin situ変形(variant)によって産生してもよい。DNAアン カーを配列し、リゲーションを利用して合成されるオリゴ配列を決定する。特異 的なハイブリダイゼーションが公開されている。フォーマット2の変形では、リ ゲーションを利用してDNAアンカーを配列し、ターゲットDNA末端に存在す るオリゴ配列を決定する。 フォーマット3では、2セットのプローブを利用する。一つのセットは並んだ かたちにあり、また他の標識されたセットは多穴プレートに保存される。この場 合、ターゲットDNAを標識する必要はない。ターゲットDNAおよび一つの標 識プローブをプローブの配列されたセットに加える。もし一つの結合したプロー ブと一つの標識プローブが共にターゲットDN A上で隣接するようにしてハイブリダイズするならば、共有結合のかたちでリゲ ートし、スコアされるものよりも2倍長い配列が作られる。このような方法は、 長いDNAフラグメント、例えば完全な細菌ゲノムを、より小さな断片のかたち でDNAサブクローニングすることなくシークエンシングするのを可能とさせる 。 本発明では、SBHを用いて短時間で1つ以上のDNA試料を効率よく同定し 、かつ塩基配列決定を行う。この方法は、DNA診断、法医学、およびゲノム・ マッピングの数多くの用途に適用されるものである。また、生物学的多様性の評 価を行ったり、DNA配列に応じた異なるタイプのデータを数多く作成するため に、遺伝子疾患または他の形質に関する突然変異を同定するのに用いることがで きよう。 発明の要約 上記したように、フォーマット1SBHは大きな一つのセットとなった試料を 同時に分析するのに好適である。何千もの試料を大きな配列上で平行して判定す る方法を一つまたはわずかな試料に対して適用すると、膜の小さな断片を用いて 個別にハイブリダイゼーション反応を数千回行うことになる。DNAの同定は1 〜20のプローブを必要とするものであり、突然変異体の同定はいくつかの場合 では各試料に対して特別に選択され、かつ設計された1,000以上のプローブ を必要とする。変異DNAフラグメントの特性を同定するために、ハイブリダイ ゼーションの第1ラウンドで検出された各変異体に対して特異的なプローブを合 成または選択してもよい。 本発明によれば、複数のDNA試料は複数の小さな配列として調製される。こ れらの小配列は適当なスペーサで分離され、また多穴プレートに保持されたオリ ゴヌクレオチドの一セットから選択されるプローブによって同時に試験される。 小さな配列は、一つ以上の試料からなる。各小配列内のDNA試料は突然変異体 またはあるシークエンスの個々の試料からなる。 大きな配列を形成する連続した複数の小さな配列は、同一配列の複製または異な るDNAフラグメントの試料のいずれかを表現する。プローブの普遍的セットは 、所定の精度、例えば各塩基対を読み取ることの冗長性についての精度を持って 任意のDNAフラグメントを分析するのに十分なプローブからなる。これらのセ ットは、ある特定のフラグメントに対して必要以上の数であり、一方で異なるシ ークエンスの数千のDNA試料を試験するのに必要とされる数以下のプローブを 含むものであってもよい。 DNAまたは形質の同定および診断用の塩基配列決定プロセスは、 1)複数の小さな配列の各々に対してハイブリダイズする専用のセット、典型的 セット、あるいは普遍的セットからプローブのサブセットを選択するステップと 、 2)平行して分析される配列の各々の上の各サブ配列に第一のプローブを添加す るステップと、 3)ハイブリダイゼーションを実施し、該ハイブリダイゼーションの結果を判定 するステップと、 4)先に使用したプローブを取り除き、判定に使用される他の残りのプローブを 繰り返すステップと、 5)最終分析を得るために、またはハイブリダイゼーションされる追加のプロー ブを決定するために、得られた結果を処理するステップと、 6)一定のサブ配列に関してさらにハイブリダイゼーションを行うステップと、 7)データの完全なセットを処理し、最終分析を得る計算を行うステップとを有 する。 本発明は、一つのタイプの僅かな数の核酸試料の同定および配列決定をすばや く行う上での問題点、およびサブ配列のかたちにある支持体に付着した試料と処 理しやすい大きさのプローブの前もって合成されたセットを使うことによって行 われる平行分析での問題点を解決する。DNAの同一性の判断、DNA診断、お よび突然変異体の同定のための効率的で、かつ汎用的なプロセスを作るために、 2つのアプローチを組み合わせた。既知 のシークエンスを同定するために、短いプローブの小さなセットを、長い独特の プローブの代わりに用いることができる。この場合、より一層多くのプローブを 判定する。しかし、プローブの普遍的セットを合成して、どのようなタイプのシ ークエンスでもカバーできるようにする。例えば、6量体または7量体の完全セ ットは、それぞれ4,096および16,384プローブである。 DNAフラグメントの完全な塩基配列決定は2つの段階を含む。第1の段階は 、少なくとも1回はすべての塩基をカバーするプローブの十分なセットのハイブ リダイゼーションである。この目的のために、標準試料に対してプローブの特定 セットを合成する。このハイブリダイゼーションデータは、非標準試料で変異( 違い)が生じたかどうか、またどこに生じたかを明らかにする。変化の同一性を 判断するために、追加の特異的プローブを試料にハイブリダイズする。他の実施 態様では、普遍的セットのすべてのプローブを判定する。 プローブの普遍的セットは、許容できない時間の浪費をすることなく2ステッ ププロセスでもって、試料あたり相対的に少ない数のプローブの判定を可能とす る。ハイブリダイゼーションプロセスは最初にハイブリダイズするプローブの最 適セットをコンピュータ処理する第1ステップと、得られた結果にもとづいて、 存在する普遍的セットのプローブから判定する追加のプローブを定める第2のス テップとにおける連続的なプロービングを含む。 試料配列の一配列を使うことで、単一試料上の、あるいは試料の小さなセット 上の多くのオリゴヌクレオチドを連続的に判定することが回避される。このこと は、一つの物理的対象物のみを操作することによって平行して多くのプローブの 判定が可能となる。プローブの普遍的セットによって形成されたサブ配列の利用 と4段階ハイブリダイゼーションプロセスとの組み合わせによって、長さが10 00塩基対のDNA試料の塩基配列決定が相対的に短時間で行える。もし試料が 一つの配列に対して50のサブ配列でスポットされるならば、配列は10回再分 析されて、500プローブ が判定される。このプローブ数はかなり満足できるものである。突然変異の発生 に関するスクリーニングでは、各塩基を3回カバーするのに約335プローブが 使用される。もし突然変異が存在しているならば、いくつかのカバーしているプ ローブが影響を及ぼされるであろう。それらのネガティブなプローブは2塩基精 度で突然変異をマッピングする。この精度でマッピングされた単一塩基突然変異 を解決するために、さらに15プローブを追加で使用する。これらのプローブは 、2つの疑わしい位置(欠失および挿入は含まれないと仮定する)に対する任意 の塩基組み合わせをカバーする。これらのプローブは、1回のサイクルで与えら れた試料が含まれる50のサブ配列上で判定される。多重標識カラー・スキーム (多重化)を実施する際、異なる蛍光色素によって標識された2ないし6のプロ ーブがプールとして使用され、それによってハイブリダイゼーション・サイクル 数を少なくし、また配列決定プロセスを短くする。 より一層複雑なケースでは、2つの近接した突然変異または挿入が存在する。 例えば、3塩基挿入は64プローブで解明される。もっとも複雑なケースは、数 段階のハイブリダイゼーションによって取り組まれるもので、先のハイブリダイ ゼーションの結果にもとづいてプローブの新しいセットを選択する。 サブ配列が一つのタイプの数十または数百の試料からなる場合、それらのうち のいくつかには、1つの以上の変化(突然変異、挿入、または欠失)が含まれよ う。変異が生ずる各セグメントについて、プローブの特定のセットが判定される 。試料のタイプについて判定されるプローブの全数は、数百程度である。平行に 複製配列を判定することによって、相対的に少ないサイクル数で数百のプローブ を判定することが可能となる。さらに、互換性のあるプローブをプールしてもよ い。ポジティブなハイブリダイゼーションを、特定のDNAセグメントをチェッ クするために選択されたプローブに割り当てる。なぜなら、これらのセグメント は構成塩基の75%が通常は異なる。 長いプローブの大きなセットを用いることによって、長いターゲットを うまい具合に分析できる。それらのターゲットは、エクソン・クローン等の短い フラグメントのプールを表す。 必要なプローブの数を少なくする多段階アプローチでは、倍数染色体の組から シークエンスされるゲノムのセグメントにおけるヘテロ接合体の存在を規定する 特定のハイブリダイゼーション判定法が用いられる。2つの可能性がある。すな わち、 i)1つの染色体由来のシークエンスは塩基のタイプを表し、また他方の染色体 由来のシークエンスは新しい変異を表す、あるいはii)両方の染色体とも新し い、しかし異なる変異を含む。第一のケースでは、マッピングを変えるように意 図された走査ステップによって、ヘテロ接合位置で2倍の最大シグナル差が与え られる。第2のケースでは、マスキングが無く、ハイブリダイゼーションの連続 するラウンドに対してプローブの選択をより完全なものとすることが要求される 。 第1のケースで必要とされる2倍シグナル差の判定は、対応シグナルを基本シ ークエンス型のみを含む対照群および他の分析された試料由来のシグナルと比較 することによって効率よく達成される。このアプローチによって、与えられた試 料の各特定のプローブに対するハイブリダイゼーションシグナルでの相対的減少 の決定が可能となる。このことは重要である。なぜなら、ハイブリダイゼーショ ン効率は、完全に一致するターゲットを持つ異なるDNAフラグメントとハイブ リダイズした特定のプローブの2倍以上に変わる。さらに、ヘテロ接合部位は、 オリゴヌクレオチド・プローブの数に応じて一つ以上のプローブに対して影響を 及ぼす。2ないし4の連続プローブのシグナルが減少することによって、ヘテロ 接合部位のより一層顕著な同定がなされる。このことは、不適正含有二重鎖から 来るシグナルよりも平均して8倍強い1つまたは僅かのプローブが完全に一致す るシグナルを与えると考えられる選択されたプローブの小さなセットによってチ ェックされる。 仕切られた膜によって、任意のタイプを表し、かつ相対的に数の多い試料に対 応する実験、あるいは少数の試料によって表される数多くの異なる タイプに対応する実験を非常に柔軟に構成することが可能となる。4ないし25 6試料の範囲を個々に効率よく取り扱うことができる。この範囲の数のドットの 中にあるサブ配列は、オリゴヌクレオチドを保存し、かつ標識する標準的な多穴 プレートの構成および大きさに一致するように設計されている。サブ配列の大き さを異なる数の試料に適合するようにするか、もしくはいくつかの標準的な順配 列の大きさを用いることもできる。さらに、各サブ配列に対して複製の数を設定 することによって、同定または塩基配列決定のプロセスを完了するまでの時間が 変わる。 発明の詳細な説明 実施例1 プローブの普遍的セットの調製 2種類のプローブの普遍的セット(universal set)を調製する。その第1の ものは、比較的短いプローブの完全なセット(あるいは、少なくとも非相補的サ ブセット)である。例えば、全4096(または、約2000の非相補的)6量 体であるか、あるいは全16,384(または、約8,000の非相補的)7量 体である。8量体の完全な非相補的サブセットまたはそれより長いプローブは、 それらが32,000以上のプローブを含むので、あまり簡便ではない。 プローブのセットの第2の種類は、少なくとも1個のプローブを有するあらゆ るシークエンスの全ての塩基対(bp)を読みとるのにさらに十分なプローブの 小さなサブセットとして選ばれる。例えば、16の2量体のうちの12が充分で ある。二重鎖DNAの塩基配列決定を行うための7量体、8量体および9量体の 小さなサブセットは、それぞれ、約3000、10,000および30,000 プローブである。 プローブは、標準的な化学を用いて、1〜3個の特定されていない(A、T、 CおよびGの混合)または普遍的(例えば、M塩基、イノシン)な塩 基を末端に用いて調製される。放射線標識化が用いられる場合には、プローブは、 放射線標識された亜リン酸基によってキナーゼ処理(kinasing)するために5′ −末端にOH基を有していてもよい。あるいはまた、蛍光染料で標識されたプロ ーブを用いてもよい。さらに、PNA(蛋白質核酸)等の他の種類のプローブ、 あるいは二本鎖の安定性(duplex stability)を変化させる修飾された塩基を含有 するプローブを使用してもよい。 プローブは、バーコードの付いた多穴プレートに保存される。少数のプローブ では、96穴のプレートを用いてもよく、10,000以上のプローブでは、3 84穴または864穴のプレートに保存することが好ましい。5〜50枚のプレ ートのスタックは、全てのプローブを保存するのに充分である。1つのDNA試 料とのハイブリッドには約5pgのプローブで充分である。したがって、プロー ブ当たり約50μgという小さな合成から、1000万の試料が分析可能となる 。各プローブが第3の試料毎に用いられる場合、および各試料が1000bpの 長さである場合には、3000以上の塩基(10ヒトゲノム)が1セットの5, 000種のプローブにより配列決定される。 実施例2 DNA試料の調製 DNAフラグメントは、M13、プラスミドまたはラムダベクターにおけるク ローンのように調製してもよく、および/または、ゲノムDNAまたはcDNA からPCRまたは他の複製方法により直接調製してもよい。試料は、多穴プレー トに調製または分配(dispense)される。約100〜1000ngのDNA試料は 、最終体積2〜500μlに調製される。 実施例3 DNAの配列(arrrays)の調製 配列は、DNA試料をナイロン膜等の支持体上にスポットすることにより調製 される。スポッティングは、金属ピンの配列(その位置は、マイクロタイタープ レートの穴の配列に対応する)を用いて行い、約20nlのDNA溶液がナイロ ン膜への移動により繰り返されてもよい。オフセット印刷により、上記穴の密度 よりも高いドット密度が達成される。用いられる標識の種類に応じて、1mm2 に1〜25ドットが収容可能である。幾つかの予め選ばれた数の列行(rows and columns)へのスポットを回避するために、別のサブセット(サブ配列(subarrays ))を形成してもよい。1つのサブ配列中の試料は、異なる個体からの同一のD NAのゲノムセグメント(または同一の遺伝子)であってもよく、あるいは異な る重複ゲノミッククローンであってもよい。上記サブ配列の各々は、同一の試料 のレプリカ・スポッティングを示す。1つの実施例において、1つの遺伝子セグ メントは、64人の患者から増幅される。各患者に対して、増幅された遺伝子セ グメントは、1枚の96穴プレート(96穴の全部が同一の試料を含有する)で あってもよい。64人の患者の各々に対して1枚のプレートを調製する。96ピ ンの装置を用いることにより、全ての試料は、1枚の8×12cmの膜上にスポ ットされる。サブ配列は、64の試料(すなわち、各患者から1試料)を含む。 96のサブ配列が同一である場合、ドットのスパンは1mm2であり、サブ配列 間には1mmの間隔があいている。 もう1つのアプローチは、物理的スペーサー(例えば、膜全面にわたって成形 されているプラスチック製グリッドであり、該グリッドは、多穴プレートの底部 に適用される膜の種類と類似している)あるいは疎水性のストリップで区切られ ていてもよい膜またはプレート(NUNC社(Naperville,Illinois)より入手可 能)を用いることである。固定された物理的スペーサーは、平坦な蛍光体−保存 スクリーン(phosphor-storage screen)またはX線フィルムに露光することによ る画像形成には好ましくない。 実施例4 プローブの選択およびラベリング サブ配列の1つの配列が得られたら、各サブ配列に対する各ハイブリダイゼー ション・サイクルでハイブリッドすべきプローブのセットを決定する。実施例3 の試料では、普遍的セットから384プローブの1セットが選ばれ、96のプロ ーブ化がそれぞれ4サイクルで行われる。1つのサイクルにおいてハイブリダイ ズするのに選ばれるプローブは、同様のG+C含量を有する。 各サイクルに対して選ばれたプローブは、96穴プレートへ移され、次いで、 それらが標識されていない場合には、保存する前に、キナーゼ処理(kinasing)ま たは他の標識化操作により(例えば安定な蛍光染料で)標識する。 第1ラウンドのハイブリダイゼーションに基づいて、さらなるサイクルのため のサブ配列の各々に対して新たな1セットのプローブが決定される。配列の幾つ かは、サイクルのどれかにおいて用いなくてもよい。例えば、64人の患者試料 のうち、わずか8人だけ突然変異を示し、かつ各突然変異に対して8つのプロー ブが最初に判定される(scored)場合には、全64のプローブが1つのサイクルで 判定され、かつ32のサブ配列は使用されない。これらのサブ配列は、次いでハ イブリダイゼーション用用緩衝液で処理されて、フィルタの乾燥を防止する。 プローブは、あらゆる簡便なアプローチにより保存プレートから回収され、そ のようなアプローチとしては、シングルチャンネル・ピペッティング装置、また は Beckman Biomek 1000(Beckman Instruments社、Fullerton,California) やMega Two robot(Megamation社、Lawrenceville,New York)ロボット・ステ ーションが挙げられる。ロボット・ステーションには、データ解析プログラムお よびプローブ管理プログラムをセットみ込んでもよい。これらのプログラムの出 力は、1つ以上のロボット・ステーションでの入力であってもよい。 プローブは、1つずつ回収され、ハイブリダイゼーション・用緩衝液に より覆われるサブ配列に添加される。回収したプローブは、新たなプレートに入 れて、標識するか、あるいはハイブリダイゼーション・用緩衝液と混合すること が好ましい。回収の好ましい方法は、保存したプレートを1枚ずつアクセスして 、各選択したプローブの充分量を各プレートから中間プレートの特定の穴へピペ ッティングすること(または、金属ピンにより移すこと)によるものである。個 別にアドレッシング可能なピペットまたはピンの配列を用いて、回収ステップを スピードアップしてもよい。 実施例5 ハイブリダイゼーションおよび判定方法 標識化したプローブは、ハイブリダイゼーション・用緩衝液と混合し、優先的 にマルチチャンネル・ピペットによりサブ配列へ移す。(膜に刷り込まれた疎水 性ストリップまたは物理的バリアが全く存在しない場合に)サブ配列間でのプロ ーブの混合を防止するために、対応するプラスチック、金属またはセラミック製 のグリッドを膜にしっかりと押し圧してもよい。さらに、用緩衝液の体積は、m m2当たり約1μl以下に低減してもよい。用いられるプローブの濃度およびハ イブリダイゼーションの条件は、洗浄用緩衝液をサブ配列の配列に素早く注いで プローブを速く希釈させて、著しいクロス・ハイブリダイゼーションを防止する 以外は、先述したとおりでよい。同じ理由により、プローブの最小濃度が用いら れ、ハイブリダイゼーションの時間が最大の実用レベルまで延長される。DNA 検出および塩基配列決定では、「正常なシークエンス」を知っていることは、連 続的な積み重ね相互作用現象(continuous stacking interaction phenomenon)を 用いてシグナルを増加させることを可能にする。標識されたプローブに加えて、 ラベルされたものと背中合わせにハイブリッドする追加の標識されていないプロ ーブを、ハイブリダイゼーション反応に添加する。ハイブリッドの量は数回増加 させてもよい。プローブはライゲーションにより連結する。このアプローチは、 「圧縮(compressions)」を形成するDNA領 域を分解(resolving)するのに重要である。 放射線標識したプローブの場合、 フィルタのイメージは、好ましくは蛍リン光体保存技術(phosphorstorage techn ology)により得られる。蛍光標識は、CCDカメラ、共焦顕微鏡法等により判定 される。未処理のシグナルは、各ドットにおけるターゲットの量に基づいて、適 切な尺度および異なるハイブリダイゼーション実験からの積分データへと標準化 される。ドット当たりのターゲットDNAの量の差は、各プローブの個々のシグ ナルに対して、1個のドットについて判定される全てのプローブに対する平均シ グナルにより補正される。また、標準化されたシグナルを測定して(通常は1〜 100)、別の実験からのデータと比較する。また、各サブ配列においては、幾 つかのコントロールDNAを用いて、完全適合ターゲット(full match target) を含有しない試料における平均的バックグラウンド・シグナルを求めてもよい。 さらに、2倍体(倍数体)の判定(score)から得られる試料では、ホモ接合体の 調節を用いて、試料中のヘテロ接合体の認識を可能にしてもよい。 実施例6 特徴−判定結果のわかっている突然変異 または完全遺伝子の塩基配列再決定 単純な場合とは、幾つかの公知の突然変異がDNAセグメント内で起こるか否 かを発見することである。12未満のプローブがこの目的を満足させ、例えば、 1つの対立遺伝子に対して正である5つのプローブ、もう一方に対して正である 5つ、および両方に対して負である2つが挙げられる。試料当たり少数のプロー ブが判定されるので、多数の試料が並行して分析される。例えば、3つのハイブ リダイゼーション・サイクルにおいて12プローブを用いて、64人の患者から の96の異なるゲノム遺伝子座または遺伝子セグメントが、12×24のサブ配 列(それぞれが、64人の患者からの同一のDNAセグメントを示す64のドッ トを有する)を含有する1枚の6×9インチの膜の上で分析される。この例にお いて、試料は、 64枚の96穴プレートで調製される。各プレートは1人の患者を示し、各穴は 、分析すべきDNAセグメントの1つを示す。64人の患者からの試料は、同一 の膜の4分の4として4つのレプリカでスポットされる。 1セットの12プローブは、シングル・チャンネル・ピペッティングまたはシ ングル・ピン移動装置(あるいは、個別に調節されたピペットまたはピンの配列 )により、96セグメントの各々に対して選択され、12枚の96穴プレートに 再度並べられる。プローブは、保存される前に予め標識されていない場合には、 標識化され、4枚のプレートからのプローブはハイブリダイゼーション・用緩衝 液と混合し、好ましくは96チャンネル・ピペッティング装置によりサブ配列に 添加する。1つのハイブリダイゼーション・サイクルの後で、37℃〜55℃で 、かつ好ましくは蒸留されていないハイブリダイゼーション・用緩衝液または洗 浄緩衝液中で膜をインキュベートすることにより、前に用いられたプローブを除 去することが可能である。 1つの対立遺伝子に対して正であるプローブが正であり、他方の対立遺伝子に 対して正であるプローブが負である可能性を用いて、その2つの対立遺伝子のど ちらが存在するかを決定する。この冗長な判定方法では、各プローブのハイブリ ダイゼーションにおける或るレベル(約10%)のエラーが許容される。 殆どの対立遺伝子を判定するために、特に同様の冗長性(redundancy)が十分で ある場合、プローブの不完全なセットを用い、例えば、試料中に2つの対立遺伝 子の一方が存在するか存在しないかを明らかにする1つまたは2つのプローブが 挙げられる。例えば、4000の8量体の1セットを用いた場合、ランダムに選 ばれた座の2つの対立遺伝子の一方に対する少なくとも1つの正のプローブを見 つける可能性が91%ある。プローブの不完全なセットは、分析される試料にお けるG+C含量および他の偏り(biases)を反映するように最適化される。 完全な遺伝子シークエンスでは、遺伝子は、適当数のセグメントに増幅される 。各セグメントに対して、1セットのプローブ(2〜4塩基当たり 約1プローブ)を選択してハイブリッドする。これらのプローブは、分析される セグメントのどこかに突然変異があるか否かを同定する。1つ以上の突然変異部 位が検出されるセグメント(すなわち、これらのセグメントを含有するサブ配列 )は、別のプローブとハイブリッドして、突然変異の起こっている部位における 正確な配列を見つける。DNA試料が第2の6量体毎に試験され、かつ突然変異 が、正にハイブリッドされたプローブであるTGCAAAおよびTATTCCに より包囲され、3つの負のプローブであるCAAAAC、AAACTAおよびA CTATTにより被覆されている場所に局在する場合には、突然変異が起こって いるヌクレオチドは、単一の塩基の突然変異により、あるいは1つまたは2つの ヌクレオチド欠損および/または塩基AA、ACまたはCTの間での挿入により 改変(change)されていなければならない。 1つのアプローチは、1つのプローブに対して正にハイブリッドされたプロー ブであるTGCAAAを右へ延長し、かつ1つのヌクレオチドのプローブTAT TCCを左へ延長するプローブを選択することである。これらの8つのプローブ (GCAAAA、GCAAAT、GCAAAC、GCAAAGおよびATATT C、TTATTC、CTATTC、GTATTC)を用いて、2つの問題となる ヌクレオチドが決定される。 突然変異について最も可能性のある仮定を決定する。例えば、AはGへ突然片 影することがわかっている。これらの結果を満足する解答が2つある。AをGで 置き換えることが唯一の改変であるか、あるいは、その改変に加えて、さらに、 新たに決定されたGと次のCとの間に数個の塩基が挿入されることである。橋か けプローブ(bridging probes)を用いた結果が負である場合、これらの選択肢は 、まず最初に、突然変異が起こっている位置(AAGCTA)を含有し、かつ、 さらに8つのプローブ(CAAAGA、CAAAGT、CAAAGC、CAAA GGおよびACTATT、TCTATT、CCTATT、GCTATT)を有す る少なくとも1つの橋かけプローブによりチェックされる。突然変異を解明する プローブを選択する方法は、他にも多くある。 二倍体の場合、試験試料およびホモ接合体の調節の判定の特定の比較を行って 、ヘテロ接合体の同定を行う(上記参照)。幾つかの連続したプローブは、これ らのプローブにより被覆されたセグメントが2つの染色体の一方の上で突然変異 を起こしている場合には、およそ2倍の類似したシグナルを有することが予期さ れる。 実施例7 遺伝子疾患または他の形質に関係する遺伝子(突然変異体)の同定 ここに開示される塩基配列決定のプロセスは、塩基あたりのコストが大変低く い。また、長いプローブ(8量体または9量体)のより大きな普遍的セットを用 いることによって、5〜20kbほどの長さのDNAフラグメントをサブクロー ン化することなくシークエンスする。さらに、再びシークエンスする際の速度は 、約1000万塩基/日/ハイブリダイゼーション機器である。このような特性 によって、科学的または医学的に興味ある個体から繰り返してヒト遺伝子または ヒト・ゲノムの大きな分画を再シークエンスすることが可能となる。ヒト遺伝子 の50%再シークエンスするために、約1000万塩基対を調べる。このことは 手頃な価格で、かつ相対的に短い時間で行うことができる。 この際、極めて優れた再シークエンシング能を、突然変異の同定、および(ま たは)疾患または任意の形質をコード化する遺伝子の同定を行う幾通りかの方法 で使用することができる。基本的には、所定の疾患を持つ患者の所定組織由来の mRNA(cDNAに変換してもよい)またはゲノムDNAを出発材料として用 いる。これら両方のDNA源から、適当な長さの分離遺伝子またはゲノム・フラ グメントをクローニング法またはin vitroでの増幅法(例えば、PCRによって 調製する。もし、クローニングを用いるならば、シークエンシングに先だって分 析すべき最小セットのクローンがライブラリから選択される。このことは、特に 5塩基を越える長さの少ない数のクローンがソートされる場合、少ない数のプロ ーブのハイブリ ダイゼーションによって効率よく行うことができる。クローニングは、ハイブリ ダイゼーションデータの量を約2倍にするが、幾万ものPCRプライマーを要求 することはない。 方法の一変形例として、遺伝子またはゲノムフラグメントをHgI等の制限酵 素でもって切断することによって調製することもできる。ここでHgIはDNA を以下のようにして切断する。すなわち、 GACGC(N5’)/GTGCG (N10’)。フラグメントが異なれば5塩基の突出した末端も異なる。一つの 酵素である数の遺伝子に関して適当なフラグメントが産生される。cDNAまた はゲノムDNAを別々の反応でもっていくつかの酵素で切断することによって、 目的とする各々の遺伝子を適切に切り取ることができる。一つのアプローチでは 、切断DNAを大きさによって分画する。この方法(および3’末端からヌクレ オチドを別々に除去し、該末端の長さおよび特異性を増加させるエクソヌクレア ーゼIIIによって任意に処理すること)によって調製されたDNAフラグメン トを試験管または多穴プレートに分ける。共通部分と適当な長さの可変突出末端 とを持つDNAアダプタの相対的に小さなセットから、増幅を必要とする遺伝子 フラグメントごとに一対のアダプタを選択する。これらのアダプタをリゲーショ ンし、さらに普遍的なプライマーによってPCRを実行する。1000アダプタ から百万対が生じ、それによってアダプタの共通末端に対する相補性を有するプ ライマの普遍的対による同一条件下で百万の異なったフラグメントが特異的に増 幅される。 何人かの患者で繰り返してDNAの違いが見つかり、さらにそのシークエンス の変化がナンセンス変異であるか、もしくは対応するタンパク質の機能を変える ことができるものであるならば、変異した遺伝子は疾患に関与するものであると 考えられる。任意の形質を持つ顕著な数の個体を分析することによって、特定の 遺伝子の機能的対立遺伝子変異が特定の形質によって対応づけられよう。 この方法は、広範囲にわたる系図上で非常に高価な遺伝子マッピングの必要性 を取り除き、さらにそのような遺伝子データまたは材料がない場合 は特別の価値を持つ。 実施例8 遺伝子マッピングにおける単一核酸多型現象の判定 この出願に開示された技術は、単一核酸多型現象(SNUP)を持つ遺伝子フ ラグメントの効率的な同定にとって適当である。クローニングによって、あるい はin vitro 増幅によって増幅される多数の既知遺伝子フラグメント上において 上記シークエンシング方法を適用することによる10個体中で、SNUPを有す る十分な数のDNAフラグメントが同定される。多型フラグメントをSNUPマ ーカーとしてさらに利用する。これらのマーカーを事前にマッピング(例えば、 マッピングされたSTSを表す)するか、あるいは以下に記載したようなスクリ ーニング法によってマッピングする。 マーカーを増幅し、かつそれをサブ配列の配列として配置することによって、 SNUPを関連した系統群または個体群由来の個々の個体で判定する。サブ配列 には、分析された個体から増幅された同一マーカーが含まれる。各マーカーにつ いて、既知の突然変異体を診断する場合のように、一つの形質に対してポジティ ブな6以下のプローブと他の形質に対してポジティブな6以下のプローブとのセ ットを選択して判定する。疾患によって一つまたは一群のマーカーが顕著に解離 することから、関与する遺伝子の染色体上の位置が決定される。高スループット および低コストであることから、数千もの個体対して数千ものマーカーが判定さ れる。 このデータ量によって、多遺伝子性の疾患に含まれる遺伝子の位置決めと同様 に、百万塩基対よりも少ない分析能で遺伝子の位置決めを行うことが可能となる 。位置決めされた遺伝子は、関連する正常個体および影響を受けた個体から特定 の領域をシークエンシングし、変異体を判定する。 PCRはゲノムDNAからマーカーを増幅するのに好適である。各々のマーカ ーはプライマーの所定の対を必要とする。存在するマーカーはコン パーチブルであるか、もしくはHgI型制限酵素によってゲノムDNAを切断す ることによって、また実施例7に記載した一対のアダプタとのリゲーションによ って調製される新しいマーカーを定めてもよい。 SNUPマーカーを増幅したり、あるいはプールとしてスポッティングされる ことによって、独立した増幅反応の数を少なくする。この場合、一試料あたりよ り多くのプローブが判定される。4つのマーカーがプールされ、かつ12枚の複 製膜上でスポッティングされる場合、48プローブ(マーカーあたり12)が4 サイクルで判定される。 実施例9 DNAフラグメントの同一性の検出および検証 制限酵素による切断、クローニング、またはin vitro 増幅(例として、PC R)で生じたDNAフラグメントは、しばしば実験によって同定される。同定は 、ゲル電気泳動上で特定の大きさのDNAバンドの存在を確認することによって 行われる。あるいは、特定のオリゴヌクレオチドを合成し、ハイブリダイゼーシ ョン法によって問題となるDNA試料を確認する。ここで開発した方法によれば 、各フラグメントに対して特定のオリゴヌクレオチドを調製することなく大量の 試料を効率良く同定することが可能となる。既知のシークエンスにもとづいて各 フラグメントに対する普遍的セットからポジティブおよびネガティブなプローブ のセットを選択する。ポジティブなものとして選択されたプローブは、通常は1 または僅かな重なり合った群を形成することができ、さらにネガティブなプロー ブは挿入全体に分散される。 この技術は、STSをYACクローン上にマッピングするプロセスにおいてS TSの同定を行うために使用される。STSの各々を、約100のYACクロー ン上で、あるいはYACクローンのプール上で試験する。これら100の反応由 来のDNAをできる限り一つのサブ配列にスポッティングする。異なるSTSは 、連続したサブ配列を表す。いくつかのハイブ リダイゼーション・サイクルでは、各々のDNA試料に対してサインが生じる。 このサインによって必要な信頼度をもって任意のYACクローンにおける所定の STSの存在が認められるか、もしくは認められない。 互いに独立したPCR 反応の数またはスポッティング用のそれぞれ独立した試料の数を減少させるため に、いくつかのSTSを一つの反応で同時に増幅させか、もしくはPCR試料を それぞれ混合する。この場合、一つのドットあたり多くのプローブが判定されな ければならない。STSのプーリングはYACのプーリングから独立したもので あり、単一YACまたはYACのプール上で使用される。このスキームは、異な る色でいくつかのプローブが標識されている場合、特に関心がよせられる。 試料中にDNAフラグメントが存在することを裏付けることに加えて、いくつ かの分離したプローブまたはプローブの1以上のプールのハイブリダイゼーショ ンの強度を用いることによってDNAの量を評価する。既知のDNA量を持つ対 照群の試料に対する強度と得られた強度とを比較することによって、全てのスポ ッティングされた試料に含まれるDNA量を同時に決定する。わずかなプローブ のみがDNAフラグメントの同定に必要であり、また長さがN塩基のDNAに使 用されるN個の推定プローブが存在することから、この利用例では任意のDNA フラグメントの同定に十分な大量のプローブを必要としない。1,000の8量 体から、平均して約30の完全に一致したプローブが100塩基対のフラグメン トに対して選択される。 実施例10 伝染病微生物およびその変異株の同定 患者の体内に宿うウイルス、細菌、真菌、および他の寄生微生物を検出するた めのDNAにもとづく試験は、一般により信頼性が高く、かつ代用のものよりも コストが低い。DNA試験の主に優れた点は、特定の下部および突然変異体を同 定することを可能にするという点であり、また最終的 にはより有効な治療を施すことを可能にするという点である。以下、2通りの利 用例を説明する。 細菌感染に存在する12の既知の抗生物質耐性遺伝子を、該遺伝子の増幅によ って試験する。128人の患者から得た増幅産物を2つのサブ配列にスポッティ ングし、つづいて12の遺伝子に対して24のサブ配列を8x12cm膜上で四 回繰り返した。各遺伝子に対して、12プローブをポジティブおよびネガティブ 判定用に選択する。3サイクルでハイブリダイゼーションを行う。これらの試験 に対して、実施例9の試験の場合のように、1,000のポジティブ・プローブ から、平均して30のプローブが1000塩基対フラグメントでポジティブであ り、さらに10のポジティブ・プローブが信頼性の高い同定に対して一般に足り うる。実施例9に記載したように、いくつかの遺伝子を増幅したり、および(ま たは)一緒にスポッティングし、さらに任意のDNAの量を決定する。増幅され た遺伝子の量は、感染の度合いを示すインジケータとして用いることができる。 他の実施例には、HIVウイルスの一つの遺伝子あるいはゲノム全体を推定ス クリーニングことが含まれる。急激な多様化のため、ウィルスは最適な治療の選 択に対して数多くの困難性を与える。DNAフラグメントは、64人までの患者 から単離されたあウィルスから増幅される。得られた配列にもとづいて、最適な 治療が選択される。もし一方が基本的なシークエンス(ヘテロ接合体の場合に類 似)である2種類のウィルス型の混合物が存在するならば、突然変異体はそれ自 身のハイブリダイゼーション判定を、他の試料、特に基本的なウイルス型のみを 含む対照群の判定と量的に比較することによって同定される。試料に含まれる2 種類のウィルス型(上記を見よ)の一つで変異した部位をカバーする3ないし4 のプローブに対して二倍小さい判定が得られる。 実施例11 法医学および親の同定への応用 シークエンス多型現象は、個々のゲノムDNAをユニークなものにする。この ことは、犯罪現場からの血液、または他の体液または組織を分析し、さらに犯罪 容疑者の試料とを比較することを可能とさせる。試料のユニークなサイン(signa ture)を作るために十分な数からなる多型部位が判定される。SBHは容易に単 一ヌクレオチド多様性を判定してそのようなサインを生産する。 DNAフラグメント(10〜1000)のセットは、試料および容疑者から増 幅される。1つのフラグメントを示す試料由来のDNAおよび容疑者由来のDN Aを、一つまたはいくつかのサブ配列にスポッティングし、さらに各サブ配列を 4回複製する。3つのサイクルでは、12のプローブによって、各DNA遺伝子 座に対して、容疑者等の各試料にある形質AまたはBの存在が決定される。試料 のパターンと容疑者のパターンとを一致させることは、犯罪に係わった容疑者の 発見につながる。 同様の方法が子供の親であるかの証明にも応用できる。DNAを調製し、子供 および成人から増幅させた多型性遺伝子座;AまたはB形質のパターンを各々に 対するハイブリダイゼーション法によって決定する。ポジティブおよびネガティ ブな対照群に沿って得られたパターンを比較することによって、家族関係の判断 に役立つ。この場合、同定のために形質の顕著な部分のみが一人の親に一致する 必要がある。多くの判定された遺伝子によって、方法における統計学的なエラー をさけたり、de novo突然変異の効果をマスクすることが可能となる。 実施例12 個体群または種の遺伝的多様性と生態学的ニッチの生物学的多様性の分析 有意な数の遺伝子座(例えば、いくつかの遺伝子またはミトコンドリアDNA 全体)上の対立遺伝子変異の頻度を測定することによって、遺伝子型に対する環 境の影響に関する結論、個体群の歴史および進化あるいは病 気や絶滅に対するその感受性などの異なるタイプの結論を発展させることが可能 となる。これらの評価は、既知の特定形質を試験することによって、あるいは申 し分ない変異あるいは環境における突然変異誘発要因の存在を示すde novo突然 変異を定めることが可能ないくつかの遺伝子座を完全に再シークエンスすること によって行われる。 さらに、微生物の世界での生物学的多様性は、進化的に保存されたDNAシー クエンス、例えばリボゾームRNAの遺伝子あるいは高度に保存されたタンパク 質の遺伝子を再シークエンスすることによって調べられる。DNAは環境および 保存されたシークエンスに対応するプライマーを用いて増幅された特定の遺伝子 から調製される。DNAフラグメントは優先的にプラスミド・ベクター内にクロ ーン化される(あるいは多穴プレートにおいて一穴あたり一分子の濃度に希釈し 、in vivoで増幅する)。このようにして調製したクローンをすでに述べたよう にして再シークエンスする。2種類の情報が得られる。第1は、異なる種のカタ ログを各種の個体の多様性と同様に定義することができる。別の種類の情報は生 態学的要因または生態系に対する汚染の影響を測定するのに使用することができ る。それは、いくつかの種は根絶されるかどうか、あるいは種間の存在比率は汚 染によって変わるかどうかを明らかにするかもしれない。また、方法は化石から のDNAをシークエンスするのに利用できる。 実施例13 DNAの塩基配列決定(シークエンシング) 複数のサブ配列のうちの一つの配列によって、複製されたサブ配列のかたちで 配列された試料の小セットの効率よいシークエンシングが可能となる。例えば、 64個の試料を8x8サブ配列に配列し、16x24サブ配列を5x23cmの 膜上に複製する。この際、サブ配列間に1mm幅のスペーサが設けられている。 複製の膜をいくつか作る。例えば、3,072 の7量体の普遍的セットからのプローブを32枚の96穴プレートに分けて、キ ナーゼ処理によって標識する。ハイブリダイゼーション・サイクルの間、平行し て4枚の膜を処理する。各膜に対して、384のプローブを判定する。すべての プローブが2回のハイブリダイゼーション・サイクル中に判定される。ハイブリ ダイゼーション強度を判定し、以下のようにしてシークエンスが組み立てれられ る。 もし単一試料のサブ配列または複数のサブ配列がいくつかの未知なものを含む ならば、特に類似の試料が用いられる場合、前に判定されたプローブの結果にも とづいてインテリジェントに選択されるものならば少数のプローブで十分である 。例えば、もしプローブAAAAAAAがポジティブではないならば、8個のオ ーバーラッピング・プローブのいずれかがポジティブである可能性は少ない。も しAAAAAAAはポジティブならば、2つのプローブは通常ポジティブである 。この場合のシークエンシング・プロセスは、まずはじめに、ポジティブ・アン カーを定義し、つぎに連続してプローブを選択するために最小限にオーバーラッ プされたプローブのサブセットにハイブリダイズするもので、アンカーのオーダ とアンカー間のギャップの大きさおよびタイプとについてもっとも見込みのある 仮説の一つを立証する。これの第2のフェーズでは、2〜10のプローブのプー ルを使用する。各プローブは一つのDNA試料においてポジティブとなるように 選択されるとともに、このDNA試料はプールの他のプローブによってポジティ ブであると予想される試料とは異なるものである。 サブ配列によるアプローチは、多岐にわたる問題点を解決するという点でプロ ーブの競合(オーバーラップしたプローブ)またはプローブの協同の効率的な実 施を可能とする。プローブの普遍的セットのハイブリダイゼーションの後に、シ ークエンス・アセンブリ・プログラムは候補となるシークエンスのサブフラグメ ント(SF)を決定する。SFをさらにアセンブルするために、追加の情報が提 供されなければならない(DNAフラグメントのオーバーラップしたシークエン ス、類似のシークエンス、単一のパス・ゲル・シークエンスから、または他のハ イブリダイゼーションまた は制限マッピング・データから)。SFアセンブリに対して競合的ハイブリダイ ゼーションおよび連続的な積み重ね相互作用が提案されている。これらのアプロ ーチは、均一な配列を用いた場合に付けられた試料に対して標識プローブが適用 されるSBHによる大量の試料のシークエンシングについて実用的価値に限界が ある。幸運にも、複製サブ配列を用いる少数の試料の分析によって、両方のアプ ローチの効率的な実施が可能となる。複製サブ配列の各々において、一つの分岐 点は、同一サブ配列内にスポッティングされた異なる試料における変異したシー クエンスを解決するという点(前述)で類似するプローブのプールを用いた1また はそれ以上のDNA試料について試験する。 この実施例で述べた64試料の各々において、約100分岐点が存在し、さら にもし8試料が各サブ配列において平行に分析されるならば、少なくとも800 サブ配列プロービングはすべての分岐を解決する。このことは、3072塩基プ ロービングに関して800プロービング(25%)が追加で用いられる。より好 ましくは、一つの分岐点に対して2つのプロービングが用いられる。サブ配列が よりいっそう小さいとするならば、追加して使用されるプローブはより少なくな る。例えば、もしサブ配列が16個の試料からなるとすると、200の追加プロ ーブが判定される(6%)。7量体のプローブ(N1-271-2)と競合または 協同で分岐を解決するアプローチを使うことによって、約1000塩基対フラグ メントのフラグメントは約4,000プロービングとアセンブルされる。さらに 、8量体プローブ(NB8N)を使うことで、4塩基対またはそれよりも長いフ ラグメントが12,000プロービングとアセンブルされる。ギャップが形成さ れたプローブ、例えばNB4NB3NまたはNB4NB4Nは分岐点の数を減らすの に使用される。 実施例14 プローブのサブ配列に対する一時的付着および 標識プローブのリゲーションによるDNA分析 4ないし40塩基の有益な長さを持つオリゴヌクレオチド・プローブは標準的 な化学によって合成されて試験管または多穴プレートに格納される。1ないし1 0,000プローブ含まれるプローブの特定セットは、デポジッションまたはin situ合成によって分離支持体または大きな支持体の独立したセクション上に配 列される。最後の場合、セクションまたはサブ配列は物理的または疎水性の障壁 によって分離される。プローブの配列はin situ 合成によって調製される。適当 なサイズの試料DNAを一つまたはそれ以上の特定配列とハイブリダイズさせる 。多くの試料が、同一サブ配列でプールとしてあるいは一つの支持体にある異な るサブ配列によって独立して確認(interrogate)される。試料と同時に、ある いは続いて、単一標識プローブまたは標識プローブのプールをサブ配列の各々に 加える。もし付着し、かつ標識されたプローブが試料DNAの相補的ターゲット 上に背中合わせにハイブリダイズするならば、それらはリゲーションされる。リ ゲーションの発生はプローブから標識を検出することによって測定されよう。 この方法は、上記したDNA分析の一つの変形例であり、DNA試料は支持体 に永久的に付着しているものではない。支持体に固定されたプローブによって一 時的付着が提供される。この場合、ターゲットDNAを配列させるプロセスは必 要ではない。さらに、リゲーションは短い標識されたプローブを短い固定された プローブと結合させることによって長いオリゴヌクレオチド配列を検出すること を可能とさせる。 プロセスにはいくつかの独特な特徴を有する。基本的には、ターゲットの一時 的付着によって再利用が可能となる。リゲーションが起こった後、ターゲットは 解放され、さらに標識は支持体に対して共有結合してとどまる。この特徴によっ て、ターゲットの循環と少量の該ターゲットによって検出可能なシグナルの生産 とが可能となる。最適な条件下では、ターゲットを増幅させる必要はない。例え ば、DNA試料の天然の源は診断およびシークエンシングの目的に直接利用され る。ターゲットは有効なハイブリ ダイゼーションと有効な2重鎖の効率的な溶解との間の温度を繰り返させること によって解放される。より好ましくは、繰り返しはない。構成要素の温度および 濃度は、遊離のターゲットとハイブリダイゼーションを開始したターゲットとの 平衡状態が50:50%の度合いになるように定める。この場合、リゲーション された産物の生産が連続する。目的に応じて平衡比を変えて最適化する。 電界を用いてターゲットの使用を強化させてもよい。最初に、各サブ配列にお いて水平方向の磁界パルスを用いてターゲットのソーティングを早める。このフ ェーズでは、平衡はハイブリダイゼーションのほうへ移動し、未標識のプローブ が使用される。ターゲットソーティング・フェーズの後、適当な洗浄(試料の動 きを制限する垂直方向の電界が役に立つ)を行う。数サイクルの選別的ハイブリ ッド溶解、ハイブリダイゼーションおよびリゲーションによるターゲットの回収 、および未使用のターゲットの除去を導入して特異性を高める。次のステップで は、標識プローブを添加し、垂直方向の電界パルスを印加する。温度を上昇させ ることによって、最適な遊離ターゲットとハイブリダイズしたターゲットとの最 適な比が達成される。垂直方向の電界は選別されたターゲットの拡散を防ぐ。 固定プローブのサブ配列および標識プローブのセット(特別に設計されるか、 もしくは普遍的なプローブ・セットから選択)を種々の方法で配列して効率的で 、かつ適応性のある塩基配列決定および診断プロセスを可能とする。例えば、も し細菌のゲノムの短いフラグメント(約100〜500塩基対)が部分的あるい は完全にシークエンスされるならば、既知のシークエンスにもとづいて設計され たプローブの小さな配列(5〜30塩基の長さ)が使用される。もしサブ配列あ たり10の標識プローブからなる異なるプールによって確認されるならば、各々 が10個のプローブを有する10種類のサブ配列のうちの一配列は200塩基の チェックを可能とするので、リゲーションによって結合した2つの塩基のみが判 定されると推測される。ハイブリッド全体にわたって不整合が見分けられる条件 下で、プローブを一つ以上の塩基と置換して長いターゲットを同数のプローブで カバーする。長いプローブを用いることによって、ターゲットは試料中の残りの DNAから増幅または単離されることなく直接確認される。また、一試料でいく つかのターゲットを同時に分析(スクリーニング)してもよい。もし得られた結 果が突然変異(または病原体)の発生を示すものならば、プローブのプールを追 加して突然変異の種類あるいは病原体の亜型を検出する。このことは患者の一部 のみに感染または突然変異があると予期する予防診断上において費用対効果が高 いプロセスの所望の特徴である。 実施例に記載したプロセスでは、種々の検出方法が使用される。例えば、放射 線標識、蛍光標識、酵素または抗体(化学的発光)、光の散乱または干渉分析に よって検出可能な巨大分子または粒子である。 実施例15 SBHに好適なオリゴヌクレオチド・プローブおよびターゲット (フラグメント-クローンの数)x(プローブの数)行列として定義される実 験的シークエンス・データを得るために、プローブの数を使用するフラグメント の数に応じて少なくするか、あるいはその逆を行う。2種類の数の最適な比率は ハイブリダイゼーションプロセスによる特定の塩基配列決定における技術的要求 によって定まる。 プローブの長さを選択する上で影響を与える2つのパラメータがある。第1は 所望の選別度合いを示すハイブリダイゼーション結果を得る点で成果を納めるこ とである。第2は所望の数のプローブを合成する技術的実現性である。 実用的かつ有効な量のターゲット核酸によってハイブリダイゼーションを十分 に弁別することを要求することによって、プローブの長さが限定される。短いプ ローブでは十分な量のハイブリッドを得ることが困難であり、また長いプローブ との末端不整合を弁別することが困難である。従来は、文献によれば11量体よ りも短いプローブを用いることは、非常に安定したプローブに限定されていた( Estivill et al.,Nucl.Acids Res.15: 1415 (1987))。一方、15塩基よりも長いプローブは何とか末端不整合を弁別する( Wood et al.,Proc.Natl.Acad.Sci.USA 82: 1585(1985))。 不安定なプローブおよび末端不整合の弁別上の問題点を解決する一つの解決策 は、情報的な意味において単一の短いプローブを表す長いプローブの一群を使用 することである。例えば、16個の10量体からなる群を単一8量体のかわりに 使用する。この群の各メンバーは共通のコア8量体と外側の位置に3通りの可能 性のあるバリエーションのうちの一つと各末端に2通りのパリエーションを有す る。このプローブは、5’(A,T,C,G)(A,T,C,G)B8(A,T ,C,G)3’として表すことができる。この種のプローブによって、内側の8 量体が読み取られるだけなので非情報的末端塩基(2つの5’末端にあり、一つ は3’末端にある)を弁別する必要がなくなる。この解決策では、ハイブリダイ ゼーション反応においてよりいっそう質量の大きいプローブと標識とが用いられ る。 これらの不都合な点は6量体ほど短いオリゴマー・プローブに対する弁別ハイ ブリダイゼーション条件のわずかな組み合わせを用いることによって排除される 。ハイブリダイゼーション反応の数は、不一致な標識プローブの数に依存する。 したがって、オリゴヌクレオチド数よりも少ない数のフラグメントクローンを用 いて短い核酸の塩基配列決定を行う場合、オリゴマーをターゲットとして用い、 かつ核酸フラグメントをプローブとして用いることが望ましい。不確定のシーク エンスを持つターゲット核酸は、異なる大きさのゲノム・フラグメントからなる 挿入を持つファージまたはプラスミド・ベクターにおいて、あるいはPCRによ って調製されたプラスミドにおいて典型的なライブラリの混合物として作られる 。シークエンスされたフラグメントの並びにおける避けることができないギャッ プおよび不確実性は、複合ゲノムのノンランダムまたは繰り返しシークエンスの 構成や大腸菌(Escherichia coli)の毒性シークエンスのクローニングの困難 さによって生ずる。これらの問題は任意の方法を用いて大きな複合分子をシーク エンシングする上で固有の問題である。そのような問題は、ライブラリおよびハ イブリダイゼーションに使用するサブクローンの数の選択 によって最小限にすることができる。あるいは、そのような困難さを増幅ターゲ ットシークエンス、例えばPCR増幅、リゲーション反応、リゲーション増幅反 応等を使うことによって克服することができよう。 核酸や、核酸の単離、クローニング、およびシークエンシングは当業者によく 知られていることである。例えば、Ausubel et al.,Current Protocols in Molecular Biology,Vol.1-2,John Wiley & Sons(1989)、およびSamb rook et al.,Molecular Cloning Alaboratory Manual,2nd Ed.,Vols.1-3, Cold Springs Harbor Press(1989)を参照せよ。これら両方の文献を本明細 書の一部として援用する。 SBHは十分に開発された技術であり、当業者に知られている方法のいくつか によって実施される。特に、以下の文献のハイブリダイゼーション法によるシー クエンシングに関連した技術を本明細書の一部として援用する。すなわち、Drm anac らの米国特許第 5,202,231 号(本明細書の一部として援用)、1993年 4月13日発行、Drmanac et al.,Genomics,4,114-128(1989)、Drmanac et a l.,Proceedings of the First Int'l.Conf.Electrophoresis Supercomput ing Human Genome Cantor,DR&Lm HAeds,World Scientific Pub.Co .,Singapore,47-59(1991);Drmanac et al.,Science,260,1649-1652(1993); Lehrach et al.,Genome Analysis:Genetic and Physical Mapping,1, 39-81(1990),Cold Spring Harbor Laboratory Press; Drmanac et al., Nuci.Acids Res.,4691(1986);Stevanovic et al.,Gene,79,139(1989);Pa nusku et al.,Mol.Biol.Evol.,1,607(1990); Nizetic et al.,Nuci.Acids Res.,19,182(1991); Drmanac et al.,J.Biomol.Struct.Dyn.,5,1085(1 991);Hoheisel et al.,MoL Gen.,4, 125-132(1991);Strezoska et al.,Pr oc.Nat'l.Acad.Sci.(USA),88,10089(1991); Drmanac et al.,Nuci.A cids Res.,19,5839(1991); およびDrmanac et al.,in:.J.Genome Res., 1,59-79(1992)。 実施例16 ハイブリダイゼーションデータから決定されるシークエンス シークエンス・アセンブリは、任意のオーバーラッピング(N−1)量体が2 回以上複製される場合は必ず中断される。最後のヌクレオチドが異なる2つのN 量体を用いてシークエンスを延長する。この分岐点はシークエンスの不明瞭では ないアセンブリに制限を加える。 ターゲット核酸の完全なシークエンスを作るためにターゲット核酸にハイブリ ダイズする既知のオリゴヌクレオチドのシークエンスの再アセンブリはいくつか のケースでは達成されない。このことは、ハイブリダイゼーションに用いられる オリゴヌクレオチドの大きさに関係した適当な大きさのフラグメントのなかにタ ーゲット核酸がない場合に何らかの情報が失われるからである。損失情報量はシ ークエンスされているターゲットの長さに比例する。しかし、もし十分に短いタ ーゲットが使用されるならば、シークエンスは不明瞭なことなく決定される。 ある長さのDNAに沿って分布するシークエンス・アセンブリと干渉する複製 シークエンスの予想頻度を計算する。この導出にはシークエンスの構成と関わり あるパラメータの定義を導入することを要求される。すなわち、シークエンス・ サブフラグメント(SF)。シークエンス・フラグメントは、ターゲット核酸の シークエンスの任意の部分が、ターゲットシークエンス内で2回以上繰り返した (N−1)量体によって開始および終了する場合、シークエンス・サブフラグメ ントが結果として生ずる。したがって、サブフラグメントは本発明の方法におい てシークエンスをアセンブリするプロセスでの分岐の2つの点間に生ずる。すべ てのサブフラグメントの合計は、短い末端が重なり合うので実際のターゲット核 酸よりも長い。一般に、サブフラグメントは追加の情報なしに直線状には集合す るものではない。なぜなら、開始および終了部分で(N−1)量体を共有するか らである。繰り返し(N−1)量体の数に応じて各核酸ターゲットに対して異な る数のサブフラグメントが得られる。数はN−1の値とターゲットの長さとに依 存する。 確率計算によって、2つのファクタの相互関係を評価することができる。 もしポジティブなN−量体のオーダリングが長さNー1Pで、あるいは平均距離 A。でオーバーラップしているシークエンスを用いることによって達成されると するならば、Lf塩基の長さのフラグメントのN−1は以下の式で表される。 式中、Kは2以上、またP(K、Lf)は長さがLf塩基のフラグメント上でN量 体がK回生ずる確立を表す。また、任意に与えられたシークエンスに対するN量 体の内容からサブフラグメントを形成することが可能なコンピュータ・プログラ ムを下記の実施例8に示す。 サブフラグメントの数は、所定の長さのプローブに対するフラグメントの長さ の増加に伴って増加する。得られたサブフラグメントは、それら自身の間で一意 的にオーダーされることはない。完全ではないが、この情報は比較によるシーク エンスの分析および機能的シークエンス特性の認識にたいへん有用である。この タイプの情報は部分シークエンスと呼ばれる。部分シークエンスを得る別の方法 は、所定の長さのオリゴヌクレオチド・プローブのサブセットのみを使うことで ある。 理論にもとづいて予測されたシークエンスとランダムDNA配列についてのコ ンピュータ・シミュレーションとの間に相対的に良好な一致が認められる。 例えば、N−1=7,[5’(A,T,C,G)B8(A,T,C,G)3’] 型の8量体または16の10量体からなる群を用いる]について、200塩基の ターゲット核酸は平均した3つのサブフラグメントを持つであろう。しかし、平 均値まわりの分散のため、ターゲット核酸のライブラリは500塩基対の挿入を 有するものでなければならず、それによって2000ターゲットの1未満が3を 上回る数のサブフラグメントを有する。したがって、ランダム・シークエンスの 長い核酸のシークエンス決定の理想的なケースでは、ターゲット核酸の十分に短 い挿入を有する典型的なライブラリ を使用する。そのような挿入によって、本発明の方法により個々のターゲットを 再構築することが可能である。 大きい核酸のシークエンス全体が、所定の個々の挿入の重ね合わせによって得 られる。 非常に短いフラグメント、例えば8量体プローブの50塩基に対する必要性を 少なくするために、クローニング、またはランダムPCRのような各ランダムD NAフラグメンテーション・プロセスに存在するオーバーラップしたフラグメン トに含まれる情報を使用する。また、短い物理的核酸フラグメントのプールを使 用することが可能である。1メガ塩基をシークエンスするための5’(A,T, C,G)N8(A,T,C,G)3’様の8量体または11量体を使うことによ って、20,00050塩基対フラグメントを必要とするかわりに、たった2, 100の試料で十分である。この数は、700個のランダム7kbクローン(基 本ライブラリ)、500塩基対(サブフラグメント・オーダリング・ライブラリ )の20クローンからなる1250プール、およびジャンピング(または類似の )ライブラリの150クローンから構成される。開発されたアルゴリズム(実施 例18参照)は上記試料のハイブリダイゼーション・データを用いるシークエン スを再生する。 実施例17 オリゴヌクレオチドによるハイブリダイゼーション オリゴヌクレオチドをGenosys社(Houston,Texas)から購入、また はApplied Biosystems381A DNAシンセサイザによっ て合成した。使用したプローブのほとんどは、HPLCまたはゲル電気泳動によ って精製した。例えば、プローブはインタフェロンの単一の完全な相補的ターゲ ット、M13クローン含有921bpEcoRI−Bgl II ヒトB1−イン タフェロン・フラグメント(Ohno and Tangiuchi,Proc.Natl.Acad.Sci.74 : 4370-4374(1981)、およびM13ベ クターそれ自身に末端塩基不整合を持つ少なくとも一つのターゲットを有するよ うに設計された。 オリゴヌクレオチドの末端標識を記載[Maniatis et al.,Molecular Cloni ng: A Laboratory Manual,Cold Spring Harbor Laboratory Cold Spr ing Harbor,New York(1982)]に従って、T4−ポリヌクレオチド・キナーゼ (5単位 Amersham 社)、γ32p−ATP(3.3pM、10μCi Amersham 社、3000Ci/mM)、およびオリゴヌクレオチド(4pM、10ng)を 含有する10μlで行った。プローブの特異的活性は2.5〜5 x 109c pm/nMであった。 一本鎖DNA(0.5NaOH、1.5MNaClに2ないし4μl)を同一 溶液で湿潤し、0.05M Na2HPO4 pH6.5で中和し、80℃、60 分間オーブンでベーキングし、さらに1分間紫外線照射したジーン・スクリーン ・メンブラン上にスポットした。つぎに、フィルタをハイブリダイゼーション溶 液(0.5M Na2PO4 pH7.2、7%ラウロイル・サルコシン・ナトリ ウム)に室温で5分間インキュベートし、プラスチック製ペトリ皿の表面に置い た。4nM濃度の32P末端標識オリゴマー・プローブを含むハイブリダイゼーシ ョン溶液(10 Ol、0.5M Na2HPO4 pH7.2, 7%ラウロイ ル・サルコシン・ナトリウム)の一滴を、フィルタあたり1〜6ドットにわたっ て置き、一枚の矩形状になったポリエチレン(約1x1cm)を重ねて置き、さ らに指示された温度で3時間にわたりモイスト・チャンバーでインキュベートし た。ハイブリダイゼーションの停止は、フィルタを6xSSC洗浄用液に3x5 分間、0℃で置くことによってハイブリダイズしていないプローブを除去した。 フィルタを乾燥させるか、あるいはさらに指示された時間および温度でもって洗 浄し、オートラジオグラフィにかけた。選別測定のために、オートラジオグラフ ィ[フォスフォイメージャー(Molecular Dynamics,Sunnyvale,California )後に乾燥フィルタからドットを切り取って液体シンチレーション・カクテルに 入れてカウントを行った。IFおよびM13ドットに対するcpmの未補正比を Dとする。 ここに報告した条件で、たいへん短いオリゴヌクレオチドとのハイブリダイゼ ーションが可能となるが、ターゲット核酸に相補的であり、かつ結合する整合し たオリゴヌクレオチドと不整合したオリゴヌクレオチドとの間の確実な弁別がな される。完全に相補的なターゲットとハイブリッドに単一の不整合がある不完全 に相補的なターゲットとの間の弁別度(D)を定める。実験的な試験では、2つ のM13クローンまたはメンブラン・フィルタに結合したモデル・オリゴヌクレ オチドに対して、長さが6ないし8ヌクレオチドの28個のプローブのドット・ ブロット・ハイブリダイゼーションが達成された。実験手法を導く原理を以下に 説明する。 プローブ過剰の条件でプローブよりも長い核酸がわずかであるフィルタに結合 したターゲット核酸に対するオリゴヌクレオチド・ハイブリダイゼーションは、 ターゲット濃度に関して擬1次反応である。この反応は以下のように定義される 。 式中、StおよびSoは、それぞれ時間tおよび時間toでのターゲット・シー クエンス濃度である。(OP)はプローブ濃度であり、またtは温度である。ハ イブリッド形成の速度定数khは0℃から30℃の範囲でわずかながら増加する (Porschke and Eigen,J.Mol.Biol.62:361(1971);Craig et al.,J.Mo l.Biol.62:383(1971)]。ハイブリッド融解はハイブリッド濃度に関して1次反 応である(ここで、フィルタ結合状態に応じて質量に置き換える)。 この等式では、HtおよびHoは、それぞれ時間tおよび時間toでのハイブリ ッド濃度である。kmは温度および塩濃度に依存したハイブリッド融 解の速度定数である[Ikuta et al.,Nucl.Acids Res.15: 797(1987);Pors clike and Eigen,J.Mol.Biol.62:361(1971);Craig et al.,J.Mol.Biol. 62: 303(1971)]。鎖連結プロセス、戻し、融解、または鎖解離であるハイブリダ イゼーション中、反応が同様に起こる。したがって、時間内に形成されたハイブ リッドの量はフォワード反応およびバック反応の結果である。平衡状態は、プロ ーブ濃度を増加し、さらに(または)温度を減少されることによってハイブリッ ド形成に動く。しかし、大容量の用緩衝液内での洗浄サイクル中、融解反応が優 勢となり、プローブが存在しないのでバック反応ハイブリダイゼーションは取る に足らない。この分析は、プローブ濃度または温度で変動する実行可能な短オリ ゴヌクレオチド・ハイブリダイゼーション(SOH)条件を示す。 Dまたは弁別は4番目の式によって定義される。すなわち、 p(tw)およびHi(tw)は、それぞれ完全および不完全に相補的な二重 鎖の同一量に対する洗浄時間tw後に残存するハイブリッドの量である。所定の 温度で、弁別Dは洗浄時間の10で変化し、式5であるHi=Bのときに最大値 に達する。 バックグラウンドBはシステムが検出することが可能な最も低いハイブリダイ ゼーション・シグナルを表す。Hiのさらなる減少は何等試験されていないので 、洗浄を続けることによってDが減少する。tw時間洗浄を続けるとBに対して Hpが減少する。不完全なハイブリッドに対する最適な洗浄時間twは、式3およ び式5から、 pは式を結合して同一twで洗浄されるので、最適弁別関数が得られる。す なわち、 Tの関数としてのDの変化が重要である。なぜなら、最適な洗浄時間が選択され るからである。それは以下のアレニウスの式: を先の等式に代入して最終的に以下の等式にする。すなわち、 式中、BはHi(to)よりも小さい。 完全なハイブリッドの活性エネルギーEα、pおよび不完全なハイブリッドの活 性エネルギーEα、iを共に等しく、あるいはEα、pよりもEα、iを少なくするこ とができるもので、Dは温度に無関係であり、あるいは温度の上昇にともなって 減少する。この結果は、SOHにおける良好な弁別にとって厳しい温度条件を探 すことは不当であることを暗に示している。より低い温度で洗浄することによっ て、等しいあるいは良好な弁別が得られる。しかし、温度が減少するとそれにと もなって指数関数的に洗浄時間が長くなる。Hp(to)に比較してHi(to)が 増加すると、弁別はTによってよりいっそう強く減少する。 より低い温度でDは、Hp(to)/Hi(to)比よりもHp(to)/B比が高い率 であることに依存する。この結果は、このステップで達成される弁別に関わりな くハイブリダイゼーションにおけるHpの十分な量を得ることが望ましいことを 示している。良好な弁別は洗浄によって得られる。なぜならよりいっそう量の多 い完全なハイブリッドによって効果を示すまでの特異な融解のための時間をより 多くかけることが可能となる。同様に、 よりいっそう多くの標的核酸を用いることによって、たとえKm,pとKm,iとの間 がわずかな差であったとしても必要な弁別が達成される。 この単純なモデルでカバーされるよりもより一層複雑な状況を考えると、所定 の核酸ターゲット内の数多くの末端不整合を有するプローブのハイブリダイゼー ションの場合に弁別を得る上で、低い温度で洗浄することはよりいっそう重要で あることを結果が示している。 上記理論的原理を実験のガイドとして用いることによって、信頼性のあるハイ ブリダイゼーションが長さ6ないし8ヌクレオチドのプローブによって得られる 。すべての実験は、フィルタ上のハイブリダイゼーション溶液の膜を提供する浮 遊するプラスチック製のシートを用いて実施した。この手法によれば、プローブ の量を最大限少なくし、それによってドット・ブロット・ハイブリダイゼーショ ンにおける標識のコストも減少させる。ラウロイル硫酸ナトリウムの代わりに高 濃度のラウロイル・サルコシン・ナトリウムを含むハイブリダイゼーション用燐 酸用緩衝液によって室温から12℃に反応温度を落とすことが可能となる。同様 に、4〜6XSSC、20%ラウロイル・サルコシン・ナトリウムによって2℃ ほどの低温でのハイブリダイゼーションが可能となる。このような用緩衝液に含 まれる界面活性剤は、標識プローブの濃度が40nMまで許容できるバックグラ ウンドを得るためのものである。短いオリゴヌクレオチド・ハイブリッドの耐熱 性に関する予備的な特徴を、G+C含量が50%のプロトタイプのオクタマー、 すなわちシークエンスTGCTGATGのプローブ上で決定した。理論的に予想 できることは、このプローブが安定性が低いオクトタマーの一つであるというこ とである。その遷移エントロピーはよりいっそう安定なヘプタマー、あるい長さ が6ヌクレオチドの場合と同じである(Bresslauer et al.,Proc.Natl.Acd. Sci.U.S.A.83: 3746(1986))。パラメータTd、ハイブリッドの50%が一分 の単位時間内で融解する温度は18℃である。結果によれば、Tdは11塩基対 二重鎖よりも8塩基対ハイブリッドの方が15℃低い[Wallance et al.,Nuc leic Acids Res.6: 3543(1979)]。 モデル・オリゴヌクレオチドによる実験に加えて、短いオリゴヌクレオチド・ ハイブリダイゼーションの実質的なデモンストレーションを行うために、システ ムとしてM13ベクタが選択される。主な目的は、本発明の方法の種々の用途で 使用されるものに類似の標的によって実用的な末端不整合の弁別を示すことであ る。M13モデルのオリゴヌクレオチド・プローブは、M13ベクタ自身が末端 が不整合した塩基を含むように選択される。ベクターIF、921塩基対ヒト・ インターフェロン遺伝子挿入を含むM13組換え体は、単一の完全に整合したタ ーゲットを運ぶ。したがって、IFはM13ベクタそれ自体と比較して同数の、 あるいはより多くの不整合したターゲットを有する。 低温度条件およびドット・ブロットを用いることで、完全および不整合したタ ーゲットを含むタイ・ドット(tie dot)と不整合したターゲットのみを含むド ットとの間でハイブリダイゼーション・シグナルにおける十分な差が得られる。 このことは、6量体オリゴヌクレオチドにとって真実であり、また核酸の大きな IF−M13対にハイブリダイズした7量体および8量体オリゴヌクレオチドに とっても真実である。 ハイブリダイゼーションのシグナルは、プローブとの反応のためのフイルタ上 で有効なターゲットの量に依存する。必要な対照群は、サイン強度の違いは2つ のドットにおける核酸の量の変化を反映するものではないことを示すためのもの である。数が同じで、かつ同様のターゲットをIFおよびM13の両方に持つプ ローブとのハイブリダイゼーションは、ドット中に等しい量のDNAが存在する ことを示す。ハイブリッド形成の効率はハイブリッドの長さによって増加するこ とから、6つのヌクレオチドを持つ二重鎖に対するシグナルは、フィルタに結合 した大量のオリゴヌクレオチド・ターゲットによって最適に検出された。分子量 が低いことから、ターゲットを兼ねる核酸の巨大分子と比較した場合に大量のオ リゴヌクレオチド・ターゲット分子が所定の表面領域に結合することができる。 未精製DNAを用いた検出の感度を測定するために、様々な量のファージ上澄 みを前記フィルター上にスポットし、32Pで標識したオクタマー でハイブリダイズした。0.5ng以上のDNAを含む最少5億個の未精製ファ ージにより、前記短オリゴヌクレオチド雑種形成法の感度が十分であることを示 す検出可能なシグナルが得られた。反応時間は短かく、実用性に加味される。 前記理論の節で述べたように、ハイブリッドの平衡収量はオイル・プローブ濃 度および/または反応温度に依存している。例えば、13℃で4nMのオクタマ ーを含む同量の標的におけるシグナルレベルは、プローブ濃度が40nMの標的 より3倍も低く、ハイブリダイゼーション温度を25℃に上げることにより4. 5倍低下する。 最大弁別(maximal discrimination)を実現するために低温度洗浄の使用を実 施する。現象を明瞭に視覚化するために、ベクトル固有プローブによるハイブリ ダイゼーションを用いる前記IFドットに添加するより50倍ものDNAを前記 M13ドットに添加した。このようにして、活性プローブを用いたハイブリダイ ゼーション・ステップの後のシグナルを、前記適合したケースにおけるシグナル に不適合な場合において、増強した。Hp:Hi比は1:4であった。7℃での長 い洗浄の後のシグナル強度の反転は、完全ハイブリッドの大きな損失なしに実現 され、その結果、比は2:1になった。これに対して、25℃でなんらかの識別 を実現することは不可能である。というのは、適合標的シグナルは2分間の洗浄 により既にバックグランドレベルに低下しており、同時に、不適合ハイブリッド からのシグナルは未だに検出可能であるからである。 7℃に比較した場合の1 3℃における識別損失は、それほど大きくないが、はっきりと視認できる。前記 不適合ハイブリッドシグナルがバックグランドレベル近くにあり、それぞれの条 件に対して最少の洗浄時間を示している、7℃での90分時と13℃での15分 時とを考察すると、13℃における場合より7℃における場合の方が量的に数倍 大きいことが明らかである。このことをさらに説明すると、前記二つの温度で開 始ハイブリッドの同量を洗浄して、その変化を識別する時間行程をたどると、前 記低温度でより高い最大値Dが示される。この結果により、前記洗浄ステップの 開始時における温度と二つの タイプのハイブリッドの量比率とによって、Dが変化しやすいことが、確かめら れた。 短オリゴヌクレオチド・ハイブリダイゼーション条件の一般的使用を示すため に、我々は、我々のM13単一システムにおける長さ12核酸までの4ヘプタマ ー、10オクタマーおよび他の14プローブ類のハイブリダイゼーションを、参 照した。これらは、二つのGC含量過剰物を示しているノナマーGTTTTTT AAとオクタマーGGCAGGCGを、含んでいる。GC含量およびシークエン スは短ハイブリッドの安定性に影響を与えるものと考えられているが[Bressla uer et al.,Proc.Nati.Acad.Sci.U.S.A.83: 3746(1986)]、低温度、 短オリゴヌクレオチド条件は、充分な識別を実現するすべてのテスト済みのプロ ーブに適用可能であった。13核酸長さのプローブを用いて得られた最適識別値 は20であったので、シークエンス変化に応じて数倍の滴下数が容易に許容され る。 前記M13システムは、複雑な標的DNAの作用を前記識別レベルについて表 す利点を有する。0または5つの不適合標的のいずれかとを有し、一つのGC対 だけが異なっている二つのオクタマーについて、測定された識別値は、それぞれ 18.3および1.7であった。 この方法の使用を示すために、ブルースクリプト・ベクトル(Bluescript ve ctor)のライブラリーから調製した51プラスミドDNAドットの集合について 、8核酸長さの3つのプローブがテストされた。一つのプローブはブルースクリ プト・ベクトルに存在し、固有であったが、M13には存在せず、他の2つのプ ローブは周知のシークエンスの挿入体である標的を有していた。このシステムに よれば、ハイブリダイゼーションのネガティブまたはポジティブ制御DNAの使 用を各プローブを用いて可能にすることができる。また、このプローブ・シーク エンス(CTCCCTTT)は、前記インターフェロン挿入体に補足標的を有し ていた。前記M13ドットは、M13またはブルースクリプトのいずれか内の前 記インターフェロン挿入体がポジティブである間、ネガティブであるので、その ハイブリダイゼーションはシークエンス固有である。同様に、前記標的を検出す るプロ ーブは、51挿入体の一つだけの中に、すなわち前記試験した挿入体のいずれで もない挿入体中に、該クローン中に前記好適な標的が存在する場合にハイブリダ イゼーションが生じることを確認するコントロールに沿って、配列している。 熱安定性は、6〜8の核酸長さであり、少なくとも、11〜12の核酸長さの ハイブリッドにおけるより低い15℃で、大変短いオリゴヌクレオチド・ハイブ リッドにおいて、カーブする[図1およびWallace et al.,Nucleic Acids R es. 6: 3543-3557(1979)]。しかしながら、低温度で、大変実用的な0.4〜4 0nM濃度のオリゴヌクレオチド・プローブを用いて、ハイブリダイゼーション を行うことにより、周知の、または未知の核酸における補足シークエンスの検出 が可能になる。未知の核酸シークエンスを完全に決定するには、65535の8 量体プローブを含む全セットを用いることができる。この目的のために充分量の 核酸は、数マイクロリットルのM13培地、10mlのバクテリア培地またはバ クテリアの単一コロニーから調製したプラスミド、または1μl未満の標準PC R反応物などの入手容易な生物学的試料中に存在する。 6〜10の核酸長さの短いオリゴヌクレオチドにより、優れた識別が行える。 不適合な単一末端を有するハイブリッドの安定性における相対的減少は、より 長いプローブにおけるより、大きい。前記オクタマーTGCTCATGで得られ た結果は、この考察を支持している。前記試験において、G/T不適合末端を有 する標的、この不適合タイプの標的へのハイブリダイゼーションが、他のタイプ のオリゴヌクレオチドを抜いて、最も安定したものである。実施したこの識別は 、19対の二重鎖の内部G/Tより大きい19塩基対の内部不適合G/Tと、同 じか、または大きい[Ikuta et al.,Nucl.Acids Res.15:797(1987)]。短オリ ゴヌクレオチド・ハイブリダイゼーションにおける前述のハイブリダイゼーショ ン条件を用いるこれらの識別特性を利用することにより、オリゴヌクレオチド標 的の大変正確な測定が可能になる。 完全および不完全ハイブリッド間の識別検出の容易性を比較すると、大 変短いオリゴヌクレオチドを用いることに伴う問題があり、それはハイブリッド の充分量を調製することにある。実際、HpとHiとを識別する必要性は、前記ド ットおよび/またはプローブ濃度におけるDNA量の増加によって、あるいは、 前記ハイブリダイゼーション温度の低下によって、促進される。しかし、高いプ ローブ濃度は通常バックグランドを増加する。さらに、実際に使用する標的核酸 の量には、限界がある。この問題は、4nMで効果的なバックグランドを与える 高濃度な界面活性剤そによって、解決された。濾過するプローブの非固有結合の ため、競争剤(competitors)を用いることによって、または、ハイブリダイゼー ション支持物質を替えることによって、さらなる改善が実現される。さらに、4 5kcal/mol未満のEαを有するプローブにおいて(例えば、多くのヘプ タマーおよび多数のヘキサマーにおいて)、修飾オリゴヌクレオチドは、その非 修飾複製より安定なハイブリッド[Asseline,et al.,Proc.Nat'l Acad.Sci .81:3297(1984)]を与える。低温度を用いる短オリゴヌクレオチド・ハイブリダ イゼーションの本発明で説明したハイブリダイゼーション条件により、すべての シークエンスおよび二重鎖ハイブリッド投入に対して、より良い識別が得られる 。異なったシークエンスのハイブリダイゼーション条件において均一性が達成さ れることに支払われるたった一つの対価は、シークエンスに依存して、洗浄時間 が数分から24時間にまで増加することである。さらに、この洗浄時間は、前記 塩濃度の低減によって、より減少可能である。 ある不適合ハイブリッドに対する一つの適合ハイブリッドの識別は優れたもの であるが、短オリゴヌクレオチド・ハイブリダイゼーションでは、不適合ハイブ リッドからのシグナルが、不適合末端から得られた多数の不適合ハイブリッドと ともに、存在する。このことにより、所定長さのプローブによって効率的に試験 される挿入サイズが、限定される。 識別におけるシークエンスの複雑性の影響は、無視できない。しかしながら、 複雑性の影響は、固有の、非ランダムなシークエンス用の短オリゴヌクレオチド ・ハイブリダイゼーションによりシークエンス情報を決定す る時に、より顕著であり、標的長さ比が好適なプローブを用いろことにより、克 服することができる。前記長さ比は、識別をなくすか、間違って逆の識別をし得 る多数の末端−不整合物を有する固有なシークエンスが生じる蓋然性がなくなる ように、統計的基盤に基づいて、選択される。結果は、それぞれ、0.6,2.5 ,および10kbより短い標的核酸投入物について6,7,および8ヌクレオチ ド長さのオリゴヌクレオチドの使用を示唆している。 実施例18 八量体および九量体を用いるターゲットの配列決定 この実施例では、用いられたハイブリダイゼーション条件を、実施例17より 詳しく説明する。八量体および九量体オリゴヌクレオチドのハイブリダイゼーシ ョンにより得られるデータは、ハイブリダイゼーションによる配列決定が極めて 高度な正確さを付与することがわかる。この実験において、既知のシークエンス を、一連の連続の重複する成分の八量体および九量体オリゴヌクレオチドを推測 するのに用いた。 完全に適合するオリゴヌクレオチドに加えて、不適合オリゴヌクレオチドを調 べた。この不適合オリゴヌクレオチドとは、内部および末端の不適合がオリゴヌ クレオチドおよびターゲットによって形成された二重鎖に生じることである。こ れらの分析において、最も低い実際温度を、ハイブリダイゼーションの形成を最 大にするのに用いた。洗浄は、同温またはより低い温度でなされ、オリゴヌクレ オチド/ターゲットのハイブリダイゼーションの適合に対する不適合のより大き な解離比を利用して、最大の識別を確かにした。これらの条件は、全てのシーク エンスに適用できるとわかっているが、絶対的なハイブリダイゼーションの収量 は、シークエンスに依存すると示している。 仮定することのできる不安定にすることの最も少ない不適合は、簡単な末端不 適合であり、そのため、ハイブリダイゼーションによる配列決定の テストは、末端不適合のオリゴヌクレオチド/ターゲットの二重鎖から完全な適 合のオリゴヌクレオチド/ターゲットの二重鎖を識別する能力である。 ドットブロットフォーマット(dot blot format)における105のハイブ リッドするオリゴヌクレオチドのうち102という識別値は、シークエンスの高 度に正確な発生を許す2より大きかった。このシステムは、ハイブリダイゼーシ ョン形成およびハイブリダイゼーションの不安定性の影響の分析も可能にする。 PCRによって調製されたヒトβ−インターフェロン遺伝子の既知の部分の1 00塩基対、つまり100bpターゲットシークエンスを、ターゲット核酸への 既知のシークエンスの105オリゴヌクレオチドプローブのハイブリダイゼーシ ョンから得られるデータを用いて発生した。用いられたオリゴヌクレオチドプロ ーブが完全にターゲットに相補的である72の八量体および21の九量体を含ん だ。93プローブの組は、一つまたは二つの塩基によって置換されたターゲット シークエンスの連続的な重複フレームを提供した。 不適合の効果を評価するため、ハイブリダイゼーションを、100bpテスト ターゲットシークエンスにハイブリッドした際に少なくともひとつの末端不適合 を含んだ12の追加のプローブに対して調べた。12のオリゴヌクレオチドが4 つの抑制DNAと完全に適合した二重鎖ハイブリッドを形成するように選ばれた 4つの他の抑制核酸に末端不適合なターゲットを有する、12のプローブのハイ ブリダイゼーションも試験した。次に、オリゴヌクレオチドとターゲットの内部 不適合、末端不適合、および完全な適合の二重鎖対のハイブリダイゼーションは 、それぞれ実験に用いられたオリゴヌクレオチドに対して評価された。テストの 八量体および九量体オリゴヌクレオチドとのハイブリダイゼーションにおける絶 対DNAターゲット濃度の効果を、同時増幅するプラスミドDNA内で単一の発 生ターゲットでない部位(single occurrence non- target site)に異なっ たオリゴヌクレオチドプローブのハイブリダイゼーションを検出することに よってターゲットDNA濃度を定義することによって決定した。 この実験結果より、ターゲットまたは抑制DNAへの完全に適合する相補的シ ークエンスを含む全てのオリゴヌクレオチドが、不適合を有するこれらのオリゴ ヌクレオチドよりも強くハイブリッドしているとわった。この結論に達するため に、我々はそれぞれのプローブに対してHpおよびDを調べた。Hpは、テスト ターゲットとオリゴヌクレオチドプローブの間に形成されたハイブリッド二重鎖 の量を定義する。105のプローブに対して得られたハイブリダイゼーション0 〜10の値のとき、105のプローブの68.5%が2より大きいHpを有する ことは、明らかであった。 次の1)および2)の間のシグナル強度の比として定義される識別値(D)が得ら れた。ここで、1)はテストオリゴヌクレオチドと、ターゲットまたは抑制核酸 の間に形成された完全に適合する二重鎖を含むドットであり、2)は同じヌクレ オチドと、ターゲットまたは抑制核酸内の異なる部位の間に形成された不適合な 二重鎖を含むドットである。Dの値の変化は、1)または2)のどちらかから得 られ、ここで、1)はバックグランド上のシグナルの視覚化を可能にするハイブ リダイゼーション効果における摂動であり、2)はテストヌクレオチドおよびタ ーゲットの間にみられる不適合のタイプである。この実験で得られたD値は、調 べられた105のオリゴヌクレオチドプルーブの102に対して2〜40であっ た。全体として102のオリゴヌクレオチドのグループに対するDの計算より、 Dの平均値は10.6であるとわかった。 オリゴヌクレオチド/ターゲットの二重鎖が末端適合を示すのは20通りあっ た。これらのうちの5つにおて、Dは10より大きかった。これらの場合での大 きなD値はおそらく、最も安定(G/TおよびG/A)な末端不適合より他のも のよって生じるハイブリダイゼーションの不安定性によるようである。他の可能 性は、オリゴヌクレオチドかターゲットかのシークエンスにおける誤差があると いうことである。 低いHpを有するプローブに対するターゲットにおける誤差は、可能性として 除外された。その理由は、かかる誤差が、他の8個の重複するオリ ゴヌクレオチドのそれぞれのハイブリダイゼーションに影響を与えるからである 。ターゲットシークエンスが正確であることを表す他の重複するオリゴヌクレオ チドのシークエンス不適合のための明らかな不安定性はなかった。オリゴヌクレ オチドシークエンスにおける誤差は、7つの新たに合成されたオリゴヌクレオチ ドのハイブリダイゼーションを再試験した後の可能性として取り除かれた。7個 のオリゴヌクレオチドのうちただ一つが、よりよいD値を得た。低いハイブリッ ド形成値は、ハイブリッド不安定性またはハイブリッド二重鎖を形成するための 不可能性から得られる。ハイブリッド二重鎖の形成に対する不可能性は、1)選 ばれたプローブの自己相補性か、2)ターゲット/ターゲットの自己ハイブリダ イゼーションから得られる。プローブが自己相補的であるとき、オリゴヌクレオ チド/オリゴヌクレオチドの二重鎖形成は、オリゴヌクレオチド/ターゲットの 二重鎖形成より好ましい。同様に、ターゲット/ターゲット会合は、そのターゲ ットが自己相補的なら好ましく、内部パリンドロームを形成する。これらの可能 性を評価する際に、プローブ分析から、疑わしプローブはそれ自身とハイブリッ ドを形成しないことは明らかであった。さらに、ターゲット/ターゲットハイブ リダイゼーションの寄与を調べる際に、疑わしいオリゴヌクレオチドプルーブの 一つが、同じターゲットを含む2つの異なるDNAと無効果にハイブリッドする ことを決定した。2つの異なるDNAが同じターゲットシークエンスに対する自 己相補的領域を有するという低い可能性は、ターゲット/ターゲットハイブリダ イゼーションが低いハイブリダイゼーション形成に寄与しないという結果を導く 。従って、これらの結果は、ハイブリッドの形成の不可能性ではなく、ハイブリ ッドの不安定性が、特別なオリゴヌクレオチドに観測された低いハイブリッド形 成の原因になることを表している。この結果は、低いハイブリッド形成が特定の オリゴヌクレオチドの特別なシークエンスのためであるということを表している 。さらに、この結果は、八量体および九量体のオリゴヌクレオチドが用いられる のなら、確かな結果がシークエンスを発生するのに得られることを表している。 これらの結果より、特別なターゲット核酸の長いシークエンスの記載方法の使 用は、構成要素のオリゴヌクレオチドの最大、または独特の重複によって発生す るとわかる。かかる配列決定法は、その頻度および位置にかかわらず、個々の成 分のオリゴマーの内容量に依存する。 下に記載されたアルゴリズムを用いて発生されるシークエンスは、高い適合度 である。アルゴリズムは、4つのより確かでない値を含む105のハイブリダイ ゼーションの値から発生したシークエンスが正しいという事実から表されるとき 、ハイブリダイゼーションドットから誤認ポジティブシグナル(false positiv e signals)を容認する。ハイブリダイゼーションによる配列決定におけるこの 適合度は、短いオリゴヌクレオチドハイブリダイゼーションの「全てまたは全く ない」動力学、および完全に適合した二重鎖および不適合の二重鎖の間に存在す る二重鎖の安定性の違いによる。適合および末端不適合の二重鎖の二重鎖安定性 の比は、二重鎖の長さが減少するにしたがって増加する。さらに、結合エネルギ ーは、より低いハイブリダイゼーション効果をまねく二重鎖の長さを減少させる ことによって減少する。しかしながら、得られた結果は、八量体ハイブリダイゼ ーションは、二重鎖の安定性および識別性に影響する要素の均衡を可能にし、ハ イブリダイゼーションによる高精度の配列決定法を提供することを示している。 他の実施例で得られた結果は、6、7、または8ヌクレオチドであるオリゴヌク レオチドが、(6量体に対して)0.5kb、(7量体に対して)2kb、およ び(8量体に対して)6kbであるターゲットでの確かなシークエンスを生成す るのに、効果的に用いらることを示している。長いフラグメントのシークエンス は重複され、完全なゲノムシークエンスを発生する。 ハイブリダイゼーションによるシークエンスを決定するアルゴリズムを、実施 例18に記載する。 実施例19 アルゴリズム この実施例では、開始核酸シークエンスの別個にランダムに定義された最小数 のフラグメントにおいて、k個の要素からなる語から4文字のアルファベットで 書かれた長い配列の発生に対するアルゴリズムを説明する。ここで、Kはオリゴ ヌクレオチドプローブの長さである。アルゴリズムは、ハイブリダイゼーション による配列決定(SBH)方法の際に、主に用いるだろう。アルゴリズムは、サ ブフラグメント(SF)、情報フラグメント(informative fragments)(IF )および情報フラグメントを定義するための物理的核シークエンスのプールを使 用する可能性に基づいている。 記載したように、フラグメントは、ターゲット核酸内のK−1オリゴマーシー クエンスの反復を結果として生じるアセンブリ方法において分枝ポイントに起因 する。サブフラグメントは、シークエンスに起こる長さK−1のあらゆる二つの 反復語の間にみられるシークエンスフラグメントである。K−1語の多発生は、 シークエンス発生の方法におけるK−語の重複を整理することを妨害する原因と なる。妨害によって、サブフラグメントの形状を保つシークエンスになる。次に 、その順番が独特に決定されない分枝点の間の明らかなセグメントは、シークエ ンスサブフラグメントと呼ばれる。 情報フラグメントは、重複した物理的シークエンスフラグメントの最も近い末 端によって決定されるシークエンスのフラグメントとして定義される。 特定数の物理的フラグメントを、情報フラグメントを定義する可能性を失うこ となくプールする。ランダムにプールされたフラグメントの全体の長さは、配列 決定方法に用いられるk個組(k-tuples)の長さに依存する。 アルゴリズムは、二つの主なユニットからなる。第一部は、シークエンスに含 まれるk個組のセットからサブフラグメントの発生に対して用いる。サブフラグ メントは、特定サイズの物理的核酸シークエンスのコードする領域内、または長 い核酸シークエンス内で定義された情報フラグメント内で発生する。両タイプの フラグメントは、基本ライブラリー(basic library) の部分である。このアルゴリズムは、基本ライブラリーのk個組の情報フラグメ ントの構成の決定、すなわちシークエス発生方法に用いられるような情報フラグ メントの製造の工程を記載していない。 アルゴリズムの第二部分は、得られたサブフラグメントの一次配列を、基本ラ イブラリーの核酸フラグメントの完全なシークエンスを再生する目的で決定する 。この目的のため、第二のオーダリング・ライブラリ(ordering library)が用 いられ、開始シークエンスのランダムにプールされたフラグメントから作られる 。アルゴリズムは、基本フラグメントのシークエンスを組み合わせ、全体に大き な塩基を加えたシークエンスを再生する工程を含まない。これは、情報フラグメ ント発生の先行条件である塩基ライブラリーのフラグメントの結合を用いて達成 される。代わりの方法として、既存の一般的末端シークエンスを基に、これらの 重複の探索を用いるこのアルゴリズムを用いて基本ライブラリーのフラグメント のシークエンスを発生した後に達成される。 アルゴリズムは、基本およびオーダリングライブラリーの核酸シークエンス内 に付与されたk個組の外観の数の知識も必要としないし、k個組の語がフラグメ ントの末端に存在するものの情報も必要としない。アルゴリズムは、種々の長さ のk個組の混合した構成要素で操作する。アルゴリズムの考え方によると、k個 組の誤認ポジティブおよび誤認ネガティブを含むk個組で操作可能である。特別 な場合のみ、k個組の誤認の内容は、主に、発生されたシークエンスの完全性お よび正確性に影響する。アルゴリズムは、模擬実験の際のパラメータの最適化に 用いられ、同様に、ゲノムDNAシークエンスの発生などの実際のSBH実験に おけるシークエンス発生に対しても用いられる。パラメーターの最適化の際、実 際のフラグメントと便利なフラグメントのオリゴヌクレオチドプローブ(k個組 )の選択、および/または定義されたブローブに対するフラグメントの最適な長 さおよび数の選択が、本質的に重要になる。 アルゴリズムのこの部分は、k個組の構成要素からシークエンスの発生方法に おいて中心的役割をする。これは最大の重複によってk個組の独特 の順番づけに基づく。シークエンス発生における主な障害は、特定の反復シーク エンスおよびk個組の誤認ポジティブおよび誤認ネガティブである。アルゴリズ ムのこの部分の目的は、正確なシークエンスと共に、最小数の最も長い可能なサ ブフラグメントを得ることである。アルゴリズムのこの部分は、ひとつの基本工 程といくつかの制御工程からなる。2工程方法は必要である。その理由は、特定 の情報は、全てのプライマリーサブフラグメントの発生のあとにのみ用いること ができるからである。 シークエンス発生の主な問題点は、定義によって特別なk個組の発生数におけ る情報を運ばない用語の内容から反復シークエンスを得ることである。全体的ア ルゴリズムの考え方は、この問題を解決するという基本に依存する。原則的に、 二つの反対のアプローチがある:1)反復シークエンスを、pSFの発生の方法 の際、初めに得てもよいし、2)反復シークエンスを、サブフラグメントの最終 的順番付けの方法の際位、後に得てもよい。第一の場合、pSFは過剰のシーク エンスを含み、第二の場合は、含まれるシークエンスは不足している。初めのア プローチは、過剰の発生したシークエンスの除外を必要とし、第二のアプローチ は、シークエンスの最終組立の工程において、いくつかのサブフラグメントの多 くの許容使用を必要とする。 二つのアプローチの違いは、k個組の固有の重複の規則の厳密さの度合いにあ る。より厳格でない規則は、:k個組のXの最右端のk−1がk個組のYの最左 端にのみ存在するときのみ、k個組のXが明らかにk個組のYと最大限に重ねら れる。この規則は、反復シークエンスおよび余りのシークエンスの発生を可能に する。 第二のアプローチに用いられたより厳しい規則は、追加の警告を有する:もし k個組のXの最右端のK−1が、k個のYの最左端にのみ存在するなら、および k個組のYの最左端のK−1が、いかなる他のk個組の最右端に存在しないのな ら、k個のXはk個のYと明らかに、最大限に重なる。このより厳密な規則に基 づいたアルゴリズムは、より簡単で、ここに記載されている。 付与されたサブフラグメントの延長方法は、含有される最後のk個組の右端の k−1が、いかなるk個組の左端にも存在しないか、2こ以上のk個組に存在す るときに、停止する。ただ1つのk個組に存在するのなら、規則の第二部分をテ ストする。加えて、以前に含まれたものと異なるk個組があるのなら、付与され たサブフラグメントの組立を、第一の最も左の位置においてのみ終了する。この 追加のk個組が存在しないのなら、状態を独特のk−1の重複に対して適合し、 付与されたサブフラグメントは、1要素によって右に延長する。 基本的な規則に加えて、補足の規則を用いて、異なる長さのk個組の補充を可 能にする。最大限の重複は、重なっている組のより短いk個組のk−1の長さで ある。pSFの発生は、ファイルからの第一のk個組から始めるように実施し、 このファイル内のk個組は、核酸シークエンスの順番からランダム、および独立 に表される。次に、ファイルの初めのk個組は、シークエンスの開始にも、特定 のサブフラグメントの開始にも必要でない。サブフラグメント発生の方法を、独 特の重複によってk個組を順番づけることによって実行し、この独特の重複は記 載された方法で決定される。それぞれに用いられたk個組を、ファイルから消す 。含まれた最後のものと明らかに重複しているさらなるk個組はないというポイ ントで、サブフラグメントの蓄積が終わり、他のpSFの蓄積を始める。大部分 のサブフラグメントの発生が実際の開始から始まらないので、形成されたpSF は、k個組のファイルに加えられ、より長いkとして考えられる。他の可能性は 、開始のk個組から両方向に進めてサブフラグメントを形成することである。こ の方法は、さらなる重なり、つまりサブフラグメントのいかなる延長が不可能な ときに終了する。 pSFは、3つのグループに分けられる:1)正確なk個組のセットの場合に おいて、最大の長さのフラグメントおよび正確なシークエンス;2)不完全なセ ットにおける最大で明らかな重複の規則の使用のために形成される短いサブフラ グメント、および/またはいくつかの誤認ポジティブのk個組を有するセット; および3)不正確なシークエンスのpSF。2) の組の不正確性は、ハイブリダイゼーション実験の誤認ネガティブの結果によっ て起こり、同様にkの不正確な組を用いることによって起こる。これらを、k個 組の誤認ポジティブおよび誤認ネガティブのため形成し、これらは、:a)誤っ て結合されたサブフラグメント;b)間違った末端を有するサブフラグメント; およびc)誤認の最小サブフラグメントとしてあらわれるk個組の誤認ポジティ ブである。 k個組の誤認ポジティブを考慮して、中央のどこかにひとつ以上の間違った塩 基を含むkの存在を可能にするか、同様に末端に間違った塩基を有するk個組の 可能性である。短い、間違い、または間違って結合されたサブフラグメントは、 後半のk個組によって生じる。前者の二種類のk個組は、k個組の長さに等しい 長さを有する間違ったpSFを表す。 疑似ネガティブのkの場合、pSFは、最大にまさなる可能性のため発生され る。その最も左および最も右端の間違った塩基を有する疑似ポジティブkの存在 の場合に、pSFを明白な重なりの可能性のために生成する。一般のk−1シー クエンスを有する疑似ポジティブおよび疑似ネガティブのkの両方が、ファイル に存在するとき、pSFはを発生し、これらのpSFの一つは、適切な待ったt nで間違ったkを含む。 シークエンスにおける失敗を有するサブフラグメントを直す方法、および明白 に接続されたpSFの結合は、サブフラグメントの発生の後、およびサブフラグ メントを順番にする方法において実行される。接続されないpSFを切断し、p SFの明白な接続によって最終サブフラグメントを得るこをからなる第一工程を 、下に記載する。 誤って連結されたサブフラグメントの形成のアプローチは2つある。第1にお いて、誤ったk個組がk−1長の反復シークエンスのアセンブリの点上に出現し た場合、誤りが発生する。第2では、反復シークエンスはk−1よりも短い。こ れらの状況は、それぞれ2つの変異体において発生する。第1の変異体では、反 復シークエンスの1つがフラグメントの末端を示す。第2の変異体では、反復シ ークエンスが、フラグメントのあらゆる位置で生ずる。第1の可能性(possibili ty)では、連結の誤り(misconnection) を生ずるために、幾つかのk個組がファイル(誤認ネガティブ)から存在しない ことが必要とされる。第2の可能性は、ファイル中に誤認ネガティブと誤認ポジ ティブの両方のk個組が存在することを必要とする。k−1シークエンスの反復 を考慮すると、末端のいずれか一方が内部的に繰り返されている場合には、唯一 1個のみのk個組の欠如で十分である。厳密に内部的な反復には、2つの欠如が 必要とされる。この理由は、シークエンスの末端が情報科学的には誤認ネガティ ブk個組の終わりのない直鎖状の配列であると考えられることによる。「k−1 個の場合より短い」ということから2つまたは3つの特異的で間違ったk個組を 必要とするk−2個の長さの反復シークエンスのみが考えられる。これらが実際 の実験において検出される唯一の場合であることは非常にありそうなことであり 、それ以外はほとんど稀である。 反復シークエンスがフラグメントの末端に現れない場合には、誤って連結され たサブフラグメントの認識はさらに厳密に定義される。この状況において、さら に2つのサブフラグメントを検出でき、そのうちの一方はその最も左に、かつ他 方はその最も右に、末端k−2個のシークエンスを含有し、このシークエンスも 、上記の誤って連結されたサブフラグメントに存在する。反復シークエンスがフ ラグメントの末端にある場合、k−2シークエンスを含有する1つのみのサブフ ラグメントがあり、その最左端または最右端でサブフラグメント形成における誤 りを生ずる。 誤って連結されたサブフラグメントの切断(cutting)による除去は、通常の規 則に従って行われる。あらゆるサブフラグメントのk−2の長さの最左端または 最右端シークエンスが他のサブフラグメントに存在する場合、そのサブフラグメ ントは、2つのサブフラグメントに切断されるべきであり、それらの各々はk− 2シークエンスを含有する。この規則は、反復k−1シークエンスの点上に1つ 以上の誤認のネガティブk個組がある場合、反復末端の稀有な状況を包含しない 。この種の誤って連結されたサブフラグメントは、オーバーラップしたフラグメ ント、または基本的およびオーダー(ordering)ライブラリーの情報フラグメント からの情報を用いて認識 可能である。さらに、2つ以上の誤認のネガティブk個組が、同一のk−1シー クエンスを含有する両方の位置で生ずる場合、この誤って連結されたサブフラグ メントは残留する。これは、非常に稀な状況である。その理由は、それが、少な くとも4つの特異的な誤認のk個組を必要とするからである。特定のシークエン スが、1つのサブフラグメントの末端および出発からk−2以下の短さの配列の 組み合わせにより得られる場合には、もうひとつの規則を導入して、長さkのシ ークエンス上のこれらのサブフラグメントを切断することが可能である。 記載した規則を厳密に適用することにより、幾つかの完全性が失われて、出力 の精度が確実になる。上記サブフラグメントの幾つかは、誤って連結されていな いにもかかわらず、切断されるであろう。その理由は、それらが、誤って連結さ れたサブフラグメントのパターンに適合するからである。この種の幾つかの状況 がある。例えば、フラグメントは、少なくとも2つの同一のk−1シークエンス に加えて、k−1からのあらゆるk−2シークエンスを含有するか、あるいは、 少なくとも2回繰り返されるk−2シークエンスと、特定のk−2シークエンス をその中心等に含有する少なくとも1つの誤認のネガティブk個組を含有する。 アルゴリズムのこの部分の目的は、pSFの数を、補正シークエンスを有する 長いサブフラグメントの最小数まで低減することである。独特に長いサブフラグ メントまたは完全なシークエンスの生成は、2つの状況において可能である。第 1の状況は、反復k−1語の特定の順番に関係する。最大に延長されたpSF( pSFの最初のグループ)の幾つか、または全てを特有に並べることが可能な場 合がある。例えば、フラグメントS−R1−a−R2−b−R1−c−R2−E (そこにおいて、SおよびEはフラグメントの開始および末端であり、a、bお よびcは各サブフラグメントに特異的な異なるシークエンスであり、R1および R2は縦一列に繰り返された2つのk−1シークエンスである)において、5つ のフラグメントが生ずる(S−R1、R1−a−R2、R2−b−R1、R1− c−R2およびR−E)。それらは、2つの方法で並べられる。すなわち、上記 のオリジナルのシークエンスまたはS−R1−c−R−b−R1−a−R−Eで ある。一方、同じ数および種類の反復シークエンスを有するが異なって並べられ たフラグメント(すなわち、S−R1−a−R1−b−R−c−R−E)では、 全てのサブフラグメントを含有する他のシークエンスはない。この種類の例は、 pSFの生成のプロセスの後でのみ、認識可能である。それらは、pSF生成の 方法における2つの工程の必要性を示す。ファイルが誤認のネガティブおよび/ またはポジティブなk個組を含有する場合、非反復k−1シークエンスの位置で の誤認の短いサブフラグメント生成の第2の状況はさらに重要である。 両方のpSF群の溶液(solution)は、2つの部分を含有する。第1に、存在し ない最小のサブフラグメントとして現れる誤認のポジティブなk個組が取り除か れる。いずれか一方の末端に(一方の末端にk−aより長い長さの、かつ他方に k−bより長い長さの)オーバーラップを有さない長さkの全てのk個組のサブ フラグメントは除かれて、最大数の連結の形成を可能にする。我々の実験におい て、aおよびbの値がそれぞれ2および3であることが、十分な数の誤認のポジ ティブk個組を除くのに適当であることがわかる。 独自に連結可能なサブフラグメントの併合は、第2の工程で達成される。連結 の規則は以下のとおりである。つまり、2つのサブフラグメントの関連する末端 または開始におけるオーバーラップ・シークエンスが、他のサブフラグメントの 開始および/または末端に存在しない場合、およびそのような場合にのみ、2つ のサブフラグメントははっきりと連結される。 例外は、考慮される対からの1つのサブフラグメントが同一の始まりおよび末 端を有する場合である。そのような場合、例え、ファイルに存在する末端と同一 の末端を有するもう1つのサブフラグメントがあったとしても、連結は可能にな る。ここにおける主な問題は、オーバーラップ・シークエンスの正確な定義であ る。唯一1対のサブフラグメントに特有のオーバーラップ・シークエンスがk− 2よりも短い場合、あるいは、k−2以上であるが、k−4より長い長さのオー バーラップ・シークエンスを有す る別のサブフラグメントが存在する場合、連結は可能にはならない。さらに、p SFの規範的な末端と1つ(また数個)の最後の塩基を除いた後の末端の両方も 、オーバーラップ・シークエンスと考えられる。 この工程の後、幾つかの誤認のポジティブk個組(最小のサブフラグメント) および正しくない末端を有する幾つかのサブフラグメントは生き残る。さらに、 特定の数の或る特異的誤認k個組が同時に存在する種々の稀有な状況において、 誤った連結が起こる。これらの場合は検出され、サブフラグメントオーダープロ セス、および切断されない「ミクロ連結された」サブフラグメントの取り扱いと 共にもう1つの調節工程において解決される。 得られる短いサブフラグメントは、2種類である。通常の場合において、これ らのサブフラグメントは、反復k−1シークエンスの分布により、それらの中で はっきりと(unambiguously)連結される。これは、pSF生成のプロセスの後で 行われ、pSF生成のプロセスにおいて2つの工程が必要とされる良い例である 。誤認のポジティブおよび/または誤認のネガティブなk個組を含有するファイ ルを用いる場合、短いpSFが、非反復k−1シークエンスの部位に得られる。 誤認のポジティブなk個組を考慮すると、k個組は、1つ以上の正しくない塩基 を含有し(あるいは、中心のどこかに1つの正しくない塩基を含有し)、さらに 末端にk個組を含有する。短く誤った(誤って連結された)サブフラグメントの 生成は、後者のk個組により起こる。前者の種類のk個組は、k個組の長さと等 しい長さを有する間違ったpSFを示す。 アルゴリズムのpSF部の併合の目的は、正しいシークエンスを有するpSF の数を長いサブフラグメントの最小数で低減することである。一方の末端におけ る長さがk−aよりも長く、かつ、他方の末端における長さがk−bよりも長く 、いずれの末端にもオーバーラップを有さない全てのk個組のサブフラグメント は、取り除いて、最大数の連結を可能にする。このようにして、誤認のポジティ ブk個組の大部分が捨てられる。連結の規則は、次のとおりである。すなわち、 2つのサブフラグメントの関連す る末端または開始のオーバーラップ・シークエンスがあらゆる他のサブフラグメ ントの開始および/または末端に存在しない場合、かつそのような場合にのみ、 2つのサブフラグメントは、はっきりと連結可能である。例外は、同一の開始お よび末端を有するサブフラグメントである。その場合、連結は可能になるが、た だし、ファイルに存在するのと同一の末端を有するもう1つのサブフラグメント がある。ここにおける主な問題は、オーバーラップ・シークエンスの正確な定義 である。少なくとも2つの特異的な誤認のネガティブk個組がk−1またはk− 2シークエンスの反復の点に存在すること、さらには誤認のポジティブおよび誤 認のネガティブk個組を組み合わせることは、幾つかのオーバーラップ・シーク エンスを破壊または「マスク」して、明白な、しかし誤ったpSFの連結を生ず る可能性がある。これを防止するために、完全性が正確さを犠牲にしなければな らない。連結は、k−2より短い末端シークエンスにおいて、および、k−4よ り長い特別な(extra)オーバーラップ・シークエンスの存在下では可能ではない 。オーバーラップ・シークエンスは、pSFの末端から決定されるか、あるいは 最後の塩基の1つまたは数個を削除する。 非常に稀有な状況において、特定の数の或る特異的な誤認ポジティブおよび誤 認ネガティブk個組が存在する場合、誤った末端を有する幾つかのサブフラグメ ントは製造可能であり、幾つかの誤認のポジティブなk個組(最小のサブフラグ メントとして)は残存するか、あるいは、誤った連結が起こる。これらのケース は検出され、サブフラグメントオーダープロセスにおいて、かつ別の調節工程に おいて切断されない誤って連結されたサブフラグメントと共に、解明される。 サブフラグメントのオーダーのプロセスは、それらの生成のプロセスと同じで ある。サブフラグメントを長いk個組と考える場合、オーダー(ordering)は、そ れらの曖昧でない連結により、オーバーラップ末端により行われる。曖昧でない 連結の情報の根拠は、基本ライブラリーのフラグメントにおいて生成されるサブ フラグメントを、それらのフラグメントのセグメントを示すグループへ分割する ことである。この方法は、関連の連結 シークエンスを有する長いオリゴヌクレオチドを用いたハイブリダイゼーション に基づく、この問題の生化学的解決と類似する。連結シークエンスは、基本的ラ イブラリーのフラグメントの関連のセグメントのk個組のセットを用いて、サブ フラグメントとして生成される。関連のフラグメントは、基本的ライブラリーの それぞれのフラグメントとオーバーラップするオーダーライブラリー(ordering library)のフラグメントにより定義される。最も短いセグメントは、オーダーラ イブラリーの情報フラグメントである。長いものは、幾つかの隣接する情報フラ グメントまたはオーダーおよび基本的ライブラリーに対応するフラグメントの全 オーバーラップ部分である。別の試料の数を低減するために、オーダーライブラ リーのフラグメントは、ランダムにプールされ、特有のk個組含量が求められる 。 オーダーライブラリーにおける多数のフラグメントを用いることにより、非常 に短いセグメントが生成され、したがって、サブフラグメントの生成の理由であ るk−1シークエンスの多重の外観の可能性が低下する。さらに、基本的ライブ ラリーの特定のフラグメントの種々の領域から構成される長いセグメントは、幾 つかの反復k−1シークエンスを含有しない。あらゆるセグメントにおいて、連 結シークエンス(連結サブフラグメント)は、特定のフラグメントからの特定の 対のサブフラグメントに対して生ずる。オーダーのプロセスは、3つの工程から なる。すなわち、(1)各セグメントのk個組の含量(contents)の生成、(2) 各セグメントにおけるサブフラグメントの生成、および(3)サブセグメントの サブフラグメントの連結である。第1のセグメントは、基本的ライブラリーの特 定にフラグメントのk個組の含量とオーダーライブラリーのプールのk個組の含 量との有意の交差点(intersections)および差(differences)として定義される。 第2の(短い方の)セグメントは、第1のセグメントのk個組の含量の交差点お よび差として定義される。 誤認のポジティブおよびネガティブ両方のk個組を差および交差点の両方に蓄 積することの問題がある。出発シークエンスからの誤認のネガティブなk個組は 、交差点(オーバーラップ部)に蓄積し、同様に、誤認のポ ジティブk個組は両方のシークエンスにランダムに生じ、関連するオーバーラッ プ領域に生じるのではない。一方、出発シークエンスのいずれか一方からの誤認 のポジティブの大部分は、交差点に吸収(taken up)されない。これは、それらと オーバーラップするフラグメントからの情報を用いることによる、各フラグメン トからの実験エラーの低減の例である。誤認のk個組は、別の理由からその差に 蓄積する。最初のシークエンスからの誤認のネガティブのセットは、誤認のポジ ティブに対して拡大され、誤認のポジティブのセットは、エラーによって交差点 に含まれない(つまり、交差点において誤認のネガティブである)k個組に対し て拡大される。出発シークエンスが10%の誤認のネガティブなデータを含む場 合、第1および第2の交差点はそれぞれ19%および28%の誤認のネガティブ なk個組を含有する。一方、基本的フラグメントおよびプールがそれぞれ500 bpおよび10,000bpを有する場合には、77という誤認のポジティブの 数学的予想が予期される。しかし、「失われた」k個組の大部分を回収する可能 性および誤認のポジティブのk個組の大部分を除去する可能性がある。 第1に、特定の対のk個組の含量の交差点として特定のセグメントに対するk 個組の塩基含有量を決定しなければならない。これに続いて、交差点における出 発k個組含量の全てのk個組を包含し、これは、一方の末端にk−1を含有し、 他方の末端に基本的セット2つのk個組の末端に生ずるk−+シークエンスを含 有する。これは、差が生ずる前に行われ、したがって、そのプロセスにおける誤 認のポジティブの蓄積を防止する。それに続いて、k個組のセットの同じ種類の 拡大(enlargement)が、借り入れ(borrowing)が交差点からである差異(distincti on)との差に適用される。全ての借用されたk個組は、誤認の交差点から誤認の ポジティブとして削除される。 交差(すなわち、1セットの通常のk個組)は、各対に対して(基本的フラグ メント)×(オーダーライブラリーのプール)で定義される。セットにおけるk 個組の数が著しい場合、記載の規則に従って、誤認のネガテ ィブで延長される。第1の差のセットは、特定の基本的フラグメントから得られ た交差点のセットを差し引くことにより得られる。誤認にネガティブなk個組は 、記載の規則に従って、交差点のセットから借りることにより差のセットに追加 され、同時に、誤認にポジティブk個組として交差点のセットから除去される。 基本的フラグメントがプールされたフラグメントよりも長い場合、この差は、さ らなる工程においてその有用性が幾分か低下した2つの別々のセグメントを示す 。第1のセグメントは、相当数のk個組を含有する対(基本的フラグメント)× (オーダーライブラリーのプール)の全ての生じた交差点および差である。第2 のフラグメントのk個組のセットは、第1のセグメントの全ての可能な対のk個 組のセットの比較により得られる。この2つの差は、相当数のk個組で交差点を 生ずる各対から定義される。オーバーラップしたフラグメントの入手可能な情報 の大部分は、この工程において回収されて、交差点および差を形成する第3ラウ ンドから得られるべきものがほとんどないようにする。 (2)セグメントのサブフラグメントの生成は、基本的ライブラリーのフラグ メントについて記載されたものと同様に行われる。 (3)サブフラグメントの連結方法は、特定の基本的ライブラリー・フラグメ ントからのサブフラグメント(幾つかのオーバーラップした末端を有する)の中 でサブフラグメントの正しく連結された対を連続的に決定する工程とから構成さ れる。4つの関連するサブフラグメント(その2つは同一の開始を含有し、2つ は、同一の末端を有する)の場合、連結可能なサブフラグメントの4つの異なる 対がある。通常、2つは正しく、2つは誤っている。正しいものを見つけるため に、特定の基本的フラグメントに対する全ての第1および第2のセグメントから 生ずるサブフラグメントにおいて、各対の連結シークエンス(connectiong seque nce)の存在が試験される。連結シークエンスの長さおよび位置は、偶然に生ずる シークエンスの妨害を回避するように選ばれる。それらはk+2またはそれ以上 であり、特定の対の両方のサブフラグメントにおいて、オーバーラップシークエ ンス以外に、少なくとも1つの要素2を含有する。連結は、2つの連結シー クエンスが見いだされ、かつ残留する2つが存在しない場合にのみ可能である。 2つの連結したサブフラグメントは、ファイル中で前者のサブフラグメントを置 き換え、このプロセスは周期的に繰り返される。 このステップにおいて反復シークエンスを生じる。これは、いくつかのサブフ ラグメントが1回以上架橋されたサブフラグメントに含まれることを意味する。 上記サブフラグメントは、関連した結合するシークエンスを発見することによっ て認識されるであろう。そのシークエンスは一つのサブフラグメントを二つの異 なるサブフラグメントに組み合わせるものである。 pSFs構築方法およびpSFsをより長いサブフラグメントに合体させる方 法の実施中において生じる誤認結合したサブフラグメントについての認識は、既 知の基本的なフラグメントに由来するサブフラグメントのシークエンスがフラグ メントに関するセグメント中に生じるサブフラグメントのシークエンス中に存在 するか否かについての試験に基づいている。誤った結合位置からのスークエンス は誤認結合したサブフラグメントを示すものとしては発見されないであろう。 サブフラグメントの順番における上記三つのステップの他に、いくつかの付加 的なコントロールステップまたは特定のシークエンスに適用可能なステップは、 誤りなしに、より完全なシークエンスを生じさせるために必要であろう。 どのセグメントに属するサブフラグメントであるかの決定はセグメントおよび サブフラグメントにおけるk個組の含有量を比較することにより実行される。k 個組含有量におけるエラーのために(プール中の初期エラーおよびk個組の発生 頻度による統計的なエラー)、サブフラグメントの正確な分割は不可能である。 このように、「全部の分割または全くなしの分割」に代えて、既知のセグメント (P(sf,s))からのチャンスがサブフラグメント毎に決められる。この可 能性は、k個組の長さ、サブフラグメントの長さ、順番ライブラリーのフラグメ ントの長さ、プールの大きさおよびファイル中の間違ったk個組のパーセントの 関数である。 ここで、Lsfはサブフラグメントの長さであり、Ckは既知のサブフラグメ ントとセグメントとの対に共通するk個組の数であり、およびFはk個組の長さ 、基本的なライブラリーのフラグメント、プールの大きさおよびエラーのパーセ ント間の関係を含むパラメータである。 特別のセグメントによるものとされるサブフラグメントは余分な短pSFsと して処理され、明白な結合プロセスに供される。明白な結合の定義は、このケー スにおいてはやや異なる。というのは、重複する末端を有するサブフラグメント が考慮されたセグメントに属するという確率に基づいているからである。なお、 明白な結合の正確性は、他のセグメントにおけるこれらのサブフラグメントの結 合に続けてコントロールされる。異なるセグメントにおける結合後、得られたサ ブフラグメントの全ては共に合体され、より長いサブフラグメント内に含まれる より短いサブフラグメントは排除され、残りのサブフラグメントは通常の結合プ ロセスに供される。シークエンスが完全に再生されない場合には、サブフラグメ ントの分割および結合のプロセスは、特別なセグメントに属する確率基準と同一 かそれ以下の厳格性で反復され、その後、明白な結合がなされる。 明白な重複を定義するための厳格な基準を用いて、いくつかの情報は用いられ ない。完全なシークエンスに代えて、既知のフラグメントに関する確率の数を定 義するいくつかのサブフラグメントが得られる。厳格でない基準を用いると正確 で完全なシークエンスが生じる。例えば誤認結合などのいくつかの状況において 、完全で、しかし不正確なシークエンスを生じる可能があり、あるいはサブフラ グメント間に結合がない「モンスター」サブフラグメントを生じる。このように 、基本的なライブラリのサブフラグメント毎に、a)一つが正確であるいくつか の可能な溶液、およびb)ほとんど良さそうな正確な溶液を得る。また、非常に 小さい数字のケースでは、サブフラグメント生成プロセスにおける誤りのため、 あるいは属す る確率の特定の割合いのために、明白な溶液は生じず、すなわち一つの最も予想 される溶液である。これらのケースは不完全シークエンスとして残る。すなわち 、明白な溶液は基本的なライブラリの他の重複フラグメントとの間でデータを比 較することによって得られる。 上述のアルゴリズムは不規則的に生じた50kbシークエンス上で試験された 。そのシークエンスはヒトゲノムのGC含有量をシミュレートしたGCを40% 含む。このシークエンスの中間部には、約4kbの全長を有し、種々の全体およ びいくつかの他の反復シークエンスが挿入された。試験管内におけるSBH実験 をシミュレートするために、続く操作を実行し適切なデータを準備した。 5kb重複する60個の「クローン」の位置は、基本的なライブラリの標本を シミュレートするために、不規則的に定義された: 500bpの「クローン」の1000分の1の位置は順番のライブラリの製造 をシミュレートするための不規則的に決められた。これらのフラグメントは上記 セグメントから抽出された。20のフラグメントの不規則プールを作製し、プー ルのk個組セットを決め、ハードディスク上に記憶させた。これらのデータはサ ブフラグメントの順番の段階で用いられている:同一密度のクローンに関し、基 本的なライブラリにおける400万のクローンおよび順番ライブラリにおける3 00万のクローンは全ヒトゲノムに用いられる。700万のクローンの総数は、 ゲノムDNAのほとんど全部の不規則的なクローニングおよびゲル一塩基化法( gel−based method)により配列する長さの数kbのクローン数 よりも少ない数で折り畳まれている。 5kbのフラグメントの開始部分および末端部分のデータから、117個の「 情報フラグメント」はその配列が決定された。これに続き、単体の「情報フラグ メント」が構成する重複k個組のセットが決定された。所定のリストに整合する k個組のサブセットのみを用いた。上記リストは65%の8量体(8−mers )、30%の9量体(9−mers)および5%の10〜12量体(10−12 −mers)を含む。生成のプロセス およびサブフラグメントの順番はこれらのデータに基づいて実行された。 アルゴリズムの試験は、二つの実験においてシミュレートしたデータ上で実行 された。50個の「情報フラグメント」のシークエンスは、100%正確なデー タセット(20,000bp以上)と、10%の誤ったk個組(5%のポジティ ブフラグメントおよび5%のネガティブフラグメント)を有する26個の「情報 フラグメント」とで再生した。 最初の実験では、全てのサブフラグメントは正確であり、50個の「情報フラ グメント」のうち一つだけ、シークエンスが完全に再生しておらず、5個がサブ フラグメントの形態で残っていた。順番ライブラリの重複フラグメントの位置の 分析では、5個のサブフラグメントの独特の順番に関する情報を欠いていること を示した。サブフラグメントは、1−2−3−4−5と 1−4−3−2−5の重複する末端に基づく二つの方法で結合され得る。相違は サブフラグメント2と4の位置が交換されていろ点だけである。サブフラグメン ト2、3および4は相対的に短い(約100bpのトータル)ので、この場合、 サブフラグメント3の領域においては順番ライブラリのフラグメントは開始も終 了もしないという相対的に大きなチャンスが存在し、発生する。 実際のシークエンスをシミュレートするために、いくつかの誤り(ハイブリダ イゼーション)データを多くの実験中に入力データとして含めた。オリゴマーハ イブリダイゼーション実験では、所定の条件下で、信頼できないデータを出した ケースは末端不整合ハイブリダイゼーションと全整合ハイブリダイゼーションと の関係だけである。従って、シミュレートする場合、本物とはどちらかの末端上 の単独のエレメントを異にするk個組のみはポジティブな誤りであると考えられ た。これらの誤りのセットは次のように生成される。「情報フラグメント」のk 個組のオリジナルセット上には、5%のポジティブな誤りのk個組のサブセット が加えられている。ポジティブな誤りのk個組は、上記セットからk個組を不規 則的にピックアップし、それを複製し、始まり部分、終了部分上のヌクレオチド を変え ることによって作製される。これに続いて、不規則的に選択した5%のk個組の サブセットを差し引く。この方法では、最も複雑化されたケースの統計的に期待 された数は、正確なk個組が末端で誤った塩基を有するk個組に置換されたとき に得られる。 上述のように、k個組のセットの生成は10%の誤ったデータまで導く。この 値は、複製され、変えられ、消去されるべきk個組の不規則的な選択のために、 ケースによって変わる。にもかかわらず、このパーセンテージは、実際のハイブ リダイゼーション実験における信頼できないデータ量の3〜4倍を越える。導入 された10%のエラーは、基本的なライブラリ(基本的なライブラリ情報フラグ メント)のフラグメントとセグメントにおけるサブフラグメント数で増加する二 つ折りに導く。約110%の最終的なサブフラグメントは、ポジティブな誤り( サブフラグメントの主生成参照)を含むk個組に関し期待されているように誤っ た塩基を末端に有している。サブフラグメントの誤った結合のケースも誤ったシ ークエンスを有するサブフラグメントも観察されなかった。完全なシークエンス を順番プロセスにおいて実験した26個のうち四つの情報フラグメントは再生さ れなかった。上記四つの消す全てにおいて、シークエンスは同一のセグメントに 含まれた、いくつかの、より長いサブフラグメントと、いくつかの、より短いサ ブフラグメントの形態で得られた。この結果はアルゴリズム原理が誤ったデータ を大きなパーセンテージで機能させたことを示す。 k個組含有量からシークエンスの生成の成功は完全性および正確性という言語 で記述され得る。生成プロセスでは、二つの特別な状況が定義され得る。一つは 情報の一部が生成されたシークエンス中で欠けているが、曖昧であり、欠けてい る部分がどのタイプに属しているかを知っている状況である。二つ目は得られた 再生シークエンスが生成されたk個組含有量からのシークエンスと整合していな いが、失敗が検出されている状況である。アルゴリズムがその理論的限界に発展 していると仮定すると、正確なk個組の使用において最初の状況のみが起こり得 る。不完全さの結果は、明白に命令できない確かな数のサブフラグメントにおい て出ており、単純なシ ークエンスの正確な長さ、すなわち完全なタンデムの繰り返し数を決定する問題 にも出ている。 誤認のk個組を用いると、正しくないシークエンスが生成される。誤りの理由 は、アルゴリズムの欠点にあるのではなく、k個組の特定の含量が、最初のもの と異なるシークエンスをはっきりと示す、という事実にある。ファイル中に存在 する誤認のk個組の種類に応じて、エラーの3つのクラスが定義できる。誤認の ネガティブなk個組(誤認のポジティブを伴わない)は「欠失」を生じる。誤認 のポジティブなk個組は「延長(等しくない乗換えまたは交叉)」を生じている 。誤認のネガティブを伴う誤認のポジティブは、「挿入」が単独で、あるいは「 欠失」を伴って生じる理由である。この「欠失」は、サブフラグメントの2つの 可能な開始の間のk個組の全て(またはその大部分)が誤認のネガティブである 場合に生じる。シークエンスにおける全ての位置がk個組により定義されるので 、通常の場合における欠失の発生は、k個の連続的な誤認ネガティブを必要とす る。(誤認のネガティブが10%であり、かつk=8である場合、この状況は、 108要素毎に起こる。)この状況は、10のゲノム当量(genome equivalents) を含有するランダムなライブラリーを用いた哺乳動物のゲノムの塩基配列決定に おいてさえも、極めて稀である。 誤認のポジティブなk個組により引き起こされるシークエンスの末端の延長は 、「挿入」の特別な場合である。その理由は、シークエンスの末端が、誤認のポ ジティブなk個組の無限に繰り返される直鎖状の配列として考えることが可能で あるからである。1つのk個組よりも長いサブフラグメントを生ずる誤認のポジ ティブなk個組の群を考えてもよい。この種の状況は、サブフラグメントが、オ ーダーライブラリーのランダムな物理的フラグメントのように、オーバーラップ ・フラグメントに生ずる場合に検出される。挿入、または欠失の代わりの挿入は 、誤認のポジティブおよび誤認のネガティブなk個組の特異的な結合の結果とし て起こりうる。第1の場合において、連続的な誤認のネガティブの数は、kより も小さい。両方の場合は、幾つかのオーバーラップしている誤認のポジティブな k個組 を必要とする。挿入および欠失は、かなり大きな実施上の反動のない、ほとんど 理論上の可能性である。その理由は、誤認のk個組の数および特異性における要 件が単純に高すぎるからである。 誤認のポジティブおよびネガティブの最小数および種類の理論上の要件に全く 合致しない全ての他の状況において、k個組の含量における誤りにより、生じる シークエンスの低い完全性のみを生ずる。

Claims (1)

  1. 【特許請求の範囲】 1. ハイブリダイゼーション法によって核酸を分析する方法であって、 基質の第1のセクタ上に第1の複数の核酸セグメントを配列する配列ステップ と、 前記基質の第2のセクタ上に第2の複数の核酸セグメントを配置する配置ステ ップと、 完全な相補性と一塩基の不整合とを弁別する条件下で、第1の複数の核酸セグ メントを、前記第1のセクタにあり、かつ前記第1の複数の核酸セグメントの一 つよりも短い第1のハイブリダイゼーションプローブに作用させる作用ステップ と、 完全な相補性と一塩基の不整合とを弁別する条件下で、前記第2のセクタにあ り、また前記第2の複数の核酸セグメントの一つのセグメントよりも短く、かつ 前記第1のハイブリッド・プローブとは異なる配列を持つ第2のハイブリダイゼ ーションプローブをインキュベートするインキュベーション・ステップと、 核酸セグメントに対するハイブリダイゼーションプローブのハイブリダイゼー ションを検出する検出ステップと、 結果を分析する分析ステップとを有することを特徴とする核酸分析方法。 2.請求項1に記載の方法であって、 さらに、前記配置ステップに先だって、核酸の移動に対する障壁を導入する導 入ステップを有することを特徴とする核酸分析方法。 3.請求項1に記載の方法であって、 前記配列ステップおよび前記配置ステップの後であり、また前記インキュベー ション・ステップに先だって、核酸の移動に対する障壁を導入する導入ステップ を有することを特徴とする核酸分析方法。 4.請求項3に記載の方法であって、 前記導入ステップは、前記基質に対して物理的障壁を押しつけることを特徴と する核酸分析方法。 5.請求項2に記載の方法であって、 前記導入ステップは、前記セクタ間のプローブの混合を防ぐために前記支持体 に対して垂直な方向切り換え電界を印加することを特徴とする核酸分析方法。 6.請求項3に記載の方法であって、 前記導入ステップは、前記セクタ間のプローブの混合を防ぐために前記支持体 に対して垂直な方向切り換え電界を印加することを特徴とする核酸分析方法。 7.請求項1に記載の方法であって、 前記配列ステップは、ピン配列の手段によって核酸試料をスポッティングする スポッティングステップを含むことを特徴とする核酸分析方法。 8.請求項1に記載の方法であって、 前記配列ステップは、管の配列によって核酸を分配する分配ステップを含むこ とを特徴とする核酸分析方法。 9.請求項1に記載の方法であって、 核酸試料をジェット印刷する印刷ステップを含むことを特徴とする核酸分析方 法。 10.請求項1に記載の方法であって、 前記作用ステップは、複数の連続的にハイブリダイズするプローブを適 用する適用ステップを有することを特徴とする核酸分析方法。 11.請求項1に記載の方法であって、 前記インキュベーション・ステップは、複数の連続的にハイブリダイズするプ ローブを適用するステップを有することを特徴とする核酸分析方法。 12.請求項10に記載の方法であって、 少なくとも2つの前記連続的にハイブリダイズするプローブをリゲートするリ ゲーションステップを有することを特徴とする核酸分析方法。 13.請求項11に記載の方法であって、 少なくとも2つの前記連続的にハイブリダイズするプローブをリゲートするリ ゲーションステップを有することを特徴とする核酸分析方法。 14.請求項1に記載の方法であって、 前記作用ステップは、重なり合った核酸配列を持つ複数の拮抗的にハイブリダ イズするプローブを適用するステップを有することを特徴とする核酸分析方法。 15.請求項1に記載の方法であって、 前記インキュベーション・ステップは、重なり合った核酸配列を持つ複数の拮 抗的にハイブリダイズするプローブを適用するステップを有することを特徴とす る核酸分析方法。 16.請求項1に記載の方法であって、 少なくとも2つの前記第1の複数の核酸セグメントは混合物として配列される ことを特徴とする核酸分析方法。 17.請求項1に記載の方法であって、 少なくとも2つの前記第2の複数の核酸セグメントは混合物として配列される ことを特徴とする核酸分析方法。 18.請求項1に記載の方法であって、 HgI型制限酵素による消化によって試料を調製し、得られた制限フラグメン トにアンカーをリゲーションするステップをさらに有することを特徴とする核酸 分析方法。 19.請求項1に記載の方法であって、 所定の長さのプローブの普遍的セットからプローブを選択するステップをさら に有することを特徴とする核酸分析方法。 20.請求項1に記載の方法であって、 所定の長さのプローブの普遍的セットからプローブを選択するステップをさら に有することを特徴とする核酸分析方法。 21.請求項1に記載の方法であって、 デオキシリボヌクレオチド・プローブを選択するステップをさらに有すること を特徴とする核酸分析方法。 22.請求項1に記載の方法であって、 リボヌクレオチド・プローブを選択するステップをさらに有することを特徴と する核酸分析方法。 23.請求項1に記載の方法であって、 タンパク質核酸プローブと塩基類似体含有プローブとからなる群から選択され る核酸類自体を選択するステップをさらに有することを特徴とする核酸分析方法 。 24.請求項1に記載の方法であって、 プローブを多重標識するステップをさらに有することを特徴とする核酸分析方 法。 25.請求項1に記載の方法であって、 ハイブリダイゼーションしていないプローブ上の標識を劣化させるステップを 含むことを特徴とする核酸分析方法。 26.請求項19に記載の方法であって、 前記作用ステップまたは前記インキュベーション・ステップは、普遍的プロー ブを長さが6,7,8,9,または10塩基であるセットに集合させるステップ を含むことを特徴とする核酸分析方法。 27.請求項19に記載の方法であって、 前記作用ステップまたは前記インキュベーション・ステップは、遍的プローブ のセットを長さが6,7,8,9,または10塩基に集合させるステップを含む ことを特徴とする核酸分析方法。 28.請求項20に記載の方法であって、 前記作用ステップまたは前記インキュベーション・ステップは、プローブのセ ットを長さが5,6,7,8,9,10,11,12,13,14,15,16 ,17,18,19,20,21,22,23,24,25,26,27,28 ,29,または30塩基に集合させるステップを含むことを特徴とする核酸分析 方法。 29.ハイブリダイゼーションによって核酸を分析する装置であって、 核酸フラグメントを付着する点を持つ基質を備え、該基質は疎水性領域によっ てセグメント化されることを特徴とする核酸分析装置。 30.請求項20に記載の方法であって、 前記配置ステップは、プローブのセットを長さが5,6,7,8,9,10, 11,12,13,14,15,16,17,18,19,20,21,22, 23,24,25,26,27,28,29,または30塩基に集合させるステ ップを含むことを特徴とする核酸分析方法。 31.請求項1に記載の方法であって、 前記少なくとも2つの塩基を含む重なり合った核酸シークエンスを有する2つ 以上のプローブのハイブリダイゼーションを検知することによって、セグメント の少なくとも2つの塩基の相対的順序を確認するステップをさらに有することを 特徴とする核酸分析方法。 32.核酸の配列を分析する方法であって、 プローブの配列に試料を導入するステップと、 試料分子の主な部分が所定の時間でリゲーションしたプローブによって解離す る温度に設定するステップと、 混合物に標識されたプローブを添加するステップと、 混合物をリガーゼとインキュベーションするステップと、 遊離のプローブを除去するステップと、 リゲーション産物を検出するステップとを有することを特徴とする核酸配列分 析方法。 33.請求項1に記載の方法であって、所望の結果を改善するために追加のプロ ーブを定めるステップと、前記作用ステップ、前記インキュベーション・ステッ プ、前記検知および分析ステップを繰り返すステップとをさらに有することを特 徴とする核酸配列分析方法。 34.請求項1に記載の方法であって、前記複数の核酸配列を再利用するために プローブから基質を取り除くステップをさらに有することを特徴と する核酸配列分析方法。
JP8517814A 1994-12-09 1995-12-08 Dna塩基配列決定およびdna同定の方法および装置 Ceased JPH10512745A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/353,554 US6270961B1 (en) 1987-04-01 1994-12-09 Methods and apparatus for DNA sequencing and DNA identification
US08/353,554 1994-12-09
PCT/US1995/016154 WO1996017957A1 (en) 1994-12-09 1995-12-08 Methods and apparatus for dna sequencing and dna identification

Publications (1)

Publication Number Publication Date
JPH10512745A true JPH10512745A (ja) 1998-12-08

Family

ID=23389627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8517814A Ceased JPH10512745A (ja) 1994-12-09 1995-12-08 Dna塩基配列決定およびdna同定の方法および装置

Country Status (10)

Country Link
US (4) US6270961B1 (ja)
EP (1) EP0797683A4 (ja)
JP (1) JPH10512745A (ja)
KR (1) KR980700433A (ja)
CN (1) CN1175283A (ja)
AU (1) AU715506B2 (ja)
CA (1) CA2206815A1 (ja)
FI (1) FI972429A (ja)
NO (1) NO972535L (ja)
WO (1) WO1996017957A1 (ja)

Families Citing this family (228)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6270961B1 (en) * 1987-04-01 2001-08-07 Hyseq, Inc. Methods and apparatus for DNA sequencing and DNA identification
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6551784B2 (en) 1989-06-07 2003-04-22 Affymetrix Inc Method of comparing nucleic acid sequences
US6416952B1 (en) 1989-06-07 2002-07-09 Affymetrix, Inc. Photolithographic and other means for manufacturing arrays
US5925525A (en) * 1989-06-07 1999-07-20 Affymetrix, Inc. Method of identifying nucleotide differences
US5744101A (en) * 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US6919211B1 (en) * 1989-06-07 2005-07-19 Affymetrix, Inc. Polypeptide arrays
US6955915B2 (en) * 1989-06-07 2005-10-18 Affymetrix, Inc. Apparatus comprising polymers
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US6346413B1 (en) 1989-06-07 2002-02-12 Affymetrix, Inc. Polymer arrays
US5547839A (en) * 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US6506558B1 (en) 1990-03-07 2003-01-14 Affymetrix Inc. Very large scale immobilized polymer synthesis
DE69132843T2 (de) * 1990-12-06 2002-09-12 Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) Identifizierung von Nukleinsäuren in Proben
US6468740B1 (en) 1992-11-05 2002-10-22 Affymetrix, Inc. Cyclic and substituted immobilized molecular synthesis
US6401267B1 (en) * 1993-09-27 2002-06-11 Radoje Drmanac Methods and compositions for efficient nucleic acid sequencing
US6287850B1 (en) * 1995-06-07 2001-09-11 Affymetrix, Inc. Bioarray chip reaction apparatus and its manufacture
US8236493B2 (en) * 1994-10-21 2012-08-07 Affymetrix, Inc. Methods of enzymatic discrimination enhancement and surface-bound double-stranded DNA
US5795716A (en) * 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
US6312894B1 (en) 1995-04-03 2001-11-06 Epoch Pharmaceuticals, Inc. Hybridization and mismatch discrimination using oligonucleotides conjugated to minor groove binders
US5801155A (en) 1995-04-03 1998-09-01 Epoch Pharmaceuticals, Inc. Covalently linked oligonucleotide minor grove binder conjugates
US6720149B1 (en) * 1995-06-07 2004-04-13 Affymetrix, Inc. Methods for concurrently processing multiple biological chip assays
US6660233B1 (en) * 1996-01-16 2003-12-09 Beckman Coulter, Inc. Analytical biochemistry system with robotically carried bioarray
EP0880598A4 (en) 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
AU4495497A (en) 1996-09-19 1998-04-14 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
US6391550B1 (en) * 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
US20020042048A1 (en) * 1997-01-16 2002-04-11 Radoje Drmanac Methods and compositions for detection or quantification of nucleic acid species
US6297006B1 (en) * 1997-01-16 2001-10-02 Hyseq, Inc. Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
EP0972078B1 (en) 1997-03-20 2005-06-01 Affymetrix, Inc. (a California Corporation) Iterative resequencing
US20030036084A1 (en) * 1997-10-09 2003-02-20 Brian Hauser Nucleic acid detection method employing oligonucleotide probes affixed to particles and related compositions
US6322968B1 (en) 1997-11-21 2001-11-27 Orchid Biosciences, Inc. De novo or “universal” sequencing array
US7715989B2 (en) 1998-04-03 2010-05-11 Elitech Holding B.V. Systems and methods for predicting oligonucleotide melting temperature (TmS)
US6127121A (en) 1998-04-03 2000-10-03 Epoch Pharmaceuticals, Inc. Oligonucleotides containing pyrazolo[3,4-D]pyrimidines for hybridization and mismatch discrimination
US6683173B2 (en) 1998-04-03 2004-01-27 Epoch Biosciences, Inc. Tm leveling methods
US6949367B1 (en) 1998-04-03 2005-09-27 Epoch Pharmaceuticals, Inc. Modified oligonucleotides for mismatch discrimination
US7045610B2 (en) 1998-04-03 2006-05-16 Epoch Biosciences, Inc. Modified oligonucleotides for mismatch discrimination
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6872521B1 (en) 1998-06-16 2005-03-29 Beckman Coulter, Inc. Polymerase signaling assay
US6703228B1 (en) 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
EP1001037A3 (en) * 1998-09-28 2003-10-01 Whitehead Institute For Biomedical Research Pre-selection and isolation of single nucleotide polymorphisms
US7034143B1 (en) 1998-10-13 2006-04-25 Brown University Research Foundation Systems and methods for sequencing by hybridization
WO2000022171A2 (en) * 1998-10-13 2000-04-20 Brown University Research Foundation Systems and methods for sequencing by hybridization
US7071324B2 (en) 1998-10-13 2006-07-04 Brown University Research Foundation Systems and methods for sequencing by hybridization
US6545264B1 (en) 1998-10-30 2003-04-08 Affymetrix, Inc. Systems and methods for high performance scanning
ATE440148T1 (de) * 1999-01-06 2009-09-15 Callida Genomics Inc Verbesserte sequenzierung mittels hybridisierung durch verwendung von sondengemischen
US6635470B1 (en) 1999-01-08 2003-10-21 Applera Corporation Fiber array and methods for using and making same
US7595189B2 (en) 1999-01-08 2009-09-29 Applied Biosystems, Llc Integrated optics fiber array
JP2003527075A (ja) * 1999-03-25 2003-09-16 ハイセック,インコーポレーテッド ハイブリダイゼーションによる配列分析のための、溶液ベースの方法
US6516276B1 (en) * 1999-06-18 2003-02-04 Eos Biotechnology, Inc. Method and apparatus for analysis of data from biomolecular arrays
US6818395B1 (en) * 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7501245B2 (en) * 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
US6339147B1 (en) 1999-07-29 2002-01-15 Epoch Biosciences, Inc. Attachment of oligonucleotides to solid supports through Schiff base type linkages for capture and detection of nucleic acids
CA2386791A1 (en) 1999-10-08 2001-04-19 Protogene Laboratories, Inc. Method and apparatus for performing large numbers of reactions using array assembly
JP3668075B2 (ja) * 1999-10-12 2005-07-06 光夫 板倉 遺伝物質シーケンス決定用懸濁系、その懸濁系を用いた遺伝物質シーケンス決定方法およびその懸濁系を用いたSNPs高速スコアリング方法
US7668658B2 (en) * 1999-10-13 2010-02-23 Sequenom, Inc. Methods for generating databases and databases for identifying polymorphic genetic markers
US6660845B1 (en) 1999-11-23 2003-12-09 Epoch Biosciences, Inc. Non-aggregating, non-quenching oligomers comprising nucleotide analogues; methods of synthesis and use thereof
US20040081959A9 (en) 1999-12-08 2004-04-29 Epoch Biosciences, Inc. Fluorescent quenching detection reagents and methods
US7205105B2 (en) 1999-12-08 2007-04-17 Epoch Biosciences, Inc. Real-time linear detection probes: sensitive 5′-minor groove binder-containing probes for PCR analysis
US6727356B1 (en) 1999-12-08 2004-04-27 Epoch Pharmaceuticals, Inc. Fluorescent quenching detection reagents and methods
JP2003519495A (ja) * 2000-01-11 2003-06-24 マキシジェン, インコーポレイテッド 多様性生成およびスクリーニングのための一体化されたシステムおよび方法
EP1944310A3 (en) 2000-03-01 2008-08-06 Epoch Biosciences, Inc. Modified oligonucleotides for mismatch discrimination
WO2001064958A2 (en) 2000-03-01 2001-09-07 Epoch Bioscienecs, Inc. Modified oligonucleotides for mismatch discrimination
JP3502803B2 (ja) * 2000-03-06 2004-03-02 日立ソフトウエアエンジニアリング株式会社 マイクロアレイ、マイクロアレイ作製方法及びマイクロアレイにおけるピン間スポット量誤差補正方法
AU2001265121A1 (en) * 2000-05-30 2001-12-11 Applera Corporation Methods for detecting target nucleic acids using coupled ligation and amplification
ES2334639T3 (es) 2000-06-14 2010-03-15 Vistagen, Inc. Tipificacion de toxicidad empleando celulas madre hepaticas.
US7846733B2 (en) 2000-06-26 2010-12-07 Nugen Technologies, Inc. Methods and compositions for transcription-based nucleic acid amplification
US6913879B1 (en) * 2000-07-10 2005-07-05 Telechem International Inc. Microarray method of genotyping multiple samples at multiple LOCI
US6984522B2 (en) 2000-08-03 2006-01-10 Regents Of The University Of Michigan Isolation and use of solid tumor stem cells
US6681186B1 (en) 2000-09-08 2004-01-20 Paracel, Inc. System and method for improving the accuracy of DNA sequencing and error probability estimation through application of a mathematical model to the analysis of electropherograms
EP1427847B1 (en) 2000-12-13 2010-07-28 Nugen Technologies, Inc. Methods and compositions for generation of multiple copies of nucleic acid sequences and methods of detection thereof
CA2433419A1 (en) * 2001-01-02 2002-07-25 Stemron, Inc. A method for producing a population of homozygous stem cells having a pre-selected immunotype and/or genotype, cells suitable for transplant derived therefrom, and materials and methods using same
WO2003012147A1 (en) * 2001-02-20 2003-02-13 Datascope Investment Corp. Method for reusing standard blots and microarrays utilizing dna dendrimer technology
KR20030082535A (ko) 2001-03-09 2003-10-22 뉴젠 테크놀로지스 인코포레이티드 Rna 서열의 증폭을 위한 방법 및 조성물
CA2440754A1 (en) * 2001-03-12 2002-09-19 Stephen Quake Methods and apparatus for analyzing polynucleotide sequences by asynchronous base extension
DE10120798B4 (de) * 2001-04-27 2005-12-29 Genovoxx Gmbh Verfahren zur Bestimmung der Genexpression
US7138506B2 (en) * 2001-05-09 2006-11-21 Genetic Id, Na, Inc. Universal microarray system
US20030036073A1 (en) * 2001-06-07 2003-02-20 Saba James Anthony Matrix Sequencing: a novel method of polynucleotide analysis utilizing probes containing universal nucleotides
US6767731B2 (en) * 2001-08-27 2004-07-27 Intel Corporation Electron induced fluorescent method for nucleic acid sequencing
AU2002331777A1 (en) * 2001-08-30 2003-03-18 Spectral Genomics, Inc. Arrays comprising pre-labeled biological molecules and methods for making and using these arrays
EP1436424A4 (en) * 2001-09-18 2005-11-16 Us Genomics Inc DIFFERENTIAL MARKING OF POLYMERS FOR HIGH RESOLUTION LINEAR ANALYSIS
AU2002364945A1 (en) * 2001-10-25 2003-07-09 Neurogenetics, Inc. Genes and polymorphisms on chromosome 10 associated with alzheimer's disease and other neurodegenerative diseases
US20030170678A1 (en) * 2001-10-25 2003-09-11 Neurogenetics, Inc. Genetic markers for Alzheimer's disease and methods using the same
US20030224380A1 (en) * 2001-10-25 2003-12-04 The General Hospital Corporation Genes and polymorphisms on chromosome 10 associated with Alzheimer's disease and other neurodegenerative diseases
GB0202462D0 (en) * 2002-02-04 2002-03-20 Tepnel Medical Ltd Nucleic acid analysis
WO2003093296A2 (en) * 2002-05-03 2003-11-13 Sequenom, Inc. Kinase anchor protein muteins, peptides thereof, and related methods
EP1573056A4 (en) * 2002-05-17 2007-11-28 Nugen Technologies Inc METHODS FOR FRAGMENTATION, LABELING AND IMMOBILIZATION OF NUCLEIC ACIDS
DE10224824A1 (de) * 2002-06-05 2003-12-24 Eppendorf Ag Verfahren zur Analyse von Target-Nukleinsäuresequenzen
AU2003257110A1 (en) 2002-07-31 2004-02-16 University Of Southern California Polymorphisms for predicting disease and treatment outcome
US20040235005A1 (en) * 2002-10-23 2004-11-25 Ernest Friedlander Methods and composition for detecting targets
US6641899B1 (en) * 2002-11-05 2003-11-04 International Business Machines Corporation Nonlithographic method to produce masks by selective reaction, articles produced, and composition for same
WO2004076683A2 (en) * 2003-02-26 2004-09-10 Callida Genomics, Inc. Random array dna analysis by hybridization
US20070141570A1 (en) * 2003-03-07 2007-06-21 Sequenom, Inc. Association of polymorphic kinase anchor proteins with cardiac phenotypes and related methods
FR2852317B1 (fr) 2003-03-13 2006-08-04 Biopuces a sondes et leurs methodes d'utilisation
CA2519362A1 (en) 2003-03-19 2004-09-30 The University Of British Columbia Plasminogen activator inhibitor-1 (pai-1) haplotypes useful as indicators of patient outcome
KR100877129B1 (ko) * 2003-03-26 2009-01-07 신에쯔 한도타이 가부시키가이샤 열처리용 웨이퍼 지지구 및 열처리 장치
US7402386B2 (en) * 2003-04-14 2008-07-22 Nugen Technologies, Inc. Global amplification using random priming by a composite primer
US8652774B2 (en) * 2003-04-16 2014-02-18 Affymetrix, Inc. Automated method of manufacturing polyer arrays
US7425700B2 (en) 2003-05-22 2008-09-16 Stults John T Systems and methods for discovery and analysis of markers
US20050239089A1 (en) * 2003-06-06 2005-10-27 Johnson Martin D Mobility cassettes
US20050170367A1 (en) * 2003-06-10 2005-08-04 Quake Stephen R. Fluorescently labeled nucleoside triphosphates and analogs thereof for sequencing nucleic acids
JP4067463B2 (ja) * 2003-07-18 2008-03-26 トヨタ自動車株式会社 ハイブリッド車輌の制御装置
US20050038776A1 (en) * 2003-08-15 2005-02-17 Ramin Cyrus Information system for biological and life sciences research
US7348146B2 (en) 2003-10-02 2008-03-25 Epoch Biosciences, Inc. Single nucleotide polymorphism analysis of highly polymorphic target sequences
PT1687609E (pt) 2003-10-28 2015-03-02 Epoch Biosciences Inc Sondas fluorescentes para a detecção de adn por hibridação com uma maior sensibilidade e menor ruído de fundo
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7439341B2 (en) 2003-11-14 2008-10-21 Integrated Dna Technologies, Inc. Fluorescence quenching azo dyes, their methods of preparation and use
US7276338B2 (en) * 2003-11-17 2007-10-02 Jacobson Joseph M Nucleotide sequencing via repetitive single molecule hybridization
WO2005054441A2 (en) * 2003-12-01 2005-06-16 California Institute Of Technology Device for immobilizing chemical and biomedical species and methods of using same
CA2552007A1 (en) 2003-12-29 2005-07-21 Nugen Technologies, Inc. Methods for analysis of nucleic acid methylation status and methods for fragmentation, labeling and immobilization of nucleic acids
US7981604B2 (en) 2004-02-19 2011-07-19 California Institute Of Technology Methods and kits for analyzing polynucleotide sequences
US20060046258A1 (en) * 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
JP2007525980A (ja) 2004-03-04 2007-09-13 ザ ユニバーシティ オブ ブリティッシュ コロンビア 患者結果を予測するトロンボモジュリン(thbd)ハプロタイプ
GB2413796B (en) * 2004-03-25 2006-03-29 Global Genomics Ab Methods and means for nucleic acid sequencing
US20050239085A1 (en) * 2004-04-23 2005-10-27 Buzby Philip R Methods for nucleic acid sequence determination
US20050260609A1 (en) * 2004-05-24 2005-11-24 Lapidus Stanley N Methods and devices for sequencing nucleic acids
US20070117104A1 (en) * 2005-11-22 2007-05-24 Buzby Philip R Nucleotide analogs
US7635562B2 (en) * 2004-05-25 2009-12-22 Helicos Biosciences Corporation Methods and devices for nucleic acid sequence determination
US20070117103A1 (en) * 2005-11-22 2007-05-24 Buzby Philip R Nucleotide analogs
US7476734B2 (en) * 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
US20060024678A1 (en) * 2004-07-28 2006-02-02 Helicos Biosciences Corporation Use of single-stranded nucleic acid binding proteins in sequencing
WO2006035443A2 (en) * 2004-09-29 2006-04-06 Tel Hashomer Medical Research Infrastructure And Services Ltd. Monitoring of convection enhanced drug delivery
US20060118754A1 (en) * 2004-12-08 2006-06-08 Lapen Daniel C Stabilizing a polyelectrolyte multilayer
US20060172328A1 (en) * 2005-01-05 2006-08-03 Buzby Philip R Methods and compositions for correcting misincorporation in a nucleic acid synthesis reaction
US7482120B2 (en) * 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
EP1869077A2 (en) * 2005-02-18 2007-12-26 Abraxis BioScience, Inc. Q3 sparc deletion mutant and uses thereof
WO2006127507A2 (en) 2005-05-20 2006-11-30 Integrated Dna Technologies, Inc. Compounds and methods for labeling oligonucleotides
US20060263790A1 (en) * 2005-05-20 2006-11-23 Timothy Harris Methods for improving fidelity in a nucleic acid synthesis reaction
US8445194B2 (en) 2005-06-15 2013-05-21 Callida Genomics, Inc. Single molecule arrays for genetic and chemical analysis
US20090264299A1 (en) * 2006-02-24 2009-10-22 Complete Genomics, Inc. High throughput genome sequencing on DNA arrays
WO2006136033A1 (en) * 2005-06-23 2006-12-28 The University Of British Columbia Coagulation factor iii polymorphisms associated with prediction of subject outcome and response to therapy
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
EP1929046B1 (en) 2005-09-07 2012-07-11 Nugen Technologies, Inc. Improved nucleic acid amplification procedure
US7960104B2 (en) * 2005-10-07 2011-06-14 Callida Genomics, Inc. Self-assembled single molecule arrays and uses thereof
US20070117102A1 (en) * 2005-11-22 2007-05-24 Buzby Philip R Nucleotide analogs
US20070128610A1 (en) * 2005-12-02 2007-06-07 Buzby Philip R Sample preparation method and apparatus for nucleic acid sequencing
DK1987159T4 (da) 2006-02-08 2020-11-16 Illumina Cambridge Ltd Fremgangsmåde til sekventering af en polynukleotidtemplate
EP1994180A4 (en) * 2006-02-24 2009-11-25 Callida Genomics Inc GENOME SEQUENCING ON DNA ARRAYS WITH HIGH THROUGHPUT
CA2656315A1 (en) * 2006-06-30 2008-01-10 Nugen Technologies, Inc. Methods for fragmentation and labeling of nucleic acids
GB0618514D0 (en) * 2006-09-20 2006-11-01 Univ Nottingham Trent Method of detecting interactions on a microarray using nuclear magnetic resonance
WO2008039071A2 (en) * 2006-09-29 2008-04-03 Agendia B.V. High-throughput diagnostic testing using arrays
WO2008070352A2 (en) 2006-10-27 2008-06-12 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
US20090105961A1 (en) * 2006-11-09 2009-04-23 Complete Genomics, Inc. Methods of nucleic acid identification in large-scale sequencing
US20090111705A1 (en) * 2006-11-09 2009-04-30 Complete Genomics, Inc. Selection of dna adaptor orientation by hybrid capture
AU2007321678B2 (en) 2006-11-15 2014-03-20 The University Of British Columbia Polymorphisms predictive of anthracycline-induced cardiotoxicity
CA2675362A1 (en) 2007-01-18 2008-07-24 University Of Southern California Polymorphisms in the egfr pathway as markers for cancer treatment
US8435752B2 (en) * 2007-01-18 2013-05-07 University Of Southern California Gene polymorphisms predictive for dual TKI therapy
US7881933B2 (en) * 2007-03-23 2011-02-01 Verizon Patent And Licensing Inc. Age determination using speech
US7572990B2 (en) * 2007-03-30 2009-08-11 Intermec Ip Corp. Keypad overlay membrane
DK3078743T3 (da) 2007-09-28 2020-08-10 Portola Pharm Inc Antidoter til faktor xa-inhibitorer og fremgangsmåder til anvendelse af disse
WO2009046094A1 (en) 2007-10-01 2009-04-09 Nabsys, Inc. Biopolymer sequencing by hybridization of probes to form ternary complexes and variable range alignment
WO2009052214A2 (en) * 2007-10-15 2009-04-23 Complete Genomics, Inc. Sequence analysis using decorated nucleic acids
US8298768B2 (en) * 2007-11-29 2012-10-30 Complete Genomics, Inc. Efficient shotgun sequencing methods
US7897344B2 (en) * 2007-11-06 2011-03-01 Complete Genomics, Inc. Methods and oligonucleotide designs for insertion of multiple adaptors into library constructs
US8518640B2 (en) * 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
US8415099B2 (en) 2007-11-05 2013-04-09 Complete Genomics, Inc. Efficient base determination in sequencing reactions
US8617811B2 (en) * 2008-01-28 2013-12-31 Complete Genomics, Inc. Methods and compositions for efficient base calling in sequencing reactions
US7901890B2 (en) * 2007-11-05 2011-03-08 Complete Genomics, Inc. Methods and oligonucleotide designs for insertion of multiple adaptors employing selective methylation
CA2705213C (en) * 2007-11-07 2016-10-04 The University Of British Columbia Microfluidic device and method of using same
CN102016579B (zh) 2007-11-30 2015-04-08 健泰科生物技术公司 Vegf多态性和抗血管发生疗法
US8592150B2 (en) 2007-12-05 2013-11-26 Complete Genomics, Inc. Methods and compositions for long fragment read sequencing
WO2009094583A1 (en) * 2008-01-23 2009-07-30 Complete Genomics, Inc. Methods and compositions for preventing bias in amplification and sequencing reactions
US20090203531A1 (en) 2008-02-12 2009-08-13 Nurith Kurn Method for Archiving and Clonal Expansion
GB2470672B (en) 2008-03-21 2012-09-12 Nugen Technologies Inc Methods of RNA amplification in the presence of DNA
US20090270273A1 (en) * 2008-04-21 2009-10-29 Complete Genomics, Inc. Array structures for nucleic acid detection
JP4667490B2 (ja) * 2008-07-09 2011-04-13 三菱電機株式会社 加熱調理器
CN102186989B (zh) 2008-09-03 2021-06-29 纳伯塞斯2.0有限责任公司 用于流体通道中生物分子和其它分析物的电压感测的纵向移位纳米级电极的使用
US8262879B2 (en) 2008-09-03 2012-09-11 Nabsys, Inc. Devices and methods for determining the length of biopolymers and distances between probes bound thereto
US9650668B2 (en) 2008-09-03 2017-05-16 Nabsys 2.0 Llc Use of longitudinally displaced nanoscale electrodes for voltage sensing of biomolecules and other analytes in fluidic channels
JP2012501658A (ja) * 2008-09-05 2012-01-26 ライフ テクノロジーズ コーポレーション 核酸配列決定の検証、較正、および標準化のための方法およびシステム
EP2356250A2 (en) 2008-11-05 2011-08-17 Genentech, Inc. Genetic polymorphisms in age-related macular degeneration
WO2010096696A2 (en) * 2009-02-20 2010-08-26 Cold Spring Harbor Laboratory Harnessing high throughput sequencing for multiplexed specimen analysis
WO2010111522A2 (en) 2009-03-26 2010-09-30 The Regents Of The University Of California Mesenchymal stem cells producing inhibitory rna for disease modification
EP3604510A1 (en) 2009-03-30 2020-02-05 Portola Pharmaceuticals, Inc. Antidotes for factor xa inhibitors and methods of using the same
WO2010123626A1 (en) 2009-04-24 2010-10-28 University Of Southern California Cd133 polymorphisms and expression predict clinical outcome in patients with cancer
US9524369B2 (en) 2009-06-15 2016-12-20 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
WO2011005598A1 (en) 2009-06-24 2011-01-13 University Of Southern California Compositions and methods for the rapid biosynthesis and in vivo screening of biologically relevant peptides
PT2453910T (pt) 2009-07-15 2016-12-07 Portola Pharm Inc Formulação de dose unitária de antídoto contra inibidores de fator xa para uso na prevenção de sangramento
RU2546008C2 (ru) 2009-10-21 2015-04-10 Дженентек, Инк. Генетические полиморфизмы при возрастной дегенерации желтого пятна
WO2011084757A1 (en) 2009-12-21 2011-07-14 University Of Southern California Germline polymorphisms in the sparc gene associated with clinical outcome in gastric cancer
WO2011085334A1 (en) 2010-01-11 2011-07-14 University Of Southern California Cd44 polymorphisms predict clinical outcome in patients with gastric cancer
EP2848704B1 (en) 2010-01-19 2018-08-29 Verinata Health, Inc Sequencing methods for prenatal diagnoses
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
EP2526415B1 (en) 2010-01-19 2017-05-03 Verinata Health, Inc Partition defined detection methods
WO2011103467A2 (en) 2010-02-19 2011-08-25 Life Technologies Corporation Methods and systems for nucleic acid sequencing validation, calibration and normalization
WO2011120049A1 (en) 2010-03-26 2011-09-29 Integrated Dna Technologies, Inc. Methods for enhancing nucleic acid hybridization
US9506057B2 (en) 2010-03-26 2016-11-29 Integrated Dna Technologies, Inc. Modifications for antisense compounds
AU2011299233B2 (en) 2010-09-07 2016-09-15 Integrated Dna Technologies, Inc. Modifications for antisense compounds
WO2012037456A1 (en) 2010-09-17 2012-03-22 President And Fellows Of Harvard College Functional genomics assay for characterizing pluripotent stem cell utility and safety
US8715933B2 (en) 2010-09-27 2014-05-06 Nabsys, Inc. Assay methods using nicking endonucleases
WO2012067911A1 (en) 2010-11-16 2012-05-24 Nabsys, Inc. Methods for sequencing a biomolecule by detecting relative positions of hybridized probes
WO2012068519A2 (en) 2010-11-19 2012-05-24 Sirius Genomics Inc. Markers associated with response to activated protein c administration, and uses thereof
WO2012109574A2 (en) 2011-02-11 2012-08-16 Nabsys, Inc. Assay methods using dna binding proteins
WO2012129547A1 (en) 2011-03-23 2012-09-27 Elitech Holding B.V. Functionalized 3-alkynyl pyrazolopyrimidine analogues as universal bases and methods of use
US8969003B2 (en) 2011-03-23 2015-03-03 Elitech Holding B.V. Functionalized 3-alkynyl pyrazolopyrimidine analogues as universal bases and methods of use
DK2697392T3 (en) 2011-04-12 2016-03-29 Verinata Health Inc SOLUTION OF GENOME FRACTIONS USING Polymorphism COUNTS
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
EP2701722A4 (en) 2011-04-28 2014-12-31 Univ Southern California CANCEROUS MARKERS OF HUMAN SUPPRESSIVE MYELOID CELLS
ES2537189T3 (es) 2011-05-24 2015-06-03 Elitech Holding B.V. Detección de estafilococos áureos resistentes a la meticilina
SG10201510189WA (en) 2011-10-19 2016-01-28 Nugen Technologies Inc Compositions And Methods For Directional Nucleic Acid Amplification And Sequencing
MX354547B (es) 2011-11-14 2018-03-09 Alfasigma Spa Ensayos y métodos para seleccionar un regimen de tratamiento para un sujeto con depresión.
WO2013112923A1 (en) 2012-01-26 2013-08-01 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
WO2013119923A1 (en) 2012-02-09 2013-08-15 The Regents Of The University Of Michigan Different states of cancer stem cells
EP2861787B1 (en) 2012-06-18 2017-09-20 Nugen Technologies, Inc. Compositions and methods for negative selection of non-desired nucleic acid sequences
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
GB201220924D0 (en) 2012-11-21 2013-01-02 Cancer Res Inst Royal Materials and methods for determining susceptibility or predisposition to cancer
US9914966B1 (en) 2012-12-20 2018-03-13 Nabsys 2.0 Llc Apparatus and methods for analysis of biomolecules using high frequency alternating current excitation
US10294516B2 (en) 2013-01-18 2019-05-21 Nabsys 2.0 Llc Enhanced probe binding
WO2014159063A1 (en) 2013-03-14 2014-10-02 Elitech Holding B.V. Functionalized 3-alkynyl pyrazolopyrimidine analogues as universal bases and methods of use
EP2971130A4 (en) 2013-03-15 2016-10-05 Nugen Technologies Inc SEQUENTIAL SEQUENCING
US20160186263A1 (en) 2013-05-09 2016-06-30 Trustees Of Boston University Using plexin-a4 as a biomarker and therapeutic target for alzheimer's disease
EP3008229B1 (en) 2013-06-10 2020-05-27 President and Fellows of Harvard College Early developmental genomic assay for characterizing pluripotent stem cell utility and safety
US20160230231A1 (en) 2013-10-18 2016-08-11 Institut De Cardiologie De Montreal Genotyping tests and methods for evaluating plasma creatine kinase levels
JP6525473B2 (ja) 2013-11-13 2019-06-05 ニューゲン テクノロジーズ, インコーポレイテッド 複製物配列決定リードを同定するための組成物および方法
WO2015131107A1 (en) 2014-02-28 2015-09-03 Nugen Technologies, Inc. Reduced representation bisulfite sequencing with diversity adaptors
KR102456013B1 (ko) 2014-07-30 2022-10-18 에프. 호프만-라 로슈 아게 고밀도 지질단백질(hdl)-상승 제제 또는 hdl-모방 제제에 의한 치료법에 대한 반응성을 예측하기 위한 유전 표지
US9789087B2 (en) 2015-08-03 2017-10-17 Thomas Jefferson University PAR4 inhibitor therapy for patients with PAR4 polymorphism
WO2018226602A1 (en) 2017-06-05 2018-12-13 Research Institute At Nationwide Children's Hospital Enhanced modified viral capsid proteins
WO2019010410A1 (en) * 2017-07-07 2019-01-10 Massachusetts Institute Of Technology SYSTEMS AND METHODS OF GENETIC IDENTIFICATION AND ANALYSIS
US11099202B2 (en) 2017-10-20 2021-08-24 Tecan Genomics, Inc. Reagent delivery system
BR112021012570A2 (pt) * 2019-01-07 2021-09-14 Personal Genome Diagnostics Inc. Quantificação de instrumentos e reagentes de sequenciamento para uso em métodos de diagnóstico molecular
CN109801679B (zh) * 2019-01-15 2021-02-02 广州柿宝生物科技有限公司 一种用于长链分子的数学序列重建方法
IL303893A (en) 2019-08-05 2023-08-01 Seer Inc Systems and methods for sample preparation, data generation and corona protein analysis
CN113275053A (zh) 2020-02-03 2021-08-20 帝肯基因组学公司 试剂存储系统
EP4430199A2 (en) 2021-11-24 2024-09-18 Research Institute at Nationwide Children's Hospital Chimeric hsv expressing hil21 to boost anti-tumor immune activity

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4302204A (en) * 1979-07-02 1981-11-24 The Board Of Trustees Of Leland Stanford Junior University Transfer and detection of nucleic acids
US4562159A (en) * 1981-03-31 1985-12-31 Albert Einstein College Of Medicine, A Division Of Yeshiva Univ. Diagnostic test for hepatitis B virus
CA1180647A (en) * 1981-07-17 1985-01-08 Cavit Akin Light-emitting polynucleotide hybridization diagnostic method
FI63596C (fi) * 1981-10-16 1983-07-11 Orion Yhtymae Oy Mikrobdiagnostiskt foerfarande som grundar sig pao skiktshybridisering av nukleinsyror och vid foerfarandet anvaenda kombinationer av reagenser
US4591567A (en) 1982-04-21 1986-05-27 California Institute Of Technology Recombinant DNA screening system including fixed array replicator and support
JPS5927900A (ja) * 1982-08-09 1984-02-14 Wakunaga Seiyaku Kk 固定化オリゴヌクレオチド
EP0756010B1 (en) * 1983-01-10 2001-07-04 Gen-Probe Incorporated Method for detecting, identifying, and quantitating organisms and viruses
JPS6010174A (ja) * 1983-06-29 1985-01-19 Fuji Photo Film Co Ltd オ−トラジオグラフイ−による遺伝子のスクリ−ニング方法
CA1222680A (en) * 1983-07-05 1987-06-09 Nanibhushan Dattagupta Testing dna samples for particular nucleotide sequences
US4677054A (en) * 1983-08-08 1987-06-30 Sloan-Kettering Institute For Cancer Research Method for simple analysis of relative nucleic acid levels in multiple small samples by cytoplasmic dot hybridization
WO1985001051A1 (en) * 1983-09-02 1985-03-14 Molecular Biosystems, Inc. Oligonucleotide polymeric support system
US4613566A (en) * 1984-01-23 1986-09-23 President And Fellows Of Harvard College Hybridization assay and kit therefor
FI71768C (fi) * 1984-02-17 1987-02-09 Orion Yhtymae Oy Foerbaettrade nykleinsyrareagenser och foerfarande foer deras framstaellning.
CA1223222A (en) 1984-02-22 1987-06-23 Nanibhushan Dattagupta Immobilized nucleic acid-containing probes
US4766062A (en) * 1984-05-07 1988-08-23 Allied Corporation Displacement polynucleotide assay method and polynucleotide complex reagent therefor
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
GB8432118D0 (en) * 1984-12-19 1985-01-30 Malcolm A D B Sandwich hybridisation technique
DE3506703C1 (de) * 1985-02-26 1986-04-30 Sagax Instrument AB, Sundbyberg Verfahren zur Sequenzanalyse von Nucleinsaeuren,insbesondere der Desoxyribonucleinsaeure (DNA) und der Ribonucleinsaeure (RNA),sowie Traeger zur Durchfuehrung des Verfahrens und Verfahren zur Herstellung des Traegers
GB8509880D0 (en) * 1985-04-17 1985-05-22 Ici Plc Testing device
EP0200113A3 (en) * 1985-04-30 1987-03-18 Pandex Laboratories, Inc. A method of solid phase nucleic acid hybridization assay incorporating a luminescent label
AU558846B2 (en) * 1985-06-21 1987-02-12 Miles Laboratories Inc. Solid-phase hydridization assay using anti-hybrid antibodies
US4794073A (en) * 1985-07-10 1988-12-27 Molecular Diagnostics, Inc. Detection of nucleic acid hybrids by prolonged chemiluminescence
US4775631A (en) * 1985-07-26 1988-10-04 Janssen Pharmaceuitica, N.V. Method of localizing nucleic acids bound to polyamide supports
US4806631A (en) * 1985-09-30 1989-02-21 Miles Inc. Immobilization of nucleic acids on solvolyzed nylon supports
US4806546A (en) * 1985-09-30 1989-02-21 Miles Inc. Immobilization of nucleic acids on derivatized nylon supports
TW203120B (ja) * 1985-10-04 1993-04-01 Abbott Lab
US4770992A (en) * 1985-11-27 1988-09-13 Den Engh Gerrit J Van Detection of specific DNA sequences by flow cytometry
US4882269A (en) * 1985-12-13 1989-11-21 Princeton University Amplified hybridization assay
EP0228075B1 (en) * 1986-01-03 1991-04-03 Molecular Diagnostics, Inc. Eucaryotic genomic dna dot-blot hybridization method
EP0231010A3 (en) * 1986-01-27 1990-10-17 INCSTAR Corporation A method of solid phase enzyme immunoassay and nucleic acid hybridization assay and dip-stick design and stabilized chromogenic substrate
NO870613L (no) * 1986-03-05 1987-09-07 Molecular Diagnostics Inc Deteksjon av mikroorganismer i en prŸve inneholdende nukleinsyre.
US5348855A (en) * 1986-03-05 1994-09-20 Miles Inc. Assay for nucleic acid sequences in an unpurified sample
CA1284931C (en) * 1986-03-13 1991-06-18 Henry A. Erlich Process for detecting specific nucleotide variations and genetic polymorphisms present in nucleic acids
US5310893A (en) * 1986-03-31 1994-05-10 Hoffmann-La Roche Inc. Method for HLA DP typing
AU7015287A (en) * 1986-03-19 1987-09-24 Cetus Corporation Detection of nucleic acid sequence using liquid hybridization method
US4981783A (en) * 1986-04-16 1991-01-01 Montefiore Medical Center Method for detecting pathological conditions
EP0245206A1 (en) * 1986-05-05 1987-11-11 IntraCel Corporation Analytical method for detecting and measuring specifically sequenced nucleic acid
DE3785658T2 (de) * 1986-08-11 1993-08-12 Siska Diagnostics Inc Methoden und zusammensetzungen fuer tests mit nukleinsaeuresonden.
US4885250A (en) * 1987-03-02 1989-12-05 E. I. Du Pont De Nemours And Company Enzyme immobilization and bioaffinity separations with perfluorocarbon polymer-based supports
KR960000479B1 (ko) * 1987-03-02 1996-01-08 젠-프로우브 인코오퍼레이티드 핵산 정제,분리 및 혼성체 형성용 다가양이온성 지지체
AU601021B2 (en) * 1987-03-11 1990-08-30 Molecular Diagnostics, Inc. Assay for necleic acid sequences in a sample
US5525464A (en) * 1987-04-01 1996-06-11 Hyseq, Inc. Method of sequencing by hybridization of oligonucleotide probes
US6270961B1 (en) * 1987-04-01 2001-08-07 Hyseq, Inc. Methods and apparatus for DNA sequencing and DNA identification
US5202231A (en) 1987-04-01 1993-04-13 Drmanac Radoje T Method of sequencing of genomes by hybridization of oligonucleotide probes
IL85551A0 (en) * 1987-04-01 1988-08-31 Miles Inc Rapid hybridization assay and reagent system used therein
US4849334A (en) * 1987-06-09 1989-07-18 Life Technologies, Inc. Human papillomavirus 43 nucleic acid hybridization probes and methods for employing the same
JPH02503983A (ja) * 1987-06-26 1990-11-22 イー・アイ・デュポン・ドゥ・ヌムール・アンド・カンパニー 捕捉ビーズを用いる組み換えクローン化naからの混入配列のアフイニテイ除去
US5120643A (en) * 1987-07-13 1992-06-09 Abbott Laboratories Process for immunochromatography with colloidal particles
US4921805A (en) * 1987-07-29 1990-05-01 Life Technologies, Inc. Nucleic acid capture method
US4942124A (en) * 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
EP0305145A3 (en) * 1987-08-24 1990-05-02 Ortho Diagnostic Systems Inc. Methods and probes for detecting nucleic acids
DE3888653T2 (de) * 1987-12-21 1994-07-07 Applied Biosystems Verfahren und Testsatz zum Nachweis einer Nukleinsäure-Sequenz.
US5354657A (en) * 1988-01-12 1994-10-11 Boehringer Mannheim Gmbh Process for the highly specific detection of nucleic acids in solid
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
US4988617A (en) * 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
US5002867A (en) * 1988-04-25 1991-03-26 Macevicz Stephen C Nucleic acid sequence determination by multiple mixed oligonucleotide probes
ATE173508T1 (de) * 1988-05-20 1998-12-15 Hoffmann La Roche Befestigung von sequenzspezifischen proben
US5094939A (en) * 1988-07-19 1992-03-10 Fujirebio, Inc. Chemiluminescence assays using stabilized dioxetane derivatives
GB8822228D0 (en) * 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
EP0392546A3 (en) * 1989-04-14 1991-09-11 Ro Institut Za Molekularnu Genetiku I Geneticko Inzenjerstvo Process for determination of a complete or a partial contents of very short sequences in the samples of nucleic acids connected to the discrete particles of microscopic size by hybridization with oligonucleotide probes
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
WO1992007093A1 (en) * 1990-10-17 1992-04-30 Jack Love Identification and paternity determination by detecting presence or absence of multiple nucleic acid sequences
DE69132843T2 (de) * 1990-12-06 2002-09-12 Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) Identifizierung von Nukleinsäuren in Proben
AU1999092A (en) * 1991-05-24 1992-12-30 Walter Gilbert Method and apparatus for rapid nucleic acid sequencing
US5672472A (en) * 1991-08-23 1997-09-30 Isis Pharmaceuticals, Inc. Synthetic unrandomization of oligomer fragments
US5474796A (en) 1991-09-04 1995-12-12 Protogene Laboratories, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
US6017696A (en) 1993-11-01 2000-01-25 Nanogen, Inc. Methods for electronic stringency control for molecular biological analysis and diagnostics
US5503980A (en) * 1992-11-06 1996-04-02 Trustees Of Boston University Positional sequencing by hybridization
ATE257861T1 (de) * 1993-09-27 2004-01-15 Arch Dev Corp Methoden und zusammensetzungen zur effizienten nukleinsaeuresequenzierung
BR9507343A (pt) * 1994-04-04 1997-09-16 Ciba Corning Diagnostics Corp Testes de hibridização - ligação para a detecção de sequências de ácido nucléico específicas
GB9507238D0 (en) * 1995-04-07 1995-05-31 Isis Innovation Detecting dna sequence variations
US5545531A (en) * 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
JP2000504575A (ja) * 1996-02-08 2000-04-18 アフィメトリックス,インコーポレイテッド 微生物のチップベースの種分化および表現型特徴付け

Also Published As

Publication number Publication date
US6270961B1 (en) 2001-08-07
WO1996017957A1 (en) 1996-06-13
CN1175283A (zh) 1998-03-04
NO972535L (no) 1997-08-06
US20020192691A1 (en) 2002-12-19
CA2206815A1 (en) 1996-06-13
KR980700433A (ko) 1998-03-30
FI972429A (fi) 1997-08-06
EP0797683A1 (en) 1997-10-01
FI972429A0 (fi) 1997-06-06
NO972535D0 (no) 1997-06-04
EP0797683A4 (en) 1999-03-03
AU4468796A (en) 1996-06-26
US6025136A (en) 2000-02-15
AU715506B2 (en) 2000-02-03
US6403315B1 (en) 2002-06-11

Similar Documents

Publication Publication Date Title
JPH10512745A (ja) Dna塩基配列決定およびdna同定の方法および装置
US6297006B1 (en) Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
Chetverin et al. Oligonucleotide arrays: New concepts and possibilities
US6309824B1 (en) Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
Southern DNA chips: analysing sequence by hybridization to oligonucleotides on a large scale
US6383742B1 (en) Three dimensional arrays for detection or quantification of nucleic acid species
CA3141255A1 (en) Method of signal encoding of analytes in a sample
US20220205028A1 (en) Multiplex method for detecting different analytes in a sample
US20020034737A1 (en) Methods and compositions for detection or quantification of nucleic acid species
US20060073506A1 (en) Methods for identifying biological samples
US20030087232A1 (en) Methods for screening polypeptides
US20110039731A1 (en) Enhanced Sequencing by Hybridization Using Pools of Probes
JP2001514906A (ja) 核酸種を検出または定量するための方法および組成物
JP2004105189A (ja) 核酸配列のハイブリダイゼーションと配列決定
Carter et al. Chipping away at complex behavior: transcriptome/phenotype correlations in the mouse brain
CN114875118B (zh) 确定细胞谱系的方法、试剂盒和装置
CN110272994B (zh) 诊断cvm的基因突变及其应用
WO2000079007A9 (en) Improved methods of sequence assembly in sequencing by hybridization
CN118389706B (zh) 一种用于鳜鱼基因分型的标记组合及应用其的全基因组液相芯片
KR102102107B1 (ko) 이동성 유전인자 SINE 선택적 발굴을 위한 HiSeq 시퀀서 기반의 DNA 라이브러리 제작 방법
US20050176007A1 (en) Discriminative analysis of clone signature
Gupta et al. Microarray: an emerging diagnostic tool in dentistry
JP3783315B2 (ja) 核酸分析方法
CN117625763A (zh) 准确地平行定量变体核酸的高灵敏度方法
CZ254699A3 (cs) Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060404

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060704

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060821

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20061127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070116