JP6028025B2 - オリゴヌクレオチド・ライゲーション・アッセイに基づく配列ベースの遺伝子型決定 - Google Patents

オリゴヌクレオチド・ライゲーション・アッセイに基づく配列ベースの遺伝子型決定 Download PDF

Info

Publication number
JP6028025B2
JP6028025B2 JP2014518468A JP2014518468A JP6028025B2 JP 6028025 B2 JP6028025 B2 JP 6028025B2 JP 2014518468 A JP2014518468 A JP 2014518468A JP 2014518468 A JP2014518468 A JP 2014518468A JP 6028025 B2 JP6028025 B2 JP 6028025B2
Authority
JP
Japan
Prior art keywords
probe
sequence
target
ligated
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014518468A
Other languages
English (en)
Other versions
JP2014520525A5 (ja
JP2014520525A (ja
Inventor
ミハエル・ヨセフス・テレジア・ファン・エイジク
ルネ・コルネリス・ヨセフス・ホガース
Original Assignee
キージーン・エン・フェー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キージーン・エン・フェー filed Critical キージーン・エン・フェー
Publication of JP2014520525A publication Critical patent/JP2014520525A/ja
Publication of JP2014520525A5 publication Critical patent/JP2014520525A5/ja
Application granted granted Critical
Publication of JP6028025B2 publication Critical patent/JP6028025B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Description

本発明は分子生物学及びバイオテクノロジーに関する。特に本発明は核酸検出に関し、より特定すると処理能力の高い核酸の検出に用いることができるプローブ(コレクション)の設計及び組成物に関する。本発明は該プローブ及び組成物を用いた核酸の検出方法にも関する。本発明は更に、問題の標的配列にハイブリダイズすることができるプローブ、連結されたプローブの増幅のためのプライマー、広範な種類の遺伝形質及び遺伝子に関連していてもよいヌクレオチド配列の同定及び/又は検出におけるこれらのプローブ及びプライマーの使用を提供する。本発明は更に、本発明による方法で用いるための好ましいプライマー及び/又はプローブのキットを提供する。本発明は人工の、植物、動物又はヒト起源からの試料又はそれらの組み合わせにおける標的ヌクレオチド配列の処理能力の高い検出の分野において適用可能性が見出される。本発明は、高い処理能力のジェノタイピング(遺伝子型決定)の分野において特に応用が見出される。
形質、対立遺伝子及びシーケンシングの情報を得るための先進技術の開発により、入手可能になる遺伝情報がほぼ指数関数的に増加している。それに伴い、試料を試験するための、効果的で信頼でき、大規模に実現可能なアッセイ、及び多くのケースでは複数の試料の、素早い方式、しばしば並列的な方式への要求が増加している。特に一塩基多型(SNPs)は生物の遺伝的な構成に関する様々な情報を含んでおり、その検出は多くの興味を引き革新的な活動を誘発している分野である。
配列が分かっている核酸の解析に用いられる主要な方法の一つは標的配列に2つのプローブをアニーリングし、当該プローブが標的配列に隣接してハイブリダイズしたら、プローブをライゲーションするものである。成功したライゲーション事象が検出されれば、試料中に標的配列が存在することの示唆となる。オリゴヌクレオチド・ライゲーション・アッセイ(Oligonucleotide Ligation Assay:OLA)は、そのような一塩基多型の検出に適していることが発見されており、長年に渡って数多くの特許出願及び科学論文に多くのバリエーションが記載されてきた。
OLA原理(オリゴヌクレオチド・ライゲーション・アッセイ)はUS4,988,617(Landegrenら)に特に記載されている。この公報は既知の可能性のある突然変異又は多型を有する既知の核酸配列の一部において核酸配列を決定するための方法を開示している。突然変異を検出するためには、オリゴヌクレオチドが決定しようとする配列セグメントのすぐ隣にアニールするように選択される。選択されたオリゴヌクレオチドプローブは一方の端部のヌクレオチドが、その既知の核酸配列の対応する部位における、通常の又は突然変異したヌクレオチドに相補的である。リガーゼは、二つのプローブが正しい塩基対であり、互いにすぐ隣接して位置する場合に、その二つのプローブを共有結合的に連結する。連結されたプローブの存在、非存在又はその量は、既知の配列及び/又は突然変異の存在の指標である。OLAベース技術のたのバリエーションは、Nilssonらにとりわけ開示されている。Human mutation, 2002, 19, 410-415; Science 1994, 265: 2085-2088; US 5,876,924; WO 98/04745; WO 98/04746; US 6,221,603; US 5,521,065; US5,962,223; EP 185494B1; US 6,027,889; US 4,988,617; EP 246864B1 ; US 6,156,178; EP 745140 B1; EP 964704B1; WO 03/054511 ; US 2003/0119004; US 2003/190646; EP 1313880; US2003/0032016; EP 912761 ; EP 956359; US 2003/108913; EP 1255871 ; EP 1194770; EP 1252334; WO 96/15271 ; WO97/45559; US2003/0119004A1 ; US 5,470,705.
OLA技術における更なる進歩はオランダ、ヴァーヘニンゲンのKeyGeneが報告している。WO 2004/111271 , WO2005/021794, WO2005/118847及びWO03/052142で、彼らはオリゴヌクレオチド・ライゲーション・アッセイの信頼性を改善するいくつかの方法及びプローブ設計を記載している。これらの出願はさらに、達成可能な多重化レベルの有意な改善を開示している。また、"SNPWave: a flexible multiplexed SNP genotyping technology", van Eijk MJ, Broekhof JL, van der Poel HJ, Hogers RC,..., Geerlings H, Buntjer JB, van Oeveren AJ, Vos P Nucleic Acids Res. 2004; 32(4):e47)は、当分野でなされた改善を記載している。
Janitz Ed. Next Generation Genome sequencing, Wley VCH, 2008に記載されているような次世代シーケンシング(Next Generation Sequencing:NGS)技術の開始とロシュ(Roche)(GS FLX及び関連システム)及びイルミナ(Illumina)(Genome Analyzer及び関連システム)が供給するプラットフォームが市場で手に入ることで、OLAアッセイをシーケンシングに適用して検出プラットフォームにすることに対する需要が生じた。その分野での改善は特にKeygene NVのWO2007100243に記載されている。WO2007100243では、オリゴヌクレオチド・ライゲーション・アッセイの結果に次世代シーケンシング技術を適用することが記載されている。この分野ではまだ更なる改善への需要があり、それは信頼性及び正確性の点からだけでなく、さらにスケールを増大させてコストを削減するための経済的な駆動力からの需要である。
米国特許第US 5,876,924号明細書 国際公開第WO 98/04745号パンフレット 国際公開第WO 98/04746号パンフレット 米国特許第US 6,221,603号明細書 米国特許第US 5,521,065号明細書 米国特許第US 5,962,223号明細書 欧州特許第EP 185494B1号明細書 米国特許第US 6,027,889号明細書 米国特許第US 4,988,617号明細書 欧州特許第EP 246864B1号明細書 米国特許第US 6,156,178号明細書 欧州特許第EP 745140B1号明細書 欧州特許第EP 964704B1号明細書 国際公開第WO 03/054511号パンフレット 米国特許出願公開第US 2003/0119004号明細書 米国特許出願公開第US 2003/190646号明細書 欧州特許出願公開第EP 1313880号明細書 米国特許出願公開第US 2003/0032016号明細書 欧州特許出願公開第EP 912761号明細書 欧州特許出願公開第EP 956359号明細書 米国特許出願公開第US 2003/108913号明細書 欧州特許出願公開第EP 1255871号明細書 欧州特許出願公開第EP 1194770号明細書 欧州特許出願公開第EP 1252334号明細書 国際公開第WO 96/15271号パンフレット 国際公開第WO 97/45559号パンフレット 米国特許出願公開第US 2003/0119004A1 米国特許第US 5,470,705号明細書 国際公開第WO 2004/111271号パンフレット 国際公開第WO 2005/021794号パンフレット 国際公開第WO 2005/118847号パンフレット 国際公開第WO 03/052142号パンフレット 国際公開第WO 2007100243号パンフレット
Human mutation (ヒトの突然変異), 2002, 19, 410-415; Science 1994, 265: 2085-2088 "SNPWave: a flexible multiplexed SNP genotyping technology"(SNPWave:フレキシブルな多重SNP遺伝子型決定技術), van Eijk MJ, Broekhof JL, van der Poel HJ, Hogers RC,..., Geerlings H, Buntjer JB, van Oeveren AJ, Vos P Nucleic Acids Res. 2004; 32(4):e47) Janitz Ed. Next Generation Genome sequencing(次世代ゲノムシーケンス), Wley VCH, 2008
当分野で知られているライゲーションプローブタイプ及び検出方法の利点を結合し、特定の不利な点を回避するオリゴヌクレオチドプローブが必要とされ続けている。付加的な利点を有するプローブを供給することによる技術の更なる改善の必要もある。本発明の目的の一つはそのようなプローブ及び方法を提供することである。本発明の他の目的は、ここで先に述べたよく知られているプローブの欠点を回避することである。本発明の更なる目的は、ハイスループット検出方法のために適したプローブを提供することである。オリゴヌクレオチド・ライゲーション・アッセイの実施による、標的ヌクレオチド配列の効率的で信頼でき、及び/又はハイスループットな方法の提供も、本発明の目的である。本発明者らは、多くの有利な面を維持することを試みると同時に、この分野に存在する問題を消滅させるか、又は少なくとも軽減するため、及びさらにこの技術を改善するために提示するものである。本分野における他の問題及びそれに対して本発明が提供する解決策は、明細書、図面及びここに記載された種々の実施形態を通じて明らかになるであろう。
本発明は以下の図面によって説明される
本発明者らは、新規のハイスループットシーケンシング技術にオリゴヌクレオチドライゲーションベースのアッセイの多用途性を組み合わせることができた。特に、本発明はオリゴヌクレオチド・ライゲーション・アッセイに基づいた標的ヌクレオチド配列のハイスループット検出の方法に関し、その中で、ハイスループットシーケンシング方法を、一つ以上の標的ヌクレオチド配列の量の有無を明らかにするために用いることができるように、ライゲーションアッセイにおいて用いられるプローブが改変されている。本発明者らは、既存の方法を適用して、複数の試料中の標的配列の適切な検出に関連するライゲーション産物のパーツの検出に焦点を当てることによって、改善がなされ得ることを発見した。この方法は、シーケンシングに先立って(ライゲーションされた)プローブの一部を除去(トリミング)することによって関係のない配列データの量を減らす工程、との組み合わせにおいて、シーケンスベースの識別子を用いる(組み合わせる)ことに基づいている。制限されたライゲーションされたプローブ又は増幅されたライゲーションされたプローブに連結されている(識別子を含んでいてもよい)アダプターを使用することにより、標的配列のために意図的にデザインされたプローブを組み合わせた、アダプター、識別子及びプライマーの一般的なセットの使用が可能となっている。標的そのものに連結されているプローブの要素及び試料の多重化(sample multiplexing)に連結された要素を切り離すこと及び配列ベースの検出により、試験された信頼性との組み合わせにおいて有利な柔軟性がもたらされている。本発明は、多数の遺伝子型のための多数の試料の、高い正確性及びデータポイントごとのコストが低い、ハイスループット遺伝子型決定の有利な方法につながる。本発明により、シーケンシングベースの新規な検出プラットフォームに、証明済みのOLA技術を適用することも可能となる。
異なるプローブタイプ(図1A、図1B、図1C)が問題の標的ヌクレオチド配列と向かい合っていることを概略的に説明している図である。プローブの種々の構成要素は、図を通して同一の描写を用いて表されている。図1Aは、標的配列(T)に対する直線プローブタイプに基づく、一般的なオリゴヌクレオチド・ライゲーション・アッセイを説明しており、ここで第1のプローブ(P1)は、第1の標的配列セクション(TS1)と、第1の識別子(ID1)及び第1のプライマー結合配列(PBS1)を含む第1のタグセクション(TAG1)と、を含み、第1のプライマー(PR1)とアニーリングすることができる。ここで第2のプローブ(P2)は、第2の標的配列セクション(TS2)と、第2の識別子(ID2)及び第2のプライマー結合配列(PBS2)を含む第2のタグセクション(TAG2)と、を含み、第2のプライマー(PR2)とアニーリングすることができる。アレル特異的検出のための実施形態において、TS2は、好ましくはタグセクションにおける異なる識別子(ID2)と一緒に、好ましくはその3’−末端に、アレル特異的ヌクレオチドを含んでいてもよい。他のアレル特異的検出のための実施形態において、TS1は、好ましくはタグセクションにおける異なる識別子(ID1)と一緒に、好ましくはその5’−末端に、アレル特異的ヌクレオチドを含んでいてもよい。遺伝子座(locus)−アレルの組み合わせはID1及び/又はID2の存在又は非存在の検出により決定(遺伝子型決定)されてもよい。同様にして、一つの多型の全ての対立遺伝子的変異体(allelic variants)を遺伝子型決定することができる(例えば、2対立遺伝子多型(bi-allelic polymorphisms)の2つのアレルはアレル特異的標的セクションを有する2つのプローブを使用して、又は4アレルに対しては4アレル特異的標的セクションを使用して)。検出がシーケンシングに基づく場合には、存在、非存在又は量の検出も、識別子及び標的特異的なセクションからの配列情報によって、連結されたプローブからの配列情報に基づくことができる。したがって、(標的セクションの一部自身の)シーケンシングによってそのアレルを決定することができる(そうでなければ識別子のシーケンシングによってその遺伝子座を決定することができ、どちらからでもできる)。図1Bは、標的配列(T)に対する直線プローブタイプに基づく、本発明のオリゴヌクレオチド・ライゲーション・アッセイを説明している。プローブには、ここでは制限酵素のための認識配列(RE1、RE2)が装備されている。図1Cは、標的配列(T)に対する直線プローブタイプに基づく、本発明のオリゴヌクレオチド・ライゲーション・アッセイを説明している。プローブにはここでは制限酵素のための認識配列(RE1、RE2)と識別子(ID1、ID2)が装備されている。 2つのプローブが標的配列にハイブリダイズし、ハイブリダイゼーションが成功である場合にはライゲーションされることを図1Bにおけるプローブコンフィギュレーションに基づいて説明する図である。ここでは2つの経路がオープンである。そのうちの一つは結合したプローブ(LP)が制限酵素で制限され、ヘアピンアダプター又は本明細書の他の部分に記載され、図5Cに説明されているように、本質的に制限され得るds鎖を局所的に提供する他のオリゴヌクレオチドを用いることにより必要に補助される。結果は制限ライゲーションプローブ(RLP)である。ほかの経路は、一つ以上のプライマー(PR1,PR2)を用いてライゲーションしたプローブを増幅し、制限して制限アンプリコン(RA)を得ることができるアンプリコン(A)を得るものである。RLP及び/又はRAに対して、(試料特異的な)識別子を含んでもよいアダプターをライゲーションすることができる。RLP及びRAはいずれもシーケンシングに供することができ、試料中の標的配列の存在、非存在及び/又は量を同定することができる。そして、試料の(共優性)遺伝子型決定は、標的セクション(の一部)及び/又はタグセクション中に提供されている識別子からの配列情報による、試料中の標的配列の同定に基づくことができる。図2Aは、アンプリコン又はライゲーションされたプローブの制限の後、アダプターをライゲーションし(AD1,AD2)、それらは識別子(AD1 ID1, AD2 ID2)を含んでいてもよく、その識別子は試料の由来を同定するための事実を提供してもよい。 本発明のいくつかの実施形態に存在するいくつかの要素の概略図である。参照の容易のため、それらは先に用いられた表示に関連付けられている。したがって、TSは標的特異的セクションを表し、IDは識別子を、REは制限酵素の認識配列を示す。プライマー結合部位はPBSで示される。制限断片にライゲーションされたアダプターはADとして描写されている。増幅工程(ライブラリ準備の一部としての増幅又はシーケンシング工程の一部としての)で用いられるプライマーはPRで示されている。制限されたアンプリコン/ライゲーションされ制限されたプローブはRA/RLAで示される。本発明の方法のシーケンシングで用いられる、ある要素を示すため、これを頭文字SEQで示すことができる。したがって、シーケンシング工程で用いられるアダプターは「シーケンシングアダプター」又はSEQ ADで示すことができる。2以上の要素が同時に存在する場合には、これは数字のサフィックスで示す。したがって、ID1は第1の識別子であり、ID2は第2等である。図3Aは本発明による、プライマー結合部位(PBS1, PBS2)、制限酵素の認識配列(RE1,RE2)、識別子(ID1,ID2)、標的特異的セクション(TS1,TS2)及び増幅のためのプライマー(PR1,PR2)を含む典型的なライゲーションされたプローブを説明している。図3Bは識別子がプローブ、アンプリコン及びアダプターがライゲーションされた断片に位置することができる、本発明の種々の可能性のいくつかを説明している。遺伝子型決定のための配列ベースの方法において、標的特異的配列は識別子として用いることもでき、遺伝子座(L)及びアレル(Al)も可能性のある識別子としてここでは示している。例えばアレルは、(1)識別子(1)及び標的セクションの配列による遺伝子座によって表すことができる。(2)アレル及び遺伝子座は識別子によって表すことができる。(3)又は、遺伝子座は識別子及び標的特異的セクションによるアレルで表すことができる。(5)試料は、識別子によって、アレル及び/又は遺伝子座の表現から独立して表すことができる。バリエーション6、7、8及び9は異なるまたは同一の目的で用いられる識別子の種々の組み合わせを表示している。他のバリエーションも可能であり、ここで表示している可能性と均等である。 本発明の断片の配列の種々の態様を説明する図である。(増幅された)ライゲーションされたプローブが制限酵素で制限されているように、増幅されたアンプリコン/制限されたライゲーションされたプローブがRA/RLPで示されている(したがって、遺伝子座及びアレル情報、L及びAlをそれぞれ含む)。制限の後、シーケンシング工程(例としてP5/P7プライマー(Illumina)が知られている)で用いることができるシーケンシングアダプター(SEQ AD1、SEQ AD2)であってもよいアダプター(AD1、AD2)が加えられている。シーケンシング工程で用いられたプライマー(シーケンシングプライマー)はSEQ PR1、SEQ PR2と示され、シーケンシングアダプターにおけるセクション(プライマー結合配列)に相補的である。図4Aは、一端又は反対側端部からの単一リードシーケンシング(I)及びペアエンドシーケンシング(I及びIIの組み合わせ)を説明している。識別子、及び場合によりRA/RLP(の一部)の配列を提供することにより、標的配列の存在/不存在又は量を識別するリードに(シーケンシングプラットフォームによって作られたリード長に応じて)先立つ一つのシーケンシングプライマーを用いて、RA/RLPを含み、更に一つ以上の識別子(ID、L、Al)を含むシーケンシング断片が一方向(破線矢印)にシーケンスされる。Iで作成されたリードは主にアダプターの配列情報を提供し、IIは主に標的配列であり、IIIは両方である(ただし、プラットフォームに応じて、リードが十分に長いこと)。図4Bは、単方向の二重タギングシーケンシングを示す。制限されたライゲーションされたプローブ又は制限されたアンプリコン(RA/RLP)が2つのシーケンシングアダプターにライゲーションされており、単一方向にシーケンスされるが、二つのプライマー(SEQ PR1、SEQ PR2)で行われる。2つのプライマーは2つの異なるリード(reads)、ショートリード及びロングリードになる。リーケンシングは、少なくとも識別子(ショートリード及びロングリードの両方)の配列情報及び、L及びAlを含んでいてもよいRLP/RA(の一部)の配列を提供する。図4Cは再クラスタリング工程が行われている実施形態を示している。シーケンシング断片は一方向にシーケンスされ、 第一リード(Long1)を生じる。シーケンシング断片はシーケンシングが行われる担体に他のシーケンシングアダプターがアニーリングされることによって再クラスタリングされる。前記断片は他端からシーケンスされ、他のロングリード(Long2)を生じる。図4Dは図4B及び図4Cに記載された実施形態を組み合わせた実施形態を示す。このように、まず単一方向の二重タギングシーケンス手順の後に再クラスタリングが続き、他の方向からの前記断片のシーケンシングが行われ、2つのロングリード及び一つのショートリードとなる。 Y型アダプターの使用を示す図である。図5AはY型アダプターを示しており、Yのアームにおけるアダプターは識別子、シーケンシングアダプター、プライマー結合部位等の異なる要素を含んでいてもよい。したがって、Yの一つのアームは、Yの他のアームとは異なる。Y型の底部は二重鎖(すなわち、相補鎖を含む)であり、両鎖は制限断片にライゲーションされ得る。この実施形態は、2つのプローブの両方のタグセクションに一つの認識部位しか導入されておらず、RLA又はRAのような制限断片の両側に一つのアダプターだけをライゲーションする必要がある場合に用いることができる(I参照)。Y分岐アダプターの自己ライゲーションは図5AのIIに示されている。図5Bは、5A(II)に示されるY型アダプターの自己ライゲーションをどのように防ぐかを表している。アダプターのアニーリング末端に一本鎖だけライゲーションするように設計することができる。もう一方の鎖はギャップを有する。これはCTAの断片の千鳥状端が、Y分岐のGAのみのところでのオーバーハングと組み合わされることで示される。これが自己ライゲーションを防ぐ。図5Cは本発明のいくつかの実施形態を示しており、ライゲーションされたプローブの一本鎖が、付加的なオリゴヌクレオチドを用いてか、又はヘアピンプローブのライゲーションによって制限されることを示す。両方の実施形態とも、制限酵素で切ることができる鎖を提供している。 メイトペアシーケンシングの方法を表す図であり、環状化工程及び断片の2つの端部が連結される工程を含み、断片化及びアダプターのライゲーションの後、続いてそれらは共にシーケンスされる。
本発明は、その最も広い形態において、オリゴヌクレオチド・ライゲーション・アッセイに基づく、試料中の標的ヌクレオチドの検出方法に関し、ここで、試料及び/又は標的配列(すなわち、遺伝子座、及び/又はアレルの組み合わせ)を識別することのできる配列ベースの識別子(の組み合わせ)と共に提供されるかそれらを含むプローブが用いられ、ここで、ライゲーション工程の後に、ライゲーションされたプローブは、又は、増幅後に、増幅されたライゲーションされたプローブは、制限酵素を用いて制限され、プローブの一部が除去され、ここで、必要に応じてアダプターを含む識別子をライゲーションし、試料の適切な呼称、並びに/又は識別子の存在及び/若しくは不存在に基づく遺伝子型のためのシーケンシング工程における関連情報を含むそれらのパーツ(識別子及び/又は標的配列)を用いて続けられる。
このように、より詳細には、本発明は、試料中の標的ヌクレオチド配列を検出する方法に関し、以下の工程を含む:
(a)それぞれの標的ヌクレオチド配列(T)に、第1のプローブ(P1)及び第2のプローブ(P2)を提供し、ここで、第1のプローブは第1の標的特異的セクション(TS1)及び、標的ヌクレオチド配列に非相補的であって、場合により第1のプライマー結合配列(PBS1)を含む第1のタグセクション(TAG1)を含み、ここで、前記第1のタグセクションは第1の制限酵素のための第1の認識配列(RE1)を含み;ここで、第2のプローブは第2の標的特異的セクション(TS2)及び、標的ヌクレオチド配列に非相補的であって、場合により第2のプライマー結合配列(PBS2)を含む第2のタグセクション(TAG2)を含み、ここで、第2のタグセクションは第2の制限酵素のための第2の認識配列(RE2)を含む、工程;
(b)第1及び第2のプローブそれぞれの第1及び第2の標的特異的セクションを標的配列にハイブリダイズさせる工程;
(c)それぞれのプローブの標的特異的配列が標的配列の実質的に隣接するセクションにハイブリダイズした際に第1及び第2のプローブをライゲーションしてライゲーションされたプローブ(LP)を提供する工程;
(d)場合により、ライゲーションされたプローブを、任意の第1及び/又は任意の第2プライマーと一緒に増幅してアンプリコン(A)を提供する工程;
(e)ライゲーションされたプローブ又はアンプリコンを第1及び又は第2の制限酵素で制限し、制限されたライゲーションされたプローブ(RLP)又は制限されたアンプリコン(RA)を提供し、アダプターに基づく識別子(ADID1、ADID2)を含む第1及び/又は第2のアダプターを制限されたライゲーションされたプローブ(RLP)又は制限されたアンプリコン(RA)にライゲーションする工程;
(f)アダプターがライゲーションされた、制限されたライゲーションされたプローブ(RLP)又はアダプターがライゲーションされた、制限されたアンプリコン(RA)を、ハイスループットシーケンシング技術に供して前記制限されたライゲーションされたプローブ又は制限されたアンプリコンの少なくとも一部のヌクレオチド配列を決定する工程;
(g)試料中の標的ヌクレオチド配列の存在、不存在又は量を同定する工程。
本方法は、標的ヌクレオチド配列(興味のある配列)を含んでいてもよい(又は含んでいると推定される)一つ以上の試料(組み合わせられ、又はプールされていてもよい)を提供することから始まる。この試料に、(第1及び第2の)プローブのセットを添加し(個々の標的配列に対して、異なるプローブセットが提供されてもよい)、プローブの標的特異的セクションが、好ましい条件下で標的配列へのハイブリダイズを可能とする。ハイブリダイゼーションの後、標的配列に本質的に隣接してハイブリダイズしたプローブをライゲーションしてライゲーションされたプローブを得る。ライゲーションされたプローブは増幅してもよく、代わりに直接ハイスループットシーケンシング方法を用いたシーケンシングに供してもよい。シーケンシング工程と一緒に、試料中の(アレル特異的な)標的配列の存在が決定され、遺伝子型を決定することができる。
本発明の一態様は本発明で用いるプローブの有利な設計に関する。これらのプローブについては以下でより詳細に議論する。本発明の他の有利な態様は、オリゴヌクレオチド・ライゲーション・アッセイの検出プラットフォームとしてのハイスループットシーケンシング技術の状態とOLAベースアッセイの識別力との結合にある。本発明者らは、プローブ設計における発明の他にも、OLAアッセイをハイスループットシーケンシングと組み合わせて行うにも、プローブとプロトコルに相当な修正を要することを観察した。
本方法の工程(a)では、試料(S)中の標的ヌクレオチド配列(T)ごとにプローブセットが提供される。プローブセットは第1のプローブ(P1)及び第2のプローブ(P2)を含むことができる。
第1のプローブは標的特異的セクション(TS1)及び第1のタグセクション(TAG1)を含む。第1のタグセクションは標的ヌクレオチド配列に非相補的であり、すなわち、標的特異的セクションのアニーリングのために採用されるストリンジェントな条件下で標的配列にアニールまたはハイブリダイズしないヌクレオチド配列から構成されている。ある態様では、第1のプローブは標的特異的セクションをその3´端に含む。第1のタグセクションはさらに第1のプライマー結合配列(PBS1)を含んでいてもよい。第1のプライマー結合配列はプライマー(PR1)と結合することができる。
第2のプローブは第2の標的特異的セクション(TS2)及び第2のタグセクション(TAG2)を含む。第2のタグセクションは標的ヌクレオチド配列に非相補的であり、すなわち、標的特異的セクションのアニーリングのために採用されるストリンジェントな条件下で標的配列にアニールまたはハイブリダイズしないヌクレオチド配列から構成されている。ある態様では、第2のプローブは標的特異的セクションをその5´端に含む。第2のタグセクションはさらに第2のプライマー結合配列(PBS2)を含んでいてもよい。(もし存在するのであれば)第2のプライマー結合配列は、プライマー(PR2)と結合することができる。
少なくとも一つのタグセクションは制限酵素の認識配列を含む。第1及び/又は第2のタグセクションは、独立して、第1及び/又は第2の制限酵素のための第1及び/又は第2の認識配列(RE1、RE2)を含む。第1及び第2の認識配列は互いに同じであるか、又は異なっていてもよい(すなわちRE1=RE2又はRE1≠RE2)。2つの異なる認識配列を有する制限酵素が好ましい(RE1≠RE2)。認識配列はプライマー結合部位(もし存在するなら)と標的特異的セクションの間に位置する。第1の認識配列は任意の第1のプライマー結合配列及び第1の標的特異的セクションの間に位置していてもよい。第2の認識配列は任意の第2のプライマー結合配列及び第2の標的特異的セクションの間に位置していてもよい。
プローブの、それぞれの第1及び第2の標的特異的セクションは、標的配列の本質的に隣接するセクションへのハイブリダイズを可能とする。いくつかの実施形態では、一つ以上のヌクレオチドギャップが2つのセクションの間に存在していてもよい(ギャップライゲーション、例えばWO2007/100243、WO00/77260、US5185243、EP439182及び以下を参照されたい。)
ある実施形態では、第1及び第2のプローブがライゲーションされる、すなわち、互いに連結される。プローブは、本質的に、(第1、第2)それぞれの標的セクションが本質的に標的配列の隣接するセクションにハイブリダイズ(又はアニール)する際に互いにライゲーションされる。第1及び第2のプローブがライゲーションされるとライゲーションされたプローブ(LP)になる。
ライゲーションされたプローブはここで:
i)制限酵素の第1及び/又は第2の認識配列を認識することができる第1及び/又は第2の制限酵素で制限されて、制限されたライゲーションされたプローブ(RLP)が提供される(別の場所に記載するように、これには相補的なオリゴヌクレオチド及び/又はヘアピンプローブの使用又はss−DNA‐エンドヌクレアーゼの使用が要求されるであろう);又は
ii)第1及び/又は場合により第2のプライマーと共に増幅(線形又は指数関数的に)してアンプリコン(A)を得、そして制限酵素の認識配列を認識することができる第1及び/又は第2の制限酵素で制限して、制限されたアンプリコン(RA)が提供される。
一つ以上の制限酵素で、ライゲーションされたプローブを処理することにより制限されたライゲーションされたプローブは、タグセクションの部分から自由になっている。これにより、ライゲーションされたプローブの長さ及びそれに続いて産生されるデータ量が相当減少し、オリゴヌクレオチド・ライゲーション・アッセイ技術の、短いリードが好ましいハイスループットシーケンシングストラテジーへの適用可能性もが改善される。制限されたライゲーションされたプローブは制限酵素の第1及び/又は第2の認識配列の残り、及び第1及び第2の標的相補的セクションを含む。制限されたライゲーションされたプローブは、本質的に以下に説明するように、さらに一つ以上の配列ベースの識別子(ID)を含んでいてもよい。ライゲーションされたプローブの制限酵素での処理において援助するため、ライゲーションされたプローブに制限部位及び/又は認識部位でアニールすることができ、二本鎖の制限部位及び/又は認識部位を提供する、付加的なオリゴヌクレオチドが提供されてもよい。代替的に、制限部位及び/又は認識部位の位置をカバーするライゲーションされたプローブにヘアピン型プローブをライゲーションすることができ、続いて制限が可能な、二本鎖の制限部位及び/又は認識部位が提供される。代替的に、第1及び/又は第2のプローブそれら自体がそのようなヘアピン構造を含んでいてもよい。
制限されたアンプリコン(又は制限されたライゲーションされたプローブ)は、本質的に以下で記載するように、ここでハイスループットシーケンシング技術に供され、制限されたアンプリコン又は制限されたライゲーションされたプローブの、少なくとも一部のヌクレオチド配列が決定される。ある実施形態では、標的特異的セクションの少なくとも一部が決定される。ある実施形態では、プローブ中に識別子が組み込まれ、少なくとも一つ以上の識別子の配列が決定される。ある好ましい実施形態では、標的特異的セクション(アレル及び/又は遺伝子座情報)及び一つ以上の識別子の組み合わせが決定される。
識別子及び/又は標的特異的セクションの一部の配列が決定されると、試料中の標的配列の存在、不存在、又は量が同定される。
〔標的ヌクレオチド配列〕
その最も広い定義において、標的配列は興味のあるいかなるヌクレオチド配列であってもよい。標的配列は、例えばある疾病、遺伝的構成又は障害を、示唆する、それに関連する、又は代表するため、決定/検出が望まれるいかなる配列でもよい。標的配列は好ましくは多型を含むか、多型を表すか、又は多型に関連するヌクレオチド配列である。
ここで用いられている用語「多型」は、集団中においてヌクレオチド配列に2以上の変種(バリアント)が存在することをいう。多型は一つ以上の塩基の変化、挿入、繰り返し又は欠失を含んでいてもよい。多型は、例えば単純反復配列(SSR)及び一塩基:アデニン(A)、チミン(T)、シトシン(C)又はグアニン(G)が変えられることで起こるバリエーションである一塩基多型(SNP)を含む。一般的に集団の少なくとも1%で起こるはずであるバリエーションが、SNPと考えられている。SNPは例えばヒトの遺伝的バリエーションの90%を構成し、ヒトゲノムの100から300塩基毎に起こる。SNPの3つに2つはシトシン(C)のチミン(T)での置換である。例えばヒト又は植物のDNA配列におけるバリエーションは彼らが疾病、バクテリア、ウイルス、化学物質、薬物等をどのように扱うかに影響する可能性がある。
多型マーカー又は部位は、配列の相違が生じる遺伝子座である。好ましいマーカーは少なくとも2つのアレルを有し、それぞれ選択された集団の1%より大きい頻度で起こり、より好ましくは10%又は20%より大きい。多型遺伝子座は1塩基対と同じくらい小さくてもよい。多型マーカーは制限断片長多型、縦列反復配列多型(VNTRs)、超可変領域、ミニサテライト、ジヌクレオチド反復、トリヌクレオチド反復、テトラヌクレオチド反復、単純反復配列、量的形質遺伝子座(QTL)エレメント、及びAlu等の挿入エレメントを含む。最初に同定された対立遺伝子型を任意に参照型(野生型)といい、他の対立遺伝子型を代替又はバリアントアレルという。選択された集団において最も頻繁に起こる対立遺伝子型はしばしば野生型という。
二倍体(及び四倍体/六倍体)の生物は対立遺伝子型についてホモ接合又はヘテロ接合であってもよい。ダイアレル(2対立遺伝子)多型は2つの形態がある。トリアレル(3対立遺伝子)多型は3つの形態がある。一塩基多型は単一ヌクレオチドが占める多型部位で起こり、その部位はアレリック配列の間のバリエーションの部位である。前記部位は通常、アレルの高度に保存された配列が先行し、後続している(例えば、集団の1/100又は1/1000以下の構成員において変化がある配列である)。一塩基多型は通常、多型部位において一つのヌクレオチドの他のものへの置換によって生じる。一塩基多型は、参照アレルに相対的に、一つのヌクレオチドの欠失又は一つのヌクレオチドの挿入によっても生じ得る。他の多型は、インデルと呼ばれる、いくつかのヌクレオチドの(小さな)欠失又は挿入を含む。ここに記載した方法を用いて個別のDNA試料中に存在する特定の遺伝的バリエーション(多型)を解析する方法はジェノタイピング又は一塩基多型の場合にはSNPジェノタイピングといわれることもある。本発明の方法は、各アレルについてのプローブセットを用いたコドミナントジェノタイピングを可能にする。この実施形態はヘテロ接合の試料において有利である。
ここで用いられる用語「アレル」は、特定の遺伝子座の遺伝子の一つ以上の代替的な形態を意味する。生物の二倍体細胞において、与えられた遺伝子のアレルは特定の遺伝子座に位置するか、染色体上の遺伝子座(複数形はloci)に位置する。一つのアレルは、ホモロガスな染色体対のそれぞれの染色体に存在する。二倍体の、又は植物種は、特定の遺伝子座において多数の異なるアレルを含んでいてもよい。したがって、野生型の系統種の遺伝子座は、ヌクレオチド及び/又はコードされるアミノ酸配列が多少変化していてもよい種々のアレルを含んでもよい。
ここで用いられる用語「遺伝子座」(複数形はloci)は、例えば遺伝子又は遺伝マーカーが発見された、染色体上の特定の場所もしくは複数の場所又は部位を意味する。例えば、「遺伝子座」は遺伝子(及び対応するアレル)が発見された、ゲノム中の場所をいう。
〔試料〕
試料は少なくとも一つの標的配列を含むことができ、原則的に、本発明の方法は一つの標的配列を含む一つの試料(単一サンプルモノプレックス)で行うことができる。好ましくは、一つの試料は2以上の異なる標的配列を含み(単一サンプルマルチプレックス)、すなわち、2以上とは試料中の標的配列の量ではなく同一性を意味している。とりわけ、試料は少なくとも2つの異なる標的配列を含み、とりわけ、少なくとも100であり、好ましくは少なくとも250であり、さらに好ましくは少なくとも500であり、さらにとりわけ、少なくとも1000であり、好ましくは少なくとも2500であり、より好ましくは少なくとも5000であり、最も好ましくは少なくとも10000の、付加的な標的配列を含む。実際には、一つの試料に含まれる、分析することができる標的配列の数は、検出し得る数よりも、アンプリコン又はライゲーションされたプローブの数によって特に制限される。ここで採用されている検出方法は比較的多数の標的配列を可能にする。試料は個体又は個体群から直接単離することができ、又はそれらに由来するするもの、例えばcDNA、プラスミド、YAC、BAC、コスミド、人工染色体ライブラリ等であってもよい。
〔複数試料〕
ある実施形態では、本発明の方法を用いて複数の試料を解析することができる。各試料は異なる起源に由来するものであってもよく、例えば、ある疾病に関する遺伝的素因の存在又は不存在をスクリーニングしなければならない異なる患者である。あるいは、試料は異なる多型についてスクリーニングするための交配の子孫に由来するものであってもよい。本発明は、少なくとも2つの異なる試料の解析に用いることができ、特に少なくとも100であり、好ましくは250であり、さらに好ましくは少なくとも500であり、さらに特定すると少なくとも1000であり、好ましくは少なくとも2500であり、さらに好ましくは少なくとも5000であり、最も好ましくは少なくとも10000の試料であり、一つ(モノプレックス−モノプレックス)又はそれ以上又は複数(マルチプレックス―マルチプレックス)の標的配列の不存在若しくは存在についてである。試料はここに別の場所で概説しているように一つ以上の識別子(の組み合わせ)を用いる方法の更なる処理において識別することができる。
〔DNA〕
(核酸の)試料において、標的ヌクレオチド配列を含む核酸は興味のあるいかなる核酸であってもよい。試料中の核酸は通常DNAの形態であろうとも、当該試料に含まれるヌクレオチド配列情報は、例えばRNA、ポリA+ RNA、cDNA、ゲノムDNA、ミトコンドリア又はクロロプラストDNAのようなオルガネラDNA、合成核酸、DNAライブラリ(例えばBACライブラリ/BACクローンのプール)、クローンバンク又はそれらのいかなる選択物若しくは組み合わせを含む、いかなる核酸源からのものであってもよい。試料中のDNAは二本鎖でも、一本鎖でも、一本鎖に変性された二本鎖DNAであってもよい。二本鎖配列を変性させると二本の一本鎖断片が得られ、その片方又は両方をそれぞれの鎖に特異的なプローブで解析することができる。好ましい核酸試料はcDNA、ゲノムDNA、制限断片、アダプターがライゲーションされた制限断片、アダプターがライゲーションされた制限断片が増幅されたもの、又はAFLP(登録商標)断片若しくはAFLPテンプレートのプレ増幅で得られる断片、の上に標的配列を含んだものである。
〔プローブ〕
標的配列に相補的なオリゴヌクレオチドプローブのセクションは、試料中の各標的配列について、第1及び第2のプローブが提供され、それによってプローブがそれぞれ、標的配列の一部(標的配列のそれぞれ第1及び第2の部分)に相補的であるセクションをそれらの先端部に含み、標的配列の対応する相補的な部分が好ましくは本質的に互いに隣り合うように位置するように、設計される。
ある実施形態では、遺伝子座の異なるアレルに対応する、付加的な第1及び/又は第2のプローブが提供されてもよい。ある実施形態では、アレル特異的ヌクレオチドは、そこでライゲーションが起こる、第1又は第2のプローブの部位、すなわち標的特異的セクションの端部に位置される。
ある実施形態では、オリゴヌクレオチドプローブの対の中で、第1のオリゴヌクレオチドプローブはその(リン酸化された)5´端に、標的配列の第1部分に相補的なセクションを有し、第2のオリゴヌクレオチドプローブはその3´(ヒドロキシ)端に、標的配列の第2部分に相補的なセクションを有する。このように、プローブ対が標的配列の相補的部分にアニーリングすると、第1のオリゴヌクレオチドプローブの5´端は、本質的に第2のオリゴヌクレオチドプローブの3´端に隣接し、二つのプローブのそれぞれの端部がライゲーションされてホスホジエステル結合又は他の好ましい様式で共有結合的に連結されるようになる。ある実施形態では、オリゴヌクレオチドプローブ対の中で、第1のオリゴヌクレオチドプローブはその3´端に標的配列の第1部分に相補的なセクションを有し、第2のオリゴヌクレオチドプローブはその5´端に標的配列の第2部分に相補的なセクションを有する。このように、プローブ対が標的配列の相補的部分にアニーリングすると、第1のオリゴヌクレオチドプローブの3´端は、本質的に第2のオリゴヌクレオチドプローブの5´端に隣接し、二つのプローブのそれぞれの端部がライゲーションされてホスホジエステル結合又は他の好ましい様式で共有結合的に連結されるようになる。
アレル特異的な検出のためには、アレル特異的プローブはプローブの3´端にその標的特異的セクションを有することが好ましい。その他のやり方として、アレル特異的プローブが、プローブの5´端に有するのは好ましさが少ない。
ある実施形態では、試料中の存在、不存在又は量が特定される各標的配列のために、第1及び第2のオリゴヌクレオチドプローブの特定の対が設計され、各プローブは各標的配列の隣接する相補的部分に相補的なセクションを有する。このように、本発明の方法では、試料中に存在する各標的配列について、ライゲーションされたプローブ又は対応する(特異的な)アンプリコンを、増幅された試料の中で得ることができる。ある実施形態では、試料中の多様な標的配列に相補的な、多様な第1及び第2のオリゴヌクレオチドプローブが提供される。試料中の与えられた標的配列のための、第1及び第2のオリゴヌクレオチドプローブの対は、他の標的配列又は他の試料のためのプローブ対とは、少なくともヌクレオチド配列が異なるであろうし、他の標的のためのプローブ対とは長さ及び/又は大きさが異なっていてもよい(上記概説の通り、これは好ましさが少ないが)。さらに好ましくは、与えられた標的のためのプローブ対から、ライゲーションされたプローブ(連結されたプローブと示されることもある)、及び/又はライゲーションされたプローブからの配列が異なるアンプリコン及び/又は試料中の他の標的に対応するアンプリコンが産生される。
本発明の範囲の中ではかなりのプローブバリエーションが可能であり、ここに記載された第1及び第2のプローブ(“直線的プローブ”と示されることもある)の代替として用いることができる。その例はいわゆるパドロックプローブ及びキーロックプローブである。これらのプローブのバリアントは相互交換的に用いることができ、すなわち直線的、パドロック及びキーロックプローブを一つのアッセイの中で用いてもよい。
〔パドロックプローブ〕
本発明の、ある実施形態では、環状化可能プローブ又はパドロックプローブを用いることができる。第1及び第2のプローブは一つのプローブに組み合わされる。環状化可能プローブは直線状のオリゴヌクレオチドであり、標的配列にアニーリングすると、及びライゲーションされると、標的配列に対してトポロジー的にロックされた、環状構造をとる。ある実施形態では、ライゲーション工程の後であって増幅の前、好ましくはPCT−増幅の前に、試料をエキソヌクレアーゼで処理すると、ライゲーションしていない環状プローブを除去することができ、増幅からのいかなるライゲーションしていないプローブも防ぐことができる。環状化可能プローブは、それら自体は当分野で、例えばEP745140またはVan Eijkら、Nucleic Acids Research, 2004, 32, e47から知られている。既知のパドロックプローブは共通してローリングサークル型増幅又はポリメラーゼ連鎖反応を用いて増幅され、コンカテマーが得られる。さらに、既知の環状化可能プローブにおけるプライマー結合部位は環状化されたプローブ全体がいかなる標的配列セクションも含めて増幅されるようにされている。PCR増幅中のコンカテマー産物を回避するため、環状化可能ライゲーションプローブの中にブロッキング改変をWO03/052142に記載されたタイプの2つのプライマー結合部位の間に組み込むことができる。ある実施形態では、本環状化可能プローブにおけるプライマー結合部位は、好ましくはプライマー結合部位と識別子を含むセクションだけが増幅されるようにされ、好ましくはライゲーションされた標的特異的セクションは増幅されない。好ましくは、ライゲーションしていない環状化可能プローブを除去するためのエンドヌクレアーゼ処理を組み合わせると、これにより、環状化されたプローブの従来の増幅で得られる従来のアンプリコンに比べて比較的短い長さのアンプリコンが提供される。これは大きなコンカテマーの形成を回避し、さらには環状化プローブ全体の不必要な増幅も回避する。ある実施形態では、識別子はプライマー結合配列の一つに本質的に隣接して位置し、好ましくは、増幅の際にアンプリコンが2つのプライマー結合部位のうちの少なくとも一つ及び不連続な識別子を含むように、第1及び第2のプライマー結合部位の間に位置する。制限酵素の少なくとも一つ、好ましくは2つの認識部位は、好ましくは、その認識部位がプローブの第1及び/又は第2の識別子及び第1及び第2の標的配列セクションを含むように位置する。引き続く、アンプリコン又は制限されたライゲーションされたプローブのハイスループットシーケンシングが、識別子及び/又は標的セクションの配列(の一部)、つまり試料中の標的配列の存在、が提供される。この実施形態では、制限酵素の認識配列の存在によって、シーケンシング可能な断片に対してコンカテマーが減少される。
〔キーロックプローブ〕
ある実施形態では、検出すべき与えられた各標的配列について、好ましくは少なくとも一対の2つのプローブが次のように設計され、つまり対の中のそれぞれのプローブが標的配列の一部にハイブリダイズでき、対の中のそれぞれのプローブは、更にそれぞれが、両方のプローブが互いにハイブリダイズできるように、対の中のもう一方のプローブの対応するセクションに相補的なセクションを含んでいる。対の中の2つのプローブは互いにハイブリダイズした時にそれらのそれぞれが標的配列にもハイブリダイズできるように設計されている。2つのプローブは互いにハイブリダイズすると、標的ヌクレオチド配列の検出のためのオリゴヌクレオチド・ライゲーション・アッセイで用いられる際にパドロックプローブとして働くかまたは模倣するか、あるいはその後の増幅及び検出工程ではプローブは線形のライゲーション産物として機能する。このタイプのプローブは「キーロック」と呼ばれ、特にWO2004111271に開示されている。この実施形態のなかでは、クランプセクション及び標的特異的セクションの間に制限酵素の認識配列が存在することにより、キーロックを少なくともそれらのクランプセクションから自由にすることができる。
〔複合プローブ〕
本発明のある実施形態では、WO2005021794に記載されたようにプローブのセットが用いられる。標的配列は第1及び第2のプローブと接触するように持ってこられ、ここで第1のプローブは標的配列と相補的な第1の標的特異的セクションを含み、第1のプローブは第1のプライマー結合配列を任意の第1のタグセクションに含まないことが好ましい。第2のプローブは第2の標的特異的セクション及び第2のタグセクションを含み、ここで第2のタグセクションは第2のプライマー結合配列を含む。第2のタグセクションは第2のプライマー結合配列と第2の標的特異的セクションとの間に識別子を含んでいてもよい。2つのプローブのハイブリダイズ及びライゲーションの後、又はそれと同時に、第1のプローブの第1の標的特異的セクション(の一部)にハイブリダイズすることができるセクションを含み、更にプライマー結合セクションを含むセクションを含む複合プローブが提供される。第1タグセクション及び、プライマー結合部位を含む複合プローブセクションの両方は、更に制限部位を含んでいてもよい。第1のタグセクションの中で、制限部位は、プライマー結合部位と標的特異的セクションの間に位置する。複合プローブの中で、制限部位はプライマー結合部位と第1の標的部位にハイブリダイズすることができるセクションの間に位置する。複合プローブはライゲーションされた第1及び第2のプローブにハイブリダイズする。ライゲーションされた第1及び第2のプローブに沿った複合プローブの伸長は、伸長された複合プローブを提供し、それは後に第1及び第2のプライマー結合部位に結合することができる第1及び第2のプライマーを用いて増幅することができる。得られたアンプリコンは一つ以上の制限酵素で制限することができ、ここに記載したハイスループットシーケンシング技術で検出することができ、試料中の標的配列は識別子の存在若しくは不存在、及び/又は遺伝子座/アレル情報によって同定することができる。
〔タグセクション〕
タグセクションの用語は標的ヌクレオチド配列にハイブリダイズすることができないプローブの部分を意味するために用いられる。タグセクションは通常識別子とプライマー結合部位、及び場合により、ここの別の場所で概説するように、クランプセクションを含む。
〔プライマー結合配列〕
プライマー結合部位は、線形又は指数関数的な増幅を容易にするためにプローブに組み込むことができる。プライマー結合部位は好ましくは、プローブ中の標的特異的セクション以外の部分に位置し、好ましくは本質的に標的配列に相補的ではないタグセクションの中である。好ましくは、(例えば一つの試料中で用いられる)プローブ対のグループの中で、プライマー結合部位はユニバーサルであり、すなわち予め決定されたプライマー結合部位のグループだけがプローブに組み込まれる。それによりマルチプレックスプライマー伸長又は、例えばAFLP(登録商標)から知られるような、その3´端に一つ以上の選択的な塩基を含むプライマー(EP0534858)等の、限られた数のプライマーからの増幅が可能となる。プローブ対のグループ間で、プライマー結合部位は異なっていてもよい(すなわち異なる配列を有していてもよい)。ある実施形態の中では、異なったプライマー結合部位に結合することができるプライマーのTmはプローブ対のグループ間で異なっていてもよい。典型的には、プライマー結合配列は6〜200ヌクレオチド、好ましくは8〜50ヌクレオチドの範囲であり、さらに好ましくは10〜25ヌクレオチドの長さを有していてもよい。
〔ハイブリダイゼーション〕
先に触れたように、プローブは試料の中でハイブリダイズに持ってこられ、標的配列と接触する。オリゴヌクレオチドプローブの対は続いて、好ましくは隣接する、試料中の標的配列の相補的部分にアニーリングすることができる。相補的な標的配列への、オリゴヌクレオチドプローブの特異的なアニーリングのための方法及び条件は当分野でよく知られている(例えば、Sambrook and Russel (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Pressを参照)。通常、オリゴヌクレオチドプローブと標的配列の混合の後、核酸は塩緩衝液中で短時間(例えば30秒〜5分間)のインキュベーション(一般的に94℃〜96℃)によって変性される。変性されたプローブと標的配列を含む試料は次にプローブと標的配列の特異的アニーリングのために最適のハイブリダイゼーション温度に冷やされ、それは通常、プローブの相補的セクション(標的セクション)と(標的配列の中の)その相補的セクションとのハイブリッドの遊離温度よりも約5℃低い。対の中の2つのプローブのうちの一つの、又は複数の標的配列の試料中での、非特異的又は無効なハイブリダイゼーションを防ぐため、一つの試料中では、標的配列に相補的なプローブのセクションが類似しており、好ましくは試料中に存在する他の標的配列との遊離温度が同じであることが好ましい。すなわち、第1及び第2のプローブの相補的セクションは、その遊離温度において、相違が20℃、15℃、10℃、5℃又は2℃よりも小さいことが好ましい。これは、第1及び第2ののプローブの相補的セクションが、同様の長さで、同様のG/C含量のものを用いることで容易にされ、相補的セクションの長さの相違が20、15、10、5又は2ヌクレオチドより小さく、それらのG/C含量の相違が30%、20%、15%、10%又は5%より小さいことが好ましい。ここで用いる相補的とは、第1のヌクレオチド配列が第2のヌクレオチド配列に、通常のストリンジェントな条件下で特異的にハイブリダイズすることができることを意味する。他のヌクレオチド配列に相補的であると考えられるヌクレオチド配列は、少量の、すなわち20%、15%、10%、5%又は2%より少ないミスマッチを含んでいてもよい。あるいは、ミスマッチを補うことが必要であるかもしれず、例えば遊離温度を増加したり、LNAsのように特異性を向上したりすることによりミスマッチを補うことができる改変されたヌクレオチドを参照又は組み込むことによってここに組み込まれるEP−A974672に例えば記載されているような、ユニバーサルヌクレオチドの組み込みによってである。プローブの標的配列へのアニーリングは濃度依存的なので、アニーリングは好ましくは小量で、すなわち25μlより少ない、好ましくは10μlより少ない量で行われる。これらのハイブリダイゼーション条件下で、通常、プローブの標的配列へのアニーリングは速く、5分、10分、又は15分より長く続ける必要はない。ハイブリダイゼーション温度が非特異的アニーリングが避けられるように維持される限り、より長いアニーリング時間を用いてもよいが。試料間での標的配列の相対的な量のモニタリングを可能にするために、ライゲーションされたプローブが標的を完全に占めることに依拠する定量的なアプリケーションでは、より長いアニーリング時間がより必要とされ/求められる。
ある実施形態ではオーバーナイトハイブリダイゼーションや1時間に10サイクルのような反復ハイブリダイゼーション等のハイブリダイゼーション時間の延長によって、優れた結果が得られている。ハイブリダイゼーション時間の延長は、ハイブリダイゼーション効率の相違によるシグナルの相違が低減され、完全なハイブリダイゼーション及び標的配列が存在するすべてのプローブのライゲーションを達成するために望ましいと考えられるため、有利であるであろう。本明細書に記載された熱安定性リガーゼを用いた、ハイブリダイゼーション−ライゲーション工程の組み合わせにより、優れた結果が得られている。この実施形態ではハイブリダイゼーション−ライゲーションはプローブが熱安定性リガーゼの存在下で1時間でハイブリダイズし、その後に変性工程が続くようにして行われた。これらの工程を少なくとも2回繰り返して良い結果を得た。これらの工程を10回繰り返すと優れた結果が得られる。変性及びアニーリングの間の蒸発を防ぐため、反応チャンバー(チューブ又はマイクロタイターウエル)の壁および蓋も、少なくとも反応ミクスチャと同じ温度まで加熱してもよく、これは一般的に市販のDNA増幅装置を用いて達成することができ、また、ミネラルオイルを上に載せることによって達成される。好ましいオリゴヌクレオチドプローブでは、標的相補的セクションの長さは好ましくは少なくとも15、18又は20ヌクレオチドであり、好ましくは30、40、又は50ヌクレオチドを超えず、プローブは好ましくは標的セクションからの遊離温度が少なくとも50℃、55℃又は60℃である。
〔ライゲーション〕
標的配列上の相補的部分に本質的に互いに隣接して標的特異的セクションがアニーリングする、第1及び第2のオリゴヌクレオチドプローブ又は環状化可能プローブの5´リン酸化末端及び3´ヒドロキシ末端それぞれは、当分野で公知の好ましい手段で結合されて共有結合を形成する。プローブの末端はリガーゼによって酵素的に好ましくはDNAリガーゼであるリガーゼによってホスホジエステル結合で結合される。DNAリガーゼは相補的な鎖の隣接する部位で結合している2つのポリヌクレオチド鎖(の端部)の間のホスホジエステル結合の形成を触媒することができる酵素である。DNAリガーゼは通常ATP(EC6.5.1.1)又はNAD(EC6.5.1.2)を二本鎖DNAの中のニックをシールするためのコファクターとして必要とする。本発明で用いるのに好ましいDNAリガーゼはT4DNAリガーゼ、E.coliDNAリガーゼ又は好ましくはThermus aquiaticus (Tag)リガーゼ、Thermus thermophilicsDNAリガーゼ、若しくはPyrococcusDNAのような、熱安定性リガーゼである。あるいは、適切に修飾されたポリヌクレオチド末端の化学的ライゲーションを、標的配列の相補的部分の隣接する部位にアニーリングした2つのオリゴヌクレオチドプローブをライゲーションするために用いてもよい。修飾されたポリヌクレオチド末端に典型的な反応性基としては、これに限定されないが、ホスホロチオエート、及びトシレート又はヨウ化物、エステル及びヒドラジド、RC(O)S、RCH2S及びアルファ−ハロアシル、トリホスホリル及びブロモアセトアミド基、及びS−ピバロイルオキシメチル−4−チオチミジンが含まれる。化学的ライゲーション剤は、これらに限定されないが、カルボジイミド、臭化シアン(BrCN)、N−シアノイミダゾール、イミダゾール、1−メチルイミダゾール/カルボジイミド/シスタミン、ジチオスレイトール(DTT)及び紫外光のような、活性化剤、濃縮剤及び還元化剤が含まれる。自己ライゲーション、すなわち、ライゲーション剤の非存在下での自発的ライゲーションも本発明の範囲内である。化学的ライゲーションの詳細なプロトコル及び適切な反応基は、他の場所、Xu et al., Nucleic Acid Res., 27: 875-81 (19
99) ; Gryaznov and Letsinger, Nucleic Acid Res. 21 : 1403-08 (1993) ; Gryaznov et al., Nucleic Acid Res. 22: 2366-69 (1994) ; Kanaya and Yanagawa, Biochemistry 25: 7423-30 (1986) ; Luebke and Dervan, Nucleic Acids Res. 20: 3005-09 (1992) ; Sievers and von Kiedrowski, Nature 369: 221-24 (1994) ; Liu and Taylor, Nucleic Acids Res. 26: 3300-04 (1999); Wang and Kool, Nucleic Acids Res. 22: 2326-33 (1994) ; Purmal et al., Nucleic Acids Res. 20: 3713-19 (1992) ; Ashley and Kushlan, Biochemistry 30: 2927-33 (1991) ; Chu and Orgel, Nucleic Acids Res. 16: 3671-91 (1988) ; Sokolova et al., FEBS Letters 232: 153-55 (1988) ; Naylor and Gilham, Biochemistry 5:2722-28 (1966) ; 及び米国特許第5,476,930号に見つけることができる。
化学的及び酵素的ライゲーションの両方は、一つ又は両方のプローブがライゲーション部位で、又はその近くで、標的配列とミスマッチである複合体に比べて、完全にマッチしたプローブ―標的配列複合体においてはるかに効率的に発生する(Wu and Wallace, 1989, Gene 76: 245-254; Xu and Kool, supra)。ライゲーションの特異性、すなわちミスマッチのオリゴヌクレオチドに比較した、完全にマッチするオリゴヌクレオチドの相対的なライゲーション効率、を増加させるため、ライゲーションは好ましくは上昇された温度で行われる。このように、本発明のある実施形態では、50〜65℃でも、延長された時間、活性を有するが、より高い温度、例えばPCRの変性工程での通常90〜100℃、では容易に不活性化されるDNAリガーゼが採用される。そのようなDNAリガーゼの一つは、WO01/61033から知られるグラム陽性菌(MRCH065株)由来のNAD要求DNAリガーゼである。このリガーゼは“リガーゼ65”と言われ、オランダ アムステルダムのMRCから商業的に入手可能である。ある実施形態では、Taqリガーゼが用いられる。ある実施形態では、リガーゼは第1及び第2のプローブがライゲーションされた後に不活性化される。ある実施形態では、ライゲーションされたプローブは標的配列から変性される。
本発明のある実施形態では、ハイブリダイゼーション及びライゲーションは組み合わされた工程の中で行われる。そのようなハイブリダイゼーションとライゲーションとの組み合わせ工程は温度サイクルプロファイル及び熱安定性リガーゼを用いて実施することができる。
〔ギャップライゲーション〕
代替的な実施形態では、例えばインデルの同定に向けて、第1及び第2のプローブの標的相補的セクションのそれぞれの末端は、ギャップが残るようにアニーリングされてもよい。換言すると、第1及び第2のプローブの第1及び第2の標的特異的セクションは隣に位置する標的ヌクレオチド配列の第1及び第2の部分にはハイブリダイズしない。これは基本的に、とりわけEP185494, US5521065, US5692223 及びWO03054311に開示されているこの技術の他のバラエティとは異なる。このギャップは適当な(第3の)(オリゴ)ヌクレオチドで埋められてライゲーションされる。このような手法は当分野で「ギャップライゲーション」(イルミナ ゴールデンゲート アッセイ)として知られており、とりわけWO00/77260; US5185243; EP439182; EP320308; W090/01069に開示されている。このギャップを埋める他の可能性は、ポリメラーゼ及びリガーゼを、場合によりA、T、C若しくはG、又はジ−、トリ−若しくは他の小さなオリゴヌクレオチドから選択される、単一の又は複数のヌクレオチドと組み合わせて用いてプローブの一端を伸長することによるものである。標的配列がRNAの場合には、このギャップを埋めるまだ他の可能性は、逆転写酵素及びリガーゼを場合によりA、T、C若しくはG、又はジ−、トリ−若しくは他の小さなオリゴヌクレオチドから選択される、単一の又は複数のヌクレオチドと組み合わせて用いてプローブの一端を伸長することによるものである。ギャップライゲーションは、単一SNPs/インデル又は密接に位置しているマルチSNPs(ハプロタイプ)の検出の両方に用途を見出すことができる。この実施形態では、シーケンシング工程には好ましくはギャップの配列の決定が含まれる。
〔増幅〕
本発明の方法においては、当分野で公知の任意の好ましい核酸増幅方法を用いて、ライゲーションされたプローブを増幅し、標的ヌクレオチド配列の表現である増幅されたライゲーションされたプローブ(アンプリコン)を含む増幅された試料を作ることができる。核酸増幅方法は通常1つ又は2つのプライマー、dNTP、及び(DNA)ポリメラーゼを用いる。増幅の好ましい方法はPCRである。ここで増幅方法の例としていう「PCR」又は「ポリメラーゼ連鎖反応」は特定のDNAセグメントのインビトロでの酵素的増幅のための迅速な手法である。増幅されるDNAは試料を加熱することで変性される。DNAポリメラーゼ及び過剰のデオキシヌクレオチド三リン酸の存在下で、標的配列に特異的にハイブリダイズするオリゴヌクレオチドが新たなDNA合成を提供する。ポリメラーゼは、鎖置換活性を示さないか、又は少なくとも著しくないDNAポリメラーゼであることが好ましい。その例は、Amplitaq(登録商標)、Amplitaq Gold(登録商標)(供給元:Perkin Elmer)及びAccuprime(登録商標)(Invitrogen)である。1ラウンドの合成により、親の鎖のように、変性及びアニーリングでプライマーにハイブリダイズすることができる確定された長さの新しい鎖が得られる。変性、アニーリング及び合成の第2サイクルでは、2本の一本鎖産物が一緒になって、ちょうどプライマー末端の間の長さの、離散的な二本鎖産物を構成する。この離散的な産物は連続する各増幅ラウンドで指数関数的に蓄積される。約20〜30サイクルで、数百万倍増幅の離散的断片を得ることができる。PCRのプロトコルは当分野でよく知られており、標準的な実験テキスト、例えばAusubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1995)に記載されている。本発明の方法における好ましいPCR増幅の条件はEP-A 0534858及びVos et al. (1995; Nucleic Acids Res.23: 4407-4414)に記載されており、ここでは、70〜700ヌクレオチドの、同じプライマー結合配列を有する複数のDNA断片が、一対のプライマー対を用いて同等の効率で増幅されている。ある実施形態では、ポリメラーゼは増幅後に不活性化される。適用することができる、他の多重及び/又は等温増幅方法には、例えばローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、自己配列複製(3SR)、QB−レプリカーゼ媒介RNA増幅、又は鎖置換増幅(SDA)が含まれる。いくつかの例では、本発明の要旨を逸脱しない範囲で、プローブ及びプライマーの異なる設計を必要とするかもしれない。
本発明において、増幅は時間的にいくつかの点で行われてもよい。増幅は、例えばライゲーション工程の後に、及び/又はシーケンシング工程の一部として(すなわち、エマルジョンPCR(Roche, Ion Torrent)又はブリッジ増幅(lllumina))、ライブラリの準備(シーケンシングの開始材料の増加)のために行うことができる。
〔アンプリコン〕
ここで用いる「アンプリコン」はライゲーションされたプローブの、増幅工程の産物をいう。すなわち、ここで用いる「アンプリコン」は増幅されたライゲーションされたプローブをいう。2つの標的配列セクションがリガーゼで連結されるライゲーション工程の後に、連結された又はライゲーションされたプローブが一つ以上のプライマー及びポリメラーゼと組み合わされ、増幅されてアンプリコンが産生される。ライゲーションされたプローブ、プライマー、ポリメラーゼ及び/又は他のパラメーター及び変数は、増幅によって、ライゲーションされたプローブが(線形に)増幅されたことを示すようにされる。好ましくは、アンプリコンは増幅された連結されたプローブのモノマー表現である。ある実施形態では、アンプリコンは好ましくは第1の、及び場合により第2のプライマー及び中間に位置する識別子のヌクレオチドからなる。ある実施形態では、アンプリコンは標的特異的セクションに由来するヌクレオチドを含んでいてもよい。本発明の様々な実施形態は、これについてさらに詳細を提供するであろう(図2)。
〔制限酵素〕
制限酵素:制限エンドヌクレアーゼ又は制限酵素は、二本鎖DNA分子における特的なヌクレオチド配列(標的部位)を認識して、標的部位ごとに、そこでまたはその近くで、DNA分子の両方の鎖を切断し、平滑末端又は突出末端を残す酵素である。一本鎖DNAを切断する制限酵素もあり(EndoTT, Exo I, Exo T)、それらはライゲーションされたプローブが増幅されず、シーケンシングに先だって直接切断される場合に本発明で用いられる。。
TypeIIs制限酵素は、制限部位から離れた位置に認識部位を有する制限酵素である。換言すると、TypeIIs制限酵素は認識配列の一方の外側で切断する。例としては、NmeAIII (GCCGAG(21/19)、FokI, AlwI, MmeIである。認識配列の両外側で切断するTypeIIs制限酵素もある。
フリークエント(頻繁な)カッターとレア(稀な)カッターは、通常、ヌクレオチド数が4(MseI等)から6(EcoRI)及びさらには8(NotI)の種々の認識配列を有する制限酵素についての標示である。用いられる制限酵素はフリークエントカッターでもレアカッターでもよい。通常「フリークエント」の用語は「レア」の用語に関連して用いられる。フリークエント切断の制限酵素(フリークエントカッターともいう)は認識配列が比較的短い制限酵素である。一般的に、フリークエントカッターが認識して切断するのは4〜5ヌクレオチドである。そうすると、フリークエントカッターは平均的には、256−1024ヌクレオチド毎にDNA配列を切断する。レアカッターは認識配列が比較的長い制限酵素である。一般的に、レアカッターが認識して切断するのは6ヌクレオチド以上である。そうすると、レア6カッターは平均的に4096ヌクレオチド毎にDNA配列を切断し、より長い断片を生じる。再び確認すると、フリークエント及びレアは互いに相対的であり、例えばMseIのような4bp認識酵素が、AvaII等の5−カッターとの組み合わせで用いられる場合、AvaIIはレアカッターとして、MseIはフリークエントカッターとして見られる。
アイソシゾマー:アイソシゾマーは、同じ認識配列に特異的であり、同じ部位で切断する、対の制限酵素である。例えば、SphI(GCATG^C)及びBbuI(GCATG^C)は互いにアイソシゾマーである。ある配列を認識して切断する最初の酵素はプロトタイプとして知られ、その配列を認識して切断する、それに続く全ての酵素はアイソシゾマーである。同じ配列を認識するが切断が異なる酵素はネオシゾマーである。アイソシゾマーはネオシゾマーの特定のタイプ(サブセット)である。例えば、SmaI(CCC^GGG)とXmaI(C^CCGGG)は互いにネオシゾマーである(アイソシゾマーではない)。
制限断片は、制限酵素でのDNAの消化によって産生されたDNA分子に用いられる用語である。いかなるゲノム(又は核酸、その起源を問わず)も特定の整合で制限断片の不連続のセットに消化されるであろう。制限酵素切断によってもたらされたDNA断片は、シーケンシング等の種々の技術に用いられる。制限断片は平滑末端でも突出部を有していてもよい。突出部はポリッシングとして記載される技術を用いて除去することができる。制限断片の「内部配列」の用語は、一般的に試料ゲノムの中に存在する制限断片の一部の起源を示すために用いられ、すなわち、アダプターの一部を形成しない。内部配列の用語はアダプター、制限酵素の認識配列の残り等を区別するために用いられる。
〔識別子配列〕
ある実施形態では、本発明のオリゴヌクレオチドプローブはさらに、識別子又は識別子配列を含む。識別子は可変配列のオリゴヌクレオチド配列である。識別子の長さは1〜30、好ましくは2〜20、より好ましくは3〜10及びもっとも好ましくは4〜6ヌクレオチドで変化する。識別子は唯一の配列である。ここで用いられる唯一とは、一つの識別子(の組み合わせ)が一つの試料又は複数の試料における特異的な標的配列を、一つの試料又は複数の試料における他のいかなる標的配列、アレル、遺伝子座からも異なるものとして明確に識別することを意味する。唯一の特徴はlannone et al. (2000), Cytometry 39: pp. 131-140によって記載されたタイプのZIPコード配列として説明することができる。6ヌクレオチドの識別子では、最大4096の唯一の組み合わせを作ることができる(=4の6乗)。ある実施形態では、識別子は2塩基GC(又は他に定義される短いG/Cリッチの)アンカー配列を3´末端に含み、同じ結合親和性及び増幅効率を確保している。さらに、識別子は、二つの同一の連続する塩基を有さないことが好ましく、明確な配列認識を保証するために、識別子のセットの中で用いられる全ての識別子は少なくとも2つの塩基が異なることが更に好ましい。複数の試料が用いられる場合、各試料は特定の識別子のセットを用いて同定され得ることが望ましい。一般的に識別子は、得られるアンプリコン又は制限されたライゲーションされたプローブが識別子配列を含むように、プライマー結合配列及び/又は制限酵素を用いたライゲーションされたプローブの増幅又は制限によってその末端に識別子が組み込まれるように、配置される。
一般的に、これはライゲーションされたプローブの中では、識別子は標的セクションの近くであって、第1のプライマー結合部位と任意の第2のプライマー結合部位の位置との間に位置することを意味する(図1B参照)。例えば遺伝子座−アレルの組み合わせのように、二つ以上の識別子を用いる実施形態では、識別子はプライマー結合部位の間にも位置する。ある実施形態では、2つの識別子が提供され、一つは各プローブに提供される。プローブのうちの一つは、すなわち、特定の遺伝子座に向けられ、遺伝子座特異的識別子を含んでいる、遺伝子座プローブとして見てもよい。もう一つのプローブは、すなわち、アレル特異的ヌクレオチドを、好ましくはライゲーション部分に含んでいる、アレル特異的プローブであってもよい。アレル特異的プローブはアレル特異的識別子を含んでいてもよい。このようにして、特定の遺伝子座‐アレルの組み合わせの存在又は不存在は、結合した識別子の存在/不存在によって同定される。一つの多型の全てのアレリックなバリエーションについて試験する場合、ただ一つの遺伝子座プローブが必要とされ、4つのアレル特異的プローブと組み合わされる。ある実施形態では、アレル特異的プローブだけが、一つの遺伝子座特異的識別子セクション及び一つのアレル特異的識別子セクションを含む識別子を含んでいてもよく、例えば、5bpの遺伝子座識別子に2bpのアレル識別子が続いている形式である。あるいは、(一つのプローブ又は両方のプローブに)5bpの試料識別子に2bpのアレル識別子が続いているか、又は更にその遺伝子座を同定するための標的セクションの部分である。
試料ベースの識別子は、単独であっても、遺伝子座及び/又はアレル識別子と組み合わせてもよい。試料識別子はプローブ中に予め提供することができるが、制限されたプローブ又はアンプリコンにライゲーションすることもできる。試料ベースの識別子は制限されたプローブ又はアンプリコンにライゲーションされたアダプターに存在していてもよい。この指針に基づいて、現在様々な可能性が当業者に利用可能である。このように、一つのシーケンシングで複数の試料が解析される場合、識別子の一つは複数の試料における試料の識別子に用いることができる。識別の目的のために、(遺伝子座及び/又はアレルを同定する)標的特異的セクション、アレル及び/又は遺伝子座を同定する一つの識別子(の一部)及び試料を同定する他の識別子(の一部)、の配列の組み合わせを使用することができる。ある実施形態では、識別子を試料及びアレルの同定に用いることができ、遺伝子座は少なくとも標的特異的セクションの配列の一部によって同定することができる。
まとめると、識別子(ID)は、プローブのタグセクションに、制限されたライゲーションされたプローブ若しくはアンプリコンにライゲーションされたアダプターに、増幅工程の間にプライマーを介して及び/又は標的特異的セクションそのもの(遺伝子座(L)/アレル(Al)情報)の中に、独立に導入することができる。識別子は、遺伝子座/アレル情報の中に、制限部位(RE)とアレル/遺伝子座配列の間(標的特異的セクション)に、制限されたライゲーションされたプローブ若しくは制限されたアンプリコンにライゲーションされたアダプターの間に、独立に位置させることができる。導入及び位置は片方又は両方のプローブ中で独立に配置することができる。
(ライゲーションされた)プローブにおける識別子の、様々な個々の位置のいくつかの概略図を図3Bに示す。
本発明の特定の好ましい実施形態では、プローブは標的セクション及び認識配列を含み、場合によりプライマー結合配列を含む。ライゲーションの後、ライゲーションされたプローブは制限され、又は増幅され、制限/消化されて制限されたライゲーションされたプローブ(RLP)又は制限されたアンプリコン(RA)を生じる。結果物のRLP/RAに対して、一つ以上の識別子を含む一つ又は二つのアダプターがライゲーションされる。結果物のアダプターがライゲーションされたRLA/RAはシーケンシングされる。標的配列のアレル/遺伝子座の組み合わせは、標的セクションの配列情報によって同定される。試料はライゲーションされたアダプター中の識別子に基づいて同定される。これは、一つの試料中において複数の標的配列を解析する効率的なやり方であり、複数の試料からの結果を組み合わせて、組み合わされた試料を解析する。それは図1Cに説明されている。
ライゲーションされたプローブはプライマー結合部位に対応するプライマー対を用いて増幅される。ある実施形態では、プライマー対はプライマーを一つだけ含み、増幅は指数関数的よりはむしろ線形的に行われる。ある実施形態では、前記対は、第1のプライマー結合セクションにアニーリングすることができ、増幅又は伸長を開始することができる第1のプライマーを含む。ある実施形態では、前記対はさらに第2のプライマー結合セクションにアニーリングすることができ、増幅又は伸長を開始することができる第2のプライマーを含む。ある実施形態では、第2のプライマーは、プローブ中の第2のプライマー結合部位と同じ配列を有し、すなわちリバースプライマーである。好ましい実施形態では、少なくとも一つのプライマー又は同じプライマー対が、試料中の2つ以上の、異なる、ライゲーションされたプローブの増幅、好ましくは試料中の全ての、ライゲーションされたプローブの増幅に用いられる。このようなプライマーはユニバーサルプライマーと呼ばれることもあり、なぜなら、それらはユニバーサルプライマー結合部位を含むすべてのライゲーションされたプローブの結果としての、対応するユニバーサルプライマー結合部位を含むすべての連結されたプローブの増幅を開始(プライミング)することができるからである。工程(i)での増幅に用いられる異なるプライマーは、基本的に、アニーリング及びプライミング効率が同じである。したがって、試料中のプライマーは好ましくは、遊離温度の相違が20℃、15℃、10℃、5℃又は2℃より小さい。これは、本明細書の別の場所での、オリゴヌクレオチドプローブの標的特異的セクションについての概説のように達成することができる。標的特異的セクションの配列とは異なり、プライマーの配列は標的配列によっては検出されない。プライマー配列は、それぞれの三量体が一つのA、T、C及びGを含むようなヌクレオチドの三量体から配列を組み立てることによって、又はプライマーのG/C含量と遊離温度が同じか、非常に近いことを確実にする他のやり方で、簡便に設計してもよい。プライマー(及び第2のプローブのタグセクションにおける対応するプライマー結合部位)の長さは、好ましくは少なくとも12、15又は17ヌクレオチドであり、好ましくは25、30、40ヌクレオチドを超えない。ある実施形態では、試料における少なくとも二つの異なる標的配列に相補的な、第2のオリゴヌクレオチドプローブのうちの少なくとも二つは、それぞれが、単一のプライマー配列に相補的な一つのプライマー結合セクションを含むタグセクションを有する。
ある実施形態では、同じアンカー配列を保有する他のプライマーに比べて同様のプライミング効率を確保するため、プライマーは3´アンカー配列、好ましくは、2bpのアンカー配列、好ましくはGCのアンカー配列を含んでいてもよい。一般的に、対応するプライマー結合配列もその相補的配列を保有しているだろう。
したがって、プライマー対の中の第1及び第2のプライマーの少なくとも一つが試料中の少なくとも2つの異なる標的配列に対応するライゲーションされたプローブの増幅に用いられ、より好ましくは試料中の全ての標的配列に対応する、連結されたプローブの増幅に用いられる。好ましくは、単一の第1プライマーだけが用いられ、いくつかの実施形態では単一の第1プライマー及び単一の第2プライマーが全ての連結(ライゲーション)されたプローブの増幅に用いられる。複数の異なる断片の増幅に共通のプライマーを用いることは、増幅工程の効率に関して有利である。アニーリングされたプローブセクションのライゲーションから得られたライゲーションされたプローブは、好ましくは試料中の各ライゲーションされたプローブのプライマー対からなるプライマー対を用いて増幅される。
プライマー対は、ライゲーションされたプローブに存在するプライマー結合配列に相補的なプライマーを含む。一つのプライマー対は通常一つの第1のプライマー及び少なくとも一つの第2のプライマーを含むが、両方向で開始(プライム)する一つだけのプライマーからなっていてもよい。とりわけEP534858及びVos et al., Nucleic Acid Research, 1995, vol. 23, 4407-4414に記載されているようなAFLPプライマーとして当分野で知られているプライマーを用いて優れた結果がられ、以下でより詳しく論じる。
〔ハイスループットシーケンシング〕
HTSと略されることもあるハイスループットシーケンシング又はスクリーニングは、生物学及び化学の分野に特に関係する、化学的実験の方法である。それは次世代シーケンシング(Next Generation Sequencing)とも呼ばれ、Janitz Ed. Next Generation Genome sequencing, Wiley VCH, 2008に十分に記載されている。近代のロボット工学及び他の専門化された実験室設備を通じて、研究者は大量の試料を一度に効率的にスクリーニングできるようになった。
シーケンシングは、ここに参照によって組み込まれるWO03/004690, WO03/054142, WO2004/069849, WO2004/070005, WO2004/070007, 及び WO2005/003375 (すべて454 Life Sciences、現在はRoche diagnosticsによる)、 Seo et al. (2004) Proc. Natl. Acad. Sci. USA 101 :5488- 93に記載された方法、及びHelicos, Solexa, US Genomics等の技術による方法のような、ハイスループットシーケンシング法を用いて行われることが好ましい。
〔Roche GS FLX技術に基づくハイスループットシーケンシング〕
シーケンシングは、ここに参照によって組み込まれるWO03/004690, WO03/054142, WO2004/069849, WO2004/070005, WO2004/070007, 及びWO2005/003375(すべて454 Life Sciences、現在はRoche diagnosticsによる)に記載された装置及び/又は方法を用いて行うことが好ましい。記載された技術は一度の実施で4千万(40 million)塩基をシーケンシングすることができ、競合する技術に比べて100倍速くて安価である。前記シーケンシング技術はおよそ以下の5工程からなる:
(1) DNAを断片化し、特定のアダプターをライゲーションして一本鎖DNA(ssDNA)のライブラリを構築する工程;
(2) ssDNAをビーズにアニーリングし、油中水マイクロリアクター中でビーズを乳化し、エマルションPCRを行ってビーズ上の個々のssDNA分子を増幅する工程;
(3) その表面上に増幅されたssDNAを含むビーズを選択/豊富化する工程;
(4) PicoTiter(登録商標)Plate中でDNA担持ビーズを沈殿(析出)させる工程;及び
(5) ピロリン酸塩光信号を発生させることにより、1,000,000を超えるウエル中で同時にシーケンシングする工程。前記方法は以下で更に詳細に説明する。
好ましい実施形態において、シーケンシングは以下の工程を含む:
(a) アダプターがつけられた断片をビーズにアニーリングする工程、それぞれのビーズは単一の、アダプターがつけられた断片とアニーリングされる;
(b) 油中水マイクロリアクターにおいてビーズを乳化する工程、それぞれの油中水マイクロリアクターは単一のビーズを含む;
(c) ウエルにビーズをロードしてピロリン酸塩光信号を発生させる工程、各ウエルは単一のビーズを含む。
最初の工程(a)において、シーケンシングアダプターは組み合わせライブラリの中の断片にライゲーションされる。当該シーケンシングアダプターはさらに識別子を含んでいてもよく、さらにビーズにアニーリングするための配列、シーケンシングプライマー領域及びPCRプライマー領域を含んでいてもよい。こうしてアダプターがつけられた断片が得られる。第1の工程において、アダプターがつけられた断片はビーズにアニーリングされ、各ビーズは単一の、アダプターがつけられた断片とアニーリングする。アダプターがつけられた断片のプールのためには、ビーズが大多数になり(ポアソン分布)、1ビーズあたりアダプターがつけられた断片一つとのアニーリングが確実になるように、ビーズは過剰に添加される。次の工程では、ビーズは油中水マイクロリアクター中で乳化され、各油中水マイクロリアクターは単一のビーズを含む。PCR試薬が該油中水マイクロリアクター中に存在し、マイクロリアクター中でのPCR反応を可能にする。続いて、マイクロリアクターは破壊され、DNAを含むビーズ(DNA陽性ビーズ)が豊富にされる。次の工程では、ビーズはウエルにロードされ、各ウエルは単一のビーズを含む。ウエルは好ましくは、大量の断片の同時シーケンシングが可能になるPicoTiter(登録商標)Plateの一部である。酵素担持ビーズを添加した後、ピロシーケンシングによって断片の配列が決定される。続く工程では、PicoTiter(登録商標)Plate及びビーズ並びにその中の酵素ビーズは、従来のシーケンシング試薬の存在下で、異なるデオキシリボヌクレオチドに供され、一つのデオキシリボヌクレオチドが組み込まれると光シグナルが発生され、記録される。正しいヌクレオチドが取り込まれると、検出することができるピロシーケンシング信号が発生する。
ピロシーケンシングそれ自体は当分野で知られており、とりわけwww.biotagebio.com,- www.pyrosequencing.com/section technologyに記載されている。この技術はさらに、ここに参照によって組み込まれるWO03/004690, WO03/054142, WO2004/069849, WO2004/070005, WO2004/070007, 及びWO2005/003375(すべて454 Life Sciences、現在はRoche diagnosticsによる)で適用されている。本発明では、ビーズは好ましくは、場合により、プライマー(結合)配列及び/又はクランプセクション若しくはその部分であってアンプリコン又はライゲーションされたプローブと結合することのできる部分が装備されている。他の実施形態では、エマルション増幅で用いられるプローブ又はプライマーは、シーケンシングの後に続くエマルション増幅を可能にするために、アンプリコン又はライゲーションされたプローブのビーズへの結合を可能にする配列が装備されている。シーケンシングされたアンプリコン又はライゲーションされたプローブは識別子の正体、及び場合により標的配列の一部が明かされ、こうして試料中の標的配列の存在又は不存在が明らかになる。
〔Illumina Genome Analyzer/HiSeq/Miseq技術に基づくハイスループットシーケンシング〕
ハイスループットシーケンシングの方法の一つは、とりわけWO0006770, WO0027521, WO0058507, WO0123610, WO0157248, W00157249, WO02061127, WO03016565, WO03048387, WO2004018497, WO2004018493, WO2004050915, WO2004076692, WO2005021786, WO2005047301 , WO2005065814, WO2005068656, WO2005068089, WO2005078130に記載されている。本質的には、この方法はアダプターがライゲーションされたDNA断片で始める。ここに記載されたシーケンシング技術で用いられるDNAは制限されたライゲーションされたプローブ(RLP)又は制限されたアンプリコン(RA)である。アダプターがライゲーションされたDNAは、一般的にフローセルで、固体表面上に付着されたプライマーの濃密な芝にランダムにハイブリダイズする。伸長の後、新たに形成された断片の端部は、前記断片の周辺近傍の固体支持体に付着されたプライマーにハイブリダイズする。このプライマーはヌクレオチド及びポリメラーゼの存在下で伸長され二本鎖断片を生じる。前記プライマーはいわゆる固相ブリッジ増幅で、ヌクレオチド及びポリメラーゼの存在下で伸長され、二本鎖断片が提供される。固相ブリッジ増幅の変性及び反復は、表面に分配された増幅された断片の濃密なクラスターを生じる。シーケンシングは、フローセルに、異なる標識が施された4種の反転可能なターミネーターヌクレオチド、プライマー及びポリメラーゼを添加することによって開始される。プライマー伸長の最初のラウンドの後、標識が検出され、最初に取り込まれた塩基の正体が記録され、3´末端がブロックされ、取り込まれた塩基から蛍光体が除去される。そして、第2の塩基が同じように決定され、シーケンシングが続く。本発明では、ライゲーションされたプローブまたはアンプリコンはプライマー結合配列、プライマー配列又はいくつかの実施形態ではクランプセクションあるいはそれらの組み合わせを介して表面に結合している。識別子配列及び関連する標的配列を含み、配列は概説のように決定され、その存在又は不存在が同定される。
〔イオントレント技術に基づくハイスループットシーケンシング〕
ハイスループットシーケンシングの方法の一つは、とりわけUS2010137143, WO2010008480, US2010282617, WO2009158006, WO2010016937, WO2010047804, US2010197507, US2010304982, WO2010138182, WO2010138186, WO2010138187, WO2010138188に記載されている。この方法は試料DNAの断片化、アダプターのライゲーション、ss-DNA鎖の産生、エマルションPCR及びそれに続く、DNA合成を始めるためのヌクレオチドのアニーリング、に続くビーズ上の鎖のキャプチャーに基づく。本質的に、それは二つのdNTPが互いに結合するときに生じる、放出されたプロトンの測定に基づくアレイである。ヌクレオチドが添加される度に一つのプロトンが放出される。プロトンの放出の測定は、オリゴヌクレオチド中にヌクレオチドが成功裏に組み込まれたことの測定である。
成長しているDNA鎖上の特定のヌクレオチドの検出は、特定の半導体チップで製造されたウエルの中で行われる。そのシーケンシングチップはDNA重合に続く水素イオンの直接的な放出からの電圧測定値をキャプチャーする。独立した測定値の合計数又は配列の読みは、一つのチップに含まれる、センサー及び製造されたウエルの数の関数である。
〔アダプター〕
本発明のいくつかの実施形態において、制限されたアンプリコン又は制限されたライゲーションされたプローブの一つ又は両方の末端に一つ以上のアダプターがライゲーションされる。
ここで用いられるアダプターは例えば長さが約10から約50塩基対であるような、限られた塩基対数の短い二本鎖DNA分子であり、それらが制限断片の末端にライゲーションすることができるように設計される。アダプターは一般的に2つの合成ヌクレオチドからなり、それらは部分的に互いに相補的なヌクレオチド配列を有する。適当な条件下で溶液中で2つの合成オリゴヌクレオチドを混合すると、それらは互いにアニーリングして日本鎖構造を形成するであろう。アニーリングの後、アダプター分子の一方端は制限断片の端部と互換性を有し、そこにライゲーションされ得るように設計される;該アダプターの他端は、ライゲーションされないように設計することができるが、そのようにする必要があるわけではない(ダブルライゲーションされたアダプター)。
好ましくは、アダプターはシーケンシング工程より先にライゲーションされる。例えば、シーケンシングプロトコルの一部としての増幅工程を容易にするためのプライマー結合部位のように、シーケンシング技術において用いられる担体(ビーズ等)にアニーリングし、シーケンシング工程中で役立つであろう付加的な機能を提供するために、アダプターは、シーケンシング工程の一部である、後の増幅工程(エマルションPCR又はブリッジ増幅)において用いることができるように、制限されたライゲーションされたプローブ又は制限されたアンプリコンにライゲーションされる。そのようなアダプターは通常「シーケンシングアダプター」といわれ、それらの設計及び機能は以下で例示する。そのようなシーケンシングアダプターの例は当分野でP5及びP7アダプターとして知られており、イルミナ技術の中で用いられる。他の技術は概念的に同様のアダプターを採用している。
このように、ある実施形態では、(二本鎖の)アダプターが制限酵素によって提供された制限断片の末端にライゲーションされる。アダプターは制限断片の末端にライゲーション可能なように構築される。制限断片の末端が平滑末端の場合には、ポリッシングによるものであろうと、制限酵素によるものであろうと、アダプターも平滑末端にするのが好ましい。アダプターは、例えば非リン酸化ヌクレオチドを使用することによって、一本の鎖だけが制限断片端にライゲーション可能であるように構築または設計し、一方該アダプターの他の鎖はライゲーションしないように構築又は設計してもよい。もし、制限断片の端部が互い違いであれば、好ましくは少なくとも一つのライゲーション可能末端を含む互い違いのアダプターを用いることが好ましい。この文脈でライゲーション可能末端は、少なくとも制限酵素の制限部位の残部に相補的な端部である。もし、ライゲーションされたプローブ又は増幅されたライゲーションされたプローブに、一つの制限酵素が用いられた場合には、一つのアダプターを用いることができる。ライゲーションされたプローブ又は増幅されたライゲーションされたプローブに一つの制限酵素が用いられた場合に、複数のアダプターを用いることも可能である。複数のアダプターの使用は、例えばライゲーションされたプローブの分離した(選択的な)部分において、又は、複雑性の低下の一部としての増幅されたライゲーションされたプローブにおいて、付加的な機能をもたらすかもしれない。ある実施形態では、(第1及び第2の)二つの制限酵素が用いられ、二つ(第1及び第2)のアダプターを制限断片のそれぞれの端部にライゲーションしてもよい。
ある実施形態では、アダプターはY型アダプター(「分岐アダプター」と呼ばれることもある)であってもよい。Y型アダプターは突出(互い違い)又は平滑末端を有していてもよい。一般的に、Y型アダプターは二つの一本鎖DNAからつくられる。一本鎖DNAの二つの断片は、それぞれその鎖の一端に、互いに相補的なセクションを含み、該セクションは二つの鎖を互いにアニーリングできるようにする。一本鎖DNAの断片はそれぞれさらに、互いに非相補的であり、アニーリングしないセクションを含む。相補末端により、Y型アダプターは、制限されたアンプリコンまたは制限されたライゲーションされたプローブの端部にライゲーションすることができる。相補末端はいかなる好適な長さでもよく、1〜50ヌクレオチドの長さであってもよい。Y型アダプターを用いることにより、一つのアダプターを用いるだけでDNAの二つの異なる鎖の導入が可能となる。その概略は5Aに示されている。アダプターはさらに識別子を含むことができ、Y型アダプターはY型アダプターの二つのアーム部に異なる識別子を含むことができる。
ある実施形態では、Y型アダプターは一つのY型アダプターが制限断片の両方の鎖にライゲーションすることができ、同時にY型アダプターの自己ライゲーションを防ぐことができるように設計することができる。この実施形態では、ライゲーション工程の前に、制限断片の突出部が部分的に埋められ、それによってY型アダプターが該断片だけにライゲーションされ、他のY型アダプターにライゲーションしない。その概略は図5Bに示される。
代替として、アダプターは「ヘアピンアダプター」として知られるタイプのものであってもよく、これは一本鎖DNAにアニーリング及びライゲーションすることができ、部分的に二本鎖のDNAを生じる。
シーケンシングに先立ってライゲーションされたプローブが制限される工程における、一本鎖のライゲーションされたプローブの使用に関する他の実施形態においては、一本鎖切断ヌクレアーゼの使用が意図される。代替として、後に制限酵素を用いて切断することができる局所的二本鎖を提供するオリゴヌクレオチドを提供することができる。アダプターは一本鎖DNAにアニーリング及びライゲーションすることができ、後に制限酵素を用いて切断することができる部分的な二本鎖DNAを提供することができる、「ヘアピンアダプター」と知られるタイプであってもよい。最後の二つの変形を図5Cに示す。
現在記載されているシーケンシング技術はそれらのシーケンシングプロトコルにおいていくつかのバリエーションを含む。これらのシーケンシングバリエーションの使用は、本発明で用いられる様々なプローブ及びプライマー、シーケンシングデータを得る経路、生成されたデータの品質、信頼性及び量に影響を及ぼすかもしれない。
〔一方向単一読み取りシーケンシング〕
単一読み取りシーケンシングでは、制限されたライゲーションされたプローブ又は制限されたアンプリコンは一つ又は二つのアダプター(シーケンシングアダプター)にライゲーションされ、一つのプライマーが用いられ、一方向にシーケンスされる。最終的にシーケンシングに供されるヌクレオチド配列を、この記載では共通して「シーケンシング断片」と表示する。
この実施形態を概略的に図4Aに示す。この実施形態では、シーケンシングアダプターがライゲーションされた断片はプライマー(シーケンシングプライマー:SEQ PR)から開始されて断片へシーケンスされ、これにより、少なくとも制限された後に残ったタグセクションの一部がシーケンスされ、少なくとも標的配列(すなわち標的特異的セクション)の一部がシーケンスされる。シーケンシングプライマーの3´に位置するいかなる識別子も標的配列と一緒にシーケンスされることになる。この識別子はシーケンシングアダプター及び/又は制限された後に残されたタグセクションの中に存在していてもよい。標的配列は、識別子又は標的配列あるいはその組み合わせによって、同定することができる。
〔一方向単一読み取りダブルタギングシーケンス〕
一方向単一読み取りダブルタギングでは、(一方向単一読み取りダブルプライミングの)制限されたアンプリコン又は制限されたプローブは一つ又は二つのシーケンシングアダプターにライゲーションされ、一方向にシーケンスされるが、二つのプライマー(SEQ PR1、 SEQ PR2)によってである。この実施形態は、概略的に図4Bに示す。この実施形態では、単一読み取りシーケンスと同じく、シーケンシング断片はシーケンシングプライマーSEQ PR1から開始されて断片にシーケンスされ、これにより、少なくとも制限された後に残ったタグセクションの一部がシーケンスされ、少なくとも標的配列(すなわち標的特異的セクション)の一部がシーケンスされる。この実施形態では、この工程で生じるシーケンス読み取りは「ロングリード」と示される。第2のプライマー(SEQ PR2)はシーケンシングアダプターがライゲーションされた制限処理されたライゲーションされたプローブ又は制限されたアンプリコンの第2の部分に向けられ、一般的に「ショートリード」と示される、その第2の部分を増幅する。
シーケンシングのためのシーケンシング断片の再クラスタリングが行われる場合、第2のシーケンシングプライマーもロングリードの結果になってもよい(図4C参照)。再クラスタリングにおいて、シーケンシング断片は、他のシーケンシングアダプターを用いてそれらが担体にアニーリングする(担体上でのシーケンシング断片のブリッジになり、それらがハイブリダイズされアニーリングされる担体のための第1シーケンシングアダプターの脱アニーリングに続く)プロトコルに供される。その結果、担体に向かい合う断片の方向付けがシフトされ(再クラスタリングされ)シーケンシングを再度行うことができる。そのような再クラスタリング及び両側からのシーケンシング(ペアエンドシーケンシング)はBentley et. Nature 2008, 456, 53-59に記載されている。したがって、再クラスタリングを行うと、2つのロングリード(Long1、Long2)になるかもしれない。
〔双方向ダブルタギングシーケンシング〕
双方向ダブルタギングシーケンシング(双方向ダブルプライミングシーケンシング)では、図4Dに示されるが、シーケンシング断片は断片が両側からシーケンスされるペアエンドシーケンシングを用いてシーケンスされる。
この実施形態では、第3の識別子がシーケンス断片中に存在していてもよく、逆の方向性を有し、第2のロングリードを生じることができるプライマーを用いて処理することができる。第3の識別子は、第2のプライマー又は特に第3の識別子の同定に向けられている第3のプライマー(異なるオーバーラップによって図中に示される、しかしこれは必ずしも必要ではない)によって、処理(シーケンス)することができる。更なる実施形態において、逆の方向性のプライマーは識別子の同定には用いられないので、第3の識別子は省略することができ、逆方向におけるシーケンス工程はシーケンシング断片のシーケンスデータを提供する。
〔ペアエンドシーケンシング〕
ここで用いられる「ペアエンドシーケンシング」は、ハイスループットシーケンシングに基づく技術であり、特にIllumina及びRocheによって現在販売されているプラットフォームに基づく。Illuminaは、アップグレードとして、今あるシーケンサーに組み込むことができるハードウエアモジュール(PE Module)をリリースしており、それによって、ペアエンドリードが生成される、テンプレートの両端のシーケンシングを可能としている。本発明による方法においては、ペアエンドシーケンシングを用いることが特に好ましく、特にRoche又はIlluminaの技術を用いることが好ましい。ペアエンドシーケンシングは例えばUS20060292611及びRocheからの刊行物(454シーケンシング)中に記載されている。
〔メイトペアシーケンシング〕
メイトペアシーケンシングは、末端が合わされている、ペアエンドシーケンシングの変種である。制限酵素処理されたライゲーション産物(又はそこからのアンプリコン)のような、シーケンスされるDNA断片は環状化され、オリジナルDNAの末端を含む断片は続いてシーケンスされ、それにより、一回のシーケンシング工程で両端からの配列情報が得られる。メイトペアシーケンシングはここに記載されたいかなるシーケンシング断片にも適用することができる。メイトペアシーケンシングの例としてwww.illumina.comも参照されたい。
メイトペアシーケンシングの概念についての詳細な情報は図6に提供されている。例として、ライゲーション産物の一つが用いられているが、シーケンシング断片に存在する要素にかかわらず、メイトペアシーケンシングの原理は本発明のいかなるシーケンシング断片にも適用される。これを説明するため、一つのシーケンシング断片を一本の実線に一般化して、DNAシーケンシング断片を表している。断片は環状化され、断片化される(切断(shearing)又は制限により)。断片の端部にはシーケンシングアダプターがライゲーションされ結果物のDNA鎖は、好ましくは両端(ペアエンド)からの、シーケンシングに供される。
本明細書、図及び添付の特許請求の範囲の全体を通して、概念「第1」及び「第2」は、アッセイにおいて用いられるプローブ、アダプター、プライマー等及びそれらのそれぞれの要素の要素間を区別するために用いられる。概念「第1」及び「第2」はここでは総和としてはもちいられておらず、すなわち第1の成分も存在する場合にしか第2の成分になることができないようにはなっていない。例えば、環状化可能プローブは、一つだけのプローブだが、さらに第1及び第2の標的特異的セクションを含んでいる。同様に、図1において、例えば第1及び第2のプローブのうちのどちらが識別子を含んでいてもよい。第1のプローブが第1の識別子と示される場合もあれば、第2のプローブが第2の識別子と示される場合もある。本出願では、第2のプローブが識別子を含み、第1のプローブが含まない場合、この識別子は第1の識別子の存在が暗示されなくても、第2の識別子ということができる。
〔メロンにおける一塩基多型(SNP)検出
1.DNAの単離
Stuart and Via (Stuart, C.N., Jr and Via, L.E. (1993) A rapid CTAB DNA isolation technique useful for RAPD fingerprinting and other PCR applications. Biotechniques, vol. 14, 748-750)に記載された、改変されたCTAB法を用いて、葉材料から、Charantaisメロンの二つのF2子孫の分離集団のゲノムDNAを単離した。DNA試料はTE(10 mM Tris-HCI pH 8.0, 1 mM EDTA)中に100ng/μgの濃度で希釈し、−20℃で保管した。
2.DNA増幅
複数の試験に十分なDNAを得るため、単離されたDNAを、lllustra GenomiPhi v2 DNA Amplification キット (GE Healthcare)を用い、製造者の説明書にしたがって増幅した。
3.メロンのSNPsの選択
メロンのSNPsは予めBeadXpress アッセイ(Illumina)に組み込まれているコレクションから選択され、上述の試料のいくつかのジェノタイピングに用いられた。野生種のSNPsを含む、全部で23個のSNPsが選択された(表1参照)。SNPsは例としてであり、本発明の技術の全般的な概念を制限するものではない。
Figure 0006028025
表1:選択されたメロンSNPs
4.オリゴヌクレオチドライゲーション反応のためのオリゴヌクレオチドプローブ設計
オリゴヌクレオチドプローブ(5´−3´方向)は、遺伝子座の既知の配列に基づいて一般的な手法を使って設計し、表1に記載された23遺伝子座のそれぞれのアレルを弁別するように選択した。PCRプライマー結合領域が含められた。全てのプローブは5´末端がリン酸化された。各SNPについて、二つのアレルプローブが、特異的アレル及び一つのリバースプローブを含むように設計された。リバースプローブのリン酸化は機能的なものであるが、それに対してアレル特異的プローブのリン酸化は単にコスト削減の結果である。
全てのオリゴヌクレオチドはドイツMartinsriedのMetabionから購入した。オリゴヌクレオチドの濃度は1μMに調整した。4×のプローブ混合液が、各アレルプローブ(=46×)1μL及び各リバースプローブ(=23×)2μLを結合して調製された。4×プローブ混合液をMilliQ(登録商標)水で希釈して1×プローブ混合液を得た。
5.PCR増幅用プライマーの設計
オリゴヌクレオチドライゲーション産物のPCR増幅のために用いられるプライマーの配列は、「4.オリゴヌクレオチドライゲーション反応のためのオリゴヌクレオチドプローブ設計」に記載されたライゲーションプローブに組み込まれているPCRプライマー結合領域に相補的である。PCRプライマー配列は、Zabeau & Vos, 1993: Selective restriction fragment amplification; a general method for DNA fingerprinting. EP 0534858-A1 , B1 ; US patent 6045994) and Vos et al (Vos, P., Hogers.R., Bleeker.M., Reijans.M., van de Lee.T., Homes, M., Frijters.A., Pot.J., Peleman.J., Kuiper.M. et al. (1995) AFLP: a new technique for DNA fingerprinting. Nucl. Acids Res., 21 , 4407-4414)に記載されたAFLP法で用いられたアダプター配列に由来する。特に、プライマー配列の3´末端はEcoRI(アレル特異的プローブ)又はHindIII(リバース(=遺伝子座特異的)プローブ)の制限酵素認識部位の一部を有するように改変された。
6.バッファー及び試薬
バッファーの濃度は以下であった:
マルチプレックスオリゴヌクレオチドライゲーションバッファ (10x): 200mM Tris-HCI pH 7.6、 250mM KAc, 100mM MgAc、 10mM NAD, 100mM ジチオスレイトール、 1 % Triton-X100。
PCR バッファー (10x): 100mM Tris-HCI pH 8.3, 500mM KCI, 15mM MgCI2, 0.01 % (w/v) ゼラチン。
制限ライゲーションバッファー(5x): 5x DNase buffer (Affymetrix), 25mM ジチオスレイトール, 250 [mu]g/ml BSA。
Tween含有MinElute(登録商標)溶出バッファー:10mM Tris pH 8.5、 0.1 % Tween X-100。
7.マルチプレックスオリゴヌクレオチドライゲーション反応及び増幅
ライゲーション反応は2つの単離されたDNA試料についてそれぞれ重複して次のように行った。(増幅された)ゲノムDNA100から200ngを1μLの10×マルチプレックスオリゴヌクレオチドライゲーションバッファー、4ユニットのTag DNAリガーゼ(New England BioLabs製)、0.4μLの1×プローブ混合液と合わせ、MilliQ(登録商標)水で全量を10μLとした。反応混合液を94℃で2分間インキュベートした後60℃で4時間インキュベーとした。反応液は次に使用するまで4℃に保たれた。ライゲーション反応液は1×マルチプレックスオリゴヌクレオチドライゲーションバッファーで4倍に希釈した。ライゲーション産物の増幅は以下のように行った:10μLの4倍希釈されたライゲーション反応液、30ngのそれぞれのプライマー(E00LF 及びH00LR)、0.2μLの20mM各dNTP混合液、2μLの10×PCRバッファー、0.4ユニットのAmpliTaq-Gold(登録商標)(Applied Biosystems)をMilliQ水で全量20μLとした。増幅反応は重複してセットした。温度サイクルのプロファイルは、金または銀のブロックを用いてPE9700(Perkin Elmer社)で、以下の条件で行った:
ステップ1: プレ PCR インキュベーション:94℃で12分
ステップ2:最初のサイクル:変性:94℃で30秒; アニーリング:65℃で30秒。次の各サイクルではアニーリング温度を0.7℃ずつ下げた。伸長:72℃で1分、全サイクル数13。
ステップ3:変性:94℃で30秒;アニーリング:56℃で30秒;伸長:72℃で1分、全サイクル数23。
ステップ4:伸長:72℃で7分間、反応液は次の使用まで4℃を維持した。
増幅産物(20μL)はMinElute(登録商標)キット(Qiagen)を用いて精製し、10μLのMilliQ(登録商標)水中で溶出した。
〔制限ライゲーション反応〕
ステップ7の増幅産物(7μL)を1×制限ライゲーションバッファーを含む全量40μL中で、制限酵素EcoRI(20ユニット)及びHindIII(20ユニット)で、37℃2時間で消化した。
一般的なHindIIIアダプター5pmol、試料IDを含むEcoRIアダプター5pmol、100mMのATPを0.1μL、5×制限ライゲーションバッファー2μL、T4 DNAリガーゼ1ユニットを全量10μL中に添加し、37℃で3時間インキュベーションすることによって、アダプターを消化産物にライゲーションした。
試料IDを含むEcoRIアダプターの配列構成は、トップストランドが3´に位置する試料ID(5nt)を含み、ボトムストランドが、対応するトップストランドの逆相補的配列である、5´に位置する試料ID(5nt)を含むようになっている。
試料IDは試料1と試料2とでは異なる。
ボトムストランドアダプターの3´末端はアミノ基で修飾されている。
アダプターは各オリゴ(トップ及びボトム)の等量(pmol)をエッペンドルフチューブで混合することによって準備した。アダプターの最終濃度は50μMであった。
HindIIIアダプターの配列構成は、EcoRIと類似して設計及び合成した。
9.制限ライゲーション産物の増幅
制限ライゲーション産物はMilliQ水で10倍に希釈した。10倍希釈した制限ライゲーション産物5μLを5ngの順方向プライマー、30ngの逆方向プライマー、20mMの各dNTP、10×PCRバッファー2μL、5ユニット/μLのAmpliTaq DNAポリメラーゼ(Applied Biosystems)及び12.02μLのMilliQ水と混合した。反応混合液をサーマルサイクラ―(PE9700、金または銀ブロック)に置き、次のプロファイルが適用された:プレインキュベーション:72℃2分間、50サイクル:94℃30秒、58℃2分、72℃2分。各増幅反応から130μLのうちの5μLがプールされ、その130μLをMineluteカラム(Qiagen)を用いて精製した。精製された産物は30μLの溶出バッファー中でTweenを添加して溶出した。
10.増幅産物のシーケンシング
ステップ9の増幅された産物のシーケンシングは、シーケンシング・バイ・シンセシスプラットフォームであり、一方向単一リードシーケンシング、一方向単一リードダブルタギングシーケンシング、双方向ダブルタギングシーケンシング、ペアエンドシーケンシング及びメイトペアシーケンシングを含む異なるシーケンシングプロトコルを用いるクローン単一分子アレイ(Clonal Single Molecule Array:CSMATM)技術を用いるGenome Analyzer II(Illumina)を用いて行われた。
得られた配列リードは識別子の存在に関してスクリーニングした。全部で1,644,183リードが残った。全てのIDタグは試料あたりのリードの平均数で411,046検出された。試料あたりのリード数は308,105(試料1)から603,889(試料3)だった。加えて、試料IDタグを含むリードについて品質管理を行った。これはEcoRI認識部位の存在、ホモポリマー(20位以上の同じヌクレオチドの連続伸長と定義される)の不存在、NCBIクロロプラストデータベースに対するポジティブマッチのリードの不存在、配列中に「N」を含むリードの不存在及びリードの最初の50ヌクレオチド中の低品質スコア(平均QS<15)の不存在を含む。試料あたりの除去されたリードの数は、12,445(試料4)から28,447(試料1)まで様々であり、平均は18,769であった。試料あたりの除去されたリードの数は全リード数のうちの小さなパーセンテージ(平均4.6%)であった。結果的に、品質管理フィルタをパスしたリードの平均パーセンテージは高かった(95.4%)。品質管理をパスしたリードはそれぞれのSNPsについて遺伝子型を決定するためのインプットとして用いられた。この工程にはBWAソフトウエアを用いて遺伝子座の参照配列に対してリードを整列させ、SAMツール(ソート(sorting)、結合(merging)、見出し付け(indexing)を含む)でのアウトプットの加工、試料中でのアレルの存在の決定及びアレルの存在率に基づく各試料の遺伝子型の決定が含まれた。SAMツールはhttp://samtools.sourceforge.netを通じて手に入れることができる。参照配列において縮重(degenerate)された位置が存在する場合には、多義的な位置を置換するために塩基のアルファベットソートを用いた。
全てのタイプの配列を用いて、23個の標的全てにおいてSNPsが検出され、遺伝子型が求められた。
12.遺伝子型の確認
重複物(試料1及び2、試料3及び4)から及び異なるシーケンシングプロトコルから産生された遺伝子型の比較により、求められた遺伝子型の100%が、重複物間で同一であることが分かった。
ステップ11で決定された遺伝子型はBeadXpress技術(Illumina)を用いて産生された、入手可能な遺伝子型と比較した。その比較から以下のことが分かった:
・SNP遺伝子座のうち21が現在のアプローチとBeadXpressデータとの間で100%の相関性を示した。
・一つのSNP遺伝子座(SBG0014)はBeadXpressでは計測されず、すなわちU(=unknown:未知)であったが、この実験で用いたアプローチでは明確な遺伝子型を生じた。
・一つのSNP遺伝子座(SBG0039)では、一貫してホモ接合性(現在のアプローチ)対ヘテロ接合性(BeadXpress)という不一致が見られた。

Claims (20)

  1. 試料中の標的ヌクレオチド配列の決定方法であって、以下の工程:
    (a)各標的ヌクレオチド配列(T)について、第1のプローブ(P1)及び第2のプローブ(P2)を提供する工程;
    ここで、前記第1のプローブは、
    第1の標的特異的セクション(TS1)及び
    標的ヌクレオチド配列に非相補的であり、第1のプライマー結合配列(PBS1)を含んでいてもよい、第1のタグセクション(TAG1)
    を含み、ここで、前記第1のタグセクションは第1の制限酵素のための第1の認識配列(RE1)を含み、
    ここで、前記第2のプローブは、
    第2の標的特異的セクション(TS2)及び
    標的ヌクレオチド配列に非相補的であり、任意の第2のプライマー結合配列(PBS2)を含、第2のタグセクション(TAG2)
    を含み、ここで、前記第2のタグセクションは第2の制限酵素のための任意の第2の認識配列(RE2)を含み、
    (b)第1及び第2のプローブの第1及び第2の標的特異的セクションをそれぞれ標的配列にハイブリダイズさせる工程;
    (c)標的配列に隣接するセクションにプローブのそれぞれの標的特異的セクションがハイブリダイズした場合に、第1及び第2のプローブをライゲーションしてライゲーションされたプローブ(LP)を提供する工程;
    (d)任意の第1及び/又は任意の第2のプライマーで、ライゲーションされたプローブを増幅してアンプリコン(A)を提供する、あるいは任意の第1及び/又は任意の第2のプライマーで、ライゲーションされたプローブを増幅しない工程;
    (e)第1及び/又は第2の制限酵素でライゲーションされたプローブ又はアンプリコンを制限して制限されライゲーションされたプローブ(RLP)又は制限されたアンプリコン(RA)を提供し、アダプターベースの識別子(AD ID1, AD ID2)を含む第1及び第2のアダプターを、制限されライゲーションされたプローブ(RLP)又は制限されたアンプリコン(RA)にライゲーションする工程;
    (f)アダプターがライゲーションされた、制限されライゲーションされたプローブ(RLP)又は、アダプターがライゲーションされた、制限されたアンプリコン(RA)をハイスループットシーケンシング技術に供して、制限されライゲーションされたプローブ又は制限されたアンプリコンのヌクレオチド配列の少なくとも一部を決定する工程;
    (g)試料中の標的ヌクレオチド配列の存在、不存在又は量を同定する工程;
    を含む方法。
  2. 第1の標的特異的セクションが第1のプローブの3´末端に位置し、第2の標的特異的セクションが第2のプローブの5´末端に位置する、請求項1に記載の方法。
  3. 第1のプローブベースの識別子配列(ID1)が第1のタグセクション中に位置する、請求項1又は2に記載の方法。
  4. 第2のプローブベースの識別子配列(ID2)が第2のタグセクション中に位置する、請求項1〜3のいずれか一項に記載の方法。
  5. 第1のプローブベースの識別子が、制限酵素の第1の認識配列と、第1の標的特異的セクションとの間に位置する、請求項1〜4のいずれか一項に記載の方法。
  6. 第2のプローブベースの識別子が、制限酵素の任意の第2の認識配列と、第2の標的特異的セクションとの間に位置する、請求項1〜5のいずれか一項に記載の方法。
  7. 第1及び第2のタグセクションがいずれも制限酵素の認識部位を有する、請求項1〜6のいずれか一項に記載の方法。
  8. ハイブリダイゼーション、ライゲーション及び任意のギャップ充填が結合された工程において行われる、請求項1〜7のいずれか一項に記載の方法。
  9. 第1のタグセクションのための制限酵素の認識配列が、第2のタグセクションのための制限酵素の認識部位に比べて異なるヌクレオチド配列を有する、請求項1〜8のいずれか一項に記載の方法。
  10. ハイスループットシーケンシングが合成によるシーケンシングを含む、請求項1〜9のいずれか一項に記載の方法。
  11. ハイスループットシーケンシングがブリッジ増幅又はエマルション増幅を含む、請求項1〜9のいずれか一項に記載の方法。
  12. ハイスループットシーケンシングが一方向単一読み取りシーケンシングを含む、請求項1〜9のいずれか一項に記載の方法。
  13. ハイスループットシーケンシングが一方向単一読み取りダブルプライミングシーケンシングを含む、請求項1〜9のいずれか一項に記載の方法。
  14. ハイスループットシーケンシングが双方向(ペアエンド)シーケンシングを含む、請求項1〜9のいずれか一項に記載の方法。
  15. ハイスループットシーケンシングがメイトペアシーケンシングを含む、請求項1〜9のいずれか一項に記載の方法。
  16. 一つの試料中で複数の標的配列が決定される、請求項1〜15のいずれか一項に記載の方法。
  17. 複数の試料中で一つの標的配列が決定される、請求項1〜15のいずれか一項に記載の方法。
  18. 複数の試料中で複数の標的配列が決定される、請求項1〜15のいずれか一項に記載の方法。
  19. プローブが環状化可能プローブ、キーロックプローブおよび/または化合物プローブである、請求項1〜18のいずれか一項に記載の方法。
  20. 少なくとも二つのプローブを含むオリゴヌクレオチド・ライゲーション・アッセイを用いた、試料中の標的配列の存在、不存在又は量について、生物学的試料をジェノタイピングする方法であって、プローブの少なくとも一つが標的セクションに加えて制限酵素の認識配列を含み、該方法が、ライゲーションされたプローブを提供するライゲーション工程をさらに含み、ライゲーション後、ライゲーションされたプローブは制限され、もしくは増幅されてから制限されて、制限されライゲーションされたプローブ(RLP)もしくは制限されたアンプリコン(RA)が提供され、得られたRLP/RAに対し、一つ以上の識別子を含む一つまたは二つのアダプターがライゲーションされ、得られたアダプターがライゲーションされたRLP/RAがシーケンスされる、
    方法。
JP2014518468A 2011-07-08 2012-07-09 オリゴヌクレオチド・ライゲーション・アッセイに基づく配列ベースの遺伝子型決定 Active JP6028025B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161505787P 2011-07-08 2011-07-08
US61/505,787 2011-07-08
PCT/NL2012/050493 WO2013009175A1 (en) 2011-07-08 2012-07-09 Sequence based genotyping based on oligonucleotide ligation assays

Publications (3)

Publication Number Publication Date
JP2014520525A JP2014520525A (ja) 2014-08-25
JP2014520525A5 JP2014520525A5 (ja) 2015-08-27
JP6028025B2 true JP6028025B2 (ja) 2016-11-16

Family

ID=46579302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014518468A Active JP6028025B2 (ja) 2011-07-08 2012-07-09 オリゴヌクレオチド・ライゲーション・アッセイに基づく配列ベースの遺伝子型決定

Country Status (8)

Country Link
US (4) US9777322B2 (ja)
EP (2) EP2980226A1 (ja)
JP (1) JP6028025B2 (ja)
AU (1) AU2012281242B2 (ja)
CA (1) CA2840929C (ja)
DK (1) DK2729580T3 (ja)
ES (1) ES2556580T3 (ja)
WO (1) WO2013009175A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
WO2013009175A1 (en) * 2011-07-08 2013-01-17 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
WO2013142389A1 (en) 2012-03-20 2013-09-26 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
WO2013192292A1 (en) * 2012-06-21 2013-12-27 Justin Lamb Massively-parallel multiplex locus-specific nucleic acid sequence analysis
JP6234463B2 (ja) 2012-09-10 2017-11-22 ジーンスカイ ダイアグノスティクス(スーツォウ) インコーポレーテッドGenesky Diagnostics (Suzhou) Inc. 核酸の多重分析の方法
US9270344B2 (en) * 2013-02-01 2016-02-23 Creating Revolutions, LLC Combination process interaction
CA2901138A1 (en) * 2013-03-12 2014-10-09 Counsyl, Inc. Systems and methods for prenatal genetic analysis
EP3968023A1 (en) 2013-08-19 2022-03-16 Singular Bio Inc. Assays for single molecule detection and use thereof
JP6442534B2 (ja) * 2014-06-02 2018-12-19 ベース4 イノベーション リミテッド ヌクレオチド多型の検出方法
AU2015296602B2 (en) * 2014-08-01 2021-09-16 F. Hoffmann-La Roche Ag Detection of target nucleic acids using hybridization
CN104372093B (zh) * 2014-11-10 2016-09-21 博奥生物集团有限公司 一种基于高通量测序的snp检测方法
US11739371B2 (en) * 2015-02-18 2023-08-29 Invitae Corporation Arrays for single molecule detection and use thereof
GB2536446B (en) * 2015-03-17 2020-06-03 Salisbury Nhs Found Trust PCR method
US10844428B2 (en) * 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US10689690B2 (en) 2015-08-13 2020-06-23 Centrillion Technology Holdings Corporation Library construction using Y-adapters and vanishing restriction sites
PT3387152T (pt) 2015-12-08 2022-04-19 Twinstrand Biosciences Inc Adaptadores, métodos e composições melhorados para sequenciamento duplex
WO2018127408A1 (en) * 2017-01-05 2018-07-12 Tervisetehnoloogiate Arenduskeskus As Quantifying dna sequences
AU2018210188B2 (en) 2017-01-18 2023-11-09 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
US11739367B2 (en) 2017-11-08 2023-08-29 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
EP3768853A4 (en) * 2018-03-23 2021-04-28 Board Of Regents The University Of Texas System EFFICIENT SEQUENCING OF DSDNA WITH EXTREMELY LOW ERROR RATE
AU2019287163A1 (en) 2018-06-12 2020-12-03 Keygene N.V. Nucleic acid amplification method
AU2019300172A1 (en) 2018-07-12 2021-01-28 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
WO2020142631A2 (en) * 2019-01-04 2020-07-09 William Marsh Rice University Quantitative amplicon sequencing for multiplexed copy number variation detection and allele ratio quantitation
EP3927840A1 (en) 2019-02-21 2021-12-29 Keygene N.V. Genotyping of polyploids
US20220372559A1 (en) * 2019-09-09 2022-11-24 Sherlock Biosciences, Inc. System
WO2021048291A1 (en) * 2019-09-12 2021-03-18 Glaxosmithkline Intellectual Property Development Limited Method for screening libraries
WO2022182682A1 (en) 2021-02-23 2022-09-01 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
US20230348962A1 (en) * 2021-11-04 2023-11-02 Florida State University Research Foundation, Inc. Using Hairpin Formation To Identify DNA and RNA Sequences Having A Target Nucleic Acid Sequence

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
GB8612087D0 (en) 1986-05-19 1986-06-25 Ici Plc Hybridisation probes
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
DE68926504T2 (de) 1988-07-20 1996-09-12 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
KR950013953B1 (ko) 1990-01-26 1995-11-18 애보트 래보라토리즈 리가제 연쇄 반응에 적용가능한 표적 핵산의 증폭 방법
DE69233719T2 (de) 1991-09-24 2009-01-02 Keygene N.V. Primer, Sätze und Restriktionsfragmente und deren Benutzung in selektiver Restriktionsfragmentenamplifikation
US5470705A (en) 1992-04-03 1995-11-28 Applied Biosystems, Inc. Probe composition containing a binding domain and polymer chain and methods of use
EP0695305B1 (en) 1993-04-12 2003-08-06 Northwestern University Method of forming oligonucleotides
US5692223A (en) 1993-10-22 1997-11-25 Minolta Co., Ltd. Remotely-controlled flash photographing system
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5876924A (en) 1994-06-22 1999-03-02 Mount Sinai School Of Medicine Nucleic acid amplification method hybridization signal amplification method (HSAM)
US20070269799A9 (en) 1994-06-22 2007-11-22 Zhang David Y Nucleic acid amplification methods
US5942391A (en) 1994-06-22 1999-08-24 Mount Sinai School Of Medicine Nucleic acid amplification method: ramification-extension amplification method (RAM)
WO1996015271A1 (en) 1994-11-16 1996-05-23 Abbott Laboratories Multiplex ligations-dependent amplification
SE506908C2 (sv) 1995-09-08 1998-03-02 Ulf Landegren Inst F Medicinsk Medicinsk användning av padlockprober
EP2369007B1 (en) 1996-05-29 2015-07-29 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US6312892B1 (en) 1996-07-19 2001-11-06 Cornell Research Foundation, Inc. High fidelity detection of nucleic acid differences by ligase detection reaction
EP0974672B1 (en) 1998-07-21 2003-04-09 Keygene N.V. Improved primers for AFLP amplification
JP2002521064A (ja) 1998-07-30 2002-07-16 ソレックサ リミテッド アレイ生体分子およびシークエンシングにおけるその使用
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
AU758630B2 (en) 1998-11-06 2003-03-27 Solexa Ltd. A method for reproducing molecular arrays
AU3567900A (en) 1999-03-30 2000-10-16 Solexa Ltd. Polynucleotide sequencing
US20020086289A1 (en) 1999-06-15 2002-07-04 Don Straus Genomic profiling: a rapid method for testing a complex biological sample for the presence of many types of organisms
US6156178A (en) 1999-07-13 2000-12-05 Molecular Dynamics, Inc. Increased throughput analysis of small compounds using multiple temporally spaced injections
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
GB0002389D0 (en) 2000-02-02 2000-03-22 Solexa Ltd Molecular arrays
US6221603B1 (en) 2000-02-04 2001-04-24 Molecular Dynamics, Inc. Rolling circle amplification assay for nucleic acid analysis
EP1130113A1 (en) 2000-02-15 2001-09-05 Johannes Petrus Schouten Multiplex ligation dependent amplification assay
AU2001265121A1 (en) 2000-05-30 2001-12-11 Applera Corporation Methods for detecting target nucleic acids using coupled ligation and amplification
AU2002231934A1 (en) 2001-01-30 2002-08-12 Solexa Ltd. Arrayed polynucleotides and their use in genome analysis
US20050009022A1 (en) 2001-07-06 2005-01-13 Weiner Michael P. Method for isolation of independent, parallel chemical micro-reactions using a porous filter
GB0119719D0 (en) 2001-08-13 2001-10-03 Solexa Ltd DNA sequence analysis
US6902921B2 (en) 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20030119004A1 (en) 2001-12-05 2003-06-26 Wenz H. Michael Methods for quantitating nucleic acids using coupled ligation and amplification
EP1319718A1 (en) 2001-12-14 2003-06-18 Keygene N.V. High throughput analysis and detection of multiple target sequences
DE10162904B4 (de) 2001-12-20 2006-05-11 Jeyes Deutschland Gmbh Vorrichtung zur Abgabe eines flüssigen Wirkstoffs in ein Spülwasser
WO2003060163A2 (en) * 2001-12-28 2003-07-24 Keygene N.V. Discrimination and detection of target nucleotide sequences using mass spectrometry
EP3795577A1 (en) 2002-08-23 2021-03-24 Illumina Cambridge Limited Modified nucleotides
EP1560838B1 (en) 2002-08-23 2009-05-13 Illumina Cambridge Limited Labelled nucleotides
US20060094016A1 (en) 2002-12-02 2006-05-04 Niall Gormley Determination of methylation of nucleic acid sequences
DE602004024034D1 (de) 2003-01-29 2009-12-24 454 Corp Nukleinsäureamplifikation auf basis von kügelchenemulsion
GB0304371D0 (en) 2003-02-26 2003-04-02 Solexa Ltd DNA Sequence analysis
WO2005001129A2 (en) * 2003-06-06 2005-01-06 Applera Corporation Mobility cassettes
ES2322904T3 (es) 2003-06-17 2009-07-01 Keygene N.V. Medio y metodo para la deteccion de secuencias nucleotidicas diana usando ensayos de ligamiento con pares de sondas oligonucleotidicas mejoradas.
GB0320059D0 (en) 2003-08-27 2003-10-01 Solexa Ltd A method of sequencing
WO2005026389A2 (en) * 2003-08-29 2005-03-24 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Ligation-based method of analysis of single nucleotide polymorphisms on genomic dna
ES2539784T3 (es) 2003-09-02 2015-07-06 Keygene N.V. Procedimientos basados en OLA para la detección de secuencias de ácidos nucleicos objetivo
EP1602733A1 (en) 2004-06-02 2005-12-07 Keygene N.V. Detection of target nucleotide sequences using an asymmetric oligonucleotide ligation assay
GB0326073D0 (en) 2003-11-07 2003-12-10 Solexa Ltd Improvements in or relating to polynucleotide arrays
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
GB0400974D0 (en) 2004-01-16 2004-02-18 Solexa Ltd Multiple inexact matching
GB0402895D0 (en) 2004-02-10 2004-03-17 Solexa Ltd Arrayed polynucleotides
US20060211000A1 (en) * 2005-03-21 2006-09-21 Sorge Joseph A Methods, compositions, and kits for detection of microRNA
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
EP3045544A1 (en) * 2005-12-22 2016-07-20 Keygene N.V. Method for high-throughput aflp-based polymorphism detection
WO2007101075A2 (en) * 2006-02-22 2007-09-07 Applera Corporation Double-ligation method for haplotype and large-scale polymorphism detection
US8460866B2 (en) * 2006-03-01 2013-06-11 Keygene N.V. High throughput sequence-based detection of SNPs using ligation assays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
CA2672315A1 (en) 2006-12-14 2008-06-26 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
WO2009092035A2 (en) 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
WO2010008480A2 (en) 2008-06-25 2010-01-21 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
JP2011525990A (ja) 2008-06-26 2011-09-29 ライフ テクノロジーズ コーポレーション Fetアレイを用いて分子相互作用を検出するための方法および装置
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
CN102301228A (zh) 2008-10-22 2011-12-28 生命技术公司 用于生物和化学分析的集成式传感器阵列
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
EP2425240A4 (en) 2009-04-30 2012-12-12 Good Start Genetics Inc METHOD AND COMPOSITION FOR EVALUATING GENETIC MARKERS
EP3301104B1 (en) 2009-05-29 2019-10-30 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
EP2603607B1 (en) 2010-08-11 2016-04-06 Celula, Inc. Genotyping dna
EP2710145B1 (en) 2011-05-17 2015-12-09 Dxterity Diagnostics Incorporated Methods and compositions for detecting target nucleic acids
WO2013009175A1 (en) * 2011-07-08 2013-01-17 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays

Also Published As

Publication number Publication date
AU2012281242B2 (en) 2016-12-22
US20180023135A1 (en) 2018-01-25
CA2840929C (en) 2020-03-24
US10422001B2 (en) 2019-09-24
US20200071757A1 (en) 2020-03-05
CA2840929A1 (en) 2013-01-17
DK2729580T3 (en) 2015-12-14
AU2012281242A1 (en) 2014-02-27
WO2013009175A1 (en) 2013-01-17
US10988807B2 (en) 2021-04-27
EP2729580A1 (en) 2014-05-14
US20140221217A1 (en) 2014-08-07
US20210207213A1 (en) 2021-07-08
EP2980226A1 (en) 2016-02-03
EP2729580B1 (en) 2015-09-16
JP2014520525A (ja) 2014-08-25
ES2556580T3 (es) 2016-01-19
US9777322B2 (en) 2017-10-03
US11873529B2 (en) 2024-01-16

Similar Documents

Publication Publication Date Title
JP6028025B2 (ja) オリゴヌクレオチド・ライゲーション・アッセイに基づく配列ベースの遺伝子型決定
JP5237126B2 (ja) ライゲーションアッセイを用いてハイスループットシークエンスに基づき遺伝子関連配列を検出する方法
US11649494B2 (en) High throughput screening of populations carrying naturally occurring mutations
JP5117722B2 (ja) 標的核酸配列の検出のためのolaベースの方法
US10465241B2 (en) High resolution STR analysis using next generation sequencing
US7749708B2 (en) Method for identifying the sequence of one or more variant nucleotides in a nucleic acid molecule
US10150960B2 (en) C-probe libraries for DNA target enrichment

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150709

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161017

R150 Certificate of patent or registration of utility model

Ref document number: 6028025

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250