I.全般的な用語
本明細書記載の本開示のシステム及び方法は、別段の表示がない限りにおいて、(組換え技法を含む)分子生物学、細胞生物学、生化学、マイクロアレイ及び配列決定技術の従来の技法及び記述を用いることができ、該技法及び記述は当業者の技能の範囲内である。かかる従来の技法としては、ポリマーアレイ合成、オリゴヌクレオチドのハイブリダイゼーション及びライゲーション、オリゴヌクレオチドの配列決定、並びに標識を用いたハイブリダイゼーションの検知が挙げられる。好適な技法の具体的な実例としては、本明細書の例を参照することにより得ることができる。但し、当然のことながら、同等の従来の手法もまた用いることができる。かかる従来の技法及び記述は、Greenら編、Genome Analysis:A Laboratory Manual Series(第I〜IV巻)(1999);Weinerら編、Genetic Variation:A Laboratory Manual(2007);Dieffenbach、Dveksler編、PCR Primer:A Laboratory Manual(2003);Bowtell及びSambrook、DNA Microarrays:A Molecular Cloning Manual(2003);Mount、Bioinformatics:Sequence and Genome Analysis(2004);Sambrook及びRussell、Condensed Protocols from Molecular Cloning:A Laboratory Manual(2006);並びにSambrook及びRussell、Molecular Cloning:A Laboratory Manual(2002)(全てCold Spring Harbor Laboratory Pressより);Stryer,L.、Biochemistry(第4版)、W.H.Freeman、ニューヨーク(1995);Gait、「Oligonucleotide Synthesis:A Practical Approach」、IRL Press、ロンドン(1984);Nelson及びCox、Lehninger,Principles of Biochemistry、第3版、W.H.Freeman Pub.、ニューヨーク(2000);並びにBergら、Biochemistry、第5版、W.H.Freeman Pub.、ニューヨーク(2002)などの標準的な実験室手引書に見ることができ、これらの全てが、全ての目的のために、それらの全体が参照により本明細書に組み込まれる。本組成物、本研究手段及びシステム並びに本方法が記載される前に、本開示は、記載される特定のシステム及び方法、組成物、対象並びに使用に限定されるものではなく、従って、当然のことながら変化し得ることが理解されるべきである。また、本明細書で用いられる用語は、特定の態様を記載することのみを目的とするものであり、本開示の範囲を限定することは意図されず、本開示の範囲は添付の特許請求の範囲によってのみ限定されることとなることも理解されるべきである。
本明細書で用いられる用語は、特定の実施形態を記載することのみを目的とするものであり、本開示の装置の限定は意図されない。本明細書において用いられる単数形、「a」、「an」及び「the」は、文脈が明確に別段の表示をしない限りにおいて、複数形をも同様に包含することが意図される。更に、用語「包含する」(「including」、「includes」)、「有する」(「having」、「has」、「with」)またはそれらの変化形が、詳細な説明及び/または特許請求の範囲のいずれかで用いられる範囲において、かかる用語は、用語「含む」(「comprising」)と同様の意味で包含することが意図される。
本開示のシステム及び方法のいくつかの態様は、説明のための応用例と関連して上述される。本開示が完全に理解されるように、多数の特定の細部、関連、並びにシステム及び方法が述べられことが理解されるべきである。但し、関連する技術分野の当業者は、本開示のシステム及び方法は、1または複数の上記特定の細部を用いることなく、あるいは他のシステムまたは方法を用いて実施することができることを容易に認識することとなる。いくつかの行為は、他の行為または事象と異なる順序で及び/または同時に行われてもよく、本開示は、例証される行為または事象の順序付けによって限定されない。更に、例証される行為または事象の全てが、本開示に従った方法論を満たすことが要求される訳ではない。
本明細書において、範囲は、「約」一つの特定の数値から及び/または「約」別な特定の数値までとして表すことができる。かかる範囲が表される場合、別な実施形態が、当該の一つの特定の数値から及び/または当該他の特定の数値までを含む。同様に、先行する「約」を用いることにより値が近似として表される場合、当該特定の値が別な実施形態を形成することが理解されよう。それぞれの範囲の終点は、もう一方の終点との関係において、及びもう一方の終点とは独立に重要であることが更に理解されよう。本明細書で用いられる用語「約」とは、当該の使用の文脈の範囲内において、記載された数値のプラスまたはマイナス15%の範囲をいう。例えば、約10は8.5〜11.5の範囲を包含することとなる。
II.概要
本開示は、母親及び胎児のポリヌクレオチドを含む試料の遺伝子変異の試験及び分析システム並びに方法を提供する。概括的には、本開示のシステム及び方法は、一般的には母親由来である試料由来の、母親及び胎児のポリヌクレオチドの混合物の単離を提供する。ポリヌクレオチドは単離及び精製され、更に、上記試料中の1または複数の遺伝子座における、コピー数多型または必然的変異型などの遺伝子変異の有無を特定するために試験される。
一般的に、図4に示すように、1または複数のプローブセットであって、それぞれが少なくとも2の、試料連鎖416中の配列に対して相補的なハイブリダイゼーション配列408及び410を含む上記プローブセットを、当該試料中の1または複数の着目する遺伝子座及び1または複数の、上記着目する遺伝子座外の遺伝子座に対してハイブリダイズさせる。プローブは一般的に、分子状バーコード配列404などの識別子分子が割り当てられる。いくつかの場合においてに、プローブセットは分子反転プローブ(molecular inversion probe)(MIP)400を含んでいてもよく、該MIPは、ユニバーサルプライマー配列402及び414、制限部位460、及びリンカー配列412などの更なる配列から構築される。次に、2以上のプローブが連結され418、リゲーション部位432において単一の連続したリゲーション生成物を生成する。結合されたプローブはエキソヌクレアーゼによる処理によって単離することができ、該エキソヌクレアーゼは直鎖状のポリヌクレオチドの末端406を選択的に標的とし、試料DNA鎖及び非結合プローブを消化する一方で、結合した環状プローブは未変化のまま残すことができる。識別子分子は、ユニバーサルプライミング部位434及び430、バーコード配列中の部位426、またはハイブリダイゼーション配列内の部位438及び436からのユニバーサル増幅を始めとする種々の手段を用いて識別され及び計数される。一般的に、特定のプローブセットに予め割り振られたバーコードの存在量は、上記特定のプローブセットが相補的である遺伝子座の存在量に略比例する。従って、バーコードの存在量は、試料中に当初存在した遺伝子座のコピー数に比例し得る。本開示のシステム及び方法は、種々の識別子の計数方法及び、1または複数の遺伝子座におけるCNVの特定などの、試料中の遺伝子変異の有無の特定における、計数された識別子の使用を提供する。
更に、本開示のシステム及び方法は、全体的な染色体異常から、他の異常を暗示する他の僅かなゲノム異常までにわたる、母親及び胎児の試料における種々の遺伝子変異を検出するために特に有用であり得る。例えば、本開示のシステム及び方法は、トリソミー21を検知すること、または嚢胞性線維症などの疾患に関する必然的変異型の検知の提供において有用であり得る。
III.ポリヌクレオチドの単離及び抽出
A.試験試料源
本開示のシステム及び方法は、種々のポリヌクレオチドの試験、操作、調製、識別及び/または定量を伴い得る。ポリヌクレオチドの例としては、DNA、RNA、アンプリコン、cDNA、dsDNA、ssDNA、プラスミドDNA、コスミドDNA、高分子量(high Molecular Weight)(MW)DNA、染色体DNA、ゲノムDNA、ウィルスDNA、細菌DNA、mtDNA(ミトコンドリア(mitochondrial)DNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、ミクロRNA、dsRNA、リボザイム、リボスイッチ及びウィルスRNA(例えば、レトロウィルスRNA)が挙げられるが、それらに限定されない。
上記試験試料は、母親及び胎児のポリヌクレオチドの混合物を含む、任意且つ適宜の生物学的出所由来であってよい。試料はヒト、哺乳類、非ヒト哺乳類、類人猿、猿、チンパンジー、爬虫類、両生類または鳥類などの種々の出所由来であってよい。いくつかの場合において、試験試料は組織試料、生体液、または細胞試料を含み得る。いくつかの場合において、試験試料はスワブ、スミア、生検材料、吸引物、またはイン・ビトロで培養された複数の細胞(すなわち、組織/細胞培養)を含み得る。いくつかの場合において、ポリヌクレオチドは細胞から抽出され、その後試験されてもよい。他の場合において、ポリヌクレオチドは、血液などの体液中で循環するポリヌクレオチドなどの無細胞の状態として存在し、その後試験されてもよい。生物学的出所の例としては、母親の臓器組織、胎児の臓器組織、血液、血漿、血清、汗、涙、痰、尿、耳分泌物、リンパ、唾液、脳脊髄液、骨、骨髄懸濁液、膣分泌物、大腿骨頸部灌流、脳流体、白血球フェレーシス試料、腹水、乳、気道分泌物、粘液、腸分泌物、羊水、絨毛膜絨毛試料、胎児の試料、臍の緒試料、または胎盤試料を挙げることができるが、それらに限定されない。
いくつかの場合において、試料は単一の出所より、または複数の出所の組み合わせより得ることができる。いくつかの場合において、母親及び胎児のポリヌクレオチドの混合物は同一の生物学的試料より得ることができる。いくつかの場合において、母親及び胎児のポリヌクレオチドの混合物は、母親の血液などの単一の母親の試料より得ることができる。いくつかの場合において、試料は別個の試料より得てもよい。例えば、試料は母親の組織由来のポリヌクレオチド及び別個の胎児の組織由来のポリヌクレオチドを含んでいてもよい。いくつかの場合において、母親及び胎児のポリヌクレオチドは試料採取の後に混合されてもよい。いくつかの場合において、試料は、異なる個体、同一若しくは異なる個体の異なる発育段階、異なる病態の個体(すなわち、ガン若しくは遺伝的障害を有する個体)、正常な、すなわち健常な個体、1または複数の病態にある個体、疾患に関して異なる治療を受けている個体、異なる環境因子に曝露されている個体、または異なる感染因子若しくは疾患因子(すなわち、ウィルス、細菌、病原体)に曝露されている個体由来であってもよい。一般的に、生物学的試料は妊娠中の女性(雌)由来であってよい。他の場合において、試料は胎芽(胚)または胎児に直接由来するものであってもよい。いくつかの場合において、試料は胎内の胎児由来であってもよい。他の場合において、試料は、胎芽(胚)由来、または、元々体外受精(in vitro fertilization)(IVF)によって生み出され、それに続いて別個の母親の試料と組み合わされた、培養された胎芽(胚)の組織由来であってもよい。
試料はまた、イン・ビトロ培養された組織、培養された細胞または他の培養されたポリヌクレオチドを含む出所などの、細胞培養物中の細胞より得てもよい。イン・ビトロでの出所より得た試料は、それらに限定されないが、様々な種類の培地条件(すなわち、pH、温度、成長因子、栄養成分等々)、培養時間の長さ、または外因による処理(すなわち、医薬、医薬候補、化学薬剤、毒素等々)を始めとする様々な条件下で培養することができる。
試料が得られた後、本技術分野において公知の任意且つ適宜の技法を用いて、ポリヌクレオチドを抽出、単離及び精製することができる。例えば、いくつかの場合において、Qiagen社のQiamp(登録商標)Circulating Nucleic Acid Kitなどの任意且つ適宜の市販のキットを用いてDNAを単離、抽出及び調製することができる。他の例としては、Qiagen Qubit(商標)dsDNA HS Assayキットプロトコル、Agilent(商標)DNA1000キット、またはTruSeq(商標)Sequencing Library Preparation;Sigma Aldrich社、Life Technologies社、Promega社、Affymetrix社、IBI社等により提供されるLow−Throughput(LT)または他のキットが挙げられるが、それらに限定されない。また、任意且つ適宜の非市販のキットも、本開示のシステム及び方法のためのポリヌクレオチドの単離及び精製に用いることができる。
精製の後、いくつかの場合において、ポリヌクレオチドを、1若しくは複数の薬剤などの1または複数の更なる物質と予備混合してもよい。薬剤としては、リガーゼ、プロテアーゼ、ポリメラーゼ、制限酵素、dNTP、塩、バルクポリヌクレオチド等を挙げることができるが、それらに限定されない。1または複数の薬剤は、後続のハイブリダイゼーションステップの前に、ポリヌクレオチドの調製のために添加することができる。
B.ポリヌクレオチドの断片化
単離及び精製の後、本開示のシステム及び方法は、ハイブリダイゼーションの前に、ポリヌクレオチドを断片化するための任意選択の調製ステップを提供する。いくつかの場合において、ポリヌクレオチドは、ポリヌクレオチドが分解された、すなわち短い配列(例えば、無細胞ポリヌクレオチド)として存在する場合におけるような断片として単離及び精製されてもよい。他の場合において、ポリヌクレオチドは、ゲノムDNA(gDNA)などの、未変化または実質的に未変化の配列として単離及び精製されてもよい。
gDNAなどの試料連鎖の断片化は、いくつかの場合において特に有用となり得る。例えば、ポリヌクレオチドはハイブリダイゼーションの前に分割されてもよく、その場合、一本鎖または断片は、単一のウェル、単一の液滴または単一の乳化液中などで分離及び分割される。gDNAは非オーバーラップの配列へと断片化されてもよく、該非オーバーラップの配列は分割され、分割物内で種々の他の薬剤と組み合わされてもよい。一例において、本明細書中で述べたバーコード配列が、分割物内でプローブ配列に割り当てられてもよい。
分割は任意且つ適宜の方法または装置を用いて行うことができる。例えば、試料または反応混合物の分配及びそれに続く薬剤の添加のために、微小流体装置が知られている。分配及び薬剤の組み合わせでの添加に用いられる種々の市販のプラットフォームを、本開示のシステム及び方法で用いることができる。例えば、Dynamic Array(商標)システム及びAccess Array(商標)システム、並びに文献に記載のシステムを用いることができる(例えば、米国特許第7,604,965号、特許公開WO2010/077618、US2009/0317798、US2008/0223721、US2009/0257920、US2009/0291435、US2011/0126910及び未公開の出願PCT/US10/58459を参照されたく、これらは全て参照により本明細書に組み込まれる。)。他の手法としては微小流体カードの使用が挙げられる。一つの有用な手法としては、反応混合物を、中で増幅反応を行うことができる微小液滴へ分配することを伴う(例えば、特許出願公開第US2009/0035838、US2010/0022414、WO01/89788、WO2006/040551、WO2006/040554、WO2004/002627、WO2008/063227、WO2004/091763、WO2005/021151、WO2006/096571、WO2007/089541、WO2007/081385及びWO2008/063227を参照されたく、これらは全て参照により本明細書に組み込まれる。)。液滴に基づく手法の一つにおいて、試料を複数の液滴へと分割し、個々の同一の液滴を指定された薬剤を含む液滴と融合することができる。
いくつかの場合において、ポリヌクレオチドは、長さとして約10〜50、50〜100、100〜500、500〜1000、1000〜3000、または1000〜3000塩基対の大きさに断片化されてもよい。いくつかの場合において、ポリヌクレオチドは、長さとして少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、または5000塩基対の大きさに断片化されてもよい。いくつかの場合において、ポリヌクレオチドは、長さとして最大で10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、または5000塩基対の大きさに断片化されてもよい。
多くの断片化システム及び方法が本明細書に記載され、また本技術分野において公知である。例えば、断片化は、物理的、機械的または酵素的システム及び方法によって実施することができる。物理的断片化としては、標的ポリヌクレオチドを熱またはUV光に曝露することをあげることができる。機械的分解は、標的ポリヌクレオチドを、超音波処理または噴霧化によるなどして、所望の範囲の断片へと機械的にせん断するために用いることができる。標的ポリヌクレオチドはまた、酵素的システム及び方法を用いて断片化することもできる。いくつかの場合において、酵素的消化は、制限酵素を用いるなどの酵素を用いることで、実施することができる。
制限酵素は、標的ポリヌクレオチドの特異的断片化または非特異的断片化を実施するために用いることができる。本開示のシステム及び方法は、一般的にI型酵素、II型酵素、及び/またはIII型酵素と表記される1または複数の制限酵素を用いることができる。II型酵素及びIII型酵素は一般に市販され、本技術分野において周知である。
IV.標的増幅及び配列決定
一態様において、本発明は試料中の複数の標的ポリヌクレオチドの配列決定方法を提供する。一実施形態において、該方法は、(a)標的ポリヌクレオチドを断片化して、断片化ポリヌクレオチドを生成させることと、(b)上記断片化ポリヌクレオチドにアダプターオリゴヌクレオチド、但し該アダプターオリゴヌクレオチドのそれぞれは配列Dを含む、を連結し、両末端に、相補的な配列D’に対してハイブリダイズする配列Dを含む改変されたポリヌクレオチドを生成させることであって、任意選択で、配列D’は標的ポリヌクレオチドの3’末端の伸長によって作製される、上記改変されたポリヌクレオチドを生成させることと、(c)配列C、配列D、及び試料に結合したバーコードを含む増幅プライマーを用いて、上記改変されたポリヌクレオチドを増幅することであって、配列Dが上記増幅プライマーの3’末端に位置する、上記改変されたポリヌクレオチドを増幅することと、(d)増幅された標的ポリヌクレオチドを、固体表面に接続された複数の異なる第1のオリゴヌクレオチドに対してハイブリダイズさせることと、(e)固体表面上で架橋増幅を行うことと、(f)ステップ(e)由来の複数のポリヌクレオチドを配列決定することとを含む。上記固体表面は複数のオリゴヌクレオチドを含んでいてもよい。いくつかの実施形態において、上記固体表面は、(i)配列A及び配列Bを含む、複数の異なる第1のオリゴヌクレオチドであって、配列Aは全ての第1のオリゴヌクレオチド間に共通であり、更に、配列Bは、各異なる第1のオリゴヌクレオチドに対して異なり、各第1のオリゴヌクレオチドの3’末端にあり、着目する遺伝子座を含む配列、または着目する遺伝子座の200ヌクレオチド以内の配列に対して相補的である、上記第1のオリゴヌクレオチド、(ii)各3’末端に配列Aを含む複数の第2のオリゴヌクレオチド、及び(iii)各3’末端に配列Cを含む複数の第3のオリゴヌクレオチドを含む。いくつかの実施形態において、1または複数の配列A、B、C、及びDは異なる配列である。いくつかの実施形態において、1または複数の配列A、B、C、及びDは、その他の1または複数の配列A、B、C、及びDとは、約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、若しくはそれを超えて、それら未満、またはそれらを超えて異なる(例えば、約10%、20%、30%、40%、50%、60%、70%、80%、90%、またはそれを超えるもの未満の同一性を有する。)。いくつかの実施形態において、1または複数の配列A、B、C、及びDはそれぞれ、約1、2、3、4、5、6、7、8、9、10、15、20若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチドを含む。
試料は、本明細書記載の方法などの適当な方法によって得ることができ、断片化することができる。いくつかの実施形態において、断片化に続いて、アダプターオリゴヌクレオチドの断片化ポリヌクレオチドへのライゲーションが行われる。アダプターオリゴヌクレオチドとしては、少なくともその一部が公知である、標的ポリヌクレオチドに連結することができる配列を有する任意のオリゴヌクレオチドが挙げられる。アダプターオリゴヌクレオチドはDNA、RNA、ヌクレオチド類縁体、非標準ヌクレオチド、標識ヌクレオチド、修飾ヌクレオチド、またはそれらの組み合わせを含むことができる。アダプターオリゴヌクレオチドは、一本鎖であり、二本鎖であり、または部分的に二重鎖であることができる。一般的に、部分的に二重鎖のアダプターは1または複数の一本鎖領域を含み、且つ1または複数の二本鎖領域を含む。二本鎖アダプターは、互いにハイブリダイズした2の別個のオリゴヌクレオチドを含むことができ(「オリゴヌクレオチド二重鎖」とも呼ばれる)、ハイブリダイゼーションは、1または複数のブラントエンド、1または複数の3’オーバーハング、1または複数の5’オーバーハング、ミスマッチの及び/若しくは非対のヌクレオチドに起因する1または複数のバルジ、あるいはこれらの任意の組み合わせを残し得る。いくつかの実施形態において、一本鎖アダプターは、互いにハイブリダイズすることができる2以上の配列を含む。一本鎖アダプター中に2のかかるハイブリダイズ可能な配列が含まれる場合は、ハイブリダイゼーションによりヘアピン構造が生成される(ヘアピンアダプター)。アダプターのハイブリダイズした2の領域が、非ハイブリダイズ領域によって互いに分離した場合、「バブル」構造が生じる。バブル構造を含むアダプターは、内部ハイブリダイゼーションを含む単一のアダプターオリゴヌクレオチドから構成されることができ、または、互いにハイブリダイズした2以上のアダプターオリゴヌクレオチドを含み得る。アダプター中の2のハイブリダイズ可能な配列間などの内部配列ハイブリダイゼーションは、一本鎖アダプターオリゴヌクレオチド中に二本鎖構造を生成させることができる。ヘアピンアダプターと二本鎖アダプター、または異なる配列の複数のアダプターなどの、異なる種類のアダプターを組み合わせて用いることができる。異なるアダプターを、逐次反応においてまたは同時に、標的ポリヌクレオチドに連結することができる。いくつかの実施形態において、同一のアダプターが標的ポリヌクレオチドの両末端に付加される。例えば、第1及び第2のアダプターを、同一の反応混合物に添加することができる。アダプターは標的ポリヌクレオチドと連結する前に操作することができる。例えば、末端リン酸基を付加または除去することができる。
いくつかの実施形態においては、アダプターが、2の部分的に相補的なポリヌクレオチド鎖を、該2の連鎖がアニールされた場合に、少なくとも1の二本鎖領域と少なくとも1の非対領域とを付与するようにアニールすることによって形成されるミスマッチのアダプターである。アダプターの「二本鎖領域」とは、2の部分的に相補的なポリヌクレオチド鎖のアニーリングによって形成される、一般的には5以上の連続する塩基対を含む短い二本鎖領域である。この用語は単に、核酸の二本鎖領域であって、その中では2の連鎖がアニールされている上記領域をいい、如何なる特定の構造的コンフォメーションを暗示するものではない。いくつかの実施形態において、上記二本鎖領域は、長さが約5、10、15、20、25、30、若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチドである。一般的に、ミスマッチのアダプターの上記二本鎖領域にとって、機能を失うことなく可能な限り短いことが有利である。この文脈において「機能」とは、酵素により触媒される核酸ライゲーション反応のための標準的な反応条件下において、上記二本鎖領域が安定な二重鎖を形成することを意味し、該反応条件は当業者に公知である(例えば、標的分子へのアダプターのライゲーションの間に、アダプターを形成する上記2の連鎖が部分的にアニールされたままになるような、当該酵素に対して適当なライゲーション緩衝液中、4℃〜25℃の範囲の温度でのインキュベーション)。上記二本鎖領域にとって、プライマー伸長またはPCR反応のアニーリングステップにおいて一般的に用いられる条件下で安定であることは、絶対的に必要なことではない。一般的に、上記二本鎖領域は、アダプターの「連結可能な」末端、すなわち、ライゲーション反応において標的ポリヌクレオチドに連結する末端に隣接する。上記アダプターの連結可能な末端はブラントエンドであることができ、あるいは、他の実施形態においては、1または複数のヌクレオチドの短い5’または3’オーバーハングが存在して、ライゲーションを容易にする/促進することができる。上記アダプターの連結可能な末端における上記5’末端ヌクレオチドは、一般的にはリン酸化され、試料ポリヌクレオチド上の3’水酸基へのリン酸ジエステル結合を可能にする。用語「非対領域」とは、当該アダプターを形成する2のポリヌクレオチド鎖の配列が、プライマー伸長またはPCR反応のための標準的なアニーリング条件下において、該2の連鎖が互いにアニーリングすることができない程度の非相補性を示すアダプターの領域をいう。上記非対領域の2の連鎖は、アニーリング条件下で、該2の連鎖が一本鎖形態に戻るとの条件の下に、酵素により触媒されるライゲーション反応のための標準的な反応条件下で、ある程度のアニーリングを示し得る。
アダプターオリゴヌクレオチドは、それらに限定されないが、1または複数の増幅プライマーアニーリング配列若しくはそれらの補体、1または複数の配列決定プライマーアニーリング配列若しくはそれらの補体、1または複数のバーコード配列、多種の異なるアダプター若しくは異なるアダプターの部分集合間で共有される1または複数の共通配列、1または複数の制限酵素認知部位、1または複数の標的ポリヌクレオチドオーバーハングに対して相補的な1または複数のオーバーハング、1または複数のプローブ結合部位(例えば、本明細書記載の装置またはIllumina Inc.によって開発されたフローセルなどの、大規模並列配列決定(massive parallel sequencing)のためのフローセルなどの、配列決定プラットフォームへの取り付けのための)1または複数のプローブ結合部位、1または複数のランダム若しくはランダムに近い配列(例えば、1または複数の位置において、2以上の異なるヌクレオチドの組より無作為に選択された1または複数のヌクレオチドであって、上記1または複数の位置において選択された異なるヌクレオチドのそれぞれが、上記ランダムな配列を含むアダプターのプール中に出現する(represented)上記ヌクレオチド)、及びそれらの組み合わせを始めとする、種々の配列エレメントの1または複数を含有することができる。2以上の配列エレメントは、互いに隣接しない(例えば、1または複数のヌクレオチドによって分離されている)、互いに隣接する、部分的にオーバーラップする、または完全にオーバーラップすることができる。例えば、増幅プライマーアニーリング配列もまた、配列決定プライマーアニーリング配列としての役目を果たすことができる。配列エレメントは3’末端若しくはその近傍、5’末端若しくはその近傍、またはアダプターオリゴヌクレオチドの内部に位置することができる。アダプターオリゴヌクレオチドがヘアピンなどの2次構造を形成することができる場合、配列エレメントは、部分的に若しくは完全に当該2次構造の外側に、部分的に若しくは完全に当該2次構造の内側に、または当該2次構造に関与する配列の間に位置することができる。配列エレメントは、長さとして約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチドなどの、任意且つ適宜の長さとし得る。アダプターオリゴヌクレオチドは、少なくともそれらを構成する1または複数の配列エレメントを収容するために十分な、任意且つ適宜の長さを有することができる。いくつかの実施形態において、アダプターは、長さとして約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200、若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチドである。
いくつかの実施形態において、1の試料由来の断片化ポリヌクレオチドに連結したアダプターオリゴヌクレオチドは、全てのアダプターオリゴヌクレオチド及び当該の特定の試料のポリヌクレオチドに連結したアダプターに固有のバーコードに共通な1または複数の配列を含む。これは、1の試料またはアダプター連結反応に由来するポリヌクレオチドを、別な試料またはアダプター連結反応に由来するポリヌクレオチドから区別ために、上記バーコード配列を用いることができるようにするためである。いくつかの実施形態において、アダプターオリゴヌクレオチドが、1または複数の標的ポリヌクレオチドオーバーハングに対して相補的な5’オーバーハング、3’オーバーハング、または両方を含む。相補的なオーバーハングは、それらに限定されないが、長さとして1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、またはそれを超えるヌクレオチドを始めとする長さの1または複数のヌクレオチドとすることができる。相補的なオーバーハングは固定された配列を含み得る。1または複数の位置において、1または複数のヌクレオチドが2以上の異なるヌクレオチドの組より無作為に選択されるように、アダプターオリゴヌクレオチドの相補的なオーバーハングは、1または複数のヌクレオチドのランダムな配列を含み得る。但し、上記1または複数の位置において選択された異なるヌクレオチドのそれぞれは、上記ランダムな配列を含む相補的なオーバーハングを有するアダプターのプール中に出現する。いくつかの実施形態において、アダプターオーバーハングは、制限エンドヌクレアーゼの消化によって生成する標的ポリヌクレオチドオーバーハングに対して相補的である。いくつかの実施形態において、アダプターオーバーハングは、アデニンまたはチミンからなる。
いくつかの実施形態において、アダプターオリゴヌクレオチドは、配列エレメント配列Dを含む1の連鎖を含む。いくつかの実施形態において、アダプターオリゴヌクレオチドは、相補的配列D’に対してハイブリダイズした配列Dを含み、ここで配列D’は配列Dと同一または異なる連鎖上に存在する。いくつかの実施形態において、標的ポリヌクレオチドの3’末端がアダプターオリゴヌクレオチドに沿って伸長され、相補的な配列D’を生起する。いくつかの実施形態において、断片化ポリヌクレオチド及びアダプターオリゴヌクレオチドが(例えば、ライゲーションにより及び任意選択で断片伸長により)組み合わされ且つ処理されて、両末端において、アダプターオリゴヌクレオチド配列に連結した断片化ポリヌクレオチド配列を含む二本鎖の、改変されたポリヌクレオチドを生成し、ここで該改変されたポリヌクレオチドの両末端は、配列D’に対してハイブリダイズした配列Dを含む。いくつかの実施形態において、アダプターの連結に供される断片化ポリヌクレオチドの量は、約50ng、100ng、200ng、300ng、400ng、500ng、600ng、700ng、800ng、900ng、1000ng、1500ng、2000ng、2500ng、5000ng、10μg、若しくはそれを超える(例えば閾値量)、それら未満、またはそれらを超える。いくつかの実施形態において、断片化ポリヌクレオチドの量はアダプターの連結を進める前に決定され、ここで上記量が閾値量を下回る場合には、アダプターの連結は実施されない。
アダプターオリゴヌクレオチド及び試料ポリヌクレオチドなどの2のポリヌクレオチドに関して本明細書で用いられる用語「連結」(joining)及び「ライゲーション」(ligation)とは、連続した骨格を有する、単一のより大きなポリヌクレオチドを生成する、2の別個のポリヌクレオチドの共有結合性の接続をいう。2のポリヌクレオチドの連結方法の非限定的な例としては、酵素的方法または非酵素的(例えば、化学的)方法が挙げられる。非酵素的なライゲーション反応の例としては、米国特許第5,780,613号及び第5,476,930号に記載の非酵素的ライゲーション技法が挙げられ、これらの特許は参照により本明細書に組み込まれる。いくつかの実施形態において、アダプターオリゴヌクレオチドが、例えばDNAリガーゼまたはRNAリガーゼなどのリガーゼによって断片化ポリヌクレオチドに連結される。リガーゼの非限定的な例としては、それぞれ特徴付けされた反応条件を有するが、tRNAリガーゼを始めとするNAD+依存性リガーゼ、Taq DNAリガーゼ、Thermus filiformis DNAリガーゼ、大腸菌DNAリガーゼ、Tth DNAリガーゼ、Thermus scotoductus DNAリガーゼ(I及びII)、熱安定リガーゼ、Ampligase熱安定性DNAリガーゼ、VanC型リガーゼ、9°N DNAリガーゼ、Tsp DNAリガーゼ、及び生物資源探査により発見された新規リガーゼ;T4 RNAリガーゼ、T4 DNAリガーゼ、T3 DNAリガーゼ、T7 DNAリガーゼ、Pfu DNAリガーゼ、DNAリガーゼ1、DNAリガーゼIII、DNAリガーゼIVを始めとするATP依存性リガーゼ、及び生物資源探査により発見された新規リガーゼ;並びにそれらの野生型、変異体イソ型、及び遺伝子操作された変異体が挙げられる。ライゲーションは、相補的なオーバーハングなどの、ハイブリダイズ可能な配列を有するポリヌクレオチド間に存在することができる。ライゲーションはまた、2のブラントエンドの間にも存在することができる。一般的に、5’リン酸がライゲーション反応に利用される。5’リン酸は断片化ポリヌクレオチド、アダプターオリゴヌクレオチド、またはそれらの両者により提供することができる。5’リン酸は、必要により、連結されるポリヌクレオチドに付加され、または該ポリヌクレオチドから除去することができる。5’リン酸の付加方法または除去方法としては本技術分野で公知であり、限定されることなく、酵素的過程及び化学的過程が挙げられる。5’リン酸の付加及び/または除去において有用な酵素としては、キナーゼ、ホスファターゼ、及びポリメラーゼが挙げられる。いくつかの実施形態において、ライゲーション反応において連結する2の末端の両方(例えば、アダプター末端及び断片化ポリヌクレオチド末端)が5’リン酸を提供し、その結果、上記2の末端が連結することにより、断片化ポリヌクレオチドの一方または両方の末端に2の共有結合が形成される。いくつかの実施形態において、3’リン酸はライゲーションに先立って除去される。いくつかの実施形態において、アダプターオリゴヌクレオチドが断片化ポリヌクレオチドの両末端に付加され、そこで、各末端の一方または両方の連鎖が、1または複数のアダプターオリゴヌクレオチドに連結する。いくつかの実施形態において、同時に分析されるべき1よりも多い試料の標的ポリヌクレオチドに対して、バーコード配列が連結されないように、各試料に対して少なくとも1の異なるバーコード配列を含む異なるアダプターオリゴヌクレオチドを用いて、異なる試料に対して別個のライゲーション反応が行われる。
アダプターオリゴヌクレオチドの非限定的な例としては、CACTCAGCAGCACGACGATCACAGATGTGTATAAGAGACAGT(配列番号17)をGTGAGTCGTCGTGCTGCTAGTGTCTACACATATTCTCTGTC(配列番号18)に対してハイブリダイズすることによって形成される二本鎖アダプターが挙げられる。更なるアダプターオリゴヌクレオチドの非限定的な例としては、US201110319290及びUS20070128624に記載され、これらは参照により本明細書に組み込まれる。
いくつかの実施形態において、改変オリゴヌクレオチドは、試料中の標的ポリヌクレオチドを増幅する増幅反応に供される。いくつかの実施形態において、増幅は、配列C、配列D、及び試料に結合したバーコードを含むプライマーを用い、ここで配列Dは増幅プライマーの3’末端に位置する。増幅プライマーは、約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチドなどの、任意且つ適宜の長さとすることができ、それらの任意の部分または全ては、上記プライマーがハイブリダイズする相当する標的配列に対して相補的であることができる(例えば、約5、10、15、20、25、30、35、40、45、50、若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチド)。「増幅」とは、標的配列のコピー数がそれによって増加する任意の過程をいう。任意の適切な、標的ポリヌクレオチドのプライマーにより方向付けられた増幅方法を用いることができ、その例としては、限定されることなく、ポリメラーゼ連鎖反応(polymerase chain reaction)(PCR)に基づく方法が挙げられる。PCRによる標的ポリヌクレオチドの増幅に有利な条件は、該過程中の種々のステップにおいて最適化することができ、標的の種類、標的濃度、増幅されるべき配列の長さ、標的及び/または1若しくは複数のプライマーの配列、プライマー長さ、プライマー濃度、用いるポリメラーゼ、反応量、1または複数の要素の1または複数の他の要素に対する比、及びその他などの、該反応における要素の特性に依存し得るが、それらの一部または全ては変えることができる。一般的に、PCRは、(二本鎖である場合は)増幅される標的の変性ステップ、標的に対する1または複数のプライマーのハイブリダイゼーションステップ、及びDNAポリメラーゼによるプライマーの伸長ステップを伴い、該ステップは標的配列を増幅するために繰り返される(すなわち、循環される)。この過程におけるステップは、収率を向上させること、偽性生成物の形成を低減すること、及び/またはプライマーアニーリングの特異度を増加または減少させることなどの、種々の結果に関して最適化することができる。最適化方法としては、増幅反応における要素の種類若しくは量、及び/または、特定のステップの温度、特定のステップの期間、及び/またはサイクル数などの、該過程中の所与のステップの条件に対する調整が挙げられる。いくつかの実施形態において、増幅反応は、少なくとも5、10、15、20、25、30、35、50、またはそれを超えるサイクルを含む。いくつかの実施形態において、増幅反応は、5、10、15、20、25、35、50、またはそれを超える数以下のサイクルを含む。サイクルは、1、2、3、4、5、6、7、8、9、10またはそれを超えるなどの、任意の数のステップを含むことができる。ステップは、それらに限定されないが、連鎖の変性、プライマーアニーリング、及びプライマー伸長を始めとする所与のステップの目的を達成するために好適な、任意の温度または温度勾配を含むことができる。ステップは、それらに限定されないが、約1、5、10、15、20、25、30、35、40、45、50、55、60、70、80、90、100、120、180、240、300、360、420、480、540、600、若しくはそれを超える、それら未満、またはそれらを超える秒数を始めとする任意の期間とすることができる。異なるステップを含む任意の数のサイクルを、任意の順で組み合わせることができる。
いくつかの実施形態において、増幅は、増幅プライマーの3’末端の配列Dと改変ポリヌクレオチドの配列D’との間のハイブリダイゼーション、増幅プライマー由来の配列D及びプライマー伸長の間に生成する配列D’を含むプライマー伸長生成物を生成する、改変ポリヌクレオチドに沿った増幅プライマーの伸長を含む。いくつかの実施形態において、鋳型ポリヌクレオチドからのプライマー伸長生成物を変性すること、及びプライマー伸長生成物を更なるプライマー伸長反応のための鋳型として用いて該過程を繰り返すことによって、1または複数回増幅過程が繰り返される。いくつかの実施形態において、第1のプライマー伸長反応において用いられたプライマーと同一のプライマーを用いて、プライマー伸長の第1のサイクルが、約5、10、15、20、25、30、35、50、若しくはそれを超える、それら未満、またはそれらを超えるサイクルの間繰り返される。いくつかの実施形態において、(例えば、配列Cの補体またはその一部に対して相補的な)第1の増幅プライマーを用いた増幅により改変ポリヌクレオチドに付加された配列に対して相補的な配列を含む3’末端を有する第2の増幅プライマーを用いた、1又は複数の増幅サイクルが、増幅プライマーによる1または複数のプライマー伸長の後に行われる。いくつかの実施形態において、第2の増幅プライマーは、3’末端に配列Cまたはその一部を含む。第2の増幅プライマーの非限定的な例としては、CGAGATCTACACGCCTCCCTCGCGCCATCAG(配列番号19)が挙げられる。いくつかの実施形態において、第2の増幅プライマーによる増幅は、約5、10、15、20、25、30、35、50、若しくはそれを超える、それら未満、またはそれらを超えるサイクルを含む。いくつかの実施形態において、増幅に供される改変ポリヌクレオチドの量は、約50ng、100ng、200ng、300ng、400ng、500ng、600ng、700ng、800ng、900ng、1000ng、1500ng、2000ng、2500ng、5000ng、10μg、若しくはそれを超える(例えば閾値量)、それら未満、またはそれらを超える。いくつかの実施形態において、改変ポリヌクレオチドの量は増幅を進める前に決定され、ここで上記量が閾値量を下回る場合には、増幅は実施されない。
いくつかの実施形態において、増幅プライマーはバーコードを含む。一般的に、用語「バーコード」とは、当該バーコードが結合するポリヌクレオチドのいくつかの特徴を識別することを可能にする、公知の核酸配列をいう。いくつかの実施形態において、識別されるポリヌクレオチドの特徴は、当該ポリヌクレオチドが由来する試料である。いくつかの実施形態において、バーコードは、長さにおいて、約または少なくとも約3、4、5、6、7、8、9、10、11、12、13、14、15、またはそれを超えるヌクレオチドである。いくつかの実施形態において、バーコードは、長さにおいて、10、9、8、7、6、5、または4よりも短いヌクレオチドである。いくつかの実施形態において、いくつかのポリヌクレオチドに結合したバーコードは、他のポリヌクレオチドに結合したバーコードとは長さが異なる。一般的に、バーコードは十分な長さを有し、当該ポリヌクレオチドが結合するバーコードに基づいて、該結合するポリヌクレオチドの特徴(例えば試料源)の識別が可能になる程度に十分に異なる配列を含む。いくつかの実施形態において、バーコード、及び当該バーコードが関連付けられる試料の出所は、当該バーコード配列における1または複数のヌクレオチドの変異、挿入、または欠失、例えば1、2、3、4、5、6、7、8、9、10、若しくはそれを超えるヌクレオチドの変異、挿入、または欠失などの後に、正確に識別することができる。いくつかの実施形態において、複数のバーコード中の各バーコードは、複数の中の他の全てのバーコードと、少なくとも3のヌクレオチド位置、例えば少なくとも3、4、5、6、7、8、9、10、またはそれを超えるヌクレオチド位置において異なる。試料のプール中に、複数のバーコードが出現することができ、各試料は、当該プール中の他の試料に由来するポリヌクレオチド中に含まれるバーコードとは異なる1または複数のバーコードを含むポリヌクレオチドを含む。上記プール中の各バーコードに沿った1または複数の位置(例えば、1、2、3、4、5、6、7、8、若しくはそれを超える、または全てのバーコードの位置)において、4種のヌクレオチド塩基A、G、C、及びTの全てが略均等に出現するように、1または複数のバーコードを含むポリヌクレオチドの試料を、当該ポリヌクレオチドが連結するバーコード配列に基づいてプールすることができる。いくつかの実施形態において、本発明の方法は、標的ポリヌクレオチドが由来する試料を、当該標的ポリヌクレオチドが連結するバーコード配列に基づいて識別することを更に含む。
いくつかの実施形態において、バーコード配列が、2以上の試料のプール中の1を超える試料の標的ポリヌクレオチドに連結しないように、各試料に対して少なくとも1の異なるバーコード配列を含む増幅プライマーを用いて、別個の増幅反応が別個の試料に対して行われる。いくつかの実施形態において、後続のポリヌクレオチドの操作を進める前(例えば、固体担体上での増幅及び/または配列決定の前)に、異なる試料に由来し、且つ異なるバーコードを含む増幅されたポリヌクレオチドがプールされる。プールは、反応量全体を含む、構成する全増幅反応の任意の画分を含むことができる。試料は均等または不均等にプールすることができる。いくつかの実施形態において、標的ポリヌクレオチドは、該ポリヌクレオチドが連結するバーコードに基づいてプールされる。プールは、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、20、25、30、40、50、75、100、若しくはそれを超える、それら未満、またはそれらを超える異なる試料に由来するポリヌクレオチドを含み得る。試料は、当該バーコードに沿った1または複数の位置において、4種のヌクレオチド塩基A、G、C、及びTの全てを均等に出現させるために、例えば4、8、12、16、20、24、28、32、36、40、44、48、52、56、60、64、96、128、192、256、384等の、4の倍数でプールすることができる。バーコードの非限定的な例としては、AGGTCA、CAGCAG、ACTGCT、TAACGG、GGATTA、AACCTG、GCCGTT、CGTTGA、GTAACC、CTTAAC、TGCTAA、GATCCG、CCAGGT、TTCAGC、ATGATC、及びTCGGATが挙げられる。いくつかの実施形態において、バーコードは、増幅プライマーの配列Dと配列Cとの間、または配列C及び配列Dの後で5’から3’への方向(「下流」)に位置する。いくつかの実施形態において、増幅プライマーは、配列CGAGATCTACACGCCTCCCTCGCGCCATCAGXXXXXXCACTCAGCAGCACGACGATCAC(配列番号21)を含むまたは該配列から構成され、ここで「X」はゼロ、1、またはそれを超えるバーコード配列のヌクレオチドを表わす。
増幅プライマーの非限定的な例を表1に示す。
いくつかの実施形態において、標的ポリヌクレオチドは固体担体に接続された複数のオリゴヌクレオチドに対してハイブリダイズされる。ハイブリダイゼーションは、アダプター連結及び増幅などの、1または複数の試料の加工ステップの前または後であってよい。いくつかの実施形態において、標的ポリヌクレオチドは、アダプター連結及び1または複数の増幅反応の両方の後に、固体担体上のオリゴヌクレオチドに対してハイブリダイズされる。固体担体上のオリゴヌクレオチドは、ランダムポリヌクレオチド配列、多数の異なる標的ポリヌクレオチドに共通な特定の配列(例えば、配列D、D’、若しくはそれらの一部などの、アダプターオリゴヌクレオチド由来の1若しくは複数の配列;配列C、C’、若しくはそれらの一部などの、増幅プライマー由来の1若しくは複数の配列;またはそれらの組み合わせ)、異なる標的ポリヌクレオチドに特異的な配列(配列Bに代表されるなどの)、あるいはこれらの組み合わせに対してハイブリダイズし得る。いくつかの実施形態において、上記固体担体は配列A及び配列Bを含む、複数の異なる第1のオリゴヌクレオチドを含み、ここで配列Aは全ての第1のオリゴヌクレオチド間で共通であり、更に、配列Bは、各異なる第1のオリゴヌクレオチドに対して異なり、各第1のオリゴヌクレオチドの3’末端に存在する。いくつかの実施形態において、複数の第1のオリゴヌクレオチドは、約5、10、25、50、75、100、125、150、175、200、300、400、500、750、1000、2500、5000、7500、10000、20000、50000、若しくはそれを超える、それら未満、またはそれらを超える異なるオリゴヌクレオチドであって、それぞれが異なる配列Bを含む上記オリゴヌクレオチドを含む。いくつかの実施形態において、配列Bまたは配列Bが特異的にハイブリダイズする標的配列は、着目する遺伝子座を含む。いくつかの実施形態において、配列Bまたは配列Bが特異的にハイブリダイズする標的配列は、約1、2、3、4、5、6、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、500若しくはそれを超える数以内、それら未満、またはそれらを超える、着目する遺伝子座のヌクレオチドである。上記固体担体は、本明細書に記載のように各第2のオリゴヌクレオチドの3’末端に配列Aを含む複数の第2のオリゴヌクレオチド、及び各第3のオリゴヌクレオチドの3’末端に配列Cを含む複数の第3のオリゴヌクレオチドを更に含んでもよい。
いくつかの実施形態において、本方法は上記固体担体上で架橋増幅を行うことを更に含む。一般的に、架橋増幅は、プライマーの鋳型へのアニーリング、プライマー伸長、及び伸長されたプライマーの鋳型からの分離のステップの繰り返しを用いる。これらのステップは一般的に、PCR(または逆転写酵素プラスPCR)技法における当業者に公知の薬剤及び条件を用いて行うことができる。従って、核酸ポリメラーゼをヌクレオシド三リン酸分子(または、修飾ヌクレオシド三リン酸などの、DNA/RNA中に存在するヌクレオチドの前駆体として作用する他の分子)の供給と共に、適宜の鋳型の存在下でプライマーを伸長させるために用いることができる。望ましくは、過剰なデオキシリボヌクレオシド三リン酸が供給される。代表的なデオキシリボヌクレオシド三リン酸は、略記されるdTTP(デオキシチミジンヌクレオシド三リン酸)(deoxythymidine nucleoside triphosphate)、dATP(デオキシアデノシンヌクレオシド三リン酸)(deoxyadenosine nucleoside triphosphate)、dCTP(デオキシシトシンヌクレオシド三リン酸)(deoxycytosine nucleoside triphosphate)及びdGTP(デオキシグアノシンヌクレオシド三リン酸)(deoxyguanosine nucleoside triphosphate)である。代表的なリボヌクレオシド三リン酸はUTP、ATP、CTP及びGTPである。但し、代替物が可能である。これらは天然産または非天然産であってよい。PCR反応において一般的に用いられる種類の緩衝液もまた提供され得る。プライマー伸長の間にヌクレオチドを組み込むために用いられる核酸ポリメラーゼは、数回使用することができるためには、利用される反応条件下で安定であることが好ましい。従って、新たに合成された核酸鎖をその鋳型から分離するために加熱が用いられる場合は、上記核酸ポリメラーゼは、用いられる温度において熱安定性であることが好ましい。かかる熱安定性ポリメラーゼとしては、好熱性微生物より得ることができ、Taqポリメラーゼとして知られるDNA依存性DNAポリメラーゼ、またその熱安定性誘導体が挙げられる。
一般的に、プライマーのその鋳型へのアニーリングは25〜90℃の温度で行われる。この範囲の温度はまた、プライマー伸長の間においても一般的に用いられることとなり、アニーリング及び/または変性の間に用いられる温度と同様または異なることができる。アニーリングを進めるため、また所望の程度のプライマー伸長を起こさせるために十分な時間が経過した後、所望ならば、温度を上昇させて連鎖を分離させることができる。この段階においては、温度は一般的に60〜100℃の温度に上昇させることとなる。アニーリングの前の非特異的なプライミングの問題を低減するため、及び/または増幅開始のタイミングを制御するため、例えば、多数の試料に対する増幅開始を同調させるために、高温を用いることもできる。あるいは、低塩且つ高pH(>12)の溶液を用いた処理により、またはカオトロピック塩(例えばグアニジン塩酸塩)を用いることにより、または有機溶媒(例えばホルムアミド)により、連鎖を分離することができる。
(例えば加熱による)連鎖の分離後に、洗浄ステップを行ってもよい。洗浄ステップは、固定化されたプライマーの近傍に同一の鋳型を保持することを所望する場合などには、アニーリング、プライマー伸長及び連鎖分離の初期の繰り返しの間には割愛されてもよい。これにより、鋳型を数回使用してコロニー形成を開始することが可能となる。固体担体上での増幅により生成するコロニーの大きさは、例えば、行うアニーリング、プライマー伸長及び連鎖分離のサイクル数の制御により、制御することができる。コロニーの大きさに影響する他の因子もまた制御することができる。該因子としては、固定化されたプライマーの表面上の数及び配置、その上にプライマーが固定化される担体の構造、鋳型及び/またはプライマー分子の長さ及び剛直性、温度、並びにその中で上記サイクルを行うことができる流体のイオン強度及び粘度が挙げられる。
本開示の方法に従った増幅過程の非限定的な例を図11に図解し、以下に説明する。まず、固体担体に接続され、その3’末端に配列Bを含む第1のオリゴヌクレオチドが、複数の異なる標的ポリヌクレオチド中の特定の標的ポリヌクレオチドに特有な配列などの相補的な標的配列B’(例えば特定のゲノムDNA配列)に対してハイブリダイズする。図11の標的ポリヌクレオチドは、アダプターオリゴヌクレオチド由来の配列(例えば配列D及びD’)及び増幅プライマー由来の配列(例えばC及びC’)を含む。第1のオリゴヌクレオチドの伸長は固体担体に接続された第1の伸長生成物を生成し、該第1の伸長生成物は、5’から3’に向かって、配列A、B、C’、及びD’を含み、ここで配列C’は配列Cに対して相補的であり、配列D’は配列Dに対して相補的である。次に、第1の伸長生成物は、標的ポリヌクレオチド鋳型から(例えば熱変性または化学変性により)分離される。第1の伸長生成物の配列C’は、次に、固体担体に接続された複数の第3のオリゴヌクレオチドの1に対してハイブリダイズし、該第3のオリゴヌクレオチドはその3’末端に配列Cを含む。第3のオリゴヌクレオチドの伸長は、固体担体に接続された第2の伸長生成物を生成し、該第2の伸長生成物は、5’から3’に向かって、配列C、D、B’、及びA’を含み、ここで配列B’は配列Bに対して相補的であり、配列A’は配列Aに対して相補的である。上記2の伸長生成物は、一方の連鎖が両末端において固体担体に接続された、二本鎖のポリヌクレオチドの「架橋」を形成する。次に、第1及び第2の伸長生成物は変性され、それに続く、上記伸長生成物とその後伸長された他のオリゴヌクレオチドとの間のハイブリダイゼーションが、第1及び第2の伸長生成物を複製する。例えば、各第1の伸長生成物が更なる第3のオリゴヌクレオチドに対してハイブリダイズし、第2の伸長生成物の更なるコピーを生成し得る。加えて、第2の伸長生成物が、固体担体に接続された複数の第2のオリゴヌクレオチドの1に対してハイブリダイズし、該第2のオリゴヌクレオチドはその3’末端に配列Aを含む。第2のオリゴヌクレオチドの伸長は第1の伸長生成物の配列を含む伸長生成物を生成する。伸長生成物に沿った伸長の連続的な繰り返しは、初期の第1の伸長生成物から外側に向かって放射状に拡がり、第1の伸長生成物及び単一の標的ポリヌクレオチドに由来する、第1の伸長生成物に相補的な第2の伸長生成物のクラスターすなわち「コロニー」を生成する。この過程は、異なる配列または配列の配置を含むオリゴヌクレオチド、異なる標的ポリヌクレオチドまたは標的ポリヌクレオチドの組み合わせ、固体担体の種類、及び特定の架橋増幅反応に応じた他の考慮すべき事項を適応させるために、変更してもよい。一般的に、この過程は、固体担体上での、標的ポリヌクレオチド及び非標的ポリヌクレオチドを含む試料ポリヌクレオチドからの、特定の標的ポリヌクレオチドの増幅を提供する。一般的に、標的ポリヌクレオチドは選択的に増幅される一方、試料中の非標的ポリヌクレオチドは増幅されない、または例えば、1又は複数の標的ポリヌクレオチドよりも約1/10、1/100、1/500、1/1000、1/2500、1/5000、1/10000、1/25000、1/50000、1/100000、1/1000000、若しくはそれ未満、またはそれらを超えて、非常に低い程度でしか増幅されない。
いくつかの実施形態において、その前の増幅ステップ由来の増幅されるポリヌクレオチドであって、架橋増幅に供される該ポリヌクレオチドの量は、約50ng、100ng、500ng、1μg、2μg、3μg、4μg、5μg、6μg、7μg、8μg、9μg、10μg、11μg、12μg、13μg、14μg、15μg、20μg、25μg、26μg、27μg、28μg、29μg、30μg、40μg、50μg、若しくはそれを超える(例えば閾値量)、それら未満、またはそれらを超える。いくつかの実施形態において、その前の増幅ステップ由来の増幅されるポリヌクレオチドの量は架橋増幅を進める前に決定され、ここで上記量が閾値量を下回る場合には、架橋増幅は実施されない。
いくつかの実施形態において、架橋増幅に続いて、固体担体に接続された複数のオリゴヌクレオチドの配列決定が行われる。いくつかの実施形態において、配列決定はシングルエンド配列決定を含むまたは該配列決定からなる。いくつかの実施形態において、配列決定はペアエンド配列決定を含むまたは該配列決定からなる。配列決定は任意且つ適宜の配列決定技法を用いて行うことができ、ここでヌクレオチドは連続的に遊離の3’水酸基に付加され、5’から3’の方向にポリヌクレオチド鎖が合成される。付加されたヌクレオチドのアイデンティティーは、好ましくはそれぞれのヌクレオチドの付加の後に特定される。あらゆる連続した塩基が配列決定されるわけではないライゲーションによる配列決定を用いる配列決定技法、及び表面上の連鎖に塩基が付加されるのではなく、該連鎖から塩基が除去される、大規模並列処理特徴配列決定(massively parallel signature sequencing)(MPSS)などの技法もまた、ピロリン酸放出の検知を用いる技法(ピロシーケンシング)であり、本発明の範囲内である。かかるピロシーケンシングに基づく技法は、ライブラリー分子由来の単一の鋳型が各ビーズ上で増幅されるように、ビーズが乳化液中で増幅された配列決定ビーズアレイに対して特に適用可能である。
本発明の方法において用いることができる特定の配列決定方法の一つは、可逆的チェインターミネーターとして作用することができる修飾ヌクレオチドの使用に基づく。かかる可逆的チェインターミネーターは、例えばWO04018497及びUS7057026に記載の、除去可能な3’保護基を含む。かかる修飾ヌクレオチドが、配列決定中の鋳型の領域に対して相補的な、生長するポリヌクレオチド鎖中に組み込まれると、更なる配列伸長に向けるために利用可能な遊離の3’−OH基が存在せず、従ってポリメラーゼは更にヌクレオチドを付加することができない。生長するポリヌクレオチド鎖中に組み込まれた塩基のアイデンティティーが特定された後、上記3’保護基が除去され、次に続くヌクレオチドの付加を可能にすることができる。これらの修飾ヌクレオチドを用いて誘導される生成物を整えることにより、DNA鋳型のDNA配列を推定することができる。上記修飾ヌクレオチドのそれぞれが、特定の塩基に対応することが知られている、各組み込みステップにおいて付加される塩基間の区別を容易にするための、該修飾ヌクレオチドに接続された異なる標識を有する場合、かかる反応は単一の実験で行うことができる。好適な標識の非限定的な例がWO/2007/135368に記載され、その内容の全体が参照により本明細書に組み込まれる。あるいは、個々に添加された上記修飾ヌクレオチドのそれぞれを含み、別個の反応が行われてもよい。
上記修飾ヌクレオチドは、それらの検知を容易にするための標識を有していてもよい。特定の実施形態において、上記標識は蛍光標識である。各ヌクレオチドの種類が異なる蛍光標識を有する。但し、上記検知可能な標識は蛍光標識である必要はない。当該ヌクレオチドのDNA配列中への組み込みの検知を可能にする任意の標識を用いることができる。蛍光標識されたヌクレオチドの検出方法の一つは、標識されたヌクレオチドに特異的な波長のレーザー光を用いること、または他の適宜の照射源の使用を含む。組み込まれたヌクレオチド上の標識からの蛍光は、CCDカメラまたは他の適宜の検知手段によって検知することができる。好適な検知手段がWO/2007/123744に記載され、その内容の全体が参照により本明細書に組み込まれる。
いくつかの実施形態において、第1の配列決定反応は、固体担体に接続されたオリゴヌクレオチド中に含まれる開裂部位における開裂によって生じる3’末端から進行し、該オリゴヌクレオチドは架橋増幅の間に伸長されている。いくつかの実施形態において、上記開裂した連鎖は、上記接続されたオリゴヌクレオチドの伸長による配列決定の前に、その相補的な連鎖から分離される。いくつかの実施形態において、新たな連鎖が伸長されながら開裂した連鎖が置換されるように、開裂によって生じた、新たに遊離となった3’末端を有する接続されたオリゴヌクレオチドが、連鎖置換活性を有するポリメラーゼを用いて伸長される。いくつかの実施形態において、接続されたオリゴヌクレオチドの伸長は、増幅反応由来の鋳型伸長生成物の全長に沿って進行し、いくつかの実施形態において、該伸長は、最後に識別されたヌクレオチドを超える伸長を含む。いくつかの実施形態において、次に、上記鋳型伸長生成物は、固体担体に接続されたオリゴヌクレオチド中に含まれる開裂部位において開裂され、配列決定反応の間に伸長されたオリゴヌクレオチドは直線化され、遊離の第1の配列決定伸長生成物を生成する。次に、第1の配列決定生成物の5’末端は、第2の配列決定反応のための鋳型の役目を果たし、第2の配列決定反応は(本明細書記載の配列決定プライマーなどの)配列決定プライマーの伸長により、または開裂部位における開裂によって生じた3’末端からの伸長により進行することができる。いくつかの実施形態において、配列決定中の鋳型ポリヌクレオチドに沿って識別されるヌクレオチドの平均またはメジアン数は、約10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、300、400、500、若しくはそれを超える、それら未満、またはそれらを超える。
いくつかの実施形態において、配列決定は、少なくとも部分的に一本鎖である鋳型を生起させるために、架橋増幅生成物を処理して、実質的に全ての「架橋」構造中の固定化された連鎖の1の全てを除去する、または該連鎖の1の少なくとも一部を除去若しくは置換することを含む。従って、一本鎖である鋳型の一部は、配列決定プライマーとのハイブリダイゼーションに利用可能となる。架橋された二本鎖核酸構造中の1の固定化された連鎖の全てまたは一部を除去する過程は、本明細書において「直線化」と呼んでもよく、WO07010251に更に詳細に記載され、その内容の全体が参照により本明細書に組み込まれる。
架橋された鋳型構造は、制限エンドヌクレアーゼを用いた一方若しくは両方の連鎖の開裂によって、またはニッキングエンドヌクレアーゼを用いた一方の連鎖の開裂によって直線化し得る。化学的開裂(例えば、過ヨウ素酸塩を用いたジオール結合の開裂)、エンドヌクレアーゼ(例えば、NEB社より供給される「USER」、製品番号M5505S)を用いた開裂によるまたは熱若しくはアルカリへの曝露による脱塩基部位の開裂、その他の部分がデオキシリボヌクレオチドから構成される増幅生成物中に組み込まれたリボヌクレオチドの開裂、光化学的開裂、あるいはペプチドリンカーの開裂を始めとする他の開裂方法を、制限酵素またはニッキング酵素に対する代替手段として用いることができるが、それらに限定されない。いくつかの実施形態において、固相増幅反応が、共有結合で固定化された1種のみの増幅オリゴヌクレオチドと、それとは別の溶液中に遊離した増幅オリゴヌクレオチドとを用いて実施される場合などには、直線化ステップは回避されてもよい。開裂ステップに続いて、開裂に用いられた方法の如何に依らず、固体担体に接続されていない、開裂した連鎖(複数可)の一部分(複数可)を除去するために、開裂反応の生成物が変性条件に供されてもよい。例えば、標準的な分子生物学のプロトコル(Sambrookら、2001、Molecular Cloning、A Laboratory Manual、第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor Laboratory Press、ニューヨーク;Current Protocols、Ausubelら編)に記載されるものなどの、水酸化ナトリウム溶液、ホルムアミド溶液、または熱などの好適な変性条件は本技術分野で公知である。変性によって、部分的にまたは実質的に一本鎖である配列決定鋳型が生成する。次に、配列決定プライマーの上記鋳型の上記一本鎖部分に対するハイブリダイゼーションにより、配列決定反応を開始することができる。このように、本開示は、核酸配列決定反応が、配列決定プライマーを直線化された増幅生成物の一本鎖領域に対してハイブリダイズすること、逐次的に、1又は複数のヌクレオチドを、配列決定される増幅された鋳型鎖の当該領域に対して相補的なポリヌクレオチド鎖中に組み込むこと、1又は複数の上記組み込まれたヌクレオチド(複数可)中に存在する塩基を識別すること、及びそれによって、鋳型鎖の領域の配列を決定することを含む方法を包含する。
いくつかの実施形態において、配列決定プライマーはアダプターオリゴヌクレオチド、増幅プライマー、固体担体に接続されたオリゴヌクレオチド、またはこれらの組み合わせに由来する1又は複数の配列に対して相補的な配列を含む。いくつかの実施形態において、配列決定プライマーは配列Dまたはその一部を含む。いくつかの実施形態において、配列決定プライマーは配列Cまたはその一部を含む。配列決定プライマーは、約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチドなどの、任意且つ適宜の長さとすることができ、上記配列決定プライマーの任意の部分または全ては、上記プライマーがハイブリダイズする相当する標的配列(例えば、約5、10、15、20、25、30、35、40、45、50、若しくはそれを超える、それら未満、またはそれらを超えるヌクレオチド)に対して相補的であり得る。いくつかの実施形態において、配列決定プライマーは配列CACTCAGCAGCACGACGATCACAGATGTGTATAAGAGACAG(配列番号20)を含む。
一般的に、配列決定プライマーの伸長により配列決定伸長生成物が生成する。配列決定過程において識別される配列決定伸長生成物に付加されるヌクレオチドの数は、鋳型配列、反応条件、用いる薬剤、及び他の因子を始めとする多数の因子に依存し得る。いくつかの実施形態において、生長する配列決定プライマーに沿って識別されるヌクレオチドの平均またはメジアン数は、約10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、300、400、500、若しくはそれを超える、それら未満、またはそれらを超える。いくつかの実施形態において、配列決定プライマーは、増幅反応由来の鋳型プライマー伸長生成物の全長に沿って伸長し、いくつかの実施形態において、該配列決定プライマーは、最後に認識されたヌクレオチドを超える伸長を含む。
いくつかの実施形態において、配列決定伸長生成物を、該配列決定伸長生成物がハイブリダイズする接続された鋳型鎖から除去するために、及び上記鋳型を部分的に又は完全に一本鎖とし、第2の配列決定プライマーとのハイブリダイゼーションに利用可能とするために、該配列決定伸長生成物が変性条件に供される。第2の配列決定プライマーは第1の配列決定プライマーと同一であってもまたは異なってもよい。いくつかの実施形態において、第2の配列決定プライマーは、第1の配列決定プライマーがハイブリダイズする配列よりも、標的核酸の5’末端により近接して位置する配列に対してハイブリダイズする。いくつかの実施形態において、第2の配列決定プライマーは、第1の配列決定プライマーがハイブリダイズする配列よりも、標的核酸の3’末端により近接して位置する配列に対してハイブリダイズする。いくつかの実施形態において、第1及び第2の配列決定プライマーの一方のみがバーコード配列に沿って伸長され、それによって当該バーコード配列中のヌクレオチドを識別する。いくつかの実施形態において、一方の配列決定プライマー(例えば第1の配列決定プライマー)が、(この配列決定プライマーの伸長が当該バーコードに相補的な配列を生起しないように)バーコード由来の5’に位置する配列にハイブリダイズし、別な配列決定プライマー(例えば第2の配列決定プライマー)が、(この配列決定プライマーの伸長が当該バーコードに相補的な配列を生起するように)バーコード由来の3’に位置する配列にハイブリダイズする。いくつかの実施形態において、第2の配列決定プライマーは配列番号19を含む。
本開示は、ポリヌクレオチド鎖へのヌクレオチドの連続的な組み込みに基づく多種多様な配列決定の方法論を用いることができ、上記に概説した配列決定方法の使用に限定されることが意図されるものではない。好適な技法としては、例えば、US6306597、US20090233802、US20120053074、及びUS20110223601記載の技法が挙げられ、これらの特許はそれらの全体が参照により組み込まれる。連鎖の再合成が採用される場合においては、両方の連鎖は、後続の固定化された連鎖の一部の放出を可能にする方法で、表面に固定化されなければならない。これは、WO07010251に記載の多数の機構により達成することができ、該公報の内容はその全体が参照により本明細書に組み込まれる。例えば、一つのプライマーがウラシルヌクレオチドを含むことができ、これは当該鎖が、当該ヌクレオチド塩基を除去する酵素ウラシルDNAグリコシラーゼ(uracil DNA glycosylase)(UDG)、及び該脱塩基ヌクレオチドを切除するエンドヌクレアーゼVIIIを用いて、ウラシル塩基において開裂することができることを意味する。この酵素の組み合わせは、New England Biolabs社よりのUSER(商標)(NEB社製品番号M5505)として利用可能である。第2のプライマーは8−オキソグアニンヌクレオチドを含むことができ、これはその後酵素FPG(NEB社製品番号M0240)により開裂可能である。このプライマーの設計は、どのプライマーが過程のどの時点で開裂するか、また、クラスター中のどこで開裂が起こるかについて完全な制御を提供する。上記プライマーはまた、例えば、特定の位置における化学的開裂を可能にするジスルフィドまたはジオールによる修飾により、化学的に修飾することができる。
いくつかの実施形態において、配列決定データは、約5、10、25、50、100、150、200、250、300、400、500、750、1000、2500、5000、7500、10000、20000、50000、若しくはそれを超える、それら未満、またはそれらを超える、単一の反応容器(例えばフローセル中のチャンネル)中の試料由来の異なる標的ポリヌクレオチドに対して作成される。いくつかの実施形態において、配列決定データは、約2、3、4、5,6,7、8、9、10、11、12、13,14、15、16、17、18、19、20、24、48、96、192、384、768、1000、若しくはそれを超える、それら未満、またはそれらを超える試料などの、同時に複数の試料に関して作成される。いくつかの実施形態において、配列決定データは、約2、3、4、5,6,7、8、9、10、11、12、13,14、15、16、17、18、19、20、24、48、96、192、384、768、1000、若しくはそれを超える、それら未満、またはそれらを超える試料などの、単一の反応容器(例えばフローセル中のチャンネル)中の複数の標的ポリヌクレオチドに対して作成され、配列決定データはその後、配列決定されたポリヌクレオチドの出所である試料により分類される。単一の反応において、配列決定データは、約106、107、108、2×108、3×108、4×108、5×108、109、1010、若しくはそれを超える、または少なくともそれらの標的ポリヌクレオチドあるいは架橋増幅反応由来のクラスターに対して作成することができ、これらの配列決定データは、約104、105、106、2×106、3×106、4×106、5×106、107、108、若しくはそれを超える、それら未満、またはそれらを超える、上記反応における各試料に関する標的ポリヌクレオチドあるいはクラスターに対する配列データを含み得る。いくつかの実施形態において、試料に対して、約5、10、25、50、75、100、125、150、175、200、300、400、500、750、1000、2500、5000、7500、10000、20000、50000、若しくはそれを超える、それら未満、またはそれらを超える、必然的遺伝子変異型の存在、非存在、または遺伝子型が、上記配列決定データに基づいて特定される。1又は複数の必然的遺伝子変異体の存在、非存在、または遺伝子型が、約80%、85%、90%、95%、97.5%、99%、99.5%、99.9%若しくはそれよりも高い、またはそれらを超える精度で特定され得る。
いくつかの実施形態において、本発明の方法における1若しくは複数、または全てのステップは、1又は複数の自動装置の使用によるなど、自動化される。一般的に、自動装置は人間の指示なしで稼働することができる装置であり、自動システムは、人間が、例えばコンピュータに指示を入力することにより、作用を推進するための任意の行動をとることを完了した後、ある期間作用を行うことができ、その後、自動装置は、更なる人間の操作なしで1又は複数のステップを行う。本発明の実施形態を実施するコードを始めとするソフトウェア及びプログラムを、CD−ROM、DVD−ROM、テープ、フラッシュドライブ、若しくはディスケット、またはその他の適当なコンピュータ可読の媒体などの何らか形式のデータ保存媒体に保存することができる。本発明の種々の実施形態も、ハードウェア、またはソフトウェア及びハードウェアの組み合わせにおいて、専らに実施することができる。例えば、一実施形態において、従来のパーソナルコンピュータよりもむしろ、プログラマブルロジックコントローラ(Programmable Logic Controller)(PLC)が用いられる。当業者に公知であるように、PLCは、多目的コンピュータの費用が不要な様々なプロセス制御用途においてしばしば用いられる。PLCは1または様々な制御プログラムを実行するための公知の様式で構成することができ、パーソナルコンピュータと類似の様式で、ユーザーまたは別の装置からの入力を受け入れること及び/またはユーザーまたは別の装置へ出力を提供することができる。従って、本発明の実施形態は多目的コンピュータの見地から記載されているが、他の構成を用いることができ、多目的コンピュータの使用は代表的なものに過ぎないことが認識されるべきである。
いくつかの実施形態において、自動操作は1又は複数のリキッドハンドラー及び関連するソフトウェアの使用を含む。いくつかの市販の液体取扱いシステムを利用して、これらの過程の自動操作を行うことができる(例えば、Perkin−Elmer社、Beckman Coulter社、Caliper Life Sciences社、Tecan社、Eppendorf社、Apricot Design社、Velocity 11社を例として参照されたい。)。いくつかの実施形態において、自動化されるステップとしては、断片化、末端修復、A−テーリング(アデニンオーバーハングの付加)、アダプター連結、PCR増幅、試料の定量(例えば、DNAの量及び/または純度)、並びに配列決定の1又は複数が挙げられる。いくつかの実施形態において、増幅されたポリヌクレオチドの固体担体に接続されたオリゴヌクレオチドに対するハイブリダイゼーション、鋳型としての増幅されたポリヌクレオチドに沿った伸長、及び/または架橋増幅が自動化される(例えば、Illumina社のcBotの使用により)。架橋増幅を行うための装置の非限定的な例がWO2008002502に記載される。いくつかの実施形態において、配列決定が自動化される。多種多様な自動配列決定機が市販され、それらとしてはLife Technologies社(SOLiDプラットフォーム、及びpHに基づく検知)、Roche社(454プラットフォーム)、Illumina社(例えば、Genome Analyzer、HiSeq、またはMiSeqシステムなどのフローセルに基づくシステム)が挙げられる。2、3、4、5、またはそれを超える自動装置間(例えば、1又は複数のリキッドハンドラー、架橋増幅装置、及び配列決定装置間)の移動は、手動または自動とすることができる。いくつかの実施形態において、本発明の方法における1又は複数のステップ(例えば、全てのステップまたは全ての自動化ステップ)は、約72、48、24、20、18、16、14、12、10、9、8、7、6、5、4、3、2、1時間、若しくはそれより短い、またはそれらよりも少ない時間で完了する。いくつかの実施形態において、試料の受け入れ、DNA抽出、断片化、アダプター連結、増幅、または架橋増幅から配列決定データの提供までの時間は、約72、48、24、20、18、16、14、12、10、9、8、7、6、5、4、3、2、1時間、若しくはそれより短い、またはそれらよりも少ない時間である。
アダプターの付加、第1のプライマーの伸長、一対のプライマーを用いる増幅、標的ポリヌクレオチドの架橋増幅、及び配列決定を含む過程の実施形態の例が図12に図解される。更なる標的ポリヌクレオチドの増幅及び配列決定のための方法及び組成物がUS20140024536及びWO201401584A2に記載され、これらの両方の全体が参照により組み込まれる。
V.プローブ設計
本開示のシステム及び方法は、概括的には、本明細書において「プローブセット」として知られる、少なくとも2のプローブすなわちハイブリダイゼーション配列のセットの使用を提供する。プローブは、ポリヌクレオチド配列の遺伝子座の少なくとも2の相補的な領域に対して選択的にアニールまたはハイブリダイズする配列を含有するように設計される。一般的に、プローブセットの複数のプローブは同じ、すなわち同一のポリヌクレオチド鎖に対してアニールするように設計される。いくつかの場合において、2を超えるプローブを用いてもよい。本開示において、2のプローブが用いられる場合、プローブは「第1のプローブ」及び「第2のプローブ」と記載される。一般的に、プローブは、試料ポリヌクレオチドに対するハイブリダイゼーションの前には、別個の、非連続のオリゴヌクレオチドとして存在していてもよい。他の場合には、試料ポリヌクレオチドに対するハイブリダイゼーションの前の分子反転プローブ(MIP)または錠型プローブに見られるように、1または複数のプローブがリンカー配列によって繋がれていてもよい。一般的に、プローブは一本鎖のポリヌクレオチド分子を含む。いくつかの場合において、プローブはDNAを含む。一般的に、プローブは人工的な配列、または試料ポリヌクレオチド中には元々存在しないヌクレオチド種を含む配列である。
2のハイブリダイゼーション配列のプローブセットの場合、第1及び第2のプローブは一般的に、試験される遺伝子座または領域に対応するポリヌクレオチド配列中の標的エレメントに対してハイブリダイズまたはアニールするように設計される。いくつかの場合において、上記標的エレメントは、遺伝子座配列のgDNA中に見られるような配列であってよい。いくつかの場合において、上記標的エレメントは、mRNA転写物またはcDNA配列中に見られる配列であってよい。いくつかの場合において、上記標的エレメントは、アダプター配列であってよく、該アダプター配列はポリヌクレオチドの末端に接続されて(すなわち、連結されて、接合されて等々)いてもよく、当該ポリヌクレオチドの配列中に元々は存在しないものであってよい。アダプター配列は、ハイブリダイゼーションに先立つステップにおいて、本明細書記載の本技術分野で公知の任意且つ適宜の方法を用いて、ポリヌクレオチドまたはポリヌクレオチドの断片に接続されてもよい。一例において、第1または第2のプローブは、遺伝子座に対応するポリヌクレオチドに接続された1または複数のアダプター配列に対してアニールまたはハイブリダイズするように設計されてもよい。
いくつかの場合において、1または複数のプローブは、遺伝子座中の配列に対して、約10%〜30%、30%〜60%、60%〜90%、または90%〜99.99%相補的であってよい。いくつかの場合において、1または複数のプローブは、遺伝子座中の配列に対して、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、99.99%相補的であってよい。いくつかの場合において、プローブは、遺伝子座中の配列に対して、最大で約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、99.99%相補的であってよい。
いくつかの場合において、1または複数のプローブは、一塩基多型(single nucleotide polymorphism)(SNP)を選択的に検知するように設計されてもよい。いくつかの場合において、2の異なるプローブセット(本明細書記載のように、各プローブセットは異なるバーコードが割り当てられる)が、同じ遺伝子座中の同一の領域に用いられてもよい。上記2のプローブセットは、1の異型SNP配列を含む一方のプローブセットが上記遺伝子座に対してハイブリダイズすることができる一方で、別な異型SNP配列を含有する他方のプローブセットは当該遺伝子座に対してハイブリダイズすることができないように、遺伝座中の想定されるSNPを検知するように設計されてもよい。上記多型は、上記SNPを有するプローブセット中の特定のプローブがうまくハイブリダイズすること、及びそれぞれのプローブセットに割り当てられたバーコード配列の計数を通じて検知することができる。いくつかの場合において、SNPの検知のための1または複数の可変の塩基は、第1のプローブ、第2のプローブまたは両方のプローブの3’末端に位置することができる。いくつかの場合において、SNPの検知のための1または複数の可変の塩基は、第1のプローブと第2のプローブとの間の意図するライゲーション点の近傍に位置することができる。
更に、本開示のシステム及び方法は、全ゲノム全体にわたる最適なプローブの選択を可能にし得る任意且つ適宜のアルゴリズムを提供する。アルゴリズムは、遺伝子座内での最適な配列を推奨すること、該プローブ配列の長さを推奨すること、並びにハイブリダイゼーションに関する一般的な最適パラメータ(すなわち、温度、塩濃度等々)を提供することなどの、プローブの設計またはプローブの選択を支援する。いくつかの場合において、アルゴリズムは、染色体中の特定の遺伝子座、または複数の染色体中の1若しくは複数の着目する遺伝子座を選択するために用いてもよい。
いくつかの場合において、第1及び第2のプローブは、長さにおいて、約5〜50、50〜100、100〜200、200〜300、300〜400、または400〜500塩基対であってよい。いくつかの場合において、第1及び第2のプローブは、長さにおいて、少なくとも約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、300、400または500塩基対であってよい。いくつかの場合において、第1及び第2のプローブは、長さにおいて、最大で約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、300、400または500塩基対であってよい。
更に、第1及び第2のプローブは、ポリヌクレオチド配列の同一の連鎖上の隣接する部位を結合するように設計されてもよい。いくつかの場合において、ギャップ、すなわちプローブがそこにアニールまたはハイブリダイズしていない一本鎖の試料配列の領域が、第1及び第2のプローブの間に存在する。いくつかの場合において、第1及び第2のプローブが、本明細書に記載のように直接連結され得るように、第1及び第2のプローブの結合部位の間にギャップが存在しない。いくつかの場合において、上記ギャップは、長さにおいて、約1〜25bp、25〜50bp、50〜100bp、100〜500bp、500〜1Kb、lKb〜2Kb、2Kb〜3Kb、3Kb〜4Kb、または4Kb〜5Kbであってよい。いくつかの場合において、上記ギャップは、長さにおいて、少なくとも約1bp、2bp、3bp、4bp、5bp、10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、75bp、100bp、125bp、150bp、175bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1Kb、2Kb、3Kb、4Kb、5Kb、または10Kbであってよい。いくつかの場合において、上記ギャップは、長さにおいて、最大で約1bp、2bp、3bp、4bp、5bp、10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、75bp、100bp、125bp、150bp、175bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、2kb、3kb、4kb、5kb、または10kbであってよい。
一般的に、用いられるプローブセットの数は、試料中の試験される遺伝子座の数によって特定することができる。いくつかの場合において、約2〜100、100〜500、500〜1000、1000〜2000、2000〜3000、3000〜4000、4000〜5000、5000〜6000、6000〜7000、7000〜8000、8000〜9000、または9000〜10000のプローブセットを用いることができる。いくつかの場合において、少なくとも約2、3、4、5,6,7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、または10000のプローブセットを用いることができる。いくつかの場合において、最大で、約2、3、4、5,6,7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、または10000のプローブセットを用いることができる。
更に、いくつかの場合において、約2〜100、100〜500、500〜1000、1000〜2000、2000〜3000、3000〜4000、4000〜5000、5000〜6000、6000〜7000、7000〜8000、8000〜9000、または9000〜10000のプローブを、単一の遺伝子座を試験するために用いることができる。いくつかの場合において、少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、または10000のプローブを、単一の遺伝子座を試験するために用いることができる。いくつかの場合において、最大で、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、または10000のプローブを、単一の遺伝子座を試験するために用いることができる。
VI.着目する遺伝子座及び遺伝子変異
本開示のシステム及び方法は、ゲノム中の1または複数の遺伝子座の試験を提供する。一般的に、遺伝子座は試料中の任意の着目する配列を含んでもよい。いくつかの場合において、遺伝子座は「着目する遺伝子座」と記載してもよく、これは一般的に、本明細書で更に述べるように、遺伝子変異を有することが想定される遺伝子座をいう。本開示のいくつかの態様において、少なくとも1の着目する遺伝子座及び該着目する遺伝子座外の遺伝座が試験される。いくつかの場合において、遺伝子座または着目する遺伝子座は、試料中の任意且つ適宜の配列であってよい。遺伝子座または着目する遺伝子座としては、染色体、遺伝子、エキソン、イントロン、イントロン−エキソン境界、プロモーター、ターミネーター、高度に反復性の配列、LTR、UTR、サテライト配列、動原体反復配列、テロメア、非コード配列、コード配列、レギュレーター、プラスミド、転写因子結合部位、リボソーム結合部位、5’キャップ、ポリd(T)配列後成的配列、可動要素、トランスポゾンまたはそれらの組み合わせを挙げることができるが、それらに限定されない。いくつかの場合において、遺伝子座は細胞中の任意のポリヌクレオチド配列中に存在してもよい。ヒトなどのいくつかの場合において、遺伝子座は、ミトコンドリアgDNA、1番染色体、2番染色体、3番染色体、4番染色体、5番染色体、6番染色体、7番染色体、8番染色体、9番染色体、10番染色体、11番染色体、12番染色体、13番染色体、14番染色体、15番染色体、16番染色体、17番染色体、18番染色体、19番染色体、20番染色体、21番染色体、22番染色体、X染色体またはY染色体の全配列または部分的配列を含むことができる。
いくつかの場合において、約2〜100、100〜500、500〜1000、1000〜2000、2000〜3000、3000〜4000、4000〜5000、5000〜6000、6000〜7000、7000〜8000、8000〜9000、または9000〜10000の遺伝子座を、試料中で試験することができる。いくつかの場合において、少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、または10000の遺伝子座を、試料中で試験することができる。いくつかの場合において、最大で、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、または10000の遺伝子座を、試料中で試験することができる。
いくつかの場合において、遺伝子座は、あるプローブの相対的な結合親和性に基づいて、または本明細書において更に述べるように、ある疾患との関連に基づいて、選択的に選ぶことができる。例えば、自閉症などの疾患と関連することが知られている多数の遺伝子座を選択し、試験することができる。いくつかの場合において、遺伝子座の試験は同時にまたは逐次的に行うことができる。いくつかの場合において、多数の疾患に関する多数の遺伝子座を選択し得る。1または複数の遺伝子座の試験を同時にまたは逐次的に行うことができる。例えば、自閉症に関連する遺伝子座及びトリソミー21に関連する遺伝子座を同時に試験し得る。別な例において、コピー数多型を含む可能性のある21番、18番及び13番などの特定の染色体に関して、1または複数の遺伝子座を選択してもよい。他の場合において、ゲノム全体にわたる配列を代表するように遺伝子座を選択してもよく、遺伝子座は1または複数の既知の疾患と関連しないものであってもよい。
更に、いくつかの場合において、遺伝子座内で、多型性配列を標的とするようにプローブを選択してもよい。いくつかの場合において、多型性配列はSNPを含有してもよい。他の場合において、多型性配列はSNPを含有しなくてもよい。いくつかの場合において、遺伝子座内で、非多型性配列を標的とするようにプローブを選択してもよい。
本開示のシステム及び方法は様々な種類の遺伝子変異の検知を提供し、該変異は遺伝子座または着目する遺伝子座中に存在してもしなくてもよい。本明細書において、「遺伝子変異」、「遺伝子異常」及び「染色体異常」は互換的に用いられる。いくつかの場合において、遺伝子変異はCNVであってもよい。他の場合において、遺伝子変異はヘテロ接合性消失(loss of heterozygosity)(LOH)であってもよい。一般的に、遺伝子変異としては、再配列、サブテロメア再配列、異数性、部分的異数性、倍数性、染色体不安定性、変異、希な変異、コピー数多型、塩基転換、転座、反転、インデル、欠失、染色体構造変異、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸化学修飾における異常変化、後成的パターンの異常変化、核酸メチル化における異常変化、ウィルス挿入、寄生性DNA挿入、縦列反復における変異、感染及びガンを挙げることができるが、これらに限定されない。
VII.バーコード及び追加の配列
いくつかの例において、プローブセットにプローブすなわちハイブリダイゼーション配列との組み合わせで追加の配列が存在する。一般的に、バーコード配列、アダプター配列、ユニバーサルプライマー配列及び他のリンカー配列が、第1及び/または第2のプローブに結合してもよい。
MIPまたは錠型プローブによって供給されるなどの、第1及び第2のプローブが結合される場合、バーコード配列、アダプター配列、ユニバーサルプライマー配列及び他のリンカー配列は、2のプローブを結合する連続したループ化領域中に存在し得る。プローブが直鎖のままである他の場合において、追加の配列はいずれかのプローブの5’領域の非相補的領域中に存在し得る。
A.分子状バーコード化プローブセット
本開示のシステム及び方法はまた、プローブ配列に識別子を割り振ることも可能にする。識別子の割り振りは、ポリヌクレオチド試料連鎖に結合する特定のプローブ配列のその後の識別を可能にするためのタグ付け、追跡、またはバーコード化を可能にすることができる。識別子の割り振りはまた、識別子の定量または計数手段及びその後の試料中の遺伝子座の計数手段も提供し得る。
いくつかの場合において、識別子はオリゴヌクレオチドバーコード配列であってよい。いくつかの例において、プローブセットに結合したバーコード配列のアイデンティティーは、ハイブリダイゼーション及び下流の分析への当該プローブセットの使用の前に知ることができる。いくつかの場合において、下流のステップにおけるバーコード配列のコピー数の計数が、試料中の結合したプローブのコピー数を表わし得るように、バーコード配列がプローブ配列を表してもよい。更に、結合したプローブのコピー数は、遺伝子座または着目する遺伝子座中に存在する配列のコピー数を表わすことができる。いくつかの場合において、バーコードのコピー数は、プローブのコピー数及びそれに続いて着目する遺伝子座中の配列のコピー数に直接比例し得る。いくつかの場合において、バーコードのコピー数は、プローブのコピー数または着目する遺伝子座中の配列のコピー数に等しくなり得る。従って、バーコード、プローブ、またはそれらの組み合わせの計数が、遺伝子座中の特定の配列のコピー数を特定するために用いられてもよい。
バーコード配列の識別及び計数が、本明細書に更に述べられるような種々の技法を用いて行われてもよい。例えば、本明細書に更に述べられるように、配列決定を用いてバーコードを計数してもよい。
更に、いくつかの場合において、完全に固有のバーコード配列が個々のプローブセットに割り振られてもよい。この場合、プローブセット中の1または複数のプローブに固有のバーコード配列を接続してもよい。いくつかの場合において、1のプローブセットが1の遺伝子座を試験するために設計されてもよい。固有のバーコード配列の検知及び計数は、対応する遺伝子座のアイデンティティー及び存在量を提供する。
いくつかの場合において、固有のバーコードは様々な配列の組み合わせから形成することができる。いくつかの場合において、非固有のバーコードに、プローブ配列、プローブ配列の一部またはプローブに結合した追加の配列などの追加の配列を結合して、固有のバーコード配列を形成してもよい。例えば、プローブ配列が単独または非固有のバーコード配列との組み合わせで用いられる場合、プローブ配列の開始(始まり)部分及び終点(終わり)部分に固有の配列を形成することができる。配列を組み合わせることにより(すなわち、プローブ配列及び非固有のバーコード配列)、固有の識別配列を提供することができる。例えば、いくつかの場合において、バーコードは一般構造5’XXXXYYYY、但しXは、それらに限定されないが、第1及び/または第2のプローブ/ハイブリダイゼーション配列、アダプター配列、ユニバーサルプライミング配列、またはリンカー配列を始めとする配列より選択される1の配列に対して相補的な、可変長さの領域である、によって設計することができる。Yは可変の長さの非固有のバーコード配列より選択することができる。いくつかの場合において、Y配列は試料中の全てのプローブセットに対して共通であってもよい。他の場合において、Y配列は、染色体全体、または特定の疾患若しく遺伝子型に関連した遺伝子座などの、固有の1の遺伝子座または複数の遺伝子座であってもよい。いくつかの場合において、XまたはYのいずれかとして規定されるヌクレオチドの長さすなわち数は、約1〜20、20〜50、50〜75、75〜100、100〜150、150〜200、200〜300、300〜400、または400〜500のヌクレオチドであってよい。いくつかの場合において、XまたはYのいずれかとして規定されるヌクレオチドの長さすなわち数は、少なくとも約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75、100、125、150、175、200、300、400、または500のヌクレオチドであってよい。いくつかの場合において、XまたはYのいずれかとして規定されるヌクレオチドの長さすなわち数は、最大で約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75、100、125、150、175、200、300、400、または500のヌクレオチドであってよい。
別な構成において、バーコードは少なくとも約1、2、3、4、5、6、7、8、9または10の配列の組み合わせによって形成されてもよい。バーコードは最大で約1、2、3、4、5、6、7、8、9または10の非固有の配列の組み合わせによって形成されてもよい。
本開示のシステム及び方法の別な構成において、非固有のバーコード配列が、1または複数のプローブセットに割り振られてもよい。例えば、同一のバーコードが、同じ遺伝子座に対して相補的であるプローブに割り振られてもよい。いくつかの場合において、上記遺伝子座は染色体領域であってもよい。他の場合において、遺伝子座は全体の染色体であってよく、ここで、同じ染色体の多数の領域に対してハイブリダイズするように設計されたプローブセットには、同一のバーコード配列が割り振られてもよい。この例において、バーコード配列は、特定の染色体に関しては固有であるが、同じ染色体上の遺伝子座に対しては同一であってよい。例えば、一つの特定のバーコード(「A」)が、例えば21番染色体などの着目する遺伝子座に対して設計されたプローブまたはプローブセットに割り振られる一方で、異なる配列(「B」)の別なバーコードが、別な着目する遺伝子座、18番染色体に対して設計されたプローブに割り振られてもよい。更に、基準を提供するために、第3のバーコード(「C」)が、21番染色体または2番染色体のいずれかの外の遺伝子座に割り振られてもよい。バーコードA、B及びCの計数、及び計数されたA〜C及びB〜Cのリードの比較を、21番染色体または18番染色体のいずれかの全体としてのコピー数多型などの遺伝子変異を検知するために用いることができる。
加えて、共通のバーコード配列が、疾患または病態に関連する1または複数の遺伝子座に割り振られもよい。例えば、一つのバーコード配列(「X」)が、嚢胞性線維症に関連する1または複数の遺伝子座に対して相補性の1または複数のプローブに割り振られる一方で、別なバーコード(「Y」)が、ダウン症候群に関連する遺伝子座に対して設計されたプローブに割り振られてもよい。第3のバーコード(「Z」)が、いずれの疾患とも関連しない遺伝子座を検知するために設計されたプローブに割り振られてもよい。バーコードX、Y及びZの計数、及び計数されたX〜Z及びY〜Zのリードの比較を、単一のアッセイにおいて、いずれかの疾患の遺伝子変異を検知するために用いることができる。いくつかの場合において、特定の疾患に関連する遺伝子座は、多数の染色体にわたって存在し得る。この様式において、1または複数の疾患に関連する1または複数の遺伝子座を同時に試験することができる。あるいは、1または複数の疾患に関連する1または複数の遺伝子座を逐次的に試験することができる。
いくつかの場合において、上記バーコード配列は、約1〜10、10〜20、20〜50、50〜100、100〜500、または500〜1000の塩基対であってよい。いくつかの場合において、上記バーコード配列は、各バーコードが少なくとも約1、2、3、4、5、6、7、8、9、10、20、50、100、500、または1000の塩基対となるような、様々な長さであってよい。他の場合において、上記バーコード配列は、1、2、3、4、5、6、7、8、9、10、20、50、100、500、または1000未満の塩基対を含んでもよい。
B.プローブセットへのバーコードの割り振り
多くの場合、本明細書記載のように、プローブセットに割り振られる識別子は、プローブセット中の第1または第2のプローブと連続したオリゴヌクレオチドバーコード配列である。但し、いくつかの場合において、異なる識別子を用いることができる。バーコード配列を有するものとしての識別子は、固有又は非固有であってよい。例えば、いくつかの場合において、上記固有の識別子はハイブリダイゼーションプローブであってもよい。一例において、ハイブリダイゼーションプローブはオリゴヌクレオチド配列及び蛍光エレメント(すなわち、ナノ粒子、ナノプローブ、量子ドット等)などの追加の成分を含んでもよい。いくつかの場合において、1または複数の蛍光エレメントが同様にバーコードとして記載され得る。例えば、異なる波長すなわち色の蛍光エレメントが固有または非固有のパターンまたは配列において配置されてもよい。他の場合において、識別子は色素であり、この場合、接続は色素の分析物分子へのインターカレーション(DNA若しくはRNAへのインターカレーションなど)または当該色素で標識されたプローブへの結合を含むことができる。更に別な場合において、識別子は核酸オリゴヌクレオチドであってもよく、この場合、ポリヌクレオチド配列への接続はオリゴヌクレオチドと当該配列との間のライゲーション反応またはPCRによる組込みを含んでもよい。他の場合において、上記反応は、金属同位体の付加を含んでもよく、ここで、第1または第2のプローブのいずれかが該同位体で標識される。
識別子がバーコード配列を含む場合、本開示のシステム及び方法は、バーコードのプローブへの割り振りに必要な任意且つ適宜の薬剤を提供する。いくつかの場合において、ライゲーション反応を利用してもよく、ライゲーション反応においては、それらに限定されないが、リガーゼ酵素、プローブ、緩衝液、アダプターオリゴヌクレオチド、及び複数の識別子DNAバーコードを始めとする薬剤を、プローブセットを生起させるために用いてもよい。濃縮法の場合には、それらに限定されないが、複数のPCRプライマー、プローブ、オリゴヌクレオチド含有バーコード配列、DNAポリメラーゼ、DNTP、及び緩衝液等を始めとする薬剤をプローブセットの調製に用いてもよい。
VIII.ハイブリダイゼーション及びライゲーション
一般的に、プローブセットを試料ポリヌクレオチドに対してハイブリダイズさせるために、任意且つ適宜の条件を用いることができる。いくつかの例において、第1及び第2のプローブは逐次的にアニールする。他の例において、第1及び第2のプローブは同時にアニールする。いくつかの場合において、プローブはハイブリダイゼーション反応混合物に逐次的に添加されてもよい。いくつかの場合において、プローブは、複数のプローブが連結されたMIPプローブまたは錠型プローブを用いるなど、ハイブリダイゼーション反応混合物に同時に添加されてもよい。第1及び第2のプローブを結合すると、特にMIP構成または錠型構成で用いられる場合に、一般的に結合の選択性が高まる。一般的に、本開示においてこの構成を用いると、プローブの非特異的結合が低減される。塩濃度、温度、ポリヌクレオチド濃度、pH等々などのハイブリダイゼーション条件を変更することもまた、試料DNAに対するプローブの非特異的な結合を低減するために用いることができる。
一般的に、ハイブリダイゼーションの後に、第1及び第2のプローブが連結されてライゲーション生成物を形成する。一般的に、ライゲーション生成物は人工的な配列、または試料ポリヌクレオチドには元々存在しないヌクレオチド種を含む配列を含む。
いくつかの例において、プローブが試料ポリヌクレオチドに対してハイブリダイズする際に、プローブの間にギャップが存在しないように、プローブを、互いに直接隣接する部位にハイブリダイズするように設計してもよい。この場合、リガーゼの添加は、第1及び第2のプローブ間の連続したライゲーション生成物を十分に形成させる。2の非連続なプローブを伴う場合には、ライゲーション生成物は連続する直鎖ポリヌクレオチドである。MIPプローブまたは錠型プローブを伴う場合には、本技術分野において公知であるように、第1及び第2のプローブのライゲーションにより、完全に環状の連続する配列が創出される。
他の例において、第1及び第2のプローブは直接隣接しなくてもよく、その場合は本明細書記載のように、プローブ間にギャップが存在する。いくつかの場合において、ライゲーションは、本明細書記載の、ポリメラーゼ及び/または架橋オリゴヌクレオチドを用いるプライマー伸長ステップなどの、更なるステップによって進行させても、または該ステップを伴ってもよい。
A.ポリメラーゼによる伸長ステップ
いくつかの構成において、第1及び第2のプローブは、更なるステップを必要とするように位置してもよい。第1及び第2のプローブが互いに直接隣接していないいくつかの例においては、伸長ステップが必要となる場合がある。いくつかの場合において、ポリメラーゼ及びdNTPを、相補的な配列を重合して2のプローブ間のギャップを埋めるために用いてもよく、その場合には、第1のプローブの3’末端からの配列は上記ギャップを横断して伸長する。いくつかの例において、この構成が有用となる場合があり、そこでは、第1及び第2のプローブに対する最適なアニーリング部位は互いに直接隣接しなくてもよい。いくつかの場合において、伸長ステップもまた有用となる場合があり、そこでは、結合パートナーが、重合した相補的な配列中のポリヌクレオチド生成物中に組み込まれ得る。例えば、ビオチンなどの結合パートナーと接合したdNTPを用い、ビオチン化dNTPがライゲーション生成物中に組み込まれるようにしてもよい。これは、後続のステップにおける、ストレプトアビジンなどの更なる結合パートナーを用いる生成物のアフィニティー精製に対して有用となる場合がある。アフィニティー精製は、本明細書記載の、連続するライゲーション生成物の試料DNA若しくはgDNAからの分離またはあるライゲーション生成物の濃縮などの種々のステップにおいて有用となり得る。
B.架橋オリゴ
いくつかの構成において、架橋オリゴは、第1及び第2のプローブとの組み合わせで用いることができる。一般的に、架橋オリゴは、遺伝子座または着目する遺伝子座中の第1または第2のプローブのいずれかにアニールする領域の間に存在する配列に結合することができるポリヌクレオチド配列を含み得る。いくつかの場合において、10の架橋オリゴが用いられ得る。いくつかの場合において、少なくとも約1、2、3、4、5、6、7、8、9または10の架橋オリゴが用いられる。いくつかの場合において、最大で約1、2、3、4、5、6、7、8、9または10の架橋オリゴが用いられる。1または複数の架橋オリゴは、互いに及び/または第1若しくは第2のプローブのいずれかの添加と逐次的または同時に添加することができる。
架橋オリゴは、着目する遺伝子座中の第1または第2のプローブのいずれかにアニールする領域の間に存在する任意の配列に対して相補的であってもよい。いくつかの場合において、架橋オリゴは、A/TまたはG/C SNPを含有する領域にアニールしてもよい。他の場合において、架橋オリゴは、着目する遺伝子座中の配列に対して100%相補的であってもよい。いくつかの場合において、架橋オリゴは、第1または第2のプローブのいずれかにアニールする領域の間に存在する配列に対して、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%または99.99%相補的であってよい。いくつかの場合において、架橋オリゴは、第1または第2のプローブのいずれかにアニールする領域の間に存在する配列に対して、最大で約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%または99.99%相補的であってよい。
いくつかの場合において、架橋オリゴは、長さにおいて、約5〜50、50〜100、100〜200、200〜300、300〜400、または400〜500塩基対であってよい。いくつかの場合において、架橋オリゴは、長さにおいて、少なくとも約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、300、400または500塩基対であってよい。いくつかの場合において、架橋オリゴは、長さにおいて、最大で約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、300、400または500塩基対であってよい。
いくつかの場合において、架橋オリゴはまた、更なる配列も含有し得る。いくつかの場合において、架橋オリゴは、縮重プライマーであってもよく、または縮重プライミング配列を含有してもよい。いくつかの場合において、架橋オリゴは、ユニバーサルプライミング配列を含んでもよい。
いくつかの場合において、架橋オリゴヌクレオチドは、着目する遺伝子座内の第1または第2のプローブのいずれかと任意且つ適宜の間隔をおいた領域にアニールすることができる。いくつかの場合において、当該オリゴと第1または第2のプローブのいずれかとの間に空間がないように、架橋オリゴは、第1または第2のプローブのいずれかに直接隣接してもよい。いくつかの場合において、架橋オリゴと第1または第2のプローブのいずれかとの間に存在する空間は、長さにおいて、少なくとも約1bp、2bp、3bp、4bp、5bp、10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、75bp、100bp、125bp、150bp、175bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1Kb、2Kb、3Kb、4Kb、5Kb、または10Kbであってよい。いくつかの場合において、架橋オリゴと第1または第2のプローブのいずれかとの間に存在する空間は、長さにおいて、最大で約1bp、2bp、3bp、4bp、5bp、10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、75bp、100bp、125bp、150bp、175bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1Kb、2Kb、3Kb、4Kb、5Kb、または10Kbであってよい。
非結合架橋オリゴを除去するための1又は複数のステップを用いてもよい。いくつかの場合において、このステップは洗浄ステップを含んでもよい。他の場合において、このステップはアフィニティー精製ステップまたはそれらの組み合わせを含んでもよい。
連続したライゲーション生成物は任意且つ適宜の方法を用いて形成することができる。架橋オリゴと第1または第2のプローブのいずれかとの間に空間がない一構成において、結合したオリゴヌクレオチドは一つのステップで連結することができる。本開示のシステム及び方法の別な構成において、架橋オリゴは、第1または第2のプローブのいずれにも直接隣接しない相補的な領域にアニールしてもよい。ある場合において、ポリメラーゼ及びdNTPを用いて架橋オリゴ、第1若しくは第2のプローブまたはそれらの組み合わせから配列を伸長させるように、伸長ステップが行われてもよい。いくつかの場合において、ポリメラーゼ及びdNTPを、第1のプローブと架橋オリゴとの間、架橋オリゴと第2のプローブとの間またはそれらの組み合わせのギャップを埋めるために用いてもよい。伸長に続いて、結合したオリゴは連結されて、遺伝子座または着目する遺伝子座を架橋する、連続するポリヌクレオチド生成物を形成してもよい。
加えて、プライマーの伸長におけるポリメラーゼの使用及び第1のプローブ、第2のプローブまたは1若しくは複数の架橋オリゴのハイブリダイゼーションを一つの反応混合物にまとめることができる。他の場合において、1又は複数のステップを逐次的に行ってもよい。
IX.結合したプローブの単離
ライゲーション後に、結合したプローブを非結合のプローブから分離することが一般的に好ましい。一構成において、結合したプローブは、結合パートナーの組み合わせを用いてアフィニティー精製されてもよい。一例において、プローブ、プローブに結合した配列(すなわち架橋オリゴ)、プライマー伸長生成物、または試料ポリヌクレオチド鎖に連結したアダプター配列は、ビオチンなどの結合パートナーを含有してもよい。次に、該結合パートナーは、アフィニティー精製ステップにおいて、ストレプトアビジンなどの更なる結合パートナーのためのベイトとして用いることができる。いくつかの場合において、結合したプローブが非結合プローブからアフィニティー精製されてもよい。他の場合において、結合パートナー及び結合したプローブを含む試料ポリヌクレオチド鎖が、非結合プローブからアフィニティー精製されてもよい。
一般的に、結合したプローブを捕捉するための任意の化学的手段が好適であり得る。いくつかの場合において、捕捉はビオチン及びストレプトアビジンまたはストレプトアビジン誘導体を含む方法によって行うことができる。例えば、本開示の一実施形態は、ビオチン化ヌクレオチドがプライマー伸長ステップまたは後続の増幅ステップの間に組み込まれ得るポリヌクレオチドの捕捉を提供する。いくつかの場合において、ヌクレオチド及びビオチン化ヌクレオチドの混合物であって、少なくとも1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%または100%ビオチン化ヌクレオチドであってよい上記混合物が用いられてもよい。他の場合において、上記混合物は最大で1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%または100%ビオチン化ヌクレオチドであってよい。
本開示のシステム及び方法の別な構成において、非結合プローブがエキソヌクレアーゼによって分解されてもよい。例えば、ライゲーション後に、MIPプローブまたは錠型プローブが完全に環状になる一方で、非結合プローブは連続したものにならず、直鎖状のまま残る。エキソヌクレアーゼI、II、またはIIIなどのエキソヌクレアーゼの添加が用いられ、非結合ポリヌクレオチドプローブなどの直鎖状ポリヌクレオチドを選択的に分解することができる一方で、完全に環状化されたプローブは影響を受けないまま残る。エキソヌクレアーゼ処理後に、結合した環状プローブは試料ポリヌクレオチドより溶離することができる。いくつかの場合において、溶離は、塩を用いるなどの任意選択の洗浄ステップによって行うことができる。他の場合において、結合されたプローブは、本技術分野で公知のように、熱的手段(すなわち、反応混合物の温度を高める)によって試料ポリヌクレオチド鎖からメルトオフ(melt off)することができる。
X.配列の識別及び計数
本開示の方法は、概括的にはライゲーション生成物の単離並びに該ライゲーション生成物中の1又は複数の配列の識別及び計数を提供する。いくつかの場合において、配列の識別及び計数はバーコード配列が関与する。他の場合において、上記配列の識別及び計数は、ユニバーサルアダプター配列、ユニバーサルプライミング配列、リンカー配列、プローブ配列すなわちハイブリダイゼーション配列の一部又は、いくつかの場合、それらの配列の組み合わせなどの他の配列が関与する。
概括的には本開示の方法は、1又は複数の選択的増幅ステップを提供し、ここで配列特異的プライマーを、標的分子(すなわちライゲーション生成物またはプローブ)中の特定の配列を増幅すなわち濃縮するために用いてもよい。いくつかの場合において、増幅は詳細には、バーコード特異的プライマーを用いて、バーコード配列を対象とする。いくつかの場合において、バーコードは、バーコード配列に隣接するように設計されたユニバーサルプライマーを用いて増幅されてもよい。
増幅後に、配列決定、定量的PCR(qPCR)及び他の本技術分野で公知の定量的方法などの方法を始めとする様々な方法を、配列を識別及び計数するために用いることができる。本開示の方法は、バーコードなどの、様々な選択的に増幅された配列の大規模並列配列決定に特に好適であり、該大規模並列配列決定においては、配列の識別及び計数の両方が行われる。
概括的には、本開示の方法及びシステムは、US7,537,897のシステム及び方法を、分子をカウントするための分子状バーコードに利用してもよい。
A.ライゲーション生成物の直接計数
本開示のいくつかの例において、ライゲーション生成物を直接計数する及び識別することが好適であり得る。いくつかの場合において、適宜の感度及び選択性を有する技法を用いることができる。いくつかの場合において、ライゲーション生成物の直接的な計数及び識別は、本明細書記載の、本技術分野で公知の方法を用いる直接的な配列決定を伴ってもよい。ライゲーション生成物の配列を、プローブ配列、バーコード、アダプター配列、ユニバーサルプライミング配列、リンカー配列またはそれらの組み合わせを識別するために用いることができる。配列はまた、配列リード数に基づいて計数することもできる。
いくつかの場合において、1又は複数の定量化可能なハイブリダイゼーションプローブが、種々の部位においてライゲーション生成物に結合してもよい。いくつかの場合において、上記プローブは、1又は複数のプローブすなわちハイブリダイゼーション配列、バーコード配列、アダプター配列、リンカー配列、またはそれらの組み合わせにアニールするように設計されてもよい。いくつかの場合において、上記プローブ配列は更に、定量することができ、試験試料中に存在するプローブ配列の数に相関する発蛍光団または蛍光シグナルに接続されてもよい。例えば、Nanostring社nCounterシステムなどの本技術分野におけるある製品を、ナノ粒子を含む一連の蛍光バーコードに接合されたDNAハイブリダイゼーションプローブを含む系を用いて、プローブ数を計数するために用いてもよい。上記システムは、高い感度でプローブを計数するために、ナノ粒子バーコードを利用する。更に、他の場合において、ライゲーション生成物にハイブリダイズする更なるプローブが、本明細書記載の方法により直接配列決定され、配列決定リード数に基づいて計数されてもよい。
ライゲーション生成物の量が十分な量でないいくつかの場合において、鋳型として一本鎖のライゲーション生成物を用いて、選択的な増幅を行なうこともできる。プライマーは、プローブ配列、アダプター配列、バーコード、ユニバーサルプライミング部位またはそれらの組み合わせに対して設計されてもよい。増幅ストラテジー及びプライマーセット設計の方法論は本明細書に更に記載される。いくつかの場合において、一本鎖のライゲーション生成物から増幅されたPCR生成物は、直接的な配列決定または他の適宜の定量的方法を始めとする種々の技法を用いた識別及び計数に用いられてもよい。
B.ライゲーション生成物の第2の連鎖合成
二本鎖のライゲーション生成物を得ることが好ましいいくつかの場合において、後続の第2の連鎖の合成ステップは、図4に示すように行われてもよい。いくつかの場合において、単一のプライマー428を、一本鎖のライゲーション生成物に相補的な連鎖424を合成するために用いてもよい。この場合、単一のプライマーは、上記ライゲーション生成物上の部位にアニールしてもよく、該ライゲーション生成物はプローブ配列、バーコード配列、アダプター配列、ユニバーサルプライマー配列、リンカー配列またはそれらの組み合わせを含んでもよい。いくつかの場合において、相補的な連鎖をプライマーの3’末端から伸長させるためにポリメラーゼを用いてもよい。環状プローブ(すなわち、MIPプローブまたは錠型プローブ)を伴う例において、相補的な連鎖はプライマーの5’末端に連結して、環状の二本鎖のポリヌクレオチドを創生することができる。
更に、いくつかの例において、1又は複数のプライマーを用いてもよい。いくつかの例において、少なくとも約1、2、3、4、5、6、7、8、9または10のプライマーを第2の連鎖の合成に用いてもよい。いくつかの例において、最大で約1、2、3、4、5、6、7、8、9または10のプライマーを第2の連鎖の合成に用いてもよい。多数のプライマーを伴う場合において、1又は複数のプライマー伸長生成物を連結して第2の連鎖を形成してもよい。
いくつかの場合において、1又は複数のプライマーはまた、更なる配列を含んでもよく、該配列は上記一本鎖のライゲーション生成物に対して相補的でなくともよい。これらの更なる配列としては、それらに限定されないが、配列決定装置尾部配列420、アダプター配列、またはバーコード配列を挙げることができ、後続の下流のステップに用いることができる。例えば、本開示のある方法において、配列決定装置特異的な尾部配列は、第2の連鎖の合成に用いられるプライマー中に組み込まれてもよい。合成後に、上記配列決定装置特異的な尾部配列は、二本鎖の分子中の一本鎖領域として存在し得る。この尾部配列は、Illumina社により提供されるような、種々の配列決定プラットフォームに適合するように設計することができる。この例において、本技術分野で公知のように、上記尾部配列を、上記二本鎖の分子を配列決定用の固体担体上にハイブリダイズするまたは捕捉するために用いることができる。これらの方法は、複数の分子またはプローブセットが同時並行で処理及び配列決定される、複合的な応用に特に有用であり得る。
他の場合において、二本鎖の生成物は、本技術分野で公知であり、本開示の他所に記載の他の方法を用いて直接配列決定することができる。直接的な配列決定は、ライゲーション生成物中の配列を識別する及び本明細書記載の配列を計数するために行われる。
C.ライゲーション生成物の開裂
いくつかの場合において、第2の連鎖の合成の後に、更に、連続するライゲーション生成物を開裂させることが好ましい場合がある。MIPプローブを伴う場合、図6Aに示す一構成は、一組のユニバーサルプライミング部位610及び620に隣接する第1のプローブ600及び第2のプローブ650、並びにバーコード配列660を含むMIPプローブを提供する。制限部位699がプローブ中に組み込まれてもよく、この場合該制限部位は2つのユニバーサルプライミング部位610及び620の間に置かれる。ライゲーション後に、第1のプローブ600及び第2のプローブ650は、部位695において連結される。制限部位699における開裂の後、ユニバーサルプライミング部位は物理的に分離され、今度はバーコード配列及び連続となったプローブ、すなわちハイブリダイゼーション配列の両方に隣接する。この構成は、本明細書で更に述べられる多重の増幅または配列決定ストラテジーを提供する。
図6Bに示す、MIPプローブを伴うこれに代わる別な構成において、第1のプローブ600及び第2のプローブ650は一組のユニバーサルプライミング部位610及び620に隣接し、該ユニバーサルプライミング部位はバーコード配列660に隣接する。制限開裂部位699はプローブ中に組み込まれてもよく、該制限開裂部位は、一方のユニバーサル増幅部位620と第2のプローブ配列650との間に置かれる。ライゲーション後に、第1のプローブ600及び第2のプローブ650は部位695において連結される。制限部位699における開裂の後、バーコード配列に隣接するユニバーサルプライミング部位は残存し、制限開裂の後に、今度は連続するプローブすなわちハイブリダイゼーション配列に隣接して位置する。この構成は、本明細書で更に述べられる多重の増幅または配列決定ストラテジーを提供する。
D.ライゲーション生成物の選択的及びユニバーサルな増幅
i.選択的プライマーセットの設計
概括的には、本開示の方法は増幅に関する様々なストラテジーを提供する。選択的増幅の場合、プライマーセットが様々な異なる様式で設計され得る。いくつかの場合において、図6A、6B及び図7に示すように、プライマーはプローブ配列、アダプター配列、ユニバーサルプライミング部位、リンカー配列または任意のそれらの組み合わせにアニールするように設計することができる。異なる選択的増幅ストラテジーの例が例示目的で提供され、限定されない。例えば、MIPプローブが開裂して図6Aに示すような構成を形成するいくつかの場合において、順方向プライマーは、プローブすなわちハイブリダイゼーション配列680に対して相補的であってよい。上記プライマーは連結された配列の一部、または第1若しくは第2のプローブのハイブリダイゼーション配列に対して相補的であってよい。このプライマーは、バーコード配列692またはユニバーサルプライミング部位695に対して相補的な逆方向プライマーとの組み合わせで用いられてもよい。図6Bに示すように、一方のハイブリダイゼーション配列または両方の配列の組み合わせに対して相補的なプローブ特異的なプライマーが、逆方向プライマー680として用いられてもよい。
図7に示すような、開裂していない環状のライゲーション生成物を伴う別な例において、選択的プライマーとしては、プローブ配列790及び770に対して相補的なプライマー780、または720若しくは710などのプローブ中の更なるリンカー配列に対して相補的なプライマー700を挙げることができる。
いくつかの場合において、個々のプライマーは本明細書記載の種々の配列の1又は複数の部分にアニールするように設計することができる。例えばいくつかの場合において、プライマーは一般構造5’MMMMMNNNNN、但し、Mは、それらに限定されないが、第1及び/または第2のプローブ配列、アダプター配列、ユニバーサルプライミング配列、またはリンカー配列を始めとする配列に対して相補的な、可変の長さの領域であり、Nは同様の群由来の異なる配列より選択される、によって設計することができる。例えば図7において、ハイブリダイゼーション配列及びユニバーサル増幅配列に対して相補的な配列を含むプライマーが用いられてもよい、760。いくつかの例において、Mはプローブ配列に対して相補的な配列を含んでもよく、Nはバーコード配列に対して相補的な配列を含む。いくつかの例において、Mは第1のプローブ配列に対して相補的な配列を含んでもよく、Nは第2のプローブ配列に対して相補的な配列を含む。いくつかの例において、長さ、すなわちMまたはNのいずれかで規定されるヌクレオチドの数は、少なくとも約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75、100、125、150、175、200、300、400、または500ヌクレオチドであってよい。いくつかの場合において、長さ、すなわちMまたはNのいずれかで規定されるヌクレオチドの数は、最大で約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75、100、125、150、175、200、300、400、または500ヌクレオチドであってよい。
ii.ユニバーサルプライマーの設計
本開示の方法のいくつかの構成において、ライゲーション生成物、または選択的増幅生成物は、着目する遺伝子座由来のハイブリダイゼーション配列を含んでもよくまたは含まなくてもよいが、ユニバーサルに増幅することができる。ユニバーサル増幅は一般的に、1又は複数の領域を増幅するためのユニバーサルプライマーの使用として記載することができる。ユニバーサルプライマーは1又は複数のプローブに共通のプライミング部位である。ユニバーサル増幅生成物は、1又は複数の選択的増幅ステップの前または後に実施することができる。いくつかの場合において、ユニバーサル増幅は、ライゲーション生成物中のユニバーサルプライミング配列部位に対して相補的なユニバーサルプライマーを用いて実施することができる。いくつかの場合において、ユニバーサル増幅はバーコード配列に対して相補的なプライマーを含んでもよい。他の場合において、ユニバーサルプライミング配列は、第2の連鎖の合成、または1若しくは複数の選択的増幅ステップの間に、ポリヌクレオチドに付加されてもよく(すなわち、選択的増幅配列のためのプライマーが、選択的増幅過程の間に、ポリヌクレオチド領域に付加されてもよく)、あるいは、ユニバーサルプライミング部位を含むユニバーサルアダプター配列が、アダプター・ライゲーションなどの方法により、増幅されるべき配列(すなわち、プローブ配列、バーコード配列等々)に隣接する領域に付加されてもよい。
いくつかの構成において、選択的な一巡の増幅が行われる。いくつかの場合において、選択的増幅は、プローブ配列、アダプター配列、バーコード配列、リンカー配列またはそれらの任意の組み合わせの増幅を伴うことができる。選択的増幅の後に、本明細書記載のプライマーセット設計ストラテジーを用いて、選択的増幅生成物上でユニバーサル増幅を行うことができる。いくつかの場合において、ユニバーサル増幅を、ユニバーサルプライマーを用いてライゲーション生成物上で行ない、続いてユニバーサル増幅生成物の選択的増幅を行うことができる。
本開示のシステム及び方法の一構成において、ユニバーサル増幅は、1又は複数のプローブセットに共通のユニバーサル増幅部位から行うことができる。一般的に、全てのプローブセットはユニバーサルプライミング部位を含み得る。ユニバーサル増幅ステップは、この技法が増幅生成物の変動の低減を可能にすることから、一般的に本開示のシステム及び方法に対して好ましい。ユニバーサルプライマーセットを用いると、プローブセット特異的なプライマーを用いた個々のプローブセットの選択的な増幅と比較して、プローブセット全体にわたる増幅がより均一になり得る。多数のプローブ特異的なプライマーセットを伴ういくつかの場合においては、増幅の非効率性が増幅生成物の量を歪める、すなわち変化させ、後のステップにおいて計数すると、それが、特定の遺伝子座におけるコピー数に関する計算に影響し得る。更に、相対的に少ないプライマーを使用することが、高処理能力の、簡素化された一回のアッセイ作業をもたらすことの助けにもなり得る。
本開示のシステム及び方法の一構成において、図6A及び6Bに示すように、ユニバーサル増幅はユニバーサル増幅プライマー670及び695を用いて行ってもよい。この構成においては、増幅生成物はバーコード配列660及びハイブリダイゼーション配列(または着目する遺伝子座に関係する配列)を含んでもよい。これは、増幅生成物を配列決定することができ、また遺伝子座が配列決定データから特定される下流での適用に有用であり得る。一般的に、プローブすなわちハイブリダイゼーションに用いられる配列の一部が増幅され得る。いくつかの場合において、約1%〜10%、20%〜30%、30%〜40%、40%〜50%、50%〜60%、60%〜70%、70%〜80%、80%〜90%、90%〜99%、または99%〜99.99%のハイブリダイゼーション配列が増幅され得る。いくつかの場合において、少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、99.99%のハイブリダイゼーション配列が増幅され得る。いくつかの場合において、最大で約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、99.99%のハイブリダイゼーション配列が増幅され得る。
この構成の他の変化形において、上記バーコード配列はまた、バーコード特異的なプライマー690及び692を用いて増幅されてもよい。バーコードが、(本明細書に記載の)関係する遺伝子座に向けて設計されたプローブセットに共通に割り振られてもよい、本開示のシステム及び方法のいくつかの場合において、既知の遺伝子座へのバーコードの割り振りは、予め決定されることとなる。バーコード配列の増幅もまた、ハイブリダイゼーション配列特異的なプライマーまたは他のユニバーサル増幅プライマーを有する組み合わせなどの、異なるプライマーの組み合わせにより行われ得る。
図6Bに示す一つの特定の場合において、バーコード配列の増幅は、ユニバーサルプライマーを用い、ハイブリダイゼーション配列の増幅及びそれに続く検知(すなわち配列決定)を行うことなくなし得る。上記ユニバーサルプライマー部位は上記バーコード配列に隣接するように設計され、開裂後に未変化のまま残ることから、これらの部位を、上記バーコード配列及びハイブリダイゼーション配列以外の配列のみを含有する増幅生成物を生起させるために用いてもよい。
図7に示す、本開示のシステム及び方法の別な構成において、ユニバーサル増幅は、環状ライゲーション生成物由来のユニバーサル増幅プライマー795を用いて行われてもよい。この構成において、増幅生成物は、バーコード配列740及びユニバーサルプライミング配列797を増幅生成物中に含んでもよい。バーコード特異的配列もまた用いることができ、730及び750、またはそれらの組み合わせである。ハイブリダイゼーション配列(または着目する遺伝子座に関係する配列)。これは、増幅生成物を配列決定することができ、また遺伝子座が配列決定データから特定される下流への適用に有用であり得る。この構成の他の変化形において、上記バーコード配列はまた、バーコード特異的なプライマー690及び692を用いて増幅することもできる。
E.増幅技法
本技術分野において、多数の増幅方法及び技法が公知である。本開示の方法において、当初の試料またはライゲーション生成物の配列情報の初期の内容を維持しつつ、ポリヌクレオチドの数量すなわち量を増加させるように、任意且つ適宜の方法を用いることができる。1又は複数の増幅方法を、1または複数の組み合わせで用いることができる。
増幅方法の例としては、ポリメラーゼ連鎖反応(PCR)(米国特許第4,683,195号及び第4,683,202号;PCR Technology:Principles and Applications for DNA Amplification、H.A.Erlich編、Freeman Press、ニューヨーク州、ニューヨーク、1992)、リガーゼ連鎖反応(ligase chain reaction)(LCR)(Wu及びWallace、Genomics 4:560、1989;Landegrenら、Science 241:1077、1988)、連鎖置換増幅(strand displacement amplification)(SDA)(米国特許第5,270,184号及び第5,422,252号)、転写媒介性増幅(transcription−mediated amplification)(TMA)(米国特許第5,399,491号)、結合線形増幅(linked linear amplification)(LLA)(米国特許第6,027,923号)など、自律配列複製(self−sustained sequence replication)(Guatelliら、Proc.Nat.Acad.Sci.USA、87、1874(1990)及びW090/06995)、標的ポリヌクレオチド配列の選択的増幅(米国特許第6,410,276号)、コンセンサス配列プライムポリメラーゼ連鎖反応(consensus sequence primed polymerase chain reaction)(CP−PCR)(米国特許第4,437,975号)、任意プライムポリメラーゼ連鎖反応(arbitrarily primed polymerase chain reaction)(AP−PCR)(米国特許第5,413,909号、第5,861,245号)、及び核酸配列ベース増幅(nucleic acid based sequence amplification)(NASBA)を挙げることができるが、それらに限定されない。(米国特許第5,409,818号、第5,554,517号、及び第6,063,603号を参照されたく、これらのそれぞれは参照により本明細書に組み込まれる)。用いることができる他の増幅方法としては、PCT特許出願第PCT/US87/00880に記載のQβレプリカーゼ、Walkerら、Nucleic Acids Res. 20(7):1691〜6(1992)に記載のSDAなどの等温増幅方法、及び米国特許第5,648,245号記載のローリングサークル増幅があげられる。用いることができる他の増幅方法としては、米国特許第5,242,794号、第5,494,810号、第4,988,617号及び米国特許出願第09/854,317号及び米国公開第20030143599号に記載され、それらのそれぞれは参照により本明細書に組み込まれる。いくつかの態様において、DNAは多様な遺伝子座特異的PCRによって増幅される。好ましい態様において、DNAはアダプター−ライゲーション及び単一プライマーPCRを用いて増幅される。均衡PCR(balanced PCR)(Makrigiorgosら、Nature Biotech、20:936−9(2002))並びに核酸配列ベース増幅(NASBA)及び自律配列複製(Guatelliら、PNAS USA 87:1874(1990))などの等温増幅法などの他の利用可能な増幅方法。かかる方法論に基づいて、当業者は、増幅すべき任意且つ適宜の領域のプライマーを、容易に設計することができる。
F.増幅生成物及び条件
一般的に、本開示の方法においては、任意且つ適宜の増幅生成物及び生成物を生成させるための条件を用いることができる。種々の増幅技法及び配列に対して適切な、様々な増幅長さ、サイクル時間、ハイブリダイゼーション条件、アニーリング条件及び伸長条件を用いることができる。
i.増幅長さ
一般的に、増幅生成物の長さは任意の長さであってよく、配列の計数において有用な任意の配列を含有することができる。一般的に、増幅されたポリヌクレオチドは、少なくとも約5bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、75kb、または100kbであってよい。一般的に、増幅されたポリヌクレオチドは、最大で約5bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、20kb、30kb、40kb、50kb、75kb、または100kbであってよい。
ii.増幅条件
一般的に、選択的増幅またはユニバーサル増幅のいずれに対しても、任意且つ適宜の増幅条件を用いることができる。いくつの場合において、増幅は線形であってよい。いくつの場合において、増幅は対数的であってよい。本開示の方法は、増幅され得る1または複数の配列の計数を提供することから、様々なステップにおいて増幅を制御して、試料間の変動性を制御することが好適であり得る。
例えば、いくつかの場合において、選択的増幅ステップまたはユニバーサル増幅ステップのいずれにおいても、制限した増幅サイクルの回数を用いることができる。これは、複数の遺伝子座またはバーコードが用いられる多様な条件下で、異なる遺伝子座またはバーコードに対する異なるプライマーセットが異なる挙動を示す選択的増幅に対して、特に好適であり得る。異なるプライマーセット中のプライマーは、それらの鋳型にハイブリダイズする能力が異なる場合があり、従ってプライマーセット間で増幅効率の違いを生じる場合がある。所与の遺伝子座に対するプライマーの各セットは、プライマー及び試料DNAの配列構成、緩衝液条件、及び他の条件に基づいて異なる挙動を示し得る。多重アッセイシステム用のユニバーサルDNA増幅は、一般的に偏り及び変動性の持ち込みがより少ない。
1又は複数の遺伝子座またはバーコード間の増幅の変動を低減するために、例えば、増幅は、線形増幅法を用い、それに続いて対数的ユニバーサル増幅を用いてもよい。いくつかの場合において、増幅が線形または略線形となるように、サイクル数は1〜50サイクルの間に制限される。いくつかの場合において、線形増幅に関する増幅サイクルは、少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、または50サイクルとすることができる。いくつかの場合において、線形増幅に関する増幅サイクルは、最大で約1、2、3、4、5、6、7、8、9、10、20、30、40、または50サイクルとすることができる。いくつかの場合において、本明細書記載のように、ライゲーション生成物由来の配列の線形な選択的増幅の後に、対数的なユニバーサル増幅ステップが行われてもよい。一般的なプライマーセットが、複数の遺伝子座またはバーコード増幅生成物に対して用いられるユニバーサル増幅は、ますます多くの量の試料を生成しつつ、増幅の変動性を更に低減することができる。
他の場合において、線形増幅の前に対数的増幅が用いられてもよい。いくつかの場合において、対数的増幅に関する増幅サイクルは、少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、または50サイクルとすることができる。いくつかの場合において、対数的増幅に関する増幅サイクルは、最大で約1、2、3、4、5、6、7、8、9、10、20、30、40、または50サイクルとすることができる。
一般的に、任意且つ適宜のプライマーセットの数が増幅に用いられてもよい。いくつかの場合において、増幅プライマーセットは、試験される遺伝子座の数に概略等しくすることができる。いくつかの場合において、プライマーセットは、少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175、200、300、400、500、600、700、800、900または1000プライマーセットであってよい。いくつかの場合において、プライマーセットは、最大で約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、125、150、175、200、300、400、500、600、700、800、900または1000プライマーセットであってよい。
G.配列の識別及び計数方法
一般的に、バーコード配列の識別及びバーコードの計数の任意の方法または技法が、本開示のシステム及び方法に用いられてもよい。いくつかの場合において、識別は本明細書記載のPCRを用いて行われてもよく、それによって、増幅生成物の有無から直接配列を特定することができ、更に定量することができる。いくつかの場合において、配列の識別は配列決定によって行われてもよい。一般的に、配列の計数は、それらに限定されないが、qPCR、ハイブリダイゼーション法及び配列決定またはそれらの組み合わせを始めとする、任意且つ適宜の定量的方法を用いて実施され得る。
i.PCR法
いくつかの場合において、PCRを伴う方法を、配列を識別する及び計数するために用いてもよい。識別の場合には、いくつかの場合において、プローブ配列を含有するプライマーを有する増幅生成物がうまく生成することが、特定の遺伝子座の存在を示し得る。いくつかの場合において、プローブ配列の生成物の増幅がうまくいかないことが、特定の遺伝子座が存在しないことを示し得る。他の場合において、プローブには個々の固有の識別子配列またはバーコードが結合し得る。PCR増幅はバーコード単独上で、またはプローブ配列とバーコードとの組み合わせ上で行うことができる。いくつかの場合において、試料を試験する前に、既知のアイデンティティーの特定のバーコードが、既知の遺伝子座の領域に対して相補的な1または複数のプローブセットに割り振られる。いくつかの場合において、バーコード配列の増幅生成物がうまく生成することが、特定の遺伝子座の存在を示し得る。いくつかの場合において、バーコード配列の生成物の増幅がうまくいかないことが、特定の遺伝子座が存在しないことを示し得る。
いくつかの場合において、PCR増幅生成物が、任意且つ適宜の方法を用いて定量され得る。いくつかの場合において、方法は定量的PCR(qPCR)またはその変化形であってよい。いくつかの場合において、これは蛍光に基づく手法であってよく、そこでは蛍光シグナルを定量することができる。定量化されたシグナルを、元々の鋳型(すなわちライゲーション生成物)の相対的な存在量を算出するために用いることができ、従って特定の遺伝子座の相対的な存在量の関係する情報を提供することができる。いくつかの場合において、相対的な存在量の測定を、CNVなどの遺伝子変異の有無の特定に用いることができる。
ii.ハイブリダイゼーション方法
あるいは、本発明の別な構成において、上記増幅生成物の全長または一部が、ハイブリダイゼーション技法を用いて分析されてもよい。検知のためのポリヌクレオチド・ハイブリダイゼーション・アッセイの実施方法は本技術分野で公知である。ハイブリダイゼーション・アッセイの手順及び条件は用途によって変わることとなり、Maniatisら、Molecular Cloning:A Laboratory Manual(第2版、Cold Spring Harbor、ニューヨーク、1989)、Berger及びKimmel、Methods in Enzymology、第152巻、Guide to Molecular Cloning Techniques(Academic Press,Inc.、カリフォルニア州サンディエゴ、1987)、Young及びDavis、P.N.A.S, 80:1194(1983)で言及する方法を始めとする公知の一般的な結合方法に従って選択される。繰り返され、制御されたハイブリダイゼーション反応を行うための方法及び装置が、米国特許第5,871,928号、第5,874,219号、第6,045,996号、及び第6,386,749号、第6,391,623号に記載されており、それらのそれぞれが参照により本明細書に組み込まれる。
識別の場合において、元々のライゲーション生成物のプローブ配列を含有する配列に対する更なるプローブのハイブリダイゼーションがうまくいくことが、特定の遺伝子座の存在を示し得る。いくつかの場合において、元々のライゲーション生成物のプローブ配列に対する更なるプローブのハイブリダイゼーションがうまくいかないことが、特定の遺伝子座が存在しないことを示し得る。他の場合において、元々のライゲーション生成物のプローブは、個々の固有の識別子配列またはバーコードに結合し得る。
ハイブリダイゼーションは、バーコード単独上で、または元々のプローブとバーコードとの組み合わせ上で行うことができる。いくつかの場合において、試料を試験する前に、どのプローブ配列に、従ってどの遺伝子座に特定のバーコードが結合され得るかが判る。いくつかの場合において、バーコード配列に対するプローブのハイブリダイゼーションがうまくいくことが、特定の遺伝子座の存在を示し得る。いくつかの場合において、バーコード配列に対するプローブのハイブリダイゼーションがうまくいかないことが、特定の遺伝子座が存在しないことを示し得る。
本開示はまた、ある好ましい態様のリガンド間のハイブリダイゼーションのシグナル検知も提供する。米国特許第5,143,854号、第5,578,832号、第5,631,734号、第5,834,758号、第5,936,324号、第5,981,956号、第6,025,601号、第6,141,096号、第6,185,030号、第6,201,639号、第6,218,803号、及び第6,225,625号、米国特許出願第60/364,731号及びPCT出願第PCT/US99/06097号(W099/47964として公開)を参照されたく、これらのそれぞれは、全ての目的のために、それによって参照によりその全体が組み込まれる。
いくつかの場合において、ハイブリダイゼーションプローブが定量化され、配列を計数することができる。いくつかの場合において、プローブは化学的薬剤、蛍光団または定量化できるリガンドに接合される。一つの特定の例において、本開示の方法は、Nanostring社nCounterシステムによって提供されるなどの計数システムに好適であり得る。
シグナル検知及び強度データの処理のための方法及び装置が、例えば、米国特許第5,143,854号、第5,547,839号、第5,578,832号、第5,631,734号、第5,800,992号、第5,834,758号、第5,856,092号、第5,902,723号、第5,936,324号、第5,981,956号、第6,025,601号、第6,090,555号、第6,141,096号、第6,185,030号、第6,201,639号、第6,218,803号、及び第6,225,625号に、米国特許出願第60/364,731号及びPCT出願第PCT/US99/06097(W099/47964として公開)に開示され、これらのそれぞれもまた、全ての目的のために、それによって参照によりその全体が組み込まれる。
iii.配列決定方法
多数の配列決定方法が本開示のシステム及び方法に適合する。代表的な配列決定方法としては、参照により組み込まれる、Drmanac、米国特許第6,864,052号、第6,309,824号、及び第6,401,267号、並びにDrmanacら、米国特許公開第2005/0191656号に開示されるようなハイブリダイゼーションに基づく方法;合成方法による配列決定、例えば、Nyrenら、米国特許第7,648,824号、第7,459,311号及び第6,210,891号;Balasubramanian、米国特許第7,232,656号及び第6,833,246号;Quake、米国特許第6,911,345号;Liら、Proc.Natl.Acad.Sci.、100:414〜419(2003);Ronaghiら、米国特許第7,648,824号、第7,459,311号、第6,828,100号、及び第6,210,891号に開示されるピロリン酸配列決定;並びに、ライゲーションに基づく配列決定方法、例えば、Drmanacら、米国特許出願第20100105052号、及びChurchら、米国特許出願第20070207482号及び第20090018024号が挙げられるが、これらに限定されない。
多数(一般的に数千から数十億)の核酸配列を本質的に並列する様式で決定する方法であって、高処理能力の連続的プロセスを用い、多数の配列が好ましくは並列して読み出される上記方法を用いて、配列情報が決定され得る。かかる方法としては、ピロシーケンシング(例えば、454 Life Sciences,Inc.、コネチカット州ブランフォードにより商業化されたもの)、ライゲーションによる配列決定(例えば、Life Technology,Inc.、カリフォルニア州カルスバッドのSOLiD(商標)技術で商業化されたもの)、修飾ヌクレオチドを用いた合成による配列決定(Illimina、Inc.、カリフォルニア州サンディエゴによるTruSeq(商標)及びHiSeq(商標)技術、Helicos Biosciences Corporation、マサチューセッツ州ケンブリッジによるHeliScope(商標)、並びにPacific Biosciences of California,Inc.、カリフォルニア州メンローパークによるPacBio RSにより商業化されたものなど)、イオン検知技術による配列決定(Ion Torrent ,Inc,,カリフォルニア州サウスサンフランシスコ)、DNAナノボールの配列決定(Complete Genomics,Inc.、カリフォルニア州マウンテンビュー)、ナノポアに基づく配列決定技術(例えば、Oxford Nanopore Technologies,LTD、英国オックスフォードにより開発されたもの)、及び類似の高度に並列化された配列決定方法が挙げられるが、これらに限定されない。
更に、配列のリードは遺伝子座またはバーコード当たりのリードの数を定量することによって計数されてもよい。
XI.リードのカウント及びフィルタリング
ある場合において、遺伝子変異の特定の前に、リードのカウントデータをフィルターにかける、すなわち選別することが好適であり得る。一般的に、各着目する遺伝子座または着目する遺伝子座の部分集合に関する存在量の測定を、遺伝子変異の有無を特定するために用いてもよい。
多数の標準的な、着目する遺伝子座の部分集合の選択方法がある。該方法としては、ある百分位数未満及び/またはそれを超えるレベルで検知された着目する遺伝子座を分析から除外する、異常値除外が挙げられる。いくつかの場合において、上記百分位数は、存在量により測定して、少なくとも、最低及び最大で約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、または25%とすることができる。いくつかの場合において、上記百分位数は、存在量により測定して、最大で、最低及び最大で約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、または25%とすることができる。
選択された遺伝子座の部分集合の別な選択方法としては、ある統計的な制限の外に位置する領域の除外が挙げられる。例えば、1または複数の平均存在量の標準偏差外に位置する着目する遺伝子座は分析から除外され得る。
いくつかの場合において、着目する遺伝子座の部分集合を用いて、選択された遺伝子座の相対的な存在量を、健常な、すなわち正常な試料中の同一の選択された遺伝子座の予期される存在量と比較し、該予想試験で不合格な着目する遺伝子座は全て廃棄してもよい。
本開示のシステム及び方法における変動を更に低減するために、各着目する遺伝子座を測定する回数を増加してもよい。本明細書記載のように、ゲノムが平均で1回未満しか測定されない遺伝子変異検知のランダム法に対して、本開示のシステム及び方法は各着目する遺伝子座を複数回試験し得る。一般に事象をカウントする際に、カウントにおける変動はポアソン統計によって特定することができ、カウントの変動は一般的に、1をカウントの回数の平方根で除した値に等しいとし得る。
いくつかの場合において、着目する遺伝子座は、それぞれ平均で少なくとも約1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000または5000回測定される。いくつかの場合において、着目する遺伝子座は、それぞれ平均で最大で約1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000または5000回測定される。
別な構成において、着目する遺伝子座の部分集合は、ランダムにではあっても、染色体異常が存在するか否かの特定において統計的に意味のある結果を与えるために十分な数の遺伝子座で選択することができる。母親の試料内において、着目する遺伝子座の異なる部分集合の多重分析を行い、より高い統計的検出力を与えることができる。この例において、ランダム分析の前に如何なる遺伝座も取り除くすなわち除去することが必要である場合と必要ない場合とがある。例えば、21番染色体に関する100の選択した遺伝子座及び18番染色体に関する100の選択した遺伝子座がある場合、当該染色体のそれぞれに対して、100よりも少ない遺伝子座を評価する一連の分析を行うこともできる。
他の場合において、増幅の偏りが検知された場合には、カウントにおいて、選択した遺伝子座に関するリードのカウントをフィルターにかける、すなわち制限してもよい。増幅の偏りに起因するなどの変動性に関して疑われる遺伝子座を識別するために、内部基準、標準管理及び他の品質管理技法を独立に用いることができる。いくつかの場合において、疑いのある遺伝子座に関してリードのカウントを制限し、データの歪みを防止することが好ましい場合がある。
XII.試料における遺伝子変異の特定
配列のリードの計数及び任意選択のフィルタリングの後に、本開示は、母親及び胎児のポリヌクレオチドの混合物を含む試料中の1または複数の遺伝子座における遺伝子変異(すなわちCNV)の有無の特定方法を提供する。いくつかの場合において、アルゴリズムを、遺伝子変異の有無を検知するために用いてもよい。いくつかの場合において、アルゴリズムを、潜在的な遺伝子変異のプロファイルを作成するために用いてもよい。いくつかの場合において、プロファイルは本明細書記載のCNVの有無を示す場合があるのであって、確証的にCNVが存在するまたは存在しないことを示し得ない。CNVの存在または非存在をそれぞれ示すプロファイルは、CNVがそれぞれ存在するまたは存在しないことのより高い確率を示すことができる。いくつかの場合において、1または複数の遺伝子変異(すなわちCNV)に関して、確率値すなわち確度を提供することができる。
あるいは、CNVの有無はまた、本明細書記載の特定の方法に基づくまたは基づかない他のシステム及び方法によっても、特定または確認することができる。いくつかの場合において、PCR、qPCRまたは比較ゲノムハイブリダイゼーションなどの技法を、単独でまたはプローブに基づく手法との組み合わせで、遺伝子変異の検知に用いることができる。
試料中の遺伝子変異の特定は、種々の適宜の方法を用いて行うことができる。一例において、例えば、比較のために内部基準が用いられる。いくつかの場合において、内部基準とは、同一の試料中で、異常と想定される存在量(すなわち、重複、異数性等々)で存在する遺伝子座と比較するために、「正常な」存在量(例えば、常染色体に関するダイソミー)で存在する遺伝子座を用いることである。基準染色体として、かかる「正常な」染色体の1を用いることが十分であり得る一方、定量の検出力を高めるために、内部基準染色体として2以上の正常な染色体を用いることも可能である。他の場合において、既知の遺伝子の状態(すなわち、1または複数の遺伝子座に関する既知のコピー数、正倍数性、トリソミー等々)の1または複数の試料を含む外部基準が用いられてもよい。
A.染色体分布の検知
いくつかの場合において、内部基準を用いて、染色体比と呼ばれる、試料中の1または複数の正常な染色体の存在量に対する、異常と想定される染色体の存在量の比を算出する。個々の染色体に関する比もまた算出されてもよく、そこでは、各染色体に対する各遺伝子座の存在量、すなわちカウントが加算され、各染色体に対する合計のカウントを算出する。染色体比に関しては、次に、1の染色体に関する合計のカウントを異なる染色体に対する合計のカウントで除して、それら2の染色体に対する染色体比を導き出す。
あるいは、各染色体に対する染色体比は、まず各染色体に関する各遺伝子座のカウントを加算し、次に上記1の染色体に関する和を2以上の染色体に関する総和で除すことによって算出することができる。算出後に、上記染色体比が正規母集団からの平均染色体比と比較される。
上記平均とは、規格化及び異常値データの除外を伴うまたは伴わない、単純、メジアン、モードまたは他の平均であってよい。いくつかの場合において、単純平均が用いられる。正規母集団由来の染色体比は測定した染色体の正常変動を用いて算出される。この変動は種々の様式で表すことができる。いくつかの場合において、該変動は変動係数、すなわちCVとして表される。試料由来の染色体比が正規母集団由来の平均染色体比と比較され、試料に関する染色体比が、統計的に正規母集団に関する平均染色体比の外側に位置する場合には、当該試料は異数性を含み得る。異数性を特定するための統計的閾値は、染色体比の測定における変動及び所望のアッセイに関する許容される偽陽性と偽陰性との比に応じて設定することができる。一般的に、この閾値は、染色体比において観測される変動の倍数とすることができる。例えば、いくつかの場合において、この閾値は、染色体比の変動の少なくとも約1、2、3、4、5、6、7、8、9、10倍である。いくつかの場合において、この閾値は、染色体比の変動の最大で約1、2、3、4、5、6、7、8、9、10倍である。
一般的に、染色体比は、染色体に沿って遺伝子座のカウントを加算することにより特定することができる。一般的には、各染色体に対して同一の数の選択された遺伝子座が用いられる。染色体比を導き出す別な方法が用いられ、各染色体に関する遺伝子座に対する平均カウントを算出してもよい。上記平均は単純、メジアンまたはモードの任意の概算値であってよいが、一般的には平均が用いられる。上記平均は全カウントの単純平均または調整された平均若しくは加重平均などの、何がしかの変化形であってもよい。各染色体に関する平均カウントが算出された後、該各染色体に関する平均カウントはその他の平均カウントで除され、2の染色体間の染色体比を得ることができ、各染色体に関する平均カウントは全ての測定した染色体に関する平均の和で除され、本明細書記載の各染色体に関する染色体比を得ることができる。
上記で強調したように、想定されるDNAが低い相対的な存在量で存在する母親の試料中の異数性を検知する能力は、アッセイでの異なる選択された遺伝子座の測定における変動に大きく依存する。この変動を低減するために多数の分析方法を用いることができ、従って異数性を検知するためのこの方法の感度を向上することができる。一つのアッセイの変動の低減方法は、染色体の存在量を算出するために用いる選択された遺伝子座の数を増加させることである。一般的に、染色体の、単一の選択された遺伝子座の測定される変動がX%であり、Y%の選択された遺伝子座が同一の染色体上で測定されると仮定した場合、当該染色体上の各選択された遺伝子座の存在量を加算または平均することによって算出される染色体存在量の測定の変動は、概略X%をY%で除した値となり得る。染色体存在量の測定の変動は、概略、各選択された遺伝子座の存在量の測定の平均の変動を遺伝子座の数の平方根で除した値となり得る。
本開示のいくつかの場合において、遺伝子座カウントは結合したバーコードの計数によって特定されてもよい。いくつかの場合において、バーコード配列は、同様の染色体上の異なる遺伝子座に関して同一であってもよい。次に、バーコードは増幅され、カウントされてもよい。この場合、1の染色体の遺伝子座全体にわたる増幅における変動、ひいてはカウントにおける変動を低減することができる。別な例において、異なる染色体の遺伝子座が、1又は複数のバーコードの同様な分布と関連していてもよい。異なるバーコードの増幅のための特定のプライマーセットに関して、増幅効率における変動が存在し得るが、染色体全体で類似のプライマーセットの分布を用いることが、試料全体での増幅の偏り及び変動性の低減を可能にし得る。これが、特に一つの染色体の別な染色体に対するカウントの比較(すなわち染色体比)を改善し得る。
B.遺伝子座に基づくCNVの識別
いくつかの場合において、CNVが1または複数の個々の遺伝子座において検知され得る。かかる場合において、CNVは、特定の遺伝子座が、閾値すなわち基準レベルを超えて増加するか(すなわち、コピー数の獲得)または閾値すなわち基準レベル未満に減少するか(すなわち、コピー数の喪失)を検知することにより、CNVを識別することができる。いくつかの場合において、特定の遺伝子座が特定の疾患、病態または感染と関連することが知られている場合がある。種々の遺伝子座の比較は、遺伝子座当たりのリードのカウントの数によって特定され、しばしばカバーの程度(depth of coverage)と呼ばれる。本技術分野で公知の、CNVをカバーの程度によって識別するために用いることができる様々なプログラムすなわちアルゴリズムがある。いくつかの場合において、アルゴリズムは、規格化されたカバーの程度の比率を用いて、遺伝子座当たりの相対的なリードのカウントを、基準との比較として評価する。この場合、上記基準は、試験試料と同様の方法で作成された、「正常な」(すなわち二染色体性の)試料の広範なデータセットより得られた複数の遺伝子座に関するメジアンリードカウントからなる。他の場合において、基準は、1または複数の既知の正倍数体ゲノム由来のデータを含んでもよい。他の場合において、基準は、三染色体性または一染色体性遺伝子座などの、他の規定された遺伝子型を有する、1または複数の既知の試料由来のデータを含んでもよい。1または複数の遺伝子座におけるCNVは、コピー数の標準的な分布からの偏差によって識別することができる。
カバーの程度の情報を用いてCNVを識別する任意且つ適宜のアルゴリズムを、本開示の組成物及び方法に用いることができる。別なアルゴリズムとしては、CONTRA、XHMM、PennCNV、CoNIFER、VarScan、CNVSeq、cn.FARMS、BIC−seq及びConsoleなどのプログラムを挙げることができるが、これらに限定されない。遺伝子座に基づくCNV検知に関係するワークフローの例を、図1及び図2に見ることができる。
C.対立遺伝子に基づくCVNの識別
いくつかの場合において、CNVは、遺伝子座由来の対立遺伝子の頻度を評価することによって識別することができる。欠失が存在する場合には、配列のこの領域はヘテロ接合性対立遺伝子を有することがなく、ヘテロ接合性消失(LOH)と呼ばれる。LOHはまた、両方の染色体の複製物または染色体のセグメントが同一の親に由来する状況である片親性ダイソミー(uniparental disomy)(UPD)がある場合に起こり得る。トリソミーの場合には、ヘテロ接合性SNPに関して、対立遺伝子の1が2倍に増加し、対立遺伝子発現の比率が正常なパターンと比較して変位を起こす。コピー数の獲得の対立遺伝子の比に対する影響は、喪失に関するよりも獲得に関する方がより小さくなり得る。かかる場合を検知するために、任意且つ適宜のアルゴリズムを用いることができる。
いくつかの場合において、プローブは、あるSNPを検知するように設計されてもよい。いくつかの場合において、MIPSプローブまたは錠型プローブが、SNPが第1及び第2のプローブの間に存在する場合に特に好適である。SNPの検知のためのMIPプローブの使用は本技術分野で公知であり、SNPは本明細書記載の方法を用いて検知することができる。いくつかの場合において、第1及び第2のプローブの間のSNPを含有する領域または領域の一部の増幅を、配列決定及び分析してもよい。次に、個々のSNP対立遺伝子に関するリードのカウントを特定してもよい。
いくつかの場合において、アルゴリズムが、試料中のヘテロ接合性SNPの対立遺伝子の頻度を評価し、予想される頻度からの偏差があるか否かを特定することができる。この分析に関して、X対立遺伝子のリードの数値をリードの合計の数値またはカバーの程度で除した値によって計算することにより、基準ではない対立遺伝子「X」の頻度を、各多型SNPに対して特定することができる。X対立遺伝子の頻度に関する予想される頻度は、常染色体及び女性におけるX染色体に関しては0.5であり、男性の試料中のX及びY染色体に関しては0または1である(胎児の性はYに連動した遺伝子の有無によって決定し得る)。多型の位置に関する違いを評価するために、他の対立遺伝子SNP頻度に対して予想される頻度が試験される。そこで、circular binary segmentation(CBS)などの種々の統計的ステップを用いて、個々のSNPデータのセグメント化が行われてもよい。一般的に、試験は、試料の頻度の分散と基準の頻度の分散との間の統計的意味を測定するために、分散の等しさに関してF試験を用いて行われる。いくつかの場合において、この基準は、任意の本明細書記載の基準のタイプ由来である、試験試料中に存在するヘテロ接合性SNPに関するメジアンのX対立遺伝子の頻度の値から構成される。このセグメント化過程は、試料中に基準との比較において歪んだ対立遺伝子発現があるゲノムにおける、連続する領域を識別し、それによって、1を超える遺伝子座にわたり得るCNVを識別することができる。
いくつかの場合において、CNVは対立遺伝子の比によって検知することができる。比較対照試料において特定された既知の値と比較した場合により高いかまたはより低いかのいずれかであるSNP比は、異数性などのCNVの存在を示し得る。
いくつかの場合において、SNP比の増加は、比較対照試料における平均値と比較して、少なくとも約1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、80%、または100%高い場合があり、CNVの存在を示すことができる。いくつかの場合において、SNP比の増加は、比較対照試料における平均値と比較して、最大で約1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、80%、または100%高い場合があり、CNVの存在を示すことができる。
いくつかの場合において、SNP比の増加は、比較対照試料における平均値と比較して、少なくとも約1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、80%、または100%低い場合があり、CNVの存在を示すことができる。いくつかの場合において、SNP比の増加は、比較対照試料における平均値と比較して、最大で約1%、2%、5%、10%、20%、30%、40%、50%、60%、70%、80%、80%、または100%低い場合があり、CNVの存在を示すことができる。
いくつかの場合において、SNP比は、比較対照試料における平均値よりも高いまたは低い標準偏差で測定されることがあり、CNVが存在する危険性が高いことを示す。いくつかの場合において、SNP比は、少なくとも約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5または5の比較対照試料における平均値よりも高い標準偏差の場合があり、CNVの存在を示し得る。いくつかの場合において、SNP比は、最大で約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5または5の比較対照試料における平均値よりも高い標準偏差であってよく、CNVの存在を示し得る。
いくつかの場合において、SNP比は、少なくとも約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5または5の比較対照試料における平均値よりも低い標準偏差の場合があり、CNVの存在を示し得る。いくつかの場合において、SNP比は、最大で約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.5、2、2.5、3、3.5、4、4.5または5の比較対照試料における平均値よりも低い標準偏差の場合があり、CNVの存在を示し得る。
いくつかの場合において、CNVは、対立遺伝子発現に対して適用されるカバーの程度の手法を用いて評価されてもよい。かかる場合には、対立遺伝子は、一方はより高発現された対立遺伝子に相当するものであり、一方の群はより低発現された対立遺伝子に相当するものである、2群に分割され得る。次に各群は、本明細書記載の遺伝子座のリードのカウントデータと同様の方法で、比較することができる。いくつかの場合において、コピー数の相対的変化の大きさがより大きく、結果としてより大きなリードのカウントに繋がり得ることから、対立遺伝子レベル分析の方が遺伝子座レベル分析よりも好ましいことがある。対立遺伝子に基づくCNV検知に関係するワークフローの一例を図3に見ることができる。
D.選択される遺伝子座数
いくつかの場合において、アッセイの精度及び分解能は、試験される遺伝子座の数の増加と共に向上し得る。遺伝子座の数を増やすことはまた、染色体全体についてのCNVの判定に関する精度及び分解能を向上させるためにも特に好適であり得る。染色体当たりの試料採取される遺伝子座の数は、少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、または5000遺伝子座であってよい。染色体当たりの試料採取される遺伝子座の数は、最大で約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、または5000遺伝子座であってよい。
E.遺伝子変異の解釈
CNVなどの遺伝子変異の識別に続いて、病原性でありそうか又は良性でありそうかを特定するために、遺伝子の異常性の妥当性が評価されてもよい。影響を特定するために、ENSEMBL(http://www.ensembl.org)、ensembl resourcesを用いた、ヒトにおける染色体不均衡及び表現型のデータベース(DECIPHER、http://www.sanger.ac.uk/PostGenomics/decipher/)、及び遺伝子変異のデータベース(DGV、http://projects.tcag.ca/variation)などの変異を分類したデータベースを参照し、遺伝子変異の結果としての表現型のまたは健康上の影響があり得るかを特定することができる。
他の検討としては、CNVの大きさ及びゲノムの内容、online mendelian inheritance in man(OMIM)データベース(www.ncbi.nlm.nih.gov/omim)における投薬に敏感な遺伝子の根拠並びに最新の文献の検出が挙げられる。これらの分析の一部または全てに基づいて、CNVの病原性の可能性の判断を決定することができる。
XIII.応用
A.胎児及び母親の健康
一般的に、本開示のシステム及び方法は、母親及び胎児の特質及び健康の評価を対象とし得る。一般的に、本開示のシステム及び方法を、CNVなどの、遺伝子変異に関連する任意の適当な疾患または病態を評価するために用いることができる。いくつかの場合において、この情報を、母親及び胎児の治療に関する判断を支援するために用いることができる。他の場合において、この情報を、妊娠(すなわち、妊娠の中止または継続)に関する判断を支援するために用いることができる。体外受精(IVF)を伴ういくつかの場合において、いずれの胎芽(胚)を女性(雌)に移植するかの選択の判断に、胎芽(胚)における遺伝子変異に関する情報を用いることができる。
他の場合において、本開示のシステム及び方法を、胎児においてまたは胎児が出生した後に起こるかも知れずまた起こらないかも知れない関係する健康問題に関する予測的情報を提供するために用いることができる。いくつかの場合において、必然的変異型を母親または胎児のいずれかにおいて識別することができ、これを、特定の疾患の発症のリスクを特定または評価するために用いることができる。
B.ガンの早期検知
本明細書において提供されるシステム及び方法を、母親または胎児のいずれかの既知のガンまたは他の疾患を監視するために用いることができる。これにより、母親、胎児または専門家のいずれかが、疾患の進行に合致した治療の選択肢を採用することを可能にし得る。この例において、本明細書に記載されるシステム及び方法を、疾患の経過にある特定の被験者の遺伝子プロファイルを構築するために用いることができる。いくつかの例において、ガンはより侵攻性となる及び遺伝的に不安定となって進行することがある。他の例において、ガンは良性、非活動性また休止状態のままでいることがある。本開示のシステム及び方法は、疾患の進行の特定において有用であり得る。
更に、本明細書記載のシステム及び方法は、特定の治療選択肢の効能の特定に有用であり得る。一例において、治療選択肢はCNVなどの遺伝子変異の性質または量に対して実際に影響を与え得る。いくつかの場合において、遺伝子変異の監視は治療の効能の監視に有用であり得る。いくつかの場合において、この相関性は治療を選択するまたは変更することにおいて有用であり得る。
C.数的染色体異常に関係する疾患の早期検知
他の応用において、本開示のシステム及び方法を、染色体異常に関係する胎児または胎芽(胚)の遺伝子変異に関連した他の疾患を検知するために用いることができる。
例えば、本開示のシステム及び方法は、正常な(または単相の)数の染色体の余分なセット(複数可)が存在するもの(三倍性及び四倍性)、個々の染色体の欠損を伴うもの(モノソミー)及び余分な個々の染色体をともなうもの(トリソミー及びダブルトリソミー)などの数的異常の検知を可能にする。自然流産の約半数が胎児の核型における異常な数の染色体の存在に関連し、これにより、異数性が流産の主要な原因となっている。本開示のシステム及び方法は、異数性に基づく病態に関する早期の検知及び可能性のある治療の選択肢において支援し得る。トリソミーは最も頻出する種類の異数性であり、臨床上認知される全妊娠の4%において起こる。最も一般的なトリソミーは21番染色体(ダウン症候群に関連する)、18番染色体(エドワード症候群)及び13番染色体(パトー症候群)に関係する。他の異数性は、ターナー症候群(単一のX染色体の存在)、クラインフェルター症候群(XXY核型により特徴付けられる)及びXYY病(XYY核型により特徴付けられる)に関連する。本開示の組成物及びシステム及び方法は、ダウン症候群、エドワード症候群及びパトー症候群、並びにターナー症候群、クラインフェルター症候群及びXYY病を始めとする異数性に関係する病の検知に有用であり得るが、これらに限定されるものではない。
D.X関連疾患に関係する疾患の早期検知
本開示のシステム及び方法を、X染色体が関係する染色体異常を検知するために用いることができる。多数のこれらの染色体異常が、集合的にX関連障害と名付けられた一群の疾患及び疾病に関連することが知られている。例えば、本開示のシステム及び方法を用いて、X染色体上のHEMA遺伝子(Xq28)における変異を検知することができ、該変異は、遺伝性の血液障害であり、主として男性が冒され、異常な出血をもたらす、第VIII因子として知られる血液凝固タンパク質の欠乏によって特徴付けられる血友病Aに関連する。
別な例において、本開示のシステム及び方法を、X染色体上のFMR1遺伝子(Xq27.3)の一方の末端のCGGモチーフの増幅(200コピー超が存在)を検知するために用いることもでき、該増幅は、現在知られている最も一般的な遺伝性の精神遅滞である脆弱X症候群に関連する。
D.テロメア中の着目する遺伝子座に関係する疾患の早期検知
脆弱X症候群に加えて、多数の他の遅滞障害が、染色体の末端領域(または先端)(すなわちテロメア)に関係する染色体異常に起因することが知られている。テロメアDNAの大部分は一般的に異なる染色体間で分かち合われる。しかしながら、テロメアはまた、各染色体に特異であり遺伝子に富む固有の(大幅に小さい)配列領域も含む。テロマー領域を含む染色体再配列は、重篤な臨床上の結果を招き得る。例えば、超顕微鏡的なサブテロメアの染色体再配列は、先天性異常を伴うまたは伴わない精神遅滞の重要な原因であることが判っている。テロメア領域は最も高い再結合速度を有し、規則に反する対形成及び乗換えに起因する異常を起こしやすくなる。450〜500バンドレベルの一般的な核型分析によれば、ほとんどの染色体の末端部分は略同一に見えることから、標準的な方法論を用いてのこの領域における染色体の再配列の検知は困難である。本開示のシステム及び方法は、従来の核型分類システム及び方法よりも大幅に高い分解能を提供することができ、これを、かかるサブテロメアの再配列を検知するために用いることができる。
E.他の様々なCNV疾患の早期検知
他の例において、本開示のシステム及び方法を、他の様々なCNVに関係する胎児の疾患を検知するために用いることができる。これらとしては、それらに限定されないが、15番染色体上のセグメントq11〜q13の欠失を挙げることができ、これは、父系で15番染色体に由来する場合には、プラダー・ウィリー症候群(精神遅滞、筋緊張の低下、低身長及び肥満によって特徴付けられる障害)に関連する。母系で15番染色体に由来する場合には、この遺伝子変異はアンジェルマン症候群(精神遅滞、言語機能障害、歩行異常、けいれん発作及び場違いな多幸性挙動によって特徴付けられる神経形成障害)と結び付く。
別な例において、本開示のシステム及び方法を、例えば22q11.2バンドに生じる、22番染色体中の微小欠失を検知するために用いることもでき、該微小欠失は、出生前に確認される先天性心臓疾患における概略10%の症例との関連で見られる、常染色体優性の疾病であるディジョージ症候群と結び付く。
別な例において、21番染色体上の小領域(21q22など)の分節性重複もまた、本開示のシステム及び方法を用いて検知することができ、該重複は21番染色体又は別な染色体上に存在することがあり(すなわち、転座の後)、ダウン症候群と関連する。
F.免疫疾患、感染症、及び胎児性別の早期検知
他の様々な疾患及び感染症は、早期検知及び監視に好適であり得る他の種類の症状をもたらすことがある。例えば、ある場合には、遺伝的障害または感染性疾患が、患者においてある遺伝子のモザイク現象を起こすことがある。この遺伝子のモザイク現象は、本開示のシステム及び方法を用いて検知することができるコピー数多型及び希な変異を起こすことがある。別な例において、本開示のシステム及び方法を、母親または胎児のいずれかの体内の免疫細胞のゲノムを監視するために用いることもできる。B細胞などの免疫細胞は、ある疾患が存在する場合に急激にクローン展開される場合がある。クローン展開はコピー数多型の検知を用いて監視することができ、ある免疫状態を監視し得る。この例においては、コピー数多型分析を経時的に実施して、特定の疾患がどのように進行していき得るかのプロファイルを作成することができる。
更に、本開示のシステム及び方法を、細菌またはウィルスなどの病原体によって引き起こされ得る全身性感染症それ自体を監視するために用いることもできる。コピー数多型の検知または希な変異の検知ですらも、感染の経過の間に病原体の数がどのように変化していくかを特定するために用いることができる。これは特に、HIV/AIDsまたは肝炎などの慢性感染の間に重要である場合があり、それにより、感染の間にウィルスがライフサイクル状態を変え及び/またはより強毒性の形態に変異する場合がある。
更に、本開示のシステム及び方法は、胎児の性別(すなわち男性(雄)または女性(雌))を特定するために用いることもできる。例えば、Y染色体の有無またはX染色体の二染色体コピー数を特定するためにプローブを用いてもよい。
G.疾患に関する必然的変異型の早期検知
一般的に、本開示のシステム及び方法を、特定の疾患の重篤性のリスクの特定に有用な必然的変異型(すなわちSNPまたはCNV)の有無を識別するために用いることもできる。例えば、本開示のシステム及び方法は、ハンチントン病の家族歴を有する患者に対して有用であり得る。この神経変性疾患は、ハンチントン遺伝子(HTT)中の様々な長さのトリヌクレオチドの繰り返しに起因する。この繰り返しの長さは固体間並びに世代間で変化し得る。該繰り返しの長さはハンチントン病そのものの重篤度に影響すると考えられている。CNVレベルの特定が、ハンチントン遺伝子中の繰り返し数に関する情報を与えることができる。この情報は、当該疾患を有することが疑われる胎児における、将来の当該疾患の重篤度への見通しを提供することができる。
XIV.情報の保存及び伝達
着目する遺伝子座の分析及び遺伝子変異の有無の識別に由来する情報は、両親、保護者または試料若しくは配列データが由来する胎児の所有者、臨床医、研究専門家、医療専門家、サービス提供者、及び医療保険者若しくは保険会社を始めとする、任意の特定の個人・団体に伝えることができる。医療専門家は、例えば、医師、看護師、医療実験室技術者、及び薬剤師とすることができる。研究専門家は、例えば、主研究者、研究技能者、博士課程後の研修者、及び大学院生とすることができる。
いくつかの実施形態において、専門家は、胎児に特定の遺伝子変異が存在するか否かを特定することにより支援を受けることができ、専門家に遺伝子変異についての情報を伝えることができる。特定の遺伝子変異についての情報が報告された後、医療専門家は両親に影響することとなり得る1または複数の行動を取り得る。例えば、医療専門家は、親の医療記録中に、当該胚芽の発達障害を発症するリスクに関する情報を記録することができる。いくつかの実施形態において、医療専門家は、女性に移植することが選択される場合には、当該胚芽のリスク評価に関する情報を記録することができる。
いくつかの実施形態において、医療専門家は、対象者または対象者の家族に、胚芽の発達障害の発症のスクリーニングに関する情報を伝えることができる。いくつかの実施形態において、医療専門家は、家族に、治療の選択肢及び専門家への紹介を始めとする、発達障害及びリスク評価情報に関する情報を提供することができる。いくつかの実施形態において、医療専門家は、専門家へ、対象者の医療記録のコピーを提供することができる。いくつかの実施形態において、研究専門家は、科学上の研究を進めるために、胚芽の発達障害の発症のリスクに関する情報を応用することができる。
情報を別な人に伝えるためには、任意の適切な方法を用いることができる。例えば、情報は専門家に直接または間接的に与えることができ、実験室の技能者は、本明細書記載の胚芽の遺伝子変異をコンピュータに基づく記録中に入力することができる。いくつかの実施形態において、情報は医療または研究記録への物理的な改訂を行うことによって伝えられる。例えば、医療専門家は、当該記録を再検討する他の医療専門家にリスク評価を伝えるために、医療記録に永続的な注釈すなわちフラッグを作成することができる。加えて、リスク評価情報を伝えるために、任意の形式の伝達手段を用いることができる。例えば、郵便、電子メール、電話、及び対面対話を用いることができる。上記情報はまた、当該情報を専門家が電子的に利用可能にすることによって当該専門家に伝えることができる。例えば、上記情報を、図8に示すように、専門家が上記情報にアクセスできるように上記情報をコンピュータデータベース上に格納することによって、上記専門家に伝えることができる。加えて、上記情報を上記専門家のエージェントの役割を果たす病院、医院、または研究施設に伝えることができる。コンピュータに基づく伝達の代表的な図解を に示す。
XV.実施形態
本開示の趣旨から逸脱することなく実質的に同様の結果を得るために、多数の且つ種々の修正を行うことができることを当業者は理解することとなろう。本明細書で参照される参考文献の全ては、議論される発明の主題に関して、それらの全体が参照により本明細書に組み込まれる。以下の例は例証のみを目的として組み入れられ、本開示の範囲を限定することは意図されない。
例1:MIPプローブライゲーション及び増幅に関する一般的な実験パラメータ
1.プローブ設計
2.100attomole/μl/プローブ(6000万分子/μl/プローブ)の貯蔵原液の作製
3.試料の抽出(すなわちcfDNAの単離)
A.市販キットを用いてCell−Free DNA BCT中へ血液を採取
B.最適な結果に向けて、カオトロピック塩の存在下、60℃、無細胞DNAの抽出の場合は1時間、細胞ゲノムDNAの抽出の場合は2時間、プロテイナーゼK処理ステップ(≧30mAU/ml消化)を含む。
4.アッセイ
1.以下を組み合わせる:
a.抽出されたcfDNAを
b.1μlのプローブ原液と
c.1Xアンプリガーゼ緩衝液(Epicentre Technologies社)中で
d.7.8μlの容量に。
2.サーモサイクラー:
a.アニーリング反応混合物を95℃に5分間加熱し
b.次に、温度を一気に1度低下させ、各温度で1分間保持し、65℃に到達するまでこれを繰り返し
c.65℃に終夜保持する。
3.以下を添加する:
a.1Uのアンプリガーゼ酵素(Epicentre Technologies社)
b.1Xアンプリガーゼ緩衝液(Epicentre Technologies社)中
c.14.2μlの合計容量で。
4.サーモサイクラー:
a.58℃で2分間
5.以下を添加する:
a.0.65UのエキソヌクレアーゼI(Epicentre Technologies社)
b.3.3UのエキソヌクレアーゼIII(Epicentre Technologies社)
c.無視できる反応混合物の容量変化で。
6.サーモサイクラー:
a.37℃で15分間
b.酵素を失活させるために80℃で15分間。
7.本発明者らは高忠実度ポリメラーゼ(例えばKapa HiFi)を用い、製造者の指示に従った。Integrated DNA Technologies社供給のHPLC精製したユニバーサル順方向及び逆方向増幅プライマー:
a.xxxxxxxxx−TACTGAGGTCGGTACACTCT
b.yyyyyyyyyy−AGTAGCCGTGACTATCGACT。
8.サーモサイクラー:
a.95℃で10分間
b.以下を5サイクル
i.94℃で30秒間
ii.63℃で30秒間
iii.72℃で30秒間
c.72℃で5分間。
例2:トリソミー21の検知
妊娠の第1または第2三半期にある妊婦より末梢血試料を採取する。採取した試料を遠心分離して、無細胞血漿を得る。QiAmp DNA Blood Mini Kit(Qiagen社)を用い、製造者の指示に従って、無細胞DNAを上記血漿画分より抽出する。15mlの血液より概略5ngのDNAを得る。
想定されるトリソミー21の検知用の試料を試験するために、21番染色体中の着目する遺伝子座に対して設計したMIPプローブを用いる。着目する遺伝子座は、アーム及び動原体領域の両方の領域において、該染色体全体から選択する。ROSOなどの、ハイブリダイゼーションのための最適なプローブ及びプローブセットを選択するための最適化アルゴリズムを用いて、特定のプローブ配列を選択する。選択基準としては、部位選択性、21番染色体の外の遺伝子座との交差反応性の低減、プローブ長さ、ハイブリダシゼーション反応における塩耐性、プローブにおける2次構造の低減及びプローブ−プローブ二量化の低減が挙げられる。個々のプローブセットのみならず、用いるプローブの全てにわたっても、選択基準及び最適化が適用される。21番染色体に対してハイブリダイズさせるために100のプローブセットを用い、各プローブは2のプローブを含む。
各プローブセット内で、相補的配列に結合した場合にプローブ間にギャップが存在しないように、第1のプローブ及び第2のプローブを選択する。21番染色体MIPプローブに全て共通にオリゴヌクレオチドバーコード配列(「X」)が割り振られる。図6Bに示すように、MIPプローブ中のバーコード「X」には、同様な構成である2のユニバーサルプライマー部位(「A」)が隣接する。
21番染色体にハイブリダイズするように設計されたプローブに加えて、21番染色体(着目する遺伝子座)外の基準遺伝子座を対象として設計されたMIPプローブを用いる。2番染色体全体にわたってハイブリダイズさせるように設計された100のMIPプローブを用いる。各プローブセット内で、21番染色体に対するプローブと同様に、相補的配列に結合した場合にプローブ間にギャップが存在しないように、第1のプローブ及び第2のプローブを選択する。2番染色体基準プローブに対しても、本明細書記載の21番染色体に対するプローブと同様のやり方で、選択基準及び最適化が適用される。2番染色体MIPプローブに全て共通にオリゴヌクレオチドバーコード配列(「Y」)が割り振られる。MIPプローブ中のバーコード「Y」には、図6Bに示すものと同様の構成で、2のユニバーサルプライマー部位(「A」)が隣接する。
21番染色体プローブセット及び2番染色体プローブセットの両方を同時に、単一のハイブリダイゼーション反応において試料に適用する。2番染色体及び21番染色体の両方に対するプローブの濃度を、無細胞DNA試料中の試験される遺伝子座の濃度の5倍過剰で添加する。まず、95℃で5分間、試料ポリヌクレオチドを変性して一本鎖無細胞DNA分子を生成させ、65℃で終夜、プローブのハイブリダイゼーションを進行させる。次に、NEBリガーゼ及び緩衝液を添加し、結合したMIPプローブのライゲーションを実施する。上記反応混合物を25℃とし、ライゲーションを2時間継続させる。
次に、ExoI/III(Epicentre社)の組み合わせを添加し、37℃で5時間エキソヌクレアーゼの反応を実施し、試料中の非結合のプローブを分解する。次に、上記反応混合物を、精製ステップとしてシリカゲルマトリクスに通して、分解した非結合プローブ及び残存無細胞DNA試料ポリヌクレオチドを除去する。連結した生成物を上記シリカゲルマトリクスから流出させ、KAPA/HIFIポリメラーゼを用いて第2の連鎖合成を実施する。第2の連鎖合成に用いるプローブ中のリンカー配列の一部に対して相補的なプライマー。
第2の連鎖合成の後、プライマー部位「A」に対して相補的なプライマーを用いて、ユニバーサル増幅ステップを実施する。線形増幅を数回繰り返し、それに続いて対数的増幅サイクルを多数回繰り返す。
次に、Illumina Genomic Adaptor Oligo Mix及びIllumina adaptor(非インデックスYアダプター)を用いて、増幅生成物をユニバーサルアダプターに連結させる。Agencourt AMPure XP PCR精製システム中に供給される磁気ビームを用いて、アダプターが連結したバーコード配列を、非連結アダプター、アダプター二量体、及び他の薬剤から精製する。次に、上記精製した増幅生成物が40μlのQiagen EB緩衝液中に流出する。増幅されたDNAを、IlluminaのGenome Analyzer IIを用いて配列決定し、片末端リードを得る。バーコードX及びYの両方に関するリードを、Illuminaソフトウェアを用いて計数する。リードのカウントの合計の設定された閾値は10000に設定され、該閾値後はカンウントを停止する。カウントX/Yの比を算出し、加えて同様な実験より得たX/Y比の集成値を含む基準閾値と比較する。変動係数及びカイ二乗分析を行って、算出された比の統計的意味を付与する。算出された比及び基準値との比較を評価することによりCNVの特定を行う。
例3:13番、18番、21番、X、及びY染色体に関する多重CNV試験
例2に記載のものと同様の実験プロトコルストラテジーを用いて、CNVに関する多重染色体試験を行ってもよい。加えて、CNVを含む染色体サブ領域を検知してもよい。例2に記載のものと同様の特性を有するMIPプローブを、13番、18番、21番、X及びY染色体にわたる種々の遺伝子座をハイブリダイズするように設計する。基準プローブを、残余の染色体、1〜20番及び22番染色体に向けて設計する。個々のプローブセットに固有のバーコード配列を割り振り、染色体の領域中の個々の遺伝子座に関する配列カウントを解明する。加えて、ユニバーサル増幅部位が、更にIllumina相当のアダプター配列が隣接する固有のバーコード配列に隣接するように、MIPプローブを設計する。この設計により、例2に記載したような、配列決定のためにアダプター配列を組み込むための更なる増幅ステップは不要となる。
例2に記載したものと同様の生化学的及び分子生物学的ステップを用いて、13番、18番、21番、X、及びY染色体にわたる遺伝子座に対してハイブリダイズするMIPプローブに関するライゲーション生成物を単離する。Illuminaプラットフォーム配列決定を用い、例2に記載したものと同様な様式で、バーコード−アダプター配列を増幅し、識別し及び、計数する。各染色体に対するバーコードの合計数(バーコード密度)を測定する。あるいは、バーコード配列の数を染色体の長さに規格化して、バーコード密度比を作成してもよい。染色体の長さへの規格化は必須のステップではなく、単に計数ステップを簡略化するために実施することができる。
得られた各染色体に関するバーコード密度をその他の染色体のそれぞれのバーコード密度と比較して、限定された染色体「量」を導き出し、該染色体「量」は、着目する染色体、例えば21番染色体、に関するバーコード密度と残余の染色体(すなわち1〜20番、22番及びX染色体)のそれぞれのバーコード密度との比として算出される。試料中の全ての染色体について上記染色体量を特定する。各着目する染色体に関する上記染色体量は、各着目する染色体についてのバーコードの合計数の、残余の染色体のそれぞれのバーコードの合計数に対する相対比における変動の尺度を与える。上記染色体量は、染色体または染色体群、すなわち、試料間で、着目する染色体の変動に最も近接する変動を有する、規格化する染色体を識別することができる。CNV遺伝子変異を、着目する染色体の染色体量の比の、1又は複数の残余の染色体についての規格化された染色体量の比に対する対比に基づいて特定する。
例4:自閉症に関する必然的変異体のSNP及びCNVの検知
胎児対象者における自閉症などの神経発生上の疾患の発症のリスクを評価するために試験を行う。自閉症のいくつかの場合には、あるSNP及び/またはCNV遺伝子変異の存在が、対象者の当該疾患発症のより高いリスクの素因となり得る。この試験において、例2及び3に記載したものと同様の実験プロトコルを用いる。但し、この試験においては、MIPプローブセットを、自閉症の発症に関連すると思われる着目する遺伝子座にハイブリダイズするように設計する。1又は複数の遺伝子座における希なSNP及び/またはCNVなどの遺伝子変異は、当該疾患に対して、より高いまたはより低いリスクを示す。各遺伝子座について、個々のプローブに固有のバーコードを割り振る。遺伝子座を多数の染色体にわたって分布させる。加えて、各MIPプローブセット中の2のプローブを、試料ポリヌクレオチドに結合させた際に、該プローブ間にギャップが存在するように設計する。上記ギャップは、自閉症の発症に関係するSNPを含有し得る特定の遺伝子座の中の試料ポリヌクレオチド中の配列に相当する。更に、MIPプローブを、図6Aに示すように、ユニバーサル増幅プライミング部位が上記バーコード配列及びハイブリダイゼーション配列に隣接するように設計する。着目する遺伝子座外の遺伝子座に対する基準プローブを、種々のハウスキーピング遺伝子にハイブリダイズするように、且つまたプローブ間にギャップを含み、自閉症に関連しない遺伝子座のSNPを捕えるように設計してもよい。
例2及び3に記載の実験設計に加えるステップにおいて、試料ポリヌクレオチドに結合したライゲーション前のプローブを、クレノウ断片などのDNAポリメラーゼを用いて処理し、2のハイブリダイズしたプローブ間のギャップに配列を重合する。この重合した配列は、当該配列のその領域に存在するSNPのアイデンティティーを捕えることができる。
ライゲーション及び生成物の単離の後、増幅を実施する。複数の異なる増幅ステップを実施してもよい。一方法において、個々のバーコード、または1若しくは複数のバーコードに共通の配列に対して設計したプライマーを用いて増幅を行う。次に、これらの生成物を配列決定し計数する。個々のバーコードの比を比較して、1または複数の遺伝子座におけるCNVを特定することができる。別なステップにおいて、ユニバーサルプライマー部位及び想定されるSNPの位置に隣接して設計された部位の組み合わせを用いて、別な増幅反応を行ってもよい。増幅生成物はバーコード配列及びハイブリダイゼーション配列の一部の両方並びに当該SNPを含有する配列を含有する。
これらの増幅生成物の配列は、ハイブリダイゼーション配列の一部及び識別されるべきSNPを用いて、基準配列にアラインしてもよい。他の場合においては、バーコードの識別が着目する遺伝子座を示すこととなるため、アラインメントは用いなくてもよい。上記バーコード配列及びSNPの両方を計数する。着目する遺伝子座及び着目する遺伝子座外の遺伝子座の両方に対する対立遺伝子の頻度を算出するために、SNPとバーコードとの比較を用いる。自閉症に関する特定の必然的変異体(SPNまたはCNV)を特定するために、比の比較を用いてもよく、胎児対象者における当該疾患の発症に対するリスクまたはリスクの要因の評価に用いてもよい。
例5:高感度での遺伝子変異の検知
増幅ステップ及び配列決定ステップを用いなくてもよい遺伝子変異に関する試験を行ってもよい。この試験において、本明細書記載のように、但し実験プロトコル中の下流へのステップへと変更して、結合したMIPのライゲーション生成物を生起させる。当該ライゲーション生成物を単離後、これらの生成物それ自体を用いて、当該生成物中に含まれる配列を直接計数することができる。いくつかの場合に、試料ポリヌクレオチド材料は、十分な数のプローブが結合し連結することができるために十分な量であってよく、バーコード及び他の配列が、増幅ステップなしで計数することができる。他の方法において、Nanostring nCounterシステムなどの高感度検知アッセイシステムを用いて、試料ポリヌクレオチドに結合したプローブの数が比較的低い場合であっても、ライゲーション生成物から直接バーコードを計数することができる。
上記nCounterは、ハイブリダイゼーション配列及び対応する蛍光ナノ粒子に基づくバーコード配列を含む分子を用いるハイブリダイゼーションに基づく方法を採用する。これらのエレメントが共同で、ハイブリダイゼーション配列のアイデンティティー並びに、試料中に存在するライゲーション生成物に結合したハイブリダイゼーション配列を計数するために用いることができる定量可能なシグナルを提供する。この試験において、ライゲーション生成物を単離した後、ライゲーション生成物中に含まれるバーコード配列のために設計したハイブリダイゼーション配列を含有するnCounter分子を用いて、バーコード配列を計数することができる。nCounter分子中のナノ粒子バーコードを、特定のハイブリダイゼーション配列(ポリヌクレオチドバーコード)に割り振ることができ、従ってMIPプローブに割り振られた特定のバーコードの識別及び計数の両方を提供できる。この試験を、本開示のシステム及び方法に関係する任意の応用に用いることができる。nCounterシステムの使用、または任意の関係する単一分子アッセイシステムを、ライゲーション生成物中の配列の計数に用いることができる。本方法を、種々のライゲーション生成物の増幅または濃縮ステップと合わせて用いることもできる。
例6:錠型プローブの例
図9は本開示に従ったプローブの例及び該プローブの領域を増幅するためのPCR増幅プライマーの例を図解する。プローブ例中の「n」は骨格配列を表わし、該骨格配列は環状概略図中に詳細に図解され、該環状概略図は、プローブであって、末端が連結して環状ポリヌクレオチドを形成した、その標的に結合した上記プローブを表わす。上記環状概略図中において、「N」は分子タグのための縮重塩基を表わし、「B」はプローブを識別するためのバーコード配列を表わす。PCR増幅プライマー中で、「X」は特定の試料に連結したバーコードの配列を表わす。この例において、プローブの5’末端と3’末端とは、更に伸長することなく連結している。これに続いて、順方向及び逆方向プライマー、R PCRプライマー及びF PCRプライマーを用いたPCRが行われ、図10に該PCRを図解する。R PCRプライマーは連結したプローブに対してハイブリダイズし、ポリメラーゼによって伸長されて第1の伸長生成物を生起する。F PCRプライマーは上記第1の伸長生成物に対してハイブリダイズし、ポリメラーゼによって伸長されて第2の伸長生成物を生起する。該第2の伸長生成物及びその後の生成物を、示されたプローブ配列を増幅するための鋳型として用いて、更なるR PCRプライマー及びF PCRプライマーのハイブリダイゼーション及び伸長を繰り返してもよい。次に、Illuminaフローセルを用いて、PCR生成物を配列決定する。