本明細書に記載の方法は、別様の指定がない限り、分子生物学(組換え技術を含む)、細胞生物学、生化学、及びマイクロアレイの従来技法及び説明、並びに配列決定技法を使用することができる。それらは当業者の技術内にある。そのような従来技法には、オリゴヌクレオチドのポリマーアレイ合成、ハイブリダイゼーション、及びライゲーション、オリゴヌクレオチドの配列決定、並びに標識を使用したハイブリダイゼーションの検出が含まれる。好適な技法は、本明細書中の実施例を参照して具体的に説明することができる。しかしながら、同等の従来手順も、無論、使用することができる。そのような従来技法及び説明は、以下のもの等の標準的実験手引き書に見出すことができる:Greenら編、Genome Analysis:A Laboratory Manual Series(I〜IV巻)(1999年);Weinerら編、Genetic Variation:A Laboratory Manual(2007年);Dieffenbach、Dveksler編、PCR Primer:A Laboratory Manual(2003年);Bowtell及びSambrook、DNA Microarrays:A Molecular Cloning Manual(2003年);Mount、Bioinformatics:Sequence and Genome Analysis(2004年);Sambrook及びRussell、Condensed Protocols from Molecular Cloning:A Laboratory Manual(2006年);及びSambrook及びRussell、Molecular Cloning:A Laboratory Manual(2002年)(全てCold Spring Harbor Laboratory Press社刊);Stryer,L.、Biochemistry(第4版)W.H.Freeman、New York(1995年);Gait、「Oligonucleotide Synthesis:A Practical Approach」IRL Press、London(1984年);Nelson及びCox、Lehninger,Principles of Biochemistry、第3版、W.H.Freeman Pub.、New York(2000年);及びBergら、Biochemistry、第5版、W.H.Freeman Pub.、New York(2002年)。これらの文献は全て、参照によりそれらの全体があらゆる目的のために本明細書に組み込まれる。本組成物、研究ツール、及び方法を説明する前に、本発明は、記載されている特定の方法、組成物、標的、及び使用に限定されず、無論、それ自体、様々であってもよいことが理解されるべきである。また、本明細書中で使用される用語は、特定の態様を説明するためのものであるに過ぎず、本発明の範囲を限定することは意図されておらず、本発明の範囲は、添付の特許請求の範囲によってのみ限定されることになることが理解されるべきである。
本明細書で使用される場合及び添付の特許請求の範囲では、単数の「1つの」、「前記」、及び「その」は、状況が明白にそうではないことを示さない限り、複数の指示対象を含む。したがって、例えば、「1つの核酸領域」への言及は、1つ、複数、又はそのような領域の混合物を指し、「方法」への言及は、当業者に知られている同等のステップ及び方法への言及を含む等である。
一連の値が提供される場合、その範囲の上限及び下限間の各介在値、及びその記載されている範囲の任意の他の記載されている値又は介在値は、本発明内に包含されることが理解されるべきである。記載されている範囲が、上限及び下限を含む場合、それらの限界値のうちのいずれかを除外した範囲も、本発明に含まれる。
本明細書で言及された刊行物は全て、本発明に関連して使用することができる配合及び方法を説明及び開示する目的を含むあらゆる目的のために、参照により組み込まれる。
以下の記載には、本発明のより良い理解を提供するために、多数の特定の詳細が示されている。しかしながら、本発明は、これら特定の詳細の1つ又は複数がなくとも実施することができることは、当業者であれば明白であろう。他の場合には、周知の特徴及び当業者に周知の手順は、本発明の曖昧さを回避するために記載されていない。
定義
本明細書で使用される用語は、当業者により理解されているような明白な通常の意味を有することが意図される。以下の定義は、読者による本発明の理解を支援するためのものであるが、具体的に指定されていない限り、そのような用語の意味を変更したり、その他の方法で限定したりすることは意図されていない。
用語「増幅核酸」は、その量が、in vitroで実施された任意の核酸増幅法又は複製法により、その開始量と比較して、少なくとも2倍増加された任意の核酸分子である。
用語「染色体異常」は、染色体の全て又は一部のあらゆる遺伝子変異を指す。遺伝子変異には、限定するものではないが、重複又は欠失、転座、逆位、及び突然変異等の任意のコピー数変異が含まれる。この用語はまた、胎児組織又は母体組織における染色体モザイク現象も含む。
用語「診断ツール」は、本明細書で使用される場合、患者試料での診断検査又はアッセイを実施するために、例えばシステムで使用される本発明の任意の組成物又は方法を指す。
用語「雌雄モザイク現象」又は「性染色体モザイク現象」又は「性染色体モザイク」は、1つの個体に異なる性染色体遺伝子型を有する2つ以上の細胞集団が存在することを指す。雌雄モザイク現象は、以下の場合に生じる:例えば、個体の幾つかの細胞が2つのX染色体を有し(XX)、その個体の他の細胞が1つのX染色体及び1つのY染色体を有する(XY)場合;個体の幾つかの細胞が1つのX染色体を有し(XO)、その個体の他の細胞が1つのX染色体及び1つのY染色体を有する(XY)場合;又は個体の幾つかの細胞が2つのX染色体及び1つのY染色体を有し(XXY)、その個体の他の細胞が1つのX染色体及び1つのY染色体を有する(XY)場合。
用語「ハイブリダイゼーション」は、一般的に、核酸の相補鎖の対合により生じる反応を意味する。DNAは、通常は二本鎖であり、鎖は、分離しても、適切な条件下で再ハイブリダイズする。ハイブリッドは、DNA−DNA間、DNA−RNA間、又はRNA−RNA間に形成され得る。ハイブリッドは、短鎖と、短鎖に相補的な領域を含む長鎖との間に形成され得る。また、不完全なハイブリッドが形成される場合があるが、それらは、より不完全になるほど、より不安定になる(また、より形成されにくくなる)。
用語「尤度」は、尤度を直接算出することにより得られる任意の値、又は尤度と相関するか、或いは他の方法で尤度を示すことができる任意の値を指す。
用語「遺伝子座」は、本明細書で使用される場合、ゲノムの既知位置の核酸領域を指す。
用語「母体試料」は、本明細書で使用される場合、胎児核酸及び母体核酸(例えば、DNA)を両方とも含む妊娠女性(雌)から採取される任意の試料を指す。好ましくは、本発明で使用される母体試料は、比較的非侵襲的な手段、例えば静脈穿刺又は被験者から末梢試料を抽出するための他の標準的技法により得られる。
「マイクロアレイ」又は「アレイ」は、表面、好ましくは(ただし排他的ではない)平坦な又は実質的に平坦な表面を有する固相支持体を指し、この表面は核酸を含む部位のアレイを担持し、アレイの各部位はオリゴヌクレオチド又はポリヌクレオチドのほぼ同一の又は同一のコピーを含み、空間的に画定されており、アレイの他のメンバーの部位と重複していない。すなわち、各部位は空間的に別個のものである。また、アレイ又はマイクロアレイは、ビーズ又はウェル等の表面を有する非平坦調査構造を含んでいてもよい。アレイのオリゴヌクレオチド又はポリヌクレオチドは、固体支持体に共有結合で結合されていてもよく、又は非共有結合で結合されていてもよい。従来のマイクロアレイ技術は、例えば、Schena編、Microarrays:A Practical Approach、IRL Press、Oxford(2000年)に概説されている。「アレイ分析」、「アレイによる分析」、又は「マイクロアレイによる分析」は、例えば、マイクロアレイを使用する1つ又は複数の生体分子の特定の核酸の単離又は配列分析等の分析を指す。
「非多型性」又は「多型不可知性」とは、選択核酸領域の検出に関して使用される場合、核酸領域の検出を意味し、これは1つ以上の多型を含んでいてもよいが、その検出は、その領域内の特定の多型の検出には依存しない。したがって、選択核酸領域は多型を含んでいてもよいが、本発明の方法を使用した領域の検出は、その領域の特定の多型の有無ではなく、領域の出現に基づく。
用語「オリゴヌクレオチド」又は「オリゴ」は、本明細書で使用される場合、ワトソン−クリックタイプの塩基対合、塩基スタッキング、及びフーグスティーン又は逆フーグスティーンタイプの塩基対合等の通常パターンのモノマー間相互作用により一本鎖ポリヌクレオチドと特異的に結合可能な、デオキシリボヌクレオチド、リボヌクレオチド、それらのアノマー形態、ペプチド核酸モノマー(PNA)、及びロックドヌクレオチド酸モノマー(LNA)等、又はそれらの組合せを含む、天然又は修飾核酸モノマーの直鎖オリゴマーを指す。通常、モノマーは、リン酸ジエステル結合又はその類似体により連結されて、サイズが、少数のモノマー単位、例えば8〜12個から、数十個のモノマー単位、例えば100〜200個以上の範囲のオリゴヌクレオチドを形成する。
本明細書で使用される場合、用語「ポリメラーゼ」は、別の鎖をテンプレートとして使用して、個々のヌクレオチドを共に連結し、鎖を長くする酵素を指す。2つの一般的なタイプのポリメラーゼ:DNAを合成するDNAポリメラーゼ及びRNAを合成するRNAポリメラーゼがある。これらの2つの種類の中には、テンプレートとして機能することができる核酸のタイプに応じて、及び形成される核酸のタイプに応じて、多数のサブタイプのポリメラーゼが存在する。
本明細書で使用される場合、「ポリメラーゼ連鎖反応」又は「PCR」は、過剰な非特異的DNAが存在する場合でさえ、特定の1片の標的DNAをin vitroで複製するための技法を指す。プライマーを標的DNAに加えると、プライマーは、ヌクレオチド及び典型的にはTaqポリメラーゼ等を使用して、標的DNAの複製を開始する。温度をサイクルさせることにより、標的DNAが、反復して変性及び複製される。他の無作為DNAと混合されている場合でさえ、標的DNAの単一コピーが増幅され、何十億個もの複製物を得ることができる。ポリメラーゼ連鎖反応を使用して、非常に少量のDNAを検出及び測定し、特注のDNAを生成することができる。幾つかの場合では、PCRの代わりに線形増幅法を使用してもよい。
用語「多型」は、本明細書で使用される場合、限定するものではないが、一塩基多型(SNP)、メチル化の相違、及びショートタンデムリピート(STR)等を含む、その特定の遺伝子座を示すことができる遺伝子座の任意の遺伝子変化を指す。
一般的に、「プライマー」は、ポリメラーゼ連鎖反応の合成ステップ又はある配列決定反応で使用されるプライマー伸長技法等、例えばDNAの伸長、ライゲーション、及び/又は合成を開始するために使用されるオリゴヌクレオチドである。プライマーは、特定の核酸領域を検出するための捕捉オリゴヌクレオチドに核酸領域の相補性を提供する手段として、ハイブリダイゼーション技法にも使用することもできる。
用語「研究ツール」は、本明細書で使用される場合、性質が学術的又は商業的である科学的調査に使用される本発明の任意の組成物又は方法を指し、これは薬学的な及び/又は生物学的な治療法の開発を含む。本発明の研究ツールは、治療用又は規制認可の対象になることが意図されていない。むしろ、本発明の研究ツールは、規制申請を支援するための情報をもたらす意図を持って実施される任意の活動を含む、そのような開発活動における研究及び支援を容易にするためのものである。
用語「選択核酸領域」は、本明細書で使用される場合、個々の染色体に対応する核酸領域を指す。選択核酸領域は、例えばハイブリダイゼーション及び/又は他の配列決定に基づく技術に基づいて、検出用の試料から直接単離及び濃縮してもよく、又は配列を検出する前に、試料をテンプレートとして使用して増幅してもよい。
用語「選択的増幅」及び「選択的に増幅する」等は、選択核酸領域の配列に対するオリゴのハイブリダイゼーションに、完全に又は部分的に依存する増幅手順を指す。ある選択的な増幅では、増幅に使用されるプライマーは、選択核酸領域に相補的である。他の選択的な増幅では、増幅に使用されるプライマーは、ユニバーサルプライマーであるが、増幅に使用される核酸の領域が目的の選択核酸領域に相補的である場合にのみ、産物をもたらす。
用語「配列決定する」及び「配列決定」等は、本明細書で使用される場合、一般的に、核酸のヌクレオチド塩基の順序を決定するために使用することができるありとあらゆる生化学的方法を指す。
用語「特異的に結合する」及び「特異的結合」等は、本明細書で使用される場合、結合パートナー(例えば、核酸プローブ又はプライマー、抗体等)について言及する場合、指定されたアッセイ条件下で統計的に有意な陽性シグナルの生成をもたらす。典型的には、相互作用は、不要な相互作用の結果として生成される任意のシグナル(バックグラウンド)の標準偏差の少なくとも2倍である検知可能なシグナルを連続的にもたらす。
用語「ユニバーサル」は、増幅手順を説明するために使用される場合、複数の増幅反応に単一のプライマー又は1セットのプライマーを使用することを指す。例えば、96個の異なる標的配列の検出では、テンプレートは全て、同一のユニバーサルプライマー結合配列を共有していてもよく、単一セットのプライマーを使用して96個の異なる配列を多重増幅することが可能になる。そのようなプライマーの使用は、複数の選択核酸配列を増幅するのに2つのプライマーしか必要としないという点で、多重化を非常に単純化する。用語「ユニバーサル」は、プライマー結合部位を説明するために使用される場合、ユニバーサルプライマーがハイブリダイズする部位である。また、ユニバーサルプライマー結合配列/プライマーの「セット」を使用してもよいことに注目すべきである。例えば、高度に多重化された反応では、単一のセットではなく、幾つかのセットのユニバーサル配列を使用することが有用であり得る。例えば、96個の異なる核酸は、第1のセットのユニバーサルプライマー結合配列を有していてもよく、第2の96個は、異なるセットのユニバーサルプライマー結合配列を有する等である。
本発明の基本
本発明は、X及びY染色体のコピー数変異体を特定するための改良方法を提供する。本発明の方法は、胎児の性別を決定するために、胎児のX染色体異数性、Y染色体異数性、又は性染色体モザイク現象の確率を評価するために、又は母体試料の汚染の可能性を決定するために有用である。幾つかの態様では、本発明の方法は、母体のX染色体異数性又はモザイク現象の検出にも有用である。
本発明のアッセイ法は、X染色体、及びY染色体、及び1つ又は複数の参照非性染色体(常染色体)に由来する選択核酸領域を選択的に濃縮することを含む。本発明の特徴的な利点は、限定するものではないが、ハイブリダイゼーション技法、デジタルPCR、及び好ましくはハイスループット配列決定技法を含む様々な検出技法及び定量技法を使用して、選択核酸領域を更に分析することができるということである。プライマーは、X及びY染色体に加えて任意の染色体の任意の数の選択核酸領域に対して設計することができる。選択核酸領域の特定及び定量前の増幅は必ずしも必要ではないが、検出前に限定的な増幅を行うことが好ましい。
本発明は、母体血液等の母体試料でコピー数変異を直接検出するために最近使用されている大規模並列ショットガン配列決定(例えば、ランダム配列決定)又はランダムデジタルPCRの使用等の、よりランダムな技法の改良である。前述の手法は、試料中のDNA断片の全て又は統計的に有意な集団を配列決定し、その後、断片を、それらの適切な染色体にマッピング又はその他の方法で関連付け若しくはアラインメントすることに依存する。その後、特定された断片を互いに、又は幾つかの他の参照(例えば、既知の正倍数性染色体対を有する試料)と比較して、特定の染色体のコピー数変異を決定する。ランダム又はショットガン配列決定法は、目的染色体領域に関して生成されるデータが、生成されるデータの少数を構成するに過ぎないため、本発明と比較して本質的に非効率的である。
試料中のDNAの非常に広範なサンプリングに依存する技法は、分析されるDNAの幅広い網羅範囲を提供するが、実際は、試料内に含まれているDNAを1×以下でサンプリングしている(つまり、サブサンプリング)。対照的に、本方法で使用される選択的な増幅及び/又は濃縮技法(ハイブリダイゼーション等)は、選択核酸領域のみの読み深度(depth of coverage)を提供し、それ自体、選択核酸領域の好ましくは2×以上の平均配列読み深度、より好ましくは100×以上の、200×以上の、250×以上の、500×以上の、750×以上の配列読み深度、又は更に好ましくは1000×以上の配列読み深度を有する選択核酸領域の「スーパーサンプリング」を提供する。
したがって、本発明のアッセイでは、定量のために分析した実質的に大多数の配列が、X及びY染色体並びに1つ又は複数の常染色体の1つ又は複数の選択核酸領域の存在に関する情報を提供する。本発明の方法は、目的染色体に由来せず、目的染色体の相対量に関する情報を提供しない多数の配列の分析を必要としない。
性染色体の検出及び定量
本発明は、母体試料中のX及びY配列の頻度を決定するための方法を提供する。それらの頻度は、例えば、胎児の性別を決定するために、及び/又はX染色体の異数性、Y染色体の異数性、及び/又は性染色体モザイク現象を特定するために使用することができる。試料は、母体血液試料(つまり全血、血清、又は血漿)等の、母体DNA及び胎児DNAを両方とも含む母体試料である。本方法では、試料に存在する胎児DNAの割合を考慮して、X及びY染色体配列の存在若しくは非存在及び/又は相対量若しくは頻度を決定するために使用されるX及びY染色体並びに1つ又は複数の常染色体に対応する、母体試料中の1つの領域又は好ましくは幾つかから多数の選択核酸領域が濃縮及び/又は単離及び増幅される。上記で詳細に記載されているように、本発明の方法は、好ましくは、試料中の選択核酸領域の含有量を高めるために、選択的な増幅、ライゲーション、又は濃縮ステップ(例えば、選択核酸領域に特異的にハイブリダイズする1つ又は複数の核酸を使用して)の1つ以上を使用する。選択的な増幅、ライゲーション、及び/又は濃縮ステップは、典型的には、更なる単離、増幅、及び分析のために、選択核酸領域のコピーを操作する機序を含む。この選択的手法は、他の技法、例えば大規模並列ショットガン配列決定に用いられるランダム増幅手法とは、そのような技術が一般的にゲノムの全て又はかなりの部分をランダム増幅することを含むため、全く対照的である。
ある態様では、本発明の方法は、母体モザイク現象を含む、母体異数性を特定することができる。母体X及びYの染色体物質の頻度は、母体試料中の胎児DNAを考慮して分析されなければならない。そのような母体異数性の確定リスク特性は、特定の異数性に応じて様々であり得る。例えば、母体がXX/XOモザイクである場合、決定される確率は、母体モザイク現象のレベル、影響を受ける組織、並びに母体試料中の胎児割合に依存することになる。
上記の例は、本明細書に記載の方法により、そのような低い割合で存在する特定の核酸を確実に検出しようとする場合、追加染色体の測定における変動は、追加染色体の増加割合よりも著しく小さくなければならないことを示す。
図1は、本発明による1つの方法100の単純化されたフローチャートである。第1のステップでは、母体試料が取得される(101)。母体試料は、母体核酸及び胎児核酸を両方とも含んでいる。母体試料は、胎児核酸及び母体核酸(例えば、DNA)を両方とも含む妊娠女性から採取される任意の試料であってよい。好ましくは、本発明で使用される母体試料は細胞を含んでおらず、静脈穿刺又は被験者から末梢試料を抽出するための他の標準的技法等の比較的非侵襲的手段により取得される。
次のステップ103では、X染色体、及びY染色体、及び少なくとも1つの常染色体(及び好ましくは複数の常染色体)の選択核酸領域に特異的なオリゴヌクレオチドプライマーを、母体試料中の選択核酸にアニーリングさせる。ステップ105では、オリゴヌクレオチドプライマーを使用して、選択核酸領域を選択的に増幅し、選択核酸領域のコピーを生成する。下記で詳細に記載されるように、選択核酸領域は、選択的増幅ステップに供されるが、選択的増幅ステップ前又は好ましくは選択的増幅ステップ後のいずれかに、ユニバーサル増幅ステップにも供される場合がある。加えて、下記に記載のように、1つ又は複数の濃縮ステップを実施してもよい。また、増幅の代替法として、選択的ハイブリダイゼーション等による濃縮ステップを実施してもよく、それにより、選択核酸領域は、試料中の他の核酸から分離される。
その後、ステップ107では、増幅された又は複製された選択核酸領域を配列決定及び定量する。好ましい実施形態では、下記に記載のように、ハイスループット配列決定技法又は次世代配列決定技法が使用されるが、任意選択で他の技法を使用してもよい。ハイスループット配列決定は、配列決定及び定量ステップの大規模並列化を可能にする。
ステップ109では、母体試料中の胎児DNA割合が決定される。次に、ステップ111では、X染色体及びY染色体の選択核酸領域の頻度が、ステップ109で決定された胎児DNA割合を考慮して決定される。本明細書に詳細に記載されているように、ステップ113では、胎児割合を考慮したX染色体及びY染色体の選択核酸領域の頻度は、女性胎児を妊娠している女性に由来する母体試料のX染色体異数性、X染色体モザイク現象、又はX染色体汚染から生じるもの等のX染色体頻度異常、及び/又はY染色体異数性、Y染色体モザイク現象、又はY染色体汚染から生じるもの等のY染色体頻度異常のリスクの評価を可能にする。
したがって、一般的に、X染色体の複数の遺伝子座に対応する選択核酸領域を検出及び合計して、母体試料中のX染色体の相対頻度が決定される。1つ又は複数の常染色体の複数の遺伝子座に対応する選択核酸領域を検出及び合計して、母体試料中の1つ又は複数の更なる染色体の相対頻度を決定し、それにより胎児割合の計算が可能になる。胎児割合が決定されたら、X染色体異常が存在するか否かを評価するために、胎児割合を考慮してX染色体の頻度を検討する。同様に、Y染色体の複数の遺伝子座に対応する選択核酸領域を検出及び合計して、母体試料中のY染色体の相対頻度を決定し、Y染色体異常が存在するか否かを評価するために、胎児割合を考慮してY染色体の頻度を検討する。
本発明の方法では、少なくとも3つの染色体:X染色体、Y染色体、及び少なくとも1つの常染色体の選択遺伝子座を表す複数の選択核酸領域が分析され、各選択核酸領域の相対頻度が分析され、独立して定量され、試料中の各選択核酸領域の相対頻度が決定される。試料中の選択核酸領域の合計は、試料中の胎児DNA割合を決定するために使用され、染色体異数性又は他の染色体異常がX及び/又はY染色体配列に関して存在するか否かを統計的に決定するために比較される。
別の態様では、各染色体の選択核酸領域のサブセットが分析され、染色体異常又は染色体頻度異常が存在するか否かが決定される。特定の染色体について選択核酸領域頻度を合計し、選択核酸領域の合計を使用して異常を決定することができる。本発明のこの態様では、各染色体の個々の選択核酸領域の頻度が合計され、次にX染色体の選択核酸領域の合計が1つ又は複数の非性染色体と比較され、Y染色体の選択核酸領域の合計が1つ又は複数の常染色体と比較される。無作為だが十分な数の選択核酸領域のサブセットを選択して、染色体異常が存在するか否かの決定をもたらす統計的に有意な結果を得ることができる。選択核酸領域の異なるサブセットの複合分析を母体試料で実施して、より高い統計能力を得ることができる。例えば、染色体Yに100個の選択核酸領域があり、2番染色体に100個の選択核酸領域がある場合、上記各染色体の100個未満の領域を評価する一連の分析を実施してもよい。例えば、30個未満の領域、16個以下の領域、10個未満の領域、又は8個の領域等の50個未満の領域を評価する一連の分析を実施してもよい。別の態様では、試料間の変動が少ないことが知られている各染色体にある特定の選択核酸領域を選択してもよいし、あるいは、例えば、試料内での頻度が非常に高いか又は非常に低い選択核酸領域のデータを無視することにより、染色体頻度の決定に使用されるデータを限定してもよい。
更に別の態様では、選択核酸領域の頻度の比率は、遺伝学的に正倍数性である被験者、つまりX染色体異常又はY染色体異常のない被験者の統計的に有意な集団で決定された参照平均比率と比較される。
母体試料中の胎児DNA割合を考慮してX及びY染色体の頻度を決定する方法は、胎児常染色体異数性のリスクを評価する技法、又は胎児の多型配列を検出する技法等の、他の非侵襲性出生前診断技法と組み合わせることができることが、当業者には理解されよう。
アッセイ法
本発明では、固定オリゴヌクレオチドのみで構成されるオリゴヌクレオチドのセットが使用されるアッセイ、又は固定オリゴヌクレオチド及び1つ又は複数の架橋オリゴヌクレオチドで構成されるオリゴヌクレオチドのセットが使用されるアッセイを含む、幾つかの異なるアッセイ法を使用することができる。加えて、セット中のオリゴヌクレオチドは、それらがライゲーションされ得る場合、互いに直接隣接して選択核酸配列にハイブリダイズしてもよく、又はセット中のオリゴヌクレオチドは、互いに直接隣接して選択核酸配列にハイブリダイズしなくともよい。したがって、ポリメラーゼ及びdNTPが使用されるプライマー伸長反応は、セット中のオリゴヌクレオチドのライゲーション前に使用される。図2〜7には、幾つかの例示的なアッセイ法が示されている。
図2には、2つの異なる選択核酸領域が単一のタンデム反応アッセイで検出される1つの例示的な方法実施形態が示されている。そのような方法実施形態、アッセイ系、及び関連実施形態は、以下の文献に詳細に記載されている:例えば、米国特許出願第13/013,732号明細書、2011年1月25日出願;第13/245,133号明細書、2011年9月26日出願;第13/205,570号明細書、2011年8月8日出願;第13/293,419号明細書、2011年11月10日出願;第13/205,409号明細書、2011年8月8日出願;第13/205,603号明細書、2011年8月8日出願;第13/407、978号明細書、2012年2月29日出願;第13/274,309号明細書、2011年10月15日出願;第13/316,154号明細書、2011年12月9日に出願;第13/338,963号明細書、2011年12月28日に出願。これらの文献は全て、全体が参照により本明細書に組み込まれる。2つの異なる選択核酸領域215、231に特異的にハイブリダイズする2セットの固定配列オリゴヌクレオチド(201及び203、223及び225)を、遺伝子試料に導入して(202)、対応する選択核酸領域にハイブリダイズさせる(204)。固定配列オリゴヌクレオチドの各セットは、配列特異的領域205、227、ユニバーサルプライマー領域209、及びインデックス領域221、235を有するオリゴヌクレオチド201、223を含む。セット中の他の固定配列オリゴヌクレオチドは、配列特異的領域207、229及びユニバーサルプライマー領域211を含む。固定配列オリゴヌクレオチドは、一般的に、約30〜200ヌクレオチド長、又は約30〜150ヌクレオチド長、又は約35〜120ヌクレオチド長、又は約40〜70ヌクレオチド長の範囲のサイズである。架橋オリゴヌクレオチドが使用される場合、架橋オリゴヌクレオチドは、一般的に、約4〜約80ヌクレオチド長、又は約4〜約60ヌクレオチド長、又は約5〜約50ヌクレオチド長、又は約7〜約40ヌクレオチド長、又は約10〜約40ヌクレオチド長、又は約12〜約30ヌクレオチド長、又は約15〜約25ヌクレオチド長の範囲のサイズである。
ハイブリダイゼーションの後、ハイブリダイズしなかった固定配列オリゴヌクレオチドは、試料の残りから分離されることが好ましい(ステップは非表示)。架橋オリゴ213、233を、固定配列オリゴヌクレオチド/核酸領域のハイブリダイズ対に導入し、これらの領域にハイブリダイズさせる(206)。図2には2つの異なる架橋オリゴヌクレオチドとして示されているが、実際は、同じ架橋オリゴヌクレオチドが、両ハイブリダイゼーション事象に好適であってもよく(配列が同じ又は実質的に類似していると仮定して)、又はそれらは、縮重配列オリゴヌクレオチドのプールに由来する2つのオリゴヌクレオチドであってもよい。ハイブリダイズしたオリゴヌクレオチドをライゲーションさせて(208)、各目的選択核酸領域にわたって伸長する相補的なひと続きの核酸を生成する。この特定の実施形態では、2つの固定配列オリゴヌクレオチド及び架橋オリゴヌクレオチドを使用して各選択核酸領域を増幅する方法が例示されているが、互いに直接隣接してハイブリダイズする2つの固定配列オリゴヌクレオチドのみが使用される方法を使用してもよく、又は互いに直接隣接してハイブリダイズしない2つの固定配列オリゴヌクレオチドのみが使用され、「ギャップ」がポリメラーゼ及びdNTPを使用して埋められる方法を使用してもよい。
ライゲーションの後、ユニバーサルプライマー217、219を導入して、ライゲーションしたオリゴヌクレオチドを増幅させ(210)、目的選択核酸領域の配列を含む増幅産物237、239を生成する(212)。試料中の選択核酸領域の存在及び量に関する情報を提供するために、これらの増幅産物237、239を、単離(任意選択)、検出(つまり、配列決定)、及び定量する。
数多くの増幅方法を使用して、本発明の方法で分析される選択核酸領域を選択的に増幅し、初期試料中の選択核酸領域の相対量の保存を可能にする様式で選択核酸領域のコピー数を増加させることができる。増幅及び分析の全ての組合せが本明細書に詳細に記載されているわけではないが、本明細書と矛盾しない、選択核酸領域を分析するための様々な同様の増幅法及び/又は分析法を使用することは、十分に当業者の技術範囲内にあり、そのような変法は、当業者であれば本開示に照らして自明であるはずである。
本発明に有用な増幅法には、限定するものではないが、以下のものが含まれる:ポリメラーゼ連鎖反応(PCR)(米国特許第4,683,195号明細書及び第4,683,202号明細書、及びTechnology:Principles and Applications for DNA Amplification、H.A.Erlich編、Freeman Press、NY、N.Y.、1992年に記載);リガーゼ連鎖反応(LCR、ligase chain reaction)(Wu及びWallace、Genomics、4巻:560頁(1989年);Landegrenら、Science、241巻:1077頁(1988年));鎖置換増幅(SDA、strand displacement amplification)(米国特許第5,270,184号明細書及び第5,422,252号明細書);転写媒介性増幅(TMA、transcription−mediated amplification)(米国特許第5,399,491号明細書);連鎖線形増幅(LLA、linked linear amplification)(米国特許第6,027,923号明細書)、自己持続的配列複製法(Guatelliら、PNAS USA、87巻:1874頁(1990年)及び国際公開第90/06995号);標的ポリヌクレオチド配列の選択的増幅(米国特許第6,410,276号明細書);コンセンサス配列プライムポリメラーゼ連鎖反応(CP−PCR、consensus sequence primed polymerase chain reaction)(米国特許第4,437,975号明細書);任意プライムポリメラーゼ連鎖反応(AP−PCR、arbitrarily primed polymerase chain reaction)(米国特許第5、413,909号明細書及び第5,861,245号明細書);及び核酸に基づく配列増幅(NASBA、nucleic acid based sequence amplification)(米国特許第5,409,818号明細書、第5,554,517号明細書、及び第6,063,603号明細書を参照。これらの各々は、参照により本明細書に組み込まれる)。使用することができる他の増幅方法には、以下のものが含まれる:Qbetaレプリカーゼ、PCT特許出願第PCT/US87/00880号に記載;SDA等の等温増幅法、Walkerら、Nucleic Acids Res.20巻(7号):1691〜6頁(1992年)に記載;及びローリングサークル増幅、米国特許第5,648,245号明細書に記載。使用することができる更に他の増幅方法は、米国特許第5,242,794号明細書、第5,494,810号明細書、第4,988,617号明細書、及び米国特許出願第09/854,317号明細書、及び米国特許出願公開第20030143599号明細書に記載されており、これらの各々は、参照により本明細書に組み込まれる。好ましい態様では、DNAは、多重化遺伝子座特異的PCRにより増幅される。幾つかの態様では、DNAは、アダプターライゲーション及び単一プライマーPCRを使用して増幅される。他の使用可能な増幅法には、バランス調整したPCR(Makrigiorgosら、Nat.Biotechnol.、20巻:936〜39頁(2002年))及び自己持続的配列複製法(Guatelliら、PNAS USA、87巻:1874頁(1990年))が含まれる。当業者であれば、そのような方法に基づいて、目的選択核酸領域に対する任意の好適な5’及び3’領域のプライマーを容易に設計することができる。そのようなプライマーは、その配列に目的選択核酸領域を含む限り、任意の長さのDNAの増幅に使用することができる。
選択核酸領域の長さは、選択核酸領域を互いに区別するための十分な配列情報を提供するのに十分な長さを有する。一般的に、選択核酸領域は、少なくとも約16ヌクレオチド長であり、より典型的には、選択核酸領域は、少なくとも約20ヌクレオチド長である。本発明の好ましい態様では、選択核酸領域は、少なくとも約30ヌクレオチド長である。本発明のより好ましい態様では、選択核酸領域は、少なくとも約32、40、45、50、又は60ヌクレオチド長である。本発明の他の態様では、選択核酸領域は、長さが約100、150、又は最大200であってもよい。
幾つかの態様において、選択的増幅プロセスでは、選択核酸領域に相補的な核酸を含むプライマー対を用いた1回又は少数回の増幅(つまり、配列特異的増幅プロセス)が使用される。他の態様では、選択的増幅は、初期線形増幅ステップ(これも配列特異的増幅プロセス)を含む。線形増幅法は、DNAの開始量が制限されている場合、特に有用であり得る。線形増幅は、DNA分子の量を、元のDNA含有量を示す様式で増加させ、それにより、選択核酸領域の正確な定量が必要な本発明等の場合のサンプリングエラーの低減が支援される。
したがって、好ましい態様では、限定的サイクル数の配列特異的増幅が、無細胞DNAを含む開始母体試料に対して実施される。サイクル数は、一般的に、典型的なPCR増幅に使用されるサイクル数よりも少なく、例えば、5〜30サイクル又はそれ以下である。
オリゴヌクレオチドのセット中のオリゴヌクレオチドは、配列特異的な様式で試料にハイブリダイズして、選択核酸領域を増幅するように設計される。選択的増幅用のプライマーは、好ましくは、1)目的染色体の選択核酸領域を効率的に増幅し、2)異なる母体試料中の母体供給源及び/又は胎児供給源からの発現が予測可能な範囲であり、かつ3)選択核酸領域に特異的である、つまり非選択核酸領域を増幅しないように設計される。プライマー又はプローブは、更なる単離又は分析のために増幅産物を精製することができるか又は固体基材(例えば、ビーズ又はアレイ)に結合させることができるように、5’末端を末端標識で(例えば、ビオチンで)、或いはプライマー又はプローブに沿って他所を修飾してもよい。好ましい態様では、プライマーは、例えば、複数のDNAコピーが、異なる選択核酸領域及び好ましくは選択核酸領域全てから単一反応で産生されるように、多数の選択核酸領域の増幅を可能にする多重化反応で使用するのに適合した融解温度を有するように作製されている。その後、選択的増幅に由来する増幅産物を、標準的PCR法又は線形増幅で更に増幅してもよい。
無細胞DNAを、例えば、妊娠女性に由来する全血、血漿、又は血清から単離し、目的染色体に対応する所定数の選択核酸領域を増幅するように作製されているプライマーと共にインキュベートしてもよい。好ましくは、X染色体特異的配列の初期増幅に使用されるプライマー対の数(したがって、X染色体の選択核酸領域の数)は8対以上、例えば16対以上、32対以上、48対以上、又は96対以上であり得る。同様に、Y染色体特異的配列の初期増幅に使用されるプライマー対の数(したがって、Y染色体の選択核酸領域の数)及び1つ又は複数の常染色体参照染色体の各々の初期増幅に使用されるプライマー対の数は8対以上、例えば16対以上、32対以上、48対以上、又は96対以上であり得る。プライマー対の各々は、単一の選択核酸領域に対応し、プライマー対には、任意選択で、識別用の(例えば、上記に記載のインデックスを使用することにより)及び/又は分離用の(例えば、捕捉のために使用される核酸配列又は化学部分を含む)タグが付加されている。限定数の、好ましくは10サイクル以下の増幅サイクルが実施される。その後、増幅産物(増幅された選択核酸領域)は、任意選択で、当技術分野で公知の方法により単離される。例えば、プライマーがビオチン分子に結合されている場合、増幅産物は、固体基材上のアビジン又はストレプトアビジンと結合させることにより単離することができる。その後、増幅産物を、他のプライマー(例えば、ユニバーサルプライマー)及び/又は配列決定及びハイブリダイゼーション等の検出技法を用いた更なる増幅等の、更なる生化学的プロセスに供してもよい。
ある系では、正規化(下記に記載のような)を使用して、選択核酸領域の増幅に由来する産物が試料の核酸含有量を正確に示すことができるため、増幅の効率は選択核酸領域間で及びサイクル間で変動してもよい。本発明の方法の1つの実施では、増幅産物の相対頻度に関するデータを利用し、試料内の選択核酸領域における変動、及び/又は異なる試料(特に、異なる試料中の同じ選択核酸領域に由来する)の選択核酸領域間の変動を含む、選択核酸領域における変動を決定して、データを正規化することができる。
選択的増幅の代わりとして、ハイブリダイゼーション技法(例えば、捕捉ハイブリダイゼーション又はアレイに対するハイブリダイゼーション)により、選択核酸領域を濃縮し、その後、任意選択で1回又は複数回の増幅を行ってもよい。任意選択で、ハイブリダイズされた又は捕捉された選択核酸領域は、増幅及び配列決定の前に解放される(例えば、変性により)。選択核酸領域は、分析に使用される選択核酸領域の選択的濃縮を可能にする種々の方法を使用して、母体試料から単離することができる。単離は、分析に使用されない母体試料中のDNAを除去すること、及び/又は初期濃縮又は増幅ステップで使用されたあらゆる過剰オリゴヌクレオチドを除去することであってもよい。例えば、選択核酸領域は、ハイブリダイゼーション技法(濃縮)を使用して、母体試料から単離することができ、例えば、ビーズ又はアレイ等の固体基材上の相補的オリゴに選択核酸領域を結合させて捕捉し、その後、未結合核酸を試料から除去することができる。別の例では、プレサークル型プローブ技法が、選択的増幅に使用される(例えば、Baranyら、米国特許第6,858,412号明細書及び第7,556,924号明細書、及び図7)。環状化された核酸産物は、選択的分解対象の線形核酸から単離することができる。他の有用な単離方法は、当業者であれば、本明細書を読むと明白であろう。
選択核酸領域の選択的に増幅されたコピーは、任意選択で、選択的増幅(又は濃縮ステップ)後、検出ステップ(つまり、配列決定又は他の検出技術)前又は検出ステップ中のいずれかにおいて、ユニバーサル増幅ステップで増幅してもよい。ユニバーサル増幅を実施する場合、選択的増幅ステップで複製された選択核酸領域に付加されたユニバーサルプライマー配列を使用して、選択核酸領域を単一のユニバーサル増幅反応で更に増幅する。記載されているように、ユニバーサルプライマー配列は、実施される場合、選択核酸領域の増幅されたコピーに、ユニバーサルプライミング配列が組み込まれるように、ユニバーサルプライマー配列を有するプライマーを選択的増幅ステップに使用することにより、選択的増幅プロセス中に、複製選択核酸領域に付加することができる。別法として、母体試料からの選択核酸領域の増幅又は濃縮及び実施される場合は単離後に、ユニバーサル増幅配列を含むアダプターを、選択核酸領域の末端にライゲーションすることができる。
バイアス及びばらつきが、DNA増幅中に試料に導入される場合がある。これは、ポリメラーゼ連鎖反応(PCR)中に起こることが知られている。増幅反応が多重化される場合、所与の選択核酸領域用プライマーの各セットは、プライマー及びテンプレートDNAの塩基組成、緩衝液条件、又は他の条件に基づいて挙動が異なる場合があるため、選択核酸領域が異なる速度又は効率で増幅する可能性がある。多重化アッセイ系のユニバーサルDNA増幅では、導入されるバイアス及びばらつきは、一般的には少ない。増幅バイアスを最小限に抑える別の技法は、異なる選択核酸領域毎にプライマー濃度を変えて、選択的増幅ステップでの配列特異的増幅サイクルの数を制限することを含む。増幅ステップでは、例えば、実験条件によりバイアス及びばらつきが不用意に導入されないことを保証するために、同じ又は異なる条件(例えば、ポリメラーゼ及び緩衝液等)を使用してもよい。
好ましい態様では、少数のサイクル(例えば、1〜10回、好ましくは、3〜5回)の選択的増幅又は核酸濃縮を実施し、その後、ユニバーサルプライマーを使用してユニバーサル増幅を行う。ユニバーサルプライマーが使用される増幅サイクルの数は様々であろう。しかし、好ましくは、少なくとも5サイクル、より好ましくは少なくとも10サイクル、更により好ましくは20サイクル以上であろう。1回又は少数の選択的増幅サイクル後にユニバーサル増幅に移行することにより、ある選択核酸領域が他のものよりも速い速度で増幅するバイアスが低減される。
任意選択で、本方法は、選択的増幅とユニバーサル増幅との間に、選択的増幅で特異的に増幅されないあらゆる過剰核酸を除去するステップを含む。選択的増幅に由来する産物は、その全体をユニバーサル増幅に使用してもよく、又はそのアリコートを使用してもよい。
本方法で使用されるプライマーのユニバーサル領域は、多数の核酸を1つの容器中の1つの反応で同時分析する従来の多重化法と適合するように設計される。そのような「ユニバーサル」プライミング法は、母体試料中に存在する核酸領域の量の効率的で大規模な分析を可能にし、そのような母体試料内の異数性を決定するための核酸領域の存在の包括的な定量を可能にする。
ユニバーサル増幅法の例には、限定するものではないが、Oliphantらの米国特許第7,582,420号明細書に記載のもの等の、多様な試料を同時に増幅及び/又は遺伝子型決定するために使用される多重化法が含まれる。この文献は、参照により本明細書に組み込まれる。
ある態様では、本発明のアッセイ系は、選択的増幅技法及びユニバーサル増幅技法の以下の組合せのうちの1つを使用する:(1)リガーゼ検出反応(「LDR」)とポリメラーゼ連鎖反応(「PCR」)との組合せ;(2)一次PCRと二次PCRとLDRの組合せ;及び(3)一次PCRと二次PCRの組合せ。これらの組合せの各々は、最適検出に特に有用である。しかしながら、これらの組合せの各々は、アッセイ系の初期相に由来するオリゴヌクレオチドプライマーが、アッセイ系の後期相で使用される配列を含む多重化検出を使用する。
Baranyらの米国特許第6,852,487号明細書、第6,797,470号明細書、第6,576,453号明細書、第6,534,293号明細書、第6,506,594号明細書、第6,312,892号明細書、第6,268,148号明細書、第6,054,564号明細書、第6,027,889号明細書、第5,830,711号明細書、第5,494,810号明細書には、様々な核酸試料中のヌクレオチドの特定の配列を検出するためのリガーゼ連鎖反応(LCR)アッセイの使用が記載されている。Baranyらの米国特許第7,807,431号明細書、第7,455,965号明細書、第7,429,453号明細書、第7,364,858号明細書、第7,358,048号明細書、第7,332,285号明細書、第7,320,865号明細書、第7,312,039号明細書、第7,244,831号明細書、第7,198,894号明細書、第7,166,434号明細書、第7,097,980号明細書、第7,083,917号明細書、第7,014,994号明細書、第6,949,370号明細書、第6,852,487号明細書、第6,797,470号明細書、第6,576,453号明細書、第6,534,293号明細書、第6,506,594号明細書、第6,312,892号明細書、及び第6,268,148号明細書には、核酸を検出するための、LDR及びPCRの組合せの使用が記載されている。Baranyらの米国特許第7,556,924号明細書及び第6,858,412号明細書には、核酸を検出するための、LDR及びPCRと組み合わせたプレサークルプローブ(「錠型(padlock)プローブ」又は「多反転(multi−inversion)プローブ」とも呼ばれる)の使用が記載されている。Baranyらの米国特許第7,807,431号明細書、第7,709,201号明細書、及び第7,198,814号明細書には、核酸配列を検出するための、エンドヌクレアーゼ切断及びライゲーション反応の組合せの使用が記載されている。Willisらの米国特許第7,700,323号明細書及び第6,858,412号明細書には、多重化核酸増幅、検出、及び遺伝子型決定におけるプレサークルプローブの使用が記載されている。Ronaghiらの米国特許第7,622,281号明細書には、固有のプライマー及びバーコードを含むアダプターを使用して核酸を標識及び増幅するための増幅技法が記載されている。選択核酸領域を増幅及び/又は検出するのに有用な例示的なプロセスには、限定するものではないが、本明細書に記載の方法が含まれ、それらの各々は、本発明の方法で使用することができる種々の要素を教示するために、それらの全体が参照により組み込まれる。
種々の増幅技法に加えて、数多くの配列決定法が、本発明の方法と適合する。好ましくは、そのような方法には、「次世代」配列決定法が含まれる。例示的な配列決定法には、限定するものではないが、以下のものが含まれる:ハイブリダイゼーションに基づく方法、例えばDrmanacの米国特許第6,864,052号明細書、第6,309,824号明細書、第6,401,267号明細書、及び米国特許出願公開第2005/0191656号明細書に記載のもの等、これらの文献は全て参照により組み込まれる;合成法による配列決定、例えば、Nyrenらの米国特許第7,648,824号明細書、第7,459,311号明細書、及び第6,210,891番号明細書;Balasubramanianの米国特許第7,232,656号明細書及び第6,833,246号明細書;Quakeの米国特許第6,911,345号明細書;Liら、PNAS、100巻:414〜19頁(2003年);ピロリン酸配列決定、Ronaghiら米国特許第7,648,824号明細書、第7,459,311号明細書、第6,828,100号明細書、及び第6,210,891号明細書に記載;及びライゲーションに基づく配列決定法、例えば、Drmanacらの米国特許出願公開第2010/0105052号明細書、及びChurchらの米国特許出願公開第2007/0207482号明細書及び第2009/0018024号明細書。
配列決定は、以下のもの等の、高次多重化で並列配列決定が可能な任意の好適な配列決定装置を使用して実施することができる:MiSeq(Illumina社)、Ion PGM(商標)(Life Technologies社)、Ion Torrent(商標)(Life Technologies社)、HiSeq(登録商標)2000(Illumina社)、HiSeq(登録商標)2500(Illumina社)、及び454プラットフォーム(Roche社)、Illumina Genome Analyzer(Illumina社)、SOLiD(登録商標)システム(Applied Biosystems社)、リアルタイムSMRT(登録商標)技術(Pacific Biosciences社)、及び好適なナノポア及び/又はナノチャネル配列決定装置等。
別法として、選択核酸領域は、ハイブリダイゼーション技法を使用して選択及び/又は特定することができる。検出用のポリヌクレオチドハイブリダイゼーションアッセイを実施するための方法は、当技術分野で十分に開発されている。ハイブリダイゼーションアッセイ手順及び条件は、用途に応じて様々であり、以下の文献に引用されているものを含む、既知の一般的な結合方法に従って選択されることになる:Maniatisら、Molecular Cloning:A Laboratory Manual(第2版、Cold Spring Harbor、N.Y.、1989年);Berger及びKimmel、Methods in Enzymology、152巻;Guide to Molecular Cloning Techniques(Academic Press,Inc.、サンディエゴ、カリフォルニア、1987年);並びにYoung及びDavis、PNAS、80巻:1194頁(1983年)。反復及び制御されたハイブリダイゼーション反応を実施するための方法及び装置は、例えば、米国特許第5,871,928号明細書、第5,874,219号明細書、第6,045,996号明細書、第6,386,749号明細書、及び第6,391,623号明細書に記載されている。
また、本発明は、ある好ましい態様では、リガンド間のハイブリダイゼーションのシグナル検出を企図する。以下の文献を参照されたい:米国特許第5,143,854号明細書、第5,578,832号明細書、第5,631,734号明細書、第5,834,758号明細書、第5,936,324号明細書、第5,981,956号明細書、第6,025,601号明細書、第6,141,096号明細書、第6,185,030号明細書、第6,201,639号明細書、第6,218,803号明細書、及び第6,225,625号明細書、米国特許出願第60/364,731号明細書、及びPCT出願PCT/US99/06097(国際公開第99/47964号として公開)。
シグナルを検出するための及び強度データを処理するための方法及び装置は、以下の文献に開示されている:例えば、米国特許第5,143,854号明細書、第5,547,839号明細書、第5,578,832号明細書、第5,631,734号明細書、第5,800,992号明細書、第5,834,758号明細書、第5,856,092号明細書、第5,902,723号明細書、第5,936,324号明細書、第5,981,956号明細書、第6,025,601号明細書、第6,090,555号明細書、第6,141,096号明細書、第6,185,030号明細書、第6,201,639号明細書、第6,218,803号明細書、及び第6,225,625号明細書、米国特許出願第60/364,731号明細書、及びPCT出願PCT/US99/06097(国際公開第99/47964号として公開)。
図3では、実質的に同じ配列特異的領域305、307を含むが、異なるインデックス321、323を含む、2つのセットの固定配列オリゴヌクレオチドが使用されている。ライゲーション反応は、同じ遺伝子試料300に由来する材料を用いるが、別々のチューブで、異なる対立遺伝子特異的オリゴヌクレオチドセットを用いて実施する。各ライゲーション反応において、選択核酸領域中の2つの考え得るSNP313、333に対応する架橋オリゴヌクレオチド313、333を使用して、選択核酸領域を検出する。SNPを示す2つの対立遺伝子インデックス321、323を使用して増幅産物を特定することができるため、目的核酸及びSNPの実際の配列の配列決定は必ずしも必要とされないが、これらの配列を更に決定して、対立遺伝子を特定及び/又は対立遺伝子の確認を提供してもよい。固定配列オリゴヌクレオチドの各々は、選択核酸領域に相補的な領域305、307、及び、初期選択及び/又は単離後に、異なる選択核酸領域を増幅するために使用されるユニバーサルプライマー配列309、311を含む。ユニバーサルプライマー配列は、固定配列オリゴヌクレオチド301、303、及び323の末端に位置してインデックス及び目的の核酸に相補的な領域に隣接し、したがって、増幅産物中の核酸特異的配列及び対立遺伝子インデックスは保存される。固定配列オリゴヌクレオチド301、303、323を、ステップ302で、遺伝子試料300の一部に導入して、選択核酸領域315又は325にハイブリダイズさせる。ハイブリダイゼーションの後、ハイブリダイズしなかった固定配列オリゴヌクレオチドは、遺伝子試料の残りから分離することが好ましい(非表示)。
A/T SNP313又はG/C SNP333に対応する架橋オリゴを、ステップ304で導入し、固定配列オリゴヌクレオチドの第1の核酸相補的領域305及び固定配列オリゴヌクレオチドの第2の核酸相補的領域307間の選択核酸領域315又は325の領域に結合させる。或いは、架橋オリゴ313、333を、固定配列オリゴヌクレオチドと同時に試料に導入してもよい。結合オリゴヌクレオチドを、ステップ306にて反応混合物中でライゲーションさせ、目的核酸領域にわたって伸長する相補的なひと続きのオリゴヌクレオチドを生成する。また、幾つかのアッセイでは、目的の非多型性(又は多型不可知性)核酸領域及び目的の多型核酸領域を両方とも、単一アッセイで調査することができるため、幾つかの架橋オリゴヌクレオチドは多型特異的であり、幾つかは多型特異的ではない場合があることに留意すべきである。
ライゲーションの後、個々の反応物を、好ましくは、ユニバーサル増幅及び検出ステップのために混合する。ユニバーサルプライマー317、319を、ステップ308で混合反応物に導入して、ライゲーションされたオリゴヌクレオチドを増幅し、ステップ310で、選択核酸領域中のSNPを表す目的核酸領域の配列を含む産物327、329を生成する。産物327、329は、対立遺伝子インデックスを特定することにより産物又は産物の部分、選択核酸領域に由来するSNPを含有する産物の領域、又はその両方を配列決定することにより検出及び定量される。好ましくは、図3の方法の産物は、対立遺伝子インデックスの次世代配列決定法により検出及び定量され、したがって、選択核酸領域に相補的な産物の領域又は産物全体の実際の配列を決定する必要性が不要になる。しかしながら、他の態様では、選択核酸領域に相補的な産物のインデックス及び領域の両方の配列を決定して、例えば、結果の確認を提供することが望ましい場合がある。
図3の方法では(及び他の図に示されている方法では)、対立遺伝子インデックスが説明されている。しかしながら、321及び323に示されているインデックスは、対立遺伝子インデックス、試料インデックス、対立遺伝子及び試料インデックス混合物、遺伝子座インデックス、又は本明細書に記載の、若しくは当技術分野において使用されている任意の他のインデックス又はインデックスの組合せであってもよい。
更に、架橋オリゴヌクレオチドの代わりに、固定配列オリゴヌクレオチドに特徴的なヌクレオチドが配置されている方法を使用してもよい。したがって、そのような例示的アッセイ系では、対立遺伝子インデックスは、対立遺伝子特異的固定配列オリゴヌクレオチドと結合し、対立遺伝子検出は、対立遺伝子インデックスの配列決定からもたらされる。対立遺伝子インデックスは、対立遺伝子特異的な第1の配列オリゴヌクレオチド又は第2の固定配列オリゴヌクレオチドのいずれに埋め込まれていてもよい。特定の態様では、対立遺伝子インデックスは、選択核酸領域内の2つ以上の多型を検出するために、第1及び第2の固定配列オリゴヌクレオチドの両方に存在する。そのような態様で使用される固定配列オリゴヌクレオチドの数は、選択核酸領域について評価されている考え得る対立遺伝子の数に対応していてもよく、対立遺伝子インデックスの配列決定は、遺伝子試料中の特定の対立遺伝子の存在、量、又は非存在を検出することができる。
図4には、本発明のこの態様が示されている。図4では、3つの固定配列オリゴヌクレオチド401、403、及び423が使用されている。固定配列オリゴヌクレオチド401、423の2つは、対立遺伝子特異的であり、例えば、それぞれA/T又はG/C SNPを含む核酸領域の対立遺伝子に相補的な領域を含む。また、対立遺伝子特異的固定配列オリゴヌクレオチド401、423の各々は、対応する対立遺伝子インデックス421、431、及びユニバーサルプライマー配列409も含む。第2の固定配列オリゴヌクレオチド403は、第2のユニバーサルプライマー配列411を有し、これらのユニバーサルプライマー配列は、選択核酸領域を増幅し、オリゴヌクレオチドのセットの遺伝子試料に由来する選択核酸領域のハイブリダイゼーション及びライゲーションに使用される。ユニバーサルプライマー配列は、固定配列オリゴヌクレオチド401、403、及び423の末端に位置して目的選択核酸領域に相補的な固定配列オリゴヌクレオチドのインデックス及び領域に隣接し、したがって、任意のユニバーサル増幅法の産物中の核酸特異的配列及びインデックスを捕捉する。
固定配列オリゴヌクレオチド401、403、423を、ステップ402で、遺伝子試料400に導入し、選択核酸領域415、425にハイブリダイズさせる。ハイブリダイゼーションの後、ハイブリダイズしなかった固定配列オリゴヌクレオチドは、遺伝子試料の残りから分離することが好ましい(非表示)。架橋オリゴ413を導入して、第1の対立遺伝子特異的固定配列オリゴヌクレオチド領域405と他の固定配列オリゴヌクレオチド領域407との間の領域の核酸415に、又は第2の対立遺伝子特異的固定配列オリゴヌクレオチド領域435と他の固定配列オリゴヌクレオチド領域407との間の領域に相補的な核酸425にハイブリダイズさせる(404)。或いは、架橋オリゴヌクレオチド413を、固定配列オリゴヌクレオチドのセットと同時に試料に導入してもよい。図3に関連して上述したように、目的の非多型性(又は多型不可知性)核酸領域及び目的の多型核酸領域は両方とも、単一アッセイで調査することができるため、幾つかのアッセイでは、オリゴヌクレオチドの幾つかのセットは多型特異的であり、幾つかは多型特異的ではない場合があることに留意すべきである。
選択核酸領域にハイブリダイズしたオリゴヌクレオチドを、ステップ406でライゲーションさせて、目的選択核酸領域にわたって伸長する相補的なひと続きのオリゴヌクレオチドを生成する。ライゲーションは、主に、対立遺伝子特異的固定配列オリゴヌクレオチドの対立遺伝子特異的末端が、選択核酸領域中のSNPに相補的である場合にのみ生じる。ライゲーション後、ユニバーサルプライマー417、419を導入して、ステップ408で、ライゲーションされたオリゴヌクレオチドを増幅し、目的核酸領域の配列を含む産物427、429をステップ410で生成する。これらの産物427、429は、産物の全て又は一部、特に、選択核酸領域及び/又は対立遺伝子インデックスにSNPを含有する産物の領域を配列決定することにより検出及び定量される。ここでは、対立遺伝子特異的ヌクレオチドは、対立遺伝子特異的固定配列オリゴヌクレオチドの末端にあるように示されているが、対立遺伝子特異的ヌクレオチドは、そのように配置されている必要はない。しかしながら、ライゲーションを対立遺伝子特異的にするためには、対立遺伝子を特定するヌクレオチドは、ライゲーション末端付近に存在しなければならない。典型的には、対立遺伝子特異的ヌクレオチドは、ライゲーション末端の5ヌクレオチド以内に存在しなければならない。好ましい態様では、対立遺伝子特異的ヌクレオチドは、最後から二番目か又は最後の(端末の)ヌクレオチドである。
本発明のアッセイの更に別の例では、対立遺伝子検出は、遺伝子座インデックスをアレイにハイブリダイゼーションさせることによりもたらされる。各対立遺伝子は、ユニバーサル増幅中に、対立遺伝子特異的な標識化ステップにより検出され、このステップにおいて、各対立遺伝子は例えば分光法的に特徴的な蛍光標識で標識される。図5には、本発明のこの態様が示されている。図5では、3つの固定配列オリゴヌクレオチド501、503、及び523が使用されている。固定配列オリゴヌクレオチド501、523の2つは、対立遺伝子特異的であり、各々は、同じ選択核酸領域の異なる対立遺伝子と一致する領域、遺伝子座インデックス521、及び対立遺伝子特異的ユニバーサルプライマー配列509、539を含む。第3の非対立遺伝子特異的固定配列オリゴヌクレオチド503は、別のユニバーサルプライマー配列511を含む。オリゴヌクレオチドのハイブリダイゼーション及びライゲーション後に、ユニバーサルプライマー配列を使用して選択核酸領域を増幅する。各対立遺伝子を識別する標識が、増幅産物に組み込まれる。上記の例と同様に、ユニバーサルプライマー配列は、固定配列オリゴヌクレオチド501、503、523の近位末端に位置し、したがって、任意のユニバーサル増幅法の産物の対立遺伝子特異的配列及びインデックスを捕捉する。固定配列オリゴヌクレオチド501、503、523を、ステップ502で、遺伝子試料500に導入し、選択核酸領域515、525に特異的に結合させる。ハイブリダイゼーションの後、ハイブリダイズしなかった固定配列オリゴヌクレオチドは、遺伝子試料の残りから分離することが好ましい(非表示)。架橋オリゴ513を導入し、ステップ504で、第1の(対立遺伝子特異的)固定配列オリゴヌクレオチド505及び第2の(非対立遺伝子特異的)固定配列オリゴヌクレオチド507間の、及び第1の(対立遺伝子特異的)固定配列オリゴヌクレオチド535及び第2の(非対立遺伝子特異的)固定配列オリゴヌクレオチド507間の、選択核酸領域515、525の領域に結合させる。或いは、架橋オリゴ513を、固定配列オリゴヌクレオチドと同時に、試料に導入してもよい。
結合オリゴヌクレオチドを、ステップ506でライゲーションさせて、目的選択核酸領域にわたって伸長する相補的なひと続きのオリゴヌクレオチドを生成する。ライゲーションは、主に、対立遺伝子特異的末端が一致する場合に生じる。ライゲーション後、ユニバーサルプライマー517、519、537を導入し、ステップ508で、ライゲーションしたオリゴヌクレオチドを増幅し、ステップ510で目的選択核酸領域の配列を含む産物527、529を生成する。ユニバーサルプライマー517及び537は、分光法的に特徴的な蛍光標識を有しており、そのため対立遺伝子特異的情報が捕捉され、これらの蛍光標識により測定することができる。産物527、529は、遺伝子座インデックス521をアレイにハイブリダイゼーションさせ、画像化することにより検出及び定量される。図4に関して記載されているように、ライゲーション506は、好ましくは対立遺伝子に特異的であり、したがって、特徴的ヌクレオチドは、対立遺伝子特異的固定配列オリゴヌクレオチドの末端から少なくとも5ヌクレオチド以内に位置し、好ましくは、最後から二番目又は最後のヌクレオチドとして配置されることに留意することが重要である。遺伝子座インデックスが、アレイに対するハイブリダイゼーションに使用される図5に示される例は、固定配列オリゴヌクレオチド及び架橋オリゴヌクレオチドが隣接してハイブリダイズせず、ポリメラーゼ及びdNTPがオリゴヌクレオチド間の「ギャップ」を埋め、その後ライゲーションするために使用される方法等の、本明細書に記載の種々の方法のいずれかで使用することができる。同様に、遺伝子座インデックス/ハイブリダイゼーション法は、固定配列オリゴヌクレオチドのみが使用される、つまり、架橋オリゴヌクレオチドが存在せず、固定配列オリゴヌクレオチドが、隣接してハイブリダイズし、ライゲーションにより結合されるか、又は固定配列オリゴヌクレオチドが、それらの間にギャップが生成させるようにハイブリダイズし、ポリメラーゼ及びdNTPを使用して結合され、その後ライゲーションされるプロトコールで使用することができる。
代替的な態様では、対立遺伝子インデックスは、所与の対立遺伝子の各固定配列オリゴヌクレオチドの対応する分光法的に特徴的な蛍光標識を使用して、各固定配列オリゴヌクレオチドの末端で多型を検出するように、第1及び第2の固定配列オリゴヌクレオチドの両方に存在する。この方法では、固定配列オリゴヌクレオチドの数は、選択核酸領域について評価されている考え得る対立遺伝子の数に対応する。上述した図及び例では、固定配列オリゴヌクレオチドは、2つの別個のオリゴヌクレオチドとして表されている。別の態様では、固定配列オリゴヌクレオチドは、同じオリゴヌクレオチドの反対側末端であってもよい(例えば、図7、上記を参照)。
上述の態様では、使用される架橋オリゴは、固定配列及び架橋オリゴヌクレオチドが特異的にハイブリダイズする際に、ライゲーションのために互いに直接隣接するように、固定配列オリゴヌクレオチドに相補的な領域に隣接する目的核酸の領域にハイブリダイズする。しかしながら、他の態様では、架橋オリゴは、固定配列オリゴの1つ又は両方に相補的な領域に直接隣接しない領域にハイブリダイズし、固定配列オリゴの1つ又は複数の伸長に必要な中間ステップが、ライゲーションの前に必要である。例えば、図6に示されているように、オリゴヌクレオチドの各セットは、好ましくは、2つの固定配列オリゴヌクレオチド601、603、及び1つ又は複数の架橋オリゴヌクレオチド613を含有する。固定配列オリゴヌクレオチドの各々は、選択核酸領域に相補的な領域605、607、及び好ましくはユニバーサルプライマー配列609、611、つまり、ユニバーサルプライマーに相補的なオリゴヌクレオチド領域を含む。ユニバーサルプライマー配列609、611は、固定配列オリゴヌクレオチド601、603の末端に又は末端付近に位置し、したがって、任意のユニバーサル増幅法の産物中の核酸特異的配列を捕捉する。
固定配列オリゴヌクレオチド601、603を、ステップ602で、遺伝子試料600に導入し、目的選択核酸領域615に相補的な部分に特異的に結合させる。ハイブリダイゼーションの後、ハイブリダイズしなかった固定配列オリゴヌクレオチドは、遺伝子試料の残りから分離することが好ましい(非表示)。その後、架橋オリゴヌクレオチドを導入し、ステップ604で、第1の固定配列オリゴヌクレオチド601及び第2の固定配列オリゴヌクレオチド603間の選択核酸領域615の領域に結合させる。或いは、架橋オリゴヌクレオチドは、固定配列オリゴヌクレオチドと同時に試料に導入してもよい。ここで示した例示的な態様では、架橋オリゴヌクレオチドは、第1の固定配列オリゴヌクレオチド領域605に直接隣接する領域にハイブリダイズするが、第2の固定配列オリゴヌクレオチド607の相補的領域とは1つ又は複数のヌクレオチドで隔てられている。固定配列及び架橋オリゴヌクレオチドのハイブリダイゼーション後、架橋オリゴヌクレオチド613を、ステップ606で、例えば、ポリメラーゼ及びdNTPを使用して伸長させ、架橋オリゴヌクレオチド613及び第2の固定配列オリゴヌクレオチド603間のギャップを埋める。伸長した後、ハイブリダイズしたオリゴヌクレオチドを、ステップ608でライゲーションさせて、目的選択核酸領域615にわたって伸長する相補的なひと続きのオリゴヌクレオチドを生成する。ライゲーション後、ユニバーサルプライマー617、619を、ステップ610で導入して、ライゲーションされたオリゴヌクレオチドを増幅し、ステップ612で目的核酸領域の配列を含む産物623を生成する。これらの産物623を、単離、検出、及び定量して、遺伝子試料中の選択核酸領域の存在及び量に関する情報を提供する。好ましくは、産物は、対立遺伝子インデックス621の次世代配列決定により、又はその代わりに、増幅産物623内の目的選択核酸615に相補的な増幅産物の部分の配列決定により、検出及び定量される。
図7には、固定配列オリゴヌクレオチドが、どのようにして同一分子の一部であり得るかが示されている。特定の態様では、単一固定配列オリゴヌクレオチド701は、両末端が選択核酸領域715に相補的である。この単一固定配列オリゴヌクレオチド701は、選択核酸領域715にハイブリダイズする際に、末端が幾つかのヌクレオチドにより隔てられているプレサークルオリゴヌクレオチド703を形成する。その後、架橋オリゴヌクレオチド713が、プレサークルオリゴヌクレオチド703の相補的領域705、707間に結合して、このギャップを埋める。その後、遺伝子試料715に結合したプレサークルオリゴヌクレオチド703のオリゴヌクレオチド領域705、707は、架橋オリゴヌクレオチド713と共にライゲーションされて、完全な環を形成する。本明細書で例示されている他の方法と同様に、架橋オリゴヌクレオチドの使用は必要ではないため、そのような実施形態では、固定配列オリゴヌクレオチドは、隣接してハイブリダイズしてもよく、又は固定配列オリゴヌクレオチドが隣接してハイブリダイズしない場合は、ポリメラーゼ及びdNTPを使用してギャップを埋めることができる。環状テンプレートは、好ましくは切断され、ユニバーサルプライマー部位の1つ又は複数を使用して増幅される。特定の態様では、Lizardiらの米国特許第6,558,928号明細書に開示されているように、単一のユニバーサルプライマー領域を使用し、ローリングサークル複製法等の技法を使用してテンプレートを複製する。
図7に示されているように、固定配列オリゴヌクレオチドは、環状テンプレート上の2つのユニバーサルプライミング部位709、711、及び任意選択で、選択核酸領域に相補的な構築物の末端間の1つ又は複数のインデックス721を有する。ここに示されているように、切断部位723は、2つのユニバーサルプライミング部位間に存在する。構築物701を、ステップ702で遺伝子試料に導入し、目的選択核酸領域にハイブリダイズさせ、架橋オリゴヌクレオチドを、ステップ704で導入し、選択核酸領域にハイブリダイズさせる。その後、ステップ706で、架橋オリゴ713にライゲーションさせることにより構築物を環状化し、ヌクレアーゼを使用して、全て又はほとんどの未環状化オリゴヌクレオチドを除去することができる。未環状化オリゴヌクレオチドを除去した後、環状化オリゴヌクレオチドを切断して、ユニバーサルプライミング部位709、711を保存し、幾つかの態様では露出させる。ステップ708で、ユニバーサルプライマー717、719を導入し、ユニバーサル増幅を生じさせ(710)、目的選択核酸領域の配列を含む増幅産物725を生成する(712)。例えば、選択核酸領域に又はその代わりにインデックスに相補的な産物の部分の次世代配列決定により、産物725を検出及び定量し、それにより、構築物全体を配列決定する必要性を不要にする。しかしながら、他の態様では、インデックスが試料情報を提供し、選択核酸領域に関する情報を提供しない場合は、インデックス及び選択核酸領域の両方の配列を含む産物を決定して、例えば、結果の内部確認を提供することが望ましい。上記で言及されているように、この単一固定配列オリゴヌクレオチド法は、図2〜7の例のいずれにも適用することができる。また、ここでも、幾つかのアッセイでは、目的の非多型性(又は多型不可知性)核酸領域及び目的の多型核酸領域を両方とも、単一アッセイで調査することができるため、幾つかのセットのオリゴヌクレオチドは多型特異的であり、幾つかは多型特異的ではない場合があることに留意すべきである。
本発明の方法におけるインデックスの使用
上記で図2〜7に関して説明されているように、ある態様では、セット中の固定配列オリゴヌクレオチドは、1つ又は複数のインデックスであって、例えば、選択核酸領域を特定する(遺伝子座インデックス)、選択核酸領域内のSNPを特定する(対立遺伝子インデックス)、及び/又は分析されている特定の試料(試料インデックス)を特定するインデックスを含む。例えば、1つ又は複数の遺伝子座インデックスの検出は、下記に記載のように選択核酸領域全体を検出するための代用としての役目を果たすことができるか、又はインデックスの検出は、インデックスの配列、及び核酸領域自体に相補的なオリゴヌクレオチド産物の配列が両方とも決定される場合、特定の選択核酸領域の存在の確認としての役目を果たすことができる。インデックスは、好ましくは、インデックス、及び選択核酸領域に特異的にハイブリダイズする領域(すなわち、選択核酸領域特異的配列)を両方とも含むプライマーを用いた選択的増幅ステップ中に、選択核酸領域に結合する。
インデックスは、典型的には、プライマーを使用して単離及び/又は増幅された選択核酸領域に関連する情報を提供するための、増幅プライマー内で使用される非相補的で固有の配列である。インデックスの順序及び配置並びにインデックスの長さは様々であってもよく、インデックスは、種々の組合せで使用することできる。別法として、初期選択的増幅後に、これらの配列を含むアダプターのライゲーションを使用して、インデックス及び/又はユニバーサル増幅配列を、選択的に増幅された選択核酸領域に付加することができる。インデックスを使用する利点は、選択核酸領域の存在(及び最終的には量又は頻度)を得るために、選択核酸領域の全長を配列決定する必要がないということであるが、ある態様では、そうすることが望ましい場合がある。しかしながら、一般的に、1つ又は複数のインデックスを特定することにより選択核酸領域を特定及び定量する能力は、特に、配列決定プライマーが位置する場所の近位にある単離された選択核酸領域の3’又は5’末端でインデックス配列が捕捉される場合、必要とされる配列決定の長さを減少させるであろう。また、より長い配列決定読取りはエラーをより導入しやすいため、選択核酸領域を特定するための代用としてのインデックスの使用は、配列決定エラーを低減することができる。また、図5に関して上記で説明されているように、遺伝子座インデックスは、例えば蛍光標識と共に使用して、アレイに対するハイブリダイゼーションにより選択核酸領域を特定及び定量することができる。
インデックスの1つの例では、選択核酸領域の選択的増幅に使用されるプライマーは、選択核酸領域に相補的な領域とユニバーサル増幅プライマー部位との間に遺伝子座インデックスを含むように設計されている。遺伝子座インデックスは、典型的には各選択核酸領域に固有であり、そのため、特定の遺伝子座インデックスが試料において生じる回数の定量を、対応する単一核酸領域の相対的コピー数、及び単一核酸領域を含有する特定の染色体と関連付けることができる。一般的に、遺伝子座インデックスは、既知の各単一核酸領域を固有に標識するのに十分な長さを有する。例えば、本方法が、192個の既知単一核酸領域を使用する場合、少なくとも192個の固有な遺伝子座インデックスが存在し、各々は、染色体の特定の遺伝子座に由来する単一の核酸領域を固有に特定する。本発明の方法で使用される遺伝子座インデックスは、単一染色体に存在する異なる単一核酸領域、並びに試料内の異なる染色体に存在する既知の単一核酸領域を示すことができる。遺伝子座インデックスは、配列決定中の1つ又は複数の塩基の欠失、置換、又は挿入の検出を含む配列決定エラー、並びにオリゴ合成、増幅、又は本方法の任意の他の態様等の、配列決定以外で生じる場合があるヌクレオチド変化の特定及び補正を可能にする追加のヌクレオチドを含有していてもよい。
別の例では、選択核酸領域の増幅に使用されるプライマーは、選択核酸領域に相補的な領域とユニバーサル増幅プライマー部位との間に対立遺伝子インデックス(遺伝子座インデックスの代替)を提供するように設計されていてもよい。対立遺伝子インデックスは選択核酸領域の特定の対立遺伝子に固有であり、そのため、特定の対立遺伝子インデックスが試料において生じる回数の定量を、その対立遺伝子の相対的コピー数と関連付けることができ、特定の選択核酸領域用の対立遺伝子インデックスの合計を、選択核酸領域を含有する特定の染色体のその選択核酸領域の相対的コピー数と関連付けることができる。多型特異的オリゴヌクレオチドセット、及び多型不可知性又はSNP不可知性オリゴヌクレオチドセットが両方とも単一のアッセイで使用される実施形態では、対立遺伝子インデックス及び遺伝子座インデックスの両方を使用してもよい。
更に別の例では、選択核酸領域の増幅に使用されるプライマーは、選択核酸領域に相補的な領域とユニバーサル増幅プライマー部位との間に識別インデックスを提供するように設計されていてもよい。そのような態様では、試料中の各増幅分子を固有に特定するのに十分な数の識別インデックスが存在する。識別インデックス配列は、好ましくは、6ヌクレオチド長以上である。好ましい態様では、識別インデックスは、各分子を単一核酸領域特異的に標識する統計的確率を有する十分な長さを有する。例えば、特定の単一核酸領域が3000コピーある場合、特定の単一核酸領域の各コピーが、固有の識別インデックスで標識される可能性が高くなるように、3000個を大幅に超える識別インデックスが存在する。他のインデックスの場合と同様に、識別インデックスは、配列決定中の1つ又は複数の塩基の欠失、置換、又は挿入の検出を含む配列決定エラー、並びにオリゴ合成、増幅、及びアッセイの任意の他の態様等の、配列決定以外で生じる場合があるヌクレオチド変化の特定及び補正を可能にする追加のヌクレオチドを含有していてもよい。
識別インデックスを任意の他のインデックスと組み合わせて、2つの特性に関する情報を提供する1つのインデックスを生成してもよい。また、識別遺伝子座を使用して、試料に由来する選択核酸領域の初期単離の下流で生じる増幅バイアスを検出及び定量することができ、このデータは、試料データの正規化に使用することができる。
本明細書に記載の他のインデックスに加えて、補正インデックスを使用してもよい。補正インデックスとは、配列決定中の1つ又は複数の塩基の欠失、置換、又は挿入の検出、並びにオリゴヌクレオチド合成、増幅、又はアッセイの他の態様等の、配列決定以外で生じる場合があるヌクレオチド変化の検出を含む、増幅エラー、配列決定エラー、又は他の実験エラーの補正を可能にする短いヌクレオチド配列である。補正インデックスは、別々の配列である独立型インデックスであってもよく、又は使用される実験技法の精度の確認を支援するために、他のインデックス内に埋め込まれていてもよく、例えば、補正インデックスは、遺伝子座インデックス又は識別インデックスの配列のサブセットであってもよい。
幾つかの態様では、選択核酸領域が単離される試料を示すインデックスを使用して、多重化アッセイ系で選択核酸領域の供給源を特定する。そのような態様では、1つの個体に由来する選択核酸領域は、特定の固有な試料インデックスに割り当てられ、関連付けられる。したがって、試料インデックスを使用して、単一反応容器中で(つまり、試料をプールした場合)異なる試料を多重化するための核酸領域特定を支援することができ、各試料をその試料インデックスに基づいて特定することができる。好ましい態様では、一連の試料中の各試料に固有な試料インデックスが存在し、試料は、配列決定中にプールされる。例えば、12個の試料が、単一配列決定反応のためにプールされる場合、少なくとも12個の固有な試料インデックスが存在し、各試料は固有に標識される。配列決定ステップを実施した後、各試料の各選択核酸領域の頻度を決定する前に、及び各試料に染色体異常が存在するか否かを決定する前に、まず、配列決定データは、好ましくは試料インデックスにより分別される。
試料内変動最小化
混合試料中の染色体異常を検出することに伴う1つの困難は、多くの場合、染色体異常を有する細胞タイプに由来するDNA(つまり、胎児DNA)が、正倍数性細胞タイプに由来するDNA(つまり、母体DNA)よりもはるかに少量で存在するということである。胎児無細胞DNA及び母体無細胞DNAを含有する母体試料の場合、全無細胞DNAに対する無細胞胎児DNAの割合は、1パーセント未満〜40パーセントと様々であり得、最も一般的には20パーセント以下で、多くの場合は10パーセント以下の頻度で存在する。例えば、そのような混合母体試料の胎児DNAにおけるY染色体異数性の検出では、Y染色体配列の相対的増加は、胎児が正常な男性であればY配列の推定割合の倍数であり、したがって、一例として胎児DNAが全体の5%である混合試料中の全DNAの割合としては、全体に対するY染色体寄与の増加の割合は5%の1/47である(試料中の全DNA割合の0.11%)。本明細書に記載の方法によりこの差異を確実に検出しようとする場合、Y染色体の測定における変動は、Y染色体の増加割合よりもはるかに小さくなければならない。
幾つかの態様では、染色体の1つ又は複数の選択核酸領域の測定量は、アッセイ系の変動(例えば、温度差及び試薬ロット差)、試料の基本的生物学的特徴変動(例えば、核酸含有量)、作業者間の差の変動、又は任意の他の変数の変動等の、供給源に由来する既知の変動を考慮するために正規化される。更に、選択核酸領域の頻度を決定するために使用するデータは、実験エラーによると考えられる異常値データ、又は特定の試料内の特発性遺伝子バイアスに基づきレベルが上昇又は低下した異常値データを除外してもよい。1つの例では、合計に使用されるデータは、1つ又は複数の試料中の特に高い頻度を有する核酸領域を除外してもよい。別の例では、合計に使用されるデータは、1つ又は複数の試料で特に存在量が低いことが見出された選択核酸領域を除外してもよい。
試料間の、及び/又は試料内の選択核酸領域の変動は、分析方法の組合せを使用して最小限に抑えることができる。例えば、変動は、アッセイに内部標準を使用することにより減少する。内部標準の一例は、「正常な」存在量で存在する染色体(例えば、常染色体の二染色体)を使用して、異常な存在量で同じ試料中に存在する場合があるX及びY染色体、つまり異数性又は微量夾雑物を比較することである。単一のそのような「正常」染色体を標準染色体として使用することが十分な場合もあるが、定量の統計能力を高めるために、2個〜数個の常染色体を内部標準染色体として使用することが望ましい。
内部標準の1つの使用は、染色体比と呼ばれる、試料中の常染色体の存在量に対する、異常であると推定されるX及び/又はY染色体頻度の存在量の比を計算することである。染色体比を計算する場合、各染色体の選択核酸領域の各々の存在量又は計数を共に合計して、各染色体の総計数を計算する。その後、一個の染色体の総計数を、異なる染色体の総計数で除算して、それら2つの染色体の染色体比を生成する。
別法として、各染色体の染色体比は、まず、各染色体の選択核酸領域の各々の計数を合計し、次に、1つの染色体について、その合計を2つ以上の染色体についての総計で除算することにより計算してもよい。計算したら、次に、染色体比を、正倍数性集団の平均染色体比と比較する。
平均は、相加平均、中央値、最頻値、又は他の平均であってもよく、正規化又は異常値データ除外が行われていてもよく又は行われていなくともよい。好ましい態様では、相加平均が使用される。正倍数性集団の染色体比のデータセットを開発する場合、測定した染色体の通常の変動を計算する。この変動は、幾つかの様式で、最も典型的には、変動係数(CV)として表される。試料のX染色体比を、正倍数性集団の平均染色体比と比較した時、試料のX染色体比が、統計的に、正倍数性集団の平均染色体比から外れる場合、試料は、例えばX異数性及び/又はX染色体モザイク現象を示すX染色体異常を含む。同様に、試料のY染色体比を、正倍数性集団の平均染色体比と比較した時、試料のY染色体比が、統計的に、正倍数性集団の平均染色体比から外れる場合、試料は、例えばY異数性及び/又はY染色体モザイク現象を示すY染色体異常を含む。
異数性を宣言するための統計的閾値を設定するための基準は、所望の方法の染色体比並びに許容される偽陽性率及び偽陰性率の測定における変動に依存する。一般的に、この閾値は、染色体比で観察される変動の倍数であってもよい。1つの例では、この閾値は、染色体比の変動の3倍以上である。別の例では、この閾値は、染色体比の変動の4倍以上である。別の例では、この閾値は、染色体比の変動の5倍以上である。別の例では、この閾値は、染色体比の変動の6倍以上である。上記の例では、染色体比は、染色体による選択核酸領域の計数を合計することにより決定される。典型的には、各染色体について同数の選択核酸領域が使用される。
染色体比を生成するための代替的な方法は、各染色体又は各染色体領域の選択核酸領域の平均計数を計算することであろう。典型的には平均が使用されるが、平均は、相加平均値、中央値、又は最頻値の任意の推定値であってよい。平均は、全計数の相加平均であってもよく、又はトリム平均又は加重平均等の幾つかの変法であってもよい。各染色体の平均計数が計算されたら、各染色体の平均計数を他方で除算して、2つの染色体間の染色体比を得る。各染色体の平均計数を、上述のように、測定された染色体全ての平均値の合計で除算して、各染色体の染色体比を得る。上記で強調したように、胎児DNAの相対存在量が少ない母体試料のX染色体、X染色体頻度、Y染色体、又はY染色体頻度を検出する能力は、アッセイにおいて異なる選択核酸領域を測定する際の変動に大きく依存する。この変動を低減させ、したがって本方法の異数性検出感度を向上させる多数の分析法を使用することができる。
アッセイのばらつきを低減させる1つの方法は、染色体の存在量を計算するために使用する選択核酸領域の数を増やすことである。一般的に、染色体の単一選択核酸領域の測定変動がB%であり、C個の異なる選択核酸領域が、同じ染色体で測定される場合、その染色体の各選択核酸領域の存在量の合計又は平均により計算される染色体存在量の測定値の変動は、およそB%÷C1/2になるであろう。言い換えると、染色体存在量の測定値の変動は、おおよそ、選択核酸領域数の平方根で除算された各選択核酸領域の存在量の測定値の平均変動になるであろう。
本発明の好ましい態様では、各染色体(X染色体、Y染色体、及び1つ又は複数の常染色体)で測定される選択核酸領域の数は、少なくとも8個である。本発明の別の好ましい態様では、各染色体で測定される選択核酸領域の数は、少なくとも24個である。本発明の更に別の好ましい態様では、各染色体で測定される選択核酸領域の数は、少なくとも32個である。本発明の別の好ましい態様では、各染色体で測定される選択核酸領域の数は、少なくとも100個である。本発明の別の好ましい態様では、各染色体で測定される選択核酸領域の数は、少なくとも200個である。各選択核酸領域の測定には増分原価の増加があるため、選択核酸領域の数を最小限に抑えつつ、それでも統計的にしっかりしたデータを生成することが重要である。本発明の好ましい態様では、各染色体で測定される選択核酸領域の数は、2000個未満である。本発明の好ましい態様では、各染色体で測定される選択核酸領域の数は、1000個未満である。本発明の最も好ましい態様では、各染色体で測定される選択核酸領域の数は、少なくとも32個かつ1000個未満である。
1つの態様では、各選択核酸領域の存在量を測定した後、選択核酸領域のサブセットを使用して、X又はY染色体異常の存在又は非存在を決定することができる。選択核酸領域のサブセットを選択するための多くの標準的方法が存在する。それらには排除が含まれ、ここでは、ある百分位数未満及び/又はある百分位数を超える検出レベルを有する選択核酸領域が分析から除外される。1つの態様では、百分位数は、測定された頻度の下位及び上位5%であってもよい。別の態様では、除外の百分位数は、測定された頻度の下位及び上位10%であってもよい。別の態様では、除外の百分位数は、測定された頻度の下位及び上位25%であってもよい。
選択核酸領域のサブセットを選択するための別の方法には、ある統計範囲から外れる領域を除外することが含まれる。例えば、平均存在量の1以上の標準偏差から外れる領域を、分析から除外してもよい。選択核酸領域のサブセットを選択するための別の方法は、選択核酸領域の相対存在量を、健常集団の同じ選択核酸領域の予想存在量と比較し、期待基準を満たさないあらゆる選択核酸領域を除外することであってもよい。アッセイにおける変動を更に最小化するために、各選択核酸領域が測定される回数を増加させてもよい。考察されているように、ゲノムが平均して1回未満しか測定されない、X及びY染色体頻度異常を検出するランダム法とは対照的に、本発明の方法では、各選択核酸領域が意図的に複数回測定される。一般的に、事象を計数する場合、計数における変動はポアソン統計により決定され、計数変動は、典型的には、計数の数の平方根で除算したものと等しい。本発明の好ましい態様では、選択核酸領域は、各々平均で少なくとも5回測定される。本発明のある態様では、選択核酸領域は、各々平均で少なくとも10、50、又は100回測定される。本発明のある態様では、選択核酸領域は、各々平均で少なくとも250回測定される。本発明のある態様では、選択核酸領域は、各々平均で少なくとも500回測定される。本発明のある態様では、選択核酸領域は、各々平均で少なくとも1000回、又は少なくとも5,000回、又は少なくとも10,000回測定される。
別の態様では、選択核酸領域のサブセットは、染色体異常が存在するか否かを決定する際に、統計的に有意な結果を得るのに十分な数を使用して、無作為に選択することができる。選択核酸領域の異なるサブセットの複合分析を母体試料内で実施して、より高い統計能力を得ることができる。この例では、ランダム分析の前に、任意の選択核酸領域を除去又は排除することが必要な場合もあり、そうでない場合もある。例えば、Y染色体に100個の選択核酸領域があり、例えば、2番染色体に100個の選択核酸領域がある場合、上記各染色体の100個未満の領域を評価する一連の分析を実施してもよい。
また、配列計数は、対数変換された計数の中央値洗練法(median polish)を使用することにより試料及びアッセイのバイアスを系統的に除外することによって正規化することができる。計量は、各試料について、特定の染色体の選択核酸領域の計数の平均、及び異なる染色体の選択核酸領域の計数の平均の合計で除算した選択核酸領域の計数の平均として計算することができる。割合についての標準的なZ検定を使用して、Z統計量を計算することができる。
式中、pjは、所与の試料jの所与の目的染色体について観察された割合であり、p0は、中央値pjとして計算された所与の試験染色体の期待割合であり、njは割合計量値の分母である。Z統計正規化は、反復打ち切りを使用して実施してもよい。各反復では、例えば3中央絶対偏差から外れる試料が除外される。10回の反復後、平均及び標準偏差を、非打ち切り試料のみを使用して計算した。その後、試料は全て、この平均及び標準偏差に対して正規化される。コルモゴロフ−スミルノフ検定(Conover、Practical Nonparametric Statistics、295〜301頁(John Wiley&Sons、New York、NY、1971年)を参照)及びシャピロ−ウイルク検定(Royston、Applied Statistics、31巻:115〜124頁(1982年)を参照)を、正倍数性試料のZ統計量を正規化するための検定に使用してもよい。
アッセイにおける変動を低減するための上記の方法に加えて、他の分析技法を組み合わせて使用してもよく、それらの多くは本願で上述されている。例えば、各試料の選択核酸領域の全てを、単一容器中の単一反応で調査すると、アッセイにおける変動を低減させることができる。同様に、アッセイにおける変動は、ユニバーサル増幅系を使用すると、低減させることができる。更に、アッセイの変動は、増幅のサイクル数を制限すると、低減させることができる。
母体試料中の胎児DNA含有量の測定
胎児寄与についての知識は、X及びY染色体に由来する選択核酸領域の予想される統計的存在に関する重要な情報を提供するため、母体試料中の胎児DNAの割合を決定することは、選択核酸領域の頻度計算の精度を増加させる。胎児寄与割合は、試料中のX及びY染色体配列の定量的な統計的有意性を決定するために使用されるため、胎児割合を考慮に入れることは、母体試料中の胎児DNAのレベルが低い場合、特に重要である。X染色体異数性、Y染色体異数性、又は性染色体モザイク現象の存在を評価する場合、及び/又は試料汚染が存在するか否かを決定する場合、胎児割合を考慮に入れることが重要である。
目的対立遺伝子での母体DNAの相対的母体寄与を、その対立遺伝子での非母体寄与と比較して、試料中のおおよその胎児DNA濃度を決定することができる。好ましい態様では、専ら父性由来配列、例えば、常染色体の父性特異的多型の相対量を使用して、母体試料中の胎児DNAの相対的濃度が決定される。母体試料中の胎児寄与割合を決定するための別の例示的な手法は、胎児DNA及び母体DNA間で異なるパターンのDNAメチル化を有するDNA断片を分析することによる。
本方法では、典型的には、胎児割合の計算にX及びY染色体配列を使用しないため、胎児多型の決定には、標的SNP及び/又は突然変異を分析して、母体試料中の胎児DNAの存在を特定することが必要である。各母体由来試料では、胎児由来DNAは、母体から受け継いだその遺伝子座の約50%、及び父体から受け継いだ遺伝子座の50%を有するであろう。父体供給源に由来する胎児に寄与した遺伝子座を決定することにより、母体試料中の胎児DNAの推定が可能になり、したがって、目的染色体の染色体頻度の統計的有意性を計算するために使用される情報が提供される。幾つかの態様では、父体及び母体の先行遺伝子型決定の使用を実施することができる。例えば、親は、疾患マーカーの遺伝子型決定、例えば、嚢胞性線維症、脊髄性筋萎縮症、筋ジストロフィー、又は更にRhD遺伝子の状態等の、障害の遺伝子型の決定を受けていてもよい。その場合、多型、コピー数変異体、又は突然変異における差異を使用して、母体試料中の胎児寄与割合を決定することができる。
代替的な好ましい態様では、母体試料中の胎児無細胞DNA割合は、母体又は父体遺伝子型の予備的知識を用いずに、多重化SNP検出法を使用して定量することができる。この態様では、各領域に1つ又は複数の既知SNPを有する選択多型核酸領域が使用される。好ましい態様では、選択多型核酸領域は、異数体である可能性が低い常染色体、例えば、6番染色体に位置する。また、好ましい態様では、選択多型核酸領域は、1つの容器中の1つの反応で増幅される。母体試料中の選択多型核酸領域の各対立遺伝子は、例えば、ハイスループット配列決定法を使用して決定及び定量される。配列決定後、母体遺伝子型及び胎児遺伝子型が異なる、例えば、母体遺伝子型がホモ接合性であり、胎児遺伝子型がヘテロ接合型である遺伝子座が特定される。父体から受け継いだ配列は、低頻度であるが、統計的に関連性のある頻度で生じる多型の検出により特定することができる。特定は、特定の選択核酸領域の1つの対立遺伝子の相対頻度が高く(>60%)、他方の対立遺伝子の相対頻度が低い(<20%かつ>0.15%)ことを観察することにより達成される。複数の遺伝子座の使用は、対立遺伝子の存在量の測定における変動の量を低減するため、特に有利である。この要求を満たす遺伝子座の全て又はサブセットを使用して、統計分析により胎児濃度が決定される。
1つの態様では、胎児濃度は、2つ以上の遺伝子座の低頻度対立遺伝子を共に合計し、高頻度対立遺伝子及び低頻度対立遺伝子の合計で除算し、2をかけることにより決定される。別の態様では、胎児無細胞DNA割合は、2つ以上の遺伝子座の低頻度対立遺伝子を平均し、高頻度対立遺伝子及び低頻度対立遺伝子の平均で除算し、2をかけることにより決定される。
多くの対立遺伝子の場合、母体配列及び胎児配列は、ホモ接合性であり同一である場合があり、この情報は母体DNAと胎児DNAを区別しないため、母体試料中の胎児DNA割合の決定に有用ではない。本方法では、胎児DNA及び母体DNA間に差異がある対立遺伝子情報(例えば、母体対立遺伝子と異なる少なくとも1つの対立遺伝子を含有する胎児対立遺伝子)を、胎児割合の計算に使用する。したがって、母体DNA及び胎児DNAで同じである対立遺伝子領域に関するデータは、分析用に選択しないか、又は有用なデータを圧倒しないように胎児DNA割合を測定する前に適切なデータから除外される。母体血漿中の胎児DNAを定量するための例示的な方法は、例えば、Chuら、Prenat Diagn(30巻:1226〜29頁(2010年)に見出すことができる。この文献は、参照により本明細書に組み込まれる。
1つの態様では、選択核酸領域は、領域の量又は頻度が、実験エラーによるか、又は特定の試料内の特発性遺伝子バイアスに由来する異常値と考えられる場合、除外してもよい。別の態様では、選択核酸は、例えば、当技術分野で知られているように又は上記に記載されているように合計又は平均する前に、正規化、標準化、クラスター化、又は変換等の統計的又は数学的な調整を受けてもよい。別の態様では、選択核酸は、合計又は平均する前に、正規化及び実験エラーデータ排除の両方を受けてもよい。好ましい態様では、12個以上の遺伝子座が分析に使用される。別の好ましい態様では、24個以上の遺伝子座が分析に使用される。別の好ましい態様では、32個以上の遺伝子座、48個以上の遺伝子座、72個以上の遺伝子座、96個以上の遺伝子座、100個以上の遺伝子座、又は200個以上の遺伝子座が分析に使用される。
1つの好ましい態様では、母体試料中の胎児寄与割合は、母体対立遺伝子及び胎児対立遺伝子のタンデムSNP検出を使用して定量することができる。母体試料から抽出されたDNAのタンデムSNPを特定するための技法は、Mitchellらの米国特許第7,799,531号明細書、及び米国特許出願第12/581,070号明細書、第12/581,083号明細書、第12/689,924号明細書、及び第12/850,588号明細書に開示されている。これらの参考文献には、胎児ゲノム及び母体ゲノム間で異なるハプロタイプを有する母体試料の少なくとも1つのタンデム一塩基多型(SNP)を検出することによる胎児遺伝子座及び母体遺伝子座の区別が記載されている。これらのハプロタイプの特定及び定量は、Mitchellらの開示に記載のように、母体試料で直接実施することができ、母体試料中の胎児寄与割合を決定するために使用することができる。
また別の代案では、ある遺伝子が、母体遺伝子コピーと胎児遺伝子コピーとの間に後成的差異を有すると特定されたら、そのような遺伝子は、母体試料中の胎児DNAマーカーの候補遺伝子座である。例えば、Chimら、PNAS USA(102巻:14753〜58頁(2005年)を参照されたい。これらの遺伝子座は、胎児DNAではメチル化されているが母体DNAではメチル化されていない場合があり(又は、その逆)、メチル化特異的PCR(MSP)を使用することにより、そのような胎児DNA分子が、母体由来の過剰なバックグラウンド血漿DNA中に存在していた場合でさえ、非常に特異的に直接検出することができる。母体試料中のメチル化増幅産物及び非メチル化増幅産物の比較を使用し、母体DNAと比較して胎児DNAのメチル化により異なって調節されることが知られている配列の1つ又は複数の後成的対立遺伝子比を計算することにより、母体試料に対する胎児DNA割合寄与を定量することができる。
母体試料中の核酸のメチル化状態を決定するためには、試料の核酸を、試料の亜硫酸水素塩変換にかけ、その後MSPにかけてから、対立遺伝子特異的プライマー伸長を行う。そのような亜硫酸水素塩変換の従来方式には、限定するものではないが、Methylamp(商標)DNA修飾キット(Epigentek社、ニューヨーク州ブルックリン)等の市販キットの使用が含まれる。対立遺伝子頻度及び対立遺伝子比を、データから直接計算し、エクスポートして、母体試料中の胎児DNAの相対割合を決定することができる。
X及びY染色体頻度分析における胎児無細胞DNA割合の使用
胎児無細胞DNA割合を計算したら、このデータを、X及びY染色体配列を検出及び定量するための方法と組み合わせて、胎児が女性、男性、X染色体の異数体、Y染色体の異数体、X染色体モザイク、Y染色体モザイクであり得る尤度を決定する。また、このデータは、モザイク現象を含む母体異数性の決定に、又は試験している母体試料が汚染されているか否かを特定するために使用することができる。
例えば、10%胎児DNAである母体試料では、各染色体は、正倍数性胎児では、10%の1/46(又はおよそ0.22%)の寄与であろう。したがって、正倍数性の男性胎児では、Y染色体は、10%の1/46(0.22%)の寄与であろう。X染色体は、10%の1/46(0.22%)の寄与であろう。常染色体対は、10%の2/46、すなわち1/23(0.44%。各常染色体は2つ存在するため)の寄与であろう。したがって、胎児が正倍数性の男性胎児か否かを決定する場合、10%胎児である試料中のY染色体特異的配列の頻度は、0.22%であるはずであり、例えば、3番染色体特異的配列の頻度は、男性胎児が2つの3番染色体を有するため、0.44%であるはずである。Y染色体異数性(すなわち、2つ以上のY染色体)が存在するか否かを決定する場合、Y染色体特異的配列の頻度は、2つのY染色体の場合はおよそ0.44%であり、3つのY染色体の場合はおよそ0.66%になるであろう。胎児がY染色体モザイクであり得るか否かを決定する場合、Y染色体特異的配列の頻度は、より少ないはずであり、XX/XYモザイクの場合は0.22%よりもかなり少ない場合があり、男性胎児に由来する核酸を有する母体試料により汚染された女性胎児に由来する核酸を有する母体試料の試料汚染の尤度を評価する場合も同じことが言える。XY/XYYモザイクでは、Y染色体特異的配列の頻度は、0.22%〜0.44%であるはずである。別の例では、5%胎児DNAである母体試料では、各染色体は、正倍数性胎児では5%の1/46(又はおよそ0.11%)の寄与であろう。したがって、正倍数性の男性胎児では、Y染色体は、5%の1/46(0.11%)の寄与であろう。常染色体対は、5%の2/46すなわち1/23(0.22%。各常染色体は2つ存在するため)の寄与であろう。
別の例では、正倍数性の女性胎児では、X染色体は、10%の2/46(つまり、1/23)(0.44%。正倍数性の女性胎児には2つのX染色体があるため)の寄与であろう。常染色体対は、10%の2/46すなわち1/23(0.44%。各常染色体は2つ存在するため)の寄与であろう。したがって、胎児が正倍数性の女性胎児であるか否かを決定する場合、10%胎児である試料中のX染色体特異的配列の頻度は、0.44%であるはずであり、例えば、3番染色体特異的配列の頻度は、女性胎児が2つの3番染色体を有するため、0.44%であるはずである。X染色体異数性(すなわち、1つ、3つ又はそれ以上のX染色体)が存在するか否かを決定する場合、X染色体特異的配列の頻度は、1つのX染色体の場合はおよそ0.22%であり、3つのX染色体の場合は0.66%であり、4つのY染色体の場合はおよそ0.88%になるであろう。胎児がX染色体モザイクであり得るか否かを決定する場合、X染色体特異的配列の頻度は、より少ないはずであり、XX/X0モザイクの場合は0.44%よりもかなり少なく、XX/XXXモザイクの場合は0.44%〜0.66%となり得る。別の例では、5%胎児DNAである母体試料では、各染色体は、正倍数性胎児では5%の1/46(すなわちおよそ0.11%)の寄与であろう。正倍数性の女性胎児では、X染色体は、5%の2/46すなわち1/23(0.22%)の寄与であろう。常染色体対は、5%の2/46すなわち1/23(0.22%。各常染色体は2つ存在するため)の寄与であろう。
図8は、本発明による統計分析を実施するための例示的な方法800の単純化されたフローチャートである。方法800のステップ801では、X及びY染色体並びに少なくとも1つの常染色体の遺伝子座が調査される。ステップ803では、ステップ801で調査された染色体の各々の染色体頻度が推定される。ステップ805では、Y染色体が、0コピー、1つのコピー、又は2つ以上のコピーで存在する尤度の値が計算され、ステップ807では、計算された尤度の値を、Y染色体が0、1、又は2つ以上のコピーで存在すると仮定した数学モデルと比較することにより、Y異数性のリスクが計算される。同様に、ステップ809では、X染色体が1つのコピー、2つのコピー、又は3つ以上のコピーで存在する尤度の値が計算され、ステップ811では、計算された尤度の値を、X染色体が1、2、又は3つ以上のコピーで存在すると仮定した数学モデルと比較することにより、X異数性のリスクが計算される。
図9は、本発明による統計分析を実施するための例示的な方法900の別の実施形態の単純化されたフローチャートである。方法900では、母体試料の胎児割合が決定され、胎児X及びY異数体リスクが計算される。ステップ901では、少なくとも1つの常染色体の少なくとも1つの多型性遺伝子座が調査される。本発明のほとんどの実施形態では、少なくとも2つの、及び多くの場合2つを超える常染色体における数個から多数個の多型性遺伝子座が調査される。ステップ903で、母体試料の胎児核酸割合(胎児割合)が、多型性遺伝子座に関する情報を使用して計算される。ステップ905では、母体試料の胎児核酸割合が、更なる分析の実施に適切か否かに関しての決定がなされる。ステップ907では、Y染色体の遺伝子座(多型性又は非多型性)が調査される。ほとんどの実施形態では、Y染色体及びX染色体の遺伝子座の調査は、少なくとも1つの常染色体の遺伝子座の調査と同時に、かつ好ましくは同じ容器中で実施される。ステップ909では、計算された胎児核酸割合を使用して、Y染色体が、0コピー、1つのコピー、又は2つ以上のコピーで存在する尤度の値が計算され、ステップ911では、計算された尤度の値を、Y染色体の0、1、又は2以上のコピーを仮定した数学モデルと比較することにより、Y胎児異数性のリスクが計算される。ステップ913では、X染色体の遺伝子座(多型性又は非多型性)が調査され、上記に記載のように、X染色体及びY染色体の遺伝子座の調査は、少なくとも1つの常染色体の遺伝子座の調査と同時に、かつ好ましくは同じ容器中で実施される。ステップ915では、計算された胎児核酸割合を使用して、X染色体が1つのコピー、2つのコピー、又は3つ以上のコピーで存在する尤度の値が計算され、ステップ9171では、計算された尤度の値を、X染色体の1、2、又は3以上のコピーを仮定した数学モデルと比較することにより、X胎児異数性のリスクが計算される。
上述のように、好ましい態様では、試料中の胎児DNA割合を決定するための選択多型核酸領域、並びにX及びY染色体に由来する選択核酸領域を両方とも調査するための反応が、単一反応で(つまり、単一の容器中で)実施される。アッセイ系の様々なステップの最中に導入され得る夾雑物又はバイアスは、染色体異常の有無の決定を支援するのに胎児DNA含有量を使用する場合に結果を歪める可能性があるが、単一の反応はそのような夾雑物又はバイアスのリスクを最小化するのを支援する。したがって、アッセイを説明した際に言及したように、選択核酸領域の調査に使用されるオリゴヌクレオチドの幾つかのセットは、胎児割合を測定するために多型特異的であり、選択核酸領域の調査に使用されるオリゴヌクレオチドの幾つかのセットは、胎児の性別、又はX及びY染色体の異数性を決定するために、多型不可知性又はSNP不可知性であり得る。
他の態様では、1つ又は複数の選択核酸領域を、胎児DNA含有量割合の決定、並びにX及びY染色体異常の検出の両方に使用することができる。選択核酸領域の対立遺伝子を使用して、胎児DNA含有量を決定することができ、その後、これらの同じ選択核酸領域を使用して、対立遺伝子特異的又はSNP特異的情報を無視することで胎児染色体異常を検出することができる。胎児DNA含有量及び染色体異常検出の両方に同じ選択核酸領域を使用することにより、実験エラー又は汚染によるあらゆるバイアスを最小限に抑えるのが更に支援される。
1つの実施形態では、母体試料中の胎児供給源寄与は、胎児の性別に関わらず、常染色体SNPを使用して測定される(Sparksら、Am.J.Obstet&Gyn、206巻:319.e1〜9(2012年)を参照)。本方法では、非母体対立遺伝子が父性遺伝の知識を問わずに特定されるため、使用されるプロセスは、父性遺伝子型の予備的知識を必要としない。二項分布が使用される最尤推定量を使用して、各母体試料中の幾つかの有益な遺伝子座にわたって推定胎児核酸寄与を計算してもよい。使用される胎児核酸寄与の計算プロセスは、例えば、2012年7月19日に出願された米国特許出願第13/553,012号明細書に記載されている。この文献は、参照により組み込まれる。胎児寄与の決定に使用される多型性領域は、1〜12番染色体に由来していてもよく、好ましくは、血液型抗原を標的としない。
ある態様では、胎児DNAのY染色体の数の決定は、胎児DNAのX染色体の数の決定とは独立して実施してもよい。
ある態様では、多型アッセイからの胎児寄与の推定を使用して、Y染色体胎児頻度(YFF)値が決定される。例えば、ある態様では、胎児頻度は、以下のように規定することができる:
式中、PF_Polyは、多型アッセイからの胎児寄与割合の推定値であり、PF_ChrYは、Y染色体計数の正規化割合であり、PF_ChrYは、例えば、Y染色体アッセイ毎の計数中央値と、各常染色体又は参照染色体アッセイ毎の計数中央値との比率を計算することにより決定することができる。YFF値が0に近い場合、胎児DNAは、Y染色体を含まない可能性が高い。YFF値が1に近い場合、胎児DNAは、単一のY染色体を含む可能性が高い。YFF値が2に近い場合、胎児DNAは、Y染色体の2つのコピーを含む可能性が高く、Yのコピーが更にある場合も同様である。ある態様では、YFF値を使用して、3、4、又は5つのコピー等の、試料の胎児DNAのY染色体の2つを超えるコピーの存在が決定される。
ある態様では、PF_Polyの推定値を使用して、X染色体胎児頻度(XFF)値を決定する。ある態様では、XFFは、試料中の潜在的なX染色体組成の各々について異なる定義を使用して、規定されてもよい。例えば、ある態様では、試料jのX胎児確率
は、単一のX染色体を含む胎児DNAの場合、以下の様に規定してもよい:
式中、
は、胎児DNAが単一のX染色体を含む確率であり、p0は常染色体の参照割合であり、fjは試料の胎児割合である。好ましくは、使用される胎児割合は、PF_Polyである。
ある態様では、X胎児確率
は、2つのX染色体を含む胎児DNAの場合、以下の様に規定してもよい:
式中、
は、胎児DNAが2つのX染色体を含む確率であり、p0は、所与の染色体の参照割合である。
ある態様では、試料jのX胎児確率
は、3つのX染色体を含む胎児DNAの場合、以下の様に規定してもよい:
式中、
は、胎児DNAが、3つのX染色体を含む確率であり、p0は、所与の染色体の参照割合であり、fjは、試料の胎児割合である。
ある態様では、胎児DNAのX染色体の数は、
の各々の正規化確率値を比較することにより推定してもよく、この正規化確率値は、ある態様では、上記で算出した確率値を確率値の総計で除算することにより算出される:
ある態様では、最も高い正規化確率は、胎児DNAのX染色体の推定数に相当する。例えば、p2が、p1及びp3よりも高い場合、胎児DNAは、2つのX染色体を含む可能性が高い。ある態様では、X正規化確率値計算を使用して、4つ、5つ又は6つのコピー等の、試料中の胎児DNAのX染色体の3つを超えるコピーの存在が決定される。
測定されたXFF及びYFF値は、アッセイ系、作業者間の差、又は他の変数に由来する変動等の、分析中に生じる変動により影響を受ける場合がある。ある態様では、特定の範囲の胎児差分値を、結果報告の目的のための確実性の基準レベルの外側として除外してもよい。幾つかの態様では、0より低いYFF値は、胎児がY染色体を持たないことを明白に示すものと見なされるであろう。幾つかの態様では、0〜1のYFF値は、Y染色体の存在又は非存在を決定するために必要なレベルの確実性を提供しない。したがって、ある態様では、0〜1等のある範囲に入るYFF値は、0.1〜0.9(例えば0.2〜0.8)の範囲の胎児差分値のように、確実性範囲に入らないとみなされる。そのような決定は、最終的であるか否かに関わらず、上記で示したような確率値に基づいてリスクスコアを計算するために使用することができる。そのようなリスクスコアは、例えば、母体及び/又は胎児の臨床ケアの助言に使用することができる。
本発明の方法のコンピュータ実施
本発明の方法は、コンピュータ又はコンピュータシステムにより実行することができる。例えば、本方法の「読み取り」、つまり増幅産物のハイスループット配列決定又はアレイに対するハイブリダイゼーションからの生データは、コンピュータ又はプロセッサに伝達され、コンピュータは、例えば、種々の目的配列の出現頻度を「計数」又は「集計」し、頻度を比較し、頻度を正規化し、品質管理及び/又は統計分析を実施し、母体試料の胎児割合又はパーセントを計算し、胎児核酸割合を考慮してゲノムの領域及び/又は染色体の量又は頻度を計算し、リスク確率を決定し、又は他の計算を実施して染色体異常を決定するソフトウェアを実行することができる。1つの実施形態では、コンピュータは、パソコンを含み得るが、コンピュータは、少なくとも1つのプロセッサ及びメモリを含む任意のタイプの機械を含むことができる。
ソフトウェア要素の出力は、例えば、ゲノム領域及び/又は染色体(この場合、X及び/又はY染色体等)が量的異常を有する確率の値のレポートを含む。幾つかの態様では、このレポートは、領域又は染色体が、2つのコピーを有する(例えば、二染色体性)尤度の値、及び領域又は染色体が、より多くのコピーを有するか(例えば、三染色体性)又はより少ないコピーを有する(例えば、一染色体性)尤度の値である。レポートは、紙に印刷されてもよく、又は電子的に、モニターに表示されてもよく、及び/又は電子メール、FTP、テキストメッセージ、サーバへの投稿等により電子的にユーザに伝達されてもよい。本発明の正規化プロセスは、ソフトウェアとして実装されると記載したが、ハードウェア及びソフトウェアの組合せとして実装することもできる。加えて、正規化用のソフトウェアは、同一の又は異なるコンピュータで作動する複数の要素として実装されていてもよい。サーバ(あれば)、及びコンピュータは両方とも、プロセッサ、入力デバイス(例えば、キーボード、ポインティングデバイス、音声コマンド用マイクロホン、ボタン、タッチスクリーン等)及び出力デバイス(例えば、表示デバイス、スピーカ等)を含む、典型的な計算デバイスのハードウェア要素(非表示)を含んでいてもよい。サーバ及びコンピュータは、プロセッサにより実行される際に開示される機能を実施するコンピュータ命令を含むコンピュータ読取り可能な媒体、例えばメモリ及び記憶装置(例えば、フラッシュメモリ、ハードドライブ、光ディスクドライブ、磁気ディスクドライブ等)を含んでいてもよい。サーバ及びコンピュータは、通信用の有線又は無線ネットワーク通信インタフェースを更に含んでいてもよい。
実施例
以下の例は、本発明を実施及び使用する方法の完全な開示及び説明を当業者に提供するために示されており、本発明者らが自らの発明であるとするものの範囲を限定するためのものではなく、下記の実験が、実施された実験の全てであること又は実施した唯一の実験であることを示し又は示唆するためのものでもない。広く記載されている本発明の趣旨又は範囲から逸脱せずに、特定の態様で示されている本発明に、数々の変更及び/又は改変をなすことができることは、当業者であれば理解するであろう。したがって、本態様は、あらゆる点で例示的なものであり、限定的ではないとみなされるべきである。
使用した数値(例えば、量、温度等)に関する正確性を確保する努力がなされているが、幾らかの実験誤差及び偏差が考慮されるべきである。別様の指示がない限り、部は重量部であり、分子量は重量平均分子量であり、温度は摂氏であり、圧力は大気圧又は大気圧付近である。
実施例1:タンデムライゲーション手順で使用されるDNAの調製
被験者のゲノムDNAは、コーリエル・セル・リポジトリーズ(Coriell Cell Repositories)(ニュージャージー州カムデン)から取得し、音響剪断(Covaris社、マサチューセッツ州ウーバン)により、およそ200bpの平均断片サイズに断片化した。
DNAを、標準的手順を使用してビオチン化した。簡潔に述べると、Covarisで断片化したDNAは、1.5mlマイクロチューブ中で以下の反応を起こすことにより末端を修復した:5ugのDNA、12μlの10×T4リガーゼ緩衝液(Enzymatics社、マサチューセッツ州ビバリー)、50UのT4ポリヌクレオチドキナーゼ(Enzymatics社、マサチューセッツ州ビバリー)、及びH20で120μlにした。これを30分間37℃でインキュベートした。DNAを、10mM Tris 1mM EDTA pH8.5を使用して、約0.5ng/μlの所望の終濃度に希釈した。
5μlのDNAを、96ウェルプレートの各ウェルに配置し、プレートを粘着性プレートシーラで密封し、250×gで10秒間遠心した。その後、プレートを3分間95℃でインキュベートし、25℃に冷却し、250×gで10秒間再び遠心した。ビオチン化マスター混合物を、1.5mlのマイクロチューブで以下の終濃度に調製した:1×TdT緩衝液(Enzymatics社、マサチューセッツ州ビバリー)、8U TdT(Enzymatics社、マサチューセッツ州ビバリー)、250μM CoCl2、0.01nmol/μlビオチン−16−dUTP(Roche社、ニュージャージー州ナットレー)、及びH20で1.5mlにした。15μlのマスター混合物を、96ウェルプレートの各ウェルに等分し、プレートを粘着性プレートシーラで密封した。プレートを250×gで10秒間遠心し、60分間37℃でインキュベートした。インキュベーション後、プレートを、250×gで10秒間再び遠心し、7.5μl析出混合物(1ng/μlデキストランブルー、3mM NaOAc)を各ウェルに添加した。
プレートを粘着性プレートシーラで密封し、IKAプレートボルテックスミキサーを使用して、3000rpmで2分間混合した。27.5μlのイソプロパノールを各ウェルに添加し、プレートを粘着性プレートシーラで密封し、3000rpmで5分間ボルテックスした。プレートを3000×gで20分間遠心し、上清をデカントし、プレートを逆さにして、吸収性ワイプに向けて10×gで1分間遠心した。プレートを5分間空気乾燥させ、ペレットを10μlの10mM Tris pH8.0、1mM EDTAに再懸濁した。等モルプール(各40nM)の第1及び第2の遺伝子座特異的固定オリゴヌクレオチドのセットを、上記のように調製したオリゴから生成した。同様に、架橋オリゴヌクレオチドの別々の等モルプール(各20μM)を、選択ゲノム遺伝子座の配列に基づくアッセイプロセス用に生成した。
10μgのストレプアビジンビーズを、96ウェルプレートのウェルに移し、上清を除去した。60μlの結合緩衝液(100mM Tris pH8.0、10mM EDTA、500mM NaCl2、58%ホルムアミド、0.17% Tween(登録商標)−80)、10μLの40nM固定配列オリゴプール、及び実施例2で調製したビオチン化テンプレートDNAの30μLをビーズに添加した。プレートを粘着性プレートシーラで密封し、ビーズが再懸濁されるまで3000rpmでボルテックスした。5分間70℃でインキュベーションすることにより、オリゴをテンプレートDNAにアニーリングさせ、その後30℃に徐冷した。
プレートを、バー隆起型(raised bar)磁気プレートに2分間設置して、磁気ビーズ及び結合DNAを、ウェルの側壁に引き寄せた。上清をピペット操作により除去し、50μLの60%結合緩衝液(v/v水溶液)に置換した。ボルテックスによりビーズを再懸濁し、再び磁石に設置し、上清を除去した。このビーズ洗浄手順を、50uLの60%結合緩衝液を使用して1回繰り返し、50μLの洗浄緩衝液(10mM Tris pH8.0、1mM EDTA、50mM NaCl2)を使用して更に2回繰り返した。
ビーズを、1X Taqリガーゼ緩衝液(Enzymatics社、マサチューセッツ州ビバリー)、10U Taqリガーゼ、及び2uM架橋オリゴプール(アッセイ形式に応じて)を含む37μlライゲーション反応混合液に再懸濁し、1時間37℃でインキュベートした。適切な場合、アッセイ形式に応じて、非プルーフリーディング熱安定性ポリメラーゼ及び200nMの各dNTPが、この混合液に含まれていた。プレートを、バー隆起型磁気プレートに2分間設置して、磁気ビーズ及び結合DNAを、ウェルの側壁に引き寄せた。上清をピペット操作により除去し、50μLの洗浄緩衝液に置換した。ボルテックスによりビーズを再懸濁し、再び磁石に設置し、上清を除去した。洗浄手順を1回繰り返した。
ストレプアビジンビーズから産物を溶出するために、30μlの10mM Tris 1mM EDTA、pH8.0を、96ウェルプレートの各ウェルに添加した。プレートを密封し、IKAボルテックスミキサーを使用して、3000rpmで2分間混合して、ビーズを再懸濁した。プレートを、1分間95℃でインキュベートし、8チャネルピペッターを使用して上清を吸引した。各ウェルの25μl上清を、ユニバーサル増幅用に、新しい96ウェルプレートに移した。
実施例2:ライゲーション産物のユニバーサル増幅
重合された及び/又はライゲーションされた核酸を、目的核酸領域にハイブリダイズされた第1及び第2の固定配列オリゴに存在するユニバーサル配列に相補的なユニバーサルPCRプライマーを使用して増幅した。実施例3の各反応混合物の25μlを、各増幅反応に使用した。50μLのユニバーサルPCR反応は、25μLの溶出したライゲーション産物及び1×Pfusion緩衝液(Finnzymes社、フィンランド)、1Mベタイン、400nMの各dNTP、1U Pfusionエラー修正型熱安定性DNAポリメラーゼ、及びプール及び配列決定する前に個々の試料を固有に特定するために使用される試料タグを有するプライマー対を含んでいた。BioRad Tetrad(商標)サーモサイクラーを使用して、ストリンジェントな条件下で、PCRを実施した。
試料の各々に由来するユニバーサルPCR産物の10μlをプールし、プールしたPCR産物を、Quant−iT(商標)PicoGreen(Invitrogen社、カリフォルニア州カールズバッド)を使用して、精製及び定量した。精製したPCR産物を、Illumina HiSeq(登録商標)2000のスライドの単一レーンで配列決定した。配列決定では、典型的には約100Mの生読取りが生じ、そのうち約85M(85%)が、予想アッセイ構造にマッピングされる。これは、実験全体の平均値が約885K読取り/試料、(96個の遺伝子座を使用する実験の場合)96個の選択核酸領域全体で9.2K読取り/複製/遺伝子座に換算される。
実施例3:胎児寄与割合を評価するための多型性遺伝子座の分析
母体試料中の胎児核酸割合を評価するために、1〜12番染色体の1セットのSNP含有遺伝子座に対して、1つの塩基が異なる2つの架橋オリゴを使用して各SNPを調査したアッセイを設計した(例えば、図3を参照)。SNPは、HapMap3データセットの少数対立遺伝子頻度用に最適化した。Duanら、Bioinformation、3巻(3号):139〜41頁(2008年);Epub 2008年11月9日。
オリゴヌクレオチドは、IDT(アイオワ州コーラルビル)が合成し、一緒にプールして、単一の多重化アッセイプールを生成した。PCR産物を、以前に記載されているように各被験者試料から生成した。有益な多型性遺伝子座は、胎児対立遺伝子が母体対立遺伝子と異なる遺伝子座と定義した。アッセイは99%を超える対立遺伝子特異性を示すため、遺伝子座の胎児対立遺伝子割合が1〜20%であると測定された場合、有益な遺伝子座は容易に特定された。最大尤度は、幾つかの有益な遺伝子座の測定値に基づいて、2012年7月19日に出願された同時係属出願の米国特許出願第13/553,012号明細書に記載のもの等の二項分布を使用して推定し、最も確実な胎児割合を決定した。結果は、Chu及び同僚ら(Chuら、Prenat.Diagn、30巻:1226〜29頁(2010年)を参照)により示された加重平均手法と良好に相関した(R2>0.99)。
実施例4:染色体特異的ゲノム領域の非多型性部位を使用したY染色体頻度異常の検出
第1の実施形態では、Y染色体の特定のゲノム領域に対するアッセイを使用して、Y染色体頻度異常の存在又は非存在を特定した。本アッセイ系は、高度に多重化された系を使用して、複数の個体のDNAにおけるそのような異常の存在又は非存在を特定することを可能にした。
Y染色体(chrY)、13、18、及び21番染色体(chr13、chr18、及びchr21)に相補的又は由来するオリゴヌクレオチドを使用して、複数の調査を準備した。タンデムライゲーション形式で使用したオリゴヌクレオチドは全て、従来の固相化学を使用して合成した。第1の固定セットのオリゴ及び架橋オリゴヌクレオチドは、5’リン酸部分が、隣接するオリゴヌクレオチドの3’ヒドロキシル末端にライゲーション可能なように合成した。chrYに対する32の非多型アッセイを開発し、chr13、chr18、及びchr21用に開発したアッセイと比較した(例えば、Sparksら、Prenat.Diagn、32巻(1号):3〜9頁(2012年)、及びSparksら、Am J.Obstet.Gynecol.(2012年)、doi:10.1016/j.ajog.2012.01.030を参照)。1〜12番染色体又はchr13、chr18、及びchr21の1セットのSNP含有遺伝子座を使用して、胎児割合を測定した。これらの染色体に由来する胎児割合推定を、2011年12月9日に出願された米国特許出願第13/316,154号明細書、及び2011年12月28日に出願された第13/338,963号明細書に記載の多型検出及び確率アルゴリズムを使用して計算した。
Y染色体計数の割合を検出及び計算して、PF_ChrYを決定した。PF_ChrYを、算出したPF_Polyで除算した。その結果を、1から差し引いてYFFを得た。
YFFの分散は、この場合、Yアッセイ計数、常染色体アッセイ計数、及び算出したPF_Polyのブートストラップサンプリングにより計算した。0コピーのY、1コピーのY、及び2コピー以上のYのモデルを使用し、ベイズ分析を実施して、0、1、又は2コピー以上を有する確率を評価した。1つの実施では、前のステップで実施された標準偏差を使用して、0コピーの場合は打ち切り正規モデル、及び1コピー又は2コピー以上の場合は正規分布モデルを使用した。差異が0に近い場合、胎児は女性である可能性が高く、差異が1に近い場合、胎児は男性である可能性が高い。本例では、YFFの結果が、0.25〜0.65であるか、又は3.5を超えた場合、その結果は、報告可能な範囲外であるとみなした。しかしながら、観察から導き出した他の閾値を使用して、何が報告可能であるかを確立してもよいと考えられる。
ブートストラップサンプリングを使用して、この胎児差分値の分布を計算し、log10オッズ比を計算して、0、1、又は2以上のchrYコピーのモデルに適合し、差異が試料由来である尤度を比較した。
得られた結果は、胎児性別の精度が100%であり、女性745人が正しく特定され、男性797人が正しく特定されたことを示す。核型分析と、本明細書に記載のchrY分析の使用との間の一致率は、胎児性別決定及びY染色体異数性決定の場合、99.8%が達成された。表1は、検証セットの胎児Y染色体状態の一致率を示す。
実施例5:胎児のXO、XX、XY、XXX、XXY、XYY、及びXXYY遺伝子型の決定
胎児X染色体の分析を可能にするために、Y染色体、並びに13、18、及び21番染色体を調査するためのオリゴヌクレオチドのセットに加えて、固定配列及び架橋オリゴヌクレオチドのセットを記載のように使用して、染色体X遺伝子座を調査した。胎児に存在するX染色体の数の尤度を算出する計算を、chrY、chr13、chr18、及びchr21の数の尤度を算出する計算、並びにPF_Polyを決定する計算に加えた。
この研究では、1セットの432個の血漿試料を処理した。被験者は全て、盲検症例対照研究の一部であり、妊婦被験者は全て侵襲的検査を受けた。得られた結果を、侵襲的検査から得られた核型と比較した。核型分析した妊娠個体に由来する血漿試料は全て、上記の実施例1〜4に詳述されているプロトコールに従って処理した。試料を選択するために使用した試料受け入れ基準は、母体年齢が18歳以上、妊娠期間が10週以上、及び単胎妊娠であった。卵子提供による妊娠は、自己卵子提供及び遺伝学的に無関係な卵子提供を両方とも許容した。
まず、各試料のT21、T18、及びT13のリスクを計算した(例えば、2011年12月9日に出願された米国特許出願第13/316,154号明細書、2011年12月28日に出願された米国特許出願第13/338,963号明細書を参照)。リスクスコアは、上限99%、下限0.01%までとした。1%を超えるリスクを、T21、T18、又はT13のリスクが高い被験者として分類した。アッセイを使用して決定したT21、T18、及びT13のリスクスコアに基づく分類と、核型分析により決定された遺伝子状態を使用して決定したT21、T18、及びT13のリスクスコアに基づく分類は一致することが特定された。
実施例4に記載のように、Y染色体分析を実施した。X染色体の場合、chrX計数対chr13、chr18、及びchr21計数の割合を使用した。chrXの1、2、又は3つ以上の胎児コピーのモデルは、試料中の測定PF_Polyに基づく期待損失又は期待利得を使用して導き出した。
試料jのX胎児確率
は、単一のX染色体を含む胎児DNAの場合、以下の様に規定した:
式中、
は、胎児DNAが単一X染色体を含む確率であり、p0は所与の染色体の参照割合であり、fjは試料の胎児割合である。X胎児の確率
は、2つのX染色体を含む胎児DNAの場合、以下の様に規定することができる:
式中、
は、胎児DNAが2つのX染色体を含む確率であり、p0は所与の染色体の参照割合である。試料jのX胎児確率
は、3つのX染色体を含む胎児DNAの場合、以下の様に規定することができる:
式中、
は、胎児DNAが3つのX染色体を含む確率であり、p0は所与の染色体の参照割合であり、fjは試料の胎児割合である。その後、胎児DNAのX染色体の数を、
の各々の正規化確率値を比較することにより推定した。これらは、上記で算出した確率値を、確率値の総計で除算することにより算出した:
最も高い正規化確率が、胎児DNAのX染色体の推定数に相当した。
胎児に存在するX染色体の数の尤度を決定するためのデータ受け入れ基準は、それぞれ1、2、又は3つ以上の胎児染色体Xコピーのモデルに適合する3つの計算を使用して、患者試料のlog10オッズを計算した以外は、Y染色体の基準と本質的に同じであった。胎児Y染色体の数について実施された計算と組み合わせて、胎児に存在するX染色体の数の尤度を計算する検定では、ベイズモデルを使用して、X及びY染色体のデータを評価し、遺伝子型XO、XX、XY、XXX、XXY、XYY、及びXXYYの仮定を比較した。胎児の性別(男性対女性)の確率が<99%であった場合、胎児X及びY染色体状態の「無結果」が生成された。XFFは、欠失又は獲得した胎児X染色体のおおよその数を表す。
432個の血漿試料のうち414個は、95.8%の試料合格率のQC基準に合格した。T21、T18、及びT13の結果は、核型分析と≧99%の一致を示し、胎児染色体X及びY状態の報告が「無結果」である割合は<1%であった。胎児X及びY染色体分析は、試料の各性染色体異数性(XO、XX、XY、XXX、XXY、XYY、及びXXYY)に対して≧99%の特異性を示し、染色体異数性XO(ターナー症候群と関連する)に対して≧80%の感度を示し、胎児X及びY染色体分析は、胎児性別(男性/女性)に関して>99%の精度を示した。
T21分類と非T21分類との境界として1%のリスクスコアを使用すると、尤度の計算と核型分析との100%一致が観察された。T18分類と非T18分類との境界として1%のリスクスコアを使用すると、尤度の計算と核型分析との100%一致が観察された。T13分類と非T13分類との境界として1%のリスクスコアを使用すると、尤度の計算と核型分析との100%一致が観察された。胎児の性別及び異数性決定の結果は、表2に要約されている。
XFF+YFF検定結果は、各XO及びXXX異数性試料に対して99.5%の特異性(95%ウィルソン信頼区間は、98.1〜99.9)、並びに各XXY、XYY、及びXXYY異数性試料に対して、100%の特異性(95%ウィルソン信頼区間は、99〜100)を示した。XFF+YFF検定は、XO異数性試料に対して、96.3%の感度(95%ウィルソン信頼区間は、82〜99.8)を示した。これは、≧80%の受け入れ基準に合格する。XFF+XYY検定結果は、胎児性別に関して、100%の精度(95%ウィルソン信頼区間は、99〜100)を示した。
本発明は、本発明の好ましい態様に関して詳細に記載されているように、多くの異なる形態の態様により条件が満たされる。本開示は、本発明の原理の例示とみなされるべきであり、本発明を、本明細書に例示及び記載されている特定の態様に限定するためのものではないことが理解される。当業者であれば、本発明の趣旨からの逸脱せずに、多数の変更をなすことができる。本発明の範囲は、添付の特許請求の範囲及びそれらの同等物により規定される。要約及び発明の名称は、本発明の範囲を限定するものとして解釈されるべきではない。それらの目的は、関係当局並びに一般公衆が本発明の一般的な性質を迅速に決定することを可能にすることである。下記の特許請求の範囲では、用語「手段」が使用されない限り、そこに列挙されている特徴又は要素はいずれも、米国特許法112条6項に記載のミーンズプラスファンクション制限として解釈されるべきでない。