JP2012525147A - 遺伝マーカーを評価するための方法および組成物 - Google Patents

遺伝マーカーを評価するための方法および組成物 Download PDF

Info

Publication number
JP2012525147A
JP2012525147A JP2012508490A JP2012508490A JP2012525147A JP 2012525147 A JP2012525147 A JP 2012525147A JP 2012508490 A JP2012508490 A JP 2012508490A JP 2012508490 A JP2012508490 A JP 2012508490A JP 2012525147 A JP2012525147 A JP 2012525147A
Authority
JP
Japan
Prior art keywords
nucleic acid
sequence
target nucleic
probe
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012508490A
Other languages
English (en)
Other versions
JP2012525147A5 (ja
Inventor
グレゴリー ポレカ,
ユリ レーザーソン,
チン ビリー リー,
イー. ロバート ワスマン,
Original Assignee
グッド スタート ジェネティクス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グッド スタート ジェネティクス, インコーポレイテッド filed Critical グッド スタート ジェネティクス, インコーポレイテッド
Publication of JP2012525147A publication Critical patent/JP2012525147A/ja
Publication of JP2012525147A5 publication Critical patent/JP2012525147A5/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material

Abstract

本発明の局面は、遺伝子座の多重分析のバイアスを減少させるためおよび遺伝子座の多重分析の再現性を高めるために有用な方法および組成物に関する。いくつかの形態では、所定の調製工程および/または核酸配列分析法が、複数のサンプル中の複数の遺伝子座に対する多重分析において用いられる。一局面において、複数の遺伝子座を分析する方法が提供され、該方法は:複数の標的核酸の各々をプローブセットと接触させる工程、複数の核酸を単離する工程、ならびに該単離された核酸を分析する工程を包含する。

Description

関連出願
この出願は、米国特許法§119(e)の下、2009年4月30日に出願された米国仮出願第61/174,470号、2009年5月15日に出願された米国仮出願第61/178,923号、2009年5月18日に出願された米国仮出願第61/179,358号および2009年5月28日に出願された米国仮出願第61/182,089号(各々の全体の内容は、参考として本明細書に援用される)の利益を主張する。
発明の背景
本発明は、患者サンプル中の遺伝子型を決定するための方法および組成物に関する。
発明の背景
被験体の遺伝子型に関する情報は、多くの疾患、障害および生理学的特徴に対する遺伝的根拠がさらに解明されるにつれて、一連の健康管理の判断にとってますます重要になり、かつそのような判断に直接関係してくる。医学的な助言は、次第に個人向けになってきており、個別の判断および勧告は、特定の遺伝情報に基づく。1つ以上の遺伝子座における対立遺伝子の型および数に関する情報は、健康管理について考慮すべき他の事柄の中でも疾患リスク、予後、治療法の選択肢および遺伝カウンセリングに影響を及ぼす。
費用効果が高く、かつ信頼できる医学的カウンセリングおよび生殖カウンセリングを大規模に行うためには、多くの被験体の多くの異なる遺伝子座についての対立遺伝子の状態を正確かつ明白に同定できることが重要である。
生物学的サンプルから核酸配列を検出するためおよび分析するために、数多くの技術が開発されている。これらの技術を用いることにより、被験体の遺伝子タイピングを行うことおよび目的の任意の遺伝子座の対立遺伝子の状態を決定することができる。しかしながら、多数の患者の多くの遺伝子座の信頼できるハイスループット分析にむけてスケールアップするには、それらの技術は、十分に頑強ではなく、費用効果の高いものではない。現在の技術は、不正確またはあいまいなコール(call)の頻度が高すぎて、不確かさを解消するためおよびアウトプット情報の信頼性を提供するために高価かつ時間のかかる工程を要さずに多数の患者サンプルを管理することはできない。
発明の要旨
本発明の局面は、遺伝子型を評価するため、特に、被験体の1つ以上の遺伝子座の対立遺伝子の同一性(または二倍体生物における同一性)を決定するための、調製および分析の方法および組成物に関する。
本発明の局面は、遺伝分析におけるあいまいさおよびエラーの種々の起源の同定に部分的に基づき、また、遺伝分析の種々の段階におけるこれらのエラーおよびあいまいさを回避するため、減少させるため、認識するため、および/または解消するための1つ以上のアプローチの同定に部分的に基づく。
本発明の局面によると、ある特定のタイプの遺伝情報は、調製段階(例えば、捕捉、増幅など)、決定段階(例えば、対立遺伝子特異的検出、配列決定など)、データ解釈段階(例えば、アッセイ情報が被験体をホモ接合またはヘテロ接合と同定するのに十分であるか否かを決定する段階)および/または他の段階のいずれかにおける、確率的変動と系統誤差(systematic bias)との組み合わせに起因して、遺伝分析において提示不足であり得るかまたは提示過剰であり得る。
本発明の局面によると、エラーまたはあいまいさは、遺伝分析において明らかであり得るが、追加のサンプリングまたはより高価なアッセイを行わずに容易に解決されることはない(例えば、アレイベースのアッセイは、ノイズの多いシグナル/低レベルのシグナルに起因してコールなし(no−call)を報告し得る)。本発明のさらなる局面によると、エラーまたはあいまいさは、遺伝分析において説明されないかもしれず、不正確なベースコール(base call)は、それらについての証拠が限られているときおよび/または統計学的に有意でないときでさえ、生じ得る(例えば、次世代シークエンシング技術は、それらについての証拠が統計学的に有意でない場合でさえ、ベースコールを報告し得る)。本発明のさらなる局面によると、エラーまたはあいまいさは、明らかであるが、分析の1つ以上の工程では容易に解決されず、また、分析の他の工程では明らかでないかまたは説明されないので、多段階の遺伝分析にとって問題となり得る。
いくつかの実施形態において、1つ以上の工程におけるエラーおよびあいまいさの起源は、生成される遺伝情報の複雑度および/または忠実度に影響を及ぼし得る任意の系統誤差または確率的影響を克服するように設計された重複プローブの1つ以上のセットを用いて目的の各標的遺伝子座を捕捉することおよび/または調べることによって対処され得る。
いくつかの実施形態において、1つ以上の工程におけるエラーおよびあいまいさの起源は、少なくとも1セットのプローブを用いて目的の各標的遺伝子座を捕捉することおよび/または調べることによって対処され得、ここで、種々のプローブは、アッセイ反応を追跡するため、および生成される情報においてある特定のタイプの遺伝情報が提示不足であるかまたは提示過剰であるかを決定するために使用され得る種々の識別子で標識されている。
いくつかの実施形態において、多数の配列リピートを含む領域の分析に関連するエラーおよびあいまいさは、アッセイの特定の段階(例えば、捕捉、シークエンシングまたは検出の段階)においてある特定の核酸の出現頻度を体系的に分析することによって対処される。そのような手法は、多くの異なる遺伝子座を、各遺伝子座に対して異なるアッセイ手順を必要とすることなく並行して評価できるように設計された標準化プロトコルにおいて特に有用であり得ることが認識されるだろう。いくつかの実施形態において、複数のタイプの遺伝子病変(例えば、点変異、挿入/欠失、長さの多型)をアッセイするために単一の検出様式(例えば、シークエンシング)を使用することは、臨床の状況において都合がよい。本発明のいくつかの実施形態において、並行した複数のサンプル調製工程の使用を促進する方法が提供され、その方法には、配列検出の後に複数の分析プロセスが連結される。よって、本発明のいくつかの実施形態において、複数の患者の複数の遺伝子座にわたって種々のタイプの遺伝子病変を同時にアッセイするときのエラーおよび不確かさを減少させる改善されたワークフローが提供される。
いくつかの実施形態において、本発明の局面は、2つ以上の手法(各々が、異なるバイアス(bias)(例えば、1つ以上のタイプの配列の提示不足または提示過剰に向かう公知のバイアス)を有する)を組み合わせ、そして得られたデータを用いることにより、より高い信頼性で被験体に対する遺伝的コール(genetic call)を決定することによって、調製および/または分析のバイアスを克服するための方法を提供する。
いくつかの実施形態において、本発明の局面は、多重診断方法(multiplex diagnostic method)に関することが認識されるだろう。いくつかの実施形態において、多重診断方法は、複数の遺伝子座(例えば、表1からの1つ以上の遺伝子座)を並行して捕捉する工程を包含する。いくつかの実施形態において、それらの遺伝子座は、1つ以上の多型(例えば、表2からの1つ以上の多型)を有し、その遺伝子型は、疾患を引き起こす対立遺伝子に対応する。したがって、いくつかの実施形態において、本開示は、複数の遺伝性障害を並行して評価するための方法を提供する。いくつかの実施形態において、着床前、出生前、出生時または出生後の段階において複数の遺伝性障害を並行して診断するための方法が提供される。いくつかの実施形態において、本開示は、患者サンプル(例えば、血液、着床前胚、絨毛または羊水サンプル)から、または本発明の局面はこの点に限定されないので、他のサンプル(例えば、他の生体液または組織サンプル、例えば、生検サンプル)から複数の遺伝子座(例えば、表1から選択される複数の標的核酸)を分析するための方法を提供する。
他のサンプルとしては、腫瘍組織または循環腫瘍細胞が挙げられ得る。いくつかの実施形態において、患者サンプル(例えば、腫瘍組織サンプルまたは腫瘍細胞サンプル)は、目的の1つ以上の変異に対する寄せ集めであるので、生殖細胞系列における変異の分析に必要な感度よりも高い感度を必要とし得る。いくつかの実施形態において、サンプルは、宿主生物に由来しない細胞(例えば、ヒト被験体内の細菌感染物またはウイルス感染物)または環境モニタリング用のサンプル(例えば、土壌、水または大気サンプルの細菌、ウイルス、真菌の組成物)を含む。
したがって、いくつかの実施形態において、本明細書中に開示される方法の局面は、標的核酸の多型の遺伝子タイピングに関する。いくつかの実施形態において、遺伝子タイピングは、標的核酸の1つ以上の対立遺伝子がヘテロ接合であるかまたはホモ接合であるかを決定することを包含し得る。さらなる実施形態において、遺伝子タイピングは、多型の配列を決定すること、およびその配列を、疾患リスクを示唆するコントロール配列と比較することを包含し得る。いくつかの実施形態において、多型は、表1または表2における遺伝子座から選択される。しかしながら、目的の疾患または状態に関連する任意の遺伝子座が使用され得ることが認識されるだろう。
いくつかの実施形態において、被験体の1つ以上の遺伝子座において決定された遺伝子型に基づいて(例えば、被験体から得られた生物学的サンプルの分析に基づいて)、診断、予後または疾患リスクの評価が、その被験体に対して提供される。いくつかの実施形態において、1つ以上の遺伝子座における夫婦のそれぞれの遺伝子型に基づいて、ある疾患または状態に関連する遺伝子型(例えば、ある疾患または状態に関連するホモ接合またはヘテロ接合の遺伝子型)を有する1人以上の小児を有するリスクに関する評価がその夫婦に提供される。いくつかの実施形態において、被験体または夫婦は、本発明の実施形態に従って決定された遺伝子型に関連して遺伝カウンセリングまたは生殖カウンセリングを求め得る。いくつかの実施形態において、腫瘍または循環腫瘍細胞からの遺伝情報は、予後を決定するためおよび適切な薬物/処置の選択を導くために使用される。
本明細書中に記載される任意の方法または組成物は、本明細書中に記載されるような1つ以上の遺伝子座に関連する任意の医学的評価と組み合わせて使用され得ることが認識されるだろう。
いくつかの実施形態において、本発明の局面は、多重的なゲノムの捕捉および/または分析(配列決定分析を含む)における系統誤差(バイアス)および/または確率的影響に関連する課題を克服するために有効な方法を提供する。いくつかの実施形態において、本発明の局面は、1つ以上のサンプリング工程および/または分析工程におけるばらつきを回避するため、減少させるためおよび/または説明するために有用である。例えば、いくつかの実施形態において、標的核酸の提示のばらつきおよび捕捉された標的核酸プール内のヘテロ接合性対立遺伝子の不均等なサンプリングが、克服され得る。
したがって、いくつかの実施形態において、本開示は、多重捕捉方法における標的核酸の検出においてばらつきを減少させる方法を提供する。他の実施形態において、その方法は、捕捉プールにおける対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、従来技術の方法と比べて、捕捉プール内の標的核酸(例えば、遺伝子座)のより均一な提示を達成するための、標的核酸の重複領域を捕捉する複数のプローブ(例えば、分子反転プローブ(molecular inversion probes)MIPs)の種々のセットの使用を含む、標的核酸を捕捉するための調製方法を提供する。他の実施形態において、その方法は、例えば、診断目的での、遺伝子座の大規模な並行捕捉に関連するバイアスまたはバイアスのリスクを低下させる。他の実施形態において、複数の遺伝子座の並行検出の再現性を高めるための(例えば、標的核酸の捕捉に対する多型の影響を低下させることによって)方法が提供される。さらなる実施形態において、複数の遺伝子座の並行した分析に対する、プローブ合成および/またはプローブ増幅のばらつきの影響を減少させるための方法が提供される。
いくつかの局面によると、複数の遺伝子座を分析する方法が提供される。いくつかの実施形態において、その方法は、複数の標的核酸の各々をプローブセットと接触させる工程(ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的な5’領域および3’領域に隣接する中央領域を有し、ここで、その標的核酸の部分領域は、異なり、各部分領域は、少なくとも1つの他の部分領域と重複する)、複数の核酸(各々、複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する)を単離する工程、ならびに単離された核酸を分析する工程を包含する。
他の実施形態において、方法は、複数の標的核酸の各々をプローブセットと接触させる工程(ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的な5’領域および3’領域に隣接する中央領域を有し、ここで、その標的核酸の部分領域は、異なり、プローブの5’領域の一部および3’領域の一部は、それぞれ、異なるプローブの5’領域の配列および3’領域の配列を有する)、複数の核酸(各々、複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する)を単離する工程、ならびに単離された核酸を分析する工程を包含する。
本開示の局面は、ゲノムの捕捉、増幅およびシークエンシングの方法における系統誤差および偶然誤差(バイアス)、すなわち、核酸の捕捉および増幅、ならびにシークエンシングライブラリー内のヘテロ接合対立遺伝子の不均衡な提示における大きなばらつきに関連する問題を克服するための方法の発見に部分的に基づく。したがって、いくつかの実施形態において、本開示は、核酸の捕捉および増幅におけるばらつきに関連するエラーを減少させる方法を提供する。他の実施形態において、その方法は、シークエンシングライブラリー内の対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、個別の核酸分子を独特にタグ化する識別タグ配列(differentiator tag sequence)の使用を含む、標的核酸(例えば、遺伝子座)を捕捉するための調製方法を提供する。いくつかの実施形態において、その識別タグ配列のおかげで、シークエンシング反応において観察される識別タグ配列と標的配列との組み合わせの出現に基づいたバイアスの検出が可能になる。他の実施形態において、その方法は、例えば、診断目的での、遺伝子座の捕捉、増幅およびシークエンシングに関連するバイアスによって引き起こされるエラー、またはバイアスのリスクを減少させる。
本発明の局面は、アッセイにおいて同定された標的核酸配列が独立して単離された標的核酸に由来するかまたは複数のコピー数の同じ標的核酸分子に由来するかを決定する(例えば、調製工程、例えば、増幅におけるバイアスに起因して)ために有用である配列タグ(識別タグと呼ばれる)を提供することに関する。この情報は、信頼できる配列情報を得るために、生物学的サンプルから独立して単離された閾値数(threshold number)の標的核酸の分析を助けるために使用され得、また、所望の程度の信頼度で遺伝子型の結論(例えば、コール)をもたらすために使用され得る。この情報は、1つ以上の核酸調製工程におけるバイアスを検出するためにも使用され得る。
いくつかの実施形態において、本明細書中に開示される方法は、例えば、ゲノムの単離、増幅、シークエンシングに関連する、バイアスを減少させることが重要な任意の用途にとって有用である。例えば、不均一な組織サンプルにおける癌変異の検出、母体に循環する胎児DNAにおける変異の検出、および着床前遺伝子診断法において単離された細胞における変異の検出。
したがって、いくつかの局面において、被験体の遺伝子タイピングを行う方法が提供される。いくつかの実施形態において、その方法は、独立して単離された少なくとも閾値数の核酸の配列を決定する工程を包含し、ここで、単離された各核酸の配列は、標的核酸配列および識別タグ配列を含み、閾値数は、標的核酸配列と識別タグ配列との独特の組み合わせの数であり、単離された核酸は、標的核酸配列と識別タグ配列との独特の組み合わせを含む場合、独立して単離されたと同定され、ここで、標的核酸配列は、被験体のゲノム遺伝子座の配列である。
いくつかの実施形態において、単離された核酸は、環状化選択(circularization selection)ベースの調製方法の産物、例えば、分子反転プローブによる捕捉産物である。他の実施形態において、単離された核酸は、増幅ベースの調製方法の産物である。他の実施形態において、単離された核酸は、ハイブリダイゼーションベースの調製方法の産物である。
環状化選択ベースの調製方法は、目的の領域(標的核酸)を共有結合的に閉じた環状分子に選択的に変換し、次いでその環状分子を、代表的には、任意の環状化されていない直鎖状核酸の除去(通常、例えばエキソヌクレアーゼを用いた、酵素的な除去)によって単離する。目的の領域(標的核酸)に隣接する末端および必要に応じてプライマー部位、例えば、シークエンシングプライマー部位を有するオリゴヌクレオチドプローブ(例えば、分子反転プローブ)を設計する。それらのプローブは、ゲノム標的にハイブリダイズすることができ、酵素を用いることにより、第1に(必要に応じて)プローブの末端間の任意のギャップが埋められ、第2に、プローブが閉じてライゲートされる。環状化の後、代表的には、任意の残りの(非標的)直鎖状核酸が除去され、標的核酸が単離(捕捉)される。環状化選択ベースの調製方法には、分子反転プローブによる捕捉反応および「セレクター(selector)」による捕捉反応が含まれる。いくつかの実施形態において、分子反転プローブによる標的核酸の捕捉は、標的核酸における多型の存在を示す。
増幅ベース(例えば、PCRベースまたはLCRベースなど)の調製方法において、ゲノム遺伝子座(標的核酸)は、1つ以上のオリゴヌクレオチドプライマーを用いて各遺伝子座を選択的に増幅するポリメラーゼ連鎖反応またはリガーゼ連鎖反応(または他の増幅方法)を用いて直接単離される。プライマーは、標的核酸とハイブリダイズするのに十分かつ標的核酸の増幅をプライミングするのに十分、標的配列と相補的であることが理解されるべきである。様々な分野において公知の方法のいずれか1つが、プライマーの設計および合成のために利用され得る。1つ以上のプライマーが、標的配列と完全に相補的であり得る。縮重プライマーもまた使用され得る。プライマーは、標的配列と相補的でないが下流の用途を容易にする追加の核酸(例えば、制限酵素認識部位および識別タグ配列を含む)も含み得る。増幅ベースの方法は、単一標的核酸の増幅および多重増幅(複数の標的核酸の並行した増幅)を含む。
ハイブリダイゼーションベースの調製方法は、さらなる操作のために標的核酸を選択的に固定化する工程を包含し得る。識別タグ配列を含み、かつ15〜170ヌクレオチド長であり得る1つ以上のオリゴヌクレオチド(固定化オリゴヌクレオチド)が使用され、そのオリゴヌクレオチドが、遺伝子座の標的領域にわたってハイブリダイズすることにより、その標的領域が固定化されることが理解されるべきである。いくつかの実施形態において、固定化オリゴヌクレオチドは、ハイブリダイゼーションが行われる前に固定化されるか(例えば、Roche/Nimblegen「配列捕捉」)、または例えば、ストレプトアビジンでコーティングされたマイクロビーズに結合することによってハイブリダイゼーションの後に標的核酸を選択的に固定化するために使用され得る部分(例えば、ビオチン)を含むように調製される(例えば、Agilent「SureSelect」)。
本明細書中に記載される環状化、増幅および/またはハイブリダイゼーションベースの方法のいずれかが、本明細書中に記載されるタイリング(tiling)/スタガリング(staggering)、タギング、サイズ検出および/または感度増強アルゴリズムのうちの1つ以上に関連して使用され得ることが認識されるだろう。
いくつかの実施形態において、本明細書中に開示される方法は、分子反転プローブによる捕捉産物(各捕捉産物は、分子反転プローブおよび標的核酸を含む)の配列を決定する工程(ここで、その分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、標的核酸は、被験体の捕捉されるゲノム遺伝子座である)および分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列に基づいて、捕捉されたゲノム遺伝子座において被験体の遺伝子タイピングを行う工程を包含する。
いくつかの実施形態において、本明細書中に開示される方法は、分子反転プローブによる捕捉産物(各捕捉産物は、分子反転プローブおよび標的核酸を含む)を得る工程(ここで、その分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、ここで、標的核酸は、被験体の捕捉されるゲノム遺伝子座である)、分子反転プローブによる捕捉産物を増幅する工程、ならびに各標的核酸について、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列を決定することによって被験体の遺伝子タイピングを行う工程を包含する。ある特定の実施形態において、上記の得る工程は、分子反転プローブ(各々が独特の識別タグ配列を含む)を用いて被験体のゲノムサンプルから標的核酸を捕捉する工程を包含する。特定の実施形態において、捕捉工程は、標的配列と識別タグ配列との同一の組み合わせを用いて2つ以上の分子反転プローブによる捕捉産物が得られる尤度が所定の値と等しいかまたはそれ未満であり、必要に応じてその所定の値が約0.05である条件下で行われる。
1つの実施形態において、特定の標的核酸配列に対する閾値数は、その遺伝子型に対する所望の統計学的信頼度に基づいて選択される。いくつかの実施形態において、上記方法は、標的核酸配列と識別タグ配列との独特の組み合わせの数に基づいて、遺伝子型に対する統計学的信頼度を決定する工程をさらに包含する。
いくつかの局面によると、複数の遺伝子座を分析する方法が提供される。いくつかの実施形態において、その方法は、分子反転プローブによる複数の捕捉産物(各々、分子反転プローブおよび標的核酸を含む)を得る工程(ここで、その分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列(例えば、シークエンシング用または他の伸長反応用のプライマーとして使用される核酸の配列と相補的である配列)を含む)、その分子反転プローブによる複数の捕捉産物を増幅する工程、増幅された複数のものにおける、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との組み合わせの出現数を測定する工程、ならびに標的核酸配列と識別タグ配列との特定の組み合わせの出現数が、所定の値を超える場合、その特定の組み合わせを含む分子反転プローブの増幅におけるバイアスを検出する工程を包含する。いくつかの実施形態において、その方法は、その複数のものにおける標的配列の遺伝子タイピングを行う工程をさらに包含し、ここで、その遺伝子タイピングは、バイアスが検出された場合にそのバイアスを補正する工程を包含する。
いくつかの実施形態において、標的核酸は、表1から選択される遺伝子(またはその一部)である。いくつかの実施形態において、遺伝子タイピングは、被験体のゲノム(二倍体ゲノム)の1つ以上(両方)の対立遺伝子における標的核酸(例えば、多型配列)の配列を決定することを含む。ある特定の実施形態において、遺伝子タイピングは、被験体の二倍体ゲノムの両方の対立遺伝子における標的核酸の配列を決定することを含み、ここで、その標的核酸は、表1、表2の配列または他の目的の遺伝子座を含むか、またはそれらからなる。
いくつかの実施形態において、本発明の局面は、目的のゲノム領域のヌクレオチド配列を決定することなく、これらの領域における核酸の挿入または欠失を同定するための方法および組成物を提供する。本発明の局面は、核酸配列リピート(例えば、ジヌクレオチドリピートまたはトリヌクレオチドリピート)を含むゲノム領域において核酸の挿入または欠失を検出するために特に有用である。しかしながら、本発明は、核酸リピートを分析することに限定されず、任意の目的の標的核酸における挿入または欠失を検出するためにも使用され得る。本発明の局面は、多重アッセイにおいて複数の遺伝子座を分析するために特に有用である。
いくつかの実施形態において、本発明の局面は、ゲノム捕捉アッセイにおいて捕捉される標的核酸の量が、予想よりも多いまたは少ないことを決定することに関する。いくつかの実施形態において、予想される量からの統計学的に有意な偏差(例えば、多いまたは少ない)は、目的のゲノム領域における核酸の挿入または欠失の存在を示す。いくつかの実施形態において、その量は、捕捉される核酸分子の数である。いくつかの実施形態において、その量は、サンプル中の独立して捕捉された核酸分子の数である。捕捉される核酸は、サンプルから文字通り捕捉されてもよいし、それらの配列は、サンプル中の元の核酸を実際に捕捉することなく捕捉されてもよいことが認識されるだろう。例えば、核酸配列は、サンプル中の、目的の領域を有する鋳型ベースの核酸伸長を含むアッセイにおいて捕捉され得る。
本発明の局面は、ある特定の捕捉手法の効率が、捕捉される核酸の長さに影響されるという認識に基づく。したがって、標的核酸の長さが長くなることまたは短くなること(例えば、反復配列の挿入または欠失に起因して)によって、その核酸の捕捉効率が変化し得る。いくつかの実施形態において、標的核酸の捕捉効率の差(例えば、捕捉効率の統計学的に有意な差)は、標的核酸における挿入または欠失を示唆する。標的核酸に対する捕捉効率は、コントロールの量に対する(例えば、捕捉されたコントロール核酸の量に基づく)、捕捉された核酸の量(例えば、捕捉された核酸分子の数)に基づいて評価され得ることが認識されるだろう。しかしながら、本発明は、この点に限定されず、捕捉効率を評価するための他の手法を使用してもよい。
本発明の局面によると、リピート領域全体の配列を決定することに対立するものとして捕捉効率を評価することは、リピート領域のシークエンシングに関連するエラーを減少させる。リピート配列は、種々の条件下において複数のシークエンシング反応を行うことなくおよび結果を慎重に分析することなく標的領域内のリピートの数を正確に決定することを困難にするスタッター(stutter)またはスキップをシークエンシング反応において引き起こすことが多い。そのような手順は、煩わしく、標的核酸のハイスループット分析と一致する様式として容易に拡張できない。いくつかの実施形態において、リピート領域は、個別の配列リード(read)の長さよりも長いことがあり、単一のリードに基づいた長さの決定を不可能にする。例えば、次世代シークエンシングを用いるとき、リピート領域は、個別の配列リードの長さよりも長いことがあり、単一のリードに基づいた長さの決定を不可能にする。したがって、本発明の局面は、標的領域、特に、反復配列を含む標的領域における挿入または欠失を検出する感度を高めるために有用である。
いくつかの実施形態において、本発明の局面は、分子反転プローブ(例えば、MIPまたはパドロックプローブ)法を用いてゲノム核酸配列を捕捉すること、および捕捉された配列の量(例えば、数)が予想よりも多いまたは少ないことを決定することに関する。いくつかの実施形態において、捕捉された配列の量(例えば、数)は、コントロールアッセイにおいて捕捉された配列の量(例えば、数)と比較される。そのコントロールアッセイは、既知の配列長(例えば、既知の核酸リピート数)を有する同じ遺伝子座由来の核酸を含むコントロールサンプルを分析することを含み得る。しかしながら、コントロールは、いかなる挿入または欠失も含むと予想されない第2の(例えば、異なる)遺伝子座を分析することを含み得る。その第2の遺伝子座は、調べられている遺伝子座と同じサンプルまたはその長さが予め測定されている異なるサンプルにおいて分析され得る。その第2の遺伝子座は、核酸リピートの存在を特徴としない(ゆえに、リピート配列の挿入または欠失を含むと予想されない)遺伝子座であり得る。
いくつかの実施形態において、評価されている標的核酸領域は、標的領域(またはその配列)を捕捉するために設計されたプローブの標的化アーム(targeting arm)の同一性によって決定され得る。例えば、MIPプローブの標的化アームは、挿入または欠失を含むと疑われる標的領域に隣接するゲノム領域に対して相補的(例えば、選択的なハイブリダイゼーションおよび//またはポリメラーゼ伸長および/またはライゲーションにとって十分に相補的)であるように設計され得る。2つの標的化アームが、ゲノム核酸の一方の鎖において配列リピートの領域のすぐ隣(例えば、それぞれすぐ5’および3’)である2つの隣接領域に対して相補的(例えば、選択的なハイブリダイゼーションおよび/またはポリメラーゼ伸長および/またはライゲーションにとって十分に相補的)であるように設計され得ることが認識されるだろう。しかしながら、一方または両方の標的化アームは、捕捉される配列が、リピート領域の片側または両側に独特のゲノム配列の領域を含むように、リピート領域から数塩基(例えば、1〜5、5〜10、10〜25、25〜50またはそれ以上)上流または下流とハイブリダイズするように設計され得る。次いで、この独特の領域を用いることにより、捕捉された標的を同定することができる(例えば、配列情報またはハイブリダイゼーション情報に基づいて)。
いくつかの実施形態において、2つ以上(例えば、2、3、4、5、6、7、8、9、10個またはそれ以上)の異なる遺伝子座が、単一アッセイ(例えば、多重アッセイ)において並行して調べられ得る。いくつかの実施形態において、各遺伝子座に対する捕捉された核酸の比を用いることにより、核酸の挿入または欠失が、他の遺伝子座と比べて1つの遺伝子座に存在するか否かが決定され得る。例えば、その比は、コントロール配列(例えば、正常である配列またはそれらの遺伝子座について健常表現型に関連すると知られている配列)と比べて挿入または欠失を有しないときの2つの遺伝子座を代表するコントロール比と比較され得る。しかしながら、捕捉された核酸の量は、本明細書中で述べられるような任意の適当なコントロールと比較されてもよい。
捕捉された配列の遺伝子座は、欠失または挿入を含むと疑われる標的核酸内のリピート領域に対して5’および/または3’の独特の配列の一部を決定することによって同定され得る。これは、捕捉されたリピート領域自体のシークエンシングを必要としない。しかしながら、本発明の局面は、この点に限定されないので、リピート領域の一部または全部が配列決定され得る。
本発明の局面は、1つ以上の配列ベースのアッセイ(例えば、SNP検出アッセイ)と組み合わせる(例えば多重形式で)ことにより、被験体の1つ以上の領域の遺伝子型を決定し得る。
いくつかの実施形態において、生物学的サンプル中の核酸において多型を検出する方法が提供される。いくつかの実施形態において、その方法は、1つ以上の遺伝子座における捕捉の効率を評価する工程、ならびにその遺伝子座における一方または両方の対立遺伝子がコントロール遺伝子座(例えば、健常表現型に関連するリピート配列の長さを示す遺伝子座)と比べて挿入または欠失を含むか否かを決定する工程を包含する。
したがって、本発明の局面は、被験体由来の生物学的サンプル中の標的核酸の捕捉効率を評価することによって、標的核酸が異常な長さを有するか否かを決定するための方法に関し、ここで、基準となる捕捉効率と異なる捕捉効率は、生物学的サンプル中の異常な長さを有する標的核酸の存在を示す。用語「異常な」は、「正常な」長さとの比較に基づく相対的な用語であることが認識されるだろう。いくつかの実施形態において、正常な長さは、正常(例えば、健常者または非保因者の表現型)に関連する長さである。したがって、異常な長さは、正常な長さよりも短いかまたは長い長さである。いくつかの実施形態において、異常な長さの存在は、その遺伝子座が疾患または疾患保因者表現型に関連する高いリスクを示唆する。いくつかの実施形態において、異常な長さは、その被験体が、ある疾患もしくは状態を有するか、またはある疾患もしくは状態(例えば、その遺伝子座に関連するもの)の保因者であることを示唆する。しかしながら、異常な長さの存在を検出することに関する実施形態の記載は、予想される長さまたはコントロールの長さと異なる長さの存在を検出することも支持することが認識されるだろう。
いくつかの実施形態において、本発明の局面は、標的核酸(例えば、標的核酸内のサブターゲット(sub−target)領域)の長さを推定することに関する。いくつかの実施形態において、本発明の局面は、標的核酸に対する検出プローブのハイブリダイゼーションを可能にする条件下で複数の検出プローブと標的核酸を接触させること(ここで、各検出プローブは、標的核酸の第1の領域にハイブリダイズする第1のアームおよび標的核酸の第2の領域にハイブリダイズする第2のアームを含むポリヌクレオチドであり、ここで、第1の領域および第2の領域は、標的核酸の共通の鎖に存在し、第1の領域の5’末端と第2の領域の3’末端との間の標的のヌクレオチド配列は、サブターゲット核酸のヌクレオチド配列である);および複数の検出プローブとハイブリダイズした複数のサブターゲット核酸を捕捉すること;および複数のサブターゲット核酸におけるあるサブターゲット核酸の出現頻度を測定すること(ここで、複数のサブターゲット核酸におけるあるサブターゲット核酸の出現頻度は、サブターゲット核酸の長さを示す)によって、標的核酸の長さを推定するための方法に関する。核酸の長さを推定するための方法は、標的核酸領域が、既知のコントロール長よりも短いか、中間であるか、または長いかを決定するために、既知の核酸の長さに対する2つ以上の基準となる効率と、標的核酸領域に対する捕捉効率を比較する工程を包含し得ることが認識されるだろう。いくつかの実施形態において、異なる既知の長さの一連の核酸を用いることにより、目的の標的核酸領域の長さを評価するための検量線が提供され得る。
いくつかの実施形態において、欠失または挿入を有すると疑われる標的領域の捕捉効率は、その捕捉効率を、正常の捕捉効率を示す参照と比較することによって測定される。いくつかの実施形態において、捕捉効率は、基準となる捕捉効率よりも低い。いくつかの実施形態において、被験体は、標的領域に挿入を有すると同定される。いくつかの実施形態において、捕捉効率は、基準となる捕捉効率よりも高い。いくつかの実施形態において、被験体は、標的領域に欠失を有すると同定される。いくつかの実施形態において、被験体は、挿入についてヘテロ接合であると同定される。いくつかの実施形態において、被験体は、欠失についてヘテロ接合であると同定される。
本明細書中に記載される方法(例えば、タイリング/スタガリング、タギング、サイズ検出および/または感度増強)のいずれかのいくつかの実施形態において、本発明の局面は、サブターゲット核酸(またはサブターゲット核酸の配列)を捕捉することに関する。いくつかの実施形態において、分子反転プローブの手法が用いられる。いくつかの実施形態において、分子反転プローブは、その5’末端に第1の標的化アームを含み、その3’末端に第2の標的化アームを含む核酸の直鎖状の一本鎖であり、ここで、その第1の標的化アームは、サブターゲット核酸の一方の末端に隣接する第1の領域と特異的にハイブリダイズすることができ、第2の標的化アームは、標的核酸の同じ鎖におけるサブターゲット核酸の他方の末端に隣接する第2の領域と特異的にハイブリダイズすることができる。いくつかの実施形態において、第1および第2の標的化アームは、約10〜約100ヌクレオチド長である。いくつかの実施形態において、第1および第2の標的化アームは、約10〜20、20〜30、30〜40または40〜50ヌクレオチド長である。いくつかの実施形態において、第1および第2の標的化アームは、約20ヌクレオチド長である。いくつかの実施形態において、第1および第2の標的化アームは、同じ長さを有する。いくつかの実施形態において、第1および第2の標的化アームは、異なる長さを有する。いくつかの実施形態において、プローブセットにおける第1の標的化アームと第2の標的化アームとの各対は、同じ長さを有する。したがって、一方の標的化アームのほうが長い場合、他方は、対応してより短い。これにより、いくつかの実施形態における精度管理工程が、捕捉されたすべてのプローブ/標的配列産物が多重化された複数の捕捉反応の後に同じ長さを有することを保証することが可能になる。いくつかの実施形態において、介在領域が、第1および第2の標的化アームの一方または両方の長さの任意の差異を吸収する(accommodate)ように変更される場合、プローブセットは、同じ長さを有するように設計され得る。
いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、同様のものである。いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、互いの2〜5℃以内である。いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、同一である。いくつかの実施形態において、第1および第2の標的化アームのハイブリダイゼーションTmは、経験的に決定される最適条件に近いが、必ずしも同一でない。
いくつかの実施形態において、分子反転プローブの第1および第2の標的化アームは、異なるTmを有する。例えば、第1の標的化アーム(分子反転プローブの5’末端におけるもの)のTmは、第2の標的化アーム(分子反転プローブの3’末端におけるもの)のTmよりも高いことがある。本発明の局面によると、理論に拘束するつもりはないが、第1の標的化アームに対するTmが相対的に高いことにより、第1の標的化アームが、第2の標的化アームの3’末端の伸長産物によってハイブリダイゼーション後に置き換えられることを回避するかまたは防ぐのが助けられ得る。本明細書中で使用されるような標的化アームのTmに対する参照は、相補的配列(例えば、標的化アームの配列と相補的である配列を有する標的核酸の領域)を有する核酸に対する標的化アームのハイブリダイゼーションTmに関するものであることが認識されるだろう。また、本明細書中に記載される標的化アームのTmは、任意の適切な方法を用いて計算され得ることも認識されるだろう。例えば、いくつかの実施形態において、ある実験方法(例えば、ゲルシフトアッセイ、ハイブリダイゼーションアッセイ、融解曲線分析法、例えば、インターカレート色素(例えば、二本鎖DNAに結合した色素など)からのシグナルレベルをモニタリングしつつ温度勾配(temperature ramp)を行うことによるSYBR色素を用いるPCR機器における融解曲線分析法)を用いることにより、1つ以上のTmが経験的に測定され得る。いくつかの実施形態において、最適なTmは、形成された産物の数を評価すること(例えば、複数のMIPプローブの各々について)、および最適なTmを、すべての標的化アームに対するTmのヒストグラムにおける中心点として決定することによって、決定され得る。いくつかの実施形態において、予測アルゴリズムを用いることにより、Tmが理論的に決定され得る。いくつかの実施形態において、配列がその標的とハイブリダイズするときのG/CおよびA/T塩基対の数ならびに/またはハイブリダイズ産物の長さに基づいた比較的単純な予測アルゴリズムが用いられ得る(例えば、例えば、64.9+41([G+C]−16.4)/(A+T+G+C)、例えば、Wallace,R.B.,Shaffer,J.,Murphy,R.F.,Bonner,J.,Hirose,T.,and Itakura,K.(1979)Nucleic Acids Res 6:3543−3557を参照のこと)。いくつかの実施形態において、より複雑なアルゴリズムを用いることにより、塩基のスタッキングのエントロピーおよびエンタルピー、イオン濃度ならびにプライマー濃度の作用が説明され得る(例えば、SantaLucia J(1998),Proc Natl Acad Sci USA,95:1460−5を参照のこと)。いくつかの実施形態において、アルゴリズムは、改変パラメータ(例えば、塩基対のエントロピー/エンタルピー値に対する最近接パラメータ)を使用し得る。本発明の局面は、この点に限定されないので、任意の適当なアルゴリズムを使用してもよいことが認識されるだろう。しかしながら、種々の方法によって、同じ配列に対して異なるTmの計算値または予測値がもたらされ得ることも認識されるだろう。したがって、いくつかの実施形態において、異なるTmについて所定の類似度または差異を有するプローブのセットを設計するとき、Tmの決定または予測における任意の体系的な差異の負の影響を回避するように、プローブセットに対する種々の配列のTmを決定するために同じ経験的な方法および/または理論的な方法が用いられる。
いくつかの実施形態において、第1の標的化アームのTmは、第2の標的化アームのTmよりも約1℃、約2℃、約3℃、約4℃、約5℃高いかまたは約5℃超高いことがある。いくつかの実施形態において、複数のプローブにおける各プローブ(例えば、5〜10個の異なるプローブのセットにおける各プローブ、少なくとも10個の異なるプローブのセットにおける各プローブ、10〜50個の異なるプローブのセットにおける各プローブ、50〜100個の異なるプローブのセットにおける各プローブ、100〜500個の異なるプローブのセットにおける各プローブ、500〜1,000個の異なるプローブのセットにおける各プローブ、1,000〜1,500個の異なるプローブのセットにおける各プローブ、1,500〜2,000個の異なるプローブのセットにおける各プローブ、2,000〜3,000個の異なるプローブのセットにおける各プローブ、3,000〜5,000個の異なるプローブのセットにおける各プローブ、5,000〜10,000個の異なるプローブのセットにおける各プローブまたは少なくとも5,000個の異なるプローブのセットにおける各プローブ)は、独特の第1の標的化アーム(例えば、それらすべてが異なる配列を有する)および独特の第2の標的化アーム(例えば、それらすべてが異なる配列を有する)を有する。いくつかの実施形態において、プローブの少なくとも10%(例えば、プローブの少なくとも25%、25%〜50%、50%〜75%、75%〜90%、90%〜95%もしくは95%超またはすべて)について、第1の標的化アームは、第2の標的化アームの相補的配列に対する第2の標的化アームのTmよりも高い(例えば、約1℃、約2℃、約3℃、約4℃、約5℃高いかまたは約5℃超高い)第1の標的化アームの相補的配列に対するTmを有する。いくつかの実施形態において、第1の標的化アームの各々は、それらのそれぞれの相補的配列に対する同様または同一のTmを有し、第2の標的化アームの各々は、それらのそれぞれの相補的配列に対する同様または同一のTmを有する(そして、第1の標的化アームは、第2の標的化アームよりも高いTmを有する)。例えば、いくつかの実施形態において、第1のアームのTmは、約58℃であり得、第2のアームのTmは、約56℃であり得る。いくつかの実施形態において、第1のアームのTmは、約68℃であり得、第2のアームのTmは、約65℃であり得る。いくつかの実施形態において、異なる標的化アームに対するTmの類似度(例えば、1℃、2℃、3℃、4℃、5℃の範囲内)または同一性は、各アームに対して経験的なデータに基づくべきであるか、または各アームに対して同じ予測アルゴリズム(例えば、Wallace,R.B.,Shaffer,J.,Murphy,R.F.,Bonner,J.,Hirose,T.,and Itakura,K.(1979)Nucleic Acids Res 6:3543−3557,SantaLucia J(1998),Proc Natl Acad Sci USA,95:1460−5または他のアルゴリズム)に基づくべきであることが認識されるだろう。
いくつかの実施形態において、分子反転プローブの第1の標的化アーム(分子反転プローブの5’末端におけるもの)のTmは、標的核酸におけるその相補的配列からの第1の標的化アームの置き換えを防ぐのに十分に安定であるように選択される。いくつかの実施形態において、第1の標的化アームのTmは、50〜55℃、少なくとも55℃、55〜60℃、少なくとも60℃、60〜65℃、少なくとも65℃、少なくとも70℃、少なくとも75℃または少なくとも80℃である。上で考察されたように、特定の標的化アームが経験的または理論的に決定され得ることが認識されるだろう。種々の理論モデルを用いることにより、Tmが決定され得、また、特定の配列に対して予想されるTmは、その予測に使用されるアルゴリズムに応じて異なり得ることが認識されるだろう。いくつかの実施形態において、複数のプローブ中の各プローブ(例えば、5〜10個の異なるプローブのセットにおける各プローブ、少なくとも10個の異なるプローブのセットにおける各プローブ、10〜50個の異なるプローブのセットにおける各プローブ、50〜100個のセット異なるプローブにおける各プローブ、100〜500個の異なるプローブのセットにおける各プローブ、または少なくとも500個の異なるプローブのセットにおける各プローブ)は、異なる第1の標的化アーム(例えば、異なる配列)を有するが、異なる第1の標的化アームの各々は、標的核酸におけるその相補的配列に対する同様または同一のTmを有する。いくつかの実施形態において、異なる標的化アームに対するTmの類似度(例えば、1℃、2℃、3℃、4℃、5℃の範囲内)または同一性は、各アームに対して経験的なデータに基づくべきであるか、または各アームに対して同じ予測アルゴリズム(例えば、Wallace,R.B.,Shaffer,J.,Murphy,R.F.,Bonner,J.,Hirose,T.,and Itakura,K.(1979)Nucleic Acids Res 6:3543−3557,SantaLucia J(1998),Proc Natl Acad Sci USA,95:1460−5または他のアルゴリズム)に基づくべきであることが認識されるだろう。
いくつかの実施形態において、サブターゲット核酸は、核酸リピートを含む。いくつかの実施形態において、核酸リピートは、ジヌクレオチドまたはトリヌクレオチドリピートである。いくつかの実施形態において、サブターゲット核酸は、核酸リピートの異常な増加または減少の非存在下において10〜100コピーの核酸リピートを含む。いくつかの実施形態において、サブターゲット核酸は、核酸リピートを含む脆弱X遺伝子座の領域である。いくつかの実施形態において、一方または両方の標的化アームは、核酸リピートの領域のすぐ隣の標的核酸における領域とハイブリダイズする。いくつかの実施形態において、一方または両方の標的化アームは、任意の核酸リピートを含まない領域によって核酸リピートの領域から分離された標的核酸における領域とハイブリダイズする。いくつかの実施形態において、分子反転プローブは、捕捉されるサブターゲット核酸ならびに必要に応じて第1の標的化アームおよび/または第2の標的化アームを配列決定するために使用され得るプライマー結合領域をさらに含む。
いくつかの実施形態において、本発明の局面は、生物学的サンプル中の複数の異なる標的核酸の長さを評価することに関する。いくつかの実施形態において、その複数の標的核酸は、複数の異なる分子反転プローブを用いて分析される。いくつかの実施形態において、異なる分子反転プローブの各々は、3’および5’末端の各々に第1の標的化アームと第2の標的化アームとの異なる対を含む。いくつかの実施形態において、異なる分子反転プローブの各々は、同じプライマー結合配列を含む。
いくつかの実施形態において、本発明の局面は、被験体から得られた生物学的サンプル由来の核酸を分析することに関する。いくつかの実施形態において、その生物学的サンプルは、血液サンプルである。いくつかの実施形態において、その生物学的サンプルは、組織サンプル、特定の細胞集団、腫瘍サンプル、循環腫瘍細胞または環境サンプルである。いくつかの実施形態において、生物学的サンプルは、単一の細胞である。いくつかの実施形態において、核酸は、複数の異なる被験体から得られた生物学的サンプルにおいて分析される。いくつかの実施形態において、生物学的サンプル由来の核酸は、多重反応において分析される。生物学的サンプルは、サンプル中の複数の細胞から得られた複数のコピー数のゲノムを含むことが認識されるだろう。したがって、サンプルは、複数の独立したコピー数の目的の標的核酸領域を含み得、その標的核酸領域の捕捉効率は、本明細書中に記載されるようにそのサイズを評価するために使用され得る。
いくつかの実施形態において、本発明の局面は、捕捉された標的核酸の量(例えば、捕捉されたサブターゲット核酸配列の量)を測定することによって核酸の捕捉効率を評価することに関する。いくつかの実施形態において、捕捉された標的核酸の量は、独立して捕捉された標的核酸分子の数(例えば、サブターゲット領域の配列を有する独立して捕捉された分子の量)を測定することによって測定される。いくつかの実施形態において、捕捉された標的核酸の量は、捕捉された核酸の基準となる量と比較される。いくつかの実施形態において、基準となる量は、基準となる核酸の独立して捕捉された分子の数を測定することによって測定される。いくつかの実施形態において、基準となる核酸は、欠失または挿入を含むと疑われない生物学的サンプル中の異なる遺伝子座の核酸である。いくつかの実施形態において、基準となる核酸は、捕捉反応に加えられる、既知サイズおよび既知量の核酸である。本明細書中に記載されるように、独立して捕捉された核酸配列の数は、核酸サンプルをプローブの調製物(例えば、本明細書中に記載されるようなMIPプローブ)と接触させることによって測定され得る。その調製物は、複数のコピー数の同じプローブを含み得、よって、複数の独立したコピー数の標的領域が、異なるプローブ分子によって捕捉され得ることが認識されるだろう。配列を実際に捕捉するプローブ分子の数は、捕捉された分子の量または数を、任意の適当な手法を用いて測定することによって評価され得る。この数は、サンプル中の標的分子の数と、それらの標的分子の捕捉効率の両方を反映するものであり、それは、本明細書中に記載されるような標的分子のサイズに関する。したがって、捕捉効率は、標的核酸の存在量について照らし合わせることによって、例えば、捕捉された標的分子の数または量を適切なコントロール(例えば、コントロール核酸の既知のサイズおよび量、または生物学的サンプル中に同じ量で存在するはずであり、いずれの挿入もしくは欠失も含まないと予想される、異なる遺伝子座)と比較することによって、評価され得る。他の因子(例えば、領域の配列、GC含有量、二次構造の存在など)も、特定の標的核酸領域の捕捉効率に影響し得ることが認識されるだろう。しかしながら、これらの因子は、適切なコントロール(例えば、同様の特性を有する公知の配列、同じ配列、同じ頻度で生物学的サンプル中に存在すると予想される他のゲノム配列など、またはそれらの任意の組み合わせ)を用いることによっても説明され得る。
いくつかの実施形態において、本発明の局面は、ある遺伝子座に対する捕捉効率が、基準となる捕捉効率と統計学的に有意に異なる場合に、その遺伝子座の1つ以上の対立遺伝子に挿入または欠失を有すると被験体を同定することに関する。
本明細書中に記載される捕捉手法のいずれか(例えば、MIPによる捕捉手法)のために用いられるハイブリダイゼーション条件は、公知のハイブリダイゼーション緩衝液およびハイブリダイゼーション条件に基づき得ることが認識されるだろう。
いくつかの実施形態において、本明細書中に開示される方法は、欠失または挿入の検出が重要である任意の用途にとって有用である。
いくつかの実施形態において、本発明の局面は、核酸配列の分析を、サンプリングされる核酸のタイプで異なる系統誤差を有する2つ以上の異なる核酸調製手法からの結果に基づかせることに関する。本発明によると、体系的であり、かつ単純に核酸の捕捉中または増幅中の確率的影響に起因しない、種々の配列バイアスを種々の手法は有する。したがって、核酸調製における変動を克服するために必要な過剰サンプリングの程度は、そのバイアスを克服するのに十分であること(例えば、2〜5倍、5〜10倍、5〜15倍、15〜20倍、20〜30倍、30〜50倍またはその中間からそれより高い倍数の過剰サンプリング)が必要である。
いくつかの実施形態によると、種々の手法は、種々の特徴的なバイアスまたは系統誤差を有する。例えば、1つの手法は、サンプル分析を目的の遺伝子座における1つの特定の対立遺伝子に偏らせ得るのに対し、別の手法は、サンプル分析を同じ遺伝子座の別の対立遺伝子に偏らせ得る。したがって、同じサンプルが、配列分析にむけて核酸を調製するために使用される手法のタイプに応じて、異なると同定され得る。各手法が、目的の多型配列に対して異なる相対的な感度を有するので、これは、感度の限界を効率的に表す。
本発明の局面によると、核酸分析の感度は、異なる核酸調製工程からの配列を組み合わせ、組み合わされた配列情報を診断アッセイのために(例えば、被験体が目的の遺伝子座においてホモ接合であるかまたはヘテロ接合であるかに関するコールを生成するために)用いることによって、高められ得る。
いくつかの実施形態において、本発明は、生物学的サンプルに対して第1の調製方法を用いて標的核酸の第1の調製物を得て、生物学的サンプルに対して第2の調製方法を用いて標的核酸の第2の調製物を得て、第1の核酸調製物と第2の核酸調製物との両方において得られた配列をアッセイして、そして第1の核酸調製物と第2の核酸調製物との両方からの配列情報を用いることにより、生物学的サンプル中の標的核酸の遺伝子型を決定することによって、核酸検出アッセイの感度を高める方法を提供し、ここで、その第1の調製方法および第2の調製方法は、異なる体系的な配列バイアスを有する。いくつかの実施形態において、第1の核酸調製物および第2の核酸調製物は、配列アッセイを行う前に組み合わされる。いくつかの実施形態において、別個の配列アッセイが、第1の核酸調製物および第2の核酸調製物において行われ、両方のアッセイからの配列情報が、組み合わされることにより、生物学的サンプル中の標的核酸の遺伝子型が決定される。いくつかの実施形態において、第1の調製方法は、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法である。いくつかの実施形態において、第2の方法は、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法である。いくつかの実施形態において、第1および第2の方法は、異なるタイプの方法である(例えば、それらのうちの一方だけが、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法であり、他方の方法は、他の2つのタイプの方法のうちの1つである)。したがって、いくつかの実施形態において、第2の調製方法は、増幅ベース、ハイブリダイゼーションベース、または環状プローブベースの調製方法であるが、但し、第2の方法は、第1の方法と異なる。しかしながら、いくつかの実施形態において、両方の方法が、異なる方法であるならば(例えば、両方ともが、増幅ベースまたはハイブリダイゼーションベースの方法であるが、異なるタイプの増幅方法またはハイブリダイゼーション方法、例えば、異なる相対的なバイアスを有する方法であるならば)、それらの両方の方法は、同じタイプの方法であってもよい。
増幅ベース(例えば、PCRベースまたはLCRベースなど)の調製方法において、ゲノム遺伝子座(標的核酸)は、オリゴヌクレオチドプライマー対を用いて各遺伝子座を選択的に増幅するポリメラーゼ連鎖反応またはリガーゼ連鎖反応(または他の増幅方法)を用いて直接単離される。プライマーは、標的核酸とハイブリダイズするのに十分、および標的核酸の増幅をプライミングするのに十分、標的配列と相補的であることが理解されるべきである。様々な分野において公知の方法のいずれか1つが、プライマーの設計および合成のために利用され得る。プライマーの一方または両方が、標的配列と完全に相補的であり得る。縮重プライマーも使用され得る。プライマーは、標的配列と相補的でないが下流の用途を容易にする追加の核酸(例えば、制限酵素認識部位および識別配列(例えば、ソース配列)を含む)も含み得る。PCRベースの方法には、単一の標的核酸の増幅および多重増幅(複数の標的核酸の並行した増幅)が含まれ得る。
ハイブリダイゼーションベースの調製方法は、さらなる操作のために標的核酸を選択的に固定化する工程を包含し得る。いくつかの実施形態において10〜200ヌクレオチド長であり得る1つ以上のオリゴヌクレオチド(固定化オリゴヌクレオチド)が使用され、そのオリゴヌクレオチドは、遺伝子座の標的領域にわたってハイブリダイズすることにより、その標的領域が固定化されることが理解されるべきである。いくつかの実施形態において、固定化オリゴヌクレオチドは、ハイブリダイゼーションが行われる前に固定化されるか(例えば、Roche/Nimblegen「配列捕捉」)、または例えば、ストレプトアビジンでコーティングされたマイクロビーズに結合することによってハイブリダイゼーションの後に標的核酸を選択的に固定化するために使用され得る部分(例えば、ビオチン)を含むように調製される(例えば、Agilent「SureSelect」)。
環状化選択ベースの調製方法は、目的の各領域を共有結合的に閉じた環状分子に選択的に変換し、次いで、その環状分子は、任意の環状化されていない直鎖状核酸を除去すること(通常、例えばエキソヌクレアーゼを用いた、酵素的な除去)によって単離される。目的の領域に隣接する末端を有するオリゴヌクレオチドプローブが設計される。それらのプローブは、ゲノム標的へのハイブリダイズを可能にし、酵素を用いることにより、第1に(必要に応じて)、プローブ末端間の任意のギャップを埋め、第2に、閉じたプローブをライゲートする。いくつかの実施形態において、環状化の後、任意の残りの(非標的)直鎖状核酸が除去されることにより、標的核酸の単離(捕捉)が生じ得る。環状化選択ベースの調製方法は、分子反転プローブによる捕捉反応および「セレクター」による捕捉反応を含む。しかしながら、本発明の局面は、この点に限定されないので、他の手法を使用してもよい。いくつかの実施形態において、標的核酸の分子反転プローブによる捕捉は、標的核酸における多型の存在を示す。
各調製手法のバイアスプロファイルを評価するためおよび比較するために、様々な方法が使用され得る。次世代シークエンシングを用いることにより、ある特定の調製方法から得られた単離された各標的核酸の存在量が定量的に測定され得る。この存在量は、コントロール存在量の値(例えば、標的核酸の既知の出発存在量)および/または代替の調製方法を使用することによって測定された存在量と比較され得る。例えば、標的核酸のセットは、3つの調製方法のうちの1つ以上によって単離され得る;その標的核酸は、増幅法を用いてx回、ハイブリダイゼーション濃縮(hybridization enrichment)法を用いてy回、および環状化選択法を用いてz回、観察され得る。ペアワイズ相関係数(pairwise correlation coefficient)は、各存在量の値の間(例えば、xとy、xとzおよびyとzとの間)についてコンピュータで計算されることにより、調製方法の対の間の核酸単離におけるバイアスが評価され得る。単離のメカニズムが各アプローチにおいて異なるので、存在量は、通常、互いに異なるものであり、大部分は互いに相関関係がない。
いくつかの実施形態において、本発明は、生物学的サンプル中の標的核酸を代表する核酸調製物を得る方法を提供し、その方法は、生物学的サンプルに対して第1の調製方法を用いて標的核酸の第1調製物を得て、生物学的サンプルに対して第2の調製方法を用いて標的核酸の第2の調製物を得て、そしてその第1の核酸調製物および第2の核酸調製物を混合することにより、その生物学的サンプル中の標的核酸を代表する混合された調製物を得ることによる、方法である。
本明細書中に記載されるいずれかの方法のいくつかの実施形態において、標的核酸の第3の調製物が、第1の調製方法および第2の調製方法とは異なる第3の調製方法を用いて得られ、ここで、第1、第2および第3の調製方法のすべてが、異なる体系的な配列バイアスを有する。本明細書中に記載されるいずれかの方法のいくつかの実施形態において、異なる調製方法が、多重核酸分析の感度を高めるために生物学的サンプル中の複数の異なる遺伝子座に対して用いられる。いくつかの実施形態において、標的核酸は、表1から選択される遺伝子の配列を有する。
しかしながら、本発明の遺伝子タイピング方法は、いくつかの工程を含み得、それらの各々は、独立して、本明細書中に記載される1つ以上の異なる調製手法を含み得ることが認識されるだろう。いくつかの実施形態において、核酸調製物は、本明細書中に記載される1つ以上の(例えば、2、3、4、5つまたはそれ以上の)異なる手法(例えば、増幅、ハイブリダイゼーションによる捕捉、環状プローブによる捕捉など、またはそれらの任意の組み合わせ)を用いて得られ得、その核酸調製物は、最初の調製物に対して用いられた手法とは独立して選択される1つ以上の異なる手法(例えば、増幅、ハイブリダイゼーションによる捕捉、環状プローブによる捕捉など、またはそれらの任意の組み合わせ)を用いて分析され得る。
いくつかの実施形態において、本発明の局面は、核酸アッセイの感度を高めるための組成物、キット、デバイスおよび分析方法も提供する。本発明の局面は、遺伝子タイピング分析の信頼水準を高めるために特に有用である。しかしながら、本発明の局面は、任意の適当な核酸分析(例えば、2つ以上の配列バリアントがサンプル中に存在するか否かを決定するように設計された核酸分析であるがこれに限定されない)において使用され得る。
いくつかの実施形態において、本発明の局面は、複数の核酸プローブ(例えば、10〜50個、50〜100個、100〜250個、250〜500個、500〜1,000個、1,000〜2,000個、2,000〜5,000個、5,000〜7,500個、7,500〜10,000個またはそれより少ないか、それより多いか、もしくは中間の数の異なるプローブ)に関する。いくつかの実施形態において、各プローブ、またはプローブの各サブセット(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、異なる第1の標的化アームを有する。いくつかの実施形態において、各プローブ、またはプローブのサブセットの各プローブ(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、異なる第2の標的化アームを有する。いくつかの実施形態において、第1および第2の標的化アームは、同じ介在配列によって分断される。いくつかの実施形態において、第1および第2の標的化アームは、それぞれの標的核酸(例えば、ゲノム遺伝子座)において同じ長さまたは類似の長さ(例えば、核酸の数、例えば、0〜25、25〜50、50〜100、100〜250、250〜500、500〜1,000、1,000〜2,500またはそれより長いかもしくは中間の数のヌクレオチド)によって分断される標的核酸配列と相補的である。いくつかの実施形態において、各プローブ、またはプローブのサブセット(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、第1のプライマー結合配列を含む。いくつかの実施形態において、そのプライマー結合配列は、同じである(例えば、それは、シークエンシング反応または他の伸長反応をプライミングするために使用され得る)。いくつかの実施形態において、各プローブ、またはプローブのサブセット(例えば、10〜25%、25〜50%、50〜75%、75〜90%または90〜99%)は、独特の識別配列タグ(例えば、予め決められており、各プローブを識別するために使用することができる、識別配列タグ)を含む。
いくつかの実施形態において、本明細書中に開示される方法は、感度が重要な任意の用途にとって有用である。例えば、不均一な組織サンプルにおける癌変異の検出、母体に循環する胎児DNAにおける変異の検出、および着床前遺伝子診断法において単離された細胞における変異の検出。
本発明のいくつかの局面によると、生物学的サンプル中の核酸における多型を検出する方法が提供される。いくつかの実施形態において、その方法は、生物学的サンプルに対してある調製方法(例えば、本明細書中に開示される調製方法のいずれか)を用いて核酸調製物を得る工程、ならびにその核酸調製物に対して分子反転プローブ捕捉反応を行う工程を包含し、ここで、その核酸調製物の標的核酸の分子反転プローブによる捕捉(例えば、変異検出MIPを用いる捕捉)は、標的核酸における変異(多型)の存在を示唆し、ここで、必要に応じてその多型は、表2から選択される。
本発明のいくつかの局面によると、生物学的サンプル中の核酸の遺伝子タイピングを行う方法が提供される。いくつかの実施形態において、その方法は、生物学的サンプルに対してある調製方法を用いて核酸調製物を得る工程、その核酸調製物の標的核酸をシークエンシングする工程、ならびに生物学的サンプルに対して分子反転プローブによる捕捉反応を行う工程(ここで、生物学的サンプル中の標的核酸の分子反転プローブによる捕捉は、標的核酸における多型の存在を示す)、そのシークエンシング反応および捕捉反応の結果に基づいて標的核酸の遺伝子タイピングを行う工程を包含する。
本明細書中に開示される方法のいくつかの実施形態において、標的核酸は、表1から選択される遺伝子の配列を有する。
本明細書中に記載される任意の1つ以上の実施形態は、複数の遺伝マーカーを並行して評価するために使用され得ることが認識されるだろう。したがって、いくつかの実施形態において、本発明の局面は、複数の異なる遺伝子座における1つ以上のマーカー(例えば、1つ以上の対立遺伝子)の存在を並行して決定することに関する。したがって、複数の遺伝性障害のリスクまたは存在が、並行して評価され得る。いくつかの実施形態において、1つ以上の遺伝性障害を有する出生児を有するリスクが評価され得る。いくつかの実施形態において、親または子の生物学的サンプル(例えば、着床前、出生前、出生時または出生後の段階におけるサンプル)に対して評価が行われ得る。いくつかの実施形態において、本開示は、患者サンプル(例えば、血液、着床前胚、絨毛または羊水サンプル)から複数の遺伝子座(例えば、表1または2から選択される複数の標的核酸)を分析するための方法を提供する。患者または被験体は、ヒトであり得る。しかしながら、本発明の局面がこの点に限定されないので、本発明の局面は、ヒトに限定されず、他の種(例えば、哺乳動物、鳥類、爬虫類、他の脊椎動物または無脊椎動物)にも適用され得る。被験体または患者は、男性(雄)または女性(雌)であり得る。いくつかの実施形態において、生殖遺伝カウンセリングに関連して、夫婦の男性メンバーおよび女性メンバー由来のサンプルが分析され得る。いくつかの実施形態において、例えば、動物育種プログラムに関連して、適合する繁殖パートナーもしくは最適な繁殖パートナーを決定するためか、または特定の形質に対するストラテジーを決定するため、あるいは1つ以上の疾患または状態を回避するために、複数の雄および雌の被験体由来のサンプルが分析され得る。したがって、1つ以上の本発明の実施形態から得られた情報に基づいて、生殖リスクが決定され得、そして/または生殖に関するアドバイスが提供され得る。
しかしながら、本発明の局面は、目的の遺伝子座における1つ以上の対立遺伝子の存在が医学的判断(例えば、疾患のリスクまたは検出、疾患の予後、治療の選択、治療のモニタリングなど)と関連がある任意の医学的評価に関連して使用され得ることが認識されるだろう。本発明のさらなる局面は、腫瘍組織もしくは循環腫瘍細胞における、癌を引き起こす細胞経路内もしくは処置レジメンの有効性を予測する細胞経路内の変異の検出、または環境内もしくは被験体、例えば、ヒト被験体から得られたサンプル中の病原生物の検出および同定に関連して使用され得る。
これらおよび他の本発明の局面は、以下の説明ならびに非限定的な実施例および図面においてより詳細に説明される。
図1は、タイリングプローブのレイアウトの非限定的な実施形態を図示している。 図2は、ずらされた(staggered)プローブのレイアウトの非限定的な実施形態を図示している。 図3は、交互にずらされた(alternating staggered)プローブのレイアウトの非限定的な実施形態を図示している。 図4A、BおよびCは、識別タグ配列と標的配列とを組み合わせるための様々な非限定的な方法を表している(NNNNは、識別タグ配列を表している)。 図5は、標的配列および識別タグ配列に基づいて遺伝子タイピングするための非限定的な方法を表している。 図6は、MIP捕捉反応のシミュレーションの非限定的な結果を表している。 図7は、シークエンシングカバレッジ(sequencing coverage)の非限定的なグラフを表している。 図8は、MIPを用いるとき、短い配列が長い配列よりも高効率で捕捉されることを図示している。 図9は、反復領域(太い波線)と、隣接する独特の配列(太い直線(strait line))との両方を含む領域のパドロック(MIP)捕捉の非限定的なスキームを図示している。 図10は、標的ギャップサイズと反復領域のリードの相対数との間の非限定的な仮説上の関係性を図示している。 図11Aは、二倍体ゲノム由来のFMR1リピート領域のMIP捕捉を表している。 図11Bは、MIP捕捉プローブおよび独特の識別タグを用いた、二倍体ゲノムにおけるFMR1リピート領域の長さの二対立遺伝子の分離のための調製方法を表している。 図11Cは、二倍体ゲノムにおけるFMR1リピート領域の長さの分析を表している。 図12は、本発明のアルゴリズムの実施形態の概略図である。 図13は、MIP捕捉を用いた、標的1つあたりの存在量のグラフの非限定的な例を図示している;そして 図14は、2つのMIP捕捉反応の相関関係の非限定的なグラフを示している。
詳細な説明
本発明の局面は、遺伝子型を評価するため、特に、被験体の1つ以上の遺伝子座の対立遺伝子の同一性(または二倍体生物の同一性)を決定するための、調製および分析の方法および組成物に関する。本発明の局面は、遺伝分析におけるあいまいさおよびエラーの種々の起源の特定に部分的に基づき、また、遺伝分析の種々の段階におけるこれらのエラーおよびあいまいさを回避するため、減少させるため、認識するため、および/または解決するための1つ以上のアプローチの特定に部分的に基づく。本発明の局面は、核酸評価技術の1つ以上の調製工程および/または分析工程に関連するバイアスおよび/または確率的変動に対処するための方法および組成物に関する。いくつかの実施形態において、調製方法は、遺伝分析の結果を歪めるバイアスのリスクを回避するかまたは減少させるように適合され得る。いくつかの実施形態において、分析方法は、誤解釈を引き起こし得るデータの変動(例えば、不正確なコール(例えば、被験体が実際にはヘテロ接合であるときのホモ接合のコールまたは被験体が実際にはホモ接合であるときのヘテロ接合のコール))を認識するようにおよび補正するように適合され得る。本発明の方法は、任意のタイプの変異、例えば、一塩基の変更(例えば、挿入、欠失、トランスバージョンまたはトランジションなど)、複数の塩基の挿入、欠失、重複、逆位および/もしくは他の任意の変更、またはそれらの組み合わせに対して使用され得る。
いくつかの実施形態において、代表的なシークエンシングリードよりもコア配列のリピートの長さが長く、それにより、1つ以上のコア配列単位の欠失または重複が生じているか否かをもっぱら配列リードに基づいて決定することが困難である場合、さらなる手法または代替の手法を用いて、そのコア配列の複数のリピートを特徴とする遺伝子座が扱われ得る。
いくつかの実施形態において、アッセイ結果の高い信頼度は、i)異なるバイアスを有する(例えば、異なるバイアスを有すると知られている)2つ以上の異なる調製手法および/もしくは分析手法を選択すること、ii)2つ以上の異なる手法を用いて患者サンプルを評価すること、iii)2つ以上の異なる手法からの結果を比較すること、ならびに/またはiv)それらの結果がその2つ以上の異なる手法に対して矛盾がないか否かを決定することによって得られ得る。いくつかの実施形態において、工程(iv)における決定が、それらの結果に矛盾がない(例えば、同じである)ことを示唆する場合、そのアッセイ結果の高い信頼度が得られる。他の実施形態において、工程(iv)における決定が、それらの結果に矛盾がある(例えば、それらの結果があいまいである)ことを示唆する場合、工程(i)において選択された2つ以上の異なる調製手法および/または分析手法と比べて異なるバイアスを有する(例えば、異なるバイアスを有すると知られている)1つ以上のさらなる調製手法および/または分析手法を用いることにより患者サンプルが評価され、そしてその1つ以上のさらなる調製手法および/または分析手法の結果を、工程(ii)からの結果と比較することにより、矛盾が解消される。
いくつかの実施形態において、2つ以上の独立したサンプルが、被験体から得られ得、独立して分析され得る。いくつかの実施形態において、2つ以上の独立したサンプルは、ほぼ同時に得られる。いくつかの実施形態において、2つ以上の独立したサンプルは、複数の異なる時点において得られる。いくつかの実施形態において、2つ以上の独立したサンプルを使用することにより、確率的な測定ノイズの排除、正規化および/または定量化が促進される。2つ以上の独立したサンプルが、本明細書中に開示される方法のいずれか(例えば、ヒトまたは他の動物被験体における病原体のプロファイリング、腫瘍の進行/後退のモニタリング、循環腫瘍細胞の分析、母体循環系中の胎児細胞の分析、および環境内の病原体の分析/モニタリング/プロファイリングのための方法を含む)に関して得られ得ることが認識されるべきである。
いくつかの実施形態において、本明細書中に記載される手法の1つ以上が、複数の患者サンプルを並行して評価するために単一のアッセイプロトコルにおいて組み合わされ得る。
本発明の局面は、複数の患者サンプルの、費用効果は高いが信頼できるハイスループットの遺伝子タイピング(例えば、並行して行われるもの、例えば、多重反応におけるもの)にとって有用であることが認識されるだろう。いくつかの実施形態において、本発明の局面は、多重分析におけるエラーの頻度を低下させるために有用である。ある特定の実施形態は、複数の反応(例えば、複数の遺伝子座および/または複数の患者サンプル)が処理されている場合に、特に有用であり得る。例えば、10〜25、25〜50、50〜75、75〜100個またはそれ以上の遺伝子座が、並行して処理され得る任意の数の被験体サンプル(例えば、1〜25、25〜50、50〜100、100〜500、500〜1,000、1,000〜2,500、2,500〜5,000個またはそれ以上もしくは中間の数の患者サンプル)から、各被験体に対して評価され得る。本発明の種々の実施形態は、2つ以上の標的捕捉反応および/または2つ以上の患者サンプル分析を単一の多重反応において並行して行うことを含み得ることが認識されるだろう。例えば、いくつかの実施形態において、複数の捕捉反応(例えば、異なる標的遺伝子座に対して異なる捕捉プローブを用いる反応)が、単一の患者サンプルに対する単一の多重反応において行われ得る。いくつかの実施形態において、複数の患者サンプルのうちの各1つから捕捉された複数の核酸が、単一の多重分析反応において組み合わされ得る。いくつかの実施形態において、異なる被験体からのサンプルは、被験体特異的(例えば、患者特異的)タグ(例えば、独特の配列タグ)でタグ化され、各産物からの情報は、同定された被験体に対して割り当てられ得る。いくつかの実施形態において、各患者サンプルに対して用いられる異なる捕捉プローブの各々は、共通の患者特異的タグを有する。いくつかの実施形態において、捕捉プローブは、患者特異的タグを有しないが、各被験体からの捕捉された産物は、患者特異的タグで標識された1つの増幅プライマーまたは増幅プライマーの対を用いて増幅され得る。本発明の局面は、この点に限定されないので、単一の患者サンプルからの捕捉された産物と患者特異的タグを関連づけるための他の手法を使用してもよい。本明細書中で使用される患者特異的タグは、特定のアッセイにおいて、同定された患者に割り当てられる独特のタグのことを指し得ることが認識されるだろう。同じタグが、異なる患者サンプルセット(例えば、異なる患者からのサンプル)(その各々は、それらのタグのうちの1つに割り当てられる)を用いた別個の多重分析において使用され得る。いくつかの実施形態において、1つのアッセイから次のアッセイへの汚染のリスクを低下させるため、および特定のアッセイに存在すると予想されないタグの存在に基づいて汚染の検出を可能にするために、独特のタグの種々のセットが、連続的な(例えば、交互の)多重反応において使用され得る。
本発明の実施形態は、いくつかの異なる状況:生殖の状況、疾患スクリーニング、癌を有する被験体の同定、ある疾患に対して高リスクを有する被験体の同定、いくつかの因子の1つ以上に従う被験体の集団の層別化、例えば、特定の薬物に対する応答性、特定の薬物に対する有害反応(または、ゆえにリスク)を欠くかもしくは欠かないこと、および/または医学的記録のための情報の提供(例えば、1つ以上の遺伝子座におけるホモ接合性、ヘテロ接合性)のいずれかに対して使用され得る。本発明は、患者サンプルのゲノム分析に限定されないことが認識されるだろう。例えば、本発明の局面は、病原体を検出するための環境サンプルのハイスループット遺伝分析にとって有用であり得る。
いくつかの実施形態において、本明細書中に開示される方法は、1つ以上の遺伝性障害の診断にとって有用である。いくつかの実施形態において、本明細書中に開示される方法を用いて診断され得る遺伝性障害は、Ashkenazi Jewish集団に蔓延している遺伝性障害である。いくつかの実施形態において、それらの遺伝性障害は:21−ヒドロキシラーゼ欠損の(Defiocient)先天性副腎過形成;ABCC8関連の高インスリン症;アルファ−サラセミア(Constant SpringおよびMR関連を含む);アリールスルファターゼA欠損の異染性白質ジストロフィ(Metyachromatic Leukodystrophy);ビオチニダーゼ欠損症−ホロカルボキシラーゼ合成酵素欠損症;ブルーム症候群;カナバン病;CFTR関連障害−嚢胞性線維症;シトルリン血症I型;複合MMA&ホモシスチン尿症−dblC;ジストロフィン異常症(DMD&BMD);家族性自律神経障害;ファンコニー貧血−FANCC;古典的ガラクトース血症:ガラクトキナーゼ欠損症(Defiency)およびガラクトースエピメラーゼ欠損症;ゴーシェ病;GJB2関連DFNB1非症候性難聴および聴覚消失;グルタル酸血症1型;異常ヘモグロビン症ベータ鎖障害;糖原病IA型;メープルシロップ尿症;IA、IB、2、3型;中鎖アシル−コエンザイムA;デヒドロゲナーゼ欠損−MCADD;メチルマロン酸血症;ムコリピドーシスIV;ネマリンミオパシー;ニーマン・ピック(Nieman−Pick)A型−酸性スフィンゴミエリナーゼ欠損症;非ケトーシス型高グリシン血症−グリシン脳症;オルニチントランスカルバミラーゼ欠損症;PKUフェニルアラニンヒドロキシラーゼ欠損症;プロピオン酸血症;短鎖アシル−CoAデヒドロゲナーゼ欠損症−SCADD;スミス・レムリ・オピッツ症候群;脊髄性筋萎縮症(SMN1)−SMA;テイ・サックス−HexA欠損症;アッシャー症候群(Usher Synbdrome)I型(IB型、IC型、ID型、IF型、IG型);X連鎖精神遅滞ARX関連障害;小脳形成不全(Cerebellar Cypoplasia)および特有の(sistinctive)顔貌を伴うX連鎖精神遅滞;X連鎖精神遅滞;9、21、30、46、58、63、88、89を含む;X連鎖精神遅滞:FM1関連障害−FRXA、脆弱X MR;X連鎖SMR:レンペニング症候群1;Zellweger Spectrum障害−Zellweger、NALDおよび/または乳児レフサム病を含むペルオキシソームの二機能性酵素欠損症から選択される。しかしながら、これらのすべて、これらのサブセット、他の遺伝子またはそれらの組み合わせが、使用され得る。
いくつかの局面によると、本開示は、多重診断方法に関する。いくつかの実施形態において、多重診断方法は、複数の遺伝子座(例えば、表1の遺伝子座)を並行して捕捉する工程を包含する。いくつかの実施形態において、遺伝子座は、1つ以上の多型(例えば、表2の多型)を有し、それらの遺伝子型は、疾患を引き起こす対立遺伝子に対応する。したがって、いくつかの実施形態において、本開示は、複数の遺伝性障害を並行して評価するための方法を提供する。
いくつかの実施形態において、着床前、出生前、出生時または出生後の段階において複数の遺伝性障害を並行して診断するための方法が提供される。いくつかの実施形態において、本開示は、患者サンプル(例えば、血液、着床前胚、絨毛または羊水サンプル)から複数の遺伝子座(例えば、表1から選択される複数の標的核酸)を分析するための方法を提供する。患者または被験体は、ヒトであり得る。しかしながら、本発明の局面は、この点に限定されないので、本発明の局面は、ヒトに限定されず、他の種(例えば、哺乳動物、鳥類、爬虫類、他の脊椎動物または無脊椎動物)にも適用され得る。被験体または患者は、男性(雄)または女性(雌)であり得る。いくつかの実施形態において、生殖遺伝カウンセリングに関連して、夫婦の男性メンバーおよび女性メンバー由来のサンプルが分析され得る。いくつかの実施形態において、例えば、動物育種プログラムに関連して、適合する繁殖パートナーもしくは最適な繁殖パートナーを決定するためか、または特定の形質に対するストラテジーを決定するため、あるいは1つ以上の疾患または状態を回避するために、複数の雄および雌の被験体由来のサンプルが分析され得る。
しかしながら、他の任意の疾患、および/または疾患もしくは障害(アレルギー、処置に対する応答性、処置および予後に対する癌腫瘍のプロファイリング、患者の感染のモニタリングおよび同定、ならびに環境内の病原体のモニタリングが挙げられるがこれらに限定されない)に対する危険因子も研究され得ることが認識されるだろう。
1.多重増幅反応における提示のバイアスの減少:
いくつかの実施形態において、本発明の局面は、例えば診断目的での、遺伝子座の多重検出において、バイアスを減少させる方法および再現性を高める方法に関する。
潜在的に複雑な混合物中の特定の核酸配列を検出するためまたは増幅するために、分子反転プローブ技術が使用される。分子反転プローブの使用は、単一ヌクレオチド多型の検出(Hardenbolら、2005 Genome Res 15:269−75)およびエキソンの大きなセットの調製増幅(Porrecaら、2007 Nat Methods 4:931−6,Krishnakumarら、2008 Proc Natl Acad Sci USA 105:9296−301)について証明されている。一般に数千の標的が、数千のプローブを含む単一反応において捕捉され得るので、上記方法の主要な利点の1つは、高い多重化の程度に対して能力がある点である。しかしながら、例えば、増幅効率に関連する課題(例えば、Turner EHら、Nat Methods.2009 Apr 6:1−2を参照のこと)のせいで、研究および診断における上記方法の実際の有用性は限定されている。
本開示の局面は、多重的なゲノム捕捉方法およびシークエンシング方法における系統誤差(バイアス)、すなわち、標的核酸の提示の大きなばらつき、および捕捉された標的核酸(例えば、生物学的サンプルから単離された標的核酸)のプール内のヘテロ接合性対立遺伝子の不均等なサンプリングに関連する課題を克服するための有効な方法の発見に部分的に基づく。したがって、いくつかの実施形態において、本開示は、多重捕捉方法における標的核酸の検出におけるばらつきを減少させる方法を提供する。他の実施形態において、方法は、捕捉プールにおける対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、標的核酸(例えば、遺伝子座)を捕捉するための調製方法を提供し、その方法は、標的核酸の重複した領域を捕捉する複数のプローブ(例えば、分子反転プローブMIP)の種々のセットの使用を含み、従来技術の方法と比べて、捕捉プール内の標的核酸のより均一な提示を達成する。他の実施形態において、方法は、例えば、診断目的での、遺伝子座の大規模な並行捕捉に関連するバイアスまたはバイアスのリスクを低下させる。他の実施形態において、複数の遺伝子座の並行した検出の再現性を高めるための(例えば、標的核酸の捕捉に対する多型の影響を減少させることによって)方法が提供される。さらなる実施形態において、複数の遺伝子座の並行した分析に対する、プローブの合成および/またはプローブの増幅のばらつきの影響を減少させるための方法が提供される。
いくつかの局面において、本開示は、複数の異なるプローブを含むプローブセットを提供する。本明細書中で使用されるとき、「プローブ」は、標的核酸またはその部分領域の同じ鎖に隣接する核酸と相補的である5’領域および3’領域に隣接した中央領域を有する核酸である。例示的なプローブは、分子反転プローブ(MIP)である。「標的核酸」は、遺伝子座であり得る。例示的な遺伝子座は、本明細書中の表1(RefSeq遺伝子の欄)に開示されている。
プローブは、代表的には、捕捉効率/増幅効率に部分的に影響すると知られているある特定の制約(例えば、融解温度、G/C含有量など)を満たすように設計されているが(Ballら(2009)Nat Biotech 27:361−8およびDengら(2009)Nat Biotech 27:353−60)、広く均一であるかまたは高度に再現性のある捕捉効率/増幅効率を確実にするのに十分な制約のセットは、以前に得られていない。本明細書中に開示されるように、均一性および再現性は、標的内の各塩基が2つ以上のプローブによって捕捉されるように標的1つあたり複数のプローブを設計することによって高められ得る。いくつかの実施形態において、本開示は、捕捉される標的1つあたり複数のMIPを提供し、ここで、所与の標的核酸に対して設計されるセット内の各MIPは、中央領域、ならびに標的核酸内の(少なくとも部分的に)異なる核酸にハイブリダイズする5’領域および3’領域(「標的化アーム」)(標的核酸の部分領域とすぐ隣接する)を有する。よって、種々の標的化アームと充填(fill−in)配列との間の効率の差は、単一の標的に対して複数のMIPにわたって平均され得、より均一かつ再現性のある捕捉効率がもたらされる。
いくつかの実施形態において、上記方法は、各標的に対して単一のプローブを設計する工程を包含する(標的は、一塩基ほど小さいか、またはキロベースもしくはそれより大きい連続した配列ほど大きいことがある)。
場合によっては、1〜200bpの範囲内の長さを有する分子(例えば、標的核酸またはその部分領域)を捕捉するプローブを設計することが好ましいことがある(本明細書中で使用されるとき、bpとは、二本鎖核酸における塩基対のことを指すが、しかしながら、長さがbpで示される場合、塩基対とは対照的に、同じ数の塩基長を有する一本鎖核酸も本発明によって企図されることが認識されるだろう)。しかしながら、プローブの設計は、そのように限定されない。例えば、プローブは、場合によっては、最大10、20、30、40、50、60、70、80、90、100、200、300、400、500、1000bpまたはそれ以上のbpの範囲の長さを有する標的を捕捉するように設計され得る。
捕捉分子(例えば、標的核酸またはその部分領域)の長さは、複数の考慮すべき事柄に基づいて選択されることが認識されるべきである。例えば、標的の分析が、シークエンシング、例えば、次世代の配列決定装置を用いたシークエンシングを含む場合、その標的の長さは、ショットガンライブラリーの構築が必要ないように、代表的にはシークエンシングのリード長とマッチするべきである。しかしながら、本発明の局面は、この点に限定されないので、捕捉された核酸は、任意の適当なシークエンシング手法を用いて配列決定され得ることが認識されるだろう。
いくつかの標的核酸は、1つのプローブで捕捉されるには大きすぎることも認識されるべきである。その結果として、標的全体を分析するために、標的核酸の複数の部分領域を捕捉することが必要な場合がある。
いくつかの実施形態において、標的核酸の部分領域は、少なくとも1bpである。他の実施形態において、標的核酸の部分領域は、少なくとも10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000bpまたはそれ以上である。他の実施形態において、標的核酸の部分領域は、標的核酸長の最大10%、20%、30%、40%、50%、60%、70%、80%、90%、95%またはそれ以上のパーセントである長さを有する。
当業者はまた、MIPの設計において、プローブの長さと標的の長さとの関係性が考慮されることも認識するだろう。いくつかの実施形態において、MIPは、対応する標的(例えば、標的核酸の部分領域、標的核酸)よりも数百塩基対(例えば、最大100、200、300、400、500、600、700、800、900、1000bpまたはそれ以上)長いように設計される。
いくつかの実施形態において、標的核酸の部分領域の長さは、異なってよい。例えば、標的核酸が、プローブハイブリダイゼーションが不可能であるかまたは非効率的である領域を含む場合、問題のある核酸とのハイブリダイゼーションを回避するため、および完全な標的核酸を含む核酸を捕捉するために、1つ以上の異なる長さの部分領域を捕捉するプローブを使用することが必要であり得る。
本発明の局面は、各標的核酸を増幅するために、複数のプローブ、例えば、MIPを使用することを含む。いくつかの実施形態において、所与の標的に対するプローブのセットが、標的全体にわたって「タイル張り」するように設計され得、一連のより短いサブターゲットとして標的が捕捉される。いくつかの実施形態において、所与の標的に対するプローブのセットが、その標的全体にわたって「タイル張り」するように設計される場合、そのセット内のいくつかのプローブは、隣接する非標的配列を捕捉する。あるいは、そのセットは、標的に隣接するハイブリダイゼーション領域の正確な位置を「ずらす」ように設計され得、種々の標的化アームを有する複数のプローブによって標的全体が捕捉され(および場合によっては、隣接する非標的配列が捕捉され)、タイリングの必要性がなくなる。選択される特定のアプローチは、標的セットの性質に左右され得る。例えば、小さい領域が捕捉される場合、末端がずらされたアプローチが、適切であり得る一方、より長い領域が望まれる場合は、タイリングが選択され得る。すべての場合において、病理学的遺伝子座を標的にするプローブに対するバイアス許容度の量は、所与の分子を捕捉するために使用される種々のMIPの数を変更することによって調節(「調整」)され得る。
いくつかの実施形態において、「カバー率(coverage factor)」すなわち、1つの分子において1つの塩基対を捕捉するために使用されるプローブの数は、条件を指定するための重要なパラメータである。タイリングアプローチ(例えば、図1を参照のこと)を用いるかまたはずらしアプローチ(staggered approach)の1つ(例えば、図2または3を参照のこと)を用いるかに応じて、標的1つあたりのプローブの種々の数が示される。
図1は、単一の標的にわたってタイリングされている10個の捕捉されたサブターゲットを示しているタイリングプローブのレイアウトの非限定的な実施形態を図示している。標的内の各位置は、3つのサブターゲットによってカバーされており、1塩基対あたりのMIPの性能は、3つのプローブに対して平均される。
図2は、3つのMIPのセットによって捕捉されている標的を示している、ずらされたプローブのレイアウトの非限定的な実施形態を図示している。各MIPは、黒色で示されている標的全体に加えて、(場合によっては)灰色で示されている追加的な標的外の配列を捕捉し、各MIPの標的化アームは、異なる配列に当たっている。標的内の各位置は、3つのサブターゲットによってカバーされており、1塩基対あたりのMIPの性能は、3つのプローブに対して平均される。標的化アームは、示される黒色または灰色の領域のすぐ隣を捕らえる。いくつかの実施形態において、標的化アーム(図示せず)は、互いと重複しないように設計され得ることが認識されるだろう。
図3は、3つのMIPのセットによって捕捉されている標的を示している、交互にずらされたプローブのレイアウトの非限定的な実施形態を図示している。各MIPは、黒色で示されている標的全体に加えて、(場合によっては)灰色で示されている追加的な標的外の配列を捕捉し、各MIPの標的化アームは、異なる配列に当たっている。標的内の各位置は、3つのサブターゲットによってカバーされており、1塩基対あたりのMIPの性能は、3つのプローブに対して平均される。標的化アームは、示される黒色または灰色の領域のすぐ隣を捕らえる。
任意のレイアウトに対して、隣接するタイリングプローブまたはずらしプローブにおける標的化アームは、重複するように、重複しないように、またはプローブのサブセットだけに対して重複するように、設計され得ることが認識されるだろう。
任意のレイアウトに対するある特定の実施形態において、約3〜約10というカバー率が使用される。しかしながら、これらの方法はそのように限定されず、最大2、3、4、5、6、7、8、9、10、20またはそれ以上のカバー率が使用され得る。選択されるカバー率は、使用されるプローブのレイアウトに依存し得ることが認識されるべきである。例えば、タイリングアプローチでは、所望のカバー率のために、標的1つあたりのプローブの数は、代表的には、標的の長さ、サブターゲットの長さおよび隣接するサブターゲットの開始位置との間隔(刻み幅)の関数である。例えば、3という所望のカバー率の場合、20bpという開始部位の隔たりおよび60bpというサブターゲットの長さによって、200bpの標的が12個のMIPでカバーされ得る(図1)。よって、標的核酸1つあたりのプローブの数および捕捉される分子の長さを変更することによって、特定のカバー率が達成され得る。ずらしアプローチでは、一定の長さの標的核酸が、いくつかの部分領域または「超標的(super−target)」として捕捉される(それらは、標的核酸および追加の隣接する核酸を含む分子であり、それらは、様々な長さであり得る)。例えば、50bpの標的は、「ずらされた」配置(図2)または「交互にずらされた」配置(図3)において3つのプローブを用いて3というカバー率で捕捉され得る。
カバー率は、検出バイアスが容認できる程度に動かされ得る。一部の例では、バイアス許容度が小さい場合、おそらくはより高いカバー率を用いて、標的核酸のより多くの部分領域を標的にすることが望ましいことがある。いくつかの実施形態において、カバー率は、最大2、3、4、5、6、7、8、9、10またはそれ以上である。
いくつかの実施形態において、タイリングプローブのレイアウトが用いられ、標的の長さが1bpより長く、かつ刻み幅(標的の5’末端と、隣接する標的の5’末端との間の距離)が標的またはその部分領域の長さより短いとき、プローブ数=T/(S/C)+(C−1)であるような標的の長さ(T)、サブターゲットの長さ(S)およびカバー率(C)に基づいて特定の標的に対するプローブの数をコンピュータで計算することが可能である。
いくつかの局面において、本開示は、複数の分子が並行して増幅されるときの増幅効率の均一性を高める方法;増幅効率の再現性を高める方法;増幅効率に対する、標的とするプローブのばらつきの関与を低減させる方法;所与の標的核酸に対する、プローブハイブリダイゼーション領域内の多型の影響を減少させる方法;および/またはMIPによる多重増幅が核酸シークエンシングによる分析用の調製工程として使用されるときに下流のワークフローを単純化する方法を提供する。
標的に隣接する領域下の標的核酸内の多型は、ハイブリダイゼーション、ポリメラーゼによる充填および/またはライゲーションを干渉し得る。さらに、これは、ただ1つの対立遺伝子に対して生じ得、対立遺伝子の脱落をもたらし、最終的には下流のシークエンシングの正確度を低下させる。いくつかの実施形態において、任意の所与の標的を捕捉するための複数のハイブリダイゼーション部位を有するMIPのセットを用いるとき、MIPのセット内のすべての標的化アームが変異の位置をカバーするわけではないので、多型が原因の損失の確率は、実質的に低下する。
多数の配列が必要とされるので、MIP捕捉反応用のプローブは、プログラム可能なマイクロアレイにおいて合成され得る。これらの方法の合成収量は少ないので、MIP増幅反応用の十分なプローブを生成するために、その後、増幅工程が必要である。多重オリゴヌクレオチド合成とプールされたものの増幅との組み合わせにより、一様でない合成エラー率および提示のバイアスがもたらされる。所与の標的に対するすべてのプローブが同じエラー率およびバイアスを有するわけではないので、各標的に対して複数のプローブを合成することによって、これらの起源による変動が平均され得る。
本明細書中に開示される多重増幅ストラテジーは、SNPの検出におけるように分析的に用いられ得るか、またはしばしば、次世代シークエンシングもしくは他のシークエンシング手法に対して調製的に用いられ得る。調製的な状況において、増幅反応のアウトプットは、通常、ショットガンライブラリープロトコルへのインプットであり、それはその後、シークエンシングプラットフォームへのインプットになる。次世代シークエンシングは、エキソンなどのアンプリコンよりも著しく短いリードをもたらすので、ショットガンライブラリーが部分的に必要である。本明細書中に記載されるマルチタイリング(multi−tiled)アプローチによってもたらされるバイアスの減少に加えて、タイリングは、ショットガンライブラリーの調製に対する必要性もなくす。プローブ、例えば、MIPを設計するとき、捕捉分子の長さを指定することができるので、その捕捉分子は、配列決定装置のリード長にマッチするように選択することができる。このように、リードは、エキソンに対するプローブセット内の各捕捉分子の開始位置のおかげでそのエキソンに沿って「歩く」ことができる。
2.核酸調製におけるバイアスに関連する分析のエラーの減少:
いくつかの実施形態において、本発明の局面は、バイアスを減少させ、かつ下流の定量的用途の信頼度および正確度を高める、DNAシークエンシング関連技術における調製工程に関する。
現在、次世代(ポロニー(polony)ベースの)シークエンシング(とりわけ、ゲノムリシークエンシング、遺伝子発現についてのRNA−seq、メチル化についての亜硫酸水素塩シークエンシングおよびImmune−seqを含む)を利用してデータを生成する多くのゲノミクスアッセイが存在する。定量的測定(遺伝子型コールを含む)を行うために、これらの方法は、核酸の元のサンプルにおける配列の提示に対する代理として、所与のゲノム遺伝子座のシークエンシングリードの数を利用する。これらの手法の大部分は、目的のサンプルを代表するDNA分子の高複雑度ライブラリーを構築する調製工程を必要とする。これには、DNAの化学的または生化学的な処理(例えば、亜硫酸水素塩処理)、ゲノムの特定のサブセットの捕捉(例えば、パドロックプローブによる捕捉、溶液ハイブリダイゼーション)および様々な増幅法(例えば、ポリメラーゼ連鎖反応、全ゲノム増幅、ローリングサークル増幅)が含まれ得る。
系統誤差および偶然誤差は、ゲノム増幅法およびシークエンシングライブラリー構築法に関連する共通の問題である。例えば、ゲノムシークエンシングライブラリーは、ライブラリー構築プロセスのエラー(バイアス)の結果として、起源ゲノム由来の特定の配列の提示過剰または提示不足を含み得る。そのようなバイアスが、シークエンシングライブラリー内に存在しないゲノム由来の標的配列またはシークエンシングライブラリー内の検出不可能なゲノム由来の標的配列に生じるとき、特に問題であり得る。例えば、シークエンシングライブラリー内のゲノム由来の特定の対立遺伝子の配列(例えば、ヘテロ接合の対立遺伝子)の提示不足は、シークエンシングライブラリーにおいて明らかなホモ接合の提示をもたらし得る。最も下流のシークエンシングライブラリーの定量化手法は、確率論的なカウントプロセスに左右されるので、これらの問題は、代表的には、統計学的に有意な判断を行うために必要な最小数の観察結果を得るのに十分なサンプリング(過剰サンプリング)によって対処されている。しかしながら、過剰サンプリングというストラテジーは、通常、低カウントポアソンノイズ(low−count Poisson noise)の排除に限定され、そのアプローチは、リソースをむだにし、そのような実験を行うために必要とされる費用を高める。さらに、過剰サンプリングは、そのデータに基づくある特定の結論(例えば、診断コール)における統計学的信頼度の低下をもたらし得る。したがって、シークエンシングライブラリー調製方法におけるバイアスを克服するための新しいアプローチが必要とされている。
本開示の局面は、ゲノムの捕捉、増幅およびシークエンシングの方法における系統誤差および偶然誤差(バイアス)に関連する問題、すなわち、核酸の捕捉および増幅における大きなばらつきならびにシークエンシングライブラリーにおけるヘテロ接合対立遺伝子の不均衡な提示に関連する問題を克服するための方法の発見に部分的に基づく。したがって、いくつかの実施形態において、本開示は、核酸の捕捉および増幅におけるばらつきを減少させる方法を提供する。他の実施形態において、その方法は、シークエンシングライブラリーにおける対立遺伝子の提示を改善し、ゆえに、相違する検出結果を改善する。ある特定の実施形態において、本開示は、個別の核酸分子を独特にタグ化する識別タグ配列の使用を含む、標的核酸(例えば、遺伝子座)を捕捉するための調製方法を提供する。いくつかの実施形態において、その識別タグ配列のおかげで、識別タグ配列と標的配列との対がシークエンシング反応において観察される頻度に基づいたバイアスの検出が可能になる。他の実施形態において、その方法は、例えば診断目的での、遺伝子座の捕捉、増幅およびシークエンシングに関連する、バイアスによって引き起こされるエラー、またはバイアスのリスクを減少させる。
本発明の局面は、独立して捕捉されたおよび/または分析された(例えば、増幅の前、またはバイアスを導入し得る他のプロセスの前に)個別の標的分子と、独特の配列タグ(識別タグ配列と呼ばれる)を関連づけることに関する。これらのタグは、独立した標的分子を互いと識別するために有用であり、それによって、既知数の個別の標的分子に基づいた分析が可能になる。例えば、アッセイにおいて得られた複数の標的分子配列の各々が、異なる識別タグと関連する場合、それらの標的配列は、互いから独立していると考えられ得、遺伝子型の尤度は、この情報に基づいて決定され得る。対照的に、アッセイにおいて得られる複数の標的分子配列の各々が、同じ識別タグと関連する場合、それらの標的分子配列のおそらくすべてが、そのアッセイにおけるこの標的分子の提示過剰に起因して(例えば、偏った増幅に起因して)、同じ標的分子を起源とするものだろう。これは、各核酸が異なる識別タグに関連した状況よりも少ない情報しか提供しない。いくつかの実施形態において、独立して単離された閾値数の分子(例えば、識別タグと標的配列との独特の組み合わせ)が分析されることにより、被験体の遺伝子型が決定される。
いくつかの実施形態において、本発明は、調製核酸のプール(ライブラリー)を含む組成物に関し、そのプール内の調製核酸の各々は、バイアスの影響を検出するためおよび減少させるため、ならびに標的核酸配列の遺伝子タイピングを行うための「識別タグ配列」を含む。本明細書中で使用されるとき、「識別タグ配列」は、核酸(調製核酸)の配列であり、それは、複数の異なる単離された核酸の状況において、独立して単離された独特の核酸を同定するものである。代表的には、識別タグ配列は、核酸調製方法の1つ以上の段階において標的核酸の起源を同定するために使用される。例えば、多重核酸捕捉反応において、識別タグ配列は、複数の独立した標的核酸捕捉事象を識別するための根拠を提供する。また、多重核酸増幅反応において、識別タグ配列は、例えば、標的核酸の複数の独立した主要なアンプリコンを識別するための根拠を提供する。よって、ある調製方法に関する単離された核酸の標的核酸配列と識別タグ配列との組み合わせ(標的:識別タグ配列)は、独立して単離された独特の標的核酸を同定するための根拠を提供する。図4A〜Cは、識別タグ配列と標的配列とを組み合わせるための方法の様々な非限定的な例を表している。
識別タグが、当該分野で公知のいくつかの異なる方法のうちのいずれか1つを用いて合成され得ることは、当業者に明らかだろう。例えば、識別タグは、ランダムなヌクレオチド付加によって合成され得る。識別タグ配列は、代表的には、あらかじめ定義された長さであり、それは、調製反応(例えば、増幅ベースの反応、環状化選択ベースの反応、例えば、MIP反応)において独特の標的:識別タグ配列を生成する尤度を制御するために選択される。識別タグ配列は、最大5、最大6、最大7 最大8、最大9、最大10、最大11、最大12、最大13、最大14、最大15、最大16、最大17、最大18、最大19、最大20、最大21、最大22、最大23、最大24、最大25またはそれ以上のヌクレオチド長であり得る。遺伝子タイピングの目的のために、単離された核酸が、標的核酸配列と識別タグ配列との独特の組み合わせを含み、標的核酸配列と識別タグ配列との閾値数の独特の組み合わせの観察結果(observance)が、その遺伝子型におけるある特定の統計学的信頼度を提供する場合、その単離された核酸は、独立して単離されたと同定される。
ライブラリー調製プロセスにおいて、各核酸分子は、独特の識別タグ配列が目的の標的核酸配列(ライブラリーを調製するための核酸配列、例えば、多型配列)とともに配列決定されることを可能にする配置において、その識別タグ配列でタグ化され得る。特定の工程において識別タグ配列を含む核酸を組み込むことによって、そのプロトコルの後の工程においてバイアスの検出および補正が可能になる。
独特の識別タグ配列の大きなライブラリーは、規定の長さの縮重ランダム配列ポリヌクレオチドを用いることによって作製され得る。それらのポリヌクレオチドの識別タグ配列は、シークエンシングの最後の段階において解読され得る。識別タグ配列の観察結果を用いることにより、ライブラリーの最後のシークエンシングの読出しにおいてバイアスが検出され得、補正され得る。例えば、ランダムに生成され得る識別タグ配列の可能な総数は、4であり、ここで、Nは、識別タグ配列の長さである。よって、識別タグ配列の長さは、独特の識別タグ配列を有するMIPの集団のサイズが、MIP捕捉産物のライブラリーを生成するのに十分であるように調整され得る(ここで、標的核酸配列と識別タグ配列との独立した同一の組み合わせは稀である)ことが理解されるべきである。本明細書中で使用されるとき、標的核酸配列と識別タグ配列との組み合わせは、「標的:識別タグ配列」とも呼ばれ得る。
シークエンシングプロセスの最後の読出しにおいて、各リードは、追加的な独特の識別タグ配列を有し得る。いくつかの実施形態において、識別タグ配列が、ライブラリー内にランダムに分配されているとき、その独特の識別タグ配列のすべてが、ほぼ同じ回数で観察される。したがって、識別タグ配列の出現回数は、ポアソン分布に従い得る。
いくつかの実施形態において、調製核酸(例えば、増幅されたMIP捕捉産物)のプールにおける標的:識別タグ配列の過剰提示は、調製プロセスにおけるバイアス(例えば、増幅プロセスにおけるバイアス)を示唆する。例えば、統計学的に過剰提示される標的:識別タグ配列の組み合わせは、そのプロトコルの、MIPへの識別タグ配列の組み込みとMIP捕捉産物の実際のシークエンシングとの間の1つ以上の工程におけるバイアスを示唆する。
所与の標的:識別タグ配列のリードの数は、起源サンプル中に存在する標的配列の量を示唆し得る(代理として働き得る)。いくつかの実施形態において、起源サンプルにおける配列の出現回数は、目的の数である。例えば、本明細書中に開示される方法を用いるとき、MIPのプール内の識別タグ配列の出現率は、あらかじめ決められ得る(例えば、すべての識別タグ配列に対して同じであり得る)。したがって、増幅後およびシークエンシング後の識別タグ配列の出現率の変化は、そのプロトコルにおけるバイアスを示唆し得る。バイアスが補正されることにより、例えば診断目的のために、元のMIPプールの組成の正確な提示が提供され得る。
いくつかの局面によると、調製核酸分子(例えば、独特の識別タグ配列を有するライブラリー内の各核酸であるMIP)のライブラリーは、そのライブラリー内の核酸分子の数が、そのライブラリーを用いて捕捉される標的核酸分子の予定数よりも著しく多くなるように構築され得る。このことにより、調製方法の産物が、独特の標的:識別タグ配列だけを含むことが確実になり;例えば、MIP反応において、捕捉工程は、MIPライブラリー内の独特の識別タグ配列の集団全体をより少なくサンプリングし得る。例えば、1μgのゲノムDNAを利用した実験は、約〜150,000コピーの二倍体ゲノムを含み得る。ライブラリー内の各MIPが、ランダムに生成された12−merの識別タグ配列を含むMIPライブラリー(約160万個の独特の識別タグ配列が存在し得る)の場合、1ゲノムコピーあたり100を超える独特の識別タグ配列が存在し得る。ライブラリー内の各MIPが、ランダムに生成された15−merの識別タグ配列を含むMIPライブラリー(約10億個の独特の識別タグ配列が存在し得る)の場合、1ゲノムコピーあたり7000を超える独特の識別タグ配列が存在し得る。ゆえに、同じ識別タグ配列が複数回組み込まれる確率は、途方もなく小さい。よって、識別タグ配列の長さは、MIP捕捉反応における標的配列の量、および標的:識別タグ配列の組み合わせが独立して複数出現することに対する所望の確率に基づいて選択されるべきであることが認識されるだろう。
図5は、標的配列および識別タグ配列に基づいて遺伝子タイピングを行うための非限定的な方法を表している。標的配列および識別タグ配列のシークエンシングリードは、二倍体の遺伝子型コールを行うためにつぶされる。図6は、MIP捕捉反応のシミュレーションの非限定的な結果を表しており、ここで、MIPプローブ(各々、15ヌクレオチドの識別タグ配列を有する)は、10000コピーの標的配列(例えば、ゲノム等価物)と組み合わされている。このシミュレートされた反応では、同じ識別タグ配列を有する1コピー以上の標的配列を捕捉する確率は、0.05である。Y軸は、観察結果の数を反映している。X軸は、標的:識別タグ組み合わせの独立した出現数を反映している。図7は、シークエンシングカバレッジの非限定的なグラフを表しており、これは、対立遺伝子が十分な深度でサンプリングされることを確実にするのを助け得る(例えば、1000個の標的を仮定したときの対立遺伝子1つあたり10×または20×最小サンプリング)。この非限定的な例では、X軸は、標的1つあたりの必要とされる総カバレッジであり、Y軸は、所与の総カバレッジが各対立遺伝子に対して少なくとも10×または20×カバレッジをもたらす確率である。
MIPライブラリー調製プロセスの一部として、アダプターが、目的の分子の末端にライゲートされ得ることを当業者は認識するだろう。アダプターは、しばしば、PCRプライマー部位(増幅用またはエマルジョンPCR用)および/またはシークエンシングプライマー部位を含む。さらに、例えば、一緒に混合され得る個別のサンプル(例えば、患者サンプル)を一義的に同定するために、バーコードが含められ得る(例えば、USPTO Publication Number US2007/0020640A1(McCloskeyら)を参照のこと)。
ランダムな識別タグ配列の実際の組み込みは、当該分野で公知の様々な方法によって行われ得る。例えば、識別タグ配列を含む核酸が、ライゲーションによって組み込まれ得る。これは、識別タグ配列を有する分子を任意の平滑末端核酸にライゲートすることができるので、融通の利く方法である。上記シークエンシングプライマーが識別タグ配列と標的配列の両方を配列決定するように、それらのシークエンシングプライマーを後で組み込まれなければならない。あるいは、ただ1回のライゲーションだけを行えばよいように、シークエンシングアダプターが、その3’末端の(縮重塩基として)ランダムな識別タグ配列とともに合成され得る。別の方法は、プライマー構造が、共通のアダプター配列の後にランダムな識別タグ配列、その後にPCRプライミング配列で(5’から3’への順序で)配置されるように、識別タグ配列をPCRプライマーに組み込む方法である。識別タグ配列およびアダプター配列(シークエンシングプライマー部位を含み得る)は、タグとして組み込まれる。識別タグ配列を組み込む別の方法は、遺伝子捕捉反応を行う前に、パドロックプローブ中に識別タグ配列を合成することである。識別タグ配列は、標的化アームに対して3’に組み込まれるが、そのプロトコルの下流で使用され得る増幅プライマーに対しては5’に組み込まれる。識別タグ配列を組み込む別の方法は、遺伝子特異的プライマーまたはポリ−dT逆転写プライマーにおけるタグとしてである。これにより、識別タグ配列をcDNAレベルで直接組み込むことが可能になる。
いくつかの実施形態において、組み込み工程における識別タグ配列の分布は、均一であると仮定され得る。この場合は、そのプロトコルの任意の部分におけるバイアスは、この分布の均一性を変化させ得、それは、シークエンシングの後に観察され得る。このことにより、最終的なアウトプットが多くの分子の並行したシークエンシングである任意の調製プロセスにおいて識別タグ配列を使用することが認められる。
識別タグ配列は、チップ上で並行して合成されるとき、複数のプローブ(例えば、MIP)に組み込まれ得、その組み込まれるヌクレオチドの縮重は、複数のプローブにおけるほぼ均一な分布を確実にするのに十分である。独特の識別タグ配列のプールの増幅自体が最初のプール内にバイアスを導入し得ることが認識されるべきである。しかしながら、ほとんどの実際の場合では、合成(例えば、カラム合成、チップベースの合成によるものなど)のスケールが十分大きいので識別タグ配列の最初のプールの増幅は必要でない。独特の識別タグ配列のプールに対する増幅工程または選択工程を回避することによって、潜在的なバイアスが最小にされ得る。
識別タグ配列の使用の1つの例は、ゲノムリシークエンシングにおけるものである。ほとんどの次世代シークエンシング機器の未処理の(raw)正確度が比較的低いことを考慮すると、目的のゲノム遺伝子座を過剰サンプリングすることは非常に重要である。さらに、すべての遺伝子座には2つの対立遺伝子が存在するので、サンプルがホモ接合であるかまたはヘテロ接合であるかを十分な程度の統計学的信頼度で決定するのに十分な回数、両方の対立遺伝子が観察されることを確実にするのに十分、サンプリングすることが重要である。実際は、シークエンシングを行うことにより、起源サンプル中の分子の組成物がサンプリングされる。しかしながら、複数のリードが、所与の遺伝子座に対して集められた後では、バイアス(例えば、PCR増幅工程によって引き起こされるバイアス)に起因して、それらのリードの大部分が単一の起源分子から得られたものである可能性がある。これは、観察された標的配列の集団を歪め得、遺伝子型コールの結果に影響し得る。例えば、ヘテロ接合である遺伝子座が、ホモ接合とコールされる可能性がある。なぜなら、その遺伝子座の多くの観察結果のうち第2の対立遺伝子の観察結果がほんのわずかにしか存在しないからである。しかしながら、提示過剰の対立遺伝子は、提示過剰の識別タグ配列を有するとも見られ得る(すなわち、提示過剰の識別タグ配列を有する配列のすべてが同じ単一分子に由来し得る)ので、識別タグ配列に対する情報が入手可能である場合、この状況は、防がれ得る。ゆえに、それらの配列および識別タグ配列の対応する分布が、遺伝子型をコールするアルゴリズムへの追加のインプットとして使用されることにより、遺伝子型コールの正確度および信頼度が著しく改善され得る。
いくつかの局面において、本開示は、遺伝子座または遺伝子座の一部(例えば、表1の遺伝子座)である複数の標的配列を分析するための方法を提供する。それらの遺伝子座は、1つ以上の多型(例えば、SNP)における遺伝子型を得るためにシークエンシングすることによって分析され得る。例示的な多型は、表2に開示される。当業者は、他の多型も当該分野で公知であり、例えば、Entrez Single Nucleotide Polymorphismデータベースを照会することによって、例えば、表1の遺伝子IDを用いて検索することによって、同定され得ることを認識するだろう。
表2に列挙される変異は、いくつかの疾患関連遺伝子において立証されている多型である(CFTRは、嚢胞性線維症において変異しており、GBAは、ゴーシェ病において変異しており、ASPAは、カナバン病において変異しており、HEXAは、テイ・サックス病において変異している)。これらの多型は、いくつかのタイプ:挿入/欠失の長さが3bpの倍数でない場合にフレームシフトを引き起こし得る(およびゆえに通常、タンパク質機能を妨害し得る)挿入/欠失多型、およびタンパク質のアミノ酸配列を変更し得、場合によっては、終止コドンの導入による完全な不活性化を引き起こし得る置換である。
3.核酸標的の長さの評価:
いくつかの実施形態において、本発明の局面は、核酸リピート配列を含む領域における核酸の欠失または挿入を検出するための方法に関する。
核酸リピート配列を含むゲノム領域は、リピート配列の数の増幅または縮小(例えば、1単位以上の反復配列の挿入または欠失)に起因する遺伝的不安定性の部位であることが多い。多数のリピート配列を含むゲノム領域の長さの不安定性は、いくつかの遺伝性および非遺伝性の疾患および状態に関連している。
例えば、「脆弱X症候群」、すなわちマーチン・ベル症候群は、徴候が重篤から軽度にわたる一連の特徴的な物理的、知的、情緒的および行動的な特色をもたらす遺伝的症候群である。この症候群は、X染色体上の単一のトリヌクレオチド遺伝子配列(CGG)の拡大に関連するものであり、正常な神経発生に必要なFMR−1タンパク質が発現できなくなる。脆弱X症候群には、繰り返しCGG配列の長さに関して一般に認められている形態が4つある;正常(29〜31個のCGGリピート)、前変異(55〜200個のCGGリピート)、完全変異(200個を超えるCGGリピート)および中間またはグレーゾーンの対立遺伝子(40〜60個のリピート)。
他の例としては、1つ以上のマイクロサテライト遺伝子座(例えば、BAT−25および/またはBAT−26)における核酸リピートのゲノムコピー数の増加または減少を含むマイクロサテライト不安定性(MSI)に関連している癌が挙げられる。現在、特定の遺伝子座における核酸リピート配列の数を決定するためおよび核酸の挿入または欠失の存在を同定するためのシークエンシングベースのアッセイが多く存在する。しかしながら、そのような手法は、ある領域の全長を配列決定しないことがあるハイスループット多重分析では有用でない。
対照的に、いくつかの実施形態において、本発明の局面は、遺伝子座を配列決定する必要なく(または、遺伝子座全体を配列決定する必要なく)、そのゲノム遺伝子座における挿入または欠失の存在を検出することに関する。本発明の局面は、高レベルのリピート配列を含む核酸領域における挿入または欠失を検出するために特に有用である。ある遺伝子座におけるリピート配列の存在は、ある集団において、その遺伝子座におけるリピート配列の1つ以上の挿入または欠失に起因する比較的高レベルの多型に関連することが多い。それらの多型は、疾患または疾患に対する素因に関連し得る(例えば、ある特定の多型の対立遺伝子は、疾患または状態に関連する劣性の対立遺伝子である)。しかしながら、その遺伝子座における正確な配列およびリピートの数を決定するためにシークエンシング手法を用いるとき、リピート配列の存在は、しばしば、遺伝子座の分析を複雑にし、エラーのリスクを高める。
いくつかの実施形態において、本発明の局面は、核酸捕捉法(例えば、分子反転プローブ技術に基づく核酸配列の捕捉法)を用いて、挿入または欠失を含むと疑われる(例えば、リピート配列の存在に起因して)遺伝子座の一部の捕捉頻度を評価することによって、遺伝子座のサイズを決定することに関する。本発明の局面によると、異なる生物学的サンプル(例えば、異なる被験体由来のサンプル)における目的の遺伝子座に対する捕捉効率の統計学的に有意な差は、それらのサンプルにおける相対的な長さが異なることを示唆する。その長さの差は、その遺伝子座の一方または両方の対立遺伝子におけるものであり得ることが認識されるだろう。したがって、本発明の局面は、生物学的サンプルがその多型に対してヘテロ接合において調べられているのかまたはホモ接合において調べられているのかに関係なく、多型を同定するために使用され得る。本発明の局面によると、挿入または欠失を有する1つ以上の遺伝子座を含む被験体は、適切なコントロール(例えば、既知の核酸サイズに対する捕捉効率、生物学的サンプル中の挿入または欠失を含むと疑われない他の領域に対する捕捉効率)もしくは所定の参照捕捉効率またはそれらの任意の組み合わせを用いて、1つ以上の生物学的サンプルから得られた核酸についての捕捉効率を分析することによって同定され得る。しかしながら、本発明の局面は、コントロールの性質または存在によって限定されないことが認識されるだろう。いくつかの実施形態において、捕捉効率の統計学的に有意な変動が検出される場合、被験体は、その遺伝子座における挿入または欠失に関連する疾患または状態に対してリスクがあると同定され得る。いくつかの実施形態において、挿入または欠失の正確な性質を決定するため、および被験体が1つ以上の挿入または欠失に対してヘテロ接合であるかまたはホモ接合であるかを決定するために、被験体は、より詳細に分析され得る。例えば、遺伝子座の増幅(例えば、PCR)産物のゲル電気泳動もしくはサザンブロッティング、またはそれらの任意の組み合わせが、遺伝子座の長さを実証する直交性アプローチとして用いられ得る。いくつかの実施形態において、挿入および欠失の数およびタイプを同定するために、遺伝子座のより網羅的かつ詳細な配列分析が行われ得る。しかしながら、本発明の局面にしたがって異常な長さを有すると同定された遺伝子座をさらに分析するために、他の手法も用いられ得る。
したがって、本発明の局面は、目的のゲノム領域における異常な核酸の長さを検出することに関する。いくつかの実施形態において、本発明は、反復エレメントなどのアクセスしづらいゲノム領域のサイズを推定することを目標とする。しかしながら、本発明の方法は、正確な長さを推定することを要求しないことが認識されるだろう。いくつかの実施形態では、異常な長さを有する1つ以上の対立遺伝子が目的の遺伝子座に存在することを決定することで十分である(例えば、異常な捕捉効率の検出に基づいて)。
非限定的な例において、本発明の局面を例証するために、トリヌクレオチドリピート(遺伝子型)のサイズが症状(表現型)と関係がある脆弱Xが用いられ得る。しかしながら、脆弱Xは、非限定的な例であり、同様の分析が、他の遺伝子座に対して行われ得る(例えば、独立して、または多重分析において同時に)ことが認識されるだろう。
分子反転プローブ(MIP)の使用は、単一ヌクレオチド多型の検出(Hardenbolら、2005 Genome Res 15:269−75)およびエキソンの大きなセットの調製的増幅(Porrecaら、2007 Nat Methods 4:931−6,Krishnakumarら、2008 Proc Natl Acad Sci USA 105:9296−301)について証明されている。どちらの場合においても、増幅される遺伝子座の上流および下流とハイブリダイズする末端(「標的化アーム」)を有するオリゴヌクレオチドプローブが設計される。
いくつかの実施形態において、本発明の局面は、プローブ捕捉効率に対する長さの影響をアッセイ(例えば、ハイスループットアッセイおよび/または多重アッセイ)に用いることにより、評価される領域全体のシークエンシングを必要とせずに配列の長さを決定することができるという認識に基づく。これは、サイズが変化しやすいリピート領域にとって特に有用である。Dengら、Nature Biotech.27:353−60(Dengらの補足図1Gを参照のこと)から再現された図8に図示されるように、MIPを用いるとき、短い配列が長い配列よりも高効率で捕捉されることが図示されている。統計パッケージRおよびそのエフェクト(effect)モジュールをこの分析のために用いた。線形モデルを使用し、個別の因子は独立していると仮定した。破線は、95%信頼区間を表している。より短い標的配列が、長い標的配列よりも高い効率で捕捉された(p<2×10−16)。しかしながら、配列の長さの体系的分析にこの差次的な捕捉効率を使用することは、以前は認識されていなかった。
いくつかの実施形態において、プローブハイブリダイゼーションの後に、ポリメラーゼ充填反応およびライゲーション反応を行うことにより、ハイブリダイズされたプローブが、所望の標的を含む共有結合的に閉じた環状分子に変換される。PCRまたはローリングサークル増幅に加えて、環状化されていない材料のエキソヌクレアーゼ消化を行うことにより、出発核酸プールから環状の標的が単離され、増幅される。この方法の主要な利点のうちの1つは、高度の多重化に対する能力であるので、一般に、数千の標的が、数千のプローブを含む単一反応において捕捉される。
本発明の局面によると、反復領域は、独特の非反復配列に取り囲まれており、その非反復配列を使用することにより、例えば、PCRまたはパドロック(MΙP)ベースの方法を用いて、リピート含有領域を増幅することができる。
反復領域に加えて、プローブ(例えば、MIPまたはパドロックプローブ)は、ゲノム(または標的プール)において一義的に同定されるのに十分な少なくとも1つの配列を含むように設計され得る。図9に図示されるように、プローブが環状化され、増幅された後、独特の配列が同定されて、反復領域の「代表」として働き得るように、アンプリコンの末端が配列決定され得る。図9は、反復領域(太い波線)と隣接する独特の配列(太い直線)の両方を含む領域のパドロック(MIP)捕捉の非限定的なスキームを図示している。これらのプローブの領域は、領域「1」および「3」として示される標的化アームとともに示されている。シークエンシングプライマー結合部位であり得るかまたはシークエンシングプライマー結合部位を含む介在領域は、「2」と示されている。パドロックが環状化され、増幅された後、末端を配列決定することにより、目的の反復領域に相当する独特の配列の配列を得ることができる。捕捉効率は、全体的に見て、標的の長さと逆の相関関係があるが、種々のプローブ配列は、独特の特性を有し得る。ゆえに、およそ0〜150bp、150〜600bpおよびそれ以上の反復サイズ(これらはそれぞれ、脆弱X症候群の正常、前変異および完全変異を表す)を識別するのに十分感度の高い最適なプローブが選択されるように、複数のプローブが、設計され得、試験され得る。しかしながら、ある範囲のリピート領域サイズの差(例えば、約3〜30塩基、約30〜60塩基、約60〜90塩基、約90〜120塩基、約120〜150塩基、約150〜300塩基、約300〜600塩基、約600〜900塩基という長さの差、または任意の中間もしくはそれより長い長さの差)を識別するように、他のプローブのサイズおよび配列が設計され得、必要に応じて、最適化され得ることが認識されるだろう。長さの差は、サイズの増加またはサイズの減少であり得ることが認識されるだろう。
いくつかの実施形態において、予想外の捕捉頻度の最初の決定は、サイズの差の存在を示す。いくつかの実施形態において、捕捉頻度の増加は、欠失を示唆する。いくつかの実施形態において、捕捉頻度の減少は、挿入を示唆する。しかしながら、捕捉プローブの特定の配列パラメータおよび相対的サイズ、標的領域ならびに欠失または挿入に応じて、捕捉頻度の変化は、標的領域の長さの増加または減少に関連し得ることが認識されるだろう。いくつかの実施形態において、その変化の正確な性質は、本明細書中に記載されるような1つ以上の追加の手法を用いて測定され得る。
したがって、いくつかの局面において、MIPプローブは、2つのハイブリダイゼーション配列または標的化アーム(一方は直鎖状プローブの各端に位置する)を含む直鎖状の核酸鎖を含み、ここで、ハイブリダイゼーション配列の各々は、標的核酸の同じ鎖における別個の配列に相補的であり、標的核酸におけるこれらの配列は、目的の標的核酸配列の2つの末端に隣接する。ハイブリダイゼーションの際、プローブの5’末端と3’末端の両方が同じ鎖にハイブリダイズすることにより、標的領域に隣接する領域を分断するという意味において、プローブの2つの末端は互いに対して反転している(例えば、図9に図示されるように)ことが認識されるだろう。
いくつかの実施形態において、ハイブリダイゼーション配列は、約10〜100ヌクレオチド長、例えば、約10〜30、約30〜60、約60〜90または約20、約30、約40もしくは約50ヌクレオチド長である。しかしながら、用途に応じて、他の長さを使用してもよい。いくつかの実施形態において、プローブの両方の標的化アームのハイブリダイゼーションTmは、同様であるように設計されるかまたは選択される。いくつかの実施形態において、異なる標的領域を捕捉するために設計された複数のプローブの標的化アームのハイブリダイゼーションTmは、同様であるように選択されるかまたは設計され、その結果、それらは多重反応において共に使用することができる。したがって、充填前のMIPプローブの代表的なサイズは、約60〜80ヌクレオチド長である。しかしながら、標的化アームのサイズおよびMIPプローブに存在する他の任意の配列(例えば、プライマー結合配列またはタグ配列)のサイズに応じて、他のサイズを使用してもよい。いくつかの実施形態において、MIPプローブは、配列依存的な二次構造を回避するように設計される。いくつかの実施形態において、MIPプローブは、標的化アームが、公知の多型の領域と重複しないように設計される。いくつかの実施形態において、脆弱X遺伝子座のリピート領域を捕捉するために使用され得る標的化アームは、捕捉される鎖に応じて、以下の配列を有し得るかまたはこれらの配列と相補的な配列を有し得る。
左:CTCCGTTTCGGTTTCACTTC(配列番号181)
右:ATCTTCTCTTCAGCCCTGCT(配列番号182) 。
これらの標的化アームを用いて捕捉される代表的なサイズは、約100ヌクレオチド長(例えば、トリヌクレオチドリピートの約30リピート)である。
いくつかの実施形態において、反復領域の「代表」に対して得られるリードの数は、得られるリードの総数に依存するので、そのリードの数は、標的の長さを推定する情報価値がない。これを克服するために、集団の中で多型が存在しないかまたは多型が最小である他の「コントロール」領域を標的にする1つ以上のプローブを含めることが有用である。捕捉効率が体系的に一貫するので(例えば、図9を参照のこと)、反復領域の「代表」に対して得られたリードと、コントロール領域に対して得られたリードとの比は、規定数のリピートを有するDNAを用いて調整され得る。最終的には、その比は、図10に図示されるように、リピートの長さの基準として働き得る。図10は、「コントロール」領域のリードに対するリピートの「代表」のリードの比によって測定される、標的のギャップサイズと反復領域のリードの相対数との非限定的な仮定的関係性を図示している。y軸の単位は、任意である。
いくつかの実施形態において、同様のサイズ範囲を有する標的をより上手く見分けるために、ショットガンライブラリーを作製することによって(例えば、捕捉された配列(例えば、MIPプローブを用いて捕捉された配列)からショットガンライブラリーを作製することによって)反復領域全体が配列決定され得る。リピートが長いほど、リピートの短いリードが多く得られ得る。ゆえに、標的の長さは、「反復」リードの相対数に対して2倍寄与し得、それにより、区別している標的のよりよい分離がもたらされ得る。いくつかの実施形態において、任意の所与のリピートからのリードの数は、存在するリピートの数の一次関数であり得るということが期待される。しかしながら、いくつかの実施形態において、ポアソンサンプリングによって誘導される広がりは、考慮される必要があり得、いくつかの実施形態において、その分離を限定するのに十分に大きい場合がある。
二倍体サンプル由来の両方の対立遺伝子の長さの正確な測定が望まれるとき、さらなる操作が必要になり得る。これは、測定される捕捉効率が、実際にはその2つの対立遺伝子の平均効率であり得るからである。各対立遺伝子に対する別個の測定を効率的に達成するために、後に続く(個別のゲノム遺伝子座からの)個別の捕捉事象の効率化を可能にするバーコード(例えば、配列タグ)が使用され得る。図11A〜Cは、上記のアプローチを示している。反応物中に同じ識別タグ配列を有する2つの任意のMIPが存在する確率が低くなるように、所与の遺伝子座に対して、それらの骨格に多数の識別タグのうちの1つを含むMIPを合成する。MIP捕捉をそのサンプルに対して行う;その反応は、より短い標的の長さに偏り、ゆえに、その反応産物は、「長い」環よりも「短い」環を多く含み得る。各環は、独特の識別タグ配列を有するはずである。次いで、直鎖RCA(lRCA)をそれらの環に対して行う。lRCA反応において、環は、それら自体の長い直鎖状のコンカテマーに変換される。そのコンカテマーが「一定の」長さ(そのポリメラーゼの処理能力/エラー率に基づいて)に達したら、所与の環に対するlRCA反応を停止する。ゆえに、より小さい環から得られたコンカテマーは、より多いコピー数の識別タグを含み得、より大きい環から得られたコンカテマーは、より少ないコピー数の識別タグを含み得る。各識別タグ配列の数は、例えば、次世代シークエンシングによって、計数される。出現数を識別タグIDに対してプロットすると、データは当然、二倍体サンプルにおける2つの対立遺伝子の長さを反映する2つの群にクラスター化する。ゆえに、既知の標準を用いて長さの絶対較正が行われた後、対立遺伝子の長さは、このグラフから直接読み取ることができる。いくつかの実施形態において、シークエンシング法(例えば、次世代シークエンシング法)を用いることにより、1つ以上の捕捉された標的(例えば、またはそのアンプリコン)の一部が配列決定され、それらの配列を用いることにより、存在する種々のバーコードの数が計数される。したがって、いくつかの実施形態において、本発明の局面は、高度に多重化されたqPCR反応に関する。
挿入もしくは欠失またはリピート配列が疾患または状態に関連し得る遺伝子座の他の非限定的な例が、表3および4に提供される。これらの遺伝子座のいずれか1つ以上における異常な長さの存在は、本発明の局面にしたがって評価され得ることが認識されるだろう。いくつかの実施形態において、これらの遺伝子座または他の遺伝子座の2つ以上は、同じ反応条件下において生物学的サンプル中の異なる標的核酸とハイブリダイズするように設計された種々のプローブを用いる単一の多重反応において評価され得る。
以下の実施例は、本発明の局面および実施形態を例証するものであり、限定または制限を意図しない。本明細書を検討すれば、本発明の多くのバリエーションが当業者に明らかになるだろう。本発明の全範囲は、等価物の全範囲に加えて請求項、および上記のようなバリエーションに加えて明細書を参照することにより、決定されるべきである。
4.検出感度の上昇:
いくつかの実施形態において、本発明の局面は、核酸検出アッセイの感度を高めるための方法に関する。
現在、次世代(ポロニーベースの)シークエンシング(とりわけ、ゲノムリシークエンシング、遺伝子発現についてのRNA−seq、メチル化についての亜硫酸水素塩シークエンシングおよびImmune−seqを含む)を利用してデータを生成する多くのゲノミクスアッセイが存在する。定量的測定(遺伝子型コールを含む)を行うために、これらの方法は、核酸の元のサンプルにおけるその配列の提示に対する代理として所与のゲノム遺伝子座のシークエンシングリードの数を利用する。これらの手法の大部分は、目的のサンプルを代表するDNA分子の高複雑度ライブラリーを構築する調製工程を必要とする。現在のアッセイは、いくつかの代替の核酸調製法(例えば、増幅、例えば、PCRベースの増幅;配列特異的捕捉、例えば、固定化された捕捉プローブを用いるもの;または環状化されたプローブへの標的捕捉の後の配列分析工程)のうちの1つを使用する。核酸単離手法および配列分析手法の予測不能性(確率的性質)に関連するエラーを減少させるために、現在の方法は、元の核酸サンプル中に存在するすべての配列が最終的な配列データにおいて提示される尤度を高めるために、標的核酸調製物の過剰サンプリングを伴う。例えば、ゲノムシークエンシングライブラリーは、そのライブラリーの構築プロセスにおける確率的変動の結果として、ソース核酸サンプル(例えば、ゲノム調製物)由来の特定の配列の提示過剰または提示不足を含み得る。そのような変動は、シークエンシングライブラリー内に存在しないゲノム由来の標的配列またはシークエンシングライブラリー内の検出不可能なゲノム由来の標的配列に生じるとき、特に問題であり得る。例えば、シークエンシングライブラリー内のゲノム由来の特定の対立遺伝子の配列(例えば、ヘテロ接合の対立遺伝子)の提示不足は、シークエンシングライブラリーにおいて明らかなホモ接合の提示をもたらし得る。
対照的に、本発明の局面は、標的核酸を単に過剰サンプリングするのではなく、核酸配列の分析を、サンプリングされる核酸のタイプで異なる系統誤差を有する2つ以上の異なる核酸調製手法からの結果に基づかせることに関する。いくつかの実施形態によると、異なる手法は、体系的でありかつ単純に核酸の捕捉中または増幅中の確率的影響に起因しない異なる配列バイアスを有する。したがって、いくつかの実施形態において、核酸調製における変動を克服するために必要な過剰サンプリングの程度は、バイアスを克服するのに十分である必要がある。いくつかの実施形態において、本発明は、異なるバイアスを有する2つ以上の異なる核酸調製手法から得られた核酸および/または配列の結果を組み合わせることによって、過剰サンプリングの必要性を低下させる方法を提供する。
本発明によると、異なる手法は、異なる特徴的なバイアスまたは系統誤差を有する。例えば、1つの手法は、サンプル分析を目的の遺伝子座における1つの特定の対立遺伝子に偏らせ得るのに対し、別の手法は、サンプル分析を同じ遺伝子座の別の対立遺伝子に偏らせ得る。したがって、同じサンプルが、配列分析にむけて核酸を調製するために使用される手法のタイプに応じて、異なると同定され得る。各手法が、目的の多型配列に対して異なる相対的な感度を有するので、これは、感度の問題を効率的に表す。
本発明の局面によると、核酸分析の感度は、異なる核酸調製工程からの配列を組み合わせ、組み合わされた配列情報を診断アッセイのために(例えば、被験体が目的の遺伝子座においてホモ接合であるかまたはヘテロ接合であるかに関するコールを生成するために)用いることによって、高められ得る。
現在、DNAシークエンシングが変異を検出する能力は、上流のサンプル単離方法(例えば、増幅、固定化濃縮、環状化捕捉などによる方法)が目的の遺伝子座を、信頼性をもって単離する能力によって限定されている。二倍体ゲノム(例えば、分子診断用シークエンシングのために提供されるヒトサンプル)についてヘテロ接合のベースコールを生成したい場合、いくつかの実施形態では、その単離方法がほぼ均一または完全に均一(目的の遺伝子座に対してヘテロ接合体またはホモ接合体と明確に「コール」されるのに少なくとも十分均一)の量の2つの配列決定された対立遺伝子を生成することが重要である。
サンプル調製方法は、3つのクラス:1)単一またはいくつかの標的の増幅(例えば、一重(uniplex)PCR、「多重」PCR)、2)多標的(multi−target)ハイブリダイゼーション濃縮(例えば、Agilent SureSelect「ハイブリッド」捕捉[Gnirkeら、2009,Nature methods 27:182−9]、Roche/Nimblegen「配列捕捉」[Hodgesら、2007,Nature genetics 39:1522−7]、および3)多標的環状化選択(例えば、分子反転プローブまたはパドロックプローブ[Porrecaら、2007,Nature methods 4:931−6、Turnerら、2009,Nature methods 6:315−6]、「セレクター」[Dahlら、2005,Nucleic acids research 33:e71])に分けられ得る。これらの方法の各々は、インプットの存在量の分布を適切に表さない単離された産物のプールを生じ得る。例えば、ヘテロ接合の位置における2つの対立遺伝子は、インプットの50:50という比から下流のシークエンシングにおいてベースコールを見落とす比に歪められ得る。例えば、その比が50:50から10:90に歪められ、かつそのサンプルが10×平均カバレッジに配列決定される場合、2つの対立遺伝子のうちの1つが10個のシークエンシングリードにおいて1回も観察されない確率が高い。これにより、ヘテロ接合の位置がホモ接合に変換されることによってシークエンシング方法の感度が低下し得る(もしかすると「変異」対立遺伝子は、観察されない対立遺伝子であるかもしれない)。いくつかの実施形態において、歪められた比は、不均一な腫瘍組織に存在する変異を検出する感度を低下させる特定の問題である。例えば、不均一なサンプルにおいて分析される細胞のわずか10%しか、ヘテロ接合性の変異を有していない場合、その変異は、配列リードの50%ではなく5%に存在すると予想され得る。このシナリオでは、ロバストな高感度の検出の必要性がなおも重大であり得る。
本明細書中に開示される方法は、ある特定のクラスの単離方法が種々の様式のバイアスを有するという発見に部分的に基づく。本開示は、1つのサンプルに対して複数の単離方法の組み合わせ(例えば、本明細書中に開示されるクラスのうちの少なくとも2つから1つ以上)を用いることによって下流のシークエンシングの感度を高めるための方法を提供する。これは、疾患関連変異を「見落とす」可能性を最小にするために高感度が要求される分子診断法において特に重要である。例えば、環状化選択後のシークエンシングに対して1×10−3という名目上の偽陰性のエラー率およびハイブリダイゼーション濃縮後のシークエンシングに対して1×10−3という偽陰性のエラー率が与えられるとき、そのサンプルに対して両方の手法を行うことによって、1×10−6という最終的な偽陰性の割合が達成され得る(各方法における失敗は完全に独立していると仮定する)。単一の完全浸透の変異対立遺伝子によって引き起こされる保因者の頻度が0.1の劣性の疾患の場合、見落とされる保因者診断の数は、試験された100万人の患者あたり1000人から試験された100万人の患者あたり1人にまで減少し得る。さらに、この試験が、出生前保因者スクリーニングにおいて使用される場合、一方の親において保因者であるというコールを見落とす結果として生まれる罹患小児の数は、出生児100万人あたり25人から10億人あたり25人にまで減少し得る。
さらに、本開示は、疾患関連対立遺伝子を含む領域におけるシークエンシングカバレッジを効率的に上げる調製方法の組み合わせを提供する。ヘテロ接合体のエラー率は、50:50の対立遺伝子提示からの偏差と、次世代DNAシークエンシングの場合の平均存在量からの偏差との両方に広く関係しているので(単離されたより少ない標的は、一方または両方の対立遺伝子においてより少なくサンプリングされる可能性が高い)、これらの領域におけるカバレッジを選択的に上げることにより、感度も選択的に上がり得る。さらに、特定の公知の疾患関連変異の存在または非存在を検出するMIPを用いることにより、感度を選択的に高めることができる。いくつかの実施形態において、これらのMIPは、最も3’側の領域が、予想される変異と相補的であり、かつ0bpまたはそれ以上のbpの充填長を有する、標的化アームを有し得る。よって、変異が存在する場合のみ、MIPは形成し、その存在は、シークエンシングによって検出され得る。
さらに、本明細書中に開示されるアルゴリズムを用いることにより、様々なレベルのストリンジェンシーで、所与の位置が任意の公知の疾患関連対立遺伝子を有するか否かに応じた塩基同一性の決定が行われ得る。ストリンジェンシーは、コンセンサスベースコールを生成するために必要な観察される変異リードの最小数を減少させることによって、そのような位置において低下され得る。これは、特異性の低下を犠牲にして変異対立遺伝子の検出に対する感度を効率的に高め得る。
本発明の実施形態は、例えば、標的核酸における多型の存在を検出するために、MIPと、ハイブリダイゼーション濃縮と、必要に応じて一般的な疾患に関連する公知の特定の遺伝子座を標的にした別のMIPとを組み合わせる。非限定的な例が、例えば、標的核酸における多型の存在を検出するために、MIPと、ハイブリダイゼーション濃縮と、必要に応じて一般的な疾患に関連する公知の特定の遺伝子座を標的にした別のMIPとを用いた概略図を図示している図12に例証されている。
図13および14は、MIPベースの捕捉に対する種々の捕捉効率を図示している。図13は、MIP捕捉による標的1つあたりの存在量のグラフを示している。このグラフでは、ここに多く存在しない標的は、両方の対立遺伝子を適切にサンプリングするためにシークエンシングにおいて十分な深度でカバーされる可能性が低いので、バイアスが、ヘテロ接合体のエラー率を大きく動かす。これは、Turnerら、2009,Nature methods 6:315−6からのものである。ハイブリダイゼーション濃縮は、定性的に類似の存在量の分布をもたらすが、所与の標的の存在量は、おそらく、2つの方法の間で相関しない。図14は、Ballら、2009,Nature biotechnology 27:361−8からの2つのMIP捕捉反応の相関関係のグラフを示している。各点は、複製物1および複製物2における標的の存在量を表している。ピアソン相関r=0.956。これは、MIP捕捉が、標的を特定の存在量に再現性よく偏らせることを示唆する。ハイブリダイゼーション濃縮は、同様に1つの捕捉から次の捕捉へと相関する。
本発明の局面によると、そのようなバイアスは、複数の被験体サンプル中の複数の遺伝子座を調べるアッセイにおいて種々の捕捉手法および/または分析手法を体系的に組み合わせることによって、検出され得るかまたは克服され得る。
したがって、本明細書中に記載される実施形態のいずれか(例えば、タイリング/スタガリング、タギング、サイズ検出、感度増強アルゴリズムまたはそれらの任意の組み合わせ)において、本発明の局面は、ゲノム核酸を調製すること、および/またはそれらを1つ以上の異なるプローブ(例えば、捕捉プローブ、ハイブリダイゼーションプローブ、MIPなど)と接触させることを含むことが認識されるだろう。いくつかの実施形態において、1被験体あたり使用されるゲノム核酸の量は、1ng〜10マイクログラム(例えば、500ng〜5マイクログラム)の範囲である。しかしながら、それよりも多い量または少ない量(例えば、1ng未満、10マイクログラム超、10〜50マイクログラム、50〜100マイクログラムまたはそれ以上)も使用され得る。いくつかの実施形態において、目的の各遺伝子座について、1アッセイあたり使用されるプローブの量は、特定の用途に対して最適化され得る。いくつかの実施形態において、プローブとゲノム等価物(例えば、半数体または二倍体のゲノム等価物、例えば、核酸標的または目的の遺伝子座の各対立遺伝子または両方の対立遺伝子に対して)との比(モル比、例えば、濃度比として測定される比)は、1/100、1/10、1/1、10/1、100/1、1000/1とさまざまである。しかしながら、それより低い比、高い比または中間の比を使用してもよい。
いくつかの実施形態において、各反応に使用される標的核酸およびプローブの量は、正規化されることにより、濃度または比が異なることによって引き起こされる、観察される任意の差が回避される。いくつかの実施形態において、ゲノムDNAおよびプローブを正規化するために、ゲノムDNAの濃度が、標準的な分光光度計または蛍光を用いて(例えば、蛍光インターカレート色素を用いて)読まれる。プローブ濃度は、実験によって、またはプローブ製造者が明記する情報を用いて、決定され得る。
同様に、いったん遺伝子座が捕捉されると(例えば、MIPもしくは他のプローブ上に、または別の形態で)、その遺伝子座は、1つ以上のプライマーが関わる反応において増幅され得、そして/または配列決定され得る。各反応に対して加えられるプライマーの量は、0.1pmol〜1nmol、0.15pmol〜1.5nmolの範囲(例えば、およそ1.5pmol)であり得る。しかしながら、他の量(例えば、それより少ない量、多い量または中間の量)を使用してもよい。
いくつかの実施形態において、1つ以上の介在配列(例えば、MIP捕捉プローブ上の第1標的化アームと第2の標的化アームとの間の配列)、識別配列もしくはタグ配列、または標的配列(例えば、ゲノム標的配列)にハイブリダイズするように設計されていない他のプローブ配列は、標的配列または生物学的サンプル中に存在し得る他の配列(例えば、他のゲノム配列)に対する過度の相補性を回避するように(クロス−ハイブリダイゼーションを回避するように)設計されるべきであることが認識されるだろう。例えば、これらの配列は、任意のゲノム配列と十分な数のミスマッチ(例えば、30塩基のうち少なくとも5、10、15またはそれ以上のミスマッチ)を有するように、またはハイブリダイゼーション反応温度よりも低い(例えば、少なくとも5、10、15、20℃またはそれ以上低い)Tm(例えば、ミスマッチTm)を有するように、設計され得る。
分析される核酸がDNA(例えば、ゲノムDNA)である場合、本明細書中で使用される標的化アームは、目的の遺伝子座のいずれかの鎖にハイブリダイズする(例えば、相補的である)ように設計され得ることが認識されるだろう。しかしながら、MIPプローブにおいては、一方の標的化アームに対して選択されるどちらかの鎖が他方の標的化アームに対しても用いられ得る。しかしながら、RNA分析においては、標的化アームは、転写されたRNAにハイブリダイズするように設計されるべきであることが認識されるだろう。標的配列を「捕捉する」と本明細書中で言及されるMIPプローブは、実際のところ、実際の標的分子の捕捉によってではなく鋳型に基づいた合成によって標的配列を捕捉することも認識されるだろう(例えば、アームが、標的分子にハイブリダイズする最初の段階以外、または標的分子が変性されるまでもしくは別途除去されるまで、伸長されたMIP産物に標的分子が結合したままであり得るという意味において)。
いくつかの実施形態において、標的化アームは、1つの対立遺伝子または変異(例えば、SNPまたは他の多型、変異など)と相補的な配列を含み得、その結果、プローブは、その対立遺伝子または変異を有する標的核酸を優先的にハイブリダイズする(および捕捉する)ことが認識されるだろう。しかしながら、多くの実施形態において、各標的化アームは、評価されている集団の被験体において多型でない配列にハイブリダイズする(例えば、相補的である)ように設計される。これにより、すべての対立遺伝子に対して標的配列が捕捉されることおよび/または配列決定されることが可能になり、被験体間(例えば、1つ以上の遺伝子座に対するヘテロ接合またはホモ接合のコール間)の差は、本明細書中に記載されるような配列情報および/または頻度に基づき得る。
配列タグ(バーコードとも呼ばれる)は、プローブ内またはプローブのファミリー内の他の位置に出現しないという点において独特であるように設計され得、また、それらは、標的にされている配列内にも出現しないことが認識されるだろう。ゆえに、それらを用いることにより、他の特徴を有する(例えば、特定の被験体および/または特定の遺伝子座に対して)特定のプローブを一義的に同定することができる(例えば、シークエンシングまたはハイブリダイゼーション特性によって)。
いくつかの実施形態において、プローブもしくはプローブの領域または他の核酸は、ある特定の配列または配列の特徴(例えば、長さ、他の特性など)を含む(comprising)かまたは含む(including)と本明細書中に記載されることも認識されるだろう。しかしながら、いくつかの実施形態では、それらの実施形態のいずれかの文脈において、プローブもしくはプローブの領域または他の核酸のいずれもが、それらの領域(例えば、アーム、中央領域、タグ、プライマー部位など、またはそれらの任意の組み合わせ)からなるか、またはそれらの配列からなるか、または本明細書中に記載されるような1つ以上の特徴(例えば、長さまたは他の特性など)からなる特徴を有する配列を有する(例えば、タイリングプローブもしくはずらされたプローブ、タグ化されたプローブ、長さの検出、感度増強アルゴリズムまたはそれらの任意の組み合わせについて)ことが認識されるだろう。
本明細書中で設計されるかまたは使用されるプローブ、プライマーおよび他の核酸は、合成のもの、天然のものまたはそれらの組み合わせであり得ることが認識されるだろう。したがって、本明細書中で使用されるとき、用語「核酸」とは、複数の連結されたヌクレオチド(すなわち、ピリミジン(例えば、シトシン(C)、チミジン(T)またはウラシル(U))またはプリン(例えば、アデニン(A)またはグアニン(G))である交換可能な有機塩基に連結された糖(例えば、リボースまたはデオキシリボース)を含む分子)のことを指す。「核酸」および「核酸分子」は、交換可能に使用され得、それらは、オリゴリボヌクレオチドならびにオリゴデオキシリボヌクレオチドのことを指す。これらの用語は、ポリヌクレオシド(すなわち、ポリヌクレオチドからリン酸を引いたもの)および他の任意の有機塩基を含む核酸も含むものとする。それらの有機塩基には、アデニン、ウラシル、グアニン、チミン、シトシンおよびイノシンが含まれる。別段述べられない限り、核酸は、一本鎖または二本鎖であり得る。その核酸は、天然に存在するものまたは天然に存在しないものであり得る。核酸は、自然源から得ることができるか、または核酸合成装置を用いて合成され得る(すなわち、合成のものであり得る)。核酸の回収および単離は、当該分野において通例のとおり行われ、適当な方法は、標準的な分子生物学の教科書に見られる(例えば、Maniatis’ Handbook of Molecular Biologyを参照のこと)。核酸は、DNAまたはRNA(例えば、ゲノムDNA、ミトコンドリアDNA、mRNA、cDNA、rRNA、miRNAまたはそれらの組み合わせ)であり得る。天然に存在しない核酸(例えば、細菌人工染色体(BAC)および酵母人工染色体(YAC))も使用され得る。
本発明は、核酸誘導体の使用も企図する。本明細書中に記載されるように、ある特定の核酸誘導体の使用は、特にそれらがヌクレアーゼを含み得る生物学的サンプルに曝露されたときの、それらの消化を防ぐことによって、本発明の核酸の安定性を高め得る。本明細書中で使用されるとき、核酸誘導体は、天然に存在しない核酸またはその単位である。核酸誘導体は、天然に存在しないエレメント(例えば、天然に存在しないヌクレオチドおよび天然に存在しない骨格結合(backbone linkages))を含み得る。
核酸誘導体は、骨格修飾(例えば、ホスホロチオエート結合、ホスホジエステル修飾された核酸、ホスホロチオレート修飾、ホスホジエステル核酸とホスホロチオエート核酸との組み合わせ、メチルホスホネート、アルキルホスホネート、リン酸エステル、アルキルホスホノチオエート、ホスホルアミデート、カルバメート、カーボネート、リン酸トリエステル、アセトアミデート、カルボキシメチルエステル、メチルホスホロチオエート、ホスホロジチオエート、p−エトキシおよびそれらの組み合わせであるがこれらに限定されない)を含み得る。核酸の骨格の組成は、均一または不均一であり得る。
核酸誘導体は、糖および/または塩基における置換または修飾を含み得る。例えば、核酸誘導体は、3’位にヒドロキシル基以外および5’位にリン酸基以外の低分子量の有機基に共有結合した骨格の糖(例えば、2’−O−アルキル化されたリボース基)を有する核酸を含む。核酸誘導体は、アラビノースなどの非リボース糖を含み得る。核酸誘導体は、置換プリンおよび置換ピリミジン(例えば、C−5プロピンで修飾された塩基、5−メチルシトシン、2−アミノプリン、2−アミノ−6−クロロプリン、2,6−ジアミノプリン、ヒポキサンチン、2−チオウラシルおよびシュードイソシトシン(pseudoisocytosine))を含み得る。いくつかの実施形態において、置換は、糖/塩基、塩基に結合した基(ビオチン、蛍光基(フルオレセイン、シアニン、ローダミンなど)、化学的に反応性の基(カルボキシル、NHS、チオールなどを含む)を含む)またはそれらの任意の組み合わせにおける1つ以上の置換/修飾を含み得る。
核酸は、ペプチド核酸(PNA)、ロックト(locked)核酸(LNA)、DNA、RNAまたはそれらの共核酸(co−nucleic acids)(例えば、DNA−LNA共核酸)であり得る。PNAは、グリシンアミノ窒素およびメチレンカルボニルリンカーを介してヌクレオチド塩基に連結された2−アミノエチルグリシン残基で置き換えられたリン酸骨格を有するDNAアナログである。PNAは、ワトソン−クリック塩基対形成によってDNA標的とRNA標的の両方に結合し得、その際、場合によっては、DNAまたはRNAに基づくオリゴヌクレオチドを用いて形成され得るハイブリッドよりも強いハイブリッドを形成し得る。
PNAは、ペプチド結合によって接続されるモノマーから合成される(Nielsen,P.E.ら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。それらのモノマーは、標準的な固相ペプチド合成法を用いて作製され得る。PNAの化学および合成によって、PNAの設計においてアミノ酸およびポリペプチド配列を含めることが可能になる。例えば、リジン残基を用いることにより、PNA骨格に正電荷が導入され得る。アミノ酸側鎖の修飾のために利用可能なすべての化学的アプローチが、PNAに対して直接、適用可能である。いくつかのタイプのPNAのデザインが存在し、これらには、一本鎖PNA(ssPNA)、bisPNAおよび偽相補(pseudocomplementary)PNA(pcPNA)が含まれる。
PNA/DNA複合体の構造は、特定のPNAおよびその配列に依存する。ssPNAは、好ましくは、逆平行の向きで(すなわち、ssPNAのN末端がssDNAの3’末端と整列するように)、かつワトソン−クリック対形成によって、一本鎖DNA(ssDNA)に結合する。PNAはまた、フーグスティーン塩基対形成によってDNAに結合し得、それにより、二本鎖DNA(dsDNA)と三重鎖を形成し得る(Wittung,P.ら、Biochemistry 36:7973(1997))。
ロックト核酸(LNA)は、改変されたRNAヌクレオチドである。LNAは、DNAとハイブリッドを形成し、そのハイブリッドは、PNA/DNAハイブリッドと少なくとも同程度に安定である(Braasch,D.A.ら、Chem & Biol.8(1):1−7(2001))。それゆえ、LNAは、PNA分子であり得るように使用され得る。LNAの結合効率は、正電荷をLNAに付加することによって、いくつかの実施形態において高まり得る。LNAは、本質的に高い結合親和性を有すると報告されている。
市販の核酸合成装置および標準的なホスホルアミダイト化学を用いることにより、LNAが作製される。それゆえ、混合性のLNA/DNA配列の作製は、混合性のPNA/ペプチド配列の作製と同程度に簡便である。LNAモノマーの安定化の効果は、相加効果ではない。LNAモノマーは、隣接するデオキシヌクレオチドの糖環のコンフォメーションに影響し、その隣接するデオキシヌクレオチドの糖環をより安定な配置に変える(Nielsen,P.E.ら、Peptide Nucleic Acids,Protocols and Applications,Norfolk:Horizon Scientific Press,p.1−19(1999))。また、配列内のLNA残基がより少ないことにより、合成の正確度は劇的に改善される。核酸を結合体化するための生化学的なアプローチのほとんどが、LNA/DNA構築物に適用可能である。
これらおよび他の本発明の局面は、以下の非限定的な例によって例証される。
以下の実施例は、本発明の非限定的な実施形態を例証するものである。
実施例1:ヒト標的エキソン用の捕捉プローブセットの設計
すべての標的が、部分的に重複するサブターゲットのセットとして捕捉される。例えば、タイリングアプローチにおいて、200bpの標的エキソンは、12個のサブターゲット(各々60bp長)のセットとして捕捉され得る(図1)。各サブターゲットは、他の2または3つの標的と部分的に重複するように選択される。
いくつかの実施形態において、すべてのプローブが、3つの領域:1)サブターゲットからすぐ上流とハイブリダイズする配列を含む20bpの「標的化アーム」、2)増幅プライミング部位の対として使用される配列を含む30bpの「定常領域」、および3)サブターゲットからすぐ下流とハイブリダイズする配列を含む第2の20bpの「標的化アーム」から構成される。標的化アームの配列は、セット内の捕捉プローブごとに異なるが、定常領域の配列は、そのセット内のすべてのプローブについて同じであることから、すべての捕捉された標的を単一のプライマーセットで増幅することが可能である。標的化アームの配列は、20bp配列の任意の所与の対が標的ゲノム内で独特であるように(望まれない部位の偽の捕捉を防止するように)設計されるべきである。さらに、融解温度は、ハイブリダイゼーション効率が一定温度(例えば、60℃)においてすべてのプローブについて均一になるように、そのセット内のすべてのプローブに対して一致させるべきである。ゲノム標的と塩基対形成する能力を損ない得る強い二次構造を形成しないことを確実にするために、標的化アームの配列は、計算的にスクリーニングされるべきである。
ヒトゲノムサンプルへの捕捉プローブのハイブリダイズ
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
サーマルサイクラーにおいて、ゲノムDNAを変性するために95℃にて5分間の加熱反応を行い、次いで、60℃に冷却する。60℃にて40時間インキュベートする。
ハイブリダイズされたプローブを、サブターゲットを含む共有結合的に閉じた環状産物に変換する
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/サブターゲット産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベート(Incubte)し、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
1.95℃で5分間
2.95℃で30秒間
3.58℃で60秒間
4.72℃で60秒間
5.2に戻り、さらにN回 。
分析にむけて、ショットガン次世代シークエンシングライブラリーを調製する。
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化(Concatemerize)する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さのフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
実施例2:エキソン標的セットのMIP捕捉反応においてバイアスを検出するためおよび補正するための識別タグ配列の使用
検出/補正を行う際の第1工程は、所与のサンプルについてどれだけ多くの識別タグ配列が必要であるかを決定することである。この実施例では、1000個のエキソンに対応する1000個のゲノム標的を捕捉した。識別タグ配列は、プローブの一部であるので、1番最初のプロトコル工程から生じるバイアスを測定/報告する。また、識別タグ配列は、骨格に位置するので、別個のプライミング部位から容易に配列決定され得、ゆえに、標的の配列決定に対する達成可能な総リード長に影響を及ぼさない。MIPプローブは、かなり多数の販売業者(例えば、IDT)によって、標準的なカラムベースのオリゴヌクレオチド合成法を用いて合成され、識別タグ配列は、その骨格内の「縮重」位置として導入される。各縮重位置は、合成される識別タグ配列の総数を4倍増加させるので、10ntの縮重領域は、約le6種という識別タグ配列の複雑度を意味する。
捕捉プローブをヒトゲノムサンプルにハイブリダイズする
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
サーマルサイクラーにおいて、ゲノムDNAを変性するために95℃にて5分間の加熱反応を行い、次いで、60℃に冷却する。60℃にて40時間インキュベートする。
ハイブリダイズされたプローブを、サブターゲットを含む共有結合的に閉じた環状産物に変換する。
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/サブターゲット産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベートし、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
6.95℃で5分間
7.95℃で30秒間
8.58℃で60秒間
9.72℃で60秒間
10.2に戻り、さらにN回 。
分析にむけて、ショットガン次世代シークエンシングライブラリーを調製する。
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さ(lenth)のフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
製造者の説明書(例えば、Illumina、ABIなど)に従ってライブラリーのシークエンシングを行い、標的配列と識別タグ配列の両方を読み取る
識別タグ配列の存在量を定量化することによって検出される任意のバイアスについて補正することによってデータを分析する
リードデータから標的:識別タグの存在量の表を構築する、例えば:
任意の特定の標的:識別タグのマッピングは、偶然に2回以上起きないので、すべての「カウント」の記載は、「1」であるはずであり、ゆえに、その2回以上のマッピングは、バイアスがサンプル調製プロセスのどこかに存在する場合にのみ観察される。2回以上観察された任意の標的:識別タグの組み合わせについては、そのようなリードのすべてが、コンセンサスベースコールが決定される前に単一の読み取りに「つぶされる」。これによって、コンセンサスベースコールの正確度に対するバイアスの影響が取り消される。図5は、リピート標的:識別タグの組み合わせがつぶされている二倍体遺伝子型のコールを生成するための方法を表している。
実施例3:MIP捕捉反応用の識別タグ配列の設計
ある標的のセットに対して、ある特定の識別タグ配列がある特定の標的配列との組み合わせにおいて2回以上偶然に観察されないと信頼できる(いくつかの統計的限界内で)ために必要な識別タグ配列の数を決定した。ある特定の長さの識別タグ配列に対する独特の識別タグ配列の総数は、4(識別タグ配列のヌクレオチドの長さ)と決定される。識別タグ配列を有するMIPプローブを用いる分子反転プローブ捕捉反応に対しては、捕捉反応を行い、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率は:p=1−[N!/(N−M)!]/[N^M]として計算され、式中、Nは、存在し得る独特の識別タグ配列の総数であり、Mは、捕捉反応における標的配列コピーの数である。よって、識別タグ配列の長さを変化させることによって、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率が所定の確率の値に設定されたMIP捕捉反応を行うことが可能である。
例えば、15ヌクレオチド長の識別タグ配列に対しては、1,073,741,824個の識別タグ配列が存在し得る。各々が15ヌクレオチドの識別タグ配列を有するMIPプローブが10000コピーの標的配列(例えば、ゲノム等価物)と組み合わされるMIP捕捉反応において、同じ識別タグ配列を有する1以上のコピー数の標的配列を捕捉する確率は、0.05である。この例では、MIP反応は、複数コピーが同じ識別タグ配列でタグ化された標的をほとんど生成しない(通常0個であるが、たまに1個またはそれ以上)。図6は、15ヌクレオチドの識別タグ配列を有する100000個の捕捉反応および10000個の標的配列に対するシミュレーションの結果を示している。
実施例4:シークエンシングカバレッジの関数としての、複数の独立した遺伝子座において正確なベースコールを行うのに十分なシークエンシングリードを得るための確率の評価
シークエンシングカバレッジの必要条件を決定するために、モンテカルロシミュレーションを行った。このシミュレーションは、所与の遺伝子座(標的)の10000ゲノムコピー(半数が母系対立遺伝子であり、半数が父系対立遺伝子である)を仮定する。このシミュレーションは、さらに、MIP反応について1%の捕捉効率を仮定する。このシミュレーションは、ある捕捉混合物から100回、非復元抽出することにより、100個の捕捉産物のセットを得る。次いで、このシミュレーションは、その100個の捕捉産物のセットから復元抽出することにより(偏りのない増幅と仮定して)、母系または父系から「リード」を生成する。標本抽出されるリードの数は、カバレッジに依存する。次いで、高精度のベースコールを行うために必要な母系と父系の両方からの独立したリードの数(10または20リードと仮定される)を測定した。このプロセスを各カバレッジレベルについて1000回繰り返し、両方の親からの十分なリードが首尾よく得られる回数の割合を測定した。成功したベースコールを得るはずの1000個の独立した遺伝子座を有すると仮定して、この割合を1000乗し、プロットした(図7を参照のこと)。結果は、>0.95の確率で各対立遺伝子を>=10×捕捉するためにはおよそ50×カバレッジが必要であるということを示している。
実施例5:「標的」遺伝子座および「コントロール」遺伝子座のMIP捕捉
いくつかの実施形態において、標的遺伝子座の捕捉効率を正確に定量化するために、様々な長さの標的遺伝子座に対する代理として働くと経験的に示されている少なくとも3セットのコントロール遺伝子座を並行して捕捉する。例えば、標的遺伝子座が、50〜1000bpの長さを有すると予想される場合、50、250および1000bpの長さを有するコントロール遺伝子座のセットが捕捉され得(例えば、1セットあたり20個の遺伝子座が外れ値からの妥当な保護をもたらすはずである)、それらの存在量がシークエンシングによってデジタル方式で測定され得る。これらの遺伝子座は、サンプル間の効率の変動および同じサンプルの複数のランにおける効率の変動が最小であることが観察されるように(ゆえに、「一定の効率」であるように)、選択されるべきである。これらは、存在量−対−長さの曲線の形状を定義する「参照」点として働き得る。次いで、標的の長さを決定することは、単に、検量線上の適切な点から長さを「読む」ことである。
いくつかの実施形態において、この方法からの標的の長さの推定における統計学的信頼度は、主として3つの因子:1)検量線を作成するために使用される存在量データの再現性/変動;2)「コントロール」データポイントに対する回帰の適合度;3)測定されている標的遺伝子座に対する存在量データの再現性によって動かされる。1)および2)における統計的限度は、アッセイを構築する際に測定されているので、あらかじめ判明している。さらに、適切な集団のサンプリングおよび技術的な再現性の測定がアッセイの構築に含まれているはずであるので、3)における統計的限度も、通常あらかじめ判明している。これらの3つの測定を、標的存在量の任意の所与の実験に基づく測定に対する単一のP値に統合するために標準的な統計学的方法が用いられるべきである。
いくつかの実施形態において、較正の観察結果のセットおよびそのデータに対する線形回帰の当てはめが与えられる場合、回帰を用いることにより、長さが不明の標的遺伝子座のn回の観察結果に対して長さの値を予測することができる。まず、長さの推定値の信頼区間に対する許容可能な範囲を選択する。例えば、脆弱Xの「正常」症例(87〜93bp)を「前変異」(165〜600bp)の潜在的な症例と識別する場合、目標は、93bpを165bpと識別するのに十分な精度で長さを測定することである。n回の観察結果が回帰直線(regressed line)に対する方程式に代入されたときにコンピュータで計算される反応の予測値は、任意精度を有し得る。しかしながら、例えば、95%信頼水準が望まれる場合、95%信頼区間は、「正常」の長さの範囲と「前変異」の長さの範囲の両方と重複しない程度に十分短くなければならない。例を続けると、較正データからの回帰に基づいてn=400のMIP観察結果から190という長さが計算される場合、95%信頼区間は、190+/−20bpであり、そのサンプルが95%の確実性で「前変異」の長さを表すと結論づけられ得る。逆に、較正データがそれほどロバストでない場合、その回帰のエラー推定値はより高いことがあり、予測される反応値に対してより広い信頼区間がもたらされる。いくつかの実施形態において、95%CIが、n=400から190+/−100bpと計算される場合、予測される反応値が「正常」の長さに対応するかまたは「前変異」の長さに対応するかを決定できない可能性がある。
いくつかの実施形態において、予測される反応に対する信頼区間は、以下のとおり計算される:
反応に対する推定値
は、その反応の平均値に対する推定値と同一である:
。予測値に対する信頼区間は、
によって与えられ、ここで、
は、xに対応する当てはめ値である。t値は、t(n−2)分布に対する大きい方の(1−C)/2棄却値である。
いくつかの実施形態において、目的の遺伝子座を分析するための手法は、以下の工程を含み得る。
ハイブリダイズされたプローブを、サブターゲットを含む共有結合的に閉じた環状産物に変換する。
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/サブターゲット産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベートし、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA−Ilmn(プラットフォーム特異的増幅配列+「環定常領域」特異的配列)
・1.5μlの10μM CP−2−RA−Ilmn(プラットフォーム特異的増幅配列+「環定常領域」特異的配列)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
11.95℃で5分間
12.95℃で30秒間
13.58℃で60秒間
14.72℃で60秒間
15.2に戻り、さらにN回 。
製造者の指示書(例えば、Illumina、ABI)に従ってデジタル定量化用のサンプルにおいてシークエンシング(例えば、次世代シークエンシング)を行う。
実施例6:エキソン標的核酸セットのMIP捕捉反応
MIPプローブは、かなり多数の販売業者(例えば、IDT)によって、標準的なカラムベースのオリゴヌクレオチド合成法を用いて合成される。
捕捉プローブをヒトゲノムサンプルにハイブリダイズする
ハイブリダイゼーション反応物を組み立てる:
・1.0μlの捕捉プローブ混合物(約2.5pmol)
・2.0μlの10×Ampligase緩衝液(Epicentre)
・6.0μlの500ng/μlヒトゲノムDNA(約16.7fmol)
・11μlのdH2O 。
サーマルサイクラーにおいて、ゲノムDNAを変性するために95℃にて5分間の加熱反応を行い、次いで、60℃に冷却する。60℃にて40時間インキュベートする。
ハイブリダイズされたプローブを、標的核酸を含む共有結合的に閉じた環状産物に変換する。
充填/ライゲーション反応混合物を調製する:
・0.25μlの2mM dNTP混合物(Invitrogen)
・2.5μlの10×Ampligase緩衝液(Epicentre)
・5.0μlの5U/μl Taq Stoffelフラグメント(Applied Biosystems)
・12.5μlの5U/μl Ampligase(Epicentre)
・4.75μlのdH2O 。
1.0μlのこの混合物をハイブリダイズされたプローブ反応物に加え、60℃で10時間インキュベートする。
環状化されたプローブ/標的核酸産物を未反応のプローブおよびゲノムDNAから精製する
エキソヌクレアーゼ反応混合物を調製する:
・21μlの充填/ライゲーション反応産物
・2.0μlの10×エキソヌクレアーゼI緩衝液(New England Biolabs)
・2.0μlの20U/μlエキソヌクレアーゼI(New England Biolabs)
・2.0μlの100U/μlエキソヌクレアーゼIII(New England Biolabs) 。
37℃で60分間インキュベートし、次いで、80℃で15分間インキュベートすることによって熱失活させる。貯蔵のために、直ちに4℃に冷却する。
プローブの「定常領域」に特異的なプライマーを用いてPCRによって環状材料を増幅する
PCR混合物を調製する:
・5.0μlの10×Accuprime反応緩衝液(Invitrogen)
・1.5μlの10μM CP−2−FA(5’−GCACGATCCGACGGTAGTGT−3’)(配列番号183)
・1.5μlの10μM CP−2−RA(5’−CCGTAATCGGGAAGCTGAAG−3’)(配列番号184)
・0.4μlの25mM dNTP混合物(Invitrogen)
・2.0μlの熱失活したエキソヌクレアーゼ反応混合物
・1.5μlの10×SybrGreen(Invitrogen)
・0.4μlの2.5U/μl Accuprime Pfxポリメラーゼ(Invitrogen)
・37.7μlのdH2O 。
以下のプロトコルに従ってリアルタイムサーマルサイクラーにおいて熱サイクル反応を行うが、増幅の収量がプラトーに達する前にサイクル反応を停止する(通常、8〜12サイクル):
16.95℃で5分間
17.95℃で30秒間
18.58℃で60秒間
19.72℃で60秒間
20.2に戻り、さらにN回 。
分析にむけて、ショットガン次世代シークエンシングライブラリーを調製する
・ゲル抽出によって、所望のアンプリコン集団を非特異的な増幅産物から精製する。
・アンプリコンを、剪断に適した高分子量産物にコンカテマー化する。
・噴霧器、BioRuptor、Hydroshear、Covarisまたは類似の装置を用いて機械的に剪断する。DNAは、数百塩基対の長さのフラグメントに剪断されるだろう。
・使用されるシークエンシングプラットフォームによる増幅に必要なアダプターをライゲートする。必要であれば、ライゲートされた産物をライゲートされていない産物およびアダプターから精製する。
製造者の説明書(例えば、Illumina、ABIなど)に従ってライブラリーのシークエンシングを行い、標的配列を読み取ることにより、標的核酸の存在量を測定する。
実施例7:1000個の標的のセットの遺伝子タイピングを行うためのMIP、ハイブリダイゼーションおよび変異検出MIPの使用
MIP、ハイブリダイゼーションおよび変異検出MIPを用いることにより、1000個の標的のセットの遺伝子タイピングを行う。このプロトコルによって、50個の特定の公知の点変異のうちのいずれかの検出が可能になる。
まず、MIP、ハイブリダイゼーションおよび変異検出MIPの別個の反応を生物学的サンプルにおいて行う。MIP捕捉反応は、本質的にはTurnerら、2009,Nature methods 6:315−6に記載されているように行う。MIPのセットは、そのセット内の各プローブが1000個の標的のうちの1つと隣接するように設計される。別個に、ハイブリダイゼーション濃縮反応は、Agilent SureSelect手順を用いて行われる。選択の前に、Illuminaの「Fragment Library」キットおよびプロトコルを用いて、濃縮されるゲノムDNAをショットガンシークエンシングライブラリーに変換する。Agilentのウェブインターフェースを用いることにより、標的核酸にハイブリダイズし得るプローブのセットを設計する。別個に、変異(例えば、特定の多型)が存在する場合のみMIPを形成し得るプローブのセットを設計する(変異検出MIP)。各変異検出MIPは、単一の公知の変異に特異的な最も3’側の塩基の同一性を有する。この変異検出MIPのセットを用いた反応を行うことにより、任意の変異対立遺伝子の存在が選択的に検出される。
3つすべての反応が行われたら、2つのMIP反応物を、単一のチューブに混合し(例えば、変異検出の感度をさらに高めるために潜在的に等モルでない比で)、1つのサンプルとして次世代DNAシークエンシング機器にかける。そのハイブリダイゼーション濃縮反応物を別個のサンプルとして次世代DNAシークエンシング機器にかける。各位置における総カバレッジ、その総カバレッジでの各リードの起源、各個別のリードの質のスコア、およびその領域と重複する変異特異的MIPから得られた任意のリードの存在(または非存在)を評価することによって標的セット内の各位置においてコンセンサス二倍体遺伝子型を形成するソフトウェアアルゴリズムによって、各「サンプル」からのリードを統合する。
前出の実施例は、非限定的なものであり、本発明の局面は、当業者(one or ordinary skill in the art)にとって利用可能な代替の手法および/またはプロトコルを用いて、本明細書中に記載されるように実行され得ることが認識されるだろう。
前述の説明および実施例に詳しく記載されているもの以外の方法が実施され得ることは明らかである。上記の教示に鑑みて、本開示の数多くの改変およびバリエーションが存在し得、ゆえに、それらは請求項の範囲内である。本開示の各局面の好ましい特徴は、必要な変更を加えた他の各局面と同様のものである。本明細書中で言及される特許、特許出願、学術論文または他の開示を含む書面は、それらの全体が本明細書によって参考として援用される。矛盾が生じる場合には、明らかな誤りの場合を除いて本願の開示が支配する。

Claims (67)

  1. 複数の遺伝子座を分析する方法であって、該方法は:
    複数の標的核酸の各々をプローブセットと接触させる工程であって、
    ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、該標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的である、5’領域および3’領域に隣接する中央領域を有し、ここで、該標的核酸の部分領域は、異なるものであり、各部分領域は、少なくとも1つの他の部分領域と重複している、工程、
    複数の核酸を単離する工程であって、該複数の核酸の各々は、該複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する、工程、ならびに
    該単離された核酸を分析する工程
    を包含する、方法。
  2. 少なくとも1つの部分領域が、少なくとも1つの他の部分領域と完全に重複する、請求項1に記載の方法。
  3. 各プローブの前記5’領域および前記3’領域の配列が、それぞれ、他の各プローブの5’領域および3’領域の配列と重複していない、請求項1に記載の方法。
  4. 各プローブの前記5’領域および前記3’領域の配列が、それぞれ、他の各プローブの5’領域および3’領域の配列と異なる、請求項1に記載の方法。
  5. 複数の遺伝子座を分析する方法であって、該方法は:
    複数の標的核酸の各々をプローブセットと接触させる工程であって、
    ここで、各プローブセットは、複数の異なるプローブを含み、各プローブは、該標的核酸の複数の部分領域のうちの1つの同じ鎖に隣接する核酸と相補的である、5’領域および3’領域に隣接する中央領域を有し、ここで、該標的核酸の部分領域は、異なるものであり、プローブの該5’領域の一部および該3’領域の一部は、それぞれ、異なるプローブの5’領域および3’領域の配列を有する、工程、
    複数の核酸を単離する工程であって、該複数の核酸の各々は、該複数の標的核酸の各々に関して異なる部分領域の核酸配列を有する、工程、ならびに
    該単離された核酸を分析する工程
    を包含する、方法。
  6. 前記標的核酸が、表1から選択される、請求項1または5に記載の方法。
  7. 前記分析工程が、前記標的核酸の多型の遺伝子タイピングを行う工程を包含する、請求項1または5に記載の方法。
  8. 前記多型が、表2から選択される、請求項7に記載の方法。
  9. 被験体の遺伝子タイピングを行う方法であって、該方法は:
    独立して単離された少なくとも閾値数の核酸の配列を決定する工程を包含し、ここで、単離された核酸の各々の配列は、標的核酸配列および識別タグ配列を含み、
    ここで、該閾値数は、標的核酸配列と識別タグ配列との独特の組み合わせの数であり、ここで、該単離された核酸は、標的核酸配列と識別タグ配列との独特の組み合わせを含む場合、独立して単離されたと同定され、ここで、該標的核酸配列は、被験体のゲノム遺伝子座の配列である、方法。
  10. 前記単離された核酸が、分子反転プローブによる捕捉産物である、請求項9に記載の方法。
  11. 被験体の遺伝子タイピングを行う方法であって、該方法は:
    分子反転プローブによる捕捉産物の配列を決定する工程であって、該分子反転プローブによる捕捉産物の各々は、分子反転プローブおよび標的核酸を含み、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、該標的核酸は、被験体の捕捉されたゲノム遺伝子座である、工程、ならびに
    分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列に基づいて、該捕捉されたゲノム遺伝子座について該被験体の遺伝子タイピングを行う工程
    を包含する、方法。
  12. 被験体の遺伝子タイピングを行う方法であって、該方法は:
    分子反転プローブによる捕捉産物を得る工程であって、各捕捉産物は、分子反転プローブおよび標的核酸を含み、ここで、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含み、ここで、該標的核酸は、該被験体の捕捉されるゲノム遺伝子座である、工程、
    該分子反転プローブによる捕捉産物を増幅する工程、ならびに
    各標的核酸について、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との少なくとも閾値数の独特の組み合わせの配列を決定することによって該被験体の遺伝子タイピングを行う工程を包含する、方法。
  13. 前記得る工程は、分子反転プローブを用いて前記被験体のゲノムサンプルから標的核酸を捕捉する工程を包含し、該分子反転プローブの各々は、独特の識別タグ配列を含む、請求項12に記載の方法。
  14. 前記捕捉工程が、標的と識別タグ配列との同一の組み合わせを用いて2つ以上の分子反転プローブによる捕捉産物を得る尤度が所定の値と等しいかまたはそれ未満である条件下で行われ、必要に応じて該所定の値が約0.05である、請求項12または13に記載の方法。
  15. 特定の標的核酸配列に対する前記閾値数が、遺伝子型に対する所望の統計学的信頼度に基づいて選択される、請求項12〜14のいずれか1項に記載の方法。
  16. 標的核酸配列と識別タグ配列との独特の組み合わせの数に基づいて、遺伝子型に対する統計学的信頼度を決定する工程をさらに包含する、請求項12〜14のいずれか1項に記載の方法。
  17. 複数の遺伝子座を分析する方法であって、該方法は:
    分子反転プローブによる複数の捕捉産物を得る工程であって、該複数の捕捉産物の各々は、分子反転プローブおよび標的核酸を含み、ここで、該分子反転プローブの配列は、識別タグ配列および必要に応じてプライマー配列を含む、工程、
    該分子反転プローブによる複数の捕捉産物を増幅する工程、
    増幅された複数のものにおける、分子反転プローブによる捕捉産物の標的核酸配列と識別タグ配列との組み合わせの出現数を測定する工程、ならびに
    標的核酸配列と識別タグ配列との特定の組み合わせの出現数が、所定の値を超える場合、該特定の組み合わせを含む該分子反転プローブの増幅におけるバイアスを検出する工程
    を包含する、方法。
  18. 前記複数のものにおける標的配列の遺伝子タイピングを行う工程をさらに包含し、ここで、該遺伝子タイピング工程は、バイアスが検出された場合に該バイアスを補正する工程を包含する、請求項17に記載の方法。
  19. 前記標的核酸配列が、表1から選択される遺伝子の配列である、請求項9〜18のいずれかに記載の方法。
  20. 標的核酸が異常な長さを有するか否かを決定するための方法であって、該方法は、被験体由来の生物学的サンプル中の標的核酸の捕捉効率を評価する工程を包含し、ここで、基準となる捕捉効率と異なる捕捉効率は、該生物学的サンプル中の異常な長さを有する標的核酸の存在を示す、方法。
  21. 欠失または挿入を有すると疑われる標的領域の捕捉効率を測定する工程、ならびに該捕捉効率を、正常な捕捉効率を示す参照と比較する工程を包含する、請求項20に記載の方法。
  22. 前記捕捉効率が、前記基準となる捕捉効率よりも低い、請求項20〜21に記載の方法。
  23. 前記被験体が、前記標的領域に挿入を有すると同定される、請求項22に記載の方法。
  24. 前記捕捉効率が、前記基準となる捕捉効率よりも高い、請求項20〜21に記載の方法。
  25. 前記被験体が、前記標的領域に欠失を有すると同定される、請求項24に記載の方法。
  26. 前記被験体が、前記挿入についてヘテロ接合であると同定される、請求項23に記載の方法。
  27. 前記被験体が、前記欠失についてヘテロ接合であると同定される、請求項25に記載の方法。
  28. サブターゲット核酸が、分子反転プローブを用いて前記標的核酸から捕捉される、前述のいずれかの請求項に記載の方法。
  29. 前記分子反転プローブが、その5’末端に第1の標的化アームを含み、その3’末端に第2の標的化アームを含み、ここで、該第1の標的化アームは、前記サブターゲット核酸の一方の末端に隣接する第1の領域と特異的にハイブリダイズすることができ、該第2の標的化アームは、該標的核酸の同じ鎖における該サブターゲット核酸の他方の末端に隣接する第2の領域と特異的にハイブリダイズすることができる、請求項28に記載の方法。
  30. 前記第1の標的化アームおよび前記第2の標的化アームが、約10から約100ヌクレオチド長である、請求項29に記載の方法。
  31. 前記第1の標的化アームおよび前記第2の標的化アームが、約10〜20、20〜30、30〜40または40〜50ヌクレオチド長である、請求項30に記載の方法。
  32. 前記第1の標的化アームおよび前記第2の標的化アームが、約20ヌクレオチド長である、請求項31に記載の方法。
  33. 前記第1の標的化アームおよび前記第2の標的化アームが、同じ長さを有する、請求項29〜31のいずれか1項に記載の方法。
  34. 前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、同様のものである、請求項29〜33のいずれか1項に記載の方法。
  35. 前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、互いの2〜5℃以内である、請求項34に記載の方法。
  36. 前記第1の標的化アームおよび前記第2の標的化アームのハイブリダイゼーションTmが、同一である、請求項34に記載の方法。
  37. 前記サブターゲット核酸が、核酸リピートを含む、請求項28〜36のいずれか1項に記載の方法。
  38. 前記核酸リピートが、ジヌクレオチドリピートまたはトリヌクレオチドリピートである、請求項37に記載の方法。
  39. 前記サブターゲット核酸が、核酸リピートの異常な増加または減少の非存在下において、10〜100コピーの前記核酸リピートを含む、請求項37に記載の方法。
  40. 前記サブターゲット核酸が、核酸リピートを含む脆弱X遺伝子座の領域である、請求項37に記載の方法。
  41. 一方または両方の標的化アームが、核酸リピートの領域のすぐ隣である、前記標的核酸における領域とハイブリダイズする、請求項29〜36のいずれか1項に記載の方法。
  42. 一方または両方の標的化アームが、任意の核酸リピートを含まない領域によって核酸リピートの領域から分離された前記標的核酸における領域とハイブリダイズする、請求項29〜36のいずれか1項に記載の方法。
  43. 前記分子反転プローブが、捕捉された前記サブターゲット核酸ならびに必要に応じて前記第1の標的化アームおよび/または前記第2の標的化アームを配列決定するために使用され得るプライマー結合領域をさらに含む、請求項29〜36のいずれか1項に記載の方法。
  44. 生物学的サンプル中の複数の異なる標的核酸が分析される、前述の請求項のいずれかに記載の方法。
  45. 前記複数の標的核酸が、複数の異なる分子反転プローブを用いて分析される、請求項44に記載の方法。
  46. 異なる分子反転プローブの各々が、3’および5’末端の各々に第1の標的化アームと第2の標的化アームとの異なる対を含む、請求項45に記載の方法。
  47. 異なる分子反転プローブの各々が、同じプライマー結合配列を含む、請求項46に記載の方法。
  48. 前記生物学的サンプルが、血液サンプルである、前述のいずれかの請求項に記載の方法。
  49. 前記生物学的サンプルが、組織サンプルである、前述のいずれかの請求項に記載の方法。
  50. 前記捕捉効率が、捕捉された標的核酸の量を測定することによって評価される、前述のいずれかの請求項に記載の方法。
  51. 捕捉された標的核酸の前記量が、独立して捕捉された標的核酸分子の数を測定することによって測定される、請求項50に記載の方法。
  52. 捕捉された標的核酸の前記量が、捕捉された核酸の基準となる量と比較される、請求項50〜51に記載の方法。
  53. 前記基準となる量が、独立して捕捉された基準となる核酸の分子の数を測定することによって測定される、請求項52に記載の方法。
  54. 前記基準となる核酸が、欠失または挿入を含むとは疑われない生物学的サンプル中の異なる遺伝子座の核酸である、請求項53に記載の方法。
  55. 前記基準となる核酸が、捕捉反応に加えられる、既知サイズおよび既知量の核酸である、請求項53に記載の方法。
  56. 前記捕捉効率が、前記基準となる捕捉効率と統計学的に有意に異なる場合、被験体は、前記遺伝子座の1つ以上の対立遺伝子に挿入または欠失を有すると同定される、前述のいずれかの請求項に記載の方法。
  57. 標的核酸の長さを推定するための方法であって、該方法は:
    (i)該標的核酸に対する検出プローブのハイブリダイゼーションを可能にする条件下で複数の該検出プローブと該標的核酸を接触させる工程であって、
    ここで、各検出プローブは、該標的核酸の第1の領域にハイブリダイズする第1のアームおよび該標的核酸の第2の領域にハイブリダイズする第2のアームを含むポリヌクレオチドであり、
    ここで、該第1の領域および該第2の領域は、該標的核酸の共通の鎖に存在し、
    ここで、該第1の領域の5’末端と該第2の領域の3’末端との間のヌクレオチド配列は、サブターゲット核酸のヌクレオチド配列である、工程;ならびに
    (ii)複数の該検出プローブとハイブリダイズした複数のサブターゲット核酸を捕捉する工程;ならびに
    (iii)該複数のサブターゲット核酸におけるあるサブターゲット核酸の出現頻度を測定する工程であって、ここで、該複数のサブターゲット核酸における該サブターゲット核酸の出現頻度は、該サブターゲット核酸の長さを示す、工程
    を包含する、方法。
  58. 核酸検出アッセイの感度を高める方法であって、該方法は:
    生物学的サンプルに対して第1の調製方法を用いて標的核酸の第1の調製物を得る工程、
    該生物学的サンプルに対して第2の調製方法を用いて標的核酸の第2の調製物を得る工程、
    第1の核酸調製物と第2の核酸調製物との両方において得られた配列をアッセイする工程、
    第1の核酸調製物と第2の核酸調製物との両方からの配列情報を用いることにより、該生物学的サンプル中の該標的核酸の遺伝子型を決定する工程
    を包含し、ここで、該第1の調製方法および該第2の調製方法は、異なる体系的な配列バイアスを有する、方法。
  59. 前記第1の核酸調製物および前記第2の核酸調製物が、配列アッセイを行う前に混合される、請求項58に記載の方法。
  60. 別個の配列アッセイが、前記第1の核酸調製物および前記第2の核酸調製物において行われ、両方のアッセイからの配列情報が、組み合わされることにより、前記生物学的サンプル中の前記標的核酸の遺伝子型が決定される、請求項58に記載の方法。
  61. 前記第1の調製方法が、PCRベース、ハイブリダイゼーションベースまたは環状プローブベースの調製方法である、請求項58に記載の方法。
  62. 前記第2の調製方法は、PCRベース、ハイブリダイゼーションベースまたは環状プローブベースの調製方法であるが、但し、該第2の調製方法は、前記第1の方法と異なる、請求項61に記載の方法。
  63. 生物学的サンプル中の核酸を代表する核酸調製物を得る方法であって、該方法は、
    生物学的サンプルに対して第1の調製方法を用いて第1の標的核酸調製物を得る工程、
    該生物学的サンプルに対して第2の調製方法を用いて第2の核酸調製物を得る工程、ならびに
    該第1の核酸調製物および該第2の核酸調製物を混合することにより、該生物学的サンプル中の核酸を代表する混合された調製物を得る工程
    を包含する、方法。
  64. 第1の調製方法および第2の調製方法と異なる第3の調製方法を用いて第3の核酸調製を行う工程をさらに包含し、ここで、該第1の調製方法、該第2の調製方法および該第3の調製方法のすべてが、異なる体系的な配列バイアスを有する、請求項1または6に記載の方法。
  65. 前記異なる調製方法が、前記生物学的サンプル中の複数の異なる遺伝子座に対して用いられることにより、多重核酸分析の感度が高められる、前述の請求項のいずれかの請求項に記載の方法。
  66. 生物学的サンプル中の核酸の遺伝子タイピングを行う方法であって、該方法は:
    生物学的サンプルに対してある調製方法を用いて核酸調製物を得る工程、
    該核酸調製物の標的核酸をシークエンシングする工程、ならびに
    該生物学的サンプルに対して分子反転プローブによる捕捉反応を行う工程であって、ここで、該生物学的サンプル中の該標的核酸の分子反転プローブによる捕捉は、該標的核酸における多型の存在を示す、工程、
    該シークエンシングおよび該捕捉反応の結果に基づいて該標的核酸を遺伝子タイピングする工程
    を包含する、方法。
  67. 前記標的核酸が、表1から選択される遺伝子の配列を有する、前述の請求項のいずれかに記載の方法。
JP2012508490A 2009-04-30 2010-04-30 遺伝マーカーを評価するための方法および組成物 Pending JP2012525147A (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US17447009P 2009-04-30 2009-04-30
US61/174,470 2009-04-30
US17892309P 2009-05-15 2009-05-15
US61/178,923 2009-05-15
US17935809P 2009-05-18 2009-05-18
US61/179,358 2009-05-18
US18208909P 2009-05-28 2009-05-28
US61/182,089 2009-05-28
PCT/US2010/001293 WO2010126614A2 (en) 2009-04-30 2010-04-30 Methods and compositions for evaluating genetic markers

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015164811A Division JP2016000046A (ja) 2009-04-30 2015-08-24 遺伝マーカーを評価するための方法および組成物

Publications (2)

Publication Number Publication Date
JP2012525147A true JP2012525147A (ja) 2012-10-22
JP2012525147A5 JP2012525147A5 (ja) 2013-03-28

Family

ID=43032733

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012508490A Pending JP2012525147A (ja) 2009-04-30 2010-04-30 遺伝マーカーを評価するための方法および組成物
JP2015164811A Pending JP2016000046A (ja) 2009-04-30 2015-08-24 遺伝マーカーを評価するための方法および組成物

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015164811A Pending JP2016000046A (ja) 2009-04-30 2015-08-24 遺伝マーカーを評価するための方法および組成物

Country Status (7)

Country Link
US (1) US11840730B1 (ja)
EP (1) EP2425240A4 (ja)
JP (2) JP2012525147A (ja)
AU (1) AU2010242073C1 (ja)
CA (1) CA2760439A1 (ja)
IL (1) IL216054A (ja)
WO (1) WO2010126614A2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016516410A (ja) * 2013-03-15 2016-06-09 アーノルド, ライル, ジェイ.ARNOLD, Lyle, J. クランプオリゴヌクレオチドを利用する核酸増幅方法
JP2016525363A (ja) * 2013-08-02 2016-08-25 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 特別なキャプチャープローブ(heatseq)を使用したシークエンスキャプチャー法
JP2017526046A (ja) * 2014-06-26 2017-09-07 10エックス ゲノミクス,インコーポレイテッド 核酸配列アセンブルのプロセス及びシステム
JP2018524993A (ja) * 2015-07-29 2018-09-06 プロジェニティ, インコーポレイテッド 染色体異常を検出するための核酸及び方法
US10854315B2 (en) 2015-02-09 2020-12-01 10X Genomics, Inc. Systems and methods for determining structural variation and phasing using variant call data
US11030276B2 (en) 2013-12-16 2021-06-08 10X Genomics, Inc. Methods and apparatus for sorting data
US11081208B2 (en) 2016-02-11 2021-08-03 10X Genomics, Inc. Systems, methods, and media for de novo assembly of whole genome sequence data

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010127186A1 (en) 2009-04-30 2010-11-04 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
JP2012525147A (ja) 2009-04-30 2012-10-22 グッド スタート ジェネティクス, インコーポレイテッド 遺伝マーカーを評価するための方法および組成物
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
DK2556171T3 (en) 2010-04-05 2015-12-14 Prognosys Biosciences Inc Spatially CODED BIOLOGICAL ASSAYS
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
DK2652155T3 (en) 2010-12-16 2017-02-13 Gigagen Inc Methods for Massive Parallel Analysis of Nucleic Acids in Single Cells
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
EP3246416A1 (en) 2011-04-15 2017-11-22 The Johns Hopkins University Safe sequencing system
EP2980226A1 (en) 2011-07-08 2016-02-03 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
US9228233B2 (en) 2011-10-17 2016-01-05 Good Start Genetics, Inc. Analysis methods
US20150031555A1 (en) * 2012-01-24 2015-01-29 Gigagen, Inc. Method for correction of bias in multiplexed amplification
DK3363901T3 (da) 2012-02-17 2021-02-22 Hutchinson Fred Cancer Res Sammensætninger og fremgangsmåder til præcis identificering af mutationer
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US8812422B2 (en) 2012-04-09 2014-08-19 Good Start Genetics, Inc. Variant database
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
EP2912468B1 (en) 2012-10-29 2018-09-12 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
WO2014152421A1 (en) 2013-03-14 2014-09-25 Good Start Genetics, Inc. Methods for analyzing nucleic acids
CA2907177A1 (en) * 2013-03-15 2014-09-18 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
WO2014160736A1 (en) * 2013-03-29 2014-10-02 University Of Washington Through Its Center For Commercialization Systems, algorithms, and software for molecular inversion probe (mip) design
EP3005200A2 (en) 2013-06-03 2016-04-13 Good Start Genetics, Inc. Methods and systems for storing sequence read data
CN111662960B (zh) 2013-06-25 2024-04-12 普罗格诺西斯生物科学公司 采用微流控装置的空间编码生物分析
US10851414B2 (en) * 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
WO2015057565A1 (en) 2013-10-18 2015-04-23 Good Start Genetics, Inc. Methods for assessing a genomic region of a subject
WO2015175530A1 (en) 2014-05-12 2015-11-19 Gore Athurva Methods for detecting aneuploidy
EP3152331B1 (en) * 2014-06-06 2019-08-07 Cornell University Method for identification and enumeration of nucleic acid sequence, expression, copy, or dna methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions
WO2016040446A1 (en) 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
JP2017536087A (ja) 2014-09-24 2017-12-07 グッド スタート ジェネティクス, インコーポレイテッド 遺伝子アッセイのロバストネスを増大させるためのプロセス制御
CA3010579A1 (en) 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
JP2018508852A (ja) 2015-01-13 2018-03-29 10エックス ゲノミクス,インコーポレイテッド 構造的変異及び相化情報を視覚化するシステム及び方法
DK3901281T3 (da) 2015-04-10 2023-01-23 Spatial Transcriptomics Ab Rumligt adskilt, multipleks nukleinsyreanalyse af biologiske prøver
US9422547B1 (en) 2015-06-09 2016-08-23 Gigagen, Inc. Recombinant fusion proteins and libraries from immune cell repertoires
CN108138220A (zh) * 2015-07-29 2018-06-08 普罗格尼迪公司 遗传分析的系统和方法
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
WO2018174821A1 (en) * 2017-03-20 2018-09-27 Nanyang Technological University A sequencing method for detecting dna mutation
US11584958B2 (en) 2017-03-31 2023-02-21 Grail, Llc Library preparation and use thereof for sequencing based error correction and/or variant identification
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
WO2020123320A2 (en) 2018-12-10 2020-06-18 10X Genomics, Inc. Imaging system hardware
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020191365A1 (en) 2019-03-21 2020-09-24 Gigamune, Inc. Engineered cells expressing anti-viral t cell receptors and methods of use thereof
WO2020206170A1 (en) 2019-04-02 2020-10-08 Progenity, Inc. Methods, systems, and compositions for counting nucleic acid molecules
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
WO2021091611A1 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Spatially-tagged analyte capture agents for analyte multiplexing
ES2946357T3 (es) 2019-12-23 2023-07-17 10X Genomics Inc Métodos para el análisis espacial usando ligación con molde de ARN
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11821035B1 (en) 2020-01-29 2023-11-21 10X Genomics, Inc. Compositions and methods of making gene expression libraries
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11835462B2 (en) 2020-02-11 2023-12-05 10X Genomics, Inc. Methods and compositions for partitioning a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
US11926863B1 (en) 2020-02-27 2024-03-12 10X Genomics, Inc. Solid state single cell method for analyzing fixed biological cells
US11768175B1 (en) 2020-03-04 2023-09-26 10X Genomics, Inc. Electrophoretic methods for spatial analysis
WO2021216622A1 (en) * 2020-04-21 2021-10-28 Aspen Neuroscience, Inc. Gene editing of gba1 in stem cells and method of use of cells differentiated therefrom
EP4242325A3 (en) 2020-04-22 2023-10-04 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
EP4025692A2 (en) 2020-06-02 2022-07-13 10X Genomics, Inc. Nucleic acid library methods
EP4158054A1 (en) 2020-06-02 2023-04-05 10X Genomics, Inc. Spatial transcriptomics for antigen-receptors
WO2021252499A1 (en) 2020-06-08 2021-12-16 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
EP4165207A1 (en) 2020-06-10 2023-04-19 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
WO2021263111A1 (en) 2020-06-25 2021-12-30 10X Genomics, Inc. Spatial analysis of dna methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
AU2022238446A1 (en) 2021-03-18 2023-09-07 10X Genomics, Inc. Multiplex capture of gene and protein expression from a biological sample
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007525963A (ja) * 2003-06-20 2007-09-13 イルミナ インコーポレイテッド 全ゲノム増幅および遺伝型決定のための方法および組成物
US20090099041A1 (en) * 2006-02-07 2009-04-16 President And Fellows Of Harvard College Methods for making nucleotide probes for sequencing and synthesis

Family Cites Families (337)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5583024A (en) 1985-12-02 1996-12-10 The Regents Of The University Of California Recombinant expression of Coleoptera luciferase
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
US5234809A (en) 1989-03-23 1993-08-10 Akzo N.V. Process for isolating nucleic acid
US6416952B1 (en) 1989-06-07 2002-07-09 Affymetrix, Inc. Photolithographic and other means for manufacturing arrays
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
CA2039652C (en) 1990-05-30 1996-12-24 Frank Zdybel, Jr. Hardcopy lossless data storage and communications for electronic document processing systems
US5060980A (en) 1990-05-30 1991-10-29 Xerox Corporation Form utilizing encoded indications for form field processing
US6716580B2 (en) 1990-06-11 2004-04-06 Somalogic, Inc. Method for the automated generation of nucleic acid ligands
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US6197508B1 (en) 1990-09-12 2001-03-06 Affymetrix, Inc. Electrochemical denaturation and annealing of nucleic acid
US5491224A (en) 1990-09-20 1996-02-13 Bittner; Michael L. Direct label transaminated DNA probe compositions for chromosome identification and methods for their manufacture
US5994056A (en) 1991-05-02 1999-11-30 Roche Molecular Systems, Inc. Homogeneous methods for nucleic acid amplification and detection
US6033854A (en) 1991-12-16 2000-03-07 Biotronics Corporation Quantitative PCR using blocking oligonucleotides
US5567583A (en) 1991-12-16 1996-10-22 Biotronics Corporation Methods for reducing non-specific priming in DNA detection
US5348853A (en) 1991-12-16 1994-09-20 Biotronics Corporation Method for reducing non-specific priming in DNA amplification
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
US5869252A (en) 1992-03-31 1999-02-09 Abbott Laboratories Method of multiplex ligase chain reaction
US6100099A (en) 1994-09-06 2000-08-08 Abbott Laboratories Test strip having a diagonal array of capture spots
JPH09507121A (ja) 1993-10-26 1997-07-22 アフィマックス テクノロジーズ ナームロゼ ベノートスハップ 生物学的チップ上の核酸プローブアレー
US5459307A (en) 1993-11-30 1995-10-17 Xerox Corporation System for storage and retrieval of digitally encoded information on a medium
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5888788A (en) 1994-05-18 1999-03-30 Union Nationale Des Groupements De Distillateurs D'alcool (Ungda) Use of ionophoretic polyether antibiotics for controlling bacterial growth in alcoholic fermentation
US5942391A (en) 1994-06-22 1999-08-24 Mount Sinai School Of Medicine Nucleic acid amplification method: ramification-extension amplification method (RAM)
US7008771B1 (en) 1994-09-30 2006-03-07 Promega Corporation Multiplex amplification of short tandem repeat loci
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
ATE314469T1 (de) 1994-10-18 2006-01-15 Univ Ottawa Neuronales apotose-inhibitor protein, gen sequenz und mutationen die wirbelsäulenmuskelatrophie verursachen
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
US6235501B1 (en) 1995-02-14 2001-05-22 Bio101, Inc. Method for isolation DNA
US5866337A (en) 1995-03-24 1999-02-02 The Trustees Of Columbia University In The City Of New York Method to detect mutations in a nucleic acid using a hybridization-ligation procedure
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5701256A (en) 1995-05-31 1997-12-23 Cold Spring Harbor Laboratory Method and apparatus for biological sequence comparison
US5636400A (en) 1995-08-07 1997-06-10 Young; Keenan L. Automatic infant bottle cleaner
US20050026204A1 (en) 1995-09-08 2005-02-03 Ulf Landegren Methods and compositions for nucleic acid targeting
SE9601676D0 (sv) 1996-04-30 1996-04-30 Ulf Landegren Improved probing of specific mucleic acids
US5830064A (en) 1996-06-21 1998-11-03 Pear, Inc. Apparatus and method for distinguishing events which collectively exceed chance expectations and thereby controlling an output
US6361940B1 (en) 1996-09-24 2002-03-26 Qiagen Genomics, Inc. Compositions and methods for enhancing hybridization and priming specificity
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
JP2001510557A (ja) 1996-10-04 2001-07-31 イントロン エルエルシー サンプル収集デバイス及びマーカーを用いたサンプル収集方法、及びサンプル確認、ラボの評価及び/又は認定の際の比較試料としてのマーカーの使用
TW491892B (en) 1996-11-07 2002-06-21 Srl Inc Apparatus for detecting microorganism
EP0848060A3 (en) 1996-12-11 2000-02-02 Smithkline Beecham Corporation Novel human 11CB splice variant
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
GB9716664D0 (en) 1997-08-06 1997-10-15 Norwegian Inst Of Fisheries & A method of removing nucleic acid contamination reactions
CA2214461A1 (en) 1997-09-02 1999-03-02 Mcgill University Screening method for determining individuals at risk of developing diseases associated with different polymorphic forms of wildtype p53
EP1027145A4 (en) 1997-09-17 2004-08-25 Gentra Systems Inc APPARATUS AND METHODS FOR ISOLATING NUCLEIC ACID
US5869717A (en) 1997-09-17 1999-02-09 Uop Llc Process for inhibiting the polymerization of vinyl aromatics
US20010046673A1 (en) 1999-03-16 2001-11-29 Ljl Biosystems, Inc. Methods and apparatus for detecting nucleic acid polymorphisms
US5993611A (en) 1997-09-24 1999-11-30 Sarnoff Corporation Capacitive denaturation of nucleic acid
US6866996B1 (en) 1998-01-30 2005-03-15 Evolutionary Genomics, Llc Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
CA2263784A1 (en) 1998-03-23 1999-09-23 Megabios Corporation Dual-tagged proteins and their uses
JP4493844B2 (ja) 1998-03-25 2010-06-30 ランデグレン、ウルフ 錠型(padlock)プローブのローリングサークル複製
US6946291B2 (en) 1998-04-24 2005-09-20 University Hospitals Of Cleveland Mixed cell diagnostic systems
US5971921A (en) 1998-06-11 1999-10-26 Advanced Monitoring Devices, Inc. Medical alarm system and methods
US6223128B1 (en) 1998-06-29 2001-04-24 Dnstar, Inc. DNA sequence assembly system
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US20020001800A1 (en) 1998-08-14 2002-01-03 Stanley N. Lapidus Diagnostic methods using serial testing of polymorphic loci
US6315767B1 (en) 1998-08-19 2001-11-13 Gambro, Inc. Cell storage maintenance and monitoring system
US6235502B1 (en) 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US6703228B1 (en) 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US7034143B1 (en) 1998-10-13 2006-04-25 Brown University Research Foundation Systems and methods for sequencing by hybridization
US7071324B2 (en) 1998-10-13 2006-07-04 Brown University Research Foundation Systems and methods for sequencing by hybridization
US6948843B2 (en) 1998-10-28 2005-09-27 Covaris, Inc. Method and apparatus for acoustically controlling liquid solutions in microfluidic devices
EP1125121B1 (en) 1998-10-28 2007-12-12 Covaris, Inc. Apparatus and methods for controlling sonic treatment
US6927024B2 (en) 1998-11-30 2005-08-09 Genentech, Inc. PCR assay
DE60042775D1 (de) 1999-01-06 2009-10-01 Callida Genomics Inc Verbesserte sequenzierung mittels hybridisierung durch verwendung von sondengemischen
GB9901475D0 (en) 1999-01-22 1999-03-17 Pyrosequencing Ab A method of DNA sequencing
CN1264744A (zh) 1999-02-26 2000-08-30 上海生元基因开发有限公司 一种通过循环差减进行大规模cDNA克隆和测序的方法
US6360235B1 (en) 1999-03-16 2002-03-19 Webcriteria, Inc. Objective measurement and graph theory modeling of web sites
US7074586B1 (en) 1999-06-17 2006-07-11 Source Precision Medicine, Inc. Quantitative assay for low abundance molecules
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7482443B2 (en) 2000-03-09 2009-01-27 Genetag Technology, Inc. Systems and methods to quantify and amplify both signaling probes for cDNA chips and genes expression microarrays
JP2001041918A (ja) 1999-08-03 2001-02-16 Honda Motor Co Ltd オイルの気体濃度検出装置
US6941317B1 (en) 1999-09-14 2005-09-06 Eragen Biosciences, Inc. Graphical user interface for display and analysis of biological sequence data
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
US6613516B1 (en) 1999-10-30 2003-09-02 Affymetrix, Inc. Preparation of nucleic acid samples
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
US20060276629A9 (en) 1999-12-17 2006-12-07 Hildebrand William H Purification and characterization of soluble human HLA proteins
US20030166057A1 (en) 1999-12-17 2003-09-04 Hildebrand William H. Method and apparatus for the production of soluble MHC antigens and uses thereof
US6775622B1 (en) 2000-01-31 2004-08-10 Zymogenetics, Inc. Method and system for detecting near identities in large DNA databases
US6714874B1 (en) 2000-03-15 2004-03-30 Applera Corporation Method and system for the assembly of a whole genome using a shot-gun data set
US20020019746A1 (en) 2000-03-16 2002-02-14 Rienhoff Hugh Y. Aggregating persons with a select profile for further medical characterization
AU2001293336A1 (en) 2000-04-11 2001-10-23 Ulf Landegren Nucleic acid detection medium
US20020091666A1 (en) 2000-07-07 2002-07-11 Rice John Jeremy Method and system for modeling biological systems
US6913879B1 (en) 2000-07-10 2005-07-05 Telechem International Inc. Microarray method of genotyping multiple samples at multiple LOCI
US6448717B1 (en) 2000-07-17 2002-09-10 Micron Technology, Inc. Method and apparatuses for providing uniform electron beams from field emission displays
US20020182609A1 (en) 2000-08-16 2002-12-05 Luminex Corporation Microsphere based oligonucleotide ligation assays, kits, and methods of use, including high-throughput genotyping
US6569920B1 (en) 2000-08-16 2003-05-27 Millennium Inorganic Chemicals, Inc. Titanium dioxide slurries having improved stability
WO2002017207A2 (en) 2000-08-23 2002-02-28 Arexis Ab System and method of storing genetic information
US8501471B2 (en) 2000-10-18 2013-08-06 Sloan-Kettering Institute For Cancer Research Uses of monoclonal antibody 8H9
ATE380883T1 (de) 2000-10-24 2007-12-15 Univ Leland Stanford Junior Direkte multiplex charakterisierung von genomischer dna
US7119188B2 (en) 2001-01-04 2006-10-10 Bristol-Myers Squibb Company N-carbobenzyloxy (N-CBZ)-deprotecting enzyme and uses therefor
CA2440754A1 (en) 2001-03-12 2002-09-19 Stephen Quake Methods and apparatus for analyzing polynucleotide sequences by asynchronous base extension
WO2002079502A1 (en) 2001-03-28 2002-10-10 The University Of Queensland A method for nucleic acid sequence analysis
US20020187483A1 (en) 2001-04-20 2002-12-12 Cerner Corporation Computer system for providing information about the risk of an atypical clinical event based upon genetic information
US7809509B2 (en) 2001-05-08 2010-10-05 Ip Genesis, Inc. Comparative mapping and assembly of nucleic acid sequences
AU2002308662A1 (en) 2001-05-12 2002-11-25 X-Mine, Inc. Web-based genetic research apparatus
GB2378245A (en) 2001-08-03 2003-02-05 Mats Nilsson Nucleic acid amplification method
US20040142325A1 (en) 2001-09-14 2004-07-22 Liat Mintz Methods and systems for annotating biomolecular sequences
US7070933B2 (en) 2001-09-28 2006-07-04 Gen-Probe Incorporated Inversion probes
US20030224384A1 (en) 2001-11-13 2003-12-04 Khalid Sayood Divide and conquer system and method of DNA sequence assembly
US7510829B2 (en) 2001-11-19 2009-03-31 Affymetrix, Inc. Multiplex PCR
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20030175709A1 (en) 2001-12-20 2003-09-18 Murphy George L. Method and system for depleting rRNA populations
DE60106469T2 (de) 2001-12-22 2005-10-13 4-Antbody AG Verfahren zur Herstellung von genetisch veränderten Lymphozyten Vorläuferzellen von Wirbeltieren und deren Gebrauch zur Produktion von heterologen Bindeproteinen
US7127436B2 (en) 2002-03-18 2006-10-24 Motorola, Inc. Gene expression programming algorithm
US20030203370A1 (en) * 2002-04-30 2003-10-30 Zohar Yakhini Method and system for partitioning sets of sequence groups with respect to a set of subsequence groups, useful for designing polymorphism-based typing assays
US6841384B2 (en) 2002-08-08 2005-01-11 Becton Dickinson Company Advanced roller bottle system for cell and tissue culturing
ES2407681T3 (es) 2002-08-23 2013-06-13 Illumina Cambridge Limited Nucleótidos modificados para la secuenciación de polinucleótidos.
WO2004026892A2 (en) 2002-09-19 2004-04-01 Applera Corporation Fragmentation of dna
KR20050073466A (ko) 2002-09-30 2005-07-13 칠드런스 머시 호스피탈 서브텔로미어 디엔에이 프로브 및 이의 제조 방법
US7865534B2 (en) 2002-09-30 2011-01-04 Genstruct, Inc. System, method and apparatus for assembling and mining life science data
US20050003369A1 (en) 2002-10-10 2005-01-06 Affymetrix, Inc. Method for depleting specific nucleic acids from a mixture
CA2507189C (en) 2002-11-27 2018-06-12 Sequenom, Inc. Fragmentation-based methods and systems for sequence variation detection and discovery
US8275554B2 (en) * 2002-12-20 2012-09-25 Caliper Life Sciences, Inc. System for differentiating the lengths of nucleic acids of interest in a sample
ES2338654T5 (es) 2003-01-29 2017-12-11 454 Life Sciences Corporation Amplificación de ácidos nucleicos en emulsión de perlas
US20060183132A1 (en) 2005-02-14 2006-08-17 Perlegen Sciences, Inc. Selection probe amplification
EP1606417A2 (en) 2003-03-07 2005-12-21 Rubicon Genomics Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US7041481B2 (en) 2003-03-14 2006-05-09 The Regents Of The University Of California Chemical amplification based on fluid partitioning
WO2004083819A2 (en) 2003-03-17 2004-09-30 Trace Genetics, Inc Molecular forensic specimen marker
ITMI20030643A1 (it) 2003-04-01 2004-10-02 Copan Innovation Ltd Tampone per il prelievo di campioni biologici
WO2004092333A2 (en) 2003-04-09 2004-10-28 Omicia Inc. Methods of selection, reporting and analysis of genetic markers using broad based genetic profiling applications
US7300755B1 (en) 2003-05-12 2007-11-27 Fred Hutchinson Cancer Research Center Methods for haplotyping genomic DNA
AU2004280531B2 (en) 2003-05-23 2010-03-25 Cold Spring Harbor Laboratory Counting exact word matches in genomes
SE0301951D0 (sv) 2003-06-30 2003-06-30 Pyrosequencing Ab New method
US7108979B2 (en) 2003-09-03 2006-09-19 Agilent Technologies, Inc. Methods to detect cross-contamination between samples contacted with a multi-array substrate
US7537889B2 (en) 2003-09-30 2009-05-26 Life Genetics Lab, Llc. Assay for quantitation of human DNA using Alu elements
US7729865B2 (en) 2003-10-06 2010-06-01 Cerner Innovation, Inc. Computerized method and system for automated correlation of genetic test results
WO2005045060A2 (en) 2003-10-29 2005-05-19 Bioarray Solutions, Ltd. Multiplexed nucleic acid analysis by fragmentation of double-stranded dna
WO2005042781A2 (en) 2003-10-31 2005-05-12 Agencourt Personal Genomics Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
US20050186589A1 (en) 2003-11-07 2005-08-25 University Of Massachusetts Interspersed repetitive element RNAs as substrates, inhibitors and delivery vehicles for RNAi
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US20070162983A1 (en) 2003-11-19 2007-07-12 Evotec Neurosciences Gmbh Diagnostic and therapeutic use of the human sgpl1 gene and protein for neurodegenerative diseases
US20050209787A1 (en) 2003-12-12 2005-09-22 Waggener Thomas B Sequencing data analysis
US8529744B2 (en) 2004-02-02 2013-09-10 Boreal Genomics Corp. Enrichment of nucleic acid targets
US7910353B2 (en) 2004-02-13 2011-03-22 Signature Genomic Laboratories Methods and apparatuses for achieving precision genetic diagnoses
EP1564306B1 (en) 2004-02-17 2013-08-07 Affymetrix, Inc. Methods for fragmenting and labeling DNA
US20060195266A1 (en) 2005-02-25 2006-08-31 Yeatman Timothy J Methods for predicting cancer outcome and gene signatures for use therein
US20100216151A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US7459274B2 (en) 2004-03-02 2008-12-02 Orion Genomics Llc Differential enzymatic fragmentation by whole genome amplification
US20080176209A1 (en) 2004-04-08 2008-07-24 Biomatrica, Inc. Integration of sample storage and sample management for life science
EP1748772A2 (en) 2004-04-09 2007-02-07 University Of South Florida Combination therapies for cancer and proliferative angiopathies
US20070244675A1 (en) 2004-04-22 2007-10-18 Ramot At Tel Aviv University Ltd. Method and Apparatus for Optimizing Multidimensional Systems
WO2005111242A2 (en) 2004-05-10 2005-11-24 Parallele Bioscience, Inc. Digital profiling of polynucleotide populations
SE0401270D0 (sv) 2004-05-18 2004-05-18 Fredrik Dahl Method for amplifying specific nucleic acids in parallel
US7622281B2 (en) 2004-05-20 2009-11-24 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for clonal amplification of nucleic acid
WO2006014869A1 (en) 2004-07-26 2006-02-09 Parallele Bioscience, Inc. Simultaneous analysis of multiple genomes
CA2618939A1 (en) 2004-08-13 2006-04-27 Jaguar Bioscience Inc. Systems and methods for identifying diagnostic indicators
US8024128B2 (en) 2004-09-07 2011-09-20 Gene Security Network, Inc. System and method for improving clinical decisions by aggregating, validating and analysing genetic and phenotypic data
US20060078894A1 (en) 2004-10-12 2006-04-13 Winkler Matthew M Methods and compositions for analyzing nucleic acids
AU2006210553A1 (en) 2005-02-01 2006-08-10 Ab Advanced Genetic Analysis Corporation Reagents, methods and libraries for bead-based sequencing
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7658346B2 (en) 2005-02-25 2010-02-09 Honeywell International Inc. Double ducted hovering air-vehicle
GB0504184D0 (en) 2005-03-01 2005-04-06 Lingvitae As Method
DE602006017534D1 (de) 2005-04-18 2010-11-25 Mitomics Inc Mitochondriale mutationen und umlagerungen als diagnostisches werkzeug zum nachweis von sonneneinstrahlung, prostatakrebs und anderen krebserkrankungen
US7523117B2 (en) 2005-05-04 2009-04-21 West Virginia University Research Corporation Method for data clustering and classification by a graph theory model—network partition into high density subgraphs
US20070009925A1 (en) 2005-05-05 2007-01-11 Applera Corporation Genomic dna sequencing methods and kits
US20060263789A1 (en) 2005-05-19 2006-11-23 Robert Kincaid Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
US7368242B2 (en) 2005-06-14 2008-05-06 Affymetrix, Inc. Method and kits for multiplex hybridization assays
US20060286577A1 (en) 2005-06-17 2006-12-21 Xiyu Jia Methods for detection of methylated DNA
US20060292585A1 (en) 2005-06-24 2006-12-28 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US7838646B2 (en) 2005-08-18 2010-11-23 Quest Diagnostics Investments Incorporated Cystic fibrosis transmembrane conductance regulator gene mutations
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
CA2623405C (en) 2005-09-20 2014-11-25 Immunivest Corporation Methods and composition to generate unique sequence dna probes labeling of dna probes and the use of these probes
JP2009509539A (ja) * 2005-09-30 2009-03-12 パーレジェン サイエンシーズ, インコーポレイテッド 血糖調節の障害のスクリーニングおよび処置のための方法および組成物
EP1943348B1 (en) 2005-10-03 2013-01-02 Life Technologies Corporation Compositions, methods, and kits for amplifying nucleic acids
US20070092883A1 (en) 2005-10-26 2007-04-26 De Luwe Hoek Octrooien B.V. Methylation specific multiplex ligation-dependent probe amplification (MS-MLPA)
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
JP2009516525A (ja) 2005-11-22 2009-04-23 プラント リサーチ インターナショナル ベー. フェー. 複合的核酸検出法
US7329860B2 (en) 2005-11-23 2008-02-12 Illumina, Inc. Confocal imaging methods and apparatus
WO2007062164A2 (en) 2005-11-26 2007-05-31 Gene Security Network Llc System and method for cleaning noisy genetic data and using data to make predictions
WO2007081386A2 (en) 2006-01-11 2007-07-19 Raindance Technologies, Inc. Microfluidic devices and methods of use
WO2007087310A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Nucleic acid analysis using sequence tokens
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
CN101401101B (zh) 2006-03-10 2014-06-04 皇家飞利浦电子股份有限公司 用于通过谱分析鉴定dna模式的方法和系统
ES2546848T3 (es) 2006-03-10 2015-09-29 Epigenomics Ag Un método para identificar una muestra biológica para el análisis de la metilación
US20100168067A1 (en) * 2006-03-21 2010-07-01 Ucl Business Plc Biomarkers for bisphosphonate-responsive bone disorders
US8457900B2 (en) 2006-03-23 2013-06-04 The Regents Of The University Of California Method for identification and sequencing of proteins
EP3373174A1 (en) 2006-03-31 2018-09-12 Illumina, Inc. Systems and devices for sequence by synthesis analysis
KR101087809B1 (ko) 2006-04-10 2011-11-29 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 단일 세포 및 콜로니의 수집을 위한 시스템
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
US7702468B2 (en) 2006-05-03 2010-04-20 Population Diagnostics, Inc. Evaluating genetic disorders
US20080014589A1 (en) 2006-05-11 2008-01-17 Link Darren R Microfluidic devices and methods of use thereof
US8178360B2 (en) 2006-05-18 2012-05-15 Illumina Cambridge Limited Dye compounds and the use of their labelled conjugates
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
WO2008111990A1 (en) 2006-06-14 2008-09-18 Cellpoint Diagnostics, Inc. Rare cell analysis using sample splitting and dna tags
US20100035243A1 (en) 2006-07-10 2010-02-11 Nanosphere, Inc. Ultra-sensitive detection of analytes
US7985716B2 (en) 2006-09-22 2011-07-26 Uchicago Argonne, Llc Nucleic acid sample purification and enrichment with a thermo-affinity microfluidic sub-circuit
US20080085836A1 (en) 2006-09-22 2008-04-10 Kearns William G Method for genetic testing of human embryos for chromosome abnormalities, segregating genetic disorders with or without a known mutation and mitochondrial disorders following in vitro fertilization (IVF), embryo culture and embryo biopsy
US20080081330A1 (en) 2006-09-28 2008-04-03 Helicos Biosciences Corporation Method and devices for analyzing small RNA molecules
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
CA2958994C (en) 2006-11-15 2019-05-07 Biospherex Llc Kit for multiplex sequencing and ecogenomics analysis
KR20090105921A (ko) 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
EP4134667A1 (en) 2006-12-14 2023-02-15 Life Technologies Corporation Apparatus for measuring analytes using fet arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US7855054B2 (en) 2007-01-16 2010-12-21 Somalogic, Inc. Multiplexed analyses of test samples
US7862999B2 (en) 2007-01-17 2011-01-04 Affymetrix, Inc. Multiplex targeted amplification using flap nuclease
CA2676570C (en) 2007-01-26 2016-05-03 Illumina, Inc. Nucleic acid sequencing system and method
EP2118797A2 (en) 2007-02-05 2009-11-18 Applied Biosystems, LLC System and methods for indel identification using short read sequencing
US20080269068A1 (en) 2007-02-06 2008-10-30 President And Fellows Of Harvard College Multiplex decoding of sequence tags in barcodes
KR100896987B1 (ko) 2007-03-14 2009-05-14 한국과학기술연구원 앱타머를 이용한 표적 단백질 검출 방법 및 검출키트
US8533327B2 (en) 2007-04-04 2013-09-10 Zte Corporation System and method of providing services via a peer-to-peer-based next generation network
US7774962B1 (en) 2007-04-27 2010-08-17 David Ladd Removable and reusable tags for identifying bottles, cans, and the like
US20080293589A1 (en) 2007-05-24 2008-11-27 Affymetrix, Inc. Multiplex locus specific amplification
ES2959127T3 (es) 2007-06-19 2024-02-20 Hoffmann La Roche Secuenciación de ácidos nucleicos de alto rendimiento por expansión
US8283116B1 (en) 2007-06-22 2012-10-09 Ptc Therapeutics, Inc. Methods of screening for compounds for treating spinal muscular atrophy using SMN mRNA translation regulation
JP2009009624A (ja) 2007-06-26 2009-01-15 Hitachi Global Storage Technologies Netherlands Bv サーボパターン形成方法および磁気ディスク装置
JP2010534474A (ja) 2007-07-26 2010-11-11 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 分子冗長配列決定
US20120252020A1 (en) 2007-08-17 2012-10-04 Predictive Biosciences, Inc. Screening Assay for Bladder Cancer
WO2009036525A2 (en) 2007-09-21 2009-03-26 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
US20100086914A1 (en) 2008-10-03 2010-04-08 Roche Molecular Systems, Inc. High resolution, high throughput hla genotyping by clonal sequencing
EP2053132A1 (en) 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
US20090119313A1 (en) 2007-11-02 2009-05-07 Ioactive Inc. Determining structure of binary data using alignment algorithms
US8478544B2 (en) 2007-11-21 2013-07-02 Cosmosid Inc. Direct identification and measurement of relative populations of microorganisms with direct DNA sequencing and probabilistic methods
US8463895B2 (en) 2007-11-29 2013-06-11 International Business Machines Corporation System and computer program product to predict edges in a non-cumulative graph
EP2227563B1 (en) 2007-12-05 2012-06-06 Complete Genomics, Inc. Efficient base determination in sequencing reactions
DE102007060291B4 (de) 2007-12-12 2011-04-28 Sartorius Stedim Biotech Gmbh Behälteranordnung mit einem Behälter mit flexibler Wandung
US20090156412A1 (en) 2007-12-17 2009-06-18 Helicos Biosciences Corporation Surface-capture of target nucleic acids
US20090163366A1 (en) 2007-12-24 2009-06-25 Helicos Biosciences Corporation Two-primer sequencing for high-throughput expression analysis
US8003326B2 (en) 2008-01-02 2011-08-23 Children's Medical Center Corporation Method for diagnosing autism spectrum disorder
US20090181389A1 (en) 2008-01-11 2009-07-16 Signosis, Inc., A California Corporation Quantitative measurement of nucleic acid via ligation-based linear amplification
EP3699291A1 (en) 2008-01-17 2020-08-26 Sequenom, Inc. Single molecule nucleic acid sequence analysis processes and compositions
WO2009102901A1 (en) 2008-02-12 2009-08-20 Codexis, Inc. Method of generating an optimized, diverse population of variants
WO2009103068A1 (en) 2008-02-15 2009-08-20 Life Technologies Corporation Methods and compositions for shearing of polymers by sonication
US20090226975A1 (en) 2008-03-10 2009-09-10 Illumina, Inc. Constant cluster seeding
US9074244B2 (en) 2008-03-11 2015-07-07 Affymetrix, Inc. Array-based translocation and rearrangement assays
US8271206B2 (en) 2008-04-21 2012-09-18 Softgenetics Llc DNA sequence assembly methods of short reads
US20090298064A1 (en) 2008-05-29 2009-12-03 Serafim Batzoglou Genomic Sequencing
US8343437B2 (en) 2008-06-04 2013-01-01 Jp Laboratories, Inc. Monitoring system based on etching of metals
EP2332082A1 (en) 2008-07-23 2011-06-15 Translational Genomics Research Institute Method of characterizing sequences from genetic material samples
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
US8645343B2 (en) 2008-08-26 2014-02-04 23Andme, Inc. Processing data from genotyping chips
US20100063742A1 (en) 2008-09-10 2010-03-11 Hart Christopher E Multi-scale short read assembly
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US8921046B2 (en) 2008-09-19 2014-12-30 Pacific Biosciences Of California, Inc. Nucleic acid sequence analysis
US20100076185A1 (en) 2008-09-22 2010-03-25 Nils Adey Selective Processing of Biological Material on a Microarray Substrate
US9127312B2 (en) 2011-02-09 2015-09-08 Bio-Rad Laboratories, Inc. Analysis of nucleic acids
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
WO2010056728A1 (en) 2008-11-11 2010-05-20 Helicos Biosciences Corporation Nucleic acid encoding for multiplex analysis
US8474228B2 (en) 2009-12-08 2013-07-02 Life Technologies Corporation Packaging systems and methods for transporting vials
US8462161B1 (en) 2009-01-20 2013-06-11 Kount Inc. System and method for fast component enumeration in graphs with implicit edges
US9012208B2 (en) 2009-02-03 2015-04-21 Netbio, Inc. Nucleic acid purification
CN103952482A (zh) 2009-04-02 2014-07-30 弗卢伊蒂格姆公司 用于对目标核酸进行条形码化的多引物扩增方法
AU2010245304B2 (en) 2009-04-27 2015-06-04 Pacific Biosciences Of California, Inc. Real-time sequencing methods and systems
EP2511843B1 (en) 2009-04-29 2016-12-21 Complete Genomics, Inc. Method and system for calling variations in a sample polynucleotide sequence with respect to a reference polynucleotide sequence
US20130337447A1 (en) 2009-04-30 2013-12-19 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
JP2012525147A (ja) 2009-04-30 2012-10-22 グッド スタート ジェネティクス, インコーポレイテッド 遺伝マーカーを評価するための方法および組成物
US20120165202A1 (en) 2009-04-30 2012-06-28 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US20110007639A1 (en) 2009-07-10 2011-01-13 Qualcomm Incorporated Methods and apparatus for detecting identifiers
WO2011019964A1 (en) 2009-08-12 2011-02-17 Nugen Technologies, Inc. Methods, compositions, and kits for generating nucleic acid products substantially free of template nucleic acid
EP2475786B1 (en) 2009-09-08 2016-03-30 Laboratory Corporation of America Holdings Compositions and methods for diagnosing autism spectrum disorders
WO2011030838A1 (ja) 2009-09-10 2011-03-17 富士フイルム株式会社 アレイ比較ゲノムハイブリダイゼーション法による核酸変異解析法
US8975019B2 (en) 2009-10-19 2015-03-10 University Of Massachusetts Deducing exon connectivity by RNA-templated DNA ligation/sequencing
WO2011050341A1 (en) 2009-10-22 2011-04-28 National Center For Genome Resources Methods and systems for medical sequencing analysis
US20120245041A1 (en) 2009-11-04 2012-09-27 Sydney Brenner Base-by-base mutation screening
WO2011066476A1 (en) 2009-11-25 2011-06-03 Quantalife, Inc. Methods and compositions for detecting genetic material
GB0921264D0 (en) 2009-12-03 2010-01-20 Olink Genomics Ab Method for amplification of target nucleic acid
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
US20120270739A1 (en) 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
US20110257889A1 (en) 2010-02-24 2011-10-20 Pacific Biosciences Of California, Inc. Sequence assembly and consensus sequence determination
EP2550370B1 (en) 2010-03-22 2015-12-30 Esoterix Genetic Laboratories, LLC Mutations associated with cystic fibrosis
WO2011119115A1 (en) 2010-03-25 2011-09-29 Agency For Science, Technology And Research Method of producing recombinant proteins with mannose- terminated n-glycans
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
US20140206552A1 (en) 2010-05-18 2014-07-24 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
ES2960184T3 (es) 2010-06-09 2024-03-01 Keygene Nv Códigos de barras de secuencias combinatorias para el cribado de alto rendimiento
EP2582847B1 (en) 2010-06-18 2016-10-26 Myriad Genetics, Inc. Methods and materials for assessing loss of heterozygosity
US20120046877A1 (en) 2010-07-06 2012-02-23 Life Technologies Corporation Systems and methods to detect copy number variation
CN103180459B (zh) 2010-07-09 2016-10-19 赛尔冉迪思股份有限公司 3-d目的基因组区域的测序策略
WO2012018387A2 (en) 2010-08-02 2012-02-09 Population Diagnotics, Inc. Compositions and methods for discovery of causative mutations in genetic disorders
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
WO2012034030A1 (en) 2010-09-09 2012-03-15 Omicia, Inc. Variant annotation, analysis and selection tool
EP3572528A1 (en) 2010-09-24 2019-11-27 The Board of Trustees of the Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
US8715933B2 (en) 2010-09-27 2014-05-06 Nabsys, Inc. Assay methods using nicking endonucleases
US8430053B2 (en) 2010-09-30 2013-04-30 Temptime Corporation Color-changing emulsions for freeze indicators
US20120197533A1 (en) 2010-10-11 2012-08-02 Complete Genomics, Inc. Identifying rearrangements in a sequenced genome
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
US8782566B2 (en) 2011-02-22 2014-07-15 Cisco Technology, Inc. Using gestures to schedule and manage meetings
WO2012122546A2 (en) 2011-03-09 2012-09-13 Lawrence Ganeshalingam Biological data networks and methods therefor
US20120252686A1 (en) 2011-03-31 2012-10-04 Good Start Genetics Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
US8680066B2 (en) 2011-04-05 2014-03-25 The United States of America as represented by the Development of Veterans Affairs Methods for determining and inhibiting rheumatoid arthritis associated with the BRAF oncogene in a subject
WO2012149171A1 (en) 2011-04-27 2012-11-01 The Regents Of The University Of California Designing padlock probes for targeted genomic sequencing
EP2716766B1 (en) 2011-05-31 2016-09-28 Berry Genomics Co., Ltd. A device for detecting copy number of fetal chromosomes or tumor cell chromosomes
PL2718466T3 (pl) 2011-06-07 2019-01-31 Icahn School Of Medicine At Mount Sinai Materiały i sposób identyfikacji nosicieli rdzeniowego zaniku mięśni
US9733221B2 (en) 2011-06-09 2017-08-15 Agilent Technologies, Inc. Injection needle cartridge with integrated sealing force generator
US20130178378A1 (en) 2011-06-09 2013-07-11 Andrew C. Hatch Multiplex digital pcr
US8496166B2 (en) 2011-08-23 2013-07-30 Eagile Inc. System for associating RFID tag with UPC code, and validating associative encoding of same
CN103764841B (zh) 2011-09-21 2016-06-29 深圳华大基因股份有限公司 确定单细胞染色体非整倍性的方法和系统
US9228233B2 (en) 2011-10-17 2016-01-05 Good Start Genetics, Inc. Analysis methods
RU2659423C2 (ru) 2012-02-16 2018-07-02 ЭйТИР ФАРМА, ИНК. ГИСТИДИЛ-тРНК-СИНТЕТАЗЫ ДЛЯ ЛЕЧЕНИЯ АУТОИММУННЫХ И ВОСПАЛИТЕЛЬНЫХ ЗАБОЛЕВАНИЙ
AU2013200876A1 (en) 2012-02-24 2013-09-12 Callum David Mcdonald Method of graph processing
EP4239081A3 (en) 2012-03-26 2023-11-08 The Johns Hopkins University Rapid aneuploidy detection
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US8812422B2 (en) 2012-04-09 2014-08-19 Good Start Genetics, Inc. Variant database
US10227635B2 (en) 2012-04-16 2019-03-12 Molecular Loop Biosolutions, Llc Capture reactions
EP4276194A3 (en) 2012-05-21 2024-03-06 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9193992B2 (en) 2012-06-05 2015-11-24 Agilent Technologies, Inc. Method for determining ploidy of a cell
CN104619894B (zh) 2012-06-18 2017-06-06 纽亘技术公司 用于非期望核酸序列的阴性选择的组合物和方法
WO2014036167A1 (en) 2012-08-28 2014-03-06 The Broad Institute, Inc. Detecting variants in sequencing data and benchmarking
WO2014052909A2 (en) 2012-09-27 2014-04-03 The Children's Mercy Hospital System for genome analysis and genetic disease diagnosis
US20150258170A1 (en) 2012-10-10 2015-09-17 The Trustees Of Columbia University In The City Of New York Diagnosis and Treatment of SMA and SMN Deficiency
WO2014074246A1 (en) 2012-11-07 2014-05-15 Good Start Genetics, Inc. Validation of genetic tests
US20140222349A1 (en) 2013-01-16 2014-08-07 Assurerx Health, Inc. System and Methods for Pharmacogenomic Classification
WO2014116881A1 (en) 2013-01-23 2014-07-31 Reproductive Genetics And Technology Solutions, Llc Compositions and methods for genetic analysis of embryos
AU2014248511B2 (en) 2013-03-12 2018-05-10 Myriad Women’s Health, Inc. Systems and methods for prenatal genetic analysis
US20160034638A1 (en) 2013-03-14 2016-02-04 University Of Rochester System and Method for Detecting Population Variation from Nucleic Acid Sequencing Data
WO2014152421A1 (en) 2013-03-14 2014-09-25 Good Start Genetics, Inc. Methods for analyzing nucleic acids
EP3005200A2 (en) 2013-06-03 2016-04-13 Good Start Genetics, Inc. Methods and systems for storing sequence read data
US9579656B2 (en) 2013-06-11 2017-02-28 J. G. Finneran Associates, Inc. Rotation-limiting well plate assembly
US9116866B2 (en) 2013-08-21 2015-08-25 Seven Bridges Genomics Inc. Methods and systems for detecting sequence variants
WO2015058086A1 (en) 2013-10-18 2015-04-23 Good Start Genetics, Inc. Methods for copy number determination
WO2015057565A1 (en) 2013-10-18 2015-04-23 Good Start Genetics, Inc. Methods for assessing a genomic region of a subject
EP3102722B1 (en) 2014-02-04 2020-08-26 Jumpcode Genomics, Inc. Genome fractioning
WO2016040446A1 (en) 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
CA3010579A1 (en) 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
US10061953B2 (en) 2015-01-15 2018-08-28 Good Start Genetics, Inc. Devices and systems for barcoding individual wells and vessels
EP3608420B1 (en) 2015-07-29 2021-05-19 Progenity, Inc. Nucleic acids and methods for detecting chromosomal abnormalities

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007525963A (ja) * 2003-06-20 2007-09-13 イルミナ インコーポレイテッド 全ゲノム増幅および遺伝型決定のための方法および組成物
US20090099041A1 (en) * 2006-02-07 2009-04-16 President And Fellows Of Harvard College Methods for making nucleotide probes for sequencing and synthesis

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
BAU ET AL, ANAL BIOANAL CHEM, vol. 393, JPN6014025531, 2009, pages 171 - 175, ISSN: 0002836104 *
DENG ET AL, NATURE BIOTECHNOLOGY, vol. 27, no. 4, JPN6014025528, 29 March 2009 (2009-03-29), pages 353 - 360, ISSN: 0002836099 *
HARDENBOL ET AL: "MULTIPLEXED GENOTYPING WITH SEQUENCE-TAGGED MOLECULAR INVERSION PROBES", NATURE BIOTECHNOLOGY, vol. 21, no. 6, JPN5012012439, 2003, pages 673 - 678, XP002292164, ISSN: 0002836100, DOI: 10.1038/nbt821 *
KRISHNAKUMAR ET AL, PNAS, vol. 105, no. 27, JPN6014025529, 8 July 2008 (2008-07-08), pages 9296 - 9301, ISSN: 0002836103 *
MOCKLER ET AL: "APPLICATIONS OF DNA TILING ARRAYS FOR WHOLE-GENOME ANALYSIS", GENOMICS, vol. 85, JPN5012012440, 2005, pages 1 - 15, XP004682840, ISSN: 0002836101, DOI: 10.1016/j.ygeno.2004.10.005 *
PORRECA ET AL, NATURE METHODS, vol. 4, no. 11, JPN6014025532, November 2007 (2007-11-01), pages 931 - 936, ISSN: 0002836105 *
TURNER ET AL, NATURE METHODS, vol. 6, no. 5, JPN6014025535, May 2009 (2009-05-01), pages 315 - 316, ISSN: 0002836102 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016516410A (ja) * 2013-03-15 2016-06-09 アーノルド, ライル, ジェイ.ARNOLD, Lyle, J. クランプオリゴヌクレオチドを利用する核酸増幅方法
JP2019176859A (ja) * 2013-03-15 2019-10-17 アーノルド, ライル, ジェイ.ARNOLD, Lyle, J. クランプオリゴヌクレオチドを利用する核酸増幅方法
JP2016525363A (ja) * 2013-08-02 2016-08-25 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 特別なキャプチャープローブ(heatseq)を使用したシークエンスキャプチャー法
US11030276B2 (en) 2013-12-16 2021-06-08 10X Genomics, Inc. Methods and apparatus for sorting data
US11853389B2 (en) 2013-12-16 2023-12-26 10X Genomics, Inc. Methods and apparatus for sorting data
JP2017526046A (ja) * 2014-06-26 2017-09-07 10エックス ゲノミクス,インコーポレイテッド 核酸配列アセンブルのプロセス及びシステム
US10854315B2 (en) 2015-02-09 2020-12-01 10X Genomics, Inc. Systems and methods for determining structural variation and phasing using variant call data
JP2018524993A (ja) * 2015-07-29 2018-09-06 プロジェニティ, インコーポレイテッド 染色体異常を検出するための核酸及び方法
US11081208B2 (en) 2016-02-11 2021-08-03 10X Genomics, Inc. Systems, methods, and media for de novo assembly of whole genome sequence data

Also Published As

Publication number Publication date
WO2010126614A3 (en) 2011-03-17
WO2010126614A2 (en) 2010-11-04
CA2760439A1 (en) 2010-11-04
US11840730B1 (en) 2023-12-12
AU2010242073C1 (en) 2015-12-24
AU2010242073B2 (en) 2015-09-03
AU2010242073A1 (en) 2011-11-24
EP2425240A2 (en) 2012-03-07
IL216054A (en) 2016-03-31
EP2425240A4 (en) 2012-12-12
JP2016000046A (ja) 2016-01-07
IL216054A0 (en) 2012-01-31

Similar Documents

Publication Publication Date Title
US11840730B1 (en) Methods and compositions for evaluating genetic markers
JP6878631B2 (ja) 非侵襲的に胎児の性染色体異数性のリスクを計算する方法
US20120165202A1 (en) Methods and compositions for evaluating genetic markers
KR102210852B1 (ko) 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
US9624490B2 (en) Multiplexed sequential ligation-based detection of genetic variants
AU2018214075A1 (en) Systems and methods for prenatal genetic analysis
US20140051585A1 (en) Methods and compositions for reducing genetic library contamination
US20200123538A1 (en) Compositions and methods for library construction and sequence analysis
US20130337447A1 (en) Methods and compositions for evaluating genetic markers
AU2019283856B2 (en) Non-invasive fetal sex determination
WO2017193044A1 (en) Noninvasive prenatal diagnostic
WO2014028778A1 (en) Methods and compositions for reducing genetic library contamination
CA2907177A1 (en) Methods and compositions for evaluating genetic markers

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130207

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140618

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140917

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140925

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141017

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141024

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141117

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20141217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150824