JP2022553164A - 3’オーバーハングを修復する方法 - Google Patents

3’オーバーハングを修復する方法 Download PDF

Info

Publication number
JP2022553164A
JP2022553164A JP2022521657A JP2022521657A JP2022553164A JP 2022553164 A JP2022553164 A JP 2022553164A JP 2022521657 A JP2022521657 A JP 2022521657A JP 2022521657 A JP2022521657 A JP 2022521657A JP 2022553164 A JP2022553164 A JP 2022553164A
Authority
JP
Japan
Prior art keywords
dna fragment
fragment
dna
repaired
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022521657A
Other languages
English (en)
Other versions
JPWO2021081423A5 (ja
Inventor
エリーン シャム,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Publication of JP2022553164A publication Critical patent/JP2022553164A/ja
Publication of JPWO2021081423A5 publication Critical patent/JPWO2021081423A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

部分的に二本鎖のDNA断片を修復する方法を提供する。いくつかの実施形態では、この方法は、(a)前記部分的に二本鎖のDNA断片をプライマー集団の1または複数のプライマーと接触させる工程であって、ここで、前記部分的に二本鎖のDNA断片が3’オーバーハングを含み、前記プライマー集団がランダム標的ハイブリッド形成配列を含む、工程;(b)DNAポリメラーゼを使用して前記DNA断片に沿って前記プライマー集団の1または複数のプライマーを伸長させる工程であって、それにより、前記DNA断片にアニーリングした1または複数の伸長したプライマーが産生される、工程;および(c)1または複数の伸長したプライマーの3’末端を、伸長したプライマーまたは部分的に二本鎖のDNA断片の鎖の5’末端にライゲートする工程であって、それにより、修復されたDNA断片が得られる、工程を含む。

Description

関連出願の引用
本出願は、2019年10月25日出願の米国仮特許出願第62/926,093号(その全体が全ての目的のために本明細書中で参考として援用される)に基づく優先権の利益を主張する。
配列表
本出願は、配列表を含んでおり、この配列表は、ASCII形式で電子的に提出され、その全体が本明細書中で参考として援用される。前記ASCIIコピーは、2020年10月21日に作成され、ファイル名は2020-10-23_GH0054WO_Sequence_Listing_ST25.txtであり、サイズは970バイトである。
緒言と要旨
ある特定のDNA分子型で生じるオーバーハングの修復は、配列決定および/または増幅などのさらなる分析用の分子の調製における重要な工程である。例えば、分子の3’末端付近のいくつかのヌクレオチドが一本鎖である3’オーバーハングは、剪断されたDNAおよび無細胞DNA(血液試料から得る)で生じ得る。タグ、バーコード、またはアダプターのライゲーションなどのその後の工程と適合させるために、3’オーバーハングを平滑末端または一塩基オーバーハングに変換することが望ましい場合がある。
既存のオーバーハングの修復方法は、3’オーバーハングを切除するために3’→5’エキソヌクレアーゼを使用する。ヌクレオチドが除去され、元の分子の末端の位置を決定することができないという点で、このアプローチは情報を喪失する。したがって、エキソヌクレオリシスによって3’オーバーハングを修復すると、例えば、5’末端と3’末端との間の塩基の配列ならびにヌクレオソームの位置付けに関する情報を得ることができない。したがって、改良された3’オーバーハングの修復方法が必要である。本開示は、このニーズを満たすか、他の利益を提供するか、少なくとも有用な選択肢を公的に提供することを目的とする。
したがって、以下の実施形態を提供する。実施形態1は、部分的に二本鎖のDNA断片を修復する方法であって、
(a)前記部分的に二本鎖のDNA断片をプライマー集団の1または複数のプライマーと接触させる工程であって、ここで、前記部分的に二本鎖のDNA断片が3’オーバーハングを含み、前記プライマー集団がランダム標的ハイブリッド形成配列を含む、工程;
(b)DNAポリメラーゼを使用して前記DNA断片に沿って前記プライマー集団の1または複数のプライマーを伸長させる工程であって、それにより、前記DNA断片にアニーリングした1または複数の伸長したプライマーが産生される、工程;および
(c)1または複数の伸長したプライマーの3’末端を、伸長したプライマーまたは部分的に二本鎖のDNA断片の鎖の5’末端にライゲートする工程であって、それにより、修復されたDNA断片が得られる、工程
を含む、方法である。
実施形態2は、先行する実施形態のいずれか1つに記載の方法であり、前記DNAポリメラーゼは3’→5’エキソヌクレアーゼ活性を欠く。
実施形態3は、先行する実施形態のいずれか1つに記載の方法であり、前記DNAポリメラーゼは5’→3’エキソヌクレアーゼ活性を欠く。
実施形態4は、先行する実施形態のいずれか1つに記載の方法であり、前記DNAポリメラーゼは鎖置換活性を欠く。
実施形態5は、先行する実施形態のいずれか1つに記載の方法であり、前記DNAポリメラーゼはクレノウ断片である。
実施形態6は、直前の実施形態に記載の方法であり、前記DNAポリメラーゼはエキソ-クレノウ断片である。
実施形態7は、先行する実施形態のいずれか1つに記載の方法であり、前記部分的に二本鎖のDNA断片は、各末端に3’オーバーハングを有する。
実施形態8は、先行する実施形態のいずれか1つに記載の方法であり、前記部分的に二本鎖のDNA断片は、3’オーバーハングおよび(i)平滑末端または(ii)5’オーバーハングを有する。
実施形態9は、直前の実施形態に記載の方法であり、前記5’オーバーハングは、前記5’オーバーハングに沿って前記3’末端を伸長させることによって修復される。
実施形態10は、先行する実施形態のいずれか1つに記載の方法であり、前記部分的に二本鎖のDNA断片は、体液試料に由来する。
実施形態11は、直前の実施形態に記載の方法であり、前記体液は、全血、血清、血漿、または尿である。
実施形態12は、先行する実施形態のいずれか1つに記載の方法であり、前記部分的に二本鎖のDNA断片はcfDNA断片である。
実施形態13は、先行する実施形態のいずれか1つに記載の方法であり、前記部分的に二本鎖のDNA断片は哺乳動物由来である。
実施形態14は、先行する実施形態のいずれか1つに記載の方法であり、前記部分的に二本鎖のDNA断片はヒト由来である。
実施形態15は、先行する実施形態のいずれか1つに記載の方法であり、前記部分的に二本鎖のDNA断片は、組成物中のDNA断片集団の一部である。
実施形態16は、直前の実施形態に記載の方法であり、前記DNA断片集団は剪断されたDNAを含む。
実施形態17は、実施形態15または16に記載の方法であり、前記DNA断片集団は、後成的に改変されたDNAを含む。
実施形態18は、実施形態15~17のいずれか1つに記載の方法であり、前記DNA断片集団は、複数のゲノム遺伝子座由来の断片を含む。
実施形態19は、実施形態15~18のいずれか1つに記載の方法であり、前記DNA断片集団は富化されていない。
実施形態20は、実施形態15~19のいずれか1つに記載の方法であり、前記DNA断片集団は増幅されていない。
実施形態21は、先行する実施形態のいずれか1つに記載の方法であり、前記ランダム標的ハイブリッド形成配列の長さは、少なくとも4、5、6、7、8、9、または10ヌクレオチドである。
実施形態22は、先行する実施形態のいずれか1つに記載の方法であり、前記ランダム標的ハイブリッド形成配列の長さは、約4、5、6、7、8、9、10、11、または12ヌクレオチドである。
実施形態23は、先行する実施形態のいずれか1つに記載の方法であり、前記プライマー集団のプライマーが一本鎖である。
実施形態24は、実施形態1~20のいずれか1つに記載の方法であり、前記プライマー集団のプライマーは3’オーバーハングを有する二本鎖であり、前記ランダム標的ハイブリッド形成配列は前記3’オーバーハング中に存在する。
実施形態25は、実施形態1~20のいずれか1つに記載の方法であり、前記プライマー集団のプライマーは3’オーバーハングを有するヘアピンであり、前記ランダム標的ハイブリッド形成配列は3’オーバーハング中に存在する。
実施形態26は、実施形態21~22のいずれか1つに記載の方法であり、前記プライマーのヘアピンまたは二本鎖領域はアダプターを含む。
実施形態27は、実施形態21~23のいずれか1つに記載の方法であり、前記プライマーのヘアピンまたは二本鎖領域はタグを含む。
実施形態28は、実施形態24に記載の方法であり、前記タグはバーコードを含む。
実施形態29は、実施形態25に記載の方法であり、前記プライマー集団は、複数の異なるバーコードを含む。
実施形態30は、先行する実施形態のいずれか1つに記載の方法であり、少なくとも工程(a)~(c)を単一の管内で行う。
実施形態31は、先行する実施形態のいずれか1つに記載の方法であり、前記二本鎖DNA断片は組成物中に存在し、少なくとも工程(a)~(c)について、構成要素は組成物から除去されない。
実施形態32は、先行する実施形態のいずれか1つに記載の方法であり、前記修復されたDNA断片が1つまたは2つの平滑末端を含むか、前記方法が、前記修復されたDNA断片の1つまたは2つの末端を平滑末端化する工程をさらに含む。
実施形態33は、直前の実施形態に記載の方法であり、前記平滑末端化された核酸の3’末端にヌクレオチドを非テンプレート指向性に付加するポリメラーゼを使用して、修復されたDNA断片を末端テーリングする工程をさらに含み、必要に応じて、AがGより優先され、GがCまたはTより優先されて付加される。
実施形態34は、先行する実施形態のいずれか1つに記載の方法であり、前記修復されたDNA断片に(必要に応じて両端に)タグをライゲートする工程をさらに含み、必要に応じて、前記タグはバーコードおよび/またはアダプターを含む。
実施形態35は、先行する実施形態のいずれか1つに記載の方法であり、前記修復されたDNA断片を精製する工程をさらに含む。
実施形態36は、先行する実施形態のいずれか1つに記載の方法であり、工程(b)および/または(c)後に工程(b)および/または(c)で使用した1または複数の酵素を変性させる工程をさらに含む。
実施形態37は、先行する実施形態のいずれか1つに記載の方法であり、前記修復されたDNA断片を増幅する工程をさらに含む。
実施形態38は、直前の実施形態に記載の方法であり、前記修復されたDNA断片は1または複数のアダプター(例えば、2つのアダプター)を含み、前記修復されたDNA断片の増幅に前記1または複数のアタプターにアニーリングする1または複数の(例えば、2つの)増幅オリゴマーを使用する。
実施形態39は、先行する実施形態のいずれか1つに記載の方法であり、前記修復されたDNA断片のうちの目的の断片を富化する工程であって、それにより富化されたDNA断片が得られる、工程をさらに含み、必要に応じて、前記富化する工程を増幅工程後に行う。
実施形態40は、直前の実施形態に記載の方法であり、前記目的の断片は、疾患または障害に関連する様式によって変動する遺伝子座を含み、必要に応じて、前記疾患または障害は癌である。
実施形態41は、直前の実施形態に記載の方法であり、前記変動は、一ヌクレオチド変動、コピー数変動、遺伝子融合、またはインデルのうちの1つまたは複数である。
実施形態42は、直前の実施形態に記載の方法であり、前記目的の断片は、疾患または障害に関連する一ヌクレオチド変動;疾患または障害に関連するコピー数の変動;疾患または障害に関連する遺伝子融合;または疾患または障害に関連するインデルを示すフラグメントのうちの1つ、2つ,3つ,または4つを含み、必要に応じて、前記疾患または障害は癌である。
実施形態43は、実施形態36~39のいずれか1つに記載の方法であり、前記富化されたDNA断片を増幅する工程をさらに含む。
実施形態44は、先行する実施形態のいずれか1つに記載の方法であり、前記修復されたDNA断片を配列決定する工程をさらに含む。
実施形態45は、直前の実施形態に記載の方法であり、前記配列決定する工程は、部分的に二本鎖のDNA断片中に3’オーバーハングを形成したヌクレオチドを配列決定する。
実施形態46は、実施形態41または42に記載の方法であり、前記配列決定する工程はハイスループット配列決定である。
実施形態47は、実施形態44~46のいずれか1つに記載の方法であり、複数の修復されたDNA断片が生成され、前記修復されたDNA断片の少なくとも一部がタグを含み、前記配列決定が複数の修復されたDNA断片から複数の配列リードを生成する。
実施形態48は、実施形態47に記載の方法であり、前記配列リードが、前記部分的に二本鎖のDNA断片中に3’オーバーハングを形成したヌクレオチドの配列およびタグの配列を含む。
本発明の各態様およびあらゆる態様のいくつかの実施形態では、本明細書中に開示のシステムおよび/または方法の結果を、報告書を作成するための材料として使用する。報告書は、紙面または電子形式であり得る。例えば、本明細書中に開示の方法またはシステムによって判定された癌の存在または非存在に関する情報を、かかる報告書に示すことができる。あるいはまたはさらに、報告書は、試料中の核酸塩基の同定に関するか、同定に由来する情報を含み得る。本明細書中に開示の方法またはシステムは、試料を提供した被験体または医療関係者などの第三者に報告書を伝える工程をさらに含み得る。
本明細書中に開示の方法の種々の工程、または本明細書中に開示のシステムによって実施される工程は、同時もしくは異なる時間に、ならびに/または同一の地理的な位置もしくは異なる地理的な位置(例えば、国)で行われ得る。本明細書中に開示の方法の種々の工程を、同一の人物または異なる人物が行うことができる。
図1は、5’オーバーハング、3’オーバーハング、および既存の末端修復方法を示す。
図2は、3’ランダム配列および5’二本鎖配列(例えば、バーコード、アダプター、またはタグを含む)を含むプライマーを部分的に二本鎖のDNA断片にアニーリングする本開示に従った3’オーバーハング修復の実施形態を示す。伸長(例えば、クレノウエキソ-を使用)およびライゲーションにより、3’オーバーハング配列が保持されている修復された分子が得られる。
図3は、ランダム配列を有するプライマーを部分的に二本鎖のDNA断片にアニーリングする本開示に従った3’オーバーハング修復の実施形態を示す。伸長(例えば、クレノウエキソ-を使用)およびライゲーションにより、3’オーバーハング配列が保持されている修復された分子が得られる。
ある特定の実施形態の詳細な説明
本明細書中で使用した節の見出しは、体系化することのみを目的とし、記載の発明の対象を制限すると解釈されないものとする。
特許出願、特許公開、およびGenbank受入番号を含む本明細書中の全ての引用文献は、各々の文献の全体が参考として援用されることを具体的かつ個別に示されているかのように、本明細書中で参考として援用される。
定義
別段の定義がない限り、本開示に関連して使用される科学用語および技術用語は、当業者が一般的に理解している意味を有するものとする。さらに、文脈上別段の必要性が無く、明確に示されていない限り、単数形の用語は複数形を含み、複数形の用語は単数形を含むものとする。種々の出典または文献の定義の間に任意の矛盾がある場合、本明細書中に提供した定義を優先するものとする。
本教示を詳細に記載する前に、本開示が具体的な組成物またはプロセスの工程に制限されず、そのようなものとして変動し得ると理解すべきである。本明細書中および添付の特許請求の範囲中で使用される場合、文脈上明確にそうでない旨を表さない限り、単数形「a」、「an」、および「the」には複数形が含まれることに留意すべきである。したがって、例えば、「オリゴマー」との言及には、複数のオリゴマーなどが含まれる。本出願では、明確に述べれられていないか、当業者によって理解されない限り、「または」の使用は「および/または」を意味する。複数の従属クレームの文脈において、「または」を使用する場合、1つを超える先行する独立クレームまたは従属クレームに戻って参照することを意味する。
本開示で考察された温度、濃度、時間などの前の「約」は、わずかな逸脱が本明細書中の教示の範囲内にあることを意味すると認識されるであろう。一般に、用語「約」は、組成物の活性または安定性にいかなる有意な影響も及ぼさない組成物の構成要素の量のわずかな変動を示す。また、「comprise」、「comprises」、「comprising」、「contain」、「contains」、「containing」、「include」、「includes」、および「including」の使用は、制限を意図しない。前記一般的な説明および詳細な説明は共に例示および説明のみを目的とし、本教示を制限しないと理解すべきである。参考として援用される任意の資料が本開示に表示の内容と矛盾する限りにおいて、表示の内容を優先する。
具体的記載がない限り、種々の構成要素「を含む」と述べている本明細書中の実施形態は、列挙された構成要素「からなる」または「から本質的になる」ことも意図する;種々の構成要素「からなる」と述べている本明細書中の実施形態は、列挙された構成要素「を含む」または「から本質的になる」ことも意図する;種々の構成要素「から本質的になる」と述べている本明細書中の実施形態は、列挙した構成要素「からなる」または「を含む」ことも意図する(この互換性は、特許請求の範囲内のこれらの用語の使用には適用されない)。
被験体は、哺乳動物種(好ましくは、ヒト)または鳥類(例えば、トリ)などの動物、または他の生物(植物など)を指す。より具体的には、被験体は、脊椎動物、例えば、マウス、霊長類、サル、またはヒトなどの哺乳動物であり得る。動物には、家畜、競技用動物、および愛玩動物が含まれる。被験体は、健康な個体、疾患もしくは疾患の素因を有するか有する疑いのある個体、または治療を必要とするか、治療を必要とする疑いのある個体であり得る。
遺伝的バリアントは、被験体の核酸試料またはゲノム中の変化、バリアント、または多型を指す。かかる変化、バリアント、または多型は、参照ゲノムに対するものであり得、参照ゲノムは、被験体または他の個体の参照ゲノムでってよい。変動には、1または複数の一ヌクレオチド変動(SNV)、挿入、欠失、反復、小さな挿入、小さな欠失、小さな反復、構造バリアントジャンクション、可変長縦列反復、および/または隣接配列が含まれ、コピー数バリアント(CNV)、トランスバージョン、および他の再構成も遺伝的変動の形態である。変動は、塩基の変化、挿入、欠失、反復、コピー数変動、塩基転換、またはその組み合わせであり得る。
癌マーカーは、癌の存在または発症リスクに関連する遺伝的バリアントである。癌マーカーは、被験体が癌を有するか、年齢および性別が適合した同種の被験体よりも癌の発症リスクが高いことを示すことができる。癌マーカーは、癌の原因であってもなくてもよい。
核酸タグは、通常は人工的な配列で、通常はDNAである短い核酸(例えば、100、50、または10ヌクレオチド長未満)であり、(i)異なる試料に由来するか(例えば、試料の指標を示す)、(ii)異なる型であるか、(iii)異なるプロセシングを受けた核酸を識別するために修復されたDNA断片を標識するために使用される。タグは、一本鎖または二本鎖であり得る。核酸タグを解読して、起源となる試料、核酸の形態またはプロセシングなどの情報を明らかにすることができる。タグを使用して異なるタグを保有する複数の核酸をプールして並行処理し、その後に核酸をタグの読み取りによって解析することができる。タグを、分子識別子またはバーコードとも呼ぶことができる。
アダプターは、修復されたDNA断片分子の末端のいずれかまたは両方に連結するための短い核酸(例えば、500、100、または50ヌクレオチド長未満であり、典型的にはDNAである)である。アダプターは、必ずしもそうではないが、ライゲーションのために二本鎖の形態で提供され得る。また、アダプターを、プライマー(例えば、一本鎖、ヘアピン、または二本鎖であり得る)中の5’エレメント(ランダム化した標的ハイブリッド形成配列を有するプライマー集団のメンバーなど)として提供することができる。アダプターは、両端がアダプターに隣接する修復されたDNA断片分子を増幅させるためのプライマー結合部位、および/または配列決定プライマー結合部位(次世代配列決定手技のためのプライマー結合部位が含まれる)を含むことができる。また、アダプターは、捕捉プローブ(フローセル支持体に付着したオリゴヌクレオチドなど)のための結合部位を含むことができる。また、アダプターは、本明細書中に記載のタグを含むことができる。タグがアンプリコンおよび修復されたDNA断片の配列決定リード中に含まれるように、タグはプライマーおよび配列決定プライマー部位に対して配置され得る。同一および異なるアダプターを、同一分子の各末端に連結することができる。時折、タグが異なることを除いて同一のアダプターがそれぞれの末端に連結される。アダプター型の例は、平滑末端化されてもいるか、相補ヌクレオチドを用いてテーリングされてもいる核酸(例えば、修復されたDNA断片)への連結のために、一方の末端が本明細書中に記載のように平滑末端化されているかテーリングされているY型アダプターである。アダプター型の別の例は、同様に分析されるべき核酸への連結のために平滑末端化またはテーリングされた末端を有するボール型アダプターである。
「部分的に二本鎖のDNA断片」は、一部が二本鎖であり、かつ一部が一本鎖である線状DNAを指す。
「3’オーバーハング」は、相補ヌクレオチドにアニーリングしない部分的に二本鎖のDNA断片の3’末端の1または複数の連続するヌクレオチドを指す。
交換可能な用語「オリゴマー」、「オリゴ」、および「オリゴヌクレオチド」は、一般に1,000ヌクレオチド(nt)残基未満の核酸(下限約5nt残基かつ上限約500~900nt残基の範囲のポリマーが含まれる)を指す。いくつかの実施形態では、オリゴヌクレオチドのサイズは、下限約12~15ntかつ上限約50~600ntの範囲であり、他の実施形態は、下限約15~20ntかつ上限約22~100ntの範囲である。オリゴヌクレオチドは、天然に存在する供給源から精製され得るか、種々の周知の酵素的方法および化学的方法のうちのいずれかを使用して合成され得る。オリゴヌクレオチドという用語は、いかなる試薬に対する特定の機能も表さず;むしろ、本明細書中に記載の全てのかかる試薬を対象とするために一般的に使用される。オリゴヌクレオチドは、種々の異なる機能を果たし得る。例えば、相補鎖とハイブリッド形成することができ、かつ核酸ポリメラーゼの存在下でさらに伸長することができる場合にはプライマーとして機能し得る;標的核酸またはそのアンプリコンとハイブリッド形成することができ、かつ検出可能な部分(例えば、フルオロフォア)をさらに提供することができる場合には標的核酸を検出するように機能し得る。
「プライマー」は、ポリメラーゼによって伸長することができる3’末端を含むオリゴヌクレオチドである。
「ランダム標的ハイブリッド形成配列を含む」プライマー集団は、標的ハイブリッド形成配列が定常配列よりも変動し得る複数のプライマーである。例えば、ランダム標的ハイブリッド形成配列は、本明細書中の他所で詳細に考察するように、集団間で変動する少なくとも4つの位置を含み得る。
「DNAポリメラーゼ」は、テンプレートに相補的なプライマーの3’末端にヌクレオチドを付加することによってテンプレートにアニーリングしたプライマーを伸長することができる酵素である(当該分野で公知のように、ポリメラーゼは一般にある程度のエラーを有すると理解されている)。
「3’→5’エキソヌクレアーゼ活性」は、核酸の3’末端からヌクレオチドを除去する酵素活性を指す。
「5’→3’エキソヌクレアーゼ活性」は、核酸の5’末端からヌクレオチドを除去する酵素活性を指す。
酵素活性についての標準的なアッセイにおいて酵素活性を検出することができない場合、酵素またはポリペプチドは、酵素活性を「欠く」。例えば、エキソヌクレアーゼ活性を、場合によって3’末端または5’末端のヌクレオチドが標識された好適な核酸基質を準備し、酵素が標識を検出可能に除去するかどうかを判定することによってアッセイすることができる。「エキソ-」という表示は、本明細書中で、エキソヌクレアーゼ活性を欠くポリメラーゼを省略するために使用される。
「タグ」は、例えば、プライマーの5’エレメントの組み込みを介するか、ライゲーションを介して核酸分子に付加された任意の配列を指す。タグは、種々の機能(その後の反応においてプライマーの結合部位としての機能を果たすこと、または試料もしくは分子のプロセシングについての情報を提供するか、分子(独立しているか、分子の内因性配列との組み合わせ)およびその複製産物もしくは増幅産物を同定するバーコードもしくはインデックスとしての機能を果たすことが含まれる)を有し得る。
「無細胞DNA」(「cfDNA」)は、被験体からのDNAの単離時に細胞内に含まれないDNAを指す。
「精製」は、組成物の少なくとも1つの他の構成要素(例えば、プライマー、酵素、塩、およびヌクレオチドなど)からの目的の分析物(修復されたDNA分子など)の分離を指す。「精製」は、分離によって出発組成物中の他の構成要素(単数または複数)と比較して高い濃度比で目的の分析物を含む組成物が得られる任意の手技を含む。
「後成的に改変された」DNAは、in vivoで起源となるそのヌクレオチドの1または複数の改変を含む。シトシンの5-メチル化および5-ヒドロキシメチル化は、後成的に改変されたDNAの例である。
詳細な説明
1.概要
核酸試料は、しばしば、ハイスループット配列決定または次世代配列決定などの配列決定のための核酸試料を調製するためにプロセシングを必要とする一本鎖オーバーハングを有する部分的に二本鎖の核酸断片を含む。5’オーバーハングを簡潔な伸長反応(図1を参照のこと)で修復することができ、この反応は、配列情報を喪失することは無いが、従来の3’オーバーハングの修復はエキソヌクレオリシスに依存しており、断片から配列が排除される。
本発明は、例えば3’オーバーハングの全てまたは実質的部分の配列を保持することができる3’オーバーハングの改良された修復方法を提供する。いくつかの実施形態では、方法は、3’オーバーハングを含む部分的に二本鎖のDNA断片をプライマー集団の1または複数のプライマーと接触させる工程を含み、ここで、プライマー集団は、ランダム標的ハイブリッド形成配列を含む。プライマー集団の1または複数のメンバーを、部分的に二本鎖のDNA断片にアニーリングして伸長させ、それにより、DNA断片にアニーリングした1または複数の伸長したプライマーを産生することができる。別の伸長したプライマーまたは部分的に二本鎖のDNA断片の鎖の5’末端と共にDNA断片にアニーリングした伸長したプライマーは、ライゲーションのための基質を形成することができる。次いで、ライゲーションを行って修復されたDNA断片を得る。当業者は、かかる方法の個別の操作(例えば、DNA分子へのランダム標的ハイブリッド形成配列を有するプライマーのアニーリング、DNAの別のセグメントの5’末端へのプライマーの伸長、および前記5’末端へ伸長したプライマーのライゲーション)の各々に適切な条件に精通しているであろう。
いくつかの実施形態では、プライマーは、部分的に二本鎖のDNA断片の鎖の5’末端まで伸長され、次いで、部分的に二本鎖のDNA断片の鎖の5’末端にライゲートされる。いくつかの実施形態では、第1のプライマーは、部分的に二本鎖のDNA断片の鎖の5’末端まで伸長され;第2のプライマーは第1のプライマーの5’末端まで伸長され;次いで、第1のプライマーは部分的に二本鎖のDNA断片の鎖の5’末端にライゲートされ、第2のプライマーは第1のプライマーの5’末端にライゲートされる。
いくつかの実施形態では、本明細書中に記載の方法の少なくとも工程(a)~(c)を単一の管内で行う。
いくつかの実施形態では、二本鎖DNA断片は組成物中に存在し、少なくとも工程(a)~(c)について、構成要素は組成物から除去されない。
2.部分的に二本鎖のDNA断片
いくつかの実施形態では、部分的に二本鎖のDNA断片は、各末端に3’オーバーハングを有する。いくつかの実施形態では、部分的に二本鎖のDNA断片は、3’オーバーハングおよび(i)平滑末端または(ii)5’オーバーハングを有する。いくつかの実施形態では、5’オーバーハングは、前記5’オーバーハングに沿って前記3’末端を伸長させることによって修復される。
いくつかの実施形態では、部分的に二本鎖のDNA断片はcfDNA断片である。いくつかの実施形態では、部分的に二本鎖のDNA断片は哺乳動物由来である。いくつかの実施形態では、部分的に二本鎖のDNA断片はヒト由来である。いくつかの実施形態では、部分的に二本鎖のDNA断片は、体液試料に由来する。さらなる実施形態では、体液は、全血、血清、または血漿である。
いくつかの実施形態では、部分的に二本鎖のDNA断片は、組成物中のDNA断片集団の一部である。さらなる実施形態では、DNA断片集団は剪断されたDNAを含む。さらなる実施形態では、DNA断片集団は、後成的に改変されたDNAを含む。いくつかの実施形態では、DNA断片集団は、複数のゲノム遺伝子座(例えば、少なくとも10、100、1000、または10000個のゲノム遺伝子座)由来の断片を含む。いくつかの実施形態では、DNA断片集団は富化されていない。ある断片を他の断片と比較して存在量を増加させる手技(配列特異的プライマーを使用した増幅または配列特異的捕捉プローブを使用した標的の捕捉など)に集団が供されていない場合、集団は富化されていない。いくつかの実施形態では、DNA断片集団が増幅されていないとは、前記集団がいかなる増幅手技も受けていなかったことを意味する。非増幅DNAを使用して、DNAメチル化などの後成的遺伝情報を保持することができる。
いくつかの実施形態では、部分的に二本鎖のDNA断片は、試料中に含まれるか、試料から得られる。試料は、被験体から単離された任意の生物試料であり得る。試料には、身体組織、例えば、存在が既知または疑われる固形腫瘍、全血、血小板、血清、血漿、便、赤血球、白血球細胞または白血球、内皮細胞、組織生検、脳脊髄液 滑液、リンパ液、腹水、間質液または細胞外液、細胞間隙中の流動物(歯肉溝滲出液が含まれる)、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿が含まれ得る。試料は、好ましくは体液、特に血液およびその画分、ならびに尿である。試料は、被験体から最初に単離された形態であり得るか、構成要素(細胞など)を除去するか添加するためか、他と比較して1つの構成要素を富化するためのさらなるプロセシングに供することができている。いくつかの実施形態では、部分的に二本鎖のDNA断片は、体液試料に由来する。さらなる実施形態では、体液は、全血、血清、または血漿である。
いくつかの実施形態では、部分的に二本鎖のDNA断片は、血漿試料に由来する。血漿の体積は、配列決定される領域の所望の読み取り深度に依存し得る。例示的な体積は、0.4~40mL、5~20mL、10~20mLである。例えば、体積は、0.5mL、1mL、5mL、10mL、20mL、30mL、または40mLであり得る。試料採取された血漿の体積は、例えば、5~20mLであってよい。
試料は、ゲノム等価物を含む種々の量のDNAを含むことができる。例えば、約30ngのDNA試料は、約10,000個の半数体ヒトゲノム等価物、無細胞DNA(cfDNA)の場合、約2000億個の個別の核酸分子を含むことができる。同様に、約100ngのDNA試料は、約30,000個の半数体ヒトゲノム等価物、無細胞DNA(cfDNA)の場合、約6000億個の個別の分子を含むことができる。いくつかの試料は、1~500、2~100、5~150ngの無細胞DNA(例えば、5~30ng、または10~150ngの無細胞DNA)を含む。
試料は、異なる供給源由来のDNAを含むことができる。例えば、試料は、生殖系列DNAまたは体細胞DNAを含むことができる。試料は、変異を有するDNAを含むことができる。例えば、試料は、生殖系列変異および/または体細胞変異を有するDNAを含むことができる。また、試料は、癌関連変異(例えば、癌関連体細胞変異)を有するDNAを含むことができる。
増幅前の試料中の無細胞DNA(cfDNA)量の例は、約1fg~約1ug、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば、量は、約600ngまで、約500ngまで、約400ngまで、約300ngまで、約200ngまで、約100ngまで、約50ngまで、または約20ngまでの無細胞核酸分子であり得る。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ng、または少なくとも200ngの無細胞核酸分子であり得る。量は、1フェムトグラム(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ng、または200ngまでの無細胞DNA分子であり得る。方法は、1フェムトグラム(fg)~200ngを得る工程を含むことができる。
いくつかの実施形態では、体液試料は、5~10mlの全血、血漿、または血清であり、前記試料は、約30ngのDNAまたは約10,000個の半数体ヒトゲノム等価物を含む。
いくつかの実施形態では、部分的に二本鎖のDNA断片は、組成物中のDNA断片集団の一部である。さらなる実施形態では、DNA断片集団は剪断されたDNAを含む。いくつかの実施形態では、部分的に二本鎖のDNA断片はcfDNA断片である。
無細胞DNAは、細胞内に含まれないか、そうでなければ細胞に結合していないDNAであり、換言すれば、インタクトな細胞の除去後に試料中に核酸が残存している。無細胞DNAは、二本鎖、一本鎖、またはそのハイブリッドであり得る。いくつかの実施形態では、cfDNA断片は、二本鎖DNA分子を含み、そのうちの少なくともいくつかは一本鎖オーバーハングを有する。無細胞DNAは、分泌または細胞死過程(例えば、細胞壊死およびアポトーシス)によって身体流動物中に放出され得る。いくつかの無細胞DNAは、癌細胞(例えば、循環腫瘍DNA(ctDNA))から身体流動物中に放出される。健康な細胞から放出されるものもある。
無細胞DNAは、1または複数の後成的改変を有することができ、例えば、無細胞核酸は、アセチル化、メチル化、ユビキチン化、ホスホリル化、sumo化、リボシル化、および/またはシトルリン化され得る。いくつかの実施形態では、部分的に二本鎖のDNA断片は、組成物中のDNA断片集団の一部であり、DNA断片集団は、後成的に改変されたDNAを含む。無細胞DNAは、約100~500ヌクレオチド、特に110~約230ヌクレオチド(最頻値は約168ヌクレオチド)、および240~440ヌクレオチドの範囲の第2の小ピークのサイズ分布を有する。
無細胞DNAを、分割工程によって身体流動物から単離することができ、無細胞DNAは、溶液中に見出される場合、インタクトな細胞および身体流動物の他の不溶性の構成要素から分離される。分割には、遠心分離または濾過などの技術が含まれ得る。あるいは、身体流動物中の細胞を溶解し、無細胞核酸および細胞核酸を共にプロセシングすることができる。一般に、緩衝液の添加および洗浄工程後、核酸をアルコールで沈殿させることができる。シリカベースのカラムなどのさらなる清浄化工程を使用して、夾雑物または塩が除去され得る。非特異的なバルクキャリア核酸を、例えば、反応中に添加して、収率などの手技のある特定の態様が最適化され得る。
かかるプロセシング後、試料は、種々のDNA形態(二本鎖DNAおよび一本鎖DNAが含まれる)を含むことができる。必要に応じて、一本鎖DNAを二本鎖形態に変換することができ、従って、その後のプロセシング工程および分析工程で二本鎖DNA形態が含まれる。
3.DNAポリメラーゼ
いくつかの実施形態では、DNAポリメラーゼは3’→5’エキソヌクレアーゼ活性を欠く。いくつかの実施形態では、DNAポリメラーゼは5’→3’エキソヌクレアーゼ活性を欠く。いくつかの実施形態では、DNAポリメラーゼは鎖置換活性を欠く。5’-3’ポリメラーゼ活性を示すことができ、かつ3’→5’エキソヌクレアーゼ活性、5’→3’エキソヌクレアーゼ活性、および鎖置換活性を欠く当該分野で公知の任意のDNAポリメラーゼは、本明細書中に記載の方法の工程(b)のためのDNAポリメラーゼとして使用され得る。いくつかの実施形態では、DNAポリメラーゼはクレノウ断片である。いくつかの実施形態では、DNAポリメラーゼはエキソ-クレノウ断片である。
4.プライマー
いくつかの実施形態では、プライマー集団のプライマーが一本鎖である。
いくつかの実施形態では、プライマー集団のプライマーは、ヘアピン領域または二本鎖領域を含む。いくつかの実施形態では、プライマー集団のプライマーは3’オーバーハングを有する二本鎖であり、ランダム標的ハイブリッド形成配列は3’オーバーハング中に存在する。いくつかの実施形態では、プライマー集団のプライマーは3’オーバーハングを有するヘアピンであり、ランダム標的ハイブリッド形成配列は3’オーバーハング中に存在する。
いくつかの実施形態では、プライマー集団のプライマーは、アダプターを含む。いくつかの実施形態では、プライマーのヘアピン領域または二本鎖領域は、アダプターを含む。
いくつかの実施形態では、アダプターは、本明細書中に記載のタグを含まれる。いくつかの実施形態では、アダプターはタグを含む。さらなる実施形態では、タグはバーコードを含む。さらなる実施形態では、プライマー集団は、複数の異なるバーコードを含む。
同一または異なるアダプターを、修復されたDNA断片のそれぞれの末端に連結することができる。時折、タグが異なることを除いて同一のアダプターがそれぞれの末端に連結される。いくつかの実施形態では、アダプターは、Y形アダプターである。いくつかの実施形態では、アダプターはベル形アダプターである。本明細書中で使用されるアダプターを、以下にさらに記載する(第6節)。
いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも4、5、6、7、8、9、または10ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも4ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも5ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも6ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも7ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも8ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも9ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも10ヌクレオチドである。
いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約4、5、6、7、8、9、10、11、または12ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約4ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約5ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約6ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約7ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約8ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約9ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約10ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約11ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約12ヌクレオチドである。
本明細書中に記載の任意の実施形態では、プライマー集団は、4つの異なる塩基(例えば、A、C、T、およびG)の各々がランダム標的ハイブリッド形成配列の各々の位置に出現するメンバーを含み得る。言い換えれば、プライマー集団の異なるメンバーにおいて、4つの塩基の各々は、ランダム標的ハイブリッド形成配列の各々の位置に出現することができる。当業者は、UをTの変わりに使用することができ、そして/または非改変塩基と同一の塩基対合優先度を有する改変塩基(例えば、メチル化シトシン、プソイドウリジンなど)を使用することができると認識するであろう;そのようなものとして、TはUを包含し、A、C、T、およびGの各々は、非改変塩基と同一の塩基対合優先度を保持する改変形態を包含する。
いくつかの実施形態では、部分的に二本鎖のDNA断片は、各々が本明細書中に開示のように修復されている2つの3’オーバーハングを含む。
いくつかの実施形態では、部分的に二本鎖のDNA断片は、3’オーバーハングおよび5’オーバーハングを含む。5’オーバーハングは、例えば、5’オーバーハングに沿って組み込まれた3’末端を伸長することによって修復され得る。いくつかの実施形態では、この伸長は、3’オーバーハングに沿って1または複数のプライマーを伸長させる同一のポリメラーゼによって行われる。
いくつかの実施形態では、修復されたDNA断片は、1つまたは2つの平滑末端を含む。いくつかの実施形態では、本明細書中に記載のライゲーション反応後、任意の残存するオーバーハングは、例えば、好適なエキソヌクレアーゼ(例えば、3’→5’エキソヌクレアーゼ)を使用してさらに修復される。これにより、少量の配列を喪失するが、それにもかかわらず3’オーバーハングの元の部分であった配列を相当量保持し得る一方で、さらなる操作に供することができる平滑末端を有する分子を依然として提供する。
いくつかの実施形態では、修復されたDNA断片は、例えば、平滑末端化された核酸の3’末端にヌクレオチドを非テンプレート指向性に付加するポリメラーゼを使用する末端テーリングに供され、必要に応じて、AはGより優先され、GはCまたはTより優先されて付加される。このポリメラーゼは、校正機能を欠き得、そして/または例えば高温で活性を保持する熱安定性であり得る。Taq、Bst大断片、およびTthポリメラーゼは、かかるポリメラーゼの例である。反応混合物は典型的には前の工程由来の4つの標準的なヌクレオチド型の各々を等モル量で含むが、4つのヌクレオチド型は、均等な比率で3’末端に付加されない。むしろAが最も高い頻度で付加され、Gがそれに続き、CおよびTがそれに続く。
適用可能な場合、修復されたDNA断片の平滑末端化およびテーリングを、単一の管内で行うことができる。平滑末端化された核酸は、テーリング反応が起こる前に平滑末端化を行う酵素(単数または複数)から分離する必要はない。必要に応じて、全ての酵素、ヌクレオチド、および他の試薬を、平滑末端化反応が起こる前に共に供給する。共に供給するとは、平滑末端化するために試料をインキュベートする時に全てが存在するように、全てを試料中に十分に近い時間に導入することを意味する。必要に応じて、少なくとも平滑末端化および末端テーリングの両方のためのインキュベーションを完了するまで、酵素、ヌクレオチド、および他の試薬を供給した後に試料から何も除去しない。しばしば、末端テーリング反応を、平滑末端化反応よりも高い温度で行う。例えば、平滑末端化反応を、5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼが活性であり、かつ熱安定性ポリメラーゼが不活性であるか最小の活性である周囲温度で行い、末端テーリング反応を、5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼが不活性であり、かつ熱安定性ポリメラーゼが活性である場合の高温(60℃超)で行うことができる。
いくつかの実施形態では、修復後および/または任意のさらなるプロセシング工程後に、酵素(単数または複数)(例えば、ポリメラーゼ、リガーゼ、および/またはエキソヌクレアーゼ)を、例えば熱変性によって変性させる。例えば、75℃~80℃に温度を上昇させることによって変性させることができる。
5.修復されたDNA断片のアダプターへの連結
いくつかの実施形態では、修復後、テーリングした試料分子をその後に精製するか精製せずに、テーリングした試料分子をアダプターに接触させる。例えば、修復されたDNA断片のテーリング後、テーリングした試料分子を、アダプターの一方の末端が相補的なTおよびCヌクレオチドでテーリングされたアダプターと接触させ得る。別の例では、平滑末端を有する修復されたDNA断片を、平滑末端を有するアダプターと接触させ得る。
アダプターを、その各鎖の個別の合成およびアニーリングによって形成することができる。したがって、さらなるTテールおよびCテールを、使用する場合、一方の鎖の合成における追加のヌクレオチドとして付加することができる。典型的には、GおよびAでテーリングしたアダプターは、これらのアダプターがCおよびTでそれぞれテーリングした試料分子とアニーリングするかもしれないが、他のアダプターともアニーリングするであろうとの理由から、含まれない。3’末端に相補ヌクレオチド(すなわち、T-AおよびC-G)を保有するアダプター分子および試料分子がアニーリングし、相互に連結することができる。Tテーリングしたアダプターと比較したCテーリングしたアダプターの百分率は、モル基準で約5~40%(例えば、10~35%、15~25%、20~35%、25~35%、または約30%)の範囲であり得る。試料分子の3’末端への単一ヌクレオチドの非テンプレート指向性の付加は完了まで進まないので、試料はいくつかのテーリングされていない平滑末端化された試料分子も含み得る。これらの分子を、1つ、好ましくは唯一の平滑末端を有するアダプターも試料に供給することによって回収することができる。平滑末端アダプターに、0.2~20%、または0.5~15%または1~10%のアダプターモル比で、TテーリングしたアダプターおよびCテーリングしたアダプターを供給することができる。末端平滑化したアダプターを、TテーリングしたアダプターおよびCテーリングしたアダプターと同時、前、または後に提供することができる。末端平滑化したアダプターを平滑末端化した試料分子と再度ライゲートすると、両側がアダプターに隣接した試料分子が得られる。これらの分子は、試料の間にA-Tヌクレオチド対またはC-Gヌクレオチド対を欠き、アダプターは、テーリングした試料分子がテーリングしたアダプターにライゲートされた時に出現する。
これらの反応で使用されるアダプターは、好ましくは、アダプターが一方向のみで試料分子とライゲートすることができるように、TまたはCで末端テーリングされた唯一の末端または唯一の平滑末端を有する。アダプターは、例えば、一方の末端がテーリングされているか平滑であり、他方の末端が2つの一本鎖を有するY形アダプターであり得る。例示的なY形アダプターは、以下の通りタグを示す(6塩基)を有する配列を有する。上のオリゴヌクレオチドは、単一塩基Tテールを含む。
ユニバーサルアダプター:5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(配列番号1)。
アダプター、インデックス1-12:5’ GATCGGAAGAGCACACGTCTGAACTCCAGTCAC(6塩基)ATCTCGTATGCCGTCTTCTGCTTG(配列番号2)
Cテールを有する別のY形アダプターは、以下の配列を有する:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCC(配列番号3)およびアダプター、インデックス1-12:5’ GATCGGAAGAGCACACGTCTGAACTCCAGTCAC(6塩基)ATCTCGTATGCCGTCTTCTGCTTG(配列番号2)
かかるオリゴヌクレオチドのカスタマイズされた組み合わせ(TテールおよびCテールの両方を有するオリゴヌクレオチドが含まれる)を、本方法で使用するために合成することができる。
これらのアダプター配列の短縮バージョンは、Rohland et al.,Genome Res.2012 May;22(5):939-946に記載されている。
また、アダプターは、テーリングされているか平滑末端化されている唯一の末端を有するベル形であり得る。アダプターは、増幅のためのプライマー結合部位、配列決定プライマーのための結合部位、および/または同定のための核酸タグを含むことができる。同一または異なるアダプターを、単一の反応で使用することができる。
アダプターが識別タグを含み、試料中の核酸が各末端でアダプターに付着される場合、識別子の潜在的な組み合わせの数は、供給される固有のタグの数に伴って指数関数的に増加する(すなわち、n個の組み合わせ、ここで、nは固有の識別タグの数である)。いくつかの方法では、固有のタグの組み合わせの数は、試料中の全てまたは実質的に全て(例えば、少なくとも90%)の異なる二本鎖DNA分子が異なる組み合わせのタグを受け取る可能性が統計的に高くなるほどに十分である。いくつかの方法では、識別タグの固有の組み合わせの数は、試料中の固有の二本鎖DNA分子の数より少ない(例えば、5~10,000の異なるタグの組み合わせ)。
上記方法を実施するのに好適な酵素を提供するキットは、NEBNext(登録商標)Ultra(商標)II DNA Library Prep Kit for Illumina(登録商標)である。このキットは、以下の試薬を提供する:NEBNext Ultra II末端調製酵素ミックス、NEBNext Ultra II末端調製反応緩衝液、NEBNextライゲーションエンハンサー、NEBNext Ultra IIライゲーションマスターミックス-20、NEBNext(登録商標)Ultra II Q5(登録商標)マスターミックス。
記載のTテーリングしたアダプターおよびCテーリングしたアダプターを付着させることによってアダプター化した核酸の集団を得ることができ、この集団は複数の核酸分子を含み、核酸分子の各々は核酸断片を含み、核酸断片はその両側がバーコードを含むアダプターに隣接しており、核酸断片とアダプターとの間でA/TまたはG/C塩基対を形成する。複数の核酸分子は、少なくとも10,000、100,000、または1,000,000分子であり得る。集団中のほとんどの核酸を、異なるバーコードを有するアダプターに隣接させることができる(例えば、少なくとも99%)。平滑末端化したアダプターも含まれる場合、集団は、核酸断片のいずれかの末端または両端にアダプターが直接連結した(すなわち、A/T対またはG/C対を介在しない)核酸分子を含む。
6.増幅
アダプターに隣接した修復されたDNA断片を、増幅すべき核酸に隣接するアダプター中のプライマー結合部位に結合するプライマーからプライミングされるPCRまたは別の増幅方法によって増幅することができる。増幅方法は、サーモサイクリングによる伸長、変性、およびアニーリングのサイクルを含むことができるか、転写媒介増幅のような等温増幅であり得る。他の増幅方法には、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベースの増幅、および自律配列ベースの複製が含まれる。
いくつかの実施形態では、本明細書中に記載の方法は、工程(a)~(c)の後に、修復されたDNA断片を増幅する工程をさらに含む。さらなる実施形態では、修復されたDNA断片は1または複数のアダプター(例えば、2つのアダプター)を含み、前記修復されたDNA断片の増幅に、前記1または複数のアタプターにアニーリングする1または複数の(例えば、2つの)増幅オリゴマーを使用する。
(本明細書中の他所で考察するように)富化工程を行う場合、増幅は、富化工程に先行し、そして/または富化工程に続き得る。いくつかの実施形態では、方法は、修復された断片を増幅する工程、富化工程を実施して付加された断片を得る、富化工程を実施する工程、および、その後に付加された修復された断片をさらに増幅する工程を含む。
7.タグ
いくつかの実施形態では、核酸分子(ポリヌクレオチド試料に由来する)は、試料インデックスおよび/または分子バーコード(一般に、「タグ」と呼ばれる)でタグ化され得る。タグは、特に、化学合成、ライゲーション(例えば、平滑末端ライゲーションまたは粘着末端ライゲーション)、またはオーバーラップ伸長ポリメラーゼ連鎖反応(PCR)によってアダプターに組み込まれるか、そうでなければ連結され得る。かかるアダプターは、最終的に標的核酸分子に連結され得る。他の実施形態では、従来の核酸増幅方法を使用して核酸分子に試料インデックスを導入するために、1ラウンドまたはそれを超えるラウンドの増幅サイクル(例えば、PCR増幅)を一般に適用する。増幅は、1または複数の反応混合物(例えば、アレイ中の複数のマイクロウェル)中で行われ得る。分子バーコードおよび/または試料インデックスは、同時または任意の順序で導入され得る。いくつかの実施形態では、分子バーコードおよび/または試料インデックスは、配列捕捉工程が行われる前および/または後に導入される。いくつかの実施形態では、プローブ捕捉前に分子バーコードのみが導入され、試料インデックスは、配列捕捉工程が行われた後に導入される。いくつかの実施形態では、分子バーコードおよび試料インデックスの両方は、プローブベースの捕捉工程が行われる前に導入される。いくつかの実施形態では、試料インデックスは、配列捕捉工程が行われた後に導入される。いくつかの実施形態では、分子バーコードは、ライゲーション(例えば、平滑末端ライゲーションまたは付着末端ライゲーション)によってアダプターを介して試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。いくつかの実施形態では、試料インデックスは、オーバーラップ伸長ポリメラーゼ連鎖反応(PCR)によって試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。典型的には、配列捕捉プロトコールは、標的にされた核酸配列(例えば、ゲノム領域のコード配列)に相補的な一本鎖核酸分子の導入を含み、かかる領域の変異は、ある癌型に関連する。
いくつかの実施形態では、タグは、試料核酸分子の一方の末端または両端に位置付けられ得る。いくつかの実施形態では、タグは、予め決定された配列、ランダム配列、またはセミランダム配列のオリゴヌクレオチドである。いくつかの実施形態では、タグは、約500、200、100、50、20、10、9、8、7、6、5、4、3、2、または1ヌクレオチド長未満であり得る。タグは、試料核酸にランダムまたは非ランダムに連結され得る。
いくつかの実施形態では、各試料は、試料インデックスまたは試料インデックスの組み合わせを用いて固有にタグ化される。いくつかの実施形態では、試料または副試料の各核酸分子は、分子バーコードまたは分子バーコードの組み合わせを用いて固有にタグ化される。他の実施形態では、分子バーコードが複数で相互に必ずしも固有ではない(例えば、非固有分子バーコード)ような複数の分子バーコードが使用され得る。これらの実施形態では、分子バーコードは、一般に、(例えば、ライゲーションによって)個別の分子に付着され、その結果、分子バーコードとこれに付着され得る配列が組み合わせられると個別に追跡され得る固有の配列が作出される。非固有にタグ化された分子バーコードの検出を内因性配列情報(例えば、試料中の元の核酸分子の配列に対応する開始(start)位置および/または末端(stop)位置、一方または両方の末端の配列リードのサブシーケンス、配列リードの長さ、および/または試料中の元の核酸分子の長さ)と組み合わせると、典型的には、固有の同一性を特定の分子に割り当てることが可能である。また、個別の配列リードの長さまたは塩基対の数は、必要に応じて、所与の分子の固有の同一性を割り当てるために使用される。本明細書中に記載されるように、それにより、固有の同一性を割り当てられた核酸の一本鎖由来の断片は、親鎖由来の断片、および/または相補鎖をその後に同定することできる場合がある。
いくつかの実施形態では、分子バーコードは、試料中の分子に対する識別子セット(例えば、固有のまたは非固有の分子バーコードの組み合わせ)の期待される比で導入される。形式の1つの例は、約2から約1,000,000個までの異なる分子バーコード、または約5から約150個までの異なる分子バーコード、または約20から約50個までの異なる分子バーコードを使用する。あるいは、約25から約1,000,000個までの異なる分子バーコードが使用され得る。分子バーコードを、標的分子の両端にライゲートすることができる。例えば、20~50×20~50個の分子バーコードを使用することができる。いくつかの実施形態では、20~50個の異なる分子バーコードを使用することができる。いくつかの実施形態では、5~100個の異なる分子バーコードを使用することができ、いくつかの実施形態では、5~150個の分子バーコードを使用することができる。いくつかの実施形態では、5~200個の異なる分子バーコードを使用することができる。かかる識別子のメンバーは、典型的には、同一の開始点および終結点を有する異なる分子が識別子の異なる組み合わせを受け取る確率を高くする(例えば、少なくとも94%、99.5%、99.99%、または99.999%)ために十分である。いくつかの実施形態では、約80%、約90%、約95%、または約99%の分子が分子バーコードの同一の組み合わせを有する。
いくつかの実施形態では、反応中の固有のまたは非固有の分子バーコードの割り当ては、例えば、米国特許出願第20010053519号、同第20030152490号、および同第20110160078号、ならびに米国特許第6,582,908号、同第7,537,898号、同第9,598,731号、および同第9,902,992号(その各々全体が、本明細書中で参考として援用される)に記載の方法およびシステムを使用して行われる。あるいは、いくつかの実施形態では、試料の異なる核酸分子は、内因性配列情報(例えば、開始および/または終結位置、配列の一方または両方の末端のサブシーケンス、および/または長さ)のみを使用して同定され得る。
したがって、また、本開示は、本明細書中に記載の方法によって産生された、修復およびタグ化されたDNA断片の組成物を提供する。ポリヌクレオチドは、断片化されたDNA(例えば、cfDNA)を含むことができる。ゲノム内のマッピング可能な塩基の位置にマッピングされる組成物中のポリヌクレオチドセットを、非固有にタグ化することができ、すなわち、異なる識別子の数は、少なくとも少なくとも2個かつマッピング可能な塩基の位置にマッピングされるポリヌクレオチド数未満であり得る。約10ng~約10μgの間(例えば、約10ng~1μg、約10ng~100ng、約100ng~10μg、約100ng~1μg、約1μg~10μgのうちのいずれか)の組成物は、2、5、10、50、または100個のうちのいずれかから100、1000、10,000、または100,000のうちのいずれかまでの異なる識別子を保有することができる。例えば、5個と100個との間または100個と4000個との間の異なる識別子を使用して、かかる組成物中のポリヌクレオチドをタグ化することができる。
異なる分子が同一の座標(この場合、同一の開始/終結位置を有する)にマッピングされ、かつ異なるタグよりもむしろ同一のタグを保有する事象は、「分子衝突」と呼ばれる。ある特定の例では、実際の分子衝突数は、上記のように計算された理論上の衝突数より大きい場合がある。これは、座標全体の分子の不均一な分布、バーコード間のライゲーション効率の相違、および他の要因と相関し得る。この場合、経験的な方法を使用して、理論上の衝突数に近づくのに必要なバーコード数を決定することができる。1つの実施形態では、配列決定された分子の長さの分布および配列の均一性に基づいて所与の半数体ゲノム等価物のバーコード衝突を減少させるために必要なバーコード数を決定する方法を本明細書中に提供する。方法は、複数の核酸分子プールを作出する工程;各プールを漸増数のバーコードでタグ化する工程;およびバーコード衝突数を理論上のレベルに減少させる最適なバーコード数(例えば、プール効率およびライゲーション効率の相違に起因する有効バーコード濃度の相違に起因し得る)を決定する工程を含む。
1つの実施形態では、ある領域にマッピングされるポリヌクレオチドを実質的に固有にタグ化するのに必要な識別子数を、経験的に決定することができる。例えば、選択した数の異なる識別子を、試料中の分子に付着させることができ、分子を前記領域にマッピングするための異なる識別子の数を計数することができる。使用される識別子数が不十分である場合、前記領域にマッピングされるいくつかのポリヌクレオチドは同一の識別子を保有するであろう。その場合、計数される識別子数は、サンプル中の元の分子の数未満であろう。新規の元の分子を示すさらなる識別子が検出されなくなるまで、異なる識別子の使用数を試料型に対して反復的に増加させることができる。例えば、第1の反復では、5個の異なる識別子が計数され得るが、これは少なくとも5個の異なる元の分子を示す。第2の反復では、より多くのバーコードを使用して、7個の異なる識別子が計数され、これは少なくとも7個の異なる元の分子を示す。第3の反復では、より多くのバーコードを使用して、10個の異なる識別子が計数され、これは少なくとも10個の異なる元の分子を示す。第4の反復では、より多くのバーコードを使用して、10個の異なる識別子が再度計数される。この時点で、より多くのバーコードを付加しても、元の分子の検出数を増加しない可能性が高い。
8.富化
いくつかの実施形態では、DNA断片を含む試料を、目的の断片について富化する。例えば、部分的に二本鎖のDNA断片の鎖の5’末端への伸長されたプライマーのライゲーション後、またはかかるライゲーションおよびアダプターの付着(ライゲーションの一部としてか、その後の工程のいずれかにおいて)に続く増幅工程後に富化が行われ得る。富化は、目的の断片の他の断片に対する相対存在量が増加する任意の手技を指し、試料中の目的の断片が優先的に保持される一方で他の断片が除去される手技が含まれる。富化は、例えば、目的の標的に特異的な標的ハイブリッド形成配列を有する捕捉プローブセットを使用した捕捉工程であり得る。目的の標的は、単一のヌクレオチドバリアント、コピー数可変領域、融合物、およびインデルのうちの1つまたは複数または全てを含むことができる。いくつかの実施形態では、単一のヌクレオチドバリアント、コピー数可変領域、融合物、およびインデルのうちの1つまたは複数または全ては、疾患または障害(例えば、本明細書中の他所で考察した任意の癌などの癌)に関連する。
上記で考察されるように、試料中の核酸を、標的配列を有する分子を次の分析のために捕捉する捕捉工程に供することができる。標的捕捉は、捕捉部分(ビオチンまたは下記の他の例など)で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を含むことができる。プローブは、遺伝子などの領域の一団にわたって探索するように選択された配列を有することができる。いくつかの実施形態では、本明細書中の他所で考察されるように、ベイトセットは、標的領域セットの捕捉収率(それぞれ配列可変標的領域セットおよび後成的標的領域セットの捕捉収率など)を上下させることができる。かかるベイトセットを、標的分子がベイトとハイブリッド形成することが可能な条件下で試料と組み合わせる。次いで、捕捉された分子を、捕捉部分を使用して単離する。例えば、ビオチン捕捉部分は、ビーズベースのストレプトアビジンである。かかる方法は、例えば、2017年12月26日発行の米国特許第9,850,523号(本明細書中で参考として援用される)にさらに記載されている。
捕捉部分には、制限されないが、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁性粒子が含まれる。抽出部分は、ビオチン/ストレプトアビジンまたはハプテン/抗体などの結合対のメンバーであり得る。いくつかの実施形態では、分析物に付着された捕捉部分は、単離可能な部分(磁性粒子または遠心分離によって沈殿することができる巨大粒子など)に付着されたその結合対によって捕捉される。捕捉部分は、捕捉部分を欠く核酸からの捕捉部分を保有する核酸の親和性分離が可能な任意のタイプの分子であり得る。例示的な捕捉部分は、固相に連結されたか連結可能なストレプトアビジンへの結合によって親和性分離が可能なビオチン、または固相に連結されたか連結可能な相補的オリゴヌクレオチドへの結合によって親和性分離が可能なオリゴヌクレオチドである。
9.配列決定のための試料を調製するための例示的なワークフロー
いくつかの実施形態では、本明細書中に記載の方法は、上記実施形態のうちのいずれかに従って修復されたDNA断片を産生する工程を含み、アダプターは、ライゲーション工程またはその後の工程によって組み込まれる。アダプターは、プライマー結合部位および必要に応じてバーコードを含む。アダプターを含む修復されたDNA断片を、増幅反応に供する。本明細書中に記載のように、増幅反応後に富化工程が続き得る。富化工程後に、必要に応じてさらなる増幅工程が続き得る。いくつかの実施形態では、さらなるタグ(例えば、試料インデックス)を増幅反応またはさらなる増幅工程中に添加する。これらのワークフローは、修復された断片中にバーコードおよび試料インデックスの一方または両方を含めること、また、修復された断片を目的の断片について富化することによって、配列決定のための試料を調製することができる。
10.配列決定
いくつかの実施形態では、本明細書中に記載の方法は、修復されたDNA断片を配列決定する工程をさらに含む。さらなる実施形態では、配列決定は、部分的に二本鎖のDNA断片中に3’オーバーハングを形成したヌクレオチドを配列決定する。
事前に増幅されているか、増幅されていないアダプターに隣接する修復されたDNA断片を、配列決定に供することができる。配列決定方法には、例えば、Sanger配列決定、ハイスループット配列決定、ピロシーケンシング、合成時配列決定、単一分子配列決定、ナノポア配列決定、半導体配列決定、ライゲーション時配列決定、ハイブリッド形成時配列決定、RNA-Seq(Illumina)、デジタル遺伝子発現(Helicos)、次世代配列決定、合成による単一分子配列決定(SMSS)(Helicos)、超並列配列決定、クローン単一分子アレイ(Solexa)、ショットガン配列決定、Ion Torrent、Oxford Nanopore、Roche Genia、Maxim-Gilbert配列決定、プライマーウォーキング、PacBio、SOLiD、Ion Torrent、またはNanoporeの各プラットフォームを使用した配列決定が含まれる。複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時にプロセシングする他の手段を含み得る種々の試料プロセシングユニット中で配列決定反応を行うことができる。試料プロセシングユニットは、複数のプロセシングを同時に運転することができるように複数の試料チャンバーも含むことができる。いくつかの実施形態では、複数の修復されたDNA断片が生成され、修復されたDNA断片の少なくとも一部がタグを含み、配列決定が複数の修復されたDNA断片から複数の配列リードを生成する。いくつかの実施形態では、配列リードは、部分的に二本鎖のDNA断片中に3’オーバーハングを形成したヌクレオチドの配列およびタグの配列を含む。
配列決定反応を、癌または他の疾患のマーカーを含むことが公知の1または複数の断片型に対して行うことができる。また、配列決定反応を、試料中に存在する任意の核酸断片に対して行うことができる。配列反応は、少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、または100%のゲノムの配列包括度を提供し得る。他の場合、ゲノムの配列包括度は、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、または100%未満であり得る。
同時配列決定反応は、多重配列決定を使用して行われ得る。一部の場合では、無細胞核酸は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000の配列決定反応を用いて配列決定され得る。他の場合では、無細胞ポリヌクレオチドは、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満の配列決定反応を用いて配列決定され得る。配列決定反応は、連続的または同時に行われ得る。その後に、配列決定反応の全部または一部に対してデータ解析が行われ得る。一部の場合では、データ解析は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000の配列決定反応に対して行われ得る。他の場合では、データ解析は、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満の配列決定反応に対して行われ得る。
配列決定方法は、超並列配列決定(すなわち、少なくとも100、1000、10,000、100,000、100万、1000万、1億、または10億の核酸分子のうちのいずれかを同時に(または立て続けに)配列決定する)であり得る。
11.解析
本発明の方法を使用して、被験体における容態(特に、癌)の存在または非存在を診断するか、容態を特徴づけるか(例えば、癌の病期分類または癌の不均一性の決定)、容態の処置に対する応答をモニタリングするか、被験体における容態の再発リスクを決定することができる。
本発明の方法を使用して、種々の癌を検出することができる。ほとんどの細胞がそうであるように、癌細胞を、代謝回転(旧細胞が死滅して新規の細胞に置換されること)の速度によって特徴づけることができる。一般に、所与の被験体中の脈管構造に接触している死細胞は、DNAまたはDNA断片を血流に放出し得る。これは、種々の病期の癌細胞にも当てはまる。また、癌細胞は、病期に応じて、コピー数変動および稀な変異などの種々の遺伝子異常を特徴とし得る。この現象は、本明細書中に記載の方法およびシステムを使用した個体における癌の存在または非存在を検出するために使用され得る。
検出され得る癌の型および数には、血液癌、脳癌、肺癌、皮膚癌、鼻の癌、咽頭癌、肝臓癌、骨の癌、リンパ腫、膵臓癌、皮膚癌、腸癌、直腸癌、甲状腺癌、膀胱癌、腎臓癌、口腔癌、胃癌、固形状態の癌、混合腫瘍、および均一腫瘍などが含まれ得る。
癌を、遺伝的変動(変異、稀な変異、インデル、コピー数変動、トランスバージョン、転座、反転、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造の変化、遺伝子融合、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸化学修飾の異常な変化、後成的パターンの異常な変化、感染症および癌による核酸メチル化の異常な変化が含まれる)から検出することができる。
また、遺伝子データを、特異的な癌形態の特徴づけのために使用することができる。癌は、しばしば、組成および病期分類の両方において不均一である。遺伝子プロフィールデータは、癌の特異的サブタイプの診断または処置において重要であり得る癌の特異的サブタイプの特徴づけが可能であり得る。また、この情報は、被験体または医師が特異的な癌型の予後予測に関する手がかりを得ることが可能であり、被験体または医師が診断の進行に合わせて治療の選択肢を採用することが可能である。いくつかの癌は、進行し、より侵襲性が高くなり、遺伝的に不安定になる。他の癌は、良性、非活動性、または休眠状態を維持し得る。本開示のシステムおよび方法は、疾患進行の判定において有用であり得る。
また、本解析は、特定の処置選択の有効性の判定において有用である。処置が成功すると、より多くの癌が死滅し、DNAが流出し得るので、処置をうまく選択すると、被験体の血液中のコピー数変動または稀な変異の検出量を増加させることができる。他の例では、これは起こらないかもしれない。別の例では、おそらくある特定の処置の選択肢は、経時的な癌の遺伝子プロフィールと相関し得る。この相関は、治療の選択において有用であり得る。さらに、処置後に癌の寛解が認められる場合、本発明の方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。
また、本発明の方法を、癌以外の容態における遺伝的変動を検出するために使用することができる。B細胞などの免疫細胞は、ある特定の疾患の存在時にクローンが急速に増殖し得る。コピー数変動の検出を用いてクローン増殖をモニタリングすることができ、ある特定の免疫状態をモニタリングすることができる。この例では、コピー数変動の解析を経時的に行って、特定の疾患の進行状態のプロフィールを得ることができる。コピー数変動またはさらに稀な変異の検出を使用して、感染中にどのように病原体集団が変化しているのかを判定することができる。これは、ウイルスが感染中に生活環の状態を変化させ、そして/またはより毒性の高い形態に変異し得る慢性感染(HIV/AIDSまたは肝炎など)中で特に重要であり得る。本発明の方法を使用して、宿主の身体の拒絶活動を判定またはプロファイリングすることができ、免疫細胞が移植された組織の破壊を試みている場合に移植された組織の状態をモニタリングすることができ、拒絶の処置または予防方針を変更することもできる。
さらに、本開示の方法を使用して、被験体における異常な容態の不均一性を特徴づけることができ、前記方法は、被験体における細胞外ポリヌクレオチドの遺伝子プロフィールを作成する工程を含み、前記遺伝子プロフィールは、コピー数変動および稀な変異の解析による複数のデータを含む。癌が含まれるがこれに限定されない一部の場合では、疾患は不均一であり得る。疾患細胞は、同一でない場合がある。癌の例では、いくつかの腫瘍は、異なる型の腫瘍細胞を含むことが公知であり、いくつかの細胞は、癌の病期が異なる。他の例では、不均一性は、複数の病巣を含み得る。さらに、癌の例では、複数の腫瘍病巣が存在する場合があり、おそらく、1または複数の病巣は、原発性部位から拡大した転移の結果である。
本発明の方法を使用して、不均一性疾患における異なる細胞由来の遺伝情報が加算されたフィンガープリントまたはデータセットを作成するかプロファイリングすることができる。このデータセットは、コピー数変動および稀な変異の解析を単独または組み合わせて含み得る。
本方法を使用して、胎児起源の癌または他の疾患を診断、予後予測、モニタリング、または観察することができる。すなわち、これらの方法論は、DNAおよび他の核酸が母親の分子と同時循環し得る出産前の被験体における癌または他の疾患を診断、予後予測、モニタリング、または観察するために妊娠中の被験体で使用され得る。
別段の具体的な指示がない限り、本発明の任意の特徴、工程、要素、実施形態、または態様を、任意の他のものと組み合わせて使用することができる。本発明は、明確にする目的および理解させる目的で例証および例示としていくらか詳細に記載されてきたが、添付の特許請求の範囲の範囲内である特定の変更および改変が行われ得ることが明らかであろう。

Claims (48)

  1. 部分的に二本鎖のDNA断片を修復する方法であって、
    (a)前記部分的に二本鎖のDNA断片をプライマー集団の1または複数のプライマーと接触させる工程であって、ここで、前記部分的に二本鎖のDNA断片が3’オーバーハングを含み、前記プライマー集団がランダム標的ハイブリッド形成配列を含む、工程;
    (b)DNAポリメラーゼを使用して前記DNA断片に沿って前記プライマー集団の1または複数のプライマーを伸長させる工程であって、それにより、前記DNA断片にアニーリングした1または複数の伸長したプライマーが産生される、工程;および
    (c)1または複数の伸長したプライマーの3’末端を、伸長したプライマーまたは部分的に二本鎖のDNA断片の鎖の5’末端にライゲートする工程であって、それにより、修復されたDNA断片が得られる、工程
    を含む、方法。
  2. 前記DNAポリメラーゼが3’→5’エキソヌクレアーゼ活性を欠く、先行する請求項のいずれか1項に記載の方法。
  3. 前記DNAポリメラーゼが5’→3’エキソヌクレアーゼ活性を欠く、先行する請求項のいずれか1項に記載の方法。
  4. 前記DNAポリメラーゼが鎖置換活性を欠く、先行する請求項のいずれか1項に記載の方法。
  5. 前記DNAポリメラーゼがクレノウ断片である、先行する請求項のいずれか1項に記載の方法。
  6. 前記DNAポリメラーゼがエキソ-クレノウ断片である、直前の請求項に記載の方法。
  7. 前記部分的に二本鎖のDNA断片が、各末端に3’オーバーハングを有する、先行する請求項のいずれか1項に記載の方法。
  8. 前記部分的に二本鎖のDNA断片が、3’オーバーハングおよび(i)平滑末端または(ii)5’オーバーハングを有する、先行する請求項のいずれか1項に記載の方法。
  9. 前記5’オーバーハングが、前記5’オーバーハングに沿って前記3’末端を伸長させることによって修復される、直前の請求項に記載の方法。
  10. 前記部分的に二本鎖のDNA断片が、体液試料に由来する、先行する請求項のいずれか1項に記載の方法。
  11. 前記体液が、全血、血清、血漿、または尿である、直前の請求項に記載の方法。
  12. 前記部分的に二本鎖のDNA断片がcfDNA断片である、先行する請求項のいずれか1項に記載の方法。
  13. 前記部分的に二本鎖のDNA断片が哺乳動物由来である、先行する請求項のいずれか1項に記載の方法。
  14. 前記部分的に二本鎖のDNA断片がヒト由来である、先行する請求項のいずれか1項に記載の方法。
  15. 前記部分的に二本鎖のDNA断片が、組成物中のDNA断片集団の一部である、先行する請求項のいずれか1項に記載の方法。
  16. 前記DNA断片集団が剪断されたDNAを含む、直前の請求項に記載の方法。
  17. 前記DNA断片集団が、後成的に改変されたDNAを含む、請求項15または16に記載の方法。
  18. 前記DNA断片集団が、複数のゲノム遺伝子座由来の断片を含む、請求項15~17のいずれか1項に記載の方法。
  19. 前記DNA断片集団が富化されていない、請求項15~18のいずれか1項に記載の方法。
  20. 前記DNA断片集団が増幅されていない、請求項15~19のいずれか1項に記載の方法。
  21. 前記ランダム標的ハイブリッド形成配列の長さが、少なくとも4、5、6、7、8、9、または10ヌクレオチドである、先行する請求項のいずれか1項に記載の方法。
  22. 前記ランダム標的ハイブリッド形成配列の長さが、約4、5、6、7、8、9、10、11、または12ヌクレオチドである、先行する請求項のいずれか1項に記載の方法。
  23. 前記プライマー集団のプライマーが一本鎖である、先行する請求項のいずれか1項に記載の方法。
  24. 前記プライマー集団のプライマーが3’オーバーハングを有する二本鎖であり、前記ランダム標的ハイブリッド形成配列が前記3’オーバーハング中に存在する、請求項1~20のいずれか1項に記載の方法。
  25. 前記プライマー集団のプライマーが3’オーバーハングを有するヘアピンであり、前記ランダム標的ハイブリッド形成配列が前記3’オーバーハング中に存在する、請求項1~20のいずれか1項に記載の方法。
  26. 前記プライマーのヘアピンまたは二本鎖領域がアダプターを含む、請求項21~22のいずれか1項に記載の方法。
  27. 前記プライマーのヘアピンまたは二本鎖領域がタグを含む、請求項21~23のいずれか1項に記載の方法。
  28. 前記タグがバーコードを含む、請求項24に記載の方法。
  29. 前記プライマー集団が、複数の異なるバーコードを含む、請求項25に記載の方法。
  30. 少なくとも工程(a)~(c)を単一の管内で行う、先行する請求項のいずれか1項に記載の方法。
  31. 前記二本鎖DNA断片が組成物中に存在し、少なくとも工程(a)~(c)について、構成要素が組成物から除去されない、先行する請求項のいずれか1項に記載の方法。
  32. 前記修復されたDNA断片が1つまたは2つの平滑末端を含むか、前記方法が、前記修復されたDNA断片の1つまたは2つの末端を平滑末端化する工程をさらに含む、先行する請求項のいずれか1項に記載の方法。
  33. 前記平滑末端化された核酸の3’末端にヌクレオチドを非テンプレート指向性に付加するポリメラーゼを使用して、修復されたDNA断片を末端テーリングする工程をさらに含み、必要に応じて、AがGより優先され、GがCまたはTより優先されて付加される、直前の請求項に記載の方法。
  34. 前記修復されたDNA断片に(必要に応じて両端に)タグをライゲートする工程をさらに含み、必要に応じて、前記タグがバーコードおよび/またはアダプターを含む、先行する請求項のいずれか1項に記載の方法。
  35. 前記修復されたDNA断片を精製する工程をさらに含む、先行する請求項のいずれか1項に記載の方法。
  36. 工程(b)および/または(c)後に工程(b)および/または(c)で使用した1または複数の酵素を変性させる工程をさらに含む、先行する請求項のいずれか1項に記載の方法。
  37. 前記修復されたDNA断片を増幅する工程をさらに含む、先行する請求項のいずれか1項に記載の方法。
  38. 前記修復されたDNA断片が1または複数のアダプター(例えば、2つのアダプター)を含み、前記修復されたDNA断片を増幅する工程に前記1または複数のアタプターにアニーリングする1または複数の(例えば、2つの)増幅オリゴマーを使用する、直前の請求項に記載の方法。
  39. 前記修復されたDNA断片を目的の断片について富化する工程であって、それにより富化されたDNA断片が得られる、工程をさらに含み、必要に応じて、前記富化する工程を増幅する工程後に行う、先行する請求項のいずれか1項に記載の方法。
  40. 前記目的の断片が、疾患または障害に関連する様式によって変動する遺伝子座を含み、必要に応じて、前記疾患または障害が癌である、直前の請求項に記載の方法。
  41. 前記変動が、一ヌクレオチド変動、コピー数変動、遺伝子融合、またはインデルのうちの1つまたは複数である、直前の請求項に記載の方法。
  42. 前記目的の断片が、疾患または障害に関連する一ヌクレオチド変動;疾患または障害に関連するコピー数の変動;疾患または障害に関連する遺伝子融合;または疾患または障害に関連するインデルを示すフラグメントのうちの1つ、2つ,3つ,または4つを含み、必要に応じて、前記疾患または障害が癌である、直前の請求項に記載の方法。
  43. 前記富化されたDNA断片を増幅する工程をさらに含む、請求項36~39のいずれか1項に記載の方法。
  44. 前記修復されたDNA断片を配列決定する工程をさらに含む、先行する請求項のいずれか1項に記載の方法。
  45. 前記配列決定する工程が、部分的に二本鎖のDNA断片中に3’オーバーハングを形成したヌクレオチドを配列決定する、直前の請求項に記載の方法。
  46. 前記配列決定する工程がハイスループット配列決定である、請求項41または42に記載の方法。
  47. 複数の修復されたDNA断片が生成され、前記修復されたDNA断片の少なくとも一部がタグを含み、前記配列決定する工程が複数の修復されたDNA断片から複数の配列リードを生成する、請求項44~46のいずれか1項に記載の方法。
  48. 前記配列リードが、前記部分的に二本鎖のDNA断片中に3’オーバーハングを形成したヌクレオチドの配列およびタグの配列を含む、請求項47に記載の方法。
JP2022521657A 2019-10-25 2020-10-23 3’オーバーハングを修復する方法 Pending JP2022553164A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962926093P 2019-10-25 2019-10-25
US62/926,093 2019-10-25
PCT/US2020/057189 WO2021081423A1 (en) 2019-10-25 2020-10-23 Methods for 3' overhang repair

Publications (2)

Publication Number Publication Date
JP2022553164A true JP2022553164A (ja) 2022-12-22
JPWO2021081423A5 JPWO2021081423A5 (ja) 2023-10-30

Family

ID=73452312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022521657A Pending JP2022553164A (ja) 2019-10-25 2020-10-23 3’オーバーハングを修復する方法

Country Status (5)

Country Link
US (2) US11447819B2 (ja)
EP (2) EP4048812B1 (ja)
JP (1) JP2022553164A (ja)
ES (1) ES2971348T3 (ja)
WO (1) WO2021081423A1 (ja)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US20030017081A1 (en) 1994-02-10 2003-01-23 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
DE60234464D1 (de) 2001-11-28 2009-12-31 Applied Biosystems Llc Zusammensetzungen und Verfahren zur selektiven Nukleinsäureisolierung
WO2004081183A2 (en) * 2003-03-07 2004-09-23 Rubicon Genomics, Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US20060078899A1 (en) 2004-10-12 2006-04-13 Scheffer Alicia F Methods and compositions for reducing label variation in array-based comparative genome hybridization assays
US8518640B2 (en) * 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
CN103502463B (zh) * 2010-12-27 2016-03-16 艾比斯生物科学公司 核酸样品的制备方法及组合物
PT2893040T (pt) 2012-09-04 2019-04-01 Guardant Health Inc Métodos para deteção de mutações raras e de variação do número de cópias
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
JP2017537657A (ja) * 2014-12-11 2017-12-21 ニユー・イングランド・バイオレイブス・インコーポレイテツド 標的配列の濃縮
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
US20210388414A1 (en) 2018-11-16 2021-12-16 Depixus Optimization of in vitro isolation of nucleic acids using site-specific nucleases

Also Published As

Publication number Publication date
EP4048812B1 (en) 2023-12-06
EP4345171A3 (en) 2024-06-12
WO2021081423A1 (en) 2021-04-29
US20230212663A1 (en) 2023-07-06
EP4048812A1 (en) 2022-08-31
US11447819B2 (en) 2022-09-20
ES2971348T3 (es) 2024-06-04
EP4345171A2 (en) 2024-04-03
US20210123097A1 (en) 2021-04-29

Similar Documents

Publication Publication Date Title
US11725241B2 (en) Compositions and methods for identification of a duplicate sequencing read
US20190360043A1 (en) Enrichment of dna comprising target sequence of interest
JP5986572B2 (ja) 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定
US11155855B2 (en) Single stranded circular DNA libraries for circular consensus sequencing
EP3610032B1 (en) Methods of attaching adapters to sample nucleic acids
CN109844137B (zh) 用于鉴定嵌合产物的条形码化环状文库构建
CN110741096B (zh) 用于检测循环肿瘤dna的组合物和方法
US20190185932A1 (en) Method for preparing libraries for massively parallel sequencing based on molecular barcoding and use of libraries prepared by the method
JP2024515305A (ja) 核酸の濃縮及び検出
US11447819B2 (en) Methods for 3′ overhang repair

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231020

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231020