JP2021511309A - 核酸を解析するための方法および組成物 - Google Patents

核酸を解析するための方法および組成物 Download PDF

Info

Publication number
JP2021511309A
JP2021511309A JP2020538919A JP2020538919A JP2021511309A JP 2021511309 A JP2021511309 A JP 2021511309A JP 2020538919 A JP2020538919 A JP 2020538919A JP 2020538919 A JP2020538919 A JP 2020538919A JP 2021511309 A JP2021511309 A JP 2021511309A
Authority
JP
Japan
Prior art keywords
oligonucleotide
overhang
nucleic acid
target nucleic
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020538919A
Other languages
English (en)
Other versions
JP7296969B2 (ja
Inventor
キンケイド, ケリー エム. ハーキンズ
キンケイド, ケリー エム. ハーキンズ
ジョシュア ディー. カップ,
ジョシュア ディー. カップ,
クリストファー ジェイ. トロル,
クリストファー ジェイ. トロル,
Original Assignee
クラレット バイオサイエンス, エルエルシー
クラレット バイオサイエンス, エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クラレット バイオサイエンス, エルエルシー, クラレット バイオサイエンス, エルエルシー filed Critical クラレット バイオサイエンス, エルエルシー
Publication of JP2021511309A publication Critical patent/JP2021511309A/ja
Priority to JP2023042991A priority Critical patent/JP2023072089A/ja
Application granted granted Critical
Publication of JP7296969B2 publication Critical patent/JP7296969B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本技術は、一部は、核酸を解析するための方法および組成物に関する。一部の態様では、本技術は、核酸ライブラリーを調製するための方法および組成物に関する。一部の態様では、本技術は、核酸断片の末端を解析するための方法および組成物に関する。特定のタイプの核酸解析のための適切なシーケンシングプラットフォームの選択は、誤りの原因、誤り率、ならびにシーケンシングの速度およびコストを含む、利用可能な技術についての詳細な理解を必要とする。

Description

関連特許出願
本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてKelly M. HARKINS KINCAIDらを記名し、代理人整理番号CBS−2001−PVにより指定される、2018年1月12に出願した米国仮特許出願第62/617,055号の利益を主張するものである。本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてKelly M. HARKINS KINCAIDらを記名し、代理人整理番号CBS−2001−PV2により指定される、2018年1月17に出願した米国仮特許出願第62/618,382号の利益を主張するものでもある。本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてKelly M. HARKINS KINCAIDらを記名し、代理人整理番号CBS−2001−PV3により指定される、2018年11月20に出願した米国仮特許出願第62/769,787号の利益を主張するものでもある。上述の出願の全内容は、本文、表および図面すべてを含めて、参照により本明細書に組み込まれる。
本技術は、一部は、核酸を解析するための方法および組成物に関する。一部の態様では、本技術は、核酸ライブラリーを調製するための方法および組成物に関する。一部の態様では、本技術は、核酸断片の末端を解析するための方法および組成物に関する。
生命体(例えば、動物、植物および微生物)および遺伝情報を複製する他の形態(例えば、ウイルス)の遺伝情報は、核酸(すなわち、デオキシリボ核酸(DNA)またはリボ核酸(RNA))にコードされている。遺伝情報は、化学的核酸または仮説的核酸の一次構造に相当するひと続きのヌクレオチドまたは修飾ヌクレオチドである。
様々なハイスループットシーケンシングプラットフォームが、核酸を解析するために使用される。例えば、Illuminaプラットフォームは、アダプターがライゲーションされたDNA断片のクローン増幅を含む。別のプラットフォームは、核酸分子または個々のヌクレオチドが小さいチャネルを通って移行することに依拠する、ナノポアに基づくシーケンシングである。ある特定のシーケンシングプラットフォームのライブラリー調製は、DNAの断片化、断片末端の修飾、およびアダプターのライゲーションを含むことが多く、核酸断片の増幅(例えば、PCR増幅)を含むことがある。
特定のタイプの核酸解析のための適切なシーケンシングプラットフォームの選択は、誤りの原因、誤り率、ならびにシーケンシングの速度およびコストを含む、利用可能な技術についての詳細な理解を必要とする。シーケンシングコストは低下してきたが、ライブラリー調製のスループットおよびコストは、制限要因であり得る。ライブラリー調製の一態様は、核酸断片の末端を、それらが特定のシーケンシングプラットフォームに好適であるように、修飾することを含む。核酸末端は、有用な情報を含有し得る。したがって、核酸末端に含有されている情報を保存しつつ、核酸末端を(例えば、ライブラリー調製のために)修飾する方法は、核酸の処理および解析に有用であると予想される。
一部の態様では、核酸ライブラリーを生成する方法であって、標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップを含み、a)標的核酸の一部またはすべてがオーバーハングを含み;b)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み;d)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、方法が、提供される。
一部の態様では、核酸ライブラリーを生成する方法であって、a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、i)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖を含み、ループが、1つまたは複数のリボ核酸(RNA)ヌクレオチドを含み、ii)標的核酸の一部またはすべてが、オーバーハングを含み、iii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、iv)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;b)ハイブリダイゼーション産物と、ハイブリダイゼーション産物をヘアピンループ内のRNAヌクレオチドで切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることによって、切断されたハイブリダイゼーション産物を形成するステップとを含む方法が、提供される。
一部の態様では、複数のオリゴヌクレオチド種を含む組成物であって、a)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖を含み、ループが、1つまたは複数のリボ核酸(RNA)ヌクレオチドを含み;b)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸中のオーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、組成物も、提供される。
一部の態様では、核酸末端を修飾する方法であって、a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、i)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、切断条件下で切断され得る1つまたは複数の切断部位を含み、ii)標的核酸の一部またはすべてが、オーバーハングを含み、iii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖および第1のオーバーハングおよび第2のオーバーハングを含み、各オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、iv)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第1および第2のオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的な少なくとも2つのオリゴヌクレオチドオーバーハング識別配列を含み、v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;b)ハイブリダイゼーション産物と、ハイブリダイゼーション産物を1つまたは複数の切断部位で切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることによって、切断されたハイブリダイゼーション産物を形成するステップと;c)切断されたハイブリダイゼーション産物と鎖置換ポリメラーゼとを接触させることによって、平滑末端化された核酸断片を形成するステップとを含む方法が、提供される。
一部の態様では、複数のオリゴヌクレオチド種を含む組成物であって、a)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、切断条件下で切断され得る1つまたは複数の切断部位を含み;b)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖および第1のオーバーハングおよび第2のオーバーハングを含み、各オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第1および第2のオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的な少なくとも2つのオリゴヌクレオチドオーバーハング識別配列を含む、組成物も、提供される。
一部の態様では、核酸末端を修飾する方法であって、a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に1つまたは複数の修飾ヌクレオチドを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、ii)標的核酸の一部またはすべてが、オーバーハングを含み、iii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iv)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;b)ハイブリダイゼーション産物と鎖置換ポリメラーゼとを接触させることによって、平滑末端化された核酸断片を形成するステップとを含む方法が、提供される。
一部の態様では、複数のオリゴヌクレオチド種を含む組成物であって、a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に1つまたは複数の修飾ヌクレオチドを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;b)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、組成物も、提供される。
一部の態様では、核酸末端を修飾する方法であって、a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、2本の鎖を含み、第1の末端にオーバーハングを含み、第1の末端のオーバーハングが、パリンドローム配列を含み、ii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、第2の末端にオーバーハングを含み、第2の末端のオーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有の第2の末端のオーバーハング配列およびオーバーハング長を有し、iii)標的核酸の一部またはすべてが、オーバーハングを含み、iv)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第2の末端のオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、v)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含み、vi)第1の末端のオーバーハングが、他の第1の末端のオーバーハングとハイブリダイズし、第2の末端のオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによって環状ハイブリダイゼーション産物が形成される、ステップと;b)ハイブリダイゼーション産物とエキソヌクレアーゼとを接触させることによって、エキソヌクレアーゼ処理されたハイブリダイゼーション産物を生成するステップと;c)エキソヌクレアーゼ処理されたハイブリダイゼーション産物をせん断することによって、エキソヌクレアーゼ処理され、せん断されたハイブリダイゼーション産物を生成するステップと;d)オリゴヌクレオチド種における配列を含む断片を、オリゴヌクレオチド種における配列を含まない断片から分離することによって、エキソヌクレアーゼ処理され、せん断され、分離されたハイブリダイゼーション産物を生成するステップとを含む方法が、提供される。
一部の態様では、複数のオリゴヌクレオチド種を含む組成物であって、a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、2本の鎖を含み、第1の末端にオーバーハングを含み、第1の末端のオーバーハングが、パリンドローム配列を含み;b)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、第2の末端にオーバーハングを含み、第2の末端のオーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有の第2の末端のオーバーハング配列およびオーバーハング長を有し;c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第2の末端のオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み;d)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、組成物も、提供される。
一部の態様では、核酸末端を修飾する方法であって、a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、(1)2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、ii)標的核酸の一部またはすべてが、オーバーハングを含み、iii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iv)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;b)ハイブリダイゼーション産物と鎖置換ポリメラーゼとを接触させることによって、平滑末端化された核酸断片を形成するステップとを含む方法が、提供される。
一部の態様では、複数のオリゴヌクレオチド種を含む組成物であって、a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、i)2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含むか、またはii)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;b)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、組成物も、提供される。
一部の態様では、核酸末端を修飾する方法であって、標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップを含み、a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、RNAヌクレオチドを含む少なくとも1つのオーバーハングを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、b)標的核酸の一部またはすべてが、オーバーハングを含み、c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み;d)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、方法が、提供される。
一部の態様では、複数のオリゴヌクレオチド種を含む組成物であって、a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、RNAヌクレオチドを含む少なくとも1つのオーバーハングを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;b)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、組成物も、提供される。
一部の態様では、核酸ライブラリーを生成する方法であって、a)標的核酸を含む核酸組成物とオリゴヌクレオチド種の第1のプールとを結合させるステップであって、i)標的核酸の一部またはすべてがオーバーハングを含み、ii)オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、iii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iv)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含み、v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物とオリゴヌクレオチド種の第1のプールが結合し、それによって結合産物の第1のセットが形成される、ステップと;b)結合産物の第1のセットを切断することによって、切断産物を形成するステップと;c)切断産物とオリゴヌクレオチド種の第2のプールとを結合させるステップであって、i)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第1の末端および第2の末端を含み、ii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第2のプライマー結合ドメインを含み、第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なり、iii)オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、第1の末端において、切断産物の少なくとも1つの末端に結合する条件下で、切断産物とオリゴヌクレオチド種の第2のプールが結合し、それによって結合産物の第2のセットが形成される、ステップとを含む方法が、提供される。
一部の態様では、a)オリゴヌクレオチド種の第1のプールであって、i)オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、ii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含む、第1のプールと;b)オリゴヌクレオチド種の第2のプールであって、i)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第1の末端および第2の末端を含み、ii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第2のプライマー結合ドメインを含む、第2のプールとを含み;第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なる、組成物も、提供される。
一部の態様では、核酸ライブラリーを生成する方法であって、a)標的核酸を含む核酸組成物とオリゴヌクレオチド種の第1のプールとを結合させるステップであって、i)標的核酸の一部またはすべてがオーバーハングを含み、ii)オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを第1の末端に含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、iii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iv)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含み、v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物とオリゴヌクレオチド種の第1のプールが結合し、それによって結合産物の第1のセットが形成される、ステップと;b)結合産物の第1のセットを切断することによって、切断産物を形成するステップと;c)切断産物とオリゴヌクレオチド種の第2のプールとを結合させるステップであって、i)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第1の鎖および第2の鎖を含み、第1の鎖が、第2の鎖より短く、第1の鎖と第2の鎖が、オリゴヌクレオチドの第1の末端において相補的であり、第2の鎖が、オリゴヌクレオチドの第2の末端における一本鎖を含み、ii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、オリゴヌクレオチド種の第2のプールに特異的なオリゴヌクレオチド識別配列を含み、iii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第2の鎖上に第2のプライマー結合ドメインを含み、第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なり、iv)オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、切断産物の少なくとも1つの末端に結合する条件下で、切断産物とオリゴヌクレオチド種の第2のプールが結合し、それによって結合産物の第2のセットが形成される、ステップとを含む方法が、提供される。
一部の態様では、a)オリゴヌクレオチド種の第1のプールであって、i)オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、ii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含む、第1のプールと;b)オリゴヌクレオチド種の第2のプールであって、i)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第1の鎖および第2の鎖を含み、第1の鎖が、第2の鎖より短く、第1の鎖と第2の鎖が、オリゴヌクレオチドの第1の末端において相補的であり、第2の鎖が、オリゴヌクレオチドの第2の末端における一本鎖を含み、ii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチド種の第2のプールに特異的なオリゴヌクレオチド識別配列を含み、iii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第2の鎖上に第2のプライマー結合ドメインを含む、第2のプールとを含み;第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なる、組成物も、提供される。
一部の態様では、核酸ライブラリーを生成する方法であって、a)標的核酸を含む核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸を生成するステップであって、標的核酸の一部またはすべてが、オーバーハングを含む、ステップと;b)脱リン酸化された標的核酸と複数のオリゴヌクレオチド種とを結合させるステップであって、i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、ii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iii)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップとを含む方法が、提供される。
一部の態様では、核酸を解析する方法であって、a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、i)標的核酸の一部またはすべてがオーバーハングを含み、ii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、iii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、iv)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;b)ハイブリダイゼーション産物またはそれらの増幅産物をシーケンシングプロセスによりシーケンシングすることによって、配列リードを生成するステップであって、配列リードが、フォワード配列リードおよびリバース配列リードを含む、ステップと;c)リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析することによって解析を生成し、フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除するステップとを含む方法が、提供される。
一部の態様では、核酸の集団をアッセイする方法であって、試料中の核酸の集団の核酸オーバーハングをアッセイするステップであって、それによって集団のオーバーハングプロファイルを生成するステップと;オーバーハングプロファイルに基づいて、試料の特性を判定するステップとを含む方法が、提供される。
一部の実施形態では、本明細書に記載されるある特定の方法またはある特定の方法の部分を実行する、システム、機械およびコンピュータプログラム製品も、提供される。
ある特定の実施形態は、下記の説明、実施例、特許請求の範囲および図面でさらに説明される。
図面は、本技術のある特定の実施形態の説明に役立つものであり、限定するものではない。説明を明確かつ容易にするために、図面は、正確な縮尺で作成されたものではなく、一部の事例では、様々な態様が、特定の実施形態の理解を助長するために、誇張または拡大して示されることがある。
図1A〜図1Cは、ヘアピンアダプター構成の例を示す。図1Aは、Illuminaプライミング部位(P5およびP7)が組み込まれており、チミン−アデニン(TA)ライゲーション用の単一の3’オーバーハングチミン(T)と、リン酸化された5’末端とを有する、シーケンシングアダプターのステムループ構造を示す。図1Bは、リン酸化されているのではなく、存在するオーバーハング(OV)のタイプおよび長さを示す固有末端識別子(UEI)を含む、アダプターを示す。図1Cは、固有分子識別子(UMI)をさらに含むアダプターを示す。ヌクレアーゼ活性によるチューバックを防止するために、オリゴ/アダプターの両方の末端の最後の2塩基間にホスホロチオエート結合が存在する。、ホスホロチオエート結合。G、グアニン(RNA塩基)。T、チミン。UEI、固有末端識別子。UMI、固有分子識別子。OV、オーバーハング。P、リン酸。P5、Illumina P5アダプター配列。P7、Illumina P7アダプター配列。 図2Aは、短い挿入物を有するアダプター(上部)または長い挿入物を有するアダプター(下部)の例を示す。5’オーバーハングを有する、短い挿入物のアダプターの例が、上部左側に示されており、3’オーバーハングを有する、短い挿入物のアダプターの例が、上部右側に示されている。OV、オーバーハング。UEI、固有末端識別子。A、アデニン。U、ウラシルまたはデオキシウリジン。図2Bは、3’オーバーハングを有する、短い挿入物のアダプターを使用する、ワークフローの例を示す。第1のステップは、DNA鋳型をリン酸化することを含む。ここに例示されているように、鋳型の例は、上および下の鎖上に3’オーバーハングを有する。次のステップは、リン酸化された鋳型に3’オーバーハングUEIアダプターをライゲーションすることを含む。示されているように、ニックがライゲーション産物に存在する。さらなるステップは、UEIアダプターDNA鎖をデオキシウリジンで酵素的に切断することを含む。さらなるステップは、鎖置換ポリメラーゼを使用してニックでフィルインして、完全な二本鎖分子を形成することを含む。無処理のままであるまたはフィルインされた、ライゲーションされていないまたは残留UEIアダプターを、消失させることができる。A、アデニン。U、ウラシルまたはデオキシウリジン。P、リン酸。 同上。 図3は、元のDNA抽出物(サイズ選択されていない)からの、ならびに二重SPRI選択によって高分子量(HMW)および低分子量(LMW)断片へとサイズ選択された、マッピングされたライブラリー分子長を示す。パネルAは、indiv1全DNA、精製スタイル1についての結果を示す。パネルBは、indiv1全DNA、精製スタイル2についての結果を示す。パネルCは、indiv1 HMW画分についての結果を示す。パネルDは、indiv1 LMW画分についての結果を示す。パネルEは、indiv2 LMW画分についての結果を示す。パネルFは、indiv2 HMW画分についての結果を示す。 図4は、固有末端識別子(UEI、「バーコード」)が、末端上に存在しない(0)、1つの末端上に存在する(1)、または両方の末端に正しく存在する(2)、ペアエンドでマッピングされたリードを示す。パネルAは、indiv1全DNA、精製スタイル1についての結果を示す。パネルBは、indiv1全DNA、精製スタイル2についての結果を示す。パネルCは、indiv1 HMW画分についての結果を示す。パネルDは、indiv1 LMW画分についての結果を示す。パネルEは、indiv2 LMW画分についての結果を示す。パネルFは、indiv2 HMW画分についての結果を示す。 図5は、様々な位置に遮断物がある固有末端識別子(UEI)アダプターの例を示す。 図6は、遮断された固有末端識別子(UEI)アダプターのリン酸化された鋳型へのライゲーション、ニックでのフィルイン、および平滑末端化された二本鎖分子の作出を含む、ワークフローの例を示す。P、リン酸。UEI、固有末端識別子。イソ−dC、イソデオキシ−シトシン。 図7A〜図7Cは、シーケンシングライブラリー中の無細胞DNA断片についての、ホスファターゼ処理なし(図7A)、無細胞DNA鋳型のホスファターゼ処理(図7B)、ならびに鋳型およびライブラリーアダプターのホスファターゼ処理(図7C)という3つの条件下での、サイズ分布を示す、テープステーション結果(すなわち、Agilent Tapestation 4200)を示す。アダプター−ダイマーアーチファクトは、約120bpで予想される。1ヌクレオソームは、280〜290bpでピークに達し、追加のヌクレオソームごとに約170bpずつ増すと予想される。図7A〜図7Cは、アダプターダイマーの低減および無細胞DNA関連ピークの相対的増加により例証される、ホスファターゼ処理後の改善を実証する。 同上。 同上。 図8Aは、1つの5’パリンドロームオーバーハングを有し、かつ、様々な長さの5’および3’ランダムオーバーハングを有する、アダプターセットの例を示す。図8Bは、ネイティブ5’および3’オーバーハングを有する、長いdsDNA断片(高分子量(HMW)DNA鋳型)にライゲーションされたオーバーハングアダプターセットを示す。図8Bの説明図は、上から下へ、「メイトペア」DNA調製のステップ3(ライゲーション)、ステップ5(せん断)およびステップ6(ビオチン化断片を単離する)後の例を示す。UEI、固有末端識別子。OV、オーバーハング。 同上。 図9Aは、第1相で鎖置換ポリメラーゼを使用して固有末端識別子(UEI)配列を結合させ、第2相でシーケンサー特異的配列(例えば、シーケンシングアダプター)を結合させる方法の例を示す。パネルAは、固有末端識別子(UEI)配列(灰色で示す)およびランダム配列(黒色で示す)で構成されている、Yアダプター(左側)およびヘアピンアダプター(右側)を示す。一部の事例では、Yアダプターは、ヘアピンアダプターの切断されたバージョンである。パネルBは、標的核酸へのヘアピンアダプターのライゲーションを示し、このライゲーション産物を切断することができる。切断後のライゲーション産物は、Y−アダプターライゲーション産物と同じである。パネルCは、完全相補的二本鎖の平滑末端化された断片を作出するための鎖置換ポリメラーゼによるニックでのフィルインステップを示す。パネルDは、最適な任意のシーケンシングライブラリー調製のための準備が整った状態である核酸断片(第2相)を示す。X、切断可能な部位。UEI、固有末端識別子。OV、オーバーハング。P、リン酸。 図9Bは、ネイティブ核酸断片の末端にYアダプターまたはヘアピンアダプターを結合させる方法を示す。パネルAは、オーバーハングと、固有末端識別子(UEI)配列(灰色で示されている)と、プライミング配列(プライミング配列1(例えば、Illumina P5プライミング配列)およびプライミング配列2(例えば、Illumina P7プライミング配列);黒色で示されているプライミング領域)とで構成されている、Yアダプター(左側)およびヘアピンアダプター(右側)を示す。パネルBは、標的核酸へのアダプターのライゲーションを示す。アダプターがリン酸化されないので、ライゲーションは、鋳型の5’末端でのみ起こり、ニックが残る。パネルCは、5’アダプター鎖がリン酸化され、アダプターの3’末端をライゲーションすると、ニックが修復されることを示す。ニック修復後、ヘアピンアダプターライゲーション産物を切断部位で切断することができる(上部)。切断後のライゲーション産物は、Y−アダプターライゲーション産物と同じである(下部)。この方法は、最適な任意のシーケンシングライブラリー調製のための準備が整った状態である二本鎖核酸断片(第2相)、および/または最適なシーケンサーための準備が整った状態である二本鎖核酸断片を生成し、これは、使用されるプライミング配列に依存し得る。OV、オーバーハング。P、リン酸。P1、プライミング配列1。P2、プライミング配列2。 図10A〜10Cは、RNA塩基含有オーバーハング(「RNAオーバーハング」)を有するオリゴヌクレオチドアダプターを使用して固有末端識別子(UEI)配列をネイティブDNA鋳型に結合させる方法の例を示す。図10Aは、RNAオーバーハングを有するオリゴヌクレオチドアダプターの構成の例を示す。黒色の領域は、シーケンサー特異的アダプター配列(例えば、P5、P7)を有するまたは有さない、非相補的塩基または遮断塩基を表す。図10Bおよび10Cは、RNAオーバーハング末端をリン酸化DNA鋳型にライゲーションし、その結果、DNA−RNA二重鎖を作出する方法の例を示す。オリゴヌクレオチドアダプター構成に依存して、リガーゼまたは標準的な鎖置換フィルインにより、ニックを修復することができる。二本鎖RNA(dsRNA)を有するアダプターダイマーを消化することができる。X、切断可能な部位。UEI、固有末端識別子。OV、オーバーハング。P、リン酸。 同上。 同上。 図11は、オリゴヌクレオチドアダプターを高分子量(HMW)DNAに結合させる方法を示す。 図12は、オリゴヌクレオチドアダプターを高分子量(HMW)DNAに結合させる方法を示す。 図13は、オリゴヌクレオチドアダプター設計を示す。 図14は、オリゴヌクレオチドアダプターを高分子量(HMW)DNAに結合させる方法を示す。 図15は、感度実験の結果を示す。オーバーハング配列は、それらがリバースリードに存在した場合にのみ考慮される。パネルA:100%機械的せん断DNAの2つの複製ライブラリーにわたってのオーバーハングカウントであって、合計で割った1ライブラリー当たりのオーバーハングカウント。値は、2つのライブラリーにわたっての平均値であり、エラーバーは、最大値および最小値を示す。パネルB:100%MluCI消化DNAの2つの複製ライブラリーにわたってのオーバーハングカウントであって、合計で割った1ライブラリー当たりのオーバーハングカウント。値は、2つのライブラリーにわたっての平均値であり、エラーバーは、最大値および最小値を示す。パネルC:MluCIの濃度の増加に伴うMluCI標的配列存在量。MluCI消化DNAのパーセントが増加するにつれて(x軸)、5’オーバーハング配列の中のその標的配列(AATT)の出現頻度が増加する(y軸)。複製ライブラリーが利用可能な場合、エラーバーは、最小値および最大値を示す。パネルD:MluCI標的配列は、1%MluCI消化DNAの場合であっても識別可能である。点は、すべてのオーバーハング配列のカウントの総和で割った1ライブラリー当たりの個々のオーバーハング配列のカウントである。機械的せん断DNAのみの2つの複製ライブラリーにわたってのカウント平均値(x軸)が、1%MluCI消化DNAの2つの複製ライブラリーにわたってのカウント平均値(y軸)に対して示されている。機械的せん断DNAにおけるカウントを予想値として使用して、1%MluCI消化DNAにおける各カウントのパーセント誤差を計算した。小数点第3位に丸められたこの値が分布の99.9パーセンタイルに入るまたはそれより高いすべての配列が、示されている。標的配列(AATT)は、最高パーセント誤差(6.2%;99.9パーセンタイル;p<0.001)を有する。 図16は、ミクロコッカスヌクレアーゼ(制限エンドヌクレアーゼMluCI)により作出されたオーバーハングについてのオーバーハングプロファイルおよび塩基組成を示す。結果は、2つの独立したライブラリーの代表値である;オーバーハング存在量プロット上のエラーバーは、最大値および最小値を示す。ライブラリーの投入DNAは、GM12878細胞から抽出されたヒトゲノムDNAである。 図17は、対照オリゴのヒトcfDNA長およびオーバーハングプロファイルに対する採血チューブの効果を示す。予想対照オリゴオーバーハング長と実測対照オリゴオーバーハング長との差異は、RTTにおける4時間までのおよび24時間までのYTTにおけるオーバーハング長の喪失を実証する。−1(1塩基分チューバックされた)と−5(分布の99パーセンタイル)の間の予想長との差異の出現頻度が示されている。PBS、リン酸緩衝食塩水 pH7.4(対照)。RTT、赤色キャップのチューブ(血清)。PTT、紫色キャップのチューブ(EDTAカリウム塩)。YTT、黄色キャップのチューブ(クエン酸塩)。Control、スパイクも抽出も施されていない対照オリゴ。 図18は、オーバーハング判定の精度を示す。フォワードリードのみからのUEIに対するリバースリードのみからのUEIデータ。オーバーハング判定の精度は、リバースリードの平滑形でないUEIのみが考慮されたとき最も高い。X軸:リバースリードにおける非平滑形UEIを除外する、正しい対照オリゴの正しい末端にライゲーションされたUEIのパーセント。Y軸:同じ値、しかしフォワードリードにおける非平滑形UEIを除外する。 図19は、提案ギャップおよびフラップの概略図を示す。ライブラリー調製プロトコールは、2つの別々の反応でライゲーションを完了する。黒色の丸は、リン酸が鋳型の5’末端に存在する、第1のライゲーションを表す。アダプターにはリン酸がないため、リン酸をアダプターの5’末端に付加するために第2のライゲーションイベント(白丸)が必要であり、これにより二本鎖ライブラリー分子の完全形成が可能になる。P5アダプターは、フォワードリードにあり、P7アダプターは、リバースリードにある。次のことが観測された:1)2本の元の鎖のうちの一方のみの過剰、および2)P5 UEIがP7 UEIより不正確である。まとめると、これらの観測により、ライゲーション中のオーバーハングのギャップおよびフラップに起因し得るいくつかの失敗モードの存在が明らかになった。描かれているような、1つの平滑末端と1つのオーバーハングとを有する鋳型を仮定すると、アダプターライゲーション中のいくつかの失敗モードは、2本の鎖のうちの1本を喪失させ得る。上のパネルは、5’オーバーハングの長さのミスマッチがギャップを生じさせる、誤りモードを示す。下のパネルは、3’オーバーハングの長さのミスマッチがフラップを生じさせる、誤りモードを示す。両方の場合、これらの誤りは、第1のライゲーション(黒色)中に「誤った」共有結合を余儀なくさせ、その結果、第2のライゲーション(白色)が阻害される。これは、1本の鎖のみの変換、および他の鎖の喪失をもたらす。さらに、これらの場合、P5 UEIは、間違ったオーバーハング長を報告することになるが、P7 UEIは、正しい。P7 UEIのはるかに高い精度が、それらが平滑形またはオーバーハングであるときに観測され、この理由のため、ある特定の解析中にP7 UEIを使用した。可能性は低いが、3’オーバーハングにギャップがまたは5’オーバーハングにフラップが生じた場合、どちらの鎖もライブラリーに変換されないと予想される。 図20は、本明細書に記載されるオーバーハングアダプターを使用して生成された各ライブラリーに存在するDNAオーバーハングのシーケンシングデータから生成されたヒートマップを示す。このヒートマップは、ウォードの階層的クラスタリング法を使用して生成された。各列は、がんドナー(黒色バー)または健康なドナー(バーなし)からの単一無細胞DNAライブラリーを表す。各行は、長さ1〜6ヌクレオチドの固有オーバーハング(5’または3’)を表し、少なくとも1つのCGジヌクレオチド、すなわちCpGを含有する行(オーバーハング)が灰色バーで示されている。ヒートマップ行列内では、色が濃いほど、そのオーバーハングが占めるライブラリー内での(対数スケールで描かれた)比率が増す。より薄い色は、そのオーバーハングの枯渇を示す。図の下部の目盛り:N=50 報告されたがんなし;N=21 がん。 図21は、ある特定のモデルで使用された変数を示す。 図22は、健康な試料に対してがん試料についてのロジスティック回帰分類器を示す。 図23は、健康な試料に対してがん試料についての分類レポートおよび受診者動作特性(ROC)を示す。 図24は、健康な試料に対して消化管(GI)がん試料についてのモデル要約を示す。 図25は、他の試料(健康および他のがんを含む)に対して消化管(GI)がん試料についてのモデル要約を示す。
核酸の解析に有用な方法および組成物が、本明細書で提供される。核酸ライブラリーの生成に有用な方法および組成物も、本明細書で提供される。核酸断片の末端の解析に有用な方法および組成物も、本明細書で提供される。ある特定の態様では、方法は、試料核酸とオリゴヌクレオチドとを結合させるステップを含む。一部の実施形態では、1つまたは複数のオリゴヌクレオチドは、試料核酸中のオーバーハングとハイブリダイズすることができるオーバーハングを含む。一部の実施形態では、1つまたは複数のオリゴヌクレオチドは、試料核酸中の平滑末端にライゲーションすることができる平滑末端を含む。一部の実施形態では、オリゴヌクレオチドは、各々、少なくとも1つのオリゴヌクレオチドオーバーハング識別配列を含む。オリゴヌクレオチドは、異なる長さおよび異なる配列のオーバーハングを含むことができ、オーバーハング識別配列は、対応するオーバーハングの長さに特異的であり得る(およびオーバーハングの他の特徴に特徴的であり得る)。一部の実施形態では、オリゴヌクレオチドは、切断部位を含む。一部の実施形態では、オリゴヌクレオチドは、ヘアピン構造を形成することができる。一部の実施形態では、オリゴヌクレオチドは、2本の鎖を含み、第1の末端にオーバーハングがあり、第2の末端に2本の非相補鎖がある。一部の実施形態では、試料核酸とオリゴヌクレオチドは、オリゴヌクレオチド中のオーバーハングが、対応する長さおよび相補配列を有する試料核酸中のオーバーハングとハイブリダイズする条件下で結合し、それによってハイブリダイゼーション産物が形成される。一部の実施形態では、ハイブリダイゼーション産物は、環状化核酸断片を含む。一部の実施形態では、方法は、平滑末端化核酸断片を生成するステップを含む。そのようなハイブリダイゼーション産物および/または平滑末端化核酸断片は、例えば、核酸ライブラリーの生成に、および/またはさらに解析もしくは処理に、有用であり得る。
核酸末端
核酸を解析するための方法および組成物が、本明細書で提供される。方法は、核酸末端を修飾するステップおよび/または解析するステップを含み得る。核酸末端は、核酸断片の末端を指す。一般に、直鎖状核酸断片は、2つの末端(すなわち、最初の部分と最後の部分)を含有する。そのような末端は、5’末端および3’末端と呼ばれることが多い。非直鎖状断片は、2つより多くの末端を含有し得る(例えば、分岐型断片は、3つまたはそれより多くの末端を含み得る)。二本鎖断片の場合、核酸末端は、オーバーハングを含有することもあり、または平滑末端化されていることもある(すなわち、オーバーハングを含有しない)。用語オーバーハングまたはオーバーハング領域は、一般に、核酸末端の一本鎖部分を指す。例えば、核酸断片は、1つまたは複数の対合ヌクレオチド(塩基)を含む二本鎖または「二重鎖」領域、および1つまたは複数の不対合ヌクレオチド(塩基)を含む一本鎖または「オーバーハング」領域を含み得る。通常は、オーバーハングは、核酸分子の末端の一本鎖領域を指し、二本鎖領域が隣接している一本鎖領域を指さない。オーバーハングは、5’オーバーハングであることもあり、または3’オーバーハングであることもある。5’オーバーハングは、二重鎖部分が終わり、一本鎖部分が始まる、接合部で開始し、オーバーハングの末端(遊離末端)で終わる、3’から5’の方向に従来の核酸方向性に従って読み取られる、核酸分子の末端の一本鎖領域を一般に指す。3’オーバーハングは、二重鎖部分が終わり、一本鎖部分が始まる、接合部で開始し、オーバーハングの末端(遊離末端)で終わる、5’から3’の方向に従来の核酸方向性に従って読み取られる、核酸分子の末端の一本鎖領域を一般に指す。
標的核酸は、1つのオーバーハングを(例えば、核酸断片の末端に)含むこともあり、2つのオーバーハングを(例えば、核酸断片の両方の末端に)含むこともある。標的核酸は、2つのオーバーハング、1つのオーバーハングと1つの平滑末端、2つの平滑末端、またはこれらの組合せを含むことがある。標的核酸は、2つの3’オーバーハング、2つの5’オーバーハング、1つの3’オーバーハングと1つの5’オーバーハング、1つの3’オーバーハングと1つの平滑末端、1つの5’オーバーハングと1つの平滑末端、2つの平滑末端、またはこれらの組合せを含むことがある。一部の実施形態では、標的核酸中のオーバーハングは、ネイティブオーバーハングである。一部の実施形態では、標的核酸末端は、ネイティブ平滑末端である。ネイティブオーバーハングおよびネイティブ平滑末端は、本明細書に記載される試料組成物とオリゴヌクレオチドとを結合させるステップの前の、修飾されていない(例えば、フィルインされていない、切断も消化も(例えば、エンドヌクレアーゼまたはエキソヌクレアーゼにより)されていない、付加されても、付加してもいない)、オーバーハングおよび平滑末端を一般に指す。多くの場合、ネイティブオーバーハングおよびネイティブ平滑末端は、本明細書に記載される試料組成物とオリゴヌクレオチドとを結合させるステップの前の、ex vivoで修飾されていない(例えば、ex vivoでフィルインされていない、ex vivoで切断も消化も(例えば、エンドヌクレアーゼまたはエキソヌクレアーゼにより)されていない、ex vivoで付加されても、付加してもいない)、オーバーハングおよび平滑末端を一般に指す。ある特定の事例では、ネイティブオーバーハングおよびネイティブ平滑末端は、対象または供給源から収集後に修飾されていない(例えば、対象または供給源からの収集後にフィルインされていない、対象または供給源からの収集後に(例えば、エンドヌクレアーゼまたはエキソヌクレアーゼにより)切断も消化もされていない、対象または供給源からの収集後に付加されても、付加してもいない)、オーバーハングおよび平滑末端を一般に指す。ネイティブオーバーハングおよびネイティブ平滑末端は、単離された試料を切断作用因子(例えば、エンドヌクレアーゼ、エキソヌクレアーゼ、制限酵素)および/またはポリメラーゼと接触させることにより作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、機械的せん断(例えば、超音波処理(例えば、CovarisによるAdaptive Focused Acoustics(商標)(AFA)プロセス))により作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、単離された試料をエキソヌクレアーゼ(例えば、DNAse)と接触させることにより作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、増幅(例えば、ポリメラーゼ連鎖反応)により作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、固体支持体に結合された、別の分子のコンジュゲートされた、またはベクターにクローニングされたオーバーハング/末端を、一般に含まない。一部の実施形態では、ネイティブオーバーハングおよびネイティブ平滑末端は、脱リン酸化に付されることがあり、脱リン酸化されたネイティブオーバーハングおよび脱リン酸化されたネイティブ平滑末端と呼ばれることがある。一部の実施形態では、ネイティブオーバーハングおよびネイティブ平滑末端は、リン酸化に付されることがあり、リン酸化されたネイティブオーバーハングおよびリン酸化されたネイティブ平滑末端と呼ばれることがある。
オリゴヌクレオチド
一部の実施形態では、核酸(例えば、試料からの核酸;標的核酸)は、オリゴヌクレオチドと結合される。オリゴヌクレオチドは、標的核酸とは明確に異なる核酸(例えば、DNA、RNA)ポリマーを一般に指し、オリゴ、アダプター、オリゴヌクレオチドアダプター、およびオリゴアダプターと呼ばれることがある。オリゴヌクレオチドは、短い長さ(例えば、50bp未満、40bp未満、30bp未満、20bp未満、10bp未満、5bp未満)であり得、常にではないが標的核酸より短いことがある。オリゴヌクレオチドを人工的に合成することができる。一部の実施形態では、核酸(例えば、試料からの核酸;標的核酸)は、複数のオリゴヌクレオチド種とまたはオリゴヌクレオチド種のプールと結合される。オリゴヌクレオチド種のプールは、オリゴヌクレオチド種のセットと呼ばれることがあり、複数の異なるオリゴヌクレオチド種を含むことがある。本明細書における方法および組成物は、オリゴヌクレオチド種の1つより多くのプール(例えば、オリゴヌクレオチド種の第1のプールおよびオリゴヌクレオチド種の第2のプール)を含むことがある。そのような事例では、第1のプール内のオリゴヌクレオチドは、共通の特徴を共有することができ、第2のプール内のオリゴヌクレオチドは、異なる共通の特徴を共有することができる。プール内の共通の特徴としては、特定のドメインおよび/または特定の修飾を挙げることができる。一部の実施形態では、プール内の共通の特徴は、共通のプライマー結合ドメインを含む。
オリゴヌクレオチドの種は、他のオリゴヌクレオチド種に対して固有である特徴を一般に含有する。例えば、オリゴヌクレオチド種は、固有のオーバーハング特徴を含有することができる。固有のオーバーハング特徴としては、固有のオーバーハング長、固有のオーバーハング配列、または固有のオーバーハング配列とオーバーハング長の組合せを挙げることができる。例えば、オリゴヌクレオチド種は、特定のオーバーハング長について、所与のオーバーハング長を有する他のオリゴヌクレオチド種に対して固有の配列を含有することができる。一部の事例では、オリゴヌクレオチド種は、特定のオーバーハング長およびタイプ(例えば、5’または3’)について、所与のオーバーハング長およびタイプを有する他のオリゴヌクレオチド種に対して固有の配列を含有する。
オリゴヌクレオチドは、1つのオーバーハングを(例えば、オリゴヌクレオチドの1つの末端に)含むこともあり、2つのオーバーハングを(例えば、オリゴヌクレオチドの両方の末端に)含むこともある。一部の実施形態では、オリゴヌクレオチドは、2つのオーバーハング、1つのオーバーハングと1つの平滑末端、2つの平滑末端、またはこれらの組合せを含む。一部の実施形態では、オリゴヌクレオチドは、2つの3’オーバーハング、2つの5’オーバーハング、1つの3’オーバーハングと1つの5’オーバーハング、1つの3’オーバーハングと1つの平滑末端、1つの5’オーバーハングと1つの平滑末端、2つの平滑末端、またはこれらの組合せを含む。一部の実施形態では、オリゴヌクレオチドは、2本の鎖を含み、第1の末端にオーバーハングまたは平滑末端があり、第2の末端に2本の非相補鎖がある。本明細書に記載されるヘアピン構造オリゴヌクレオチドの場合、そのようなオリゴヌクレオチド(例えば、未切断状態のもの)は、一般に、1つのオーバーハング(例えば、5’オーバーハングまたは3’オーバーハング)を含み、ある特定の事例では、オーバーハングを含まない(すなわち、平滑末端を含む)。一般に、オリゴヌクレオチドオーバーハングは、標的核酸オーバーハングとハイブリダイズすることができる。オリゴヌクレオチドオーバーハングは、標的核酸オーバーハング中の領域と相補的である領域を含み得る。一部の実施形態では、オリゴヌクレオチドオーバーハングの全長は、標的核酸オーバーハングの全長とハイブリダイズすることができる。したがって、全オリゴヌクレオチドオーバーハングは、全核酸オーバーハングと相補的であり得る。
多くの場合、「相補的」または「相補性」は、本明細書に記載の配列相補性を指し、「非相補的」または「非相補性」は、本明細書に記載の配列非相補性を指す。ある特定の態様では、「相補的」または「相補性」は、構造的相補性(例えば、オーバーハング相補性)を指すことがある。例えば、5’の8塩基対オーバーハングを有する標的核酸は、5’の8塩基対オーバーハングを有するオリゴヌクレオチドと構造的相補性を有することができる。構造的相補性は、非特異的塩基対合を含み得る。ある特定の実施形態では、オリゴヌクレオチドオーバーハングは、標的核酸中の塩基との非特異的塩基対合が可能である1つまたは複数のヌクレオチドを含む。例えば、5’の8塩基対オーバーハングを有する標的核酸は、5’の8塩基対オーバーハングを有するオリゴヌクレオチドと構造的相補性を有することができ、オリゴヌクレオチドオーバーハングは、標的核酸オーバーハング中の対応する位置における可能性のある塩基のすべてまたは一部と非特異的に対合することができる1つまたは複数のヌクレオチドを含む。ある特定の実施形態では、オリゴヌクレオチドオーバーハングは、すべてが標的核酸中の塩基との非特異的塩基対合が可能である、ヌクレオチドを含む。非特異的塩基対合が可能であるヌクレオチドは、「ユニバーサル塩基」と呼ばれることがあり、これは、上記の4つの典型的な塩基のいずれかを置換することができるものであり(例えば、ニトロインドール、5−ニトロインドール、3−ニトリピロール、イノシン、デオキシイノシン、2−デオキシイノシン)、または「縮重/ゆらぎ塩基」と呼ばれることがあり、これは、4つの典型的な塩基の(すべてではないが)2つまたは3つを置換することができるものである(例えば、非天然塩基PおよびK)。ある特定の実施形態では、オリゴヌクレオチドオーバーハングは、1つまたは複数のユニバーサル塩基を含む。ある特定の実施形態では、オリゴヌクレオチドオーバーハングは、ユニバーサル塩基からなる。
一部の実施形態では、複数のオリゴヌクレオチド種のうちのまたはオリゴヌクレオチド種のプール内の各オリゴヌクレオチドは、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む。オリゴヌクレオチドオーバーハング識別配列は、オーバーハング識別配列、識別配列、オリゴヌクレオチドオーバーハング識別ポリヌクレオチド、オーバーハング識別ポリヌクレオチド、識別ポリヌクレオチド、バーコード、可変オーバーハングバーコード、固有末端識別子(UEI)、末端識別子、または識別子と呼ばれることがある。オーバーハング識別配列は、そのそれぞれのオリゴヌクレオチドに存在するオーバーハングを一意的に識別し、オリゴヌクレオチドオーバーハングが特異的にハイブリダイズする標的核酸に存在するオーバーハングの各タイプ(例えば、長さ、5’もしくは3’、および/またはこれらに類するもの)を一意的に識別することができる。ある特定の実施形態では、オーバーハング識別配列は、オリゴヌクレオチドオーバーハングが特異的にハイブリダイズする標的核酸に存在するネイティブオーバーハングの各タイプ(例えば、長さ、5’もしくは3’、および/またはこれらに類するもの)を一意的に識別することができる。多くの場合、異なる長さのオーバーハングとハイブリダイズするオリゴヌクレオチドオーバーハングに特異的なオーバーハング識別配列は、互いに異なり、固有のものである。通常は、i)異なる長さのオーバーハングとハイブリダイズするオリゴヌクレオチドオーバーハングにおよびii)異なるタイプ(すなわち、3’、5’)のオリゴヌクレオチドオーバーハングに特異的なオーバーハング識別配列は、互いに異なり、固有のものである。一般に、異なる長さのオーバーハングを有する、複数のオリゴヌクレオチド種またはオリゴヌクレオチド種のプールには、オリゴヌクレオチドオーバーハングの長さに特異的な2つのオーバーハング識別配列はない。言い換えると、オリゴヌクレオチドオーバーハングの所与の長さに特異的である所与のオーバーハング識別配列(または配列のセット)は、そのような所与の長さのオーバーハングを有するオリゴヌクレオチドにのみ存在することになる。異なるオーバーハング長を有するオリゴヌクレオチドは、異なるオーバーハング識別配列(または配列のセット)を含むことになる。一部の実施形態では、特定の長さのオーバーハングを有するすべてのオリゴヌクレオチド種に対して1つのオーバーハング識別配列がある。一部の実施形態では、特定の長さのオーバーハングを有するすべてのオリゴヌクレオチド種に対して、一方のオーバーハング識別配列が5’オーバーハングの所与の長さに特異的であり、他方のオーバーハング識別配列が3’オーバーハングの所与の長さに特異的であるような、2つのオーバーハング識別配列がある。一部の実施形態では、オーバーハングの配列を問わず、特定の長さのオーバーハングを有するすべてのオリゴヌクレオチド種に対して、1つまたは2つのオーバーハング識別配列がある。一部の実施形態では、特定の長さのオーバーハングを有するオリゴヌクレオチド種に対してオーバーハング識別配列のサブセットがあり、サブセット中の異なるオーバーハング識別配列は、オリゴヌクレオチドの異なるオーバーハング配列に(例えば、オーバーハングの長さおよびタイプ(すなわち、5’または3’)に特異的であることに加えて)特異的である。一部の実施形態では、オーバーハング識別配列は、オーバーハングに特異的でない(すなわち、平滑末端化オリゴヌクレオチドに特異的である)。
一般に、オーバーハング識別配列は、オーバーハング識別配列のヌクレオチド配列によって、対応するオリゴヌクレオチドオーバーハングの長さおよび/またはタイプについての情報を提供する。オーバーハング識別配列のヌクレオチド配列をシーケンシングプロセスによりシーケンシングし、オリゴヌクレオチド−標的配列についての配列リードに含めることができる。したがって、ある特定の実施形態では、オーバーハング識別配列は、それらのヌクレオチド配列のリードを超えるさらなるシグナルを生成しない。例えば、オーバーハング識別配列は、シグナルを生成するために、標識すること(例えば、蛍光標識による)も、コンジュゲーション(例えば、固体支持体、抗体への)も、標識を有するまたは固体支持体、抗体などにコンジュゲートされたポリヌクレオチドとのハイブリダイゼーションも、必要としないことがある。
一部の実施形態では、オリゴヌクレオチドは、オーバーハングおよびオーバーハング識別配列以外に、1つまたは複数の部分またはドメインを含む。そのようなさらなる部分を、例えば、ハイブリダイゼーション産物またはそれらの誘導体を利用するまたはさらに処理する1つまたは複数の下流の用途、例えば、核酸増幅、シーケンシング(例えば、ハイスループットシーケンシング)、または両方を助長するために、含めることができる。ある特定の実施形態では、さらなる部分は、1つまたは複数の核酸結合ドメイン、例えば、プライマー結合ドメイン(プライミング配列とも呼ばれる)、および/またはシーケンシングアダプター、もしくはシーケンシングアダプターの1つもしくは複数の成分(例えば、本明細書に記載される1つもしくは複数の成分)などを含む。一部の実施形態では、オリゴヌクレオチドは、固有分子識別子(UMI)を含む。UMIは、一般に、固有の出発分子(例えば、増幅前の出発分子)の数の推定に、およびある特定の事例では、ライゲーション反応の感度の評価に使用される。
一部の実施形態では、オリゴヌクレオチドは、1つまたは複数のプライマー結合ドメインを含む。プライマー結合ドメインは、プライマー(例えば、増幅プライマー)がアニールすることができるポリヌクレオチドである。プライマー結合ドメインは、プライマー(例えば、増幅プライマー)のヌクレオチド配列に相補的または実質的に相補的である、ヌクレオチド配列を通常は含む。一部の実施形態では、オリゴヌクレオチド種の異なるプールは、プライマー結合ドメインを有するオリゴヌクレオチドを含むことができ、各プールが、独自のプライマー結合ドメインを有する。例えば、プールA内のオリゴヌクレオチドは、プライマー結合ドメインAを含むことができ、プールB内のオリゴヌクレオチドは、プライマー結合ドメインBを含むことができ、プライマー結合ドメインAとプライマー結合ドメインBは異なる。プライマー結合ドメインAおよびプライマー結合ドメインBは、異なるそれらのヌクレオチド配列に基づいて、異なると考えることができる。プライマー結合ドメインAおよびプライマー結合ドメインBは、プライマーAが、プライマー結合ドメインAにアニールし、プライマー結合ドメインBにアニールしない、およびプライマーBが、プライマー結合ドメインBにアニールし、プライマー結合ドメインAにアニールしないという特徴に基づいて、異なると考えることができる。
一部の実施形態では、オリゴヌクレオチドは、標的核酸オーバーハングとハイブリダイズするまたは平滑末端を含む1つのオーバーハングと、標的核酸オーバーハングとハイブリダイズしない配列を含有する別のオーバーハングとを含む。標的核酸オーバーハングとハイブリダイズしないそのような配列は、標的核酸には一般に見られない配列を含有することがある。標的核酸オーバーハングとハイブリダイズしないそのような配列は、それ自体とハイブリダイズすることができる配列を含有することもある。例えば、配列は、パリンドローム配列を含み得る。パリンドローム配列を有するオーバーハングを含有するオリゴヌクレオチドは、例えば、オーバーハングハイブリダイゼーションによって標的核酸の各末端とハイブリダイズし、次いで、パリンドローム配列ハイブリダイゼーションにより互いにハイブリダイズすることができ、その結果、環状ハイブリダイゼーション産物が形成される。
一部の実施形態では、オリゴヌクレオチドオーバーハングは、任意の好適なタイプのヌクレオチド(例えば、DNAヌクレオチド、RNAヌクレオチド、修飾ヌクレオチド、天然ヌクレオチド)を含み、この例は、本明細書で提供される。一部の実施形態では、オリゴヌクレオチドオーバーハングは、1つまたは複数のDNAヌクレオチドを含む。一部の実施形態では、オリゴヌクレオチドオーバーハングは、DNAヌクレオチドからなる。一部の実施形態では、オリゴヌクレオチドオーバーハングは、1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、オリゴヌクレオチドオーバーハングは、RNAヌクレオチドからなる。例えば、RNAヌクレオチドを含むまたはRNAヌクレオチドからなるオリゴヌクレオチドオーバーハングは、DNAヌクレオチドを含むまたはDNAヌクレオチドからなる標的核酸オーバーハングとハイブリダイズすることができ、それによってRNA−DNA二重鎖が形成される。そのような事例では、RNAリガーゼ(例えば、T4 RNAリガーゼ2、SplintR(登録商標)リガーゼ)をライゲーションに使用することができる。ある特定の実施形態では、ライゲーションされていないオリゴダイマー産物(例えば、RNA−RNA二重鎖を含有するもの)を、RNA−RNA二重鎖を(例えば、例えばRNAse IIIなどの、RNAseを使用して)消化することにより除去することができる。
Y−オリゴヌクレオチド
一部の実施形態では、オリゴヌクレオチドは、2本の鎖を含み、第1の末端にオーバーハングがあり、第2の末端に2本の非相補鎖がある。そのようなオリゴヌクレオチドは、Y−オリゴヌクレオチド、Y−アダプター、Y形オリゴヌクレオチド、Y形アダプターなどと呼ばれることがある。一部の実施形態では、オリゴヌクレオチド(例えば、Y−アダプター)は、2本の鎖を含み、第1の末端に平滑末端またはオーバーハングのどちらかがあり、第2の末端に2本の非相補鎖がある。
Y形構造を有するオリゴヌクレオチドは、一般に、二本鎖二重鎖領域を含み、一方の末端に2つの一本鎖「アーム」を含み、他方の末端に平滑末端またはオーバーハングのどちらかを含む。
Y−オリゴヌクレオチドは、複数のポリヌクレオチドを含むことがある。一部の実施形態では、Y−オリゴヌクレオチドは、第1のポリヌクレオチドおよび第2のポリヌクレオチドを含む。一部の実施形態では、第1のポリヌクレオチド(第1の鎖のもの)は、第2のポリヌクレオチド(第2の鎖のもの)に相補的である。一部の実施形態では、第1のポリヌクレオチド(第1の鎖のもの)の一部分は、第2のポリヌクレオチド(第2の鎖のもの)の一部分に相補的である。一部の実施形態では、第1のポリヌクレオチドは、第2のポリヌクレオチド中の第1の領域に相補的である第1の領域を含み、第1のポリヌクレオチドは、第2のポリヌクレオチド中の第2の領域に相補的でない第2の領域を含む。相補的な領域は、Y−オリゴヌクレオチドの二重鎖領域を形成することが多く、非相補的な領域は、Y−オリゴヌクレオチドのアームまたはそれらの部分を形成することが多い。第1および第2のポリヌクレオチドは、本明細書に記載されるアダプターの成分、例えば、増幅プライミング部位など、および/または特異的シーケンシングアダプター(例えば、P5、P7アダプター)を含むことがある。一部の実施形態では、第1および第2のポリヌクレオチドは、本明細書に記載されるアダプターのある特定の成分、例えば、増幅プライミング部位など、および特異的シーケンシングアダプター(例えば、P5、P7アダプター)を含まない。
一部の実施形態では、Y−オリゴヌクレオチドは、オーバーハング(例えば、5’オーバーハング、3’オーバーハング)を含む。Y−オリゴヌクレオチドのオーバーハングは、二本鎖二重鎖部分に隣接して、非相補鎖(または「アーム」)部分の反対側の末端に、通常は位置する。Y−オリゴヌクレオチドのオーバーハングは、通常は、標的核酸中のオーバーハングに相補的である。Y−オリゴヌクレオチドは、オーバーハング識別配列を含むこともある。一部の実施形態では、Y−オリゴヌクレオチドは、非相補鎖(または「アーム」)部分の反対側に平滑末端を含む。一部の実施形態では、複数のY−オリゴヌクレオチド種、またはY−オリゴヌクレオチド種のプールは、1)オーバーハングを含むオリゴヌクレオチドと、2)平滑末端を含むオリゴヌクレオチドとの混合物を含む。
ヘアピン
一部の実施形態では、オリゴヌクレオチドは、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖を含む。一部の実施形態では、オリゴヌクレオチドは、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖からなる。ヘアピン構造を有するオリゴヌクレオチドは、一般に、二本鎖「ステム」領域および一本鎖「ループ」領域を含む。一部の実施形態では、オリゴヌクレオチドは、ヘアピン構造をとることができる1本の鎖(すなわち、1本の連続鎖)を含む。一部の実施形態では、オリゴヌクレオチドは、ヘアピン構造をとることができる1本の鎖(すなわち、1本の連続鎖)から本質的になる。1本の鎖から本質的になるとは、オリゴヌクレオチドが、連続鎖の一部でない、核酸の(例えば、オリゴヌクレオチドとハイブリダイズした)いかなるさらなる鎖も含まないことを意味する。したがって、ここでの「から本質的になる」は、オリゴヌクレオチド中の鎖の数を指し、オリゴヌクレオチドは、鎖の数に不可欠でない他の特徴を含むことができる(例えば、検出可能な標識を含むことができる;他の領域を含むことができる)。ヘアピン構造を形成することができる1本の鎖を含むまたはそのような1本の鎖から本質的になるオリゴヌクレオチドは、本明細書では、ヘアピン、ヘアピンオリゴヌクレオチド、またはヘアピンアダプターと呼ばれることがある。
ヘアピンオリゴヌクレオチドは、1本の鎖内に複数のポリヌクレオチドを含むことがある。一部の実施形態では、ヘアピンアダプターは、第1のポリヌクレオチドおよび第2のポリヌクレオチドを含む。一部の実施形態では、第1のポリヌクレオチドは、第2のポリヌクレオチドに相補的である。一部の実施形態では、第1のポリヌクレオチドの一部分は、第2のポリヌクレオチド一部分に相補的である。一部の実施形態では、第1のポリヌクレオチドは、第2のポリヌクレオチド中の第1の領域に相補的である第1の領域を含み、第1のポリヌクレオチドは、第2のポリヌクレオチド中の第2の領域に相補的でない第2の領域を含む。相補的な領域は、ヘアピンアダプターのステムを形成することが多く、非相補的な領域は、ヘアピンアダプターのループまたはその一部を形成することが多い。第1および第2のポリヌクレオチドは、本明細書に記載されるアダプターの成分、例えば、増幅プライミング部位など、および特異的シーケンシングアダプター(例えば、P5、P7アダプター)を含むことがある。一部の実施形態では、第1および第2のポリヌクレオチドは、本明細書に記載されるアダプターのある特定の成分、例えば、増幅プライミング部位など、および特異的シーケンシングアダプター(例えば、P5、P7アダプター)を含まない。
ヘアピンオリゴヌクレオチドは、切断条件下で切断され得る1つまたは複数の切断部位を含むことができる。一部の実施形態では、切断部位は、第1のポリヌクレオチドと第2のポリヌクレオチドの間に位置する。切断部位での切断は、ヘアピンオリゴヌクレオチドから2本の別々の鎖を生成することが多い。一部の実施形態では、切断部位での切断は、「Y」構造を形成する2つの不対合鎖を有する部分的に二本鎖のオリゴヌクレオチドを生成する。切断部位は、例えば、本明細書に記載される切断部位などの、任意の好適な切断部位を含み得る。一部の実施形態では、切断部位は、RNAヌクレオチドを含み、例えばRNAseを使用して、切断部位を切断することができる。一部の実施形態では、切断部位は、ウラシルおよび/またはデオキシウリジンを含み、例えば、DNAグリコシラーゼ、エンドヌクレアーゼ、RNAseなど、およびこれらの組合せを使用して、切断部位を切断することができる。一部の実施形態では、切断部位は、ウラシルおよび/またはデオキシウリジンを含まない。一部の実施形態では、本明細書における方法は、ヘアピンオリゴヌクレオチドと標的核酸とを結合させるステップの後、1つまたは複数の切断部位を切断条件に曝露するステップを含み、それによってオリゴヌクレオチドが切断される。
一部の実施形態では、ヘアピンオリゴヌクレオチドは、オーバーハング(例えば、5’オーバーハング、3’オーバーハング)を含む。ヘアピンオリゴヌクレオチドのオーバーハングは、二本鎖ステム部分に隣接して、ループ部分の反対側の末端に、通常は位置する。ヘアピンオリゴヌクレオチドのオーバーハングは、通常は、標的核酸中のオーバーハングに相補的である。ヘアピンオリゴヌクレオチドは、オーバーハング識別配列を含むこともある。一部の実施形態では、ヘアピンオリゴヌクレオチドは、5’から3’の方向に、第1のオーバーハング識別配列、第1のポリヌクレオチド、1つまたは複数の切断部位、第2のポリヌクレオチド、第1のオーバーハング識別配列に相補的な第2のオーバーハング識別配列、およびオーバーハングを含む。一部の実施形態では、ヘアピンオリゴヌクレオチドは、5’から3’の方向に、オーバーハング、第1のオーバーハング識別配列、第1のポリヌクレオチド、1つまたは複数の切断部位、第2のポリヌクレオチド、および第1のオーバーハング識別配列に相補的なオーバーハング識別配列を含む。一部の実施形態では、複数のヘアピンリゴヌクレオチド種、またはヘアピンオリゴヌクレオチド種のプールは、1)5’から3’の方向に、第1のオーバーハング識別配列、第1のポリヌクレオチド、1つまたは複数の切断部位、第2のポリヌクレオチド、第1のオーバーハング識別配列に相補的な第2のオーバーハング識別配列、およびオーバーハングを含む、オリゴヌクレオチドと、2)5’から3’の方向に、オーバーハング、第1のオーバーハング識別配列、第1のポリヌクレオチド、1つまたは複数の切断部位、第2のポリヌクレオチド、および第1のオーバーハング識別配列に相補的なオーバーハング識別配列を含む、オリゴヌクレオチドとの混合物を含む。上記のある特定の実施形態では、第1および第2のポリヌクレオチドは、5’から3’の方向に、第1のポリヌクレオチドの第1の部分、第1のポリヌクレオチドの第2の部分、切断部位、第2のポリヌクレオチドの第2の部分、そして第2のポリヌクレオチドの第1の部分の順に並べられ、各ポリヌクレオチドの第1の部分は、相補的であり、各ポリヌクレオチドの第2の部分は、相補的でない。一部の実施形態では、複数のヘアピンリゴヌクレオチド種、またはヘアピンオリゴヌクレオチド種のプールは、1)オーバーハングを含むオリゴヌクレオチドと、2)平滑末端を含むオリゴヌクレオチドとの混合物を含む。
修飾ヌクレオチド
一部の実施形態では、オリゴヌクレオチド種は、1つまたは複数の修飾ヌクレオチドを含む。修飾ヌクレオチドは、修飾塩基と呼ぶことができ、例えば、結合対のメンバーにコンジュゲートされたヌクレオチド、遮断されたヌクレオチド、非天然ヌクレオチド、ヌクレオチド類似体、ペプチド核酸(PNA)ヌクレオチド、モルホリノヌクレオチド、ロックド核酸(LNA)ヌクレオチド、架橋核酸(BNA)ヌクレオチド、グリコール核酸(GNA)ヌクレオチド、トレオース核酸(TNA)ヌクレオチドなど、およびこれらの組合せを含み得る。一部の実施形態では、オリゴヌクレオチド種は、オリゴヌクレオチドの、二重鎖領域内に、オーバーハング領域内に、一方の末端に、または両方の末端に、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、オリゴヌクレオチド種は、1つまたは複数の不対合修飾ヌクレオチドを含む。一部の実施形態では、オリゴヌクレオチド種は、オリゴヌクレオチドの一方の末端に1つまたは複数の不対合修飾ヌクレオチドを含む。一部の実施形態では、オリゴヌクレオチド種は、標的核酸とハイブリダイズする末端(例えば、オリゴヌクレオチドオーバーハングを含む末端)の反対側のオリゴヌクレオチドの末端に、1つまたは複数の不対合修飾ヌクレオチドを含む。修飾ヌクレオチドは、3’末端を有する鎖の末端に存在することもあり、または5’末端を有する鎖の末端に存在することもある。
一部の実施形態では、オリゴヌクレオチド種は、1つまたは複数の遮断されたヌクレオチドを含む。例えば、オリゴヌクレオチド種は、標的核酸中のヌクレオチドとのハイブリダイゼーションを遮断することができる1つまたは複数の修飾ヌクレオチドを含むことがある。一部の事例では、1つまたは複数の修飾ヌクレオチドは、標的核酸中のヌクレオチドへのライゲーションを遮断することができる。一部の実施形態では、オリゴヌクレオチド種は、天然ヌクレオチドに結合することができない1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ−塩基、ジデオキシ−塩基、逆方向ジデオキシ−塩基、スペーサー、およびアミノリンカーのうちの1つまたは複数を含む。
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ−塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ−グアニン(イソ−dG)を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ−シトシン(イソ−dC)を含む。イソ−dCおよびイソ−dGは、それぞれ、シトシンおよびグアニンの化学的バリアントである。イソ−dCは、イソ−dGと水素結合することができるが、未修飾グアニン(天然グアニン)とはできない。イソ−dGは、イソ−dCと塩基対合することができるが、未修飾シトシン(天然シトシン)とはできない。イソ−dCを含有するオリゴヌクレオチドを、イソ−dGを含有する相補的オリゴとハイブリダイズするが、天然に存在するいずれの核酸配列ともハイブリダイズすることができないように、設計することができる。
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ジデオキシ−塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ジデオキシ−シトシンを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、逆方向ジデオキシ−塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、逆方向ジデオキシ−チミンを含む。例えば、配列の5’末端に位置する逆方向ジデオキシ−チミンは、望ましくない5’ライゲーションを防止することができる。
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、スペーサーを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、C3スペーサーを含む。C3スペーサーホスホロアミダイトをオリゴヌクレオチドの内部にまたは5’末端に組み込むことができる。複数のC3スペーサーをオリゴヌクレオチドのどちらかの末端に付加させて、長い親水性スペーサーアームを(例えば、フルオロフォアまたは他のペンダント基の結合のために)導入することができる。他のスペーサーとしては、例えば、光切断性(PC)スペーサー、ヘキサンジオール、スペーサー9、スペーサー18、1’,2’−ジデオキシリボース(dSpacer)などが挙げられる。
一部の実施形態では、修飾ヌクレオチドは、結合対のメンバーを含む。結合対は、例えば、抗体/抗原、抗体/抗体、抗体/抗体断片、抗体/抗体受容体、抗体/プロテインAもしくはプロテインG、ハプテン/抗ハプテン、ビオチン/アビジン、ビオチン/ストレプトアビジン、葉酸/葉酸結合タンパク質、ビタミンB12/内因子、化学反応性基/相補的化学反応性基、ジゴキシゲニン部分/抗ジゴキシゲニン抗体、フルオレセイン部分/抗フルオレセイン抗体、ステロイド/ステロイド結合タンパク質、オペレーター/リプレッサー、ヌクレアーゼ/ヌクレオチド、レクチン/多糖、活性化合物/活性化合物受容体、ホルモン/ホルモン受容体、酵素/基質、オリゴヌクレオチドもしくはポリヌクレオチド/その対応する補体など、またはこれらの組合せを含み得る。一部の実施形態では、修飾ヌクレオチドは、ビオチンを含む。
一部の実施形態では、修飾ヌクレオチドは、結合対の第1のメンバー(例えば、ビオチン)を含み、結合対の第2のメンバー(例えば、ストレプトアビジン)は、固体支持体または基板にコンジュゲートされている。固体支持体または基板は、マイクロアレイおよびウェルにより提供される表面、ならびに粒子、例えば、ビーズ(例えば、常磁性ビーズ、磁気ビーズ、マイクロビーズ、ナノビーズ)、微小粒子およびナノ粒子を含むがこれらに限定されない、結合対のメンバーを直接または間接的に結合することができる任意の物理的に分離可能な固体であり得る。固体支持体は、例えば、チップ、カラム、光ファイバー、拭き取り繊維、フィルター(例えば、平面フィルター)、1つもしくは複数のキャピラリー、ガラスおよび改質もしくは機能化ガラス(例えば、細孔制御ガラス(CPG))、石英、雲母、ジアゾ化膜(紙もしくはナイロン)、ポリホルムアルデヒド、セルロース、酢酸セルロース、紙、セラミックス、金属、半金属、半導体材料、量子ドット、被覆ビーズもしくは粒子、他のクロマトグラフ材料、磁気粒子;プラスチック(アクリル樹脂、ポリスチレン、スチレンもしくは他の材料のコポリマー、ポリブチレン、ポリウレタン、TEFLON(登録商標)、ポリエチレン、ポリプロピレン、ポリアミド、ポリエステル、ポリフッ化ビニリデン(PVDF)などを含む)、多糖、ナイロンもしくはニトロセルロース、樹脂、シリカ、もしくはシリコン、シリカゲルおよび変性シリコンを含む、シリカに基づく材料、Sephadex(登録商標)、Sepharose(登録商標)、炭素、金属(例えば、鋼、金、銀、アルミニウム、ケイ素および銅)、無機ガラス、導電性ポリマー(ポリピロールおよびポリインドールなどのポリマーを含む);マイクロもしくはナノ構造化表面、例えば、核酸タイリングアレイ、ナノチューブ、ナノワイヤ、もしくはナノ粒子装飾表面;または多孔質表面、またはゲル、例えば、メタクリレート、アクリルアミド、糖ポリマー、セルロース、シリケート、または他の繊維状もしくは鎖状ポリマーも含み得る。一部の実施形態では、固体支持体または基板は、デキストラン、アクリルアミド、ゼラチンまたはアガロースなどの、ポリマーを含む、任意の数の材料を用いた不動態または化学的誘導体化コーティングを使用して、被覆することができる。ビーズおよび/または粒子は、ばらばらの状態であることもあり、または互いにつながっている(例えば、焼結されている)こともある。一部の実施形態では、固体支持体は、粒子の集合体であることができる。一部の実施形態では、粒子は、シリカを含むことができ、シリカは、二酸化ケイ素を含み得る。一部の実施形態では、シリカは、多孔質であることができ、ある特定の実施形態では、シリカは、無孔質であることができる。一部の実施形態では、粒子は、粒子に常磁性特性を付与する薬剤をさらに含む。ある特定の実施形態では、薬剤は、金属を含み、ある特定の実施形態では、薬剤は、酸化鉄(例えば、鉄または酸化鉄、ここでの酸化鉄は、Fe2+とFe3+の混合物を含有する)である。結合対のメンバーを共有結合によりまたは非共有結合性相互作用により固体支持体に連結させることができ、直接または間接的に(例えば、スペーサー分子もしくはビオチンなどの仲介物質によって)固体支持体に連結させることができる。
リン酸化および脱リン酸化
一部の実施形態では、本明細書における方法は、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む。一部の実施形態では、本明細書における方法は、オリゴヌクレオチドとホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種、または脱リン酸化されたオリゴヌクレオチド種のプールを生成するステップを含む。一般に、標的核酸および/またはオリゴヌクレオチドは、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化される。標的核酸は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでその後にリン酸化されることがある。オリゴヌクレオチドは、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでその後にリン酸化されることがある。オリゴヌクレオチドは、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでリン酸化されないことがある。核酸の脱リン酸化を行うための試薬およびキットは、公知であり、入手可能である。例えば、標的核酸および/またはオリゴヌクレオチドをホスファターゼ(すなわち、水を使用してリン酸モノエステルを切断してリン酸イオンとアルコールにする酵素)で処理することができる。
一部の実施形態では、本明細書における方法は、標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、脱リン酸化された標的核酸物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、オリゴヌクレオチドとホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、脱リン酸化されたオリゴヌクレオチドとホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む。一般に、標的核酸および/またはオリゴヌクレオチドは、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、リン酸化される。核酸の5’リン酸化を様々な手法で行うことができる。例えば、ATPのγ位からポリヌクレオチド(二本鎖および一本鎖DNAおよびRNA)の5’−ヒドロキシル末端およびヌクレオシド3’一リン酸へのパイの転移および交換を触媒するポリヌクレオチドキナーゼ(PNK)(例えば、T4 PNK)で、標的核酸および/またはオリゴヌクレオチドを処理することができる。好適な反応条件としては、例えば、1×PNK反応緩衝剤(例えば、70mM Tris−HCl、10mM MgCl、5mM DTT、25℃でpH 7.6)中、30分間、37℃での核酸とPNKのインキュベーション;およびT4 DNAリガーゼ緩衝剤(例えば、50mM Tris−HCl、10mM MgCl、1mM ATP、10mM DTT、25℃でpH 7.5)中、30分間、37℃での核酸とPNKのインキュベーションが挙げられる。必要に応じて、リン酸化反応後に、PNKを、例えば65℃で20分間、熱不活性化してもよい。一部の実施形態では、方法は、核酸試料からの核酸の5’末端をリン酸化することにより5’リン酸化された核酸を生成するステップを含まない。ある特定の事例では、核酸試料は、自然にリン酸化される5’末端を有する核酸を含む。一部の実施形態では、方法は、オリゴヌクレオチドの5’末端をリン酸化することにより5’リン酸化されたオリゴヌクレオチドを生成するステップを含まない。
ハイブリダイゼーションおよびライゲーション
核酸断片をオリゴヌクレオチドと結合させることができ、それによって結合産物が生成される。核酸断片とオリゴヌクレオチドを結合させるステップは、オーバーハングハイブリダイゼーション、ライゲーション(例えば、ハイブリダイゼーション産物のライゲーション)および平滑末端ライゲーションのうちの1つまたは複数を含み得る。結合産物は、核酸断片の一方または両方の末端でオリゴヌクレオチドに接続された(例えば、ハイブリダイズおよび/またはライゲーションされた)核酸断片を含み得る。一部の実施形態では、標的核酸をオリゴヌクレオチドと結合させることができ、それによって結合産物が生成される。一部の実施形態では、切断ステップからの産物(すなわち、切断産物)をオリゴヌクレオチドと結合させることができ、それによって結合産物が生成される。本明細書におけるある特定の方法は、結合産物のセット(例えば、結合産物の第1のセットおよび結合産物の第2のセット)を生成するステップを含む。一部の実施形態では、結合産物の第1のセットは、オリゴヌクレオチドの第1のプールからのオリゴヌクレオチドに接続された(例えば、ハイブリダイズおよび/またはライゲーションされた)標的核酸を含む。一部の実施形態では、結合産物の第2のセットは、オリゴヌクレオチドの第2のプールからのオリゴヌクレオチドに接続された(例えば、ハイブリダイズおよび/またはライゲーションされた)切断産物を含む。
標的核酸をオリゴヌクレオチドとハイブリダイゼーション条件下で結合させることができ、それによってハイブリダイゼーション産物が生成される。結合ステップ中の条件は、オリゴヌクレオチド(例えば、オリゴヌクレオチドオーバーハング)が、オリゴヌクレオチドオーバーハングに対して配列が相補的であり、かつ対応する長さを有するオーバーハングまたはオーバーハング領域を有する標的核酸と、特異的にハイブリダイズする条件である。一部の実施形態では、対応する長さは、一般に、同じ長さ(すなわち、オリゴヌクレオチドオーバーハングおよび標的核酸オーバーハング中の同じ塩基数)を指す。特異的ハイブリダイゼーションは、オリゴヌクレオチドオーバーハングと標的核酸オーバーハングとの相補性度、それらの長さ、およびハイブリダイゼーションが起こる温度などの要因による影響を被るまたは影響を受ける可能性があり、ハイブリダイゼーションが起こる温度は、オーバーハングの融解温度(Tm)から情報を得ることができる。融解温度は、オリゴヌクレオチドオーバーハング/標的核酸オーバーハングの半分がハイブリダイズした状態のままであり、オリゴヌクレオチドオーバーハング/標的核酸オーバーハングの半分が解離して一本鎖になる、温度を一般に指す。二重鎖のTmは、実験により決定することができ、または以下の式Tm=81.5+16.6(log10[Na+])+0.41(分率G+C)−(60/N)(式中、Nは、連鎖長であり、[Na+]は、1M未満である)を使用して予測することができる。
一部の実施形態では、本明細書における方法は、標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチド種の末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む。結合するステップは、標的核酸の、それがハイブリダイズされるオリゴヌクレオチドへの共有結合を可能にする、任意の好適なアプローチにより果たすことができる。標的核酸の一方の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合されるとき、通常は、2つの結合イベントが遂行される:1)標的核酸中の一方の鎖の3’末端とオリゴヌクレオチド中の一方の鎖の5’末端の結合イベント、および2)標的核酸中の他方の鎖の5’末端とオリゴヌクレオチド中の他方の鎖の3’末端の結合イベント。標的核酸の両方の末端が、それがハイブリダイズされるオリゴヌクレオチドに各々結合されるとき、通常は、4つの結合イベントが遂行される:1)標的核酸中の一方の鎖の3’末端とオリゴヌクレオチド中の一方の鎖の5’末端の結合イベント、2)標的核酸中の他方の鎖の5’末端とオリゴヌクレオチド中の他方の鎖の3’末端の結合イベント、ならびに3)および4):別のオリゴヌクレオチドに結合される標的核酸の反対側の末端の(1)および(2)と同じ結合イベント。
一部の実施形態では、本明細書における方法は、標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチド種の末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とリガーゼ活性を有する薬剤とを接触させるステップを含む。リガーゼ活性は、例えば、平滑末端リガーゼ活性、ニックシーリングリガーゼ活性、突出末端リガーゼ活性、環状化リガーゼ活性、付着末端リガーゼ活性、DNAリガーゼ活性、およびRNAリガーゼ活性を含み得る。リガーゼ活性は、標的核酸の5’末端を、それとハイブリダイズしたオリゴヌクレオチドの3’末端に、ライゲーション反応でライゲーションさせることを含む。ライゲーション反応を行うための好適な試薬(例えば、リガーゼ)およびキットは、公知であり、入手可能である。例えば、New England Biolabs(Ipswich、MA)から入手可能なInstant Sticky−end Ligase Master Mixを使用することができる。使用することができるリガーゼとしては、例えば、T4 DNAリガーゼ、T7 DNAリガーゼ、E.coli DNAリガーゼ、Electro Ligase(登録商標)、RNAリガーゼ、T4 RNAリガーゼ2、SplintR(登録商標)リガーゼなど、およびこれらの組合せが挙げられる。
一部の実施形態では、ハイブリダイゼーション産物を、第1のリガーゼ活性を有する第1の薬剤、および第1のリガーゼ活性とは異なる第2のリガーゼ活性を有する第2の薬剤と接触させる。例えば、第1のリガーゼ活性および第2のリガーゼ活性は、平滑末端リガーゼ活性、ニックシーリングリガーゼ活性、突出末端リガーゼ活性、環状化リガーゼ活性、および付着末端リガーゼ活性から独立して選択することができる。一部の実施形態では、ある特定のオリゴヌクレオチドは、オーバーハングを有さない。そのようなオリゴヌクレオチドを平滑末端化することができ、標的核酸の1つまたは複数の平滑末端に結合させる(例えば、ライゲーションする)ことができる。
一部の実施形態では、本明細書における方法は、生体適合性結合によって標的核酸をオリゴヌクレオチドに結合させるステップを含む。方法は、例えば、生体分子を結合させるのに有用な生体適合性反応を含む、クリックケミストリーまたはタグ付けを含み得る。一部の実施形態では、オリゴヌクレオチドの各々についての末端は、第1の化学反応性部分を含み、標的核酸の各々についての末端は、第2の化学反応性部分を含む。そのような実施形態では、第1の化学反応性部分は、通常、第2の化学反応性部分と反応すること、そしてオリゴヌクレオチドと、オリゴヌクレオチドがハイブリダイズされる標的核酸との間に共有結合を形成することができる。一部の実施形態では、本明細書における方法は、第2の化学反応性部分が、標的核酸の各々についての末端に組み込まれる条件下で、標的核酸と1つまたは複数の化学剤とを接触させるステップを含む。一部の実施形態では、本明細書における方法は、第1の化学反応性部分が第2の化学反応性部分と反応して、オリゴヌクレオチドと、オリゴヌクレオチドがハイブリダイズされる標的核酸との間に共有結合を形成する条件に、ハイブリダイゼーション産物を曝露するステップを含む。一部の実施形態では、第1の化学反応性部分は、第2の化学反応性部分と反応して、オリゴヌクレオチドと、オリゴヌクレオチドがハイブリダイズされる標的核酸との間に1,2,3−トリアゾールを形成することができる。一部の実施形態では、第1の化学反応性部分は、銅を含む条件下で、第2の化学反応性部分と反応することができる。第1および第2の化学反応性部分は、任意の好適な対合を含み得る。例えば、第1の化学反応性部分は、アジド含有部分および5−オクタジイニルデオキシウラシルから選択することができ、第2の化学反応性部分は、独立して、アジド含有部分、ヘキシニルおよび5−オクタジイニルデオキシウラシルから選択することができる。一部の実施形態では、アジド含有部分は、N−ヒドロキシスクシンイミド(NHS)エステル−アジドである。
切断
一部の実施形態では、本明細書におけるオリゴヌクレオチド、および/またはハイブリダイゼーション産物(例えば、標的核酸にハイブリダイズした本明細書におけるオリゴヌクレオチド)は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。一部の実施形態では、本明細書におけるオリゴヌクレオチド、および/またはハイブリダイゼーション産物は、切断部位で切断またはせん断される。一部の実施形態では、本明細書におけるオリゴヌクレオチド、および/またはハイブリダイゼーション産物は、ヘアピンループ内の切断部位で切断またはせん断される。一部の実施形態では、本明細書におけるオリゴヌクレオチド、および/またはハイブリダイゼーション産物は、オリゴヌクレオチドの内部位置の(例えば、オリゴヌクレオチドの二重鎖領域内の)切断部位で切断またはせん断される。一部の実施形態では、環状ハイブリダイゼーション産物は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。一部の実施形態では、核酸、例えば、環状核酸および/または大きい断片(例えば、長さが500塩基対より長い)は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。大きい断片は、高分子量(HMW)核酸またはHMW DNAと呼ばれることがある。HMW核酸断片は、約500bp、約600bp、約700bp、約800bp、約900bp、約1000bp、約2000bp、約3000bp、約4000bp、約5000bp、約10,000bpより長い、またはそれより長い断片を含み得る。用語「せん断すること」または「切断」は、核酸分子を2つの(またはそれより多くの)より小さい核酸分子に分断することができる手順または条件を一般に指す。そのようなせん断または切断は、配列特異的、塩基特異的、または非特異的であり得、例えば、化学的、酵素的、および物理的(例えば、物理的断片化)を含む、様々な方法、試薬または条件により果たすことができる。せん断または切断された核酸は、約5〜約10,000塩基対、約100〜約1,000塩基対、約100〜約500塩基対、または約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000もしくは9000塩基対の長さの名目値、代表値または平均値を有し得る。
せん断または切断された核酸を好適な方法により生成することができ、そのような方法の非限定的な例としては、物理的方法(例えば、せん断、例えば、音波処理、超音波処理、フレンチプレス、熱、UV照射など)、酵素的プロセス(例えば、酵素的切断作用因子(例えば、好適なヌクレアーゼ、好適な制限酵素)、化学的方法(例えば、アルキル化、DMS、ピペリジン、酸加水分解、塩基加水分解、熱など、もしくはこれらの組合せ)、紫外(UV)線(例えば、光切断性部位(例えば、光切断性スペーサーを含む))など、またはこれらの組合せが挙げられる。結果として得られる核酸断片の長さ代表値、平均値または名目値は、適切な断片生成方法を選択することにより制御することができる。
用語「切断作用因子」は、一般に、核酸を1つまたは複数の特異的または非特異的部位で切断することができる薬剤、ときには、化学物質または酵素を指す。特異的切断作用因子は、特定のヌクレオチド配列に従って特定の部位で特異的に切断することが多く、特定の部位は、切断部位と呼ばれることがある。切断作用因子は、酵素的切断作用因子、化学的切断作用因子、および光(例えば、紫外(UV)線)を含み得る。
酵素的切断作用因子の例としては、限定ではないが、エンドヌクレアーゼ;デオキシリボヌクレアーゼ(DNase;例えば、DNase I、II);リボヌクレアーゼ(RNase;例えば、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse V);エンドヌクレアーゼVIII;CLEAVASE酵素;TAQ DNAポリメラーゼ;E.coli DNAポリメラーゼI;真核生物の構造特異的エンドヌクレアーゼ;マウスFEN−1エンドヌクレアーゼ;ニッキング酵素;I、IIまたはIII型制限エンドヌクレアーゼ(すなわち、制限酵素)、例えば、Acc I、AciI、Afl III、Alu I、Alw44 I、Apa I、Asn I、Ava I、Ava II、BamH I、Ban II、Bcl I、Bgl I. Bgl II、Bln I、Bsm I、BssH II、BstE II、BstUI、Cfo I、CIa I、Dde I、Dpn I、Dra I、EcIX I、EcoR I、EcoR I、EcoR II、EcoR V、Hae II、Hae II、HhaI、Hind II、Hind III、Hpa I、Hpa II、Kpn I、Ksp I、MaeII、McrBC、Mlu I、MIuN I、Msp I、Nci I、Nco I、Nde I、Nde II、Nhe I、Not I、Nru I、Nsi I、Pst I、Pvu I、Pvu II、Rsa I、Sac I、Sal I、Sau3A I、Sca I、ScrF I、Sfi I、Sma I、Spe I、Sph I、Ssp I、Stu I、Sty I、Swa I、Taq I、Xba I、Xho I;グリコシラーゼ(例えば、ウラシル−DNAグリコシラーゼ(UDG)、3−メチルアデニンDNAグリコシラーゼ、3−メチルアデニンDNAグリコシラーゼII、ピリミジンヒドレート−DNAグリコシラーゼ、FaPy−DNAグリコシラーゼ、チミンミスマッチ−DNAグリコシラーゼ(例えば、ヒポキサンチン−DNAグリコシラーゼ、ウラシルDNAグリコシラーゼ(UDG)、5−ヒドロキシメチルウラシルDNAグリコシラーゼ(HmUDG)、5−ヒドロキシメチルシトシンDNAグリコシラーゼ、または1,N6−エテノ−アデニンDNAグリコシラーゼ);エキソヌクレアーゼ(例えば、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII);5’→3’エキソヌクレアーゼ(例えば、エキソヌクレアーゼII);3’→5’エキソヌクレアーゼ(例えば、エキソヌクレアーゼI);ポリ(A)特異的3’→5’エキソヌクレアーゼ;リボザイム;DNAザイム;など、およびこれらの組合せが挙げられる。
一部の実施形態では、切断部位(例えば、オリゴヌクレオチドの二重鎖部分内の切断部位)は、ウラシルおよびデオキシウリジンから選択されるヌクレオチドを含む。一部の実施形態では、切断作用因子は、エンドヌクレアーゼを含む。一部の実施形態では、切断作用因子は、DNAグリコシラーゼを含む。一部の実施形態では、切断作用因子は、エンドヌクレアーゼおよびDNAグリコシラーゼを含む。一部の実施形態では、切断作用因子は、ウラシルDNAグリコシラーゼ(UDG)とエンドヌクレアーゼVIIIの混合物を含む。
一部の実施形態では、切断部位は、制限酵素認識部位を含む。一部の実施形態では、切断作用因子は、制限酵素を含む。一部の実施形態では、切断部位は、レアカッター制限酵素認識部位(例えば、NotI認識配列)を含む。一部の実施形態では、切断作用因子は、レアカッター酵素(例えば、レアカッター制限酵素)を含む。レアカッター酵素は、ゲノム(例えば、ヒトゲノム)に極めてまれに存在する認識配列を有する制限酵素を一般に指す。一例は、5’−GCGGCCGC−3’配列の最初のGCの後で切断するNotIである。7および8塩基対認識配列を有する制限酵素は、多くの場合、レアカッター酵素と考えられる。
DNAを特異的部位で切断するための切断方法および制限酵素を選択するための手順は、当業者に周知である。例えば、New England BioLabs、Pro−Mega Biochems、Boehringer−Mannheimなどを含む、多くの制限酵素供給業者は、特異的制限酵素により切断されるDNA配列の条件およびタイプに関する情報を提供している。酵素は、約95%〜100%の効率で、好ましくは約98%〜100%の効率で、DNAの切断を可能にすることになる条件下で使用されることが多い。
一部の実施形態では、切断部位は、1つまたは複数のリボ核酸(RNA)ヌクレオチドを含む。一部の実施形態では、切断部位は、1つまたは複数のRNAヌクレオチドを含む一本鎖部分を含む。一部の実施形態では、一本鎖部分は、二重鎖部分と隣接している。一部の実施形態では、一本鎖部分は、ヘアピンループである。一部の実施形態では、切断部位は、1つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、2つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、3つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、4つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、5つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、5つより多くのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)、グアニン(G)およびウラシル(U)から選択される1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)およびグアニン(G)から選択される1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、ウラシル(U)を含まない。一部の実施形態では、切断部位は、グアニン(G)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、グアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、を、アデニン(A)およびシトシン(C)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断作用因子は、リボヌクレアーゼ(RNAse)を含む。一部の実施形態では、RNAseは、エンドリボヌクレアーゼである。RNAseは、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse Vのうちの1つまたは複数から選択することができる。
一部の実施形態では、切断部位は、光切断性スペーサーまたは光切断性修飾を含む。光切断性修飾は、例えば、特異的波長(例えば、300〜350nm)の紫外(UV)線により切断可能である光解離性官能基を含み得る。光切断性スペーサーの例(Integrated DNA Technologiesから入手可能;製品番号1707)は、適切なスペクトル範囲内のUV線に曝露されたときにのみ切断され得る、10原子リンカーアームである。光切断性スペーサーを含むオリゴヌクレオチドは、後のリガーゼ反応に利用可能である5’リン酸基を有することができる。光切断性スペーサーを、DNA塩基間に配置することができ、またはオリゴと末端修飾(例えばフルオロフォア)の間に配置することができる。そのような実施形態では、紫外(UV)線を切断作用因子と考えることができる。
一部の実施形態では、切断部位は、ジオールを含む。例えば、切断部位は、5’と5’の連結で組み込まれた隣接ジオールを含むことがある。ジオールを含む切断部位は、例えば過ヨウ素酸塩を使用して、化学的に切断することができる。一部の実施形態では、切断部位は、平滑末端制限酵素認識部位を含む。平滑末端制限酵素認識部位を含む切断部位は、平滑末端制限酵素により切断することができる。
ニックシールおよびフィルイン
一部の実施形態では、本明細書における方法は、ニックシール反応を行うステップ(例えば、DNAリガーゼまたは他の好適な酵素、およびある特定の事例では、核酸を5’リン酸化するように構成されたキナーゼ(例えば、ポリヌクレオチドキナーゼ(PNK)を使用する)を含む。一部の実施形態では、本明細書における方法は、フィルイン反応を行うステップを含む。例えば、オリゴヌクレオチドが二重鎖として存在する場合、二重鎖の一部または全ては、核酸とハイブリダイズル末端の反対側のその二重鎖の末端にオーバーハングを含むことがある。そのような二重鎖オーバーハングが存在する場合、本明細書における方法は、結合させるステップの後に、二重鎖により形成されたオーバーハングをフィルインするステップをさらに含み得る。一部の実施形態では、フィルイン反応は、平滑末端化ハイブリダイゼーション産物を生成するために行われる。フィルイン反応を行うために任意の好適な試薬を使用することができる。フィルイン反応を行うために好適なポリメラーゼとしては、例えば、DNAポリメラーゼI、大きい(クレノウ)断片、Bacillus stearothermophilus(Bst)DNAポリメラーゼなどが挙げられる。一部の実施形態では、鎖置換ポリメラーゼが使用される(例えば、Bst DNAポリメラーゼ)。
エキソヌクレアーゼ処理
一部の実施形態では、核酸(例えば、ハイブリダイゼーション産物;環状化ハイブリダイゼーション産物)は、エキソヌクレアーゼで処理される。エキソヌクレアーゼは、3’または5’末端のどちらかにおいてホスホジエステル結合を切断する加水分解反応によってポリヌクレオチド鎖の末端から1つずつヌクレオチドを切断することにより作用する酵素である。エキソヌクレアーゼは、例えば、DNAses、RNAses(例えば、RNAseH)、5’→3’エキソヌクレアーゼ(例えば、エキソヌクレアーゼII)、3’→5’エキソヌクレアーゼ(例えば、エキソヌクレアーゼI)、およびポリ(A)特異的3’→5’エキソヌクレアーゼを含む。一部の実施形態では、ハイブリダイゼーション産物は、例えば、一本鎖オリゴヌクレオチドまたは核酸断片などの、夾雑核酸を除去するために、エキソヌクレアーゼで処理される。一部の実施形態では、環状化ハイブリダイゼーション産物は、一切の非環状化ハイブリダイゼーション産物、ハイブリダイズされていないオリゴヌクレオチド、ハイブリダイズされていない標的核酸、オリゴヌクレオチドダイマーなど、およびこれらの組合せを除去するために、エキソヌクレアーゼで処理される。
オリゴヌクレオチドの第2のプール
本明細書に記載されるある特定の方法は、標的核酸とオリゴヌクレオチド(例えば、本明細書に記載の標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含むオリゴヌクレオチド)の第1のプールとを結合させるステップと、結合産物を切断して切断産物を生成するステップと、切断産物とオリゴヌクレオチドの第2プールとを結合させるステップとを含む。第2のプール内のオリゴヌクレオチドは、オリゴヌクレオチドについて本明細書に記載される任意の特徴を含むことができる。しかし、第2のプール内のオリゴヌクレオチドは、標的核酸中のネイティブオーバーハングと相補的であるオーバーハングを一般に含まず、オーバーハング識別配列を一般に含まない。
一部の実施形態では、本明細書における方法は、第2のプールからのオリゴヌクレオチドを切断された標的核酸断片(切断産物)の少なくとも一方の末端に結合させる(例えば、アニールする、ハイブリダイズする、ライゲーションする)ステップを含む。一般に、第2のプールからのオリゴヌクレオチドは、切断された末端で切断された標的核酸断片に結合し、ネイティブ末端には結合しない。一部の実施形態では、切断された標的核酸断片は、第2のプールからのオリゴヌクレオチドと結合させるステップの前に、平滑末端修復、3’→5’エキソヌクレアーゼ処理、5’フィルイン、Aテーリング、および5’リン酸化のうちの1つまたは複数を含む末端修復に付される。一部の実施形態では、本明細書における方法は、切断産物の一方または両方の末端(すなわち、切断された末端(単数または複数))に1つまたは複数の不対合ヌクレオチド(Aテール)を付加させるステップを含む。一部の実施形態では、第2のプールからのオリゴヌクレオチドは、切断産物に付加された1つまたは複数のヌクレオチドに相補的である1つまたは複数のヌクレオチドを(例えば、第1の末端に)含む。一部の実施形態では、第2のプールからのオリゴヌクレオチドの末端(例えば、第1の末端)は、オリゴヌクレオチドが結合される切断産物の末端に共有結合で連結され得る。一部の実施形態では、オリゴヌクレオチド鎖の3’末端は、オリゴヌクレオチドが結合される切断産物中の鎖の5’末端(例えば、リン酸化された5’末端)に共有結合で連結され得る。
第2のプールからのオリゴヌクレオチドは、プライマー結合ドメインを含むことがある。第2のプールからのオリゴヌクレオチド上のプライマー結合ドメインは、第1のプールからのオリゴヌクレオチド上のプライマー結合ドメインとは異なることがある。プライマー結合ドメインは、任意の好適なプライマー結合配列を含むことがある。一部の実施形態では、プライマー結合ドメインは、P5プライマー結合配列を含む。一部の実施形態では、プライマー結合ドメインは、P7プライマー結合配列を含む。
第2のプールからのオリゴヌクレオチドは、平滑末端を(例えば、第1の末端に)含むことがあり、または短い(例えば、1bp、2bp、3bp)オーバーハングを第1の末端に含むこともある。例えば、第2のプールからのオリゴヌクレオチドは、単一のT、A、C、GまたはUオーバーハングを第1の末端に含むことがある。一部の実施形態では、第2のプールからのオリゴヌクレオチドは、単一のTオーバーハングを含む。通常は、オーバーハング(例えば、Tオーバーハング)は、鎖の3’末端の第1の末端にある。
第2のプールからのオリゴヌクレオチドは、ホスホロチオエート骨格修飾(例えば、鎖上の最後の2ヌクレオチド間にホスホロチオエート結合)を含むことがある。一部の実施形態では、第2のプールからのオリゴヌクレオチドは、オーバーハング(例えば、3’Tオーバーハング)の前に鎖に対するホスホロチオエート骨格修飾を含む。第2のプールからのオリゴヌクレオチドは、例えば本明細書に記載される任意の修飾ヌクレオチドなどの、1つまたは複数の修飾ヌクレオチドを含むことがある。一部の実施形態では、第2のプールからのオリゴヌクレオチドは、遮断されたヌクレオチドを含む。第2のプールからのオリゴヌクレオチドをリン酸化することができる。第2のプールからのオリゴヌクレオチドを第1の末端でリン酸化することができる。通常は、第2のプールからのオリゴヌクレオチドは、鎖の5’末端の第1の末端でリン酸化される。
本明細書に記載されるある特定の方法は、短縮化オリゴヌクレオチドの使用を含む。一部の実施形態では、オリゴヌクレオチドの第2のプールは、短縮化オリゴヌクレオチドを含む。短縮化オリゴヌクレオチドは、本明細書では、専用オリゴヌクレオチド、専用アダプター(例えば、専用P5アダプター)、ショーティオリゴヌクレオチド、ショーティアダプター(例えば、ショーティP5アダプター)、およびこれらの変形形態と呼ばれることがある。短縮化オリゴヌクレオチドは、一方の鎖が他方の鎖より短い2本の核酸鎖(すなわち、第1の鎖および第2の鎖)を一般に含む。一部の実施形態では、第1の鎖は、第2の鎖より短い。一部の実施形態では、第1の鎖および第2の鎖は、オリゴヌクレオチドの一方の末端(例えば、第1の末端)で相補的であり、第2の鎖は、オリゴヌクレオチドの他方の末端(例えば、第2の末端)における一本鎖を含む。長い鎖の相補配列が、アニールされた状態を継続するのに十分な長さであるが、増幅される(例えば、インデックスPCR中に)には短すぎるように、短縮化オリゴヌクレオチドを設計することができる。短縮化オリゴヌクレオチドは、オリゴヌクレオチドについて本明細書に記載される任意の特徴を含むことができる。しかし、短縮化オリゴヌクレオチドは、標的核酸中のネイティブオーバーハングと相補的であるオーバーハングを一般に含まず、オーバーハング識別配列を一般に含まない。
短縮化オリゴヌクレオチドは、短縮化オリゴヌクレオチドに特異的なオリゴヌクレオチド識別配列(例えば、バーコード)を含むことがある。オリゴヌクレオチド識別配列を使用して、短縮化オリゴヌクレオチドにライゲーションされる核酸断片末端を識別することができる。一部の事例では、オリゴヌクレオチド識別配列を使用して、短縮化オリゴヌクレオチドにライゲーションされる核酸断片末端と、非短縮化オリゴヌクレオチド(例えば、本明細書に記載されるオーバーハングオリゴヌクレオチド)にライゲーションされる核酸断片末端とを区別することができる。一部の事例では、オリゴヌクレオチド識別配列を使用して、非ネイティブ核酸断片末端(例えば、せん断により生成された核酸断片末端)を識別することができる。一部の実施形態では、短縮化オリゴヌクレオチドは、長さ約5bp〜約10bpであるオリゴヌクレオチド識別配列を含む。例えば、短縮化オリゴヌクレオチドは、長さ約5bp、6bp、7bp、8bp、9bpまたは10bpであるオリゴヌクレオチド識別配列を含むことがある。一部の実施形態では、短縮化オリゴヌクレオチドは、長さ8bpであるオリゴヌクレオチド識別配列を含む。
短縮化オリゴヌクレオチドは、プライマー結合ドメインを含むことがある。一般に、プライマー結合ドメインは、長い方の鎖(例えば、第2の鎖)上にある。プライマー結合ドメインは、任意の好適なプライマー結合配列を含むことがある。一部の実施形態では、プライマー結合ドメインは、P5プライマー結合配列を含む。一部の実施形態では、プライマー結合ドメインは、P7プライマー結合配列を含む。通常は、短い方の鎖(例えば、第1の鎖)は、プライマー結合ドメインを含まない。
短縮化オリゴヌクレオチドは、平滑末端を(例えば、第1の末端に)含むことがあり、または短い(例えば、1bp、2bp、3bp)オーバーハングを第1の末端に含むことがある。例えば、短縮化オリゴヌクレオチドは、単一のT、A、C、GまたはUオーバーハングを第1の末端に含むことがある。一部の実施形態では、短縮化オリゴヌクレオチドは、単一のTオーバーハングを含む。通常は、オーバーハング(例えば、Tオーバーハング)は、第2の鎖の3’末端にある。
短縮化オリゴヌクレオチドは、ホスホロチオエート骨格修飾(例えば、鎖上の最後の2ヌクレオチド間にホスホロチオエート結合)を含むことがある。一部の実施形態では、短縮化オリゴヌクレオチドは、第2の鎖に対するホスホロチオエート骨格修飾を含む。一部の実施形態では、短縮化オリゴヌクレオチドは、オーバーハング(例えば、3’Tオーバーハング)の前に第2の鎖に対するホスホロチオエート骨格修飾を含む。
短縮化オリゴヌクレオチドは、例えば本明細書に記載される任意の修飾ヌクレオチドなどの、1つまたは複数のヌクレオチドを含み得る。一部の実施形態では、短縮化オリゴヌクレオチドは、遮断されたヌクレオチド(例えば、C3スペーサーを含むヌクレオチド)を含む。一部の実施形態では、短縮化オリゴヌクレオチドは、第2の鎖に遮断されたヌクレオチドを含む。通常は、遮断されたヌクレオチドは、第2の鎖の5’末端にある。短縮化オリゴヌクレオチドをリン酸化することができる。短縮化オリゴヌクレオチドを第1の末端でリン酸化することができる。通常は、短縮化オリゴヌクレオチドは、第1の鎖の5’末端でリン酸化される。
試料
核酸を処理および/または解析するための方法および組成物が、本明細書で提供される。本明細書に記載される方法および組成物において利用される核酸または核酸混合物は、対象(例えば、被検対象)から得た試料から単離することができる。対象は、ヒト、非ヒト動物、植物、細菌、真菌、原生生物または病原体を含むがこれらに限定されない、任意の生命体または非生命体であり得る。任意のヒトまたは非ヒト動物を選択することができ、任意のヒトまたは非ヒト動物としては、例えば、哺乳動物、爬虫類、鳥類、両生類、魚類、有蹄動物、反芻動物、ウシ亜科の動物(例えば、ウシ)、ウマ科の動物(例えば、ウマ)、ヤギ亜科の動物およびヒツジ属の動物(例えば、ヒツジ、ヤギ)、イノシシ属の動物(例えば、ブタ)、ラクダ科の動物(例えば、ラクダ、ラマ、アルパカ)、サル、類人猿(例えば、ゴリラ、チンパンジー)、クマ科の蹠行性肉食動物(例えば、クマ)、家禽、イヌ、ネコ、マウス、ラット、魚類、イルカ、クジラおよびサメを挙げることができる。対象は、雄であってもよく、または雌(例えば、女性、もしくは妊婦)であってもよい。対象は、いかなる年齢(例えば、胚、胎児、乳幼児、小児、成人)であってもよい。対象は、がん患者、がんの罹患が疑われる患者、寛解期の患者、がんの家族歴を有する患者、および/またはがんスクリーニングを受ける対象であり得る。対象は、感染症もしくは感染性疾患に罹患しているまたは病原体(例えば、細菌、ウイルス、真菌、原生動物など)に感染した患者、感染症もしくは感染性疾患の罹患または病原体による感染が疑われる患者、感染症、感染性疾患または病原体感染から回復した患者、感染症歴、感染性疾患歴、病原体感染歴がある患者、および/あるいは感染性疾患または病原体スクリーニングを受ける対象であり得る。対象は、移植レシピエントであり得る。対象は、マイクロバイオーム解析を受けている患者であり得る。一部の実施形態では、被検対象は、雌である。一部の実施形態では、被検対象は、ヒト雌である。一部の実施形態では、被検対象は、雄である。一部の実施形態では、被検対象は、ヒト雄である。
核酸試料を、任意のタイプの好適な生物検体または試料(例えば、被検試料)から単離することまたは得ることができる。核酸試料を、単一細胞、複数の細胞(例えば、培養細胞)、細胞培養培地、馴化培地、組織、臓器、または生物(例えば、細菌、酵母など)から単離することまたは得ることができる。一部の実施形態では、核酸試料は、動物(例えば、動物対象)の細胞、組織、臓器および/またはこれらに類するものから単離されるかまたは得られる。一部の実施形態では、核酸試料は、細菌、酵母、昆虫(例えば、ショウジョウバエ)、哺乳動物、両生類(例えば、カエル(例えば、ツメガエル))、ウイルス、植物、または任意の他の哺乳動物もしくは非哺乳動物の核酸試料源などの、供給源から単離されるかまたは得られる。
核酸試料を、現存生物または動物から単離することまたは得ることができる。一部の事例では、核酸試料を、絶滅した(または「古代」)生物または動物(例えば、絶滅した哺乳動物;ヒト属からの絶滅した哺乳動物)から単離することまたは得ることができる。一部の事例では、核酸試料を、法医学分析の一部として得ることができる。一部の事例では、核酸試料を、診断分析の一部として得ることができる。
試料または被検試料は、対象またはその一部(例えば、ヒト対象、妊娠している雌、がん患者、感染症または感染性疾患に罹患している患者、移植レシピエント、胎児、腫瘍、感染臓器または組織、移植臓器または組織、マイクロバイオーム)から単離されるまたは得られ任意の検体であり得る。試料は、任意の妊娠期(例えば、ヒト対象については妊娠初期、妊娠中期または妊娠後期)の胎児を宿している妊娠している雌対象からのものであることもあり、出産後の対象からのものであることもある。試料は、すべての染色体が正倍数性である胎児を宿している妊娠している対象からのものであることもあり、染色体異数性(例えば、染色体の1、3(すなわち、トリソミー(例えば、T21、T18、T13))もしくは4つのコピー)または他の遺伝的変異を有する胎児を宿している妊娠している対象からのものであることもある。検体の非限定的な例としては、血液もしくは血液製剤(例えば、血清、血漿など)、臍帯血、絨毛膜絨毛、羊水、脳脊髄液、脊髄液、洗浄液(例えば、気管支肺胞、胃、腹膜、管、耳、関節鏡視下)、生検試料(例えば、着床前胚;がん生検からのもの)、体腔穿刺試料、細胞(血液細胞、胎盤細胞、胚もしくは胎児細胞、胎児有核細胞もしくは胎児細胞遺残物、正常細胞、異常細胞(例えば、がん細胞))またはそれらの部分(例えば、ミトコンドリアのもの、核、抽出物など)、雌生殖管の洗液、尿、糞便、痰、唾液、鼻粘膜、前立腺液、洗浄、精液、リンパ液、胆汁、涙、汗、母乳、乳汁など、またはそれらの組合せを限定ではないが含む、対象からの体液または組織が挙げられる。一部の実施形態では、生体試料は、対象からの子宮頸部スワブである。核酸が抽出される体液または組織試料は、無細胞性(例えば、無細胞)であることがある。一部の実施形態では、体液または組織試料は、細胞要素または細胞遺残物を含有することがある。一部の実施形態では、胎児細胞またはがん細胞が試料に含まれていることがある。
試料は、液体試料であることがある。液体試料は、細胞外核酸(例えば、循環無細胞DNA)を含むことがある。液体試料の非限定的な例としては、血液もしくは血液製剤(例えば、血清、血漿など)、尿、生検試料(例えば、がんの検出のための液体生検)、上記の液体試料など、またはこれの組合せが挙げられる。ある特定の実施形態では、試料は、液体生検であり、液体生検は、疾患の存在、非存在、悪化または寛解についての対象からの液体試料の評定を一般に指す。液体生検を、固体生検(例えば、腫瘍生検)とともに、または固体生検(例えば、腫瘍生検)の代替法として、使用することができる。ある特定の事例では、細胞外核酸は、液体生検で解析される。
一部の実施形態では、生体試料は、血液、血漿または血清であることがある。用語「血液」は、従来どおりの定義の、全血、血液製剤、または血液の任意の画分、例えば、血清、血漿、バフィーコートなどを包含する。血液またはその画分は、ヌクレオソームを含むことが多い。ヌクレオソームは、核酸を含み、無細胞であることもあり、または細胞内にあることもある。血液は、バフィーコートも含む。バフィーコートは、フィコール勾配を利用することにより単離されることもある。バフィーコートは、白血球(例えば、白血球細胞、T細胞、B細胞、血小板など)を含むことができる。血漿は、抗凝固薬で処理された血液の遠心分離の結果として得られる、全血の画分を指す。血清は、血液試料が凝固した後に残存する流体の水様部分を指す。体液または組織試料は、病院または診療所が一般に準拠する標準プロトコールに従って採取されることが多い。血液の場合、末梢血の適切な量(例えば、3〜40ミリリットルの間、5〜50ミリリットルの間)が採取されることが多く、調製前または後に標準的な手順に従って保管され得る。
対象の血液中で見つかった核酸の解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、母体血中で見つかった胎児DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、患者の血液中で見つかった腫瘍またはがんDNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、患者の血液中で見つかった病原体DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、移植レシピエントの血液中で見つかった移植DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。対象(例えば、母体対象;患者;がん患者)から得た血液から血清または血漿を調製する方法は、公知である。例えば、対象の血液(例えば、妊婦の血液;患者の血液;がん患者の血液)を、EDTAを含有するチューブまたは専用市販製品、例えば、Vacutainer SST(Becton Dickinson、Franklin Lakes、N.J.)に入れて、血液凝固を防止することができ、次いで、血漿を全血から遠心分離によって得ることができる。血清は、血液凝固後の遠心分離を行ってまたは行わずに得ることができる。遠心分離が使用される場合には、遠心分離は、排他的にではないが、通常は、適切な速度、例えば、1,500〜3,000回gで行われる。血漿または血清は、核酸抽出のために未使用のチューブに移す前に追加の遠心分離ステップに付されることがある。全血の無細胞性部分に加えて、細胞画分から、対象からの全血試料の遠心分離および血漿の除去後に得ることができるバフィーコート部分に多く含まれている核酸を回収することもできる。
試料は、腫瘍核酸試料(すなわち、腫瘍から単離された核酸試料)であることがある。用語「腫瘍」は、悪性であるか良性であるかを問わず、新生物細胞成長および増殖を一般に指し、前がん性およびがん性細胞および組織を含み得る。用語「がん」および「がん性(の)」は、非調節細胞成長/増殖によって通常は特徴付けられる哺乳動物の生理的状態を一般に指す。がんの例としては、癌腫、リンパ腫、芽腫、肉腫、白血病、扁平上皮がん、小細胞肺がん、非小細胞肺がん、肺腺癌、肺扁平上皮癌、腹膜がん、肝細胞がん、消化管がん、膵臓がん、神経膠芽腫、子宮頸がん、卵巣がん、肝臓がん、膀胱がん、ヘパトーマ、乳がん、結腸がん、結腸直腸がん、子宮内膜または子宮癌、唾液腺癌、腎臓がん、肝臓がん、前立腺がん、外陰がん、甲状腺がん、肝癌、様々なタイプの頭頸部がんなどが挙げられるが、これらに限定されない。
試料は、不均一であることがある。例えば、試料は、1つより多くの細胞型および/または1つもしくは複数の核酸種を含むことがある。一部の事例では、試料は、(i)胎児細胞と母体細胞、(ii)がん細胞と非がん細胞、および/または(iii)病原性細胞と宿主細胞を含むことがある。一部の事例では、試料は、(i)がん核酸と非がん核酸、(ii)病原体核酸と宿主核酸、(iii)胎児由来核酸と母体由来核酸、および/またはより一般的には、(iv)突然変異した核酸と野生型核酸を含むことがある。一部の事例では、試料は、下でさらに詳細に説明されるような、少数派核酸種と多数派核酸種を含むことがある。一部の事例では、試料は、単一の対象からの細胞および/もしくは核酸を含むこともあり、または複数の対象からの細胞および/もしくは核酸を含むこともある。
核酸
核酸を処理および/または解析するための方法および組成物が、本明細書で提供される。核酸、核酸分子、核酸断片、標的核酸、核酸鋳型、鋳型核酸、核酸標的、標的核酸、ポリヌクレオチド、ポリヌクレオチド断片、標的ポリヌクレオチド、ポリヌクレオチド標的などの用語は、本開示を通して同義で使用され得る。これらの用語は、DNA(例えば、相補的DNA(cDNA;目的の任意のRNAまたはDNAから合成されたもの)、ゲノムDNA(gDNA)、ゲノムDNA断片、ミトコンドリアDNA(mtDNA)、組換えDNA(例えば、プラスミドDNA)など)、RNA(例えば、メッセンジャーRNA(mRNA)、短鎖抑制性RNA(siRNA)、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA、トランス作用性低分子干渉RNA(ta−siRNA)、天然低分子干渉RNA(nat−siRNA)、核小体低分子RNA(snoRNA)、核内低分子RNA(snRNA)、長鎖ノンコーディングRNA(lncRNA)、ノンコーディングRNA(ncRNA)、トランスファー・メッセンジャーRNA(tmRNA)、前駆体メッセンジャーRNA(pre−mRNA)、低分子カハール体特異的RNA(scaRNA)、piwi結合RNA(piRNA)、エンドリボヌクレアーゼ調製siRNA(esiRNA)、小分子RNA(stRNA)、シグナル認識RNA、テロメアRNA、胎児または胎盤により高度に発現されるRNAなど)、および/またはDNAもしくはRNAアナログ(例えば、塩基アナログ、糖アナログおよび/または非ネイティブ骨格などを含む)、RNA/DNAハイブリッドならびにポリアミド核酸(PNA)であって、すべてが、一本鎖または二本鎖形態であることがあり、別段の限定がない限り、天然に存在するヌクレオチドと同様に機能することができる天然ヌクレオチドの公知のアナログを包含し得る、これらのものなどからの、任意の組成の核酸を指す。核酸は、プラスミド、ファージ、ウイルス、細菌、自己複製配列(ARS)、ミトコンドリア、セントロメア、人工染色体、染色体であってもよく、またはこれらからのものであってもよく、あるいはある特定の実施形態ではin vitroでまたは宿主細胞、細胞、細胞の細胞核もしくは細胞質で複製し得るもしくは複製され得る他の核酸であってもよく、またはそのような他の核酸からのものであってもよい。一部の実施形態での鋳型核酸は、単一の染色体からのものであり得る(例えば、核酸試料は、二倍体生物から得られた試料の1つの染色体からのものであることがある)。特に制限がない限り、この用語は、参照核酸と同様の結合特性を有し、天然に存在するヌクレオチドと同様に代謝される、天然ヌクレオチドの公知アナログを含む、核酸を包含する。別段の指示がない限り、特定の核酸配列は、明確に示される配列ばかりでなく、その保存的に修飾されたバリアント(例えば、縮重コドン置換)、対立遺伝子、オルソログ、一塩基多型(SNP)および相補配列も暗に包含する。具体的には、縮重コドン置換は、1つまたは複数の選択された(またはすべての)コドンの第3の位置が混合塩基および/またはデオキシイノシン残基で置換されている配列を生じさせることにより果たすことができる。核酸という用語は、遺伝子座、遺伝子、遺伝子によりコードされているcDNAおよびmRNAと同義で使用される。この用語は、ヌクレオチドアナログ、一本鎖(「センス」または「アンチセンス」、「プラス」鎖または「マイナス」鎖、「フォワード」リーディングフレームまたは「リバース」リーディングフレーム)および二本鎖ポリヌクレオチドから合成されたRNAまたはDNAの誘導体、バリアントおよびアナログも、同意義のものとして含み得る。用語「遺伝子」は、ポリペプチド鎖の産生に関与するDNAの一区画を指し;遺伝子産物の転写/翻訳におよび転写/翻訳の調節に関与するコード領域(リーダーおよびトレーラー)に先行するおよび続く領域、ならびに個々のコード領域(エクソン)間の介在配列(イントロン)を一般に含む。ヌクレオチドまたは塩基は、核酸のプリンおよびピリミジン分子単位(例えば、アデニン(A)、チミン(T)、グアニン(G)およびシトシン(C))を一般に指す。RNAについては、塩基チミンが、ウラシルに置き換えられる。核酸長またはサイズを、塩基の数で表すことができる。
標的核酸は、目的の任意の核酸であり得る。核酸は、デオキシリボヌクレオチド(すなわち、DNA塩基)、リボヌクレオチド(すなわち、RNA塩基)、またはこれらの組合せで構成されている任意の長さの、例えば、10塩基のまたはそれより長い、20塩基のまたはそれより長い、50塩基のまたはそれより長い、100塩基のまたはそれより長い、200塩基のまたはそれより長い、300塩基のまたはそれより長い、400塩基のまたはそれより長い、500塩基のまたはそれより長い、1000塩基のまたはそれより長い、2000塩基のまたはそれより長い、3000塩基のまたはそれより長い、4000塩基のまたはそれより長い、5000塩基のまたはそれより長いポリマーであり得る。ある特定の態様では、核酸は、デオキシリボヌクレオチド(すなわち、DNA塩基)、リボヌクレオチド(すなわち、RNA塩基)、またはこれらの組合せ、例えば、10塩基もしくはそれ未満、20塩基もしくはそれ未満、50塩基もしくはそれ未満、100塩基もしくはそれ未満、200塩基もしくはそれ未満、300塩基もしくはそれ未満、400塩基もしくはそれ未満、500塩基もしくはそれ未満、1000塩基もしくはそれ未満、2000塩基もしくはそれ未満、3000塩基もしくはそれ未満、4000塩基もしくはそれ未満、または5000塩基もしくはそれ未満で構成されている、ポリマーである。
核酸は、一本鎖状であってもよく、または二本鎖状であってもよい。例えば、一本鎖DNAは、例えば、加熱によりまたはアルカリでの処理により二本鎖DNAを変性させることによって生成することができる。ある特定の実施形態では、核酸は、オリゴヌクレオチドまたはDNA様分子、例えばペプチド核酸(PNA)、による二重鎖DNA分子に対する鎖侵入によって形成される、D−ループ構造で存在する。例えば、当技術分野において公知の方法を使用する、E.Coli RecAタンパク質の付加によりおよび/または塩濃度の変更により、Dループ形成を助長することができる。
核酸(例えば、核酸標的、オリゴヌクレオチド、オーバーハング)は、本明細書では、別の核酸に相補的であると、または相補的領域を有すると、記載されることがある。用語「相補的」または「相補性」は、本明細書で使用される場合、核酸(例えば、標的)の領域と非共有結合により塩基対合するヌクレオチド配列を指す。標準ワトソン・クリック塩基対合では、DNAの場合、アデニン(A)は、チミン(T)と塩基対を形成し、グアニン(G)は、シトシン(C)と対合する。RNAの場合、チミンは、ウラシル(U)により置き換えられる。しかるが故に、Aは、Tと相補的であり、Gは、Cと相補的である。RNAの場合、Aは、Uと相補的であり、逆もまた同様である。通常は、「相補的」または「相補性」は、少なくとも部分的に相補的であるヌクレオチド配列を指す。これらの用語は、完全に相補的であり、したがって、一方の鎖内のあらゆるヌクレオチドが、他方の鎖の対応する位置のあらゆるヌクレオチドと相補的である、二重鎖も包含し得る。
ある特定の事例では、ヌクレオチド配列は、標的に部分的に相補的であることがあり、この場合、すべてのヌクレオチドが、標的核酸中のすべての対応する位置のあらゆるヌクレオチドと相補的であるとは限らない。例えば、オリゴヌクレオチドオーバーハングは、標的核酸オーバーハングに完璧に(すなわち、100%)相補的であることもあり、または完璧とまではいかない(例えば、70%、75%、85%、90%、95%、99%である)ある程度の相補性を共有することもある。
一部の実施形態では、核酸の混合物中の核酸が解析される。核酸の混合物は、同じもしくは異なるヌクレオチド配列、異なる長さ、異なる起源(例えば、ゲノム起源、胎児対母体起源、細胞もしくは組織起源、がん対非がん起源、腫瘍対非腫瘍起源、宿主対病原体、宿主対移植片、宿主対マイクロバイオーム、試料起源、対象起源など)、異なるオーバーハング長、異なるオーバーハングタイプ(例えば、5’オーバーハング、3’オーバーハング、オーバーハングなし)、またはこれらの組合せを有する、2つまたはそれより多くの核酸種を含むことができる。本明細書に記載されるプロセスに供される核酸は、1つの試料からの、または2つもしくはそれより多くの試料からの(例えば、1つもしくは複数、2つもしくはそれより多くの、3つもしくはそれより多くの、4つもしくはそれより多くの、5つもしくはそれより多くの、6つもしくはそれより多くの、7つもしくはそれより多くの、8つもしくはそれより多くの、9つもしくはそれより多くの、10もしくはそれより多くの、11もしくはそれより多くの、12もしくはそれより多くの、13もしくはそれより多くの、14もしくはそれより多くの、15もしくはそれより多くの、16もしくはそれより多くの、17もしくはそれより多くの、18もしくはそれより多くの、19もしくはそれより多くの、または20もしくはそれより多くの試料からの)核酸を含有することがある。
一部の実施形態では、標的核酸は、分解されたDNAを含む。分解されたDNAは、低品質DNAまたは高度に分解されたDNAと呼ばれることがある。分解されたDNAは、高度に断片化されていることがあり、損傷部をミスコードしやすいおよび/または分子間架橋しやすい塩基アナログおよび脱塩基部位などの損傷を含むことがある。例えば、シトシン残基の脱アミノ化の結果として生じるシーケンシングの誤りは、分解されたDNAから得られるある特定の配列中に存在することがある(例えば、CをTとおよびGをAとミスコードすること)。
核酸を当技術分野において公知の方法により1つまたは複数の供給源(例えば、生体試料、血液、細胞、血清、血漿、バフィーコート、尿、リンパ液、皮膚、土壌など)から得ることができる。任意の好適な方法を、生体試料から(例えば、血液または血液製剤から)のDNAの単離、抽出および/または精製に使用することができ、この方法の非限定的な例としては、DNA調製方法(例えば、Sambrook and Russell, Molecular Cloning: A Laboratory Manual 3d ed., 2001に記載されている)、様々な市販の試薬もしくはキット、例えば、Qiagen,Inc.(Germantown、Md)によるDNeasy(登録商標)、RNeasy(登録商標)、QIAprep(登録商標)、QIAquick(登録商標)およびQIAamp(登録商標)(例えば、QIAamp(登録商標)Circulating Nucleic Acid Kit、QiaAmp(登録商標)DNA Mini KitまたはQiaAmp(登録商標)DNA Blood Mini Kit)核酸単離/精製キット;GenomicPrep(商標)Blood DNA Isolation Kit(Promega、Madison、Wis.);GFX(商標)Genomic Blood DNA Purification Kit(Amersham、Piscataway、N.J.);Life Technologies,Inc.(Carlsbad、CA)によるDNAzol(登録商標)、ChargeSwitch(登録商標)、Purelink(登録商標)、GeneCatcher(登録商標)核酸単離/精製キット;Clontech Laboratories,Inc.(Mountain View、CA)によるNucleoMag(登録商標)、NucleoSpin(登録商標)およびNucleoBond(登録商標)核酸単離/精製キット;など、またはこれらの組合せが挙げられる。ある特定の態様では、核酸は、固定された生体試料、例えば、ホルマリン固定、パラフィン包埋(FFPE)組織から、単離される。FFPE組織からのゲノムDNAは、市販のキット−例えば、Qiagen,Inc.(Germantown、Md)によるAllPrep(登録商標)DNA/RNA FFPEキット、Life Technologies,Inc.(Carlsbad、CA)によるFFPE用RecoverAll(登録商標)Total Nucleic Acid Isolationキット、およびClontech Laboratories,Inc.(Mountain View、CA)によるNucleoSpin(登録商標)FFPEキット−を使用して単離することができる。
一部の実施形態では、核酸は、細胞溶解手順を使用して細胞から抽出される。細胞溶解手順および試薬は、当技術分野において公知であり、一般に、化学的方法(例えば、界面活性剤、低張溶液、酵素的手順など、もしくはこれらの組合せ)、物理的方法(例えば、フレンチプレス、音波処理など)、または電解溶解法により行われ得る。任意の好適な溶解手順を利用することができる。例えば、化学的方法は、一般に、溶解剤を利用して細胞を破壊し、細胞から核酸を抽出し、その後、カオトロピック塩で処理する。物理的方法、例えば、凍結/解凍、続いての粉砕、細胞プレスの使用なども、有用である。一部の事例では、高塩および/またはアルカリ溶解手順が利用されることがある。一部の事例では、溶解手順は、EDTA/プロテイナーゼKでの溶解ステップ、大量の塩(例えば、グアニジン塩酸塩(GuHCl)、酢酸ナトリウム)およびイソプロパノールを用いる結合緩衝ステップ、およびこの溶液中のDNAをシリカに基づくカラムに結合させるステップを含み得る。一部の事例では、溶解プロトコールは、Dabney et al., Proceedings of the National Academy of Sciences 110, no. 39 (2013): 15758-15763に記載されている、ある特定の手順を含む。
核酸は、ある特定の実施形態では細胞外核酸を含むことができる。用語「細胞外核酸」は、本明細書で使用される場合、実質的に細胞を有さない供給源から単離された核酸を指すことができ、「無細胞」核酸(無細胞DNA、無細胞RNA、または両方)、「循環無細胞核酸」(例えば、CCF断片、ccf DNA)および/または「無細胞循環胞核酸」とも呼ばれる。細胞外核酸は、血液中に存在することができ、細胞外核酸を血液から(例えば、ヒト対象の血液から)得ることができる。細胞外核酸は、多くの場合、検出可能な細胞を含まず、細胞要素または細胞遺残物を含有し得る。細胞外核酸の無細胞性供給源の非限定的な例は、血液、血漿、血清および尿である。ある特定の態様では、無細胞核酸は、全血、血漿、血清、羊水、唾液、尿、胸膜滲出液、気管支洗浄、気管支吸引物、母乳、初乳、涙、精液、腹水、胸膜滲出液、および便から選択される体液試料から得られる。本明細書で使用される場合、用語「無細胞循環試料核酸を得る」は、試料を直接得ること(例えば、試料、例えば被検試料、を採取すること)、または試料を採取した別の者から試料を得ることを含む。細胞外核酸は、細胞の分泌および/または核酸放出(例えば、DNA放出)の産物であることがある。細胞外核酸は、例えば、任意の形態の死細胞の産物であることがある。一部の事例では、細胞外核酸は、有糸分裂性、膨化性、毒性、虚血性のものなど、およびこれらの組合せを含む、任意の形態のI型またはII型細胞死の産物である。理論により制限されるものではないが、細胞外核酸は、細胞アポトーシスおよび細胞破壊の産物であることがあり、これは、スペクトル(例えば「ラダー」)にわたって一連の長さを有することが多い細胞外核酸の基礎を提供する。一部の事例では、細胞外核酸は、細胞壊死、ネクロプトーシス(necropoptosis)、膨化死、エントーシス、ピロトーシス(pyrotosis)など、およびこれらの組合せの産物である。一部の実施形態では、被検対象からの試料核酸は、循環無細胞核酸である。一部の実施形態では、循環無細胞核酸は、被検対象からの血漿または血清からのものである。一部の態様では、無細胞核酸は、分解されている。一部の実施形態では、無細胞核酸は、無細胞胎児核酸(例えば、無細胞胎児DNA)を含む。ある特定の態様では、無細胞核酸は、循環がん核酸(例えば、がんDNA)を含む。ある特定の態様では、無細胞核酸は、循環腫瘍核酸(例えば、腫瘍DNA)を含む。一部の実施形態では、無細胞核酸は、感染性因子核酸(例えば、病原体DNA)を含む。一部の実施形態では、無細胞核酸は、移植片からの核酸(例えば、DNA)を含む。一部の実施形態では、無細胞核酸は、マイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)からの核酸(例えば、DNA)を含む。
細胞外核酸は、異なる核酸種を含むことがあり、したがって、ある一定の実施形態では「不均一」と本明細書では呼ばれる。例えば、腫瘍またはがんに罹患している人物からの血清または血漿は、腫瘍細胞またはがん細胞(例えば、新生物)からの核酸と、非腫瘍細胞または非がん細胞からの核酸とを含み得る。別の例では、妊娠している雌からの血清または血漿は、母体核酸と胎児核酸を含み得る。別の例では、感染症または感染性疾患に罹患している患者からの血清または血漿は、宿主核酸と感染因子または病原体核酸とを含み得る。別の例では、移植を受けたことがある対象からの試料は、宿主核酸とドナー臓器または組織からの核酸とを含み得る。一部の事例では、がん核酸、腫瘍核酸、胎児核酸、病原体核酸、または移植片核酸は、全核酸の約5%〜約50%であることもある(例えば、全核酸の約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48または49%が、がん、腫瘍、胎児、病原体、移植片またはマイクロバイオーム核酸である)。別の例では、不均一核酸は、2またはそれより多くの対象(例えば、犯行現場からの試料)からの核酸を含み得る。
少なくとも2つの異なる核酸種が、細胞外核酸中に異なる量で存在することがあり、これらの核酸種は、少数派種および多数派種と呼ばれることがある。ある特定の事例では、核酸の少数派種は、罹患細胞型(例えば、がん細胞、消耗細胞、免疫系による攻撃を受けた細胞)からのものである。ある特定の実施形態では、遺伝的変異または遺伝的変更(例えば、コピー数変更、コピー数変異、一塩基変更、一塩基変異、染色体変更、および/または転座)が、少数派核酸種について判定される。ある特定の実施形態では、遺伝的変異または遺伝的変更が、多数派核酸種について判定される。一般に、用語「少数派」または「多数派」は、いかなる点についても厳格に定義されることを意図したものでない。一態様では、例えば、「少数派」と考えられる核酸は、試料中の全核酸の少なくとも約0.1%から試料中の全核酸の50%未満までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約1%から試料中の全核酸の約40%までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約2%から試料中の全核酸の約30%までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約3%から試料中の全核酸の約25%までの存在量を有することができる。例えば、少数派核酸は、試料中の全核酸の約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%または30%の存在量を有することができる。一部の事例では、細胞外核酸の少数派種は、全核酸の約1%〜約40%であることもある(例えば、核酸の約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%または40%が、少数派種核酸である)。一部の実施形態では、少数派核酸は、細胞外DNAである。一部の実施形態では、少数派核酸は、アポトーシス組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、内部の一部の細胞がアポトーシスを遂げた組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、壊死組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、内部の一部の細胞が壊死を遂げた組織からの細胞外DNAである。壊死は、ある特定の事例では、細胞死の後の死後プロセスを指すことがある。一部の実施形態では、少数派核酸は、細胞増殖性障害(例えば、がん)に罹患した組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、腫瘍細胞からの細胞外DNAである。一部の実施形態では、少数派核酸は、細胞外胎児DNAである。一部の実施形態では、少数派核酸は、病原体からの細胞外DNAである。一部の実施形態では、少数派核酸は、移植片からの細胞外DNAである。一部の実施形態では、少数派核酸は、マイクロバイオームからの細胞外DNAである。
別の態様では、例えば、「多数派」と考えられる核酸は、試料中の全核酸の50%を超える存在量から試料中の全核酸の約99.9%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約60%から試料中の全核酸の約99%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約70%から試料中の全核酸の約98%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約75%から試料中の全核酸の約97%までの存在量を有することができる。例えば、多数派核酸は、試料中の全核酸の少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%の存在量を有することができる。一部の実施形態では、多数派核酸は、細胞外DNAである。一部の実施形態では、多数派核酸は、細胞外母体DNAである。一部の実施形態では、多数派核酸は、健康な組織からのDNAである。一部の実施形態では、多数派核酸は、非腫瘍細胞からのDNAである。一部の実施形態では、多数派核酸は、宿主細胞からのDNAである。
一部の実施形態では、細胞外核酸の少数派種は、約500塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約500塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約300塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約300塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約250塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約250塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約200塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約200塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約150塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約150塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約100塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約100塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約50塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約50塩基対またはそれ未満の長さのものである)。
核酸は、核酸を含有する試料の処理の有無にかかわらず、本明細書に記載される方法の実施に供することができる。一部の実施形態では、核酸は、核酸を含有する試料の処理後に、本明細書に記載される方法の実施に供される。例えば、核酸を試料から抽出、単離、精製、部分的に精製、または増幅することができる。用語「単離された」は、本明細書で使用される場合、その元の環境(例えば、それが天然に存在する場合には天然環境、または外因的に発現される場合には宿主細胞)から除去された核酸を指し、したがって、その元の環境からヒトの介入により(例えば、「人間の手により」)変更されている。用語「単離された核酸」は、本明細書で使用される場合、対象(例えば、ヒト対象)から除去された核酸を指すことができる。供給源試料に存在する成分の量より少ない非核酸成分(例えば、タンパク質、脂質)を有する、単離された核酸を提供することができる。単離された核酸を含む組成物は、約50%〜99%を超える%非核酸成分不含であり得る。単離された核酸を含む組成物は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える%非核酸成分不含であり得る。用語「精製された」は、本明細書で使用される場合、核酸を精製手順に付す前に存在する非核酸成分の量より少ない非核酸成分(例えば、タンパク質、脂質、炭水化物)を含有する、提供される核酸を指すことができる。精製された核酸を含む組成物は、約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える%他の非核酸成分不含であり得る。用語「精製された」は、本明細書で使用される場合、核酸が由来する試料源中より少ない核酸種を含有する、提供される核酸を指すことができる。精製された核酸を含む組成物は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える%他の核酸種不含であり得る。例えば、胎児核酸を、母体核酸と胎児核酸とを含む混合物から精製することができる。ある特定の例では、核酸の小さい断片(例えば、30〜500bp断片)を、異なる長さの核酸断片を含む混合物から精製または部分的に精製することができる。ある特定の例では、核酸のより小さい断片を含むヌクレオソームを、核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。ある特定の例では、核酸のより大きい断片を含むより大きいヌクレオソーム複合体を、核酸のより小さい断片を含むヌクレオソームから精製することができる。ある特定の例では、胎児核酸の小さい断片(例えば、30〜500bp断片)を、胎児核酸断片と母体核酸断片の両方を含む混合物から精製または部分的に精製することができる。ある特定の例では、胎児核酸のより小さい断片を含むヌクレオソームを、母体核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。ある特定の例では、がん細胞核酸を、がん細胞核酸と非がん細胞核酸とを含む混合物から精製することができる。ある特定の例では、がん細胞核酸のより小さい断片を含むヌクレオソームを、非がん核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。一部の実施形態では、核酸は、核酸を含有する試料の事前の処理なしで、本明細書に記載される方法の実施に供される。例えば、事前の抽出、精製、部分的精製、および/または増幅なしで、試料から直接核酸を解析することができる。
核酸を増幅条件下で増幅することができる。用語「増幅される」または「増幅」または「増幅条件」は、本明細書で使用される場合、標的核酸またはその一部と同じまたは実質的に同じヌクレオチド配列を有するアンプリコン核酸を直線的にまたは指数関数的に生成するプロセスに試料中の標的核酸を付すことを指す。ある特定の実施形態では、用語「増幅される」または「増幅」または「増幅条件」は、ポリメラーゼ連鎖反応(PCR)を含む方法を指す。ある特定の事例では、増幅産物は、核酸鋳型配列の増幅ヌクレオチド領域より1つまたは複数多いヌクレオチドを含有することができる(例えば、プライマーは、核酸鋳型遺伝子分子に相補的なヌクレオチドに加えて転写開始配列などの「余分な」ヌクレオチドを含有することができ、その結果、増幅産物は、核酸鋳型遺伝子分子の増幅ヌクレオチド領域に対応しない「余分な」ヌクレオチドまたはヌクレオチドを含有することになる)。
核酸は、本明細書に記載される方法に核酸を供する前に、核酸中のある特定のヌクレオチドを修飾するプロセスに曝露され得る。例えば、内部のヌクレオチドのメチル化状態に基づいて核酸を選択的に修飾するプロセスを核酸に適用することができる。加えて、高温、紫外線照射、X線照射などの条件は、核酸分子の配列の変化を誘導することができる。核酸を、配列解析を行うのに有用な任意の好適な形態で提供することができる。
一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前に、長さに関して修飾されない。この文脈での「修飾されない」は、標的核酸が試料から単離され、次いで、標的核酸の長さの修飾なしでオリゴヌクレオチドと結合されることを意味する。例えば、標的核酸は、長さが1ヌクレオチドも複数ヌクレオチドも短縮されず(例えば、それらは、制限酵素とも、ヌクレアーゼとも、長さを低減させる物理的条件(例えば、せん断条件、切断条件)とも接触されず)かつ増加されない(例えば、末端は、オーバーハングでフィルインされない;ヌクレオチドが末端に付加されない)。標的核酸の一方または両方の末端へのリン酸基または化学反応性基の付加は、一般に、核酸の長さの修飾と見なされない。
一部の実施形態では、標的核酸のネイティブ末端は、本明細書でのオリゴヌクレオチドと結合させるステップの前に、長さに関して修飾されない。この文脈での「修飾されない」は、標的核酸が試料から単離され、次いで、標的核酸のネイティブ末端の長さの修飾なしでオリゴヌクレオチドと結合されることを意味する。例えば、標的核酸は、長さが1ヌクレオチドも複数ヌクレオチドも短縮されず(例えば、それらは、非ネイティブ末端を生成するために、制限酵素とも、ヌクレアーゼとも、長さを低減する物理的条件(例えば、せん断条件、切断条件)とも接触されず)かつ増加されない(例えば、ネイティブ末端は、オーバーハングでフィルインされない;ヌクレオチドがネイティブ末端に付加されない)。標的核酸のネイティブ末端の一方または両方へのリン酸基または化学反応性基の付加は、一般に、核酸の長さの修飾と見なされない。
一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前に、切断作用因子(例えば、エンドヌクレアーゼ、エキソヌクレアーゼ、制限酵素)および/またはポリメラーゼと接触されない。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前に、機械的せん断(例えば、超音波処理(例えば、CovarisによるAdaptive Focused Acoustics(商標)(AFA)プロセス))に付されない。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前にエキソヌクレアーゼ(例えば、DNAse)と接触されない。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前に増幅されない。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前に固体支持体に結合されない。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前に別の分子にコンジュゲートされない。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前にベクターにクローニングされない。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前に脱リン酸化に付されることがある。一部の実施形態では、標的核酸は、本明細書でのオリゴヌクレオチドと結合させるステップの前にリン酸化に付されることがある。
一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、および単離された標的核酸をオリゴヌクレオチドと結合させることを含む。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、単離された標的核酸をリン酸化すること、およびリン酸化された標的核酸をオリゴヌクレオチドと結合させることを含む。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、オリゴヌクレオチドを脱リン酸化すること、および単離された標的核酸を脱リン酸化されたオリゴヌクレオチドと結合させることを含む。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱離リン酸化された標的核酸をリン酸化すること、およびリン酸化された標的核酸をオリゴヌクレオチドと結合させることを含む。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱離リン酸化された標的核酸をリン酸化すること、オリゴヌクレオチドを脱リン酸化すること、およびリン酸化された標的核酸を脱リン酸化されたオリゴヌクレオチドと結合させることを含む。
一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、および単離された標的核酸をオリゴヌクレオチドと結合させることからなる。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、単離された標的核酸をリン酸化すること、およびリン酸化された標的核酸をオリゴヌクレオチドと結合させることからなる。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、オリゴヌクレオチドを脱リン酸化すること、および単離された標的核酸を脱リン酸化されたオリゴヌクレオチドと結合させることからなる。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱離リン酸化された標的核酸をリン酸化すること、およびリン酸化された標的核酸をオリゴヌクレオチドと結合させることからなる。一部の実施形態では、本明細書での標的核酸をオリゴヌクレオチドと結合させるステップは、本明細書では、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱離リン酸化された標的核酸をリン酸化すること、オリゴヌクレオチドを脱リン酸化すること、およびリン酸化された標的核酸を脱リン酸化されたオリゴヌクレオチドと結合させることからなる。
核酸の濃縮
一部の実施形態では、核酸(例えば、細胞外核酸)は、核酸の部分集団または種について濃縮または相対的に濃縮される。核酸部分集団は、例えば、胎児核酸、母体核酸、がん核酸、腫瘍核酸、患者核酸、宿主核酸、病原体核酸、移植片核酸、マイクロバイオーム核酸、特定の長さもしくは長さの範囲の断片を含む核酸、または特定のゲノム領域(例えば、単一の染色体、染色体のセット、および/もしくはある特定の染色体領域)からの核酸を含むことができる。そのような濃縮された試料を、本明細書で提供される方法とともに使用することができる。したがって、ある特定の実施形態では、本技術の方法は、試料中の核酸の部分集団について濃縮するさらなるステップを含む。ある特定の実施形態では、正常組織(例えば、非がん細胞、宿主細胞)からの核酸は、試料から選択的に(部分的に、実質的に、ほぼ完全に、または完全に)除去される。ある特定の実施形態では、母体核酸は、試料から選択的に(部分的に、実質的に、ほぼ完全に、または完全に)除去される。ある特定の実施形態では、特定の低コピー数種核酸(例えば、がん、腫瘍、胎児、病原体、移植片、マイクロバイオーム核酸)についての濃縮は、定量感度を改善することができる。試料を核酸の特定の種について濃縮する方法は、例えば、米国特許第6,927,028号、国際特許出願公開番号WO2007/140417、国際特許出願公開番号WO2007/147063、国際特許出願公開番号WO2009/032779、国際特許出願公開番号WO2009/032781、国際特許出願公開番号WO2010/033639、国際特許出願公開番号WO2011/034631、国際特許出願公開番号WO2006/056480、および国際特許出願公開番号WO2011/143659に記載されており、各々の全内容は、本文、表、式および図面すべてを含めて、参照により本明細書に組み込まれる。
一部の実施形態では、核酸は、ある特定の標的断片種および/または参照断片種について濃縮される。ある特定の実施形態では、核酸は、下で説明される、1つまたは複数の長さに基づく分離方法を使用して、特異的核酸断片長または断片長範囲について濃縮される。ある特定の実施形態では、核酸は、本明細書に記載されるおよび/または当技術分野において公知の、1つまたは複数の配列に基づく分離方法を使用して、選択ゲノム領域(例えば、染色体)からの断片について濃縮される。
試料中の核酸部分集団について濃縮する方法の非限定的な例としては、核酸種間のエピジェネティックな差を利用する方法(例えば、参照により本明細書に組み込まれる米国特許出願公開第2010/0105049号に記載されている、メチル化に基づく胎児核酸濃縮方法);制限エンドヌクレアーゼにより多型配列を増強するアプローチ(例えば、参照により本明細書に組み込まれる米国特許出願公開第2009/0317818号に記載されている方法など);選択的酵素的消化アプローチ;大規模並列シグネチャーシーケンシング(MPSS)アプローチ;増幅(例えば、PCR)に基づくアプローチ(例えば、遺伝子座特異的増幅法、マルチプレックスSNP対立遺伝子PCRアプローチ;ユニバーサル増幅法);プルダウンアプローチ(例えば、ビオチン化ウルトラマープルダウン法);伸長およびライゲーションに基づく方法(例えば、分子反転プローブ(MIP)伸長およびライゲーション);およびこれらの組合せが挙げられる。
一部の実施形態では、核酸は、本明細書に記載される1つまたは複数の配列に基づく分離方法を使用して、選択ゲノム領域(例えば、染色体)からの断片について濃縮される。配列に基づく分離は、目的の断片(例えば、標的および/または参照断片)に存在するが、試料の他の断片には実質的に存在しないかまたは他の断片のごくわずかな量(例えば、5%またはそれ未満)に存在する、ヌクレオチド配列に一般に基づく。一部の実施形態では、配列に基づく分離は、分離された標的断片および/または分離された参照断片を生じさせることができる。分離された標的断片および/または分離された参照断片は、核酸試料中に残存する断片から単離されることが多い。ある特定の実施形態では、分離された標的断片および分離された参照断片はまた、互いから単離される(例えば、別々のアッセイ区画で単離される)。ある特定の実施形態では、分離された標的断片および分離された参照断片は、一緒に単離される(例えば、同じアッセイ区画で単離される)。一部の実施形態では、未結合断片を別個に除去または分解または消化することができる。
一部の実施形態では、標的および/または参照断片を核酸試料から分離するために、選択的核酸捕捉プロセスが使用される。市販の核酸捕捉システムとしては、例えば、Nimblegen配列捕捉システム(Roche NimbleGen、Madison、WI);Illumina BEADARRAYプラットフォーム(Illumina、San Diego、CA);Affymetrix GENECHIPプラットフォーム(Affymetrix、Santa Clara、CA);Agilent SureSelect Target Enrichment System(Agilent Technologies、Santa Clara、CA);および関連プラットフォームが挙げられる。そのような方法は、キャプチャーオリゴヌクレオチドと標的または参照断片のヌクレオチド配列の一部またはすべてとのハイブリダイゼーションを通常は含み、固相(例えば、固相アレイ)および/または溶液に基づくプラットフォームの使用を含み得る。キャプチャーオリゴヌクレオチド(「ベイト」と呼ばれることもある)を、それらが、選択されたゲノム領域もしくは遺伝子座からの核酸断片と、または核酸標的中の特定の配列と、優先的にハイブリダイズするように、選択または設計することができる。ある特定の実施形態では、ハイブリダイゼーションに基づく方法(例えば、オリゴヌクレオチドアレイを使用するもの)を使用して、ある特定の核酸配列を含有する断片について濃縮することができる。したがって、一部の実施形態では、核酸試料は、例えば、試料核酸中の選択された配列に相補的なキャプチャーオリゴヌクレオチドを使用して断片のサブセットを捕捉することにより、必要に応じて濃縮される。ある特定の事例では、捕捉された断片が増幅される。例えば、アダプターを含有する捕捉された断片を、アダプターオリゴヌクレオチドに相補的なプライマーを使用して増幅して、アダプター配列に従ってインデックスが付加された、増幅された断片の一群を形成することができる。一部の実施形態では、核酸は、目的の領域を含有する断片の配列またはそれらの部分に相補的なオリゴヌクレオチド(例えば、PCRプライマ−)を使用する目的の1つまたは複数の領域の増幅により、選択ゲノム領域(例えば、染色体、遺伝子)からの断片について濃縮される。
一部の実施形態では、核酸は、1つまたは複数の長さに基づく分離方法を使用して、特定の閾値またはカットオフ未満のまたはそれを超える、特定の核酸断片長(単数)、長さの範囲、または長さ(複数)について濃縮される。核酸断片長は、通常は、断片中のヌクレオチドの数を指す。核酸断片長はまた、核酸断片サイズと呼ばれることもある。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを測定せずに行われる。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを決定する方法とともに行われる。一部の実施形態では、長さに基づく分離は、分画されたプールのすべてまたは一部を単離(例えば、保持)および/または解析することができる、サイズ分画手順を指す。サイズ分画手順は、当技術分野において公知である(例えば、アレイでの分離、モレキュラーシーブによる分離、ゲル電気泳動による分離、カラムクロマトグラフィー(例えば、サイズ排除カラム)による分離、およびマイクロフルイディクスに基づくアプローチ)。ある特定の事例では、長さに基づく分離アプローチは、例えば、選択的配列タグ付けアプローチ、断片環状化、化学的処理(例えば、ホルムアルデヒド、ポリエチレングリコール(PEG)沈殿)、質量分析および/またはサイズ特異的核酸増幅を含み得る。
一部の態様では、方法は、標的核酸の種について濃縮するステップを含む。例えば、本明細書における方法は、特定のオーバーハング特徴(例えば、長さ、タイプ(5’、3’)、配列)を有する標的核酸の種について濃縮するステップを含むことがある。特定のオーバーハング特徴を有する標的核酸の種についての濃縮は、特定のオーバーハング識別配列に従って果たすことができる。例えば、本明細書に記載されるオリゴヌクレオチドと複合体化した、ある特定の標的核酸を、特定のオーバーハング識別配列に従って(例えば、オーバーハング識別配列の、配列に従って、または別の特徴(例えば、修飾)に従って)標的核酸の残部から分離することができる。一部の実施形態では、方法は、複合体(本明細書におけるオリゴヌクレオチドに結合された標的核酸)を、特定のオーバーハング識別配列と特異的にハイブリダイズする1つまたは複数の結合剤と会合させるステップを含み、それによって濃縮された複合体が生成される。用語「特異的にハイブリダイズする」について、特異的、または特異度は、一般に、ある分子と別の分子(例えば、ポリヌクレオチド鎖と相補鎖)の結合またはハイブリダイゼーションを指す。すなわち、特異的または特異度は、2分子間の、これらの2分子のうちのどちらかと他の分子との実質的により低い認識、接触または複合体形成と比較して、安定した複合体の認識、接触および形成を指す。ハイブリダイズするという用語は、一般に、2分子間の安定した複合体の形成を指す。
一部の態様では、特定のオーバーハング識別配列に相補的なポリヌクレオチドは、結合対のメンバーを含む。一部の態様では、特定のオーバーハング識別配列中の1つまたは複数のヌクレオチド(例えば、1つまたは複数の修飾ヌクレオチド)は、結合対のメンバーを含む。結合対は、例えば、抗体/抗原、抗体/抗体、抗体/抗体断片、抗体/抗体受容体、抗体/プロテインAもしくはプロテインG、ハプテン/抗ハプテン、ビオチン/アビジン、ビオチン/ストレプトアビジン、葉酸/葉酸結合タンパク質、ビタミンB12/内因子、化学反応性基/相補的化学反応性基、ジゴキシゲニン部分/抗ジゴキシゲニン抗体、フルオレセイン部分/抗フルオレセイン抗体、ステロイド/ステロイド結合タンパク質、オペレーター/リプレッサー、ヌクレアーゼ/ヌクレオチド、レクチン/多糖、活性化合物/活性化合物受容体、ホルモン/ホルモン受容体、酵素/基質、オリゴヌクレオチドもしくはポリヌクレオチド/その対応する補体など、またはこれらの組合せを含み得る。
一部の実施形態では、特定のオーバーハング識別配列と特異的にハイブリダイズする1つまたは複数の結合剤を、固体支持体(例えば、ビーズ、または本明細書に記載されるもしくは当技術分野において公知の任意の好適な固体支持体)に結合させることができる。その後、オーバーハングの特定の種を有する標的核酸についての濃縮を、生体分子を分離するための任意の好適な方法(例えば、プルダウンアッセイ、固体支持体の使用など)に従って果たすことができる。
長さに基づく分離
一部の実施形態では、本明細書における方法は、断片長に従って標的核酸を分離するステップを含む。例えば、標的核酸を、1つまたは複数の長さに基づく分離方法を使用して、特定の閾値またはカットオフ未満のまたはそれを超える、特定の核酸断片長(単数)、長さの範囲、または長さ(複数)について濃縮することができる。核酸断片長は、通常は、断片中のヌクレオチドの数を指す。核酸断片長はまた、核酸断片サイズと呼ばれることもある。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを測定せずに行われる。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを決定する方法と併せて行われる。一部の実施形態では、長さに基づく分離は、分画されたプールのすべてまたは一部を単離(例えば、保持)および/または解析することができる、サイズ分画手順を指す。サイズ分画手順は、当技術分野において公知である(例えば、アレイでの分離、モレキュラーシーブによる分離、ゲル電気泳動による分離、カラムクロマトグラフィー(例えば、サイズ排除カラム)による分離、およびマイクロフルイディクスに基づくアプローチ)。一部の実施形態では、長さに基づく分離アプローチは、例えば、断片環状化、化学的処理(例えば、ホルムアルデヒド、ポリエチレングリコール(PEG))、質量分析および/またはサイズ特異的核酸増幅を含み得る。一部の実施形態では、長さに基づく分離は、固相可逆的固定法(SPRI)ビーズを使用して行われる。
一部の実施形態では、特定の閾値またはカットオフ未満のまたはそれを超える、ある特定の長さ(単数)、長さ範囲、または長さ(複数)の核酸断片が、試料から分離される。一部の実施形態では、特定の閾値またはカットオフ(例えば、500bp、400bp、300bp、200bp、150bp、100bp)未満の長さを有する断片は、「短い」断片と呼ばれ、特定の閾値またはカットオフ(例えば、500bp、600bp、700bp、800bp、900bp、1000bp)を超える長さを有する断片は、「長い」断片、大きい断片、および/または高分子量(HMW)断片と呼ばれる。一部の実施形態では、特定の閾値またはカットオフ未満のまたはそれを超える、ある特定の長さ(単数)、長さ範囲、または長さ(複数)の断片は、解析のために保持され、その一方で、閾値またはカットオフを超えるまたはそれ未満の、異なる長さ(単数)、または長さ範囲、または長さ(複数)の断片は、解析のために保持されない。一部の実施形態では、約500bp未満である断片は、保持される。一部の実施形態では、約400bp未満である断片は、保持される。一部の実施形態では、約300bp未満である断片は、保持される。一部の実施形態では、約200bp未満である断片は、保持される。一部の実施形態では、約150bp未満である断片は、保持される。例えば、約190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp、110bpまたは100bp未満である断片は、保持される。一部の実施形態では、約100bp〜約200bpである断片は、保持される。例えば、約190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp、または110bpである断片は、保持される。一部の実施形態では、約100bp〜約200bpの範囲内である断片は、保持される。例えば、約110bp〜約190bp、130bp〜約180bp、140bp〜約170bp、140bp〜約150bp、150bp〜約160bp、または145bp〜約155bpの範囲内である断片は、保持される。
一部の実施形態では、約1000bp未満の断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約500bp未満の断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約400bp未満の断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約300bp未満の断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約200bp未満の断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約100bp未満の断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。
一部の実施形態では、約100bpのまたはそれより長い断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約200bpのまたはそれより長い断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約300bpのまたはそれより長い断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約400bpのまたはそれより長い断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約500bpのまたはそれより長い断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。一部の実施形態では、約1000bpのまたはそれより長い断片長を有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。
一部の実施形態では、任意の断片長または断片長の任意の組合せを有する標的核酸は、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合される。例えば、500bp未満の断片長および500bpのまたはそれより長い断片長を有する標的核酸を、本明細書に記載される、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプールと結合させることができる。
本明細書に記載される方法とともに使用することができる、長さに基づくある特定の分離方法は、例えば、選択的配列タグ付けアプローチを利用する。そのような方法では、長い核酸と短い核酸とを含む試料中の核酸の断片サイズ種(例えば、短い断片)に、選択的にタグ付けすることができる。そのような方法は、内部プライマーと外部プライマーとを含む1セットのネステッドプライマーを使用して核酸増幅反応を行うステップを通常は含む。一部の実施形態では、内部のものの一方または両方にタグ付けして、それによって標的増幅産物上にタグを導入することができる。外部プライマーは、(内部)標的配列を有する短い断片に一般にアニールしない。内部プライマーは、短い断片にアニールし、タグと標的配列とを有する増幅産物を生成することができる。通常は、長い断片のタグ付けは、例えば、外部プライマーの事前のアニーリングおよび伸長による内部プライマーの伸長遮断を含む、機構の組合せによって阻害される。タグ付き断片の濃縮は、例えば、一本鎖核酸のエキソヌクレアーゼ消化、および少なくとも1つのタグに特異的な増幅プライマーを使用するタグ付き断片の増幅を含む、様々な方法のいずれかにより果たすことができる。
本明細書に記載される方法とともに使用することができる、長さに基づく別の分離方法は、核酸試料をポリエチレングリコール(PEG)沈殿に付すステップを含む。方法の例としては、国際特許出願公開番号WO2007/140417およびWO2010/115016に記載されているものが挙げられる。この方法は、小さい(例えば、300ヌクレオチド未満の)核酸を実質的に沈殿させずに大きい核酸を実質的に沈殿させるのに十分な条件下、1つまたは複数の一価の塩の存在下で、核酸試料とPEGを接触させるステップを一般に必要とする。
本明細書に記載される方法とともに使用することができる、長さに基づく別の濃縮方法は、例えばcircligaseを使用する、ライゲーションによる環状化を含む。通常は、短い核酸断片を長い断片より高い効率で環状化することができる。環状化されていない配列を環状化された配列から分離することができ、濃縮された短い断片をさらなる解析に使用することができる。
核酸ライブラリー
本明細書における方法は、核酸ライブラリーを調製するステップ、および/または核酸ライブラリーために核酸を修飾するステップを含み得る。一部の実施形態では、核酸断片の末端は、断片またはそれらの増幅産物を核酸ライブラリーに組み込むことができるように修飾される。一般に、核酸ライブラリーは、その非限定的な例が、固相(例えば、固体支持体、フローセル、ビーズ)上への固定化、濃縮、増幅、クローニング、検出を含む、特異的プロセスのために、および/または核酸シーケンシングのために、調製される、組み立てられる、および/または修飾される、複数のポリヌクレオチド分子(例えば、核酸の試料)を指す。ある特定の実施形態では、核酸ライブラリーは、シーケンシングプロセスの前にまたはシーケンシングプロセス中に調製される。核酸ライブラリー(例えば、シーケンシングライブラリー)は、当技術分野において公知であるような好適な方法により調製することができる。核酸ライブラリーは、標的化または非標的化調製プロセスにより調製することができる。
一部の実施形態では、核酸のライブラリーは、固体支持体への核酸の固定化のために構成される化学的部分(例えば、官能基)を含むように修飾される。一部の実施形態では、核酸ライブラリーは、固体支持体へのライブラリーの固定化のために構成される、生体分子(例えば、官能基)および/または結合対のメンバーを含むように修飾され、生体分子および結合対の非限定的な例としては、チロキシン結合グロブリン、ステロイド結合タンパク質、抗体、抗原、ハプテン、酵素、レクチン、核酸、リプレッサー、プロテインA、プロテインG、アビジン、ストレプトアビジン、ビオチン、補体成分C1q、核酸結合タンパク質、受容体、炭水化物、オリゴヌクレオチド、ポリヌクレオチド、相補的核酸配列など、およびこれらの組合せが挙げられる。特異的結合対の一部の例としては、限定ではないが、アビジン部分とビオチン部分;抗原エピトープと抗体またはその免疫反応性断片;抗体とハプテン;ジゴキシゲニン部分と抗ジゴキシゲニン抗体;フルオレセイン部分と抗フルオレセイン抗体;オペレーターとリプレッサー;ヌクレアーゼとヌクレオチド;レクチンと多糖;ステロイドとステロイド結合タンパク質;活性化合物と活性化合物受容体;ホルモンとホルモン受容体;酵素と基質;免疫グロブリンとプロテインA;オリゴヌクレオチドまたはポリヌクレオチドとその対応する補体;など、またはこれらの組合せが挙げられる。
一部の実施形態では、核酸のライブラリーは、既知組成の1つまたは複数のポリヌクレオチドを含むように修飾され、ポリヌクレオチドの非限定的な例としては、識別子(例えば、タグ、インデックス付加用タグ)、キャプチャー配列、標識、アダプター、制限酵素部位、プロモーター、エンハンサー、複製起点、ステムループ、相補配列(例えば、プライマー結合部位、アニーリング部位)、好適な組み込み部位(例えば、トランスポゾン、ウイルス組み込み部位)、修飾ヌクレオチド、本明細書に記載されるオーバーハング識別配列(すなわち、固有末端識別子(UEI))、本明細書に記載される固有分子識別子(UMI)、本明細書に記載されるパリンドローム配列など、またはこれらの組合せが挙げられる。既知配列のポリヌクレオチドを、好適な位置に、例えば、5’末端、3’末端にまたは核酸配列内に、付加させることができる。既知配列のポリヌクレオチドは、同じ配列であることもあり、または異なる配列であることもある。一部の実施形態では、既知配列のポリヌクレオチドは、表面(例えば、フローセルの表面)に固定化された1つまたは複数のオリゴヌクレオチドとハイブリダイズするように構成される。例えば、5’既知配列を含む核酸分子は、第1の複数のオリゴヌクレオチドとハイブリダイズすることができ、その一方で、3’既知配列は、第2の複数のオリゴヌクレオチドとハイブリダイズすることができる。一部の実施形態では、核酸のライブラリーは、染色体特異的タグ、キャプチャー配列、標識および/またはアダプター(例えば、本明細書に記載されるオリゴヌクレオチドアダプター)を含み得る。一部の実施形態では、核酸のライブラリーは、1つまたは複数の検出可能な標識を含む。一部の実施形態では、1つまたは複数の検出可能な標識を、核酸ライブラリーの5’末端に、3’末端に、および/またはライブラリー内の核酸内の任意のヌクレオチド位置に組み込むことができる。一部の実施形態では、核酸のライブラリーは、ハイブリダイズしたオリゴヌクレオチドを含む。ある特定の実施形態では、ハイブリダイズしたオリゴヌクレオチドは、標識されたプローブである。一部の実施形態では、核酸のライブラリーは、ハイブリダイズしたオリゴヌクレオチドプローブを固相への固定化の前に含む。
一部の実施形態では、既知配列のポリヌクレオチドは、ユニバーサル配列を含む。ユニバーサル配列は、2つもしくはそれより多くの核酸分子にまたは核酸分子の2つもしくはそれより多くのサブセットに組み込まれる特異的ヌクレオチド配列であり、ユニバーサル配列は、それが組み込まれるすべての分子または分子のサブセットについて同じである。ユニバーサル配列は、ユニバーサル配列に相補的である単一のユニバーサルプライマーを使用して、複数の異なる配列とハイブリダイズするように、および/または複数の異なる配列を増幅するように、設計されることが多い。一部の実施形態では、2つ(例えば、一対)またはそれより多くのユニバーサル配列および/またはユニバーサルプライマーが使用される。ユニバーサルプライマーは、ユニバーサル配列を含むことが多い。一部の実施形態では、アダプター(例えば、ユニバーサルアダプター)は、ユニバーサル配列を含む。一部の実施形態では、1つまたは複数のユニバーサル配列が、核酸の複数の種またはサブセットを捕捉、識別および/または検出するために使用される。
核酸ライブラリーの調製についてのある特定の実施形態では、(例えば、ある特定の一塩基合成法手順では)、核酸は、数百塩基対またはそれ未満の長さに(例えば、ライブラリー生成のための調製において)サイズ選択および/または断片化される。一部の実施形態では、ライブラリー調製は、断片化なしで行われる(例えば、無細胞DNAを使用する場合)。
ある特定の実施形態では、ライゲーションに基づくライブラリー調製方法が使用される(例えば、ILLUMINA TRUSEQ、Illumina、San Diego、CA)。ライゲーションに基づくライブラリー調製方法は、インデックス配列(例えば、核酸配列についての試料起源を識別するための試料インデックス配列)を最初のライゲーションステップで組み込むことができ、多くの場合、シングルリードシーケンシング、ペアエンドシーケンシングおよび多重化シーケンシングのための試料の調製に使用され得る、アダプター(例えば、メチル化アダプター)設計を使用することが多い。例えば、核酸(例えば、断片化された核酸または無細胞DNA)を、フィルイン反応、エキソヌクレアーゼ反応またはこれらの組合せにより、末端修復することができる。一部の実施形態では、次いで、結果として生じた平滑末端修復核酸を、アダプター/プライマーの3’末端の単一のヌクレオチドオーバーハングと相補的である単一のヌクレオチドにより伸長することができる。任意のヌクレオチドを伸長/オーバーハングヌクレオチドに使用することができる。一部の実施形態では、末端修復が省略され、アダプターオリゴヌクレオチド(例えば、本明細書に記載されるオリゴヌクレオチド)は、核酸(例えば、断片化された核酸または無細胞DNA)のネイティブ末端に直接ライゲーションされる。
一部の実施形態では、核酸ライブラリー調製は、本明細書に記載されるアダプターオリゴヌクレオチドなどの、アダプターオリゴヌクレオチドを(例えば、試料核酸に、試料核酸断片に、鋳型核酸に、標的核酸に)ライゲーションすることを含む。アダプターオリゴヌクレオチドは、フローセルアンカーに相補的であることが多く、例えばフローセルの内部表面などの、固体支持体に核酸ライブラリーを固定化するために利用されることもある。一部の実施形態では、アダプターオリゴヌクレオチドは、識別子、1つもしくは複数シーケンシングプライマーハイブリダイゼーション部位(例えば、ユニバーサルシーケンシングプライマー、シングルエンドシーケンシングプライマー、ペアエンドシーケンシングプライマー、多重化シーケンシングプライマーなどに相補的な配列)、またはこれらの組合せ(例えば、アダプター/シーケンシング、アダプター/識別子、アダプター/識別子/シーケンシング)を含む。一部の実施形態では、アダプターオリゴヌクレオチドは、本明細書ではプライミング配列またはプライマー結合ドメインとも呼ばれる、プライマーアニーリングポリヌクレオチド(例えば、フローセル結合オリゴヌクレオチドへの、および/または遊離増幅プライマーへのアニーリングのためのもの)、インデックスポリヌクレオチド(例えば、異なる試料からの核酸を追跡するための試料インデックス配列;試料IDとも呼ばれる)、オーバーハング識別配列(本明細書では固有末端識別子(UEI)とも呼ばれる)およびバーコードポリヌクレオチド(例えば、シーケンシングの前に増幅される試料核酸の個々の分子を追跡するための単一分子バーコード(SMB);分子バーコードまたは固有分子識別子(UMI)とも呼ばれる)のうちの1つまたは複数を含む。一部の実施形態では、アダプターオリゴヌクレオチドのプライマーアニーリング成分(またはプライミング配列またはプライマー結合ドメイン)は、1つまたは複数のユニバーサル配列(例えば、1つまたは複数のユニバーサル増幅プライマーに相補的な配列)を含む。一部の実施形態では、インデックスポリヌクレオチド(例えば、試料インデックス;試料ID)は、アダプターオリゴヌクレオチドの成分である。一部の実施形態では、インデックスポリヌクレオチド(例えば、試料インデックス;試料ID)は、ユニバーサル増幅プライマー配列の成分である。
一部の実施形態では、アダプターオリゴヌクレオチドは、増幅プライマー(例えば、ユニバーサル増幅プライマー)とともに使用されるとき、ユニバーサル配列、分子バーコード、試料ID配列、スペーサー配列、および試料核酸配列のうちの1つまたは複数を含むライブラリー構築物を生成するように設計される。一部の実施形態では、アダプターオリゴヌクレオチドは、ユニバーサル増幅プライマーとともに使用されるとき、ユニバーサル配列、分子バーコード、試料ID配列、スペーサー配列、および試料核酸配列のうちの1つまたは複数の順序付けられた組合せを含むライブラリー構築物を生成するように設計される。例えば、ライブラリー構築物は、第1のユニバーサル配列、続いて第2のユニバーサル配列、続いて第1の分子バーコード、続いてスペーサー配列、続いて鋳型配列(例えば、試料核酸配列)、続いてスペーサー配列、続いて第2の分子バーコード、続いて第3のユニバーサル配列、続いて試料ID、続いて第4のユニバーサル配列を含み得る。一部の実施形態では、アダプターオリゴヌクレオチドは、増幅プライマー(例えば、ユニバーサル増幅プライマー)とともに使用されるとき、鋳型分子(例えば、試料核酸分子)の鎖ごとにライブラリー構築物を生成するように設計される。一部の実施形態では、アダプターオリゴヌクレオチドは、二重鎖アダプターオリゴヌクレオチドである。
識別子は、識別子を含む核酸の検出および/または識別を可能にする、核酸(例えば、ポリヌクレオチド)に組み込まれたまたは結合された好適な検出可能な標識であり得る。一部の実施形態では、識別子は、シーケンシング方法の間に(例えば、ポリメラーゼにより)核酸に組み込まれるかまたは結合される。識別子の非限定的な例としては、核酸タグ、核酸インデックスもしくはバーコード、放射標識(例えば、同位体)、金属標識、蛍光標識、化学発光標識、リン光標識、フルオロフォアクエンチャー、色素、タンパク質(例えば、酵素、抗体もしくはその一部、リンカー、結合対のメンバー)など、またはこれらの組合せが挙げられる。一部の実施形態では、識別子(例えば、核酸インデックスまたはバーコード)は、ヌクレオチドまたはヌクレオチド類似体の固有の、既知のおよび/または識別可能な配列である。一部の実施形態では、識別子は、連続する6またはそれを超えるヌクレオチドである。様々な異なる励起および発光スペクトルを有する多数のフルオロフォアが、利用可能である。任意の好適なタイプおよび/または数のフルオロフォアを、識別子として使用することができる。一部の実施形態では、1つもしくは複数、2つもしくはそれより多くの、3つもしくはそれより多くの、4つもしくはそれより多くの、5つもしくはそれより多くの、6つもしくはそれより多くの、7つもしくはそれより多くの、8つもしくはそれより多くの、9つもしくはそれより多くの、10もしくはそれより多くの、20もしくはそれより多くの、30もしくはそれより多くの、または50もしくはそれより多くの異なる識別子が、本明細書に記載される方法(例えば、核酸検出および/またはシーケンシング方法)において利用される。一部の実施形態では、1つまたは2つのタイプの識別子(例えば、蛍光標識)が、ライブラリー内の各核酸に連結される。識別子の検出および/または定量化は、好適な方法、装置または機械により行うことができ、そのような方法、装置または機械の非限定的な例としては、フローサイトメトリー、定量的ポリメラーゼ連鎖反応(qPCR)、ゲル電気泳動、ルミノメーター、蛍光光度計、分光光度計、好適な遺伝子チップまたはマイクロアレイ解析、ウエスタンブロット、質量分析、クロマトグラフィー、細胞蛍光分析、蛍光顕微鏡法、好適な蛍光またはデジタルイメージング法、共焦点レーザー走査顕微鏡法、レーザー走査型サイトメトリー、親和性クロマトグラフィー、マニュアルバッチモード分離、電界懸架、好適な核酸シーケンシング方法および/または核酸シーケンシング装置など、ならびにこれらの組合せが挙げられる。
一部の実施形態では、核酸ライブラリーまたはその一部は、増幅条件下で増幅される(例えば、PCRに基づく方法により増幅される)。一部の実施形態では、シーケンシング方法は、核酸ライブラリーの増幅を含む。核酸ライブラリーを、固体支持体(例えば、フローセル内の固体支持体)への固定化の前または後に増幅することができる。核酸増幅は、(例えば、核酸ライブラリー内に)存在する核酸鋳型のおよび/またはその補体の数を、鋳型および/またはその補体の1つまたは複数のコピーを生成することにより、増幅するまたは増加させるプロセスを含む。増幅は、好適な方法により行うことができる。核酸ライブラリーを、サーモサイクリング法によりまたは等温増幅法により増幅することができる。一部の実施形態では、ローリングサークル増幅法が使用される。一部の実施形態では、増幅は、核酸ライブラリーまたはその一部分が固定化されている固体支持体(例えば、フローセル内のもの)上で行われる。ある特定のシーケンシング方法では、核酸ライブラリーは、フローセルに添加され、好適な条件下でのアンカーへのハイブリダイゼーションにより固定化される。このタイプの核酸増幅は、固相増幅と呼ばれることが多い。固相増幅の一部の実施形態では、増幅産物のすべてまたは一部分は、固定化されたプライマーから開始する伸長により合成される。固相増幅反応は、増幅オリゴヌクレオチド(例えば、プライマー)の少なくとも1つが固体支持体に固定化されることを除き、標準的な液相増幅に類似している。一部の実施形態では、修飾核酸(例えば、アダプターの付加により修飾された核酸)が増幅される。
一部の実施形態では、固相増幅は、表面に固定化されたオリゴヌクレオチドプライマーの1つの種のみを含む核酸増幅反応を含む。ある特定の実施形態では、固相増幅は、複数の異なる固定化されたオリゴヌクレオチドプライマー種を含む。一部の実施形態では、固相増幅は、固体表面に固定化されたオリゴヌクレオチドプライマーの1つの種と溶液中の第2の異なるオリゴヌクレオチドプライマー種とを含む核酸増幅反応を含み得る。固定化されたプライマーまたは溶液系プライマーの複数の異なる種を使用することができる。固相核酸増幅反応の非限定的な例としては、界面増幅、架橋増幅、エマルジョンPCR、WildFire増幅(例えば、米国特許出願公開第2013/0012399号)などまたはこれらの組合せが挙げられる。
核酸シーケンシング
一部の実施形態では、核酸(例えば、核酸断片、試料核酸、無細胞核酸)がシーケンシングされる。一部の実施形態では、本明細書で提供されるオリゴヌクレオチドとハイブリダイズした核酸標的(「ハイブリダイゼーション産物」)がシーケンシングプロセスによりシーケンシングされる。一部の実施形態では、ハイブリダイゼーション産物が増幅プロセスにより増幅され、それらの増幅産物がシーケンシングプロセスによりシーケンシングされる。一部の実施形態では、シーケンシングプロセスは、配列リード(またはシーケンシングリード)を生成する。一部の実施形態では、本明細書における方法は、配列リードに基づいて標的核酸のオーバーハングの配列を決定するステップを含む。一部の実施形態では、本明細書における方法は、配列リードに基づいてオーバーハング識別配列または固有末端識別子(UEI)の配列を決定するステップを含む。一部の実施形態では、本明細書における方法は、配列リードに基づいてオーバーハング識別配列または固有末端識別子(UEI)と標的核酸のオーバーハングとを含むエレメントの配列を決定するステップを含む。一部の実施形態では、本明細書における方法は、配列リードに基づいてオーバーハング識別配列または固有末端識別子(UEI)と標的核酸のオーバーハングとからなるエレメントの配列を決定するステップを含む。一部の実施形態では、本明細書における方法は、配列リードに従って標的核酸のオーバーハングの長さを決定するステップを含む。
ある特定のシーケンシングプラットフォーム(例えば、ペアエンドシーケンシング)の場合、配列リードを生成するステップは、フォワード配列リードを生成すること、およびリバース配列リードを生成することを含み得る。例えば、ある特定のペアエンドシーケンシングプラットフォームを使用するシーケンシングは、各核酸断片を両方の方向からシーケンシングし、一般に、その結果、フォワード方向の第1のリード(フォワードリード)および逆相補的方向の第2のリード(リバースリード)を含む2つのリードが、核酸断片ごとに得られる。ある特定のプラットフォームの場合、フォワードリードは、シーケンシングアダプター内の特定のプライマー(例えば、Illuminaアダプター、P5プライマー)から生成され、リバースリードは、シーケンシングアダプター内の異なるプライマー(例えば、Illuminaアダプター、P7プライマー)から生成される。
一部の実施形態では、本明細書における方法は、配列リードのサブセットを解析(例えば、定量化、処理)するステップを含む。一部の実施形態では、本明細書における方法は、配列リードのサブセットを解析(例えば、定量化、処理)するステップと、配列リードの別のサブセットを解析から削除するステップとを含む。一部の実施形態では、本明細書における方法は、配列リードのサブセットについてオーバーハング情報を解析または処理するステップを含む。一部の実施形態では、本明細書における方法は、リバース配列リードを解析(例えば、定量化、処理)するステップを含む。一部の実施形態では、本明細書における方法は、リバース配列リードについてオーバーハング情報を解析または処理するステップを含む。一部の実施形態では、本明細書における方法は、リバース配列リードについてオーバーハング識別配列に関連するオーバーハング情報を解析または処理するステップを含む。一部の実施形態では、本明細書における方法は、P7配列リードを解析(例えば、定量化、処理)するステップを含む。一部の実施形態では、本明細書における方法は、P7配列リードから生成されたオーバーハング情報を解析(例えば、定量化、処理)するステップを含む。一部の実施形態では、本明細書における方法は、P7配列リードから生成されたオーバーハング識別配列に関連するオーバーハング情報を解析(例えば、定量化、処理)するステップを含む。
一部の実施形態では、本明細書における方法は、フォワード配列リードを解析から削除するステップを含む。一部の実施形態では、本明細書における方法は、フォワード配列リードから生成されたオーバーハング情報を解析から削除するステップを含む。一部の実施形態では、本明細書における方法は、フォワード配列リードから生成されたオーバーハング識別配列に関連するオーバーハング情報を解析から削除するステップを含む。一部の実施形態では、本明細書における方法は、P5配列リードを解析から削除するステップを含む。一部の実施形態では、本明細書における方法は、P5配列リードから生成されたオーバーハング情報を解析から削除するステップを含む。一部の実施形態では、本明細書における方法は、P5配列リードから生成されたオーバーハング識別配列に関連するオーバーハング情報を解析から削除するステップを含む。
一部の実施形態では、フォワードリード全体が、全て排除されるわけではない。例えば、フォワードリードのオーバーハング識別配列は無視され、その結果として、フォワードリードオーバーハング識別配列から推測されるオーバーハングは、オーバーハング解析から排除され、リバースリードからのオーバーハングのみが解析される。そのような事例では、フォワードリードの他の態様を解析に含めて、例えば、断片長を推測すること、GC含有量を決定すること、一塩基バリアントを識別すること、または平滑末端を識別することができる。
一部の実施形態では、本明細書における方法は、リバース配列リードについてオーバーハングなし(すなわち、平滑末端)を示すオーバーハング識別配列に関連するオーバーハング情報を解析または処理するステップを含む。一部の実施形態では、本明細書における方法は、フォワード配列リードについてオーバーハングなし(すなわち、平滑末端)を示すオーバーハング識別配列に関連するオーバーハング情報を解析または処理するステップを含む。一部の実施形態では、本明細書における方法は、フォワードおよびリバース配列リードについてオーバーハングなし(すなわち、平滑末端)を示すオーバーハング識別配列に関連するオーバーハング情報を解析または処理するステップを含む。したがって、一部の実施形態では、オーバーハング識別配列がオーバーハングなし(すなわち、平滑末端)を示す場合、平滑末端についての情報は、解析から削除されない。
一部の実施形態では、本明細書における方法は、フォワードおよびリバース配列リードについてオーバーハングなし(すなわち、平滑末端)を示すオーバーハング識別配列に関連するオーバーハング情報を解析または処理するステップと、リバース配列リードについてオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析または処理するステップと、フォワード配列リードについてオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除するステップとを含む。したがって、核酸末端(例えば、ネイティブ核酸末端)の解析は、フォワード配列リードとリバース配列リードの両方から生成された核酸末端平滑末端情報、およびリバースリードのみから生成された核酸オーバーハング情報の解析を含み得る。
核酸は、サンガーシーケンシングプラットフォーム、ハイスループットもしくは大規模並列シーケンシング(次世代シーケンシング(NGS))プラットフォームなど、例えば、Illumina(登録商標)により提供されているシーケンシングプラットフォーム(例えば、HiSeq(商標)、MiSeq(商標)および/もしくはGenome Analyzer(商標)シーケンシングシステム)、Oxford Nanopore(商標)Technologiesにより提供されているシーケンシングプラットフォーム(例えば、MinIONシーケンシングシステム)、Ion Torrent(商標)により提供されているシーケンシングプラットフォーム(例えば、Ion PGM(商標)および/もしくはIon Proton(商標)シーケンシングシステム)、Pacific Biosciencesにより提供されているシーケンシングプラットフォーム(例えば、PACBIO RS IIシーケンシングシステム)、Life Technologies(商標)により提供されているシーケンシングプラットフォーム(例えば、SOLiDシーケンシングシステム)、Rocheにより提供されるシーケンシングプラットフォーム(例えば、454 GS FLX+および/もしくはGS Juniorシーケンシングシステム)、または任意の他の好適なシーケンシングプラットフォームなどを含む、任意の好適なシーケンシングプラットフォームを使用してシーケンシングすることができる。一部の実施形態では、シーケンシングプロセスは、高多重化シーケンシングプロセスである。ある特定の事例では、完全または実質的に完全な配列が得られ、部分的配列が得られることもある。核酸シーケンシングは、一般に、配列リードの一群を生成する。本明細書で使用される場合、「リード」(複数)(例えば、「リード」(単数)、「配列リード」(単数))は、本明細書に記載されるまたは当技術分野において公知の任意のシーケンシングプロセスにより生成されたオリゴヌクレオチドの短い配列である。リードは、核酸断片の一方の末端から生成され得(シングルエンドリード)、核酸断片の両方の末端から生成されることもある(例えば、ペアエンドリード、ダブルエンドリード)。一部の実施形態では、シーケンシングプロセスは、短いシーケンシングリードまたは「短いリード」を生成する。一部の実施形態では、短いリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから、連続する約250またはそれを超えるヌクレオチドまでであることもある。一部の実施形態では、短いリードの長さの名目値、代表値、平均値または絶対値は、連続する約50ヌクレオチドから、連続する約150またはそれを超えるヌクレオチドまでである。
配列リードの長さは、利用される特定のシーケンシング技術に関連することが多い。例えば、ハイスループット法は、サイズに数十から数百塩基対(bp)までの幅があり得る、配列リードを生じさせる。例えば、ナノポアシーケンシングは、サイズに数十から数百そして数千塩基対までの幅があり得る、配列リードを生じさせ得る。一部の実施形態では、配列リードは、約15bp〜約900bp長の長さ平均値、中央値、代表値または絶対値を有する。ある特定の実施形態では、配列リードは、約1000bpのまたはそれを超える、長さ平均値、中央値、代表値または絶対値を有する。一部の実施形態では、配列リードは、約1500、2000、2500、3000、3500、4000、4500もしくは5000bpのまたはそれを超える、長さ平均値、中央値、代表値または絶対値を有する。一部の実施形態では、配列リードは、約100bp〜約200bpの長さ平均値、中央値、代表値または絶対値を有する。
一部の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから連続する約250またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約200またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約150またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約125またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約100またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約75またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約60またはそれを超えるヌクレオチドまで、連続する15ヌクレオチドから連続する約50またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約40またはそれを超えるヌクレオチドまでであることもあり、連続する約15ヌクレオチド、または連続する約36もしくはそれを超えるヌクレオチドであることもある。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約20〜約30塩基、または約24〜約28塩基である。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、21、22、23、24、25、26、27、28または約29塩基もしくはそれを超える。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約20〜約200塩基、約100〜約200塩基、または約140〜約160塩基である。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、または約200塩基もしくはそれを超える。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから連続する約25ヌクレオチドまたはそれを超えるヌクレオチド数まで(例えば、長さ約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24もしくは25ヌクレオチド、またはそれを超えるヌクレオチド数)、連続する約15ヌクレオチドから連続する約20ヌクレオチドまたはそれを超えるヌクレオチド数までであることもあり、連続する約17ヌクレオチドまたは連続する約18ヌクレオチドであることもある。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約25ヌクレオチドから連続する約400ヌクレオチドまたはそれを超えるヌクレオチド数まで(例えば、長さ約25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390もしくは400ヌクレオチド、またはそれを超えるヌクレオチド数)、連続する約50ヌクレオチドから連続する約350ヌクレオチドまたはそれを超えるヌクレオチド数まで、連続する約100ヌクレオチドから連続する約325ヌクレオチドまで、連続する約150ヌクレオチドから連続する約325ヌクレオチドまで、連続する約200ヌクレオチドから連続する約325ヌクレオチドまで、連続する約275ヌクレオチドから連続する約310ヌクレオチドまで、連続する約100ヌクレオチドから連続する約200ヌクレオチドまで、連続する約100ヌクレオチドから連続する約175ヌクレオチドまで、連続する約125ヌクレオチドから連続する約175ヌクレオチドまでであることもあり、連続する約140ヌクレオチドから連続する約160ヌクレオチドまでであることもある。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約150ヌクレオチドであり、連続する150ヌクレオチドであることもある。
リードは、一般に、物理的核酸中のヌクレオチド配列の表現である。例えば、配列のATGC描写を含有するリードの場合、物理的核酸中の、「A」は、アデニンヌクレオチドを表し、「T」は、チミンヌクレオチドを表し、「G」は、グアニンヌクレオチドを表し、「C」は、シトシンヌクレオチドを表す。対象からの試料から得られる配列リードは、少数派核酸と多数派核酸の混合物からのリードであることがある。例えば、がん患者の血液から得られる配列リードは、がん核酸と非がん核酸の混合物からのリードであることがある。別の例では、妊娠している雌の血液から得られる配列リードは、胎児核酸と母体核酸の混合物からのリードであることがある。別の例では、感染症または感染性疾患に罹患している患者の血液から得られる配列リードは、宿主核酸と病原体核酸の混合物からのリードであることがある。別の例では、移植レシピエントの血液から得られる配列リードは、宿主核酸と移植片核酸の混合物からのリードであることがある。別の例では、試料から得られる配列リードは、対象のマイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)を集団で構成する微生物からの核酸の混合物からのリードであることがある。別の例では、試料から得られる配列リードは、マイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)を集団で構成する微生物からの核酸と宿主対象からの核酸との混合物からのリードであることがある。比較的短いリードの混合物を、本明細書に記載されるプロセスにより、対象内に存在するゲノム核酸の表現に、および/または腫瘍、胎児、病原体、移植片もしくはマイクロバイオームに存在するゲノム核酸の表現に、変換することができる。
ある特定の実施形態では、対象から試料の核酸配列リードを「得ること」、および/または1名もしくは複数名の参照人物から生物検体の核酸配列リードを「得ること」は、配列情報を得るために核酸を直接シーケンシングすることを含むことができる。一部の実施形態では、「得ること」は、別の者により核酸から直接得られた配列情報を受け取ることを含むことができる。
一部の実施形態では、試料中の一部またはすべての核酸は、シーケンシング前または中に(例えば、非特異的に、例えば、PCRに基づく方法により)濃縮および/または増幅される。ある特定の実施形態では、試料中の特異的核酸種またはサブセットは、シーケンシング前または中に濃縮および/または増幅される。一部の実施形態では、核酸のあらかじめ選択されたプールの種またはサブセットは、ランダムにシーケンシングされる。一部の実施形態では、試料中の核酸は、シーケンシング前または中に濃縮および/または増幅されない。
一部の実施形態では、ゲノムの代表的画分は、シーケンシングされ、「カバレッジ」または「カバレッジ倍数」と呼ばれることもある。例えば、1倍のカバレッジは、ゲノムのヌクレオチド配列のおよそ100%がリードにより表されることを示す。一部の事例では、カバレッジ倍数は、「シーケンシング深度」と呼ばれる(およびそれに正比例する)。一部の実施形態では、「カバレッジ倍数」は、参照として以前のシーケンシング実験を参照する相対的用語である。例えば、第2のシーケンシング実験は、第1のシーケンシング実験の2分の1のカバレッジを有することがある。一部の実施形態では、ゲノムは、ゲノムの所与の領域が、2つもしくはそれより多くのリードまたはオーバーラップしているリードによりカバーされ得る(例えば、1を超える「カバレッジ倍数」、例えば、2倍のカバレッジ)冗長性で、シーケンシングされる。一部の実施形態では、ゲノム(例えば、全ゲノム)は、約0.01倍〜約100倍のカバレッジ、約0.1倍〜約20倍のカバレッジ、または約0.1倍〜約1倍のカバレッジ(例えば、約0.015倍、0.02倍、0.03倍、0.04倍、0.05倍、0.06倍、0.07倍、0.08倍、0.09倍、0.1倍、0.2倍、0.3倍、0.4倍、0.5倍、0.6倍、0.7倍、0.8倍、0.9倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍またはそれを超えるカバレッジ)で、シーケンシングされる。一部の実施形態では、ゲノムの特異的部分(例えば、標的化された方法からのゲノム部分)がシーケンシングされ、カバレッジ倍数値は、シーケンシングされる特異的ゲノム部分の画分を一般に指す(すなわち、カバレッジ倍数値は、全ゲノムを指さない)。一部の事例では、特異的ゲノム部分は、1000倍のカバレッジまたはそれを超えるカバレッジでシーケンシングされる。例えば、特異的ゲノム部分を、2000倍、5,000倍、10,000倍、20,000倍、30,000倍、40,000倍または50,000倍のカバレッジでシーケンシングすることができる。一部の実施形態では、シーケンシングは、約1,000倍〜約100,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約10,000倍〜約70,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約20,000倍〜約60,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約30,000倍〜約50,000倍のカバレッジでのものである。
一部の実施形態では、1個体からの1つの核酸試料がシーケンシングされる。ある特定の実施形態では、2つまたはそれより多くの試料であって、1個体からのものであるかまたは異なる個体からのものである試料の各々からの核酸が、シーケンシングされる。ある特定の実施形態では、各生体試料が1個体または2もしくはそれより多くの個体からのものである、2つまたはそれより多くの生体試料からの核酸試料が、プールされ、そのプールがシーケンシングされる。後者の実施形態では、各生体試料からの核酸試料は、1つまたは複数の固有識別子により識別されることが多い。
一部の実施形態では、シーケンシング方法は、シーケンシングプロセスにおいて配列反応の多重化を可能にする識別を利用する。固有識別子の数が多いほど、例えば、シーケンシングプロセスで多重化することができる、検出用の試料および/または染色体の数が多い。シーケンシングプロセスは、任意の好適な数(例えば、4、8、12、24、48、96またはそれより多く)の固有識別子を使用して、行うことができる。
シーケンシングプロセスは、固相を使用することもあり、固相は、ライブラリーからの核酸を結合させることができるフローセスであって、試薬を流動させ、結合した核酸と接触させることができるフローセルを、含むこともある。フローセルは、フローセルレーンを含むこともあり、識別子の使用は、各レーンでのいくつかの試料の解析を容易にすることができる。フローセルは、結合された分析物を保持し、および/またはその上を試薬溶液が順序だって通過することを可能にするように、構成することができる固体支持体であることが多い。フローセルは、多くの場合、平面形状であり、光学的に透明であり、一般に、ミリメートルまたはミリメートル未満の規模であり、分析物/試薬相互作用が起こるチャネルまたはレーンを有することが多い。一部の実施形態では、所与のフローセルレーンで解析される試料の数は、ライブラリー調製および/またはプローブ設計中に利用される固有識別子の数に依存する。例えば、12の識別子を使用する多重化により、8レーンフローセルで(例えば、96ウェルマイクロウェルプレートにおけるウェルの数に等しい)96の試料の同時解析が可能になる。同様に、例えば48の識別子を使用する多重化により、8レーンフローセルで(例えば、384ウェルマイクロウェルプレートにおけるウェルの数に等しい)384の試料の同時解析が可能になる。市販のマルチプレックスシーケンシングキットの非限定的な例としては、Illuminaのmultiplexing sample preparation oligonucleotide kitおよびmultiplexing sequencing primers and PhiX control kit(例えば、それぞれ、Illuminaのカタログ番号PE−400−1001およびPE−400−1002)が挙げられる。
任意の好適な核酸シーケンシング方法を使用することができ、そのような方法の非限定的な例としては、マクサム・ギルバート法(Maxim & Gilbert)、連鎖停止法、一塩基合成法、ライゲーションによるシーケンシング、質量分析によるシーケンシング、顕微鏡法に基づく手法など、またはこれらの組合せが挙げられる。一部の実施形態では、例えば、マイクロ流体サンガーシーケンシングを含む、自動化サンガーシーケンシング法を含むサンガーシーケンシング法などの、第1世代技術を、本明細書で提供される方法において使用することができる。一部の実施形態では、核酸イメージング技術(例えば、透過型電子顕微鏡法(TEM)および原子間力顕微鏡法(AFM))の使用を含むシーケンシング技術を使用することができる。一部の実施形態では、ハイスループットシーケンシング法が使用される。ハイスループットシーケンシング法は、大規模並列方式で、ときにはフローセル内で、シーケンシングされる、クローン増幅されたDNA鋳型または単一のDNA分子を一般に含む。大規模並列方式でDNAをシーケンシングすることができる次世代(例えば、第2および第3世代)シーケンシング手法を本明細書に記載される方法に使用することができ、そのような手法は、本明細書では「大規模並列シーケンシング」(MPS)と総称される。一部の実施形態では、MPSシーケンシング法は、目的の特異的染色体、遺伝子または領域がシーケンシングされる、標的化アプローチを利用する。ある特定の実施形態では、試料中の大半のまたはすべての核酸がランダムにシーケンシング、増幅および/または捕捉される、非標的化アプローチが、使用される。
一部の実施形態では、標的化された濃縮、増幅および/またはシーケンシングアプローチが使用される。標的化アプローチは、配列特異的オリゴヌクレオチドの使用によるさらなる処理のために試料中の核酸のサブセットを単離、選択および/または濃縮することが多い。一部の実施形態では、配列特異的オリゴヌクレオチドのライブラリーは、試料中の核酸の1つまたは複数のセットを標的とする(例えば、そのようなセットとハイブリダイズする)ために利用される。配列特異的オリゴヌクレオチドおよび/またはプライマーは、目的の1つまたは複数の染色体、遺伝子、エクソン、イントロンおよび/または調節領域に存在する特定の配列(例えば、固有核酸配列)に対して選択的であることが多い。任意の好適な方法または方法の組合せを、標的核酸の1つまたは複数のサブセットの濃縮、増幅および/またはシーケンシングに使用することができる。一部の実施形態では、標的配列は、1つまたは複数の配列特異的アンカーを使用する固相(例えば、フローセル、ビーズ)への捕捉により単離および/または濃縮される。一部の実施形態では、標的配列は、配列特異的プライマーおよび/またはプライマーセットを使用するポリメラーゼに基づく方法(例えば、任意の好適なポリメラーゼに基づく伸長による、PCRに基づく方法)により濃縮および/または増幅される。配列特異的アンカーを、多くの場合、配列特異的プライマーとして使用することができる。
MPSシーケンシングは、一塩基合成法およびある特定のイメージングプロセスを使用することもある。本明細書に記載される方法において使用することができる核酸シーケンシング技術は、一塩基合成法および可逆的ターミネーターに基づくシーケンシング(例えば、IlluminaのGenome Analyzer;Genome Analyzer II;HISEQ 2000;HISEQ 2500(Illumina、San Diego CA))である。この技術を用いて、何百万もの核酸(例えば、DNA)断片を並行してシーケンシングすることができる。このタイプのシーケンシング技術の一例では、光学的に透明なスライドであって、その表面の8つの個別のレーンにオリゴヌクレオチドアンカー(例えば、アダプタープライマー)が結合されている、スライドを含有する、フローセルが使用される。
一塩基合成法は、一般に、鋳型により方向付けられる様式でプライマーまたは既存の核酸鎖にヌクレオチドを(共有結合性付加により)反復的に付加させることにより行われる。ヌクレオチドの反復的付加各々が検出され、核酸鎖の配列が得られるまでこのプロセスが何度も繰り返される。得られる配列の長さは、一部には、行われる付加および検出ステップの数に依存する。一塩基合成法の一部の実施形態では、ヌクレオチド付加の1ラウンドで、同じタイプの1つ、2つ、3つまたはそれより多くのヌクレオチド(例えば、A、G、CまたはT)が、付加され、検出される。ヌクレオチドを任意の好適な方法により(例えば、酵素的にまたは化学的に)付加させることができる。例えば、一部の実施形態では、ポリメラーゼまたはリガーゼは、ヌクレオチドをプライマーに、または既存の核酸鎖に、鋳型により方向付けられる様式で付加させる。一塩基合成法の一部の実施形態では、異なるタイプのヌクレオチド、ヌクレオチド類似体および/または識別子が使用される。一部の実施形態では、可逆的ターミネーターおよび/または除去可能な(例えば、切断可能な)識別子が使用される。一部の実施形態では、蛍光標識されたヌクレオチドおよび/またはヌクレオチド類似体が使用される。ある特定の実施形態では、一塩基合成法は、切断(例えば、識別子の切断および除去)および/または洗浄ステップを含む。一部の実施形態では、1つまたは複数のヌクレオチドの付加は、本明細書に記載されるまたは当技術分野において公知の好適な方法により検出され、そのような方法の非限定的な例としては、任意の好適なイメージング装置、好適なカメラ、デジタルカメラ、CCD(電荷結合素子)に基づくイメージング装置(例えば、CCDカメラ)、CMOS(相補型金属酸化物シリコン)に基づくイメージング装置(例えば、CMOSカメラ)、光ダイオード(例えば、光電子増倍チューブ)、電子顕微鏡法、電界効果トランジスタ(例えば、DNA電界効果トランジスタ)、ISFETイオンセンサー(例えば、CHEMFETセンサー)など、またはこれらの組合せが挙げられる。
本明細書に記載される方法を行うための任意の好適なMPS法、システムまたは技術プラットフォームを使用して、核酸配列リードを得ることができる。MPSプラットフォームの非限定的な例としては、Illumina/Solex/HiSeq(例えば、IlluminaのGenome Analyzer;Genome Analyzer II;HISEQ 2000;HISEQ)、SOLiD、Roche/454、PACBIOおよび/もしくはSMRT、Helicos True Single Molecule Sequencing、Ion TorrentおよびIon半導体に基づくシーケンシング(例えば、Life Technologiesにより開発されたようなもの)、WildFire、5500、5500xl Wおよび/もしくは5500xl W Genetic Analyzerに基づく技術(例えば、Life Technologiesにより開発され、販売されているようなもの;米国特許出願公開第2013/0012399号);Polonyシーケンシング、パイロシーケンシング、大規模並列シグネチャーシーケンシング(MPSS)、RNAポリメラーゼ(RNAP)シーケンシング、LaserGenシステムおよび方法、ナノポアに基づくプラットフォーム、化学物質感受性電界効果トランジスタ(CHEMFET)アレイ、電子顕微鏡法に基づくシーケンシング(例えば、ZS Genetics、Halcyon Molecularにより開発されたようなもの)、ナノボールシーケンシングなど、またはこれらの組合せが挙げられる。本明細書における方法を行うために使用することができる他のシーケンシング方法としては、デジタルPCR、ハイブリダイゼーションによるシーケンシング、ナノポアシーケンシング、染色体特異的シーケンシング(例えば、DANSR(選択された領域のデジタル解析))技術が挙げられる。
一部の実施形態では、核酸は、シーケンシングされ、シーケンシング産物(例えば、配列リードの一群)は、シーケンシングされた核酸の解析前にまたは解析と同時に処理される。例えば、配列リードは、アライメント、マッピング、フィルタリング、計数、正規化、重み付け、プロファイルの生成などのうちの1つまたは複数、およびこれらの組合せに従って、処理され得る。ある特定の処理ステップをいずれの順序で行ってもよく、ある特定の処理ステップを繰り返してもよい。
リードのマッピング
配列リードをマッピングすることができ、指定核酸領域(例えば、染色体またはその一部分)にマッピングするリードの数は、カウントと呼ばれる。ある特定の実施形態では、オーバーハング配列情報を含む配列リードをマッピングすることができ、オーバーハング配列情報を含むリードの数が、指定核酸領域にマッピングすることになる。任意の好適なマッピング方法(例えば、プロセス、アルゴリズム、プログラム、ソフトウェア、モジュールなど、またはこれらの組合せ)を使用することができる。マッピングプロセスのある特定の態様が、以下に説明される。
ヌクレオチド配列リード(すなわち、物理的なゲノム位置が不明である断片からの配列情報)のマッピングは、いくつかの方法で行うことができ、多くの場合、得られた配列リードと参照ゲノム内のマッチする配列とのアライメントを含む。そのようなアライメントでは、配列リードは、一般に、参照配列とアライメントされ、アライメントしているものは、「マッピングされている」と、「マッピングされた配列リード」と、または「マッピングされたリード」と言われる。ある特定の実施形態では、マッピングされた配列リードは、「ヒット」または「カウント」と呼ばれる。一部の実施形態では、マッピングされた配列リードは、様々なパラメーターに従ってまとめられ、下でさらに詳細に論じられる特定のゲノム部分に割り当てられる。
用語「アライメントされた」、「アライメント」または「アライメントすること」は、マッチ(例えば、同一性100%)または部分的マッチとして識別され得る、2つまたはそれより多くの核酸配列を一般に指す。アライメントを手作業で行うことができ、またはコンピュータ(例えば、ソフトウェア、プログラム、モジュールもしくはアルゴリズム)により行うことができ、この非限定的な例としては、Illumina Genomics Analysis pipelineの一部として配給されているEfficient Local Alignment of Nucleotide Data(ELAND)コンピュータプログラムが挙げられる。配列リードのアライメントは、100%配列マッチであり得る。一部の場合には、アライメントは、100%未満の配列マッチ(すなわち、非完璧マッチ、部分的マッチ、部分的アライメント)である。一部の実施形態では、アライメントは、約99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%または75%マッチである。一部の実施形態では、アライメントは、ミスマッチを含む。一部の実施形態では、アライメントは、1、2、3、4または5つのミスマッチを含む。2つまたはそれより多くの配列を、どちらかの鎖(例えば、センスまたはアンチセンス鎖)を使用してアライメントすることができる。ある特定の実施形態では、核酸配列は、別の核酸配列の逆相補鎖とアライメントされる。
様々な計算論的方法を使用して、各配列リードを一部分にマッピングすることができる。配列をアライメントするために使用することができるコンピュータアルゴリズムの非限定的な例としては、限定ではないが、BLAST、BLITZ、FASTA、BOWTIE 1、BOWTIE 2、ELAND、MAQ、PROBEMATCH、SOAP、BWAもしくはSEQMAP、またはその変形形態、またはそれらの組合せが挙げられる。一部の実施形態では、配列リードを参照ゲノム内の配列とアライメントすることができる。一部の実施形態では、配列リードを、例えば、GenBank、dbEST、dbSTS、EMBL(European Molecular Biology Laboratory)およびDDBJ(日本DNAデータバンク)を含む、当技術分野において公知の核酸データベースにおいて見つけることができ、および/またはそのようなデータベース内の配列とアライメントすることができる。BLASTまたは類似のツールを使用して、識別された配列を配列データベースに対して検索することができる。次いで、検索ヒットを使用して、例えば、識別された配列を適切な部分にソートすることができる(以下に説明される)。
一部の実施形態では、リードは、参照ゲノム内の部分に一意的にマッピングすることもあり、または非一意的にマッピングすることもある。リードは、それが参照ゲノム内の単一の配列とアライメントした場合、「一意的にマッピングされた」と考えられる。リードは、それが参照ゲノム内の2つまたはそれより多くの配列とアライメントした場合、「非一意的にマッピングされた」と考えられる。一部の実施形態では、非一意的にマッピングされたリードは、さらなる解析(例えば、定量化)から除外される。ある特定の実施形態では、参照ゲノムとマッピングされた個々の試料からのリードとの間に存在し得る一塩基多型を考慮するために、ある特定の少しのミスマッチ(0〜1)が許可され得る。一部の実施形態では、いかなる程度のミスマッチも、参照配列へのリードのマッピングに許可されない。
本明細書で使用される場合、用語「参照ゲノム」は、対象からの識別された配列を参照するために使用することができる任意の生物またはウイルスについての任意の特定の既知のシーケンシングまたは特徴付けされたゲノムを指し、これは、部分的なものか完全なものかを問わない。例えば、ヒト対象にはもちろん多くの他の生物にも使用される参照ゲノムは、ワールドワイドウェブURL ncbi.nlm.nih.govのNational Center for Biotechnology Informationで見つけることができる。「ゲノム」は、核酸配列で表される、生物またはウイルスの完全遺伝情報を指す。本明細書で使用される場合、参照配列または参照ゲノムは、多くの場合、1個体または複数の個体からの組み立てられたまたは部分的に組み立てられたゲノム配列である。一部の実施形態では、参照ゲノムは、1名または複数名のヒト個体からの組み立てられたまたは部分的に組み立てられたゲノム配列である。一部の実施形態では、参照ゲノムは、染色体に割り当てられた配列を含む。
ある特定の実施形態では、マッピング能力は、ゲノム領域(例えば、部分、ゲノム部分)について評定される。マッピング能力は、ヌクレオチド配列リードを参照ゲノムの一部分と明確にアライメントする能力であり、通常は、例えば0、1、2またはそれより多くのミスマッチを含む、指定数までのミスマッチである。所与のゲノム領域についての予想マッピング能力は、あらかじめ設定されたリード長についてスライディングウインドウアプローチを使用すること、および結果として得られるリードレベルのマッピング能力の値を平均することにより、推定することができる。固有ヌクレオチド配列の伸長部を含むゲノム領域が高いマッピング能力値を有することもある。
ペアエンドシーケンシングの場合、好適なマッピングおよび/またはアライメントプログラムの使用によりリードを参照ゲノムにマッピングすることができ、そのようなプログラムの非限定的な例としては、BWA(Li H. and Durbin R. (2009)Bioinformatics 25, 1754-60)、Novoalign[Novocraft (2010)]、Bowtie(Langmead B, et al., (2009) Genome Biol. 10:R25)、SOAP2(Li R, et al., (2009) Bioinformatics 25, 1966-67)、BFAST(Homer N, et al., (2009) PLoS ONE 4, e7767)、GASSST(Rizk, G. and Lavenier, D. (2010) Bioinformatics 26, 2534-2540)、およびMPscan(Rivals E., et al. (2009) Lecture Notes in Computer Science 5724, 246-260)などが挙げられる。ペアエンドリードは、好適なショートリードアライメントプログラムを使用してマッピングおよび/またはアライメントすることができる。ショートリードアライメントプログラムの非限定的な例としては、BarraCUDA、BFAST、BLASTN、BLAT、Bowtie、BWA、CASHX、CUDA−EC、CUSHAW、CUSHAW2、drFAST、ELAND、ERNE、GNUMAP、GEM、GensearchNGS、GMAP、Geneious Assembler、iSAAC、LAST、MAQ、mrFAST、mrsFAST、MOSAIK、MPscan、Novoalign、NovoalignCS、Novocraft、NextGENe、Omixon、PALMapper、Partek、PASS、PerM、QPalma、RazerS、REAL、cREAL、RMAP、rNA、RTG、Segemehl、SeqMap、Shrec、SHRiMP、SLIDER、SOAP、SOAP2、SOAP3、SOCS、SSAHA、SSAHA2、Stampy、SToRM、Subread、Subjunc、Taipan、UGENE、VelociMapper、TimeLogic、XpressAlign、ZOOMなど、またはこれらの組合せが挙げられる。ペアエンドリードは、参照ゲノムに従って、同じポリヌクレオチド断片の反対側の末端にマッピングされることが多い。一部の実施形態では、リードメイトが独立してマッピングされる。一部の実施形態では、両方の配列リードからの(すなわち、各末端からの)情報は、マッピングプロセスで因数分解される。参照ゲノムは、ペアエンドリードメイト間に位置する核酸の配列を決定および/または推測するために使用されることが多い。用語「不一致リードペア」は、本明細書で使用される場合、リードメイトの一方または両方が、一つには、連続するヌクレオチドのセグメントにより定義される、参照ゲノムの同じ領域に明確にマッピングすることができないリードメイトのペアを含む、ペアエンドリードを指す。一部の実施形態では、不一致リードペアは、参照ゲノムの予想外の位置にマッピングする、ペアエンドリードメイトである。参照ゲノムの予想外の位置の非限定的な例としては、(i)2つの異なる染色体、(ii)所定の断片サイズより大きい(例えば、300bpより大きい、500bpより大きい、1000bpより大きい、5000bpより大きい、もしくは10,000bpより大きい)断片サイズによって隔てられている位置、(iii)参照配列と合致しない方向(すなわち、反対方向)など、またはこれらの組合せが挙げられる。一部の実施形態では、不一致リードメイトは、試料中の鋳型ポリヌクレオチド断片の長さ(例えば、長さ代表値、所定の断片サイズ)または予想長に従って識別される。例えば、試料中のポリヌクレオチド断片の長さ代表値または予想長を超える長さによって隔てられている位置にマッピングするリードメイトは、不一致リードペアとして識別されることもある。反対方向にマッピングするリードペアは、リードのうちの一方の逆相補鎖を使うこと、および参照配列の同じ鎖を使用して両方のリードのアライメントを比較することにより、決定されることもある。不一致リードペアは、当技術分野において公知のまたは本明細書に記載される任意の好適な方法および/またはアルゴリズム(例えば、SVDetect、Lumpy、BreakDancer、BreakDancerMax、CREST、DELLYなど、またはこれらの組合せ)により識別することができる。
配列リード定量化
選択された特徴または変数に基づいてマッピングまたは分割される配列リードを定量化して、1つまたは複数の部分(例えば、参照ゲノムの部分)にマッピングされるリードの量または数を決定することができる。一部の実施形態では、選択された特徴または変数に基づいてマッピングまたは分割されるオーバーハング情報を含む配列リードを定量化して、1つまたは複数の部分にマッピングされるオーバーハング情報を含むリードの量または数を決定することができる。ある特定の実施形態では、部分またはセグメントにマッピングされる配列リードの量は、カウントまたはリード密度と呼ばれる。
カウントは、多くの場合、ゲノム部分と関連付けられる。一部の実施形態では、カウントは、部分にマッピングされた(すなわち、部分と関連付けられた)配列リードの一部またはすべてから決定される。ある特定の実施形態では、カウントは、部分の群(例えば、セグメントまたは領域内の部分)にマッピングされた配列リードの一部またはすべてから決定される。
カウントは、好適な方法、操作または数学的プロセスにより決定することができる。カウントは、セグメントに対応するゲノム部分もしくはゲノム部分の群にマッピングされた、ゲノムの小領域(例えば、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域、性染色体領域)に対応する部分の群にマッピングされた、および/または、ときには、ゲノムに対応する部分の群にマッピングされた、すべての配列リードの直和であることもある。リード定量化は、比であることもあり、領域a内の部分についての定量化の領域b内の部分についての定量化に対する比であることもある。領域aは、1つの部分、セグメント領域、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域および/または性染色体領域であることもある。領域bは、独立して、1つの部分、セグメント領域、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域、性染色体領域、すべての常染色体を含む領域、性染色体を含む領域、および/またはすべての染色体を含む領域であることもある。
一部の実施形態では、カウントは、生配列リードおよび/またはフィルタリングされた配列リードから導出される。ある特定の実施形態では、カウントは、ゲノム部分にまたはゲノム部分の群(例えば、領域内のゲノム部分)にマッピングされた配列リードの代表値、平均値または合計である。一部の実施形態では、カウントは、不確定値に関連付けられる。カウントは、調整されることもある。カウントは、重み付けされた、除去された、フィルタリングされた、正規化された、調整された、平均された、平均値として導出された、中央値として導出された、加算された、またはこれらの組合せが施された、ゲノム部分または部分の群に関連付けられた配列リードに従って、調整することができる。
配列リード定量化は、リード密度であることもある。リード密度を、ゲノムの1つまたは複数のセグメントについて決定および/または生成することができる。ある特定の事例では、リード密度を、1つまたは複数の染色体について決定および/または生成することができる。一部の実施形態では、リード密度は、参照ゲノムのセグメントまたは一部分にマッピングされた配列リードのカウントの定量的測度を含む。リード密度を、好適なプロセスにより決定することができる。一部の実施形態では、リード密度は、好適な分布および/または好適な分布関数により決定される。分布関数の非限定的な例としては、確率関数、確率分布関数、確率密度関数(PDF)、カーネル密度関数(カーネル密度推定)、累積分布関数、確率質量関数、離散確率分布、絶対連続単変量分布など、任意の好適な分布、またはこれらの組合せが挙げられる。リード密度は、好適な確率密度関数から導出される密度推定であり得る。密度推定は、基礎をなす確率密度関数の推定値を実測データに基づいて構築することである。一部の実施形態では、リード密度は、密度推定(例えば、確率密度推定、カーネル密度推定)を含む。各々の部分が配列リードのカウントを構成する、ゲノムの1つまたは複数の部分の各々についての密度推定を生成することを含むプロセスに従って、リード密度を生成することができる。部分またはセグメントにマッピングされた、正規化および/または重み付けされたカウントについて、リード密度を生成することができる。一部の事例では、部分またはセグメントにマッピングされた各リードは、リード密度に寄与することができ、値(例えば、カウント)は、本明細書に記載される正規化プロセスから得られるその重みに等しくなる。一部の実施形態では、1つまたは複数の部分またはセグメントについてのリード密度が調整される。リード密度を、好適な方法により調整することができる。例えば、1つまたは複数の部分についてのリード密度に重み付けすることができ、および/またはリード密度を正規化することができる。
所与の部分またはセグメントについて定量化されたリードは、1つの供給源からのものであることもあり、または異なる供給源からのものであることもある。一例では、がんに罹患しているまたはがんの罹患が疑われる対象からの核酸から、リードを得ることができる。そのような状況では、1つまたは複数の部分にマッピングされたリードは、健康な細胞(すなわち、非がん細胞)とがん細胞(例えば、腫瘍細胞)の両方を代表するリードであることが多い。ある特定の実施形態では、ある部分にマッピングされたリードの一部は、がん細胞核酸からのものであり、同じ部分にマッピングされたリードの一部は、非がん細胞核酸からのものである。別の例では、胎児を宿している妊娠している雌からの核酸試料から、リードを得ることができる。そのような状況では、1つまたは複数の部分にマッピングされたリードは、胎児と胎児の母(例えば、妊娠している雌対象)の両方を代表するリードであることが多い。ある特定の実施形態では、ある部分にマッピングされたリードの一部は、胎児ゲノムからのものであり、同じ部分にマッピングされたリードの一部は、母体ゲノムからのものである。
アッセイ
本開示の手法を使用して、様々なアッセイを行うことができる。一部の場合には、試料を、試料核酸中に存在するオーバーハングの一部、多数またはすべてについてアッセイすることができる。この情報を、存在するオーバーハングの数または出現頻度を示す、試料の全般的オーバーハングプロファイルを生成するために使用することができる。一部の場合には、試料を、試料中に存在する1つまたは複数の特定のオーバーハングの一団についてアッセイすることができる。一部の場合には、試料を、試料中に存在するオーバーハングの1つまたは複数の特徴についてアッセイすることができる。一部の場合には、試料を、平滑末端化断片(例えば、片側が平滑末端化されている、または両側が平滑末端化されている、標的核酸(例えばDNA))についてアッセイすることができる。
試料のオーバーハングプロファイルは、試料中に存在するオーバーハングのある特定の特徴を解析および/または定量化することにより生成することができる。ある特定の事例では、プロファイルは、標的/鋳型核酸自体の特徴を、さらにまたは代替的に(例えば、オーバーハング情報とともに、またはなしで)含むことができる。ある特定の事例では、オーバーハングプロファイルは、標的/鋳型核酸の特徴を含まない。したがって、ある特定の実施形態では、オーバーハングプロファイルは、オーバーハング特徴からなる。オーバーハング/鋳型特徴は、回帰(例えば、ロジスティック回帰、線形回帰、多変量回帰、最小二乗回帰)、階層的クラスタリング(例えば、ウォードの階層的クラスタリング)、教師あり学習アルゴリズム(例えば、サポートベクターマシン(SVM))、多変量モデル(例えば、主成分分析(PCA))、線形判別分析、二次判別分析、バギング、ニューラルネットワーク、サポートベクターマシンモデル、ランダムフォレスト、分類木モデル、k近傍法などを含むがこれらに限定されない、任意の好適な定量化方法、クラスタリング方法、統計的アルゴリズム、分類器もしくはモデル、ならびに/または任意の好適な数学的および/もしくは統計的操作を使用して、解析または定量化することができる。
解析または定量化することができるオーバーハング/鋳型特徴としては、ジヌクレオチドカウント(例えば、オーバーハングもしくはリード中の特定のジヌクレオチドの存在/非存在(例えば、特定のジヌクレオチドを有する試料中のオーバーハングの数、特定のジヌクレオチドを有する試料中の鋳型+オーバーハングの数、もしくは特定のジヌクレオチドを有する試料中のオーバーハングなしの鋳型の数)および/またはオーバーハングもしくはリード内の特定のジヌクレオチドのインスタンスのカウント);トリヌクレオチドカウント(例えば、オーバーハングもしくはリード中の特定のトリヌクレオチドの存在/非存在(例えば、特定のトリヌクレオチドを有する試料中のオーバーハングの数、特定のトリヌクレオチドを有する試料中の鋳型+オーバーハングの数、もしくは特定のトリヌクレオチドを有する試料中のオーバーハングなしの鋳型の数)および/またはオーバーハングもしくはリード内の特定のトリヌクレオチドのインスタンスのカウント);テトラヌクレオチドカウント(例えば、オーバーハングもしくはリード中の特定のテトラヌクレオチドの存在/非存在(例えば、特定のテトラヌクレオチドを有する試料中のオーバーハングの数、特定のテトラヌクレオチドを有する試料中の鋳型+オーバーハングの数、もしくは特定のテトラヌクレオチドを有する試料中のオーバーハングなしの鋳型の数)および/またはオーバーハングもしくはリード内の特定のテトラヌクレオチドのインスタンスのカウント);ジヌクレオチドパーセント(例えば、特定のジヌクレオチドを有する試料中のオーバーハングのパーセント、特定のジヌクレオチドを有する試料中の鋳型+オーバーハングのパーセント、または特定のジヌクレオチドを有する試料中のオーバーハングなしの鋳型のパーセント;オーバーハング長により正規化されたオーバーハング中のジヌクレオチドの数;その特定のオーバーハングのものであるジヌクレオチドの比率;長さを問わず全オーバーハングにわたっての比較);トリヌクレオチドパーセント(例えば、特定のトリヌクレオチドを有する試料中のオーバーハングのパーセント、特定のトリヌクレオチドを有する試料中の鋳型+オーバーハングのパーセント、または特定のトリヌクレオチドを有する試料中のオーバーハングなしの鋳型のパーセント;オーバーハング長により正規化されたオーバーハング中のトリヌクレオチドの数;その特定のオーバーハングのものであるトリヌクレオチドの比率;長さを問わず全オーバーハングにわたっての比較);テトラヌクレオチドパーセント(例えば、特定のテトラヌクレオチドを有する試料中のオーバーハングのパーセント、特定のテトラヌクレオチドを有する試料中の鋳型+オーバーハングのパーセント、または特定のテトラヌクレオチドを有する試料中のオーバーハングなしの鋳型のパーセント;オーバーハング長により正規化されたオーバーハング中のテトラヌクレオチドの数;その特定のオーバーハングのものであるテトラヌクレオチドの比率;長さを問わず全オーバーハングにわたっての比較);鋳型の完全長;長さのカテゴリー(例えば、cfDNAの場合:サブヌクレオソーム、モノヌクレオソーム、マルチヌクレオソーム);オーバーハング長(例えば、1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、またはそれを超える塩基数);オーバーハングタイプ(例えば、5’オーバーハング、3’オーバーハング、平滑形);GC含有量(例えば、オーバーハングのGC含有量、鋳型+オーバーハングのGC含有量、またはオーバーハングなしの鋳型のGC含有量);オーバーハングパーセント(例えば、オーバーハング配列/全オーバーハングのlog2パーセント);オーバーハングカウント(例えば、特定のオーバーハング配列のカウント);長さパーセント(例えば、オーバーハングの長さ/鋳型の完全長);鋳型分子の全配列中に対するオーバーハング中のジヌクレオチドカウント;鋳型分子の全配列中に対するオーバーハング中のトリヌクレオチドカウント;鋳型分子の全配列中に対するオーバーハング中のテトラヌクレオチドカウント;オーバーハングが、特定の領域(例えば、コード領域、CpGアイランド、転写因子結合部位(例えば、CCCTC結合因子(CTCF)結合部位)、DNAse高感受性部位、オープンクロマチンを示す配列(例えば、ATAC−seqピーク);プロモーター領域、エンハンサー領域、高メチル化領域、目的の他の領域など)とオーバーラップするか、特定の領域に含有されるか、および/または特定の領域内で開始するかもしくは終了するかを含み得る、ブール変数;ゲノム座標;所与のオーバーハングタイプおよびオーバーハング長を有する分子の断片長または分布の平均値;所与のオーバーハング配列を有する分子の断片長または分布の平均値;ライブラリー間の差(例えば、変数間のデータの相関関係の識別(例えば、特徴Xと特徴Yの間の相関関係の検出、例えば、断片長分布の平均値対変数X(例えば、所与のオーバーハング配列を有する断片の長さまたは分布の平均値対そのX;ここで、X=上記の任意の特徴/変数)));など、ならびにこれらの組合せが挙げられるが、それらに限定されない。ジヌクレオチドの例としては、AA、AT、AC、AG、TT、TA、TC、TG、CC、CG、CA、CT、GG、GA、GC、およびGTが挙げられる。トリヌクレオチドは、可能な4のヌクレオチド組合せを含み、テトラヌクレオチドは、可能な4のヌクレオチド組合せを含む。一部の実施形態では、試料中のオーバーハング中のジヌクレオチドの存在が解析される。一部の実施形態では、試料中のオーバーハング中のCGジヌクレオチドの存在が解析される。一部の実施形態では、試料中のオーバーハング中のGGジヌクレオチドの存在が解析される。一部の実施形態では、試料中のオーバーハング中のGCジヌクレオチドの存在が解析される。
全般的オーバーハングプロファイルを含むオーバーハングプロファイル、オーバーハングの一団、およびオーバーハング特徴は、試料、または試料が採取された供給源(例えば、生物)の様々な特性を示すことができる。これらの特性としては、ヌクレアーゼ活性および/または含有量、トポイソメラーゼ活性および/または含有量、疾患(例えば、がん型、がん病期、感染症、臓器疾患または不全、神経変性疾患、虚血、脳卒中、心血管疾患)、細胞死(例えば、全身性の細胞死率の上昇または低下、特定の臓器または細胞型における細胞死率の上昇または低下、細胞死のある特定の様式(例えば、アポトーシス、オートファジー、壊死、分裂期細胞死、アノイキス、角質化、興奮毒性、フェロトーシス、ウォラー変性、活性化誘導細胞死(AICD)、虚血性細胞死、膨化死、免疫原性細胞死またはアポトーシス、パイロトーシス)の率の上昇または低下、アポトーシスまたは他の細胞死様式の調節異常)、マイクロバイオームプロファイル(例えば、腸マイクロバイオーム、血液マイクロバイオーム、口腔マイクロバイオーム、皮膚マイクロバイオーム、環境マイクロバイオーム(例えば、土壌マイクロバイオーム、水マイクロバイオーム))、ならびに放射線曝露のタイプおよび/または量(例えば、紫外線(AおよびB)、電離放射線(例えば、宇宙線、アルファ粒子、ベータ粒子、ガンマ線、X線)、中性子線)を挙げることができるが、これらに限定されない。一部の実施形態では、全般的オーバーハングプロファイルを含むオーバーハングプロファイル、オーバーハングの一団、およびオーバーハング特徴は、がんを示す。一部の実施形態では、全般的オーバーハングプロファイルを含むオーバーハングプロファイル、オーバーハングの一団、およびオーバーハング特徴は、消化管がんを示す。
全般的オーバーハングプロファイルを含むオーバーハングプロファイル、オーバーハングの一団、およびオーバーハング特徴は、ヌクレアーゼ(例えば、DNase)活性、例えば、内因性ヌクレアーゼ活性を示すことができる。ヌクレアーゼ(例えば、DNase)活性は、がんを含むがこれに限定されない、本明細書で論じられる試料または供給源の様々な特性を示すことができる。一部の場合には、試料中の天然に存在する核酸のオーバーハングをアッセイすることができる。一部の場合には、核酸(例えば、合成された核酸)を試料に導入することができ、するとそこでそれらの核酸は、試料中に存在するヌクレアーゼによる作用を受け得る。既知核酸集団の使用は、異なる試料からのものと比較される、オーバーハングプロファイルを生じさせることができる。既知核酸上に生成された異なるオーバーハングは、試料のヌクレアーゼプロファイルの情報を提供することができる。組織特異的ヌクレアーゼ活性をin vitroでアッセイすることができる。例えば、異なる臓器、組織または細胞型からの細胞系を培養することができ、細胞死を誘導することができ、その後、オーバーハングプロファイルのアッセイを行うことができる。オーバーハングプロファイルを特定の酵素(ヌクレアーゼ)または酵素の群についてアッセイすることもできる。特定の酵素または酵素の群を使用して、核酸の集団を消化することができ、結果として生じたオーバーハングプロファイルをアッセイすることができる。例えば、CRISPR/Casシステムタンパク質または他の核酸誘導ヌクレアーゼをアッセイして、それらが生じさせる末端のタイプ(例えば、平滑末端、1bp付着末端、他のオーバーハング)を判定することができる。一部の応用では、オーバーハングプロファイルアッセイは、DNAse活性の活性を変更することを目的とする特定の処置および標的治療(例えば、ビタミンCおよびK3;抗がん治療に使用されるトポイソメラーゼ阻害剤;など)の有効性をモニターするために使用され得る。
一部の場合には、対象におけるまたは試料中のヌクレアーゼを阻害して、特定のオーバーハングプロファイルを保存することができる。例えば、細胞プロセスは、1つのオーバーハングプロファイルを(例えば、溶解、細胞死、および/または死後細胞内プロセスから)生じさせ得るが、細胞外に(例えば、血液などの体液中に)存在するヌクレアーゼは、細胞の第1のオーバーハングプロファイルをさらに変更し得る。細胞外のものなどのヌクレアーゼを(例えば、一時的に)阻害または不活性化して、最初のオーバーハングプロファイルをアッセイするために保存することができる。ヌクレアーゼ活性を試料採取より前に(例えば、アクチンで)阻害することができる。一例では、オーバーハングの2つの集団、罹患細胞からのもの(D)と健康な細胞からのもの(H)、がアッセイされる。細胞からのDNAの放出後、血液中のヌクレアーゼは、オーバーハングをさらに変更することができ、その結果、修飾されたオーバーハング集団D’およびH’が生じることになる。それ故、血液中に存在するヌクレアーゼ(例えば、DNase)を阻害することにより、修飾されていないまたはあまり修飾されていないオーバーハング集団(例えば、DおよびH、または阻害なしで観察されると予想されるものよりDおよびHに近い)をアッセイすることが可能になり得る。オーバーハングプロファイルに影響を与える他の酵素も阻害することができる。例えば、トポイソメラーゼ切除は、核酸を切断することができ、その結果、特定のオーバーハングプロファイルが生じることになる。これらのプロファイルのアッセイを可能にするために、トポイソメラーゼ阻害剤を導入してこれらのオーバーハングを(例えば、再ライゲーションを防止することにより)保存することができる。
オーバーハングプロファイルは、様々な手法によりアッセイすることができる。オーバーハングを核酸シーケンシングによりアッセイすることができ、これは、本明細書で開示されるようにアッセイすることを含む。オーバーハングを、結合またはハイブリダイゼーションによりアッセイすることができる。例えば、オーバーハングを、特定のオーバーハングと特異的にハイブリダイズする結合剤に結合させることができる。結合剤は、アレイまたはビーズなどの基板上に位置することがある。結合イベントを検出することができ(例えば、蛍光または他の光シグナル、電気シグナル)、オーバーハングプロファイルを判定することができる。アッセイの前に、またはアッセイの一部として、核酸の特定の種(例えば、特定のオーバーハングを有するもの、またはオーバーハングの一団からの1つもしくは複数のオーバーハングを有するもの)を濃縮することができ、これは、本明細書で開示されるように濃縮することを含む。
分類およびそれらの使用
本明細書に記載される方法は、上記の試料または供給源の1つまたは複数の特性を示すアウトカムを提供することができる。本明細書に記載される方法は、被検試料(例えば、医学的状態の存在もしくは非存在および/または表現型を決定するアウトカムを提供するもの)についての表現型および/または医学的状態の存在もしくは非存在を示すアウトカムを提供することもある。アウトカムは、分類プロセスの一部であることが多く、分類(例えば、試料もしくは供給源の1つもしくは複数の特性、ならびに/または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在の分類)は、アウトカムに基づくこともあり、および/またはアウトカムを含むこともある。アウトカムおよび/または分類は、分類プロセス(例えば、統計値)において試料および/もしくは供給源の1つもしくは複数の特性ならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在の判定を容易にする、被検試料についてのデータ処理の結果に基づくこともあり、および/またはそのような結果を含むこともある。アウトカムおよび/または分類は、試料もしくは供給源の1つもしくは複数の特性、ならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在を決定するスコアをあるいはそのような特性ならびに/または存在もしくは非存在のコールを含むこともあり、またはそのようなスコアもしくはコールに基づくこともある。ある特定の実施形態では、アウトカムおよび/または分類は、分類プロセスにおいて試料もしくは供給源の1つもしくは複数の特性をならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在を予測および/または判定する、結論を含む。
アウトカムおよび/または分類の任意の好適な表現を提供することができる。アウトカムおよび/または分類は、確率の1つまたは複数の考察に関連して本明細書に記載される処理方法を使用して生成された1つまたは複数の数値に基づくこともあり、および/またはそのような数値を含むこともある。利用することができる値の非限定的な例としては、感度、特異度、標準偏差、中央絶対偏差(MAD)、確実性の測度、信頼度の測度、被検試料について得られた値が特定の値範囲内または外にある確実性または信頼度の測度、不確実性の測度、被検試料について得られた値が特定の値範囲内または外にある不確実性の測度、変動係数(CV)、信頼レベル、信頼区間(例えば、約95%信頼区間)、標準スコア(例えば、zスコア)、カイ値、パイ値、t検定の結果、p値、倍数性値、適合した少数派種の分率、面積比、中央値レベルなど、またはこれらの組合せが挙げられる。一部の実施形態では、アウトカムおよび/または分類は、オーバーハングプロファイル、リード密度、リード密度プロファイルおよび/またはプロット(例えば、プロファイルプロット)を含む。ある特定の実施形態では、複数の値が、ときにはそのような値についてのプロファイル(例えば、zスコアプロファイル、p値プロファイル、カイ値プロファイル、パイ値プロファイル、t検定の結果、値のプロファイルなど、またはこれらの組合せ)に関して、一緒に解析される。確率の考察は、試料または供給源の1つもしくは複数の特性の判定、ならびに/または対象が、遺伝子型、表現型、遺伝的変異および/もしくは医学的状態を有するリスクがあるか、もしくは有しているかの判定を容易にすることができ、前述のことを決定するアウトカムおよび/または分類が、そのような考察を含むこともある。
ある特定の実施形態では、アウトカムおよび/または分類は、被検試料について遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在のリスクもしくは確率を予測および/または判定する結論に基づく、ならびに/またはそのような結論を含む。結論は、本明細書に記載されるデータ解析方法から決定された値(例えば、確率、確実性および/または不確実性を示す統計値(例えば、標準偏差、中央絶対偏差(MAD)、確実性の測度、信頼度の測度、被検試料について得られた値が特定の値範囲内または外にある確実性または信頼度の測度、不確実性の測度、被検試料について得られた値が特定の値範囲内または外にある不確実性の測度、変動係数(CV)、信頼レベル、信頼区間(例えば、約95%信頼区間)、標準スコア(例えば、zスコア)、カイ値、パイ値、t検定の結果、p値、感度、特異度など、またはこれらの組合せ)に基づくこともある。アウトカムおよび/または分類は、特定の被検試料についての検査室検査レポートに、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在に関連する確率(例えば、オッズ比、p値)、尤度またはリスク因子として表示されることもある。被検試料についてのアウトカムおよび/または分類は、特定の遺伝子型、表現型、遺伝的変異および/または医学的状態に関して「陽性」または「陰性」として提供されることもある。例えば、アウトカムおよび/または分類は、特定の被検試料について、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在が判定された場合、検査室検査レポートに「陽性」と表示されることもあり、ときには、アウトカムおよび/または分類は、特定の被検試料について、遺伝子型、表現型、遺伝的変異および/または医学的状態の非存在が判定された場合、検査室検査レポートに「陽性」と表示される。アウトカムおよび/または分類は、データ処理で判定されることもあり、データ処理で使用される仮説を含むこともある。
分類プロセスで生成される分類について、真陽性、偽陽性、真陰性および偽陰性という4つのタイプが概して存在する。用語「真陽性」は、本明細書で使用される場合、被検試料について正しく判定された遺伝子型、表現型、遺伝的変異、または医学的状態の存在を指す。用語「偽陽性」は、本明細書で使用される場合、被検試料について誤って判定された遺伝子型、表現型、遺伝的変異、または医学的状態の存在を指す。用語「真陰性」は、本明細書で使用される場合、被検試料について正しく判定された遺伝子型、表現型、遺伝的変異、または医学的状態の非存在を指す。用語「偽陰性」は、本明細書で使用される場合、被検試料について誤って判定された遺伝子型、表現型、遺伝的変異、または医学的状態の非存在を指す。分類プロセスについて性能の次の2つの測度:(i)一般に、陽性であると正しく識別される予測陽性の分率である、感度値;および(ii)一般に、陰性であると正しく識別される予測陽性の分率である、特異度値を、これらの存在比に基づいて算出することができる。
ある特定の実施形態では、分類プロセスについて生成される検査室検査レポートは、検査性能の測度(例えば、感度および/または特異度)、および/または信頼度の測度(例えば、信頼レベル、信頼区間)を含む。検査性能および/または信頼度の測度は、被検試料についての検査室検査を行う前に行われる臨床検証研究から得られることもある。ある特定の実施形態では、感度、特異度および/または信頼度のうちの1つまたは複数は、パーセンテージとして表される。一部の実施形態では、感度、特異度または信頼レベルの各々について独立して表されるパーセンテージは、約90%より高い(例えば、約90、91、92、93、94、95、96、97、98または99%であるか、または99%より高い(例えば、約99.5%であるかそれより高い、約99.9%であるかそれより高い、約99.95%であるかそれより高い、約99.99%であるかそれより高い))。特定の信頼レベル(例えば、約90%〜約99.9%(例えば約95%)の信頼レベル)について表される信頼区間を値の範囲として表すことができ、そのような信頼区間は、特定の信頼レベルについての感度および/または特異度の範囲として表されることもある。一部の実施形態での変動係数(CV)は、パーセンテージとして表され、パーセンテージは、約10%またはそれ未満(例えば、約10、9、8、7、6、5、4、3、2もしくは1%、または1%未満(例えば、約0.5%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.01%もしくはそれ未満))であることもある。ある特定の実施形態での(例えば、特定のアウトカムおよび/または分類が偶然によるものでない)確率は、標準スコア(例えば、zスコア)、p値、またはt検定の結果として表される。一部の実施形態では、アウトカムおよび/または分類についての測定分散、信頼レベル、信頼区間、感度、特異度など(例えば、信頼度パラメーターと総称される)は、本明細書に記載される1つまたは複数のデータ処理操作を使用して生成することができる。
被検試料についてのアウトカムおよび/または分類は、医療専門家または他の有資格者(例えば、医師もしくは助手)により発注されることが多く、彼らに提供されることが多く、彼らが、アウトカムおよび/または分類を、被検試料が採取される対象に伝送する。ある特定の実施形態では、アウトカムおよび/または分類は、好適な視覚媒体(例えば、機械の周辺機器またはコンポーネント、例えば、プリンターまたはディスプレイ)を使用して提供される。分類および/またはアウトカムは、医療専門家または有資格者にレポートの形態で提供されることが多い。レポートは、アウトカムおよび/または分類(例えば、値、試料もしくは供給源の1つもしくは複数の特性、または遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在の評定もしくは確率)の表示を通常は含み、関連信頼度パラメーターを含むこともあり、アウトカムおよび/または分類を生成するために使用された検査についての性能の測度を含むこともある。レポートは、追跡調査手順(例えば、アウトカムまたは分類を確認する手順)の助言を含むこともある。レポートは、染色体またはその一部分の視覚表示(例えば、染色体イディオグラムまたはカリオグラム)を含むこともあり、被検試料について識別された染色体の重複および/または欠失領域の視覚化(例えば、染色体欠失または重複についての全染色体の視覚化;欠失し領域または重複領域が示されている全染色体の視覚化;重複または欠失した染色体の部分の視覚化;染色体の部分の欠失イベントにおいて残存する染色体の部分の視覚化)を示すこともある。
レポートを、医療従事者または他の有資格者による遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在の判定を容易にする好適な形式で表示することができる。レポートの作成に使用するために好適な形式の非限定的な例としては、デジタルデータ、グラフ、2Dグラフ、3Dグラフおよび4Dグラフ、画像(例えば、jpg、ビットマップ(例えば、bmp)、pdf、tiff、gif、raw、pngなど、もしくは好適な形式)、統計図表、チャート、表、棒グラフ、円グラフ、図、フローチャート、散布図、マップ、ヒストグラム、密度チャート、関数グラフ、回路図、ブロック図、バブルマップ、信号空間ダイヤグラム、コンター図、統計地図、クモの巣グラフ、ベン図、計算図表など、または前述のものの組合せが挙げられる。
レポートを、コンピュータにより、および/またはヒトによるデータ入力により、作成してもよく、好適な電子媒体を使用して(例えば、インターネット経由で、コンピュータ経由で、ファクシミリ経由で、同じもしくは異なる物理的位置で1つのネットワークの場所から別の場所に)、またはデータを送信もしくは受信する別の方法(例えば、メールサービス、クーリエサービスなど)により、伝送および通信することができる。レポートを伝送するための通信媒体の非限定的な例としては、聴覚ファイル、コンピュータ可読ファイル(例えば、pdfファイル)、紙のファイル、検査室ファイル、診療記録ファイル、または前の段落に記載の任意の他の媒体が挙げられる。検査室ファイルまたは診療記録ファイルは、ある実施形態では、有形形態であってもよく、または電子形態(例えば、コンピュータ可読形態)であってもよい。レポートが作成され、伝送された後、アウトカムおよび/または分類を含む書面による表示および/またはグラフィック表示を好適な通信媒体経由で得ることによりレポートを受け取ることができ、これを見直すことによって、医療専門家または他の有資格者は、試料または供給源の1つもしくは複数の特性、または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在について判定することができる。
アウトカムおよび/または分類は、検査室により提供されることがあり、検査室から得られる(例えば、検査室ファイルから得られる)ことがある。検査室ファイルは、試料もしくは供給源の1つもしくは複数の特性および/または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在を判定するための1つまたは複数の検査を行う検査室により、作成され得る。検査室職員(例えば、主席研究員)は、アウトカムおよび/または分類の根拠となる被検試料に関連する情報(例えば、検査プロファイル、参照プロファイル、検査値、参照値、逸脱レベル、患者情報)を解析することができる。近いまたは疑わしい遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在に関するコールについては、検査室職員は、被検対象からの同じ(例えば、同じ試料のアリコート)または異なる被検試料を使用して同じ手順を再実行することができる。検査室は、検査室ファイルからの遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を評定する職員と同じ場所にあってもよく、または異なる場所(例えば、別の国)にあってもよい。例えば、検査室ファイルをある場所で作成し、別の場所に伝送することができ、そこで、そのファイル内の被検試料についての情報が、医療専門家または他の有資格者により評定され、必要に応じて、被検試料が採取された対象に伝送される。検査室が、被検試料についてのゲノム不安定性、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在についての分類を含む検査室レポートを作成および/または伝送することもある。検査室検査レポートを作成する検査室は、認定された検査室であることもあり、臨床検査室改善法(CLIA)のもとで認定された検査室であることもある。
アウトカムおよび/または分類は、対象の診断の構成要素であることもあり、ときには、アウトカムおよび/または分類は、被検試料についての診断を下すことの一部として利用および/または評定される。例えば、医療専門家または他の有資格者は、アウトカムおよび/または分類を解析し、そのアウトカムおよび/もしくは分類に基づいて、または一部は基づいて、診断を下すことができる。一部の実施形態では、医学的状態、疾患、症状または異常の判定、検出または診断は、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を決定するアウトカムおよび/または分類の使用を含む。したがって、本明細書に記載される方法により生成されたアウトカムまたは分類に従って、ならびに必要に応じて、被検試料についての遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在についての分類を含む検査室レポートの作成および伝送に従って、被検試料についての遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を診断する方法が、本明細書で提供される。
機械、ソフトウェアおよびインターフェース
本明細書に記載されるある特定のプロセスおよび方法(例えば、リードのサブセットを選択するプロセスおよび方法、オーバーハングプロファイルを生成するプロセスおよび方法、オーバーハングデータを処理するプロセスおよび方法、オーバーハング定量化を処理するプロセスおよび方法、オーバーハングデータまたはオーバーハングプロファイルに基づいて試料の1つまたは複数の特性を判定するプロセスおよび方法)は、コンピュータ、マイクロプロセッサー、ソフトウェア、モジュールまたは他の機械なしでは遂行することができないことが多い。本明細書に記載される方法は、コンピュータ実装方法であり得、方法の1つまたは複数の部分は、1つまたは複数のプロセッサー(例えば、マイクロプロセッサー)、コンピュータ、システム、装置または機械(例えば、マイクロプロセッサー制御型機械)により遂行されることもある。
使用に好適なコンピュータ、システム、装置、機械およびコンピュータプログラム製品は、多くの場合、コンピュータ可読記憶媒体を含み、またはコンピュータ可読記憶媒体とともに利用される。コンピュータ可読記憶媒体の非限定的な例としては、メモリー、ハードディスク、CD−ROM、フラッシュメモリーデバイスなどが挙げられる。コンピュータ可読記憶媒体は、一般に、コンピュータハードウェアであり、多くの場合、非一過性コンピュータ可読記憶媒体である。コンピュータ可読記憶媒体は、コンピュータ可読伝送媒体ではなく、後者のコンピュータ可読伝送媒体は、それ自体が伝送信号である。
実行可能プログラムが記憶されているコンピュータ可読記憶媒体であって、プログラムが、マイクロプロセッサーに、本明細書に記載される方法を遂行するように命令する、コンピュータ可読記憶媒体が、本明細書で提供される。実行可能プログラムモジュールが記憶されているコンピュータ可読記憶媒体であって、プログラムモジュールが、マイクロプロセッサーに、本明細書に記載される方法の一部を遂行するように命令する、コンピュータ可読記憶媒体も、提供される。実行可能プログラムが記憶されているコンピュータ可読記憶媒体を含む、システム、機械、装置およびコンピュータプログラム製品であって、プログラムが、マイクロプロセッサーに、本明細書に記載される方法を遂行するように命令する、システム、機械、装置およびコンピュータプログラム製品も、本明細書で提供される。実行可能プログラムモジュールが記憶されているコンピュータ可読記憶媒体を含む、システム、機械および装置であって、プログラムモジュールが、マイクロプロセッサーに、本明細書に記載される方法の一部を遂行するように命令する、システム、機械および装置も、提供される。
コンピュータプログラム製品も提供される。コンピュータプログラム製品は、内部で実施されるコンピュータ可読プログラムコードを含む、コンピュータ使用可能媒体であって、コンピュータ可読プログラムコードが、本明細書に記載される方法または方法の一部を実行するための命令を受けるように構成されている、コンピュータ使用可能媒体を、多くの場合、含む。コンピュータ使用可能媒体および可読プログラムコードは、伝送媒体(すなわち、それ自体が伝送信号)ではない。コンピュータ可読プログラムコードは、プロセッサー、コンピュータ、システム、装置または機械により実行されるように構成されている。
一部の実施形態では、本明細書に記載される方法(例えば、(例えば、リードのサブセットを選択する方法、オーバーハングプロファイルを生成する方法、オーバーハングデータを処理する方法、オーバーハング定量化を処理する方法、オーバーハングデータまたはオーバーハングプロファイルに基づいて試料の1つまたは複数の特性を判定する方法)は、自動化法により遂行される。一部の実施形態では、本明細書に記載される方法の1つまたは複数のステップは、マイクロプロセッサーおよび/もしくはコンピュータにより行われ、ならびに/またはメモリーと連動して行われる。一部の実施形態では、自動化法は、本明細書に記載される方法を遂行する、ソフトウェア、モジュール、マイクロプロセッサー、同様のものを含む周辺機器、および/または機械で、実施される。本明細書で使用される場合、ソフトウェアは、マイクロプロセッサーにより実行されたときに本明細書に記載のコンピュータ操作を遂行する、コンピュータ可読プログラム命令を指す。
機械、ソフトウェアおよびインターフェースを使用して、本明細書に記載される方法を行うことができる。機械、ソフトウェアおよびインターフェースを使用して、ユーザーは、特定の情報、プログラムまたはプロセスを使用する(例えば、オーバーハングデータを処理する、オーバーハング定量化を処理する、および/またはアウトカムを提供する)ための選択肢の入力、リクエスト、クエリまたは決定を行うことができ、これは、例えば、統計解析アルゴリズム、統計的有意性アルゴリズム、統計アルゴリズム、反復ステップ、検証アルゴリズム、およびグラフィック表示の実行を伴い得る。一部の実施形態では、データセットは、ユーザーにより入力情報として入力されることがあり、ユーザーは、好適なハードウェア媒体(例えば、フラッシュドライブ)により1つもしくは複数のデータセットをダウンロードすることができ、ならびに/またはユーザーは、アウトカムのその後の処理および/もしくは提供のためにデータセットをあるシステムから別のシステムに送信する(例えば、オーバーハング配列処理のためにシーケンサーからコンピュータシステムに配列リードデータを送信する;処理されたオーバーハングデータを、アウトカムおよび/もしくはレポートをさらに処理するおよび/もしくは生じさせるために、コンピュータシステムに送信する)ことができる。
システムは、通常は、1つまたは複数の機械を含む。各機械は、メモリー、1つまたは複数のマイクロプロセッサー、および命令のうちの1つまたは複数を含む。システムが、2つまたはそれより多くの機械を含む場合、機械の一部もしくはすべてが、同じ場所に位置してもよく、機械の一部もしくはすべてが、異なる場所に位置してもよく、機械のすべてが、一カ所に位置してもよく、および/または機械のすべてが、異なる場所に位置してもよい。システムが、2つまたはそれより多くの機械を含む場合、機械の一部もしくはすべてが、ユーザーと同じ場所に位置してもよく、機械の一部もしくはすべてが、ユーザーとは異なる場所に位置してもよく、機械のすべてが、ユーザーと同じ場所に位置してもよく、および/または機械のすべてが、ユーザーとは異なる1つもしくは複数の場所に位置してもよい。
システムは、計算機と、シーケンシング装置またはシーケンシング機とを含むことがあり、この場合、シーケンシング装置またはシーケンシング機は、物理的核酸を受け取り、配列リードを生成するように構成されており、計算装置は、シーケンシング装置またはシーケンシング機からのリードを処理するように構成されている。計算機は、配列リードからアウトカム(例えば、試料の特性)を判定するように構成されていることもある。
ユーザーは、例えば、ソフトウェアに対してクエリを行うことができ、その結果、インターネットアクセス経由でデータセットを獲得することができ、ある特定の実施形態では、プログラム可能マイクロプロセッサーを、所与のパラメーターに基づいて好適なデータセットを獲得するように促すことができる。プログラム可能マイクロプロセッサーにより、ユーザーが、所与のパラメーターに基づいてマイクロプロセッサーにより選択された1つまたは複数のデータセット選択肢を選択するように促されることもある。プログラム可能マイクロプロセッサーは、ユーザーに、インターネット経由で見つかった情報、他の内部または外部情報などに基づいてマイクロプロセッサーにより選択された1つまたは複数のデータセット選択肢を選択するように促すことができる。選択肢は、方法、機械、装置、コンピュータプログラム、または実行可能プログラムが記憶されている非一過性コンピュータ可読記憶媒体の、1つまたは複数のデータ特徴選択、1つまたは複数の統計アルゴリズム、1つまたは複数の統計解析アルゴリズム、1つまたは複数の統計的有意性アルゴリズム、反復ステップ、1つまたは複数の検証アルゴリズム、および1つまたは複数のグラフィック表示を選択するために、選択され得る。
本明細書で取り扱われるシステムは、例えば、ネットワークサービス、ラップトップシステム、デスクトップシステム、携帯型システム、携帯情報端末、コンピューティングキオスクなどのような、コンピュータシステムの一般的コンポーネントを含み得る。コンピュータシステムは、ユーザーによるシステムへのデータの入力を可能にする、キーボード、タッチスクリーン、マウス、音声認識または他の手段などの、1つまたは複数の入力手段を含み得る。システムは、ディスプレイスクリーン(例えば、CRTもしくはLCD)、スピーカー、FAX機、プリンター(例えば、レーザー、インクジェット、インパクト、白黒もしくはカラープリンター)、または情報(例えば、アウトカムおよび/もしくはレポート)の視覚的、聴覚的および/もしくはハードコピー出力の提供に有用な他の出力要素を含むがこれらに限定されない、1つまたは複数の出力要素をさらに含み得る。
システム内で、入力および出力コンポーネントを中央処理ユニットに接続することができ、この中央処理ユニットは、数あるコンポーネントの中でも特に、プログラム命令を実行するためのマイクロプロセッサーと、プログラムコードおよびデータを記憶するためのメモリーとを含み得る。一部の実施形態では、プロセスを、単一の地理的位置に位置するシングルユーザーシステムとして実行することができる。ある特定の実施形態では、プロセスを、マルチユーザーシステムとして実行することができる。マルチユーザーインプリメンテーションの場合、複数の中央処理ユニットをネットワークによって接続することができる。ネットワークは、建物の一カ所にある単一の部署を包含する、ローカルなものであることもあり、建物全体であることもあり、複数の建物にわたることもあり、地域にわたることもあり、国全体にわたることもあり、または世界中であることもある。ネットワークは、プロバイダーにより所有され、制御される、プライベートなものであることもあり、またはユーザーがウェブページにアクセスして入り、情報を取り出す、インターネットに基づくサービスとして実行されることもある。したがって、ある特定の実施形態では、システムは、ユーザーを基準にしてローカルであることもあり、または遠隔であることもある、1つまたは複数の機械を含む。1つの場所または複数の場所の1つより多くの機械にユーザーはアクセスすることができ、順次および/または並行してデータをマッピングおよび/または処理することができる。したがって、複数の機械を、例えば、ローカルネットワーク、遠隔ネットワーク、および/または「クラウド」コンピュータプラットフォームで使用して、データをマッピングおよび/または処理するために、好適な構成および制御を利用することができる。
システムは、一部の実施形態では、通信用インターフェースを含むことができる。通信用インターフェースは、コンピュータシステムと1つまたは複数の外部デバイスとの間のソフトウェアおよびデータの転送を可能にする。通信用インターフェースの非限定的な例としては、モデム、ネットワークインターフェース(例えば、イーサネット(登録商標)カード)、通信ポート、PCMCIAスロットおよびカードなどが挙げられる。通信用インターフェース経由で転送されるソフトウェアおよびデータは、一般に、通信用インターフェースによって受信され得る電子、電磁、光および/または他の信号であり得る、信号の形態である。信号は、チャネルを介して通信用インターフェースに提供されることが多い。チャネルは、多くの場合、信号を伝達し、ワイヤもしくはケーブル、光ファイバー、電話線、携帯電話リンク、RFリンクおよび/または他の通信チャネルを使用して、チャネルを実装することができる。したがって、一例では、通信用インターフェースを使用して、信号検出モジュールにより検出され得る信号情報を受信することができる。
データは、手動入力デバイスまたは直接データ入力デバイス(DDE)を含むがこれらに限定されない、好適なデバイスおよび/または方法により、入力することができる。手動デバイスの非限定的な例としては、キーボード、コンセプトキーボード、タッチ式スクリーン、ライトペン、マウス、トラッカーボール、ジョイスティック、グラフィックタブレット、スキャナー、デジタルカメラ、ビデオデジタイザーおよび音声認識デバイスが挙げられる。DDEの非限定的な例としては、バーコードリーダー、磁気ストライプコード、スマートカード、磁気インク文字認識、光学式文字認識、光学式マーク認識、およびターンアラウンドドキュメントが、挙げられる。
一部の実施形態では、シーケンシング装置またはシーケンシング機からの出力は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、オーバーハング情報(例えば、オーバーハング特徴、例えば、長さ、タイプ、配列)は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、マッピングされた配列リードは、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸断片サイズ(例えば、長さ)は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸捕捉プロセスからの出力(例えば、ゲノム領域由来のデータ)は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸断片サイズ(例えば、長さ)と核酸捕捉プロセスからの出力(例えば、ゲノム領域由来のデータ)との組合せは、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、模擬データは、in silicoプロセスにより生成され、模擬データは、入力デバイスによって入力することができるデータとして役立ち得る。用語「in silico」は、コンピュータを使用して遂行される研究および実験を指す。in silicoプロセスとしては、本明細書に記載されるプロセスに従って配列リードをマッピングすることおよびマッピングされた配列リードを処理することが挙げられるが、これらに限定されない。
システムは、本明細書に記載されるプロセスまたはプロセスの一部の遂行に有用なソフトウェアを含むことがあり、ソフトウェアは、そのようなプロセスを遂行するための1つまたは複数のモジュール(例えば、シーケンシングモジュール、論理処理モジュール、データ表示構成モジュール)を含むことができる。用語「ソフトウェア」は、コンピュータにより実行されたときにコンピュータ操作を遂行する、コンピュータ可読プログラム命令を指す。1つまたは複数のマイクロプロセッサーにより実行可能な命令が、実行コードとして提供されることもあり、実行コードは、実行されたとき、本明細書に記載される方法を1つまたは複数のマイクロプロセッサーに実行させることができる。本明細書に記載されるモジュールは、ソフトウェアとして存在することができ、ソフトウェアで実施される命令(例えば、プロセス、ルーチン、サブルーチン)がマイクロプロセッサーにより実行または遂行され得る。例えば、モジュール(例えば、ソフトウェアモジュール)は、特定のプロセスまたはタスクを遂行するプログラムの一部であり得る。用語「モジュール」は、より大型の機械またはソフトウェアシステムで使用され得る自己完結型機能ユニットを指す。モジュールは、モジュールの機能を行うための一連の命令を含むことができる。モジュールは、データおよび/または情報を変換することができる。データおよび/または情報は、適切な形態であり得る。例えば、データおよび/または情報は、デジタルまたはアナログであり得る。ある特定の実施形態では、データおよび/または情報は、ときにはパケット、バイト、文字またはビットであり得る。一部の実施形態では、データおよび/または情報は、任意の収集された、整理された、または使用可能なデータまたは情報であり得る。データおよび/または情報の非限定的な例としては、好適な媒体、画像、ビデオ、音(例えば、周波数、可聴のまたは非可聴の)、数、定数、値、オブジェクト、時間、関数、命令、マップ、参照、配列、リード、マッピングされたリード、レベル、範囲、閾値、シグナル、これらの表示、表現または変形が挙げられる。モジュールは、データおよび/または情報を受け入れ、または受信し、データおよび/または情報を二次形態に変換し、二次形態を機械、周辺機器、コンポーネントまたは別のモジュールに提供または転送することができる。マイクロプロセッサーは、ある特定の実施形態では、モジュールで命令を実行することができる。一部の実施形態では、1つまたは複数のマイクロプロセッサーは、モジュールまたはモジュール群で命令を実行するために必要とされる。モジュールは、データおよび/または情報を別のモジュール、機械または供給源に提供することができ、データおよび/または情報を別のモジュール、機械または供給源から受信することができる。
コンピュータプログラム製品は、有形コンピュータ可読媒体で実施されることもあり、非一過性コンピュータ可読媒体で明白に実施されることもある。モジュールは、コンピュータ可読媒体(例えば、ディスク、ドライブ)に記憶されていることもあり、またはメモリー(例えば、ランダムアクセスメモリー)に記憶されていることもある。モジュール、およびモジュールからの命令を実行することができるマイクロプロセッサーは、機械内または異なる機械内に位置することができる。モジュール、および/またはモジュールの命令を実行することができるマイクロプロセッサーは、ユーザーと同じ場所に位置することができ(例えば、ローカルネットワーク)、またはユーザーとは異なる場所に位置することができる(例えば、遠隔ネットワーク、クラウドシステム)。方法が2つまたはそれより多くのモジュールと連動して行われる実施形態では、モジュールは、同じ機械内に位置することができ、1つまたは複数のモジュールは、同じ物理的な場所の異なる機械内に位置することができ、1つまたは複数のモジュールは、異なる物理的な場所の異なる機械内に位置することができる。
機械は、一部の実施形態では、モジュールで命令を行うための少なくとも1つのマイクロプロセッサーを含む。配列リード定量化(例えば、カウント)および/またはオーバーハングデータは、本明細書に記載される方法を行うように構成された命令を実行するマイクロプロセッサーによりアクセスされることもある。マイクロプロセッサーによりアクセスされる配列リード定量化および/またはオーバーハングデータは、システムのメモリー内にあることができ、カウントおよび/またはオーバーハングデータにアクセスし、それらを得た後、それらをシステムのメモリーに入れることができる。一部の実施形態では、機械は、マイクロプロセッサー(例えば、1つまたは複数のマイクロプロセッサー)を含み、このマイクロプロセッサーは、モジュールからの1つまたは複数の命令(例えば、プロセス、ルーチンおよび/またはサブルーチン)を遂行および/または実行することができる。一部の実施形態では、機械は、複数のマイクロプロセッサー、例えば、連係しており、並行して働くマイクロプロセッサーを含む。一部の実施形態では、機械は、1つまたは複数の外部マイクロプロセッサー(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))で動作する。一部の実施形態では、機械は、モジュール(例えば、1つまたは複数のモジュール)を含む。モジュールを含む機械は、多くの場合、他のモジュールへ、および他のモジュールから、データおよび/または情報の1つまたは複数を受信および転送することができる。
ある特定の実施形態では、機械は、周辺機器および/またはコンポーネントを含む。ある特定の実施形態では、機械は、他のモジュール、周辺機器および/またはコンポーネントへ、ならびに他のモジュール、周辺機器および/またはコンポーネントから、データおよび/または情報を転送することができる、1つまたは複数の周辺機器またはコンポーネントを含むことができる。ある特定の実施形態では、機械は、データおよび/または情報を提供する周辺機器および/またはコンポーネントと交信する。ある特定の実施形態では、周辺機器およびコンポーネントは、機械による機能の実行またはモジュールとの直接交信を支援する。周辺機器および/またはコンポーネントの非限定的な例としては、スキャナー、プリンター、ディスプレイ(例えば、モニター、LED、LCTもしくはCRT)、カメラ、マイクロホン、パッド(例えば、iパッド、タブレット)、タッチスクリーン、スマートフォン、携帯電話、USB I/Oデバイス、USB大容量記憶デバイス、キーボード、コンピュータマウス、デジタルペン、モデム、ハードドライブ、ジャンプドライブ、フラッシュドライブ、マイクロプロセッサー、サーバー、CD、DVD、グラフィックカード、専用I/Oデバイス(例えば、シーケンサー、光電池、光電子増倍チューブ、光学式読み取り装置、センサーなど)、1つまたは複数のフローセル、流体操作コンポーネント、ネットワークインターフェスコントローラー、ROM、RAM、ワイヤレス転送法およびデバイス(ブルートゥース(登録商標)、WiFiなど)、ワールドワイドウェブ(www)、インターネット、コンピュータおよび/または他のモジュールを含むがこれらに限定されない、好適なコンピュータ周辺機器、I/Oまたは記憶方法またはデバイスが挙げられる。
ソフトウェアは、コンピュータ可読媒体に記録されたプログラム命令を含むプログラム製品で提供されることが多く、コンピュータ可読媒体としては、フロッピー(登録商標)ディスク、ハードディスクおよび磁気テープを含む、磁気媒体;ならびにCD−ROMディスク、DVDディスクを含む、光媒体;光磁気ディスク、フラッシュメモリ−デバイス(例えば、フラッシュドライブ)、RAM、フロッピー(登録商標)ディスクなど、ならびにプログラム命令を記録することができる他のそのような媒体が挙げられるが、これらに限定されない。オンラインインプリメンテーションの場合、団体により維持されているサーバーおよびウェブサイトは、遠隔ユーザーにソフトウェアダウンロードを提供するように構成されていることがあり、または遠隔ユーザーは、団体により維持されている遠隔システムにアクセスして、ソフトウェアに遠隔アクセスすることができる。ソフトウェアは、入力情報を得るまたは受信することができる。ソフトウェアは、データを特異的に得るまたは受信するモジュール(例えば、配列リードデータおよび/またはマッピングされたリードデータを受信するデータ受信モジュール)を含むことができ、データを特異的に処理するモジュール(例えば、受信したデータを処理する(例えば、アウトカムおよび/またはレポートをフィルタリングする、正規化する、提供する)処理モジュール)を含むことができる。入力情報を「得ること」および「受信すること」という用語は、データ(例えば、配列リード、マッピングされたリード)を、ローカルもしくは遠隔サイトからコンピュータ通信手段により、人間によるデータ入力により、または任意の他のデータ受信方法により、受信することを指す。入力情報を、それを受信する場所と同じ場所で作成することができ、またはそれを異なる場所で作成し、受信場所に伝送することができる。一部の実施形態では、入力情報は、処理される前に修正される(例えば、処理に適用可能な形式にされる(例えば、表形式にされる))。
ソフトウェアは、ある特定の実施形態では、1つまたは複数のアルゴリズムを含むことができる。アルゴリズムは、命令の有限数列に従ってデータを処理するおよび/またはアウトカムもしくはレポートを提供するために、使用され得る。アルゴリズムは、多くの場合、タスクを完了するための定義済み命令のリストである。初期状態から開始して、命令は、定義された一連の連続状態を経て最終的に最終終了状態で終了する計算を記述することができる。ある状態から次の状態への移行は、必ずしも確定的ではない(例えば、一部のアルゴリズムは、乱数性を取り入れている)。例として、限定ではなく、アルゴリズムは、検索アルゴリズム、ソートアルゴリズム、マージアルゴリズム、数値アルゴリズム、グラフアルゴリズム、文字列アルゴリズム、モデリングアルゴリズム、計算幾何アルゴリズム、組合せアルゴリズム、機械学習アルゴリズム、暗号学アルゴリズム、データ圧縮アルゴリズム、構文解析アルゴリズムなどであり得る。アルゴリズムは、1つのアルゴリズム、または組合せで働く2つもしくはそれより多くのアルゴリズムを含み得る。アルゴリズムは、任意の好適な複雑性クラスおよび/またはパラメーター化された複雑性のものであり得る。アルゴリズムは、演算および/またはデータ処理に使用することができ、一部の実施形態では、決定論的または確率論的/予測アプローチで使用することができる。アルゴリズムを好適なプログラミング言語の使用によりコンピュータ環境で実行することができ、そのようなプログラミング言語の非限定的な例は、C、C++、Java(登録商標)、Perl、Python、Fortranなどである。一部の実施形態では、アルゴリズムを、許容誤差、統計解析、統計的有意性、および/または他の情報もしくはデータセットとの比較(例えば、ニューラルネットもしくはクラスタリングアルゴリズムを使用する場合に適用可能)を含むように、構成または修正することができる。
ある特定の実施形態では、いくつかのアルゴリズムをソフトウェアでの使用のために実装することができる。これらのアルゴリズムを、一部の実施形態では、生データで訓練することができる。新たな生データ試料ごとに、訓練されたアルゴリズムが、代表処理データセットまたはアウトカムを生成し得る。処理データセットは、処理された親データセットと比較して複雑性が低下したものであることもある。処理セットに基づいて訓練されたアルゴリズムの性能を、一部の実施形態では、感度および特異度に基づいて評定することができる。ある特定の実施形態では、感度および/または特異度が最も高いアルゴリズムを識別し、利用することができる。
ある特定の実施形態では、模擬(またはシミュレーション)データは、例えば、アルゴリズムを訓練することまたはアルゴリズムを検査することにより、データ処理を補助することができる。一部の実施形態では、模擬データは、配列リードの異なるグループ分けについての仮定的な様々な抽出試料を含む。模擬データは、現実の集団から予想され得るものに基づくこともあり、またはアルゴリズムを検査するおよび/もしくは正しい分類を割り当てるための偏ったものであることもある。模擬データは、本明細書では「仮想」データとも呼ばれる。ある特定の実施形態では、コンピュータプログラムによりシミュレーションを行うことができる。模擬データセットを使用する場合の可能性のある1つのステップは、識別された結果の信頼度、例えば、ランダム抽出試料が、どれ程、元データとよくマッチするか、または元データを最良に表すのかを、評価することである。1つのアプローチは、選択された試料より良好なスコアを有するランダム試料の確率を推定する、確率値(p値)を算出することである。一部の実施形態では、少なくとも1つの試料が参照試料と(分解変動の有無にかかわらず)マッチすることが仮定される、経験的モデルを評定することができる。一部の実施形態では、例えばポアソン分布などの、別の分布を使用して、確率分布を定義することができる。
システムは、ある特定の実施形態では、1つまたは複数のマイクロプロセッサーを含むことがある。マイクロプロセッサーを通信バスに接続することができる。コンピュータシステムは、メインメモリー、多くの場合、ランダムアクセスメモリー(RAM)を含むことがあり、二次メモリーを含むこともできる。一部の実施形態でのメモリーは、非一過性コンピュータ可読記憶媒体を含む。二次メモリーは、例えば、ハードディスクドライブおよび/またはリムーバブル記憶ドライブを含むことができ、リムーバブル記憶ドライブは、フロッピー(登録商標)ディスクドライブ、磁気テープドライブ、光ディスクドライブ、メモリーカードなどを意味する。リムーバブル記憶ドライブは、多くの場合、リムーバブル記憶ユニットから読み取る、および/またはリムーバブル記憶ユニットに書き込む。リムーバブル記憶ユニットの非限定的な例としては、例えば、リムーバブル記憶ドライブによって読み取られ得る、かつリムーバブル記憶ドライブに書き込まれ得る、フロッピー(登録商標)ディスク、磁気テープ、光ディスクなどが挙げられる。リムーバブル記憶ユニットは、コンピュータソフトウェアおよび/またはデータが内部に記憶されているコンピュータ使用可能記憶媒体を含むことができる。
マイクロプロセッサーは、システム内のソフトウェアを実行することができる。一部の実施形態では、マイクロプロセッサーを、ユーザーが行うことができる本明細書に記載されるタスクを自動的に遂行するようにプログラムすることができる。したがって、マイクロプロセッサー、またはそのようなマイクロプロセッサーにより実行されるアルゴリズムは、ユーザーによる監視も入力も殆どないしは全く必要とするはずがない(例えば、ソフトウェアを、自動的に機能を実行するようにプログラムすることができる)。一部の実施形態では、プロセスの複雑性が非常に高いので、1名の人物、または人物群が、試料の1つまたは複数の特性を判定するのに十分短い時間枠ではプロセスを遂行することができない。
一部の実施形態では、二次メモリーは、コンピュータシステムへのコンピュータプログラムまたは他の命令のローディングを可能にするための他の同様の手段を含むことがある。例えば、システムは、リムーバブル記憶ユニットおよびインターフェースデバイスを含むことができる。そのようなシステムの非限定的な例としては、プログラムカートリッジおよびカートリッジインターフェース(例えば、ビデオゲームデバイスに見られるもの)、リムーバブルメモリーチップ(例えば、EPROMまたはPROM)および付随するソケット、ならびにソフトウェアおよびでデータをリムーバブル記憶ユニットからコンピュータシステムに転送することを可能にする他のリムーバブル記憶ユニットおよびインターフェースが、挙げられる。
ある特定の実施形態では、1つまたは複数のマイクロプロセッサーおよびメモリーを含む、システム、機械および装置であって、メモリーが、1つまたは複数のマイクロプロセッサーにより実行可能な命令を含み、1つまたは複数のマイクロプロセッサーにより実行可能な命令が、試料中の核酸の集団の核酸オーバーハングのオーバーハングプロファイルを生成し、オーバーハングプロファイルに基づいて試料の1つまたは複数の特性を判定するように構成されている、システム、機械および装置が、本明細書で提供される。
ある特定の実施形態では、1つまたは複数のマイクロプロセッサーおよびメモリーを含む、システム、機械および装置であって、メモリーが、1つまたは複数のマイクロプロセッサーにより実行可能な命令を含み、1つまたは複数のマイクロプロセッサーにより実行可能な命令が、リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析するように構成されており、それによって、解析を生成し、フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除する、システム、機械および装置が、本明細書で提供される。
ある特定の実施形態では、1つまたは複数のマイクロプロセッサーおよびメモリーを含む機械であって、メモリーが、1つまたは複数のマイクロプロセッサーにより実行可能な命令を含み、メモリーが、試料中の核酸の集団の核酸オーバーハングについてのオーバーハングデータを含み、1つまたは複数のマイクロプロセッサーにより実行可能な命令が、核酸オーバーハングのオーバーハングプロファイルを生成し、オーバーハングプロファイルに基づいて試料の1つまたは複数の特性を判定するように構成されている、機械が、本明細書で提供される。
ある特定の実施形態では、1つまたは複数のマイクロプロセッサーおよびメモリーを含む機械であって、メモリーが、1つまたは複数のマイクロプロセッサーにより実行可能な命令を含み、メモリーが、シーケンシングプロセスにより生成されたフォワード配列リードおよびリバース配列リードを含み、1つまたは複数のマイクロプロセッサーにより実行可能な命令が、リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析するように構成されており、それによって、解析を生成し、フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除する、機械が、本明細書で提供される。
ある特定の実施形態では、実行可能プログラムが記憶されている非一過性コンピュータ可読記憶媒体であって、プログラムが、マイクロプロセッサーに、(a)試料中の核酸の集団の核酸オーバーハングについてのオーバーハングデータにアクセスすることと、(b)核酸オーバーハングのオーバーハングプロファイルを生成することと、(c)オーバーハングプロファイルに基づいて、試料の1つまたは複数の特性を判定することとを遂行するように命令する、非一過性コンピュータ可読記憶媒体が、本明細書で提供される。
ある特定の実施形態では、実行可能プログラムが記憶されている非一過性コンピュータ可読記憶媒体であって、プログラムが、マイクロプロセッサーに、(a)シーケンシングプロセスにより生成されたフォワード配列リードおよびリバース配列リードにアクセスすることと、(b)リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析することによって、解析を生成し、フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除することとを遂行するように命令する、非一過性コンピュータ可読記憶媒体が、本明細書で提供される。
キット
ある特定の実施形態では、キットが提供される。キットは、本明細書に記載される方法のいずれかを行うのに有用な、本明細書に記載される任意の成分および組成物(例えば、オリゴヌクレオチド、オリゴヌクレオチド成分/領域、標的核酸、酵素)を任意の好適な組合せで含むことができる。キットは、本明細書に記載される方法のいずれかを行うのに有用な任意の試薬、緩衝剤または他の成分をさらに含むことができる。例えば、キットは、複数のオリゴヌクレオチド種、またはオリゴヌクレオチド種のプール、核酸試料の核酸を5’リン酸化するように構成されたキナーゼ(例えば、ポリヌクレオチドキナーゼ(PNK))、DNAリガーゼ、切断作用因子、フィルインおよび/または鎖置換反応を行うのに好適な酵素(例えば、ポリメラーゼ)のうちの1つまたは複数、ならびにこれらの任意の組合せを含むことができる。
キットの成分は、別々の容器内に存在することもあり、または複数の成分が、単一の容器内に存在することもある。好適な容器としては、単一のチューブ(例えば、バイアル)、プレート(例えば、96ウェルプレート、384ウェルプレートなど)の1つまたは複数ウェルなどが挙げられる。
キットは、本明細書に記載される1つもしくは複数の方法を行うための使用説明書、および/または本明細書に記載される1つもしくは複数の成分の説明書きも含むことがある。例えば、キットは、核酸断片の末端を修飾するために、および/または核酸ライブラリーを生成するために、本明細書に記載される組成物を使用するための使用説明書を含むことがある。使用説明書および/または説明書きは、印刷された形態であることもあり、キット添付文書に含まれることもある。一部の実施形態では、使用説明書および/または説明書きは、好適なコンピュータ可読記憶媒体、例えば、携帯フラッシュドライブ、DVD、CD−ROM、ディスケットなど、に存在する電子記憶データファイルとして提供される。キットは、そのような使用説明書または説明書きを提供するインターネットの場所についての書面での説明書きを含むこともある。
下記の実施例は、ある特定の実施形態を例証するものであり、本技術を限定するものではない。
(実施例1)
RNAse切断性ヘアピンアダプター
分解されたDNA分子(例えば、古代DNA)の損傷の1つの形態は、シトシン(C)からウラシルへ脱アミノ化である。ループにデオキシウリジンを含有するヘアピン構造の形態のDNAシーケンシングアダプターは、一本鎖を切断するためにウラシル−DNA−グリコシラーゼおよびエンドヌクレアーゼを使用する必要がある。これらの酵素の使用の1つの起こり得る帰結は、目的のDNA断片内の損傷部位での切断であり、それによって断片はライブラリー変換に利用できなくなる。例えば循環無細胞DNAなどの古代DNAに類似したある特定の基質によって、身体からの放出およびクリアランスのプロセスの間に損傷した塩基が蓄積され得る。これは、循環無細胞DNAライブラリー調製のためのデオキシウリジンを含有するシーケンシングアダプターの使用を制限し得る。ライブラリー調製中にRNAseの使用と併せてヘアピンのループ内にRNA塩基を有するヘアピンアダプターを使用することにより、DNAライブラリー調製についてのそのような課題が取り除かれるはずである。ライブラリー調製中のRNAseの使用は、ある特性の夾雑物をシーケンシング前に低減させるのに有用でもあり得る。ヘアピンアダプター構成の例を図1A、図1Bおよび図1Cに示す。
方法
シーケンシングライブラリーを、鋳型DNAをDNA/RNAアダプターにライゲーションすることにより調製し、DNA/RNAアダプターは、二本鎖ステムがIlluminaシーケンシングアダプターに普遍的ないくつかのDNA塩基の相補性により作出され、一本鎖ループが、P5およびP7(フォワードおよびリバース)プライマー部位の固有の非相補的DNA塩基を含有する、ステムループ構造を有した。3つのグアニンRNA塩基をループ内に配置し、これは、T1 RNAseの切断部位としての役割を果たした。切断後、二本鎖DNA分子が形成され、これを直接増幅およびシーケンシングすることができた。
末端修復中にAテーリングを行う市販のIlluminaライブラリー調製キットを比較のために使用した。この実施例で検査したRNAse切断性ヘアピンアダプターは、Aテールを有する鋳型に対応する単一のTオーバーハングを有するように設計したものであり、5’リン酸を有した。
RNAse切断性ヘアピンアダプターの性能を、標準Illuminaライブラリーの調製を再現すること、およびRNAse切断性ヘアピンアダプターを市販キットのウラシルアダプターの代わりに用いることによって、評価した。次の4つのDNA源を鋳型として使用した:1)血漿から単離した無細胞DNA、2)尿から単離した無細胞DNA、3)ヒトホルマリン固定パラフィン包埋(FFPE)試料、および4)30kyaのバイソン骨から単離したDNA。ライブラリー調製は、マニュアルに記載の通りに行い、ペアエンドシーケンシングは、v2ナノフローセルまたはv3試薬キットを使用してMiSeqで行った。
結果
表1の結果は、RNAse切断性ヘアピンアダプターが、市販のウラシルアダプターと全く同じように動作し、尿からの無細胞DNAおよび断片化したFFPE試料について最も大きな増加が観測されたことを示す。下記の8つの実験のうちの6つにおいて、RNAse切断性ヘアピンアダプターは、わずかにより低い複製率を示した。
Figure 2021511309
Figure 2021511309
(実施例2)
固有末端識別子(UEI)および固有分子識別子(UMI)
DNA放出、様々な形態の細胞死、および死後の細胞プロセスなどの、イベントは、明確に異なる形態的特徴および分子経路によって特徴付けられる。二本鎖切断後のDNA末端に見られるシグナルは、固有のDNA分解パターンを反映することができ、原因となるプロセスおよび可能性のある病態形成プロセスについての情報を提供することができる。これを研究するために、RNAse切断性アダプターを、ネイティブDNA末端に存在するときに一本鎖オーバーハングを捕捉するように設計した(例えば、図1Bを参照されたい)。
そのようなアダプターを、1)長さNの5’または3’一本鎖オーバーハング、および2)オーバーハングに隣接する固有末端識別子(UEI)という、少なくとも2つの部分を含有する合成DNAのライゲーションにより生成した。UEIは、存在する場合にはそのオーバーハングのタイプおよび長さを伝達する、二本鎖バーコードである。一般に、ハイブリダイゼーションおよびダイマーの形成を回避するためにUEIおよびUEIアダプターをリン酸化しない。一部の事例では、UEIおよびUEIアダプターをリン酸化する。
このヘアピン設計のある特定の反復、および他のアダプターの設計では、固有分子識別子(UMI)も、UEIに隣接して含めるか、またはアダプター構造内の他の場所に含める(例えば、図1Cを参照されたい)。UMIは、それらによって固有の出発分子の数の推定が可能になり、ライゲーション反応の感度が評価されることから、UEIとは異なる目的に役立つ。
(実施例3)
DNA末端にタグを付けるための固有末端識別子(UEI)を有する両側オリゴ
固有末端識別子(UEI)は、DNA末端にタグを付けるために使用することもできる。他のシーケンシングプラットフォームまたは下流の解析のための柔軟な選択肢を与えるために、UEIは、独立型ライゲーション成分(すなわち、シーケンサー特異的アダプター配列を有さない)として機能することができる。このプロセスは、任意ライブラリータイプへの変換または解析のために、オーバーハングDNAのネイティブ末端をコードする/そのままの状態に保つ。そのようなライゲーションの産物は、平滑末端化された二本鎖分子であり得る。
UEIの両側での対応するDNAオーバーハングへのライゲーションを可能にする1つの設計を、図2Aに示す。両側UEIオリゴと呼ばれることがあるこのオリゴは、フォワードおよびリバース鎖上に内部ウラシル(またはデオキシウリジン)を有し、これは、ウラシル特異的除去試薬(USER)酵素(すなわち、ウラシルDNAグリコシラーゼ(UDG)とDNAグリコシラーゼ−リアーゼエンドヌクレアーゼVIIIの混合物)の切断部位として役立つ。ある特定のオリゴ設計は、1個または2個のウラシルを含む、2〜12個のランダムな塩基をUEI間に含む。図2Aは、オリゴヌクレオチドの例を示し、ワークフローの例を図2Bで説明する。手短に述べると、ライゲーション後、酵素カクテルが、両方の鎖のウラシルを切断し、その結果、あらゆるライゲーションされていない物質または隣接するライゲーション産物が分離される。切断後、鋳型DNA分子には、依然としてUEIが両側にライゲーションされている。フィルインを行って、分子内に残存するニックを修復する。フィルイン後、平滑末端化された二本鎖分子は、依然として、ライブラリー調製のための準備が整った状態である。
上記オリゴ設計の性能を検査するために、両側UEIオリゴを、2個体からの血漿から単離した5ngの無細胞DNAにライゲーションした(20×オリゴ:鋳型比)。多くの場合、血漿から単離した無細胞DNA断片サイズについて2つの画分が観測された。これに対処するために、DNA抽出物を分画して、500bpより大きい断片(「高」)を500bpより小さいもの(「低」)から分離した。ライブラリー調製を上で説明したように行い、鋳型をリン酸化し、両側UEIオリゴをライゲーションし、ウラシルを切断し、フィルインを行った。次いで、結果として得られたDNA産物を、Illumina用のNEB Ultra IIライブラリー調製キットを使用するライブラリー調製に付した。MiSeq v2ナノフローセルを使用して、ペアエンドシーケンシング(2×150)を行った。
結果
このアプローチは、他の設計と比較してより多くのアダプターダイマーを生成し、これによりシーケンシング出力が低下した。ライブラリー当たり30,000〜150,000の間のリードが生成された。ヒトゲノムにマッピング可能であったDNAは、無細胞DNAの予想サイズ分布、およそ167bp、またはヌクレオソームに巻き付いたDNAの長さであった(図3および図4を参照されたい)。抽出物の「高」画分であるAPN307およびAPN310からの非常に少数のリードは、マージするのに十分な短さであり、ヌクレオソーム1個のサイズを優に上回っていた(図3、パネルCおよびF)。「高」画分ライブラリーは、データ数が少なすぎて目に見える表示が一切なかった(図4、パネルCおよびF)。ライブラリーの「低」または「全」(すなわち、サイズ分解されていない)部分は、ライブラリーを生成したが、所期のサイズの大半のDNA断片は、1つの両側UEIオリゴのみにライゲーションされたか、またはどの両側UEIオリゴヌクレオチドにもライゲーションされなかった(図4、パネルA、B、D、E)。
ある特定の事例では、各鋳型DNA分子は、2つのUEIオリゴヌクレオチドを受け取ると有利である。多くの場合、ライゲーションされたUEIオリゴを1つだけ有する、またはライゲーションされたUEIオリゴを有さない分子は、それでもやはり、下流で標準的なライブラリー分子に変換されることになる。DNAのネイティブ末端を特徴付ける目的には、UEIオリゴヌクレオチドを有さない断片は、有用でなく、1つのUEIオリゴを有する断片は、理想的でない。この課題に対処するために、ビオチン化dNTPをフィルインステップ中に鎖に組み込む。フィルインに成功した(すなわち、ライゲーションに成功した)鋳型断片のみを固定化することにより、UEIオリゴライゲーションイベントが起こらなかったDNA分子を下流の処理から除外する。このアプローチは、シーケンシング調製前にUEIオリゴ(すなわち、両側UEIオリゴ)を有するDNA断片を調製するあらゆる設計に適用可能である。
(実施例4)
DNA末端にタグを付けるための固有末端識別子(UEI)を有する片側オリゴの遮断
UEIオリゴの両末端でのライゲーションを促す設計を使用するのではなく、特定の方向で確実にライゲーションするために単一の遮断性修飾塩基をUEIオリゴの3’末端に配置する。図5に示す1つの設計は、UEIオリゴを強制的に一方向にライゲーションさせるためにUEIオリゴの3’末端を遮断する。イソデオキシ−塩基を遮断剤として選択した。イソデオキシ−Gおよびイソデオキシ−Cは、天然塩基とは異なる水素結合パターンを有する。しかるが故に、それらは、いずれの天然塩基とも結合することができない。典型的に、isoGは、isoCとのみ対合することができる。これらの2つの修飾塩基のうちの1つ、isoGまたはisoCのどちらか、のみを使用することにより、UEIオリゴの「誤った」末端でライゲーションもハイブリダイゼーションも起こらないはずであり、したがって、ライゲーションイベントの正しい方向が余儀なくされる。
鋳型DNAのみがリン酸化される(オリゴはされない)ので、ニックは、ライゲーション後に分子のフォワード鎖上およびリバース鎖上の両方に残存する。鎖置換ポリメラーゼを使用するフィルインは、二本鎖分子を完成し、修飾塩基を有するUEIオリゴの鎖を除去する(図6を参照されたい)。
(実施例5)
合成および生物学的DNAの脱リン酸化
上記のある特定の実施例で説明したライブラリー調製では、一般に、3’オーバーハングをチューバックし、5’オーバーハングをフィルインし、Aテーリングまたは平滑末端ライゲーション用の鋳型を調製する、従来の末端修復ステップを省略する。上で説明した方法は、鋳型DNAを調製するためのヌクレアーゼの使用もポリメラーゼの使用も通常は含まず、その代わりにライゲーションの前に鋳型をT4 PNKでリン酸化する。
ある特定の事例では、アダプターおよび対照を含む、オリゴに対して、および/または鋳型DNAに対して前処理を行って、埋め込まれていようが、そうでなかろうが、すべての3’および5’末端のリン酸を除去した。ホスファターゼrSAP(DNAの1pmol当たり1単位)をこの前処理に使用した。
図7A、図7Bおよび図7CのTapestationデータは、rSAPで無細胞DNA鋳型(図7B)ならびに無細胞DNAおよびアダプター(図7C)を処理した後の、ライブラリー生成の改善を実証する。rSAP処理後の改善は、アダプターダイマーピークの低減およびDNAサイズのピークの増加と考えられる。図7Aは、ほぼ排他的にアダプターダイマーで構成されているライブラリー、鋳型をrSAPで処理しなかったときのDNAのほぼ完全な喪失を示す。
T4 PNKでの第1のステップの前に合成50bp二本鎖対照オリゴを脱リン酸化したときにも、有意な改善が観測された。これは、リン酸化されていないオリゴまたはアダプターを商事会社から購入した場合であっても、一部のDNA末端が、T4 PNKでのリン酸化を含む末端修飾に適応できず、それ故、ライゲーション中にうまく動作しないことを示す。
(実施例6)
メイトペアライブラリー
ライブラリー変換の推奨断片長より長い、ゲノムDNAまたは他のDNAを、通常は、ライブラリー調製前に機械的せん断するか、または酵素的せん断する。せん断後、従来のライブラリー調製が、末端修復ステップから始まる。せん断も、末端修復も、ネイティブDNA末端の利用、したがって観測を妨げる。
無細胞DNA断片の一部分は、使用可能なシーケンシングデータの生成に理想的であるものより大きい(例えば、500bpより上〜700bp)ことがある。大きい断片を含有する無細胞DNAの高分子量(HMW)部分は、非アポトーシス細胞死または壊死後の放出の結果であり得、そのような断片の末端は、有用な情報源を提供し得る。HMW DNAからの長いDNA断片のネイティブ末端を保持し、特徴付け、保存末端をシーケンシングライブラリーにうまく変換するための1つの設計は、メイトペアライブラリーの修飾またはDNA断片の環状化である。
メイトペア修飾は、まず、長い、例えば>500bpの、5’リン酸化DNA断片を、ビオチン化二本鎖(ds)オリゴヌクレオチドのプールにライゲーションすることを含む。各dsオリゴを、一方の側に長いパリンドローム一本鎖オーバーハング(5’オーバーハングまたは3’オーバーハングのどちらかとして配置することができる;図8Aには5’オーバーハングとして示されている)を含み、他方の側には、固有末端識別子(UEI)と呼ばれる、オーバーハングの長さおよびタイプ(5’または3’)を識別する固有配列が先行する、長さNまでの様々な長さのランダム配列で構成されている5’または3’一本鎖オーバーハングのすべての組合せを含むように、設計する。様々な5’および3’オーバーハング長を有するオリゴヌクレオチドの少数の例を、図8Aで説明する。長いパリンドローム配列は、ヒトゲノムでは一般に見られも予測されもせず、ヒトマイクロバイオームに付随することが多い細菌では通常は観測されもしない。ヘアピン形成について推定される高いデルタG値は、ヘアピンではなく自己ダイマーが、所望通りに優先的に形成することになり、それによって環状化が促進されることを示唆する。dsDNA鋳型上に存在するネイティブ3’および5’オーバーハングは、存在する場合、オリゴヌクレオチドセットの利用可能なオーバーハング末端にライゲーションすることになる。元々平滑形のdsDNA鋳型は、セット内の平滑末端化オリゴヌクレオチドにライゲーションすることができる。相補的オリゴヌクレオチドの長いパリンドローム配列により生成される自己ダイマーによって、リガーゼの存在下で長い断片の環状化が可能になる。一部の事例では、ポリヌクレオチドキナーゼをリガーゼとともにまたはリガーゼの前に使用して、ニックを修復し、二本鎖を完成する。一部の事例では、5’リン酸を有するオリゴヌクレオチドを調製する。
オリゴヌクレオチドと鋳型DNAがライゲーションされ、環状化されると、エキソヌクレアーゼが一切の非環状化DNAまたは過剰なオリゴヌクレオチドを除去する。次いで、環状化DNAを(例えば、超音波破砕装置(Covaris)を使用して、または酵素的断片化により)せん断して、ショートリードでハイスループットのシーケンサーに好適な分子を生成する。一般に、ビオチン化オリゴヌクレオチドにライゲーションされるすべてのDNA断片をストレプトアビジン被覆ビーズ上に固定化することにより、目的のDNA末端のみを捕捉する。これらのステップは、ネイティブ末端から生じたものでない高分子量(HMW)DNA片からのライブラリー分子の生成を低減させる。DNA抽出後に低分子量(LMW)核酸と高分子量(HMW)核酸の両方を分画した後、長いDNA断片の環状化戦略を、より短いDNA断片についての、上で説明したもののような、アプローチと組み合わせることができる。これらの2つの戦略の結果として得られるデータセットを、バイオインフォマティクスによりマージして、または比較のために別々に解析して、ネイティブDNA末端が全DNA断片長によってどのように異なるのかを詳しく調査することができる。
メイトペアまたは環状化法は、一般に次のように行う:1)鋳型DNAをホスファターゼで前処理する;2)鋳型DNAをリン酸化する;3)オーバーハングUEIオリゴヌクレオチドプールを鋳型にライゲーションし、必要に応じてニックを修復する;4)エキソヌクレアーゼで処理する;5)せん断する;6)ビオチン化断片をビーズ上に固定化する;7)最適なライブラリー調製を開始する。
上で説明した方法について、特定のオーバーハング末端パターンが、生物学的(例えば、ヒト内因性もしくは組織特異的ヌクレアーゼ機能)、生物医学的(例えば、病理学的もしくは処置誘導細胞死、腫瘍形成)、または法医学的(例えば、生物学的分解対タフォノミック分解)発見にとって重要である場合、UEI配列が組み込まれたオーバーハングオリゴ/アダプターを、ビオチンとともにまたはなしで、標的濃縮戦略として使用することができる。
(実施例7)
さらなるアダプターの例
さらなるアダプターの例を図9Aおよび9B(パネルA)に示す。図9Aは、第1相で鎖置換ポリメラーゼを使用して固有末端識別子(UEI)配列を結合させ、第2相でシーケンサー特異的配列(例えば、シーケンシングアダプター)を結合させる方法の例を示す。したがって、図9A、パネルAに示すアダプターは、シーケンサー特異的アダプター配列(P5、P7)を含有しない。図9AのパネルAは、固有末端識別子(UEI)配列(灰色で示す)およびランダム配列(黒色で示す)で構成されている、Yアダプター(左側)およびヘアピンアダプター(右側)を示す。一部の事例では、Yアダプターは、ヘアピンアダプターの切断されたバージョンである。ヘアピンアダプターは、切断部位(「X」)を含み、この切断部位は、実施例1で説明したような1つまたは複数のRNAヌクレオチドを含み得る。図9AのパネルBは、標的核酸へのアダプターのライゲーションを示す。ヘアピンアダプターライゲーション産物を切断部位で切断することができる。切断後のライゲーション産物は、Y−アダプターライゲーション産物と同じである。図9AのパネルCは、完全相補的二本鎖の平滑末端化断片を作出するための鎖置換ポリメラーゼによるニックでのフィルインステップを示す。図9AのパネルDは、最適な任意のシーケンシングライブラリー調製のための準備が整った状態である核酸断片(第2相)を示す。
図9Bは、ネイティブ核酸断片の末端にYアダプターまたはヘアピンアダプターを結合させる方法の例を示す。パネルAは、オーバーハングと、固有末端識別子(UEI)配列(灰色で示す)と、プライミング配列(プライミング配列1(例えば、Illumina P5プライミング配列)およびプライミング配列2(例えば、Illumina P7プライミング配列);黒色で示すプライミング領域)とで構成されている、Yアダプター(左側)およびヘアピンアダプター(右側)を示す。パネルBは、標的核酸へのアダプターのライゲーションを示す。アダプターがリン酸化されないので、ライゲーションは、鋳型の5’末端でのみ起こり、ニックが残る。パネルCは、5’アダプター鎖がリン酸化され、アダプターの3’末端をライゲーションすると、ニックが修復されることを示す。ニック修復後、ヘアピンアダプターライゲーション産物を切断部位で切断することができる。切断後のライゲーション産物は、Y−アダプターライゲーション産物と同じである。この方法は、最適な任意のシーケンシングライブラリー調製のための準備が整った状態である二本鎖核酸断片(第2相)、および/または最適なシーケンサーための準備が整った状態である二本鎖核酸断片を生成し、これは、使用されるプライミング配列に依存し得る。
(実施例8)
断片サイズ選択
ライブラリー調製後にビーズ、ゲル切り出し、またはPippen Prepマシンのような自動化法を使用してサイズ選択を行うのではなく、一部の事例では、サイズ分画をDNA抽出物で行うことで、ライブラリー分子に変換されることになるDNAのサイズを制御する。分画にはある特定の現実的および生物学的動機がある。現実的には、分画は、ある特定のシーケンシングプラットフォーム(例えば、Illuminaプラットフォーム)を使用して効率的にシーケンシングするには長すぎる断片の存在を低減せる。生物学的には、分画は、異なる生物学的プロセスの産物であり得る断片を分離し、保持する。無細胞DNA(cfDNA)断片長は、一般に、1、2または数ヌクレオチドのサイズ、約170、約340、約510bpぐらいであり、これらの断片は、一般に、細胞アポトーシスの産物と考えられる。より大きい断片は、ある一定の事例では、ゲノムDNA(gDNA)夾雑物を含む。より大きい断片は、cfDNA断片(例えば、ヌクレオソームより大きい断片、例えば、異なる分解段階の断片、またはアポトーシス以外のプロセス(例えば、壊死)に由来する断片)も含み得る。
固相可逆的固定法(SPRI)ビーズを使用して分画を行って、短いDNA断片と長いDNA断片の両方(それぞれ、<500bpおよび>500bpと定義する)を分離し、保持する。カルボキシル化ビーズを、様々なPEG−8000濃度(18%、20%および38%)およびNaCl濃度(0.5M、1Mおよび2M)の溶液中で調製する。DNA抽出物を溶液とともにインキュベートし、磁性粒子分離装置を使用してビーズを回収する。上清を、所望される効果に依存して、廃棄するかまたは保持する。ビーズをエタノールで洗浄した後、DNAを、ビーズから、水、10mM Tris−HCl、TE緩衝液、またはTWEEN(登録商標)−20を含有するTE(TET)のような、中性pHの溶出用緩衝液へ放出させる。
溶液中のSPRIビーズ上に固定化されることになるDNA断片の長さは、PEGの濃度に依存し、この濃度は、ビーズのDNAに対する比と言い換えられる。一般に、この比が低いほど、長いDNA断片がビーズ上に捕捉されることになり、その結果、より短いDNAが上清に残存することになる。短い断片を上清から得るには、より高いビーズのDNAに対する比を使用する。一例では、二重サイズ選択を血漿DNA抽出で行い、各DNA抽出物を0.4〜0.5×比のSPRIビーズ溶液(最終18%PEG、1M NaCl)とともに(すなわち、20ulのDNA、8ulのビーズ)、15分間、室温でインキュベートした。15分後、上清を回収し、取っておいた。ビーズを80%エタノールで2回洗浄し、15ulのTET緩衝液で溶出した。この画分は、一般に、短いDNA断片を含まない。
2×比のSPRIビーズを上清に添加した。インキュベーション、洗浄および溶出を、上で説明したように行った。溶出後、この画分は、一般に、短いDNA断片を含有した。次いで、短い断片を様々なIlluminaオーバーハングライブラリー調製方法に使用し、これらの方法の一部を、上記のある特定の実施例で説明している。
(実施例9)
RNAオーバーハングを有するオリゴヌクレオチドアダプター
この実施例は、オリゴヌクレオチドアダプターにおける一本鎖オーバーハングの基質としてRNA塩基を使用する方法を記載するものである。RNAオーバーハングを有するアダプターを、ライブラリー調製のために、非常に多くの構成、例えば、Y、ヘアピン、二重鎖、遮断する修飾を加えた二重鎖(例えば、図10Aを参照されたい)で、構造化することができる。本明細書に記載する他のすべての反復と同様に、オーバーハングの長さおよびオーバーハングのタイプ(例えば、5’オーバーハングまたは3’オーバーハング)を示す固有末端識別子(UEI)をオリゴヌクレオチドの二重鎖部分に組み込む。一部の事例では、Illumina特異的アダプター配列(例えば、P5、P7)をUEI−アダプターに含める。一部の事例では、Illumina特異的アダプター配列(例えば、P5、P7)をUEI−アダプターに含めない。
T4 RNAリガーゼ2またはSplintR(登録商標)リガーゼなどの、ある特定のリガーゼまたはリガーゼの組合せは、ある特定の条件下で、DNAがRNA鋳型にアニールされるとRNAをDNAにライゲーションすることができる。RNA塩基の一本鎖オーバーハングを有するアダプターを作出することにより、ネイティブDNA鋳型とのハイブリダイゼーションは、ライゲーションされ得るRNA−DNA二重鎖を生じさせる。
ダイマーを(例えば、RNA−RNA二重鎖を形成するオーバーハングハイブリダイゼーションによって)形成するオリゴヌクレオチドアダプターの潜在的な問題に対処するために、二本鎖RNA(dsRNA)構造を標的とするリボヌクレアーゼ(RNAse)を使用して、アダプターダイマーの消化を行う。RNAse IIIは、dsRNA構造を標的とするRNAseの例である。大半のリボヌクレアーゼは、十分に機能するために長い基質を必要とする。しかし、より短いdsRNAアダプターダイマーは、アダプター設計(例えば、最短長の基質および許容リーダー配列)の5’末端(「リーダー」)が、特定のリボヌクレアーゼ(例えば、RNAse III)の標準要件を満たすのであれば、消化または切断によって消失される。
ワークフローの例は、次の構成要素を含む:1)DNA鋳型を脱リン酸化する;2)DNA鋳型をリン酸化する;3)複数の(設計に依存して、完全または部分的)二本鎖DNAアダプターオリゴヌクレオチド種であって、UEIと長さ1〜NのランダムRNA塩基を有する一本鎖オーバーハングとを各々が有し、平滑形アダプター(オーバーハングなし)も含まれる、二本鎖DNAアダプターオリゴヌクレオチド種と、鋳型をハイブリダイズする;4)リガーゼの1つまたは組合せとライゲーションする;5)必要に応じて、ヘアピン構造を切断する;6)二本鎖分子を完成する−アダプター構成に依存して、鎖置換ポリメラーゼを使用してニックをシールするまたはニックでフィルインする;7)SPRI精製して、サイズに基づいてアダプターダイマーを除去することで、過剰なアダプターおよび100bp未満のダイマーを除去する;ある特定の事例では、酵素的消化も使用する;8)必要に応じて、Illumina調製に進む。
(実施例10)
高分子量(HMW)DNAのためのオリゴヌクレオチドアダプター
この実施例は、ショートリード次世代シーケンシング(NGS;例えば、ハイスループットシーケンシング)を利用して高分子量(HMW)DNAからオーバーハング情報を収集するためのオリゴヌクレオチドアダプターおよび方法を記載するものである。
上記実施例で説明した、ある特定のオリゴヌクレオチドアダプターおよび方法は、500bp未満の長さを有する二本鎖DNA(dsDNA)のためのオーバーハングの長さおよび方向に関する情報を(例えば、ショートリードNGSシーケンサーを使用して)得るのに有用であり得る。上で論じた、ある特定の戦略は、5’末端または3’末端のどちらかにランダムな一本鎖N−merを含有するバーコード化Y(またはヘアピン)オリゴヌクレオチドアダプターのプールをdsDNAにライゲーションすることに依拠する。次世代シーケンシング後、各タイプのアダプター上に存在する固有のバーコードが、存在する場合には各DNA分子上に存在するオーバーハングの正しい長さおよび方向を伝える。ある特定のプロトコールでは、1つの計算論的アプローチは、関与する分子生物学の細目のため、シーケンシングデータ(例えば、Illuminaプラットフォームを使用して得たもの)のリード2の最初にバーコードを使用する。
一般に、上で説明した方法では、dsDNA末端は、不変である。ショートリードシーケンサーを使用するには、一般に、シーケンシング前に高分子量(HMW)DNA(例えば、500bpを超える長さのDNA)をより小さい断片サイズにせん断する必要がある。HMW DNAのせん断は、通常は、ネイティブ末端を喪失する結果となる。裸のものであるか、クロマチンに結合されているかを問わず、任意のサイズのDNAだが、元のDNA分子のオーバーハングに関する情報を保持しているDNAを、ショートリードシーケンサーでシーケンシングするためのオリゴヌクレオチドアダプターおよび方法を、下で提供する。そのようなアダプターおよび方法は、例えば、ホルマリン固定パラフィン包埋組織からのDNA(FFPE DNA)、in vivoおよび/またはin vitro内因性手段(UV、メチル化、嵩高い付加物など)により損傷されたDNA、ならびに細胞培養抽出物からのDNAを含むがこれらに限定されない、天然に約500bpより大きいDNAのオーバーハング情報を解析するためのハイスループット法に有用であり得る。他の使用としては、細胞培養でin vitroでのまたはin vivoでの、医療用に設計されたDNA損傷剤および化学療法剤の照合;現行のTUNELアッセイの代替;新規ヌクレアーゼのスクリーニングなどを挙げることができる。
第1の方法を図11に示す。それらのネイティブ断片長のDNA分子は、オーバーハング長情報を有する第1の非リン酸化縮重バーコード化アダプター(例えば、P7アダプタ−)がリン酸化ゲノムDNA(gDNA)にライゲーションされる、部分的シーケンシングライブラリー調製を経る。アダプターダイマーの発生を阻止するためのおよびアダプターの変化の防止するための任意の好適な修飾を使用して、第1のアダプター(例えば、P7アダプター)を修飾することができる(例えば、図12を参照されたい)。
ライゲーションされていないアダプターを除去するための適切な固相可逆的固定法(SPRI)クリーンアップ後、ライゲーションされたアダプターは、上記のある特定の実施例で説明したようなリン酸化およびニック修復を経る。部分的な第1のアダプター(例えば、P7アダプター)戦略を使用する場合、アダプターを(例えば、Bst DNAポリメラーゼを使用して)フィルインする。アダプターダイマーを除去するための適切なSPRIクリーンアップ後、機械的または酵素的方法を使用してDNAをショートリードシーケンサー用の適切なシーケンシング長にせん断する。次いで、DNA分子は、好適な末端修復およびAテーリング手法を使用する末端修復およびAテーリングを経る。Aテーリング後、正しい末端に5’リン酸化修飾および他方の遊離末端にライゲーションを遮断する修飾を有する、修飾された第2のアダプター(例えば、修飾P5アダプター)を、残存するDNA断片にライゲーションする。
次いで、第1および第2のアダプターに従って設計したプライマーを使用して、ライブラリーをPCR増幅する(例えば、P5/P7増幅戦略)。この戦略は、最終プール内の修飾された第1のアダプター(例えば、P7アダプター)を有する分子のみを増幅するので、ネイティブDNAオーバーハングの濃縮を確実にする。第1のアダプター(例えば、P7アダプタ−)のみが修飾されるこの戦略は、アッセイにおいて仕様に従ってIlluminaシーケンサーのリード2で読み取られる正しいライゲーションイベントの濃縮も確実にする。
第2の方法を図14に示す。高分子量DNA分子の末端を捕捉するこの方法は、裸のDNAを用いてまたはクロマチン結合DNAを用いて行うことができる。まず、オーバーハングY−アダプターのプールを遊離dsDNA末端にライゲーションする。オーバーハングY−アダプターを遮断することができる(例えば、C3スペーサーを使用する;遮断修飾を図14にXにより示す)。次いで、DNAをせん断する(クロマチン結合DNAの場合、DNAをせん断前にプロテイナーゼKで処理する)。DNAをシーケンシングに好適なサイズに断片化した後、末端修復ステップ(Aテーリングを伴うまたは伴わない)を行い、専用アダプター(例えば、専用P5アダプター;図14では特別なショーティP5と呼ばれる)を新たに遊離した末端にライゲーションして、正しく形成された分子を濃縮することにより、ライブラリーを完成する。せん断に適応できるものより短いDNAは、それでもやはりライブラリー分子を構成することになる−しかし、通常の(すなわち、専用でない)アダプターおよび対応するバーコードを両側に有することになる。切断産物は、平滑末端修復およびAテーリングを行う末端修復プロセスを経ることがある。このステップには、市販の酵素ミックスを使用することができる。そのような酵素ミックスは、5’リン酸化を行うポリヌクレオチドキナーゼ、5’フィルインを行うポリメラーゼ(例えば、T4ポリメラーゼ)、3’→5’エキソヌクレアーゼを伴う酵素(例えば、T4ポリメラーゼ)、およびAテーリングを行うポリメラーゼ(例えば、Taqポリメラーゼ)を含み得る。
専用アダプター(例えば、専用P5アダプター)は、長い鎖の相補配列(例えば、P5)が、アニールされた状態を継続するのに十分な長さであるが、インデックスPCR中に増幅されるには短すぎ、したがって、1本の鎖のみが正しく形成され、コピーされることになるように、設計する。オーバーハングからの情報は、それがP7側にある場合、考慮される。したがって、その鎖は濃縮される。専用アダプター(例えば、専用P5アダプター)は、かつてHMWであった分子を認識するための固有の8bpバーコードを有する。専用アダプターを遮断すること(図14にXにより示す)で、間違った方向での相互作用を最小にすることができる。ある特定の事例では、専用アダプターをリン酸化し、C3スペーサーで遮断する。2本の鎖のうちの1本は、Tオーバーハングの前にホスホロチオエート骨格修飾を有することができる(図14を参照されたい;ホスホロチオエート骨格修飾を、専用P5アダプターのプールにアスタリスク「*」により示す)。
専用P5アダプターの例としては、以下のヌクレオチド配列が挙げられる:
Figure 2021511309
この方法の予備検査を行い、結果は、この方法が高分子量DNA分子の末端をうまく捕捉することを示した。
(実施例11)
断片化DNAのネイティブ末端を特徴付けるためのNGSライブラリー調製方法
この実施例では、断片状DNA末端のネイティブな状態についての包括的情報を提供する、ライゲーションに基づく次世代シーケンシング(NGS)ライブラリーアプローチを説明する。標準的なDNA末端修復ステップを省略することにより、この方法を使用して生成されるライブラリーは、カスタムシーケンシングアダプターを使用して各分子末端での切断のタイプをコードすることができる。このライブラリー調製方法の最終結果は、ゲノムワイドなヌクレオチド分解能のDNA断片化を提供する、ハイスループットNGSアッセイである。Illumina適合二本鎖DNA(dsDNA)シーケンシングライブラリーを生成するこの方法は、存在する場合には各々の元の鋳型分子上に存在する一本鎖オーバーハングのタイプ(3’、5’または平滑形)および長さならびに存在する場合には各DNA断片上の残存オーバーハングの長さおよび配列をコードする固有識別子を、シーケンシングアダプターに導入する。この方法の精度を、1)既知一本鎖オーバーハングを有する対照オリゴの集団、および2)特異的制限酵素からのDNA消化産物を使用して、実証する。Diagenode Bioruptor、NEB Fragmentase、DNaseI、およびミクロコッカスヌクレアーゼを使用する一般的な機械的および酵素的せん断方法により生成されたdsDNA断片のネイティブ末端の分布も記載する。最後に、この方法を使用して、ヒト血液を採取する一般的な手順が、循環無細胞DNA断片を血液中に存在するヌクレアーゼによる分解から保護するそれらの能力の点で異なることを示す。
材料および方法
核酸鋳型獲得および調製
ランダム配列生成装置を使用して50%GC含有量で合成対照オリゴ(表2)を設計し、公開データベースの任意の公知生物とマッチする配列を除去した。各対照分子(n=12)は、1つの平滑末端と、ランダム配列、長さ1〜6ヌクレオチド、の1つの3’または5’一本鎖オーバーハングとを有する、二本鎖DNAの固有の50bp配列である。各対照は、固有の配列であるため、オリゴの構造を示すそれ自体のバーコードとして役立つ。オリゴは、Integrated DNA Technologies(IDT)により標準的な脱塩精製を使用して合成され、二重鎖化されたものであり、すべてのランダムヌクレオチドを、合成の偏りを低減させるために「手で混合」した。対照オリゴを等モル比で一緒にプールした。アダプターライゲーションの前に、37℃で30分間インキュベートされ、その後、10分間、65℃で熱不活性化される迅速エビアルカリホスファターゼ(New England Biolabs)を使用する20μl反応で、1pmol以下のプールした対照オリゴを脱リン酸化した。次いで、この熱不活性化される20μlのエビアルカリホスファターゼ反応を、ATPを補充したT4ポリヌクレオチドキナーゼ(New England Biolabs)を使用して40μlにすることにより、対照オリゴを5’リン酸化した。このリン酸化反応を37℃で30分間行い、その後、65℃で30分間の熱不活性化ステップを行った。その結果、オリゴは、アダプターライゲーションのための準備が整った状態になった。オリゴ濃度は、40μlで割ったオリゴ投入量pmolを使って算出した。
Figure 2021511309
Figure 2021511309
NA12878 gDNAをコリエル医学研究所(Coriell Institute for Medical Research)から購入し、いくつかの方法でアダプターライゲーション用に調製した。機械的せん断:Bioruptor Pico(Diagenode)および製造業者の使用説明書を使用して、NA12878を長さ代表値350bpにせん断した。次いで、せん断されたDNAを、Pippen Prep用色素不含2%ゲル(Sage Sciences)を製造業者の使用説明書に従って使用して200〜600bpからサイズ選択した。制限酵素消化:1μgのNA12878を、10単位のMluCI(New England Biolabs)を使用して、37℃で1時間、50μl反応で消化した。消化されたDNAを、2×AMPUREビーズ(Beckman Coulter)を製造業者の使用説明書に従って使用して精製した。精製後、DNAを、Pippen Prep用色素不含2%ゲル(Sage Sciences)および製造業者の使用説明書を使用して200〜600bpからサイズ選択した。酵素的せん断:NEBNext(登録商標)dsDNA Fragmentase(登録商標)(New England Biolabs)を用いて、37℃で25分間、20μl反応で1μgのNA12878を消化し、0.1mM EDTAで停止させた。次いで、反応を50μlにし、上記のように精製した。DNase I:0.01単位のDNase I(New England Biolabs)を使用して、37℃で10分間、50μl反応で1μgのNA12878を消化し、0.1mM EDTAで停止させ、DNAを上記のように精製した。ミクロコッカスヌクレアーゼ:2単位のミクロコッカスヌクレアーゼ(New England Biolabs)を使用して、37℃で5分間、50μl反応で1μgのNA12878を消化し、0.1mM EDTAで停止させ、DNAを上記のように精製した。
すべてのNA12878反応:上記方法のいずれかを使用してNA12878 gDNAを調製した後、それを、対照オリゴについて上で詳述したのと同じプロトコールを使用する脱リン酸化、続いての5’リン酸化によって、アダプターライゲーション用に末端調製した。
ヒト血漿および無細胞DNA調製のために、匿名化されたドナーからの全血をin vitro研究使用のためにPalo Alto、CAのスタンフォード献血センター(Stanford Blood Center)から入手した。血液をいくつかのチューブタイプのうちの1つに採取した(表3)。採血チューブを1800gで10分間、4℃で回転させることにより、全血から血漿を抽出した。細胞層を乱すことなく、上清の2mlアリコートを無菌条件下で微量遠心チューブに移し、16000gで10分間、4℃で再び回転させて、細胞デブリを除去し、1mlアリコートとして−80℃で保管した。循環無細胞DNAキット(Qiagen)を製造業者のプロトコールに従って使用して、1mlの血漿からcfDNAを抽出した。精製されたcfDNAを、QUANT−IT高感度dsDNAアッセイキットおよびQubit蛍光光度計(ThermoFisher)を使用して、二本鎖DNA(dsDNA)濃度について測定した。精製されたcfDNAを、Agilent TapeStation 4200ならびに関連D1000およびD5000高感度製品を使用して、サイズ分布について解析した。無細胞DNAを、対照オリゴについて上で詳述したのと同じプロトコールを使用する脱リン酸化、続いての5’リン酸化によって、アダプターライゲーション用に末端調製した。
Figure 2021511309
対照スパイク実験のために、おおよそ40mlの全血をドナーごとに5本の採血チューブ(表3)に採取した。各チューブからの血液を3つのアリコートに分けた。オーバーハングプロファイルに対する血中ヌクレアーゼの効果を正確に評価するために、対照オリゴのプール(全血1ml当たり合計1pmol)を無菌条件下で添加した。血清チューブの場合、凝固が採血時から開始するため、血餅を実験開始時に分離し、対照オリゴプールを血清調製前に1mlの上清に添加した。血漿−オリゴ混合物を0、4または24時間インキュベートした。各時点の直後に、血漿抽出およびcfDNA調製を、上で説明したプロトコールに従って行った。水および1×PBS pH7.4を、対照オリゴの代わりに用いる陰性対照として使用し、全血アリコートと同様にDNA抽出を行った。ビーズ結合緩衝剤、プロテイナーゼKおよび磁気ビーズ体積を、投入する血漿の体積に従って増減させた。対照をスパイクしたcfDNAのDNA末端調製を上で説明したように行い、その後、ライブラリー調製を行った。
アダプターライゲーションおよびシーケンシングライブラリー調製
各アダプターは、Illuminaシーケンサー特異的プライミング部位と、固有末端識別子(UEI)−存在する場合には元の分子に存在するオーバーハングの長さおよび正体(5’または3’)を示すバーコード配列−とを含有する(表4)。アダプターは、Integrated DNA Technologies(IDT)により標準的な脱塩精製を使用して合成され、二重鎖化されたものである。この研究のための13のアダプターセットは、3’オーバーハング(長さ1〜6nt)を有する6つと、5’オーバーハング(長さ1〜6nt)を有する6つと、単一の平滑形アダプター(すなわち、オーバーハングなし)とを含む。アダプターをリン酸化せず、かくてアダプターによるダイマー形成を阻止した。13すべての二重鎖アダプターを等モル比でプールし、1pmolのプールアダプター、10単位の迅速エビアルカリホスファターゼ(New England Biolabs)、1×Cutsmart緩衝剤を37℃で30分間インキュベートし、その後、10分間、65℃で熱不活性化する、20μl反応を使用する末端脱リン酸化により、ライゲーション用に調製した。単一のQIAQUICK Nucleotide Removalカラム(Qiagen)で複数の脱リン酸化反応物を併せ、製造業者の使用説明書に従って精製した。DNA濃度(Qubit蛍光定量)および既知の長さを使用して、アダプターモル濃度を算出した。その結果、アダプターは、ライゲーションのための準備が整った状態であった。
Figure 2021511309
Figure 2021511309
アダプターライゲーションは、最初のライゲーションステップ、その後、インデックスPCRの前に後続のニック修復ライゲーションステップを含む。0.05pmolの基質DNA(対照/NA12878/cfDNA)を、800単位のT4 DNAリガーゼ(New England Biolabs)を用いて60μlのライゲーション反応で1pmolのアダプターと結合させ、20℃で1時間インキュベートし、その後、対照オリゴについての2×AMPUREクリーンまたはNA12878もしくはcfDNAについての1.2×AMPUREクリーンのどちらかを行った。DNA精製後、DNAを、48.8μlの反応で、20単位のT4ポリヌクレオチドキナーゼ(New England Biolabs)および1×T4 DNAリガーゼ緩衝剤でリン酸化し、37℃でインキュベートした。30分後、480単位のT4 DNAリガーゼを反応に添加し、温度を15分間、20℃に低下させた。ニック修復の後、2×AMPUREビーズクリーン、および20μlの低TE(10mM Tris pH8、0.1mM EDTA)での溶出を行った。
インデックスPCRのために、アダプターにライゲーションされ、精製された10μlのDNAを、50μl反応で、1×カッパHiFi HotStart ReadyMix(Roche)および最終濃度0.4mMのIS4および最終濃度0.4mMのインデックスプライマー2と結合させ、次の熱サイクル条件を使用して増幅した:初期変性のために98℃で3分間、続いて、98℃で20秒間、68℃で30秒間、72℃で30秒間を対照/NA12878について15サイクルまたはcfDNAについて18サイクル、最後に72℃で1分の伸長ステップ。インデックスPCR後、DNAを、対照オリゴについての1.5×AMPUREクリーンまたはNA12878/cfDNAについての1.2×AMPUREクリーンのどちらかで精製した。各シーケンシングDNAライブラリーについて、断片長分布およびdsDNA濃度(Agilent Tapestation 4200およびQubit蛍光定量ユニット)を使用して最終モル濃度推定値を算出した。次いで、試料をプールし、Illumina MISEQベンチトップシーケンサーで(製造業者の使用説明書に従って)2×150bpサイクルを1試料当たり深度おおよそ100,000リードペアまで実行した。
インフォマティクス解析
UEIバーコード化リードペアのマッピングは、鋳型分子が、単一の7ntバーコードを加えたフォワードおよびリバースリードの長さの合計より短い場合、バイオインフォマティクス上の課題を提起する。この課題は、各リードが、そのメイトのバーコード配列にわたることがあり、ことによるとそれを超えてIlluminaアダプター配列へと及ぶこともあるため、存在する。古代DNAの分野におけるものなどの短い鋳型分子が期待される研究での1つのアプローチは、アダプター配列の除去とリードのマージを同時に行うことである。このプロセスは、配列類似性に基づいてフォワードリードとリバースリードを折り畳んで単一の配列にすること、その一方で、SEQPREP(github.com/jstjohn/SeqPrep)を使用して公知Illuminaアダプター配列とマッチするリードの末端をトリミングすることを含む。しかし、UEIが存在する場合、これらのマージされたリードは、両末端に7nt UEIを有することができ、末端の一方が逆補完されることになる。
マッピングを単純にするために、アダプタートリミングおよびリードのマージは、UEI配列の存在を条件とする。各リードについて、各ペアにおけるフォワードリードおよびリバースリード両方における既知UEIの存在をチェックした。UEIには、1個以下の「N」塩基を含有することを許可したが、他の塩基ミスマッチを許可しなかった。両方のリードが既知UEI配列を有する場合、各配列をそのメイトのUEIの逆相補鎖について検索することにより、リードがマージしたかどうかをチェックした。どちらのリードもこの基準を満たさなかった場合、両方のリードは、未変化状態で出力された。リードは、それがそのメイトのUEI配列にわたる場合、アダプター配列しか含むことができないからである。両方のリードが、それらのメイトの逆補完UEI配列を含有し、メイトのUEIと遭遇する位置がマッチした場合には、両方のリードを、それらのメイトのUEIと遭遇する位置で短縮化した。位置がマッチしなかった場合、両方のリードを廃棄した。
メイトのUEI配列が参照ゲノムへのマッピングに干渉しないように、マージしたすべてのリードペアを折り畳んだ配列として保存するのではなく、それらを短縮型リードペアとして保持した。比較的短い配列が期待される対照オリゴ実験のために、上記基準を使用してマージしたリードペアについての折り畳んだ配列も保存した。そのような配列について、マージした領域内の塩基には、最大で1つのミスマッチを含有することを許可した(ミスマッチ位置に選択された塩基は、より高い品質を有する塩基であったか、または同点の場合はランダムな塩基であった)。
インデックスの誤った割り当てに起因する、Illuminaシーケンシング対照DNA−phiX−によるシーケンシングデータの汚染リスクを低下させるために、まず、デフォルトパラメーターでbwa memを使用してすべての生データをphiXゲノムとアライメントした。マッピング(samtools fastq−f 12)されなかたリードを抽出し、下流の解析に使用した。
オーバーハングアダプターは、リバース(P7)リードではなくフォワード(P5)リードで遭遇した場合、信頼性が低いことが判明したため、解析は、オーバーハングアダプターで始まるフォワードリードを無視した。平滑形アダプターをフォワードリードでもリバースリードでも許可した。すべての場合、このフィルタリングステップを、結果を計算するときにのみ適用した(処理、マージおよびアライメントの際にすべてのリードを含めたが、フォワードリードでのオーバーハングアダプターが結果に影響を与えることを許可しなかった)。
「固有末端識別−UEI」バーコードを使用してオーバーハングを識別するコードを使用した。アルゴリズムは、以下の特徴を含んだ:
1.オーバーハングのタイプおよび長さを示すかまたは平滑末端を示すUEIバーコード配列のリストを含有するデータ構造;
2.各リードの最初の7塩基(7=バーコードの長さ)を使う;
3.これらが公知バーコードとマッチするかどうかを確かめる;
4.Nが1つあった場合、それを塩基に変換することによって、それが公知バーコードとマッチするかどうかを確かめる;
5.それがバーコードとマッチした場合、バーコードにより示される塩基の数をリードから引くことによりそのバーコードのオーバーハングを調べる;および
6.バーコードが平滑形である場合を除き、フォワードリードを無視する。
対照オリゴ実験
対照オリゴは、一方の末端が一本鎖オーバーハングを有するように合成され、他方の末端が平滑形であるように意図された、合成二本鎖DNAの短い(50bp)配列であった。処理の際、すべての適正に形成された配列は、対照オリゴが共に連鎖している場合を除き、上記の基準を使用してマージすると予想された。一方が感度を測定するためのものであり、他方が特異度を測定するためのものである、対照オリゴ実験を評定する2つ方法を定義した。
感度を測定するためにアダプターを使用して正しく識別される妥当な(非連鎖)対照オリゴ末端のパーセントを計算した。最初に、上記の基準を使用してマージしたすべてのリードを考慮した。リードペアをマージしているときにミスマッチ塩基に遭遇した場合、より高い品質スコアを有する塩基を選択し、品質スコアが同点であった場合、塩基をランダムに選択した。次に、すべての対照オリゴ配列およびそれらの逆相補鎖を含む、参照配列を構築し、最長対照オリゴオーバーハングと長さが等しい「N」塩基の実行により分離した。マージしたリード各々の対照オリゴタイプを決定するために、マージしたリードとこの参照配列とを、Edlib C++配列アライメントライブラリーを使用して、アライメントにおけるリードの最初と最後にギャップを許可し、かつ1塩基以下のミスマッチを許可することで、「N」をペナルティーなしで任意の塩基にマッチさせて、アライメントした。最良のアライメントが、単一の対照オリゴ配列(非キメラアライメント)の座標内に入った場合、その対照オリゴを正しい配列として選択した。対照オリゴは、正しいオーバーハングのバーコードがそのオリゴのオーバーハング末端にライゲーションされ、平滑形アダプターのバーコードが反対側の末端にライゲーションされた場合、正しいと考えた。
特異度を測定するために、マッチするオーバーハングを有する対照オリゴの正しい末端にライゲーションされたUEI配列のパーセントを計算した。この場合、対照オリゴが連鎖を形成するかどうかを評定せず、したがって、ライゲーションに利用可能なあらゆるDNA末端を評定した。すべてのペアエンドリード(上で説明したように短縮されているが、マージしていない)について、UEIに続く配列を、最長オーバーハングと長さが等しい「N」塩基の実行により分離したすべての対照オリゴ配列を含有する参照配列と、アライメントした。アライメントが非キメラである(単一対照オリゴ配列の座標内にある)場合、1つ以下のミスマッチ許可し、任意の塩基とマッチする「N」を用いる、最良のアライメントを使用して、正しい対照オリゴ配列を決定した。その際、特異度を、リードの最初にあるUEIの後に正しいタイプの対照オリゴ末端が正しい方向で続くリードのパーセントと定義した。
オーバーハング配列のヌクレオチド組成を決定するために、UEI配列の末端と対照オリゴ配列の始点の間のすべての塩基を、オーバーハングの真の配列であると見なした。オーバーハング配列の塩基組成を評定するとき、すべてのアダプターを正しいタイプの対照オリゴにライゲーションする必要があった。
ヒトDNA
フィルタリング後に残存するペアエンドリードを、必要に応じて短縮化し、UCSCゲノムブラウザからダウンロードしたhg19ヒト参照ゲノムとアライメントした。アライメントには、リードの最初のUEI配列をスキップして(−Bパラメーター)、デフォルトパラメーターでbwa alnおよびbwa sampeを使用した。次いで、samtools rmdupを使用して、重複リードを除去した。リードは、キメラアライメントの原因となる断片連鎖の可能性のため正しい対合の要件(samtools view−c−f64−q20)が外される制限酵素実験の場合を除いて、20の最小マップ品質(samtools view−c−f66−q20)で正しいペアの状態にあったときにマッピングされた場合にのみ計数した。
マッピングされたリードにおけるUEIタイプを計数するために、HTSLibのBAMパーサーを使用してBAMファイルをスキャンし、BCタグからUEI配列を得た。オーバーハング配列は、UEIにより示されるオーバーハング長と等しい各リードの最初の部分からの塩基の数を使うことによって得た。
一部のシーケンシングライブラリーは、対照オリゴをスパイクしたヒトDNAを含有した。これらのライブラリーを解析するために、すべてのシーケンシングリードを、最初は、ライブライーがヒトDNAのみを含有するかのごとく処理した。次いで、非ヒト配列を、ヒト参照ゲノムとのアライメントから、マッピングされなかったリードおよびマップ品質が10未満であるリードを(samtools fastqとは異なり、抽出されたリード配列にバーコードを再び付加することができるカスタム手法を使用して)選択することにより抽出した。次いで、大部分が対照オリゴであったこれらのリードを、他の対照オリゴライブラリーと同様に処理した。
結果
ライブラリー構築
この実施例での方法は、ライブラリー調製ワークフロー後の断片化され、分解されたdsDNA末端をアッセイするものであった。この方法のための各アダプターは、次の3つの部分を含んだ:P5/P7 Illuminaに基づくシーケンシングおよびインデクスプライミング部位、7塩基対(bp)固有末端識別子(UEI;末端のタイプをコードするバーコード)、および平滑末端、または存在する場合には、基質のオーバーハングとハイブリダイズし、ライゲーションする一本鎖オーバーハング。オーバーハングは、長さN(ここでは、6ヌクレオチド(nt)以下の長さ)のランダム配列の等しい比率を用いて合成した。アダプターを過剰に含めて、すべての鋳型dsDNAタイプが適合するアダプターを確実に利用できるようにした。このようにして、アダプターを、可能なすべての突出末端化鋳型分子とハイブリダイズするのに十分な適合配列を提供する競合反応で導入した。しかし、アダプターのオーバーハングは、自己ハイブリダイゼーションおよびライゲーションの可能性を生じさせるため、アダプターダイマー形成を防止するためにアダプターのオーバーハングをリン酸化しなかった。
この方法の最初のステップの間に、鋳型DNAをポリヌクレオチドキナーゼで処理して、5’末端をリン酸化した。リン酸化を除いて、鋳型DNA末端を変化させない。次に、2ステップライゲーションを行った。まず、5’リン酸化された鋳型DNAを、リン酸化されていないUEI含有アダプターのプールにライゲーションした。この第1のライゲーションを、両方の鋳型鎖のフォワード(P5)アダプター末端でのみ行った。次に、精製を行って、過剰な、ライゲーションされていないアダプターを除去した。最後に、アダプターの5’末端をリン酸化し、第2のライゲーションを−今度はリバース(P7)アダプター末端で−行って、dsDNAライブラリー分子を完成した。次いで、完全に形成された分子にインデックスを付加し、ユニバーサルP5プライマーおよび固有のインデックスが付加されたP7プライマーを使用して増幅した。Illuminaシーケンサーでのペアエンドシーケンシング後、UEIを使用して、オーバーハングのタイプ、長さおよび配列により配列リードを分類した。
DNA末端識別の精度の評定
精度
この実施例で説明するアッセイの精度を判定するために、各々の一本鎖オーバーハングの長さおよびタイプ(3’または5’)が既知である12の合成二本鎖対照オリゴのプールを構築した。各対照オリゴは、固有の識別可能な50bpコアと、一方の側に平滑形末端、および他方の側に特定の長さ(1〜6nt)の5’または3’オーバーハングという一般的な構造とを含有した。ライブラリーをシーケンシングした後、リバースリード(P7)でのUEIを使用して、アダプターUEIにより示されるオーバーハングが、dsDNA対照鋳型上の操作されたオーバーハングと正しくマッチする頻度を比較することにより、アッセイの精度を定量化した。リバースアダプター上に存在するUEIは、正しいオーバーハングを予測することに関して、両方のアダプター上に存在するUEIが含まれる場合またはフォワードアダプターのみが含まれる場合よりも正確である(図18)ため、解析をリバースリードに限定した。この現象を説明するためのモデルを図19に提供する。
この実施例でのアッセイの特異度は、対照オリゴプールを使用して2つの方法で測定した。まず、データセットを正しく形成されたライブラリー分子(すなわち、真の対照オリゴ配列の編集距離1以内の配列を有するモノマー対照オリゴ)に限定し、正しいオーバーハングタイプおよび長さが捕捉される頻度を算出した。各対照オリゴについて、最も多く認められたアダプターUEIが、検査したすべてのオーバーハングタイプ(3’および5’)および長さ(1〜6nt)に関して正しいアダプターであった。しかし、ライブラリー分子のほんのわずかな画分は、それらのUEIが、これらの対照オリゴの既知オーバーハング長またはタイプに対応しないことが認められた。オーバーハングのタイプおよび長さ各々に関しての全般的なUEI精度は、84.94%+/−0.72%(95%C.I.)であった。次に、各UEIの特異度を、合成オリゴの各タイプへの各UEIアダプターのライゲーションが観測された回数を計数することにより測定した。すべての3’UEIおよび平滑形UEIについて、最もよく見られたライゲーションイベントは、正しいものであった。5’1ntオーバーハング以外のすべての5’UEIについて、最もよく見られたライゲーションイベントは、正しいものであった。しかし、群としてまとめると、5’オーバーハングは、3’オーバーハングの精度より低い精度を有する。正しい長さから±1ntの距離で、特に、5’1nt、5’3ntおよび5’5nt対照において、誤りが最も多く発生した。
塩基組成
ライゲーション精度または効率が、オーバーハングの塩基組成による影響を受けるかどうかを判定するために、回収した一本鎖オーバーハング各々のヌクレオチド配列を、配列データおよびUEIデータを使用して決定した。ライブラリーの構造のため、5’オーバーハングに存在する塩基は、挿入鋳型分子に由来し、挿入鋳型分子は、この場合は対照オリゴであり、これに対して、3’オーバーハングは、アダプター自体のDNAオーバーハングに由来した。過剰なシトシンが観測された5’1ntオーバーハングを除いて、各オーバーハングタイプおよび長さについてヌクレオチドの均一な分布が観測された。このシトシンの偏りが、オリゴ合成プロセスの産物であるのかどうかを評価するために、標準的な末端修復ライブラリーを、合成対照オリゴを用いて調製した(NEB Ultra II)。末端修復ステップは、ポリメラーゼ活性によって、3’オーバーハングを除去し、5’オーバーハングをフィルインするものであり、これにより合成DNA 5’オーバーハングの塩基組成を特徴付けることができた。対照オリゴの標準的な末端修復ライブラリー内で、5’1ntシトシンのリードカウントの上昇が観測された。それ故、この観測は、カスタムオリゴ合成の偏りに由来する可能性が高く、ライゲーション中に導入される偏りに由来する可能性は低い。
感度
外来DNA分子のバックグラウンドにおいて特異的な末端タイプの存在を検出する本明細書におけるアダプターの能力を評価するために、単一の既知オーバーハング配列を有するDNAを多様なオーバーハングのプールに混入する希釈系列を行った。多様な末端のプールを、NA12878ゲノムDNA(gDNA)の音波処理(Diagenode Bioruptor)およびサイズ選択により作出した。単一の既知オーバーハングを有するDNAを、NA12878 gDNAを制限エンドヌクレアーゼMluCIで消化することにより作出し、これにより配列AATTの5’4ntオーバーハングが作出され、その後、サイズ選択を行った。
まず、音波処理鋳型からおよびMluCI消化鋳型DNAから生成したライブラリーをシーケンシングして、両方の試料の末端を特徴付けた。音波処理試料についてのオーバーハング長分布(図15、パネルA)は、DNAの音波処理せん断が、平滑末端の保有率、これに続く、3’1ntおよび3’2ntオーバーハングが過度である5’末端と3’末端の両方に存在する1〜4ntオーバーハングの保有率を特徴とする、非ランダムプロファイルを生じさせることを示した。MluCIについては予想通り、MluCI消化DNAの長さ分布が、5’4ntオーバーハングの圧倒的過剰を示した(図15、パネルB)。
希釈系列を行うために、MluCI消化DNAの規定量を、音波処理DNA試料と混合し、次いで、プールした混合物からライブラリーを生成した。プールは、MluCI消化DNAを1%から50%まで含有した。5’AATTオーバーハングに起因する配列リードの各ライブラリー中のパーセント(図15、パネルC;表5)を算出した。全体的に見れば、ライブラリープール中の既知MluCIの分率と、シーケンシングしたデータ中の正しいAATTオーバーハングを有する正しい5’4ヌクレオチドオーバーハングとして観測されたものとの間には、一致があった。MluCI消化DNAの分率(100%〜10%)がより高いライブラリーは、予想されたものより少ない5’AATTオーバーハングを示し、これは、適合する突出鋳型末端の過多に起因する可能性が高かったが、より低い希釈ライブラリーは、既知MluCIの分率のより正確な推定値を生じさせた。
Figure 2021511309
次に、MluCI消化DNAのいかなる濃度で5’AATTシグナルが喪失されるのかを推定するために、滴定量のMluCI消化DNAを含有する音波処理ライブラリーを、スパイクされた5’AATTオーバーハングを含有しない対照音波処理ライブラリーと比較した。系列中の最低希釈度(1%MluCI)であっても、5’AATTオーバーハングの存在が、他のすべてのオーバーハングより多く検出された、p<0.001(図15、パネルD)。この観測は、適切な対照ライブラリーと比較したとき、この実施例でのアッセイには、ライブラリーの1%未満を構成するオーバーハングモチーフを発見するのに十分な感度があることを示す。音波処理によりせん断されたDNA末端およびMluCIにより消化されたDNA末端の正確なゲノム位置のマッピングは、オーバーハングのランダムな分布、および予想された5’4ntオーバーハングの過多を、それぞれ示した。
一般的DNAせん断機構のオーバーハングプロファイル
高分子量DNAの断片化またはせん断は、通常は、ショートリード、例えばIllumina、シーケンシングライブラリーを作出する際に必要なステップである。評判のよりDNAせん断手段としては、音波処理および酵素的消化が挙げられる。音波処理による機械的せん断が、NGSライブラリーの品質を偏らせるまたは別様に影響を与えるのかどうかを詳しく調査するために、クローニングに基づくアプローチを使用して、DNA音波処理により作出された末端を調査した研究、および標準的な末端修復NGSライブラリー中の5’オーバーハングを解析して、DNA音波処理による非ランダムせん断の証拠を見つけた別の研究を含む、いくつかの研究により、せん断方法の帰結が比較されている。酵素的せん断の帰結を詳しく調査するために、いくつかの研究は、分子に基づく方法、マイクロアレイに基づく方法およびシーケンシングに基づく方法を使用して、DNaseIの消化の優先傾向、ならびに低分解能でだがミクロコッカスヌクレアーゼの切断の優先傾向を説明している。本明細書に記載するアダプターを使用して生成されるライブラリーは、すべての遊離DNA末端の微小構造を偏りのないハイスループットな方法で評定することができるため、この実施例で説明するアッセイを使用して、音波処理および酵素的せん断の両方によって断片化された裸のNA12878ゲノムDNAのDNA末端プロファイルを特徴付けた(表6)。
Figure 2021511309
音波処理
音波処理により生成されたオーバーハングをより詳細に照合するために、Diagenode Bioruptorでせん断したライブラリーから生成したデータを、上で紹介したように調査した(感度セクションを参照されたい)。音波処理試料についてのオーバーハング長および配列モチーフ分布は、DNAの音波処理が、平滑末端のより高い保有率、これに、5’末端と3’末端の両方に存在する1〜4ntオーバーハングが続くが、3’1ntおよび3’2ntオーバーハングに優先傾向がある保有率を生じさせることを示した。Bioruptorで音波処理したDNAの塩基組成プロファイルは、1ntオーバーハングが形成される場合を除いて、バランスのとれた範囲を示した。1nt DSBの存在は、ほとんどの場合、単一シトシンオーバーハングを残し、これは、5’1ntオーバーハングに関して以前に観測された現象である。
酵素的せん断
酵素的せん断により生成されるオーバーハングを照合するために、dsFragmentase(New England Biolabs、NEB)、DNaseIおよびミクロコッカスヌクレアーゼ(MNase)という3つのエンドヌクレアーゼを使用して、ライブラリーを生成した。NEB製品dsFragmentaseは、NGS DNA断片化用に特別に設計された2つの酵素のカクテルである。dsFragmentase消化試料からのオーバーハング長分布は、音波処理と比較して、オーバーハングを有する分子を多く生じさせ、平滑末端化された分子を少なく生じさせた。dsFragmentaseはまた、ライブラリー複製物間で観測されたオーバーハング長の変動に基づいて、Bioruptorよりランダムなせん断プロファイルを生じさせた。この研究で使用したアダプターは、6ntまでしか伸長しなかった。6ntオーバーハングを含有する分子のせん断数は、dsFragmentaseが、6ntより長いオーバーハングを生じさせることを示す。dsFragmentaseオーバーハングのモチーフ分布は、5’オーバーハングの生成と3’オーバーハングの生成間で等しい分布を示した。dsFragmentaseオーバーハングの塩基組成は、Bioruptorのものに類似していたが、長さ2nt〜6ntのオーバーハングにはより多くのシトシンがあった。
次に、エンドヌクレアーゼDNaseIおよびミクロコッカスヌクレアーゼ(MNase)により生成されたオーバーハングを照合した。DNaseIで消化された裸のDNAについてのオーバーハング長プロットは、3’2ntオーバーハングはもちろん、5’2nt〜4ntオーバーハングの保有率も示した。後者のうち、ヌクレオチドが3つまたはそれより多いオーバーハングは、GCリッチであった。オーバーハング長分布プロットにおける6ntオーバーハングの相対存在量に基づいて、DNaseIは、6ntを超える長さのオーバーハングを生じさせる可能性が高い。DNaseI消化DNAのオーバーハング塩基組成プロファイルは、オーバーハングの長さが増加するにつれて5’オーバーハング中のシトシンの優先傾向の低下を示し、3’1ntチミンのわずかな優先傾向を示した。DNaseI切断部位の上流のヌクレオチドの塩基組成は、5’オーバーハングの−1位にあるA/T部位でのDNA切断の優先傾向を示した。
MNase消化DNAについてのオーバーハング長プロット(図16、上のパネル)は、MNaseには平滑形DNA末端の作出の強い優先傾向(オーバーハングデータの39.5%)があり、オーバーハングが長くなるとそれが徐々に低下する可能性が高いことを示した。オーバーハングが生成された場合、MNaseは、A/Tリッチ5’オーバーハングの全般的優先傾向を(1ntオーバーハングを除いて)示した(図16、下のパネル)。MNase切断部位の上流のヌクレオチドの塩基組成は、MNaseにより生成される実際の3’オーバーハングが5’オーバーハングほどA/Tリッチではないが、3’オーバーハングの−1位が圧倒的にA/Tリッチであることを示す。
これらの結果は、この実施例で説明する方法が、様々なDNAせん断方法の優先傾向および偏りを特徴付けた以前の研究のアウトカムを再現し得ることを示す。これらの結果はまた、新規ヌクレアーゼの特徴付けにこの方法を利用することの潜在的利益を強調する。
全血におけるin vivoヌクレアーゼ活性により生成される末端の回収
最近、循環無細胞DNA(cfDNA)プロファイリングは、非侵襲的出生前検査およびがん診断における使用に向けてかなりの注目を集めている。血漿からの高品質DNAの獲得は、採血自体から始まる。血液凝固または凝血は、ヌクレアーゼ活性増大に関連するプロセスであり、採血チューブ(BCT)のタイプは、cfDNA抽出物の量および品質に影響を与え得る。ここでは、一般的なBCTが、どの程度cfDNAの完全性を維持するのかを、公知の対照オリゴ(上記)をスパイクした様々なBCTから抽出したcfDNAのライブラリーを構築することによりアッセイした。一般に使用されている抗凝固薬を含有するBCTを含め(表3)、抗凝固薬のない対照チューブ(赤色キャップのチューブ;RTT)を含めた。
上で説明したように血漿(または血清)を抽出し、cfDNAを単離する前に、対照オリゴを4つのチューブタイプの各々にスパイクした。対照オリゴとcfDNAの混合物を、オリゴスパイクイン後0、4および24時間の時点で抽出し、本明細書に記載されるアダプターを使用してライブラリーに変換した。ヌクレアーゼ活性および細胞溶解を阻害する添加剤を含有するStreck(登録商標)BCT(SBCT)内では、ヒトcfDNA断片長プロファイルまたは存在量は、経時的に変化しなかった。逆に言うと、複数のヌクレオソーム断片がYTT(抗凝固薬−クエン酸塩)およびPTT(抗凝固薬−EDTAカリウム塩)では24時間の時点で出現し、これは、アポトーシス性細胞gDNAを想起させた。RTTでは、複数のヌクレオソーム断片が0時間ほども早期に見られた。これは、アポトーシスプロセスが、エンドヌクレアーゼおよびエキソヌクレアーゼの放出に関連する血液凝固中に開始され得ることを示唆する。
cfDNA抽出前の対照オリゴを含有する全血のインキュベーションによって、採血後に依然として活性であるヌクレアーゼに起因する既知DNA末端の喪失または変化の量を定量化することができた。SBCTにおいても、PTTにおいても、陰性対照においても、対照DNA末端プロファイルの有意な喪失も変化も観測されなかった(図17)。いずれの公知ヌクレアーゼ阻害剤も含有しないYTTでは、3’オーバーハングプロファイルと5’オーバーハングプロファイル両方の変化が観測された。これらの変化は、1つまたは複数の活性な循環エキソヌクレアーゼの存在を示した(図17)。24時間までに、YTTでは対照オリゴの3’オーバーハングシグナルが有意に低下した。これは、3’→5’エキソヌクレアーゼが、5’→3’エキソヌクレアーゼよりプロセシング性が高い可能性があることを示唆する。RTTでは、3’オーバーハングカウントの完全喪失が4時間以内に観測され、かつて平滑形であった分子における新たなオーバーハングの生成により識別される、真の平滑末端の枯渇も観測された。24時間までに、RTTでは、高活性ヌクレアーゼ環境に関して予想された通り、対照オリゴがもはや目視できなくなった。要するに、これらの観測は、この実施例で説明した方法が、cfDNAのオーバーハングパターンの変化を判別することおよび血液中の循環ヌクレアーゼの効果を調査するために使用することができることを示す。
(実施例12)
オーバーハングシーケンシングデータセットの解析
試料中の核酸の集団の核酸オーバーハングを(例えば、バイオインフォマティクス解析を使用して)照合して、オーバーハングの1つまたは複数の特徴を含むオーバーハングプロファイルを生成することができる(例えば、ある特定のオーバーハングタイプ(例えば、5’、3’、平滑形)の定量化、ある特定のオーバーハング長の定量化、ある特定のオーバーハング配列特徴の定量化など)。ある特定の事例では、鋳型分子の特徴を考慮することができる。オーバーハングプロファイルおよび/またはある特定の鋳型特徴に基づいて、試料の1つまたは複数の特性を判定することができる。
試料の1つまたは複数の特性を判定するために使用することができる特徴変数(例えば、オーバーハング特徴;鋳型特徴)の例を、表7に提供する。
Figure 2021511309
Figure 2021511309
*ジヌクレオチドの例としては、AA、AT、AC、AG、TT、TA、TC、TG、CC、CG、CA、CT、GG、GA、GC、GTが挙げられる;トリヌクレオチドの可能な組合せ 43;テトラヌクレオチドの可能な組合せ 44
**X=上記の任意の特徴
オーバーハングデータおよび試料特性との関係についてのある特定のバイオインフォマティクス解析の例を下で説明する。
オーバーハングデータのヒートマップ
がんに罹患しているドナー(「がんドナー」)および健康なドナーからの無細胞DNAについてのライブラリーを、本明細書に記載されるY形オーバーハングアダプターを使用して生成した(例えば、図9Bに示すY形アダプターおよび方法を参照されたい)。ウォードの階層的クラスタリング法を使用して、各ライブラリーに存在するDNAオーバーハングのシーケンシングデータからヒートマップ(図20)を作成した。図20に示すヒートマップの各列は、がんドナー(黒色バー)または健康なドナー(バーなし)からの単一無細胞DNAライブラリーを表す。図20に示すヒートマップの各行は、長さ1〜6ヌクレオチドの固有オーバーハング(5’または3’)を表し、少なくとも1つのCGジヌクレオチド、すなわちCpG、を含有する行(オーバーハング)を灰色バーで示す。図20に示すヒートマップ行列内では、色が濃いほど、そのオーバーハングが占めるライブラリー内での(対数スケールで描かれた)比率が増す。より薄い色は、そのオーバーハングの枯渇を示す。
図20に示すように、CpG含有オーバーハングの大半は、木の一端に向かってクラスター化しており、少数のより小さいクラスターが全体にわたって存在する。がんドナーの1つの一次クラスターが観測され(図20、左の上から2番目のクレード)、その大半(13のうちの12)がGIがんに罹患していた。これらの試料は、CG含有オーバーハングを有するライブラリーのより低いパーセント(枯渇)を示し、その一方で、健康なドナーには、CG含有オーバーハングを有するライブラリーのより高いパーセンテージ(濃縮)を有する傾向があった。このように、CG含有オーバーハングに関して、枯渇のパターンが、がん無細胞DNAライブラリーのある特定のクラスターにおいて観測された。
オーバーハング配列データを使用する機械学習アプローチ
CGカウント、オーバーハング長、完全分子長、および図21に記載の他の変数を含む、変数を用いて、ロジスティック回帰および教師あり学習アルゴリズム(サポートベクターマシン(SVM))を実行して、がんおよび健康試料を分類した。SVMとロジスティック回帰の両方が、75%より高い適合率および再現率(適合率−真の陽性として試料を表示するモデルの能力;再現率−すべての陽性試料を見つけるモデルの能力)で、75%の正解率を有した。
モデルに使用した変数を図21に提供する。再帰的特徴量削減後、異なるサブセットを用いて−これらに対して、用いる特徴セットを徐々に小さくして再帰的処理を行って−モデル作成プロセスを繰り返した後、すべての変数を最もよく動作する特徴と見なした。
ロジスティック回帰分類器(がん対健康−混同行列)
被検セットに関するロジスティック回帰分類器の予測正解率は、真陽性、偽陽性、真陰性および偽陰性の間のよりよい分割で75%であった−正しい予測790+823および誤った予測308+230(図22)。
SVM分類器(がん対健康−分類レポートおよびROC)
真陽性として試料を表示するモデルの能力(適合率)は73%であり、すべての陽性試料を見つけるモデルの能力(再現率)は78%であった。最終モデルは、データを30%被検セットと70%訓練セットに分割した。f1スコアは、適合率と再現率との調和平均であり、サポートは、被検セットからの考慮した試料の数である。分類の正解率は、75%であった。
GIがん対健康−モデル要約
がんに罹患している患者のオッズは、オーバーハングがCGジヌクレオチド配列を含有する場合、120%増加する。がんに罹患している患者のオッズは、オーバーハングがGGジヌクレオチド配列を含有する場合には105%増加し、オーバーハングがGCジヌクレオチド配列を含有する場合には50%増加する。すべての特徴変数は、最終モデルにおいて−カットオフを0.05として−有意なp値、P>|z|、を有した。
GIがん対その他(健康および他のがんを含む)−モデル要約
がんに罹患している患者のオッズは、オーバーハングがCGジヌクレオチド配列を含有する場合、94%増加する。すべての特徴変数は、最終モデルにおいて−カットオフを0.05として−有意なp値、P>|z|、を有した。
分類器の例
がん対健康
Figure 2021511309
Figure 2021511309
Figure 2021511309
Figure 2021511309
Figure 2021511309
Figure 2021511309
(実施例13)
実施形態の例
下記の例は、ある特定の実施形態を説明するものであり、本技術を限定するものではない。
A1.核酸ライブラリーを生成する方法であって、
(a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、
(i)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖を含み、ループが、1つまたは複数のリボ核酸(RNA)ヌクレオチドを含み、
(ii)標的核酸の一部またはすべてが、オーバーハングを含み、
(iii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
(iv)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
(v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;
(b)ハイブリダイゼーション産物と、ハイブリダイゼーション産物をヘアピンループ内のRNAヌクレオチドで切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることによって、切断されたハイブリダイゼーション産物を形成するステップと
を含む方法。
A2.複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖からなる、実施形態A1の方法。
A3.ループが、2つのRNAヌクレオチドを含む、実施形態A1またはA2の方法。
A4.ループが、3つのRNAヌクレオチドを含む、実施形態A1またはA2の方法。
A5.ループが、4つのRNAヌクレオチドを含む、実施形態A1またはA2の方法。
A6.ループが、アデニン(A)、シトシン(C)およびグアニン(G)から選択される1つまたは複数のリボ核酸(RNA)ヌクレオチドを含む、実施形態A1〜A5のいずれか1つの方法。
A7.RNAヌクレオチドが、グアニン(G)を含む、実施形態A1〜A6のいずれか1つの方法。
A8.RNAヌクレオチドが、グアニン(G)からなる、実施形態A1〜A6のいずれか1つの方法。
A9.RNAヌクレオチドが、シトシン(C)を含む、実施形態A1〜A6のいずれか1つの方法。
A10.RNAヌクレオチドが、シトシン(C)からなる、実施形態A1〜A6のいずれか1つの方法。
A11.RNAヌクレオチドが、アデニン(A)を含む、実施形態A1〜A6のいずれか1つの方法。
A12.RNAヌクレオチドが、アデニン(A)からなる、実施形態A1〜A6のいずれか1つの方法。
A13.RNAヌクレオチドが、アデニン(A)、シトシン(C)およびグアニン(G)からなる、実施形態A1〜A6のいずれか1つの方法。
A14.RNAヌクレオチドが、アデニン(A)およびシトシン(C)からなる、実施形態A1〜A6のいずれか1つの方法。
A15.RNAヌクレオチドが、アデニン(A)およびグアニン(G)からなる、実施形態A1〜A6のいずれか1つの方法。
A16.RNAヌクレオチドが、シトシン(C)およびグアニン(G)からなる、実施形態A1〜A6のいずれか1つの方法。
A17.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態A1〜A16のいずれか1つの方法。
A18.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態A1〜A17のいずれか1つの方法。
A19.オーバーハングを含むオリゴヌクレオチドが、一本鎖ループ、二重鎖部分、および一本鎖オーバーハングを含む、実施形態A1〜A18のいずれか1つの方法。
A20.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態A1〜A19のいずれか1つの方法。
A21.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態A1〜A20のいずれか1つの方法。
A22.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態A21の方法。
A23.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態A22の方法。
A24.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態A21、A22またはA23の方法。
A25.オーバーハングを含まないオリゴヌクレオチドが、一本鎖ループおよび二重鎖部分を含む、実施形態A1〜A18のいずれか1つの方法。
A26.オリゴヌクレオチドの末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態A1〜A25のいずれか1つの方法。
A27.オリゴヌクレオチド鎖の3’末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態A26の方法。
A28.ハイブリダイゼーション産物が、二重鎖領域および少なくとも1つの一本鎖ループを含む、実施形態A1〜A27のいずれか1つの方法。
A29.ハイブリダイゼーション産物が、二重鎖領域を含み、各末端に一本鎖ループを含む、実施形態A1〜A28のいずれか1つの方法。
A30.1つまたは複数の切断作用因子が、ハイブリダイゼーション産物をヘアピンループ内のRNAヌクレオチドで切断することができ、ハイブリダイゼーション産物を二重鎖領域内で切断することができない、実施形態A28またはA29の方法。
A31.1つまたは複数の切断作用因子が、リボヌクレアーゼ(RNAse)を含む、実施形態A1〜A30のいずれか1つの方法。
A32.RNAseが、エンドリボヌクレアーゼである、実施形態A31の方法。
A33.RNAseが、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse Vのうちの1つまたは複数から選択される、実施形態A31またはA32の方法。
A34.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態A1〜A33のいずれか1つの方法。
A35.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態A1〜A34のいずれか1つの方法。
A36.標的核酸の一部が、オーバーハングを含まない、実施形態A1〜A35のいずれか1つの方法。
A37.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態A1〜A36のいずれか1つの方法。
A38.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態A1〜A37のいずれか1つの方法。
A39.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態A1〜A38のいずれか1つの方法。
A40.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態A1〜A39のいずれか1つの方法。
A41.標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態A1〜A40のいずれか1つの方法。
A42.DNA断片が、細胞から得られる、実施形態A41の方法。
A43.DNA断片が、ゲノムDNA断片を含む、実施形態A41またはA42の方法。
A44.標的核酸が、リボ核酸(RNA)断片を含む、実施形態A1〜A40のいずれか1つの方法。
A45.RNA断片が、細胞から得られる、実施形態A44の方法。
A46.標的核酸が、無細胞核酸断片を含む、実施形態A1〜A45のいずれか1つの方法。
A47.標的核酸が、循環無細胞核酸断片を含む、実施形態A1〜A46のいずれか1つの方法。
A48.標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態A1〜A47のいずれか1つの方法。
A49.標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態A1〜A48のいずれか1つの方法。
A50.標的核酸が、複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、実施形態A1〜A49のいずれか1つの方法。
A51.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態A1〜A50のいずれか1つの方法。
A52.標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む、実施形態A1〜A51のいずれか1つの方法。
A53.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とリガーゼ活性を含む薬剤とを接触させるステップを含む、実施形態A52の方法。
A54.(a)の前に、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態A1〜A53のいずれか1つの方法。
A55.(a)の前に、脱リン酸化された標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態A54の方法。
A56.(a)の前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態A1〜A55のいずれか1つの方法。
A57.(a)の前に、脱リン酸化されたオリゴヌクレオチド種とホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む、実施形態A56の方法。
A58.標的核酸が、対象からの試料から得られる、実施形態A1〜A57のいずれか1つの方法。
A59.対象がヒトである、実施形態A58の方法。
A60.(a)の前に、標的核酸を断片長に従って分離するステップを含む、実施形態A1〜A59のいずれか1つの方法。
A61.約500bp未満の断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態A60の方法。
A62.約500bpのまたはそれより長い断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態A60の方法。
A63.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態A1〜A62のいずれか1つの方法。
A64.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態A1〜A62のいずれか1つの方法。
A65.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態A1〜A62のいずれか1つの方法。
A66.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態A1〜A62のいずれか1つの方法。
A67.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とRNAリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態A65またはA66の方法。
A68.ハイブリダイゼーション産物とRNAse活性を有する薬剤とを、二本鎖RNA二重鎖が消化される条件下で接触させるステップを含む、実施形態A65〜A67のいずれか1つの方法。
B1.複数のオリゴヌクレオチド種を含む組成物であって、
(a)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖を含み、ループが、1つまたは複数のリボ核酸(RNA)ヌクレオチドを含み;
(b)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸中のオーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;
(c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、組成物。
B2.複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖からなる、実施形態B1の組成物。
B3.ループが、2つのRNAヌクレオチドを含む、実施形態B1またはB2の組成物。
B4.ループが、3つのRNAヌクレオチドを含む、実施形態B1またはB2の組成物。
B5.ループが、4つのRNAヌクレオチドを含む、実施形態B1またはB2の組成物。
B6.ループが、アデニン(A)、シトシン(C)およびグアニン(G)から選択される1つまたは複数のリボ核酸(RNA)ヌクレオチドを含む、実施形態B1〜B5のいずれか1つの組成物。
B7.RNAヌクレオチドが、グアニン(G)を含む、実施形態B1〜B6のいずれか1つの組成物。
B8.RNAヌクレオチドが、グアニン(G)からなる、実施形態B1〜B6のいずれか1つの組成物。
B9.RNAヌクレオチドが、シトシン(C)を含む、実施形態B1〜B6のいずれか1つの組成物。
B10.RNAヌクレオチドが、シトシン(C)からなる、実施形態B1〜B6のいずれか1つの組成物。
B11.RNAヌクレオチドが、アデニン(A)を含む、実施形態B1〜B6のいずれか1つの組成物。
B12.RNAヌクレオチドが、アデニン(A)からなる、実施形態B1〜B6のいずれか1つの組成物。
B13.RNAヌクレオチドが、アデニン(A)、シトシン(C)およびグアニン(G)からなる、実施形態B1〜B6のいずれか1つの組成物。
B14.RNAヌクレオチドが、アデニン(A)およびシトシン(C)からなる、実施形態B1〜B6のいずれか1つの組成物。
B15.RNAヌクレオチドが、アデニン(A)およびグアニン(G)からなる、実施形態B1〜B6のいずれか1つの組成物。
B16.RNAヌクレオチドが、シトシン(C)およびグアニン(G)からなる、実施形態B1〜B6のいずれか1つの組成物。
B17.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態B1〜B16のいずれか1つの組成物。
B18.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態B1〜B17のいずれか1つの組成物。
B19.オーバーハングを含むオリゴヌクレオチドが、一本鎖ループ、二重鎖部分、および一本鎖オーバーハングを含む、実施形態B1〜B18のいずれか1つの組成物。
B20.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態B1〜B19のいずれか1つの組成物。
B21.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態B1〜B20のいずれか1つの組成物。
B22.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態B21の組成物。
B23.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態B22の組成物。
B24.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態B21、B22またはB23の組成物。
B25.オーバーハングを含まないオリゴヌクレオチドが、一本鎖ループおよび二重鎖部分を含む、実施形態B1〜B18のいずれか1つの組成物。
B26.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態B1〜B25のいずれか1つの組成物。
B27.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態B1〜B26のいずれか1つの組成物。
B28.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態B1〜B27のいずれか1つの組成物。
B29.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態B1〜B28のいずれか1つの組成物。
B30.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態B1〜B28のいずれか1つの組成物。
B31.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態B1〜B28のいずれか1つの組成物。
B32.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態B1〜B28のいずれか1つの組成物。
C1.核酸末端を修飾する方法であって、
(a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、
(i)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、切断条件下で切断され得る1つまたは複数の切断部位を含み、
(ii)標的核酸の一部またはすべてが、オーバーハングを含み、
(iii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖および第1のオーバーハングおよび第2のオーバーハングを含み、各オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
(iv)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第1および第2のオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的な少なくとも2つのオリゴヌクレオチドオーバーハング識別配列を含み、
(v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;
(b)ハイブリダイゼーション産物と、ハイブリダイゼーション産物を1つまたは複数の切断部位で切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることによって、切断されたハイブリダイゼーション産物を形成するステップと;
(c)切断されたハイブリダイゼーション産物と鎖置換ポリメラーゼとを接触させることによって、平滑末端化された核酸断片を形成するステップと
を含む方法。
C2.(c)が、切断されたハイブリダイゼーション産物と鎖置換ポリメラーゼおよび修飾ヌクレオチドとを接触させることによって、1つまたは複数の修飾ヌクレオチドを含む平滑末端化された核酸断片を形成することを含む、実施形態C1の方法。
C3.1つまたは複数の修飾ヌクレオチドが、結合対のメンバーにコンジュゲートされたヌクレオチドを含む、実施形態C2の方法。
C4.1つまたは複数の修飾ヌクレオチドが、ビオチンにコンジュゲートされたヌクレオチドを含む、実施形態C2の方法。
C5.1つまたは複数の切断部位が、ウラシルおよびデオキシウリジンから選択されるヌクレオチドを含む、実施形態C1〜C4のいずれか1つの方法。
C6.1つまたは複数の切断作用因子が、エンドヌクレアーゼを含む、実施形態C1〜C5のいずれか1つの方法。
C7.1つまたは複数の切断作用因子が、DNAグリコシラーゼを含む、実施形態C1〜C5のいずれか1つの方法。
C8.1つまたは複数の切断作用因子が、エンドヌクレアーゼおよびDNAグリコシラーゼを含む、実施形態C1〜C7のいずれか1つの方法。
C9.1つまたは複数の切断作用因子が、ウラシルDNAグリコシラーゼ(UDG)とエンドヌクレアーゼVIIIの混合物を含む、実施形態C8の方法。
C10.1つまたは複数の切断部位が、制限酵素認識部位を含む、実施形態C1〜C4のいずれか1つの方法。
C11.1つまたは複数の切断作用因子が、制限酵素を含む、実施形態C10の方法。
C12.1つまたは複数の切断作用因子が、レアカッター制限酵素を含む、実施形態C10の方法。
C13.保留。
C14.保留。
C15.1つまたは複数の切断部位が、1つまたは複数のRNAヌクレオチドを含む、実施形態C1〜C4のいずれか1つの方法。
C16.1つまたは複数の切断部位が、1つまたは複数のRNAヌクレオチドを含む一本鎖部分を含む、実施形態C1〜C4のいずれか1つの方法。
C17.1つまたは複数の切断作用因子が、リボヌクレアーゼ(RNAse)を含む、実施形態C15またはC16の方法。
C18.RNAseが、エンドリボヌクレアーゼである、実施形態C17の方法。
C19.RNAseが、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse Vのうちの1つまたは複数から選択される、実施形態C17またはC18の方法。
C20.1つまたは複数の切断部位が、光切断性スペーサーを含む、実施形態C1〜C4のいずれか1つの方法。
C21.1つまたは複数の切断作用因子が、紫外(UV)線を含む、実施形態C20の方法。
C22.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態C1〜C21のいずれか1つの方法。
C23.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態C1〜C22のいずれか1つの方法。
C24.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分を含み、各末端に一本鎖オーバーハングを含む、実施形態C1〜C23のいずれか1つの方法。
C25.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分を含み、各末端に一本鎖オーバーハングを含み、第1の末端の一本鎖オーバーハングが、第2の末端のオーバーハングと、長さの点で同一であり、かつ配列の点で同一である、実施形態C1〜C24のいずれか1つの方法。
C26.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態C1〜C25のいずれか1つの方法。
C27.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態C1〜C26のいずれか1つの方法。
C28.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態C27の方法。
C29.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態C28の方法。
C30.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態C27、C28またはC29の方法。
C31.オーバーハングを含まないオリゴヌクレオチドが、平滑末端化された二重鎖部分を含む、実施形態C1〜C30のいずれか1つの方法。
C32.オリゴヌクレオチドの末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態C1〜C31のいずれか1つの方法。
C33.オリゴヌクレオチド鎖の3’末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態C32の方法。
C34.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態C1〜C33のいずれか1つの方法。
C35.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態C1〜C34のいずれか1つの方法。
C36.標的核酸の一部が、オーバーハングを含まない、実施形態C1〜C35のいずれか1つの方法。
C37.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態C1〜C36のいずれか1つの方法。
C38.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態C1〜C37のいずれか1つの方法。
C39.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態C1〜C38のいずれか1つの方法。
C40.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態C1〜C39のいずれか1つの方法。
C41.標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態C1〜C40のいずれか1つの方法。
C42.DNA断片が、細胞から得られる、実施形態C41の方法。
C43.DNA断片が、ゲノムDNA断片を含む、実施形態C41またはC42の方法。
C44.標的核酸が、リボ核酸(RNA)断片を含む、実施形態C1〜C40のいずれか1つの方法。
C45.RNA断片が、細胞から得られる、実施形態C44の方法。
C46.標的核酸が、無細胞核酸断片を含む、実施形態C1〜C45のいずれか1つの方法。
C47.標的核酸が、循環無細胞核酸断片を含む、実施形態C1〜C46のいずれか1つの方法。
C48.標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態C1〜C47のいずれか1つの方法。
C49.標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態C1〜C48のいずれか1つの方法。
C50.標的核酸が、複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、実施形態C1〜C49のいずれか1つの方法。
C51.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態C1〜C50のいずれか1つの方法。
C52.標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む、実施形態C1〜C51のいずれか1つの方法。
C53.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態C52の方法。
C54.(a)の前に、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態C1〜C53のいずれか1つの方法。
C55.(a)の前に、脱リン酸化された標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態C54の方法。
C56.(a)の前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態C1〜C55のいずれか1つの方法。
C57.(a)の前に、脱リン酸化されたオリゴヌクレオチド種とホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む、実施形態C56の方法。
C58.標的核酸が、対象からの試料から得られる、実施形態C1〜C57のいずれか1つの方法。
C59.対象がヒトである、実施形態C58の方法。
C60.(a)の前に、標的核酸を断片長に従って分離するステップを含む、実施形態C1〜C59のいずれか1つの方法。
C61.約500bp未満の断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態C60の方法。
C62.約500bpのまたはそれより長い断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態C60の方法。
C63.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態C1〜C62のいずれか1つの方法。
C64.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態C1〜C62のいずれか1つの方法。
C65.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態C1〜C62のいずれか1つの方法。
C66.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態C1〜C62のいずれか1つの方法。
C67.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とRNAリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態C65またはC66の方法。
C68.ハイブリダイゼーション産物とRNAse活性を有する薬剤とを、二本鎖RNA二重鎖が消化される条件下で接触させるステップを含む、実施形態C65〜C67のいずれか1つの方法。
D1.複数のオリゴヌクレオチド種を含む組成物であって、
(a)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、切断条件下で切断され得る1つまたは複数の切断部位を含み;
(b)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖および第1のオーバーハングおよび第2のオーバーハングを含み、各オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;
(c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第1および第2のオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的な少なくとも2つのオリゴヌクレオチドオーバーハング識別配列を含む、
組成物。
D2.1つまたは複数の切断部位が、ウラシルおよびデオキシウリジンから選択されるヌクレオチドを含む、実施形態D1の組成物。
D3.1つまたは複数の切断部位が、制限酵素認識部位を含む、実施形態D1の組成物。
D4.1つまたは複数の切断部位が、1つまたは複数のRNAヌクレオチドを含む、実施形態D1の組成物。
D5.1つまたは複数の切断部位が、1つまたは複数のRNAヌクレオチドを含む一本鎖部分を含む、実施形態D4の組成物。
D6.1つまたは複数の切断部位が、光切断性スペーサーを含む、実施形態D1の組成物。
D7.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態D1〜D6のいずれか1つの組成物。
D8.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態D1〜D7のいずれか1つの組成物。
D9.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分を含み、各末端に一本鎖オーバーハングを含む、実施形態D1〜D8のいずれか1つの組成物。
D10.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分を含み、各末端に一本鎖オーバーハングを含み、第1の末端の一本鎖オーバーハングが、第2の末端のオーバーハングと、長さの点で同一であり、かつ配列の点で同一である、実施形態D1〜D9のいずれか1つの組成物。
D11.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態D1〜D10のいずれか1つの組成物。
D12.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態D1〜D11のいずれか1つの組成物。
D13.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態D12の組成物。
D14.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態D13の組成物。
D15.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態D12、D13またはD14の組成物。
D16.オーバーハングを含まないオリゴヌクレオチドが、平滑末端化された二重鎖部分を含む、実施形態D1〜D15のいずれか1つの組成物。
D17.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態D1〜D16のいずれか1つの組成物。
D18.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態D1〜D17のいずれか1つの組成物。
D19.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態D1〜D18のいずれか1つの組成物。
D20.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態D1〜D19のいずれか1つの組成物。
D21.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態D1〜D19のいずれか1つの組成物。
D22.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態D1〜D19のいずれか1つの組成物。
D23.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態D1〜D19のいずれか1つの組成物。
E1.核酸末端を修飾する方法であって、
(a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、
(i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に1つまたは複数の修飾ヌクレオチドを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
(ii)標的核酸の一部またはすべてが、オーバーハングを含み、
(iii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
(iv)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;
(b)ハイブリダイゼーション産物と鎖置換ポリメラーゼとを接触させることによって、平滑末端化された核酸断片を形成するステップと
を含む方法。
E2.1つまたは複数の修飾ヌクレオチドを第2の末端に有するオリゴヌクレオチドが、不対合修飾ヌクレオチドを第2の末端に含む、実施形態E1の方法。
E3.1つまたは複数の修飾ヌクレオチド(one or modified nucleotides)を第2の末端に有するオリゴヌクレオチドが、3’末端を有する鎖の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態E1またはE2の方法。
E4.1つまたは複数の修飾ヌクレオチドを第2の末端に有するオリゴヌクレオチドが、5’末端を有する鎖の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態E1またはE2の方法。
E5.1つまたは複数の修飾ヌクレオチドが、標的核酸中のヌクレオチドとのハイブリダイゼーションを遮断することができる、実施形態E1〜E4のいずれか1つの方法。
E6.1つまたは複数の修飾ヌクレオチドが、標的核酸中のヌクレオチドへのライゲーションを遮断することができる、実施形態E1〜E5のいずれか1つの方法。
E7.1つまたは複数の修飾ヌクレオチドが、天然ヌクレオチドに結合することができない修飾ヌクレオチドを含む、実施形態E1〜E6のいずれか1つの方法。
E8.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−塩基、ジデオキシ−塩基、逆方向ジデオキシ−塩基、スペーサー、およびアミノリンカーから選択される1つまたは複数の修飾ヌクレオチドを含む、実施形態E1〜E7のいずれか1つの方法。
E9.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−塩基を含む、実施形態E1〜E8のいずれか1つの方法。
E10.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−グアニン(イソ−dG)を含む、実施形態E9の方法。
E11.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−シトシン(イソ−dC)を含む、実施形態E10の方法。
E12.1つまたは複数の修飾ヌクレオチドが、ジデオキシ−塩基を含む、実施形態E1〜E8のいずれか1つの方法。
E13.1つまたは複数の修飾ヌクレオチドが、ジデオキシ−シトシンを含む、実施形態E12の方法。
E14.1つまたは複数の修飾ヌクレオチドが、逆方向ジデオキシ−塩基を含む、実施形態E1〜E8のいずれか1つの方法。
E15.1つまたは複数の修飾ヌクレオチドが、逆方向ジデオキシ−チミンを含む、実施形態E14の方法。
E16.1つまたは複数の修飾ヌクレオチドが、スペーサーを含む、実施形態E1〜E8のいずれか1つの方法。
E17.1つまたは複数の修飾ヌクレオチドが、C3スペーサーを含む、実施形態E16の方法。
E18.(b)で形成される平滑末端化された核酸断片が、修飾ヌクレオチドを含まない、実施形態E1〜E17のいずれか1つの方法。
E19.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態E1〜E18のいずれか1つの方法。
E20.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態E1〜E19のいずれか1つの方法。
E21.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分を含み、第1の末端にオーバーハングを含み、第2の末端に少なくとも1つの不対合修飾ヌクレオチドを含む、実施形態E1〜E20のいずれか1つの方法。
E22.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態E1〜E21のいずれか1つの方法。
E23.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態E1〜E22のいずれか1つの方法。
E24.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態E23の方法。
E25.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態E24の方法。
E26.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態E23、E24またはE25の方法。
E27.オーバーハングを含まないオリゴヌクレオチドが、第1の末端に平滑末端を有する二重鎖部分を含み、第2の末端に少なくとも1つの不対合修飾ヌクレオチドを含む、実施形態E1〜E26のいずれか1つの方法。
E28.オリゴヌクレオチドの末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態E1〜E27のいずれか1つの方法。
E29.オリゴヌクレオチド鎖の3’末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態E28の方法。
E30.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態E1〜E29のいずれか1つの方法。
E31.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態E1〜E30のいずれか1つの方法。
E32.標的核酸の一部が、オーバーハングを含まない、実施形態E1〜E31のいずれか1つの方法。
E33.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態E1〜E32のいずれか1つの方法。
E34.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態E1〜E33のいずれか1つの方法。
E35.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態E1〜E34のいずれか1つの方法。
E36.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態E1〜E35のいずれか1つの方法。
E37.標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態E1〜E36のいずれか1つの方法。
E38.DNA断片が、細胞から得られる、実施形態E37の方法。
E39.DNA断片が、ゲノムDNA断片を含む、実施形態E37またはE38の方法。
E40.標的核酸が、リボ核酸(RNA)断片を含む、実施形態E1〜E36のいずれか1つの方法。
E41.RNA断片が、細胞から得られる、実施形態E40の方法。
E42.標的核酸が、無細胞核酸断片を含む、実施形態E1〜E41のいずれか1つの方法。
E43.標的核酸が、循環無細胞核酸断片を含む、実施形態E1〜E42のいずれか1つの方法。
E44.標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態E1〜E43のいずれか1つの方法。
E45.標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態E1〜E44のいずれか1つの方法。
E46.標的核酸が、複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、実施形態E1〜E45のいずれか1つの方法。
E47.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態E1〜E46のいずれか1つの方法。
E48.標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む、実施形態E1〜E47のいずれか1つの方法。
E49.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態E48の方法。
E50.(a)の前に、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態E1〜E49のいずれか1つの方法。
E51.(a)の前に、脱リン酸化された標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態E50の方法。
E52.(a)の前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態E1〜E51のいずれか1つの方法。
E53.(a)の前に、脱リン酸化されたオリゴヌクレオチド種とホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む、実施形態E52の方法。
E54.標的核酸が、対象からの試料から得られる、実施形態E1〜E53のいずれか1つの方法。
E55.対象がヒトである、実施形態E54の方法。
E56.(a)の前に、標的核酸を断片長に従って分離するステップを含む、実施形態E1〜E55のいずれか1つの方法。
E57.約500bp未満の断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態E56の方法。
E58.約500bpのまたはそれより長い断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態E56の方法。
E59.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態E1〜E58のいずれか1つの方法。
E60.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態E1〜E58のいずれか1つの方法。
E61.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態E1〜E58のいずれか1つの方法。
E62.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態E1〜E58のいずれか1つの方法。
E63.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とRNAリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態E61またはE62の方法。
E64.ハイブリダイゼーション産物とRNAse活性を有する薬剤とを、二本鎖RNA二重鎖が消化される条件下で接触させるステップを含む、実施形態E61〜E63のいずれか1つの方法。
F1.複数のオリゴヌクレオチド種を含む組成物であって、
(a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に1つまたは複数の修飾ヌクレオチドを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;
(b)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、
組成物。
F2.1つまたは複数の修飾ヌクレオチドを第2の末端に有するオリゴヌクレオチドが、不対合修飾ヌクレオチドを第2の末端に含む、実施形態F1の組成物。
F3.1つまたは複数の修飾ヌクレオチドを第2の末端に有するオリゴヌクレオチドが、3’末端を有する鎖の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態F1またはF2の組成物。
F4.1つまたは複数の修飾ヌクレオチドを第2の末端に有するオリゴヌクレオチドが、5’末端を有する鎖の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態F1またはF2の組成物。
F5.1つまたは複数の修飾ヌクレオチドが、標的核酸中のヌクレオチドとのハイブリダイゼーションを遮断することができる、実施形態F1〜F4のいずれか1つの組成物。
F6.1つまたは複数の修飾ヌクレオチドが、標的核酸中のヌクレオチドへのライゲーションを遮断することができる、実施形態F1〜F5のいずれか1つの組成物。
F7.1つまたは複数の修飾ヌクレオチドが、天然ヌクレオチドに結合することができない修飾ヌクレオチドを含む、実施形態F1〜F6のいずれか1つの組成物。
F8.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−塩基、ジデオキシ−塩基、逆方向ジデオキシ−塩基、スペーサー、およびアミノリンカーから選択される1つまたは複数の修飾ヌクレオチドを含む、実施形態F1〜F7のいずれか1つの組成物。
F9.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−塩基を含む、実施形態F1〜F8のいずれか1つの組成物。
F10.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−グアニン(イソ−dG)を含む、実施形態F9の組成物。
F11.1つまたは複数の修飾ヌクレオチドが、イソデオキシ−シトシン(イソ−dC)を含む、実施形態F9の組成物。
F12.1つまたは複数の修飾ヌクレオチドが、ジデオキシ−塩基を含む、実施形態F1〜F8のいずれか1つの組成物。
F13.1つまたは複数の修飾ヌクレオチドが、ジデオキシ−シトシンを含む、実施形態F12の組成物。
F14.1つまたは複数の修飾ヌクレオチドが、逆方向ジデオキシ−塩基を含む、実施形態F1〜F8のいずれか1つの組成物。
F15.1つまたは複数の修飾ヌクレオチドが、逆方向ジデオキシ−チミンを含む、実施形態F14の組成物。
F16.1つまたは複数の修飾ヌクレオチドが、スペーサーを含む、実施形態F1〜F8のいずれか1つの組成物。
F17.1つまたは複数の修飾ヌクレオチドが、C3スペーサーを含む、実施形態F16の組成物。
F18.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態F1〜F17のいずれか1つの組成物。
F19.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態F1〜F18のいずれか1つの組成物。
F20.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分を含み、第1の末端にオーバーハングを含み、第2の末端に少なくとも1つの不対合修飾ヌクレオチドを含む、実施形態F1〜F19のいずれか1つの組成物。
F21.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態F1〜F20のいずれか1つの組成物。
F22.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態F1〜F21のいずれか1つの組成物。
F23.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態F22の組成物。
F24.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態F23の組成物。
F25.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態F22、F23またはF24の組成物。
F26.オーバーハングを含まないオリゴヌクレオチドが、第1の末端に平滑末端を有する二重鎖部分を含み、第2の末端に少なくとも1つの不対合修飾ヌクレオチドを含む、実施形態F1〜F25のいずれか1つの組成物。
F27.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態F1〜F26のいずれか1つの組成物。
F28.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態F1〜F27のいずれか1つの組成物。
F29.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態F1〜F28のいずれか1つの組成物。
F30.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態F1〜F29のいずれか1つの組成物。
F31.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態F1〜F29のいずれか1つの組成物。
F32.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態F1〜F29のいずれか1つの組成物。
F33.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態F1〜F29のいずれか1つの組成物。
G1.核酸末端を修飾する方法であって、
(a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、
(i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、2本の鎖を含み、第1の末端にオーバーハングを含み、第1の末端のオーバーハングが、パリンドローム配列を含み、
(ii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、第2の末端にオーバーハングを含み、第2の末端のオーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有の第2の末端のオーバーハング配列およびオーバーハング長を有し、
(iii)標的核酸の一部またはすべてが、オーバーハングを含み、
(iv)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第2の末端のオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
(v)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含み、
(vi)第1の末端のオーバーハングが、他の第1の末端のオーバーハングとハイブリダイズし、第2の末端のオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによって環状ハイブリダイゼーション産物が形成される、ステップと;
(b)ハイブリダイゼーション産物とエキソヌクレアーゼとを接触させることによって、エキソヌクレアーゼ処理されたハイブリダイゼーション産物を生成するステップと;
(c)エキソヌクレアーゼ処理されたハイブリダイゼーション産物をせん断することによって、エキソヌクレアーゼ処理され、せん断されたハイブリダイゼーション産物を生成するステップと;
(d)オリゴヌクレオチド種における配列を含む断片を、オリゴヌクレオチド種における配列を含まない断片から分離することによって、エキソヌクレアーゼ処理され、せん断され、分離されたハイブリダイゼーション産物を生成するステップと
を含む方法。
G2.1つまたは複数の修飾ヌクレオチドが、結合対の第1のメンバーにコンジュゲートされたヌクレオチドを含む、実施形態G1の方法。
G3.1つまたは複数の修飾ヌクレオチドが、ビオチンにコンジュゲートされたヌクレオチドを含む、実施形態G1またはG2の方法。
G4.第1の末端のオーバーハングが、1つまたは複数の修飾ヌクレオチドを含む、実施形態G1〜G3のいずれか1つの方法。
G5.(d)での分離が、エキソヌクレアーゼ処理され、せん断されたハイブリダイゼーション産物と、結合対の第2のメンバーとを接触させることを含む、実施形態G1〜G4のいずれか1つの方法。
G6.結合対の第2のメンバーが、固体支持体にコンジュゲートされたストレプトアビジンである、実施形態G5の方法。
G7.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチド、ならびにこれらの組合せを含む、実施形態G1〜G6のいずれか1つの方法。
G8.1つまたは複数のオリゴヌクレオチド種が、5’オーバーハングを第1の末端に有する、実施形態G1〜G7のいずれか1つの方法。
G9.1つまたは複数のオリゴヌクレオチド種が、3’オーバーハングを第1の末端に有する、実施形態G1〜G8のいずれか1つの方法。
G10.1つまたは複数のオリゴヌクレオチド種が、5’オーバーハングを第2の末端に有する、実施形態G1〜G9のいずれか1つの方法。
G11.1つまたは複数のオリゴヌクレオチド種が、3’オーバーハングを第2の末端に有する、実施形態G1〜G10のいずれか1つの方法。
G12.1つまたは複数のオリゴヌクレオチド種が、第2の末端にオーバーハングを有さない、実施形態G1〜G11のいずれか1つの方法。
G13.複数のオリゴヌクレオチド種が、第1の末端5’オーバーハングまたは第1の末端3’オーバーハングと、第2の末端5’オーバーハング、第2の末端3’オーバーハング、またはオーバーハングを含まない第2の末端とを独立して有する、オリゴヌクレオチドを含む、実施形態G1〜G12のいずれか1つの方法。
G14.第2の末端のオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態G1〜G13のいずれか1つの方法。
G15.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有する第2の末端のオーバーハングを含む、実施形態G1〜G14のいずれか1つの方法。
G16.複数のオリゴヌクレオチド種における第2の末端のオーバーハングが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態G15の方法。
G17.複数のオリゴヌクレオチド種における第2の末端のオーバーハングが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態G16の方法。
G18.第2の末端のオーバーハング配列が、ランダムである、実施形態G15、G16またはG17の方法。
G19.オリゴヌクレオチドの末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態G1〜G18のいずれか1つの方法。
G20.第1の末端のオーバーハングの末端が、ハイブリダイゼーション産物において第1の末端のオーバーハングがハイブリダイズされる第1の末端を含むオリゴヌクレオチド種の末端に共有結合で連結され得る、実施形態G1〜G19のいずれか1つの方法。
G21.オリゴヌクレオチド鎖の3’末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態G20の方法。
G22.オリゴヌクレオチドオーバーハング識別配列が、第2の末端のオーバーハングの長さに特異的である、実施形態G1〜G21のいずれか1つの方法。
G23.オリゴヌクレオチドオーバーハング識別配列が、第2の末端のオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択される第2の末端のオーバーハングの1つまたは複数の特徴に特異的である、実施形態G1〜G22のいずれか1つの方法。
G24.標的核酸の一部が、オーバーハングを含まない、実施形態G1〜G23のいずれか1つの方法。
G25.オリゴヌクレオチド種が、第2の末端のオーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態G1〜G24のいずれか1つの方法。
G26.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態G1〜G25のいずれか1つの方法。
G27.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態G1〜G26のいずれか1つの方法。
G28.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態G1〜G27のいずれか1つの方法。
G29.標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態G1〜G28のいずれか1つの方法。
G30.DNA断片が、細胞から得られる、実施形態G29の方法。
G31.DNA断片が、ゲノムDNA断片を含む、実施形態G29またはG30の方法。
G32.標的核酸が、リボ核酸(RNA)断片を含む、実施形態G1〜G28のいずれか1つの方法。
G33.RNA断片が、細胞から得られる、実施形態G32の方法。
G34.標的核酸が、無細胞核酸断片を含む、実施形態G1〜G33のいずれか1つの方法。
G35.標的核酸が、循環無細胞核酸断片を含む、実施形態G1〜G34のいずれか1つの方法。
G36.標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態G1〜G35のいずれか1つの方法。
G37.標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態G1〜G36のいずれか1つの方法。
G38.標的核酸が、複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、実施形態G1〜G37のいずれか1つの方法。
G39.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態G1〜G38のいずれか1つの方法。
G40.標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む、実施形態G1〜G39のいずれか1つの方法。
G41.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態G40の方法。
G42.(a)の前に、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態G1〜G41のいずれか1つの方法。
G43.(a)の前に、脱リン酸化された標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態G42の方法。
G44.(a)の前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態G1〜G43のいずれか1つの方法。
G45.(a)の前に、脱リン酸化されたオリゴヌクレオチド種とホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む、実施形態G44の方法。
G46.標的核酸が、対象からの試料から得られる、実施形態G1〜G45のいずれか1つの方法。
G47.対象がヒトである、実施形態G46の方法。
G48.(a)の前に、標的核酸を断片長に従って分離するステップを含む、実施形態G1〜G47のいずれか1つの方法。
G49.約500bp未満の断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態G48の方法。
G50.約500bpのまたはそれより長い断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態G48の方法。
G51.第2の末端のオーバーハングが、DNAヌクレオチドを含む、実施形態G1〜G50のいずれか1つの方法。
G52.第2の末端のオーバーハングが、DNAヌクレオチドからなる、実施形態G1〜G50のいずれか1つの方法。
G53.第2の末端のオーバーハングが、RNAヌクレオチドを含む、実施形態G1〜G50のいずれか1つの方法。
G54.第2の末端のオーバーハングが、RNAヌクレオチドからなる、実施形態G1〜G50のいずれか1つの方法。
G55.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とRNAリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態G53またはG54の方法。
G56.ハイブリダイゼーション産物とRNAse活性を有する薬剤とを、二本鎖RNA二重鎖が消化される条件下で接触させるステップを含む、実施形態G53〜G55のいずれか1つの方法。
H1.複数のオリゴヌクレオチド種を含む組成物であって、
(a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、2本の鎖を含み、第1の末端にオーバーハングを含み、第1の末端のオーバーハングが、パリンドローム配列を含み;
(b)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、第2の末端にオーバーハングを含み、第2の末端のオーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有の第2の末端のオーバーハング配列およびオーバーハング長を有し;
(c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、第2の末端のオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み;
(d)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、
組成物。
H2.1つまたは複数の修飾ヌクレオチドが、結合対の第1のメンバーにコンジュゲートされたヌクレオチドを含む、実施形態H1の組成物。
H3.1つまたは複数の修飾ヌクレオチドが、ビオチンにコンジュゲートされたヌクレオチドを含む、実施形態H1またはH2の組成物。
H4.第1の末端のオーバーハングが、1つまたは複数の修飾ヌクレオチドを含む、実施形態H1〜H3のいずれか1つの組成物。
H5.(d)での分離が、エキソヌクレアーゼ処理され、せん断されたハイブリダイゼーション産物と、結合対の第2のメンバーとを接触させることを含む、実施形態H1〜H4のいずれか1つの組成物。
H6.結合対の第2のメンバーが、固体支持体にコンジュゲートされたストレプトアビジンである、実施形態H5の組成物。
H7.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチド、ならびにこれらの組合せを含む、実施形態H1〜H6のいずれか1つの組成物。
H8.1つまたは複数のオリゴヌクレオチド種が、5’オーバーハングを第1の末端に有する、実施形態H1〜H7のいずれか1つの組成物。
H9.1つまたは複数のオリゴヌクレオチド種が、3’オーバーハングを第1の末端に有する、実施形態H1〜H8のいずれか1つの組成物。
H10.1つまたは複数のオリゴヌクレオチド種が、5’オーバーハングを第2の末端に有する、実施形態H1〜H9のいずれか1つの組成物。
H11.1つまたは複数のオリゴヌクレオチド種が、3’オーバーハングを第2の末端に有する、実施形態H1〜H10のいずれか1つの組成物。
H12.1つまたは複数のオリゴヌクレオチド種が、第2の末端にオーバーハングを有さない、実施形態H1〜H11のいずれか1つの組成物。
H13.複数のオリゴヌクレオチド種が、第1の末端5’オーバーハングまたは第1の末端3’オーバーハングと、第2の末端5’オーバーハング、第2の末端3’オーバーハング、またはオーバーハングを含まない第2の末端とを独立して有する、オリゴヌクレオチドを含む、実施形態H1〜H12のいずれか1つの組成物。
H14.第2の末端のオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態H1〜H13のいずれか1つの組成物。
H15.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有する第2の末端のオーバーハングを含む、実施形態H1〜H14のいずれか1つの組成物。
H16.複数のオリゴヌクレオチド種における第2の末端のオーバーハングが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態H15の組成物。
H17.複数のオリゴヌクレオチド種における第2の末端のオーバーハングが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態H16の組成物。
H18.第2の末端のオーバーハング配列が、ランダムである、実施形態H15、H16またはH17の組成物。
H19.オリゴヌクレオチドオーバーハング識別配列が、第2の末端のオーバーハングの長さに特異的である、実施形態H1〜H18のいずれか1つの組成物。
H20.オリゴヌクレオチドオーバーハング識別配列が、第2の末端のオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択される第2の末端のオーバーハングの1つまたは複数の特徴に特異的である、実施形態H1〜H19のいずれか1つの組成物。
H21.オリゴヌクレオチド種が、第2の末端のオーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態H1〜H20のいずれか1つの組成物。
H22.第2の末端のオーバーハングが、DNAヌクレオチドを含む、実施形態H1〜H21のいずれか1つの組成物。
H23.第2の末端のオーバーハングが、DNAヌクレオチドからなる、実施形態H1〜H21のいずれか1つの組成物。
H24.第2の末端のオーバーハングが、RNAヌクレオチドを含む、実施形態H1〜H21のいずれか1つの組成物。
H25.第2の末端のオーバーハングが、RNAヌクレオチドからなる、実施形態H1〜H21のいずれか1つの組成物。
I1.核酸末端を修飾する方法であって、
(a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、
(i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、(1)2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
(ii)標的核酸の一部またはすべてが、オーバーハングを含み、
(iii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
(iv)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;
(b)ハイブリダイゼーション産物と鎖置換ポリメラーゼとを接触させることによって、平滑末端化された核酸断片を形成するステップと
を含む方法。
I2.複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖からなる、実施形態I1の方法。
I3.一本鎖ループが、切断部位を含む、実施形態I1またはI2の方法。
I4.切断部位が、1つまたは複数のRNAヌクレオチドを含む、実施形態I3の方法。
I5.ループが、2つのRNAヌクレオチドを含む、実施形態I4の方法。
I6.ループが、3つのRNAヌクレオチドを含む、実施形態I4の方法。
I7.ループが、4つのRNAヌクレオチドを含む、実施形態I4の方法。
I8.ループが、アデニン(A)、シトシン(C)、グアニン(G)およびウラシル(U)から選択される1つまたは複数のリボ核酸(RNA)ヌクレオチドを含む、実施形態I4〜I7のいずれか1つの方法。
I9.RNAヌクレオチドが、グアニン(G)を含む、実施形態I4〜I8のいずれか1つの方法。
I10.RNAヌクレオチドが、グアニン(G)からなる、実施形態I4〜I8のいずれか1つの方法。
I11.RNAヌクレオチドが、シトシン(C)を含む、実施形態I4〜I8のいずれか1つの方法。
I12.RNAヌクレオチドが、シトシン(C)からなる、実施形態I4〜I8のいずれか1つの方法。
I13.RNAヌクレオチドが、アデニン(A)を含む、実施形態I4〜I8のいずれか1つの方法。
I14.RNAヌクレオチドが、アデニン(A)からなる、実施形態I4〜I8のいずれか1つの方法。
I15.RNAヌクレオチドが、アデニン(A)、シトシン(C)およびグアニン(G)からなる、実施形態I4〜I8のいずれか1つの方法。
I16.RNAヌクレオチドが、アデニン(A)およびシトシン(C)からなる、実施形態I4〜I8のいずれか1つの方法。
I17.RNAヌクレオチドが、アデニン(A)およびグアニン(G)からなる、実施形態I4〜I8のいずれか1つの方法。
I18.RNAヌクレオチドが、シトシン(C)およびグアニン(G)からなる、実施形態I4〜I8のいずれか1つの方法。
I19.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態I1〜I18のいずれか1つの方法。
I20.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態I1〜I19のいずれか1つの方法。
I21.オーバーハングを含むオリゴヌクレオチドが、一本鎖ループ、二重鎖部分、および一本鎖オーバーハングを含む、実施形態I1〜I20のいずれか1つの方法。
I22.オーバーハングを含むオリゴヌクレオチドが、第1の末端にオーバーハングを含み、二重鎖部分を含み、第2の末端に2本の非相補鎖を含む、実施形態I1〜I20のいずれか1つの方法。
I23.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態I1〜I22のいずれか1つの方法。
I24.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態I1〜I23のいずれか1つの方法。
I25.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態I24の方法。
I26.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態I25の方法。
I27.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態I24、I25またはI26の方法。
I28.オーバーハングを含まないオリゴヌクレオチドが、一本鎖ループおよび二重鎖部分を含む、実施形態I1〜I27のいずれか1つの方法。
I29.オーバーハングを含まないオリゴヌクレオチドが、平滑末端化された第1の末端を含み、二重鎖部分を含み、第2の末端に2本の非相補鎖を含む、実施形態I1〜I27のいずれか1つの方法。
I30.オリゴヌクレオチドの末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態I1〜I29のいずれか1つの方法。
I31.オリゴヌクレオチド鎖の3’末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態I30の方法。
I32.ハイブリダイゼーション産物が、二重鎖領域および少なくとも1つの一本鎖ループを含む、実施形態I1〜I31のいずれか1つの方法。
I33.ハイブリダイゼーション産物が、二重鎖領域を含み、各末端に一本鎖ループを含む、実施形態I1〜I32のいずれか1つの方法。
I34.ハイブリダイゼーション産物が、二重鎖領域と、2本の非相補鎖を含む少なくとも1つの末端とを含む、実施形態I1〜I31のいずれか1つの方法。
I35.ハイブリダイゼーション産物が、二重鎖領域を含み、各末端に2本の非相補鎖を含む、実施形態I1〜I31およびI134のいずれか1つの方法。
I36.ハイブリダイゼーション産物と、ハイブリダイゼーション産物をヘアピンループ内の切断部位おいて切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることによって、切断されたハイブリダイゼーション産物を形成するステップを含む、実施形態I3〜I35のいずれか1つの方法。
I37.ハイブリダイゼーション産物と、ハイブリダイゼーション産物をヘアピンループ内のRNAヌクレオチドで切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることによって、切断されたハイブリダイゼーション産物を形成するステップを含む、実施形態I4〜I36のいずれか1つの方法。
I38.1つまたは複数の切断作用因子が、ハイブリダイゼーション産物をヘアピンループ内のRNAヌクレオチドで切断することができ、ハイブリダイゼーション産物を二重鎖領域内で切断することができない、実施形態I37の方法。
I39.1つまたは複数の切断作用因子が、リボヌクレアーゼ(RNAse)を含む、実施形態I36〜I38のいずれか1つの方法。
I40.RNAseが、エンドリボヌクレアーゼである、実施形態I39の方法。
I41.RNAseが、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse Vのうちの1つまたは複数から選択される、実施形態I39またはI40の方法。
I42.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態I1〜I41のいずれか1つの方法。
I43.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態I1〜I42のいずれか1つの方法。
I44.標的核酸の一部が、オーバーハングを含まない、実施形態I1〜I43のいずれか1つの方法。
I45.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態I1〜I44のいずれか1つの方法。
I46.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態I1〜I45のいずれか1つの方法。
I47.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態I1〜I46のいずれか1つの方法。
I48.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態I1〜I47のいずれか1つの方法。
I49.標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態I1〜I48のいずれか1つの方法。
I50.DNA断片が、細胞から得られる、実施形態I49の方法。
I51.DNA断片が、ゲノムDNA断片を含む、実施形態I49またはI50の方法。
I52.標的核酸が、リボ核酸(RNA)断片を含む、実施形態I1〜I48のいずれか1つの方法。
I53.RNA断片が、細胞から得られる、実施形態I52の方法。
I54.標的核酸が、無細胞核酸断片を含む、実施形態I1〜I53のいずれか1つの方法。
I55.標的核酸が、循環無細胞核酸断片を含む、実施形態I1〜I54のいずれか1つの方法。
I56.標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態I1〜I55のいずれか1つの方法。
I57.標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態I1〜I56のいずれか1つの方法。
I58.標的核酸が、複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、実施形態I1〜I57のいずれか1つの方法。
I59.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態I1〜I58のいずれか1つの方法。
I60.標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む、実施形態I1〜I59のいずれか1つの方法。
I61.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態I60の方法。
I62.(a)の前に、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態I1〜I61のいずれか1つの方法。
I63.(a)の前に、脱リン酸化された標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態I62の方法。
I64.(a)の前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態I1〜I63のいずれか1つの方法。
I65.(a)の前に、脱リン酸化されたオリゴヌクレオチド種とホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む、実施形態I64の方法。
I66.標的核酸が、対象からの試料から得られる、実施形態I1〜I65のいずれか1つの方法。
I67.対象がヒトである、実施形態I66の方法。
I68.(a)の前に、標的核酸を断片長に従って分離するステップを含む、実施形態I1〜I67のいずれか1つの方法。
I69.約500bp未満の断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態I68の方法。
I70.約500bpのまたはそれより長い断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態I68の方法。
I71.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態I1〜I70のいずれか1つの方法。
I72.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態I1〜I70のいずれか1つの方法。
I73.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態I1〜I70のいずれか1つの方法。
I74.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態I1〜I70のいずれか1つの方法。
I75.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とRNAリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態I73またはI74の方法。
I76.ハイブリダイゼーション産物とRNAse活性を有する薬剤とを、二本鎖RNA二重鎖が消化される条件下で接触させるステップを含む、実施形態I73〜I75のいずれか1つの方法。
J1.複数のオリゴヌクレオチド種を含む組成物であって、
(a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、(i)2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含むか、または(ii)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;
(b)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、
組成物。
J2.複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖からなる、実施形態J1の組成物。
J3.一本鎖ループが、切断部位を含む、実施形態J1またはJ2の組成物。
J4.切断部位が、1つまたは複数のRNAヌクレオチドを含む、実施形態J3の組成物。
J5.ループが、2つのRNAヌクレオチドを含む、実施形態J4の組成物。
J6.ループが、3つのRNAヌクレオチドを含む、実施形態J4の組成物。
J7.ループが、4つのRNAヌクレオチドを含む、実施形態J4の組成物。
J8.ループが、アデニン(A)、シトシン(C)、グアニン(G)およびウラシル(U)から選択される1つまたは複数のリボ核酸(RNA)ヌクレオチドを含む、実施形態J4〜J7のいずれか1つの組成物。
J9.RNAヌクレオチドが、グアニン(G)を含む、実施形態J4〜J8のいずれか1つの組成物。
J10.RNAヌクレオチドが、グアニン(G)からなる、実施形態J4〜J8のいずれか1つの組成物。
J11.RNAヌクレオチドが、シトシン(C)を含む、実施形態J4〜J8のいずれか1つの組成物。
J12.RNAヌクレオチドが、シトシン(C)からなる、実施形態J4〜J8のいずれか1つの組成物。
J13.RNAヌクレオチドが、アデニン(A)を含む、実施形態J4〜J8のいずれか1つの組成物。
J14.RNAヌクレオチドが、アデニン(A)からなる、実施形態J4〜J8のいずれか1つの組成物。
J15.RNAヌクレオチドが、アデニン(A)、シトシン(C)およびグアニン(G)からなる、実施形態J4〜J8のいずれか1つの組成物。
J16.RNAヌクレオチドが、アデニン(A)およびシトシン(C)からなる、実施形態J4〜J8のいずれか1つの組成物。
J17.RNAヌクレオチドが、アデニン(A)およびグアニン(G)からなる、実施形態J4〜J8のいずれか1つの組成物。
J18.RNAヌクレオチドが、シトシン(C)およびグアニン(G)からなる、実施形態J4〜J8のいずれか1つの組成物。
J19.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態J1〜J18のいずれか1つの組成物。
J20.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態J1〜J19のいずれか1つの組成物。
J21.オーバーハングを含むオリゴヌクレオチドが、一本鎖ループ、二重鎖部分、および一本鎖オーバーハングを含む、実施形態J1〜J20のいずれか1つの組成物。
J22.オーバーハングを含むオリゴヌクレオチドが、第1の末端にオーバーハングを含み、二重鎖部分を含み、第2の末端に2本の非相補鎖を含む、実施形態J1〜J21のいずれか1つの組成物。
J23.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態J1〜J22のいずれか1つの組成物。
J24.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態J1〜J23のいずれか1つの組成物。
J25.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態J24の組成物。
J26.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態J25の組成物。
J27.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態J24、J25またはJ26の組成物。
J28.オーバーハングを含まないオリゴヌクレオチドが、一本鎖ループおよび二重鎖部分を含む、実施形態J1〜J27のいずれか1つの組成物。
J29.オーバーハングを含まないオリゴヌクレオチドが、平滑末端化された第1の末端を含み、二重鎖部分を含み、第2の末端に2本の非相補鎖を含む、実施形態J1〜J27のいずれか1つの組成物。
J30.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態J1〜J29のいずれか1つの組成物。
J31.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態J1〜J30のいずれか1つの組成物。
J32.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態J1〜J31のいずれか1つの組成物。
J33.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドを含む、実施形態J1〜J32のいずれか1つの組成物。
J34.オリゴヌクレオチドオーバーハングが、DNAヌクレオチドからなる、実施形態J1〜J32のいずれか1つの組成物。
J35.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドを含む、実施形態J1〜J32のいずれか1つの組成物。
J36.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態J1〜J32のいずれか1つの組成物。
K1.実施形態B1〜B32のいずれか1つの組成物と、
組成物を使用して核酸ライブラリーを生成するための使用説明書と
を含む、キット。
K2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態K1のキット。
K3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態K1またはK2のキット。
K4.リガーゼ活性を有する薬剤をさらに含む、実施形態K1〜K3のいずれか1つのキット。
K5.1つまたは複数の切断作用因子をさらに含む、実施形態K1〜K4のいずれか1つのキット。
K6.1つまたは複数の切断作用因子が、リボヌクレアーゼ(RNAse)を含む、実施形態K5のキット。
K7.RNAseが、エンドリボヌクレアーゼである、実施形態K6のキット。
L1.実施形態D1〜D23のいずれか1つの組成物と、
組成物を使用して核酸末端を修飾するための使用説明書と
を含む、キット。
L2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態L1のキット。
L3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態L1またはL2のキット。
L4.リガーゼ活性を有する薬剤をさらに含む、実施形態L1〜L3のいずれか1つのキット。
L5.1つまたは複数の切断作用因子をさらに含む、実施形態L1〜L4のいずれか1つのキット。
L6.1つまたは複数の切断作用因子が、エンドヌクレアーゼを含む、実施形態L1〜L5のいずれか1つのキット。
L7.1つまたは複数の切断作用因子が、DNAグリコシラーゼを含む、実施形態L1〜L5のいずれか1つのキット。
L8.1つまたは複数の切断作用因子が、エンドヌクレアーゼおよびDNAグリコシラーゼを含む、実施形態L1〜L7のいずれか1つのキット。
L9.1つまたは複数の切断作用因子が、ウラシルDNAグリコシラーゼ(UDG)とエンドヌクレアーゼVIIIの混合物を含む、実施形態L8のキット。
L10.鎖置換ポリメラーゼをさらに含む、実施形態L1〜L9のいずれか1つのキット。
L11.修飾ヌクレオチドをさらに含む、実施形態L1〜L10のいずれか1つのキット。
L12.修飾ヌクレオチドが、結合対の第1のメンバーにコンジュゲートされたヌクレオチドを含む、実施形態L11のキット。
L13.修飾ヌクレオチドが、ビオチンにコンジュゲートされたヌクレオチドを含む、実施形態L11またはL12のキット。
L14.固体支持体にコンジュゲートされた結合対の第2のメンバーをさらに含む、実施形態L12またはL13のキット。
L15.結合対の第2のメンバーが、ストレプトアビジンである、実施形態L14のキット。
M1.実施形態F1〜F33のいずれか1つの組成物と、
組成物を使用して核酸末端を修飾するための使用説明書と
を含む、キット。
M2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態M1のキット。
M3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態M1またはM2のキット。
M4.リガーゼ活性を有する薬剤をさらに含む、実施形態M1〜M3のいずれか1つのキット。
M5.鎖置換ポリメラーゼをさらに含む、実施形態M1〜M4のいずれか1つのキット。
N1.実施形態H1〜H25のいずれか1つの組成物と、
組成物を使用して核酸末端を修飾するための使用説明書と
を含む、キット。
N2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態N1のキット。
N3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態N1またはN2のキット。
N4.リガーゼ活性を有する薬剤をさらに含む、実施形態N1〜N3のいずれか1つのキット。
N5.エキソヌクレアーゼをさらに含む、実施形態N1〜N4のいずれか1つのキット。
N6.せん断剤をさらに含む、実施形態N1〜N5のいずれか1つのキット。
N7.固体支持体にコンジュゲートされた結合対のメンバーをさらに含む、実施形態N1〜N6のいずれか1つのキット。
N8.結合対のメンバーが、ストレプトアビジンである、実施形態N7のキット。
O1.実施形態J1〜J36のいずれか1つの組成物と、
組成物を使用して核酸末端を修飾するための使用説明書と
を含む、キット。
O2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態O1のキット。
O3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態O1またはO2のキット。
O4.リガーゼ活性を有する薬剤をさらに含む、実施形態O1〜O3のいずれか1つのキット。
O5.鎖置換ポリメラーゼをさらに含む、実施形態O1〜O4のいずれか1つのキット。
O6.1つまたは複数の切断作用因子をさらに含む、実施形態O1〜O5のいずれか1つのキット。
O7.1つまたは複数の切断作用因子が、リボヌクレアーゼ(RNAse)を含む、実施形態O6のキット。
O8.RNAseが、エンドリボヌクレアーゼである、実施形態O7のキット。
P1.核酸の集団をアッセイする方法であって、
試料中の核酸の集団の核酸オーバーハングをアッセイするステップであって、それによって集団のオーバーハングプロファイルを生成するステップと;
オーバーハングプロファイルに基づいて、試料の1つまたは複数の特性を判定するステップと
を含む方法。
P2.アッセイするステップが、オリゴヌクレオチドを核酸の集団に接触させることを含む、実施形態P1の方法。
P2.1 オリゴヌクレオチドの一部またはすべてが、核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有する、実施形態P2の方法。
P3.オリゴヌクレオチドが、オーバーハング識別配列を含む、実施形態P2またはP2.1の方法。
P3.1 各オーバーハング識別配列が、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態P3の方法。
P3.2 オリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含む、実施形態P2〜P3.1のいずれか1つの方法。
P3.3.オリゴヌクレオチドの一部またはすべてが、一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態P2〜P3.1のいずれか1つの方法。
P4.試料の1つまたは複数の特性が、病状を含む、実施形態P1〜P3.3のいずれか1つの方法。
P5.病状が、がん型またはがんの病期を含む、実施形態P4の方法。
P5.1 がん型が、消化管がんである、実施形態P5の方法。
P6.病状が、細胞死の率または様式の変化を含む、実施形態P4の方法。
P7.変化が、特定の細胞型または臓器の種類に関連する、実施形態P6の方法。
P8.試料の1つまたは複数の特性が、マイクロバイオームプロファイルを含む、実施形態P1〜P3.3のいずれか1つの方法。
P9.試料の1つまたは複数の特性が、放射線曝露を含む、実施形態P1〜P3.3のいずれか1つの方法。
P10.試料の1つまたは複数の特性が、ヌクレアーゼ活性を含む、実施形態P1〜P3.3のいずれか1つの方法。
P11.ヌクレアーゼ活性が、核酸誘導ヌクレアーゼ活性を含む、実施形態P10の方法。
P12.核酸誘導ヌクレアーゼ活性が、CRISPR/Casシステムタンパク質活性を含む、実施形態P11の方法。
P13.試料の1つまたは複数の特性が、トポイソメラーゼ活性を含む、実施形態P1〜P3.3のいずれか1つの方法。
P14.アッセイするステップの前に、酵素活性を阻害するステップをさらに含む、実施形態P1〜P13のいずれか1つの方法。
P15.酵素活性が、ヌクレアーゼ活性を含む、実施形態P14の方法。
P16.アッセイするステップが、ハイブリダイゼーションを含み、それによってハイブリダイゼーション産物を生成する、実施形態P1〜P15のいずれか1つの方法。
P17.アッセイするステップが、ハイブリダイゼーション産物またはそれらの増幅産物をシーケンシングプロセスによりシーケンシングすることによって、配列リードを生成することを含む、実施形態P1〜P16のいずれか1つの方法。
P18.配列リードが、フォワード配列リードおよびリバース配列リードを含む、実施形態P17の方法。
P19.配列リードを定量化することによって配列リード定量化をもたらすステップであって、リバース配列リードが定量化され、フォワード配列リードが定量化から除外される、ステップを含む、実施形態P18の方法。
P20.オーバーハングプロファイルが、リバース配列リードに従って生成される、実施形態P18またはP19の方法。
P21.リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析することによって解析を生成するステップを含む、実施形態P18の方法。
P22.フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除するステップを含む、実施形態P21の方法。
P23.フォワード配列リードおよびリバース配列リードについてのオーバーハングがないことを示すオーバーハング識別配列に関連するオーバーハング情報を解析するステップを含む、実施形態P21またはP22の方法。
P24.オーバーハングプロファイルが、1つまたは複数のオーバーハング特徴を含む、実施形態P1〜P23のいずれか1つの方法。
P25.1つまたは複数のオーバーハング特徴が、オーバーハング長、オーバーハングのタイプ、ジヌクレオチドカウント、トリヌクレオチドカウント、テトラヌクレオチドカウント、ジヌクレオチドパーセント、トリヌクレオチドパーセント、テトラヌクレオチドパーセント、GC含有量、オーバーハングパーセント、オーバーハングカウント、オーバーハング長パーセント、およびゲノム座標のうちの1つまたは複数から選択される、実施形態P24の方法。
P26.1つまたは複数のオーバーハング特徴が、特定のジヌクレオチドの存在を含む、実施形態P24の方法。
P27.1つまたは複数のオーバーハング特徴が、CGジヌクレオチドの存在を含む、実施形態P26の方法。
P28.オーバーハングプロファイルを参照オーバーハングプロファイルと比較するステップをさらに含む、実施形態P1〜P27のいずれか1つの方法。
P29.オーバーハングプロファイルを第2の試料の第2のオーバーハングプロファイルと比較するステップであって、第2の試料が、異なる時点での試料と同じ供給元からのものである、ステップをさらに含む、実施形態P1〜P27のいずれか1つの方法。
P30.1つまたは複数のステップが、マイクロプロセッサーにより行われる、実施形態P1〜P29のいずれか1つの方法。
P31.実施形態A1〜A68、C1〜C68、E1〜E64、G1〜G56、I1〜I76、Q1〜Q42、T1〜T58、およびW1〜W59のいずれか1つについての1つまたは複数の特徴を含む、実施形態P1〜P29のいずれか1つの方法。
Q1.核酸末端を修飾する方法であって、
標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップを含み、
(a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、RNAヌクレオチドを含む少なくとも1つのオーバーハングを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
(b)標的核酸の一部またはすべてが、オーバーハングを含み、
(c)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
(d)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、
方法。
Q2.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態Q1の方法。
Q3.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態Q1またはQ2の方法。
Q4.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態Q1〜Q3のいずれか1つの方法。
Q5.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態Q1〜Q4のいずれか1つの方法。
Q6.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態Q1〜Q5のいずれか1つの方法。
Q7.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態Q6の方法。
Q8.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態Q7の方法。
Q9.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態Q6、Q7またはQ8の方法。
Q10.オリゴヌクレオチドの末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態Q1〜Q9のいずれか1つの方法。
Q11.オリゴヌクレオチド鎖の3’末端が、ハイブリダイゼーション産物においてオリゴヌクレオチドがハイブリダイズされる標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態Q10の方法。
Q12.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態Q1〜Q11のいずれか1つの方法。
Q13.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態Q1〜Q12のいずれか1つの方法。
Q14.標的核酸の一部が、オーバーハングを含まない、実施形態Q1〜Q13のいずれか1つの方法。
Q15.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態Q1〜Q14のいずれか1つの方法。
Q16.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態Q1〜Q15のいずれか1つの方法。
Q17.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態Q1〜Q16のいずれか1つの方法。
Q18.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態Q1〜Q17のいずれか1つの方法。
Q19.標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態Q1〜Q18のいずれか1つの方法。
Q20.DNA断片が、細胞から得られる、実施形態Q19の方法。
Q21.DNA断片が、ゲノムDNA断片を含む、実施形態Q19またはQ20の方法。
Q22.標的核酸が、リボ核酸(RNA)断片を含む、実施形態Q1〜Q18のいずれか1つの方法。
Q23.RNA断片が、細胞から得られる、実施形態Q22の方法。
Q24.標的核酸が、無細胞核酸断片を含む、実施形態Q1〜Q23のいずれか1つの方法。
Q25.標的核酸が、循環無細胞核酸断片を含む、実施形態Q1〜Q24のいずれか1つの方法。
Q26.標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態Q1〜Q25のいずれか1つの方法。
Q27.標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態Q1〜Q26のいずれか1つの方法。
Q28.標的核酸が、複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、実施形態Q1〜Q27のいずれか1つの方法。
Q29.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態Q1〜Q28のいずれか1つの方法。
Q30.標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む、実施形態Q1〜Q29のいずれか1つの方法。
Q31.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態Q30の方法。
Q32.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、ハイブリダイゼーション産物とRNAリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態Q30の方法。
Q33.結合させるステップの前に、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態Q1〜Q32のいずれか1つの方法。
Q34.結合させるステップの前に、脱リン酸化された標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態Q33の方法。
Q35.結合させるステップの前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態Q1〜Q34のいずれか1つの方法。
Q36.結合させるステップの前に、脱リン酸化されたオリゴヌクレオチド種とホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む、実施形態Q35の方法。
Q37.標的核酸が、対象からの試料から得られる、実施形態Q1〜Q36のいずれか1つの方法。
Q38.対象がヒトである、実施形態Q37の方法。
Q39.結合させるステップの前に、標的核酸を断片長に従って分離するステップを含む、実施形態Q1〜Q38のいずれか1つの方法。
Q40.約500bp未満の断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態Q39の方法。
Q41.約500bpのまたはそれより長い断片長を有する標的核酸が、複数のオリゴヌクレオチド種と結合される、実施形態Q39の方法。
Q42.ハイブリダイゼーション産物とRNAse活性を有する薬剤とを、二本鎖RNA二重鎖が消化される条件下で接触させるステップを含む、実施形態Q1〜Q41のいずれか1つの方法。
R1.複数のオリゴヌクレオチド種を含む組成物であって、
(a)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、RNAヌクレオチドを含む少なくとも1つのオーバーハングを含み、オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;
(b)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含む、
組成物。
R2.オリゴヌクレオチドオーバーハングが、RNAヌクレオチドからなる、実施形態R1の組成物。
R3.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態R1またはR2の組成物。
R4.複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態R1〜R3のいずれか1つの組成物。
R5.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態R1〜R4のいずれか1つの組成物。
R6.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態R1〜R5のいずれか1つの組成物。
R7.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態R6の組成物。
R8.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態R7の組成物。
R9.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態R6、R7またはR8の組成物。
R10.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態R1〜R9のいずれか1つの組成物。
R11.オリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態R1〜R10のいずれか1つの組成物。
R12.オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態R1〜R11のいずれか1つの組成物。
S1.実施形態R1〜R12のいずれか1つの組成物と、
組成物を使用して核酸末端を修飾するための使用説明書と
を含む、キット。
S2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態S1のキット。
S3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態S1またはS2のキット。
S4.リガーゼ活性を有する薬剤をさらに含む、実施形態S1〜S3のいずれか1つのキット。
S5.RNAリガーゼ活性を有する薬剤をさらに含む、実施形態S1〜S4のいずれか1つのキット。
S6.鎖置換ポリメラーゼをさらに含む、実施形態S1〜S5のいずれか1つのキット。
S7.1つまたは複数の切断作用因子をさらに含む、実施形態S1〜S6のいずれか1つのキット。
S8.1つまたは複数の切断作用因子が、リボヌクレアーゼ(RNAse)を含む、実施形態S7のキット。
S9.RNAseが、エンドリボヌクレアーゼである、実施形態S8のキット。
S10.RNAseが、RNAse IIIである、実施形態S8またはS9のキット。
T1.核酸ライブラリーを生成する方法であって、
a)標的核酸を含む核酸組成物とオリゴヌクレオチド種の第1のプールとを結合させるステップであって、
i)標的核酸の一部またはすべてがオーバーハングを含み、
ii)オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
iii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
iv)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含み、
v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物とオリゴヌクレオチド種の第1のプールが結合し、それによって結合産物の第1のセットが形成される、ステップと;
b)結合産物の第1のセットを切断することによって、切断産物を形成するステップと;
c)切断産物とオリゴヌクレオチド種の第2のプールとを結合させるステップであって、
i)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第1の末端および第2の末端を含み、
ii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第2のプライマー結合ドメインを含み、第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なり、
iii)オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、第1の末端において、切断産物の少なくとも1つの末端に結合する条件下で、切断産物とオリゴヌクレオチド種の第2のプールが結合し、それによって結合産物の第2のセットが形成される、ステップと
を含む方法。
T1.1 d)増幅条件下で、結合産物の第2のセットと2つまたはそれより多くの増幅プライマー種とを接触させることによって、増幅産物を生成するステップであって、第1のプライマー種が、第1のプライマー結合ドメインに相補的なヌクレオチド配列を含み、第2のプライマー結合ドメインが、第2のプライマー結合ドメインに相補的なヌクレオチド配列を含む、ステップ
をさらに含む、実施形態T1の方法。
T2.標的核酸が、500bpより大きい核酸断片を含む、実施形態T1またはT1.1の方法。
T3.標的核酸が、1000bpより大きい核酸断片を含む、実施形態T1またはT1.1の方法。
T4.(b)が、結合産物の第1のセットと、結合産物を切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることを含む、実施形態T1〜T3のいずれか1つの方法。
T5.(b)が、機械的せん断を含む、実施形態T1〜T3のいずれか1つの方法。
T6.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態T1〜T5のいずれか1つの方法。
T7.1つまたは複数の修飾ヌクレオチドが、プール内の他のオリゴヌクレオチドへの結合を遮断することができる、実施形態T6の方法。
T8.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドの一部またはすべてが、第2の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態T1〜T7のいずれか1つの方法。
T9.1つまたは複数の修飾ヌクレオチドが、切断産物へのオリゴヌクレオチドの第2の末端の結合を遮断することができる、実施形態T8の方法。
T10.増幅産物をシーケンシングプロセスによりシーケンシングするステップをさらに含む、実施形態T1〜T9のいずれか1つの方法。
T11.シーケンシングプロセスが、短い配列リードを生成する、実施形態T10の方法。
T12.オリゴヌクレオチド種の第1のプールが、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態T1〜T11のいずれか1つの方法。
T13.オリゴヌクレオチド種の第1のプールが、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態T1〜T12のいずれか1つの方法。
T14.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分および一本鎖オーバーハングを含む、実施形態T12またはT13の方法。
T15.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態T12〜T14のいずれか1つの方法。
T16.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態T1〜T15のいずれか1つの方法。
T17.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態T16の方法。
T18.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態T17の方法。
T19.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態T16、T17またはT18の方法。
T20.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの末端が、結合産物の第1のセットにおいてオリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態T1〜T19のいずれか1つの方法。
T21.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチド鎖の3’末端が、結合産物の第1のセットにおいてオリゴヌクレオチドがハイブリダイズされる標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態T20の方法。
T22.(b)の後に切断産物の末端を修復するステップを含む、実施形態T1〜T21のいずれか1つの方法。
T23.(b)の後に切断産物の末端に1つまたは複数の不対合ヌクレオチドを付加させるステップを含む、実施形態T1〜T22のいずれか1つの方法。
T24.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、切断産物に付加された1つまたは複数のヌクレオチドに相補的である1つまたは複数のヌクレオチドを第1の末端に含む、実施形態T23の方法。
T25.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、第1の末端において、切断産物の少なくとも1つの末端とハイブリダイズする、実施形態T24の方法。
T26.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドの末端が、結合産物の第2のセットにおいてオリゴヌクレオチドが結合される切断産物の末端に共有結合で連結され得る、実施形態T1〜T25のいずれか1つの方法。
T27.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチド鎖の3’末端が、結合産物の第2のセットにおいてオリゴヌクレオチドが結合される切断産物の鎖の5’末端に共有結合で連結され得る、実施形態T26の方法。
T28.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、ネイティブ標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含まない、実施形態T1〜T27のいずれか1つの方法。
T28.1 オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、オリゴヌクレオチドオーバーハング識別配列を含まない、実施形態T1〜T28のいずれか1つの方法。
T29.オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチド上のオリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態T1〜T28.1のいずれか1つの方法。
T30.オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチド上のオリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態T1〜T29のいずれか1つの方法。
T31.標的核酸の一部が、オーバーハングを含まない、実施形態T1〜T30のいずれか1つの方法。
T32.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態T1〜T31のいずれか1つの方法。
T33.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態T1〜T32のいずれか1つの方法。
T34.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態T1〜T33のいずれか1つの方法。
T35.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態T1〜T34のいずれか1つの方法。
T36.標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態T1〜T35のいずれか1つの方法。
T37.DNA断片が、細胞から得られる、実施形態T36の方法。
T38.DNA断片が、ゲノムDNA断片を含む、実施形態T36またはT37の方法。
T39.標的核酸が、リボ核酸(RNA)断片を含む、実施形態T1〜T35のいずれか1つの方法。
T40.RNA断片が、細胞から得られる、実施形態T39の方法。
T41.標的核酸が、無細胞核酸断片を含む、実施形態T1〜T40のいずれか1つの方法。
T42.標的核酸が、循環無細胞核酸断片を含む、実施形態T1〜T41のいずれか1つの方法。
T43.標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態T1〜T42のいずれか1つの方法。
T44.標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態T1〜T43のいずれか1つの方法。
T45.標的核酸が、複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、実施形態T1〜T44のいずれか1つの方法。
T46.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態T1〜T45のいずれか1つの方法。
T47.標的核酸の末端が、それがハイブリダイズされるオリゴヌクレオチドの末端に結合される条件に、結合産物の第1のセットを曝露するステップを含む、実施形態T1〜T46のいずれか1つの方法。
T48.標的核酸の末端が、標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、結合産物の第1のセットとリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態T47の方法。
T49.切断産物の末端が、それが結合されるオリゴヌクレオチドの末端に結合される条件に、結合産物の第2のセットを曝露するステップを含む、実施形態T1〜T48のいずれか1つの方法。
T50.切断産物の末端が、標的核酸が結合されるオリゴヌクレオチドの末端に共有結合で連結される条件下で、結合産物の第2のセットとリガーゼ活性を有する薬剤とを接触させるステップを含む、実施形態T49の方法。
T51.(a)の前に、標的核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態T1〜T50のいずれか1つの方法。
T52.(a)の前に、脱リン酸化された標的核酸組成物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態T51の方法。
T53.(a)の前に、オリゴヌクレオチド種の第1のプールとホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、脱リン酸化されたオリゴヌクレオチド種の第1のプールを生成するステップを含む、実施形態T1〜T52のいずれか1つの方法。
T54.(c)の前に、オリゴヌクレオチド種の第2のプールとホスホリル転移活性を有する薬剤とを、5’リン酸が第1の末端におけるオリゴヌクレオチド種の5’末端に付加される条件下で接触させるステップを含む、実施形態T1〜T53のいずれか1つの方法。
T55.標的核酸が、対象からの試料から得られる、実施形態T1〜T54のいずれか1つの方法。
T56.対象がヒトである、実施形態T55の方法。
T57.(a)の前に、標的核酸を断片長に従って分離するステップを含む、実施形態T1〜T56のいずれか1つの方法。
T58.標的核酸が、(a)の前に長さによって分離されない、実施形態T1〜T56のいずれか1つの方法。
U1.a)オリゴヌクレオチド種の第1のプールであって、
i)オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
ii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
iii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含む、第1のプールと;
b)オリゴヌクレオチド種の第2のプールであって、
i)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第1の末端および第2の末端を含み、
ii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第2のプライマー結合ドメインを含む、第2のプールと
を含み;第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なる、組成物。
U2.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態U1の組成物。
U3.1つまたは複数の修飾ヌクレオチドが、プール内の他のオリゴヌクレオチドへの結合を遮断することができる、実施形態U2の組成物。
U4.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドの一部またはすべてが、第2の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態U1〜U3のいずれか1つの組成物。
U5.1つまたは複数の修飾ヌクレオチドが、切断された標的核酸へのオリゴヌクレオチドの第2の末端の結合を遮断することができる、実施形態U4の組成物。
U6.オリゴヌクレオチド種の第1のプールが、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態U1〜U5のいずれか1つの組成物。
U7.オリゴヌクレオチド種の第1のプールが、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態U1〜U6のいずれか1つの組成物。
U8.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分および一本鎖オーバーハングを含む、実施形態T12またはT13の組成物。
U9.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態U6〜U8のいずれか1つの組成物。
U10.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態U1〜U9のいずれか1つの組成物。
U11.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態U10の組成物。
U12.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態U11の組成物。
U13.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態U10、U11またはU12の組成物。
U14.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、第1の末端に1つまたは複数の不対合ヌクレオチドを含む、実施形態U1〜U13のいずれか1つの組成物。
U15.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、ネイティブ標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含まない、実施形態U1〜U14のいずれか1つの組成物。
U15.1 オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、オリゴヌクレオチドオーバーハング識別配列を含まない、実施形態U1〜U15のいずれか1つの組成物。
U16.オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチド上のオリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態U1〜U15.1のいずれか1つの組成物。
U17.オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチド上のオリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態U1〜U16のいずれか1つの組成物。
U18.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態U1〜U17のいずれか1つの組成物。
V1.実施形態U1〜U18のいずれか1つの組成物と、
組成物を使用して核酸ライブラリーを生成するための使用説明書と
を含む、キット。
V2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態V1のキット。
V3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態V1またはV2のキット。
V4.リガーゼ活性を有する薬剤をさらに含む、実施形態V1〜V3のいずれか1つのキット。
V5.切断活性を有する薬剤をさらに含む、実施形態V1〜V4のいずれか1つのキット。
V6.ポリメラーゼ活性を有する薬剤をさらに含む、実施形態V1〜V5のいずれか1つのキット。
V7.第1の増幅プライマー種および第2の増幅プライマー種をさらに含み、第1のプライマー種が、第1のプライマー結合ドメインに相補的なヌクレオチド配列を含み、第2のプライマー種が、第2のプライマー結合ドメインに相補的なヌクレオチド配列を含む、実施形態V1〜V6のいずれか1つのキット。
V8.核酸増幅を行うための1つまたは複数の薬剤をさらに含む、実施形態V1〜V7のいずれか1つのキット。
W1.核酸ライブラリーを生成する方法であって、
a)標的核酸を含む核酸組成物とオリゴヌクレオチド種の第1のプールとを結合させるステップであって、
i)前記標的核酸の一部またはすべてがオーバーハングを含み、
ii)オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを第1の末端に含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
iii)オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチドが、前記オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
iv)オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含み、
v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、前記核酸組成物とオリゴヌクレオチド種の前記第1のプールが結合し、それによって結合産物の第1のセットが形成される、ステップと;
b)結合産物の前記第1のセットを切断することによって、切断産物を形成するステップと;
c)前記切断産物とオリゴヌクレオチド種の第2のプールとを結合させるステップであって、
i)オリゴヌクレオチド種の前記第2のプール内の各オリゴヌクレオチドが、第1の鎖および第2の鎖を含み、前記第1の鎖が、前記第2の鎖より短く、前記第1の鎖と前記第2の鎖が、前記オリゴヌクレオチドの第1の末端において相補的であり、前記第2の鎖が、前記オリゴヌクレオチドの第2の末端における一本鎖を含み、
ii)オリゴヌクレオチド種の前記第2のプール内の各オリゴヌクレオチドが、オリゴヌクレオチド種の前記第2のプールに特異的なオリゴヌクレオチド識別配列を含み、
iii)オリゴヌクレオチド種の前記第2のプール内の各オリゴヌクレオチドが、前記第2の鎖上に第2のプライマー結合ドメインを含み、前記第1のプライマー結合ドメインと前記第2のプライマー結合ドメインが異なり、
iv)オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、前記切断産物の少なくとも一方の末端に結合する条件下で、前記切断産物とオリゴヌクレオチド種の前記第2のプールが結合し、それによって結合産物の第2のセットが形成される、ステップと
を含む方法。
W1.1.d)増幅条件下で、結合産物の前記第2のセットと2つまたはそれより多くの増幅プライマー種とを接触させることによって、増幅産物を生成するステップであって、第1のプライマー種が、前記第1のプライマー結合ドメインに相補的なヌクレオチド配列を含み、第2のプライマー種が、前記第2のプライマー結合ドメインに相補的なヌクレオチド配列を含む、ステップ
をさらに含む、実施形態W1の方法。
W2.前記標的核酸が、500bpより大きい核酸断片を含む、実施形態W1またはW1.1の方法。
W3.前記標的核酸が、1000bpより大きい核酸断片を含む、実施形態W1またはW1.1の方法。
W4.(b)が、結合産物の前記第1のセットと、前記結合産物を切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることを含む、実施形態W1〜W3のいずれか1つの方法。
W5.(b)が、機械的せん断を含む、実施形態W1〜W3のいずれか1つの方法。
W6.オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドの一部またはすべてが、第2の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態W1〜W5のいずれか1つの方法。
W7.前記1つまたは複数の修飾ヌクレオチドが、標的核酸への前記オリゴヌクレオチドの前記第2の末端の結合を遮断することができる、実施形態W6の方法。
W8.オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドの一部またはすべてが、前記第2の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態W1〜W7のいずれか1つの方法。
W9.前記1つまたは複数の修飾ヌクレオチドが、前記切断産物への前記オリゴヌクレオチドの前記第2の末端の結合を遮断することができる、実施形態W8の方法。
W10.前記増幅産物をシーケンシングプロセスによりシーケンシングするステップをさらに含む、実施形態W1〜W9のいずれか1つの方法。
W11.前記シーケンシングプロセスが、短い配列リードを生成する、実施形態W10の方法。
W12.オリゴヌクレオチド種の前記第1のプールが、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態W1〜W11のいずれか1つの方法。
W13.オリゴヌクレオチド種の前記第1のプールが、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態W1〜W12のいずれか1つの方法。
W14.オーバーハングを含む前記オリゴヌクレオチドが、二重鎖部分および一本鎖オーバーハングを含む、実施形態W12またはW13の方法。
W15.オーバーハングを含む前記オリゴヌクレオチドが、(1)2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態W12〜W14のいずれか1つの方法。
W16.前記オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態W12〜W15のいずれか1つの方法。
W17.オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態W1〜W16のいずれか1つの方法。
W18.オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態W17の方法。
W19.オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態W18の方法。
W20.前記オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態W17、W18またはW19の方法。
W21.オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドの末端が、結合産物の前記第1のセットにおいて前記オリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、実施形態W1〜W20のいずれか1つの方法。
W22.オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチド鎖の3’末端が、結合産物の前記第1のセットにおいて前記オリゴヌクレオチドがハイブリダイズされる前記標的核酸の鎖の5’末端に共有結合で連結され得る、実施形態W21の方法。
W23.(b)の後に前記切断産物の末端を修復するステップを含む、実施形態W1〜W22のいずれか1つの方法。
W24.(b)の後に前記切断産物の前記末端に1つまたは複数の不対合ヌクレオチドを付加させるステップを含む、実施形態W1〜W23のいずれか1つの方法。
W25.オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、前記切断産物に付加された前記1つまたは複数のヌクレオチドに相補的である1つまたは複数のヌクレオチドを前記第1の末端に含む、実施形態W24の方法。
W26.オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、前記第1の末端において、前記切断産物の少なくとも一方の末端とハイブリダイズする、実施形態W25の方法。
W27.オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドの末端が、結合産物の前記第2のセットにおいて前記オリゴヌクレオチドが結合される切断産物の末端に共有結合で連結され得る、実施形態W1〜W26のいずれか1つの方法。
W28.オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチド鎖の3’末端が、結合産物の前記第2のセットにおいて前記オリゴヌクレオチドが結合される前記切断産物の鎖の5’末端に共有結合で連結され得る、実施形態W27の方法。
W29.オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、ネイティブ標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含まない、実施形態W1〜W28のいずれか1つの方法。
W29.1.オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、オリゴヌクレオチドオーバーハング識別配列を含まない、実施形態W1〜W29のいずれか1つの方法。
W30.オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチド上の前記オリゴヌクレオチドオーバーハング識別配列が、前記オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態W1〜W29.1のいずれか1つの方法。
W31.オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチド上の前記オリゴヌクレオチドオーバーハング識別配列が、前記オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態W1〜W30のいずれか1つの方法。
W32.前記標的核酸の一部が、オーバーハングを含まない、実施形態W1〜W31のいずれか1つの方法。
W33.オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態W1〜W32のいずれか1つの方法。
W34.オーバーハングを含む前記標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態W1〜W33のいずれか1つの方法。
W35.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態W1〜W34のいずれか1つの方法。
W36.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態W1〜W35のいずれか1つの方法。
W37.前記標的核酸が、デオキシリボ核酸(DNA)断片を含む、実施形態W1〜W36のいずれか1つの方法。
W38.前記DNA断片が、細胞から得られる、実施形態W37の方法。
W39.前記DNA断片が、ゲノムDNA断片を含む、実施形態W37またはW38の方法。
W40.前記標的標的核酸が、リボ核酸(RNA)断片を含む、実施形態W1〜W36のいずれか1つの方法。
W41.前記RNA断片が、細胞から得られる、実施形態W40の方法。
W42.前記標的核酸が、無細胞核酸断片を含む、実施形態W1〜W41のいずれか1つの方法。
W43.前記標的核酸が、循環無細胞核酸断片を含む、実施形態W1〜W42のいずれか1つの方法。
W44.標的核酸の前記オーバーハングが、ネイティブオーバーハングである、実施形態W1〜W43のいずれか1つの方法。
W45.標的核酸中の前記オーバーハングが、未修飾オーバーハングである、実施形態W1〜W44のいずれか1つ方法。
W46.前記標的核酸が、前記複数のオリゴヌクレオチド種と結合させるステップの前に、長さについて修飾されない、実施形態W1〜W45のいずれか1つの方法。
W47.試料から核酸を単離することによって核酸組成物を生成することから本質的になるプロセスにより核酸組成物を調製するステップを(a)の前に含む、実施形態W1〜W46のいずれか1つの方法。
W48.前記標的核酸の末端が、それがハイブリダイズされる前記オリゴヌクレオチドの末端に結合される条件に、結合産物の前記第1のセットを曝露するステップを含む、実施形態W1〜W47のいずれか1つの方法。
W49.標的核酸の末端が、前記標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、結合産物の前記第1のセットとリガーゼ活性を有する作用因子とを接触させるステップを含む、実施形態W48の方法。
W50.前記切断産物の末端が、それが結合される前記オリゴヌクレオチドの末端に結合される条件に、結合産物の前記第2のセットを曝露するステップを含む、実施形態W1〜W49のいずれか1つの方法。
W51.切断産物の末端が、前記標的核酸が結合される前記オリゴヌクレオチドの末端に共有結合で連結される条件下で、結合産物の前記第2のセットとリガーゼ活性を有する作用因子とを接触させるステップを含む、実施形態W50の方法。
W52.(a)の前に、前記標的核酸組成物とホスファターゼ活性を有する作用因子とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、実施形態W1〜W51のいずれか1つの方法。
W53.(a)の前に、前記脱リン酸化された標的核酸組成物とホスホリル転移活性を有する作用因子とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態W52の方法。
W54.(a)の前に、オリゴヌクレオチド種の前記第1のプールとホスファターゼ活性を有する作用因子とを、前記オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、脱リン酸化されたオリゴヌクレオチド種の第1のプールを生成するステップを含む、実施形態W1〜W53のいずれか1つの方法。
W55.(c)の前に、オリゴヌクレオチド種の前記第2のプールとホスホリル転移活性を有する作用因子とを、5’リン酸が前記第1の鎖の5’末端に付加される条件下で接触させるステップを含む、実施形態W1〜W54のいずれか1つの方法。
W56.前記標的核酸が、対象からの試料から得られる、実施形態W1〜W55のいずれか1つの方法。
W57.前記対象がヒトである、実施形態W56の方法。
W58.(a)の前に、前記標的核酸を断片長に従って分離するステップを含む、実施形態W1〜W57のいずれか1つの方法。
W59.前記標的核酸が、(a)の前に長さによって分離されない、実施形態W1〜W57のいずれか1つの方法。
X1.a)オリゴヌクレオチド種の第1のプールであって、
i)オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
ii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
iii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含む、第1のプールと;
b)オリゴヌクレオチド種の第2のプールであって、
i)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第1の鎖および第2の鎖を含み、第1の鎖が、第2の鎖より短く、第1の鎖と第2の鎖が、オリゴヌクレオチドの第1の末端において相補的であり、第2の鎖が、オリゴヌクレオチドの第2の末端における一本鎖を含み、
ii)オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチドが、オリゴヌクレオチド種の第2のプールに特異的なオリゴヌクレオチド識別配列を含み、
(iii)オリゴヌクレオチド種の第2のプール内の各オリゴヌクレオチドが、第2の鎖上に第2のプライマー結合ドメインを含む、第2のプールと
を含み;第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なる、組成物。
X2.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドの一部またはすべてが、第2の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態X1の組成物。
X3.1つまたは複数の修飾ヌクレオチドが、標的核酸へのオリゴヌクレオチドの第2の末端の結合を遮断することができる、実施形態X2の組成物。
X4.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドの一部またはすべてが、第2の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態X1〜X3のいずれか1つの組成物。
X5.1つまたは複数の修飾ヌクレオチドが、切断された標的核酸へのオリゴヌクレオチドの第2の末端の結合を遮断することができる、実施形態X4の組成物。
X6.オリゴヌクレオチド種の第1のプールが、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、実施形態X1〜X5のいずれか1つの組成物。
X7.オリゴヌクレオチド種の第1のプールが、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、実施形態X1〜X6のいずれか1つの組成物。
X8.オーバーハングを含むオリゴヌクレオチドが、二重鎖部分および一本鎖オーバーハングを含む、実施形態X6またはX7の組成物。
X9.オーバーハングを含むオリゴヌクレオチドが、(1)2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態X6〜X8のいずれか1つの組成物。
X10.オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、実施形態X6〜X9のいずれか1つの組成物。
X11.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、実施形態X1〜X10のいずれか1つの組成物。
X12.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態X11の組成物。
X13.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、実施形態X12の組成物。
X14.オリゴヌクレオチドオーバーハング配列が、ランダムである、実施形態X11、X12またはX13の組成物。
X15.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、第1の末端に1つまたは複数の不対合ヌクレオチドを含む、実施形態X1〜X14のいずれか1つの組成物。
X16.オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、ネイティブ標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含まない、実施形態X1〜X15のいずれか1つの組成物。
X16.1 オリゴヌクレオチド種の第2のプール内のオリゴヌクレオチドが、オリゴヌクレオチドオーバーハング識別配列を含まない、実施形態X1〜X16のいずれか1つの組成物。
X17.オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチド上のオリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的である、実施形態X1〜X16.1のいずれか1つの組成物。
X18.オリゴヌクレオチド種の第1のプール内の各オリゴヌクレオチド上のオリゴヌクレオチドオーバーハング識別配列が、オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、実施形態X1〜X17のいずれか1つの組成物。
X19.オリゴヌクレオチド種の第1のプール内のオリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、実施形態X1〜X18のいずれか1つの組成物。
Y1.実施形態X1〜X19のいずれか1つの組成物と、
組成物を使用して核酸ライブラリーを生成するための使用説明書と
を含む、キット。
Y2.ホスファターゼ活性を有する薬剤をさらに含む、実施形態Y1のキット。
Y3.ホスホリル転移活性を有する薬剤をさらに含む、実施形態Y1またはY2のキット。
Y4.リガーゼ活性を有する薬剤をさらに含む、実施形態Y1〜Y3のいずれか1つのキット。
Y5.切断活性を有する薬剤をさらに含む、実施形態Y1〜Y4のいずれか1つのキット。
Y6.ポリメラーゼ活性を有する薬剤をさらに含む、実施形態Y1〜Y5のいずれか1つのキット。
Y7.第1の増幅プライマー種および第2の増幅プライマー種をさらに含み、第1のプライマー種が、第1のプライマー結合ドメインに相補的なヌクレオチド配列を含み、第2のプライマー種が、第2のプライマー結合ドメインに相補的なヌクレオチド配列を含む、実施形態Y1〜Y6のいずれか1つのキット。
Y8.核酸増幅を行うための1つまたは複数の薬剤をさらに含む、実施形態Y1〜Y7のいずれか1つのキット。
Z1.核酸ライブラリーを生成する方法であって、
a)標的核酸を含む核酸組成物とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸を生成するステップであって、標的核酸の一部またはすべてが、オーバーハングを含む、ステップと;
b)脱リン酸化された標的核酸と複数のオリゴヌクレオチド種とを結合させるステップであって、
i)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
ii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
iii)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと
を含む方法。
Z2.(b)の前に、脱リン酸化された標的核酸物とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態Z1の方法。
Z3.(b)の前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態Z1またはZ2の方法。
Z4.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含む、実施形態Z1〜Z3のいずれか1つの方法。
Z5.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態Z1〜Z3のいずれか1つの方法。
Z6.ハイブリダイゼーション産物またはそれらの増幅産物をシーケンシングプロセスによりシーケンシングすることによって、配列リードを生成するステップであって、配列リードが、フォワード配列リードおよびリバース配列リードを含むステップを含む、実施形態Z1〜Z5のいずれか1つの方法。
Z7.配列リードを定量化することによって配列リード定量化をもたらすステップであって、リバース配列リードが定量化され、フォワード配列リードが定量化から除外される、ステップを含む、実施形態Z6の方法。
Z8.リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析することによって解析を生成するステップを含む、実施形態Z6の方法。
Z9.フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除するステップを含む、実施形態Z8の方法。
Z10.フォワード配列リードおよびリバース配列リードについてのオーバーハングがないことを示すオーバーハング識別配列に関連するオーバーハング情報を解析するステップを含む、実施形態Z8またはZ9の方法。
Z11.実施形態A1〜A68、C1〜C68、E1〜E64、G1〜G56、I1〜I76、Q1〜Q42、T1〜T58、およびW1〜W59のいずれか1つについての1つまたは複数の特徴を含む、実施形態Z1〜Z10のいずれか1つの方法。
A’1.核酸を解析する方法であって、
a)標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップであって、
i)標的核酸の一部またはすべてがオーバーハングを含み、
ii)複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
iii)複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
iv)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、核酸組成物と複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、ステップと;
b)ハイブリダイゼーション産物またはそれらの増幅産物をシーケンシングプロセスによりシーケンシングすることによって、配列リードを生成するステップであって、配列リードが、フォワード配列リードおよびリバース配列リードを含む、ステップと;
c)リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析することによって解析を生成し、フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析から削除するステップと
を含む方法。
A’2.(c)が、フォワード配列リードおよびリバース配列リードについてのオーバーハングがないことを示すオーバーハング識別配列に関連するオーバーハング情報を解析することを含む、実施形態A’1の方法。
A’3.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含む、実施形態A’1またはA’2の方法。
A’4.複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態A’1またはA’2の方法。
A’5.(a)の前に、標的核酸とホスファターゼ活性を有する薬剤とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸を生成するステップを含む、実施形態A’1〜A’4のいずれか1つの方法。
A’6.脱リン酸化された標的核酸とホスホリル転移活性を有する薬剤とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、実施形態A’5の方法。
A’7.(a)の前に、複数のオリゴヌクレオチド種とホスファターゼ活性を有する薬剤とを、オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、実施形態A’1〜A’6のいずれか1つの方法。
A’8.(c)が、マイクロプロセッサーを使用して行われる、実施形態A’1〜A’7のいずれか1つの方法。
A’9.実施形態A1〜A68、C1〜C68、E1〜E64、G1〜G56、I1〜I76、Q1〜Q42、T1〜T58、およびW1〜W59のいずれか1つについての1つまたは複数の特徴を含む、実施形態A’1〜A’8のいずれか1つの方法。
本明細書で参照される各特許、特許出願、公報および文献の全体が、参照により組み込まれる。上記特許、特許出願、公報および文献の引用は、上述のもののいずれかが関連先行技術であることの承認ではなく、これらの公報および文献の内容または日付についてのいかなる承認にも相当しない。それらの引用は、関連する開示の検索の指示ではない。これらの文献の日付または内容に関するすべての記載は、入手可能な情報に基づくものであり、それらの正確さについて承認するものでも、それらの正当性について承認するものでもない。
本技術の基本態様から逸脱することなく、上述の事物に修飾を加えることができる。本技術を1つまたは複数の特定の実施形態に関してかなり詳細に説明したが、当業者には、本願で具体的に開示される実施形態に変更を加えることができ、それでもこれらの修飾形態および改善形態が、本技術の範囲および趣旨の範囲内であることは、認識されると予想される。
本明細書で例証して説明した本技術は、本明細書で具体的に開示していない、いずれかの要素の非存在下で好適に実施されることがある。したがって、例えば、本明細書での各事例では、用語「含む」、「から本質的になる」、および「からなる」のいずれかを、他の2つの用語のどちらかで置き換えることができる。用いた用語および表現は、説明用語として使用しており、限定用語として使用しておらず、そのような用語および表現の使用は、示されているおよび説明されている特徴またはそれらの部分のいかなる均等物も除外せず、様々な修飾形態が請求項記載の本技術の範囲内で可能である。用語「a」または「an」は、この用語が修飾する要素の1つまたは複数の要素を、要素の1つが記載されているのか、または要素の1つより多くが記載されているのかが、文脈上明白である場合を除き、指すことができる(例えば、「試薬(a reagent)」は、1つまたは複数の試薬を意味することができる)。用語「約」は、本明細書で使用される場合、基礎をなすパラメーターの10%以内の値(すなわち、プラスまたはマイナス10%)を指し、一連の値の始めに用語「約」を使用することにより、値の各々が修飾される(すなわち、「約1、2および3」は、約1、約2および約3を指す)。例えば、「約100グラム」の重量は、90グラム〜110グラムの間の重量を含み得る。さらに、値のリスト(例えば、約50%、60%、70%、80%、85%または86%)が本明細書に記載されている場合、このリストは、それらのすべての中間値および分数値(例えば、54%、85.4%)を含む。したがって、本技術を代表実施形態および必要に応じた特徴により具体的に開示したが、本明細書で開示した概念の修飾形態および変形形態を当業者は用いることができること、ならびにそのような修飾形態および変形形態が本技術の範囲内で考えられることは、理解されるはずである。
本技術のある特定の実施形態を後続の特許請求の範囲で示す。

Claims (99)

  1. 核酸ライブラリーを生成する方法であって、
    標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップを含み、
    a)前記標的核酸の一部またはすべてがオーバーハングを含み;
    b)前記複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドの一部またはすべてが、2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含み、前記オーバーハングが、標的核酸オーバーハングとハイブリダイズすることができ、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し;
    c)前記複数のオリゴヌクレオチド種のうちの各オリゴヌクレオチドが、前記オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み;
    d)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、前記核酸組成物と前記複数のオリゴヌクレオチド種が結合し、それによってハイブリダイゼーション産物が形成される、方法。
  2. 前記複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、請求項1に記載の方法。
  3. 前記複数のオリゴヌクレオチド種が、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、請求項1または2に記載の方法。
  4. オーバーハングを含む前記オリゴヌクレオチドが、第1の末端にオーバーハングを含み、二重鎖部分を含み、第2の末端に2本の非相補鎖を含む、請求項1〜3のいずれか一項に記載の方法。
  5. 前記オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、請求項1〜4のいずれか一項に記載の方法。
  6. 前記複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、請求項1〜5のいずれか一項に記載の方法。
  7. 前記複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、請求項6に記載の方法。
  8. 前記複数のオリゴヌクレオチド種のうちのオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、請求項7に記載の方法。
  9. 前記オリゴヌクレオチドオーバーハング配列が、ランダムである、請求項6、7または8に記載の方法。
  10. オーバーハングを含まない前記オリゴヌクレオチドが、平滑末端化された第1の末端を含み、二重鎖部分を含み、第2の末端に2本の非相補鎖を含む、請求項1〜9のいずれか一項に記載の方法。
  11. オリゴヌクレオチドの末端が、前記ハイブリダイゼーション産物において前記オリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、請求項1〜10のいずれか一項に記載の方法。
  12. オリゴヌクレオチド鎖の3’末端が、ハイブリダイゼーション産物において前記オリゴヌクレオチドがハイブリダイズされる前記標的核酸の鎖の5’末端に共有結合で連結され得る、請求項11に記載の方法。
  13. 前記ハイブリダイゼーション産物が、二重鎖領域と、2本の非相補鎖を含む少なくとも1つの末端とを含む、請求項1〜12のいずれか一項に記載の方法。
  14. 前記ハイブリダイゼーション産物が、二重鎖領域を含み、各末端に2本の非相補鎖を含む、請求項1〜13のいずれか一項に記載の方法。
  15. 前記オリゴヌクレオチドオーバーハング識別配列が、前記オリゴヌクレオチドオーバーハングの長さに特異的である、請求項1〜14のいずれか一項に記載の方法。
  16. 前記オリゴヌクレオチドオーバーハング識別配列が、前記オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、請求項1〜15のいずれか一項に記載の方法。
  17. 前記標的核酸の一部が、オーバーハングを含まない、請求項1〜16のいずれか一項に記載の方法。
  18. オリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、請求項1〜17のいずれか一項に記載の方法。
  19. オーバーハングを含む前記標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、請求項1〜18のいずれか一項に記載の方法。
  20. オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、請求項1〜19のいずれか一項に記載の方法。
  21. オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、請求項1〜20のいずれか一項に記載の方法。
  22. 前記標的核酸が、無細胞核酸断片を含む、請求項1〜21のいずれか一項に記載の方法。
  23. 前記標的核酸が、循環無細胞核酸断片を含む、請求項1〜22のいずれか一項に記載の方法。
  24. 標的核酸中の前記オーバーハングが、ネイティブオーバーハングである、請求項1〜23のいずれか一項に記載の方法。
  25. 標的核酸中の前記オーバーハングが、未修飾オーバーハングである、請求項1〜24のいずれか一項に記載の方法。
  26. 前記標的核酸が、前記複数のオリゴヌクレオチド種と結合させるステップの前に、長さに関して修飾されない、請求項1〜25のいずれか一項に記載の方法。
  27. 前記標的核酸の末端が、それがハイブリダイズされる前記オリゴヌクレオチドの末端に結合される条件に、前記ハイブリダイゼーション産物を曝露するステップを含む、請求項1〜26のいずれか一項に記載の方法。
  28. 標的核酸の末端が、前記標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、前記ハイブリダイゼーション産物とリガーゼ活性を有する作用因子とを接触させるステップを含む、請求項27に記載の方法。
  29. 標的核酸の5’末端が、前記標的核酸がハイブリダイズされるオリゴヌクレオチドの3’末端に共有結合で連結される条件下で、前記ハイブリダイゼーション産物とリガーゼ活性を有する作用因子とを接触させることによって、ライゲーション産物を形成するステップを含む、請求項28に記載の方法。
  30. 標的核酸の3’末端が、前記標的核酸がハイブリダイズされるオリゴヌクレオチドの5’末端に共有結合で連結される条件下で、前記ライゲーション産物とニックシーリングリガーゼ活性を有する作用因子とを接触させることによって、ニックがシールされたライゲーション産物を形成するステップを含む、請求項29に記載の方法。
  31. 前記ライゲーション産物と鎖置換ポリメラーゼとを接触させることによって、平滑末端化された核酸断片を形成するステップを含む、請求項29に記載の方法。
  32. 標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップの前に、前記標的核酸とホスファターゼ活性を有する作用因子とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸を生成するステップを含む、請求項1〜31のいずれか一項に記載の方法。
  33. 前記脱リン酸化された標的核酸とホスホリル転移活性を有する作用因子とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、請求項32に記載の方法。
  34. 標的核酸を含む核酸組成物と複数のオリゴヌクレオチド種とを結合させるステップの前に、前記複数のオリゴヌクレオチド種とホスファターゼ活性を有する作用因子とを、前記オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、複数の脱リン酸化されたオリゴヌクレオチド種を生成するステップを含む、請求項1〜33のいずれか一項に記載の方法。
  35. 前記オリゴヌクレオチド種の前記第2の末端の前記2本の非相補鎖のうちの少なくとも一方が、プライマー結合ドメインを含む、請求項1〜34のいずれか一項に記載の方法。
  36. 前記オリゴヌクレオチド種の前記第2の末端の前記2本の非相補鎖の各々が、プライマー結合ドメインを含む、請求項1〜35のいずれか一項に記載の方法。
  37. 前記非相補鎖の一方が、第1のプライマー結合ドメインを含み、他方の非相補鎖が、第2のプライマー結合ドメインを含み、前記第1のプライマー結合ドメインと第2のプライマー結合ドメインが異なる、請求項36に記載の方法。
  38. 前記ハイブリダイゼーション産物またはそれらの増幅産物をシーケンシングプロセスによりシーケンシングすることによって、配列リードを生成するステップであって、前記配列リードが、フォワード配列リードおよびリバース配列リードを含む、ステップを含む、請求項1〜37のいずれか一項に記載の方法。
  39. 前記リバース配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を解析することによって解析を生成し、前記フォワード配列リードについてのオーバーハングの存在を示すオーバーハング識別配列に関連するオーバーハング情報を前記解析から削除するステップを含む、請求項38に記載の方法。
  40. 前記標的核酸が、対象からの試料から得られる、請求項1〜39のいずれか一項に記載の方法。
  41. 前記対象がヒトである、請求項40に記載の方法。
  42. 核酸ライブラリーを生成する方法であって、
    a)標的核酸を含む核酸組成物とオリゴヌクレオチド種の第1のプールとを結合させるステップであって、
    i)前記標的核酸の一部またはすべてがオーバーハングを含み、
    ii)オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドの一部またはすべてが、標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを第1の末端に含み、各オリゴヌクレオチド種が、固有のオーバーハング配列およびオーバーハング長を有し、
    iii)オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチドが、前記オリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的なオリゴヌクレオチドオーバーハング識別配列を含み、
    iv)オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチドが、第1のプライマー結合ドメインを含み、
    v)オリゴヌクレオチドオーバーハングが、対応する長さを有する標的核酸オーバーハングとハイブリダイズする条件下で、前記核酸組成物とオリゴヌクレオチド種の前記第1のプールが結合し、それによって結合産物の第1のセットが形成される、ステップと;
    b)結合産物の前記第1のセットを切断することによって、切断産物を形成するステップと;
    c)前記切断産物とオリゴヌクレオチド種の第2のプールとを結合させるステップであって、
    i)オリゴヌクレオチド種の前記第2のプール内の各オリゴヌクレオチドが、第1の鎖および第2の鎖を含み、前記第1の鎖が、前記第2の鎖より短く、前記第1の鎖と前記第2の鎖が、前記オリゴヌクレオチドの第1の末端において相補的であり、前記第2の鎖が、前記オリゴヌクレオチドの第2の末端における一本鎖を含み、
    ii)オリゴヌクレオチド種の前記第2のプール内の各オリゴヌクレオチドが、オリゴヌクレオチド種の前記第2のプールに特異的なオリゴヌクレオチド識別配列を含み、
    iii)オリゴヌクレオチド種の前記第2のプール内の各オリゴヌクレオチドが、前記第2の鎖上に第2のプライマー結合ドメインを含み、前記第1のプライマー結合ドメインと前記第2のプライマー結合ドメインが異なり、
    iv)オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、前記切断産物の少なくとも一方の末端に結合する条件下で、前記切断産物とオリゴヌクレオチド種の前記第2のプールが結合し、それによって結合産物の第2のセットが形成される、ステップと
    を含む方法。
  43. d)増幅条件下で、結合産物の前記第2のセットと2つまたはそれより多くの増幅プライマー種とを接触させることによって、増幅産物を生成するステップであって、第1のプライマー種が、前記第1のプライマー結合ドメインに相補的なヌクレオチド配列を含み、第2のプライマー種が、前記第2のプライマー結合ドメインに相補的なヌクレオチド配列を含む、ステップ
    をさらに含む、請求項42に記載の方法。
  44. 前記標的核酸が、500bpより大きい核酸断片を含む、請求項42または43に記載の方法。
  45. 前記標的核酸が、1000bpより大きい核酸断片を含む、請求項42または43に記載の方法。
  46. (b)が、結合産物の前記第1のセットと、前記結合産物を切断することができる1つまたは複数の切断作用因子とを、切断条件下で接触させることを含む、請求項42〜45のいずれか一項に記載の方法。
  47. (b)が、機械的せん断を含む、請求項42〜45のいずれか一項に記載の方法。
  48. オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドの一部またはすべてが、第2の末端に1つまたは複数の修飾ヌクレオチドを含む、請求項42〜47のいずれか一項に記載の方法。
  49. 前記1つまたは複数の修飾ヌクレオチドが、標的核酸への前記オリゴヌクレオチドの前記第2の末端の結合を遮断することができる、請求項48に記載の方法。
  50. オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドの一部またはすべてが、前記第2の末端に1つまたは複数の修飾ヌクレオチドを含む、請求項42〜49のいずれか一項に記載の方法。
  51. 前記1つまたは複数の修飾ヌクレオチドが、前記切断産物への前記オリゴヌクレオチドの前記第2の末端の結合を遮断することができる、請求項50に記載の方法。
  52. 前記増幅産物をシーケンシングプロセスによりシーケンシングするステップをさらに含む、請求項43〜51のいずれか一項に記載の方法。
  53. 前記シーケンシングプロセスが、短い配列リードを生成する、請求項52に記載の方法。
  54. オリゴヌクレオチド種の前記第1のプールが、5’オーバーハングを有するオリゴヌクレオチドおよび3’オーバーハングを有するオリゴヌクレオチドを含む、請求項42〜53のいずれか一項に記載の方法。
  55. オリゴヌクレオチド種の前記第1のプールが、5’オーバーハングを有するオリゴヌクレオチド、3’オーバーハングを有するオリゴヌクレオチド、およびオーバーハングを有さないオリゴヌクレオチドを含む、請求項42〜54のいずれか一項に記載の方法。
  56. オーバーハングを含む前記オリゴヌクレオチドが、二重鎖部分および一本鎖オーバーハングを含む、請求項54または55に記載の方法。
  57. オーバーハングを含む前記オリゴヌクレオチドが、(1)2本の鎖を含み、第1の末端にオーバーハングを含み、第2の末端に2本の非相補鎖を含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、請求項54〜56のいずれか一項に記載の方法。
  58. 前記オリゴヌクレオチドオーバーハングが、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドを含む、請求項54〜57のいずれか一項に記載の方法。
  59. オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について異なる配列を有するオリゴヌクレオチドオーバーハングを含む、請求項42〜58のいずれか一項に記載の方法。
  60. オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドが、特定のオーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、請求項59に記載の方法。
  61. オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドが、各オーバーハング長について可能なすべてのオーバーハング配列の組合せを含む、請求項60に記載の方法。
  62. 前記オリゴヌクレオチドオーバーハング配列が、ランダムである、請求項59、60または61に記載の方法。
  63. オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチドの末端が、結合産物の前記第1のセットにおいて前記オリゴヌクレオチドがハイブリダイズされる標的核酸の末端に共有結合で連結され得る、請求項42〜62のいずれか一項に記載の方法。
  64. オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチド鎖の3’末端が、結合産物の前記第1のセットにおいて前記オリゴヌクレオチドがハイブリダイズされる前記標的核酸の鎖の5’末端に共有結合で連結され得る、請求項63に記載の方法。
  65. (b)の後に前記切断産物の末端を修復するステップを含む、請求項42〜64のいずれか一項に記載の方法。
  66. (b)の後に前記切断産物の前記末端に1つまたは複数の不対合ヌクレオチドを付加させるステップを含む、請求項42〜65のいずれか一項に記載の方法。
  67. オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、前記切断産物に付加された前記1つまたは複数のヌクレオチドに相補的である1つまたは複数のヌクレオチドを前記第1の末端に含む、請求項66に記載の方法。
  68. オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、前記第1の末端において、前記切断産物の少なくとも一方の末端とハイブリダイズする、請求項67に記載の方法。
  69. オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドの末端が、結合産物の前記第2のセットにおいて前記オリゴヌクレオチドが結合される切断産物の末端に共有結合で連結され得る、請求項42〜68のいずれか一項に記載の方法。
  70. オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチド鎖の3’末端が、結合産物の前記第2のセットにおいて前記オリゴヌクレオチドが結合される前記切断産物の鎖の5’末端に共有結合で連結され得る、請求項69に記載の方法。
  71. オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、ネイティブ標的核酸オーバーハングとハイブリダイズすることができるオーバーハングを含まない、請求項42〜70のいずれか一項に記載の方法。
  72. オリゴヌクレオチド種の前記第2のプール内のオリゴヌクレオチドが、オリゴヌクレオチドオーバーハング識別配列を含まない、請求項42〜71のいずれか一項に記載の方法。
  73. オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチド上の前記オリゴヌクレオチドオーバーハング識別配列が、前記オリゴヌクレオチドオーバーハングの長さに特異的である、請求項42〜72のいずれか一項に記載の方法。
  74. オリゴヌクレオチド種の前記第1のプール内の各オリゴヌクレオチド上の前記オリゴヌクレオチドオーバーハング識別配列が、前記オリゴヌクレオチドオーバーハングの長さに特異的であり、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)(i)と(iii)の組合せ、または(v)(ii)と(iii)の組合せから選択されるオリゴヌクレオチドオーバーハングの1つまたは複数の特徴に特異的である、請求項42〜73のいずれか一項に記載の方法。
  75. 前記標的核酸の一部が、オーバーハングを含まない、請求項42〜74のいずれか一項に記載の方法。
  76. オリゴヌクレオチド種の前記第1のプール内のオリゴヌクレオチド種が、オーバーハングを含まず、オーバーハングを有さないことに特異的なオリゴヌクレオチドオーバーハング識別配列を含む、請求項42〜75のいずれか一項に記載の方法。
  77. オーバーハングを含む前記標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、請求項42〜76のいずれか一項に記載の方法。
  78. オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、請求項42〜77のいずれか一項に記載の方法。
  79. オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、請求項42〜78のいずれか一項に記載の方法。
  80. 前記標的核酸が、デオキシリボ核酸(DNA)断片を含む、請求項42〜79のいずれか一項に記載の方法。
  81. 前記DNA断片が、細胞から得られる、請求項80に記載の方法。
  82. 前記DNA断片が、ゲノムDNA断片を含む、請求項80または81に記載の方法。
  83. 前記標的核酸が、無細胞核酸断片を含む、請求項42〜82のいずれか一項に記載の方法。
  84. 前記標的核酸が、循環無細胞核酸断片を含む、請求項42〜83のいずれか一項に記載の方法。
  85. 標的核酸の前記オーバーハングが、ネイティブオーバーハングである、請求項42〜84のいずれか一項に記載の方法。
  86. 標的核酸中の前記オーバーハングが、未修飾オーバーハングである、請求項42〜85のいずれか一項に記載の方法。
  87. 前記標的核酸が、前記複数のオリゴヌクレオチド種と結合させるステップの前に、長さについて修飾されない、請求項42〜86のいずれか一項に記載の方法。
  88. 前記標的核酸の末端が、それがハイブリダイズされる前記オリゴヌクレオチドの末端に結合される条件に、結合産物の前記第1のセットを曝露するステップを含む、請求項42〜87のいずれか一項に記載の方法。
  89. 標的核酸の末端が、前記標的核酸がハイブリダイズされるオリゴヌクレオチドの末端に共有結合で連結される条件下で、結合産物の前記第1のセットとリガーゼ活性を有する作用因子とを接触させるステップを含む、請求項88に記載の方法。
  90. 前記切断産物の末端が、それが結合される前記オリゴヌクレオチドの末端に結合される条件に、結合産物の前記第2のセットを曝露するステップを含む、請求項42〜89のいずれか一項に記載の方法。
  91. 切断産物の末端が、前記標的核酸が結合される前記オリゴヌクレオチドの末端に共有結合で連結される条件下で、結合産物の前記第2のセットとリガーゼ活性を有する作用因子とを接触させるステップを含む、請求項90に記載の方法。
  92. (a)の前に、前記標的核酸組成物とホスファターゼ活性を有する作用因子とを、標的核酸が脱リン酸化される条件下で接触させることによって、脱リン酸化された標的核酸組成物を生成するステップを含む、請求項42〜91のいずれか一項に記載の方法。
  93. (a)の前に、前記脱リン酸化された標的核酸組成物とホスホリル転移活性を有する作用因子とを、5’リン酸が標的核酸の5’末端に付加される条件下で接触させるステップを含む、請求項92に記載の方法。
  94. (a)の前に、オリゴヌクレオチド種の前記第1のプールとホスファターゼ活性を有する作用因子とを、前記オリゴヌクレオチドが脱リン酸化される条件下で接触させることによって、脱リン酸化されたオリゴヌクレオチド種の第1のプールを生成するステップを含む、請求項42〜93のいずれか一項に記載の方法。
  95. (c)の前に、オリゴヌクレオチド種の前記第2のプールとホスホリル転移活性を有する作用因子とを、5’リン酸が前記第1の鎖の5’末端に付加される条件下で接触させるステップを含む、請求項42〜94のいずれか一項に記載の方法。
  96. 前記標的核酸が、対象からの試料から得られる、請求項42〜95のいずれか一項に記載の方法。
  97. 前記対象がヒトである、請求項96に記載の方法。
  98. (a)の前に、前記標的核酸を断片長に従って分離するステップを含む、請求項42〜97のいずれか一項に記載の方法。
  99. 前記標的核酸が、(a)の前に長さによって分離されない、請求項42〜97のいずれか一項に記載の方法。
JP2020538919A 2018-01-12 2019-01-11 核酸を解析するための方法および組成物 Active JP7296969B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023042991A JP2023072089A (ja) 2018-01-12 2023-03-17 核酸を解析するための方法および組成物

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862617055P 2018-01-12 2018-01-12
US62/617,055 2018-01-12
US201862618382P 2018-01-17 2018-01-17
US62/618,382 2018-01-17
US201862769787P 2018-11-20 2018-11-20
US62/769,787 2018-11-20
PCT/US2019/013210 WO2019140201A1 (en) 2018-01-12 2019-01-11 Methods and compositions for analyzing nucleic acid

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023042991A Division JP2023072089A (ja) 2018-01-12 2023-03-17 核酸を解析するための方法および組成物

Publications (2)

Publication Number Publication Date
JP2021511309A true JP2021511309A (ja) 2021-05-06
JP7296969B2 JP7296969B2 (ja) 2023-06-23

Family

ID=65516714

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020538919A Active JP7296969B2 (ja) 2018-01-12 2019-01-11 核酸を解析するための方法および組成物
JP2023042991A Pending JP2023072089A (ja) 2018-01-12 2023-03-17 核酸を解析するための方法および組成物

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023042991A Pending JP2023072089A (ja) 2018-01-12 2023-03-17 核酸を解析するための方法および組成物

Country Status (7)

Country Link
US (2) US11584929B2 (ja)
EP (1) EP3737774A1 (ja)
JP (2) JP7296969B2 (ja)
CN (1) CN111954720A (ja)
AU (1) AU2019207900A1 (ja)
CA (1) CA3087001A1 (ja)
WO (1) WO2019140201A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3030430A1 (en) 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries
US11584929B2 (en) 2018-01-12 2023-02-21 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
KR20210016560A (ko) 2018-06-06 2021-02-16 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 핵산 라이브러리의 생성 방법 및 이를 실행하기 위한 조성물 및 키트
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
US20220064630A1 (en) 2018-12-10 2022-03-03 10X Genomics, Inc. Resolving spatial arrays using deconvolution
ES2968457T3 (es) * 2018-12-19 2024-05-09 Univ Hong Kong Chinese Características de los extremos del ADN extracelular circulante
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
EP3976820A1 (en) 2019-05-30 2022-04-06 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
WO2021072037A1 (en) 2019-10-09 2021-04-15 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
US20210189494A1 (en) * 2019-12-18 2021-06-24 The Chinese University Of Hong Kong Cell-free dna fragmentation and nucleases
ES2946357T3 (es) 2019-12-23 2023-07-17 10X Genomics Inc Métodos para el análisis espacial usando ligación con molde de ARN
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
ES2965354T3 (es) 2020-04-22 2024-04-12 10X Genomics Inc Métodos para análisis espacial que usan eliminación de ARN elegido como diana
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
EP4153775A1 (en) 2020-05-22 2023-03-29 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
WO2021247543A2 (en) 2020-06-02 2021-12-09 10X Genomics, Inc. Nucleic acid library methods
WO2021252499A1 (en) 2020-06-08 2021-12-16 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
WO2021252591A1 (en) 2020-06-10 2021-12-16 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
WO2021263111A1 (en) 2020-06-25 2021-12-30 10X Genomics, Inc. Spatial analysis of dna methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
KR20230038263A (ko) * 2020-07-13 2023-03-17 더 차이니즈 유니버시티 오브 홍콩 무세포 핵산에 대한 뉴클레아제 관련 말단 특징 분석
WO2022020346A1 (en) 2020-07-21 2022-01-27 Claret Bioscience, Llc Cancer detection, monitoring, and reporting from sequencing cell-free dna
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
WO2022076574A1 (en) 2020-10-08 2022-04-14 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
WO2022140028A1 (en) 2020-12-21 2022-06-30 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
CN113012762B (zh) * 2021-04-09 2023-06-16 上海交通大学医学院附属仁济医院 基于分子分类器的样本分类系统、试剂盒、方法及应用
EP4196605A1 (en) 2021-09-01 2023-06-21 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
CN116092631A (zh) * 2023-01-17 2023-05-09 湖南安泰康成生物科技有限公司 铁死亡诱导剂与电场联用的肿瘤治疗系统
CN117248003B (zh) * 2023-11-13 2024-04-12 元码基因科技(北京)股份有限公司 用于完整端粒扩增子测序的组合物、预文库及其构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012103154A1 (en) * 2011-01-24 2012-08-02 Nugen Technologies, Inc. Stem-loop composite rna-dna adaptor-primers: compositions and methods for library generation, amplification and other downstream manipulations
WO2018013837A1 (en) * 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2318288A (en) 1987-08-07 1989-03-09 Genelabs Incorporated Coincidence cloning method and library
US6261774B1 (en) 1990-06-11 2001-07-17 Gilead Sciences, Inc. Truncation selex method
US5744306A (en) 1993-04-19 1998-04-28 Emory University Methods for nucleic acid detection, sequencing, and cloning using exonuclease
US5871697A (en) 1995-10-24 1999-02-16 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
EP0876508B1 (en) 1995-11-29 2006-11-22 The Anthony Nolan Bone Marrow Trust Methods for separating and/or identifying dna molecules
US5861246A (en) 1996-01-24 1999-01-19 Yale University Multiple selection process for binding sites of DNA-binding proteins
EP0929694A4 (en) 1996-03-15 2002-05-02 Penn State Res Found DETECTION OF TUMOR-RELATED EXTRACELLULAR NUCLEIC ACID USING PLASMA OR BLOOD SERUM USING NUCLEIC ACID AMPLIFICATION TESTS
CN1195872C (zh) 1996-06-06 2005-04-06 林克斯治疗公司 通过连接经编码的衔接子进行测序
US6083693A (en) 1996-06-14 2000-07-04 Curagen Corporation Identification and comparison of protein-protein interactions that occur in populations
US6013438A (en) 1996-11-27 2000-01-11 Baylor College Of Medicine Assay for detecting apoptotic cells
EP0994967A1 (en) 1997-07-11 2000-04-26 Brax Group Limited Categorising nucleic acid
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
WO2000039333A1 (en) 1998-12-23 2000-07-06 Jones Elizabeth Louise Sequencing method using magnifying tags
CA2367400A1 (en) 1999-04-06 2000-10-12 Yale University Fixed address analysis of sequence tags
CA2383264A1 (en) 1999-08-13 2001-02-22 Yale University Binary encoded sequence tags
ATE317024T1 (de) 1999-12-29 2006-02-15 Keygene Nv Verfahren zur erzeugung von oligonukleotiden, im besonderen zur detektion amplifizierter restriktionsfragmente, die durch aflp erhalten wurden
US7300751B2 (en) 2000-06-30 2007-11-27 Syngenta Participations Ag Method for identification of genetic markers
US6596490B2 (en) 2000-07-14 2003-07-22 Applied Gene Technologies, Inc. Nucleic acid hairpin probes and uses thereof
US20040006033A1 (en) 2001-08-06 2004-01-08 Zhu York Yuan-Yuan Methods for identifying low-abundance polynucleotides and related compositions
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US20030219878A1 (en) 2002-03-13 2003-11-27 Large Scale Biology Corporation Sticky rice
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
US9074013B2 (en) 2004-11-29 2015-07-07 Sequenom, Inc. Means and methods for detecting methylated DNA
US7723077B2 (en) 2005-08-11 2010-05-25 Synthetic Genomics, Inc. In vitro recombination method
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
GB0524069D0 (en) 2005-11-25 2006-01-04 Solexa Ltd Preparation of templates for solid phase amplification
US8679741B2 (en) 2006-05-31 2014-03-25 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
CN101501251A (zh) 2006-06-16 2009-08-05 塞昆纳姆股份有限公司 扩增、检测和定量样品中核酸的方法和组合物
WO2008045575A2 (en) 2006-10-13 2008-04-17 J. Craig Venter Institute, Inc. Sequencing method
WO2009032781A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for universal size-specific polymerase chain reaction
WO2009032779A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
WO2009091719A1 (en) 2008-01-14 2009-07-23 Applera Corporation Compositions, methods, and kits for detecting ribonucleic acid
EP2276858A4 (en) 2008-03-26 2011-10-05 Sequenom Inc RESTRICTED ENDONUCLEASE AMPLIFIED POLYMORPHIC SEQUENCE DETECTION
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
EP3103871B1 (en) 2008-09-16 2020-07-29 Sequenom, Inc. Processes for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for fetal nucleic acid quantification
WO2010115016A2 (en) 2009-04-03 2010-10-07 Sequenom, Inc. Nucleic acid preparation compositions and methods
WO2011143659A2 (en) 2010-05-14 2011-11-17 Fluidigm Corporation Nucleic acid isolation methods
US20110319290A1 (en) 2010-06-08 2011-12-29 Nugen Technologies, Inc. Methods and Compositions for Multiplex Sequencing
CN103890245B (zh) 2011-05-20 2020-11-17 富鲁达公司 核酸编码反应
WO2013019361A1 (en) 2011-07-07 2013-02-07 Life Technologies Corporation Sequencing methods
US9506113B2 (en) 2011-12-28 2016-11-29 Ibis Biosciences, Inc. Nucleic acid ligation systems and methods
US10227587B2 (en) 2012-01-10 2019-03-12 Berry Genomics Co., Ltd. Method for constructing a plasma DNA sequencing library
US9605313B2 (en) 2012-03-02 2017-03-28 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20140024541A1 (en) * 2012-07-17 2014-01-23 Counsyl, Inc. Methods and compositions for high-throughput sequencing
CN110872617A (zh) 2012-09-04 2020-03-10 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
US9982255B2 (en) 2013-03-11 2018-05-29 Kailos Genetics, Inc. Capture methodologies for circulating cell free DNA
EP4253558A1 (en) 2013-03-15 2023-10-04 The Board of Trustees of the Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
AU2014233373B2 (en) 2013-03-15 2019-10-24 Verinata Health, Inc. Generating cell-free DNA libraries directly from blood
WO2014210353A2 (en) 2013-06-27 2014-12-31 10X Technologies, Inc. Compositions and methods for sample processing
US10036013B2 (en) 2013-08-19 2018-07-31 Abbott Molecular Inc. Next-generation sequencing libraries
DE102013221744B4 (de) 2013-10-25 2019-05-16 Eberspächer Climate Control Systems GmbH & Co. KG Pumpe, insbesondere zum Fördern von flüssigem Brennstoff für ein Fahrzeugheizgerät
CN105849264B (zh) 2013-11-13 2019-09-27 纽亘技术公司 用于鉴别重复测序读数的组合物和方法
ES2908644T3 (es) 2014-01-31 2022-05-03 Swift Biosciences Inc Procedimientos mejorados para el procesamiento de sustratos de ADN
US10273538B2 (en) 2014-02-05 2019-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Error-free sequencing of DNA
WO2015134552A1 (en) 2014-03-03 2015-09-11 Swift Biosciences, Inc. Enhanced adaptor ligation
KR102441391B1 (ko) 2014-07-25 2022-09-07 유니버시티 오브 워싱톤 무세포 dna를 생성하는 조직 및/또는 세포 유형을 결정하는 방법 및 이를 사용하여 질환 또는 장애를 확인하는 방법
WO2016037358A1 (zh) 2014-09-12 2016-03-17 深圳华大基因科技有限公司 分离的寡核苷酸及其在核酸测序中的用途
CA2965500A1 (en) 2014-10-24 2016-04-28 Abbott Molecular Inc. Enrichment of small nucleic acids
EP3221813A4 (en) 2014-11-20 2018-04-18 Children's Medical Center Corporation Methods relating to the detection of recurrent and non-specific double strand breaks in the genome
EP3237616A1 (en) 2014-12-24 2017-11-01 Keygene N.V. Backbone mediated mate pair sequencing
CN107557355A (zh) 2016-07-01 2018-01-09 Pgi股份有限公司 建构环状模板和检测dna分子的方法
US11198865B2 (en) 2017-11-02 2021-12-14 Amanda Raine Splinted ligation adapter tagging
US11584929B2 (en) 2018-01-12 2023-02-21 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012103154A1 (en) * 2011-01-24 2012-08-02 Nugen Technologies, Inc. Stem-loop composite rna-dna adaptor-primers: compositions and methods for library generation, amplification and other downstream manipulations
WO2018013837A1 (en) * 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries

Also Published As

Publication number Publication date
US20230392141A1 (en) 2023-12-07
US11584929B2 (en) 2023-02-21
EP3737774A1 (en) 2020-11-18
CN111954720A (zh) 2020-11-17
US20210054366A1 (en) 2021-02-25
WO2019140201A1 (en) 2019-07-18
CA3087001A1 (en) 2019-07-18
JP7296969B2 (ja) 2023-06-23
JP2023072089A (ja) 2023-05-23
AU2019207900A1 (en) 2020-07-09

Similar Documents

Publication Publication Date Title
US20230392141A1 (en) Methods and compositions for analyzing nucleic acid
US20220411871A1 (en) Methods and Processes for Non-Invasive Assessment of Genetic Variations
US20220348906A1 (en) Methods and compositions for analyzing nucleic acid
ES2930180T3 (es) Métodos para enriquecer ácido nucleico canceroso a partir de una muestra biológica
US11060145B2 (en) Methods and compositions for identifying presence or absence of hypermethylation or hypomethylation locus
US20150284783A1 (en) Methods and compositions for analyzing nucleic acid
US20230014607A1 (en) Methods and compositions for analyzing nucleic acid
EP4172357B1 (en) Methods and compositions for analyzing nucleic acid
US20230340609A1 (en) Cancer detection, monitoring, and reporting from sequencing cell-free dna
US20240150825A1 (en) Methods and compositions for analyzing nucleic acid
WO2024054517A1 (en) Methods and compositions for analyzing nucleic acid
WO2023158739A2 (en) Methods and compositions for analyzing nucleic acid
US20220403468A1 (en) Methods and processes for non-invasive assessment of genetic variations

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230613

R150 Certificate of patent or registration of utility model

Ref document number: 7296969

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150