JP2022528139A - 核酸を解析するための方法および組成物 - Google Patents

核酸を解析するための方法および組成物 Download PDF

Info

Publication number
JP2022528139A
JP2022528139A JP2021559245A JP2021559245A JP2022528139A JP 2022528139 A JP2022528139 A JP 2022528139A JP 2021559245 A JP2021559245 A JP 2021559245A JP 2021559245 A JP2021559245 A JP 2021559245A JP 2022528139 A JP2022528139 A JP 2022528139A
Authority
JP
Japan
Prior art keywords
oligonucleotide
ssna
nucleic acid
scaffold
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021559245A
Other languages
English (en)
Other versions
JPWO2020206143A5 (ja
Inventor
キンケイド, ケリー エム. ハーキンズ
コリン パトリック ノートン,
ヴァーシャ ラオ,
クリストファー ジェイ. トロル,
ジョシュア ディー. カップ,
Original Assignee
クラレット バイオサイエンス, エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クラレット バイオサイエンス, エルエルシー filed Critical クラレット バイオサイエンス, エルエルシー
Publication of JP2022528139A publication Critical patent/JP2022528139A/ja
Publication of JPWO2020206143A5 publication Critical patent/JPWO2020206143A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • C12N2330/31Libraries, arrays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本技術は、一部は、核酸を解析するための方法および組成物に関する。一部の態様では、本技術は、一本鎖核酸断片から核酸ライブラリーを調製するための方法および組成物に関する。上記方法は、(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、(a)前記複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み得る。

Description

関連特許出願
本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてKelly M. HARKINS KINCAIDらを記名し、代理人整理番号CBS-2002-PVにより指定される、2019年4月5日に出願した米国仮特許出願第62/830,211号の利益を主張するものである。本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてKelly M. HARKINS KINCAIDらを記名し、代理人整理番号CBS-2002-PV2により指定される、2019年6月14日に出願した米国仮特許出願第62/861,594号の利益を主張するものでもある。本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてKelly M. HARKINS KINCAIDらを記名し、代理人整理番号CBS-2002-PV3により指定される、2019年10月23日に出願した米国仮特許出願第62/925,132号の利益を主張するものでもある。上述の出願の全内容は、本文、表および図面すべてを含めて、参照により本明細書に組み込まれる。
分野
本技術は、一部は、核酸を解析するための方法および組成物に関する。一部の態様では、本技術は、一本鎖核酸断片からの核酸ライブラリーを調製するための方法および組成物に関する。
背景
生命体(例えば、動物、植物および微生物)および遺伝情報を複製する他の形態(例えば、ウイルス)の遺伝情報は、核酸(すなわち、デオキシリボ核酸(DNA)またはリボ核酸(RNA))にコードされている。遺伝情報は、化学的核酸または仮説的核酸の一次構造に相当するひと続きのヌクレオチドまたは修飾ヌクレオチドである。
様々なハイスループットシーケンシングプラットフォームが、核酸を解析するために使用される。例えば、ILLUMINAプラットフォームは、アダプターがライゲーションされたDNA断片のクローン増幅を含む。別のプラットフォームは、核酸分子または個々のヌクレオチドが小さいチャネルを通って移行することに依拠する、ナノポアに基づくシーケンシングである。ある特定のシーケンシングプラットフォームのライブラリー調製は、DNAの断片化、断片末端の修飾、およびアダプターのライゲーションを含むことが多く、核酸断片の増幅(例えば、PCR増幅)を含むことがある。
特定のタイプの核酸解析のための適切なシーケンシングプラットフォームの選択は、誤りの原因、誤り率、ならびにシーケンシングの速度およびコストを含む、利用可能な技術についての詳細な理解を必要とする。シーケンシングコストは低下してきたが、ライブラリー調製のスループットおよびコストは、制限要因であり得る。ライブラリー調製の一態様は、核酸断片の末端を、それらが特定のシーケンシングプラットフォームに好適であるように、修飾することを含む。核酸末端は、有用な情報を含有し得る。したがって、核酸末端に含有されている情報を保存しつつ、核酸末端を(例えば、ライブラリー調製のために)修飾する方法は、核酸の処理および解析に有用であると予想される。
ライブラリー調製の別の態様は、一本鎖核酸断片を捕捉することを含む。ある特定の事例では、一本鎖ライブラリー調製方法は、旧来の二本鎖DNA(dsDNA)調製方法と比較してより良好でより複雑なライブラリーを生成することができる。
一本鎖DNA(ssDNA)ライブラリーの生成の欠点としては、労力集約的で費用がかかり、かつ時間がかかるプロトコール、および新奇のまたは特別注文の試薬の要件が挙げられる。したがって、労力集約的で費用がかかり、かつ時間がかかるプロトコールおよび/または新奇のもしくは特別注文の試薬を必要とすることなく、一本鎖核酸を(例えば、ライブラリー調製のために)捕捉する方法は、核酸(例えば、一本鎖核酸、変性された二本鎖核酸、または一本鎖核酸を含有する混合物)の処理および解析に有用であると予想される。
ライブラリー調製の別の態様は、一本鎖RNA断片を捕捉することを含む。一般に、既存のRNAライブラリー調製方法は、逆転写酵素を使用するRNAからの第1鎖DNA合成のみならず、下流の二本鎖シーケンシングアダプターライゲーションに適合するcDNA分子を作製するための第2鎖合成も必要とする。多くの場合、転写物が転写されることになるゲノムDNA鎖について正確な評定を行なうことができるように鎖RNAシーケンシングライブラリーを生成することが望ましい。鎖RNAシーケンシングライブラリーを作出するために、方法は、シーケンシングアダプターライゲーション後に第2のDNA鎖を分解するステップを含み得る。しかし、RNAの事前分解前に第2鎖DNA合成を行なうことは、結果として得られるRNAシーケンシングデータを畳み込んでライブラリーの鎖の数を部分的に分かりにくくする第3およびときには第4鎖合成副産物を作出し得る点で、問題が多い。したがって、第2鎖合成を必要することなく一本鎖RNAを(例えば、ライブラリー調製のために)捕捉する方法は、RNAを含有する核酸の処理および解析に有用であると予想される。
要旨
一部の態様では、核酸ライブラリーを生成する方法であって、(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、(a)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;(b)核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が、(i)第1のssNA末端領域および(ii)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法が、提供される。一部の態様では、方法は、結合させるステップの前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される。一部の態様では、方法は、ssNAからライブラリーを生成するための、SSB不使用の方法である。
一部の態様では、一本鎖核酸(ssNA)を含む核酸組成物と、第1のオリゴヌクレオチドと、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種とを含む、組成物も提供される。
一部の態様では、第1のオリゴヌクレオチドと、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種と、第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種を使用して核酸ライブラリーを生成するための使用説明書とを含む、キットも提供される。
一部の態様では、核酸ライブラリーを生成するための方法であって、(i)一本鎖リボ核酸(ssRNA)または一本鎖相補デオキシリボ核酸(sscDNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、(a)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssRNAまたはsscDNAハイブリダイゼーション領域、および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;(b)核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(i)第1のssRNAまたはsscDNA末端領域および(ii)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssRNAまたはsscDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法が提供される。一部の態様では、方法は、結合させるステップの前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される。一部の態様では、方法は、ssRNAまたはsscDNAからライブラリーを生成するための、SSB不使用の方法である。
一部の態様では、一本鎖リボ核酸(ssRNA)または一本鎖相補デオキシリボ核酸(sscDNA)を含む核酸組成物と、第1のオリゴヌクレオチドと、ssRNAまたはsscDNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種とを含む、組成物も提供される。
一部の態様では、第1のオリゴヌクレオチドと、ssRNAまたはsscDNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種と、第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種を使用してssRNAまたはsscDNAから核酸ライブラリーを生成するための使用説明書とを含む、キットも提供される。
ある特定の実施形態は、下記の説明、実施例、特許請求の範囲および図面でさらに説明される。
図面は、本技術のある特定の実施形態の説明に役立つものであり、限定するものではない。説明を明確かつ容易にするために、図面は、正確な縮尺で作成されたものではなく、一部の事例では、様々な態様が、特定の実施形態の理解を助長するために、誇張または拡大して示されることがある。
図1は、本明細書に記載されるある特定のライブラリー調製方法についての一般的なワークフローを示す。P5アダプターの末端における、P7アダプターの末端における、およびP5/P7足場ポリヌクレオチドの末端における黒塗りの山形は、遮断する修飾を表す。
図2Aは、超熱安定性一本鎖DNA結合タンパク質(ET SSB)を使用してまたは使用せずに作製されたssDNAライブラリーについての分子QCメトリクスを示す。 図2Bは、ET SSBを使用してまたは使用せずに生成されたssDNAライブラリーについてのILLUMINA HISEQシーケンシングメトリクスを示す。2つの試料等分散t検定は、シーケンシングメトリクスの有意な差がないことを示した。
図3Aは、SSBの存在を用いて(上)および用いずに(下)生成された、1ngの無細胞DNAからのssDNA最終ライブラリー産物サイズ分布を示す。 図3Bは、2つのcfDNAライブラリー(SSBを用いてまたは用いずに生成された)のシーケンシングデータから推測された挿入物長分布のオーバーラップを示す。
図4は、迅速エビアルカリホスファターゼ(rSAP)を使用するP5/P7アダプターの脱リン酸化前処理の後の、Qubit蛍光光度計により測定したライブラリー収量(上)、およびアダプターダイマー%(下)を示す。rSAP処理後、ライブラリー収量は増加し、アダプターダイマーに起因するアーチファクトの量は減少する。
図5Aおよび図5Bは、ssDNAライブラリーライゲーションステップ中の完全インデックス付加シーケンシングアダプターと足場のライゲーションを含む、PCR不使用のアプローチを示す。このようなアダプターは、固有分子識別子(UMI)を含有することもあり、またはしないこともある。 図5Aおよび図5Bは、ssDNAライブラリーライゲーションステップ中の完全インデックス付加シーケンシングアダプターと足場のライゲーションを含む、PCR不使用のアプローチを示す。このようなアダプターは、固有分子識別子(UMI)を含有することもあり、またはしないこともある。
図6Aおよび図6Bは、固有分子識別子(UMI)を有する足場アダプター構成を示す。図6Aは、UMIが鋳型に隣接している構成を示す。図6Bは、UMIがインデックスポリヌクレオチドに隣接している構成を示す。 図6Aおよび図6Bは、固有分子識別子(UMI)を有する足場アダプター構成を示す。図6Aは、UMIが鋳型に隣接している構成を示す。図6Bは、UMIがインデックスポリヌクレオチドに隣接している構成を示す。
図7は、単一プライマー伸長を使用するインデックスPCRの前の足場アダプターライゲーション後の固有分子識別子(UMI)およびP7インデックス付加アダプターの組込みの例を示す。
図8は、ヘアピン足場アダプター設計の例を示す。
図9は、段階的なライゲーションおよび酵素遅延を伴うワークフローの例を示す。X、遮断する修飾。5’P、5’リン酸。5’OH、5’ヒドロキシル。3’OH、3’ヒドロキシル。N、任意のヌクレオチド。
図10は、5’App修飾とATP遅延とを有するP7足場アダプターを使用する段階的なライゲーションを用いるワークフローの例を示す。X、遮断する修飾。5’App、5’-アデニル化DNA。5’P、5’リン酸。3’OH、3’ヒドロキシル。N、任意のヌクレオチド。
図11は、3’リン鎖を有する一本鎖P5アダプターを使用する段階的なライゲーションを用いるワークフローの例を示す。X、遮断する修飾。3’P、3’リン酸。5’P、5’リン酸。3’OH、3’ヒドロキシル。5’OH、5’ヒドロキシル。N、任意のヌクレオチド。
図12は、ランダムヘキサマー、オクタマーおよびアンカー型ポリTプライマーならびにMu-MLV逆転写酵素(社内プロトコール)、またはNew England Biolabs Ultra II RNA First Strand合成モジュール(市販プロトコール)を使用して合成された第1鎖cDNAから生成された4つのssDNAライブラリーのtapestationトレースを示す。iおよびiiは、社内プロトコールの技術的反復実験であり、iiiおよびivは、市販プロトコールの技術的反復実験である。
図13は、ランダムヘキサマー、オクタマーおよびアンカー型ポリTプライマーならびにMu-MLV逆転写酵素(社内プロトコール)、またはNew England Biolabs Ultra II RNA First Strand合成モジュール(市販のプロトコール)を使用して合成された第1鎖cDNAから生成された4つのssDNAライブラリーの分子メトリクスを示す。上のパネル:最終RNA-Seqライブラリーのゲル画像。下のパネル:ライブラリー収量(ng/μl)およびサイズ(bp)を示す表。iおよびiiは、社内プロトコールの技術的反復実験であり、iiiおよびivは、市販プロトコールの技術的反復実験である。
図14は、社内プロトコール(ランダムヘキサマー、オクタマーおよびアンカー型ポリTプライマーならびにMu-MLV逆転写酵素)、または市販プロトコール(New England Biolabs Ultra II RNA First Strand合成モジュール)を使用して合成された第1鎖cDNAから生成されたssDNAライブラリーについての、STARアライナーを使用して生成されたシーケンシングメトリクスを示す表を提供する。高品質ライブラリーの典型的なRNA-Seqメトリクスは、a)ライブラリーの70~90%についての一意的にマッピングされたリード、およびb)約5の複数の遺伝子座にマッピングされたリード%(そのようなメトリクスが灰色で示されている)を含み得る。表に与えられているデータは、RNA-seqライブラリー生成の成功を示す。
図15は、RNA-Seqの一本鎖調製のための方法の全体像、ならびに第1鎖cDNA合成後の一本鎖足場アダプターライゲーション技術の詳細を示す概略図を示す。
図16は、RNA-Seqの一本鎖調製のための方法の全体像、ならびにDNA/RNAハイブリッドを作出する一本鎖足場アダプターライゲーション技術、続いてのcDNA第1鎖合成の詳細を示す概略図を示す。
図17は、本明細書に記載されるssDNA/ssRNAライゲーション反応の前または後に行なうことができる様々なワークフローを示す。
図18は、アダプターダイマーのパーセンテージが高い試料についての連続的1.2×固相可逆的固定法(SPRI)クリーンの結果を示す。
図19は、逐次的0.6×SPRI+0.6×SPRIクリーンの結果を示す。
図20は、推定アダプターダイマー形成、一本鎖形態のアダプターダイマー、およびそのような一本鎖アダプターダイマーにのみアニールするオリゴの付加の例を示す。一例では、二本鎖ハイブリダイゼーション産物が形成されるときにXbaI認識部位が形成する。
図21は、定方向RNA-Seqライブラリー調製NGSアッセイについてのワークフローの例を示す。
図22は、本明細書に記載されるRNAの一本鎖ライブラリー調製(ssPrep)についての1~20ngのmRNA投入物からのライブラリー収量を示す。投入物濃度ごとに反復実験の代表値が示されている。1ngの投入物(11PCRサイクルで増幅した)を除いて、すべてのライブラリーを9サイクルで増幅した。QUANT-IT dsDNA High Sensitivityキットを使用してライブラリーを定量化した。
図23は、本明細書に記載されるRNAの一本鎖ライブラリー調製(ssPrep)と、3つの市販の二本鎖ライブラリー調製(dsPrep)キット(すなわち、NEBNEXT ULTRA II Directional RNA-Seqキット;NUGEN Universal mRNAライブラリーキット;およびTRUSEQ mRNA Strandedライブラリーキット)との比較を示す表を提供する。投入量範囲、ワークフロー時間、およびPCRサイクルの比較が示されている。
図24は、本明細書に記載されるRNAの一本鎖ライブラリー調製(ssPrep)または市販の二本鎖ライブラリー調製(dsPrep)キット(すなわち、NEBNEXT ULTRA II Directional RNA-Seqキット)から生成されたヒトリードについての収量およびマッピングメトリクスの比較を示す表を提供する。ssPrepおよびdsPrepの複製ライブラリーからのシーケンシングデータを、ヒト参照ゲノム(hg19)にマッピングした。ssPrepライブラリーのほうが、末端ポリッシングの欠如に恐らく起因して、マッピングされた長さが短かった。
図25は、市販の二本鎖ライブラリー調製(dsPrep)キット(すなわち、NEBNEXT ULTRA II Directional RNA-Seqキット)に対する、本明細書に記載されるRNAの一本鎖ライブラリー調製(ssPrep)についての、性能メトリクスを示す。上のパネル:両方の方法により生成された複製ライブラリーについてのマッピングメトリクス代表値。両方のライブラリーが、約90%の一意的にマッピングされたリード、および約5%のリボソームリードを有した。リードの約93%は、正しい鎖にマッピングした。下のパネル:ρ約0.95のスピアマン相関係数が、両方の方法についてのおよび互いの反復実験の正規化されたリードカウント(ヒト)間で観察された。ペアワイズ相関係数が、四角の中に提供されている。
図26は、市販の二本鎖ライブラリー調製(dsPrep)キット(すなわち、NEBNEXT ULTRA II Directional RNA-Seqキット)に対して本明細書に記載されるRNAの一本鎖ライブラリー調製(ssPrep)を比較するデータを示す。上のパネル:Picard Tools CollectRNASeqMetricsを使用してGene bodyカバレッジを計算した;転写物の全長にわたっての正規化されたカバレッジが、ssPrepおよびdsPrepの複製ライブラリーについて示されている。中央パネル:Picard Tools CollectRNASeqMetricsを使用してリードのゲノム分布を計算し、コード領域、非翻訳(UTR)領域、イントロン領域および遺伝子間領域の平均的組成をプロットした。両方の方法が最小の遺伝子間領域を捕捉した。ssPrepは、より均一なGene bodyカバレッジのため、より多くの非翻訳領域を捕捉した。下のパネル:2つの方法により捕捉された差次的GC組成。外部RNA標準コンソーシアム(ERCC)スパイクイン対照のGC分布が挿入図に示されている。パーセンテージは、各ライブラリーについての実測GC組成を示す。
図27は、本明細書に記載されるRNAの一本鎖ライブラリー調製(ssPrep)または市販の二本鎖ライブラリー調製(dsPrep)キット(すなわち、NEBNEXT ULTRA II Directional RNA-Seqキット)を使用して生成されたライブラリーについての、ERCC参照ゲノムにマッピングするリードの数および正しい鎖へのマッピングパーセントを示す表を提供する。両方のタイプのライブラリーが、>300,000の対照リード、正しい鎖にマッピングされた>99%のリードを有した。
図28は、一本鎖ライブラリー調製(ssPrep)方法の模式的全体像を示す。多様な鋳型分子のDNA投入物プールが、熱で変性され、急冷、および熱安定性一本鎖DNA結合タンパク質(SSB)の使用によって、一本鎖分子として維持される。鋳型DNAは、リン酸化され、ランダム化された7bp一本鎖足場オーバーハングとライゲーションを遮断する修飾とをすべての末端に有するssPrep足場アダプターが、正しく配向されたライブラリー分子を助長するものを除いて、複合リン酸化/ライゲーション反応でライゲーションされる。クリーンアップ後、分子は、インデックスPCRの準備が整った状態である。
図29は、健康なヒトのcfDNA抽出物(A、試料A;B、試料B)からの一本鎖ライブラリー調製(ssPrep)および市販キット(dsPrep;すなわち、NEBNEXT ULTRA II)ライブラリーからのマージされたリードについての標準的なNGSメトリクスを示す。別段の記述がない限り、各方法についてのすべてのライブラリーを解析の前にcfDNA抽出物ごとに組み合わせ、PCR重複、およびq20に等しいかまたはそれより大きい品質スコアについてフィルタリングした。パネルA:cfDNA抽出物AおよびBそれぞれについての挿入物分布プロット。パネルB:cfDNA抽出物ごとのssPrepおよび市販キットについてのヒトゲノム(hg19)にわたっての塩基パーセントによるカバレッジ倍数。組み合わせたライブラリーをカバレッジ倍数計算の前に同様のリード深度についてサブサンプリングした。サブサンプリングした深度を、ssPrep-Bについてのシーケンシングされるリードの限界である295Mリードに設定した。パネルC:cfDNA抽出物ごとのssPrepおよび市販のキットについてのヒトゲノムにわたっての100bpスライディングスケールによるGC含有量の関数としての正規化されたカバレッジ。網掛けヒストグラムは、100bpスライディングウインドウにわたってのヒトゲノムGCを表す。パネルD:cfDNA抽出物ごとのssPrepおよび市販キットについてのPreseq複雑性推定。可能な最も正確なpreseq推定値を得るために、同等のシーケンシング深度の3つのライブラリーを方法ごとに組み合わせた。より多くのライブラリーが、市販キットよりもssPrepによって作製されたからである。PCR重複リードを含有するファイルを使用して、複雑性推定を助長した。パネルE:リード開始部位の2bp上流で開始して34bp下流に及ぶ、リード末端の各位置における正規化され、log変換された塩基組成。挿入物長にかかわらず、すべてのリードを考慮した。
図30は、一本鎖ライブラリー調製(ssPrep)および市販キット(dsPrep;すなわち、NEBNEXT ULTRA II)についての一本鎖オーバーハングを含有する二重鎖オリゴのカバレッジを示す。パネルA:二重鎖合成オリゴ-1つの平滑末端、識別可能な50nt相補領域、ならびに特定の長さおよびタイプのオーバーハング-の略画概略図。パネルB:ssPrepおよび市販キット方法の両方の0ベース座標における3回の技術的反復実験についてのすべての二重鎖オリゴの長さにわたっての塩基ごとのカバレッジの代表値。技術的反復実験は、互いに統計的に差がなかった(スチューデントt検定:ssPrep p=0.714、市販キットp=0.985)。シーケンシングした各オリゴ>5,000リード。
図31は、一本鎖オリゴ解析をssPrepごとに示す。灰色および黒色の線および点は、技術的反復実験を表す。パネルA:等モルのプールされた一本鎖オリゴライブラリーの挿入物分布。10nt間隔で合成した20~120ntのオリゴを標準的脱塩により精製した。フィルタリングされていない生シーケンシングデータ。パネルB:オリゴごとに分けられた技術的反復実験についてのマッピングされたシーケンシングデータ。オリゴ長の関数として表されている。黒色の縦棒ならびに付随する黒色および灰色の数字は、完全長産物のパーセントをライブラリープール内に存在するオリゴ長ごとに示す。各ライブラリーを約100,000リードペア(20および30nt長を除いて、オリゴ当たり10,000リードペア)の深度までシーケンシングした。パネルC:60ntの合成されたオリゴのオリゴ長の関数としてのオリゴ純度に対する様々な精製方法の効果。付随する黒色および灰色の数字は、オリゴ当たりの完全長産物のパーセントを示す。パネルBから取り出した標準的な脱塩60nt合成オリゴについてのデータ。
図32は、cfDNA解析を示す。パネルA:100bp±(リードがマッピングされた座標)を含む、3つの別個の断片長のssPrepデータについてのリード長の関数としての正規化されたゲノムジヌクレオチド出現頻度。リード中点は、ゼロを中心とする。負の数は、中点の上流(5プライム)のゲノム領域を示し、正の数は、中点の下流(3プライム)のゲノム領域を示す。入力データは、組み合わせた試料Aおよび試料B ssPrepデータセットからのものである。パネルB:リードの中への9bp領域(正の数)およびリードから外への10bp(負の数)を含む、3つの別個の断片長の末端のssPrepデータについてのリード長の関数としての正規化されたゲノムジヌクレオチド出現頻度。リード開始および終了座標は、0を中心とする。入力データは、組み合わせた試料Aおよび試料B ssPrepデータセットからのものである。パネルC:市販キットデータを除いて、パネルAと同じ。パネルD:市販キットデータを除いて、パネルBと同じ。パネルE:最初にWPSをはっきりと示すために使用された第12染色体上の同じ動原体周辺遺伝子座にある試料CH01と比較したssPrepデータについての正規化されたWPS値(120bpウインドウ;120~180bp断片)。パネルF:試料CH01と比較したssPrepデータの長い断片長のビニング処理されたデータ(120bpウインドウ;120~180bp断片)および短い断片長のビニング処理されたデータ(16bpウインドウ;35~80bp断片)についてのアノテーション付きCTCF結合部位の±1kb以内の正規化されたWPSスコア代表値。
図33Aおよび33Bは、投入cfDNAならびに代表的なssPrepおよびdsPrepライブラリーを示す。図33A、上のパネル:血漿抽出/精製後かつNGSライブラリー調製前の無細胞DNA抽出物(試料A)。D5000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いて解析した。ゲル画像および電気泳動図を示す。図33A、下のパネル:血漿抽出/精製後かつNGSライブラリー調製前の無細胞DNA抽出物(試料B)。D1000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いて解析した。ゲル画像および電気泳動図を示す。図33B、上のパネル:D1000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いてインデックスPCR後に解析した、cfDNA抽出物からの1つの代表的なssPrepライブラリー(試料A、ライブラリーID:A’)およびcfDNA抽出物からの1つの代表的なssPrepライブラリー(試料B、ライブラリーID:B’)。ゲル画像および電気泳動図を示す。図33B、下のパネル:D1000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いてインデックスPCR後に解析した、cfDNA抽出物からの1つの代表的なdsPrep(すなわち、NEBNEXT ULTRA II)ライブラリー(試料A、ライブラリーID:A”)およびcfDNA抽出物からの1つの代表的なdsPrep(すなわち、NEBNEXT ULTRA II)ライブラリー(試料B、ライブラリーID:B”)。ゲル画像および電気泳動図を示す。 図33Aおよび33Bは、投入cfDNAならびに代表的なssPrepおよびdsPrepライブラリーを示す。図33A、上のパネル:血漿抽出/精製後かつNGSライブラリー調製前の無細胞DNA抽出物(試料A)。D5000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いて解析した。ゲル画像および電気泳動図を示す。図33A、下のパネル:血漿抽出/精製後かつNGSライブラリー調製前の無細胞DNA抽出物(試料B)。D1000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いて解析した。ゲル画像および電気泳動図を示す。図33B、上のパネル:D1000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いてインデックスPCR後に解析した、cfDNA抽出物からの1つの代表的なssPrepライブラリー(試料A、ライブラリーID:A’)およびcfDNA抽出物からの1つの代表的なssPrepライブラリー(試料B、ライブラリーID:B’)。ゲル画像および電気泳動図を示す。図33B、下のパネル:D1000 HSテープおよび付随するTapestation 4200(Agilent)を製造業者の使用説明書に従って用いてインデックスPCR後に解析した、cfDNA抽出物からの1つの代表的なdsPrep(すなわち、NEBNEXT ULTRA II)ライブラリー(試料A、ライブラリーID:A”)およびcfDNA抽出物からの1つの代表的なdsPrep(すなわち、NEBNEXT ULTRA II)ライブラリー(試料B、ライブラリーID:B”)。ゲル画像および電気泳動図を示す。
図34は、試料Aおよび試料Bの複製ライブラリーについての挿入物分布を示す。パネルA:試料A cfDNA抽出物について製造されたすべてのライブラリーについての挿入物分布。パネルB:試料B cfDNA抽出物について製造されたすべてのライブラリーについての挿入物分布。各説明文に列挙されているライブラリーIDの順序は、説明文に示されているトレースの順序に対応する。
図35は、断片長保持に対するインデックスPCR後DNA精製の効果を示す。1.2×または1.5×DNA精製ビーズ体積:インデックスPCR反応体積比のどちらかを使用して、cfDNA(試料A)のssPrepライブラリーを精製した。<100bp断片の回収率は、より低い比からより高い比について9.3%から14.7%へと変化した。
図36は、一本鎖DNAライブラリー調製(ssPrep)についてのワークフローの例を示す。ssPrepは、末端ポリッシング(すなわち、末端修復)を伴わないライゲーションのための鋳型DNA分子の調製と、本明細書に記載される足場アダプターを利用することによるILLUMINAアダプターのライゲーションとを同時に行なう、1ステップ複合リン酸化/ライゲーションステップで動作する。
図37は、cfDNA保護モデルの説明図を示す。
図38は、ライブラリー調製キットおよび投入cfDNAの概要を示す、表を提供する。ssPrepと、2つの市販の末端ポリッシング型dsDNAライブラリー調製キットと、市販のssDNAキットとを利用して、2名の健康な個体のcfDNA抽出物(試料1および試料2)からシーケンシングライブラリーを生成した。ライブラリーをILLUMINA HISEQ Xで2×151bpシーケンシングした。市販キット1、NEBNext(登録商標)Ultra II(商標);市販キット2、タカラバイオ株式会社ThruPLEX(登録商標)Plasma-Seq;市販キット3、Swift Accel-NGS(登録商標)1S Plus。
図39は、インデックスPCR後の収量を示す。Qubit 3.0を使用し、インデックスPCR後の2μlの最終精製ライブラリーを用いて、ライブラリーを定量化した。キット付属のポリメラーゼマスターミックスおよびプライマーを使用して10サイクルのPCRでインデックスが付加されたすべてのライブラリー。Prepキットが各ヒストグラムの中に左から右へ示されている:ssPrep、Swift、タカラバイオ株式会社、NEB。
図40は、マッピングおよび短い挿入物ビンデータを示す。SeqPrep2.0を使用してライブラリーをトリミング/マージし、マージされたリード<30bpを廃棄した。残りのリードは、BWA alnでヒト参照ゲノムhg19にマッピングした。カスタムスクリプトを用いてサイズビニングを行なった。Prepキットが各ヒストグラムの中に左から右に示されている:ssPrep、Swift(Swift Accel-NGS(登録商標)1S Plus)、タカラバイオ株式会社(Swift Accel-NGS(登録商標)1S Plus)、NEB(NEBNext(登録商標)Ultra II(商標))。
図41は、インデックスPCR後の収量およびマッピング状態を示す表を提供する。ライブラリー調製中に生じたテーリングアーチファクトに起因して、市販キット3は、マッピングの前にフォワードおよびリバースリードから10bpトリミングすることを推奨している。それに基づいて、30~100bpのビンサイズの上限を100bpではなく90bpに低下させた。市販キット1、NEBNext(登録商標)Ultra II(商標);市販キット2、タカラバイオ株式会社ThruPLEX(登録商標)Plasma-Seq;市販キット3、Swift Accel-NGS(登録商標)1S Plus。
図42Aおよび42Bは、マッピングされた挿入物長分布を示す。図42Aは、ssPrepをdsDNA調製に対して示す。キット2、タカラバイオ株式会社ThruPLEX(登録商標)Plasma-Seq;キット1、NEBNext(登録商標)Ultra II(商標)。図42Bは、ssPrepを市販ssDNA調製キット(Swift Accel-NGS(登録商標)1S Plus)に対して示す。各ライブラリーに含有されているすべての分子についてのリード長を、正しくマッピングされ、ソートされたbamファイルから抽出し、次いでプロットした。 図42Aおよび42Bは、マッピングされた挿入物長分布を示す。図42Aは、ssPrepをdsDNA調製に対して示す。キット2、タカラバイオ株式会社ThruPLEX(登録商標)Plasma-Seq;キット1、NEBNext(登録商標)Ultra II(商標)。図42Bは、ssPrepを市販ssDNA調製キット(Swift Accel-NGS(登録商標)1S Plus)に対して示す。各ライブラリーに含有されているすべての分子についてのリード長を、正しくマッピングされ、ソートされたbamファイルから抽出し、次いでプロットした。
図43は、複雑性推定値を示す。ライブラリー調製キットの複雑性推定値出力は、Preseqアルゴリズムからであった。図41における表からのリードを入力データとして使用し、固有分子の数を300Mリードペアに外挿した。
図44は、各cfDNA抽出物についてのライブラリーの正規化されたカバレッジとしてのGCカバレッジを、ヒト参照ゲノムの(hg19)GC含有量の関数として、100bpスライディングウインドウに対して示す。左側のY軸は、cfDNA(線)を指す。右側の軸は、参照ゲノムを指す(灰色のヒストグラム)。Picard Tools CollectGcBiasMetricsから取り出したデータ。
図45は、ヌクレオソーム占有率を示す。WPS計算を生成し、chr12でアルファサテライトアレイ小領域についての最高WPS絶対値に対して正規化した。WPS計算の前に、健康なcfDNA試料1および2についてのssPrep bamファイルを組み合わせ、ヌクレオソーム関連挿入物に関するリードをフィルタリングすることにより、cfDNAデータを得た。
図46は、ジヌクレオチド出現頻度を示す。ATおよびCG含有ジヌクレオチドについてのジヌクレオチド出現頻度を、1657bpにおける試料1の主ヒストン単量体ピークに相当するすべてのリードの5’および3’末端についてプロットした。
図47は、損傷したDNAについてのライブラリー調製方法の比較を示す。
図48A~図48Dは、様々な精製条件下での断片-足場アダプターライゲーション産物のSPRI精製後に回収された断片長およびアダプターダイマーパーセントの比較を示す。図48Aは、50μlのTris緩衝液の添加を伴う(すなわち、25μlのライゲーション産物を添加した)18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図48Bは、25μlのイソプロパノールおよび25μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図48Cは、50μlのイソプロパノールの添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図48Dは、38%PEGを含有するSPRIビーズ溶解緩衝液を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。 図48A~図48Dは、様々な精製条件下での断片-足場アダプターライゲーション産物のSPRI精製後に回収された断片長およびアダプターダイマーパーセントの比較を示す。図48Aは、50μlのTris緩衝液の添加を伴う(すなわち、25μlのライゲーション産物を添加した)18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図48Bは、25μlのイソプロパノールおよび25μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図48Cは、50μlのイソプロパノールの添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図48Dは、38%PEGを含有するSPRIビーズ溶解緩衝液を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。
図49A~図49Eは、様々な精製条件下での断片-足場アダプターライゲーション産物の精製後に回収された断片長およびアダプターダイマーパーセントの比較を示す。図49Aは、50μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Bは、カラム精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Cは、5μlのイソプロパノールおよび45μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Dは、10μlのイソプロパノールおよび40μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Eは、20μlのイソプロパノールおよび30μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。 図49A~図49Eは、様々な精製条件下での断片-足場アダプターライゲーション産物の精製後に回収された断片長およびアダプターダイマーパーセントの比較を示す。図49Aは、50μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Bは、カラム精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Cは、5μlのイソプロパノールおよび45μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Dは、10μlのイソプロパノールおよび40μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。図49Eは、20μlのイソプロパノールおよび30μlのTris緩衝液の添加を伴う18%PEG SPRI精製を使用して精製された断片-足場アダプターライゲーション産物についての、アダプターダイマーおよび断片長ピークを示す。
図50は、一本鎖RNAからシーケンシングライブラリーを生成するためのワークフローの例を示す。
図51は、ssNAハイブリダイゼーション領域内の塩基の一部またはすべてが定義された塩基であるかまたは既知の塩基である、足場アダプター設計の例を示す。
図52A~図52Dは、修飾された核酸の濃縮についてのワークフローの例を示す。修飾された核酸の濃縮をdsDNAの変性の前(図52A、52B)または後(図52C、52D)に行なうことができる。 図52A~図52Dは、修飾された核酸の濃縮についてのワークフローの例を示す。修飾された核酸の濃縮をdsDNAの変性の前(図52A、52B)または後(図52C、52D)に行なうことができる。 図52A~図52Dは、修飾された核酸の濃縮についてのワークフローの例を示す。修飾された核酸の濃縮をdsDNAの変性の前(図52A、52B)または後(図52C、52D)に行なうことができる。 図52A~図52Dは、修飾された核酸の濃縮についてのワークフローの例を示す。修飾された核酸の濃縮をdsDNAの変性の前(図52A、52B)または後(図52C、52D)に行なうことができる。
図53Aおよび図53Bは、ニックの入ったDNAからライブラリーを生成するためのワークフローの例を示す。 図53Aおよび図53Bは、ニックの入ったDNAからライブラリーを生成するためのワークフローの例を示す。
図54は、DNA、RNA、またはこれらの組合せを含む、足場アダプター構成の例を示す。
図55は、病原体RNAを含有する試料からシーケンシングライブラリーを生成するためのワークフローの例を示す。
詳細な説明
核酸の解析に有用な方法および組成物が、本明細書で提供される。核酸ライブラリーの生成に有用な方法および組成物も、本明細書で提供される。一本鎖核酸断片の末端の解析に有用な方法および組成物も、本明細書で提供される。ある特定の態様では、方法は、一本鎖核酸断片を含む試料核酸と指定アダプターとを結合させるステップを含む。一部の実施形態では、指定アダプターは、一本鎖核酸の末端とハイブリダイズすることができる足場ポリヌクレオチドを含む。そのようなハイブリダイゼーションの産物は、例えば、核酸ライブラリーの生成に、および/またはさらに解析もしくはプロセシングに、有用であり得る。
足場アダプター
本明細書におけるある特定の方法は、ssNAと足場アダプターまたはその成分とを結合させるステップを含む。足場アダプターは、一般に、足場ポリヌクレオチド、およびオリゴヌクレオチドを含む。したがって、足場アダプターの「成分」は、足場ポリヌクレオチド、および/もしくはオリゴヌクレオチド、またはその小成分もしくは領域を指すことがある。オリゴヌクレオチドおよび/または足場ポリヌクレオチドは、ピリミジン(C、T、U)および/またはプリン(A、G)ヌクレオチドで構成され得る。さらなる成分または小成分としては、インデックスポリヌクレオチド、固有分子識別子(UMI)、プライマー結合部位(例えば、シーケンシングプライマー結合部位、P5プライマー結合部位、P7プライマー結合部位)、フローセル結合領域などのうちの1つまたは複数、ならびにそれらの成分を挙げることができる。P5プライマー結合部位を含む足場アダプターは、P5アダプターまたはP5足場アダプターと呼ばれることがある。P7プライマー結合部位を含む足場アダプターは、P7アダプターまたはP7足場アダプターと呼ばれることがある。
足場ポリヌクレオチドは、足場アダプターの一本鎖成分である。本明細書におけるポリヌクレオチドは、一般に、5~500ヌクレオチド、例えば5~100ヌクレオチドの、ヌクレオチドの一本鎖マルチマーを指す。ポリヌクレオチドは、合成のものであることもあり、または酵素的に作製されることもあり、一部の実施形態では、長さ約5~50ヌクレオチドである。ポリヌクレオチドは、リボヌクレオチドモノマー(すなわち、ポリリボヌクレオチドまたは「RNAポリヌクレオチド」であり得る)、デオキシリボヌクレオチドモノマー(すなわち、ポリデオキシリボヌクレオチドまたは「DNAポリヌクレオチド」であり得る)、またはこれらの組合せを含有することがある。ポリヌクレオチドは、例えば、長さ10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、150~200ヌクレオチド、または500ヌクレオチド以下であり得る。用語ポリヌクレオチドをおよびオリゴヌクレオチドは、本明細書では同義で使用され得る。
足場ポリヌクレオチドは、ssNAハイブリダイゼーション領域(足場、足場領域、一本鎖足場、一本鎖足場領域とも呼ばれる)およびオリゴヌクレオチドハイブリダイゼーション領域を含み得る。ssNAハイブリダイゼーション領域およびオリゴヌクレオチドハイブリダイゼーション領域は、足場ポリヌクレオチドの小成分と呼ばれることがある。ssNAハイブリダイゼーション領域は、通常は、ssNA末端領域にハイブリダイズする、またはハイブリダイズすることができる、ポリヌクレオチドを含む。オリゴヌクレオチドハイブリダイゼーション領域は、足場アダプターのオリゴヌクレオチド成分のすべてまたは一部分にハイブリダイズする、またはハイブリダイズすることができる、ポリヌクレオチドを通常は含む。
足場ポリヌクレオチドのssNAハイブリダイゼーション領域は、ssNA末端領域に相補的または実質的に相補的である、ポリヌクレオチドを含み得る。一部実施形態では、ssNAハイブリダイゼーション領域は、ランダム配列を含む。一部の実施形態では、ssNAハイブリダイゼーション領域は、目的のssNA末端領域配列(例えば、標的配列)に相補的な配列を含む。ある特定の実施形態では、ssNAハイブリダイゼーション領域は、ssNA中の塩基との非特異的塩基対合が可能である、1つまたは複数のヌクレオチドを含む。非特異的塩基対合が可能なヌクレオチドは、ユニバーサル塩基と呼ばれることがある。ユニバーサル塩基は、4つの標準ヌクレオチド塩基:A、C、GおよびTの各々と無差別に塩基対合することができる塩基である。ssNAハイブリダイゼーション領域に組み込むことができるユニバーサル塩基としては、イノシン、デオキシイノシン、2’-デオキシイノシン(dI、dInosine)、ニトロインドール、5-ニトロインドール、および3-ニトロピロールが挙げられるが、これらに限定されない。ある特定の実施形態では、ssNAハイブリダイゼーション領域は、4つの典型的な塩基のうちの2つまたは3つ(しかしすべてではない)(例えば、非天然塩基PおよびK)を置き換えることができる1つまたは複数の縮重/ゆらぎ塩基を含む。
足場ポリヌクレオチドのssNAハイブリダイゼーション領域は、任意の好適な長さおよび配列を有し得る。一部の実施形態では、ssNAハイブリダイゼーション領域の長さは、10ヌクレオチドまたはそれ未満である。ある特定の態様では、ssNAハイブリダイゼーション領域は、長さ4~100ヌクレオチド、例えば、長さ約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95または100ヌクレオチドである。ある特定の態様では、ssNAハイブリダイゼーション領域は、長さ4~20ヌクレオチド、例えば、長さ5~15、5~10、5~9、5~8、または5~7(例えば、6または7)ヌクレオチドである。一部の実施形態では、ssNAハイブリダイゼーション領域は、長さ7ヌクレオチドである。一部の実施形態では、ssNAハイブリダイゼーション領域は、ランダムヌクレオチド配列を含むか、またはそれからなり、したがって、様々なランダムssNAハイブリダイゼーション領域を有する複数の不均一足場ポリヌクレオチドが用いられる場合、その一群が、ssNAの末端領域の配列に関係なくssNAの不均一集団のための足場ポリヌクレオチドとして作用することができる。固有のssNAハイブリダイゼーション領域配列を有する各足場ポリヌクレオチドは、足場ポリヌクレオチド種と呼ばれることがあり、複数の足場ポリヌクレオチド種の一群は、複数の足場ポリヌクレオチド種と呼ばれることがある(例えば、ssNAハイブリダイゼーション領域内に7つのランダム塩基を有するように設計された足場ポリヌクレオチドの場合、複数の足場ポリヌクレオチド種は、4の固有のssNAハイブリダイゼーション領域配列を含むことになる)。したがって、固有の足場ポリヌクレオチドを有する(すなわち、固有のssNAハイブリダイゼーション領域配列を含む)各足場アダプターは、足場アダプター種と呼ばれることもあり、複数の足場アダプター種の一群は、複数の足場アダプター種と呼ばれることがある。足場ポリヌクレオチドの種は、他の足場ポリヌクレオチド種に対して固有である特徴を一般に有する。例えば、足場ポリヌクレオチド種は、固有の配列特徴を有することができる。固有の配列特徴としては、固有の配列長、固有のヌクレオチド配列(例えば、固有のランダム配列、固有の標的配列)、または固有の配列長とヌクレオチド配列の組合せを挙げることができる。
足場ポリヌクレオチドは、インデックスポリヌクレオチド、固有分子識別子(UMI)、プライマー結合部位(例えば、P5プライマー結合部位、P7プライマー結合部位)、フローセル結合領域など、またはその相補ポリヌクレオチドを含む、1つもしくは複数のさらなる小成分を含むことがある。足場ポリヌクレオチドは、プライマー結合部位(またはプライマー結合部位に相補的なポリヌクレオチド)を含むこともある。P5プライマー結合部位を含む足場ポリヌクレオチド(またはその相補体)は、P5足場またはP5足場ポリヌクレオチドと呼ばれることがある。P7プライマー結合部位を含む足場ポリヌクレオチド(またはその相補体)は、P7足場またはP7足場ポリヌクレオチドと呼ばれることがある。
オリゴヌクレオチドは、足場アダプターのさらなる一本鎖成分であり得る。本明細書におけるオリゴヌクレオチドは、一般に、5~500ヌクレオチド、例えば5~100ヌクレオチドの、ヌクレオチドの一本鎖マルチマーを指す。オリゴヌクレオチドは、合成のものであることもあり、または酵素的に作製されることもあり、一部の実施形態では、長さ5~50ヌクレオチドである。オリゴヌクレオチドは、リボヌクレオチドモノマー(すなわち、オリゴリボヌクレオチドもしくは「RNAオリゴヌクレオチド」であり得る)、デオキシリボヌクレオチドモノマー(すなわち、オリゴデオキシリボヌクレオチドもしくは「DNAオリゴヌクレオチド」であり得る)、またはこれらの組合せを含有することがある。オリゴヌクレオチドは、例えば、長さ10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、150~200ヌクレオチド、または500ヌクレオチド以下であり得る。用語オリゴヌクレオチドおよびポリヌクレオチドは、本明細書では同義で使用され得る。
足場アダプターのオリゴヌクレオチド成分は、一般に、足場ポリヌクレオチドのオリゴヌクレオチドハイブリダイゼーション領域に相補的または実質的に相補的である核酸配列を含む。足場アダプターのオリゴヌクレオチド成分は、例えば、ssNA断片またはその誘導体のPCR増幅、ssNAまたはその誘導体のシーケンシングなどのような、1つまたは複数の下流の応用に有用な、1つまたは複数の小成分を含み得る。一部の実施形態では、オリゴヌクレオチドの小成分は、シーケンシングアダプターである。シーケンシングアダプターは、目的のシーケンシングプラットフォーム、例えば、Illumina(登録商標)により提供されているシーケンシングプラットフォーム(例えば、HiSeq(商標)、MiSeq(商標)および/もしくはGenome Analyzer(商標)シーケンシングシステム);Oxford Nanopore(商標)Technologiesにより提供されているシーケンシングプラットフォーム(例えば、MinION(商標)シーケンシングシステム);Ion Torrent(商標)により提供されているシーケンシングプラットフォーム(例えば、Ion PGM(商標)および/もしくはIon Proton(商標)シーケンシングシステム);Pacific Biosciencesにより提供されているシーケンシングプラットフォーム(例えば、SequelもしくはPACBIO RS IIシーケンシングシステム);Life Technologies(商標)により提供されているシーケンシングプラットフォーム(例えば、SOLiD(商標)シーケンシングシステム);Rocheにより提供されているシーケンシングプラットフォーム(例えば、454 GS FLX+および/もしくはGS Juniorシーケンシングシステム);Genapsysにより提供されているシーケンシングプラットフォーム;BGIにより提供されているシーケンシングプラットフォーム;または目的の任意のシーケンシングプラットフォームによって用いられる、ヌクレオチド配列(またはその相補体)の少なくとも一部分を含む、1つまたは複数の核酸ドメインを一般に指す。
一部の実施形態では、足場アダプターのオリゴヌクレオチド成分は、表面結合シーケンシングプラットフォームオリゴヌクレオチド(例えば、Illumina(登録商標)シーケンシングシステム内のフローセルの表面に結合されたP5もしくはP7オリゴヌクレオチド)に特異的に結合するドメイン(例えば、「キャプチャー部位」もしくは「キャプチャー配列」);シーケンシングプライマー結合ドメイン(例えば、Illumina(登録商標)プラットフォームのRead 1もしくはRead 2プライマーが結合し得るドメイン);固有識別子もしくはインデックス(例えば、特異的バーコードもしくは「タグ」で所与の試料からのあらゆる分子にマークを付けることにより試料多重化を可能にするためにシーケンシングされることになるssNAの試料源を一意的に識別する、バーコードもしくは他のドメイン);バーコードシーケンシングプライマー結合ドメイン(バーコードをシーケンシングするために使用されるプライマーが結合するドメイン);目的の分子に、例えば、シーケンシングされる固有のタグのインスタンスの数に基づいて発現レベルを決定するために、一意的にマークを付けるための、分子識別ドメインもしくは固有分子識別子(UMI)(例えば、4、6、もしくは他のヌクレオチド数のランダム化されたタグなどの、分子インデックスタグ);任意のそのようなドメインの成分;またはこれらの任意の組合せから選択される、核酸ドメインであるか、またはそれを含む。一部の実施形態では、バーコードドメイン(例えば、試料インデックスタグ)および分子識別ドメイン(例えば、分子インデックスタグ;UMI)を同じ核酸に含めることができる。シーケンシングプラットフォームオリゴヌクレオチド、シーケンシングプライマー、およびそれらの対応する結合ドメインを、本明細書で論じられるものを含むがそれらに限定されない様々な利用可能なシーケンシングプラットフォームおよび技術に適合するように設計することができる。
足場アダプターのオリゴヌクレオチド成分が、シーケンシングアダプターの1つまたは一部分を含む場合、様々なアプローチを使用して1つもしくは複数のさらなるシーケンシングアダプターおよび/またはそのシーケンシングアダプターの残存部分を付加させることができる。例えば、さらなるシーケンシングアダプターおよび/またはシーケンシングアダプターの残存部分を、ライゲーション、逆転写、PCR増幅などのうちのいずれか1つにより付加させることができる。PCRの場合、3’ハイブリダイゼーション領域(例えば、オリゴヌクレオチドのアダプター領域とハイブリダイズするための)とさらなるシーケンシングアダプターおよび/またはシーケンシングアダプターの残存部分を含む5’領域とを含む第1の増幅プライマー、ならびに3’ハイブリダイゼーション領域(例えば、ssNA分子の反対側の末端に付加された第2のオリゴヌクレオチドのアダプター領域とハイブリダイズするための)と、必要に応じて、さらなるシーケンシングアダプターおよび/またはシーケンシングアダプターの残存部分を含む5’領域とを含む第2の増幅プライマーを含む、増幅プライマー対を利用することができる。
足場アダプターのオリゴヌクレオチド成分は、インデックスポリヌクレオチド、固有分子識別子(UMI)、プライマー結合部位(例えば、P5プライマー結合部位、P7プライマー結合部位)、フローセル結合領域もしくはシーケンシングアダプターなど、またはそれらの相補ポリヌクレオチドを含む、1つもしくは複数のさらなる小成分を含み得る。オリゴヌクレオチドは、プライマー結合部位(またはプライマー結合部位に相補的なポリヌクレオチド)を含むこともある。P5プライマー結合部位を含むオリゴヌクレオチド(またはその相補体)は、P5オリゴまたはP5オリゴヌクレオチドと呼ばれることがある。P7プライマー結合部位を含むオリゴヌクレオチド(またはその相補体)は、P7オリゴまたはP7オリゴヌクレオチドと呼ばれることがある。
足場ポリヌクレオチドをオリゴヌクレオチドとハイブリダイズさせて、足場アダプター内に二重鎖を形成することができる。したがって、足場アダプターは、足場二重鎖、二重鎖アダプター、二重鎖オリゴヌクレオチド、または二重鎖ポリヌクレオチドと呼ばれることがある。固有の足場ポリヌクレオチドを有する(すなわち、固有のssNAハイブリダイゼーション領域配列を含む)各足場二重鎖は、足場二重鎖種と呼ばれることがあり、複数の足場二重鎖種の一群は、複数の足場二重鎖種と呼ばれることがある。一部の実施形態では、足場ポリヌクレオチドおよびオリゴヌクレオチドは、別々のDNA鎖上にある。一部の実施形態では、足場ポリヌクレオチドおよびオリゴヌクレオチドは、単一のDNA鎖(例えば、ヘアピン構造を形成することができる単一のDNA鎖)上にある。
足場アダプターは、DNA、RNA、またはこれらの組合せを含むことができる。足場アダプターは、DNA足場ポリヌクレオチドとDNAオリゴヌクレオチド、DNA足場ポリヌクレオチドとRNAオリゴヌクレオチド、RNA足場ポリヌクレオチドとDNAオリゴヌクレオチド、またはRNA足場ポリヌクレオチドとRNAオリゴヌクレオチドを含むことができる。足場アダプター組成物および設計の例は、図54に示されている(縦線の陰影はRNAを示し、斜線の陰影はDNAを示す)。図54、上部は、RNA試料核酸に伴う、DNA足場ポリヌクレオチドとDNAオリゴヌクレオチドとを含む足場アダプターを示し、そのようなアダプターとともに使用するためのリガーゼの例としては、T4 RNAリガーゼ2およびT4 DNAリガーゼが挙げられる。図54、中央部は、RNA試料核酸に伴う、DNA足場ポリヌクレオチドとRNAオリゴヌクレオチドとを含む足場アダプターを示し、そのようなアダプターとともに使用するためのリガーゼの例としては、T4 RNAリガーゼ1が挙げられる。図54、下部は、RNA試料核酸に伴う、RNA足場ポリヌクレオチドとRNAオリゴヌクレオチドとを含む足場アダプターを示し、そのようなアダプターとともに使用するためのリガーゼの例としては、T4 RNAリガーゼ1が挙げられる。一部の事例では、アダプターヌクレオチド組成物は、試料核酸と足場アダプター核酸間の均一性をもたらすように(例えば、少なくともオリゴヌクレオチドが試料核酸と均一であるように)選択される。一部の事例では、アダプターヌクレオチド組成物は、オリゴヌクレオチドと試料核酸間の均一性、および足場ポリヌクレオチドと試料核酸間の不均一性をも生じさせるように、選択される。
足場アダプターまたはその成分とssNAとの結合
本明細書における方法は、1つもしくは複数の足場アダプターまたはその成分と、一本鎖核酸(ssNA)を含む組成物とを結合させて、1つまたは複数の複合体を形成するステップを含み得る。足場ポリヌクレオチドは、複合体形成時にオリゴヌクレオチド成分の末端がssNA断片の末端領域の末端に隣接しているような、ssNA断片およびオリゴヌクレオチド成分との同時ハイブリダイゼーションのために、設計される。通常は、複合体形成時にオリゴヌクレオチド成分の5’末端は、ssNAの末端領域の3’末端に隣接しているか、またはオリゴヌクレオチド成分の5’末端は、ssNAの末端領域の3’末端に隣接している。複合体形成時に足場アダプターがssNA断片の両方の末端に結合される事例では、1つのオリゴヌクレオチド成分の5’末端は、ssNAの1つの末端領域の3’末端に隣接しており、第2のオリゴヌクレオチド成分の5’末端は、ssNAの第2の末端領域の3’末端に隣接している。
一部の実施形態では、方法は、ssNA組成物と、オリゴヌクレオチドと、不確定配列の末端領域を有するssNAの不均一集団のための足場として作用することができる様々なランダムssNAハイブリダイゼーション領域を有する複数の不均一足場ポリヌクレオチドとを結合させることにより、複合体を形成するステップを含む。
一部の実施形態では、ssNAハイブリダイゼーション領域は、既知配列のssNA末端領域とハイブリダイズするように設計された既知配列を含む。一部の実施形態では、既知配列の異なるssNAハイブリダイゼーション領域を有する2つまたはそれより多くの不均一足場ポリヌクレオチドは、既知配列のそれぞれのssNA末端領域とハイブリダイズするように設計される。ssNAハイブリダイゼーション領域が既知配列を有する実施形態は、例えば、既知配列の末端領域を有するssNAのサブセットからの核酸ライブラリーの生成に、有用であり得る。したがって、ある特定の実施形態では、本明細書における方法は、ssNA組成物と、オリゴヌクレオチドと、既知配列の1つまたは複数の末端領域を有する1つまたは複数のssNAのための足場として作用することができる既知配列の1つまたは複数の異なるssNAハイブリダイゼーション領域を有する1つまたは複数の不均一足場ポリヌクレオチドとを結合させることにより、複合体を形成するステップを含む。
ssNA断片、オリゴヌクレオチドおよび足場ポリヌクレオチドを、様々な方法で結合させることができる。一部の構成では、結合させることは、1)オリゴヌクレオチドハイブリダイゼーション領域によってオリゴヌクレオチド成分にハイブリダイズされた足場ポリヌクレオチドを含む複合体と、2)ssNA断片とを結合させることを含む。別の構成では、結合させることは、1)ssNAハイブリダイゼーション領域によってssNA断片にハイブリダイズされた足場ポリヌクレオチドを含む複合体と、2)オリゴヌクレオチド成分とを結合させることを含む。別の構成では、結合させることは、1)ssNA断片と、2)オリゴヌクレオチドと、3)足場ポリヌクレオチドとを結合させることを含み、この場合、3成分のいずれも、結合させる前に別の成分と、事前に複合体を形成されず、ハイブリダイズもされない。
結合させることは、ssNAハイブリダイゼーション領域によってssNA断片の末端領域とハイブリダイズされた足場ポリヌクレオチドと、オリゴヌクレオチドハイブリダイゼーション領域によってオリゴヌクレオチド成分とハイブリダイズされた足場ポリヌクレオチドとを含む複合体が形成されるようなハイブリダイゼーション条件下で、行なうことができる。特異的ハイブリダイゼーションが起こるかどうかは、足場ポリヌクレオチド、ssNA断片の末端領域およびオリゴヌクレオチド成分の、ハイブリダイゼーション領域間の相補性度、ならびにそれらの長さ、塩濃度、およびハイブリダイゼーションが起こる温度などの要因によって判定することができ、ハイブリダイゼーションが起こる温度は、関連領域の融解温度(Tm)から情報を得るこができる。
複合体を、オリゴヌクレオチド成分の末端がssNA断片の末端領域の末端に隣接しているように形成することができる。~に隣接しているとは、オリゴヌクレオチドの末端の末端ヌクレオチドと、ssNA断片の末端領域の末端ヌクレオチド末端とが、これらの末端ヌクレオチドを、例えば、化学的ライゲーション、酵素的ライゲーションなどにより、共有結合で連結することができるほど十分に、互いに近接していることを指す。一部の実施形態では、末端は、オリゴヌクレオチドの末端の末端ヌクレオチドとssNAの末端領域の末端ヌクレオチド末端が足場ポリヌクレオチドの隣接ヌクレオチドにハイブリダイズされていることによって、互いに隣接している。足場ポリヌクレオチドを、オリゴヌクレオチドの末端がssNA断片の末端領域の末端に確実に隣接しているように設計することができる。
足場ポリヌクレオチドを、チミンの代わりに1つまたは複数のウラシル塩基を用いて設計することができる。一部の実施形態では、足場アダプター二重鎖における鎖の一方を、例えばウラシル-DNAグリコシラーゼおよびエンドヌクレアーゼを使用することによって、ウラシル塩基の位置に複数の切断部位を生成することにより、分解することができる。
足場アダプター、オリゴヌクレオチド成分、および足場ポリヌクレオチドは、本明細書では、第1の足場アダプター(もしくは第1の足場二重鎖)、第1のオリゴヌクレオチド成分(もしくは第1のオリゴヌクレオチド)、および第1の足場ポリヌクレオチド;または第2の足場アダプター(もしくは第2の足場二重鎖)、第2のオリゴヌクレオチド成分(もしくは第2のオリゴヌクレオチド)、および第2の足場ポリヌクレオチドと、呼ばれることがある。第1のおよび第2のという用語は、ssNA断片末端の第1の末端および第2の末端(すなわち、5’末端および3’末端)とハイブリダイズしている、ならびに/またはこれらに共有結合で連結されている、足場アダプターまたはその成分を、一般に指す。第1の末端および第2の末端という用語は、ssNA断片の特定の方向性を必ずしも指すとは限らない。したがって、ssNA末端の第1の末端は、5’末端であることもあり、または3’末端であることもあり、ssNA末端の第2の末端は、5’末端であることもあり、または3’末端であることもある。第1の足場アダプター、またはその成分は、P5アダプター、もしくはその成分、またはP7アダプター、もしくはその成分を指すことがある。第2の足場アダプター、またはその成分は、P5アダプター、もしくはその成分、またはP7アダプター、もしくはその成分を指すことがある。
一部の事例では、足場アダプターまたはその成分と、ssNAを含む核酸試料とを結合させる前に、核酸試料をヌクレアーゼで処理して望ましくない核酸を除去することができる。例えば、本明細書で開示されるように、二本鎖特異的ヌクレアーゼ(例えば、T7ヌクレアーゼ)を使用して一部のまたはすべての二本鎖DNAを消化することができ、次いで、足場用アダプターを使用して残存核酸のシーケンシングライブラリーを調製することができる。ある例では、二本鎖特異的ヌクレアーゼは、試料中の二本鎖核酸を消化するために使用され、宿主生物および/または細菌からの二本鎖DNAを消化するが、一本鎖DNAウイルス、一本鎖RNAウイルスおよび一本鎖DNA(例えば、損傷したDNA)からのものなどの無傷一本鎖核酸を残す。
足場アダプターまたはその成分とssRNAまたはsscDNAとの結合
本明細書における方法は、1つまたは複数の複合体を形成するために、1つもしくは複数の足場アダプターまたはその成分と、一本鎖リボ核酸(ssRNA)または一本鎖相補デオキシリボ核酸(sscDNA)を含む組成物とを結合させるステップを含み得る。足場ポリヌクレオチドは、ssNAについて上記で説明されたように、複合体形成時にオリゴヌクレオチド成分の末端がssRNAもしくはsscDNA断片の末端領域の末端に隣接しているような、ssRNAまたはsscDNA断片およびオリゴヌクレオチド成分との同時ハイブリダイゼーションのために、設計される。
一部の実施形態では、核酸組成物は、sscDNAを含む。一部の実施形態では、方法は、結合させるステップの前に、sscDNAを一本鎖リボ核酸(ssRNA)から生成するステップを含む。通常は、核酸組成物がsscDNAを含む場合、本明細書における方法は、第1鎖cDNAを使用し、第2鎖cDNAの生成を必要としない。したがって、一部の実施形態では、核酸組成物は、第1鎖sscDNAを含む。一部の実施形態では、核酸組成物は、第1鎖sscDNAから本質的になる。第1鎖sscDNA「から本質的になる」核酸組成物は、一般に、第1鎖sscDNAを含み、さらなるタンパク質も核酸成分も含まない。第1鎖sscDNAから本質的になる核酸組成物は、一般に、第2鎖sscDNAを含まない。加えて、例えば、第1鎖sscDNA「から本質的になる」核酸組成物は、二本鎖cDNA(dscDNA)を含まないこともあり、または低いパーセンテージのdscDNA(例えば、10%未満のdscDNA、5%未満のdscDNA、1%未満のdscDNA)を含むこともある。第1鎖sscDNA「から本質的になる」核酸組成物は、タンパク質を含まないこともある。例えば、第1鎖sscDNA「から本質的になる」核酸組成物は、一本鎖結合タンパク質(SSB)も、第1鎖sscDNAの安定化に有用な他のタンパク質も含まないことがある。第1鎖sscDNA「から本質的になる」核酸組成物は、核酸組成物中に通常は存在する化学成分、例えば、緩衝剤、塩、アルコール、クラウディング剤(例えば、PEG)などを含むことがあり、核酸源(例えば、試料)からの、核酸抽出からの、またはcDNA合成からの残留成分(例えば、核酸(例えば、残留RNA)、タンパク質、細胞膜成分)を含むこともある。第1鎖sscDNA「から本質的になる」核酸組成物は、1つまたは複数のリン酸(例えば、末端リン酸、5’末端リン酸)を有する第1鎖sscDNA断片を含むことがある。第1鎖sscDNA「から本質的になる」核酸組成物は、1つまたは複数の修飾ヌクレオチドを含む第1鎖sscDNA断片を含むこともある。
一部の実施形態では、sscDNAを生成するステップは、ssRNAと、プライマー、および逆転写酵素活性を有する薬剤とを接触させることによって、DNA-RNA二重鎖を生成することを含む。一部の実施形態では、sscDNAを生成するステップは、DNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることによって、RNAを消化し、sscDNA産物を生成することをさらに含むことがある。一部の実施形態では、逆転写酵素活性を有する薬剤は、RNAse活性も有する。したがって、一部の実施形態では、逆転写およびRNAse消化は、1ステップに組み合わせられる。一部の実施形態では、逆転写酵素活性およびRNAse活性を有する薬剤は、M-MuLV逆転写酵素(M-MLV逆転写酵素とも呼ばれる)である。プライマー(単数または複数)は、逆転写酵素とともに使用するのに好適な任意のプライマー(単数または複数)であり得る。プライマー(単数または複数)は、ランダムプライマー(例えば、ランダムヘキサマープライマー、ランダムオクタマープライマー)、およびポリ(T)プライマーのうちの1つまたは複数から選択することができる。sscDNA産物を、好適な精製または洗浄方法、例えば、本明細書に記載される精製または洗浄方法により、精製することができる。
一部の実施形態では、核酸組成物は、ssRNAを含む。そのような実施形態では、足場アダプターは、ssRNA断片に直接ハイブリダイズされ、オリゴヌクレオチド成分は、ssRNAの末端のうちの1つまたは複数の末端に共有結合で連結され、それによって、1つまたは複数の足場アダプターとssRNA断片とを含有するハイブリダイゼーション産物が形成される。一部の実施形態では、方法は、一本鎖ライゲーション産物をハイブリダイゼーション産物から(例えば、ハイブリダイゼーション産物を変性させることにより)生成するステップをさらに含む。そのような実施形態では、一本鎖ライゲーション産物は、1つまたは複数のオリゴヌクレオチド成分に共有結合で連結されたssRNA断片を含む。一部の実施形態では、方法は、一本鎖ライゲーション産物と、プライマー、および逆転写酵素活性を有する薬剤とを接触させることによって、DNA-RNA二重鎖を生成するステップをさらに含む。一部の実施形態では、方法は、DNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることによって、RNAを消化し、一本鎖cDNA(sscDNA)産物を生成するステップをさらに含む。一部の実施形態では、逆転写酵素活性を有する薬剤は、RNAse活性も有する。したがって、一部の実施形態では、逆転写およびRNAse消化は、1ステップに組み合わせられる。一部の実施形態では、逆転写酵素活性およびRNAse活性を有する薬剤は、M-MuLV逆転写酵素(M-MLV逆転写酵素とも呼ばれる)である。プライマーは、逆転写酵素とともに使用するのに好適な任意のプライマーであり得る。一部の実施形態では、プライマーは、オリゴヌクレオチド成分(すなわち、ssRNA断片に共有結合で連結されたオリゴヌクレオチド成分)中の配列に相補的なヌクレオチド配列を含む。sscDNA産物を、好適な精製または洗浄方法、例えば、本明細書に記載される精製または洗浄方法により、精製することができる。
一部の実施形態では、sscDNA産物は、増幅される。sscDNA産物を、好適な増幅方法、例えば、本明細書に記載される増幅方法により、増幅することができる。一部の実施形態では、sscDNA産物を増幅させるステップを、DNA-RNA二重鎖を生成するステップおよび/またはsscDNA産物を生成するステップと同時に行なう(例えば、単一のステップ、反応、容器および/または体積で同時に行なう)ことができる。したがって、DNA-RNA二重鎖を生成するための試薬(例えば、逆転写酵素活性を有する1つまたは複数の薬剤)、sscDNA産物を生成するための試薬(例えば、RNAse活性を有する1つまたは複数の薬剤)およびsscDNA産物を増幅させるための試薬(例えば、プライマー、ポリメラーゼ活性を有する薬剤)を単一のステップ、反応、容器および/または体積で使用するために組み合わせることができる。一部の実施形態では、sscDNA産物を増幅させるための試薬は、本明細書に記載される足場アダプターの成分(例えば、第1のオリゴヌクレオチド)とハイブリダイズする増幅プライマーを含む。増幅プライマーは、ポリメラーゼとともに使用するのに好適な任意のプライマーであり得る。一部の実施形態では、各プライマーは、オリゴヌクレオチド成分(すなわち、ssRNA断片に共有結合で連結されたオリゴヌクレオチド成分)に対応するsscDNA産物中の配列に相補的なヌクレオチド配列を含む。増幅されたsscDNA産物を、好適な精製または洗浄方法、例えば、本明細書に記載される精製または洗浄方法により、精製することができる。
一部の実施形態では、本明細書における方法は、ssRNAと足場アダプターもしくはその成分とを結合させるステップの前に、またはsscDNAを生成するステップの前に、ssRNAを断片化することによってssRNA断片を生成するステップを含む。例えば、本明細書に記載される断片化方法などの、任意の好適な断片化方法を使用することができる。一部の実施形態では、本明細書における方法は、ssRNAと足場アダプターもしくはその成分とを結合させるステップの前に、またはsscDNAを生成するステップの前に、リボソームRNA(rRNA)を枯渇させるステップおよび/またはメッセンジャーRNA(mRNA)を濃縮するステップを含む。例えば、本明細書に記載されるrRNA枯渇方法および/またはmRNA濃縮方法などの、任意の好適なrRNA枯渇方法および/またはmRNA濃縮方法を使用することができる。
ハイブリダイゼーションおよびライゲーション
核酸断片(例えば、ssNA断片)を足場アダプターまたはその成分と結合させることによって結合産物を生成する。ssNA断片と足場アダプターまたはその成分とを結合させることは、ハイブリダイゼーションおよび/またはライゲーション(例えば、ハイブリダイゼーション産物のライゲーション)含み得る。結合産物は、ssNA断片の一方または両方の末端で足場アダプターまたはその成分に接続された(例えば、それとハイブリダイズされた、および/またはそれにライゲーションされた)ssNA断片を含み得る。結合産物は、ssNA断片の一方または両方の末端で足場アダプターまたはその成分とハイブリダイズされたssNA断片を含むことがあり、この断片は、ハイブリダイゼーション産物と呼ばれることがある。結合産物は、ssNA断片の一方または両方の末端で足場アダプターまたはその成分にライゲーションされたssNA断片を含むことがあり、この断片は、ライゲーション産物と呼ばれることがある。一部の実施形態では、切断ステップからの産物(すなわち、切断産物)を足場アダプターまたはその成分と結合させることによって結合産物を生成することができる。本明細書におけるある特定の方法は、結合産物のセット(例えば、結合産物の第1のセットおよび結合産物の第2のセット)を生成するステップを含む。一部の実施形態では、結合産物の第1のセットは、足場アダプター、またはその成分の第1のセットからの足場アダプターまたはその成分に接続された(例えば、それとハイブリダイズされた、および/またはそれにライゲーションされた)ssNAを含む。一部の実施形態では、結合産物の第2のセットは、足場アダプター、またはその成分の第2のセットからの足場アダプターまたはその成分に接続された(例えば、それとハイブリダイズされた、および/またはそれにライゲーションされた)結合産物の第1のセットを含む。
ssNAを足場アダプターまたはその成分とハイブリダイゼーション条件下で結合させることによってハイブリダイゼーション産物を生成することができる。一部の実施形態では、足場アダプターは、事前にハイブリダイズされた産物として提供され、ハイブリダイゼーションステップは、足場アダプターをssNAとハイブリダイズさせることを含む。一部の実施形態では、足場アダプター成分(すなわち、オリゴヌクレオチドおよび足場ポリヌクレオチド)は、個々の成分として提供され、ハイブリダイゼーションステップは、足場アダプター成分を1)互いに、および2)ssNAと、ハイブリダイズさせることを含む。一部の実施形態では、足場アダプター成分(すなわち、オリゴヌクレオチドおよび足場ポリヌクレオチド)は、個々の成分として逐次的に提供され、ハイブリダイゼーションステップは、1)足場ポリヌクレオチドをssNAとハイブリダイズさせること、次いで、2)オリゴヌクレオチドを足場ポリヌクレオチドのオリゴヌクレオチドハイブリダイゼーション領域とハイブリダイズさせることを含む。結合させるステップ中の条件は、足場アダプター、またはその成分(例えば、一本鎖足場領域)が、一本鎖足場領域に対して配列が相補的である末端領域(単数または複数)を有するssNAと、特異的にハイブリダイズする条件である。結合させるステップ中の条件は、足場アダプターの成分(例えば、オリゴヌクレオチド、および足場ポリヌクレオチド中のオリゴヌクレオチドハイブリダイゼーション領域)が互いに特異的にハイブリダイズするまたはハイブリダイズした状態のままである条件も含み得る。
特異的ハイブリダイゼーションは、一本鎖足場領域とssNA末端領域とのまたはオリゴヌクレオチドとオリゴヌクレオチドハイブリダイゼーション領域との相補性度、それらの長さ、およびハイブリダイゼーションが起こる温度などの要因による影響を被るまたは影響を受ける可能性があり、ハイブリダイゼーションが起こる温度は、一本鎖足場領域の融解温度(Tm)から情報を得ることができる。融解温度は、一本鎖足場領域/ssNA末端領域の半分がハイブリダイズした状態のままであり、一本鎖足場領域/ssNA末端領域の半分が解離して一本鎖になる、温度を一般に指す。二重鎖のTmは、実験により決定することができ、または式Tm=81.5+16.6(log10[Na+])+0.41(分率G+C)-(60/N)(式中、Nは、鎖長であり、[Na+]は、1M未満である)を使用して予測することができる。様々なパラメーターに依存するさらなるモデルを使用して、様々なハイブリダイゼーション条件に依存する関連領域のTmを予測することができる。具体的な核酸ハイブリダイゼーションを達成するためのアプローチは、例えば、Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, part I, chapter 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," Elsevier (1993)に記載されている。
一部の実施形態では、本明細書における方法は、ssNAの末端が、それがハイブリダイズされる足場アダプターの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む。詳細には、本明細書における方法は、ssNAの末端が、それがハイブリダイズされる足場アダプターのオリゴヌクレオチド成分の末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含み得る。結合は、ssNAの、それがハイブリダイズされる足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分への共有結合を可能にする、任意の好適なアプローチにより果たすことができる。ssNAの一方の末端が、それがハイブリダイズされる足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分の末端に結合されるとき、通常は、次の2つの結合事象の一方が行なわれる:1)足場アダプターのオリゴヌクレオチド成分の5’末端へのssNAの3’末端の結合事象、または2)足場アダプターのオリゴヌクレオチド成分の3’末端へのssNAの5’末端の結合事象。ssNAの両方の末端が、それがハイブリダイズされる足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分の末端に各々結合されるとき、通常は、次の2つの結合事象が行なわれる:1)第1の足場アダプターのオリゴヌクレオチド成分の5’末端へのssNAの3’末端の結合事象、および2)第2の足場アダプターのオリゴヌクレオチド成分の3’末端へのssNAの5’末端の結合事象。
一部の実施形態では、本明細書における方法は、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、ssNAの末端が、標的核酸(ssNA)がハイブリダイズされる足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分の末端に共有結合で連結される条件下で、接触させるステップを含む。リガーゼ活性は、例えば、平滑末端リガーゼ活性、ニックシーリングリガーゼ活性、突出末端リガーゼ活性、環状化リガーゼ活性、付着末端リガーゼ活性、DNAリガーゼ活性、RNAリガーゼ活性、一本鎖リガーゼ活性、および二本鎖リガーゼ活性を含み得る。リガーゼ活性は、1つのポリヌクレオチドの5’リン酸化末端を別のポリヌクレオチドの3’OH末端に(5’Pを3’OHに)ライゲーションすることを含み得る。リガーゼ活性は、1つのポリヌクレオチドの3’リン酸化末端を別のポリヌクレオチドの5’OH末端に(3’Pを5’OHに)ライゲーションすることを含むことがある。リガーゼ活性は、ssNAの5’末端を、それとハイブリダイズされる足場アダプターおよび/またはそれとハイブリダイズされる足場アダプターのオリゴヌクレオチド成分の3’末端に、ライゲーション反応でライゲーションすることを含むことがある。リガーゼ活性は、ssNAの3’末端を、それとハイブリダイズされる足場アダプターおよび/またはそれとハイブリダイズされる足場アダプターのオリゴヌクレオチド成分の5’末端に、ライゲーション反応でライゲーションすることを含み得る。ライゲーション反応を行うための好適な試薬(例えば、リガーゼ)およびキットは、公知であり、入手可能である。例えば、New England Biolabs(Ipswich、MA)から入手可能なInstant Sticky-end Ligase Master Mixを使用することができる。使用することができるリガーゼとしては、例えば、T3リガーゼ、T4 DNAリガーゼ(例えば、低または高濃度で)、T7 DNAリガーゼ、E.coli DNAリガーゼ、Electro Ligase(登録商標)、RNAリガーゼ、T4 RNAリガーゼ2、SplintR(登録商標)リガーゼ、RtcBリガーゼ、Taqリガーゼなど、およびこれらの組合せを挙げることができるが、それらに限定されない。必要とされる場合、例えばT4ポリヌクレオチドキナーゼ(PNK)などの、好適なキナーゼを使用して、リン酸基をオリゴヌクレオチド成分またはssNA断片の5’末端に付加させることができる。そのようなキナーゼ、および5’末端をリン酸化するためにそのようなキナーゼを使用するためのガイダンスは、例えば、New England BioLabs,Inc.(Ipswich、MA)から入手可能である。
一部の実施形態では、方法は、オリゴヌクレオチド成分およびssNA末端領域の隣接している末端を共有結合で連結させるステップを含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される。一部の実施形態では、共有結合で連結させるステップは、ハイブリダイゼーション産物(例えば、本明細書における少なくとも1つの足場アダプターとハイブリダイズされたssNA断片)と、リガーゼ活性を有する薬剤とを、ssNA末端領域の末端がオリゴヌクレオチド成分の末端に共有結合で連結される条件下で接触させることを含む。一部の実施形態では、方法は、第1のオリゴヌクレオチド成分および第1のssNA末端領域の隣接している末端を共有結合で連結させるステップと、第2のオリゴヌクレオチド成分および第2のssNA末端領域の隣接している末端を共有結合で連結させるステップとを含み、それによって共有結合で連結されたハイブリダイゼーション産物が生成される。一部の実施形態では、共有結合で連結させるステップは、ハイブリダイゼーション産物(例えば、本明細書における2つの足場アダプターと各々がハイブリダイズするssNA断片)と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチド成分の末端に共有結合で連結され、第2のssNA末端領域の末端が第2のオリゴヌクレオチド成分の末端に共有結合で連結される条件下で、接触させることを含む。一部の実施形態では、リガーゼ活性を有する薬剤は、T4 DNAリガーセである。一部の実施形態では、T4 DNAリガーゼは、約1単位/μl~約50単位/μlの間の量で使用される。一部の実施形態では、T4 DNAリガーゼは、約5単位/μl~約30単位/μlの間の量で使用される。一部の実施形態では、T4 DNAリガーゼは、約5単位/μl~約15単位/μlの間の量で使用される。一部の実施形態では、T4 DNAリガーゼは、約10単位/μlで使用される。一部の実施形態では、T4 DNAリガーゼは、25単位/μl未満の量で使用される。一部の実施形態では、T4 DNAリガーゼは、20単位/μl未満の量で使用される。一部の実施形態では、T4 DNAリガーゼは、15単位/μl未満の量で使用される。一部の実施形態では、T4 DNAリガーゼは、10単位/μl未満の量で使用される。
一部の実施形態では、ハイブリダイゼーション産物は、第1のリガーゼ活性を有する第1の薬剤、および第1のリガーゼ活性とは異なる第2のリガーゼ活性を有する第2の薬剤と接触される。例えば、第1のリガーゼ活性および第2のリガーゼ活性は、平滑末端リガーゼ活性、ニックシーリングリガーゼ活性、突出末端リガーゼ活性、環状化リガーゼ活性、および付着末端リガーゼ活性、二本鎖リガーゼ活性、一本鎖リガーゼ活性、5’Pの3’OHに対するリガーゼ活性、および3’Pの5’OHに対するリガーゼ活性から独立して選択することができる。
一部の実施形態では、本明細書における方法は、ssNAを、足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分に、生体適合性結合によって結合させるステップを含む。方法は、例えば、生体分子を結合させるのに有用な生体適合性反応を含む、クリックケミストリーまたはタグ付けを含み得る。一部の実施形態では、オリゴヌクレオチド成分の各々についての末端は、第1の化学反応性部分を含み、ssNAの各々についての末端は、第2の化学反応性部分を含む。そのような実施形態では、第1の化学反応性部分は、通常は、第2の化学反応性部分と反応することができ、足場アダプターのオリゴヌクレオチド成分と、足場アダプターがハイブリダイズされるssNAとの間に、共有結合を形成することができる。一部の実施形態では、本明細書における方法は、ssNAと、1つまたは複数の化学剤とを、第2の化学反応性部分がssNA断片の各々についての末端に組み込まれる条件下で、接触させるステップを含む。一部の実施形態では、本明細書における方法は、第1の化学反応性部分が第2の化学反応性部分と反応して、オリゴヌクレオチド成分と足場アダプターがハイブリダイズされるssNAとの間に共有結合を形成する条件に、ハイブリダイゼーション産物を曝露するステップを含む。一部の実施形態では、第1の化学反応性部分は、第2の化学反応性部分と反応して、オリゴヌクレオチド成分と、足場アダプターがハイブリダイズされるssNAとの間に1,2,3-トリアゾールを形成することができる。一部の実施形態では、第1の化学反応性部分は、銅を含む条件下で、第2の化学反応性部分と反応することができる。第1および第2の化学反応性部分は、任意の好適な対合を含み得る。例えば、第1の化学反応性部分は、アジド含有部分および5-オクタジイニルデオキシウラシルから選択することができ、第2の化学反応性部分は、独立して、アジド含有部分、ヘキシニルおよび5-オクタジイニルデオキシウラシルから選択することができる。一部の実施形態では、アジド含有部分は、N-ヒドロキシスクシンイミド(NHS)エステル-アジドである。
オリゴヌクレオチドおよびssNA断片の隣接している末端を共有結合で連結させると、共有結合で連結された産物が生成され、この産物は、ライゲーション産物と呼ばれることがある。足場ポリヌクレオチドとハイブリダイズした状態のままである、オリゴヌクレオチド成分に共有結合で連結されたssNA断片を含む、共有結合で連結された産物は、共有結合で連結されたハイブリダイゼーション産物と呼ばれることがある。共有結合で連結されたハイブリダイゼーション産物を変性させて(例えば、熱変性させて)、足場ポリヌクレオチドからのオリゴヌクレオチド成分に共有結合で連結されたssNA断片を分離することができる。足場ポリヌクレオチドともはやハイブリダイズしていない(変性後の)、オリゴヌクレオチド成分に共有結合で連結されたssNA断片を含む、共有結合で連結された産物は、一本鎖ライゲーション産物と呼ばれることがある。一部の事例では、足場ポリヌクレオチドの部分を、例えば、足場ポリヌクレオチド中の1つまたは複数のウラシル塩基に対してウラシル-DNAグリコシラーゼまたはエンドヌクレアーゼを使用することにより、切断することおよび/または変性させることができる。
共有結合で連結されたハイブリダイゼーション産物および/または一本鎖ライゲーション産物を、目的の下流の応用(例えば、増幅;シーケンシング)で投入物として使用する前に精製することができる。例えば、共有結合で連結されたハイブリダイゼーション産物および/または一本鎖ライゲーション産物を、結合させるステップ、ハイブリダイゼーションステップおよび/または共有結合で連結させる(ライゲーション)ステップ中に存在するある特定の成分から(例えば、固相可逆的固定法(SPRI)、カラム精製、および/またはこれらに類することにより)精製することができる。
一部の実施形態では、本明細書における方法が、ssNA組成物と本明細書における足場アダプターまたはその成分とを結合させるステップ、ならびにオリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるステップを含む場合、結合させるステップおよび共有結合で連結させるステップの全継続時間は、4時間もしくはそれ未満、3時間もしくはそれ未満、2時間もしくはそれ未満、または1時間もしくはそれ未満であり得る。一部の実施形態では、結合させるステップおよび共有結合で連結させるステップの全継続時間は、1時間未満である。
一部の実施形態では、本明細書における方法は、マイクロ流体デバイスを含むがこれに限定されない、単一容器、単一チャンバおよび/または単一体積(すなわち、連続体積)で行なわれる。一部の実施形態では、ssNA組成物と本明細書における足場アダプターまたはその成分とを結合させるステップ、ならびにオリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるステップは、マイクロ流体デバイスを含むがこれに限定されない、単一容器、単一チャンバおよび/または単一体積(すなわち、連続体積)で行なわれる。一部の実施形態では、本明細書における方法は、マイクロ流体デバイスを含むがこれに限定されない、一連のウェル、液滴、エマルジョン、区画または他の反応体積で行なわれる。一部の実施形態では、ssNA組成物と本明細書における足場アダプターまたはその成分とを結合させるステップ、ならびにオリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるステップは、マイクロ流体デバイスを含むがこれに限定されない、一連のウェル、液滴、エマルジョン、区画または他の反応体積で行なわれる。一部の事例では、一連の反応体積は、反応体積の大部分またはすべてが、多くても1つのssNAしか含まないように、調製される。一部の事例では、一連の反応体積は、反応体積の大部分またはすべてが、多くても2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000またはそれより多くのssNAしか含まないように、調製される。反応体積への1つまたは限られた数のssNAの分配は、試料核酸の希少種のライブラリー変換を増加させることなどの、好ましい反応動態をもたらすことができる。
アダプターダイマー
一部の実施形態では、本明細書における方法は、アダプターダイマーを防止する、低減させるまたは消失させるための1または複数の修飾および/またはさらなるステップを含む。アダプターダイマーは、本明細書に記載される方法中に意図せず形成されることがある。アダプターダイマーは、互いにハイブリダイズするかまたはハイブリダイズしてライゲーションする2つもしくはそれより多くの足場アダプター、それらの成分、またはそれらの部分を、一般に指す。ある特定のアダプターダイマー構成の例は、図20に提供されている。
ある特定の実施形態では、足場アダプター、またはその成分は、アダプターダイマー形成を防止するように修飾される。足場アダプターの修飾の例としては、足場アダプター、オリゴヌクレオチド成分または足場ポリヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子(例えば、別の足場アダプター、オリゴヌクレオチド成分および/または足場ポリヌクレオチド)への、共有結合性連結を遮断することができる修飾ヌクレオチドが、挙げられる。修飾ヌクレオチドの例は、下で説明される。足場アダプターの他の/さらなる修飾は、Y構成またはヘアピン構成などの構成を含み、これらの構成は、下でさらに詳細に説明される。一部の実施形態では、足場アダプター、オリゴヌクレオチド成分は、および/または足場ポリヌクレオチドは、ホスホロチオエート骨格修飾(例えば、鎖上の最後の2ヌクレオチド間のホスホロチオエート結合)を含むことがある。
一部の実施形態では、方法は、アダプターダイマー形成を防止または低減させるための脱リン酸化ステップを含む。一部の実施形態では、方法は、足場アダプターまたはその成分をssNAと結合させるステップの前に、足場アダプター、オリゴヌクレオチド成分および/または足場ポリヌクレオチドと、ホスファターゼ活性を有する薬剤とを、足場アダプター、オリゴヌクレオチド成分および/または足場ポリヌクレオチドが脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された足場アダプター、脱リン酸化されたオリゴヌクレオチド成分、および/または脱リン酸化された足場ポリヌクレオチドが生成される。
一部の実施形態では、方法は、アダプターダイマー形成を防止または低減させるための1つまたは複数の段階的なライゲーションアプローチを含む。一部の実施形態では、方法は、ホスホリル転移活性を有する薬剤の付加を(例えば、ハイブリダイゼーション産物が形成し終えるまで)遅延させること、および/または第2の足場アダプターもしくはその成分の付加を遅延させることを含む、段階的なライゲーションを含む(図9を参照されたい)。例えば、方法は、ハイブリダイゼーション産物を形成するステップの後、かつオリゴヌクレオチド成分をssNA末端領域に共有結合で連結させるステップの前に、オリゴヌクレオチド成分と、ホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド成分の5’末端に付加される条件下で接触させるステップを含み得る。別の例では、方法は、足場アダプターの第1のセットをssNAと結合させるステップを含み得る。足場アダプターの第1のセットは、3’OHを有するオリゴヌクレオチド成分を含み得る。足場アダプターの第1のセットは、ssNAにハイブリダイズされ、オリゴヌクレオチド成分の3’OHは、ssNA末端領域の5’末端(例えば、5’リン酸化末端)に共有結合で連結される。ハイブリダイゼーションおよび共有結合性連結のこのような第1のラウンドの産物は、共有結合で連結されたハイブリダイゼーション産物中間体と呼ばれることがある。共有結合で連結されたハイブリダイゼーション産物中間体は、次いで、足場アダプターの第2のセットと結合される。足場アダプターの第2のセットは、本明細書に記載されるようにリン酸化され得る5’末端を有するオリゴヌクレオチド成分を含み得る。足場アダプターの第2のセットは、共有結合で連結されたハイブリダイゼーション産物中間体にハイブリダイズされ、オリゴヌクレオチド成分の5’リン酸化末端は、ssNA末端領域の3’末端に共有結合で連結される。
一部の実施形態では、方法は、アデニル化修飾を有する足場アダプターまたはその成分の使用を含む、段階的なライゲーションを含む(図10を参照されたい)。例えば、足場アダプターの第1のセットは、オリゴヌクレオチド成分の5’末端のアデニル化修飾(5’App)を含むことがある。足場アダプターの第1のセットは、ssNAにハイブリダイズされ、オリゴヌクレオチド成分の5’Appは、ssNA末端領域の3’末端に共有結合で連結される。共有結合性連結は、ATPの非存在下で行なわれることもある。ハイブリダイゼーションおよび共有結合性連結のこのような第1のラウンドの産物は、共有結合で連結されたハイブリダイゼーション産物中間体と呼ばれることがある。共有結合で連結されたハイブリダイゼーション産物中間体は、次いで、足場アダプターの第2のセットと結合される。足場アダプターの第2のセットは、3’OH末端を有するオリゴヌクレオチド成分を含み得る。足場アダプターの第2のセットは、共有結合で連結されたハイブリダイゼーション産物中間体にハイブリダイズされ、オリゴヌクレオチド成分の3’OH末端は、ssNA末端領域の5’末端(例えば、5’リン酸化末端)に(ATPの付加によって)共有結合で連結される。1つの変形形態では、足場アダプターの第1のセットおよび足場アダプターの第2のセットは、ATPの非存在下で同時にssNAと結合される。足場アダプターの第1のセットのライゲーションは、ATPの非存在下で進行することができ、足場アダプターの第2のセットのライゲーションは、ATPが付加されるまでしか進行することができない。
一部の実施形態では、方法は、3’リン酸化末端を有するオリゴヌクレオチド(すなわち、一本鎖オリゴヌクレオチド)の使用を含む、段階的なライゲーションを含む(図11を参照されたい)。3’リン酸化末端を有するオリゴヌクレオチドは、足場アダプターのオリゴヌクレオチド成分についての本明細書に記載される小成分(例えば、プライマー結合部位、インデックス、UMI、フローセルアダプターなど)のいずれかを含み得る。3’リン酸化末端を有するオリゴヌクレオチドは、一般に、一本鎖状であり、足場ポリヌクレオチドとハイブリダイズされていない。一例では、方法は、足場アダプターまたはその成分とssNAとを結合させるステップの前に、ssNAと、3’末端にリン酸を含むオリゴヌクレオチドとを結合させるステップ、およびオリゴヌクレオチドの3’リン酸化末端をssNA末端領域の5’末端(例えば、5’非リン酸化末端)に共有結合で連結させるステップを含み得る。一部の実施形態では、オリゴヌクレオチドをssNAに共有結合で連結させるステップの前に、ssNAは、ホスファターゼ活性を有する薬剤と、ssNAが脱リン酸化される条件下で接触され、それによって脱リン酸化されたssNAが生成される。一部の実施形態では、オリゴヌクレオチドをssNAに共有結合で連結させるステップは、ssNAおよびオリゴヌクレオチドと、一本鎖リガーゼ活性を有する薬剤とを、ssNAの5’末端がオリゴヌクレオチドの3’末端に共有結合で連結される条件下で接触させることを含む。一部の実施形態では、リガーゼ活性を有する薬剤は、RtcBリガーセである。そのような共有結合で連結させるステップの産物は、共有結合で連結された産物中間体と呼ばれることがある。共有結合で連結された産物中間体は、次いで、足場アダプターのセットと結合される。足場アダプターのセットは、5’リン酸化末端を有するオリゴヌクレオチド成分を含むことがある。足場アダプターのセットは、共有結合で連結された産物中間体にハイブリダイズされ、オリゴヌクレオチド成分の5’リン酸化末端は、ssNA末端領域の3’末端に共有結合で連結される。
一部の実施形態では、方法は、アダプターダイマーを低減または消失させるための、オリゴヌクレオチドダイマー産物とハイブリダイズすることができるオリゴヌクレオチドの使用(図20を参照されたい)を含む。オリゴヌクレオチドダイマー産物は、足場アダプターダイマーの成分であり、第2の足場アダプターからのオリゴヌクレオチド成分に共有結合で連結された第1の足場アダプターからのオリゴヌクレオチド成分を含有し得る。本明細書における方法は、足場アダプターダイマーからオリゴヌクレオチドダイマー産物を放出させることができる変性ステップを含み得る。オリゴヌクレオチドダイマー産物は、オリゴヌクレオチドダイマー産物、またはその一部、に相補的な配列を有するオリゴヌクレオチドとハイブリダイズすることができ、それによってオリゴヌクレオチドダイマーハイブリダイゼーション産物が形成される。一部の実施形態では、オリゴヌクレオチドダイマーハイブリダイゼーション産物は、切断部位を含む。一部の実施形態では、切断部位は、制限酵素認識部位である。一部の実施形態では、本明細書における方法は、オリゴヌクレオチドダイマーハイブリダイゼーション産物と切断剤(例えば、制限酵素、レアカッター制限酵素)とを接触させるステップをさらに含む。
一部の実施形態では、方法は、アダプターダイマーを低減または消失させるためにライブラリー調製の様々な段階で核酸産物を精製または洗浄するステップを含む。一部の事例では、核酸産物を精製または洗浄するステップは、アダプターダイマーを低減または消失させることができる。例えば、共有結合で連結されたハイブリダイゼーション産物(すなわち、足場アダプターとハイブリダイズされ、オリゴヌクレオチド成分に共有結合で連結された、ssNA)、一本鎖ライゲーション産物(すなわち、変性された、共有結合で連結された、ハイブリダイゼーション産物;オリゴヌクレオチド成分に共有結合で連結されており、もはや足場ポリヌクレオチドとハイブリダイズすることができない、ssNA)、またはこれらの増幅産物を、任意の好適な精製または洗浄方法により精製または洗浄することができる。一部の実施形態では、精製または洗浄するステップは、固相可逆的固定法(SPRI)の使用を含む。例えば、約2.5M~約5M NaCl、約0.1mM~約1M EDTA、約10mM Tris、約0.01%~約0.05%TWEEN(登録商標)-20、および約8%~約38%の間のPEG-8000を含有する、DNA結合緩衝液に、SPRIビーズを懸濁させることができる。例えば、1mlのSPRIビーズ懸濁液を、2.5M NaCl、10mM Tris、1mM EDTA、0.05%Tween-20および20%PEG-8000と併せることができる。一部の実施形態では、SPRIは、連続的SPRI(連続して行なわれる洗浄)およびまたは逐次的SPRI(逐次的なSPRIビーズの添加およびインキュベーションを含む洗浄)を含む。連続的SPRIは、2、3、4、5、6、7、8、9、10回またはそれより多くの連続的洗浄を含み得る、複数の連続的(連続した)洗浄を含み得る。逐次的SPRIは、2、3、4、5、6、7、8、9、10回またはそれより多くのSPRIビーズの逐次的添加を含み得る、SPRIビーズの複数の逐次的添加(インキュベーションが介在する)を含み得る。一部の実施形態では、SPRI精製に使用されるSPRIビーズの量は、0.1×~3×SPRIビーズの間の量を含み得る(×は、ビーズの核酸に対する(例えば、ビーズ体積の反応体積に対する)比である)。例えば、SPRI精製において使用されるSPRIビーズの量は、約0.1×、0.2×、0.3×、0.4×、0.5×、0.6×、0.7×、0.8×、0.9×、1.0×、1.1×、1.2×、1.3×、1.4×、1.5×、1.6×、1.7×、1.8×、1.9×、2.0×、2.1×、2.2×、2.3×、2.4×、2.5×、2.6×、2.7×、2.8×、2.9×、または3.0×SPRIビーズを含み得る。一部の実施形態では、SPRI精製において使用されるSPRIビーズの量は、1.2×である。一部の実施形態では、SPRI精製において使用されるSPRIビーズの量は、1.5×である。一部の実施形態では、精製または洗浄するステップは、カラム精製(例えば、カラムクロマトグラフィー)を含む。一部の実施形態では、精製または洗浄するステップは、カラム精製(例えば、カラムクロマトグラフィー)を含まない。一部の実施形態では、共有結合で連結されたハイブリダイゼーション産物、一本鎖ライゲーション産物、および/またはそれらの増幅産物は、精製も洗浄もされない。
SPRI精製は、通常は、緩衝液の存在下で行なわれる。任意の好適な緩衝液、例えば、Tris緩衝液、同様のpHのものである水などを、使用することができる。SPRI精製ビーズを、試料溶液(例えば、共有結合で連結されたハイブリダイゼーション産物(ライゲーション産物)またはそれらの増幅された産物を含有する、試料溶液)に直接添加することができる。ある特定の事例では、緩衝液を添加して反応の体積を増加させることができ、したがってさらなるビーズを添加することができる。一部の実施形態では、SPRIビーズ溶液は、水、NaCl、TrisおよびEDTAに溶解されたPEG 8000に添加された、カルボキシル化磁気ビーズで構成されている。通常は、PEGの量によってSPRIビーズ溶液のPEGパーセンテージが決まる。例えば、50ml SPRIビーズ溶液中9gのPEG 8000の添加は、「18%SPRI」と呼ばれることがある。別の例では、50ml SPRI溶液中19gのPEG 8000の添加は、「38%SPRI」と呼ばれることがある。一般に、PEGの比率が高いほど、保持されるDNA断片のサイズは小さい。
一部の実施形態では、精製プロセスは、共有結合で連結されたハイブリダイゼーション産物(ライゲーション産物)と、固相可逆的固定法(SPRI)ビーズおよび緩衝液とを接触させるステップを含む。一部の実施形態では、一部またはすべてのSPRI緩衝液がイソプロパノールで置き換えられる。一部の実施形態では、SPRI緩衝液は、イソプロパノールを含む。一部の実施形態では、SPRI緩衝液は、イソプロパノールで完全に置き換えられる。一部の実施形態では、SPRI緩衝液は、約5%体積/体積(v/v)イソプロパノール~約50% v/vイソプロパノールを含む。一部の実施形態では、SPRI緩衝液は、約10% v/v イソプロパノール~約40% v/v イソプロパノールを含む。例えば、SPRI緩衝液は、約10% v/vイソプロパノール、15% v/vイソプロパノール、20% v/vイソプロパノール、25% v/vイソプロパノール、30% v/vイソプロパノール、35% v/vイソプロパノール、または40% v/vイソプロパノールを含み得る。一部の実施形態では、SPRI緩衝液は、約20% v/v イソプロパノールを含む。
一部の実施形態では、精製または洗浄するステップは、特定の長さまたは長さの範囲を有する核酸断片またはそれらの増幅産物を濃縮することができる。一部の実施形態では、SPRI精製は、特定の長さまたは長さの範囲を有する核酸断片またはそれらの増幅産物を濃縮することができる。一部の実施形態では、SPRI精製において使用されるSPRIビーズ溶液中のPEG 8000の量は、濃縮される断片の長さまたは長さの範囲に影響を与え得る。例えば、1.5× v/v比でのSPRI精製は、<100塩基の範囲において1.2×でのSPRI精製より多くの断片を回収することができる。なぜなら、PEG 8000の最終濃度が1.2×でよりも1.5×でのほうが高いからである。一部の実施形態では、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI比を調整するステップを含む。一部の実施形態では、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI精製におけるイソプロパノールの量を調整するステップを含む。一部の実施形態では、本明細書における方法は、望ましくないアーチファクト(例えば、アダプターダイマー)の量を最小限に抑えつつ所望の断片長または長さの範囲を濃縮するように、SPRI精製におけるイソプロパノールの量を調整するステップを含む。例えば、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI精製におけるイソプロパノールの量を調整するステップであって、回収されるアダプターダイマーの量が、回収される全核酸の約10%未満である、ステップを含む。別の例では、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI精製におけるイソプロパノールの量を調整するステップであって、回収されるアダプターダイマーの量が、回収される全核酸の約5%未満である、ステップを含む。
一部の実施形態では、本明細書における方法(例えば、ssNAと足場アダプターまたはその成分とを結合させるステップ、ハイブリダイゼーション、および共有結合で連結させステップ)を、好適な反応体積で、ならびに/またはssNAの好適な量および/もしくはssNAの足場アダプター(もしくはその成分)に対する好適な比を用いて、行なうことができる。好適な反応体積、および/またはssNAの好適な量、および/またはssNAの足場アダプター(もしくはその成分)に対する好適な比は、アダプターダイマー形成を低減させるまたは防止する反応体積、ssNAの量、および/またはssNAと足場アダプターの比を含み得る。一部の実施形態では、ssNAの好適な量は、ssNA約250pg~約5ngの範囲であり得る。例えば、ssNAの好適な量は、約250pg、500pg、750pg、1ng、1.5ng、2ng、2.5ng、3ng、3.5ng、4ng、4.5ng、または5ngであり得る。一部の実施形態では、ssNAの好適な量は、ssNA約1ngであり得る。一部の実施形態では、25μlの最終反応体積の場合は、1ngのssNAを、約1.0~2.0ピコモルの間の各足場アダプター(すなわち、ssNA末端領域の5’末端とハイブリダイズする約1.0~2.0ピコモルの足場アダプター(複数の足場アダプター種を含有する足場アダプターのプール)、およびssNA末端領域の3’末端とハイブリダイズする約1.0~2.0ピコモルの足場アダプター(複数の足場アダプター種を含有する足場アダプターのプール))と結合させることができる。例えば、25μlの最終反応体積の場合は、1ngのssNAを、約1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、または2.0ピコモルの各足場アダプターと結合させることができる。一部の実施形態では、25μlの最終反応体積の場合は、1ngのssNAは、約1.6ピコモルの各足場アダプター(すなわち、ssNA末端領域の5’末端とハイブリダイズする約1.6ピコモルの足場アダプター、およびssNA末端領域の3’末端とハイブリダイズする約1.6ピコモルの足場アダプター)と結合される。より大きい反応体積の場合、ssNAおよび足場アダプターの量を、相対量が保存されることを条件に、規模拡大することができる。より小さい反応体積の場合、ssNAおよび足場アダプターの量を、相対量が保存されることを条件に、規模縮小することができる。一部の実施形態では、本明細書における足場アダプターは、ssNAと、約5:1(足場アダプター対ssNA)~約50:1(足場アダプター対ssNA)の間のモル比で結合される。例えば、足場アダプターを、ssNAと、約5:1(足場アダプター対ssNA)、約10:1(足場アダプター対ssNA)、約15:1(足場アダプター対ssNA)、約20:1(足場アダプター対ssNA)、約25:1(足場アダプター対ssNA)、約30:1(足場アダプター対ssNA)、約35:1(足場アダプター対ssNA)、約40:1(足場アダプター対ssNA)、約45:1(足場アダプター対ssNA)、または約50:1(足場アダプター対ssNA)のモル比で結合させることができる。一部の実施形態では、足場アダプターは、ssNAと、約15:1(足場アダプター対ssNA)のモル比で結合される。一部の実施形態では、足場アダプターは、ssNAと、約30:1(足場アダプター対ssNA)のモル比で結合される。
一部の実施形態では、本明細書における方法は、クラウディング剤の使用を含む。好適な量のクラウディング剤を使用してアダプターダイマー形成を低減させることまたは防止することができる。クラウディング剤としては、例えば、フィコール70、デキストラン70、ポリエチレングリコール(PEG)2000、およびポリエチレングリコール(PEG)8000を挙げることができる。一部の実施形態では、本明細書における方法は、ポリエチレングリコール(PEG)8000の使用を含む。PEGを、例えば、約15%~約20%の間の量で使用することができ、このパーセンテージは、ライゲーション反応におけるPEGの最終濃度を指す。例えば、PEGを、約15%、15.5%、16%、16.5%、17%、17.5%、18%、18.5%、19%、19.5%または20%で使用することができる。一部の実施形態では、18.5%PEGが使用される。一部の実施形態では、18%PEGが使用される。
精製中にSPRIビーズ溶液を試料溶液に添加することができ、多くの場合、v/v比についての指示がある。例えば、1.2×18%SPRIは、50μl試料を入れる場合に60μl(50×1.2)の18%SPRIビーズを添加することを意味する。このv/v比は、試料溶液中にPEGがないことを仮定すると、9.8%のPEGの最終濃度に至る。しかし、多くの場合、ライゲーション後に、試料溶液(すなわち、ライゲーション産物)中に存在するPEGの既存量がある。したがって、ユーザーは、添加するSPRIビーズの量を、所望の最終PEG濃度に達するように調整することができる。所望の最終PEG濃度は、約5%最終PEG~約15%最終PEGの範囲であり得る。例えば、所望の最終PEG濃度は、約5%、6%、7%、8%、9%、10%、11%、12%、13%、14%または15%であり得る。一部の実施形態では、所望の最終PEG濃度は、約10%(例えば、毛髪試料およびcfDNA試料について)である。一部の実施形態では、所望の最終PEG濃度は、約12%(例えば、ホルマリン固定パラフィン包埋(FFPE)試料、および大きい鋳型断片を有する試料について)である。
Yアダプター
一部の実施形態では、本明細書に記載される足場アダプターは、2本の鎖を含み、第1の末端に一本鎖足場領域があり、第2の末端に2本の非相補鎖がある。そのような足場アダプターは、Y足場アダプター、Yアダプター、Y形足場アダプター、Y形アダプター、Y二重鎖、Y形二重鎖、Y足場二重鎖、Y形足場二重鎖などと呼ばれることがある。Y形構造を有する足場アダプターは、一般に、二本鎖二重鎖領域を含み、一方の末端に2つの一本鎖「アーム」を、および他方の末端に一本鎖足場領域を含む。
Y足場アダプターは、複数の核酸成分および小成分を含み得る。一部の実施形態では、Y足場アダプターは、第1の核酸鎖および第2の核酸鎖を含む。一部の実施形態では、第1の核酸鎖は、第2の核酸鎖に相補的である。一部の実施形態では、第1の核酸鎖の一部分は、第2の核酸鎖の一部分に相補的である。一部の実施形態では、第1の核酸鎖は、第2の核酸鎖中の第1の領域に相補的である第1の領域を含み、第1のポリヌクレオチドは、第2のポリヌクレオチド中の第2の領域に相補的でない第2の領域を含む。相補的な領域は、Y足場アダプターの二重鎖領域を形成することが多く、非相補的な領域は、Y足場アダプターのアームまたはそれらの部分を形成することが多い。第1および第2の核酸鎖は、小成分(例えば、足場ポリヌクレオチドの小成分、オリゴヌクレオチドの小成分、ならびに本明細書に記載されるシーケンシングアダプターの小成分、例えば、増幅プライミング部位および/または個別のシーケンシングアダプター(例えば、P5、P7アダプター)など)を含むことがある。一部の実施形態では、第1および第2の核酸鎖は、本明細書に記載されるシーケンシングアダプターのある特定の小成分、例えば、増幅プライミング部位および/または個別のシーケンシングアダプター(例えば、P5、P7アダプター)などを含まない。
一部の実施形態では、Y足場アダプターは、一本鎖足場領域(ssNAハイブリダイゼーション領域)を含む。Y足場アダプターの一本鎖足場領域は、二本鎖二重鎖部分に隣接して、非相補鎖(または「アーム」)部分の反対側の末端に、通常は位置する。Y足場アダプターの一本鎖足場領域は、通常は、標的核酸の末端領域(例えば、一本鎖核酸の末端領域)に相補的である。
ヘアピン
一部の実施形態では、足場アダプターは、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖を含む。一部の実施形態では、足場アダプターは、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖からなる。ヘアピン構造を有する足場アダプターは、一般に、二本鎖「ステム」領域および一本鎖「ループ」領域を含む。一部の実施形態では、足場アダプターは、ヘアピン構造をとることができる1本の鎖(すなわち、1本の連続鎖)を含む。一部の実施形態では、足場アダプターは、ヘアピン構造をとることができる1本の鎖(すなわち、1本の連続鎖)から本質的になる。1本の鎖から本質的になるとは、足場アダプターが、連続鎖の一部でない、核酸の(例えば、足場アダプターとハイブリダイズされたるさらなる鎖を一切含まないことを意味する。したがって、ここでの「から本質的になる」は、足場アダプター中の鎖の数を指し、足場アダプターは、鎖の数に不可欠でない他の特徴を含むことができる(例えば、検出可能な標識を含むことができる;他の領域を含むことができる)。ヘアピン構造を形成することができる1本の鎖を含むまたはそのような1本の鎖から本質的になる足場アダプターは、本明細書では、ヘアピン、ヘアピン足場アダプター、またはヘアピンアダプターと呼ばれることがある。
ヘアピン足場アダプターは、1本の鎖の中に複数の核酸成分および小成分を含むことがある。一部の実施形態では、ヘアピン足場アダプターは、オリゴヌクレオチドおよび足場ポリヌクレオチドを含む。一部の実施形態では、オリゴヌクレオチドは、足場ポリヌクレオチド中のオリゴヌクレオチドハイブリダイゼーション領域に相補的である。一部の実施形態では、オリゴヌクレオチドの一部分は、足場ポリヌクレオチド中のオリゴヌクレオチドハイブリダイゼーション領域の一部分に相補的である。一部の実施形態では、ヘアピン足場アダプターは、相補領域および非相補領域を含む。相補領域は、ヘアピンアダプターのステムを形成することが多く、非相補領域は、ヘアピン足場アダプターのループまたはその一部を形成することが多い。オリゴヌクレオチドおよび足場ポリヌクレオチドは、小成分(例えば、足場ポリヌクレオチドの小成分、オリゴヌクレオチドの小成分、ならびに本明細書に記載されるシーケンシングアダプターの小成分、例えば、増幅プライミング部位および/または個別のシーケンシングアダプター(例えば、P5、P7アダプター)など)を含むことがある。一部の実施形態では、オリゴヌクレオチドおよび足場ポリヌクレオチドは、本明細書に記載されるシーケンシングアダプターのある特定の小成分、例えば、増幅プライミング部位および個別のシーケンシングアダプター(例えば、P5、P7アダプター)などを含まない。
ヘアピン足場アダプターは、切断条件下で切断され得る1つまたは複数の切断部位を含むことがある。一部の実施形態では、切断部位は、オリゴヌクレオチドと足場ポリヌクレオチドの間に位置する。切断部位での切断は、ヘアピン足場アダプターから2本の別々の鎖を生成することが多い。一部の実施形態では、切断部位での切断は、「Y」構造を形成する2つの不対合鎖を有する部分的に二本鎖の足場アダプターを生成する。切断部位は、例えば、本明細書に記載される切断部位などの、任意の好適な切断部位を含み得る。一部の実施形態では、切断部位は、RNAヌクレオチドを含み、例えばRNAseを使用して切断され得る。一部の実施形態では、切断部位は、ウラシルおよび/またはデオキシウリジンを含み、例えば、DNAグリコシラーゼ、エンドヌクレアーゼ、RNAseなど、およびこれらの組合せを使用して切断され得る。一部の実施形態では、切断部位は、ウラシルおよび/またはデオキシウリジンを含まない。一部の実施形態では、本明細書における方法は、ヘアピン足場アダプターと一本鎖核酸とを結合させるステップの後、1つまたは複数の切断部位を切断条件に曝露するステップを含み、それによって足場アダプターが切断される。
一部の実施形態では、ヘアピン足場アダプターは、一本鎖足場領域(ssNAハイブリダイゼーション領域)を含む。ヘアピン足場アダプターの一本鎖足場領域は、通常は、二本鎖ステム部分に隣接して、ループ部分の反対側の末端に位置する。ヘアピン足場アダプターの一本鎖足場領域は、通常は、標的核酸の末端領域(例えば、一本鎖核酸の末端領域)に相補的である。
一部の実施形態では、ヘアピン足場アダプターは、5’から3’の方向に、オリゴヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドハイブリダイゼーション領域と足場領域(ssNAハイブリダイゼーション領域)とを含む足場ポリヌクレオチドを含む。一部の実施形態では、ヘアピンオリゴヌクレオチドは、5’から3’の方向に、足場領域(ssNAハイブリダイゼーション領域)とオリゴヌクレオチドハイブリダイゼーション領域とを含む足場ポリヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドを含む。一部の実施形態では、複数のヘアピン足場アダプター、またはヘアピン足場アダプターのプールは、1)5’から3’の方向に、オリゴヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドハイブリダイゼーション領域と足場領域(ssNAハイブリダイゼーション領域)とを含む足場ポリヌクレオチドを含む、ヘアピン足場アダプターと、2)5’から3’の方向に、足場領域(ssNAハイブリダイゼーション領域)とオリゴヌクレオチドハイブリダイゼーション領域とを含む足場ポリヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドを含む、ヘアピン足場アダプターとの、混合物を含む。
修飾ヌクレオチド
一部の実施形態では、足場アダプター、またはその成分は、1つまたは複数の修飾ヌクレオチドを含む。修飾ヌクレオチドは、修飾塩基と呼ばれることがあり、例えば、結合対のメンバーにコンジュゲートされたヌクレオチド、遮断されたヌクレオチド、非天然ヌクレオチド、ヌクレオチド類似体、ペプチド核酸(PNA)ヌクレオチド、モルホリノヌクレオチド、ロックド核酸(LNA)ヌクレオチド、架橋核酸(BNA)ヌクレオチド、グリコール核酸(GNA)ヌクレオチド、トレオース核酸(TNA)ヌクレオチドなど、およびこれらの組合せを含み得る。一部の実施形態では、足場アダプター、またはその成分は、足場アダプターまたはその成分の、二重鎖領域内に、足場領域内に、一方の末端に、または両方の末端に、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、足場アダプター、またはその成分は、1つまたは複数の不対合修飾ヌクレオチドを含む。一部の実施形態では、足場アダプター、またはその成分は、アダプターの一方の末端に1つまたは複数の不対合修飾ヌクレオチドを含む。一部の実施形態では、足場アダプター、またはその成分は、標的核酸とハイブリダイズする末端(例えば、一本鎖足場領域を含む末端)の反対側のアダプターの末端に、1つまたは複数の不対合修飾ヌクレオチドを含む。修飾ヌクレオチドは、3’末端を有する鎖の末端に存在することもあり、または5’末端を有する鎖の末端に存在することもある。
一部の実施形態では、オリゴヌクレオチド成分は、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチド成分の共有結合性連結を遮断することができる。一部の実施形態では、オリゴヌクレオチド成分は、ssNAに隣接していない末端に1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、足場ポリヌクレオチドは、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる。足場ポリヌクレオチドは、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含むことがある。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ライゲーションを遮断する修飾を含む。
一部の実施形態では、足場アダプター、またはその成分は、1つまたは複数の遮断されたヌクレオチドを含む。一例では、足場アダプター、またはその成分は、別の足場アダプターまたはその成分中のヌクレオチドとのハイブリダイゼーションを遮断することができる1つまたは複数の修飾ヌクレオチドを含むことがある。一部の事例では、1つまたは複数の修飾ヌクレオチドは、別の足場アダプターまたはその成分中のヌクレオチドへのライゲーションを遮断することができる。別の例では、足場アダプター、またはその成分は、標的核酸(例えば、ssNA)中のヌクレオチドとのハイブリダイゼーションを遮断することができる1つまたは複数の修飾ヌクレオチドを含むことがある。一部の事例では、1つまたは複数の修飾ヌクレオチドは、標的核酸中のヌクレオチドへのライゲーションを遮断することができる。一部の実施形態では、足場ポリヌクレオチドの一方または両方の末端は、遮断する修飾を含み、および/またはssNA断片に隣接していないオリゴヌクレオチド成分の末端は、遮断する修飾を含むことがある。遮断する修飾は、オリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるために用いられるアプローチを使用して別の核酸成分の末端に連結させることができない、修飾された末端を指す。ある特定の実施形態では、遮断する修飾は、ライゲーションを遮断する修飾である。足場ポリヌクレオチドの一方もしくは両方の末端および/またはssNAに隣接していないオリゴヌクレオチド成分の末端に含まれることがある、遮断する修飾の例としては、3’OHの非存在、および接近不可能な3’OHが挙げられる。末端が接近不可能な3’OHを有する、遮断する修飾の非限定的な例としては、アミノ修飾因子、アミノリンカー、スペーサー、イソデオキシ塩基、ジデオキシ塩基、逆方向ジデオキシ塩基、3’リン酸などが挙げられる。一部の実施形態では、足場アダプター、またはその成分は、天然ヌクレオチドに結合することができない1つまたは複数の修飾ヌクレオチドを含む。
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ-塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ-グアニン(イソ-dG)を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ-シトシン(イソ-dC)を含む。イソ-dCおよびイソ-dGは、それぞれ、シトシンおよびグアニンの化学的バリアントである。イソ-dCは、イソ-dGと水素結合することができるが、未修飾グアニン(天然グアニン)とはできない。イソ-dGは、イソ-dCと塩基対合することができるが、未修飾シトシン(天然シトシン)とはできない。イソ-dCを含有する骨格アダプターまたはその成分を、イソ-dGを含有する相補的オリゴとハイブリダイズするが、天然に存在するいずれの核酸配列ともハイブリダイズすることができないように、設計することができる。
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、メチル化、ヒドロキシメチル化およびカルボキシル化を含むがこれらに限定されない、エピジェネティクス関連修飾を含む。エピジェネティクス関連修飾の例としては、カルボキシシトシン、5-メチルシトシン(5mC)およびその酸化誘導体(例えば、5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)、および5-カルボニルシトシン(arboxylcytosine)(5caC))、N(6)-メチルアデニン(6mA)、N4-メチルシトシン(4mC)、N(6)-メチルアデノシン(m(6)A)、プソイドウリジン(Ψ)、5-メチルシチジン(m(5)C)、ヒドロキシメチルウラシル、3’末端の2’-O-メチル化、tRNA修飾、miRNA修飾、およびsnRNA修飾が、挙げられる。
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ジデオキシ-塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ジデオキシ-シトシンを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、逆方向ジデオキシ-塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、逆方向ジデオキシ-チミンを含む。例えば、配列の5’末端に位置する逆方向ジデオキシ-チミンは、望ましくない5’ライゲーションを防止することができる。
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、スペーサーを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、C3スペーサーを含む。C3スペーサーホスホロアミダイトをオリゴヌクレオチドの内部にまたは5’末端に組み込むことができる。複数のC3スペーサーを骨格アダプターまたはその成分のどちらかの末端に付加させて、長い親水性スペーサーアームを(例えば、フルオロフォアまたは他のペンダント基の結合のために)導入することができる。他のスペーサーとしては、例えば、光切断性(PC)スペーサー、ヘキサンジオール、スペーサー9、スペーサー18、1’,2’-ジデオキシリボース(dSpacer)などが挙げられる。
一部の実施形態では、修飾ヌクレオチドは、アミノリンカーまたはアミノ遮断剤を含む。一部の実施形態では、修飾ヌクレオチドは、アミノリンカーC6(例えば、5’アミノリンカーC6または3’アミノリンカーC6)を含む。一例では、アミノリンカーC6を使用して、活性一級アミノ基をオリゴヌクレオチドの5’末端に組み込むことができる。次いで、これをリガンドにコンジュゲートすることができる。すると、アミノ基は、5’末端リガンドに内在化される。アミノ基は、アミノ基とオリゴとの立体相互作用を低減させるように6炭素スペーサーアームによって5’末端ヌクレオチド塩基から離隔される。一部の実施形態では、修飾ヌクレオチドは、アミノリンカーC12(例えば、5’アミノリンカーC12または3’アミノリンカーC12)を含む。一例では、アミノリンカーC12を使用して、活性一級アミノ基をオリゴヌクレオチドの5’末端に組み込むことができる。アミノ基は、アミノ基とオリゴとの立体相互作用を最小にするように12炭素スペーサーアームによって5’末端ヌクレオチド塩基から離隔される。
一部の実施形態では、修飾ヌクレオチドは、結合対のメンバーを含む。結合対は、例えば、抗体/抗原、抗体/抗体、抗体/抗体断片、抗体/抗体受容体、抗体/プロテインAもしくはプロテインG、ハプテン/抗ハプテン、ビオチン/アビジン、ビオチン/ストレプトアビジン、葉酸/葉酸結合タンパク質、ビタミンB12/内因子、化学反応性基/相補的化学反応性基、ジゴキシゲニン部分/抗ジゴキシゲニン抗体、フルオレセイン部分/抗フルオレセイン抗体、ステロイド/ステロイド結合タンパク質、オペレーター/リプレッサー、ヌクレアーゼ/ヌクレオチド、レクチン/多糖、活性化合物/活性化合物受容体、ホルモン/ホルモン受容体、酵素/基質、オリゴヌクレオチドもしくはポリヌクレオチド/その対応する補体など、またはこれらの組合せを含み得る。一部の実施形態では、修飾ヌクレオチドは、ビオチンを含む。
一部の実施形態では、修飾ヌクレオチドは、結合対の第1のメンバー(例えば、ビオチン)を含み、結合対の第2のメンバー(例えば、ストレプトアビジン)は、固体支持体または基板にコンジュゲートされている。固体支持体または基板は、マイクロアレイおよびウェルにより提供される表面、ならびに粒子、例えば、ビーズ(例えば、常磁性ビーズ、磁気ビーズ、マイクロビーズ、ナノビーズ)、微小粒子およびナノ粒子を含むがこれらに限定されない、結合対のメンバーを直接または間接的に結合することができる任意の物理的に分離可能な固体であり得る。固体支持体は、例えば、チップ、カラム、光ファイバー、拭き取り繊維、フィルター(例えば、平面フィルター)、1つもしくは複数のキャピラリー、ガラスおよび改質もしくは機能化ガラス(例えば、細孔制御ガラス(CPG))、石英、雲母、ジアゾ化膜(紙もしくはナイロン)、ポリホルムアルデヒド、セルロース、酢酸セルロース、紙、セラミックス、金属、半金属、半導体材料、量子ドット、被覆ビーズもしくは粒子、他のクロマトグラフ材料、磁気粒子;プラスチック(アクリル樹脂、ポリスチレン、スチレンもしくは他の材料のコポリマー、ポリブチレン、ポリウレタン、TEFLON(登録商標)、ポリエチレン、ポリプロピレン、ポリアミド、ポリエステル、ポリフッ化ビニリデン(PVDF)などを含む)、多糖、ナイロンもしくはニトロセルロース、樹脂、シリカ、もしくはシリコン、シリカゲルおよび変性シリコンを含む、シリカに基づく材料、Sephadex(登録商標)、Sepharose(登録商標)、炭素、金属(例えば、鋼、金、銀、アルミニウム、ケイ素および銅)、無機ガラス、導電性ポリマー(ポリピロールおよびポリインドールなどのポリマーを含む);マイクロもしくはナノ構造化表面、例えば、核酸タイリングアレイ、ナノチューブ、ナノワイヤ、もしくはナノ粒子装飾表面;または多孔質表面、またはゲル、例えば、メタクリレート、アクリルアミド、糖ポリマー、セルロース、シリケート、または他の繊維状もしくは鎖状ポリマーも含み得る。一部の実施形態では、固体支持体または基板は、デキストラン、アクリルアミド、ゼラチンまたはアガロースなどの、ポリマーを含む、任意の数の材料を用いた不動態または化学的誘導体化コーティングを使用して、被覆することができる。ビーズおよび/または粒子は、ばらばらの状態であることもあり、または互いにつながっている(例えば、焼結されている)こともある。一部の実施形態では、固体支持体は、粒子の集合体であることができる。一部の実施形態では、粒子は、シリカを含むことができ、シリカは、二酸化ケイ素を含み得る。一部の実施形態では、シリカは、多孔質であることができ、ある特定の実施形態では、シリカは、無孔質であることができる。一部の実施形態では、粒子は、粒子に常磁性特性を付与する薬剤をさらに含む。ある特定の実施形態では、薬剤は、金属を含み、ある特定の実施形態では、薬剤は、酸化鉄(例えば、鉄または酸化鉄、ここでの酸化鉄は、Fe2+とFe3+の混合物を含有する)である。結合対のメンバーを共有結合によりまたは非共有結合性相互作用により固体支持体に連結させることができ、直接または間接的に(例えば、スペーサー分子もしくはビオチンなどの仲介物質によって)固体支持体に連結させることができる。
一部の実施形態では、足場ポリヌクレオチド、オリゴヌクレオチド成分、または両方は、ヌクレオチドアナログとも呼ばれる、1つまたは複数の非天然ヌクレオチドを含む。足場ポリヌクレオチド、オリゴヌクレオチド成分、または両方に含まれることがある、非天然ヌクレオチドの非限定的な例としては、LNA(ロックド核酸)、PNA(ペプチド核酸)、FANA(2’-デオキシ-2’-フルオロアラビノヌクレオチド)、GNA(グリコール核酸)、TNA(トレオース核酸)、2’-O-Me RNA、2’-フルオロRNA、モルホリノヌクレオチド、およびこれらの任意の組合せが挙げられる。
末端処理
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、末端処理活性を有する薬剤とを、一本鎖核酸(ssNA)分子が処理される条件下で接触させるステップを含み、それによって、末端処理されたssNA組成物が生成される。末端処理は、リン酸化、脱リン酸化、メチル化、脱メチル化、酸化、脱酸化、塩基修飾、伸長、重合、およびこれらの組合せを含み得るが、それらに限定されない。末端処理は、酵素を用いて行なうことができ、そのような酵素としては、リガーゼ、ポリヌクレオチドキナーゼ(PNK)、ターミナルトランスフェラーゼ、メチルトランスフェラーゼ、メチラーゼ(例えば、3’メチラーゼ、5’メチラーゼ)、ポリメラーゼ(例えば、ポリAポリメラーゼ)、オキシダーゼ、およびこれらの組合せが挙げられるが、それらに限定されない。
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、ホスファターゼ活性を有する薬剤とを、一本鎖核酸(ssNA)分子が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化されたssNA組成物が生成される。一部の実施形態では、本明細書における方法は、足場アダプターまたはその成分と、ホスファターゼ活性を有する薬剤とを、足場アダプターまたはその成分が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された足場アダプターまたはその成分(例えば、脱リン酸化されたオリゴヌクレオチド;脱リン酸化された足場ポリヌクレオチド)が生成される。一般に、ssNA組成物、および/または足場アダプターもしくはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)脱リン酸化される。ssNAは、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでその後にリン酸化されることがある。足場アダプター、またはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでその後にリン酸化されることがある。足場アダプター、またはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでリン酸化されないことがある。足場アダプター、またはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、リン酸化されず、次いで、結合させるステップの後(すなわち、ハイブリダイゼーションの後)かつライゲーションステップの前またはライゲーションステップ中にリン酸化されることがある。核酸の脱リン酸化を行うための試薬およびキットは、公知であり、入手可能である。例えば、標的核酸(例えば、ssNA)および/または足場アダプターもしくはそれらの成分を、ホスファターゼ(すなわち、水を使用してリン酸モノエステルを切断してリン酸イオンとアルコールにする酵素)で処理することができる。
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、ホスホリル転移活性を有する薬剤とを、5’リン酸がssNAの5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、脱リン酸化されたssNA組成物と、ホスホリル転移活性を有する薬剤とを、5’リン酸がssNAの5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、足場アダプターまたはその成分と、リン酸転移活性を有する薬剤とを、5’リン酸が足場アダプターまたはその成分の5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、脱リン酸化された足場アダプターまたはその成分と、ホスホリル酸転移活性を有する薬剤とを、5’リン酸が足場アダプターまたはその成分の5’末端に付加される条件下で接触させるステップを含む。ある特定の事例では、ssNA組成物、および/または足場アダプターもしくはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)リン酸化される。核酸の5’リン酸化を様々な手法で行うことができる。例えば、ATPのγ位からポリヌクレオチド(二本鎖および一本鎖DNAおよびRNA)の5’-ヒドロキシル末端およびヌクレオシド3’一リン酸へのPiの転移および交換を触媒するポリヌクレオチドキナーゼ(PNK)(例えば、T4 PNK)で、ssNA組成物、および/または足場アダプターもしくはそれらの成分を処理することができる。好適な反応条件としては、例えば、核酸と、PNKの、1×PNK反応緩衝剤(例えば、70mM Tris-HCl、10mM MgCl、5mM DTT、25℃でpH7.6)中、30分間、37℃でのインキュベーション;および核酸と、PNKの、T4 DNAリガーゼ緩衝剤(例えば、50mM Tris-HCl、10mM MgCl、1mM ATP、10mM DTT、25℃でpH7.5)中、30分間、37℃でのインキュベーションが挙げられる。必要に応じて、リン酸化反応後に、PNKを、例えば65℃で20分間、熱不活性化してもよい。
一部の実施形態では、本明細書における方法は、ホスホリル転移活性を有する薬剤の使用を含まない。一部の実施形態では、方法は、核酸試料からのssNAの5’末端をリン酸化することにより5’リン酸化されたssNAを生成するステップを含まない。ある特定の事例は、核酸試料は、自然にリン酸化された5’末端を有するssNAを含む。一部の実施形態では、方法は、足場アダプターまたはそれらの成分の5’末端をリン酸化することにより5’リン酸化された足場アダプターまたはそれらの成分を生成するステップを含まない。
切断
一部の実施形態では、ssNA、足場アダプター、および/またはハイブリダイゼーション産物(例えば、ssNAとハイブリダイズされた足場アダプター)は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。一部の実施形態では、ssNA、足場アダプター、および/またはハイブリダイゼーション産物は、切断部位で切断またはせん断される。一部の実施形態では、足場アダプターおよび/またはハイブリダイゼーション産物は、ヘアピンループ内の切断部位で切断またはせん断される。一部の実施形態では、足場アダプターおよび/またはハイブリダイゼーション産物は、足場アダプターの内部位置の(例えば、足場アダプターの二重鎖領域内の)切断部位で切断またはせん断される。一部の実施形態では、足場アダプターは、足場ポリヌクレオチド上にしか存在せず相補的オリゴヌクレオチド成分上には存在しない内部位置にある切断部位(例えば、ウラシル)で切断される。したがって、一部の実施形態では、足場ポリヌクレオチドは、1つまたは複数ウラシル塩基を含み、オリゴヌクレオチド成分は、ウラシル塩基を含まない。一部の実施形態では、環状ハイブリダイゼーション産物は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。一部の実施形態では、核酸、例えば、環状核酸および/または大きい断片(例えば、長さが500塩基対より長い)は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。大きい断片は、高分子量(HMW)核酸、HMW DNAまたはHMW RNAと呼ばれることがある。HMW核酸断片は、約500bp、約600bp、約700bp、約800bp、約900bp、約1000bp、約2000bp、約3000bp、約4000bp、約5000bp、約10,000bpより長い、またはそれより長い断片を含み得る。用語「せん断すること」または「切断」は、核酸分子を2つの(またはそれより多くの)より小さい核酸分子に分断することができる手順または条件を一般に指す。そのようなせん断または切断は、配列特異的、塩基特異的、または非特異的であり得、例えば、化学的、酵素的、および物理的(例えば、物理的断片化)を含む、様々な方法、試薬または条件により果たすことができる。せん断または切断された核酸は、約5~約10,000塩基対、約100~約1,000塩基対、約100~約500塩基対、または約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000もしくは9000塩基対の長さの名目値、代表値または平均値を有し得る。
せん断または切断された核酸を好適な方法により生成することができ、そのような方法の非限定的な例としては、物理的方法(例えば、せん断、例えば、音波処理、超音波処理、フレンチプレス、熱、UV照射など)、酵素的プロセス(例えば、酵素的切断作用因子(例えば、好適なヌクレアーゼ、好適な制限酵素)、化学的方法(例えば、アルキル化、DMS、ピペリジン、酸加水分解、塩基加水分解、熱など、もしくはこれらの組合せ)、紫外(UV)線(例えば、光切断性部位(例えば、光切断性スペーサーを含む))など、またはこれらの組合せが挙げられる。結果として得られる核酸断片の長さ代表値、平均値または名目値は、適切な断片生成方法を選択することにより制御することができる。
用語「切断作用因子」は、一般に、核酸を1つまたは複数の特異的または非特異的部位で切断することができる薬剤、ときには、化学物質または酵素を指す。特異的切断作用因子は、特定のヌクレオチド配列に従って特定の部位で特異的に切断することが多く、特定の部位は、切断部位と呼ばれることがある。切断作用因子は、酵素的切断作用因子、化学的切断作用因子、および光(例えば、紫外(UV)線)を含み得る。
酵素的切断作用因子の例としては、限定ではないが、エンドヌクレアーゼ;デオキシリボヌクレアーゼ(DNase;例えば、DNase I、II);リボヌクレアーゼ(RNase;例えば、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse V);エンドヌクレアーゼVIII;CLEAVASE酵素;TAQ DNAポリメラーゼ;E.coli DNAポリメラーゼI;真核生物の構造特異的エンドヌクレアーゼ;マウスFEN-1エンドヌクレアーゼ;ニッキング酵素;I、IIまたはIII型制限エンドヌクレアーゼ(すなわち、制限酵素)、例えば、Acc I、AciI、Afl III、Alu I、Alw44 I、Apa I、Asn I、Ava I、Ava II、BamH I、Ban II、Bcl I、Bgl I. Bgl II、Bln I、Bsm I、BssH II、BstE II、BstUI、Cfo I、CIa I、Dde I、Dpn I、Dra I、EcIX I、EcoR I、EcoR I、EcoR II、EcoR V、Hae II、Hae II、HhaI、Hind II、Hind III、Hpa I、Hpa II、Kpn I、Ksp I、MaeII、McrBC、Mlu I、MIuN I、Msp I、Nci I、Nco I、Nde I、Nde II、Nhe I、Not I、Nru I、Nsi I、Pst I、Pvu I、Pvu II、Rsa I、Sac I、Sal I、Sau3A I、Sca I、ScrF I、Sfi I、Sma I、Spe I、Sph I、Ssp I、Stu I、Sty I、Swa I、Taq I、Xba I、Xho I;グリコシラーゼ(例えば、ウラシル-DNAグリコシラーゼ(UDG)、3-メチルアデニンDNAグリコシラーゼ、3-メチルアデニンDNAグリコシラーゼII、ピリミジンヒドレート-DNAグリコシラーゼ、FaPy-DNAグリコシラーゼ、チミンミスマッチ-DNAグリコシラーゼ(例えば、ヒポキサンチン-DNAグリコシラーゼ、ウラシルDNAグリコシラーゼ(UDG)、5-ヒドロキシメチルウラシルDNAグリコシラーゼ(HmUDG)、5-ヒドロキシメチルシトシンDNAグリコシラーゼ、または1,N6-エテノ-アデニンDNAグリコシラーゼ);エキソヌクレアーゼ(例えば、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII);5’→3’エキソヌクレアーゼ(例えば、エキソヌクレアーゼII);3’→5’エキソヌクレアーゼ(例えば、エキソヌクレアーゼI);ポリ(A)特異的3’→5’エキソヌクレアーゼ;リボザイム;DNAザイム;など、およびこれらの組合せが挙げられる。
一部の実施形態では、切断部位は、制限酵素認識部位を含む。一部の実施形態では、切断作用因子は、制限酵素を含む。一部の実施形態では、切断部位は、レアカッター制限酵素認識部位(例えば、NotI認識配列)を含む。一部の実施形態では、切断作用因子は、レアカッター酵素(例えば、レアカッター制限酵素)を含む。レアカッター酵素は、ゲノム(例えば、ヒトゲノム)に極めてまれに存在する認識配列を有する制限酵素を一般に指す。一例は、5’-GCGGCCGC-3’配列の最初のGCの後で切断するNotIである。7および8塩基対認識配列を有する制限酵素は、多くの場合、レアカッター酵素と考えられる。
DNAを特異的部位で切断するための切断方法および制限酵素を選択するための手順は、当業者に周知である。例えば、New England BioLabs、Pro-Mega Biochems、Boehringer-Mannheimなどを含む、多くの制限酵素供給業者は、特異的制限酵素により切断されるDNA配列の条件およびタイプに関する情報を提供している。酵素は、約95%~100%の効率で、好ましくは約98%~100%の効率で、DNAの切断を可能にすることになる条件下で使用されることが多い。
一部の実施形態では、切断部位は、1つまたは複数のリボ核酸(RNA)ヌクレオチドを含む。一部の実施形態では、切断部位は、1つまたは複数のRNAヌクレオチドを含む一本鎖部分を含む。一部の実施形態では、一本鎖部分は、二重鎖部分と隣接している。一部の実施形態では、一本鎖部分は、ヘアピンループである。一部の実施形態では、切断部位は、1つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、2つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、3つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、4つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、5つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、5つより多くのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)、グアニン(G)およびウラシル(U)から選択される1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)およびグアニン(G)から選択される1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、ウラシル(U)を含まない。一部の実施形態では、切断部位は、グアニン(G)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、グアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、を、アデニン(A)およびシトシン(C)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断作用因子は、リボヌクレアーゼ(RNAse)を含む。一部の実施形態では、RNAseは、エンドリボヌクレアーゼである。RNAseは、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse Vのうちの1つまたは複数から選択することができる。
一部の実施形態では、切断部位は、光切断性スペーサーまたは光切断性修飾を含む。光切断性修飾は、例えば、特異的波長(例えば、300~350nm)の紫外(UV)線により切断可能である光解離性官能基を含み得る。光切断性スペーサーの例(Integrated DNA Technologiesから入手可能;製品番号1707)は、適切なスペクトル範囲内のUV線に曝露されたときにのみ切断され得る、10原子リンカーアームである。光切断性スペーサーを含むオリゴヌクレオチドは、後のリガーゼ反応に利用可能である5’リン酸基を有することができる。光切断性スペーサーを、DNA塩基間に配置することができ、またはオリゴと末端修飾(例えばフルオロフォア)の間に配置することができる。そのような実施形態では、紫外(UV)線を切断作用因子と考えることができる。
一部の実施形態では、切断部位は、ジオールを含む。例えば、切断部位は、5’と5’の連結で組み込まれた隣接ジオールを含むことがある。ジオールを含む切断部位は、例えば過ヨウ素酸塩を使用して、化学的に切断することができる。一部の実施形態では、切断部位は、平滑末端制限酵素認識部位を含む。平滑末端制限酵素認識部位を含む切断部位は、平滑末端制限酵素により切断することができる。
ニックシールおよびフィルイン
一部の実施形態では、本明細書における方法は、ニックシール反応を行うステップ(例えば、DNAリガーゼまたは他の好適な酵素、およびある特定の事例では、核酸を5’リン酸化するように構成されたキナーゼ(例えば、ポリヌクレオチドキナーゼ(PNK)を使用する)を含む。一部の実施形態では、本明細書における方法は、フィルイン反応を行うステップを含む。例えば、骨格アダプターが二重鎖として存在する場合、二重鎖の一部または全ては、ssNAとハイブリダイズする末端の反対側のその二重鎖の末端にオーバーハングを含むことがある。そのような二重鎖オーバーハングが存在する場合、本明細書における方法は、結合させるステップの後に、二重鎖により形成されたオーバーハングをフィルインするステップをさらに含み得る。一部の実施形態では、フィルイン反応は、平滑末端化ハイブリダイゼーション産物を生成するために行われる。フィルイン反応を行うために任意の好適な試薬を使用することができる。フィルイン反応を行うために好適なポリメラーゼとしては、例えば、DNAポリメラーゼI、大きい(クレノウ)断片、Bacillus stearothermophilus(Bst)DNAポリメラーゼなどが挙げられる。一部の実施形態では、鎖置換ポリメラーゼが使用される(例えば、Bst DNAポリメラーゼ)。
エキソヌクレアーゼ処理
一部の実施形態では、核酸(例えば、RNA-DNA二重鎖、ハイブリダイゼーション産物、環状化ハイブリダイゼーション産物)は、エキソヌクレアーゼで処理される。一部の実施形態では、RNA-DNA二重鎖(例えば、第1鎖cDNA合成により生成されたRNA-DNA二重鎖)中のRNAは、エキソヌクレアーゼで処理される。エキソヌクレアーゼは、3’または5’末端のどちらかにおけるホスホジエステル結合を切断する加水分解反応によってポリヌクレオチド鎖の末端から1つずつヌクレオチドを切断することにより作用する酵素である。エキソヌクレアーゼは、例えば、DNAse、RNAse(例えば、RNAseH)、5’→3’エキソヌクレアーゼ(例えば、エキソヌクレアーゼII)、3’→5’エキソヌクレアーゼ(例えば、エキソヌクレアーゼI)、およびポリ(A)特異的3’→5’エキソヌクレアーゼを含む。一部の実施形態では、エキソヌクレアーゼ活性は、逆転写酵素により提供される(例えば、完全機能性RNAseHドメインを有するM-MLV逆転写酵素により提供されるRNAse活性)。一部の実施形態では、ハイブリダイゼーション産物は、例えば、一本鎖オリゴヌクレオチド、核酸断片、またはRNA-DNA二重鎖からのRNAなどの、夾雑核酸を除去するために、エキソヌクレアーゼで処理される。一部の実施形態では、環状化ハイブリダイゼーション産物は、一切の非環状化ハイブリダイゼーション産物、ハイブリダイズされていないオリゴヌクレオチド、ハイブリダイズされていない標的核酸、オリゴヌクレオチドダイマーなど、およびこれらの組合せを除去するために、エキソヌクレアーゼで処理される。
試料
核酸を処理および/または解析するための方法および組成物が、本明細書で提供される。本明細書に記載される方法および組成物において利用される核酸または核酸混合物は、対象(例えば、被検対象)から得た試料から単離することができる。対象は、ヒト、非ヒト動物、植物、細菌、真菌、原生生物または病原体を含むがこれらに限定されない、任意の生命体または非生命体であり得る。任意のヒトまたは非ヒト動物を選択することができ、任意のヒトまたは非ヒト動物としては、例えば、哺乳動物、爬虫類、鳥類、両生類、魚類、有蹄動物、反芻動物、ウシ亜科の動物(例えば、ウシ)、ウマ科の動物(例えば、ウマ)、ヤギ亜科の動物およびヒツジ属の動物(例えば、ヒツジ、ヤギ)、イノシシ属の動物(例えば、ブタ)、ラクダ科の動物(例えば、ラクダ、ラマ、アルパカ)、サル、類人猿(例えば、ゴリラ、チンパンジー)、クマ科の蹠行性肉食動物(例えば、クマ)、家禽、イヌ、ネコ、マウス、ラット、魚類、イルカ、クジラおよびサメを挙げることができる。対象は、雄であってもよく、または雌(例えば、女性、もしくは妊婦)であってもよい。対象は、いかなる年齢(例えば、胚、胎児、乳幼児、小児、成人)であってもよい。対象は、がん患者、がんの罹患が疑われる患者、寛解期の患者、がんの家族歴を有する患者、および/またはがんスクリーニングを受ける対象であり得る。対象は、感染症もしくは感染性疾患に罹患しているまたは病原体(例えば、細菌、ウイルス、真菌、原生動物など)に感染した患者、感染症もしくは感染性疾患の罹患または病原体による感染が疑われる患者、感染症、感染性疾患または病原体感染から回復した患者、感染症歴、感染性疾患歴、病原体感染歴がある患者、および/あるいは感染性疾患または病原体スクリーニングを受ける対象であり得る。対象は、移植レシピエントであり得る。対象は、マイクロバイオーム解析を受けている患者であり得る。一部の実施形態では、被検対象は、雌である。一部の実施形態では、被検対象は、ヒト雌である。一部の実施形態では、被検対象は、雄である。一部の実施形態では、被検対象は、ヒト雄である。
核酸試料を、任意のタイプの好適な生物検体または試料(例えば、被検試料)から単離することまたは得ることができる。核酸試料を、単一細胞、複数の細胞(例えば、培養細胞)、細胞培養培地、馴化培地、組織、臓器、または生物(例えば、細菌、酵母など)から単離することまたは得ることができる。一部の実施形態では、核酸試料は、動物(例えば、動物対象)の細胞、組織、臓器および/またはこれらに類するものから単離されるかまたは得られる。一部の実施形態では、核酸試料は、細菌、酵母、昆虫(例えば、ショウジョウバエ)、哺乳動物、両生類(例えば、カエル(例えば、ツメガエル))、ウイルス、植物、または任意の他の哺乳動物もしくは非哺乳動物の核酸試料源などの、供給源から単離されるかまたは得られる。
核酸試料を、現存生物または動物から単離することまたは得ることができる。一部の事例では、核酸試料を、絶滅した(または「古代」)生物または動物(例えば、絶滅した哺乳動物;ヒト属からの絶滅した哺乳動物)から単離することまたは得ることができる。一部の事例では、核酸試料を、診断分析の一部として得ることができる。
一部の事例では、核酸試料を、法医学分析の一部として得ることができる。一部の実施形態では、本明細書に記載される一本鎖核酸ライブラリー調製(ssPrep)方法は、法医学試料または検体に適用される。法医学試料または検体は、核酸を含有するあらゆる生物学的物質を含み得る。例えば、法医学試料または検体は、血液、精液、毛髪、皮膚、汗、唾液、分解された組織、骨、指の爪の擦過物、舐められた切手/封筒、剥離物、タッチDNA、カミソリ残留物などを含み得る。
試料または被検試料は、対象またはその一部(例えば、ヒト対象、妊娠している雌、がん患者、感染症または感染性疾患に罹患している患者、移植レシピエント、胎児、腫瘍、感染臓器または組織、移植臓器または組織、マイクロバイオーム)から単離されるまたは得られ任意の検体であり得る。試料は、任意の妊娠期(例えば、ヒト対象については妊娠初期、妊娠中期または妊娠後期)の胎児を宿している妊娠している雌対象からのものであることもあり、出産後の対象からのものであることもある。試料は、すべての染色体が正倍数性である胎児を宿している妊娠している対象からのものであることもあり、染色体異数性(例えば、染色体の1、3(すなわち、トリソミー(例えば、T21、T18、T13))もしくは4つのコピー)または他の遺伝的変異を有する胎児を宿している妊娠している対象からのものであることもある。検体の非限定的な例としては、血液もしくは血液製剤(例えば、血清、血漿など)、臍帯血、絨毛膜絨毛、羊水、脳脊髄液、脊髄液、洗浄液(例えば、気管支肺胞、胃、腹膜、管、耳、関節鏡視下)、生検試料(例えば、着床前胚;がん生検からのもの)、体腔穿刺試料、細胞(血液細胞、胎盤細胞、胚もしくは胎児細胞、胎児有核細胞もしくは胎児細胞遺残物、正常細胞、異常細胞(例えば、がん細胞))またはそれらの部分(例えば、ミトコンドリアのもの、核、抽出物など)、雌生殖管の洗液、尿、糞便、痰、唾液、鼻粘膜、前立腺液、洗浄、精液、リンパ液、胆汁、涙、汗、母乳、乳汁など、またはそれらの組合せを限定ではないが含む、対象からの体液または組織が挙げられる。一部の実施形態では、生体試料は、対象からの子宮頸部スワブである。核酸が抽出される体液または組織試料は、無細胞性(例えば、無細胞)であることがある。一部の実施形態では、体液または組織試料は、細胞要素または細胞遺残物を含有することがある。一部の実施形態では、胎児細胞またはがん細胞が試料に含まれていることがある。
試料は、液体試料であることがある。液体試料は、細胞外核酸(例えば、循環無細胞DNA)を含むことがある。液体試料の例としては、血液もしくは血液製剤(例えば、血清、血漿など)、尿、脳脊髄液、唾液、痰、生検試料(例えば、がんの検出のための液体生検)、上記の液体試料など、またはこれの組合せが挙げられるがこれらに限定されない。ある特定の実施形態では、試料は、液体生検であり、液体生検は、疾患の存在、非存在、悪化または寛解についての対象からの液体試料の評定を一般に指す。液体生検を、固体生検(例えば、腫瘍生検)とともに、または固体生検(例えば、腫瘍生検)の代替法として、使用することができる。ある特定の事例では、細胞外核酸は、液体生検で解析される。
一部の実施形態では、生体試料は、血液、血漿または血清であることがある。用語「血液」は、従来どおりの定義の、全血、血液製剤、または血液の任意の画分、例えば、血清、血漿、バフィーコートなどを包含する。血液またはその画分は、ヌクレオソームを含むことが多い。ヌクレオソームは、核酸を含み、無細胞であることもあり、または細胞内にあることもある。血液は、バフィーコートも含む。バフィーコートは、フィコール勾配を利用することにより単離されることもある。バフィーコートは、白血球(例えば、白血球細胞、T細胞、B細胞、血小板など)を含むことができる。血漿は、抗凝固薬で処理された血液の遠心分離の結果として得られる、全血の画分を指す。血清は、血液試料が凝固した後に残存する流体の水様部分を指す。体液または組織試料は、病院または診療所が一般に準拠する標準プロトコールに従って採取されることが多い。血液の場合、末梢血の適切な量(例えば、3~40ミリリットルの間、5~50ミリリットルの間)が採取されることが多く、調製前または後に標準的な手順に従って保管され得る。
対象の血液中で見つかった核酸の解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、母体血中で見つかった胎児DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、患者の血液中で見つかった腫瘍またはがんDNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、患者の血液中で見つかった病原体DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、移植レシピエントの血液中で見つかった移植DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。対象(例えば、母体対象;患者;がん患者)から得た血液から血清または血漿を調製する方法は、公知である。例えば、対象の血液(例えば、妊婦の血液;患者の血液;がん患者の血液)を、EDTAを含有するチューブまたは専用市販製品、例えば、Cell-Free DNA BCT(Streck,Omaha,NE)またはVacutainer SST(Becton Dickinson、Franklin Lakes、N.J.)に入れて、血液凝固を防止することができ、次いで、血漿を全血から遠心分離によって得ることができる。血清は、血液凝固後の遠心分離を行ってまたは行わずに得ることができる。遠心分離が使用される場合には、遠心分離は、排他的にではないが、通常は、適切な速度、例えば、1,500~3,000回gで行われる。血漿または血清は、核酸抽出のために未使用のチューブに移す前に追加の遠心分離ステップに付されることがある。全血の無細胞性部分に加えて、細胞画分から、対象からの全血試料の遠心分離および血漿の除去後に得ることができるバフィーコート部分に多く含まれている核酸を回収することもできる。
試料は、腫瘍核酸試料(すなわち、腫瘍から単離された核酸試料)であることがある。用語「腫瘍」は、悪性であるか良性であるかを問わず、新生物細胞成長および増殖を一般に指し、前がん性およびがん性細胞および組織を含み得る。用語「がん」および「がん性(の)」は、非調節細胞成長/増殖によって通常は特徴付けられる哺乳動物の生理的状態を一般に指す。がんの例としては、癌腫、リンパ腫、芽腫、肉腫、白血病、扁平上皮がん、小細胞肺がん、非小細胞肺がん、肺腺癌、肺扁平上皮癌、腹膜がん、肝細胞がん、消化管がん、膵臓がん、神経膠芽腫、子宮頸がん、卵巣がん、肝臓がん、膀胱がん、ヘパトーマ、乳がん、結腸がん、結腸直腸がん、子宮内膜または子宮癌、唾液腺癌、腎臓がん、肝臓がん、前立腺がん、外陰がん、甲状腺がん、肝癌、様々なタイプの頭頸部がんなどが挙げられるが、これらに限定されない。
試料は、不均一であることがある。例えば、試料は、1つより多くの細胞型および/または1つもしくは複数の核酸種を含むことがある。一部の事例では、試料は、(i)胎児細胞と母体細胞、(ii)がん細胞と非がん細胞、および/または(iii)病原性細胞と宿主細胞を含むことがある。一部の事例では、試料は、(i)がん核酸と非がん核酸、(ii)病原体核酸と宿主核酸、(iii)胎児由来核酸と母体由来核酸、および/またはより一般的には、(iv)突然変異した核酸と野生型核酸を含むことがある。一部の事例では、試料は、下でさらに詳細に説明されるような、少数派核酸種と多数派核酸種を含むことがある。一部の事例では、試料は、単一の対象からの細胞および/もしくは核酸を含むこともあり、または複数の対象からの細胞および/もしくは核酸を含むこともある。
核酸
核酸を処理および/または解析するための方法および組成物が、本明細書で提供される。核酸、核酸分子、核酸断片、標的核酸、核酸鋳型、鋳型核酸、核酸標的、標的核酸、ポリヌクレオチド、ポリヌクレオチド断片、標的ポリヌクレオチド、ポリヌクレオチド標的などの用語は、本開示を通して同義で使用され得る。これらの用語は、DNA(例えば、相補的DNA(cDNA;目的の任意のRNAまたはDNAから合成されたもの)、ゲノムDNA(gDNA)、ゲノムDNA断片、ミトコンドリアDNA(mtDNA)、組換えDNA(例えば、プラスミドDNA)など)、RNA(例えば、メッセンジャーRNA(mRNA)、短鎖抑制性RNA(siRNA)、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA、トランス作用性低分子干渉RNA(ta-siRNA)、天然低分子干渉RNA(nat-siRNA)、核小体低分子RNA(snoRNA)、核内低分子RNA(snRNA)、長鎖ノンコーディングRNA(lncRNA)、ノンコーディングRNA(ncRNA)、トランスファー・メッセンジャーRNA(tmRNA)、前駆体メッセンジャーRNA(pre-mRNA)、低分子カハール体特異的RNA(scaRNA)、piwi結合RNA(piRNA)、エンドリボヌクレアーゼ調製siRNA(esiRNA)、小分子RNA(stRNA)、シグナル認識RNA、テロメアRNA、胎児または胎盤により高度に発現されるRNAなど)、および/またはDNAもしくはRNAアナログ(例えば、塩基アナログ、糖アナログおよび/または非ネイティブ骨格などを含む)、RNA/DNAハイブリッドならびにポリアミド核酸(PNA)であって、すべてが、一本鎖または二本鎖形態であることがあり、別段の限定がない限り、天然に存在するヌクレオチドと同様に機能することができる天然ヌクレオチドの公知のアナログを包含し得る、これらのものなどからの、任意の組成の核酸を指す。核酸は、プラスミド、ファージ、ウイルス、細菌、自己複製配列(ARS)、ミトコンドリア、セントロメア、人工染色体、染色体であってもよく、またはこれらからのものであってもよく、あるいはある特定の実施形態ではin vitroでまたは宿主細胞、細胞、細胞の細胞核もしくは細胞質で複製し得るもしくは複製され得る他の核酸であってもよく、またはそのような他の核酸からのものであってもよい。一部の実施形態での鋳型核酸は、単一の染色体からのものであり得る(例えば、核酸試料は、二倍体生物から得られた試料の1つの染色体からのものであることがある)。特に制限がない限り、この用語は、参照核酸と同様の結合特性を有し、天然に存在するヌクレオチドと同様に代謝される、天然ヌクレオチドの公知アナログを含む、核酸を包含する。別段の指示がない限り、特定の核酸配列は、明確に示される配列ばかりでなく、その保存的に修飾されたバリアント(例えば、縮重コドン置換)、対立遺伝子、オルソログ、一塩基多型(SNP)および相補配列も暗に包含する。具体的には、縮重コドン置換は、1つまたは複数の選択された(またはすべての)コドンの第3の位置が混合塩基および/またはデオキシイノシン残基で置換されている配列を生じさせることにより果たすことができる。核酸という用語は、遺伝子座、遺伝子、遺伝子によりコードされているcDNAおよびmRNAと同義で使用される。この用語は、ヌクレオチドアナログ、一本鎖(「センス」または「アンチセンス」、「プラス」鎖または「マイナス」鎖、「フォワード」リーディングフレームまたは「リバース」リーディングフレーム)および二本鎖ポリヌクレオチドから合成されたRNAまたはDNAの誘導体、バリアントおよびアナログも、同意義のものとして含み得る。用語「遺伝子」は、ポリペプチド鎖の産生に関与するDNAの一区画を指し;遺伝子産物の転写/翻訳におよび転写/翻訳の調節に関与するコード領域(リーダーおよびトレーラー)に先行するおよび続く領域、ならびに個々のコード領域(エクソン)間の介在配列(イントロン)を一般に含む。ヌクレオチドまたは塩基は、核酸のプリンおよびピリミジン分子単位(例えば、アデニン(A)、チミン(T)、グアニン(G)およびシトシン(C))を一般に指す。RNAについては、塩基チミンが、ウラシルに置き換えられる。核酸長またはサイズを、塩基の数で表すことができる。
標的核酸は、目的の任意の核酸であり得る。核酸は、デオキシリボヌクレオチド(すなわち、DNA塩基)、リボヌクレオチド(すなわち、RNA塩基)、またはこれらの組合せで構成されている任意の長さの、例えば、10塩基のまたはそれより長い、20塩基のまたはそれより長い、50塩基のまたはそれより長い、100塩基のまたはそれより長い、200塩基のまたはそれより長い、300塩基のまたはそれより長い、400塩基のまたはそれより長い、500塩基のまたはそれより長い、1000塩基のまたはそれより長い、2000塩基のまたはそれより長い、3000塩基のまたはそれより長い、4000塩基のまたはそれより長い、5000塩基のまたはそれより長いポリマーであり得る。ある特定の態様では、核酸は、デオキシリボヌクレオチド(すなわち、DNA塩基)、リボヌクレオチド(すなわち、RNA塩基)、またはこれらの組合せ、例えば、10塩基もしくはそれ未満、20塩基もしくはそれ未満、50塩基もしくはそれ未満、100塩基もしくはそれ未満、200塩基もしくはそれ未満、300塩基もしくはそれ未満、400塩基もしくはそれ未満、500塩基もしくはそれ未満、1000塩基もしくはそれ未満、2000塩基もしくはそれ未満、3000塩基もしくはそれ未満、4000塩基もしくはそれ未満、または5000塩基もしくはそれ未満で構成されている、ポリマーである。
核酸は、一本鎖状であってもよく、または二本鎖状であってもよい。例えば、一本鎖DNA(ssDNA)は、例えば、加熱によりまたはアルカリでの処理により二本鎖DNAを変性させることによって生成することができる。したがって、一部の実施形態では、ssDNAは、二本鎖DNA(dsDNA)に由来する。一部の実施形態では、本明細書における方法は、dsDNAを含む核酸組成物と、本明細書における足場アダプターまたはその成分とを結合させるステップの前に、dsDNAを変性させるステップを含み、それによってssDNAが生成される。
ある特定の実施形態では、核酸は、オリゴヌクレオチドまたはDNA様分子、例えばペプチド核酸(PNA)、による二重鎖DNA分子に対する鎖侵入によって形成される、D-ループ構造で存在する。例えば、当技術分野において公知の方法を使用する、E.Coli RecAタンパク質の付加によりおよび/または塩濃度の変更により、Dループ形成を助長することができる。
核酸(例えば、核酸標的、一本鎖核酸(ssNA)、オリゴヌクレオチド、オーバーハング、足場ポリヌクレオチドおよびそれらのハイブリダイゼーション領域(例えば、ssNAハイブリダイゼーション領域、オリゴヌクレオチドハイブリダイゼーション領域))は、別の核酸に相補的であると、相補性領域を有すると、別の核酸とハイブリダイズすることができると、またはハイブリダイゼーション領域を有すると、本明細書に記載されることがある。用語「相補的」または「相補性」または「ハイブリダイゼーション」は、核酸の領域への非共有結合により塩基対合するヌクレオチド配列(例えば、ssNA断片の末端領域とハイブリダイズするssNAハイブリダイゼーション領域のヌクレオチド配列、および足場アダプターのオリゴヌクレオチド成分とハイブリダイズするオリゴヌクレオチドハイブリダイゼーション領域のヌクレオチド配列)を、一般に指す。標準ワトソン・クリック塩基対合では、DNAの場合、アデニン(A)は、チミン(T)と塩基対合を形成し、グアニン(G)は、シトシン(C)と対合する。RNAの場合、チミン(T)は、ウラシル(U)により置き換えられる。しかるが故に、Aは、Tに相補的であり、Gは、Cに相補的である。RNAの場合、Aは、Uに相補的であり、逆もまた同様である。DNA-RNA二重鎖の場合、A(DNA鎖中の)は、U(RNA鎖中の)に相補的である。一部の実施形態では、1つまたは複数のチミン(T)塩基は、足場アダプターまたはその成分中のウラシル(U)により置き換えられ、アデニン(A)に相補的である。通常は、「相補的」または「相補性」または「ハイブリダイズすることができる」は、少なくとも部分的に相補的であるヌクレオチド配列を指す。これらの用語は、完全に相補的であり、したがって、一方の鎖内のあらゆるヌクレオチドが、他方の鎖の対応する位置のあらゆるヌクレオチドと相補的であるかまたはハイブリダイズする、二重鎖も包含し得る。
ある特定の事例では、ヌクレオチド配列は、標的に部分的に相補的であることがあり、この場合、すべてのヌクレオチドが、標的核酸中のすべての対応する位置のあらゆるヌクレオチドと相補的であるとは限らない。例えば、ssNAハイブリダイゼーション領域は、標的ssNA末端領域に完璧に(すなわち、100%)相補的であることもあり、またはssNAハイブリダイゼーション領域は、完璧とまではいかない(例えば、70%、75%、85%、90%、95%、99%である)ある程度の相補性を共有することもある。別の例では、オリゴヌクレオチドハイブリダイゼーション領域は、オリゴヌクレオチドに完璧に(すなわち、100%)相補的であることもあり、またはオリゴヌクレオチドハイブリダイゼーション領域は、完璧とまではいかない(例えば、70%、75%、85%、90%、95%、99%である)ある程度の相補性を共有することもある。
2つのヌクレオチド配列の同一性パーセントは、最適な比較を目的として配列をアライメントすることにより決定することができる(例えば、最適なアライメントのために第1の配列の配列にギャップを導入することができる)。その場合、対応する位置のヌクレオチドが比較され、2配列間の同一性パーセントは、それらの配列により共有される同一の位置の数の関数である(すなわち、同一性%=同一の位置の数/位置の総数×100)。1つの配列内の位置が、他の配列内の対応する位置と同じヌクレオチドにより占有されている場合には、それらの分子は、その位置で同一である。
一部の実施形態では、核酸の混合物中の核酸が解析される。核酸の混合物は、同じもしくは異なるヌクレオチド配列、異なる長さ、異なる起源(例えば、ゲノム起源、胎児対母体起源、細胞もしくは組織起源、がん対非がん起源、腫瘍対非腫瘍起源、宿主対病原体、宿主対移植片、宿主対マイクロバイオーム、試料起源、対象起源など)、異なるオーバーハング長、異なるオーバーハングタイプ(例えば、5’オーバーハング、3’オーバーハング、オーバーハングなし)、またはこれらの組合せを有する、2つまたはそれより多くの核酸種を含むことができる。一部の実施形態では、核酸の混合物は、一本鎖核酸および二本鎖核酸を含む。一部の実施形態では、核酸の混合物は、DNAおよびRNAを含む。一部の実施形態では、核酸の混合物は、リボソームRNA(rRNA)およびメッセンジャーRNA(mRNA)を含む。本明細書に記載されるプロセスに供される核酸は、1つの試料からの、または2つもしくはそれより多くの試料からの(例えば、1つもしくは複数、2つもしくはそれより多くの、3つもしくはそれより多くの、4つもしくはそれより多くの、5つもしくはそれより多くの、6つもしくはそれより多くの、7つもしくはそれより多くの、8つもしくはそれより多くの、9つもしくはそれより多くの、10もしくはそれより多くの、11もしくはそれより多くの、12もしくはそれより多くの、13もしくはそれより多くの、14もしくはそれより多くの、15もしくはそれより多くの、16もしくはそれより多くの、17もしくはそれより多くの、18もしくはそれより多くの、19もしくはそれより多くの、または20もしくはそれより多くの試料からの)核酸を含有することがある。
一部の実施形態では、標的核酸(例えば、ssNA)は、分解されたDNAを含む。分解されたDNAは、低品質DNAまたは高度に分解されたDNAと呼ばれることがある。分解されたDNAは、高度に断片化されていることがあり、損傷部をミスコードしやすいおよび/または分子間架橋しやすい塩基アナログおよび脱塩基部位などの損傷を含むことがある。例えば、シトシン残基の脱アミノ化の結果として生じるシーケンシングの誤りは、分解されたDNAから得られるある特定の配列中に存在することがある(例えば、CをTとおよびGをAとミスコードすること)。一部の実施形態では、標的核酸(例えば、ssNA)は、ニックの入った二本鎖核酸断片に由来する。ニックの入った二本鎖核酸断片を変性(例えば、熱変性)させてssNA断片を生成することができる。
核酸を当技術分野において公知の方法により1つまたは複数の供給源(例えば、生体試料、血液、細胞、血清、血漿、バフィーコート、尿、リンパ液、皮膚、毛髪、土壌など)から得ることができる。任意の好適な方法を、生体試料から(例えば、血液または血液製剤から)のDNAの単離、抽出および/または精製に使用することができ、この方法の非限定的な例としては、DNA調製方法(例えば、Sambrook and Russell, Molecular Cloning: A Laboratory Manual 3d ed., 2001に記載されている)、様々な市販の試薬もしくはキット、例えば、Qiagen,Inc.(Germantown、Md)によるDNeasy(登録商標)、RNeasy(登録商標)、QIAprep(登録商標)、QIAquick(登録商標)およびQIAamp(登録商標)(例えば、QIAamp(登録商標)Circulating Nucleic Acid Kit、QiaAmp(登録商標)DNA Mini KitまたはQiaAmp(登録商標)DNA Blood Mini Kit)核酸単離/精製キット;GenomicPrep(商標)Blood DNA Isolation Kit(Promega、Madison、Wis.);GFX(商標)Genomic Blood DNA Purification Kit(Amersham、Piscataway、N.J.);Life Technologies,Inc.(Carlsbad、CA)によるDNAzol(登録商標)、ChargeSwitch(登録商標)、Purelink(登録商標)、GeneCatcher(登録商標)核酸単離/精製キット;Clontech Laboratories,Inc.(Mountain View、CA)によるNucleoMag(登録商標)、NucleoSpin(登録商標)およびNucleoBond(登録商標)核酸単離/精製キット;など、またはこれらの組合せが挙げられる。ある特定の態様では、核酸は、固定された生体試料、例えば、ホルマリン固定、パラフィン包埋(FFPE)組織から、単離される。FFPE組織からのゲノムDNAは、市販のキット-例えば、Qiagen,Inc.(Germantown、Md)によるAllPrep(登録商標)DNA/RNA FFPEキット、Life Technologies,Inc.(Carlsbad、CA)によるFFPE用RecoverAll(登録商標)Total Nucleic Acid Isolationキット、およびClontech Laboratories,Inc.(Mountain View、CA)によるNucleoSpin(登録商標)FFPEキット-を使用して単離することができる。
一部の実施形態では、核酸は、細胞溶解手順を使用して細胞から抽出される。細胞溶解手順および試薬は、当技術分野において公知であり、一般に、化学的方法(例えば、界面活性剤、低張溶液、酵素的手順など、もしくはこれらの組合せ)、物理的方法(例えば、フレンチプレス、音波処理など)、または電解溶解法により行われ得る。任意の好適な溶解手順を利用することができる。例えば、化学的方法は、一般に、溶解剤を利用して細胞を破壊し、細胞から核酸を抽出し、その後、カオトロピック塩で処理する。物理的方法、例えば、凍結/解凍、続いての粉砕、細胞プレスの使用なども、有用である。一部の事例では、高塩および/またはアルカリ溶解手順が利用されることがある。一部の事例では、溶解手順は、EDTA/プロテイナーゼKでの溶解ステップ、大量の塩(例えば、グアニジン塩酸塩(GuHCl)、酢酸ナトリウム)およびイソプロパノールを用いる結合緩衝ステップ、およびこの溶液中のDNAをシリカに基づくカラムに結合させるステップを含み得る。一部の事例では、溶解プロトコールは、Dabney et al., Proceedings of the National Academy of Sciences 110, no. 39 (2013): 15758-15763に記載されている、ある特定の手順を含む。
核酸は、ある特定の実施形態では細胞外核酸を含むことができる。用語「細胞外核酸」は、本明細書で使用される場合、実質的に細胞を有さない供給源から単離された核酸を指すことができ、「無細胞」核酸(無細胞DNA、無細胞RNA、または両方)、「循環無細胞核酸」(例えば、CCF断片、ccf DNA)および/または「無細胞循環胞核酸」とも呼ばれる。細胞外核酸は、血液中に存在することができ、細胞外核酸を血液から(例えば、ヒト対象の血液から)得ることができる。細胞外核酸は、多くの場合、検出可能な細胞を含まず、細胞要素または細胞遺残物を含有し得る。細胞外核酸の無細胞性供給源の非限定的な例は、血液、血漿、血清および尿である。ある特定の態様では、無細胞核酸は、全血、血漿、血清、羊水、唾液、尿、胸膜滲出液、気管支洗浄、気管支吸引物、母乳、初乳、涙、精液、腹水、胸膜滲出液、および便から選択される体液試料から得られる。本明細書で使用される場合、用語「無細胞循環試料核酸を得る」は、試料を直接得ること(例えば、試料、例えば被検試料、を採取すること)、または試料を採取した別の者から試料を得ることを含む。細胞外核酸は、細胞の分泌および/または核酸放出(例えば、DNA放出)の産物であることがある。細胞外核酸は、例えば、任意の形態の死細胞の産物であることがある。一部の事例では、細胞外核酸は、有糸分裂性、膨化性、毒性、虚血性のものなど、およびこれらの組合せを含む、任意の形態のI型またはII型細胞死の産物である。理論により制限されるものではないが、細胞外核酸は、細胞アポトーシスおよび細胞破壊の産物であることがあり、これは、スペクトル(例えば「ラダー」)にわたって一連の長さを有することが多い細胞外核酸の基礎を提供する。一部の事例では、細胞外核酸は、細胞壊死、ネクロプトーシス(necropoptosis)、膨化死、エントーシス、ピロトーシス(pyrotosis)など、およびこれらの組合せの産物である。一部の実施形態では、被検対象からの試料核酸は、循環無細胞核酸である。一部の実施形態では、循環無細胞核酸は、被検対象からの血漿または血清からのものである。一部の態様では、無細胞核酸は、分解されている。一部の実施形態では、無細胞核酸は、無細胞胎児核酸(例えば、無細胞胎児DNA)を含む。ある特定の態様では、無細胞核酸は、循環がん核酸(例えば、がんDNA)を含む。ある特定の態様では、無細胞核酸は、循環腫瘍核酸(例えば、腫瘍DNA)を含む。一部の実施形態では、無細胞核酸は、感染性因子核酸(例えば、病原体DNA)を含む。一部の実施形態では、無細胞核酸は、移植片からの核酸(例えば、DNA)を含む。一部の実施形態では、無細胞核酸は、マイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)からの核酸(例えば、DNA)を含む。
無細胞DNA(cfDNA)は、分解された供給源に由来することがあり、多くの場合、抽出されたときにわずかな量のDNAしか提供しない。一本鎖DNA(ssDNA)ライブラリーを生成するための本明細書に記載される方法は、cfDNAから大量の短いDNA断片を捕捉することができる。例えば、がん試料からのcfDNAは、短い断片のより高度な集団を有する傾向がある。ある特定の事例では、cfDNA中の短い断片を、ヌクレオソームではなく転写因子によって生じる断片について濃縮することができる。
細胞外核酸は、異なる核酸種を含むことがあり、したがって、ある一定の実施形態では「不均一」と本明細書では呼ばれる。例えば、腫瘍またはがんに罹患している人物からの血清または血漿は、腫瘍細胞またはがん細胞(例えば、新生物)からの核酸と、非腫瘍細胞または非がん細胞からの核酸とを含み得る。別の例では、妊娠している雌からの血清または血漿は、母体核酸と胎児核酸を含み得る。別の例では、感染症または感染性疾患に罹患している患者からの血清または血漿は、宿主核酸と感染因子または病原体核酸とを含み得る。別の例では、移植を受けたことがある対象からの試料は、宿主核酸とドナー臓器または組織からの核酸とを含み得る。一部の事例では、がん核酸、腫瘍核酸、胎児核酸、病原体核酸、または移植片核酸は、全核酸の約5%~約50%であることもある(例えば、全核酸の約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48または49%が、がん、腫瘍、胎児、病原体、移植片またはマイクロバイオーム核酸である)。別の例では、不均一核酸は、2またはそれより多くの対象(例えば、犯行現場からの試料)からの核酸を含み得る。
少なくとも2つの異なる核酸種が、細胞外核酸中に異なる量で存在することがあり、これらの核酸種は、少数派種および多数派種と呼ばれることがある。ある特定の事例では、核酸の少数派種は、罹患細胞型(例えば、がん細胞、消耗細胞、免疫系による攻撃を受けた細胞)からのものである。ある特定の実施形態では、遺伝的変異または遺伝的変更(例えば、コピー数変更、コピー数変異、一塩基変更、一塩基変異、染色体変更、および/または転座)が、少数派核酸種について判定される。ある特定の実施形態では、遺伝的変異または遺伝的変更が、多数派核酸種について判定される。一般に、用語「少数派」または「多数派」は、いかなる点についても厳格に定義されることを意図したものでない。一態様では、例えば、「少数派」と考えられる核酸は、試料中の全核酸の少なくとも約0.1%から試料中の全核酸の50%未満までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約1%から試料中の全核酸の約40%までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約2%から試料中の全核酸の約30%までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約3%から試料中の全核酸の約25%までの存在量を有することができる。例えば、少数派核酸は、試料中の全核酸の約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%または30%の存在量を有することができる。一部の事例では、細胞外核酸の少数派種は、全核酸の約1%~約40%であることもある(例えば、核酸の約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%または40%が、少数派種核酸である)。一部の実施形態では、少数派核酸は、細胞外DNAである。一部の実施形態では、少数派核酸は、アポトーシス組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、内部の一部の細胞がアポトーシスを遂げた組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、壊死組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、内部の一部の細胞が壊死を遂げた組織からの細胞外DNAである。壊死は、ある特定の事例では、細胞死の後の死後プロセスを指すことがある。一部の実施形態では、少数派核酸は、細胞増殖性障害(例えば、がん)に罹患した組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、腫瘍細胞からの細胞外DNAである。一部の実施形態では、少数派核酸は、細胞外胎児DNAである。一部の実施形態では、少数派核酸は、病原体からの細胞外DNAである。一部の実施形態では、少数派核酸は、移植片からの細胞外DNAである。一部の実施形態では、少数派核酸は、マイクロバイオームからの細胞外DNAである。
別の態様では、例えば、「多数派」と考えられる核酸は、試料中の全核酸の50%を超える存在量から試料中の全核酸の約99.9%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約60%から試料中の全核酸の約99%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約70%から試料中の全核酸の約98%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約75%から試料中の全核酸の約97%までの存在量を有することができる。例えば、多数派核酸は、試料中の全核酸の少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%の存在量を有することができる。一部の実施形態では、多数派核酸は、細胞外DNAである。一部の実施形態では、多数派核酸は、細胞外母体DNAである。一部の実施形態では、多数派核酸は、健康な組織からのDNAである。一部の実施形態では、多数派核酸は、非腫瘍細胞からのDNAである。一部の実施形態では、多数派核酸は、宿主細胞からのDNAである。
一部の実施形態では、細胞外核酸の少数派種は、約500塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約500塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約300塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約300塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約250塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約250塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約200塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約200塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約150塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約150塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約100塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約100塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約50塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約50塩基対またはそれ未満の長さのものである)。
核酸は、核酸を含有する試料の処理の有無にかかわらず、本明細書に記載される方法の実施に供することができる。一部の実施形態では、核酸は、核酸を含有する試料の処理後に、本明細書に記載される方法の実施に供される。例えば、核酸を試料から抽出、単離、精製、部分的に精製、または増幅することができる。用語「単離された」は、本明細書で使用される場合、その元の環境(例えば、それが天然に存在する場合には天然環境、または外因的に発現される場合には宿主細胞)から除去された核酸を指し、したがって、その元の環境からヒトの介入により(例えば、「人間の手により」)変更されている。用語「単離された核酸」は、本明細書で使用される場合、対象(例えば、ヒト対象)から除去された核酸を指すことができる。供給源試料に存在する成分の量より少ない非核酸成分(例えば、タンパク質、脂質)を有する、単離された核酸を提供することができる。単離された核酸を含む組成物は、約50%~99%を超える%非核酸成分不含であり得る。単離された核酸を含む組成物は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える%非核酸成分不含であり得る。用語「精製された」は、本明細書で使用される場合、核酸を精製手順に付す前に存在する非核酸成分の量より少ない非核酸成分(例えば、タンパク質、脂質、炭水化物)を含有する、提供される核酸を指すことができる。精製された核酸を含む組成物は、約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える%他の非核酸成分不含であり得る。用語「精製された」は、本明細書で使用される場合、核酸が由来する試料源中より少ない核酸種を含有する、提供される核酸を指すことができる。精製された核酸を含む組成物は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える%他の核酸種不含であり得る。例えば、胎児核酸を、母体核酸と胎児核酸とを含む混合物から精製することができる。ある特定の例では、核酸の小さい断片(例えば、30~500bp断片)を、異なる長さの核酸断片を含む混合物から精製または部分的に精製することができる。ある特定の例では、核酸のより小さい断片を含むヌクレオソームを、核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。ある特定の例では、核酸のより大きい断片を含むより大きいヌクレオソーム複合体を、核酸のより小さい断片を含むヌクレオソームから精製することができる。ある特定の例では、胎児核酸の小さい断片(例えば、30~500bp断片)を、胎児核酸断片と母体核酸断片の両方を含む混合物から精製または部分的に精製することができる。ある特定の例では、胎児核酸のより小さい断片を含むヌクレオソームを、母体核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。ある特定の例では、がん細胞核酸を、がん細胞核酸と非がん細胞核酸とを含む混合物から精製することができる。ある特定の例では、がん細胞核酸のより小さい断片を含むヌクレオソームを、非がん核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。一部の実施形態では、核酸は、核酸を含有する試料の事前の処理なしで、本明細書に記載される方法の実施に供される。例えば、事前の抽出、精製、部分的精製、および/または増幅なしで、試料から直接核酸を解析することができる。
核酸を増幅条件下で増幅することができる。用語「増幅される」または「増幅」または「増幅条件」は、本明細書で使用される場合、標的核酸(例えば、ssNA)またはその一部と同じまたは実質的に同じヌクレオチド配列を有するアンプリコン核酸を直線的にまたは指数関数的に生成するプロセスに試料中の標的核酸(例えば、ssNA)または本明細書中の方法により生成された核酸産物を付すことを指す。ある特定の実施形態では、用語「増幅される」または「増幅」または「増幅条件」は、ポリメラーゼ連鎖反応(PCR)を含む方法を指す。ある特定の事例では、増幅産物は、核酸鋳型配列の増幅ヌクレオチド領域より1つまたは複数多いヌクレオチドを含有することができる(例えば、プライマーは、核酸鋳型遺伝子分子に相補的なヌクレオチドに加えて転写開始配列などの「余分な」ヌクレオチドを含有することができ、その結果、増幅産物は、核酸鋳型遺伝子分子の増幅ヌクレオチド領域に対応しない「余分な」ヌクレオチドまたはヌクレオチドを含有することになる)。
核酸は、本明細書に記載される方法に核酸を供する前に、核酸中のある特定のヌクレオチドを修飾するプロセスに曝露され得る。例えば、内部のヌクレオチドのメチル化状態に基づいて核酸を選択的に修飾するプロセスを核酸に適用することができる。加えて、高温、紫外線照射、X線照射などの条件は、核酸分子の配列の変化を誘導することができる。核酸を、配列解析を行うのに有用な任意の好適な形態で提供することができる。
一部の実施形態では、標的核酸(例えば、ssNA)は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、修飾されない。一部の実施形態では、標的核酸(例えば、ssNA)は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、長さに関して修飾されない。この文脈での「修飾されない」は、標的核酸が試料から単離され、次いで、標的核酸の長さも組成も修飾することなく、足場アダプターまたはそれらの成分と結合されることを意味する。例えば、標的核酸(例えば、ssNA)は、短縮されないこともあり(例えば、それらは、制限酵素とも、ヌクレアーゼとも、長さを低減させる物理的条件(例えば、せん断条件、切断条件)とも接触されない)、長さが1つまたは複数のヌクレオチドだけ増加されないこともある(例えば、末端は、オーバーハング位置でフィルインされない;ヌクレオチドが末端に付加されない)。標的核酸(例えば、ssNA)の一方または両方の末端へのリン酸基または化学反応性基の付加は、一般に、核酸の修飾とも、核酸の長さの修飾とも見なされない。ssNA断片を生成するための二本鎖核酸(dsNA)断片の変性は、一般に、核酸の修飾とも、核酸の長さの修飾とも見なされない。
一部の実施形態では、標的核酸(例えば、ssNA)の一方または両方のネイティブ末端は、ssNAが本明細書における足場アダプターまたはそれらの成分と結合されるときに存在する。ネイティブ末端は、一般に、核酸断片の未修飾断片を指す。一部の実施形態では、標的核酸(例えば、ssNA)のネイティブ末端は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、長さに関して修飾されない。この文脈での「修飾されない」は、標的核酸が試料から単離され、次いで、標的核酸のネイティブ末端の長さを修飾せずに足場アダプターまたはそれらの成分と結合されることを意味する。例えば、標的核酸(例えば、ssNA)は、長さが1ヌクレオチドも複数ヌクレオチドも短縮されず(例えば、それらは、非ネイティブ末端を生成するために、制限酵素とも、ヌクレアーゼとも、長さを低減する物理的条件(例えば、せん断条件、切断条件)とも接触されず)かつ増加されない(例えば、ネイティブ末端は、オーバーハングでフィルインされない;ヌクレオチドがネイティブ末端に付加されない)。標的核酸のネイティブ末端の一方または両方へのリン酸基または化学反応性基の付加は、一般に、核酸の長さの修飾と見なされない。
一部の実施形態では、標的核酸(例えば、ssNA)は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、切断剤(例えば、エンドヌクレアーゼ、エキソヌクレアーゼ、制限酵素)および/またはポリメラーゼと接触していない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、機械的せん断(例えば、超音波処理(例えば、CovarisによるAdaptive Focused Acoustics(商標)(AFA)プロセス))に付されない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前にエキソヌクレアーゼ(例えば、DNAse)と接触していない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に増幅されない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に固体支持体に結合されない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に別の分子にコンジュゲートされない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前にベクターにクローニングされない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に脱リン酸化に付されることがある。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前にリン酸化に付されることがある。
一部の実施形態では、標的核酸(例えば、ssNA)と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、および単離された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、本明細書における足場アダプターまたはそれらの成分を脱リン酸化すること、および単離された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、足場アダプターまたはそれらの成分を脱リン酸化すること、およびリン酸化された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることを含む。
一部の実施形態では、標的核酸(例えば、ssNA)と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、および単離された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、足場アダプターまたはそれらの成分を脱リン酸化すること、および単離された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、足場アダプターまたはそれらの成分を脱リン酸化すること、およびリン酸化された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることからなる。
一本鎖核酸
専用アダプター(例えば、シーケンシングライブラリーを生成するための)を使用して一本鎖核酸(ssNA)を捕捉するための方法および組成物が、本明細書で提供される。一本鎖核酸またはssNAは、それらの長さの70%またはそれより高い%にわたって一本鎖状態である(すなわち、分子間ハイブリダイゼーションも分子内ハイブリダイゼーションもしていない)ポリヌクレオチドの一群を一般に指す。一部の実施形態では、ssNAは、ポリヌクレオチドの長さの75%もしくはそれより高い%、80%もしくはそれより高い%、85%もしくはそれより高い%、90%もしくはそれより高い%、95%もしくはそれより高い%、または99%もしくはそれより高い%にわたって一本鎖状態である。ある特定の態様では、ssNAは、ポリヌクレオチドの全長にわたって一本鎖状体である。一本鎖核酸は、本明細書では標的核酸と呼ばれることがある。
ssNAは、一本鎖デオキシリボ核酸(ssDNA)を含み得る。一部の実施形態では、ssDNAは、二本鎖DNA(dsDNA)に由来するssDNAを含むが、これに限定されない。例えば、ssDNAは、ssDNAを生成するように変性される(例えば、熱変成される、および/または化学的に変性される)二本鎖DNAから得られる。一部の実施形態では、本明細書における方法は、ssDNAと本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップの前に、dsDNAを変性させることによりssDNAを生成するステップを含む。
一部の実施形態では、ssNAは、一本鎖リボ核酸(ssRNA)を含む。RNAは、例えば、メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、トランス作用性低分子干渉RNA(ta-siRNA)、天然低分子干渉RNA(nat-siRNA)、リボソームRNA(rRNA)、転移RNA(tRNA)、核小体低分子RNA(snoRNA)、核内低分子RNA(snRNA)、長鎖ノンコーディングRNA(lncRNA)、ノンコーディングRNA(ncRNA)、トランスファー・メッセンジャーRNA(tmRNA)、前駆体メッセンジャーRNA(pre-mRNA)、低分子カハール体特異的RNA(scaRNA)、piwi結合RNA(piRNA)、エンドリボヌクレアーゼ調製(endoribonucleaseprepared)siRNA(esiRNA)、小分子RNA(stRNA)、シグナル認識RNA、テロメアRNA、リボザイム、またはこれらの組合せを含み得る。一部の実施形態では、ssNAが、ssRNAである場合、ssRNAは、mRNAである。一部の実施形態では、ssNAは、一本鎖相補DNA(cDNA)を含む。
一部の実施形態では、本明細書における方法は、ssNAと一本鎖核酸結合タンパク質(SSB)とを接触させてSSB結合ssNAを生成するステップを含む。SSBは、一般に、共同的にssNAに結合し、通常は二本鎖核酸(dsNA)にはあまり結合しない。ssDNAに結合すると、SSBは、ヘリックス二重鎖を不安定化する。SSBは、原核生物SSB(例えば、細菌もしくは古細菌SSB)であることもあり、または真核生物SSBであることもある。SSBの例としては、E.coli SSB、E.coli RecA、高度熱安定性一本鎖DNA結合タンパク質(ET SSB)、Thermus thermophilus(Tth)RecA、T4遺伝子32タンパク質、複製プロテインA(RPA-真核生物SSB)などを挙げることができる。ET SSB、Tth RecA、E.coli RecA、T4遺伝子32タンパク質、さらに、そのようなSSBを使用してSSB結合ssNAを調製するための緩衝剤および詳細なプロトコールは、市販されている(New England Biolabs,Inc.(Ipswich、MA))。
一部の実施形態では、本明細書における方法は、ssNAと一本鎖核酸結合タンパク質(SSB)とを接触させてSSB結合ssNAを生成するステップを含まない。したがって、本明細書における方法は、SSB結合ssNAを生成するステップを省略することができる。例えば、本明細書における方法は、ssNAとSSBとを接触させることなく、ssNAと、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含むことがある。そのような事例では、本明細書における方法は、核酸ライブラリーを生成するための「SSB不使用の」方法と呼ばれることがある。本明細書に記載されるある特定のSSB不使用の方法は、図面に示され、実施例で論じられるように、SSBを使用して調製されるライブラリーのパラメーターと同様のパラメーターを有するライブラリーを生成することができる。一部の実施形態では、本明細書における方法は、ssNAと、SSB以外の一本鎖核酸結合剤とを接触させるステップを含む。そのような一本鎖核酸結合剤は、一本鎖核酸に安定的に結合することができ、核酸二重鎖の形成を防止することまたは低減させることができ、結合された核酸のライゲーションまたは別の方法での末端修飾をなお可能にすることができ、熱安定性であることができる。一本鎖核酸結合剤の例としては、トポイソメラーゼ、ヘリカーゼ、これらのドメイン、およびこれらのドメインを含む融合タンパク質が挙げられるが、それらに限定されない。
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含む。一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)からなる核酸組成物と、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含む。一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)から本質的になる核酸組成物と、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含む。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、一般に、ssNAを含み、さらなるタンパク質も核酸成分も含まない。例えば、一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、二本鎖核酸(dsNA)を含まないこともあり、または低いパーセンテージのdsNA(例えば、10%未満のdsNA、5%未満のdsNA、1%未満のdsNA)を含むこともある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、タンパク質を含まないことがある。例えば、一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、一本鎖結合タンパク質(SSB)も、ssNAの安定化に有用な他のタンパク質も含まないことがある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、核酸組成物中に通常は存在する化学成分、例えば、緩衝剤、塩、アルコール、クラウディング剤(例えば、PEG)などを含むことがあり、核酸源(例えば、試料)または核酸抽出からの残留成分(例えば、核酸、タンパク質、細胞膜成分)を含むこともある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、1つまたは複数のリン酸(例えば、末端リン酸、5’末端リン酸)を有するssNA断片を含むことがある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、1つまたは複数の修飾ヌクレオチドを含むssNA断片を含むこともある。
核酸の濃縮
一部の実施形態では、核酸(例えば、細胞外核酸)は、核酸の部分集団または種について濃縮または相対的に濃縮される。核酸部分集団は、例えば、胎児核酸、母体核酸、がん核酸、腫瘍核酸、患者核酸、宿主核酸、病原体核酸、移植片核酸、マイクロバイオーム核酸、特定の長さもしくは長さの範囲の断片を含む核酸、または特定のゲノム領域(例えば、単一の染色体、染色体のセット、および/もしくはある特定の染色体領域)からの核酸を含むことができる。そのような濃縮された試料を、本明細書で提供される方法とともに使用することができる。したがって、ある特定の実施形態では、本技術の方法は、試料中の核酸の部分集団について濃縮するさらなるステップを含む。ある特定の実施形態では、正常組織(例えば、非がん細胞、宿主細胞)からの核酸は、試料から選択的に(部分的に、実質的に、ほぼ完全に、または完全に)除去される。ある特定の実施形態では、母体核酸は、試料から選択的に(部分的に、実質的に、ほぼ完全に、または完全に)除去される。ある特定の実施形態では、特定の低コピー数種核酸(例えば、がん、腫瘍、胎児、病原体、移植片、マイクロバイオーム核酸)についての濃縮は、定量感度を改善することができる。試料を核酸の特定の種について濃縮する方法は、例えば、米国特許第6,927,028号、国際特許出願公開番号WO2007/140417、国際特許出願公開番号WO2007/147063、国際特許出願公開番号WO2009/032779、国際特許出願公開番号WO2009/032781、国際特許出願公開番号WO2010/033639、国際特許出願公開番号WO2011/034631、国際特許出願公開番号WO2006/056480、および国際特許出願公開番号WO2011/143659に記載されており、各々の全内容は、本文、表、式および図面すべてを含めて、参照により本明細書に組み込まれる。
一部の実施形態では、核酸は、ある特定の標的断片種および/または参照断片種について濃縮される。ある特定の実施形態では、核酸は、下で説明される、1つまたは複数の長さに基づく分離方法を使用して、特異的核酸断片長または断片長範囲について濃縮される。ある特定の実施形態では、核酸は、本明細書に記載されるおよび/または当技術分野において公知の、1つまたは複数の配列に基づく分離方法を使用して、選択ゲノム領域(例えば、染色体)からの断片について濃縮される。
試料中の核酸部分集団について濃縮する方法の非限定的な例としては、核酸種間のエピジェネティックな差を利用する方法(例えば、参照により本明細書に組み込まれる米国特許出願公開第2010/0105049号に記載されている、メチル化に基づく胎児核酸濃縮方法);制限エンドヌクレアーゼにより多型配列を増強するアプローチ(例えば、参照により本明細書に組み込まれる米国特許出願公開第2009/0317818号に記載されている方法など);選択的酵素的消化アプローチ;大規模並列シグネチャーシーケンシング(MPSS)アプローチ;増幅(例えば、PCR)に基づくアプローチ(例えば、遺伝子座特異的増幅法、マルチプレックスSNP対立遺伝子PCRアプローチ;ユニバーサル増幅法);プルダウンアプローチ(例えば、ビオチン化ウルトラマープルダウン法);伸長およびライゲーションに基づく方法(例えば、分子反転プローブ(MIP)伸長およびライゲーション);およびこれらの組合せが挙げられる。
一部の実施形態では、修飾された核酸を濃縮することができる。核酸修飾としては、カルボキシシトシン、5-メチルシトシン(5mC)およびその酸化誘導体(例えば、5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)、および5-カルボニルシトシン(arboxylcytosine)(5caC))、N(6)-メチルアデニン(6mA)、N4-メチルシトシン(4mC)、N(6)-メチルアデノシン(m(6)A)、プソイドウリジン(Ψ)、5-メチルシチジン(m(5)C)、ヒドロキシメチルウラシル、3’末端の2’-O-メチル化、tRNA修飾、miRNA修飾、およびsnRNA修飾が挙げられるが、これらに限定されない。1つまたは複数の修飾を含む核酸を、抗体に基づくプルダウンを含むがこれに限定されない様々な方法により、濃縮することができる。修飾された核酸の濃縮をdsDNAの変性の前(図52A~B)または後(図52C~D)に行なうことができる。変性前の濃縮は、修飾を欠いていることがある相補鎖の濃縮ももたらすことがあるが、変性後の濃縮は、修飾を欠いている相補鎖を濃縮しない。
一部の実施形態では、核酸は、本明細書に記載される1つまたは複数の配列に基づく分離方法を使用して、選択ゲノム領域(例えば、染色体)からの断片について濃縮される。配列に基づく分離は、目的の断片(例えば、標的および/または参照断片)に存在するが、試料の他の断片には実質的に存在しないかまたは他の断片のごくわずかな量(例えば、5%またはそれ未満)に存在する、ヌクレオチド配列に一般に基づく。一部の実施形態では、配列に基づく分離は、分離された標的断片および/または分離された参照断片を生じさせることができる。分離された標的断片および/または分離された参照断片は、核酸試料中に残存する断片から単離されることが多い。ある特定の実施形態では、分離された標的断片および分離された参照断片はまた、互いから単離される(例えば、別々のアッセイ区画で単離される)。ある特定の実施形態では、分離された標的断片および分離された参照断片は、一緒に単離される(例えば、同じアッセイ区画で単離される)。一部の実施形態では、未結合断片を別個に除去または分解または消化することができる。
一部の実施形態では、足場アダプターは、標的核酸を濃縮するために使用される。例えば、図51に示されているように、足場アダプターを、ssNAハイブリダイゼーション領域内の塩基の一部またはすべてが定義されたまたは既知の塩基であるように、設計することができる。これらの足場アダプターは、足場アダプターssNAハイブリダイゼーション領域の定義されたまたは既知の塩基に相補的な配列を有する標的核酸と優先的にハイブリダイズすることができ、それによって、得られるライブラリー内の標的核酸が濃縮される。例えば、図51に示されているように、ssNAハイブリダイゼーション領域へのGCジヌクレオチドの組み入れを使用して、末端CG(CpGとも呼ばれる)ジヌクレオチドを有する標的核酸を濃縮することができる。足場アダプターssNAハイブリダイゼーション領域の長さの一部またはすべてを使用して、ヌクレアーゼ切断部位、遺伝子プロモーター領域、病原体配列、腫瘍関連配列および他のモチーフを含むがこれらに限定されない、任意の他の定義された配列を、同様に標的とすることができる。ある例では、ライブラリーは、非濃縮性の足場アダプターおよびCGジヌクレオチド濃縮性の足場アダプターを使用して調製された。濃縮を用いずに調製されたライブラリーの場合、リードの1.7%がCGで開始し、リードの1.1%がCGで終了した。濃縮を用いて調製されたライブラリーの場合、リードの5.2%がCGで開始し、リードの19.6%がCGで終了した。図55に示されている、別の例では、RNA(例えば、宿主および病原体RNA)を含む試料は、目的の病原体RNAに特異的なプライマーを用いて逆転写されてcDNAを生成し、次いで、cDNAは、精製され、そして標準的な足場アダプター、または逆転写プライマーにより濃縮された領域に標的化されたssNAハイブリダイゼーション領域を有する足場アダプター、どちらかを用い、本明細書で論じられるような一本鎖ライブラリー調製方法を用いて調製される。病原体DNAを同様に濃縮することができる。
一部の事例では、5’または3’核酸末端における標的核酸配列は、定義されるかまたは既知である。他の事例では、足場アダプターを使用して、5’または3’核酸末端における目的の新規標的を識別することができる。目的の核酸配列またはパターンを、濃縮を用いてまたは用いずに足場アダプターライブラリー出力から特徴付けることができる。一部の事例では、5’、3’または両方の核酸末端における特異的配列または配列パターンを、特定の状態と関連付けることができる。そのような状態としては、病状、メチル化状態、および発現状態が挙げられるが、これらに限定されない。足場アダプターを使用して、試料と対照の間、例えば、がん患者からの無細胞DNAと健康な対照の間の、核酸末端における既知または新規標的配列の存在または相対存在量を定量化することができる。これらのデータを使用して、DNA末端における配列情報と所与の状態との間の関係を学習することができる。患者試料および健康な試料の十分に特徴付けられたデータセットを用いて訓練することにより、一例では、解析方法またはアルゴリズムを使用して、状態、または状態による移行を予測することができる。例えば、本発明者らは、急性骨髄性白血病(AML)を有する患者からのcfDNAに、非AML患者試料と比較して、5’および3’DNA末端におけるATジヌクレオチドの増加およびCpGジヌクレオチドの低減を認めた。この例では、分析ツールをcfDNA末端配列情報に関して使用して、AMLを発症する患者のリスクを予測することができる。
一部の実施形態では、標的および/または参照断片を核酸試料から分離するために、選択的核酸捕捉プロセスが使用される。市販の核酸捕捉システムとしては、例えば、Nimblegen配列捕捉システム(Roche NimbleGen、Madison、WI);ILLUMINA BEADARRAYプラットフォーム(Illumina、San Diego、CA);Affymetrix GENECHIPプラットフォーム(Affymetrix、Santa Clara、CA);Agilent SureSelect Target Enrichment System(Agilent Technologies、Santa Clara、CA);および関連プラットフォームが挙げられる。そのような方法は、キャプチャーオリゴヌクレオチドと標的または参照断片のヌクレオチド配列の一部またはすべてとのハイブリダイゼーションを通常は含み、固相(例えば、固相アレイ)および/または溶液に基づくプラットフォームの使用を含み得る。キャプチャーオリゴヌクレオチド(「ベイト」と呼ばれることもある)を、それらが、選択されたゲノム領域もしくは遺伝子座からの核酸断片と、または核酸標的中の特定の配列と、優先的にハイブリダイズするように、選択または設計することができる。ある特定の実施形態では、ハイブリダイゼーションに基づく方法(例えば、オリゴヌクレオチドアレイを使用するもの)を使用して、ある特定の核酸配列を含有する断片について濃縮することができる。したがって、一部の実施形態では、核酸試料は、例えば、試料核酸中の選択された配列に相補的なキャプチャーオリゴヌクレオチドを使用して断片のサブセットを捕捉することにより、必要に応じて濃縮される。ある特定の事例では、捕捉された断片が増幅される。例えば、アダプターを含有する捕捉された断片を、アダプター配列に相補的なプライマーを使用して増幅して、アダプター配列に従ってインデックスが付加された、増幅された断片の一群を形成することができる。一部の実施形態では、核酸は、目的の領域を含有する断片の配列またはそれらの部分に相補的なオリゴヌクレオチド(例えば、PCRプライマ-)を使用する目的の1つまたは複数の領域の増幅により、選択ゲノム領域(例えば、染色体、遺伝子)からの断片について濃縮される。
一部の実施形態では、核酸は、1つまたは複数の長さに基づく分離方法を使用して、特定の閾値またはカットオフ未満のまたはそれを超える、特定の核酸断片長(単数)、長さの範囲、または長さ(複数)について濃縮される。核酸断片長は、通常は、断片中のヌクレオチドの数を指す。核酸断片長はまた、核酸断片サイズと呼ばれることもある。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを測定せずに行われる。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを決定する方法とともに行われる。一部の実施形態では、長さに基づく分離は、分画されたプールのすべてまたは一部を単離(例えば、保持)および/または解析することができる、サイズ分画手順を指す。サイズ分画手順は、当技術分野において公知である(例えば、アレイでの分離、モレキュラーシーブによる分離、ゲル電気泳動による分離、カラムクロマトグラフィー(例えば、サイズ排除カラム)による分離、およびマイクロフルイディクスに基づくアプローチ)。ある特定の事例では、長さに基づく分離アプローチは、例えば、選択的配列タグ付けアプローチ、断片環状化、化学的処理(例えば、ホルムアルデヒド、ポリエチレングリコール(PEG)沈殿)、質量分析および/またはサイズ特異的核酸増幅を含み得る。
一部の実施形態では、核酸は、1つまたは複数の核酸結合タンパク質に関連する断片が濃縮される。濃縮方法の例としては、クロマチン免疫沈降(ChIP)、架橋ChIP(XCHIP)、ネイティブChIP(NChIP)、ビーズ不使用のChIP、キャリアChIP(CChIP)、高速ChIP(qChIP)、迅速かつ定量的ChIP(QChIP)、マイクロチップ(μChIP)、マトリックスChIP、病原体-ChIP(PAT-ChIP)、ChIP-エキソ、ChIP・オン・チップ、RIP-ChIP、HiChIP、ChIA-PET、およびHiChIRPが挙げられるが、これらに限定されない。
一部の実施形態では、本明細書における方法は、RNA種の混合物中のRNA種を濃縮するステップを含む。例えば、本明細書における方法は、mRNAとリボソームRNA(rRNA)の混合物中に存在するメッセンジャーRNA(mRNA)を濃縮するステップを含み得る。任意の好適なmRNA濃縮方法を使用することができ、そのような方法としては、rRNA枯渇および/またはmRNA濃縮方法、例えば、磁気ビーズでのrRNA枯渇(例えば、試料からrRNAを枯渇させる、したがってmRNAを濃縮する、ために磁気ビーズと組み合わせてrRNA枯渇プローブを使用する、Ribo-zero(商標)、Ribominus(商標)およびMICROBExpress(商標))、オリゴ(dT)に基づくポリ(A)濃縮(例えば、BioMag(登録商標)Oligo(dT)20)、ヌクレアーゼに基づくrRNA枯渇(例えば、Terminator(商標)5’-リン酸依存性エキソヌクレアーゼの消化)ならびにこれらの組合せが挙げられる。
濃縮戦略は、標的核酸の相対存在量を(例えば、シーケンシングリードのパーセントにより評定して)少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1100%、1200%、1300%、1400%、1500%、1600%、1700%、1800%、1900%、2000%、3000%、4000%、5000%、6000%、7000%、8000%、9000%、10000%、またはそれより大きく増加させることができる。
長さに基づく分離
一部の実施形態では、本明細書における方法は、断片長に従って標的核酸(例えば、ssNA)を分離するステップを含む。例えば、標的核酸(例えば、ssNA)を、1つまたは複数の長さに基づく分離方法を使用して、特定の閾値またはカットオフ未満のまたはそれを超える、特定の核酸断片長(単数)、長さの範囲、または長さ(複数)について濃縮することができる。核酸断片長は、通常は、断片中のヌクレオチドの数を指す。核酸断片長はまた、核酸断片サイズと呼ばれることもある。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを測定せずに行われる。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを決定する方法と併せて行われる。一部の実施形態では、長さに基づく分離は、分画されたプールのすべてまたは一部を単離(例えば、保持)および/または解析することができる、サイズ分画手順を指す。サイズ分画手順は、当技術分野において公知である(例えば、アレイでの分離、モレキュラーシーブによる分離、ゲル電気泳動による分離、カラムクロマトグラフィー(例えば、サイズ排除カラム)による分離、およびマイクロフルイディクスに基づくアプローチ)。一部の実施形態では、長さに基づく分離アプローチは、例えば、断片環状化、化学的処理(例えば、ホルムアルデヒド、ポリエチレングリコール(PEG))、質量分析および/またはサイズ特異的核酸増幅を含み得る。一部の実施形態では、長さに基づく分離は、固相可逆的固定法(SPRI)ビーズを使用して行われる。
一部の実施形態では、特定の閾値またはカットオフ未満のまたはそれを超える、ある特定の長さ(単数)、長さ範囲、または長さ(複数)の核酸断片が、試料から分離される。一部の実施形態では、特定の閾値またはカットオフ(例えば、500bp、400bp、300bp、200bp、150bp、100bp)未満の長さを有する断片は、「短い」断片と呼ばれ、特定の閾値またはカットオフ(例えば、500bp、600bp、700bp、800bp、900bp、1000bp)を超える長さを有する断片は、「長い」断片、大きい断片、および/または高分子量(HMW)断片と呼ばれる。一部の実施形態では、特定の閾値またはカットオフ未満のまたはそれを超える、ある特定の長さ(単数)、長さ範囲、または長さ(複数)の断片は、解析のために保持され、その一方で、閾値またはカットオフを超えるまたはそれ未満の、異なる長さ(単数)、または長さ範囲、または長さ(複数)の断片は、解析のために保持されない。一部の実施形態では、約500bp未満である断片は、保持される。一部の実施形態では、約400bp未満である断片は、保持される。一部の実施形態では、約300bp未満である断片は、保持される。一部の実施形態では、約200bp未満である断片は、保持される。一部の実施形態では、約150bp未満である断片は、保持される。例えば、約190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp、110bpまたは100bp未満である断片は、保持される。一部の実施形態では、約100bp~約200bpである断片は、保持される。例えば、約190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp、または110bpである断片は、保持される。一部の実施形態では、約100bp~約200bpの範囲内である断片は、保持される。例えば、約110bp~約190bp、130bp~約180bp、140bp~約170bp、140bp~約150bp、150bp~約160bp、または145bp~約155bpの範囲内である断片は、保持される。
一部の実施形態では、約1000bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約500bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約400bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約300bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約200bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約100bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。
一部の実施形態では、約100bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約200bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約300bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約400bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約500bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約1000bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。
一部の実施形態では、任意の断片長または断片長の組合せを有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。例えば、500bp未満の断片長および500bpのまたはそれより長い断片長を有する標的核酸(例えば、ssNA)を、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と、結合させることができる。
本明細書に記載される方法とともに使用することができる、長さに基づくある特定の分離方法は、例えば、選択的配列タグ付けアプローチを利用する。そのような方法では、長い核酸と短い核酸とを含む試料中の核酸の断片サイズ種(例えば、短い断片)に、選択的にタグ付けすることができる。そのような方法は、内部プライマーと外部プライマーとを含む1セットのネステッドプライマーを使用して核酸増幅反応を行うステップを通常は含む。一部の実施形態では、内部のものの一方または両方にタグ付けして、それによって標的増幅産物上にタグを導入することができる。外部プライマーは、(内部)標的配列を有する短い断片に一般にアニールしない。内部プライマーは、短い断片にアニールし、タグと標的配列とを有する増幅産物を生成することができる。通常は、長い断片のタグ付けは、例えば、外部プライマーの事前のアニーリングおよび伸長による内部プライマーの伸長遮断を含む、機構の組合せによって阻害される。タグ付き断片の濃縮は、例えば、一本鎖核酸のエキソヌクレアーゼ消化、および少なくとも1つのタグに特異的な増幅プライマーを使用するタグ付き断片の増幅を含む、様々な方法のいずれかにより果たすことができる。
本明細書に記載される方法とともに使用することができる、長さに基づく別の分離方法は、核酸試料をポリエチレングリコール(PEG)沈殿に付すステップを含む。方法の例としては、国際特許出願公開番号WO2007/140417およびWO2010/115016に記載されているものが挙げられる。この方法は、小さい(例えば、300ヌクレオチド未満の)核酸を実質的に沈殿させずに大きい核酸を実質的に沈殿させるのに十分な条件下、1つまたは複数の一価の塩の存在下で、核酸試料とPEGを接触させるステップを一般に必要とする。
本明細書に記載される方法とともに使用することができる、長さに基づく別の濃縮方法は、例えばcircligaseを使用する、ライゲーションによる環状化を含む。通常は、短い核酸断片を長い断片より高い効率で環状化することができる。環状化されていない配列を環状化された配列から分離することができ、濃縮された短い断片をさらなる解析に使用することができる。
核酸ライブラリー
本明細書における方法は、核酸ライブラリーを調製するステップ、および/または核酸ライブラリーために核酸を修飾するステップを含み得る。一部の実施形態では、核酸断片の末端は、断片またはそれらの増幅産物を核酸ライブラリーに組み込むことができるように修飾される。一般に、核酸ライブラリーは、その非限定的な例が、固相(例えば、固体支持体、フローセル、ビーズ)上への固定化、濃縮、増幅、クローニング、検出を含む、特異的プロセスのために、および/または核酸シーケンシングのために、調製される、組み立てられる、および/または修飾される、複数のポリヌクレオチド分子(例えば、核酸の試料)を指す。ある特定の実施形態では、核酸ライブラリーは、シーケンシングプロセスの前にまたはシーケンシングプロセス中に調製される。核酸ライブラリー(例えば、シーケンシングライブラリー)は、当技術分野において公知であるような好適な方法により調製することができる。核酸ライブラリーは、標的化または非標的化調製プロセスにより調製することができる。
一部の実施形態では、核酸のライブラリーは、固体支持体への核酸の固定化のために構成される化学的部分(例えば、官能基)を含むように修飾される。一部の実施形態では、核酸ライブラリーは、固体支持体へのライブラリーの固定化のために構成される、生体分子(例えば、官能基)および/または結合対のメンバーを含むように修飾され、生体分子および結合対の非限定的な例としては、チロキシン結合グロブリン、ステロイド結合タンパク質、抗体、抗原、ハプテン、酵素、レクチン、核酸、リプレッサー、プロテインA、プロテインG、アビジン、ストレプトアビジン、ビオチン、補体成分C1q、核酸結合タンパク質、受容体、炭水化物、オリゴヌクレオチド、ポリヌクレオチド、相補的核酸配列など、およびこれらの組合せが挙げられる。特異的結合対の一部の例としては、限定ではないが、アビジン部分とビオチン部分;抗原エピトープと抗体またはその免疫反応性断片;抗体とハプテン;ジゴキシゲニン部分と抗ジゴキシゲニン抗体;フルオレセイン部分と抗フルオレセイン抗体;オペレーターとリプレッサー;ヌクレアーゼとヌクレオチド;レクチンと多糖;ステロイドとステロイド結合タンパク質;活性化合物と活性化合物受容体;ホルモンとホルモン受容体;酵素と基質;免疫グロブリンとプロテインA;オリゴヌクレオチドまたはポリヌクレオチドとその対応する補体;など、またはこれらの組合せが挙げられる。
一部の実施形態では、核酸のライブラリーは、既知組成の1つまたは複数のポリヌクレオチドを含むように修飾され、ポリヌクレオチドの非限定的な例としては、識別子(例えば、タグ、インデックス付加用タグ)、キャプチャー配列、標識、アダプター、制限酵素部位、プロモーター、エンハンサー、複製起点、ステムループ、相補配列(例えば、プライマー結合部位、アニーリング部位)、好適な組み込み部位(例えば、トランスポゾン、ウイルス組み込み部位)、修飾ヌクレオチド、本明細書に記載される固有分子識別子(UMI)、本明細書に記載されるパリンドローム配列など、またはこれらの組合せが挙げられる。既知配列のポリヌクレオチドを、好適な位置に、例えば、5’末端、3’末端にまたは核酸配列内に、付加させることができる。既知配列のポリヌクレオチドは、同じ配列であることもあり、または異なる配列であることもある。一部の実施形態では、既知配列のポリヌクレオチドは、表面(例えば、フローセルの表面)に固定化された1つまたは複数のオリゴヌクレオチドとハイブリダイズするように構成される。例えば、5’既知配列を含む核酸分子は、第1の複数のオリゴヌクレオチドとハイブリダイズすることができ、その一方で、3’既知配列は、第2の複数のオリゴヌクレオチドとハイブリダイズすることができる。一部の実施形態では、核酸のライブラリーは、染色体特異的タグ、キャプチャー配列、標識および/またはアダプター(例えば、本明細書に記載されるオリゴヌクレオチドアダプター)を含み得る。一部の実施形態では、核酸のライブラリーは、1つまたは複数の検出可能な標識を含む。一部の実施形態では、1つまたは複数の検出可能な標識を、核酸ライブラリーの5’末端に、3’末端に、および/またはライブラリー内の核酸内の任意のヌクレオチド位置に組み込むことができる。一部の実施形態では、核酸のライブラリーは、ハイブリダイズしたオリゴヌクレオチドを含む。ある特定の実施形態では、ハイブリダイズしたオリゴヌクレオチドは、標識されたプローブである。一部の実施形態では、核酸のライブラリーは、ハイブリダイズしたオリゴヌクレオチドプローブを固相への固定化の前に含む。
一部の実施形態では、既知配列のポリヌクレオチドは、ユニバーサル配列を含む。ユニバーサル配列は、2つもしくはそれより多くの核酸分子にまたは核酸分子の2つもしくはそれより多くのサブセットに組み込まれる特異的ヌクレオチド配列であり、ユニバーサル配列は、それが組み込まれるすべての分子または分子のサブセットについて同じである。ユニバーサル配列は、ユニバーサル配列に相補的である単一のユニバーサルプライマーを使用して、複数の異なる配列とハイブリダイズするように、および/または複数の異なる配列を増幅するように、設計されることが多い。一部の実施形態では、2つ(例えば、一対)またはそれより多くのユニバーサル配列および/またはユニバーサルプライマーが使用される。ユニバーサルプライマーは、ユニバーサル配列を含むことが多い。一部の実施形態では、アダプター(例えば、ユニバーサルアダプター)は、ユニバーサル配列を含む。一部の実施形態では、1つまたは複数のユニバーサル配列が、核酸の複数の種またはサブセットを捕捉、識別および/または検出するために使用される。
核酸ライブラリーの調製についてのある特定の実施形態では、(例えば、ある特定の一塩基合成法手順では)、核酸は、数百塩基対またはそれ未満の長さに(例えば、ライブラリー生成のための調製において)サイズ選択および/または断片化される。一部の実施形態では、ライブラリー調製は、断片化なしで行われる(例えば、無細胞DNAを使用する場合)。
ある特定の実施形態では、ライゲーションに基づくライブラリー調製方法が使用される(例えば、ILLUMINA TRUSEQ、Illumina、San Diego、CA)。ライゲーションに基づくライブラリー調製方法は、インデックス配列(例えば、核酸配列についての試料起源を識別するための試料インデックス配列)を最初のライゲーションステップで組み込むことができ、多くの場合、シングルリードシーケンシング、ペアエンドシーケンシングおよび多重化シーケンシングのための試料の調製に使用され得る、アダプター(例えば、メチル化アダプター)設計を使用することが多い。例えば、核酸(例えば、断片化された核酸または無細胞DNA)を、フィルイン反応、エキソヌクレアーゼ反応またはこれらの組合せにより、末端修復することができる。一部の実施形態では、次いで、結果として生じた平滑末端修復核酸を、アダプター/プライマーの3’末端の単一のヌクレオチドオーバーハングと相補的である単一のヌクレオチドにより伸長することができる。任意のヌクレオチドを伸長/オーバーハングヌクレオチドに使用することができる。一部の実施形態では、末端修復が省略され、骨格アダプター(例えば、本明細書に記載される骨格アダプター)は、核酸(例えば、一本鎖核酸、断片化された核酸および/または無細胞DNA)のネイティブ末端に直接ライゲーションされる。
一部の実施形態では、核酸ライブラリー調製は、本明細書に記載される足場アダプターなどの、足場アダプターまたはその成分を(例えば、試料核酸に、試料核酸断片に、鋳型核酸に、標的核酸に、ssNAに)ライゲーションするステップを含む。足場アダプター、またはそれらの成分は、フローセルアンカーに相補的である配列を含むことができ、例えばフローセルの内部表面などの、固体支持体に核酸ライブラリーを固定化するために利用されることもある。一部の実施形態では、足場アダプター、またはその成分は、識別子、1つもしくは複数シーケンシングプライマーハイブリダイゼーション部位(例えば、ユニバーサルシーケンシングプライマー、シングルエンドシーケンシングプライマー、ペアエンドシーケンシングプライマー、多重化シーケンシングプライマーなどに相補的な配列)、またはこれらの組合せ(例えば、アダプター/シーケンシング、アダプター/識別子、アダプター/識別子/シーケンシング)を含む。一部の実施形態では、足場アダプター、またはその成分は、本明細書ではプライミング配列またはプライマー結合ドメインとも呼ばれる、プライマーアニーリングポリヌクレオチド(例えば、フローセル結合オリゴヌクレオチドへの、および/または遊離増幅プライマーへの、アニーリングのためのもの)、インデックスポリヌクレオチド(例えば、異なる試料からの核酸を追跡するための試料インデックス配列;試料IDとも呼ばれる)、バーコードポリヌクレオチド(例えば、シーケンシングの前に増幅される試料核酸の個々の分子を追跡するための単一分子バーコード(SMB);分子バーコードまたは固有分子識別子(UMI)とも呼ばれる)のうちの1つまたは複数を含む。一部の実施形態では、足場アダプターまたはその成分の、プライマーアニーリング成分(またはプライミング配列またはプライマー結合ドメイン)は、1つまたは複数のユニバーサル配列(例えば、1つまたは複数の増幅プライマーに相補的な配列)を含む。一部の実施形態では、インデックスポリヌクレオチド(例えば、試料インデックス;試料ID)は、足場アダプターまたはその成分の、成分である。一部の実施形態では、インデックスポリヌクレオチド(例えば、試料インデックス;試料ID)は、ユニバーサル増幅プライマー配列の成分である。
一部の実施形態では、足場アダプター、またはその成分は、増幅プライマー(例えば、ユニバーサル増幅プライマー)と組み合わせて使用される場合、ユニバーサル配列、分子バーコード、試料ID配列、スペーサー配列、および試料核酸配列(例えば、ssNA配列)のうちの1つまたは複数を含むライブラリー構築物を生成するように設計される。一部の実施形態では、足場アダプター、またはその成分は、ユニバーサル増幅プライマーと組み合わせて使用される場合、ユニバーサル配列、分子バーコード、試料ID配列、スペーサー配列、および試料核酸配列(例えば、ssNA配列)のうちの1つまたは複数の順序付けられた組合せを含むライブラリー構築物を生成するように設計される。例えば、ライブラリー構築物は、第1のユニバーサル配列、続いて第2のユニバーサル配列、続いて第1の分子バーコード、続いてスペーサー配列、続いて鋳型配列(例えば、試料核酸配列;ssNA配列)、続いてスペーサー配列、続いて第2の分子バーコード、続いて第3のユニバーサル配列、続いて試料ID、続いて第4のユニバーサル配列を含み得る。一部の実施形態では、足場アダプター、またはそれらの成分は、増幅プライマー(例えば、ユニバーサル増幅プライマー)と組み合わせて使用される場合、鋳型分子(例えば、試料核酸分子;ssNA分子)の鎖ごとにライブラリー構築物を生成するように設計される。一部の実施形態では、足場アダプターは、二重鎖アダプターである。
識別子は、識別子を含む核酸の検出および/または識別を可能にする、核酸(例えば、ポリヌクレオチド)に組み込まれたまたは結合された好適な検出可能な標識であり得る。一部の実施形態では、識別子は、シーケンシング方法の間に(例えば、ポリメラーゼにより)核酸に組み込まれるかまたは結合される。一部の実施形態では、識別子は、シーケンシング方法の前に(例えば、伸長反応により、増幅反応により、ライゲーション反応により)核酸に組み込まれるかまたは結合される。識別子の非限定的な例としては、核酸タグ、核酸インデックスもしくはバーコード、放射標識(例えば、同位体)、金属標識、蛍光標識、化学発光標識、リン光標識、フルオロフォアクエンチャー、色素、タンパク質(例えば、酵素、抗体もしくはその一部、リンカー、結合対のメンバー)など、またはこれらの組合せが挙げられる。一部の実施形態では、識別子(例えば、核酸インデックスまたはバーコード)は、ヌクレオチドまたはヌクレオチド類似体の固有の、既知のおよび/または識別可能な配列である。一部の実施形態では、識別子は、連続する6またはそれを超えるヌクレオチドである。様々な異なる励起および発光スペクトルを有する多数のフルオロフォアが、利用可能である。任意の好適なタイプおよび/または数のフルオロフォアを、識別子として使用することができる。一部の実施形態では、1つもしくは複数、2つもしくはそれより多くの、3つもしくはそれより多くの、4つもしくはそれより多くの、5つもしくはそれより多くの、6つもしくはそれより多くの、7つもしくはそれより多くの、8つもしくはそれより多くの、9つもしくはそれより多くの、10もしくはそれより多くの、20もしくはそれより多くの、30もしくはそれより多くの、または50もしくはそれより多くの異なる識別子が、本明細書に記載される方法(例えば、核酸検出および/またはシーケンシング方法)において利用される。一部の実施形態では、1つまたは2つのタイプの識別子(例えば、蛍光標識)が、ライブラリー内の各核酸に連結される。識別子の検出および/または定量化は、好適な方法、装置または機械により行うことができ、そのような方法、装置または機械の非限定的な例としては、フローサイトメトリー、定量的ポリメラーゼ連鎖反応(qPCR)、ゲル電気泳動、ルミノメーター、蛍光光度計、分光光度計、好適な遺伝子チップまたはマイクロアレイ解析、ウエスタンブロット、質量分析、クロマトグラフィー、細胞蛍光分析、蛍光顕微鏡法、好適な蛍光またはデジタルイメージング法、共焦点レーザー走査顕微鏡法、レーザー走査型サイトメトリー、親和性クロマトグラフィー、マニュアルバッチモード分離、電界懸架、好適な核酸シーケンシング方法および/または核酸シーケンシング装置など、ならびにこれらの組合せが挙げられる。
一部の実施形態では、識別子、シーケンシング特異的インデックス/バーコード、およびシーケンサー特異的フローセル結合プライマー部位は、単一プライマー伸長により(例えば、鎖置換ポリメラーゼにより)核酸ライブラリーに組み込まれる。
一部の実施形態では、核酸ライブラリーまたはその一部は、増幅条件下で増幅される(例えば、PCRに基づく方法により増幅される)。一部の実施形態では、シーケンシング方法は、核酸ライブラリーの増幅を含む。核酸ライブラリーを、固体支持体(例えば、フローセル内の固体支持体)への固定化の前または後に増幅することができる。核酸増幅は、(例えば、核酸ライブラリー内に)存在する核酸鋳型のおよび/またはその補体の数を、鋳型および/またはその補体の1つまたは複数のコピーを生成することにより、増幅するまたは増加させるプロセスを含む。増幅は、好適な方法により行うことができる。核酸ライブラリーを、サーモサイクリング法によりまたは等温増幅法により増幅することができる。一部の実施形態では、ローリングサークル増幅法が使用される。一部の実施形態では、増幅は、核酸ライブラリーまたはその一部分が固定化されている固体支持体(例えば、フローセル内のもの)上で行われる。ある特定のシーケンシング方法では、核酸ライブラリーは、フローセルに添加され、好適な条件下でのアンカーへのハイブリダイゼーションにより固定化される。このタイプの核酸増幅は、固相増幅と呼ばれることが多い。固相増幅の一部の実施形態では、増幅産物のすべてまたは一部分は、固定化されたプライマーから開始する伸長により合成される。固相増幅反応は、増幅オリゴヌクレオチド(例えば、プライマー)の少なくとも1つが固体支持体に固定化されることを除き、標準的な液相増幅に類似している。一部の実施形態では、修飾核酸(例えば、アダプターの付加により修飾された核酸)が増幅される。
一部の実施形態では、固相増幅は、表面に固定化されたオリゴヌクレオチドプライマーの1つの種のみを含む核酸増幅反応を含む。ある特定の実施形態では、固相増幅は、複数の異なる固定化されたオリゴヌクレオチドプライマー種を含む。一部の実施形態では、固相増幅は、固体表面に固定化されたオリゴヌクレオチドプライマーの1つの種と溶液中の第2の異なるオリゴヌクレオチドプライマー種とを含む核酸増幅反応を含み得る。固定化されたプライマーまたは溶液系プライマーの複数の異なる種を使用することができる。固相核酸増幅反応の非限定的な例としては、界面増幅、架橋増幅、エマルジョンPCR、WildFire増幅(例えば、米国特許出願公開第2013/0012399号)などまたはこれらの組合せが挙げられる。
核酸シーケンシング
一部の実施形態では、核酸(例えば、核酸断片、試料核酸、無細胞核酸、一本鎖核酸、一本鎖DNA、一本鎖RNA)は、シーケンシングされる。一部の実施形態では、本明細書で提供される足場アダプターとハイブリダイズされたssNA(「ハイブリダイゼーション産物」)は、シーケンシングプロセスによりシーケンシングされる。一部の実施形態では、本明細書で提供されるオリゴヌクレオチド成分とハイブリダイズされたssNA(「一本鎖ライゲーション産物」)は、シーケンシングプロセスによりシーケンシングされる。一部の実施形態では、ハイブリダイゼーション産物および/または一本鎖ライゲーション産物は、増幅プロセスにより増幅され、増幅産物は、シーケンシングプロセスによりシーケンシングされる。一部の実施形態では、ハイブリダイゼーション産物および/または一本鎖ライゲーション産物は、増幅プロセスにより増幅されず、ハイブリダイゼーション産物および/または一本鎖ライゲーション産物は、事前の増幅なしにシーケンシングプロセスによりシーケンシングされる。一部の実施形態では、シーケンシングプロセスは、配列リード(またはシーケンシングリード)を生成する。一部の実施形態では、本明細書における方法は、配列リードに基づいて一本鎖核酸分子の配列を決定するステップを含む。
ある特定のシーケンシングプラットフォーム(例えば、ペアエンドシーケンシング)の場合、配列リードを生成するステップは、フォワード配列リードを生成すること、およびリバース配列リードを生成することを含み得る。例えば、ある特定のペアエンドシーケンシングプラットフォームを使用するシーケンシングは、各核酸断片を両方の方向からシーケンシングし、一般に、その結果、フォワード方向の第1のリード(フォワードリード)および逆相補的方向の第2のリード(リバースリード)を含む2つのリードが、核酸断片ごとに得られる。ある特定のプラットフォームの場合、フォワードリードは、シーケンシングアダプター内の特定のプライマー(例えば、ILLUMINAアダプター、P5プライマー)から生成され、リバースリードは、シーケンシングアダプター内の異なるプライマー(例えば、ILLUMINAアダプター、P7プライマー)から生成される。
核酸は、サンガーシーケンシングプラットフォーム、ハイスループットもしくは大規模並列シーケンシング(次世代シーケンシング(NGS))プラットフォームなど、例えば、Illumina(登録商標)により提供されているシーケンシングプラットフォーム(例えば、HiSeq(商標)、MiSeq(商標)および/もしくはGenome Analyzer(商標)シーケンシングシステム)、Oxford Nanopore(商標)Technologiesにより提供されているシーケンシングプラットフォーム(例えば、MinIONシーケンシングシステム)、Ion Torrent(商標)により提供されているシーケンシングプラットフォーム(例えば、Ion PGM(商標)および/もしくはIon Proton(商標)シーケンシングシステム)、Pacific Biosciencesにより提供されているシーケンシングプラットフォーム(例えば、PACBIO RS IIシーケンシングシステム)、Life Technologies(商標)により提供されているシーケンシングプラットフォーム(例えば、SOLiDシーケンシングシステム)、Rocheにより提供されるシーケンシングプラットフォーム(例えば、454 GS FLX+および/もしくはGS Juniorシーケンシングシステム)、または任意の他の好適なシーケンシングプラットフォームなどを含む、任意の好適なシーケンシングプラットフォームを使用してシーケンシングすることができる。一部の実施形態では、シーケンシングプロセスは、高多重化シーケンシングプロセスである。ある特定の事例では、完全または実質的に完全な配列が得られ、部分的配列が得られることもある。核酸シーケンシングは、一般に、配列リードの一群を生成する。本明細書で使用される場合、「リード」(複数)(例えば、「リード」(単数)、「配列リード」(単数))は、本明細書に記載されるまたは当技術分野において公知の任意のシーケンシングプロセスにより生成されたオリゴヌクレオチドの短い配列である。リードは、核酸断片の一方の末端から生成され得(シングルエンドリード)、核酸断片の両方の末端から生成されることもある(例えば、ペアエンドリード、ダブルエンドリード)。一部の実施形態では、シーケンシングプロセスは、短いシーケンシングリードまたは「短いリード」を生成する。一部の実施形態では、短いリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから、連続する約250またはそれを超えるヌクレオチドまでであることもある。一部の実施形態では、短いリードの長さの名目値、代表値、平均値または絶対値は、連続する約50ヌクレオチドから、連続する約150またはそれを超えるヌクレオチドまでである。
配列リードの長さは、利用される特定のシーケンシング技術に関連することが多い。例えば、ハイスループット法は、サイズに数十から数百塩基対(bp)までの幅があり得る、配列リードを生じさせる。例えば、ナノポアシーケンシングは、サイズに数十から数百そして数千塩基対までの幅があり得る、配列リードを生じさせ得る。一部の実施形態では、配列リードは、約15bp~約900bp長の長さ平均値、中央値、代表値または絶対値を有する。ある特定の実施形態では、配列リードは、約1000bpのまたはそれを超える、長さ平均値、中央値、代表値または絶対値を有する。一部の実施形態では、配列リードは、約1500、2000、2500、3000、3500、4000、4500もしくは5000bpのまたはそれを超える、長さ平均値、中央値、代表値または絶対値を有する。一部の実施形態では、配列リードは、約100bp~約200bpの長さ平均値、中央値、代表値または絶対値を有する。
一部の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから連続する約250またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約200またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約150またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約125またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約100またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約75またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約60またはそれを超えるヌクレオチドまで、連続する15ヌクレオチドから連続する約50またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約40またはそれを超えるヌクレオチドまでであることもあり、連続する約15ヌクレオチド、または連続する約36もしくはそれを超えるヌクレオチドであることもある。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約20~約30塩基、または約24~約28塩基である。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、21、22、23、24、25、26、27、28または約29塩基もしくはそれを超える。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約20~約200塩基、約100~約200塩基、または約140~約160塩基である。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、または約200塩基もしくはそれを超える。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから連続する約25ヌクレオチドまたはそれを超えるヌクレオチド数まで(例えば、長さ約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24もしくは25ヌクレオチド、またはそれを超えるヌクレオチド数)、連続する約15ヌクレオチドから連続する約20ヌクレオチドまたはそれを超えるヌクレオチド数までであることもあり、連続する約17ヌクレオチドまたは連続する約18ヌクレオチドであることもある。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約25ヌクレオチドから連続する約400ヌクレオチドまたはそれを超えるヌクレオチド数まで(例えば、長さ約25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390もしくは400ヌクレオチド、またはそれを超えるヌクレオチド数)、連続する約50ヌクレオチドから連続する約350ヌクレオチドまたはそれを超えるヌクレオチド数まで、連続する約100ヌクレオチドから連続する約325ヌクレオチドまで、連続する約150ヌクレオチドから連続する約325ヌクレオチドまで、連続する約200ヌクレオチドから連続する約325ヌクレオチドまで、連続する約275ヌクレオチドから連続する約310ヌクレオチドまで、連続する約100ヌクレオチドから連続する約200ヌクレオチドまで、連続する約100ヌクレオチドから連続する約175ヌクレオチドまで、連続する約125ヌクレオチドから連続する約175ヌクレオチドまでであることもあり、連続する約140ヌクレオチドから連続する約160ヌクレオチドまでであることもある。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約150ヌクレオチドであり、連続する150ヌクレオチドであることもある。
リードは、一般に、物理的核酸中のヌクレオチド配列の表現である。例えば、配列のATGC描写を含有するリードの場合、物理的核酸中の、「A」は、アデニンヌクレオチドを表し、「T」は、チミンヌクレオチドを表し、「G」は、グアニンヌクレオチドを表し、「C」は、シトシンヌクレオチドを表す。対象からの試料から得られる配列リードは、少数派核酸と多数派核酸の混合物からのリードであることがある。例えば、がん患者の血液から得られる配列リードは、がん核酸と非がん核酸の混合物からのリードであることがある。別の例では、妊娠している雌の血液から得られる配列リードは、胎児核酸と母体核酸の混合物からのリードであることがある。別の例では、感染症または感染性疾患に罹患している患者の血液から得られる配列リードは、宿主核酸と病原体核酸の混合物からのリードであることがある。別の例では、移植レシピエントの血液から得られる配列リードは、宿主核酸と移植片核酸の混合物からのリードであることがある。別の例では、試料から得られる配列リードは、対象のマイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)を集団で構成する微生物からの核酸の混合物からのリードであることがある。別の例では、試料から得られる配列リードは、マイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)を集団で構成する微生物からの核酸と宿主対象からの核酸との混合物からのリードであることがある。比較的短いリードの混合物を、本明細書に記載されるプロセスにより、対象内に存在するゲノム核酸の表現に、および/または腫瘍、胎児、病原体、移植片もしくはマイクロバイオームに存在するゲノム核酸の表現に、変換することができる。
ある特定の実施形態では、対象から試料の核酸配列リードを「得ること」、および/または1名もしくは複数名の参照人物から生物検体の核酸配列リードを「得ること」は、配列情報を得るために核酸を直接シーケンシングすることを含むことができる。一部の実施形態では、「得ること」は、別の者により核酸から直接得られた配列情報を受け取ることを含むことができる。
一部の実施形態では、試料中の一部またはすべての核酸は、シーケンシング前または中に(例えば、非特異的に、例えば、PCRに基づく方法により)濃縮および/または増幅される。ある特定の実施形態では、試料中の特異的核酸種またはサブセットは、シーケンシング前または中に濃縮および/または増幅される。一部の実施形態では、核酸のあらかじめ選択されたプールの種またはサブセットは、ランダムにシーケンシングされる。一部の実施形態では、試料中の核酸は、シーケンシング前または中に濃縮および/または増幅されない。
一部の実施形態では、ゲノムの代表的画分は、シーケンシングされ、「カバレッジ」または「カバレッジ倍数」と呼ばれることもある。例えば、1倍のカバレッジは、ゲノムのヌクレオチド配列のおよそ100%がリードにより表されることを示す。一部の事例では、カバレッジ倍数は、「シーケンシング深度」と呼ばれる(およびそれに正比例する)。一部の実施形態では、「カバレッジ倍数」は、参照として以前のシーケンシング実験を参照する相対的用語である。例えば、第2のシーケンシング実験は、第1のシーケンシング実験の2分の1のカバレッジを有することがある。一部の実施形態では、ゲノムは、ゲノムの所与の領域が、2つもしくはそれより多くのリードまたはオーバーラップしているリードによりカバーされ得る(例えば、1を超える「カバレッジ倍数」、例えば、2倍のカバレッジ)冗長性で、シーケンシングされる。一部の実施形態では、ゲノム(例えば、全ゲノム)は、約0.01倍~約100倍のカバレッジ、約0.1倍~約20倍のカバレッジ、または約0.1倍~約1倍のカバレッジ(例えば、約0.015倍、0.02倍、0.03倍、0.04倍、0.05倍、0.06倍、0.07倍、0.08倍、0.09倍、0.1倍、0.2倍、0.3倍、0.4倍、0.5倍、0.6倍、0.7倍、0.8倍、0.9倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍またはそれを超えるカバレッジ)で、シーケンシングされる。一部の実施形態では、ゲノムの特異的部分(例えば、標的化された方法からのゲノム部分)がシーケンシングされ、カバレッジ倍数値は、シーケンシングされる特異的ゲノム部分の画分を一般に指す(すなわち、カバレッジ倍数値は、全ゲノムを指さない)。一部の事例では、特異的ゲノム部分は、1000倍のカバレッジまたはそれを超えるカバレッジでシーケンシングされる。例えば、特異的ゲノム部分を、2000倍、5,000倍、10,000倍、20,000倍、30,000倍、40,000倍または50,000倍のカバレッジでシーケンシングすることができる。一部の実施形態では、シーケンシングは、約1,000倍~約100,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約10,000倍~約70,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約20,000倍~約60,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約30,000倍~約50,000倍のカバレッジでのものである。
一部の実施形態では、1個体からの1つの核酸試料がシーケンシングされる。ある特定の実施形態では、2つまたはそれより多くの試料であって、1個体からのものであるかまたは異なる個体からのものである試料の各々からの核酸が、シーケンシングされる。ある特定の実施形態では、各生体試料が1個体または2もしくはそれより多くの個体からのものである、2つまたはそれより多くの生体試料からの核酸試料が、プールされ、そのプールがシーケンシングされる。後者の実施形態では、各生体試料からの核酸試料は、1つまたは複数の固有識別子により識別されることが多い。
一部の実施形態では、シーケンシング方法は、シーケンシングプロセスにおいて配列反応の多重化を可能にする識別を利用する。固有識別子の数が多いほど、例えば、シーケンシングプロセスで多重化することができる、検出用の試料および/または染色体の数が多い。シーケンシングプロセスは、任意の好適な数(例えば、4、8、12、24、48、96またはそれより多く)の固有識別子を使用して、行うことができる。
シーケンシングプロセスは、固相を使用することもあり、固相は、ライブラリーからの核酸を結合させることができるフローセスであって、試薬を流動させ、結合した核酸と接触させることができるフローセルを、含むこともある。フローセルは、フローセルレーンを含むこともあり、識別子の使用は、各レーンでのいくつかの試料の解析を容易にすることができる。フローセルは、結合された分析物を保持し、および/またはその上を試薬溶液が順序だって通過することを可能にするように、構成することができる固体支持体であることが多い。フローセルは、多くの場合、平面形状であり、光学的に透明であり、一般に、ミリメートルまたはミリメートル未満の規模であり、分析物/試薬相互作用が起こるチャネルまたはレーンを有することが多い。一部の実施形態では、所与のフローセルレーンで解析される試料の数は、ライブラリー調製および/またはプローブ設計中に利用される固有識別子の数に依存する。例えば、12の識別子を使用する多重化により、8レーンフローセルで(例えば、96ウェルマイクロウェルプレートにおけるウェルの数に等しい)96の試料の同時解析が可能になる。同様に、例えば48の識別子を使用する多重化により、8レーンフローセルで(例えば、384ウェルマイクロウェルプレートにおけるウェルの数に等しい)384の試料の同時解析が可能になる。市販のマルチプレックスシーケンシングキットの非限定的な例としては、Illuminaのmultiplexing sample preparation oligonucleotide kitおよびmultiplexing sequencing primers and PhiX control kit(例えば、それぞれ、Illuminaのカタログ番号PE-400-1001およびPE-400-1002)が挙げられる。
任意の好適な核酸シーケンシング方法を使用することができ、そのような方法の非限定的な例としては、マクサム・ギルバート法(Maxim & Gilbert)、連鎖停止法、一塩基合成法、ライゲーションによるシーケンシング、質量分析によるシーケンシング、顕微鏡法に基づく手法など、またはこれらの組合せが挙げられる。一部の実施形態では、例えば、マイクロ流体サンガーシーケンシングを含む、自動化サンガーシーケンシング法を含むサンガーシーケンシング法などの、第1世代技術を、本明細書で提供される方法において使用することができる。一部の実施形態では、核酸イメージング技術(例えば、透過型電子顕微鏡法(TEM)および原子間力顕微鏡法(AFM))の使用を含むシーケンシング技術を使用することができる。一部の実施形態では、ハイスループットシーケンシング法が使用される。ハイスループットシーケンシング法は、大規模並列方式で、ときにはフローセル内で、シーケンシングされる、クローン増幅されたDNA鋳型または単一のDNA分子を一般に含む。大規模並列方式でDNAをシーケンシングすることができる次世代(例えば、第2および第3世代)シーケンシング手法を本明細書に記載される方法に使用することができ、そのような手法は、本明細書では「大規模並列シーケンシング」(MPS)と総称される。一部の実施形態では、MPSシーケンシング法は、目的の特異的染色体、遺伝子または領域がシーケンシングされる、標的化アプローチを利用する。ある特定の実施形態では、試料中の大半のまたはすべての核酸がランダムにシーケンシング、増幅および/または捕捉される、非標的化アプローチが、使用される。
一部の実施形態では、標的化された濃縮、増幅および/またはシーケンシングアプローチが使用される。標的化アプローチは、配列特異的オリゴヌクレオチドの使用によるさらなる処理のために試料中の核酸のサブセットを単離、選択および/または濃縮することが多い。一部の実施形態では、配列特異的オリゴヌクレオチドのライブラリーは、試料中の核酸の1つまたは複数のセットを標的とする(例えば、そのようなセットとハイブリダイズする)ために利用される。配列特異的オリゴヌクレオチドおよび/またはプライマーは、目的の1つまたは複数の染色体、遺伝子、エクソン、イントロンおよび/または調節領域に存在する特定の配列(例えば、固有核酸配列)に対して選択的であることが多い。任意の好適な方法または方法の組合せを、標的核酸の1つまたは複数のサブセットの濃縮、増幅および/またはシーケンシングに使用することができる。一部の実施形態では、標的配列は、1つまたは複数の配列特異的アンカーを使用する固相(例えば、フローセル、ビーズ)への捕捉により単離および/または濃縮される。一部の実施形態では、標的配列は、配列特異的プライマーおよび/またはプライマーセットを使用するポリメラーゼに基づく方法(例えば、任意の好適なポリメラーゼに基づく伸長による、PCRに基づく方法)により濃縮および/または増幅される。配列特異的アンカーを、多くの場合、配列特異的プライマーとして使用することができる。
MPSシーケンシングは、一塩基合成法およびある特定のイメージングプロセスを使用することもある。本明細書に記載される方法において使用することができる核酸シーケンシング技術は、一塩基合成法および可逆的ターミネーターに基づくシーケンシング(例えば、IlluminaのGenome Analyzer;Genome Analyzer II;HISEQ 2000;HISEQ 2500(Illumina、San Diego CA))である。この技術を用いて、何百万もの核酸(例えば、DNA)断片を並行してシーケンシングすることができる。このタイプのシーケンシング技術の一例では、光学的に透明なスライドであって、その表面の8つの個別のレーンにオリゴヌクレオチドアンカー(例えば、アダプタープライマー)が結合されている、スライドを含有する、フローセルが使用される。
一塩基合成法は、一般に、鋳型により方向付けられる様式でプライマーまたは既存の核酸鎖にヌクレオチドを(共有結合性付加により)反復的に付加させることにより行われる。ヌクレオチドの反復的付加各々が検出され、核酸鎖の配列が得られるまでこのプロセスが何度も繰り返される。得られる配列の長さは、一部には、行われる付加および検出ステップの数に依存する。一塩基合成法の一部の実施形態では、ヌクレオチド付加の1ラウンドで、同じタイプの1つ、2つ、3つまたはそれより多くのヌクレオチド(例えば、A、G、CまたはT)が、付加され、検出される。ヌクレオチドを任意の好適な方法により(例えば、酵素的にまたは化学的に)付加させることができる。例えば、一部の実施形態では、ポリメラーゼまたはリガーゼは、ヌクレオチドをプライマーに、または既存の核酸鎖に、鋳型により方向付けられる様式で付加させる。一塩基合成法の一部の実施形態では、異なるタイプのヌクレオチド、ヌクレオチド類似体および/または識別子が使用される。一部の実施形態では、可逆的ターミネーターおよび/または除去可能な(例えば、切断可能な)識別子が使用される。一部の実施形態では、蛍光標識されたヌクレオチドおよび/またはヌクレオチド類似体が使用される。ある特定の実施形態では、一塩基合成法は、切断(例えば、識別子の切断および除去)および/または洗浄ステップを含む。一部の実施形態では、1つまたは複数のヌクレオチドの付加は、本明細書に記載されるまたは当技術分野において公知の好適な方法により検出され、そのような方法の非限定的な例としては、任意の好適なイメージング装置、好適なカメラ、デジタルカメラ、CCD(電荷結合素子)に基づくイメージング装置(例えば、CCDカメラ)、CMOS(相補型金属酸化物シリコン)に基づくイメージング装置(例えば、CMOSカメラ)、光ダイオード(例えば、光電子増倍チューブ)、電子顕微鏡法、電界効果トランジスタ(例えば、DNA電界効果トランジスタ)、ISFETイオンセンサー(例えば、CHEMFETセンサー)など、またはこれらの組合せが挙げられる。
本明細書に記載される方法を行うための任意の好適なMPS法、システムまたは技術プラットフォームを使用して、核酸配列リードを得ることができる。MPSプラットフォームの非限定的な例としては、ILLUMINA/SOLEX/HISEQ(例えば、IlluminaのGenome Analyzer;Genome Analyzer II;HISEQ 2000;HISEQ)、SOLiD、Roche/454、PACBIOおよび/もしくはSMRT、Helicos True Single Molecule Sequencing、Ion TorrentおよびIon半導体に基づくシーケンシング(例えば、Life Technologiesにより開発されたようなもの)、WildFire、5500、5500xl Wおよび/もしくは5500xl W Genetic Analyzerに基づく技術(例えば、Life Technologiesにより開発され、販売されているようなもの;米国特許出願公開第2013/0012399号);Polonyシーケンシング、パイロシーケンシング、大規模並列シグネチャーシーケンシング(MPSS)、RNAポリメラーゼ(RNAP)シーケンシング、LaserGenシステムおよび方法、ナノポアに基づくプラットフォーム、化学物質感受性電界効果トランジスタ(CHEMFET)アレイ、電子顕微鏡法に基づくシーケンシング(例えば、ZS Genetics、Halcyon Molecularにより開発されたようなもの)、ナノボールシーケンシングなど、またはこれらの組合せが挙げられる。本明細書における方法を行うために使用することができる他のシーケンシング方法としては、デジタルPCR、ハイブリダイゼーションによるシーケンシング、ナノポアシーケンシング、染色体特異的シーケンシング(例えば、DANSR(選択された領域のデジタル解析))技術が挙げられる。
一部の実施形態では、核酸は、シーケンシングされ、シーケンシング産物(例えば、配列リードの一群)は、シーケンシングされた核酸の解析前にまたは解析と同時に処理される。例えば、配列リードは、アライメント、マッピング、フィルタリング、計数、正規化、重み付け、プロファイルの生成などのうちの1つまたは複数、およびこれらの組合せに従って、処理され得る。ある特定の処理ステップをいずれの順序で行ってもよく、ある特定の処理ステップを繰り返してもよい。
本開示の方法を使用して、シーケンシング誤り率を低下させることができる。一部の実施形態では、最初の変性させるステップの前に、二本鎖分子をバーコードで標識することができ、その結果、後続の変性、一本鎖ライブラリー調製、およびシーケンシング後に、元々互いに対合していた核酸分子からの配列を関連付けることができる。一部の実施形態では、足場アダプターの最初のライゲーション後、インデックスプライマーのプールが、インデックスPCRを行なうために使用され、その結果、元の試料核酸分子と最初のPCR第1鎖合成からの核酸の両方のコピーが生成され、これらの両方が、同じバーコードまたはUMI(またはその相補体)を含む。元々ハイブリダイズされていた(それ故、相補配列を有する)鎖を関連付けるこれらのまたは他の手段により、両方の鎖についてのシーケンシングリード情報を比較することができ、それらの情報を使用してシーケンシング誤り率を低下させることができる。
リードのマッピング
配列リードをマッピングすることができ、指定核酸領域(例えば、染色体またはその一部分)にマッピングするリードの数は、カウントと呼ばれる。任意の好適なマッピング方法(例えば、プロセス、アルゴリズム、プログラム、ソフトウェア、モジュールなど、またはこれらの組合せ)を使用することができる。マッピングプロセスのある特定の態様が、以下に説明される。
ヌクレオチド配列リード(すなわち、物理的なゲノム位置が不明である断片からの配列情報)のマッピングは、いくつかの方法で行うことができ、多くの場合、得られた配列リードと参照ゲノム内のマッチする配列とのアライメントを含む。そのようなアライメントでは、配列リードは、一般に、参照配列とアライメントされ、アライメントしているものは、「マッピングされている」と、「マッピングされた配列リード」と、または「マッピングされたリード」と言われる。ある特定の実施形態では、マッピングされた配列リードは、「ヒット」または「カウント」と呼ばれる。一部の実施形態では、マッピングされた配列リードは、様々なパラメーターに従ってまとめられ、下でさらに詳細に論じられる特定のゲノム部分に割り当てられる。
用語「アライメントされた」、「アライメント」または「アライメントすること」は、マッチ(例えば、同一性100%)または部分的マッチとして識別され得る、2つまたはそれより多くの核酸配列を一般に指す。アライメントを手作業で行うことができ、またはコンピュータ(例えば、ソフトウェア、プログラム、モジュールもしくはアルゴリズム)により行うことができ、この非限定的な例としては、ILLUMINA Genomics Analysis pipelineの一部として配給されているEfficient Local Alignment of Nucleotide Data(ELAND)コンピュータプログラムが挙げられる。配列リードのアライメントは、100%配列マッチであり得る。一部の事例でには、アライメントは、100%未満の配列マッチ(すなわち、非完璧マッチ、部分的マッチ、部分的アライメント)である。一部の実施形態では、アライメントは、約99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%または75%マッチである。一部の実施形態では、アライメントは、ミスマッチを含む。一部の実施形態では、アライメントは、1、2、3、4または5つのミスマッチを含む。2つまたはそれより多くの配列を、どちらかの鎖(例えば、センスまたはアンチセンス鎖)を使用してアライメントすることができる。ある特定の実施形態では、核酸配列は、別の核酸配列の逆相補鎖とアライメントされる。
様々な計算論的方法を使用して、各配列リードを一部分にマッピングすることができる。配列をアライメントするために使用することができるコンピュータアルゴリズムの非限定的な例としては、限定ではないが、BLAST、BLITZ、FASTA、BOWTIE 1、BOWTIE 2、ELAND、MAQ、PROBEMATCH、SOAP、BWAもしくはSEQMAP、またはその変形形態、またはそれらの組合せが挙げられる。一部の実施形態では、配列リードを参照ゲノム内の配列とアライメントすることができる。一部の実施形態では、配列リードを、例えば、GenBank、dbEST、dbSTS、EMBL(European Molecular Biology Laboratory)およびDDBJ(日本DNAデータバンク)を含む、当技術分野において公知の核酸データベースにおいて見つけることができ、および/またはそのようなデータベース内の配列とアライメントすることができる。BLASTまたは類似のツールを使用して、識別された配列を配列データベースに対して検索することができる。次いで、検索ヒットを使用して、例えば、識別された配列を適切な部分にソートすることができる(以下に説明される)。
一部の実施形態では、リードは、参照ゲノム内の部分に一意的にマッピングすることもあり、または非一意的にマッピングすることもある。リードは、それが参照ゲノム内の単一の配列とアライメントした場合、「一意的にマッピングされた」と考えられる。リードは、それが参照ゲノム内の2つまたはそれより多くの配列とアライメントした場合、「非一意的にマッピングされた」と考えられる。一部の実施形態では、非一意的にマッピングされたリードは、さらなる解析(例えば、定量化)から除外される。ある特定の実施形態では、参照ゲノムとマッピングされた個々の試料からのリードとの間に存在し得る一塩基多型を考慮するために、ある特定の少しのミスマッチ(0~1)が許可され得る。一部の実施形態では、いかなる程度のミスマッチも、参照配列へのリードのマッピングに許可されない。
本明細書で使用される場合、用語「参照ゲノム」は、対象からの識別された配列を参照するために使用することができる任意の生物またはウイルスについての任意の特定の既知のシーケンシングまたは特徴付けされたゲノムを指し、これは、部分的なものか完全なものかを問わない。例えば、ヒト対象にはもちろん多くの他の生物にも使用される参照ゲノムは、ワールドワイドウェブURL ncbi.nlm.nih.govのNational Center for Biotechnology Informationで見つけることができる。「ゲノム」は、核酸配列で表される、生物またはウイルスの完全遺伝情報を指す。本明細書で使用される場合、参照配列または参照ゲノムは、多くの場合、1個体または複数の個体からの組み立てられたまたは部分的に組み立てられたゲノム配列である。一部の実施形態では、参照ゲノムは、1名または複数名のヒト個体からの組み立てられたまたは部分的に組み立てられたゲノム配列である。一部の実施形態では、参照ゲノムは、染色体に割り当てられた配列を含む。
ある特定の実施形態では、マッピング能力は、ゲノム領域(例えば、部分、ゲノム部分)について評定される。マッピング能力は、ヌクレオチド配列リードを参照ゲノムの一部分と明確にアライメントする能力であり、通常は、例えば0、1、2またはそれより多くのミスマッチを含む、指定数までのミスマッチである。所与のゲノム領域についての予想マッピング能力は、あらかじめ設定されたリード長についてスライディングウインドウアプローチを使用すること、および結果として得られるリードレベルのマッピング能力の値を平均することにより、推定することができる。固有ヌクレオチド配列の伸長部を含むゲノム領域が高いマッピング能力値を有することもある。
ペアエンドシーケンシングの場合、好適なマッピングおよび/またはアライメントプログラムまたはアルゴリズムの使用によりリードを参照ゲノムにマッピングすることができ、そのようなプログラムの非限定的な例としては、BWA(Li H. and Durbin R. (2009)Bioinformatics 25, 1754-60)、Novoalign[Novocraft (2010)]、Bowtie(Langmead B, et al., (2009) Genome Biol. 10:R25)、SOAP2(Li R, et al., (2009) Bioinformatics 25, 1966-67)、BFAST(Homer N, et al., (2009) PLoS ONE 4, e7767)、GASSST(Rizk, G. and Lavenier, D. (2010) Bioinformatics 26, 2534-2540)、およびMPscan(Rivals E., et al. (2009) Lecture Notes in Computer Science 5724, 246-260)などが挙げられる。好適なトリミングおよび/またはマージングプログラムまたはアルゴリズムを使用することによりリードをトリミングおよび/またはマージすることができ、そのようなプログラムまたはアルゴリズムの非限定的な例としては、Cutadapt、trimmomatic、SeqPrep、およびusearchが挙げられる。シーケンシングリード長より短い核酸鋳型からのものなどの一部の対合末端リードは、フォワードリードとリバースリードの両方によりシーケンシングされた部分を有することができ、そのような事例では、フォワードリードとリバースリード間のオーバーラップを使用してフォワードリードとリバースリードを単一のリードにマージすることができる。オーバーラップしていないリード、または十分にオーバーラップしていないリードは、マージしていない状態のままであることもあり、対合リードとしてマッピングされることもある。ペアエンドリードは、好適なショートリードアライメントプログラムまたはアルゴリズムを使用して、マッピングおよび/またはアライメントすることができる。ショートリードアライメントプログラムの非限定的な例としては、BarraCUDA、BFAST、BLASTN、BLAT、Bowtie、BWA、CASHX、CUDA-EC、CUSHAW、CUSHAW2、drFAST、ELAND、ERNE、GNUMAP、GEM、GensearchNGS、GMAP、Geneious Assembler、iSAAC、LAST、MAQ、mrFAST、mrsFAST、MOSAIK、MPscan、Novoalign、NovoalignCS、Novocraft、NextGENe、Omixon、PALMapper、Partek、PASS、PerM、QPalma、RazerS、REAL、cREAL、RMAP、rNA、RTG、Segemehl、SeqMap、Shrec、SHRiMP、SLIDER、SOAP、SOAP2、SOAP3、SOCS、SSAHA、SSAHA2、Stampy、SToRM、Subread、Subjunc、Taipan、UGENE、VelociMapper、TimeLogic、XpressAlign、ZOOMなど、またはこれらの組合せが挙げられる。ペアエンドリードは、参照ゲノムに従って、同じポリヌクレオチド断片の反対側の末端にマッピングされることが多い。一部の実施形態では、リードメイトが独立してマッピングされる。一部の実施形態では、両方の配列リードからの(すなわち、各末端からの)情報は、マッピングプロセスで因数分解される。参照ゲノムは、ペアエンドリードメイト間に位置する核酸の配列を決定および/または推測するために使用されることが多い。用語「不一致リードペア」は、本明細書で使用される場合、リードメイトの一方または両方が、一つには、連続するヌクレオチドのセグメントにより定義される、参照ゲノムの同じ領域に明確にマッピングすることができないリードメイトのペアを含む、ペアエンドリードを指す。一部の実施形態では、不一致リードペアは、参照ゲノムの予想外の位置にマッピングする、ペアエンドリードメイトである。参照ゲノムの予想外の位置の非限定的な例としては、(i)2つの異なる染色体、(ii)所定の断片サイズより大きい(例えば、300bpより大きい、500bpより大きい、1000bpより大きい、5000bpより大きい、もしくは10,000bpより大きい)断片サイズによって隔てられている位置、(iii)参照配列と合致しない方向(すなわち、反対方向)など、またはこれらの組合せが挙げられる。一部の実施形態では、不一致リードメイトは、試料中の鋳型ポリヌクレオチド断片の長さ(例えば、長さ代表値、所定の断片サイズ)または予想長に従って識別される。例えば、試料中のポリヌクレオチド断片の長さ代表値または予想長を超える長さによって隔てられている位置にマッピングするリードメイトは、不一致リードペアとして識別されることもある。反対方向にマッピングするリードペアは、リードのうちの一方の逆相補鎖を使うこと、および参照配列の同じ鎖を使用して両方のリードのアライメントを比較することにより、決定されることもある。不一致リードペアは、当技術分野において公知のまたは本明細書に記載される任意の好適な方法および/またはアルゴリズム(例えば、SVDetect、Lumpy、BreakDancer、BreakDancerMax、CREST、DELLYなど、またはこれらの組合せ)により識別することができる。
配列リード定量化
選択された特徴または変数に基づいてマッピングまたは分割される配列リードを定量化して、1つまたは複数の部分(例えば、参照ゲノムの部分)にマッピングされるリードの量または数を決定することができる。ある特定の実施形態では、部分またはセグメントにマッピングされる配列リードの量は、カウントまたはリード密度と呼ばれる。
カウントは、多くの場合、ゲノム部分と関連付けられる。一部の実施形態では、カウントは、部分にマッピングされた(すなわち、部分と関連付けられた)配列リードの一部またはすべてから決定される。ある特定の実施形態では、カウントは、部分の群(例えば、セグメントまたは領域内の部分)にマッピングされた配列リードの一部またはすべてから決定される。
カウントは、好適な方法、操作または数学的プロセスにより決定することができる。カウントは、セグメントに対応するゲノム部分もしくはゲノム部分の群にマッピングされた、ゲノムの小領域(例えば、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域、性染色体領域)に対応する部分の群にマッピングされた、および/または、ときには、ゲノムに対応する部分の群にマッピングされた、すべての配列リードの直和であることもある。リード定量化は、比であることもあり、領域a内の部分についての定量化の領域b内の部分についての定量化に対する比であることもある。領域aは、1つの部分、セグメント領域、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域および/または性染色体領域であることもある。領域bは、独立して、1つの部分、セグメント領域、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域、性染色体領域、すべての常染色体を含む領域、性染色体を含む領域、および/またはすべての染色体を含む領域であることもある。
一部の実施形態では、カウントは、生配列リードおよび/またはフィルタリングされた配列リードから導出される。ある特定の実施形態では、カウントは、ゲノム部分にまたはゲノム部分の群(例えば、領域内のゲノム部分)にマッピングされた配列リードの代表値、平均値または合計である。一部の実施形態では、カウントは、不確定値に関連付けられる。カウントは、調整されることもある。カウントは、重み付けされた、除去された、フィルタリングされた、正規化された、調整された、平均された、平均値として導出された、中央値として導出された、加算された、またはこれらの組合せが施された、ゲノム部分または部分の群に関連付けられた配列リードに従って、調整することができる。
配列リード定量化は、リード密度であることもある。リード密度を、ゲノムの1つまたは複数のセグメントについて決定および/または生成することができる。ある特定の事例では、リード密度を、1つまたは複数の染色体について決定および/または生成することができる。一部の実施形態では、リード密度は、参照ゲノムのセグメントまたは一部分にマッピングされた配列リードのカウントの定量的測度を含む。リード密度を、好適なプロセスにより決定することができる。一部の実施形態では、リード密度は、好適な分布および/または好適な分布関数により決定される。分布関数の非限定的な例としては、確率関数、確率分布関数、確率密度関数(PDF)、カーネル密度関数(カーネル密度推定)、累積分布関数、確率質量関数、離散確率分布、絶対連続単変量分布など、任意の好適な分布、またはこれらの組合せが挙げられる。リード密度は、好適な確率密度関数から導出される密度推定であり得る。密度推定は、基礎をなす確率密度関数の推定値を実測データに基づいて構築することである。一部の実施形態では、リード密度は、密度推定(例えば、確率密度推定、カーネル密度推定)を含む。各々の部分が配列リードのカウントを構成する、ゲノムの1つまたは複数の部分の各々についての密度推定を生成することを含むプロセスに従って、リード密度を生成することができる。部分またはセグメントにマッピングされた、正規化および/または重み付けされたカウントについて、リード密度を生成することができる。一部の事例では、部分またはセグメントにマッピングされた各リードは、リード密度に寄与することができ、値(例えば、カウント)は、本明細書に記載される正規化プロセスから得られるその重みに等しくなる。一部の実施形態では、1つまたは複数の部分またはセグメントについてのリード密度が調整される。リード密度を、好適な方法により調整することができる。例えば、1つまたは複数の部分についてのリード密度に重み付けすることができ、および/またはリード密度を正規化することができる。
所与の部分またはセグメントについて定量化されたリードは、1つの供給源からのものであることもあり、または異なる供給源からのものであることもある。一例では、がんに罹患しているまたはがんの罹患が疑われる対象からの核酸から、リードを得ることができる。そのような状況では、1つまたは複数の部分にマッピングされたリードは、健康な細胞(すなわち、非がん細胞)とがん細胞(例えば、腫瘍細胞)の両方を代表するリードであることが多い。ある特定の実施形態では、ある部分にマッピングされたリードの一部は、がん細胞核酸からのものであり、同じ部分にマッピングされたリードの一部は、非がん細胞核酸からのものである。別の例では、胎児を宿している妊娠している雌からの核酸試料から、リードを得ることができる。そのような状況では、1つまたは複数の部分にマッピングされたリードは、胎児と胎児の母(例えば、妊娠している雌対象)の両方を代表するリードであることが多い。ある特定の実施形態では、ある部分にマッピングされたリードの一部は、胎児ゲノムからのものであり、同じ部分にマッピングされたリードの一部は、母体ゲノムからのものである。
分類およびそれらの使用
本明細書に記載される方法は、上記の試料または供給源の1つまたは複数の特性を示すアウトカムを提供することができる。本明細書に記載される方法は、被検試料(例えば、医学的状態の存在もしくは非存在および/または表現型を決定するアウトカムを提供するもの)についての表現型および/または医学的状態の存在もしくは非存在を示すアウトカムを提供することもある。アウトカムは、分類プロセスの一部であることが多く、分類(例えば、試料もしくは供給源の1つもしくは複数の特性、ならびに/または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在の分類)は、アウトカムに基づくこともあり、および/またはアウトカムを含むこともある。アウトカムおよび/または分類は、分類プロセス(例えば、統計値)において試料および/もしくは供給源の1つもしくは複数の特性ならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在の判定を容易にする、被検試料についてのデータ処理の結果に基づくこともあり、および/またはそのような結果を含むこともある。アウトカムおよび/または分類は、試料もしくは供給源の1つもしくは複数の特性、ならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在を決定するスコアをあるいはそのような特性ならびに/または存在もしくは非存在のコールを含むこともあり、またはそのようなスコアもしくはコールに基づくこともある。ある特定の実施形態では、アウトカムおよび/または分類は、分類プロセスにおいて試料もしくは供給源の1つもしくは複数の特性をならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在を予測および/または判定する、結論を含む。
アウトカムおよび/または分類の任意の好適な表現を提供することができる。アウトカムおよび/または分類は、確率の1つまたは複数の考察に関連して本明細書に記載される処理方法を使用して生成された1つまたは複数の数値に基づくこともあり、および/またはそのような数値を含むこともある。利用することができる値の非限定的な例としては、感度、特異度、標準偏差、中央絶対偏差(MAD)、確実性の測度、信頼度の測度、被検試料について得られた値が特定の値範囲内または外にある確実性または信頼度の測度、不確実性の測度、被検試料について得られた値が特定の値範囲内または外にある不確実性の測度、変動係数(CV)、信頼レベル、信頼区間(例えば、約95%信頼区間)、標準スコア(例えば、zスコア)、カイ値、パイ値、t検定の結果、p値、倍数性値、適合した少数派種の分率、面積比、中央値レベルなど、またはこれらの組合せが挙げられる。一部の実施形態では、アウトカムおよび/または分類は、リード密度、リード密度プロファイルおよび/またはプロット(例えば、プロファイルプロット)を含む。ある特定の実施形態では、複数の値が、ときにはそのような値についてのプロファイル(例えば、zスコアプロファイル、p値プロファイル、カイ値プロファイル、パイ値プロファイル、t検定の結果、値のプロファイルなど、またはこれらの組合せ)に関して、一緒に解析される。確率の考察は、試料または供給源の1つもしくは複数の特性の判定、ならびに/または対象が、遺伝子型、表現型、遺伝的変異および/もしくは医学的状態を有するリスクがあるか、もしくは有しているかの判定を容易にすることができ、前述のことを決定するアウトカムおよび/または分類が、そのような考察を含むこともある。
ある特定の実施形態では、アウトカムおよび/または分類は、被検試料について遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在のリスクもしくは確率を予測および/または判定する結論に基づく、ならびに/またはそのような結論を含む。結論は、本明細書に記載されるデータ解析方法から決定された値(例えば、確率、確実性および/または不確実性を示す統計値(例えば、標準偏差、中央絶対偏差(MAD)、確実性の測度、信頼度の測度、被検試料について得られた値が特定の値範囲内または外にある確実性または信頼度の測度、不確実性の測度、被検試料について得られた値が特定の値範囲内または外にある不確実性の測度、変動係数(CV)、信頼レベル、信頼区間(例えば、約95%信頼区間)、標準スコア(例えば、zスコア)、カイ値、パイ値、t検定の結果、p値、感度、特異度など、またはこれらの組合せ)に基づくこともある。アウトカムおよび/または分類は、特定の被検試料についての検査室検査レポートに、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在に関連する確率(例えば、オッズ比、p値)、尤度またはリスク因子として表示されることもある。被検試料についてのアウトカムおよび/または分類は、特定の遺伝子型、表現型、遺伝的変異および/または医学的状態に関して「陽性」または「陰性」として提供されることもある。例えば、アウトカムおよび/または分類は、特定の被検試料について、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在が判定された場合、検査室検査レポートに「陽性」と表示されることもあり、ときには、アウトカムおよび/または分類は、特定の被検試料について、遺伝子型、表現型、遺伝的変異および/または医学的状態の非存在が判定された場合、検査室検査レポートに「陽性」と表示される。アウトカムおよび/または分類は、データ処理で判定されることもあり、データ処理で使用される仮説を含むこともある。
分類プロセスで生成される分類について、真陽性、偽陽性、真陰性および偽陰性という4つのタイプが概して存在する。用語「真陽性」は、本明細書で使用される場合、被検試料について正しく判定された遺伝子型、表現型、遺伝的変異、または医学的状態の存在を指す。用語「偽陽性」は、本明細書で使用される場合、被検試料について誤って判定された遺伝子型、表現型、遺伝的変異、または医学的状態の存在を指す。用語「真陰性」は、本明細書で使用される場合、被検試料について正しく判定された遺伝子型、表現型、遺伝的変異、または医学的状態の非存在を指す。用語「偽陰性」は、本明細書で使用される場合、被検試料について誤って判定された遺伝子型、表現型、遺伝的変異、または医学的状態の非存在を指す。分類プロセスについて性能の次の2つの測度:(i)一般に、陽性であると正しく識別される予測陽性の分率である、感度値;および(ii)一般に、陰性であると正しく識別される予測陽性の分率である、特異度値を、これらの存在比に基づいて算出することができる。
ある特定の実施形態では、分類プロセスについて生成される検査室検査レポートは、検査性能の測度(例えば、感度および/または特異度)、および/または信頼度の測度(例えば、信頼レベル、信頼区間)を含む。検査性能および/または信頼度の測度は、被検試料についての検査室検査を行う前に行われる臨床検証研究から得られることもある。ある特定の実施形態では、感度、特異度および/または信頼度のうちの1つまたは複数は、パーセンテージとして表される。一部の実施形態では、感度、特異度または信頼レベルの各々について独立して表されるパーセンテージは、約90%より高い(例えば、約90、91、92、93、94、95、96、97、98または99%であるか、または99%より高い(例えば、約99.5%であるかそれより高い、約99.9%であるかそれより高い、約99.95%であるかそれより高い、約99.99%であるかそれより高い))。特定の信頼レベル(例えば、約90%~約99.9%(例えば約95%)の信頼レベル)について表される信頼区間を値の範囲として表すことができ、そのような信頼区間は、特定の信頼レベルについての感度および/または特異度の範囲として表されることもある。一部の実施形態での変動係数(CV)は、パーセンテージとして表され、パーセンテージは、約10%またはそれ未満(例えば、約10、9、8、7、6、5、4、3、2もしくは1%、または1%未満(例えば、約0.5%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.01%もしくはそれ未満))であることもある。ある特定の実施形態での(例えば、特定のアウトカムおよび/または分類が偶然によるものでない)確率は、標準スコア(例えば、zスコア)、p値、またはt検定の結果として表される。一部の実施形態では、アウトカムおよび/または分類についての測定分散、信頼レベル、信頼区間、感度、特異度など(例えば、信頼度パラメーターと総称される)は、本明細書に記載される1つまたは複数のデータ処理操作を使用して生成することができる。
被検試料についてのアウトカムおよび/または分類は、医療専門家または他の有資格者(例えば、医師もしくは助手)により発注されることが多く、彼らに提供されることが多く、彼らが、アウトカムおよび/または分類を、被検試料が採取される対象に伝送する。ある特定の実施形態では、アウトカムおよび/または分類は、好適な視覚媒体(例えば、機械の周辺機器またはコンポーネント、例えば、プリンターまたはディスプレイ)を使用して提供される。分類および/またはアウトカムは、医療専門家または有資格者にレポートの形態で提供されることが多い。レポートは、アウトカムおよび/または分類(例えば、値、試料もしくは供給源の1つもしくは複数の特性、または遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在の評定もしくは確率)の表示を通常は含み、関連信頼度パラメーターを含むこともあり、アウトカムおよび/または分類を生成するために使用された検査についての性能の測度を含むこともある。レポートは、追跡調査手順(例えば、アウトカムまたは分類を確認する手順)の助言を含むこともある。レポートは、染色体またはその一部分の視覚表示(例えば、染色体イディオグラムまたはカリオグラム)を含むこともあり、被検試料について識別された染色体の重複および/または欠失領域の視覚化(例えば、染色体欠失または重複についての全染色体の視覚化;欠失し領域または重複領域が示されている全染色体の視覚化;重複または欠失した染色体の部分の視覚化;染色体の部分の欠失イベントにおいて残存する染色体の部分の視覚化)を示すこともある。
レポートを、医療従事者または他の有資格者による遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在の判定を容易にする好適な形式で表示することができる。レポートの作成に使用するために好適な形式の非限定的な例としては、デジタルデータ、グラフ、2Dグラフ、3Dグラフおよび4Dグラフ、画像(例えば、jpg、ビットマップ(例えば、bmp)、pdf、tiff、gif、raw、pngなど、もしくは好適な形式)、統計図表、チャート、表、棒グラフ、円グラフ、図、フローチャート、散布図、マップ、ヒストグラム、密度チャート、関数グラフ、回路図、ブロック図、バブルマップ、信号空間ダイヤグラム、コンター図、統計地図、クモの巣グラフ、ベン図、計算図表など、または前述のものの組合せが挙げられる。
レポートを、コンピュータにより、および/またはヒトによるデータ入力により、作成してもよく、好適な電子媒体を使用して(例えば、インターネット経由で、コンピュータ経由で、ファクシミリ経由で、同じもしくは異なる物理的位置で1つのネットワークの場所から別の場所に)、またはデータを送信もしくは受信する別の方法(例えば、メールサービス、クーリエサービスなど)により、伝送および通信することができる。レポートを伝送するための通信媒体の非限定的な例としては、聴覚ファイル、コンピュータ可読ファイル(例えば、pdfファイル)、紙のファイル、検査室ファイル、診療記録ファイル、または前の段落に記載の任意の他の媒体が挙げられる。検査室ファイルまたは診療記録ファイルは、ある実施形態では、有形形態であってもよく、または電子形態(例えば、コンピュータ可読形態)であってもよい。レポートが作成され、伝送された後、アウトカムおよび/または分類を含む書面による表示および/またはグラフィック表示を好適な通信媒体経由で得ることによりレポートを受け取ることができ、これを見直すことによって、医療専門家または他の有資格者は、試料または供給源の1つもしくは複数の特性、または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在について判定することができる。
アウトカムおよび/または分類は、検査室により提供されることがあり、検査室から得られる(例えば、検査室ファイルから得られる)ことがある。検査室ファイルは、試料もしくは供給源の1つもしくは複数の特性および/または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在を判定するための1つまたは複数の検査を行う検査室により、作成され得る。検査室職員(例えば、主席研究員)は、アウトカムおよび/または分類の根拠となる被検試料に関連する情報(例えば、検査プロファイル、参照プロファイル、検査値、参照値、逸脱レベル、患者情報)を解析することができる。近いまたは疑わしい遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在に関するコールについては、検査室職員は、被検対象からの同じ(例えば、同じ試料のアリコート)または異なる被検試料を使用して同じ手順を再実行することができる。検査室は、検査室ファイルからの遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を評定する職員と同じ場所にあってもよく、または異なる場所(例えば、別の国)にあってもよい。例えば、検査室ファイルをある場所で作成し、別の場所に伝送することができ、そこで、そのファイル内の被検試料についての情報が、医療専門家または他の有資格者により評定され、必要に応じて、被検試料が採取された対象に伝送される。検査室が、被検試料についてのゲノム不安定性、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在についての分類を含む検査室レポートを作成および/または伝送することもある。検査室検査レポートを作成する検査室は、認定された検査室であることもあり、臨床検査室改善法(CLIA)のもとで認定された検査室であることもある。
アウトカムおよび/または分類は、対象の診断の構成要素であることもあり、ときには、アウトカムおよび/または分類は、被検試料についての診断を下すことの一部として利用および/または評定される。例えば、医療専門家または他の有資格者は、アウトカムおよび/または分類を解析し、そのアウトカムおよび/もしくは分類に基づいて、または一部は基づいて、診断を下すことができる。一部の実施形態では、医学的状態、疾患、症状または異常の判定、検出または診断は、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を決定するアウトカムおよび/または分類の使用を含む。したがって、本明細書に記載される方法により生成されたアウトカムまたは分類に従って、ならびに必要に応じて、被検試料についての遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在についての分類を含む検査室レポートの作成および伝送に従って、被検試料についての遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を診断する方法が、本明細書で提供される。
機械、ソフトウェアおよびインターフェース
本明細書に記載されるある特定のプロセスおよび方法(例えば、配列リードのサブセットを選択するプロセスおよび方法、配列リードプロファイルを生成するプロセスおよび方法、配列リードデータを処理するプロセスおよび方法、配列リード定量化を処理するプロセスおよび方法、配列リードデータまたは配列リードプロファイルに基づいて試料の1つまたは複数の特性を判定するプロセスおよび方法)は、多くの場合、頭の中で行なうには複雑すぎ、コンピュータ、マイクロプロセッサー、ソフトウェア、モジュールまたは他の機械なしでは遂行することができない。本明細書に記載される方法は、コンピュータ実装方法であり得、方法の1つまたは複数の部分は、1つまたは複数のプロセッサー(例えば、マイクロプロセッサー)、コンピュータ、システム、装置または機械(例えば、マイクロプロセッサー制御型機械)により遂行されることもある。
使用に好適なコンピュータ、システム、装置、機械およびコンピュータプログラム製品は、多くの場合、コンピュータ可読記憶媒体を含み、またはコンピュータ可読記憶媒体とともに利用される。コンピュータ可読記憶媒体の非限定的な例としては、メモリー、ハードディスク、CD-ROM、フラッシュメモリーデバイスなどが挙げられる。コンピュータ可読記憶媒体は、一般に、コンピュータハードウェアであり、多くの場合、非一過性コンピュータ可読記憶媒体である。コンピュータ可読記憶媒体は、コンピュータ可読伝送媒体ではなく、後者のコンピュータ可読伝送媒体は、それ自体が伝送信号である。
実行可能プログラムが記憶されているコンピュータ可読記憶媒体であって、プログラムが、マイクロプロセッサーに、本明細書に記載される方法を遂行するように命令する、コンピュータ可読記憶媒体が、本明細書で提供される。実行可能プログラムモジュールが記憶されているコンピュータ可読記憶媒体であって、プログラムモジュールが、マイクロプロセッサーに、本明細書に記載される方法の一部を遂行するように命令する、コンピュータ可読記憶媒体も、提供される。実行可能プログラムが記憶されているコンピュータ可読記憶媒体を含む、システム、機械、装置およびコンピュータプログラム製品であって、プログラムが、マイクロプロセッサーに、本明細書に記載される方法を遂行するように命令する、システム、機械、装置およびコンピュータプログラム製品も、本明細書で提供される。実行可能プログラムモジュールが記憶されているコンピュータ可読記憶媒体を含む、システム、機械および装置であって、プログラムモジュールが、マイクロプロセッサーに、本明細書に記載される方法の一部を遂行するように命令する、システム、機械および装置も、提供される。
コンピュータプログラム製品も提供される。コンピュータプログラム製品は、内部で実施されるコンピュータ可読プログラムコードを含む、コンピュータ使用可能媒体であって、コンピュータ可読プログラムコードが、本明細書に記載される方法または方法の一部を実行するための命令を受けるように構成されている、コンピュータ使用可能媒体を、多くの場合、含む。コンピュータ使用可能媒体および可読プログラムコードは、伝送媒体(すなわち、それ自体が伝送信号)ではない。コンピュータ可読プログラムコードは、プロセッサー、コンピュータ、システム、装置または機械により実行されるように構成されている。
一部の実施形態では、本明細書に記載される方法(例えば、配列リードのサブセットを選択する方法、配列リードプロファイルを生成する方法、配列リードデータを処理する方法、配列リード定量化を処理する方法、配列リードデータまたは配列リードプロファイルに基づいて試料の1つまたは複数の特性を判定する方法)は、自動化法により遂行される。一部の実施形態では、本明細書に記載される方法の1つまたは複数のステップは、マイクロプロセッサーおよび/もしくはコンピュータにより行われ、ならびに/またはメモリーと連動して行われる。一部の実施形態では、自動化法は、本明細書に記載される方法を遂行する、ソフトウェア、モジュール、マイクロプロセッサー、同様のものを含む周辺機器、および/または機械で、実施される。本明細書で使用される場合、ソフトウェアは、マイクロプロセッサーにより実行されたときに本明細書に記載のコンピュータ操作を遂行する、コンピュータ可読プログラム命令を指す。
機械、ソフトウェアおよびインターフェースを使用して、本明細書に記載される方法を行うことができる。機械、ソフトウェアおよびインターフェースを使用して、ユーザーは、特定の情報、プログラムまたはプロセスを使用する(例えば、配列リードデータを処理する、配列リード定量化を処理する、および/またはアウトカムを提供する)ための選択肢の入力、リクエスト、クエリまたは決定を行うことができ、これは、例えば、統計解析アルゴリズム、統計的有意性アルゴリズム、統計アルゴリズム、反復ステップ、検証アルゴリズム、およびグラフィック表示の実行を伴い得る。一部の実施形態では、データセットは、ユーザーにより入力情報として入力されることがあり、ユーザーは、好適なハードウェア媒体(例えば、フラッシュドライブ)により1つもしくは複数のデータセットをダウンロードすることができ、ならびに/またはユーザーは、アウトカムのその後の処理および/もしくは提供のためにデータセットをあるシステムから別のシステムに送信する(例えば、配列リード処理のためにシーケンサーからコンピュータシステムに配列リードデータを送信する;処理された配列リードデータを、アウトカムおよび/もしくはレポートをさらに処理するおよび/もしくは生じさせるために、コンピュータシステムに送信する)ことができる。
システムは、通常は、1つまたは複数の機械を含む。各機械は、メモリー、1つまたは複数のマイクロプロセッサー、および命令のうちの1つまたは複数を含む。システムが、2つまたはそれより多くの機械を含む場合、機械の一部もしくはすべてが、同じ場所に位置してもよく、機械の一部もしくはすべてが、異なる場所に位置してもよく、機械のすべてが、一カ所に位置してもよく、および/または機械のすべてが、異なる場所に位置してもよい。システムが、2つまたはそれより多くの機械を含む場合、機械の一部もしくはすべてが、ユーザーと同じ場所に位置してもよく、機械の一部もしくはすべてが、ユーザーとは異なる場所に位置してもよく、機械のすべてが、ユーザーと同じ場所に位置してもよく、および/または機械のすべてが、ユーザーとは異なる1つもしくは複数の場所に位置してもよい。
システムは、計算機と、シーケンシング装置またはシーケンシング機とを含むことがあり、この場合、シーケンシング装置またはシーケンシング機は、物理的核酸を受け取り、配列リードを生成するように構成されており、計算装置は、シーケンシング装置またはシーケンシング機からのリードを処理するように構成されている。計算機は、配列リードからアウトカム(例えば、試料の特性)を判定するように構成されていることもある。
ユーザーは、例えば、ソフトウェアに対してクエリを行うことができ、その結果、インターネットアクセス経由でデータセットを獲得することができ、ある特定の実施形態では、プログラム可能マイクロプロセッサーを、所与のパラメーターに基づいて好適なデータセットを獲得するように促すことができる。プログラム可能マイクロプロセッサーにより、ユーザーが、所与のパラメーターに基づいてマイクロプロセッサーにより選択された1つまたは複数のデータセット選択肢を選択するように促されることもある。プログラム可能マイクロプロセッサーは、ユーザーに、インターネット経由で見つかった情報、他の内部または外部情報などに基づいてマイクロプロセッサーにより選択された1つまたは複数のデータセット選択肢を選択するように促すことができる。選択肢は、方法、機械、装置、コンピュータプログラム、または実行可能プログラムが記憶されている非一過性コンピュータ可読記憶媒体の、1つまたは複数のデータ特徴選択、1つまたは複数の統計アルゴリズム、1つまたは複数の統計解析アルゴリズム、1つまたは複数の統計的有意性アルゴリズム、反復ステップ、1つまたは複数の検証アルゴリズム、および1つまたは複数のグラフィック表示を選択するために、選択され得る。
本明細書で取り扱われるシステムは、例えば、ネットワークサービス、ラップトップシステム、デスクトップシステム、携帯型システム、携帯情報端末、コンピューティングキオスクなどのような、コンピュータシステムの一般的コンポーネントを含み得る。コンピュータシステムは、ユーザーによるシステムへのデータの入力を可能にする、キーボード、タッチスクリーン、マウス、音声認識または他の手段などの、1つまたは複数の入力手段を含み得る。システムは、ディスプレイスクリーン(例えば、CRTもしくはLCD)、スピーカー、FAX機、プリンター(例えば、レーザー、インクジェット、インパクト、白黒もしくはカラープリンター)、または情報(例えば、アウトカムおよび/もしくはレポート)の視覚的、聴覚的および/もしくはハードコピー出力の提供に有用な他の出力要素を含むがこれらに限定されない、1つまたは複数の出力要素をさらに含み得る。
システム内で、入力および出力コンポーネントを中央処理ユニットに接続することができ、この中央処理ユニットは、数あるコンポーネントの中でも特に、プログラム命令を実行するためのマイクロプロセッサーと、プログラムコードおよびデータを記憶するためのメモリーとを含み得る。一部の実施形態では、プロセスを、単一の地理的位置に位置するシングルユーザーシステムとして実行することができる。ある特定の実施形態では、プロセスを、マルチユーザーシステムとして実行することができる。マルチユーザーインプリメンテーションの場合、複数の中央処理ユニットをネットワークによって接続することができる。ネットワークは、建物の一カ所にある単一の部署を包含する、ローカルなものであることもあり、建物全体であることもあり、複数の建物にわたることもあり、地域にわたることもあり、国全体にわたることもあり、または世界中であることもある。ネットワークは、プロバイダーにより所有され、制御される、プライベートなものであることもあり、またはユーザーがウェブページにアクセスして入り、情報を取り出す、インターネットに基づくサービスとして実行されることもある。したがって、ある特定の実施形態では、システムは、ユーザーを基準にしてローカルであることもあり、または遠隔であることもある、1つまたは複数の機械を含む。1つの場所または複数の場所の1つより多くの機械にユーザーはアクセスすることができ、順次および/または並行してデータをマッピングおよび/または処理することができる。したがって、複数の機械を、例えば、ローカルネットワーク、遠隔ネットワーク、および/または「クラウド」コンピュータプラットフォームで使用して、データをマッピングおよび/または処理するために、好適な構成および制御を利用することができる。
システムは、一部の実施形態では、通信用インターフェースを含むことができる。通信用インターフェースは、コンピュータシステムと1つまたは複数の外部デバイスとの間のソフトウェアおよびデータの転送を可能にする。通信用インターフェースの非限定的な例としては、モデム、ネットワークインターフェース(例えば、イーサネット(登録商標)カード)、通信ポート、PCMCIAスロットおよびカードなどが挙げられる。通信用インターフェース経由で転送されるソフトウェアおよびデータは、一般に、通信用インターフェースによって受信され得る電子、電磁、光および/または他の信号であり得る、信号の形態である。信号は、チャネルを介して通信用インターフェースに提供されることが多い。チャネルは、多くの場合、信号を伝達し、ワイヤもしくはケーブル、光ファイバー、電話線、携帯電話リンク、RFリンクおよび/または他の通信チャネルを使用して、チャネルを実装することができる。したがって、一例では、通信用インターフェースを使用して、信号検出モジュールにより検出され得る信号情報を受信することができる。
データは、手動入力デバイスまたは直接データ入力デバイス(DDE)を含むがこれらに限定されない、好適なデバイスおよび/または方法により、入力することができる。手動デバイスの非限定的な例としては、キーボード、コンセプトキーボード、タッチ式スクリーン、ライトペン、マウス、トラッカーボール、ジョイスティック、グラフィックタブレット、スキャナー、デジタルカメラ、ビデオデジタイザーおよび音声認識デバイスが挙げられる。DDEの非限定的な例としては、バーコードリーダー、磁気ストライプコード、スマートカード、磁気インク文字認識、光学式文字認識、光学式マーク認識、およびターンアラウンドドキュメントが、挙げられる。
一部の実施形態では、シーケンシング装置またはシーケンシング機からの出力は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、配列リード情報は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、マッピングされた配列リードは、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸断片サイズ(例えば、長さ)は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸捕捉プロセスからの出力(例えば、ゲノム領域由来のデータ)は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸断片サイズ(例えば、長さ)と核酸捕捉プロセスからの出力(例えば、ゲノム領域由来のデータ)との組合せは、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、模擬データは、in silicoプロセスにより生成され、模擬データは、入力デバイスによって入力することができるデータとして役立ち得る。用語「in silico」は、コンピュータを使用して遂行される研究および実験を指す。in silicoプロセスとしては、本明細書に記載されるプロセスに従って配列リードをマッピングすることおよびマッピングされた配列リードを処理することが挙げられるが、これらに限定されない。
システムは、本明細書に記載されるプロセスまたはプロセスの一部の遂行に有用なソフトウェアを含むことがあり、ソフトウェアは、そのようなプロセスを遂行するための1つまたは複数のモジュール(例えば、シーケンシングモジュール、論理処理モジュール、データ表示構成モジュール)を含むことができる。用語「ソフトウェア」は、コンピュータにより実行されたときにコンピュータ操作を遂行する、コンピュータ可読プログラム命令を指す。1つまたは複数のマイクロプロセッサーにより実行可能な命令が、実行コードとして提供されることもあり、実行コードは、実行されたとき、本明細書に記載される方法を1つまたは複数のマイクロプロセッサーに実行させることができる。本明細書に記載されるモジュールは、ソフトウェアとして存在することができ、ソフトウェアで実施される命令(例えば、プロセス、ルーチン、サブルーチン)がマイクロプロセッサーにより実行または遂行され得る。例えば、モジュール(例えば、ソフトウェアモジュール)は、特定のプロセスまたはタスクを遂行するプログラムの一部であり得る。用語「モジュール」は、より大型の機械またはソフトウェアシステムで使用され得る自己完結型機能ユニットを指す。モジュールは、モジュールの機能を行うための一連の命令を含むことができる。モジュールは、データおよび/または情報を変換することができる。データおよび/または情報は、適切な形態であり得る。例えば、データおよび/または情報は、デジタルまたはアナログであり得る。ある特定の実施形態では、データおよび/または情報は、ときにはパケット、バイト、文字またはビットであり得る。一部の実施形態では、データおよび/または情報は、任意の収集された、整理された、または使用可能なデータまたは情報であり得る。データおよび/または情報の非限定的な例としては、好適な媒体、画像、ビデオ、音(例えば、周波数、可聴のまたは非可聴の)、数、定数、値、オブジェクト、時間、関数、命令、マップ、参照、配列、リード、マッピングされたリード、レベル、範囲、閾値、シグナル、これらの表示、表現または変形が挙げられる。モジュールは、データおよび/または情報を受け入れ、または受信し、データおよび/または情報を二次形態に変換し、二次形態を機械、周辺機器、コンポーネントまたは別のモジュールに提供または転送することができる。マイクロプロセッサーは、ある特定の実施形態では、モジュールで命令を実行することができる。一部の実施形態では、1つまたは複数のマイクロプロセッサーは、モジュールまたはモジュール群で命令を実行するために必要とされる。モジュールは、データおよび/または情報を別のモジュール、機械または供給源に提供することができ、データおよび/または情報を別のモジュール、機械または供給源から受信することができる。
コンピュータプログラム製品は、有形コンピュータ可読媒体で実施されることもあり、非一過性コンピュータ可読媒体で明白に実施されることもある。モジュールは、コンピュータ可読媒体(例えば、ディスク、ドライブ)に記憶されていることもあり、またはメモリー(例えば、ランダムアクセスメモリー)に記憶されていることもある。モジュール、およびモジュールからの命令を実行することができるマイクロプロセッサーは、機械内または異なる機械内に位置することができる。モジュール、および/またはモジュールの命令を実行することができるマイクロプロセッサーは、ユーザーと同じ場所に位置することができ(例えば、ローカルネットワーク)、またはユーザーとは異なる場所に位置することができる(例えば、遠隔ネットワーク、クラウドシステム)。方法が2つまたはそれより多くのモジュールと連動して行われる実施形態では、モジュールは、同じ機械内に位置することができ、1つまたは複数のモジュールは、同じ物理的な場所の異なる機械内に位置することができ、1つまたは複数のモジュールは、異なる物理的な場所の異なる機械内に位置することができる。
機械は、一部の実施形態では、モジュールで命令を行うための少なくとも1つのマイクロプロセッサーを含む。配列リード定量化(例えば、カウント)は、本明細書に記載される方法を行うように構成された命令を実行するマイクロプロセッサーによりアクセスされることもある。マイクロプロセッサーによりアクセスされる配列リード定量化は、システムのメモリー内にあることができ、配列リードカウントにアクセスし、それらを得た後、それらをシステムのメモリーに入れることができる。一部の実施形態では、機械は、マイクロプロセッサー(例えば、1つまたは複数のマイクロプロセッサー)を含み、このマイクロプロセッサーは、モジュールからの1つまたは複数の命令(例えば、プロセス、ルーチンおよび/またはサブルーチン)を遂行および/または実行することができる。一部の実施形態では、機械は、複数のマイクロプロセッサー、例えば、連係しており、並行して働くマイクロプロセッサーを含む。一部の実施形態では、機械は、1つまたは複数の外部マイクロプロセッサー(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))で動作する。一部の実施形態では、機械は、モジュール(例えば、1つまたは複数のモジュール)を含む。モジュールを含む機械は、多くの場合、他のモジュールへ、および他のモジュールから、データおよび/または情報の1つまたは複数を受信および転送することができる。
ある特定の実施形態では、機械は、周辺機器および/またはコンポーネントを含む。ある特定の実施形態では、機械は、他のモジュール、周辺機器および/またはコンポーネントへ、ならびに他のモジュール、周辺機器および/またはコンポーネントから、データおよび/または情報を転送することができる、1つまたは複数の周辺機器またはコンポーネントを含むことができる。ある特定の実施形態では、機械は、データおよび/または情報を提供する周辺機器および/またはコンポーネントと交信する。ある特定の実施形態では、周辺機器およびコンポーネントは、機械による機能の実行またはモジュールとの直接交信を支援する。周辺機器および/またはコンポーネントの非限定的な例としては、スキャナー、プリンター、ディスプレイ(例えば、モニター、LED、LCTもしくはCRT)、カメラ、マイクロホン、パッド(例えば、ipad、タブレット)、タッチスクリーン、スマートフォン、携帯電話、USB I/Oデバイス、USB大容量記憶デバイス、キーボード、コンピュータマウス、デジタルペン、モデム、ハードドライブ、ジャンプドライブ、フラッシュドライブ、マイクロプロセッサー、サーバー、CD、DVD、グラフィックカード、専用I/Oデバイス(例えば、シーケンサー、光電池、光電子増倍チューブ、光学式読み取り装置、センサーなど)、1つまたは複数のフローセル、流体操作コンポーネント、ネットワークインターフェスコントローラー、ROM、RAM、ワイヤレス転送法およびデバイス(ブルートゥース(登録商標)、WiFiなど)、ワールドワイドウェブ(www)、インターネット、コンピュータおよび/または他のモジュールを含むがこれらに限定されない、好適なコンピュータ周辺機器、I/Oまたは記憶方法またはデバイスが挙げられる。
ソフトウェアは、コンピュータ可読媒体に記録されたプログラム命令を含むプログラム製品で提供されることが多く、コンピュータ可読媒体としては、フロッピー(登録商標)ディスク、ハードディスクおよび磁気テープを含む、磁気媒体;ならびにCD-ROMディスク、DVDディスクを含む、光媒体;光磁気ディスク、フラッシュメモリ-デバイス(例えば、フラッシュドライブ)、RAM、フロッピー(登録商標)ディスクなど、ならびにプログラム命令を記録することができる他のそのような媒体が挙げられるが、これらに限定されない。オンラインインプリメンテーションの場合、団体により維持されているサーバーおよびウェブサイトは、遠隔ユーザーにソフトウェアダウンロードを提供するように構成されていることがあり、または遠隔ユーザーは、団体により維持されている遠隔システムにアクセスして、ソフトウェアに遠隔アクセスすることができる。ソフトウェアは、入力情報を得るまたは受信することができる。ソフトウェアは、データを特異的に得るまたは受信するモジュール(例えば、配列リードデータおよび/またはマッピングされたリードデータを受信するデータ受信モジュール)を含むことができ、データを特異的に処理するモジュール(例えば、受信したデータを処理する(例えば、アウトカムおよび/またはレポートをフィルタリングする、正規化する、提供する)処理モジュール)を含むことができる。入力情報を「得ること」および「受信すること」という用語は、データ(例えば、配列リード、マッピングされたリード)を、ローカルもしくは遠隔サイトからコンピュータ通信手段により、人間によるデータ入力により、または任意の他のデータ受信方法により、受信することを指す。入力情報を、それを受信する場所と同じ場所で作成することができ、またはそれを異なる場所で作成し、受信場所に伝送することができる。一部の実施形態では、入力情報は、処理される前に修正される(例えば、処理に適用可能な形式にされる(例えば、表形式にされる))。
ソフトウェアは、ある特定の実施形態では、1つまたは複数のアルゴリズムを含むことができる。アルゴリズムは、命令の有限数列に従ってデータを処理するおよび/またはアウトカムもしくはレポートを提供するために、使用され得る。アルゴリズムは、多くの場合、タスクを完了するための定義済み命令のリストである。初期状態から開始して、命令は、定義された一連の連続状態を経て最終的に最終終了状態で終了する計算を記述することができる。ある状態から次の状態への移行は、必ずしも確定的ではない(例えば、一部のアルゴリズムは、乱数性を取り入れている)。例として、限定ではなく、アルゴリズムは、検索アルゴリズム、ソートアルゴリズム、マージアルゴリズム、数値アルゴリズム、グラフアルゴリズム、文字列アルゴリズム、モデリングアルゴリズム、計算幾何アルゴリズム、組合せアルゴリズム、機械学習アルゴリズム、暗号学アルゴリズム、データ圧縮アルゴリズム、構文解析アルゴリズムなどであり得る。アルゴリズムは、1つのアルゴリズム、または組合せで働く2つもしくはそれより多くのアルゴリズムを含み得る。アルゴリズムは、任意の好適な複雑性クラスおよび/またはパラメーター化された複雑性のものであり得る。アルゴリズムは、演算および/またはデータ処理に使用することができ、一部の実施形態では、決定論的または確率論的/予測アプローチで使用することができる。アルゴリズムを好適なプログラミング言語の使用によりコンピュータ環境で実行することができ、そのようなプログラミング言語の非限定的な例は、C、C++、Java(登録商標)、Perl、Python、Fortranなどである。一部の実施形態では、アルゴリズムを、許容誤差、統計解析、統計的有意性、および/または他の情報もしくはデータセットとの比較(例えば、ニューラルネットもしくはクラスタリングアルゴリズムを使用する場合に適用可能)を含むように、構成または修正することができる。
ある特定の実施形態では、いくつかのアルゴリズムをソフトウェアでの使用のために実装することができる。これらのアルゴリズムを、一部の実施形態では、生データで訓練することができる。新たな生データ試料ごとに、訓練されたアルゴリズムが、代表処理データセットまたはアウトカムを生成し得る。処理データセットは、処理された親データセットと比較して複雑性が低下したものであることもある。処理セットに基づいて訓練されたアルゴリズムの性能を、一部の実施形態では、感度および特異度に基づいて評定することができる。ある特定の実施形態では、感度および/または特異度が最も高いアルゴリズムを識別し、利用することができる。
ある特定の実施形態では、模擬(またはシミュレーション)データは、例えば、アルゴリズムを訓練することまたはアルゴリズムを検査することにより、データ処理を補助することができる。一部の実施形態では、模擬データは、配列リードの異なるグループ分けについての仮定的な様々な抽出試料を含む。模擬データは、現実の集団から予想され得るものに基づくこともあり、またはアルゴリズムを検査するおよび/もしくは正しい分類を割り当てるための偏ったものであることもある。模擬データは、本明細書では「仮想」データとも呼ばれる。ある特定の実施形態では、コンピュータプログラムによりシミュレーションを行うことができる。模擬データセットを使用する場合の可能性のある1つのステップは、識別された結果の信頼度、例えば、ランダム抽出試料が、どれ程、元データとよくマッチするか、または元データを最良に表すのかを、評価することである。1つのアプローチは、選択された試料より良好なスコアを有するランダム試料の確率を推定する、確率値(p値)を算出することである。一部の実施形態では、少なくとも1つの試料が参照試料と(分解変動の有無にかかわらず)マッチすることが仮定される、経験的モデルを評定することができる。一部の実施形態では、例えばポアソン分布などの、別の分布を使用して、確率分布を定義することができる。
システムは、ある特定の実施形態では、1つまたは複数のマイクロプロセッサーを含むことがある。マイクロプロセッサーを通信バスに接続することができる。コンピュータシステムは、メインメモリー、多くの場合、ランダムアクセスメモリー(RAM)を含むことがあり、二次メモリーを含むこともできる。一部の実施形態でのメモリーは、非一過性コンピュータ可読記憶媒体を含む。二次メモリーは、例えば、ハードディスクドライブおよび/またはリムーバブル記憶ドライブを含むことができ、リムーバブル記憶ドライブは、フロッピー(登録商標)ディスクドライブ、磁気テープドライブ、光ディスクドライブ、メモリーカードなどを意味する。リムーバブル記憶ドライブは、多くの場合、リムーバブル記憶ユニットから読み取る、および/またはリムーバブル記憶ユニットに書き込む。リムーバブル記憶ユニットの非限定的な例としては、例えば、リムーバブル記憶ドライブによって読み取られ得る、かつリムーバブル記憶ドライブに書き込まれ得る、フロッピー(登録商標)ディスク、磁気テープ、光ディスクなどが挙げられる。リムーバブル記憶ユニットは、コンピュータソフトウェアおよび/またはデータが内部に記憶されているコンピュータ使用可能記憶媒体を含むことができる。
マイクロプロセッサーは、システム内のソフトウェアを実行することができる。一部の実施形態では、マイクロプロセッサーを、ユーザーが行うことができる本明細書に記載されるタスクを自動的に遂行するようにプログラムすることができる。したがって、マイクロプロセッサー、またはそのようなマイクロプロセッサーにより実行されるアルゴリズムは、ユーザーによる監視も入力も殆どないしは全く必要とするはずがない(例えば、ソフトウェアを、自動的に機能を実行するようにプログラムすることができる)。一部の実施形態では、プロセスの複雑性が非常に高いので、1名の人物、または人物群が、試料の1つまたは複数の特性を判定するのに十分短い時間枠ではプロセスを遂行することができない。
一部の実施形態では、二次メモリーは、コンピュータシステムへのコンピュータプログラムまたは他の命令のローディングを可能にするための他の同様の手段を含むことがある。例えば、システムは、リムーバブル記憶ユニットおよびインターフェースデバイスを含むことができる。そのようなシステムの非限定的な例としては、プログラムカートリッジおよびカートリッジインターフェース(例えば、ビデオゲームデバイスに見られるもの)、リムーバブルメモリーチップ(例えば、EPROMまたはPROM)および付随するソケット、ならびにソフトウェアおよびでデータをリムーバブル記憶ユニットからコンピュータシステムに転送することを可能にする他のリムーバブル記憶ユニットおよびインターフェースが、挙げられる。
核酸を解析するための方法
核酸を解析するための方法が、本明細書で提供される。
核酸の純度および/または品質を評定するための方法が、本明細書で提供される。本明細書に記載される一本鎖ライブラリー調製方法を使用して、核酸の純度および/または品質を評定することができる。
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製方法を使用して、一本鎖核酸(ssNA)の純度および/または品質を評定することができる。ssNAは、単一ssNA種(例えば、同じ配列および長さを有するssNA)を含むこともあり、またはssNA種のプール(例えば、異なる配列および/または長さを有するssNA)を含むこともある。一部の実施形態では、ssNAは、一本鎖オリゴヌクレオチドを含む。一部の実施形態では、一本鎖オリゴヌクレオチドは、商業生産される。一部の実施形態では、一本鎖オリゴヌクレオチドは、ユーザーにより生成される。一部の実施形態では、ssNAは、一本鎖プローブを含む。一部の実施形態では、一本鎖プローブは、商業生産される。一部の実施形態では、一本鎖プローブは、ユーザーにより生成される。
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製方法を使用して、一本鎖リボ核酸(ssRNA)の純度および/または品質を評定することができる。ssRNAは、単一ssRNA種(例えば、同じ配列および長さを有するssRNA)を含むこともあり、またはssRNA種のプール(例えば、異なる配列および/または長さを有するssRNA)を含むこともある。一部の実施形態では、ssRNAは、一本鎖RNAオリゴヌクレオチドを含む。一部の実施形態では、一本鎖RNAオリゴヌクレオチドは、商業生産される。一部の実施形態では、一本鎖RNAオリゴヌクレオチドは、ユーザーにより生成される。一部の実施形態では、ssRNAは、一本鎖RNAプローブを含む。一部の実施形態では、一本鎖RNAプローブは、商業生産される。一部の実施形態では、一本鎖RNAプローブは、ユーザーにより生成される。
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製方法を使用して、一本鎖相補デオキシリボ核酸(sscDNA)の純度および/または品質を評定することができる。sscDNAは、単一sscDNA種(例えば、同じ配列および長さを有するsscDNA)を含むこともあり、またはsscDNA種のプール(例えば、異なる配列および/または長さを有するsscDNA)を含むこともある。一部の実施形態では、sscDNAは、一本鎖cDNAオリゴヌクレオチドを含む。一部の実施形態では、一本鎖cDNAオリゴヌクレオチドは、商業生産される。一部の実施形態では、一本鎖cDNAオリゴヌクレオチドは、ユーザーにより生成される。一部の実施形態では、sscDNAは、一本鎖cDNAプローブを含む。一部の実施形態では、一本鎖cDNAプローブは、商業生産される。一部の実施形態では、一本鎖cDNAプローブは、ユーザーにより生成される。
ssNA、ssRNAおよび/またはsscDNAの純度および/または品質を、断片長の評定に従って評定することができる。断片長を決定するための任意の好適な方法を使用して、断片長を決定することができる。一部の実施形態では、断片長は、シングルエンドシーケンシングリードの長さ(例えば、このリード長は、断片全体の長さをカバーする)に従って決定される。一部の実施形態では、断片長は、ペアエンドシーケンシングリードのマッピングされた部分に従って決定される。一部の実施形態では、ssNA、ssRNAおよび/またはsscDNAの純度および/または品質は、断片長プロファイルに従って評定される。断片長プロファイルは、特定の長さを有する断片の定量化を含み得る。断片長プロファイルの例は、図31に提供される。一部の実施形態では、ssNA、ssRNAおよび/またはsscDNAの純度および/または品質は、断片長プロファイルにおける主要なssNA、ssRNAおよび/またはsscDNA種の量ならびに副次的なssNA、ssRNAおよび/またはsscDNA種の量に従って評定される。主要な種は、一般に、試料中の最も存在量が多い断片長を指す。主要な種は、評定されることになるssNA、ssRNAおよび/またはsscDNAの所期または予想断片長を指すこともある。例えば、正確に50ヌクレオチドを含むように設計されたオリゴヌクレオチドについて、そのオリゴヌクレオチドの純度および/または品質の評定により、50ヌクレオチドという主要な種の長さが得られることがある。副次的な種は、一般に、主要な種ではない残りの断片長を指す。副次的な種は、評定されることになるssNA、ssRNAおよび/またはsscDNAの意図せぬまたは予想外の断片長を指す。例えば、正確に50ヌクレオチドを含むように設計されたオリゴヌクレオチドについての、そのオリゴヌクレオチドの純度および/または品質の評定により、50ヌクレオチドを超える、および/または50ヌクレオチド未満の、しかし正確に50ヌクレオチドではない長さを有する、副次的な種が得られることもある。ssNA、ssRNAおよび/またはsscDNAの純度および/または品質を、比またはパーセンテージとして表すことができる。例えば、試料中のオリゴヌクレオチドの90%が主要な種の断片長のものであり、試料中のオリゴヌクレオチドの(集合的に)10%が副次的な種の断片長のものであった場合、オリゴヌクレオチドを主要な種について純度90%と見なすことができる。
試料中のニックの入ったDNAの量を推定または測定することができる。例えば、シーケンシングライブラリーをニック修復の前および後に試料から調製することができる。2つのライブラリーについてのシーケンシング結果を比較することができ、ニックの入ったDNAの量を推定または測定することができる。ニックの入ったDNAは、例えば、アポトーシスを遂げ、その後、血流中にある細胞内のゲノムDNAに対するエンドおよびエキソヌクレアーゼ活性に起因して生成される、cfDNAであり得る。初期ヌクレアーゼ活性は、ヌクレオソーム間のエンドヌクレアーゼ活性、またはヌクレオソームに対するDNaseIのニッキング活性を含み得る。ニッキングされやすい核酸領域を理解することにより、ヌクレオソーム占有率の情報を得ることができる。ニックの入ったDNAの他の供給源としては、FFPE試料、毛髪、分解された試料、およびニッカーゼ酵素のin vitro試験が挙げられるが、これらに限定されない。一本鎖ライブラリー調製方法、例えば本開示のものは、ニックの入った断片を捕捉することができる。加えて、本開示の方法は、ニッキングから生じた末端を保持する。ニックの入った分子を直接用いて本開示の方法を行なうと、異なる長さの3本の鎖-1つの長いおよび2つのより短い分子-が生成されることになる(例えば、図53B)。ニックシーリング酵素(例えば、HiFi Taqリガーゼ)での処理は、ニックの入った2本の鎖をライゲーションすることになり、その後、これらのシールされたdsDNAを用いて本開示の方法を行なうことにより、ニックで生じる末端の可視性がなくても同様の長さの2本の鎖が得られることになる(例えば、図53A)。2つのライブラリーから得られる配列(および断片末端)の比較は、ニックがシールされたライブラリーでのほうが、短い断片が少なく、ニックの入った領域に隣接する配列を有するリードが少ないことを示すであろう。
ある例では、5’GAGTCNNNN^N3’でニックを生成するN.BstNBIを使用して、gDNAに既知ニックを生じさせた。ニックの入ったgDNA試料の一部分は、HiFi Taqリガーゼでニックをシールし、一部分はしなかった。両方を用いて本明細書での論述の通り一本鎖ライブラリー調製を行い、ライブラリーをシーケンシングし、比較した。全くニックが入っていない対照gDNAは、配列リードの0.07%がGAGTCNNNNで終わることを示し、シールされなかったニックの入ったDNAは、配列リードの15.74%がGAGTCNNNNで終わることを示し、ニックが入り、ニックがシールされたDNAは、配列リードの10.67%が、GAGTCNNNNで終わることを示した。
核酸(例えば、アプタマー、siRNA、オリゴヌクレオチドプローブ)のプールを、核酸が、それらの特性に影響を与え得るプライマー結合部位などの隣接領域を含む必要なく、シーケンシングすることができる。本開示の一本鎖ライブラリー調製方法によって、所与の目的のための核酸のプールを生成し、所望の特性についての1または複数ラウンドの選択に付し、シーケンシングすることができる。例えば、アプタマーまたはsiRNAのランダムプールを生成し、1または複数ラウンドの正および/または負の選択(例えば、所望の標的への結合についての正の選択、オフターゲット結合についての負の選択)に付すことができ、成功した候補を、ランダムアプタマーまたはsiRNAがシーケンシングのために隣接領域を含む必要なく、本開示の方法によってシーケンシングすることができる。そのような隣接領域の存在は、アプタマーまたはsiRNA性能に影響を及ぼす可能性がある。
ある例では、化学合成または合成されたDNAからの転写によって核酸のランダムプール(例えば、合成される(例えば、アプタマー、siRNA、オリゴヌクレオチドプローブ)。次いで、ランダムプールは、1もしくは複数ラウンドの正の選択および/または1もしくは複数ラウンドの負の選択に付される。正の選択は、次第にストリンジェントになる結合条件下での所望の結合標的とのインキュベーションを含み得る。負の選択は、次第に有利になる結合条件下でのオフターゲット結合基質とのインキュベーションを含み得る。結合条件としては、温度、塩濃度、pH、磁場、クラウディング剤、競合結合剤、阻害剤、および他の条件を挙げることができるが、これらに限定されない。プールおよびその変化についてのバイオインフォマティック解析のために、本開示の方法によるシーケンシングを、選択の前に、選択ラウンド間に、および/または選択が完了した後に行なうことができる。UMIまたは他のバーコードを使用して、プール内の核酸種の相対量の数値もしくは絶対カウントを得ることができる。例えば、各々の結合されたプールを用いてシーケンシングを行なって、結合された配列プールが異なる選択ストリンジェンシーに伴ってどのように変化するのかを別々にモニターしながら、所望の結合標的の存在下で、正の選択をnラウンド行うことができる。核酸配列の異なるクラスターを、異なる選択ラウンド中に見つけることができる。一部の事例では、各々の正の選択ラウンドからの結合された核酸は、核酸配列の異なるクラスターを異なる選択ラウンド中に見つけることができるので、結合された核酸プールが異なる選択ストリンジェンシーに伴ってどのように変化するのかを別々にモニターするために残りの選択およびライブラリー調製プロセスを経ることもある。
キット
ある特定の実施形態では、キットが提供される。キットは、本明細書に記載される方法のいずれかを行なうために有用な、本明細書に記載される任意の成分および組成物(例えば、足場アダプターおよびそれらの成分/小成分、オリゴヌクレオチド、オリゴヌクレオチド成分/領域、足場ポリヌクレオチド、足場ポリヌクレオチド成分/領域、核酸、一本鎖核酸、プライマー、一本鎖結合タンパク質、酵素)を、任意の好適な組合せで含むことができる。キットは、本明細書に記載される方法のいずれかを行うのに有用な任意の試薬、緩衝剤または他の成分をさらに含むことができる。例えば、キットは、複数の足場アダプター種もしくは複数の足場ポリヌクレオチド種および対応するオリゴヌクレオチド成分、核酸を5’リン酸化するように構成されたキナーゼ(例えば、ポリヌクレオチドキナーゼ(PNK))、DNAリガーゼ、ならびにこれらの任意の組合せのうちの1つまたは複数を含むことができる。
キットは、一本鎖DNAおよび/または一本鎖RNAを捕捉するための成分を含むことができる。一本鎖DNAを捕捉するためのキットを、ユーザーが二本鎖または一本鎖DNAを生じさせるように構成することができる。一本鎖RNAを捕捉するためのキットを、ユーザーがcDNA(一本鎖もしくは二本鎖のどちらか)を生じさせるように、またはRNA(例えば、全RNAもしくはrRNA枯渇RNA)を生じさせるように構成することができる。一本鎖RNAを捕捉するためのキットは、rRNA枯渇試薬、mRNA濃縮試薬、断片化試薬、cDNA合成試薬、および/またはRNA消化試薬を含むことができる。
キットの成分は、別々の容器内に存在することもあり、または複数の成分が、単一の容器内に存在することもある。好適な容器としては、単一のチューブ(例えば、バイアル)、プレート(例えば、96ウェルプレート、384ウェルプレートなど)の1つまたは複数ウェルなどが挙げられる。
キットは、本明細書に記載される1つもしくは複数の方法を行うための使用説明書、および/または本明細書に記載される1つもしくは複数の成分の説明書きも含むことがある。例えば、キットは、一本鎖核酸断片を捕捉するために、および/または核酸ライブラリーを生成するために、本明細書に記載される骨格アダプターまたはその成分を使用するための使用説明書を含むことがある。使用説明書および/または説明書きは、印刷された形態であることもあり、キット添付文書に含まれることもある。一部の実施形態では、使用説明書および/または説明書きは、好適なコンピュータ可読記憶媒体、例えば、携帯フラッシュドライブ、DVD、CD-ROM、ディスケットなど、に存在する電子記憶データファイルとして提供される。キットは、そのような使用説明書または説明書きを提供するインターネットの場所についての書面での説明書きを含むこともある。
下記の実施例は、ある特定の実施形態を説明するものであり、本技術を限定するものではない。
(実施例1)
無細胞DNA(cfDNA)の一本鎖特異的ライブラリー調製
この実施例では、一本鎖DNA(ssDNA)ライブラリー調製方法およびその改良を説明する。下で説明するssDNAライブラリー調製方法は、アダプターライゲーションの前にすべてのDNA一本鎖を作製することにより二本鎖(dsDNA)およびssDNA分子両方を捕捉する。
基本プロトコール
1)DNAを熱安定性一本鎖DNA結合タンパク質(SSB)の存在下で3分間、95℃に加熱することによりssDNAを作出して維持し、次いで、氷を用いてチューブを急速冷却する。
2)足場アダプターの適切な希釈物を調製し、a)6×過剰のP5およびP7足場アダプター両方の組合せとb)リン酸化/ライゲーションマスターミックスとを添加して、80μlの反応体積中、最終濃度18.5%PEG 8000、最終1mMのATP、最終11mMのDTT、最終10mMのMgCl、50mMのTris-HCl pH7.5、2,000単位のT4 DNAリガーゼ、および10単位のPNKを得る。
3)1時間、37℃でインキュベートする。
4)Qiagen MINELUTE PCR Purification Kitを使用してカラム精製クリーンを行なう。
5)インデックスPCRを行なう。
基本プロトコールの改良および改善
上記の基本プロトコールの様々な改良を下で説明する。ある特定の改良は、例えば、より良好なライブラリー品質、収量の増加、より速いライブラリー生成、より少ない用量またはより低用量の試薬、より少ないステップおよびこれらに類するものなどの、プロトコールの改善をもたらした。
リガーゼ
800単位~2000単位のT4 DNAリガーゼ投入量を試験した。結果は、2000単位と同様の結果を生じさせるために800単位で十分過ぎるほどであることを示した。
インキュベーション時間
様々なインキュベーション時間を試験した。試験した反応時間は、5分~60分であった。
適切なライブラリーが、5分ほども短いインキュベーション時間で生成された。インキュベーション時間を60分に増加させるとDNA収量が増加したが、30分から60分への増加は、ごく軽度であった。
ssDNAアダプターライゲーション/リン酸化反応後の精製
種々の精製方法を試験した。結果は、精製方法が重要でないことを示した。固相可逆的固定法(SPRI)磁気ビーズ精製は、カラム精製と同様の効果を発揮した。複数のSPRIビーズ製造業者を試験し、すべてが良好な効果を発揮した。精製ステップなしでライゲーション/リン酸化反応から直接インデックスPCRに進むことも試験した。精製なしの方法は効果を発揮したが、インデックスPCR後に、より低い収率およびより問題のあるDNAサイズプロファイルを生じさせた。
ssDNAの維持
この方法は、一本鎖結合タンパク質(SSB)を用いておよび用いずに行なった。結果は、オリゴプールなどの複雑度の低い混合物の場合でさえ、SSBがプロトコールに必要でないことを示した。結果は、SSBの非存在下であっても、DNAが熱変成および急速冷却後に十分一本鎖状態を維持することを示した。SSB滴定および様々な供給業者からのSSBを試験し、試験したいずれの条件もSSBなし対照との間に差は認められなかった。解析したパラメーターは、アダプターダイマー%、DNAライブラリー収量、30~130塩基対(bp)間の断片%、マッピング率%、重複率%、リードパスフィルター%、パスフィルターリードのマッピング率、およびライブラリー産物サイズ分布を含んだ。SSBのSSBなしに対する試験結果を図2A、2B、3Aおよび3Bに示す。
足場アダプター:基質DNA比
様々な足場アダプターの基質DNAに対する比を試験した。結果は、足場アダプターの基質DNAに対する理想的な比がおよそ30×であることを示した。結果は、基本プロトコールでの6×比が低すぎることも示した。
足場アダプター修飾
ssDNAライゲーション/リン酸化反応を行なう前のホスファターゼでの足場アダプターの前処理は、結果を改善し、収量を増加させ、アダプターダイマーを減少させた。これらの改善を図4に示す。
足場アダプターの末端に対する様々なライゲーション/伸長遮断修飾も試験した。試験したすべての修飾は、同等の効果を発揮した。
ライゲーション/リン酸化マスターミックス
アダプターライゲーション/リン酸化反応の成分を事前に作製し、使用しやすいように一緒に保管した。マスターミックスは、tris緩衝液pH8、DTT、MgCl、ATP、PEG 8000、T4 DNAリガーゼ、およびT4 PNKを含んだ。
リン酸化
ライゲーション/リン酸化反応のリン酸化(例えば、PNK)部分は、品質ライブラリーの生成には必要でなかった。PNKをプロトコールから完全に削除するかまたはライゲーションステップの上流に配置し、品質ライブラリーをどちらかの方法で生成した。また、PNKをライゲーションステップの上流に含めるのであれば、またはPNKがライゲーションステップと同時に存在することになるのであれば、基質DNAを脱リン酸化することができる。
インデックスPCR
様々な高忠実度熱安定性ポリメラーゼを用いて品質ライブラリーを生成した。最終0.2μM~4μMの間の範囲のプライマー濃度を用いて品質ライブラリーを生成した。1μMを最終プライマー濃度として選択した。
PCR不使用のssDNAライブラリー
シーケンサー互換性に必要なすべての必須DNA配列を含有する足場アダプター(「完全長アダプター」と呼ぶ)を合成すれば、インデックスPCRを用いずに品質ライブラリーを構築することができるだろう。図5Aおよび5Bを参照されたい。図5Aでは、足場アダプターの足場ポリヌクレオチド(下の鎖)およびオリゴヌクレオチド(上の鎖)各々が、フローセル結合領域を含む。図5Bでは、足場アダプターのオリゴヌクレオチド(上の鎖)はフローセル結合領域を含み、足場アダプターの足場ポリヌクレオチド(下の鎖)は、フローセル結合領域を含まない。
PEG濃度
ライゲーション/リン酸化反応中に0~30%の最終PEG 8000濃度を試験し、結果は、18.5%が含めるのに理想的な量であることを示した。
アダプターダイマーの低減
上で説明した一本鎖DNAプロトコールに関する1つの問題は、このプロトコールがアダプターダイマーの高いパーセントを生じさせ得ることであり、この原因は、足場アダプターの構造にある可能性が最も高い。アダプターダイマー形成に対抗するために、いくつかの異なる技法を開発し、試験したが、これらの成功レベルにはばらつきがあった。1つの技法は、ssDNAライゲーション/リン酸化反応を行なう前にホスファターゼで足場アダプターを前処理すること(上で説明した)であった。別の技法は、ライゲーション/リン酸化反応の定量滴定を行なうこと(下で説明する)であった。試験した他の技法を下で説明する。
インデックスPCR後のSPRI(例えば、18%PEG 8000)滴定、ならびに連続的および逐次的SPRIクリーンを行なった。例えば、連続して行なった2回またはそれより多くの連続的1.2×SPRIは、アダプターダイマー%を低下させ、ライブラリーのアダプターダイマーに対する相対量を増加させた。図18は、4回の連続的1.2×SPRIクリーンの各々の後のダイマーの低減を実証するゲル画像および表を示す。配列データに対する連続的SPRIの効果は、アダプターアーチファクトに起因して廃棄されるリードの数を低減させることによって、使用可能なデータの量を増加させ、ヒトゲノムへのマッピング能力を増大させた。最小断片長カテゴリー(すなわち、<100bp)のわずかな減少があった。試料を0.6×SPRIビーズとともに数分間インキュベートすること、その後、0.6×ビーズを1.2×SPRIの最終量までもう一度添加することを含む、逐次的SPRIも、ダイマーを低減させ、目的のライブラリーサイズを増加させた。図19は、cfDNAに関する逐次的SPRIのゲルおよびAgilent Tapestationトレースを示し、このトレースは、アダプターダイマーサイズの分子に対するライブラリーサイズの分子の不均衡な回収率を示す。
別のアプローチは、ダイマーを、インデックスPCR前にそれらのダイマーに相補的なオリゴと併せて差別的に消化し、インデックスPCR後に相補的オリゴとともにまたはなしで差別的に消化する選択的制限酵素の使用を用いるアプローチである。この実施例では、推定アダプターダイマーにのみ相補的である短いオリゴを添加し、インキュベートし、ハイブリダイゼーションおよびライゲーション後、二本鎖DNA断片が形成されることになり、その後、ヌクレアーゼXbaIを添加し、このヌクレアーゼによって、二本鎖アダプターダイマーDNA中に存在するTCTAGA認識部位が切断される。図20は、推定アダプターダイマー形成、一本鎖形態のアダプターダイマー(またはオリゴダイマー)、および一本鎖ダイマーにのみアニールするオリゴの付加の例を示す。この実施例では、二本鎖ハイブリダイゼーション産物が作出されたときにXbaI認識部位が形成した。PCR中に、アダプターダイマーは二本鎖状になる。この理由から、XbaI処理を上記オリゴなしでPCR後に行なうことができる。アダプターダイマーの低減は、オリゴがあってもなくてもXbaIの使用後に見られるが、このアプローチの1つのリスクまたは妥協点は、目的のゲノムDNA中のXbaI部位の枯渇である。XbaI処理前に試料を変性させ、リアニールすることにより、XbaI部位の保持を増すことができる。ゲノムDNAの高度な複雑性は、目的のgDNAのリアニーリングを妨げる可能性があり、その一方で、アダプターダイマーの低い複雑性は、より高速のリアニーリングを生じさせ、ヌクレアーゼによる標的化のためにアダプターダイマーを成熟させる可能性がある。
ある特定の構成では、足場アダプターの構造を、ヘアピンを形成するように修飾して(図8を参照されたい)またはホスホロチオエート結合を付加させることにより修飾して、足場アダプターの剛性を増大させ、ヌクレアーゼ分解の防止を助長した。
ライゲーション/リン酸化反応体積
ライゲーション/リン酸化反応について定量滴定を行なった。結果は、全反応体積を低下させると、収量が増加され、アダプターダイマー形成が抑制されることを示した。理論により制限されるものではないが、これは、18.5%PEGの存在下での単位体積当たりのアダプター/足場分子に対するDNA分子末端の比の結果である可能性がある。最良の挿入物分布および最小のアダプターダイマー形成を伴う、cfDNAから最高品質ライブラリーを生成する比は、基質DNA末端が、18.5%PEG 8000の存在下で0.4フェムトモル毎マイクロリットル(fmol/μl)であり、各足場アダプターが10fmol/μlであるときに存在した。この比を任意の体積で達成することができ、必要に応じて体積または投入DNA質量を増加させることにより制約を克服することができる。この比は、多くの異なる方法および単位で表すことができる。例えば、1つのプロトコールは、25μlの最終反応体積、1ngの無細胞DNA投入量、および1.6ピコモルの各足場アダプターの添加を含む。
投入(基質)DNA滴定
5ng~100pgの投入DNA量を試験した。ライブラリーをすべての投入量から作製したが、250pg未満では品質が低下した。
ライゲーション/リン酸化反応温度
16℃~37℃の反応温度を試験した。最良の温度は37℃であり、温度が低下するにつれて、DNA収量が減少し、アダプターダイマー%がより高くなった。
固有分子識別子(UMI)
UMIポリヌクレオチドを含むように足場アダプターを修飾した。UMIを足場アダプターに組み込むために少数の構成を設計した。例えば、UMIを、Nまたはイノシンをランダム塩基として使用して挿入物に直接隣接する短いアダプターで付加させたか、または完全長アダプター内のインデックス付加バーコードの隣に配置した(図6Aまたは6Bを参照されたい)。図6Bに示す構成では、完全長P5およびP7アダプターが反応中にライゲーションされる。UMIは、ユニバーサル塩基、ランダム塩基、または既知の塩基を含み得る。UMIは、長さ1、2、3、4、5、6、7、8、9、10塩基であり得、またはそれより長いこともある。ある特定の構成では、PCR増幅中に短いP5/P7をライゲーションしてアダプターを完全長にした。P7アダプター内のインデックスの隣にランダムN塩基のUMIを配置する方法が、良好な効果を発揮した。
インデックスPCRの前に、単一プライマー伸長方法および鎖置換ポリメラーゼ、例えばBstポリメラーゼを使用して、UMIポリヌクレオチドを一本鎖ライゲーション産物またはライブラリーに組み込むことができる。プライマーは各々、ssNAの3’に位置する足場アダプターの一部分にアニールし、そこからプライミングする配列と、UMIポリヌクレオチドとを含有することができる。一部の事例では、プライマーは、シーケンシングインデックスまたはバーコード配列およびフローセル結合部位も含む(図7を参照されたい)。プライマーは、5’末端に遮断する修飾を含むこともあり、または含まないこともある。ワークフローの一例では、ssNA-足場アダプターライゲーション産物を変性させて、足場ポリヌクレオチドを放出させ、その結果、一本鎖ライゲーション産物(足場アダプターのオリゴヌクレオチド成分にライゲーションしたssNA)を得ることができる。遊離足場ポリヌクレオチドおよび一本鎖ライゲーション産物は各々、遮断する修飾を有するため、伸長され得ない。UMIまたはインデックス含有プライマーを鎖置換ポリメラーゼで伸長して(ssNAライゲーション産物が鋳型としての役割を果たす)、分子のP7側にのみ完全なライブラリー鎖を作出することができる。伸長後、SPRI精製を行なうことができる。インデックスが付加された完全なライブラリー分子を完成するために、IS4または他のバージョンのP5インデックスプライマーと、フローセル結合部位に相補的なプライマーとを使用して、PCRを行なうことができる(図7を参照されたい)。ワークフローの一変形形態では、変性中にssNAライゲーション産物から放出される、デオキシウリジン切断部位を有する過剰な足場ポリヌクレオチドを、DNA-ウラシルグリコシラーゼで分解して、それらがアニーリングするのを防止する。
ヘアピンアダプター
アダプターダイマーの形成を低減させるために、足場アダプターのヘアピン構造を設計した(図8を参照されたい)。ヘアピンアダプターを使用する方法は効果を発揮したが、元のアダプター設計ほどは良好に機能しない。
代替的アダプター設計
図9、10および11は、代替的な操作順序、酵素もしくは他の試薬の添加遅延、末端DNA修飾、および/または他のリガーゼタイプを含む、足場アダプターへの修飾を記載する。
1つのアダプター構成およびワークフローは、段階的なライゲーション、および酵素遅延を含む(図9)。非リン酸化または脱リン酸化P5およびP7足場アダプターを一本鎖DNA鋳型と結合させる。PNKを含まないライゲーションマスターミックスをアダプター/鋳型結合体に添加し、室温で5分間インキュベートする。P5アダプターが、5’リン酸を有するDNA鋳型にライゲーションする。P5ライゲーション後、PNKを反応物に添加し、温度を37℃にする。P7アダプターがPNKによりリン酸化され、P7アダプターの5’リン酸化末端が、DNA鋳型の3’末端にライゲーションする。このワークフローを行ない、ダイマーを半減させ、収量をSOPと比較しておおよそ倍増させた。このワークフローの1つの変形形態は、P5アダプターがDNA鋳型にライゲーションし終えるまでP7アダプターの添加を遅延させること、またはP7アダプターがDNA鋳型にライゲーションし終えるまでP5アダプターの添加を遅延させることを含む。このワークフローの1つの変形形態は、リン酸化P7を最初に添加するが、P5およびPNKの添加を20分遅延させることを含む。このワークフローも行ない、ダイマーを半減させ、収量をSOPと比較しておおよそ倍増させた。
別のアダプター構成およびワークフローは、段階的なライゲーション、5’App P7アダプター、およびATP遅延を含む(図10)。5’App P7足場アダプターを一本鎖DNA鋳型と結合させる。ATPを含まないライゲーションマスターミックスをアダプター/鋳型結合体に添加し、室温で5分間インキュベートする。P7アダプターの5’App末端が、ATPなしでDNA鋳型の3’末端にライゲーションする。P7ライゲーション後、非リン酸化または脱リン酸化P5足場アダプターおよびATPを反応物に添加する。P5アダプターが、5’リン酸を有するDNA鋳型にライゲーションする。
別のアダプター構成およびワークフローは、段階的なライゲーション、および3’リン酸を有する一本鎖P5アダプターを含む(図11)。鋳型DNAを脱リン酸化し、3’リン酸を有する一本鎖P5アダプターと結合させる。DNA3’リン酸末端を5’OH末端にライゲーションすることができ、かつ好んで一本鎖をライゲーションする、リガーゼ(例えば、RtcB)を、アダプター/鋳型結合体に添加する。P5アダプターの3’リン酸末端が、DNA鋳型の5’OH末端にライゲーションする。次いで、5’リン酸化P7足場アダプターおよびT4 DNAリガーゼを反応物に添加し、P7アダプターの5’リン酸化末端が、DNA鋳型の3’末端にライゲーションする。このワークフローの1つの変形形態は、5’リン酸化P7足場アダプターとDNA鋳型を結合させることを含み、この場合は一本鎖P5アダプターを添加する。
(実施例2)
RNAの一本鎖特異的ライブラリー調製
実施例1で説明した一本鎖DNAライブラリー調製方法を、RNA分子のシーケンシングライブラリーへの変換用に改良した。1つの構成では、rRNAが枯渇されたまたはmRNAが濃縮された全RNAから生成される第1鎖DNA合成産物を、本明細書に記載する一本鎖DNAライブラリー調製方法に組み込む。別の構成では、rRNAが枯渇されたまたはmRNAが濃縮された全RNAを、本明細書に記載する一本鎖DNAライブラリー調製方法に直接組込み、その後、第1鎖DNA合成を行なう。より少ない酵素的ステップ、時間の節約および試薬の節約に加えて、RNAへの一本鎖DNAライブラリー調製方法の応用には、既存の技術を超えるいくつかの生物学的利益もある。例えば、本明細書に記載する技術の一本鎖性のため、第2鎖合成を完全に省くことができる。得られたRNAシーケンシングライブラリーは、鎖RNAシーケンシングライブラリーを生成することができ、その結果、転写物マッピングがより正確になる。
1つの構成の一般的ワークフローを図15に示し、このワークフローは以下を含む。rRNA枯渇キットまたはmRNA濃縮キットによって全RNAを抽出し、全RNAがそのキットの過程を経る。次いで、RNAを断片化し、ランダムプライマーおよび逆転写酵素を使用して第1鎖合成cDNAを作出する。RNaseH消化を行なって、RNA-DNAハイブリッドからRNAを確実に除去する。少し改良を加えた一本鎖DNAライブラリー調製キットに第1鎖cDNAを供給する。多くの場合、cDNAを変性させて二次構造を除去する。一本鎖結合タンパク質を含めてもよいが、一般にはその必要はない。本明細書に記載する足場アダプターをPNKの存在下で第1鎖cDNAにライゲーションして、DNA末端をリン酸化する。リン酸化以外に、ネイティブ末端に変更を加えない。ライゲーション産物をクリーンアップおよび精製に付し、その後、PCR(例えば、インデックスPCR)により増幅させる。次いで、増幅産物をクリーンアップおよび精製に付す。
上で説明したワークフローの具体的な例では、rRNA枯渇キットまたはmRNA濃縮キットによって全RNAを抽出し、全RNAがそのキットの過程を経る。次いで、RNAを断片化し、熱変性させ(94℃、15分間)、ランダムヘキサマー/ランダムオクタマー/ポリTプライマーまたは市販ランダムプライマー、およびM-MLV逆転写酵素を使用して、第1鎖合成cDNAを作出する。RNaseH消化を行なって(37℃で30分間)、RNA-DNAハイブリッドからRNAを確実に除去する。cDNAを熱変性させて二次構造を除去し、次いで急速冷却する。本明細書に記載する足場アダプターをPNKの存在下で第1鎖cDNAにライゲーションして、DNA末端をリン酸化する。ライゲーション産物をクリーンアップおよび精製に付し、その後、インデックスPCRにより増幅させる。この方法を行ない、ライブラリーの構築に成功した。ライブラリーの解析結果を図12、13および14で提供する。
上記プロトコールは、1つまたは複数の変形形態を含み得る。例えば、足場アダプターを、rRNA枯渇(またはmRNA濃縮)およびRNA断片化後に、RNAに直接ライゲーションすることができる。その場合、第1鎖合成は、一本鎖アダプター特異的プライマーを使用することができる。この代替的プロトコールも、第2鎖合成をなくすが、cDNA作出の上流に追加のRNA処理(断片化)を必要とする(図16のワークフローを参照されたい)。この方法の1つの変形形態を行い、ライブラリーの構築に成功した(図50に示すワークフローを参照されたい)。このワークフローでは、全RNA投入量が、mRNA濃縮および/またはrRNA枯渇を経、RNAをせん断し(例えば、BIORUPTORまたは他の断片化方法)、RNA断片を、本明細書に記載するDNA足場アダプターにライゲーションし、SPRI精製し、逆転写酵素とPCR増幅を組み合わせたステップを行なう。この組み合わせたステップにおいて、DNA/RNAハイブリッドライゲーション産物を逆転写酵素(例えば、M-MLV逆転写酵素)によりcDNAに変換し、cDNA分子をPCR(例えば、NEBのONETAQ One-Step RT-PCR、およびssPrep Illumina互換性アダプターからプライミングするPCRプラマーを使用する)により増幅する。
この実施例で説明するプロトコールの他の変形形態は、1)mRNA濃縮、断片化およびcDNA合成が、ランダムプライマーカクテル中のリボソームRNA結合オリゴを除去することにより1ステップで行なわれる、rRNA枯渇(mRNA濃縮)を用いるまたは用いない方法を行なうこと;2)RNA断片化を用いるまたは用いない方法を行なうこと(例えば、Illumina以外のシーケンサーを使用する場合);3)RNaseH消化を用いるまたは用いない方法を行なうこと;4)一本鎖DNA結合タンパク質を用いるまたは用いない方法を行なうこと;5)rSAP処理アダプターまたは非rSAP処理アダプターを使用する方法を行なうこと;6)PNK処理が切り離され、上流に配置されるかまたはされない、方法を行なうこと;7)PCRの前に任意のタイプのクリーンアップを使用するかまたはクリーンアップを用いない方法を行なうこと;および8)様々なRNA投入量を用いる方法を行なうことを含み得る。他の変形形態は、ワークフロー内のある特定のステップを組み合わせることを含む。例えば、図17は、ワークフロー内のある特定のステップを組み合わせる、修飾形態A、BおよびCを示す。図50は、RNA/DNAハイブリッドライゲーション産物の逆転写とcDNA産物の増幅とが単一のステップに組み合わされた、例示的なワークフローを示す。
(実施例3)
定方向RNA-Seqライブラリー調製NGSアッセイ(RNAのssPrep)
RNA-Seqは、遺伝子発現プロファイリングおよび全トランスクリプトーム解析に使用される、次世代シーケンシング(NGS)ワークフローである。本明細書に記載し、図21に示す、RNAの一本鎖ライブラリー調製(ssPrep)は、定方向RNA-Seqライブラリー調製方法であり、この方法は、固有のNGSアダプターを使用して第1鎖cDNAから直接ライブラリーを生成し、したがって第2鎖合成およびDNA末端修復をなくす。それ故、費用および時間の大幅な削減によってライブラリー品質が向上されることになる。
RNAのssPrepの特徴は、以下のことを含む:約2時間での、直接、第1鎖cDNAからIllumina(登録商標)シーケンシング対応ライブラリーへの、ワークフロー;ユーザーが選択した第1鎖cDNA合成プロトコールを使用することができる;キットが、アダプターライゲーションのための試薬、インデックス付加PCRのための試薬、および磁気精製ステップのための磁気ビーズを含有する;10ngのmRNA、最少の実践時間、ならびに非常に少ないPCRサイクルおよび低減された偏りで生成されるシーケンシング対応ライブラリーのために、最適化されている。RNAのssPrepは、Illumina(登録商標)プラットフォームで、末端ポリッシングを伴わないライゲーションのための鋳型第1鎖cDNA分子の調製と、シーケンシングのための足場アダプター(すなわち、本明細書に記載する足場アダプター)のライゲーションとを同時に行う、1ステップ反応で動作する。下流の応用としては、例えば、遺伝子発現プロファイリング、アイソフォーム解析、およびスプライスバリアント発見を挙げることができる。
mRNA投入量範囲
この実施例では、RNAのssPrepのプロトコールを用いて作製したRNA-Seqライブラリーについての品質メトリクスの改善を実証する。RNAのssPrep方法についてのメトリクスを、市販の二本鎖(dsPrep)方法(すなわち、NEBNEXT ULTRA II Directionalライブラリー調製方法)のものと比較した。スパイクインmRNA対照を使用したとき、RNAのssPrepは、反復実験間の高度な一致を有し、ライブラリーの鎖の数を保持し、かつ真のmRNA GC組成を捕捉する、ライブラリーを生成した。
Qiagen All Prep DNA,RNA,Proteinキットを使用して、全RNAを肺がん細胞系H2126から抽出した。mRNAを、NEBNEXT PolyA磁気mRNA単離モジュールで単離した。NEBNEXT ULTRA II第1鎖合成モジュールを使用する第1鎖cDNA合成のための投入物として、1~20ngのmRNAを使用した。ビーズ精製後、ライブラリーを、RNAのssPrepのプロトコールに従ってインデックスPCR反応で増幅させ、ILLUMINA MISEQでシーケンシングした。mRNAから出発して、シーケンシング対応ライブラリーを1~20ngの投入物から約4時間で生成した(収量を図22に示す)。第1鎖cDNA合成およびクリーンアップ後、プロトコールは、約2時間かかった。RNAのssPrepは、他の市販RNA-Seqキットと比較して、シーケンシング対応ライブラリーを生成するために必要とするPCRサイクルの回数が少なかった(図23)。
市販二本鎖調製(dsPrep)キットとの比較
RNAのssPrepの性能を、第2鎖合成を必要とする市販二本鎖調製(dsPrep)キット(すなわち、NEBNEXT ULTRA II Directionalキット)の性能と比較した。第2鎖合成ステップは、dUTPを相補鎖に組み込み、その後、dAテール付加、末端充填およびアダプターライゲーションを行う。dUTPを含有する鎖のその後の酵素的消化は、元の鎖情報を維持する。従来のRNAseq方法とは異なり、RNAのssPrepは、第1鎖cDNAを用いて直接行なわれ、したがって、転写物の方向性を自然に維持する。
第1鎖合成(NEBNEXT First Strand Synthesis Module)後、各ライブラリーを製造業者のプロトコールに従って完成させた。RNAのssPrepについての相対的性能を評価するために、外部RNA標準コンソーシアム(ERCC)から入手可能なスパイクイン対照を使用した(複製mRNA試料10ng当たり対照1000amol)。この対照は、真核生物mRNAによく似ているがヒトゲノムにマッピングしない、濃度、長さおよび配列が既知の92転写物の混合物である。予想したトランスクリプトームの複雑性からの偏差を評価するためにERCC対照を設計した。
各ライブラリーを深度>10,000,000リードまでシーケンシングした(ILLUMINA MISEQ 2×76bp)。STAR v2.6.1dを使用して、リードをヒトまたはERCC対照参照ゲノムにマッピングした。両方のライブラリー方法が、同等のマッピングメトリクスを示した:>90%の一意的にマッピングされたリード、最少のリボソームリード、および鎖の数の維持(図25の上のパネル)。正規化されたリードカウントを、ヒトリードとERCCリードの両方について決定した。高い一致が、ヒトリード(図25、下のパネル)とERCCリード(図示なし)の両方について反復実験および2つの方法の間で観察された。
さらなる解析により、RNAのssPrepは、配列をGene bodyにわたって均一に捕捉したが、市販キットライブラリーには、軽度の5’偏りがあることが示された(図26、上のパネル)。この偏りは、トランスクリプトームのゲノム組成にも反映され、非翻訳領域のより高い回収%として観察された(図26、中央パネル)。2つの方法により生成したライブラリーは、わずかに異なるヒトDNA GC組成を有したが、スパイクイン対照についての実測対予想(44.5%)GC組成の比較により、RNAのssPrepは市販のキットよりもその予測値に厳密にマッチすることが明らかになった(図26、下のパネル、挿入図)。スパイクイン対照解析により、マッピングされたERCCリードのほぼ100%が両方のライブラリーについて正しい鎖から生じることも明らかになった(図27)。
(実施例4)
無細胞DNAおよび一本鎖オリゴの解析のためのNGSライブラリー調製への一本鎖アプローチ
この実施例では、鋳型分子のネイティブ末端に変更を加えることなく、少ない投入量のcfDNAから複雑なライブラリーを生成するように設計した、単純かつ効率的な、ライゲーションに基づくssDNAライブラリー調製を提示する。ssPrepと呼ぶこともあるこの方法は、1ステップ複合リン酸化/ライゲーション反応で動作する。ssPrep方法は、特殊設計された次世代シーケンシング(NGS)足場-アダプターをライゲーションする、末端ポリッシングを伴わないライゲーションのための鋳型DNA分子を調製する。ssPrep方法は、プロトコール時間およびシーケンシング結果が、最も効率のよい二本鎖ライブラリー調製DNA方法に匹敵する、迅速かつ効率的な一本鎖ライブラリー方法である。合成オリゴの2つの独立した群を使用してssPrepのネイティブ末端保持の有用性を実証し、一本鎖オリゴを純度についてアッセイするssPrepの能力を明らかに示す。最後に、ssPrepから生じたcfDNA次世代シーケンシングデータを使用して健康な個体からのヌクレオソームの位置取りおよび転写因子結合部位を解析することができることを実証する。したがって、ssPrepは、cfDNA断片のような断片化されたDNA分子を、本来の長さおよびネイティブ末端を保持するシーケンシングライブラリーに変換するための、迅速かつ用途の広いツールである。
鋳型分子のネイティブ末端を変更することなく、1ナノグラム(ng)のDNAから複雑なNGSライブラリーを生成するように設計した、迅速、単純、かつ効率的な、ライゲーションに基づく一本鎖DNAライブラリー調製方法(ssPrep)を、この実施例で説明する。ssPrep方法は、新奇な試薬を必要とせず、2.5時間で完了することができ、ILLUMINAアダプターをライゲーションしているときに、末端ポリッシングを伴わないライゲーションのための鋳型DNA分子を同時に調製する、1ステップ複合リン酸化/ライゲーション反応で動作する。
健康なヒトcfDNAドナーから作製したssPrepライブラリーにより生成した標準シーケンシングメトリクスを提示し、旧来の末端ポリッシング型dsDNAライブラリー方法からの結果と比較する。ssPrepを使用して生成したssDNAライブラリーを、合成二重鎖オリゴヌクレオチドを使用するdsDNA調製と比較する。次に、長さが短いssDNA断片を捕捉するssPrepの能力を実証し、長さが様々であり配列が既知である一本鎖合成オリゴを使用してオリゴヌクレオチドの純度をアッセイする能力を実証する。最後に、ssPrepライブラリーが、広範なDNA断片長を捕捉することによってそれらのネイティブ5プライムおよび3プライム末端を変更することなくcfDNAデータの改善された解析をできるようにする方法を、実証する。その効率および使用の容易さを考えると、ssPrepは、多くの応用についてssDNAライブラリー調製方法およびdsDNAライブラリー調製方法の両方に取って代わることができる。
方法
以下の方法をこの実施例では使用した。
ヒト無細胞DNA調製
匿名化されたドナーからの全血をin vitro研究使用のためにPalo Alto、CAのスタンフォード献血センター(Stanford Blood Center)から入手した。採血チューブを1800gで10分間、4℃で回転させることにより、全血から血漿を抽出した。細胞層を乱すことなく、上清の2mlアリコートを無菌条件下で微量遠心チューブに移し、16000gで10分間、4℃で再び回転させて、細胞デブリを除去した。
循環無細胞DNAキット(Qiagen Technologies)を製造業者のプロトコールに従って使用して、4mlの血漿からcfDNAを調製した。精製された無細胞DNA(cfDNA)の濃度を、QUANT-IT高感度dsDNA Assay KitおよびQubit蛍光光度計(ThermoFisher Scientific)を使用して測定した。TapeStationおよび付随するD5000またはD1000高感度製品を使用して、cfDNAサイズ分布を解析した(Agilent;図33Aおよび33B)。
合成オリゴ調製
ランダム配列生成装置を使用して50%GC含有量で二本鎖合成オリゴ(下記表1に示す)を設計し、公開データベースの任意の公知生物とマッチする配列を除去した。各dsDNAオリゴ(n=12)は、1つの平滑末端と、ランダム配列、長さ1~6ヌクレオチド、の1つの3プライムまたは5プライム一本鎖オーバーハングとを有する、二本鎖DNAの固有の50nt配列であった。オリゴは、Integrated DNA Technologies(IDT)により標準的な脱塩精製を使用して合成され、二重鎖化されたものであり、すべてのランダムヌクレオチドを、合成の偏りを低減させるために「手で混合」した。一本鎖ライブラリー調製(ssPrep)のために、対照オリゴを等モル比で一緒にプールした。
Figure 2022528139000002
一本鎖合成オリゴ(下記の表2に示す)を、二本鎖対照オリゴと同じ方法で生成した。別段の断り書きがない限り、オリゴは、長さ20~80ntのssDNAオリゴについては標準的な脱塩精製、および長さ90~120ntのssDNAオリゴについてはUltramer精製を使用して合成した。
Figure 2022528139000003
ssPrepアダプター調製
フォワード(P5)ssPrepアダプターおよびリバース(P7)ssPrepアダプターは、両方とも二本鎖足場アダプターであった。フォワードssPrepアダプターは、アダプターの足場部分に5プライムオーバーハング、およびライゲーション末端に遊離3プライムOH末端を含有し、すべての他の末端は、ライゲーションおよび伸長を遮断する修飾を有した。リバースssPrepアダプターは、アダプターの足場部分に3プライムオーバーハング、およびライゲーション末端にリン酸化5プライム末端を含有し、すべての他の末端は、ライゲーションおよび伸長を遮断する修飾を有した(下記の表3)。ssPrepアダプターは、Integrated DNA Technologies(IDT)により標準的な脱塩精製を使用して合成され、二重鎖化されたものであった。アダプターの作業用ストックを、TE+50mM NaClでアダプターを希釈することにより製造した。
Figure 2022528139000004
ssPrepライブラリー調製
22μl変性反応では、QUANT-ITにより測定して1ngの精製cfDNAまたは5ngの合成したオリゴを、10mM Tris pH8.0および8ngのET SSB(New England Biolabs)と、氷上で併せた。95℃に予熱したサーモサイクラー内に反応物を配置し、3分間インキュベートした後、直ちに、少なくとも2分間、氷上に戻した。1pmolのフォワードおよび1pmolのリバースssPrepアダプターを氷上の変性反応物に添加し、PEG-8000、T4 DNAリガーゼ緩衝剤、T4 PNK、およびT4 DNAリガーゼ(すべてNew England Biolabs)も添加して最終体積50μlにした。PEG-8000を18.5% v/vの最終濃度まで添加した。T4 DNAリガーゼ緩衝剤を1×の最終濃度まで添加した。T4 PNKおよびT4 DNAリガーゼをそれぞれ10単位および800単位の最終濃度まで添加した。このライゲーション反応物を37℃で1時間インキュベートし、MINELUTE PCR Purification Kit(Qiagen)および製造業者の使用説明書を次の変更を加えて使用して精製した:初期結合スピンは、卓上遠心分離機を用いて6000rpmで行なった。洗浄スピンは、洗浄スピンを合計2回反復し、両方の洗浄を6000rpmで行なった。DNAを15μlの10mM Tris pH8.0で溶出した。
ライゲーションされ、精製されたDNAを、50μl反応で、1×KAPA HIFI HOTSTART READYMIX(Roche)および最終濃度2mMのユニバーサルプライマーおよび最終濃度2mMのインデックスプライマーと併せ、次の熱サイクル条件:初期変性のために98℃で3分間、続いて、98℃で20秒間、68℃で30秒間、72℃で30秒間を10サイクル、最後に72℃で1分間の伸長ステップ、を使用して増幅させることにより、ssPrepライブラリーにインデックスを付加させた。インデックスPCR後、ssPrepライブラリーを、1.2×AMPUREクリーン(Beckman Coulter)で精製し、20μlの10mM Tris pH8.0で溶出した。断片長分布およびdsDNA濃度(Agilent Tapestation 4200およびQubit蛍光定量ユニット)を使用して、最終モル濃度推定値を計算した。
二本鎖DNAライブラリー調製
QUANT-ITにより測定して、1ngの精製cfDNAまたは5ngの合成オリゴを、供給された試薬、推奨AMPUREクリーンアップ比、および推奨インデックスPCRサイクルを使用する、NEBNEXT ULTRA IIマニュアルに概要が示されている通りのライブラリー調製(末端ポリッシング、アダプターライゲーション、インデックスPCR)によって、得た。
シーケンシング
すべてのcfDNAライブラリーは、Fulgent GeneticsによりILLUMINA HISEQXを用いて2×151リード長でシーケンシングされたものであった。すべての合成オリゴライブラリーは、社内ILLUMINA MISEQ卓上シーケンサーを製造業者の使用説明書に従って2×151bpのリード長でシーケンシングした。
リード処理
シーケンシングデータを、先ず、bwa memを使用してデフォルトパラメーターでPhiXゲノムとアライメントした。PhiX(samtools fastq-f 12)にマッピングしなかった抽出リードを、下流の解析に使用した。次に、アダプター配列の除去とリードのマージを同時に行なった。このプロセスは、配列類似性に基づいてフォワードリードとリバースリードを折り畳んで単一の配列にすること、その一方で、SeqPrep(github.com/jstjohn/SeqPrep)を使用して公知ILLUMINAアダプター配列とマッチするリードの末端をトリミングすることを含んだ。フィルタリング後に残存した、マージしたリードを、UCSCゲノムブラウザからダウンロードしたhg19ヒト参照ゲノム(下記の表4および5)、または合成したオリゴ配列(表1)に対応するカスタムfastaファイルのどちらかと、アライメントした。デフォルトパラメーターでbwa alnおよびbwa sampeをアライメントおよびマッピングに使用した。ヒトライブラリーについてのマッピング率を、samtools flagstatから決定した。次いで、samtools rmdupを使用して、重複リードを除去した。
Figure 2022528139000005
Figure 2022528139000006
Figure 2022528139000007
Figure 2022528139000008
QCメトリクス
大部分の解析について、解析の前にsamtools mergeを使用して、同じ調製方法および同じcfDNA抽出物の個々のライブラリーからのbamファイルを試料特異的およびライブラリー特異的bamファイルにマージした。同じ調製方法およびcfDNA抽出物についての、マージしたリードの挿入物長分布について、samtools view -q20 -f66を使用して生成した、個々のライブラリーのbamファイルから、挿入物長の情報を解析し、連結コマンドを使用して結合させた。長さ当たりのリードの頻度を計算し、全ライブラリーに対するリードのパーセントとしてプロットした。全ライブラリーが同じカバレッジを有するように、samtools view-sを使用して、マージし、重複を除去し、ダウンサンプリングしたbamファイルから、正規化したゲノムカバレッジを抽出した。ダウンサンプリングしたbamファイルをsamtools view -q20 -bからbedtools genomecovにピッピング(pipping)することにより、データを得た。ダウンサンプリングの前にライブラリー調製方法ごとにNEBNEXT ULTRA IIよりもcfDNA抽出物当たりのライブラリー数が多いssPrepの複雑性を人工的に増大させないように各cfDNA入力試料について3つだけのライブラリーを組み合わせることにより、preseq複雑性推定値を得た。ssPrep試料Aについて組み合わせたライブラリーは、A1、A2、A3であった。ssPrep試料Bについて組み合わせたライブラリーは、B6、B7、B8であった。試料Aおよび試料BについてのNEBNEXT ULTRA IIの組み合わせたライブラリーは、それぞれ、ds1A~ds3Aおよびds4A~ds6Aであった。組み合わせてダウンサンプリングした後に、preseq lcextractを使用して複雑性推定および外挿を行なった。Picard Tools(Broad Institute)CollectGCBiasMetricsを用いて、マージし、重複を除去し、ダウンサンプリングしたbamファイルからGCカバレッジを得た。ライブラリータイプごとに、断片の両方のリードに基づいて-2~+34塩基にわたる領域のあらゆる位置での各塩基の比率、すなわち塩基組成、を計算することによって断片末端ヌクレオチド解析を行なった。位置ごとの塩基組成を、領域の長さに沿ってその塩基の最頻値を用いて正規化し、log-2変換した。正規化され、log変換された比率を、両方のリードの両方のライブラリータイプについて計算し、プロットした。すべてのプロットを、ggplot2を用いてRで生成した。
合成オリゴ解析
カスタムスクリプトakinをsamtools depthに用いて、オリゴ中の各位置における二本鎖合成オリゴシーケンシングカバレッジを決定し、Rでggplot2を用いて0ベース座標でオリゴの長さにわたってのパーセントの関数としてプロットした。
cfDNAについてのものに類似した、一本鎖合成オリゴの断片長解析を行った。
cfDNAの生物学的解析
ジヌクレオチド出現頻度計算のために、各ライブラリー調製方法についての試料Aおよび試料Bの組み合わせたライブラリーからのマージされたbamファイルを、samtools view -bh -F 0X10 -m -M -q 20を使用して構文解析して、特異的挿入物長:167bp(クロマトソームに巻き付いたDNA長)、144bp(コア粒子に巻き付いたDNA長)、および83bp(図29、パネルAにピークとして存在する、より短いDNA長)の、フォワードリードを抽出した。各挿入物長については、5プライムおよび3プライム断片化点の両方に100bpまたは11bpのゲノムコンテキストをそれぞれ追加した100bpまたは11bpウインドウどちらかについての16すべての2-mer組合せのカスタムpythonスクリプトを使用して、両方の断片化点の周辺のジヌクレオチドカウントを推定した。両末端の100bp隣接ウインドウを用いて生成したデータについて、オーバーラップしている領域(当然のこととして、同じカウントを有する)を除去した。中央値フィルターを使用してデータを正規化し、ジヌクレオチド出現頻度を、挿入物の中央がゼロになり、断片化点の上流の領域が負の値を有し、下流が正の値を有するように、弱いジヌクレオチド(AA/AT/TA/TT)相互作用について強いジヌクレオチド(CC/CG/GC/GG)相互作用に対してプロットした。11bp隣接ウインドウに関して生成されたデータについて、中央値フィルターを用いてデータを正規化し、弱いジヌクレオチドの強いジヌクレオチドに対するジヌクレオチド出現頻度を、Rを使用して5プライムおよび3プライム末端についてプロットした。
ゲノム内の各位置についてのWPSスコアを、大きい断片の解析の場合は120bp、短い断片の解析の場合は35bpである、その位置の周辺のウインドウ内でアライメントするリードを収集することにより(Snyder et al., Cell 164, 57-68 (2016)に記載されているように)決定した。スコアは、次のように計算した:挿入物がそのウインドウ内で始まるかまたは終わるたびに、スコアから1を引く。挿入物がそのウインドウ内で始まりも終わりもしないが、それにもかかわらずそれにアライメントする場合、スコアに1を加える。オーバーラップしていない1000bpセグメントを用いてWPSスコアを得、中央値WPSスコアを引くことによりゼロの中央値スコアに合わせることによって、正規化されたWPSスコアを計算した。次いで、スコアを、Savitzky-Golayフィルターにより平滑化した:二次多項式を、21bpウインドウにわたって各位置における中央値調整スコアにあてはめた。平滑化されたスコアが、その位置でのその多項式の値である。等しい長さの領域のセットを用いて、位置1がセット内の各領域の第1のヌクレオチドであり、位置2が各領域内の第2のヌクレオチドであるなどである、セット内の領域の各々における各位置にわたるWPSスコアの平均値を計算することにより、WPSスコア代表値を計算した。CTCF部位は、Snyder et al., Cell 164, 57-68 (2016)に記載されているように選択した。推定的TF結合部位のリストを含有するbedファイルを、UCSC Genome Browser Table BrowserからのJASPAR2018表(hub_186875_JasparTFBS)からbedファイルにダウンロードし、CTCF部位のみを含むようにフィルタリングした。これらの部位を、19の細胞系からのCTCF Chipseqデータと比較した。19の細胞系すべてにおいてchipseqピークがオーバーラップしている推定的結合部位をさらなる解析に使用した。
略号
cfDNA:無細胞DNA;NGS:次世代シーケンシング;ssDNA:一本鎖DNA;dsDNA:二本鎖DNA;bp:塩基対;nt:ヌクレオチド;SSB:一本鎖結合タンパク質;FFPE:ホルマリン固定パラフィン包埋;ctDNA:循環腫瘍DNA;WPS:ウインドウ保護スコア。
ライブラリー構築
この実施例で説明するssPrep方法は、断片化されたまたは分解された鋳型DNAからILLUMINAシーケンシングライブラリーを作出する(図28)。dsDNAと、ssDNAと、ニックの入ったdsDNAとの複合混合物であり得る鋳型DNAを、先ず、熱変性させ、次いで直ちにコールドショックを与えてすべての鋳型DNA分子を均一な一本鎖状にする。熱安定性一本鎖結合タンパク質(SSB)を含めることにより、ライゲーション反応を通してDNAを一本鎖状態として維持する。次に、今や均一な一本鎖状であり、SSBで被覆されている、鋳型DNAを、(リン酸化/一本鎖オーバーハングを含有する方向性のあるdsDNA NGSアダプターとのライゲーション)の二重反応に供する。
フォワードシーケンシングアダプターとリバースシーケンシングアダプターの両方は、同様の構造を共有するが、末端が適切なライゲーションを容易にするために遮断されていない点で異なる。両方のシーケンシングアダプターは、フォワードアダプターのボトム鎖の3プライム末端およびリバースアダプターのボトム鎖の5プライム末端に存在するランダム7塩基対(bp)一本鎖足場オーバーハングを除いて、dsDNAである。このようにして、フォワード(P5)ILLUMINAアダプターを常に鋳型分子の5プライム末端に供給し、リバース(P7)ILLUMINAアダプターを常に鋳型分子の3プライム末端に供給する。
二重リン酸化/ライゲーション反応中に、T4ポリヌクレオチドキナーゼ(PNK)は、5プライム末端をリン酸化することおよび3プライム末端を脱リン酸化することにより、ライゲーションのための鋳型DNA末端を調製する。T4 PNKは、ssDNA分子とdsDNA分子の両方に効果を発揮し、リン酸化状態のタンパク質に対する活性を持たない。同時に、足場アダプターのランダム塩基が一本鎖鋳型分子にアニールする。これは、短い局在dsDNA分子を生じさせ、その結果、二本鎖DNA鋳型に対するライゲーション効率が高いがssDNAに対する低いライゲーション効率が低いT4 DNAリガーゼでのアダプターへの鋳型のライゲーションが可能になる。単一リン酸化/ライゲーション反応が完了した後、ライブラリーDNAを精製し、単一インデックスプライマーと二重インデックスプライマーの両方に適合する標準的なNGSインデックス付加PCRに、直接、供する。
ssPrepプロトコールの性能
ssPrepにより生成されたデータの品質および量を評価するために、ssPrepおよび鎖末端ポリッシングdsDNAライブラリーキット(New England Biolabs NEBNEXT ULTRA II;市販キットまたはdsPrepとも呼ぶ)の両方を使用して、2名の健康なヒト個体から得た2つの血清cfDNA抽出物(試料Aおよび試料B)からいくつかのシーケンシングライブラリーを生成した。ライブラリー調製および定量化(図33Aおよび33B)後、ILLUMINA HISEQ X(2×150bp)を用いてライブラリーをcfDNA抽出物当たりおよそ400,000,000リードペアまでペアエンドシーケンシングした。同じcfDNA抽出物およびライブラリー調製方法から生成したライブラリーからのシーケンシングデータを解析のために組み合わせた。フォワード配列リードとリバース配列リードを、これらのリードがオーバーラップしている場合にはマージして、元のDNA断片を表す単一のリードを生成した。cfDNAからの配列リードの大多数は約167bp長であるので、マージしたリード(リード1およびリード2が少なくとも30bpの相補性によりオーバーラップしていた)のみを、下流の解析に使用した(上記の表4および表5)。生成されたデータによって、cfDNA抽出物ごとにssPrep試料とdsPrep試料の両方についてヒトゲノムの約15倍のカバレッジを得た。
ssPrepおよびdsPrep(市販キット)cfDNAにより生成されたライブラリーは、cfDNA断片に特有の長さ分布特徴を有した。それらは両方とも、167bpのクロマトソーム長を中心とする断片長分布を示した。それらは両方とも、より短い断片では、10.4bpの周期性でヌクレオソーム結合DNAの露出した副溝のDNase Iによる切断の結果であるのこぎり歯パターンを示した(図29、パネルA;図34)。しかし、図29、パネルA、およびその挿入図に示すように、2つの調製方法には、異なる断片長で捕捉されたリードの比率はもちろん、のこぎり歯パターンで存在するサブピークの長さ分布にも差があった。ssPrepライブラリーには、dsPrepに対して、より短い、すなわちヌクレオソーム未満の長さの、リードの存在量がより多く、のこぎり歯パターンでのより短いサブピークがあった。ヌクレオソーム未満のサイズのリードの比率の増加は、短いおよび/またはニックの入ったDNA断片を配列ライブラリー分子に変換するssDNA方法の能力の増大を反映していた。理論により制限されるものではないが、ヌクレオソーム未満のピークサイズの差は、dsDNA方法と比較してネイティブ末端を保持するssPrepの能力に起因する可能性が高い。dsDNAライブラリー方法では、5プライムオーバーハングが充填され、3プライムオーバーハングは除去される。したがって、所与のDNA分子の実測長は、いかなるタイプのオーバーハングが存在するのかに依存することになる。この情報は、dsDNAライブラリー調製に必要とされる末端ポリッシングステップ中に失われる。
dsPrep(市販キット)ライブラリーに対するssPrepライブラリーのリードカバレッジ、GC含有量、および複雑性(ライブラリー内の固有分子の数)を、両方のcfDNA抽出物について比較した。図29、パネルBは、ssPrepが、dsPrepキットのものと同様のカバレッジ倍数を生じさせること、および両方の方法が、比較的均一なゲノムカバレッジを生じさせることを示す。図29、パネルCは、ssPrepライブラリーのGC含有量が、ヒトゲノム参照(灰色でプロットされたヒストグラム)のものを反映するdsPrepキットのものと同様であることを示す。低いGC含有量の領域で示される、ssPrepとdsPrep間の差は、インデックスPCR中に使用したポリメラーゼ(NEB Q5対KAPA HIFI HS RM)の相違の結果であり得るか、またはssPrep足場アダプターのランダム部分の合成におけるGCリッチの偏りの結果であり得る。図29、パネルDは、300,000,000リードのシーケンシング深度、またはおよそ1のHISEQシーケンシングレーンで、ssPrepライブラリーがdsPrepライブラリーよりも高度な分子複雑性を有すると推定されることを示す。理論により制限されるものではないが、この差は、旧来のdsDNAライブラリー調製により失われるニックの入った鎖およびssDNA鎖を回復させるssPrepの能力の現れであり得る。
この実施例で使用するdsPrepキットを含む大部分のdsDNAライブラリー調製は、投入DNA分子に対して末端ポリッシングを行なう。ssPrep方法は、DNA断片のネイティブ末端にシーケンシングアダプターを供給するため、各DNA断片の正確な5プライムおよび3プライム末端のならびにその周辺の塩基組成を、単一ヌクレオチド分解能で調査することができる。末端ポリッシング手順が、分子のネイティブ5プライム末端を保持することに留意されたい。しかし、T4 DNAポリメラーゼの5プライムオーバーハング「フィルイン」および3プライムオーバーハングエキソヌクレアーゼ活性は、どちらかのタイプのオーバーハングが存在する場合、元の分子に代表的なものではない3プライム末端を生じさせる。このように、末端ポリッシング手順は、相補鎖の5プライム末端に存在するものをすべての3プライム末端に反映させることが期待される。
DNA末端情報の差を試験するために、出発座標にわたって位置ごとの塩基組成を、ssPrepおよびdsPrep両方のcfDNAライブラリーの、マージしたリードデータセットから推測した、フォワードリード(リード1)およびリバースリード(リード2)の両方について比較した(図29、パネルE)。4つの注目に値する発見があった。第1に、ssPrepとdsPrepの両方について、各リードの開始時および生物学的断片化箇所の上流に平均的塩基組成からの有意な逸脱があった。第2に、dsDNAライブラリーデータとは異なり、ssPrepライブラリーではフォワードリードの開始およびリバースリードの開始の平均的塩基組成が異なる。これは、cfDNA断片が、dsDNAライブラリー調製の末端ポリッシングステップ中に改変されるオーバーハングを含有することが多いことを示す。第3に、dsPrepライブラリーにおけるフォワードリードの開始の平均的塩基組成は、リバースリードの開始の平均的塩基組成のまさに逆補体であった(dsPrepは、末端ポリッシングの副産物である一様に平滑末端化されている分子を生成する)。最後に、ssPrepライブラリーにおけるフォワードリードの開始の平均的塩基組成は、dsPrepライブラリーとほぼ同一であった(末端ポリッシングは、ssPrep直接ライゲーション手順のようにネイティブ5プライム末端を保持する)。
ssPrepの特徴の評定
5プライムおよび3プライムオーバーハング
5プライムおよび3プライム末端におけるcfDNAの塩基組成の相違を考えて、ssPrep方法、およびNEBNEXT ULTRA IIのようなdsDNAライブラリー調製方法が、投入DNA断片を変えることになる(または変えることにならない)のかどうかを試験するための実験を設計した。特定の長さおよびタイプの(5プライムまたは3プライム)オーバーハングを各々が有する、12の合成二重鎖オリゴのプールを等モル濃度で構築した。各二重鎖は、各オーバーハングタイプに固有の、50ヌクレオチド(nt)コア配列を含有し、一方の側に平滑末端および他方の側に特定の長さのランダム配列(1~6nt)の5プライムまたは3プライムオーバーハングという、共通の構造を有した(図30、パネルA;表1)。
オリゴのこのプールをcfDNA抽出物にスパイクすることにより、ssPrepおよびdsPrepライブラリーを生成した。シーケンシングデータから、各オリゴの既知の固有の50ntコア配列を含有する参照ファイルにライブラリーをマッピングすることにより、オリゴプールに由来するリードを特定した。オーバーハングを含む、プール内の各オリゴについて、あらゆる位置におけるカバレッジの深度を計算した。結果(図30、パネルB)は、ssPrepが、オーバーハング領域にわたって合成オリゴの二本鎖領域と比較して低減されたカバレッジを生じさせたことを示し、これは、この方法が、投入DNAを正確に特徴付ける鎖データを生じさせることができることを例証する。対照的に、dsPrepにより生成されたライブラリーは、末端ポリッシングの結果を実証した。5プライムオーバーハングをフィルインし、その結果、既知5プライムオーバーハングを有する分子の相補鎖についてほぼ完全なカバレッジを得た。その一方で、3プライムエキソヌクレアーゼ活性は、3プライムオーバーハング配列の、それが存在した場合、ほぼ完全な喪失を引き起こした。
一本鎖オリゴライブラリー
定義された範囲の投入DNA鋳型長でのssPrepの効率を試験するために、10nt長間隔で20~120ヌクレオチドの範囲の長さの11の一本鎖オリゴ(標準的な脱塩精製)1セット(表2)を設計した。等モル濃度の各々を使用してプールを作製し、このプールからssPrepライブラリーを生成した。これらのライブラリーのシーケンシングからの鋳型長の比率の解析は、ssPrepプロトコールがこの長さ範囲にわたってssDNAライブラリーを生成することを示した(図31、パネルA)。対照として、一本鎖オリゴのこのプールからdsPrepライブラリーを生成することを試みた。このプロトコールは、排他的に一本鎖投入DNAの鋳型を使用してライブラリーを生成することが全くできなかった(ライブラリーは、アダプターダイマーを含有したが、予想されたサイズ分布で検出可能な収量を有さなかった)。
ssPrepデータ解析からいくつかの特筆すべき観察結果があった。第1に、最も短い被検オリゴ(20ntおよび30nt長)は、ライブラリー内で十分提示されなかった。これは、このサイズ範囲のDNAオリゴに対する長さの偏りがある、ライゲーション後のビーズクリーンアップステップに起因する可能性が高かった。第2に、より長い(>=40nt)被検オリゴ間にライブラリー変換効率の多少のばらつきがあった。このばらつきは、各長さについて単一の固定された配列である被検オリゴにおけるわずかな偏りに起因する可能性が高い。最後に、投入オリゴ長に対応しないオリゴ長の連続バックグラウンド部分が観察され、20~120の間のあらゆる長さの少なくともいくつかのリードが観察された。
予想外の長さのこれらのリードが、短縮され、不完全なオリゴの合成に起因するのか、またはより長い一本鎖オリゴの不安定な破断に起因するのかを試験するために、ssPrepライブラリーにおけるすべてのリードをそれらのそれぞれのオリゴ参照にマッピングした(図31、パネルB;下記表6)。短縮産物は、オリゴごとに存在した。これらの短縮化DNA断片は、オリゴ長にわたってほぼ均一に分布している長さを有した。各オリゴにマッピングする正しい完全長リードの分率が、オリゴ長に応じて減少した。このような観察は、オリゴ合成のホスホロアミダイト方法の限界を示す。これらの観察は、ヌクレオチド組込みが化学的な塩基付加サイクル各々における効率が100%に満たないモデルと一致する。
Figure 2022528139000009
ssPrepが、様々な精製方法に付したオリゴの純度を評定することができるかどうかを試験するために、標準的な脱塩、HPLCおよびPAGE精製という3つの一般的スキームを使用して60ntオリゴを精製した。3つすべての精製方法からの60ntオリゴを使用して、2重反復でssPrepライブラリーを構築した。60nt参照配列への配列データのマッピング(図31、パネルC)は、標準的な脱塩オリゴから生成されたライブラリーと比較して、予想完全長配列に起因すると考えられるリードの比率がHPLC精製オリゴライブラリーにおいてもPAGE精製オリゴライブラリーにおいても増加し、その一方で、長さが60nt未満のリードと定義した短縮産物が減少することを示した。これらの結果は、ホスホロアミダイト合成に基づく各精製方法の予測品質(Integrated DNA Technologies Product Literature)と一致し、ssPrepを、化学合成されたDNAオリゴの純度を判定するための単純かつ高感度のアッセイとして使用することができることを示す。
ssPrep cfDNAライブラリーの解析
cfDNA断片の大多数は、ヌクレオソームの周りに巻き付いているDNA(細胞死中にヌクレアーゼ分解からのDNAを保護する構成)に由来する。したがって、cfDNA断片のこのゲノムマップ位置を使用して、cfDNA分子の集団を生じさせた組織内のヒストンおよび他のDNA結合タンパク質の位置を推測することができる。この実施例で説明するssPrepのような、一本鎖DNAライブラリー方法は、これらのタンパク質がDNAをエンドヌクレアーゼ活性から保護するので、cfDNA断片のネイティブ末端を保持し、したがって、ヒストンおよび他のDNA結合タンパク質の位置の推測に最大限に有用である。2名の健康な個体(試料Aおよび試料B)からのssPrepデータを組み合わせて30倍のゲノムカバレッジ代表値を得た。これらのデータから、ヌクレオソームおよび他のDNA結合タンパク質の位置取りの態様を明らかにするssPrepライブラリーの能力を調査した。
ヌクレオソーム位置取りは、ゲノムにより少なくとも部分的にコードされる。ヒストンに結合しているDNAの場合、A/Tジヌクレオチドは、一般に、副溝がヒストンの方を向いているときに有利であり、G/Cジヌクレオチドは、一般に、副溝が外側に向いているときに有利である。したがって全体として解析した場合、ヌクレオソームにより保護されたDNAに由来するDNA断片は、周囲のゲノム領域と比較して、捕捉された断片内にA/TリッチおよびG/C枯渇領域、その直後に続くG/CリッチおよびA/T枯渇領域という、周期変動パターンを有するはずである。この周期変動パターンがssPrepデータに存在するかどうかを試験するために、3つの断片長167、144および83bpの分子におけるA/TおよびG/Cゲノムジヌクレオチドを、これら3つのリード長の各々についての上流および下流の塩基100ntを含めて、調査した(図32、パネルA)。各々が配列の中点を中心とするものであった。述べたように、167bpは、ヌクレオソームコア粒子の周りに巻き付いているDNAと付随するリンカー領域の長さに相当し、144bpは、ヌクレオソームコア粒子の周りに巻き付いているDNAの長さのみを表し、83bpは、ヌクレオソーム関連DNAに由来する分解産物を表し得る。
周囲のゲノム領域と比較して、シーケンシングした分子長の中にA/TおよびG/Cジヌクレオチドの周期変動濃縮が観察された。83bp断片長の上流約55bpの強い周期変動シグナルも観察され、これは、これらの分子が、分解したヌクレオソーム関連DNAに由来する可能性が高いことを示していた。dsPrep方法の定義された断片長の中でのこのジヌクレオチドの周期変動も観察された(図32、パネルC)。しかし、dsPrepデータについては83bp断片長における上流の周期変動シグナルが観察されなかった。これは、dsDNA調製方法における短い断片の低い回収率、または断片化されたもしくはニックの入ったDNAをシーケンシングライブラリーに変換するdsDNA調製の能力の他の相違に起因し得る。
ジヌクレオチド媒介ヒストン巻き付きのさらなる特徴は、副溝に到達可能である場合にDNase I媒介ニッキングが起こることである。この現象は、ヌクレオソーム関連断片の末端におけるG/Cジヌクレオチドの特異的濃縮をもたらす(図32、パネルA~D)。dsDNA末端ポリッシングステップに起因して、dsPrepデータの5プライムおよび3プライム末端の末端プロファイルは、互いの鏡像であった(図32、パネルD)。ssPrepとdsPrep間に相当な差がある3プライム末端におけるジヌクレオチド出現頻度は、多様なオーバーハングのかなりの集団が、ヌクレオソーム関連cfDNA断片の集団内に存在することを示す(図32、パネルBおよびD)。
次に、ヌクレオソームの位置取りを、ウインドウ保護スコア(WPS)を使用して調査した。WPSは、ゲノム内の位置が、エンドヌクレアーゼ活性から保護される傾向があるのか、またはエンドヌクレアーゼ活性が強化される傾向があるのかについての測度である。WPSは、所与の位置に及ぶ(それ故、切断されなかった)リードの数の、その位置で始まるまたは終わる(それ故、切断された)リードの数に対する関数である。正規化されたWPSを、第12染色体上のよい位置にあるヌクレオソームから構成される領域におけるssPrepデータを使用して計算した。代替的ssDNAライブラリープロトコールを使用する以前の結果とWPS結果を比較すると、ピークおよびトラフの位置に関して良好な一致が観察された(図32、パネルE;包括的ピアソン相関(Overall Pearons Correlation):r=0.80、p<0.0001)。
転写因子CTCFについての実験により決定した結合部位の上流1kbまたは下流1kb以内のロングサイズのビン(120~180bp、ヒストン保護に由来すると考えられる断片長の範囲)およびショートサイズのビン(35~80bp、他のDNA結合タンパク質により保護された断片を多く含むと考えられる)に長さが分類される断片について正規化されたWPSを計算することにより、ssPrepデータの第2のWPS検証を行なった(図32、パネルF)。CTCFは、結合されるヒストンを遮蔽し、上流および下流に位置するヒストンを編成する、DNA結合タンパク質である。長い断片WPSは、推定的CTCF結合部位(0位)を中心とするくぼみと、よい位置にあるヌクレオソームを示す、約180bpの周期性での外側に両方向に広がる周期変動パターンとを示した。短い断片結果は、エンドヌクレアーゼ活性からのCTCF保護に恐らく起因する、推定的CTCF結合部位を中心とする強いピークを示した。上流および下流の、より小さい振幅の周期変動は、ヌクレオソーム以外のDNA結合タンパク質の非存在と一致した。
(実施例5)
無細胞DNA用のssPrepキット
この実施例では、一本鎖無細胞DNAからNGSライブラリーを調製するためのキットを説明する。ssPrepキットのワークフローの例を図36に示す。
無細胞DNA用のssPrepキットの特徴としては、以下のことが挙げられる:二重鎖DNA回復ならびに鎖調製によって失われる一本鎖およびニックの入った二重鎖DNA;1ngの低い投入量によって複雑なライブラリーが生成され、貴重な試料が節約される;単一の反応によって、過失に起因する失敗が低減され、ベンチタイムが短縮される;末端ポリッシングがないことにより、すべてのDNA断片の天然末端が保存される;短い断片長のより優れた回収率;下流のデータトリミングがないことにより、パイプライン互換性が保証される;3時間足らずでDNAからシーケンシング対応Illumina(登録商標)ライブラリーへ;各キットが、ライブラリー調製、インデックス付加PCRおよびビーズ精製のための試薬を提供する;単一および二重インデックス付加、ならびに固有分子識別子(UMI)組込みに利用可能な選択肢;50pg/μlほども低い投入濃度での1ngの無細胞DNA向けに最適化されている;ならびに最適化されたマスターミックスおよび最小限のピペット操作ステップによって予定の時間でのわずかな労力が保証される。ssPrepキットの下流の応用としては、エキソームシーケンシング、パネル濃縮、ヌクレオソーム位置取り、SNPコーリング、および新規発見が挙げられる。ssPrepキットが役立つ分野としては、液体生検、腫瘍学、出生前検査、および移植医療が挙げられる。
血漿および他の体液中での循環が見られる無細胞DNAは、大量の臨床的に意義のある生体情報を含有し、低侵襲手順によって回収することができる。cfDNAから得られるNGSデータは、細胞生物学のいくつかの態様、例えば、出生前の健康状態、臓器移植受入れまたは拒絶、がん検出および進行、ならびに多数の他の疾患を明らかにすることができる。
血漿cfDNAから抽出されたDNA断片の大多数は、長さおよそ167塩基対(bp)を中心とするものであり、多くの場合、ヌクレアーゼ分解から保護されるヒストン単量体結合DNAの結果である。加えて、血漿に由来するcfDNAは、転写因子のフットプリントを保有する有益な少数のショートサイズの長さのDNA断片(30~100bp)、他のDNA結合タンパク質、ミトコンドリアDNA、および微生物由来のDNAを含有し、これらのすべてが、cfDNA配列データに詳細を加える(図37)。
一本鎖ライブラリー調製方法の恩恵は、dsDNA調製よりも(1)短い、大きく損傷した断片および(2)多様なDNA分子を、二重鎖DNA鎖を喪失することなく、捕捉する能力を含む。しかし、これらの有利な点にもかかわらず、NGSコミュニティーによる幅広い利用は、旧来のdsDNA方法よりも時間がかかり、新奇または単一源酵素を必要とし、一部の事例ではシーケンシングアーチファクトを生じさせる、既存の一本鎖DNAライブラリー調製方法およびキットにより妨げられてきた。
この実施例で説明するssPrepキットは、鋳型分子のネイティブ末端に変更を加えることなく、1ngの投入cfDNAから複雑なライブラリーを生成するように設計されている、単純かつ効率的な、ライゲーションに基づく、一本鎖DNAライブラリー調製方法である。ssPrepは、旧来のdsDNAキットの収量、複雑性および調製時間に匹敵するものであるが、dsDNAキットが提供できない追加情報、例えば、短い断片のカバレッジ向上およびネイティブ末端の保持を、すべて単一の反応で提供する(図38)。
ssPrepライブラリーは高いDNA収量をもたらす
インデックス後のライブラリー収量は、ライブラリー成功の測度であり、総合的変換性能の間接的測定値である。ssPrepは、高いDNA収量を戻して、シーケンシングおよびシーケンシング前の下流の濃縮に関するユーザーの自由度を大幅に改善する(図39)。
ssPrepライブラリーマッピング率および短い断片の保持
ssPrep cfDNAライブラリーのマッピング性能は、市場に出ている最良の市販キットと比肩する。ssPrepは、短い挿入物(30~100bp)に関するリードのより高いパーセンテージを捕捉して研究者が短いcfDNA断片にコードされた価値のある生物学を利用するのに役立つ点で、他の市販キット以上の働きをする(図40および41を参照されたい)。
ssPrepライブラリー、マッピングされる挿入物の長さの詳細、生体シグナル
ssPrepライブラリーは、約167bpにおけるヒストン単量体を中心とする顕著な断片長分布と、ヌクレオソーム結合DNAの露出した副溝のDNase Iによる切断の結果である可能性が高い10.4bpの周期性を明示するのこぎり歯パターンとを明らかに示す、標準cfDNA分子長プロファイルを生じさせる。ssPrepは、それ自体がdsDNA調製とは(1)比率が増したヌクレオソーム未満のサイズの断片を捕捉し、短いDNA断片を保持するその能力の点、および(2)DNA末端ポリッシングステップを省略してネイティブDNA末端を回復させ、その結果、dsDNA対応物よりわずかに短い副ピークにより実証されるような真の断片長プロファイルを明らかにする点で、区別される(図42A)。ssPrepまたはdsDNA方法とは異なり、Swift Accel NGS 1S Plusデータは、その調製プロセス中に非鋳型ヌクレオチドを加えることに起因して、マッピングの前にリードのトリミングを必要とする。これは、生体シグナル(のこぎり歯パターンなし)を消滅させもし、人工的に挿入物分布をより小さくシフトさせもする(図42B)。
ssPrepは複雑なライブラリーを生成する
ssPrepは、ライブラリー複雑性を犠牲にすることなくネイティブ末端を保持する。ssPrepは、末端ポリッシングを必要とすることなく、市場に出ている最良の市販キットと比肩する複雑なライブラリーを1ngの投入量から生成する(図43を参照されたい)。
ssPrepライブラリーは均一GCカバレッジをもたらす
ライブラリー品質のもう1つの測度は、GCスペクトルにわたってのカバレッジである。ssPrepは、NEBNext Ultra IIキットのものと同様の比での低GCリッチ領域におけるゲノムカバレッジ、ヒトゲノムGC含有量ビンの大部分にわたってのほぼ均一なカバレッジ、および他のキットと比較して高いGC含有量を有するエリアのカバレッジ向上を示す(図44を参照されたい)。
ssPrepはcfDNAの生物学的発見を助長する
無細胞DNAは、原発組織調査、発現相関関係、およびがんの進化などの、多数の生体シグナルを活用するために利用することができる、ヌクレオソーム位置取り情報を含有する。第12染色体からよい位置にあるヌクレオソームの強力に保存される領域についてのssPrep cfDNAライブラリーからの正規化されたウインドウ保護スコア(WPS)を図45に示す。この正弦曲線は、順序付けられたヌクレオソーム位置取りを示し、ピークは、cfDNA断片のヌクレオソーム保護が最も強い位置にある。
局在ジヌクレオチド組成は、ヌクレオソームの回転の位置取りに重要である。G/CジヌクレオチドとA/Tジヌクレオチドの間の定期的周期変動は、DNAによるヒストン巻き付きを助長する。さらに、DNase IによるDNAニッキングは、副溝が、外側に向いており、Dnase Iに到達可能である場合に存在するので、G/Cリッチジヌクレオチド領域で発生する。ssPrepライブラリーは、図46におけるリード長の中での周期変動頻度および断片終端点でのG/C二分染色体の濃縮から分かるように、ヌクレオソーム位置取りのこれらの特徴を保存する。
(実施例6)
核酸断片サイズ濃縮
上記のある特定の実施例で説明した一本鎖ライブラリー調製方法の一部の変形形態では、ライゲーション産物(例えば、本明細書に記載する足場アダプター(またはその成分)にライゲーションした一本鎖試料断片)を、SPRI精製を使用して増幅の前に精製する。この実施例で説明する一部の変形形態では、SPRI精製の前に、ある特定の量の溶出用緩衝液(EB;すなわち、10mM Tris緩衝液)を使用してライゲーション産物の体積を増加させる。一部の変形形態では、緩衝液の体積をイソプロパノールで置き換えて、より小さい断片の保持を増加させた。精製ステップのこの部分でイソプロパノールを添加することにより、アダプターアーチファクト(例えば、アダプターダイマー)の排除について妥協することなく、分解DNA(例えば、分解ヒトDNA)サイズ分布の下端でのきめの細かいカットオフが可能になる。最小のヒト断片を回収しようとしてさほど厳密でないSPRI精製を行なえば、より多くのアダプターアーチファクトが回収される。イソプロパノールの様々な増加量(例えば、2μl、5μl)を使用して、所望のサイズ分布に合わせることができる。
25歳の毛髪の分解試料から得た150pgのDNAからライブラリーを生成した。ライゲーション後のSPRIビーズ精製ステップ中に、次のプロトコールに従って、イソプロパノールを、ある特定の緩衝液-試料混合物に添加した:
1)50μlのEBを各反応物に添加するか、またはEB体積の一部分をイソプロパノールで置き換える(より高い比率の小さい断片の保持するために)
2)72.6μlの18%PEG SPRIビーズ溶液(すなわち、50μlの試料については、18%SPRIビーズの試料に対する1.2×比)を添加し、SPRI精製を行なう
3)20μlのEBで溶出する
精製されたライゲーション産物を、50μlのAMPLITAQ GOLDを使用するPCRにより増幅させ、増幅産物を、1.2×でのSPRIビーズ精製を使用して精製した。PCR後の精製は、18%SPRIビーズ(SPRI溶液中18%PEG)を使用する1.2×での精製であった。ライゲーション後の精製は、1.01× v/v比での精製であった(72.6ulの18%SPRIによって75ulの最終反応体積を得た)。一般に、ライゲーション後の精製におけるPEGの最終濃度は、ライゲーション産物が既にPEGを含有していたので、この実施例では約12%であった。
図48A~図48Dは、PCR増幅および1.2×18%SPRI精製の後のDNAライブラリーのトレースを示す。各トレースは、増幅の前に使用したライゲーション後のSPRI条件に基づいて異なる。図48A~図48Dおよび図49A~図49Eに示されている断片サイズ分布は、EB(すなわち、Tris緩衝液)にスパイクした異なる体積のイソプロパノールで保持された断片に関するシフトを示す。詳細には、100~148bpの間のピークは、イソプロパノールの増加に伴って比例的に高く維持されるが、148~350のピークは、比例的に減少し、断片サイズ代表値を低下させる。1つの観察結果は、ある特定の条件下でのアダプターダイマー保持の増加である。例えば、図48Aは、25μlのライゲーション産物に添加した50μlのTris緩衝液でのライゲーション後SPRI精製(72.6μlの18%SPRI)の後の、14.8%アダプターダイマーと、206bpの断片長代表値と、60.7nmol/μlの増幅されたライゲーション産物(アダプターダイマーを含まない)濃度とを有する、増幅されたDNAライブラリーを示す。図48Bは、25μlのライゲーション産物に添加した25μlのイソプロパノールおよび25μlのTris緩衝液でのライゲーション後SPRI精製(72.6μlの18%SPRI)の後の、26.4%アダプターダイマー、197bpの断片長代表値、および28.5nmol/μlの増幅されたライゲーション産物濃度を示す。図48Cは、25ulのライゲーション産物に添加した50μlのイソプロパノールでのライゲーション後SPRI精製(72.6μlの18%SPRI)の後の、26.9%アダプターダイマー、193bpの断片長代表値、および27.8nmol/μlの増幅されたライゲーション産物濃度を示す。図48Dは、25μlのライゲーション産物に添加した50μlのTris緩衝液でのSPRI精製(72.6μlの38%PEG)を使用して精製したライゲーション産物についての、27.8%アダプターダイマー、192bpの断片長代表値、および32.8nmol/μlを示す。
別の実験では、新鮮な毛髪試料から得た150pgのDNAからライブラリーを生成した。この実験についてのある特定のパラメーターは、アダプターHyb=1:1.4(Ad:Sp);P5=1.6p rSAP;P7=0.4pホスホ、rSAPなし;SSB=64ngを含んだ。二本鎖アダプターの調製中に、P5アダプターのトップ鎖をP5アダプターの足場鎖に1:1.4の比でアニールし(すなわち、より多くの足場鎖をアニーリング中に付加させる)、P7アダプターのトップ鎖をP7アダプターの足場鎖に1:1.4の比でアニールした。1.6pmolの非リン酸化P5アダプターおよび0.4pmolのリン酸化P7アダプターを添加した。アダプターライゲーションステップの前に、DNA鋳型を64ngのSSBと併せた。ライゲーション後のSPRIビーズ精製ステップ中に、次のプロトコールに従って、イソプロパノールを、ある特定の緩衝液-試料混合物に添加した:
1)50μlのEBを各反応物に添加するか、またはEB体積の一部分をイソプロパノールで置き換える(より高い比率の小さい断片を保持するために)
2)72.6μlの18%PEG SPRIビーズ溶液を添加し、SPRI精製を行なう
3)20μlのEBで溶出する
精製されたライゲーション産物を、100μlのAMPLITAQ GOLDを使用するPCR(16サイクル)により増幅させ、増幅産物を、1.2×での18%PEG SPRIビーズ精製を使用して精製した。PCR後の精製は、18%SPRIビーズ(SPRI溶液中18%PEG)を使用する1.2×での精製であった。ライゲーション後の精製は、1.01× v/v比での精製であった(72.6ulの18%SPRIによって75ulの最終反応体積を得た)。一般に、ライゲーション後の精製におけるPEGの最終濃度は、ライゲーション産物が既にPEGを含有していたので、この実施例では約12%であった。
図49A~図49Eは、PCR増幅および1.2×18%SPRI精製の後のDNAライブラリーのトレースを示す。各トレースは、増幅の前に使用したライゲーション後のSPRI条件に基づいて異なる。図49A~図49Eに示されている断片サイズ分布は、EB(すなわち、Tris緩衝液)にスパイクした異なる体積のイソプロパノールで保持された断片に関するシフトを示す。図49Aは、25ulのライゲーション産物に添加した50μlのTris緩衝液でのSPRI精製(72.6μlの18%SPRI)を使用して精製したライゲーション産物についての、1.16%アダプターダイマーおよび263bpの断片長代表値を示す。図49Bは、カラム精製を使用して精製したライゲーション産物についての6.13%アダプターダイマーおよび232bpの断片長代表値を示す。図49Cは、25ulのライゲーション産物に添加した5μlのイソプロパノールおよび45μlのTris緩衝液でのSPRI精製(72.6μlの18%SPRI)を使用して精製したライゲーション産物についての、1.26%アダプターダイマーおよび256bpの断片長代表値を示す。図49Dは、25ulのライゲーション産物に添加した10μlのイソプロパノールおよび40μlのTris緩衝液でのSPRI精製(72.6μlの18%SPRI)を使用して精製したライゲーション産物についての、1.66%アダプターダイマーおよび236bpの断片長代表値を示す。図49Eは、25ulのライゲーション産物に添加した20μlのイソプロパノールおよび30μlのTris緩衝液でのSPRI精製(72.6μlの18%SPRI)を使用して精製したライゲーション産物についての、7.53%アダプターダイマーおよび227bpの断片長代表値を示す。
この実験についての断片長代表値、アダプターダイマーパーセント、および増幅後の収量(濃度)を下の表7に提供する。
Figure 2022528139000010
さらなる実験では、新鮮な毛髪試料から得た150pgのDNAからライブラリーを生成した。この実験についてのある特定のパラメーターは、アダプターHyb=1:1.4(Ad:Sp);P5=1.6p rSAP;P7=0.4pホスホ、rSAPなし;SSB=64ngを含んだ。二本鎖アダプターの調製中に、P5アダプターのトップ鎖をP5アダプターの足場鎖に1:1.4の比でアニールし(すなわち、より多くの足場鎖をアニーリング中に付加させる)、P7アダプターのトップ鎖をP7アダプターの足場鎖に1:1.4の比でアニールした。1.6pmolの非リン酸化P5アダプターおよび0.4pmolのリン酸化P7アダプターを添加した。アダプターライゲーションステップの前に、DNA鋳型を64ngのSSBと併せた。ライゲーション後のSPRIビーズ精製ステップ中に、次のプロトコールに従って、イソプロパノールを緩衝液-試料混合物に添加した:
1)各反応について75μlの総体積のために様々な量のイソプロパノールおよびEBを25μlの試料に添加する
2)72.6μlの18%PEG SPRIビーズ溶液を添加し、SPRI精製を行なう
3)20μlのEBで溶出する
精製されたライゲーション産物を、100μlのAMPLITAQ GOLDを使用するPCR(15サイクル)により増幅させ、増幅産物を、1.2×での18%PEG SPRIビーズ精製を使用して精製した。PCR後の精製は、18%SPRIビーズ(SPRI溶液中18%PEG)使用する1.2×での精製であった。ライゲーション後の精製は、1.01× v/v比での精製であった(72.6ulの18%SPRIによって75ulの最終反応体積を得た)。一般に、ライゲーション後の精製におけるPEGの最終濃度は、ライゲーション産物が既にPEGを含有していたので、この実施例では約12%であった。
この実験についての断片長代表値、アダプターダイマーパーセント、および増幅後の収量(濃度)を下の表8に提供する。
Figure 2022528139000011
(実施例7)
実施形態の例
A1.核酸ライブラリーを生成する方法であって、
(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、
(a)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(b)核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(i)第1のssNA末端領域および(ii)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法。
A1.1 結合させるステップの前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップをさらに含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される、実施形態A1の方法。
A2.結合させるステップの前に、第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、実施形態A1またはA1.1の方法。
A3.複数の第1の足場二重鎖種が、ssNAと、約30:1の(第1の足場二重鎖種のssNAに対する)モル比で結合される、実施形態A2の方法。
A3.1 複数の第1の足場二重鎖種が、ssNAと、約15:1の(第1の足場二重鎖種のssNAに対する)モル比で結合される、実施形態A2の方法。
A4.結合させるステップの前に、複数の第1の足場二重鎖種と、ホスファターゼ活性を有する薬剤とを、第1の足場二重鎖種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1の足場二重鎖種が生成される、実施形態A2~A3.1のいずれか1つの方法。
A5.結合させるステップの前に、第1の足場ポリヌクレオチド種の各々が、第1のssNA末端領域とハイブリダイズされて複数の第1の足場-ssNA複合体を形成する、実施形態A1の方法。
A6.結合させるステップの前に、複数の第1の足場-ssNA複合体と、ホスファターゼ活性を有する薬剤とを、第1の足場-ssNA複合体が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1の足場-ssNA複合体が生成される、実施形態A5の方法。
A7.第1のオリゴヌクレオチドおよび第1のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態A1~A6のいずれか1つの方法。
A8.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態A7の方法。
A9.結合させるステップの前に、第2のオリゴヌクレオチドをssNAの5’末端に共有結合で連結させるステップを含む、実施形態A1~A8のいずれか1つの方法。
A10.第2のオリゴヌクレオチドを共有結合で連結させるステップの前に、ssNAと、ホスファターゼ活性を有する薬剤とを、ssNAが脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化されたssNAが生成される、実施形態A9の方法。
A11.第2のオリゴヌクレオチドが、3’末端にリン酸を含む、実施形態A9またはA10の方法。
A12.第2のオリゴヌクレオチドを共有結合で連結させるステップが、ssNAおよび第2のオリゴヌクレオチドと、一本鎖リガーゼ活性を有する薬剤とを、ssNAの5’末端が第2のオリゴヌクレオチドの3’末端に共有結合で連結される条件下で、接触させることを含む、実施形態A11の方法。
A13.リガーゼ活性を有する薬剤が、RtcBリガーゼである、実施形態A12の方法。
A14.核酸組成物と、(iv)第2のオリゴヌクレオチドおよび(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(c)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(d)核酸組成物、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第2の足場ポリヌクレオチド種の分子が(i)第2のssNA末端領域および(ii)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、実施形態A1からA8のいずれか一つの方法。
A14.1 結合させるステップの前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップをさらに含み、それによって、脱リン酸化された第2のオリゴヌクレオチドおよび/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、実施形態A14の方法。
A15.結合させるステップの前に、第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態A14またはA14.1の方法。
A16.複数の第1の足場二重鎖種が、ssNAと結合され、ssNAに共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物中間体が形成される、実施形態A15の方法。
A17.共有結合で連結されたハイブリダイゼーション産物中間体が、複数の第2の足場二重鎖種と結合され、複数の第2の足場二重鎖種に共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物が形成される、実施形態A16の方法。
A18.複数の第1の足場二重鎖種の中の二重鎖の一部またはすべてが、第1のオリゴヌクレオチドの5’末端にアデニル化修飾を含む、実施形態A15の方法。
A19.複数の第1の足場二重鎖種が、ATPの非存在下でssNAと結合され、ssNAに共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物中間体が形成される、実施形態A18の方法。
A20.共有結合で連結されたハイブリダイゼーション産物中間体が、複数の第2の足場二重鎖種およびATPと結合され、複数の第2の足場二重鎖種およびATPに共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物が形成される、実施形態A19の方法。
A21.複数の第2の足場二重鎖種が、ssNAと、約30:1の(第2の足場二重鎖種のssNAに対する)モル比で結合される、実施形態A15~A20のいずれか1つの方法。
A21.1 複数の第2の足場二重鎖種が、ssNAと、約15:1の(第2の足場二重鎖種のssNAに対する)モル比で結合される、実施形態A15~A20のいずれか1つの方法。
A22.結合させるステップの前に、複数の第2の足場二重鎖種と、ホスファターゼ活性を有する薬剤とを、第2の足場二重鎖種が脱リン酸化される条件下で接触させるステップを含み、それによって脱リン酸化された第2の足場二重鎖種が生成される、実施形態A15~A21.1のいずれか1つの方法。
A23.結合させるステップの前に、第2の足場ポリヌクレオチド種の各々が、第2のssNA末端領域とハイブリダイズされて複数の第2の足場-ssNA複合体を形成する、実施形態A14の方法。
A24.結合させるステップの前に、複数の第2の足場-ssNA複合体と、ホスファターゼ活性を有する薬剤とを、第2の足場-ssNA複合体が脱リン酸化される条件下で接触させるステップを含み、それによって脱リン酸化された第2の足場-ssNA複合体が生成される、実施形態A23の方法。
A25.第1のオリゴヌクレオチドおよび第1のssNA末端領域の隣接している末端を共有結合で連結させるステップ、ならびに第2のオリゴヌクレオチドおよび第2のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって共有結合で連結されたハイブリダイゼーション産物を生成する、実施形態A14~A24のいずれか1つの方法。
A26.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結され、かつ第2のssNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件下で、接触させることを含む、実施形態A25の方法。
A27.リガーゼ活性を有する薬剤が、T4 DNAリガーゼである、実施形態A8またはA26の方法。
A28.T4 DNAリガーゼが、25単位/μl未満の量で使用される、実施形態A27の方法。
A29.T4 DNAリガーゼが、約10単位/μlで使用される、実施形態A28の方法。
A30.結合させるステップおよび共有結合で連結させるステップが、1時間またはそれ未満で行なわれる、実施形態A7~A29のいずれか1つの方法。
A31.結合させるステップおよび共有結合で連結させるステップが、30分またはそれ未満で行なわれる、実施形態A7~A29のいずれか1つの方法。
A32.結合させるステップおよび共有結合で連結させるステップが、約5分で行なわれる、実施形態A7~A29のいずれか1つの方法。
A33.結合させるステップおよびライゲーションするステップが、単一容器内で行なわれる、実施形態A7~A32のいずれか1つの方法。
A34.結合させるステップおよびライゲーションするステップが、約25μlの反応体積で行なわれる、実施形態A7~A33のいずれか1つの方法。
A35.結合させるステップの前またはステップ中に、ssNAと、ホスホリル転移活性を有する薬剤とを、5’リン酸がssNAの5’末端に付加される条件下で接触させることを含む、実施形態A1~A34のいずれか1つの方法。
A36.ハイブリダイゼーション産物を形成するステップの後、かつ共有結合で連結させるステップの前に、ssNAと、ホスホリル転移活性を有する薬剤とを、5’リン酸がssNAの5’末端に付加される条件下で接触させるステップを含む、実施形態A7~A34のいずれか1つの方法。
A37.結合させるステップの前またはステップ中に、第1のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第1のオリゴヌクレオチドの5’末端に付加される条件下で接触させることを含む、実施形態A1~A36のいずれか1つの方法。
A38.結合させるステップの前またはステップ中に、第2のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第2のオリゴヌクレオチドの5’末端に付加される条件下で接触させることを含む、実施形態A14~A36のいずれか1つの方法。
A39.ハイブリダイゼーション産物を形成するステップの後、かつ共有結合で連結させるステップの前に、第1のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第1のオリゴヌクレオチドの5’末端に付加される条件下で接触させるステップを含む、実施形態A7~A36のいずれか1つの方法。
A40.ハイブリダイゼーション産物を形成するステップの後、かつ共有結合で連結させるステップの前に、第2のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第2のオリゴヌクレオチドの5’末端に付加される条件下で接触させるステップを含む、実施形態A14~A36のいずれか1つの方法。
A41.ホスホリル転移活性を有する薬剤の使用を含まない、実施形態A1~A34のいずれか1つの方法。
A42.結合させるステップおよび共有結合で連結させるステップの後に、共有結合で連結されたハイブリダイゼーション産物を精製するステップをさらに含む、実施形態A7~A41のいずれか1つの方法。
A43.共有結合で連結されたハイブリダイゼーション産物が、固相可逆的固定法を含む精製プロセスにより精製される、実施形態A42の方法。
A43.1 精製プロセスが、共有結合で連結されたハイブリダイゼーション産物と固相可逆的固定法ビーズおよび緩衝液とを接触させるステップを含む、実施形態A43の方法。
A43.2 緩衝液が、イソプロパノールを含む、実施形態A43.1の方法。
A43.3 緩衝液が、約10% v/vイソプロパノール~約40% v/vイソプロパノールを含む、実施形態A43.2の方法。
A43.4 緩衝液が、約20% v/vイソプロパノールを含む、実施形態A43.2の方法。
A43.5 共有結合で連結されたハイブリダイゼーション産物が、連続的固相可逆的固定法を含む精製プロセスにより精製される、実施形態にA43~A43.4のいずれか1つの方法。
A43.6 共有結合で連結されたハイブリダイゼーション産物が、逐次的固相可逆的固定法を含む精製プロセスにより精製される、実施形態A43~A43.4のいずれか1つの方法。
A44.共有結合で連結されたハイブリダイゼーション産物が、カラム精製を含まない精製プロセスにより精製される、実施形態A42~A43.2のいずれか1つの方法。
A45.共有結合で連結されたハイブリダイゼーション産物が、結合させるステップおよび共有結合で連結させるステップの後に精製されない、実施形態A7~A41のいずれか1つの方法。
A46.第1のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態A1からA45のいずれか1つの方法。
A47.第2のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態A14からA46のいずれか1つの方法。
A48.ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態A1からA47のいずれか1つの方法。
A49.ssNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、実施形態A1からA47のいずれか1つの方法。
A50.ssNAハイブリダイゼーション領域が、約10またはそれ未満の塩基を含む、実施形態A1~A49のいずれか1つの方法。
A51.第1のオリゴヌクレオチドが、第1のプライマー結合ドメインを含む、実施形態A1~A50のいずれか1つの方法。
A52.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態A51の方法。
A53.第2のオリゴヌクレオチドが、第2のプライマー結合ドメインを含む、実施形態A14~A52のいずれか1つの方法。
A54.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態A53の方法。
A55.第1のオリゴヌクレオチドが、第1のシーケンシングアダプターまたはその一部を含む、実施形態A1~A54のいずれか1つの方法。
A56.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態A55の方法。
A57.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態A55の方法。
A58.第2のオリゴヌクレオチドが、第2のシーケンシングアダプターまたはその一部を含む、実施形態A14~A57のいずれか1つの方法。
A59.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態A58の方法。
A60.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態A58の方法。
A61.第1のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態A1~A60のいずれか1つの方法。
A62.第1のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態A61の方法。
A63.第2のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態A14~A62のいずれか1つの方法。
A64.第2のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態A63の方法。
A65.第1のオリゴヌクレオチドが、インデックスを含む、実施形態A1~A64のいずれか1つの方法。
A66.第1のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態A65の方法。
A67.第2のオリゴヌクレオチドが、インデックスを含む、実施形態A14~A66のいずれか1つの方法。
A68.第2のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態A67の方法。
A69.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態A1~A68のいずれか1つの方法。
A70.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態A14~A69のいずれか1つの方法。
A71.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチドの共有結合性連結を遮断することができる、実施形態A69またはA70の方法。
A72.オリゴヌクレオチドが、ssNAに隣接していない末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態A69、A70またはA71に記載の方法。
A73.第1の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態A1~A72のいずれか1つの方法。
A74.第2の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態A14~A73のいずれか1つの方法。
A75.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる、実施形態A73またはA74の方法。
A76.足場ポリヌクレオチドが、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態A73からA75のいずれか1つの方法。
A77.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態A69からA76のいずれか1つの方法。
A78.核酸組成物が、一本鎖DNA(ssDNA)を含む、実施形態A1~A77のいずれか1つの方法。
A79.ssDNAが、二本鎖DNA(dsDNA)に由来する、実施形態A78の方法。
A80.結合させるステップの前に、dsDNAを変性させるステップを含み、それによってssDNAが生成される、実施形態A79の方法。
A81.核酸組成物が、一本鎖RNA(ssRNA)を含む、実施形態A1~A77のいずれか1つの方法。
A82.ssNAが、結合させるステップの前に修飾されない、実施形態A1~A81のいずれか1つの方法。
A83.ssNAが、結合させるステップの前または結合させるステップ中に、一本鎖核酸結合タンパク質(SSB)と結合されない、実施形態A1~A82のいずれか1つの方法。
A84.結合させるステップの前に、ssNAと一本鎖核酸結合剤とを接触させるステップを含む、実施形態A1~A82のいずれか1つの方法。
A84.1 結合させるステップの前に、ssNAと一本鎖核酸結合タンパク質(SSB)とを接触させて、SSB結合ssNAを生成するステップを含む、実施形態A1~A82のいずれか1つの方法。
A85.ssNAが第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種と結合されたとき、ssNAの一方または両方のネイティブ末端が存在する、実施形態A1~A84.1のいずれか1つの方法。
A86.ssNAが、無細胞核酸からのものである、実施形態A1~A85のいずれか1つの方法。
A87.核酸組成物が、約250pg~約5ngのssNAを含む、実施形態A1~A86のいずれか1つの方法。
A88.核酸組成物が、約1ngのssNAを含む、実施形態A1~A87のいずれか1つの方法。
A89.核酸組成物が、ssNAから本質的になる、実施形態A1~A88のいずれか1つの方法。
A90.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって一本鎖ライゲーション産物が生成される、実施形態A7~A89のいずれか1つの方法。
A91.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって増幅ライゲーション産物が生成される、実施形態A90の方法。
A92.増幅ライゲーション産物を精製するステップをさらに含む、実施形態A91の方法。
A93.増幅ライゲーション産物が、固相可逆的固定法を含む精製プロセスにより精製される、実施形態A92の方法。
A94.増幅ライゲーション産物が、連続的固相可逆的固定法を含む精製プロセスにより精製される、実施形態A93の方法。
A95.増幅ライゲーション産物が、逐次的固相可逆的固定法を含む精製プロセスにより精製される、実施形態A93の方法。
A96.増幅ライゲーション産物が、カラム精製を含まない精製プロセスにより精製される、実施形態A92~A95のいずれか1つの方法。
A97.増幅ライゲーション産物が、増幅させるステップの後に精製されない、実施形態A91の方法。
A98.増幅ライゲーション産物をシーケンシングするステップをさらに含む、実施形態A91~A97のいずれか1つの方法。
A99.一本鎖ライゲーション産物が、増幅されない、実施形態A90の方法。
A100.ライゲーション産物をシーケンシングするステップをさらに含む、実施形態A99の方法。
A101.第1の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態A2~A100のいずれか1つの方法。
A102.第2の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態A15~A101のいずれか1つの方法。
A103.オーバーハングが、ssNAハイブリダイゼーション領域を含む、実施形態A101またはA102の方法。
A104.第1の足場二重鎖種、第1のオリゴヌクレオチド、および/または複数の第1の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態A2~A103のいずれか1つの方法。
A105.第2の足場二重鎖種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態A15~A104のいずれか1つの方法。
A106.一本鎖ライゲーション産物と、第3のオリゴヌクレオチドとを、第3のオリゴヌクレオチドが、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズされる条件下で結合させるステップをさらに含み、それによって、オリゴヌクレオチドダイマーハイブリダイゼーション産物が形成される、実施形態A90からA105のいずれか1つの方法。
A107.オリゴヌクレオチドダイマーハイブリダイゼーション産物が、切断部位を含む、実施形態A106の方法。
A108.切断部位が、制限酵素認識部位である、実施形態A107の方法。
A109.オリゴヌクレオチドダイマーハイブリダイゼーション産物と切断剤とを接触させるステップをさらに含む、実施形態A106からA108のいずれか1つの方法。
A110.複数の第1の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態A1~A109のいずれか1つの方法。
A111.複数の第2の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態A14~A110のいずれか1つの方法。
A112.第1のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態A1~A111のいずれか1つの方法。
A113.第2のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態A14~A110のいずれか1つの方法。
A114.共有結合で連結されたハイブリダイゼーション産物とウラシル-DNAグリコシラーゼおよびエンドヌクレアーゼとを接触させるステップをさらに含む、実施形態A110~A113のいずれか1つの方法。
A115.一本鎖ライゲーション産物と、シーケンシングアダプター、UMIおよびインデックスのうちの1つまたは複数を含む伸長プライマーとを、ハイブリダイゼーション条件下で接触させるステップをさらに含み、それによって、伸長プライマーとハイブリダイズされた一本鎖ライゲーション産物が生成される、実施形態A90~A114のいずれか1つの方法。
A116.伸長プライマーにハイブリダイズされた一本鎖ライゲーション産物を伸長させるステップをさらに含み、それによって伸長産物が生成される、実施形態A115の方法。
A117.伸長産物を増幅させるステップをさらに含み、それによって増幅伸長産物が生成される、実施形態A116の方法。
A118.増幅伸長産物をシーケンシングするステップをさらに含む、実施形態A117の方法。
A119.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、DNAを含む、実施形態A1~A118のいずれか1つの方法。
A120.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、RNAを含む、実施形態A1~A118のいずれか1つの方法。
A121.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、DNAを含む、実施形態A1からA120のいずれか1つの方法。
A122.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、RNAを含む、実施形態A1からA120のいずれか1つの方法。
A123.結合させるステップの前に、核酸組成物とヌクレアーゼとを接触させるステップを含む、実施形態A1~A122のいずれか1つの方法。
A124.ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、実施形態A123の方法。
B1.一本鎖核酸(ssNA)を含む核酸組成物と、
第1のオリゴヌクレオチドと、
ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種と
を含む、組成物。
B2.第2のオリゴヌクレオチドと、
ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第2の足場ポリヌクレオチド種と
をさらに含む、実施形態B1の組成物。
B3.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドとハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態B1またはB2の組成物。
B4.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドとハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態B2またはB3の組成物。
B5.複数の第1の足場二重鎖種およびssNAが、約30:1の(第1の足場二重鎖種のssNAに対する)モル比で存在する、実施形態B3またはB4の組成物。
B6.複数の第1の足場二重鎖種およびssNAが、約15:1の(第1の足場二重鎖種のssNAに対する)モル比で存在する、実施形態B3またはB4の組成物。
B7.複数の第2の足場二重鎖種およびssNAが、約30:1の(第2の足場二重鎖種のssNAに対する)モル比で存在する、実施形態B4、B5またはB6の組成物。
B8.複数の第2の足場二重鎖種およびssNAが、約15:1の(第2の足場二重鎖種のssNAに対する)モル比で存在する、実施形態B3またはB4の組成物。
B9.第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、および/または複数の第1の足場二重鎖種が、脱リン酸化されている、実施形態B3~B8のいずれか1つの組成物。
B10.第2のオリゴヌクレオチド、複数の第2の足場ポリヌクレオチド種、および/または複数の第2の足場二重鎖種が、脱リン酸化されている、実施形態B4~B9のいずれか1つの組成物。
B11.オリゴヌクレオチドの末端をssNA末端領域の末端に共有結合で連結させるための薬剤をさらに含む、実施形態B1~B10のいずれか1つの組成物。
B12.薬剤が、リガーゼである、実施形態B11の組成物。
B13.リガーゼが、T4リガーゼである、実施形態B12の組成物。
B14.T4リガーゼが、25単位/μl未満の量で存在する、実施形態B13の組成物。
B15.T4リガーゼが、約10単位/μlで存在する、実施形態B14の組成物。
B16.ssNAが、5’末端においてリン酸化されている、実施形態B1~B15のいずれか1つの組成物。
B16.1 ssNAが脱リン酸化されている、実施形態B1~B15のいずれか1つの組成物。
B17.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、3’リン酸を含む、実施形態B1~B16.1のいずれか1つの組成物。
B18.ssNA末端領域の5’末端を、3’リン酸を含む第1のオリゴヌクレオチドまたは3’リン酸を含む第2のオリゴヌクレオチドの3’末端に、共有結合で連結させるための薬剤をさらに含む、実施形態B17の組成物。
B19.薬剤が、一本鎖リガーゼである、実施形態B18の組成物。
B20.リガーゼが、RtcBリガーゼである、実施形態B19の組成物。
B21.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、5’末端にアデニル化修飾を含む、実施形態B1~B17のいずれか1つの組成物。
B22.ATP不含である、実施形態B21の組成物。
B23.ホスホリル転移活性を有する薬剤をさらに含む、実施形態B1~B22のいずれか1つの組成物。
B24.ホスホリル転移活性を有する薬剤を含まない、実施形態B1~B22のいずれか1つの組成物。
B25.第1の足場ポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態B1からB24のいずれか1つの組成物。
B26.第2の足場ポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態B2からB25のいずれか1つの組成物。
B27.ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態B1からB26のいずれか1つの組成物。
B28.ssNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、実施形態B1からB26のいずれか1つの組成物。
B29.ssNAハイブリダイゼーション領域が、約10またはそれ未満の塩基を含む、実施形態B1~B28のいずれか1つの組成物。
B30.第1のオリゴヌクレオチドが、第1のプライマー結合ドメインを含む、実施形態B1~B29のいずれか1つの組成物。
B31.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態B30の組成物。
B32.第2のオリゴヌクレオチドが、第2のプライマー結合ドメインを含む、実施形態B2~B31のいずれか1つの組成物。
B33.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態B32の組成物。
B34.第1のオリゴヌクレオチドが、第1のシーケンシングアダプターまたはその一部を含む、実施形態B1~B33のいずれか1つの組成物。
B35.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態B34の組成物。
B36.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態B34の組成物。
B37.第2のオリゴヌクレオチドが、第2のシーケンシングアダプターまたはその一部を含む、実施形態B2~B36のいずれか1つの組成物。
B38.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態B37の組成物。
B39.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態B37の組成物。
B40.第1のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態B1~B39のいずれか1つの組成物。
B41.第1のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態B40の組成物。
B42.第2のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態B2~B41のいずれか1つの組成物。
B43.第2のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態B42の組成物。
B44.第1のオリゴヌクレオチドが、インデックスを含む、実施形態B1~B43のいずれか1つの組成物。
B45.第1のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態B44の組成物。
B46.第2のオリゴヌクレオチドが、インデックスを含む、実施形態B2~B45のいずれか1つの組成物。
B47.第2のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態B46の組成物。
B48.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態B1~B47のいずれか1つの組成物。
B49.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態B2~B48のいずれか1つの組成物。
B50.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチドの共有結合性連結を遮断することができる、実施形態B48またはB49の組成物。
B51.オリゴヌクレオチドが、ssNA末端領域に隣接することにならない末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態B48、B49またはB50に記載の組成物。
B52.第1の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態B1~B51のいずれか1つの組成物。
B53.第2の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態B2~B52のいずれか1つの組成物。
B54.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる、実施形態B52またはB53の組成物。
B55.足場ポリヌクレオチドが、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態B52からB54のいずれか1つの組成物。
B56.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態B48からB55のいずれか1つの組成物。
B57.核酸組成物が、一本鎖DNA(ssDNA)を含む、実施形態B1~B56のいずれか1つの組成物。
B58.ssDNAが、二本鎖DNA(dsDNA)に由来する、実施形態B57の組成物。
B59.核酸組成物が、一本鎖RNA(ssRNA)を含む、実施形態B1~B56のいずれか1つの組成物。
B60.一本鎖核酸結合剤をさらに含む、実施形態B1~B59のいずれか1つの組成物。
B60.1 一本鎖核酸結合タンパク質(SSB)をさらに含む、実施形態B1~B59のいずれか1つの組成物。
B61.SSB不含である、実施形態B1~B60のいずれか1つの組成物。
B62.核酸組成物が、ssNAから本質的になる、実施形態B1~B59およびB61のいずれか1つの組成物。
B63.ssNAが、未修飾ssNAである、実施形態B1~B62のいずれか1つの組成物。
B64.ssNAが、一方の末端または両方の末端にネイティブ末端を含む、実施形態B1~B63のいずれか1つの組成物。
B65.ssNAが、無細胞核酸からのものである、実施形態B1~B64のいずれか1つの組成物。
B66.約250pg~約5ngのssNAを含む、実施形態B1~B65のいずれか1つの組成物。
B67.約1ngのssNAを含む、実施形態B1~B66のいずれか1つの組成物。
B68.第1の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態B3~B67のいずれか1つの組成物。
B69.第2の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態B4~B68のいずれか1つの組成物。
B70.オーバーハングが、ssNAハイブリダイゼーション領域を含む、実施形態B68またはB69の組成物。
B71.第1の足場二重鎖種、第1のオリゴヌクレオチド、および/または複数の第1の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態B3~B70のいずれか1つの組成物。
B72.第2の足場二重鎖種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態B4~B71のいずれか1つの組成物。
B73.第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズすることができる、第3のオリゴヌクレオチドをさらに含む、実施形態B2~B72のいずれか1つの組成物。
B74.第3のオリゴヌクレオチドが、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズされたときに切断部位を形成する配列を含む、実施形態B73の組成物。
B75.切断部位が、制限酵素認識部位である、実施形態B74の組成物。
B76.切断剤をさらに含む、実施形態B73~B75のいずれか1つの組成物。
B77.約25μlの体積の水溶液中に存在する、実施形態B1~B76のいずれか1つの組成物。
B78.複数の第1の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態B1~B77のいずれか1つの組成物。
B79.複数の第2の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態B2~B78のいずれか1つの組成物。
B80.第1のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態B1~B79のいずれか1つの組成物。
B81.第2のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態B2~B80のいずれか1つの組成物。
B82.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、DNAを含む、実施形態B1~B81のいずれか1つの組成物。
B83.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、RNAを含む、実施形態B1~B81のいずれか1つの組成物。
B84.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、DNAを含む、実施形態B1からB83のいずれか1つの組成物。
B85.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、RNAを含む、実施形態B1からB83のいずれか1つの組成物。
B86.ヌクレアーゼをさらに含む、実施形態B1~B85のいずれか1つの組成物。
B87.ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、実施形態B86の組成物。
C1.第1のオリゴヌクレオチドと、
ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種と、
第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種を使用して核酸ライブラリーを生成するための使用説明書と
を含む、キット。
C2.第2のオリゴヌクレオチドと、
ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第2の足場ポリヌクレオチド種と
をさらに含み、使用説明書が、第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種を使用して核酸ライブラリーを生成するためのものである、実施形態C1のキット。
C3.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドとハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態C1またはC2のキット。
C4.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドとハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態C2またはC3のキット。
C5.使用説明書が、複数の第1の足場二重鎖種およびssNAを、約30:1の(第1の足場二重鎖種のssNAに対する)モル比で合わせることを含む、実施形態C3またはC4のキット。
C6.使用説明書が、複数の第1の足場二重鎖種およびssNAを、約15:1の(第1の足場二重鎖種のssNAに対する)モル比で合わせることを含む、実施形態C3またはC4のキット。
C7.使用説明書が、複数の第2の足場二重鎖種およびssNAを、約30:1の(第2の足場二重鎖種のssNAに対する)モル比で合わせることを含む、実施形態C4、C5またはC6のキット。
C8.使用説明書が、複数の第2の足場二重鎖種およびssNAを、約15:1の(第2の足場二重鎖種のssNAに対する)モル比で合わせることを含む、実施形態C3またはC4のキット。
C9.第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、および/または複数の第1の足場二重鎖種が、脱リン酸化されている、実施形態C3~C8のいずれか1つのキット。
C10.第2のオリゴヌクレオチド、複数の第2の足場ポリヌクレオチド種、および/または複数の第2の足場二重鎖種が、脱リン酸化されている、実施形態C4~C9のいずれか1つのキット。
C11.オリゴヌクレオチドの末端をssNA末端領域の末端に共有結合で連結させるための薬剤をさらに含む、実施形態C1~C10のいずれか1つのキット。
C12.薬剤が、リガーゼである、実施形態C11のキット。
C13.リガーゼが、T4リガーゼである、実施形態C12のキット。
C14.T4リガーゼが、25単位/μl未満の量で存在する、実施形態C13のキット。
C15.T4リガーゼが、約10単位/μlで存在する、実施形態C14のキット。
C16.ホスファターゼをさらに含む、実施形態C1~C15のいずれか1つのキット。
C17.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、3’リン酸を含む、実施形態C1~C16のいずれか1つのキット。
C18.ssNA末端領域の5’末端を、3’リン酸を含む第1のオリゴヌクレオチドまたは3’リン酸を含む第2のオリゴヌクレオチドの3’末端に、共有結合で連結させるための薬剤をさらに含む、実施形態C17のキット。
C19.薬剤が、一本鎖リガーゼである、実施形態C18のキット。
C20.リガーゼが、RtcBリガーゼである、実施形態C19のキット。
C21.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、5’末端にアデニル化修飾を含む、実施形態C1~C17のいずれか1つのキット。
C22.ATP不含である、実施形態C21のキット。
C23.ホスホリル転移活性を有する薬剤をさらに含む、実施形態C1~C22のいずれか1つのキット。
C24.ホスホリル転移活性を有する薬剤を含まない、実施形態C1~C22のいずれか1つのキット。
C25.第1の足場ポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態C1からC24のいずれか1つのキット。
C26.第2の足場ポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態C2からC25のいずれか1つのキット。
C27.ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態C1からC26のいずれか1つのキット。
C28.ssNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、実施形態C1からC26のいずれか1つのキット。
C29.ssNAハイブリダイゼーション領域が、約10またはそれ未満の塩基を含む、実施形態C1~C28のいずれか1つのキット。
C30.第1のオリゴヌクレオチドが、第1のプライマー結合ドメインを含む、実施形態C1~C29のいずれか1つのキット。
C31.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態C30のキット。
C32.第2のオリゴヌクレオチドが、第2のプライマー結合ドメインを含む、実施形態C2~C31のいずれか1つのキット。
C33.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態C32のキット。
C34.第1のオリゴヌクレオチドが、第1のシーケンシングアダプターまたはその一部を含む、実施形態C1~C33のいずれか1つのキット。
C35.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態C34のキット。
C36.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態C34のキット。
C37.第2のオリゴヌクレオチドが、第2のシーケンシングアダプターまたはその一部を含む、実施形態C2~C36のいずれか1つのキット。
C38.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態C37のキット。
C39.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態C37のキット。
C40.第1のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態C1~C39のいずれか1つのキット。
C41.第1のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態C40のキット。
C42.第2のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態C2~C41のいずれか1つのキット。
C43.第2のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態C42のキット。
C44.第1のオリゴヌクレオチドが、インデックスを含む、実施形態C1~C43のいずれか1つのキット。
C45.第1のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態C44のキット。
C46.第2のオリゴヌクレオチドが、インデックスを含む、実施形態C2~C45のいずれか1つのキット。
C47.第2のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態C46のキット。
C48.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態C1~C47のいずれか1つのキット。
C49.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態C2~C48のいずれか1つのキット。
C50.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチドの共有結合性連結を遮断することができる、実施形態C48またはC49のキット。
C51.オリゴヌクレオチドが、ssNA末端領域に隣接することにならない末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態C48、C49またはC50に記載のキット。
C52.第1の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態C1~C51のいずれか1つのキット。
C53.第2の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態C2~C52のいずれか1つのキット。
C54.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる、実施形態C52またはC53のキット。
C55.足場ポリヌクレオチドが、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態C52からC54のいずれか1つのキット。
C56.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態C48からC55のいずれか1つのキット。
C57.使用説明書が、第1のオリゴヌクレオチドおよび複数の第1のポリヌクレオチド種と、一本鎖核酸(ssNA)を含む核酸組成物とを結合させることを含む、実施形態C1~C56のいずれか1つのキット。
C58.ssNAが、一本鎖DNA(ssDNA)を含む、実施形態C57のキット。
C59.ssNAが、一本鎖RNA(ssRNA)を含む、実施形態C57のキット。
C60.一本鎖核酸結合剤をさらに含む、実施形態C1~C59のいずれか1つのキット。
C60.1 一本鎖核酸結合タンパク質(SSB)をさらに含む、実施形態C1~C59のいずれか1つのキット。
C61.SSB不含である、実施形態C1~C60のいずれか1つのキット。
C62.核酸組成物が、ssNAから本質的になる、実施形態C57~C59およびC61のいずれか1つのキット。
C63.ssNAが、未修飾ssNAである、実施形態C57~C62のいずれか1つのキット。
C64.ssNAが、一方の末端または両方の末端にネイティブ末端を含む、実施形態C57~C63のいずれか1つのキット。
C65.ssNAが、無細胞核酸からのものである、実施形態C57~C64のいずれか1つのキット。
C66.使用説明書が、第1のオリゴヌクレオチドおよび複数の第1のポリヌクレオチド種と、約250pg~約5ngのssNAを含む核酸組成物とを結合させることを含む、実施形態C57~C65のいずれか1つのキット。
C67.使用説明書が、第1のオリゴヌクレオチドおよび複数の第1のポリヌクレオチド種と、約1ngのssNAを含む核酸組成物とを結合させることを含む、実施形態C57~C66のいずれか1つのキット。
C68.第1の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態C3~C67のいずれか1つのキット。
C69.第2の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態C4~C68のいずれか1つのキット。
C70.オーバーハングが、ssNAハイブリダイゼーション領域を含む、実施形態C68またはC69のキット。
C71.第1の足場二重鎖種、第1のオリゴヌクレオチド、および/または複数の第1の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態C3~C70のいずれか1つのキット。
C72.第2の足場二重鎖種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態C4~C71のいずれか1つのキット。
C73.第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズすることができる、第3のオリゴヌクレオチドをさらに含む、実施形態C2~C72のいずれか1つのキット。
C74.第3のオリゴヌクレオチドが、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズされたときに切断部位を形成する配列を含む、実施形態C73のキット。
C75.切断部位が、制限酵素認識部位である、実施形態C74のキット。
C76.切断剤をさらに含む、実施形態C73~C75のいずれか1つのキット。
C77.核酸を精製するための試薬をさらに含む、実施形態C1~C76のいずれか1つのキット。
C77.1 核酸を精製するための試薬が、固相可逆的固定法ビーズおよび緩衝液を含む、実施形態C77のキット。
C77.2 緩衝液が、イソプロパノールを含む、実施形態C77.1のキット。
C77.3 緩衝液が、約10% v/vイソプロパノール~約40% v/vイソプロパノールを含む、実施形態C77.2のキット。
C77.4 緩衝液が、約20% v/vイソプロパノールを含む、実施形態C77.2のキット。
C78.核酸を増幅するための試薬をさらに含む、実施形態C1~C77.4のいずれか1つのキット。
C79.複数の第1の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態C1~C78のいずれか1つのキット。
C80.複数の第2の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態C2~C79のいずれか1つのキット。
C81.第1のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態C1~C80のいずれか1つのキット。
C82.第2のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態C2~C81のいずれか1つのキット。
C83.ウラシル-DNAグリコシラーゼおよびエンドヌクレアーゼをさらに含む、実施形態C78~C82のいずれか1つのキット。
C84.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、DNAを含む、実施形態C1~C83のいずれか1つのキット。
C85.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、RNAを含む、実施形態C1~C83のいずれか1つのキット。
C86.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、DNAを含む、実施形態C1からC85のいずれか1つのキット。
C87.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、RNAを含む、実施形態C1からC85のいずれか1つのキット。
C88.ヌクレアーゼをさらに含む、実施形態C1~C87のいずれか1つのキット。
C89.ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、実施形態C88のキット。
D1.核酸ライブラリーを生成する方法であって、
(i)一本鎖核酸リボ核酸(ssRNA)または一本鎖相補デオキシリボ核酸(sscDNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、
(a)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssRNAまたはsscDNAハイブリダイゼーション領域、および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;および
(b)核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(i)第1のssRNAまたはsscDNA末端領域および(ii)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssRNAまたはsscDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法。
D1.1 結合させるステップの前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップをさらに含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される、実施形態D1の方法。
D2.核酸組成物が、sscDNAを含む、実施形態D1またはD1.1の方法。
D3.結合させるステップの前に、sscDNAを一本鎖リボ核酸(ssRNA)から生成するステップを含む、実施形態D2の方法。
D4.sscDNAを生成するステップが、ssRNAと、プライマー、および逆転写酵素活性を有する薬剤とを接触させることによって、DNA-RNA二重鎖を生成することを含む、実施形態D3の方法。
D5.sscDNAを生成するステップが、DNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることによって、RNAを消化し、sscDNA産物を生成することを含む、実施形態D4の方法。
D6.sscDNA産物を精製するステップをさらに含む、実施形態D5の方法。
D7.逆転写酵素活性を有する薬剤が、RNAse活性も有する、実施形態D5またはD6の方法。
D8.薬剤が、M-MuLV逆転写酵素である、実施形態D7の方法。
D9.プライマーが、ランダムヘキサマープライマー、ランダムオクタマープライマー、およびポリ(T)プライマーのうちの1つまたは複数から選択される、実施形態D4~D8のいずれか1つの方法。
D10.核酸組成物が、ssRNAを含む、実施形態D1の方法。
D11.一本鎖ライゲーション産物をハイブリダイゼーション産物から生成するステップをさらに含む、実施形態D10の方法。
D12.一本鎖ライゲーション産物と、プライマー、および逆転写酵素活性を有する薬剤とを接触させることによって、DNA-RNA二重鎖を生成するステップをさらに含む、実施形態D11の方法。
D13.DNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることによって、RNAを消化し、一本鎖cDNA(sscDNA)産物を生成するステップをさらに含む、実施形態D12の方法。
D14.sscDNA産物を精製するステップをさらに含む、実施形態D13の方法。
D15.逆転写酵素活性を有する薬剤が、RNAse活性も有する、実施形態D13またはD14の方法。
D16.薬剤が、M-MuLV逆転写酵素である、実施形態D15の方法。
D17.プライマーが、第1のオリゴヌクレオチド中の配列に相補的なヌクレオチド配列を含む、実施形態D12~D16のいずれか1つの方法。
D17.1 sscDNA産物を増幅させることによって、増幅sscDNA産物を生成するステップをさらに含む、実施形態D13~D16のいずれか1つの方法。
D17.2 DNA-RNA二重鎖を生成するステップ、sscDNA産物を生成するステップ、および増幅sscDNA産物を生成するステップが、単一容器内でおよび/または単一体積で行なわれる、実施形態D17.1の方法。
D18.結合させるステップの前に、ssRNAを断片化することによって、ssRNA断片を生成するステップを含む、実施形態D1~D17.2のいずれか1つの方法。
D19.結合させるステップの前に、リボソームRNA(rRNA)を枯渇させるおよび/またはメッセンジャーRNA(mRNA)を濃縮するステップを含む、実施形態D1~D18のいずれか1つの方法。
D20.結合させるステップの前に、第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、実施形態D1~D19のいずれか1つの方法。
D21.複数の第1の足場二重鎖種が、ssRNAまたはsscDNAと、約30:1の(第1の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で結合される、実施形態D20の方法。
D22 複数の第1の足場二重鎖種が、ssRNAまたはsscDNAと、約15:1の(第1の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で結合される、実施形態D20の方法。
D23.結合させるステップの前に、複数の第1の足場二重鎖種と、ホスファターゼ活性を有する薬剤とを、第1の足場二重鎖種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1の足場二重鎖種が生成される、実施形態D1~D22のいずれか1つの方法。
D24.結合させるステップの前に、第1の足場ポリヌクレオチド種の各々が、第1のssRNAまたはsscDNA末端領域とハイブリダイズされて複数の第1の足場-ssRNAまたは第1の足場-sscDNA複合体を形成する、実施形態D1~D19のいずれか1つの方法。
D25.結合させるステップの前に、複数の第1の足場-ssRNA複合体または第1の足場-sscDNA複合体と、ホスファターゼ活性を有する薬剤とを、第1の足場-ssRNA複合体または第1の足場-sscDNA複合体が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1の足場-ssRNA複合体または第1の足場-sscDNA複合体が生成される、実施形態D24の方法。
D26.第1のオリゴヌクレオチドおよび第1のssRNAまたはsscDNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態D1~D25のいずれか1つの方法。
D27.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssRNAまたはsscDNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態D26の方法。
D28.結合させるステップの前に、第2のオリゴヌクレオチドをssRNAまたはsscDNAの5’末端に共有結合で連結させるステップを含む、実施形態D1~D27のいずれか1つの方法。
D29.第2のオリゴヌクレオチドを共有結合で連結させるステップの前に、ssRNAまたはsscDNAと、ホスファターゼ活性を有する薬剤とを、ssRNAまたはsscDNAが脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化されたssRNAまたはsscDNAが生成される、実施形態D28の方法。
D30.第2のオリゴヌクレオチドが、3’末端にリン酸を含む、実施形態D28またはD29の方法。
D31.第2のオリゴヌクレオチドを共有結合で連結させるステップが、ssRNAまたはsscDNAおよび第2のオリゴヌクレオチドと、一本鎖リガーゼ活性を有する薬剤とを、ssRNAまたはsscDNAの5’末端が第2のオリゴヌクレオチドの3’末端に共有結合で連結される条件下で、接触させることを含む、実施形態D30の方法。
D32.リガーゼ活性を有する薬剤が、RtcBリガーゼである、実施形態D31の方法。
D33.核酸組成物と、(iv)第2のオリゴヌクレオチドおよび(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(c)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssRNAまたはsscDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(d)核酸組成物、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第2の足場ポリヌクレオチド種の分子が(i)第2のssRNAまたはsscDNA末端領域および(ii)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第2のssRNAまたはsscDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、実施形態D1からD27のいずれか一つの方法。
D33.1 結合させるステップの前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップをさらに含み、それによって、脱リン酸化された第2のオリゴヌクレオチドおよび/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、実施形態D33の方法。
D33.2 実施形態D17のプライマーが、第2のオリゴヌクレオチド中の配列に相補的なヌクレオチド配列を含む、実施形態D33またはD33.1の方法。
D34.結合させるステップの前に、第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態D33、D33.1またはD33.2のいずれか一つの方法。
D35.複数の第1の足場二重鎖種が、ssRNAまたはsscDNAと結合され、ssRNAまたはsscDNAに共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物中間体が形成される、実施形態D34の方法。
D36.共有結合で連結されたハイブリダイゼーション産物中間体が、複数の第2の足場二重鎖種と結合され、複数の第2の足場二重鎖種に共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物が形成される、実施形態D35の方法。
D37.複数の第1の足場二重鎖種の中の二重鎖の一部またはすべてが、第1のオリゴヌクレオチドの5’末端にアデニル化修飾を含む、実施形態D34の方法。
D38.複数の第1の足場二重鎖種が、ATPの非存在下でssRNAまたはsscDNAと結合され、ssRNAまたはsscDNAに共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物中間体が形成される、実施形態D37の方法。
D39.共有結合で連結されたハイブリダイゼーション産物中間体が、複数の第2の足場二重鎖種およびATPと結合され、複数の第2の足場二重鎖種およびATPに共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物が形成される、実施形態D38の方法。
D40.複数の第2の足場二重鎖種が、ssRNAまたはsscDNAと、約30:1の(第2の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で結合される、実施形態D34~D39のいずれか1つの方法。
D41 複数の第2の足場二重鎖種が、ssRNAまたはsscDNAと、約15:1の(第2の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で結合される、実施形態D34~D39のいずれか1つの方法。
D42.結合させるステップの前に、複数の第2の足場二重鎖種と、ホスファターゼ活性を有する薬剤とを、第2の足場二重鎖種が脱リン酸化される条件下で接触させるステップを含み、それによって脱リン酸化された第2の足場二重鎖種が生成される、実施形態D34~D41のいずれか1つの方法。
D43.結合させるステップの前に、第2の足場ポリヌクレオチド種の各々が、第2のssRNAまたはsscDNA末端領域とハイブリダイズされて複数の第2の足場-ssRNAまたは第2の足場-sscDNA複合体を形成する、実施形態D33の方法。
D44.結合させるステップの前に、複数の第2の足場-ssRNA複合体または第2の足場-sscDNA複合体と、ホスファターゼ活性を有する薬剤とを、第2の足場-ssRNA複合体または第2の足場-sscDNA複合体が脱リン酸化される条件下で接触させるステップを含み、それによって脱リン酸化された第2の足場-ssRNA複合体または第2の足場-sscDNA複合体が生成される、実施形態D43の方法。
D45.第1のオリゴヌクレオチドおよび第1のssRNAまたはsscDNA末端領域の隣接している末端を共有結合で連結させるステップ、ならびに第2のオリゴヌクレオチドおよび第2のssRNAまたはsscDNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって共有結合で連結されたハイブリダイゼーション産物を生成する、実施形態D33~D44のいずれか1つの方法。
D46.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssRNAまたはsscDNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結され、かつ第2のssRNAまたはsscDNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件下で、接触させることを含む、実施形態D45の方法。
D47.リガーゼ活性を有する薬剤が、T4 DNAリガーゼである、実施形態D27またはD46の方法。
D48.T4 DNAリガーゼが、25単位/μl未満の量で使用される、実施形態D47の方法。
D49.T4 DNAリガーゼが、約10単位/μlで使用される、実施形態D48の方法。
D50.結合させるステップおよび共有結合で連結させるステップが、1時間またはそれ未満で行なわれる、実施形態D26~D49のいずれか1つの方法。
D51.結合させるステップおよび共有結合で連結させるステップが、30分またはそれ未満で行なわれる、実施形態D26~D49のいずれか1つの方法。
D52.結合させるステップおよび共有結合で連結させるステップが、約5分で行なわれる、実施形態D26~D49のいずれか1つの方法。
D53.結合させるステップおよびライゲーションするステップが、単一容器内で行なわれる、実施形態D26~D52のいずれか1つの方法。
D54.結合させるステップおよびライゲーションするステップが、約25μlの反応体積で行なわれる、実施形態D26~D53のいずれか1つの方法。
D55.結合させるステップの前またはステップ中に、ssRNAまたはsscDNAと、ホスホリル転移活性を有する薬剤とを、5’リン酸がssRNAまたはsscDNAの5’末端に付加される条件下で接触させることを含む、実施形態D1~D54のいずれか1つの方法。
D56.ハイブリダイゼーション産物を形成するステップの後、かつ共有結合で連結させるステップの前に、ssRNAまたはsscDNAと、ホスホリル転移活性を有する薬剤とを、5’リン酸がssRNAまたはsscDNAの5’末端に付加される条件下で接触させるステップを含む、実施形態D26~D54のいずれか1つの方法。
D57.結合させるステップの前またはステップ中に、第1のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第1のオリゴヌクレオチドの5’末端に付加される条件下で接触させることを含む、実施形態D1~D56のいずれか1つの方法。
D58.結合させるステップの前またはステップ中に、第2のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第2のオリゴヌクレオチドの5’末端に付加される条件下で接触させることを含む、実施形態D33~D56のいずれか1つの方法。
D59.ハイブリダイゼーション産物を形成するステップの後、かつ共有結合で連結させるステップの前に、第1のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第1のオリゴヌクレオチドの5’末端に付加される条件下で接触させるステップを含む、実施形態D26~D56のいずれか1つの方法。
D60.ハイブリダイゼーション産物を形成するステップの後、かつ共有結合で連結させるステップの前に、第2のオリゴヌクレオチドと、ホスホリル転移活性を有する薬剤とを、5’リン酸が第2のオリゴヌクレオチドの5’末端に付加される条件下で接触させるステップを含む、実施形態D33~D56のいずれか1つの方法。
D61.ホスホリル転移活性を有する薬剤の使用を含まない、実施形態D1~D54のいずれか1つの方法。
D62.結合させるステップおよび共有結合で連結させるステップの後に、共有結合で連結されたハイブリダイゼーション産物を精製するステップをさらに含む、実施形態D26~D61のいずれか1つの方法。
D63.共有結合で連結されたハイブリダイゼーション産物が、固相可逆的固定法を含む精製プロセスにより精製される、実施形態D62の方法。
D63.1 精製プロセスが、共有結合で連結されたハイブリダイゼーション産物と固相可逆的固定法ビーズおよび緩衝液とを接触させるステップを含む、実施形態D63の方法。
D63.2 緩衝液が、イソプロパノールを含む、実施形態D63.1の方法。
D63.3 緩衝液が、約10% v/vイソプロパノール~約40% v/vイソプロパノールを含む、実施形態D63.2の方法。
D63.4 緩衝液が、約20% v/vイソプロパノールを含む、実施形態D63.2の方法。
D64 共有結合で連結されたハイブリダイゼーション産物が、連続的固相可逆的固定法を含む精製プロセスにより精製される、実施形態にD63~D63.4のいずれか1つの方法。
D65 共有結合で連結されたハイブリダイゼーション産物が、逐次的固相可逆的固定法を含む精製プロセスにより精製される、実施形態D63~D63.4のいずれか1つの方法。
D66.共有結合で連結されたハイブリダイゼーション産物が、カラム精製を含まない精製プロセスにより精製される、実施形態D62~D65のいずれか1つの方法。
D67.共有結合で連結されたハイブリダイゼーション産物が、結合させるステップおよび共有結合で連結させるステップの後に精製されない、実施形態D26~D61のいずれか1つの方法。
D68.第1のポリヌクレオチド種の各々についてのssRNAまたはsscDNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssRNAまたはsscDNAハイブリダイゼーション領域とは異なる、実施形態D1からD67のいずれか1つの方法。
D69.第2のポリヌクレオチド種の各々についてのssRNAまたはsscDNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssRNAまたはsscDNAハイブリダイゼーション領域とは異なる、実施形態D33からD68のいずれか1つの方法。
D70.ssRNAまたはsscDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態D1からD69のいずれか1つの方法。
D71.ssRNAまたはsscDNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、実施形態D1からD69のいずれか1つの方法。
D72.ssRNAまたはsscDNAハイブリダイゼーション領域が、約10またはそれ未満の塩基を含む、実施形態D1~D71のいずれか1つの方法。
D73.第1のオリゴヌクレオチドが、第1のプライマー結合ドメインを含む、実施形態D1~D72のいずれか1つの方法。
D74.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態D73の方法。
D75.第2のオリゴヌクレオチドが、第2のプライマー結合ドメインを含む、実施形態D33~D74のいずれか1つの方法。
D76.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態D75の方法。
D77.第1のオリゴヌクレオチドが、第1のシーケンシングアダプターまたはその一部を含む、実施形態D1~D76のいずれか1つの方法。
D78.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態D77の方法。
D79.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態D77の方法。
D80.第2のオリゴヌクレオチドが、第2のシーケンシングアダプターまたはその一部を含む、実施形態D33~D79のいずれか1つの方法。
D81.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態D80の方法。
D82.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態D80の方法。
D83.第1のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態D1~D82のいずれか1つの方法。
D84.第1のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態D83の方法。
D85.第2のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態D33~D84のいずれか1つの方法。
D86.第2のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態D85の方法。
D87.第1のオリゴヌクレオチドが、インデックスを含む、実施形態D1~D86のいずれか1つの方法。
D88.第1のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態D87の方法。
D89.第2のオリゴヌクレオチドが、インデックスを含む、実施形態D33~D88のいずれか1つの方法。
D90.第2のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態D89の方法。
D91.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態D1~D90のいずれか1つの方法。
D92.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態D33~D91のいずれか1つの方法。
D93.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチドの共有結合性連結を遮断することができる、実施形態D91またはD92の方法。
D94.オリゴヌクレオチドが、ssRNAまたはsscDNAに隣接していない末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態D91、D92またはD93に記載の方法。
D95.第1の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態D1~D94のいずれか1つの方法。
D96.第2の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態D33~D95のいずれか1つの方法。
D97.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる、実施形態D95またはD96の方法。
D98.足場ポリヌクレオチドが、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態D95からD97のいずれか1つの方法。
D99.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態D91からD98のいずれか1つの方法。
D100.ssRNAまたはsscDNAが、結合させるステップの前に修飾されない、実施形態D1~D99のいずれか1つの方法。
D101.ssRNAまたはsscDNAが、結合させるステップの前または結合させるステップ中に、一本鎖核酸結合タンパク質(SSB)と結合されない、実施形態D1~D100のいずれか1つの方法。
D102.結合させるステップの前に、ssRNAまたはsscDNAと一本鎖核酸結合剤とを接触させるステップを含む、実施形態D1~D100のいずれか1つの方法。
D102.1 結合させるステップの前に、ssRNAまたはsscDNAと一本鎖核酸結合タンパク質(SSB)とを接触させて、SSB結合ssRNAまたはsscDNAを生成するステップを含む、実施形態D1~D100のいずれか1つの方法。
D103.ssRNAまたはsscDNAが第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種と結合されたとき、ssRNAまたはsscDNAの一方または両方のネイティブ末端が存在する、実施形態D1~D102.1のいずれか1つの方法。
D104.核酸組成物が、約250pg~約5ngのssRNAまたはsscDNAを含む、実施形態D1~D103のいずれか1つの方法。
D105.核酸組成物が、約1ngのssRNAまたはsscDNAを含む、実施形態D1~D104のいずれか1つの方法。
D106.核酸組成物が、ssRNAまたはsscDNAから本質的になる、実施形態D1~D105のいずれか1つの方法。
D107.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって一本鎖ライゲーション産物が生成される、実施形態D26~D106のいずれか1つの方法。
D108.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって増幅ライゲーション産物が生成される、実施形態D107の方法。
D109.増幅ライゲーション産物を精製するステップをさらに含む、実施形態D108の方法。
D110.増幅ライゲーション産物が、固相可逆的固定法を含む精製プロセスにより精製される、実施形態D109の方法。
D111.増幅ライゲーション産物が、連続的固相可逆的固定法を含む精製プロセスにより精製される、実施形態D110の方法。
D112.増幅ライゲーション産物が、逐次的固相可逆的固定法を含む精製プロセスにより精製される、実施形態D110の方法。
D113.増幅ライゲーション産物が、カラム精製を含まない精製プロセスにより精製される、実施形態D109~D112のいずれか1つの方法。
D114.増幅ライゲーション産物が、増幅させるステップの後に精製されない、実施形態D108の方法。
D115.増幅ライゲーション産物をシーケンシングするステップをさらに含む、実施形態D108~D114のいずれか1つの方法。
D116.一本鎖ライゲーション産物が、増幅されない、実施形態D107の方法。
D117.ライゲーション産物をシーケンシングするステップをさらに含む、実施形態D116の方法。
D118.第1の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態D20~D117のいずれか1つの方法。
D119.第2の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態D34~D118のいずれか1つの方法。
D120.オーバーハングが、ssRNAまたはsscDNAハイブリダイゼーション領域を含む、実施形態D118またはD119の方法。
D121.第1の足場二重鎖種、第1のオリゴヌクレオチド、および/または複数の第1の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態D20~D120のいずれか1つの方法。
D122.第2の足場二重鎖種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態D34~D121のいずれか1つの方法。
D123.一本鎖ライゲーション産物と、第3のオリゴヌクレオチドとを、第3のオリゴヌクレオチドが、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズされる条件下で結合させるステップをさらに含み、それによって、オリゴヌクレオチドダイマーハイブリダイゼーション産物が形成される、実施形態D107からD122のいずれか1つの方法。
D124.オリゴヌクレオチドダイマーハイブリダイゼーション産物が、切断部位を含む、実施形態D123の方法。
D125.切断部位が、制限酵素認識部位である、実施形態D124の方法。
D126.オリゴヌクレオチドダイマーハイブリダイゼーション産物と切断剤とを接触させるステップをさらに含む、実施形態D123からD125のいずれか1つの方法。
D127.複数の第1の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態D1~D126のいずれか1つの方法。
D128.複数の第2の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態D33~D127のいずれか1つの方法。
D129.第1のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態D1~D128のいずれか1つの方法。
D130.第2のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態D33~D129のいずれか1つの方法。
D131.共有結合で連結されたハイブリダイゼーション産物とウラシル-DNAグリコシラーゼおよびエンドヌクレアーゼとを接触させるステップをさらに含む、実施形態D127~D130のいずれか1つの方法。
D132.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、DNAを含む、実施形態D1~D131のいずれか1つの方法。
D133.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、RNAを含む、実施形態D1~D131のいずれか1つの方法。
D134.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、DNAを含む、実施形態D1からD133のいずれか1つの方法。
D135.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、RNAを含む、実施形態D1からD133のいずれか1つの方法。
D136.結合させるステップの前に、核酸組成物とヌクレアーゼとを接触させるステップを含む、実施形態D1~D135のいずれか1つの方法。
D137.ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、実施形態D136の方法。
E1.一本鎖リボ核酸(ssRNA)または一本鎖相補デオキシリボ核酸(sscDNA)を含む核酸組成物と、
第1のオリゴヌクレオチドと、
ssRNAまたはsscDNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種と
を含む、組成物。
E2.第2のオリゴヌクレオチドと、
ssRNAまたはsscDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第2の足場ポリヌクレオチド種と
をさらに含む、実施形態E1の組成物。
E3.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドとハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態E1またはE2の組成物。
E4.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドとハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態E2またはE3の組成物。
E5.複数の第1の足場二重鎖種およびssRNAまたはsscDNAが、約30:1の(第1の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で存在する、実施形態E3またはE4の組成物。
E6.複数の第1の足場二重鎖種およびssRNAまたはsscDNAが、約15:1の(第1の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で存在する、実施形態E3またはE4の組成物。
E7.複数の第2の足場二重鎖種およびssRNAまたはsscDNAが、約30:1の(第2の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で存在する、実施形態E4、E5またはE6の組成物。
E8.複数の第2の足場二重鎖種およびssRNAまたはsscDNAが、約15:1の(第2の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で存在する、実施形態E3またはE4の組成物。
E9.第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、および/または複数の第1の足場二重鎖種が、脱リン酸化されている、実施形態E3~E8のいずれか1つの組成物。
E10.第2のオリゴヌクレオチド、複数の第2の足場ポリヌクレオチド種、および/または複数の第2の足場二重鎖種が、脱リン酸化されている、実施形態E4~E9のいずれか1つの組成物。
E11.オリゴヌクレオチドの末端をssRNAまたはsscDNA末端領域の末端に共有結合で連結させるための薬剤をさらに含む、実施形態E1~E10のいずれか1つの組成物。
E12.薬剤が、リガーゼである、実施形態E11の組成物。
E13.リガーゼが、T4リガーゼである、実施形態E12の組成物。
E14.T4リガーゼが、25単位/μl未満の量で存在する、実施形態E13の組成物。
E15.T4リガーゼが、約10単位/μlで存在する、実施形態E14の組成物。
E16.ssRNAまたはsscDNAが、5’末端においてリン酸化されている、実施形態E1~E15のいずれか1つの組成物。
E16.1 ssRNAまたはsscDNAが脱リン酸化されている、実施形態E1~E15のいずれか1つの組成物。
E17.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、3’リン酸を含む、実施形態E1~E16.1のいずれか1つの組成物。
E18.ssRNAまたはsscDNA末端領域の5’末端を、3’リン酸を含む第1のオリゴヌクレオチドまたは3’リン酸を含む第2のオリゴヌクレオチドの3’末端に、共有結合で連結させるための薬剤をさらに含む、実施形態E17の組成物。
E19.薬剤が、一本鎖リガーゼである、実施形態E18の組成物。
E20.リガーゼが、RtcBリガーゼである、実施形態E19の組成物。
E21.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、5’末端にアデニル化修飾を含む、実施形態E1~E17のいずれか1つの組成物。
E22.ATP不含である、実施形態E21の組成物。
E23.ホスホリル転移活性を有する薬剤をさらに含む、実施形態E1~E22のいずれか1つの組成物。
E24.ホスホリル転移活性を有する薬剤を含まない、実施形態E1~E22のいずれか1つの組成物。
E25.第1の足場ポリヌクレオチド種の各々についてのssRNAまたはsscDNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるssRNAまたはsscDNAハイブリダイゼーション領域とは異なる、実施形態E1からE24のいずれか1つの組成物。
E26.第2の足場ポリヌクレオチド種の各々についてのssRNAまたはsscDNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssRNAまたはsscDNAハイブリダイゼーション領域とは異なる、実施形態E2からE25のいずれか1つの組成物。
E27.ssRNAまたはsscDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態E1からE26のいずれか1つの組成物。
E28.ssRNAまたはsscDNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、実施形態E1からE26のいずれか1つの組成物。
E29.ssRNAまたはsscDNAハイブリダイゼーション領域が、約10またはそれ未満の塩基を含む、実施形態E1~E28のいずれか1つの組成物。
E30.第1のオリゴヌクレオチドが、第1のプライマー結合ドメインを含む、実施形態E1~E29のいずれか1つの組成物。
E31.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態E30の組成物。
E32.第2のオリゴヌクレオチドが、第2のプライマー結合ドメインを含む、実施形態E2~E31のいずれか1つの組成物。
E33.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態E32の組成物。
E34.第1のオリゴヌクレオチドが、第1のシーケンシングアダプターまたはその一部を含む、実施形態E1~E33のいずれか1つの組成物。
E35.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態E34の組成物。
E36.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態E34の組成物。
E37.第2のオリゴヌクレオチドが、第2のシーケンシングアダプターまたはその一部を含む、実施形態E2~E36のいずれか1つの組成物。
E38.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態E37の組成物。
E39.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態E37の組成物。
E40.第1のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態E1~E39のいずれか1つの組成物。
E41.第1のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態E40の組成物。
E42.第2のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態E2~E41のいずれか1つの組成物。
E43.第2のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態E42の組成物。
E44.第1のオリゴヌクレオチドが、インデックスを含む、実施形態E1~E43のいずれか1つの組成物。
E45.第1のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態E44の組成物。
E46.第2のオリゴヌクレオチドが、インデックスを含む、実施形態E2~E45のいずれか1つの組成物。
E47.第2のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態E46の組成物。
E48.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態E1~E47のいずれか1つの組成物。
E49.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態E2~E48のいずれか1つの組成物。
E50.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチドの共有結合性連結を遮断することができる、実施形態E48またはE49の組成物。
E51.オリゴヌクレオチドが、ssRNAまたはsscDNA末端領域に隣接することにならない末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態E48、E49またはE50に記載の組成物。
E52.第1の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態E1~E51のいずれか1つの組成物。
E53.第2の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態E2~E52のいずれか1つの組成物。
E54.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる、実施形態E52またはE53の組成物。
E55.足場ポリヌクレオチドが、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態E52からE54のいずれか1つの組成物。
E56.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態E48からE55のいずれか1つの組成物。
E57.一本鎖核酸結合剤をさらに含む、実施形態E1~E56のいずれか1つの組成物。
E57.1 一本鎖核酸結合タンパク質(SSB)をさらに含む、実施形態E1~E56のいずれか1つの組成物。
E58.SSB不含である、実施形態E1~E57のいずれか1つの組成物。
E59.核酸組成物が、ssRNAまたはsscDNAから本質的になる、実施形態E1~E56およびE58のいずれか1つの組成物。
E60.ssRNAまたはsscDNAが、未修飾ssRNAまたはsscDNAである、実施形態E1~E59のいずれか1つの組成物。
E61.ssRNAまたはsscDNAが、一方の末端または両方の末端にネイティブ末端を含む、実施形態E1~E60のいずれか1つの組成物。
E62.約250pg~約5ngのssRNAまたはsscDNAを含む、実施形態E1~E61のいずれか1つの組成物。
E63.約1ngのssRNAまたはsscDNAを含む、実施形態E1~E62のいずれか1つの組成物。
E64.第1の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態E3~E63のいずれか1つの組成物。
E65.第2の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態E4~E64のいずれか1つの組成物。
E66.オーバーハングが、ssRNAまたはsscDNAハイブリダイゼーション領域を含む、実施形態E64またはE65の組成物。
E67.第1の足場二重鎖種、第1のオリゴヌクレオチド、および/または複数の第1の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態E3~E66のいずれか1つの組成物。
E68.第2の足場二重鎖種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態E4~E67のいずれか1つの組成物。
E69.第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズすることができる、第3のオリゴヌクレオチドをさらに含む、実施形態E2~E68のいずれか1つの組成物。
E70.第3のオリゴヌクレオチドが、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズされたときに切断部位を形成する配列を含む、実施形態E69の組成物。
E71.切断部位が、制限酵素認識部位である、実施形態E70の組成物。
E72.切断剤をさらに含む、実施形態E69~E71のいずれか1つの組成物。
E73.約25μlの体積の水溶液中に存在する、実施形態E1~E72のいずれか1つの組成物。
E74.核酸組成物が、sscDNAを含む、実施形態E1~E73のいずれか1つの組成物。
E75.核酸組成物が、ssRNAを含む、実施形態E1~E73のいずれか1つの組成物。
E76.逆転写酵素活性を有する薬剤をさらに含む、実施形態E1~E75のいずれか1つの組成物。
E77.RNAse活性を有する薬剤をさらに含む、実施形態E1~E76のいずれか1つの組成物。
E78.逆転写酵素活性およびRNAse活性を有する薬剤をさらに含む、実施形態E1~E77のいずれか1つの組成物。
E79.薬剤が、M-MuLV逆転写酵素である、実施形態E78の組成物。
E80.プライマーをさらに含む、実施形態E1~E79のいずれか1つの組成物。
E81.プライマーが、ランダムヘキサマープライマー、ランダムオクタマープライマー、およびポリ(T)プライマーのうちの1つまたは複数から選択される、実施形態E80の組成物。
E82.プライマーが、第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチド中の配列に相補的なヌクレオチド配列を含む、実施形態E80の組成物。
E83.複数の第1の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態E1~E82のいずれか1つの組成物。
E84.複数の第2の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態E2~E83のいずれか1つの組成物。
E85.第1のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態E1~E84のいずれか1つの組成物。
E86.第2のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態E2~E85のいずれか1つの組成物。
E87.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、DNAを含む、実施形態E1~E86のいずれか1つの組成物。
E88.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、RNAを含む、実施形態E1~E86のいずれか1つの組成物。
E89.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、DNAを含む、実施形態E1からE87のいずれか1つの組成物。
E90.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、RNAを含む、実施形態E1からE87のいずれか1つの組成物。
E91.ヌクレアーゼをさらに含む、実施形態E1~E90のいずれか1つの組成物。
E92.ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、実施形態E91の組成物。
F1.第1のオリゴヌクレオチドと、
ssRNAまたはsscDNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種と、
第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種を使用してssRNAまたはsscDNAから核酸ライブラリーを生成するための使用説明書と
を含む、キット。
F2.第2のオリゴヌクレオチドと、
ssRNAまたはsscDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第2の足場ポリヌクレオチド種と
をさらに含み、使用説明書が、第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種を使用して核酸ライブラリーを生成するためのものである、実施形態F1のキット。
F3.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドとハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態F1またはF2のキット。
F4.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドとハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態F2またはF3のキット。
F5.使用説明書が、複数の第1の足場二重鎖種およびssRNAまたはsscDNAを、約30:1の(第1の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で合わせることを含む、実施形態F3またはF4のキット。
F6.使用説明書が、複数の第1の足場二重鎖種およびssRNAまたはsscDNAを、約15:1の(第1の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で合わせることを含む、実施形態F3またはF4のキット。
F7.使用説明書が、複数の第2の足場二重鎖種およびssRNAまたはsscDNAを、約30:1の(第2の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で合わせることを含む、実施形態F4、F5またはF6のキット。
F8.使用説明書が、複数の第2の足場二重鎖種およびssRNAまたはsscDNAを、約15:1の(第2の足場二重鎖種のssRNAまたはsscDNAに対する)モル比で合わせることを含む、実施形態F3またはF4のキット。
F9.第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、および/または複数の第1の足場二重鎖種が、脱リン酸化されている、実施形態F3~F8のいずれか1つのキット。
F10.第2のオリゴヌクレオチド、複数の第2の足場ポリヌクレオチド種、および/または複数の第2の足場二重鎖種が、脱リン酸化されている、実施形態F4~F9のいずれか1つのキット。
F11.オリゴヌクレオチドの末端をssRNAまたはsscDNA末端領域の末端に共有結合で連結させるための薬剤をさらに含む、実施形態F1~F10のいずれか1つのキット。
F12.薬剤が、リガーゼである、実施形態F11のキット。
F13.リガーゼが、T4リガーゼである、実施形態F12のキット。
F14.T4リガーゼが、25単位/μl未満の量で存在する、実施形態F13のキット。
F15.T4リガーゼが、約10単位/μlで存在する、実施形態F14のキット。
F16.ホスファターゼをさらに含む、実施形態F1~F15のいずれか1つのキット。
F17.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、3’リン酸を含む、実施形態C1~C16のいずれか1つのキット。
F18.ssRNAまたはsscDNA末端領域の5’末端を、3’リン酸を含む第1のオリゴヌクレオチドまたは3’リン酸を含む第2のオリゴヌクレオチドの3’末端に、共有結合で連結させるための薬剤をさらに含む、実施形態F17のキット。
F19.薬剤が、一本鎖リガーゼである、実施形態F18のキット。
F20.リガーゼが、RtcBリガーゼである、実施形態F19のキット。
F21.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドが、5’末端にアデニル化修飾を含む、実施形態F1~F17のいずれか1つのキット。
F22.ATP不含である、実施形態F21のキット。
F23.ホスホリル転移活性を有する薬剤をさらに含む、実施形態F1~F22のいずれか1つのキット。
F24.ホスホリル転移活性を有する薬剤を含まない、実施形態F1~F22のいずれか1つのキット。
F25.第1の足場ポリヌクレオチド種の各々についてのssRNAまたはsscDNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるssRNAまたはsscDNAハイブリダイゼーション領域とは異なる、実施形態F1からF24のいずれか1つのキット。
F26.第2の足場ポリヌクレオチド種の各々についてのssRNAまたはsscDNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssRNAまたはsscDNAハイブリダイゼーション領域とは異なる、実施形態F2からF25のいずれか1つのキット。
F27.ssRNAまたはsscDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態F1からF26のいずれか1つのキット。
F28.ssRNAまたはsscDNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、実施形態F1からF26のいずれか1つのキット。
F29.ssRNAまたはsscDNAハイブリダイゼーション領域が、約10またはそれ未満の塩基を含む、実施形態F1~F28のいずれか1つのキット。
F30.第1のオリゴヌクレオチドが、第1のプライマー結合ドメインを含む、実施形態F1~F29のいずれか1つのキット。
F31.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態F30のキット。
F32.第2のオリゴヌクレオチドが、第2のプライマー結合ドメインを含む、実施形態F2~F31のいずれか1つのキット。
F33.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のプライマー結合ドメインに相補的なポリヌクレオチドを含む、実施形態F32のキット。
F34.第1のオリゴヌクレオチドが、第1のシーケンシングアダプターまたはその一部を含む、実施形態F1~F33のいずれか1つのキット。
F35.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態F34のキット。
F36.第1のオリゴヌクレオチドハイブリダイゼーション領域が、第1のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態F34のキット。
F37.第2のオリゴヌクレオチドが、第2のシーケンシングアダプターまたはその一部を含む、実施形態F2~F36のいずれか1つのキット。
F38.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含む、実施形態F37のキット。
F39.第2のオリゴヌクレオチドハイブリダイゼーション領域が、第2のシーケンシングアダプター、またはその一部、に相補的なポリヌクレオチドを含まない、実施形態F37のキット。
F40.第1のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態F1~F39のいずれか1つのキット。
F41.第1のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態F40のキット。
F42.第2のオリゴヌクレオチドが、固有分子識別子(UMI)を含む、実施形態F2~F41のいずれか1つのキット。
F43.第2のオリゴヌクレオチドハイブリダイゼーション領域が、固有分子識別子(UMI)に相補的なポリヌクレオチドを含む、実施形態F42のキット。
F44.第1のオリゴヌクレオチドが、インデックスを含む、実施形態F1~F43のいずれか1つのキット。
F45.第1のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態F44のキット。
F46.第2のオリゴヌクレオチドが、インデックスを含む、実施形態F2~F45のいずれか1つのキット。
F47.第2のオリゴヌクレオチドハイブリダイゼーション領域が、インデックスに相補的なポリヌクレオチドを含む、実施形態F46のキット。
F48.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態F1~F47のいずれか1つのキット。
F49.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態F2~F48のいずれか1つのキット。
F50.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチドの共有結合性連結を遮断することができる、実施形態F48またはF49のキット。
F51.オリゴヌクレオチドが、ssRNAまたはsscDNA末端領域に隣接することにならない末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態F48、F49またはF50に記載のキット。
F52.第1の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態F1~F51のいずれか1つのキット。
F53.第2の足場ポリヌクレオチド種の一部またはすべてが、1つまたは複数の修飾ヌクレオチドを含む、実施形態F2~F52のいずれか1つのキット。
F54.1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる、実施形態F52またはF53のキット。
F55.足場ポリヌクレオチドが、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含む、実施形態F52からF54のいずれか1つのキット。
F56.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態F48からF55のいずれか1つのキット。
F57.使用説明書が、第1のオリゴヌクレオチドおよび複数の第1のポリヌクレオチド種と、ssRNAまたはsscDNAを含む核酸組成物とを結合させることを含む、実施形態F1~F56のいずれか1つのキット。
F58.ssNAが、ssRNAを含む、実施形態F57のキット。
F59.ssNAが、ssRNAを含む、実施形態F57のキット。
F60.一本鎖核酸結合剤をさらに含む、実施形態F1~F59のいずれか1つのキット。
F60.1 一本鎖核酸結合タンパク質(SSB)をさらに含む、実施形態F1~F59のいずれか1つのキット。
F61.SSB不含である、実施形態F1~F60のいずれか1つのキット。
F62.核酸組成物が、ssRNAまたはsscDNAから本質的になる、実施形態F57~F59およびF61のいずれか1つのキット。
F63.ssRNAまたはsscDNAが、未修飾ssRNAまたはsscDNAである、実施形態F57~F62のいずれか1つのキット。
F64.ssRNAまたはsscDNAが、一方の末端にネイティブ末端を含む、実施形態F57~F63のいずれか1つのキット。
F65.ssRNAまたはsscDNAが、両方の末端にネイティブ末端を含む、実施形態F57~F63のいずれか1つのキット。
F66.使用説明書が、第1のオリゴヌクレオチドおよび複数の第1のポリヌクレオチド種と、約250pg~約5ngのssRNAまたはsscDNAを含む核酸組成物とを結合させることを含む、実施形態F57~F65のいずれか1つのキット。
F67.使用説明書が、第1のオリゴヌクレオチドおよび複数の第1のポリヌクレオチド種と、約1ngのssRNAまたはsscDNAを含む核酸組成物とを結合させることを含む、実施形態F57~F66のいずれか1つのキット。
F68.第1の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態F3~F67のいずれか1つのキット。
F69.第2の足場二重鎖種が、(1)2本の鎖とオーバーハングとを第1の末端に、および2本の非相補鎖を第2の末端に含むか、または(2)一本鎖ループとオーバーハングとを有するヘアピン構造を形成することができる1本の鎖を含む、実施形態F4~F68のいずれか1つのキット。
F70.オーバーハングが、ssRNAまたはsscDNAハイブリダイゼーション領域を含む、実施形態F68またはF69のキット。
F71.第1の足場二重鎖種、第1のオリゴヌクレオチド、および/または複数の第1の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態F3~F70のいずれか1つのキット。
F72.第2の足場二重鎖種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が、1つまたは複数のホスホロチオエート骨格修飾を含む、実施形態F4~F71のいずれか1つのキット。
F73.第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズすることができる、第3のオリゴヌクレオチドをさらに含む、実施形態F2~F72のいずれか1つのキット。
F74.第3のオリゴヌクレオチドが、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドのダイマーとハイブリダイズされたときに切断部位を形成する配列を含む、実施形態F73のキット。
F75.切断部位が、制限酵素認識部位である、実施形態F74のキット。
F76.切断剤をさらに含む、実施形態F73~F75のいずれか1つのキット。
F77.逆転写酵素活性を有する薬剤をさらに含む、実施形態F1~F76のいずれか1つのキット。
F78.RNAse活性を有する薬剤をさらに含む、実施形態F1~F77のいずれか1つのキット。
F79.逆転写酵素活性およびRNAse活性を有する薬剤をさらに含む、実施形態F1~F78のいずれか1つのキット。
F80.薬剤が、M-MuLV逆転写酵素である、実施形態F79のキット。
F81.プライマーをさらに含む、実施形態F1~F80のいずれか1つのキット。
F82.プライマーが、ランダムヘキサマープライマー、ランダムオクタマープライマー、およびポリ(T)プライマーのうちの1つまたは複数から選択される、実施形態F81のキット。
F83.プライマーが、第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチド中の配列に相補的なヌクレオチド配列を含む、実施形態F81のキット。
F84.核酸を精製するための試薬をさらに含む、実施形態F1~F83のいずれか1つのキット。
F84.1 核酸を精製するための試薬が、固相可逆的固定法ビーズおよび緩衝液を含む、実施形態F84のキット。
F84.2 緩衝液が、イソプロパノールを含む、実施形態F84.1のキット。
F84.3 緩衝液が、約10% v/vイソプロパノール~約40% v/vイソプロパノールを含む、実施形態F84.2のキット。
F84.4 緩衝液が、約20% v/vイソプロパノールを含む、実施形態F84.2のキット。
F85.核酸を増幅するための試薬をさらに含む、実施形態F1~F84.4のいずれか1つのキット。
F86.mRNAを濃縮するおよび/またはrRNAを枯渇させるための試薬をさらに含む、実施形態F1~F85のいずれか1つのキット。
F87.ssRNAを断片化するための試薬をさらに含む、実施形態F1~F86のいずれか1つのキット。
F88.複数の第1の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態F1~F87のいずれか1つのキット。
F89.複数の第2の足場ポリヌクレオチド種の中の1つまたは複数の足場ポリヌクレオチドが、1つまたは複数のデオキシウリジン塩基を含む、実施形態F2~F88のいずれか1つのキット。
F90.第1のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態F1~F89のいずれか1つのキット。
F91.第2のオリゴヌクレオチドが、デオキシウリジン塩基を含まない、実施形態F2~F90のいずれか1つのキット。
F92.ウラシル-DNAグリコシラーゼおよびエンドヌクレアーゼをさらに含む、実施形態F88~F91のいずれか1つのキット。
F93.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、DNAを含む、実施形態F1~F92のいずれか1つのキット。
F94.第1の足場ポリヌクレオチド種および/または第2の足場ポリヌクレオチド種が、RNAを含む、実施形態F1~F92のいずれか1つのキット。
F95.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、DNAを含む、実施形態F1からF94のいずれか1つのキット。
F96.第1のオリゴヌクレオチドおよび/または第2のオリゴヌクレオチドが、RNAを含む、実施形態F1からF94のいずれか1つのキット。
F97.ヌクレアーゼをさらに含む、実施形態F1~F96のいずれか1つのキット。
F98.ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、実施形態F97のキット。
G1.一本鎖核酸(ssNA)の純度および/または品質の評定に使用するための、実施形態A1~A124のいずれか1つの方法。
G2.ssNAが、一本鎖オリゴヌクレオチドを含む、実施形態G1の方法。
G3.一本鎖オリゴヌクレオチドが、商業生産される、実施形態G2の方法。
G4.ssNAが、一本鎖プローブを含む、実施形態G1の方法。
G5.一本鎖プローブが、商業生産される、実施形態G4の方法。
G6.ssNAの純度および/または品質が、断片長プロファイルに従って評定される、実施形態G1~G5のいずれか1つの方法。
G7.ssNAの純度および/または品質が、断片長プロファイルにおける主要なssNA種の量および副次的なssNA種の量に従って評定される、実施形態G6の方法。
H1.一本鎖リボ核酸(ssRNA)または一本鎖相補デオキシリボ核酸(sscDNA)の純度および/または品質の評定に使用するための、実施形態D1~D137のいずれか1つの方法。
H2.ssRNAが、一本鎖RNAオリゴヌクレオチドを含む、実施形態H1の方法。
H3.一本鎖RNAオリゴヌクレオチドが、商業生産される、実施形態H2の方法。
H4.ssRNAが、一本鎖RNAプローブを含む、実施形態H1の方法。
H5.一本鎖RNAプローブが、商業生産される、実施形態H4の方法。
H6.sscDNAが、一本鎖cDNAオリゴヌクレオチドを含む、実施形態H1の方法。
H7.一本鎖cDNAオリゴヌクレオチドが、商業生産される、実施形態H6の方法。
H8.sscDNAが、一本鎖cDNAプローブを含む、実施形態H1の方法。
H9.一本鎖cDNAプローブが、商業生産される、実施形態H8の方法。
H10.ssRNAまたはsscDNAの純度および/または品質が、断片長プロファイルに従って評定される、実施形態H1~H9のいずれか1つの方法。
H11.ssRNAまたはsscDNAの純度および/または品質が、断片長プロファイルにおける主要なssRNAまたはsscDNA種の量および副次的なssRNAまたはsscDNA種の量に従って評定される、実施形態H10の方法。
I1.ニッキングされたDNAを含む試料の評定に使用するための、実施形態A1~A124のいずれか1つの方法。
J1.核酸試料中の標的核酸の濃縮に使用するための、実施形態A1~A124のいずれか1つの方法。
* * *
本明細書で参照される各特許、特許出願、公報および文献の全体が、参照により組み込まれる。上記特許、特許出願、公報および文献の引用は、上述のもののいずれかが関連先行技術であることの承認ではなく、これらの公報および文献の内容または日付についてのいかなる承認にも相当しない。それらの引用は、関連する開示の検索の指示ではない。これらの文献の日付または内容に関するすべての記載は、入手可能な情報に基づくものであり、それらの正確さについて承認するものでも、それらの正当性について承認するものでもない。
本技術の基本態様から逸脱することなく、上述の事物に修飾を加えることができる。本技術を1つまたは複数の特定の実施形態に関してかなり詳細に説明したが、当業者には、本願で具体的に開示される実施形態に変更を加えることができ、それでもこれらの修飾形態および改善形態が、本技術の範囲および趣旨の範囲内であることは、認識されると予想される。
本明細書で例証して説明した本技術は、本明細書で具体的に開示していない、いずれかの要素の非存在下で好適に実施されることがある。したがって、例えば、本明細書での各事例では、用語「含む」、「から本質的になる」、および「からなる」のいずれかを、他の2つの用語のどちらかで置き換えることができる。用いた用語および表現は、説明用語として使用しており、限定用語として使用しておらず、そのような用語および表現の使用は、示されているおよび説明されている特徴またはそれらの部分のいかなる均等物も除外せず、様々な修飾形態が請求項記載の本技術の範囲内で可能である。用語「a」または「an」は、この用語が修飾する要素の1つまたは複数の要素を、要素の1つが記載されているのか、または要素の1つより多くが記載されているのかが、文脈上明白である場合を除き、指すことができる(例えば、「試薬(a reagent)」は、1つまたは複数の試薬を意味することができる)。用語「約」は、本明細書で使用される場合、基礎をなすパラメーターの10%以内の値(すなわち、プラスまたはマイナス10%)を指し、一連の値の始めに用語「約」を使用することにより、値の各々が修飾される(すなわち、「約1、2および3」は、約1、約2および約3を指す)。例えば、「約100グラム」の重量は、90グラム~110グラムの間の重量を含み得る。さらに、値のリスト(例えば、約50%、60%、70%、80%、85%または86%)が本明細書に記載されている場合、このリストは、それらのすべての中間値および分数値(例えば、54%、85.4%)を含む。したがって、本技術を代表実施形態および必要に応じた特徴により具体的に開示したが、本明細書で開示した概念の修飾形態および変形形態を当業者は用いることができること、ならびにそのような修飾形態および変形形態が本技術の範囲内で考えられることは、理解されるはずである。
本技術のある特定の実施形態を後続の特許請求の範囲で示す。

Claims (88)

  1. 核酸ライブラリーを生成する方法であって、
    (i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、
    (a)前記複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;
    (b)前記核酸組成物、前記第1のオリゴヌクレオチド、および前記複数の第1の足場ポリヌクレオチド種が、前記第1の足場ポリヌクレオチド種の分子が(i)第1のssNA末端領域および(ii)前記第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、前記第1のオリゴヌクレオチドの前記分子の末端が前記第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成され;
    (c)前記ssNAが、前記結合させるステップの前または前記結合させるステップ中に一本鎖核酸結合タンパク質(SSB)と結合されない、方法。
  2. 前記結合させるステップの前に、前記第1のオリゴヌクレオチドおよび/または前記複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、前記第1のオリゴヌクレオチドおよび/または前記複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップをさらに含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される、請求項1に記載の方法。
  3. 核酸ライブラリーを生成する方法であって、
    第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、前記第1のオリゴヌクレオチドおよび前記複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップであって、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび複数の脱リン酸化された第1の足場ポリヌクレオチド種が生成される、ステップ;および
    (i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)前記脱リン酸化された第1のオリゴヌクレオチドと、(iii)前記複数の脱リン酸化された第1の足場ポリヌクレオチド種とを結合させるステップ
    を含み、
    (a)前記複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;
    (b)前記核酸組成物と、前記脱リン酸化された第1のオリゴヌクレオチドと、前記脱リン酸化された複数の第1の足場ポリヌクレオチド種とが、前記第1の足場ポリヌクレオチド種の分子が(i)第1のssNA末端領域および(ii)前記第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、前記第1のオリゴヌクレオチドの前記分子の末端が前記第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法。
  4. 前記ssNAが、前記結合させるステップの前または前記結合させるステップ中に、一本鎖核酸結合タンパク質(SSB)と結合されない、請求項3に記載の方法。
  5. 前記結合させるステップの前に、
    前記ssNAと、ホスファターゼ活性を有する薬剤とを、前記ssNAが脱リン酸化される条件下で接触させるステップであって、それによって、脱リン酸化ssNAが生成されるステップ;および
    第2のオリゴヌクレオチドを前記ssNAの5’末端に共有結合で連結させるステップ
    をさらに含み、(i)前記第2のオリゴヌクレオチドが、3’末端にリン酸を含み、(ii)前記第2のオリゴヌクレオチドを共有結合で連結させるステップが、前記ssNAおよび前記第2のオリゴヌクレオチドと、一本鎖リガーゼ活性を有する薬剤とを、前記ssNAの5’末端が前記第2のオリゴヌクレオチドの3’末端に共有結合で連結される条件下で、接触させることを含む、請求項1から4のいずれか一項に記載の方法。
  6. 前記核酸組成物と、(iv)第2のオリゴヌクレオチドおよび(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
    (c)前記複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
    (d)前記核酸組成物、前記第2のオリゴヌクレオチド、および前記複数の第2の足場ポリヌクレオチド種が、前記第2の足場ポリヌクレオチド種の分子が(i)第2のssNA末端領域および(ii)前記第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、前記第2のオリゴヌクレオチドの前記分子の末端が前記第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、
    請求項1から4のいずれか一項に記載の方法。
  7. 前記結合させるステップの前に、前記第2のオリゴヌクレオチドおよび/または前記複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、前記第2のオリゴヌクレオチドおよび/または前記複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップをさらに含み、それによって、脱リン酸化された第2のオリゴヌクレオチドおよび/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、請求項6に記載の方法。
  8. 前記結合させるステップの前に、前記第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成し、前記第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、請求項6または7に記載の方法。
  9. 前記第1のオリゴヌクレオチドおよび前記第1のssNA末端領域の隣接している末端を共有結合で連結させるステップ、ならびに前記第2のオリゴヌクレオチドおよび前記第2のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって共有結合で連結されたハイブリダイゼーション産物を生成する、請求項6から8のいずれか一項に記載の方法。
  10. 前記共有結合で連結させるステップが、前記ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、前記第1のssNA末端領域の末端が前記第1のオリゴヌクレオチドの末端に共有結合で連結され、かつ前記第2のssNA末端領域の末端が前記第2のオリゴヌクレオチドの末端に共有結合で連結される条件下で、接触させることを含む、請求項9に記載の方法。
  11. 前記複数の第1の足場二重鎖種における二重鎖の一部またはすべてが、前記第1のオリゴヌクレオチドの5’末端にアデニル化修飾を含み、前記複数の第1の足場二重鎖種が、ATPの非存在下で前記ssNAと結合され、前記ssNAに共有結合で連結され、それによって、共有結合で連結されたハイブリダイゼーション産物中間体が形成される、請求項8に記載の方法。
  12. 前記共有結合で連結されたハイブリダイゼーション産物中間体が、前記複数の第2の足場二重鎖種およびATPと結合され、前記複数の第2の足場二重鎖種およびATPに共有結合で連結され、それによって共有結合で連結されたハイブリダイゼーション産物が形成される、請求項11に記載の方法。
  13. 前記結合させるステップおよび前記共有結合で連結させるステップが、30分またはそれ未満で行なわれる、請求項9から12のいずれか一項に記載の方法。
  14. 前記結合させるステップおよび前記共有結合で連結させるステップが、単一容器内で行なわれる、請求項9から13のいずれか一項に記載の方法。
  15. 前記第1のポリヌクレオチド種の各々についての前記ssNAハイブリダイゼーション領域が、前記複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、請求項1から14のいずれか一項に記載の方法。
  16. 前記第2のポリヌクレオチド種の各々についての前記ssNAハイブリダイゼーション領域が、前記複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、請求項6から15のいずれか一項に記載の方法。
  17. 前記ssNAハイブリダイゼーション領域が、ランダム配列を含む、請求項1から16のいずれか一項に記載の方法。
  18. 前記ssNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、請求項1から17のいずれか一項に記載の方法。
  19. a)前記第1のオリゴヌクレオチドが、
    (i)第1のプライマー結合ドメイン、
    (ii)第1のシーケンシングアダプター、もしくはその一部、
    (iii)固有分子識別子(UMI)、および
    (iv)インデックス
    のうちの1つまたは複数を含み、
    b)前記第1のオリゴヌクレオチドハイブリダイゼーション領域が、
    (i)前記第1のプライマー結合ドメインに相補的なポリヌクレオチド、
    (ii)前記第1のシーケンシングアダプター、もしくはその一部、に相補的なポリヌクレオチド、
    (iii)前記固有分子識別子(UMI)に相補的なポリヌクレオチド、および
    (iv)前記インデックスに相補的なポリヌクレオチド
    のうちの1つまたは複数を含む、
    請求項1から18のいずれか一項に記載の方法。
  20. a)前記第2のオリゴヌクレオチドが、
    (i)第2のプライマー結合ドメイン、
    (ii)第2のシーケンシングアダプター、もしくはその一部、
    (iii)固有分子識別子(UMI)、および
    (iv)インデックス
    のうちの1つまたは複数を含み、
    b)前記第2のオリゴヌクレオチドハイブリダイゼーション領域が、
    (i)前記第2のプライマー結合ドメインに相補的なポリヌクレオチド、
    (ii)前記第2のシーケンシングアダプター、もしくはその一部、に相補的なポリヌクレオチド、
    (iii)前記固有分子識別子(UMI)に相補的なポリヌクレオチド、および
    (iv)前記インデックスに相補的なポリヌクレオチド
    のうちの1つまたは複数を含む、
    請求項6から19のいずれか一項に記載の方法。
  21. 前記第1のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含むか、前記第1の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含むか、または前記第1のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含み、かつ前記第1の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含む、請求項1から20のいずれか一項に記載の方法。
  22. 前記第2のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含むか、前記第2の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含むか、または前記第2のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含み、かつ前記第2の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含む、請求項6から21のいずれか一項に記載の方法。
  23. 前記1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への前記オリゴヌクレオチドの共有結合性連結を遮断することができる、請求項21または22に記載の方法。
  24. 前記オリゴヌクレオチドが、前記ssNAに隣接していない末端に前記1つまたは複数の修飾ヌクレオチドを含む、請求項21、22または23に記載の方法。
  25. 前記1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への前記足場ポリヌクレオチドの共有結合性連結を遮断することができる、請求項21から24のいずれか一項に記載の方法。
  26. 前記足場ポリヌクレオチドが、前記ポリヌクレオチドの一方または両方の末端に前記1つまたは複数の修飾ヌクレオチドを含む、請求項21から25のいずれか一項に記載の方法。
  27. 前記1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、請求項21から26のいずれか一項に記載の方法。
  28. 前記共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって一本鎖ライゲーション産物が生成される、請求項9から27のいずれか一項に記載の方法。
  29. 前記一本鎖ライゲーション産物と、第3のオリゴヌクレオチドとを、前記第3のオリゴヌクレオチドが、前記第1のオリゴヌクレオチドおよび前記第2のオリゴヌクレオチドのダイマーとハイブリダイズされる条件下で結合させるステップをさらに含み、それによって、オリゴヌクレオチドダイマーハイブリダイゼーション産物が形成される、請求項28に記載の方法。
  30. 前記オリゴヌクレオチドダイマーハイブリダイゼーション産物が、切断部位を含む、請求項29に記載の方法。
  31. 前記切断部位が、制限酵素認識部位である、請求項30に記載の方法。
  32. 前記オリゴヌクレオチドダイマーハイブリダイゼーション産物と切断剤とを接触させるステップをさらに含む、請求項29から31のいずれか一項に記載の方法。
  33. 前記第1の足場ポリヌクレオチド種および/または前記第2の足場ポリヌクレオチド種が、DNAを含む、請求項6から32のいずれか一項に記載の方法。
  34. 前記第1の足場ポリヌクレオチド種および/または前記第2の足場ポリヌクレオチド種が、RNAを含む、請求項6から32のいずれか一項に記載の方法。
  35. 前記第1のオリゴヌクレオチドおよび/または前記第2のオリゴヌクレオチドが、DNAを含む、請求項6から34のいずれか一項に記載の方法。
  36. 前記第1のオリゴヌクレオチドおよび/または前記第2のオリゴヌクレオチドが、RNAを含む、請求項6から34のいずれか一項に記載の方法。
  37. 前記結合させるステップの前に、前記核酸組成物とヌクレアーゼとを接触させるステップを含む、請求項1から36のいずれか一項に記載の方法。
  38. 前記ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、請求項37に記載の方法。
  39. 前記核酸組成物が、一本鎖DNA(ssDNA)を含むか、一本鎖RNA(ssRNA)を含むか、またはssDNAおよびssRNAを含む、請求項1から38のいずれか一項に記載の方法。
  40. 前記ssNAが、前記結合させるステップの前に修飾されない、請求項1から39のいずれか一項に記載の方法。
  41. 前記ssNAが前記第1のオリゴヌクレオチドおよび前記複数の第1の足場ポリヌクレオチド種と結合されたとき、前記ssNAの一方または両方のネイティブ末端が存在する、請求項1から40のいずれか一項に記載の方法。
  42. 前記ssNAが、無細胞核酸からのものである、請求項1から41のいずれか一項に記載の方法。
  43. 前記核酸組成物が、ssNAから本質的になる、請求項1から42のいずれか一項に記載の方法。
  44. 第1のオリゴヌクレオチドと、
    ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第1の足場ポリヌクレオチド種と
    を含む、SSB不含組成物。
  45. 前記第1のオリゴヌクレオチドおよび/または前記複数の第1の足場ポリヌクレオチド種が、脱リン酸化されている、請求項44に記載の組成物。
  46. 脱リン酸化された第1のオリゴヌクレオチドと、
    ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の脱リン酸化された第1の足場ポリヌクレオチド種と
    を含む、組成物。
  47. SSB不含一本鎖核酸(ssNA)を含む核酸組成物をさらに含む、請求項44、45または46に記載の組成物。
  48. 第2のオリゴヌクレオチドと、
    ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む複数の第2の足場ポリヌクレオチド種と
    をさらに含む、請求項44から47のいずれか一項に記載の組成物。
  49. 前記第2のオリゴヌクレオチドおよび/または前記複数の第2の足場ポリヌクレオチド種が、脱リン酸化されている、請求項48に記載の組成物。
  50. 前記第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドとハイブリダイズされている、複数の第1の足場二重鎖種と、前記第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドとハイブリダイズされている、複数の第2の足場二重鎖種とを含む、請求項48または49に記載の組成物。
  51. オリゴヌクレオチドの末端をssNA末端領域の末端に共有結合で連結させるための薬剤をさらに含む、請求項44から50のいずれか一項に記載の組成物。
  52. 前記薬剤が、リガーゼである、請求項51に記載の組成物。
  53. 前記リガーゼが、T4リガーゼである、請求項52に記載の組成物。
  54. 前記第1のオリゴヌクレオチドまたは前記第2のオリゴヌクレオチドが、3’リン酸を含む、請求項44から53のいずれか一項に記載の組成物。
  55. ssNA末端領域の5’末端を、前記3’リン酸を含む前記第1のオリゴヌクレオチドまたは前記3’リン酸を含む前記第2のオリゴヌクレオチドの3’末端に、共有結合で連結させるための薬剤をさらに含む、請求項54に記載の組成物。
  56. 前記薬剤が、一本鎖リガーゼである、請求項55に記載の組成物。
  57. 前記リガーゼが、RtcBリガーゼである、請求項56に記載の組成物。
  58. 前記第1のオリゴヌクレオチドまたは前記第2のオリゴヌクレオチドが、5’末端にアデニル化修飾を含む、請求項44から53のいずれか一項に記載の組成物。
  59. ATP不含である、請求項58に記載の組成物。
  60. 前記第1の足場ポリヌクレオチド種の各々についての前記ssNAハイブリダイゼーション領域が、前記複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、請求項44から59のいずれか一項に記載の組成物。
  61. 前記第2の足場ポリヌクレオチド種の各々についての前記ssNAハイブリダイゼーション領域が、前記複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、請求項48から60のいずれか一項に記載の組成物。
  62. 前記ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態44から61のいずれか一項に記載の組成物。
  63. 前記ssNAハイブリダイゼーション領域が、1つまたは複数のユニバーサル塩基を含む、実施形態44から62のいずれか一項に記載の組成物。
  64. a)前記第1のオリゴヌクレオチドが、
    (i)第1のプライマー結合ドメイン、
    (ii)第1のシーケンシングアダプター、もしくはその一部、
    (iii)固有分子識別子(UMI)、および
    (iv)インデックス
    のうちの1つまたは複数を含み、
    b)前記第1のオリゴヌクレオチドハイブリダイゼーション領域が、
    (i)前記第1のプライマー結合ドメインに相補的なポリヌクレオチド、
    (ii)前記第1のシーケンシングアダプター、もしくはその一部、に相補的なポリヌクレオチド、
    (iii)前記固有分子識別子(UMI)に相補的なポリヌクレオチド、および
    (iv)前記インデックスに相補的なポリヌクレオチド
    のうちの1つまたは複数を含む、
    請求項44から63のいずれか一項に記載の組成物。
  65. a)前記第2のオリゴヌクレオチドが、
    (i)第2のプライマー結合ドメイン、
    (ii)第2のシーケンシングアダプター、もしくはその一部、
    (iii)固有分子識別子(UMI)、および
    (iv)インデックス
    のうちの1つまたは複数を含み、
    b)前記第2のオリゴヌクレオチドハイブリダイゼーション領域が、
    (i)前記第2のプライマー結合ドメインに相補的なポリヌクレオチド、
    (ii)前記第2のシーケンシングアダプター、もしくはその一部、に相補的なポリヌクレオチド、
    (iii)前記固有分子識別子(UMI)に相補的なポリヌクレオチド、および
    (iv)前記インデックスに相補的なポリヌクレオチド
    のうちの1つまたは複数を含む、
    請求項48から64のいずれか一項に記載の方法。
  66. 前記第1のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含むか、前記第1の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含むか、または前記第1のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含み、かつ前記第1の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含む、請求項44から65のいずれか一項に記載の組成物。
  67. 前記第2のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含むか、前記第2の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含むか、または前記第2のオリゴヌクレオチドが、1つもしくは複数の修飾ヌクレオチドを含み、かつ前記第2の足場ポリヌクレオチド種の一部もしくはすべてが、1つもしくは複数の修飾ヌクレオチドを含む、請求項48から66のいずれか一項に記載の組成物。
  68. 前記1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への前記オリゴヌクレオチドの共有結合性連結を遮断することができる、請求項66または67に記載の組成物。
  69. 前記オリゴヌクレオチドが、ssNA末端領域に隣接することにならない末端に前記1つまたは複数の修飾ヌクレオチドを含む、請求項66、67または68に記載の組成物。
  70. 前記1つまたは複数の修飾ヌクレオチドが、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への前記足場ポリヌクレオチドの共有結合性連結を遮断することができる、請求項66から69のいずれか一項に記載の組成物。
  71. 前記足場ポリヌクレオチドが、前記ポリヌクレオチドの一方または両方の末端に前記1つまたは複数の修飾ヌクレオチドを含む、請求項66から70のいずれか一項に記載の組成物。
  72. 前記1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、請求項66から71のいずれか一項に記載の組成物。
  73. 前記第1のオリゴヌクレオチドおよび前記第2のオリゴヌクレオチドのダイマーとハイブリダイズすることができる、第3のオリゴヌクレオチドをさらに含む、請求項48から72のいずれか一項に記載の組成物。
  74. 前記第3のオリゴヌクレオチドが、前記第1のオリゴヌクレオチドおよび前記第2のオリゴヌクレオチドのダイマーとハイブリダイズされたときに切断部位を形成する配列を含む、請求項73に記載の組成物。
  75. 前記切断部位が、制限酵素認識部位である、請求項74に記載の組成物。
  76. 切断剤をさらに含む、請求項73から75のいずれか一項に記載の組成物。
  77. 前記第1の足場ポリヌクレオチド種および/または前記第2の足場ポリヌクレオチド種が、DNAを含む、請求項48から76のいずれか一項に記載の組成物。
  78. 前記第1の足場ポリヌクレオチド種および/または前記第2の足場ポリヌクレオチド種が、RNAを含む、請求項48から76のいずれか一項に記載の組成物。
  79. 前記第1のオリゴヌクレオチドおよび/または前記第2のオリゴヌクレオチドが、DNAを含む、請求項48から78のいずれか一項に記載の組成物。
  80. 前記第1のオリゴヌクレオチドおよび/または前記第2のオリゴヌクレオチドが、RNAを含む、請求項48から78のいずれか一項に記載の組成物。
  81. ヌクレアーゼをさらに含む、請求項44から80のいずれか一項に記載の組成物。
  82. 前記ヌクレアーゼが、二本鎖特異的ヌクレアーゼである、請求項81に記載の組成物。
  83. 前記核酸組成物が、一本鎖DNA(ssDNA)を含むか、一本鎖RNA(ssRNA)を含むか、またはssDNAおよびssRNAを含む、請求項44から82のいずれか一項に記載の組成物。
  84. 前記ssNAが、未修飾ssNAである、請求項44から83のいずれか一項に記載の組成物。
  85. 前記ssNAが、一方の末端または両方の末端にネイティブ末端を含む、請求項44から84のいずれか一項に記載の組成物。
  86. 前記ssNAが、無細胞核酸からのものである、請求項44から85のいずれか一項に記載の組成物。
  87. 前記核酸組成物が、ssNAから本質的になる、請求項44から86のいずれか一項に記載の組成物。
  88. 請求項44から87のいずれか一項に記載の組成物と使用説明書とを含むキット。
JP2021559245A 2019-04-05 2020-04-02 核酸を解析するための方法および組成物 Pending JP2022528139A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962830211P 2019-04-05 2019-04-05
US62/830,211 2019-04-05
US201962861594P 2019-06-14 2019-06-14
US62/861,594 2019-06-14
US201962925132P 2019-10-23 2019-10-23
US62/925,132 2019-10-23
PCT/US2020/026421 WO2020206143A1 (en) 2019-04-05 2020-04-02 Methods and compositions for analyzing nucleic acid

Publications (2)

Publication Number Publication Date
JP2022528139A true JP2022528139A (ja) 2022-06-08
JPWO2020206143A5 JPWO2020206143A5 (ja) 2023-03-13

Family

ID=70465467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021559245A Pending JP2022528139A (ja) 2019-04-05 2020-04-02 核酸を解析するための方法および組成物

Country Status (10)

Country Link
US (1) US20220348906A1 (ja)
EP (1) EP3947723A1 (ja)
JP (1) JP2022528139A (ja)
KR (1) KR20210148304A (ja)
CN (1) CN114174530A (ja)
AU (1) AU2020253471A1 (ja)
CA (1) CA3134831A1 (ja)
IL (1) IL286945A (ja)
SG (1) SG11202110468YA (ja)
WO (1) WO2020206143A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210016560A (ko) 2018-06-06 2021-02-16 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 핵산 라이브러리의 생성 방법 및 이를 실행하기 위한 조성물 및 키트
WO2021072037A1 (en) 2019-10-09 2021-04-15 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
CN110669830B (zh) * 2019-10-24 2023-05-23 裕策医疗器械江苏有限公司 一种低质量ffpe dna的处理方法、装置和存储介质
EP4172357B1 (en) * 2020-06-24 2024-05-15 Claret Bioscience, LLC Methods and compositions for analyzing nucleic acid
WO2022020346A1 (en) 2020-07-21 2022-01-27 Claret Bioscience, Llc Cancer detection, monitoring, and reporting from sequencing cell-free dna
WO2022076574A1 (en) 2020-10-08 2022-04-14 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
JP2024512122A (ja) * 2021-03-31 2024-03-18 イルミナ・ケンブリッジ・リミテッド アダプター二量体検出を用いる核酸ライブラリシーケンシング技術
WO2022256560A1 (en) * 2021-06-04 2022-12-08 Somagenics, Inc. Improved method of sequencing library preparation for short dna
CA3234378A1 (en) * 2021-10-15 2023-04-20 Eric Lader Methods for producing dna libraries and uses thereof
WO2023158739A2 (en) * 2022-02-17 2023-08-24 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
WO2024044668A2 (en) * 2022-08-24 2024-02-29 The Regents Of The University Of California Next-generation sequencing pipeline for detection of ultrashort single-stranded cell-free dna
WO2024054517A1 (en) * 2022-09-08 2024-03-14 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US9074013B2 (en) 2004-11-29 2015-07-07 Sequenom, Inc. Means and methods for detecting methylated DNA
US8679741B2 (en) 2006-05-31 2014-03-25 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
CN101501251A (zh) 2006-06-16 2009-08-05 塞昆纳姆股份有限公司 扩增、检测和定量样品中核酸的方法和组合物
WO2009032779A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
WO2009032781A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for universal size-specific polymerase chain reaction
EP2276858A4 (en) 2008-03-26 2011-10-05 Sequenom Inc RESTRICTED ENDONUCLEASE AMPLIFIED POLYMORPHIC SEQUENCE DETECTION
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
EP3103871B1 (en) 2008-09-16 2020-07-29 Sequenom, Inc. Processes for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for fetal nucleic acid quantification
WO2010115016A2 (en) 2009-04-03 2010-10-07 Sequenom, Inc. Nucleic acid preparation compositions and methods
WO2011143659A2 (en) 2010-05-14 2011-11-17 Fluidigm Corporation Nucleic acid isolation methods
WO2013019361A1 (en) 2011-07-07 2013-02-07 Life Technologies Corporation Sequencing methods
RU2694686C2 (ru) * 2013-03-12 2019-07-16 Е.И.Дюпон Де Немур Энд Компани Способы идентификации вариантных сайтов распознавания для редкощепящих сконструированных средств для индукции двунитевого разрыва, и композиции с ними, и их применения
CN105441429A (zh) * 2014-08-08 2016-03-30 深圳华大基因科技有限公司 一种制备腺苷酰化接头的方法及腺苷酰化接头
CA3030430A1 (en) * 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries
WO2018175258A1 (en) * 2017-03-20 2018-09-27 Illumina, Inc. Methods and compositions for preparing nuclelic acid libraries
CA3057867A1 (en) * 2017-03-23 2018-09-27 University Of Washington Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing

Also Published As

Publication number Publication date
WO2020206143A1 (en) 2020-10-08
CN114174530A (zh) 2022-03-11
IL286945A (en) 2021-12-01
CA3134831A1 (en) 2020-10-08
KR20210148304A (ko) 2021-12-07
EP3947723A1 (en) 2022-02-09
SG11202110468YA (en) 2021-10-28
US20220348906A1 (en) 2022-11-03
WO2020206143A9 (en) 2021-12-23
AU2020253471A1 (en) 2021-10-14

Similar Documents

Publication Publication Date Title
JP7296969B2 (ja) 核酸を解析するための方法および組成物
US20220348906A1 (en) Methods and compositions for analyzing nucleic acid
US11085072B2 (en) Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing
US20220073909A1 (en) Methods and compositions for rapid nucleic library preparation
EP3377625B1 (en) Method for controlled dna fragmentation
US10648103B2 (en) Universal blocking oligo system and improved hybridization capture methods for multiplexed capture reactions
EP4172357B1 (en) Methods and compositions for analyzing nucleic acid
US11136576B2 (en) Method for controlled DNA fragmentation
US20240150825A1 (en) Methods and compositions for analyzing nucleic acid
WO2024054517A1 (en) Methods and compositions for analyzing nucleic acid
WO2023158739A2 (en) Methods and compositions for analyzing nucleic acid

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240513