JP2024512463A - 増幅されたライブラリからの望ましくない断片の選択的枯渇のためのブロッキングオリゴヌクレオチド - Google Patents

増幅されたライブラリからの望ましくない断片の選択的枯渇のためのブロッキングオリゴヌクレオチド Download PDF

Info

Publication number
JP2024512463A
JP2024512463A JP2023556903A JP2023556903A JP2024512463A JP 2024512463 A JP2024512463 A JP 2024512463A JP 2023556903 A JP2023556903 A JP 2023556903A JP 2023556903 A JP2023556903 A JP 2023556903A JP 2024512463 A JP2024512463 A JP 2024512463A
Authority
JP
Japan
Prior art keywords
rna
blocking oligonucleotides
blocking
pcr
cdna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023556903A
Other languages
English (en)
Inventor
ブラウン、コリン
シュルツァバーガー、サラ
エム グロス、スティーブン
バー、アンジェリカ
スノー、サマンサ
Original Assignee
イルミナ インコーポレイティッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イルミナ インコーポレイティッド filed Critical イルミナ インコーポレイティッド
Publication of JP2024512463A publication Critical patent/JP2024512463A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/113Modifications characterised by incorporating modified backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/186Modifications characterised by incorporating a non-extendable or blocking moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/163Reactions characterised by the reaction format or use of a specific feature the purpose or use of blocking probe

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本開示は、ブロッキングオリゴヌクレオチドを使用する増幅されたライブラリからの望ましくない断片の選択的枯渇のための方法、組成物、及びキットに関する。

Description

(関連出願の相互参照)
本出願は、2021年3月31日に出願された米国特許仮出願第63/169,185号に対する優先権を主張するものであり、その開示は、参照により本明細書に組み込まれる。
(発明の分野)
本開示は、ブロッキングオリゴヌクレオチドを使用する増幅されたライブラリからの望ましくない断片の選択的枯渇のための方法、組成物、及びキットに関する。
ライブラリ調製物は、次世代シーケンシング(next-generation sequencing、NGS)のためのDNA断片のコレクションを構築することを目的とする。高品質DNAライブラリは、均一かつ一貫したゲノムカバレッジを保証し、したがって、包括的かつ信頼できる配列決定データを送達する。しかしながら、ライブラリ調製物は、rRNAのための配列、ハウスキーピング遺伝子のための配列、ミトコンドリア配列などの、多くの望ましくない配列を含有する。したがって、ライブラリ調製物におけるこれらの望ましくない配列の排除は、より焦点が絞られた、かつデータリッチな次世代シーケンシング(NGS)ライブラリを提供することができる。
rRNAのハイブリダイゼーションプルダウン(例えば、RiboZero、RiboMinus)又は酵素消化(例えば、RNaseH、CRISPR)などの、豊富な配列の枯渇のための現在の方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定/パラフィン包埋(formalin fixed/paraffin-embedded、FFPE)組織及び血漿由来循環RNA(circulating RNA、C-RNA)などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ(例えば、エクソームキャプチャ)は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードRNAを検出するためのそれらの有用性を制限する。
本開示は、PCRにおけるポリメラーゼ伸長をブロックするために、長く、強く結合するオリゴヌクレオチドを使用する代替的な枯渇戦略である「PCRブロッキング」及び関連方法を提供する。本明細書に説明されるアプローチは、既存のアプローチに特徴的な時間のかかる非効率的なインキュベーション及び精製工程を排除し、増幅前の工程中に豊富な配列がビルトイン「キャリア」として作用することを可能にすることによって、低入力用途におけるライブラリ変換を改善することが予想される。
特定の実施形態では、本開示は、1つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたDNA又はcDNAライブラリから望ましくない断片を選択的に枯渇させる方法を提供し、方法は、ポリメラーゼ連鎖反応(polymerase chain reaction、PCR)反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない望ましくない断片を含む、増幅することを含み、PCR反応が、複数の断片、ポリメラーゼ、dNTP、PCRプライマ、及び1つ以上のブロッキングオリゴヌクレオチドを含み、1つ以上のブロッキングオリゴヌクレオチドが、(i)、及び/又は(ii)、並びに(iii):(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに(iii)ブロッキングオリゴヌクレオチドの3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含み、1つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、PCRによる所望されない断片の増幅をブロックする。更なる実施形態では、ブロッキングオリゴヌクレオチドのうちの1つ以上が、15nt~100ntの長さである。なお更なる実施形態では、ポリメラーゼが5’-3’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、5’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む。別の実施形態では、ポリメラーゼが3’-5’プルーフリーディング活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、3’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む。なお別の実施形態では、1つ以上のブロッキングオリゴヌクレオチドが、(i)、(ii)、及び(iii):(i)5’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、(ii)3’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、及び(iii)ブロッキングオリゴヌクレオチドの3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含む。別の実施形態では、3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される。なお別の実施形態では、増幅されたライブラリが、cDNA由来の鋳型配列を含む。更なる実施形態では、増幅されたライブラリが、gDNA由来の鋳型配列を含む。特定の実施形態では、アダプタ配列が、鋳型配列の各末端にライゲーションされているY字アダプタに由来する。別の実施形態では、1つ以上のブロッキングオリゴヌクレオチドが、rRNA及び/又はグロビン由来の鋳型配列に結合する。なお別の実施形態では、1つ以上のブロッキングオリゴヌクレオチドが、18S rRNA、5.8S rRNA、及び/又は28S RNA由来の鋳型配列に結合するブロッキングオリゴヌクレオチドのプールを含む。更なる実施形態では、ブロッキングオリゴヌクレオチドのうちの1つ以上が、mtDNA由来の鋳型配列に結合する。なお更なる実施形態では、増幅されたDNA又はcDNAライブラリは、次世代シーケンシングを使用することによって分析される。特定の実施形態では、PCR増幅工程は、以下の工程:RNA試料を取得する工程と、RNAを断片化する工程と、RNA断片をcDNAに逆転写する工程と、cDNAを平滑末端化し、平滑末端化されたcDNAの3’末端にAヌクレオチドを付加する工程と、Aテール付きcDNAを、3’末端に非相補的Tヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される。更なる実施形態では、RNA断片をcDNAに逆転写する前に、RNA試料が、RNA試料からrRNA配列を枯渇させるように処理される。
特定の実施形態では、本開示は、1つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたDNA又はcDNAライブラリから望ましくない断片を選択的に枯渇させる方法を更に提供し、方法は、ポリメラーゼ連鎖反応(PCR)反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない鋳型配列を含有する望ましくない断片を含む、増幅することを含み、PCR反応が、複数の断片、ポリメラーゼ、dNTP、PCRプライマ、及びブロッキングオリゴヌクレオチドのプールを含み、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に結合し、1つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、PCRによる所望されない断片の増幅をブロックする。更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、15nt~100ntの長さである。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、非重複かつ隣接様式で鋳型の鎖に結合するブロッキングオリゴヌクレオチドを含む。別の実施形態では、ブロッキングオリゴヌクレオチドのプールが、他のブロッキングオリゴヌクレオチドに対して逆相補的であるブロッキングオリゴヌクレオチドを含む。なお別の実施形態では、ブロッキングオリゴヌクレオチドのプールが、(i)、及び/又は(ii)、並びに(iii):(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに(iii)ブロッキングオリゴヌクレオチドの3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含む。更なる実施形態では、ポリメラーゼが5’-3’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、5’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む。なお更なる実施形態では、ポリメラーゼが3’-5’プルーフリーディング活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、3’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む。特定の実施形態では、1つ以上のブロッキングオリゴヌクレオチドが、(i)、(ii)、及び(iii):(i)5’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、(ii)3’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、及び(iii)ブロッキングオリゴヌクレオチドの3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む。更なる実施形態では、3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される。別の実施形態では、増幅されたライブラリが、cDNA由来の鋳型配列を含む。なお別の実施形態では、増幅されたライブラリが、gDNA由来の鋳型配列を含む。更なる実施形態では、アダプタ配列が、鋳型配列の各末端にライゲーションされているY字アダプタに由来する。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、rRNA及び/又はグロビン由来の鋳型配列に結合する。別の実施形態では、ブロッキングオリゴヌクレオチドのプールが、18S rRNA、5.8S rRNA、及び/又は28S RNA由来の鋳型配列に結合する。更なる実施形態では、ブロッキングオリゴヌクレオチドのブロッキングのプールが、mtDNA由来の鋳型配列に結合する。なお更なる実施形態では、増幅されたDNA又はcDNAライブラリは、次世代シーケンシングを使用することによって分析される。別の実施形態では、PCR増幅工程は、以下の工程:RNA試料を取得する工程と、RNAを断片化する工程と、RNA断片をcDNAに逆転写する工程と、cDNAを平滑末端化し、平滑末端化されたcDNAの3’末端にAヌクレオチドを付加する工程と、Aテール付きcDNAを、3’末端に非相補的Tヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される。なお更なる実施形態では、RNA断片をcDNAに逆転写する前に、RNA試料が、RNA試料からrRNA配列を枯渇させるように処理される。
特定の実施形態では、本開示は、1つ以上のブロッキングオリゴヌクレオチドを含むRNA-Seqベースのライブラリ調製キットを更に提供し、1つ以上のブロッキングオリゴヌクレオチドが、(i)、及び/又は(ii)、並びに(iii):(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに(iii)ブロッキングオリゴヌクレオチドの3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含み、1つ以上のブロッキングオリゴヌクレオチドが、所望されないライブラリ断片の鋳型配列に結合し、それによって、PCRによる所望されないライブラリ断片の増幅をブロックする。更なる実施形態では、ライブラリ調製キットが、A-テーリングミックスと、増強されたPCRミックスと、ライゲーションミックスと、再懸濁緩衝液と、停止ライゲーション緩衝液と、Elute,Prime,Fragment High Concentration Mixと、First strand Synthesis Act D Mixと、逆転写酵素と、第2鎖マスタミックスと、を含む。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのうちの1つ以上が、15nt~100ntの長さである。
特定の実施形態では、本開示は、ブロッキングオリゴヌクレオチドのプールを含むRNA-Seqベースのライブラリ調製キットを提供し、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に非重複かつ隣接様式で結合し、それによって、PCRによる所望されないライブラリ断片の増幅をブロックする。更なる実施形態では、ライブラリ調製キットが、A-テーリングミックスと、増強されたPCRミックスと、ライゲーションミックスと、再懸濁緩衝液と、停止ライゲーション緩衝液と、Elute,Prime,Fragment High Concentration Mixと、First strand Synthesis Act D Mixと、逆転写酵素と、第2鎖マスタミックスと、を含む。更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、15nt~100ntの長さである。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、(i)、及び/又は(ii)、並びに(iii):(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに(iii)ブロッキングオリゴヌクレオチドの3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含む。更なる実施形態では、3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される。
本開示の1つ以上の実施形態の詳細が、添付の図面及び以下の明細書に記載されている。他の特徴、目的、及び利点は、明細書及び図面、並びに特許請求の範囲から明らかになるであろう。
rRNA断片のRNA-Seqライブラリを枯渇させるためのPCRクランプの使用と比較した、従来の全RNAワークフローのワークフロー概要を提示する。 不要な断片の配列決定ライブラリを枯渇させるためにPCRクランプがどのように使用され得るかの例示を提供する。反応における重要な試薬:所望される断片及び所望されない断片から構成される配列決定ライブラリ、PCRクランプ、並びにPCR増幅プライマ。簡略化のために、2つのライブラリ断片タイプのみが示される:PCRクランプによって標的化される1つの所望されない断片(赤色)及びPCRクランプによって標的化されない1つの断片。ライブラリ断片における濃い灰色の末端は、ユニバーサルアダプタ配列を表す。 不要な断片の配列決定ライブラリを枯渇させるためにPCRクランプがどのように使用され得るかの例示を提供する。PCRクランプ及びPCRプライマのハイブリダイゼーション:PCRにおける高温による変性後、反応物が冷却されて、PCRプライマのアニーリングを可能にする。同時に、所望されないライブラリ断片は、PCRクランプとハイブリダイズすることによって除去のために標的化されるが、一方、所望されるライブラリ断片は、任意のPCRクランプによって非結合のままである。重要な特徴は、PCRクランプのその標的への完全な端から端までのハイブリダイゼーションが必要とされないことである。したがって、多くの所望されないライブラリ断片は、ライブラリ内のそれらの特異的性質の演繹的知識なしで、枯渇のために標的化され得る。 不要な断片の配列決定ライブラリを枯渇させるためにPCRクランプがどのように使用され得るかの例示を提供する。伸長:耐熱性ポリメラーゼがPCRプライマから伸長して、ライブラリ断片のコピーを生成する。所望されない断片に結合したPCRクランプは、結合したPCRクランプによるブロッキングに起因して、完全にコピーされることができない。所望されるライブラリ断片は、PCRクランプによって妨害されずにコピーされる。 不要な断片の配列決定ライブラリを枯渇させるためにPCRクランプがどのように使用され得るかの例示を提供する。最終ライブラリ:最終ライブラリは、所望されるライブラリ断片(灰色)の指数関数的増幅から生成されるが、一方、所望されないライブラリ断片(赤色)は、非効率的に増幅された。結果は、所望されないライブラリ断片が「枯渇」されるライブラリである。 rRNA遺伝子の増幅をブロックするように設計された例示的なPCRクランプの概要を提供する。Design1は、逆平行及び隣接PCRクランプを提供する。Design1+2は、追加の逆相補的PCRクランプが付加されているDesign1の特徴を組み込む非重複PCRクランプを提供する。Design3は、重複逆平行PCRクランプを提供する。 Design1又はDesign1_2において設計されたPCRクランプが、非枯渇全RNAを使用したときのrRNA増幅転写物を有意に低減させたことを示す。rRNAは、対照(PCRクランプなし)と比較して、PCRクランプを使用して約85%から30%まで減少した。 Design1又はDesign1_2において設計されたPCRクランプが、RPO濃縮試料及び非枯渇全RNA試料においてrRNAを更に低減させたことを示す。DesignOffSet(Design3)は、RPO試料中のrRNA濃縮に有意な影響を及ぼさなかった。Design1又はDesign1_2 PCRクランプを使用することは、rRNA濃縮を約20%から1%まで減少させた。 Design1又はDesign1_2で設計されたPCRクランプが、mRNA選択試料中の標的化されたrRNAを低減したことを実証する。Design1及び2は、mRNA選択試料中の%rRNAを約1.5%rRNAから約0.25%rRNAまで更に低減することができた。 PCRクランプとRiboZero法との間の100万マッピングリード当たりの転写物1キロベースの断片数(Fragments Per Kilobase of transcript per Million mapped reads、FPKM)比較を提供する。 PCRクランプを使用する試料が、異なる枯渇方法にわたってFPKM R値>0.95を有する高レベルの発現相関を有することを実証する。 最適化なしのプローブパネルから生成されたデータのトレースを示す。プローブ設計及びワークフロー生化学を最適化することによって、追加の利益が可能であり得る。 本開示のPCRクランプ(ブロッキングオリゴ)の例示的な実施形態を提供する。 75℃又は80℃の融解温度を有するように設計されたPCRクランプを用いて、28S rRNA、18S rRNA、5.85rRNA、Mt12S rRNA及びmt16Sの配列から生成され得るPCRクランプの例を提供する。丸は、80℃PCRクランプがrRNA配列から生成されることができない配列のギャップを示す(表に示されるように)。 rRNA含有RNAseqデータからのデータを示す。リードの大部分は、80℃の融解温度を有するPCRクランプでブロックされた。 PCRクランプ研究の概要を提示する。(上パネル)42kbpヒトリボソームDNA完全反復単位(GenBank U13359.1)の概要。非常に豊富なリボソームRNA(18S、5.8S、及び28S)をコードする3つの遺伝子座が赤色で記されている。追加の特徴は、濃い灰色で示されている。(下パネル)18S、5.8S、及び28S rRNAをコードする遺伝子座を含有する領域の拡大図。rRNA遺伝子は、赤色で記されている。PCRクランプの2つの設計が示されている:端から端までタイル状に並べられた交互の80-mer PCRクランプを有するDesign1。1つおきのPCRクランプは、標的化されたrRNA遺伝子に対して交互の5’→3’配向にある(薄い灰色又は濃い灰色のいずれか)。Design2は、Design1と同じ相対位置にPCRクランプを含有するが、各クランプは、Design1の逆相補的配列である。
本明細書に組み込まれ、かつ本明細書の一部を構成する添付図面は、本開示の1つ以上の実施形態を図解し、詳細な説明とともに、本開示の原理及び実装を説明する役割を果たす。
本明細書及び添付の特許請求の範囲で使用される場合、「a」、「an」、及び「the」という単数形は、文脈がそうでない旨を明確に指示しない限り、複数の指示対象を含む。したがって、例えば、「オリゴヌクレオチド(oligonucleotide)」への言及は、複数のそのようなオリゴヌクレオチドを含み、「標的配列(the target sequence)」への言及は、1つ以上の標的配列への言及などを含む。
また、別途記載のない限り、「又は」の使用は「及び/又は」を意味する。同様に、「含む(comprise)」、「含む(comprises)」、「含む(comprising)」、「含む(include)」、「含む(includes)」、「含む(including)」、「有する(have)」、「有する(haves)」、「有する(having)」は、交換可能であり、限定することを意図するものではない。
様々な実施形態の説明が「含む(comprising)」という用語を使用する場合、当業者であれば、いくつかの具体的な事例において、ある実施形態が、「から本質的になる(consisting essentially of)」又は「からなる(consisting of)」という文言を使用して代替的に説明することができることを理解するであろうことを、更に理解されたい。
別途定義されない限り、本開示書で使用される全ての技術用語及び科学用語は、本開示が属する技術分野の当業者に一般的に理解されるものと同じ意味を有する。本明細書に記載されるものと同様又は同等の方法及び材料を本開示の方法及び組成物の実施に使用することができるが、例示的な方法、デバイス、及び材料が、本明細書に記載されている。
「増幅」又は「増幅する」という表現は、特定のポリヌクレオチドの余分なコピー又は複数のコピーが形成されるプロセスを指す。増幅は、PCR、ライゲーション増幅(又はリガーゼ連鎖反応、ligase chain reaction、LCR)、及び増幅法などの方法を含む。これらの方法は、公知であり、当技術分野で広く実施されている。例えば、米国特許第4,683,195号及び同第4,683,202号、並びにInnis et al.,「PCR protocols:a guide to method and applications」Academic Press,Incorporated(1990)(PCRに関して)と、Wu et al.(1989)Genomics4:560-569(LCRに関して)と、を参照されたい。一般に、PCR手順は、(i)DNA試料(又はライブラリ)内の特定の遺伝子へのプライマの配列特異的ハイブリダイゼーション、(ii)DNAポリメラーゼを使用する複数回のアニーリング、伸長、及び変性を伴うその後の増幅、並びに(iii)正確なサイズのバンドについてのPCR産物のスクリーニングから構成される、遺伝子増幅の方法を説明する。使用されるプライマは、重合の開始を提供するのに十分な長さ及び適切な配列のオリゴヌクレオチドであり、すなわち、各プライマは、増幅されるゲノム遺伝子座の各鎖に相補的であるように特異的に設計される。
増幅反応を実施するための試薬及びハードウェアは、市販されている。特定の遺伝子領域からの配列を増幅するために有用なプライマは、好ましくは、標的領域又はその隣接領域における配列に相補的であり、かつ特異的にハイブリダイズし、本明細書で提供されるポリヌクレオチド配列を使用して調製され得る。増幅によって生成された核酸配列は、直接配列決定され得る。
「ブロッキングオリゴヌクレオチド」は、本明細書で使用される場合、1つ以上の望ましくない核酸種のうちの少なくとも1つに特異的に結合し得る核酸分子を指し、それによって、ブロッキングオリゴヌクレオチドと1つ以上の望ましくない核酸種との間の結合は、1つ以上の望ましくない核酸腫の増幅又は伸長(例えば、逆転写)を低減又は防止し得る。例えば、ブロッキングオリゴヌクレオチドは、1つ以上の望ましくない核酸種とハイブリダイズすることができる核酸配列を含み得る。いくつかの実施形態では、複数のブロッキングオリゴヌクレオチドが提供され得る。複数のブロッキングオリゴヌクレオチドは、1つ以上の望ましくない核酸種のうちの少なくとも1つ、少なくとも2つ、少なくとも5つ、少なくとも10個、少なくとも100個、少なくとも1,000個以上に特異的に結合し得る。更に、複数の異なるブロッキングオリゴヌクレオチドは、同じ望ましくない核酸種上の少なくとも1つ、少なくとも2つ、少なくとも5つ、少なくとも10個、少なくとも20個、少なくとも100個の異なる部位に、望ましくない核酸種上の平行であるか、逆平行であるか、間隔を有するか、又は連続する部位で特異的に結合し得る。ブロッキングオリゴヌクレオチドが望ましくない核酸種に特異的に結合する場所は、変化し得る。例えば、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の5’末端に近い配列に特異的に結合し得る。いくつかの態様では、ブロッキングオリゴヌクレオチドは、1つ以上の望ましくない核酸種のうちの少なくとも1つの5’末端の10nt、20nt、30nt、40nt、50nt、100nt、200nt、300nt、400nt、500nt、又は1,000nt以内に特異的に結合し得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の3’末端に近い配列に特異的に結合し得る。例えば、ブロッキングオリゴヌクレオチドは、1つ以上の望ましくない核酸種のうちの少なくとも1つの3’末端の10nt、20nt、30nt、40nt、50nt、100nt、200nt、300nt、400nt、500nt、1,000nt以内に特異的に結合し得る。別の例として、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の中間部分の配列に特異的に結合し得る。いくつかの態様では、ブロッキングオリゴヌクレオチドは、1つ以上の望ましくない核酸種のうちの少なくとも1つの中間点から10nt、20nt、30nt、40nt、50nt、100nt、200nt、300nt、400nt、500nt、1,000nt以内に特異的に結合し得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の5’末端と3’末端との間の複数の位置で結合し得る。
いくつかの実施態様では、ブロッキングオリゴヌクレオチドと望ましくない核酸種との間の結合は、望ましくない核酸種の増幅及び/又は伸長を少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、又は100%だけ低減し得る。
ブロッキングオリゴヌクレオチドは、例えば、望ましくない核酸種とのハイブリダイゼーション複合体を形成することによって、望ましくない核酸種の増幅及び/又は伸長を低減し得ることが企図され、それにより、複合体は、高い融解温度(T)を有し、したがって、ブロッキングオリゴヌクレオチドが、逆転写酵素若しくはポリメラーゼ、又はそれらの組み合わせのためのプライマとして機能することを可能にしない。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、70℃、75℃、80℃、又は上記の温度のうちの任意の2つを含むか若しくはその間である範囲(例えば、50℃~60℃)のTを有し得る。
ブロッキングオリゴヌクレオチドは、いくつかの実施形態では、1つ以上の非天然ヌクレオチドを含み得る。非天然ヌクレオチドは、例えば、感光性又はトリガー可能なヌクレオチドであり得る。非天然ヌクレオチドの例としては、ペプチド核酸(peptide nucleic acid、PNA)、モルフォリノ及びロックド核酸(locked nucleic acid、LNA)、並びにグリコール核酸(glycol nucleic acid、GNA)及びトレオース核酸(threose nucleic acid、TNA)が挙げられ得るが、これらに限定されない。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、LNA/PNA/DNAキメラ、LNA/DNAキメラ、PNA/DNAキメラ、GNA/DNAキメラ、TNA/DNAキメラ、又はそれらの組み合わせなどの、キメラオリゴヌクレオチドである。
ブロッキングオリゴヌクレオチドは、約10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、30nt、35nt、40nt、45nt、50nt、60nt、70nt、80nt、90nt、100nt、200nt、又は上記のヌクレオチド長のうちのいずれか2つを含むか若しくはその間である範囲(例えば、17nt~30nt)である長さを有し得る。
ブロッキングオリゴヌクレオチドの融解温度(T)は、いくつかの実施形態では、ブロッキングオリゴヌクレオチドの長さを調節することによって修飾され得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドのTは、LNA/DNAキメラ又はPNA/DNAキメラを含むブロッキングオリゴヌクレオチド中のDNA残基の数によって修飾される。例えば、LNA/DNAキメラ又はPNA/DNAキメラを含むブロッキングオリゴヌクレオチドは、約10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%、95%、99%又は上記の値のうちの任意の2つの間の範囲であるDNA残基のパーセンテージを有し得る。
いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、増幅及び/又は伸長反応のためのプライマ又はプローブとして機能することができないように設計され得る。例えば、ブロッキングオリゴヌクレオチドは、逆転写酵素又はポリメラーゼに対するプライマとして機能することができない場合がある。例えば、LNA/DNAキメラ又はPNA/DNAキメラを含むブロッキングオリゴヌクレオチドは、特定のパーセンテージのLNA又はPNA残基を有するように、あるいはオリゴヌクレオチドの3’末端、5’末端に近いか、若しくは3’末端、5’末端、又は中間部分などの、特定の場所にLNA又はPNAを有するように設計され得る。いくつかの実施形態では、LNA/DNAキメラ又はPNA/DNAキメラを含むブロッキングオリゴヌクレオチドは、約10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、80%、90%、又は上記の値のうちの任意の2つの間の範囲であるLNA又はPNA残基のパーセンテージを有し得る。
「cDNAライブラリ」という用語は、単一細胞又は複数の単一細胞のトランスクリプトームのいくつかの部分を一緒に構成する、クローニングされた相補的DNA(complementary DNA、cDNA)断片のコレクションを指す。cDNAは、細胞に見つかる完全に転写されたmRNAから生成され、したがって、単一細胞の発現された遺伝子のみ、又は一緒にプールされたとき、複数の単一細胞由来の発現された遺伝子を含有する。
本明細書で使用される場合、「相補的」という用語は、2つのヌクレオチド間の精密な対合の能力を指し得る。例えば、核酸の所与の位置のヌクレオチドが別の核酸のヌクレオチドと水素結合することができる場合、2つの核酸は、その位置で互いに相補的であると考えられる。2つの一本鎖核酸分子間の相補性は、ヌクレオチドのうちの一部のみが結合する「部分的」であり得るか(例えば、ブロッキングオリゴと相補的標的との間に1つ以上のミスマッチが存在する)、又は一本鎖分子間に完全な相補性が存在するとき完全であり得る(例えば、ブロッキングオリゴと相補的標的との間にミスマッチがない)。第1のヌクレオチド配列は、第1のヌクレオチド配列が第2のヌクレオチド配列に相補的である場合、第2の配列の「相補体」であると言うことができる。第1のヌクレオチド配列は、第1のヌクレオチド配列が第2の配列の逆である(すなわち、ヌクレオチドの順序が逆である)配列に相補的である場合、第2の配列の「逆相補体」であると言うことができる。本明細書で使用される場合、「相補体」、「相補的」、及び「逆相補体」という用語は、交換可能に使用され得る。分子が別の分子にハイブリダイズし得る場合、それはハイブリダイズしている分子の相補体であり得ることが本開示から理解される。
「保存的アミノ酸置換」は、アミノ酸残基が類似の側鎖を有するアミノ酸残基で置換される置換である。類似の側鎖を有するアミノ酸残基のファミリーは、当技術分野において定義されている。これらのファミリーは、塩基性側鎖を有するアミノ酸(例えば、リジン、アルギニン、ヒスチジン)、酸性側鎖を有するアミノ酸(例えば、アスパラギン酸、グルタミン酸)、無電荷極性側鎖を有するアミノ酸(例えば、グリシン、アスパラギン、グルタミン、セリン、スレオニン、チロシン、システイン)、非極性側鎖を有するアミノ酸(例えば、アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン)、β分岐側鎖を有するアミノ酸(例えば、スレオニン、バリン、イソロイシン)、及び芳香族側鎖を有するアミノ酸(例えば、チロシン、フェニルアラニン、トリプトファン、ヒスチジン)を含む。以下の6つの群は、各々、互いに保存的置換であるアミノ酸を含有する:1)セリン(S)、スレオニン(T)、2)アスパラギン酸(D)、グルタミン酸(E)、3)アスパラギン(N)、グルタミン(Q)、4)アルギニン(R)、リジン(K)、5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、アラニン(A)、バリン(V)、及び6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)。
本明細書で使用される場合、「発現」は、ポリヌクレオチドがmRNAに転写されるプロセス、及び/又は転写されたmRNAが、続いて、ペプチド、ポリペプチド、若しくはタンパク質に翻訳されるプロセスを指す。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核細胞におけるmRNAのスプライシングを含み得る。
第1のファミリー又は種の元の酵素又は遺伝子に関して使用される「相同体」という用語は、機能的、構造的又はゲノム分析によって、第1のファミリー又は種の元の酵素又は遺伝子に対応する第2のファミリー又は種の酵素又は遺伝子であると決定される、第2のファミリー又は種の別個の酵素又は遺伝子を指す。ほとんどの場合、相同体は、機能的、構造的、又はゲノム類似性を有することになる。酵素又は遺伝子の相同体が、遺伝子プローブ及びPCRを使用して容易にクローニングされ得る技術は公知である。相同体としてのクローニングされた配列の同一性は、機能アッセイを使用して、及び/又は遺伝子のゲノムマッピングによって確認され得る。
本明細書で使用される場合、2つのポリヌクレオチド、オリゴヌクレオチド、ペプチド、ポリペプチド、若しくはタンパク質(又は上記のうちのいずれかの断片)は、核酸又はアミノ酸配列が少なくとも約30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%の同一性を有するとき、実質的に相同である。2つのアミノ酸配列、又は2つの核酸配列のパーセント同一性を決定するために、配列が最適な比較目的のためにアラインメントされる(例えば、ギャップが、最適なアラインメントのために第1及び第2のアミノ酸又は核酸配列のうちの一方又は両方に導入され得、非相同配列は、比較目的のために無視され得る)。一実施形態では、比較目的のためにアラインメントされる参照配列の長さは、参照配列の長さの少なくとも30%、典型的には少なくとも40%、より典型的には少なくとも50%、更により典型的には少なくとも60%、及び更により典型的には少なくとも70%、80%、90%、又は100%である。次いで、対応するアミノ酸位置又はヌクレオチド位置におけるアミノ酸残基又はヌクレオチドが比較される。第1の配列における位置が、第2の配列における対応する位置と同じアミノ酸残基又はヌクレオチドによって占められているとき、分子は、その位置で同一である(本明細書で使用される場合、アミノ酸又は核酸「同一性」は、アミノ酸又は核酸「相同性」と等価である)。2つの配列間のパーセント同一性は、2つの配列の最適なアラインメントのために導入される必要がある、ギャップの数及び各ギャップの長さを考慮する、配列によって共有される同一の位置の数の関数である。
ハイブリダイゼーションが2つの一本鎖ポリヌクレオチド間で、逆平行構成において起こるとき、反応は、「アニーリング」と呼ばれ、これらのポリヌクレオチドは、「相補的」として説明される。二本鎖ポリヌクレオチドは、ハイブリダイゼーションが第1のポリヌクレオチドの鎖のうちの1つと第2のポリヌクレオチドとの間で起こり得る場合、別のポリヌクレオチドに対して相補的又は相同であり得る。相補性又は相同性(1つのポリヌクレオチドが別のポリヌクレオチドと相補的である度合い)は、一般的に受け入れられている塩基対合規則に従って、互いに水素結合を形成すると予想される対向鎖における塩基の割合に関して定量可能である。
「オリゴヌクレオチド」及び「ポリヌクレオチド」という用語は、交換可能に使用され、デオキシリボヌクレオチド若しくはリボヌクレオチド又はそれらの類似体のいずれかである、任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の三次元構造を有し得、既知の又は不明な任意の機能を果たし得る。以下は、ポリヌクレオチドの非限定的な例である:遺伝子又は遺伝子断片(例えば、プローブ、プライマ、EST又はSAGEタグ)、エクソン、イントロン、メッセンジャーRNA(messenger RNA、mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離DNA、任意の配列の単離RNA、核酸プローブ及びプライマ。ポリヌクレオチド(例えば、ブロッキングオリゴヌクレオチド)は、メチル化ヌクレオチド及びヌクレオチド類似体などの修飾ヌクレオチドを含み得る。用語はまた、二本鎖分子及び一本鎖分子の両方を指す。別段の指定又は要求がない限り、ポリヌクレオチドを含む本開示の任意の実施形態は、二本鎖形態と、二本鎖形態を構成することが知られているか又は予測される2つの相補的な一本鎖形態の各々との両方を包含する。
本明細書に開示される方法及び組成物において有用な核酸は、骨格中に非天然糖部分を含有し得る。例示的な糖修飾としては、ハロゲン、アルキル、置換アルキル、-SH、-SCH、-OCN、-Cl、-Br、-CN、-CF、-OCF、-SOCH、-OSO、-SO、-CH、-ONO、-NO、-N、-NH、置換シリルなどの付加などの2’修飾が挙げられるが、これらに限定されない。同様の修飾は、糖上の他の位置、特に3’末端ヌクレオチド上又は2’-5’結合オリゴヌクレオチド中の糖の3’位、及び5’末端ヌクレオチドの5’位でも行われ得る。糖修飾を有する核酸、ヌクレオシド類似体、又はヌクレオチド類似体は、可逆的ブロッキング基、ペプチド結合標識、又はその両方を含むように更に修飾され得る。上記の2’修飾が存在するそれらの実施形態では、塩基は、ペプチド結合標識を有し得る。
本明細書に開示される方法及び組成物において有用な核酸はまた、ネイティブ又は非ネイティブ塩基を含み得る。この点に関して、ネイティブデオキシリボ核酸は、アデニン、チミン、シトシン、又はグアニンからなる群から選択される1つ以上の塩基を有することができ、リボ核酸は、ウラシル、アデニン、シトシン、又はグアニンからなる群から選択される1つ以上の塩基を有することができる。ネイティブ骨格又は類似体構造を有するかどうかにかかわらず、核酸に含められ得る例示的な非ネイティブ塩基としては、限定なしで、イノシン、キササニン、ヒポキササニン、イソシトシン、イソグアニン、5-メチルシトシン、5-ヒドロキシメチルシトシン、2-アミノアデニン、6-メチルアデニン、6-メチルグアニン、2-プロピルグアニン、2-プロピルアデニン、2-チオウラシル、2-チオチミン、2-チオシトシン、15-ハロウラシル、15-ハロシトシン、5-プロピニルウラシル、5-プロピニルシトシン、6-アゾウラシル、6-アゾシトシン、6-アゾチミン、5-ウラシル、4-チオウラシル、8-ハロアデニン又はグアニン、8-アミノアデニン又はグアニン、8-チオールアデニン又はグアニン、8-チオアルキルアデニン又はグアニン、8-ヒドロキシルアデニン又はグアニン、5-ハロ置換ウラシル又はシトシン、7-メチルグアニン、7-メチルアデニン、8-アザグアニン、8-アザアデニン、7-デアザグアニン、7-デアザアデニン。3-デアザグアニン、3-デアザアデニンなどが挙げられる。特定の実施形態は、米国特許第5,681,702号に一般的に説明されているように、非特異的ハイブリダイゼーションを低減するために、核酸中のイソシトシン及びイソグアニンを利用し得る。
本開示の核酸において使用される非ネイティブ塩基は、ユニバーサル塩基対合活性を有し得、任意の他の天然由来の塩基と塩基対合することができる。ユニバーサル塩基対合活性を有する例示的な塩基としては、3-ニトロピロール及び5-ニトロインドールが挙げられる。使用され得る他の塩基としては、シトシン、アデニン、又はウラシルと塩基対合するイノシンなどの天然由来の塩基のサブセットとの塩基対合活性を有するものが挙げられる。
ポリヌクレオチドは、4つのヌクレオチド塩基:アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、及びポリヌクレオチドがRNAであるとき、チミンの代わりにウラシル(U)の特定の配列から構成される。したがって、ポリヌクレオチド配列という用語は、ポリヌクレオチド分子のアルファベット表現である。このアルファベット表現は、中央処理装置を有するコンピュータ内のデータベース内に入力され、機能ゲノミクス及び相同性検索などのバイオインフォマティクス用途に使用され得る。
「ライブラリ」という用語は、5’末端及び3’末端に、典型的に、付加されたアダプタ配列を含む、鋳型分子のコレクション又は複数の鋳型分子を指す。鋳型分子のコレクション又は複数の鋳型分子を指すための「ライブラリ」という用語の使用は、ライブラリを構成する鋳型が特定の供給源に由来すること、又は「ライブラリ」が特定の組成物を有することを暗示すると解釈されるべきではない。例として、「ライブラリ」という用語の使用は、ライブラリ内の個々の鋳型が異なるヌクレオチド配列のものでなければならないこと、又は鋳型が配列及び/若しくは供給源に関して関連していることを暗示すると解釈されるべきではない。
本明細書で使用される場合、「ロックド核酸」又は「LNA」という用語は、修飾RNAヌクレオチドを指す。LNAヌクレオチドのリボース部分は、2’酸素及び4’炭素を接続する余分な架橋で修飾される。架橋は、リボースを3’-endo(North)立体構造に「ロック」する。本開示の方法においてLNAを使用する利点のうちのいくつかとしては、二本鎖の熱安定性の増加、標的特異性の増加、並びにエキソ及びエンドヌクレアーゼからの耐性が挙げられる。
様々な実施形態では、本開示は、単一のタイプの鋳型分子の複数のコピーを含み、各々が、それらの5’末端及びそれらの3’末端に付加されたアダプタ配列を有する、いわゆる「単一鋳型」ライブラリと、個々の鋳型分子の全てではないが多くが異なる標的配列(以下に定義されるような)を含み、各鋳型分子がそれらの5’末端及びそれらの3’末端にアダプタ配列を付加している、「複合」ライブラリと、の形成を包含する。そのような複合鋳型ライブラリは、ランダムゲノムDNA断片、cDNAなど(これらに限定されない)の標的ポリヌクレオチドの複合混合物から出発して、本開示の方法を使用して調製され得る。本開示はまた、いくつかの個々の「単一鋳型」ライブラリを一緒に混合することによって形成された「複合」ライブラリに及び、「単一鋳型」ライブラリの各々は、単一のタイプの標的分子(すなわち、モノ鋳型)から出発して、本開示の方法を使用して別々に調製されている。特定の実施形態では、複合ライブラリ中の個々のポリヌクレオチド鋳型の50%超、又は60%超、又は70%超、又は80%超、又は90%超、又は95%超が、異なる標的配列を含み得る。
本明細書で使用される場合、「複数」とは、分子の集団を指し、分析されることが所望される任意の数の分子を含み得る。
本明細書で使用される場合、「ペプチド核酸」又は「PNA」は、DNA又はRNAに類似する人工的に合成されたポリマーを指し、骨格は、ペプチド結合によって結合された反復N-(2-アミノエチル)-グリシン単位から構成される。PNAの骨格は、天然由来の核酸の高度に荷電されたホスホジエステル骨格とは対照的に、中性条件下で実質的に非イオン性である。これは、2つの非限定的な利点を提供する。第一に、PNA骨格は、改善されたハイブリダイゼーション動態を呈する。第二に、PNAは、ミスマッチ塩基対完全にマッチした塩基対の融解温度(Tm)のより大きい変化を有する。DNA及びRNAは、典型的には、内部ミスマッチに対してTmにおける2~4℃の低下を呈する。非イオン性PNA骨格では、低下は、7~9℃に近い。これは、より良好な配列識別を提供し得る。同様に、それらの非イオン性の性質に起因して、これらの骨格に結合した塩基のハイブリダイゼーションは、塩濃度に対して比較的非感受性である。
「プライマ」は、概して、標的とハイブリダイズし、その後、標的に相補的なポリヌクレオチドの重合を促進することによって、関心対象の試料中に潜在的に存在する標的又は鋳型に結合する遊離3’--OH基を有する短いポリヌクレオチドである。本開示のプライマは、17~30ヌクレオチドの範囲のヌクレオチドから構成される。一実施形態では、プライマは、少なくとも17ヌクレオチド、又は代替的に少なくとも18ヌクレオチド、又は代替的に少なくとも19ヌクレオチド、又は代替的に少なくとも20ヌクレオチド、又は代替的に少なくとも21ヌクレオチド、又は代替的に少なくとも22ヌクレオチド、又は代替的に少なくとも23ヌクレオチド、又は代替的に少なくとも24ヌクレオチド、又は代替的に少なくとも25ヌクレオチド、又は代替的に少なくとも26ヌクレオチド、又は代替的に少なくとも27ヌクレオチド、又は代替的に少なくとも28ヌクレオチド、又は代替的に少なくとも29ヌクレオチド、又は代替的に少なくとも30ヌクレオチド、又は代替的に少なくとも50ヌクレオチド、又は代替的に少なくとも75ヌクレオチド、又は代替的に少なくとも100ヌクレオチドである。
本明細書で使用される場合、「単一細胞」は、1つの細胞を指す。本明細書に説明される方法において有用な単一細胞は、関心対象の組織から、又は生検、血液試料、若しくは細胞培養物から取得され得る。加えて、特定の器官、組織、腫瘍、新生物などからの細胞が取得され、本明細書に説明される方法で使用され得る。更に、一般に、細菌又は酵母を含む原核生物又は真核生物の単細胞生物の集団などの任意の集団由来の細胞が、本方法において使用され得る。いくつかの実施形態では、cDNAライブラリを調製する方法は、単一細胞を取得する工程を含み得る。単一細胞懸濁液は、例えば、トリプシン又はパパインを酵素的に使用して、組織試料中の細胞を結合すること、又は培養中の接着細胞を放出すること、又は試料中の細胞を機械的に分離することを含む、当技術分野で公知の標準的な方法を使用して取得され得る。単一細胞は、単一細胞が個々に処理され得る任意の好適な反応容器中に配置され得る。例えば、各単一細胞が単一ウェルに配置されるような96ウェルプレートである。
単一細胞を操作するための方法は、当技術分野で公知であり、蛍光活性化細胞選別(fluorescence activated cell sorting、FACS)、顕微操作、及び半自動細胞ピッカー(例えば、Stoelting Co.製のQuixell(商標)細胞転送システム)の使用を含む。個々の細胞は、例えば、場所、形態、又はレポーター遺伝子発現などの顕微鏡観察によって検出可能な特徴に基づいて個々に選択され得る。
ライブラリ中の個々のポリヌクレオチド分子を指すための「鋳型」という用語の使用は、ライブラリ中のポリヌクレオチドの一方又は両方の鎖が、ポリメラーゼによって触媒される鋳型依存性核酸重合のための鋳型として作用することができることを単に示す。この用語の使用は、本開示の範囲を、その後の酵素触媒重合反応において鋳型として実際に使用されるポリヌクレオチドのライブラリに限定するものとして解釈されるべきではない。
「マッチしていない領域」という用語は、アダプタを形成する2つのポリヌクレオチド鎖の配列が、PCR反応のための標準的なアニーリング条件下で、2つの鎖が互いにアニーリングすることができないような非相補性の度合いを呈する、アダプタの領域を指す。マッチしていない領域における2つの鎖は、2つの鎖がアニーリング条件下で一本鎖形態に逆転するという条件で、酵素触媒ライゲーション反応のための標準的な反応条件下で、ある程度のアニーリングを呈し得る。
プールされたcDNA試料は、本明細書中に説明される方法で、エマルジョンPCR及び単一プライマPCRを含むポリメラーゼ連鎖反応(PCR)によって増幅され得る。例えば、cDNA試料は、単一プライマPCRによって増幅され得る。cDNA合成プライマは、5’増幅プライマ配列(amplification primer sequence、APS)を含み得、これは、その後、cDNAの第1鎖が、5’APSに相補的であるプライマを使用するPCRによって増幅されることを可能にする。鋳型スイッチオリゴヌクレオチドはまた、5’APSを含み得、これは、cDNA合成プライマ中の5’APSと少なくとも70%同一、少なくとも80%同一、少なくとも90%同一、少なくとも95%同一、又は70%、80%、90%、若しくは100%同一であり得る。これは、プールされたcDNA試料が、単一プライマを使用するPCRによって(すなわち、単一プライマPCRによって)増幅され得ることを意味し、これは、短い混入アンプリコン及びプライマ二量体の増幅を低減するためにPCR抑制効果を利用する(Dai et al.,J Biotechnol 128(3):435-43(2007))。各アンプリコンの2つの末端が相補的であるため、短いアンプリコンは、安定なヘアピンを形成することになり、これらは、PCRには不十分な鋳型である。これは、短縮型cDNAの量を低減し、より長いcDNA分子の収率を改善する。5’APSは、cDNAライブラリの下流処理を容易にするように設計され得る。例えば、cDNAライブラリが特定の配列決定方法、例えば、Life TechnologyのSOLiD配列決定技術、又はIlluminaのGenome Analyzerによって分析されることになる場合、5’APSは、これらの配列決定方法において使用されるプライマと同一であるように設計され得る。例えば、5’APSは、SOLiD P1プライマ、及び/又はcDNA合成プライマに挿入されたSOLiD P2配列と同一であり得、その結果、SOLiD配列決定に必要とされるP1及びP2配列は、増幅されたライブラリに不可欠である。
プールされたcDNAを増幅するための別の例示的な方法は、PCRを含む。PCRは、複製コピーが、上流及び下流プライマからなるプライマの対又はプライマのセットと、DNAポリメラーゼなどの重合の触媒と、典型的には、熱安定性ポリメラーゼ酵素と、を使用して、標的ポリヌクレオチドから作製される反応である。PCRの方法は、当技術分野で周知であり、例えば、MacPherson et al.(1991)PCR1:A Practical Approach(IRL Press at Oxford University Press)に教示されている。PCR又は遺伝子クローニングなどのポリヌクレオチドの複製コピーを生成する全てのプロセスは、本明細書で集合的に複製と称される。プライマはまた、サザンブロット分析又はノーザンブロット分析などの、ハイブリダイゼーション反応におけるプローブとして使用され得る。
エマルジョンPCRのために、エマルジョンPCR反応は、「油中水」混合物を激しく振盪又は撹拌して、数百万のミクロンサイズの水性区画を生成することによって生じる。DNAライブラリは、限界希釈で、乳化前にビーズと混合されるか、又はエマルジョン混合物中に直接混合される。区画サイズとビーズ及び標的分子の限界希釈との組み合わせが、平均してただ1つのDNA分子及びビーズを含有する区画を生成するために使用される(最適希釈では、多くの区画がいかなる標的も含まないビーズを有することになる)。増幅効率を促進するために、上流(低濃度、ビーズ上のプライマ配列にマッチする)、及び下流PCRプライマ(高濃度)の両方が、反応混合物中に含められる。乳化工程中に生成された水性区画のサイズに応じて、1μl当たり最大3×10個の個々のPCR反応が同じチューブ内で同時に実施され得る。本質的に、エマルジョン中の各小区画は、マイクロPCR反応器を形成する。エマルジョン中の区画の平均サイズは、乳化条件に応じて、直径がサブミクロンから100ミクロンを超える範囲である。
「同一性」、「相同性」、又は「類似性」は、交換可能に使用され、2つの核酸分子間の配列類似性を指す。同一性は、比較の目的のためにアラインメントされ得る各配列における位置を比較することによって決定され得る。比較される配列中の位置が同じ塩基又はアミノ酸によって占められているとき、分子は、その位置で相同である。配列間の同一性の度合いは、配列によって共有されるマッチング又は同一の位置の数の関数である。非関連配列又は非相同配列は、本明細書に説明される配列のうちの1つと40%未満の同一性、又は代替的に25%未満の同一性を共有する。
別の配列に対して特定のパーセンテージ(例えば、60%、65%、70%、75%、80%、85%、90%、95%、98%又は99%)の「配列同一性」を有するポリヌクレオチドは、アラインメントされたとき、そのパーセンテージの塩基が、2つの配列を比較する際に、同じであることを意味する。このアラインメント及びパーセント配列同一性又は相同性は、当技術分野で公知のソフトウェアプログラム、例えば、Ausubel et al.,Current Protocols in Molecular Biology,John Wiley & Sons,New York,N.Y.,(1993)に説明されるものを使用して決定され得る。好ましくは、デフォルトパラメータがアラインメントに使用される。1つのアラインメントプログラムは、デフォルトパラメータを使用するBLASTである。特に、プログラムは、以下のデフォルトパラメータを使用するBLASTN及びBLASTPである:Genetic code=standard、filter=none、strand=both、cutoff=60、expect=10、Matrix=BLOSUM62、Descriptions=50sequences、sort by=HIGH SCORE、Databases=non-redundant、GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+SwissProtein SPupdate+PIR。これらのプログラムの詳細は、National Center for Biotechnology Informationにおいて見出すことができる。
パーセント配列同一性とも称され得る、ポリペプチドに対する配列相同性は、典型的には、配列分析ソフトウェアを使用して測定される。例えば、the Sequence Analysis Software Package of the Genetics Computer Group(GCG),University of Wisconsin Biotechnology Center,910 University Avenue,Madison,Wis.53705を参照されたい。タンパク質分析ソフトウェアは、保存的アミノ酸置換を含む様々な置換、欠失、及び他の修飾に割り当てられた相同性の測定を使用して、類似の配列をマッチングさせる。例えば、GCGは、「Gap」及び「Bestfit」などのプログラムを含有し、これらは、デフォルトパラメータとともに使用されて、異なる種の生物由来の相同ポリペプチドなどの、密接に関連するポリペプチド間、又は野生型タンパク質とその突然変異タンパク質との間の配列相同性又は配列同一性を決定し得る。例えば、GCGバージョン6.1を参照されたい。
分子配列を、異なる生物由来の多数の配列を含有するデータベースと比較するために使用される典型的なアルゴリズムは、コンピュータプログラムBLAST(Altschul,1990、Gish,1993、Madden,1996、Altschul,1997、Zhang,1997)、特にblastp又はtblastn(Altschul,1997)である。BLASTpの典型的なパラメータは以下のとおりである:Expectation value:10(デフォルト)、Filter:seg(デフォルト)、Cost to open a gap:11(デフォルト)、Cost to extend a gap:1(デフォルト)、Max.alignments:100(デフォルト)、Word size:11(デフォルト)、No.of descriptions:100(デフォルト)、Penalty Matrix:BLOWSUM62。
多数の異なる生物に由来する配列を含有するデータベースを検索するとき、アミノ酸配列を比較することが典型的である。アミノ酸配列を使用するデータベース検索は、当技術分野で公知のblastp以外のアルゴリズムによって測定され得る。例えば、ポリペプチド配列は、GCGバージョン6.1のプログラムであるFASTAを使用して比較され得る。FASTAは、クエリー配列と検索配列との間の最良の重複の領域のアラインメント及びパーセント配列同一性を提供する(Pearson,1990、参照によって本明細書に組み込まれる)。例えば、アミノ酸配列間のパーセント配列同一性は、参照により本明細書に組み込まれるGCGバージョン6.1で提供されるように、FASTAをそのデフォルトパラメータ(2のword size及びPAM250 scoring matrix)を用いて使用して決定され得る。
本明細書で説明されるcDNAライブラリを調製する方法は、cDNAライブラリを処理して、配列決定に好適なライブラリを取得することを更に含み得る。本明細書で使用される場合、ライブラリは、cDNAライブラリの複雑性、サイズ、純度などが所望されるスクリーニング方法に好適であるとき、配列決定に好適である。特に、cDNAライブラリは、Life TechnologyのSOLiD配列決定技術、OxfordのNanopore DNA配列決定技術、又はIlluminaのクラスタ生成及び配列決定技術などの、任意のハイスループットスクリーニング方法に好適な試料を作製するように処理され得る。したがって、cDNAライブラリは、短い断片の5’末端ライブラリを取得するために、cDNAライブラリ(例えば、DNaseを用いて)を断片化することによって処理され得る。アダプタは、ライブラリの配列決定を容易にするために、例えば、一方又は両方の末端でcDNAに付加され得る。cDNAライブラリは、配列決定のために十分な量のcDNAを取得するために、例えば、PCRによって更に増幅され得る。
本開示の実施形態は、本明細書に説明される方法のいずれかによって生成されたcDNAライブラリを提供する。このcDNAライブラリは、単一細胞又は複数の単一細胞における遺伝子発現の分析を提供するために配列決定され得る。
本開示の実施形態はまた、複数の単一細胞における遺伝子発現を分析するための方法を提供し、方法は、本明細書に説明される方法を使用してcDNAライブラリを調製する工程と、cDNAライブラリを配列決定する工程と、を含む。「遺伝子」は、転写及び翻訳された後に特定のポリペプチド又はタンパク質をコードすることができる少なくとも1つのオープンリーディングフレーム(open reading frame、ORF)を含有するポリヌクレオチドを指す。本明細書に説明されるポリヌクレオチド配列のうちのいずれかは、それらと関連付けられる遺伝子のより大きい断片又は全長コード配列を識別するために使用され得る。より大きい断片配列を単離する方法は、当業者に公知である。
cDNAライブラリは、任意の好適なスクリーニング方法によって配列決定され得る。特に、cDNAライブラリは、Life TechnologyのSOLiD配列決定技術、OxfordのNanopore DNA配列決定技術、又はIlluminaのクラスタ生成及び配列決定技術などの、任意のハイスループットスクリーニング方法を使用して配列決定され得る。一実施形態では、cDNAライブラリは、ショットガン配列決定され得る。リードの数は、少なくとも10,000、少なくとも100万、少なくとも1000万、少なくとも1億、又は少なくとも10億であり得る。別の実施形態では、リードの数は、10,000~100,000、又は代替的に100,000~100万、又は代替的に100万~1000万、又は代替的に1000万~1億、又は代替的に1億~10億であり得る。「リード」は、配列決定反応によって取得される連続的な核酸配列の長さである。
次世代シーケンシング(NGS)ライブラリは、多くの場合、トランスクリプトームライブラリにおけるリボソームRNA配列、マイクロバイオーム若しくはメタゲノムライブラリにおける宿主配列、又は体細胞変異体検出用途におけるマジョリティ対立遺伝子配列などの、生物学的重要性がほとんどない豊富な配列を含有する。RNA-seqライブラリでは、例えば、リボソームRNA(rRNA)配列は、全リードの95%以上を構成し得、ほとんどの用途では、これらのリードは、情報価値がなく、二次分析中に廃棄される。これらの配列によって占められるフローセルの「不動産」は、特に、関心対象の種を十分にサンプリングするためにより大きい配列決定深度が必要とされる、カウントベースの用途又は稀な断片の検出について、配列決定のコストを有意に増加させ得る。
全ての生物において、非常に豊富なリボソームの構造成分であるリボソームRNA(rRNA)は、全てのRNAの大部分を構成する。これらのリボソームRNAのRNA試料を選択的に枯渇させずに、結果的に得られるNGSライブラリは、大部分がrRNAを表す断片から構成され、これは、エンドユーザにとってほとんど役に立たないか、又は科学的関心がほとんどないものである。したがって、rRNAは、ライブラリ構築の前に試料から枯渇されなければならない。rRNAのハイブリダイゼーションプルダウン(例えば、RiboZero、RiboMinus)又は酵素消化(例えば、RNaseH、CRISPR)などの、豊富な配列の枯渇のための現在の方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定/パラフィン包埋(FFPE)組織及び血漿由来循環RNA(C-RNA)などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ(例えば、エクソームキャプチャ)は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードRNAを検出するためのそれらの有用性を制限する。加えて、rRNAを除去するためのこれらの処理は、化学的に不安定なRNAから構成される試料に直接作用し、試料損傷のリスクを導入する。更に、rRNAを低減するためのこれらの方法は、RNA試料自体のみに適用可能であり、一旦、試料がライブラリに変換されると、rRNAキャプチャ又は枯渇のために同じ方法が適用可能ではない。
望ましくないライブラリ断片の存在量を低減するための1つ以上のブロッキングオリゴヌクレオチドの使用が、本明細書に説明される。本開示の方法は、エンドユーザにとって極めて容易であり、追加のライブラリ調製工程及び1つ以上のオリゴヌクレオチドの付加を必要としない。本明細書に説明される方法は、試料に直接ではなく、作製されたライブラリに作用し、元のポリヌクレオチド試料への損傷のリスクを低減する。
本明細書に提示される研究に示されるように、本開示の方法は、RNA-Seq技術についてrRNAを有意に低減した。本開示の方法が、望ましくないライブラリ断片が生成される他のライブラリ調製(例えば、ds DNAライブラリ)に適用されるとき、同様の結果が予想されることになる。他の潜在的な使用の例としては、グロビンRNA、ミトコンドリアDNA断片、ライブラリからのハウスキーピング遺伝子断片、非宿主遺伝物質の除去、及び宿主又は他の豊富な核酸の枯渇が、より焦点が絞られたデータリッチなNGSライブラリの生成に望ましい他のシナリオが挙げられるが、これらに限定されない。
したがって、本開示の方法、組成物、及びキットは、gDNA又は他のDNA供給源から生成されたDNAライブラリとともに使用され得る。そのような場合、ライブラリ生成は、アダプタ/鋳型構築物からDNA配列決定ライブラリを作製するためのPCR増幅工程を除いて、標準的な方法論を利用することになる。特に、本開示の1つ以上のブロッキングオリゴヌクレオチドは、DNA配列決定ライブラリを作製するためのPCR増幅工程への成分として付加されることになる。
ここで、本明細書に開示される方法の様々な非限定的な特定の実施形態が、添付の図面を参照して更に詳細に説明されることになる。1つの特定の実施形態に関して好ましいものとして説明されている特徴は、別途記載されない限り、本開示の他の特定の実施形態に必要な変更を加えて適用される。
図1は、全RNAから配列決定のための鋳型ライブラリを生成するために従来的に使用されるプロセスを例示する。全RNAからのライブラリ調製は、Illumina(商標)、Life Technologies(商標)、及びOxford Nanopore(商標)からのものを含む、全ての主要な配列決定プラットフォームに共通である。
図1に示されるように、全RNA試料は、本明細書に説明されるもののような方法論を使用して試料から単離される。全RNAは、典型的には、rRNA枯渇工程を実施することによってrRNAを除去するように処理される。rRNAの枯渇のための現在の方法としては、rRNAのハイブリダイゼーションプルダウン(例えば、RiboZero(商標)、RiboMinus(商標))、又は酵素消化(例えば、RNaseH、CRISPR)が挙げられる。上記のrRNA枯渇方法は、非常に長く(1.5~2時間)、複数のサブコンポーネント及び工程を伴い得る。これらの枯渇方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定/パラフィン包埋(FFPE)組織及び血漿由来循環RNA(C-RNA)などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ(例えば、エクソームキャプチャ)は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードRNAを検出するためのそれらの有用性を制限する。更に、rRNA及び他の所望されないRNAを除去するための枯渇方法は、RNA試料自体に対して実施されなければならない。RNAは、不安定な核酸であり、取り扱い、保存条件、及びRNase活性に感受性である。上記の方法を使用するrRNA及び他の所望されないRNAの不完全な枯渇は、一旦、ライブラリに変換されると、その後の工程において改善されることができないことが留意されるべきである。
全く対照的に、本開示は、1つ以上のブロッキングオリゴヌクレオチド(すなわち、PCRクランプ)を使用して、所望されないヌクレオチド配列を枯渇させるための新しい革新的な方法を提供する。ブロッキングオリゴヌクレオチドを設計するための考慮事項は、本明細書に更に説明される。
図1は、RNAからの配列決定のための鋳型ライブラリを生成するために標準的に使用されるRNA-Seqプロセスを例示する。図1は、本開示の1つ以上のブロッキングオリゴヌクレオチドを組み込むように修飾されたRNA-Seqプロセスを更に例示する。RNA-Seq(「RNA配列決定」の略語として命名される)は、次世代シーケンシング(NGS)を使用して、所与の瞬間における生体試料中のRNAの存在及び量を明らかにし、連続的に変化する細胞トランスクリプトームを分析する配列決定技術である。
具体的には、RNA-Seqは、選択的遺伝子スプライシングされた転写物、転写後修飾、遺伝子融合、突然変異/SNP、及び経時的な遺伝子発現の変化、又は異なる群若しくは処理における遺伝子発現の差異を見る能力を促進する。mRNA転写物に加えて、RNA-Seqは、全RNA、miRNA、tRNAなどの小RNA、及びリボソームプロファイリングを含むように、RNAの異なる集団を見ることができる。RNA-Seqはまた、エクソン/イントロン境界を決定し、既に注釈付きの5’及び3’遺伝子境界を検証又は修正するために使用され得る。RNA-Seqにおける最近の進歩は、単一細胞配列決定及び固定組織のインサイチュ配列決定を含む。
RNA-Seqの前に、ハイブリダイゼーションベースのマイクロアレイを用いて遺伝子発現研究が行われた。マイクロアレイに関する問題としては、クロスハイブリダイゼーションアーチファクト、低発現遺伝子及び高発現遺伝子の不十分な定量化、並びに先験的に配列を知る必要があることが挙げられる。これらの技術的問題のため、トランスクリプトミクスは、配列決定ベースの方法に移行した。これらは、発現配列タグタグライブラリのサンガーシーケンシングから、化学的タグベースの方法(例えば、例えば、遺伝子発現の連続分析)、最終的に現在の技術であるcDNAの次世代シーケンシング(特にRNA-Seq)へと進歩した。次世代シーケンシング(NGS)は、典型的には、既知のアダプタDNA配列が、配列決定される標的ヌクレオチドに付加されるライブラリ調製を必要とする。従来的に、これは、RNAがcDNAに変換され、断片化され、末端修復され、次いで、アダプタDNAにライゲーションされることを必要とする(例えば、図1を参照されたい)。このライブラリ調製は、Illumina(商標)、Pacific Biosciences(商標)、及びOxford Nanopore(商標)からのものを含む、全ての主要な配列決定プラットフォームに共通である。
図1に示されるように、RNAは、試料から単離される。特定の実施形態では、RNAは、細胞を溶解することによって、細胞から単離され得る。溶解は、例えば、細胞を加熱することによって、若しくは界面活性剤若しくは他の化学的方法の使用によって、又はそれらの組み合わせによって、達成され得る。しかしながら、当技術分野で公知の任意の好適な溶解方法を使用することができる。核クロマチンの放出を防止し、それによって、cDNAライブラリのゲノム汚染を回避し、mRNAの分解を最小限に抑えるために、穏やかな溶解手順が有利に使用され得る。例えば、Tween-20の存在下で、72℃で2分間細胞を加熱することは、結果的に核クロマチンからの検出可能なゲノム汚染をもたらさずに、細胞を溶解するのに十分である。代替的に、細胞は、水中で10分間65℃まで(Esumi et al.,Neurosci Res60(4):439-51(2008))、若しくは0.5%NP-40(Kurimoto et al.,Nucleic Acids Res34(5):e42(2006))で懸濁されたPCRバッファーII(Life Technology)中で90秒間70℃まで加熱され得るか、又は溶解は、プロテイナーゼKなどのプロテアーゼを用いて、又はグアニジンイソチオシアネートなどのカオトロピック塩の使用によって達成され得る(米国特許出願公開第2007/0281313号)。
DNaseは、典型的には、RNA試料に付加される。DNaseは、ゲノムDNAの量を低減する。RNA分解の量がゲル及びキャピラリー電気泳動でチェックされ、RNA完全性番号を試料に割り当てるために使用される。このRNA品質及び出発RNAの総量は、その後のライブラリ調製中、配列決定中、及び分析工程中に考慮される。RNAは、Qiagen若しくはAmbionからのキット、Lucigen MasterPure Kitsなどの任意の数の市販のキットを使用して、又はTRIzolのような特定のRNA単離試薬を使用して、良好な収率及び高品質で単離され得る。RNA完全性番号は、8を超えるべきである。RNAは、Ribo-greenのような、蛍光分析ベースの方法を使用して定量化され得る。
図1に示されるように、次いで、RNAは、典型的には、ポリA選択によって濃縮されるか、又はrRNA試料のRNAを枯渇させるように処理される。rRNAのハイブリダイゼーションプルダウン(例えば、RiboZero、RiboMinus)又は酵素消化(例えば、RNaseH、CRISPR)などの、豊富な配列の枯渇のための現在の方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定/パラフィン包埋(FFPE)組織及び血漿由来循環RNA(C-RNA)などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ(例えば、エクソームキャプチャ)は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードRNAを検出するためのそれらの有用性を制限する。典型的には、rRNAのRNA試料を枯渇させるのに1~2時間かかる。
RNA試料を所望される鋳型で濃縮するためにRNAが処理された後、RNAは、cDNAに逆転写される。任意選択的に、RNAは、cDNAへの変換の前に断片化及びサイズ選択され得る。断片化及びサイズ選択は、配列決定機械に適切な長さである配列を精製するために実施される。RNA、cDNA、又はその両方は、酵素、超音波処理、又はネブライザーで断片化される。RNAの断片化は、ランダムにプライムされた逆転写の5’バイアス及びプライマ結合部位の影響を低減し、5’及び3’末端がcDNAにあまり効率的に変換されないという欠点を有する。断片化の後にサイズ選択が続き、小さい配列が除去されるか、又は狭い範囲の配列長が選択される。miRNAのような小RNAが失われるため、これらは、独立して分析される。
図1に示されるように、処理されたRNAは、cDNAに変換される。cDNAは、典型的には、逆転写によってmRNAから合成される。単一細胞を含む少量のmRNAからcDNAを合成するための方法は、既に説明されている(Kurimoto et al.,Nucleic Acids Res34(5):e42(2006):Kurimoto et al.,Nat Protoc2(3):739-52(2007)、及びEsumi et al.,Neurosci Res60(4):439-51(2008))。増幅可能なcDNAを生成するために、これらの方法は、cDNAライブラリが単一のプライマを使用して増幅され得るような方式で、各cDNA分子の両末端にプライマアニーリング配列を導入する。Kurimoto法は、ポリメラーゼを使用して3’ポリAテールをcDNA鎖に付加し、次いで、これが、ユニバーサルオリゴ-Tプライマを使用して増幅され得る。対照的に、Esumi法は、cDNA合成プライマの3’テールに逆相補的であるように設計されている、任意の配列をcDNAの3’末端に導入するために鋳型スイッチング法を使用する。再び、cDNAライブラリは、単一のPCRプライマによって増幅され得る。単一プライマPCRは、短い混入アンプリコン及びプライマ二量体の増幅を低減するためにPCR抑制効果を利用する(Dai et al.,J Biotechnol 128(3):435-43(2007))。各アンプリコンの2つの末端が相補的であるため、短いアンプリコンは、安定なヘアピンを形成することになり、これらは、PCRには不十分な鋳型である。これは、短縮型cDNAの量を低減し、より長いcDNA分子の収率を改善する。
特定の実施形態では、cDNAの第1鎖の合成は、RNA相補配列(RCS)を含むcDNA合成プライマ(CDS)によって導かれ得る。別の実施形態では、RCSは、個々のmRNA試料中の1つ以上のmRNAに少なくとも部分的に相補的である。これは、典型的にはオリゴヌクレオチドであるプライマが、個々のmRNA試料中の少なくともいくつかのmRNAにハイブリダイズして、mRNAを鋳型として使用してcDNA合成を導くことを可能にする。RCSは、オリゴ(dT)を含むか、又は全ての若しくは大部分の関連遺伝子内に存在する核酸の配列などの遺伝子ファミリー特異的であるか、あるいはランダムヘキサマーなどのランダム配列から構成され得る。cDNA合成プライマがそれ自体をプライミングし、したがって、所望されない副産物を生成することを回避するために、非自己相補的準ランダム配列が使用され得る。例えば、遺伝子コードの1文字が排除され得るか、又はcDNA合成プライマを非自己相補的であるように制約しながら、より複雑な設計が使用され得る。
RCSはまた、cDNAの第1鎖の一部分に少なくとも部分的に相補的であり得、それにより、cDNAの第1鎖を鋳型として使用してcDNAの第2鎖の合成を導くことができる。したがって、第1鎖合成に続いて、RNase酵素(例えば、RNaseH活性を有する酵素)が、cDNAの第1鎖の合成後に付加されて、RNA鎖を分解し、cDNA合成プライマが、第1鎖上で再びアニーリングして、cDNAの第2鎖の合成を導くことを可能にし得る。例えば、RCSは、ランダムヘキサマー、又は非自己相補的準ランダム配列(cDNA合成プライマの自己アニーリングを最小化する)を含み得る。
cDNAの第1鎖の3’末端の一部分に少なくとも部分的に相補的である部分を含む鋳型スイッチオリゴヌクレオチド(template switch oligonucleotide、TSO)は、本明細書に説明される方法で各個々のRNA試料に付加され得る。そのような鋳型スイッチング法は、(Esumi et al.,Neurosci Res60(4):439-51(2008))に説明され、RNAの完全な5’末端を含む完全長cDNAが合成されることを可能にする。逆転写酵素の末端トランスフェラーゼ活性は、典型的には、mRNAから合成されたcDNAの第1鎖の3’末端に2~5個のシトシンを組み込ませているため、cDNAの第1鎖は、その3’末端に、グアノシンと塩基対合する複数のシトシン又はシトシン類似体を含み得る(米国特許第5,962,272号を参照されたい)。一実施形態では、cDNAの第1鎖は、グアノシンと塩基対合する、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、又は2つ、3つ、4つ、若しくは5つのシトシン又はシトシン類似体を含む3’部分を含み得る。グアノシンと塩基対合するシトシン類似体の非限定的な例は、5-アミノアリル-2’-デオキシシチジンである。
一実施形態では、鋳型スイッチオリゴヌクレオチドは、シトシンと塩基対合する複数のグアノシン又はグアノシン類似体を含む3’部分を含み得る。本明細書に説明される方法で有用なグアノシン又はグアノシン類似体の非限定的な例としては、デオキシリボグアノシン、リボグアノシン、ロックド核酸-グアノシン、及びペプチド核酸-グアノシンが挙げられるが、これらに限定されない。グアノシンは、リボヌクレオシド又はロックド核酸モノマーであり得る。
特定の実施形態では、鋳型スイッチオリゴヌクレオチドは、シトシンと塩基対合する、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、あるいは2つ、3つ、4つ、若しくは5つ、又は2~5つのグアノシン又はグアノシン類似体を含む3’部分を含み得る。複数のグアノシン(又はシトシンと塩基対合するグアノシン類似体)の存在は、鋳型スイッチオリゴヌクレオチドが、cDNAの第1鎖の3’末端の露出したシトシンに一過的にアニーリングすることを可能にする。これは、逆転写酵素に、鋳型をスイッチさせ、鋳型スイッチオリゴヌクレオチドに相補的な鎖を合成することを続けさせる。一実施形態では、鋳型スイッチオリゴヌクレオチドの3’末端は、例えば、3’リン酸基によってブロックされて、鋳型スイッチオリゴヌクレオチドがcDNA合成中にプライマとして機能することを防止し得る。
別の実施形態では、RNAは、細胞溶解によって細胞から放出される。溶解が加熱によって部分的に達成される場合、cDNA合成プライマ及び/又は鋳型スイッチオリゴヌクレオチドは、細胞溶解中に各個々のRNA試料に付加され得、これは、オリゴヌクレオチドのハイブリダイゼーションを支援することになるためである。いくつかの実施形態では、逆転写酵素が、細胞溶解後に付加されて、酵素の変性を回避し得る。
本開示のいくつかの実施形態では、タグは、cDNAの合成中にcDNAに組み込まれ得る。例えば、cDNA合成プライマ及び/又は鋳型スイッチオリゴヌクレオチドは、長さが少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも15、又は少なくとも20ヌクレオチドであり得る特定のヌクレオチド配列などのタグを含み得る。例えば、タグは、4~20ヌクレオチドの長さ、例えば、4、5、6、7、8、9、10、15、又は20ヌクレオチドの長さのヌクレオチド配列であり得る。タグは、cDNA合成プライマ及び/又は鋳型スイッチオリゴヌクレオチド中に存在するため、その合成中にcDNAに組み込まれることになり、したがって、cDNAを識別するための「バーコード」として作用し得る。cDNA合成プライマ及び鋳型スイッチオリゴヌクレオチドの両方は、タグを含み得る。cDNA合成プライマ及び鋳型スイッチオリゴヌクレオチドは、各々、タグ付きcDNA試料がタグの組み合わせを含むように、異なるタグを含み得る。上記の方法によって生成された各cDNA試料は、別個のタグ又はタグの別個の組み合わせを有し得、それにより、一旦タグ付きcDNA試料がプールされると、タグは、どの単一細胞が各cDNA試料に由来するかを識別するために使用され得る。したがって、各cDNA試料は、タグ付きcDNA試料が本明細書で説明される方法でプールされた後でも、単一細胞に結合され得る。
タグ付きcDNA試料がプールされる前に、例えば、逆転写酵素を除去又は不活性化することによって、cDNAの合成が停止され得る。これは、逆転写によるcDNA合成がプールされた試料中で継続することを防止する。タグ付きcDNA試料は、任意選択的に、それらがプールされる前又は後のいずれかで、増幅の前に精製され得る。
RNAがcDNAへの変換前に断片化されなかった場合、cDNAが断片化され、サイズ選択が実施される。cDNAは、酵素、音波処理、又はネブライザーで断片化され得る。断片化の後にサイズ選択が続き、小さい配列が除去されるか、又は狭い範囲の配列長が選択される。
cDNA反応後、次いで、末端修復反応が、T4ポリヌクレオチドキナーゼ、rATP、及びT4 DNAポリメラーゼ、dNTPを用いて実施されて、平滑末端二本鎖鋳型を形成する。末端修復完了及びサイズ選択の後、A-テーリング反応が、Klenow exo-、dNTP(例えば、dATP)を用いて実施されて(図1参照)、アダプタのライゲーションを容易にする。アダプタは、従来の自動化オリゴヌクレオチド合成によって調製された2つの一本鎖オリゴヌクレオチドをアニーリングすることによって形成される。オリゴヌクレオチドは、第1のオリゴヌクレオチドの3’末端が第2のオリゴヌクレオチドの5’末端に相補的であるように部分的に相補的である。第1のオリゴヌクレオチドの5’末端及び第2のオリゴヌクレオチドの3’末端は、互いに相補的ではない。2つの鎖がアニーリングされるとき、結果的に得られる構造は、一方の末端(二本鎖領域)で二本鎖であり、他方の末端(マッチしていない領域)で一本鎖であり、本明細書では「Y字アダプタ」と称される。Y字アダプタの二本鎖領域は、平滑末端であり得るか、又はオーバーハングを有し得る。後者の場合、オーバーハングは、3’オーバーハング又は5’オーバーハングであり得、単一のヌクレオチド又は2つ以上のヌクレオチドを含み得る。Y字アダプタは、その5’末端でリン酸化され、二本鎖部分は、「T」デオキシヌクレオチドを含む単一塩基3’オーバーハングを含有する。次いで、アダプタを、T4リガーゼ、rATPを使用して、「A」ヌクレオチドの5’側に単一塩基を含む二本鎖鋳型分子の末端にライゲーションされる。
Y型アダプタは、その5’末端でリン酸化され、二重鎖の二本鎖部分は、「T」デオキシヌクレオチドを含む単一塩基3’オーバーハングを含有する(図1参照)。次いで、アダプタを、T4リガーゼ、rATPを使用して、「A」ヌクレオチドの5’側に単一塩基を含む二本鎖鋳型分子の末端にライゲーションされる。
ライブラリは、一般に、アダプタポリヌクレオチド分子を1つ以上の標的ポリヌクレオチド二重鎖(既知の、部分的に既知の、又は不明な配列であり得る)の5’及び3’末端にライゲーションして、アダプタ-標的構築物を形成し、次いで、PCR増幅を実行して、鋳型ポリヌクレオチドのライブラリを形成することによって形成される。次いで、鋳型ポリヌクレオチドのライブラリは、次世代シーケンシングを使用して配列決定され得る。資源を節約するために、複数のライブラリが一緒にプールされ、同じ実行で配列決定され得、これは、多重化として知られるプロセスである。アダプタライゲーション中、固有のインデックス配列、又は「バーコード」が各ライブラリに付加される。これらのバーコードは、データ分析中にライブラリを区別するために使用される。
本開示の非相同末端結合因子及び方法を使用して二本鎖鋳型上に付加されたアダプタは、典型的には、相補的配列の二本鎖領域及び配列ミスマッチの一本鎖領域を含む。特定の実施形態では、アダプタは、Y字を有し、配列ミスマッチの領域がアダプタのアームを互いに分離させる。アダプタの「二本鎖領域」は、2つの部分的に相補的なポリヌクレオチド鎖のアニーリングによって形成される、典型的には5つ以上の連続する塩基対を含む短い二本鎖領域である。この用語は、単に、2つの鎖がアニーリングされている核酸の二本鎖領域を指し、いかなる特定の構造的配座も暗示しない。代替的な実施形態では、アダプタは、Y字構造を有する代わりに、U字であり、それにより、一旦、非相同末端結合因子を使用してアダプタが鋳型の末端に付加されると、本開示の方法は、鋳型の5’末端及び3’末端で連続ループを形成する。したがって、結果的に得られたDNAライブラリ鋳型は、ローリングサークル増幅を使用して増幅され得る。
概して、二本鎖領域は、機能を損なうことなく可能な限り短いことが有利である。この文脈における「機能」とは、二本鎖領域が、本明細書に説明される原核生物末端結合因子及び修復因子についての反応条件下で安定な二重鎖を形成し、それにより、アダプタを形成する2つの鎖は、標的分子へのアダプタのライゲーション中に部分的にアニーリングされたままであることを意味する。二本鎖領域が、PCR反応のアニーリング工程において典型的に使用される条件下で安定であることは絶対的に必要ではない。
別の実施形態では、同一のアダプタが各鋳型分子の両端に付加され、各アダプタ-標的構築物中の標的配列は、アダプタの二本鎖領域に由来する相補的配列に隣接することになる。二本鎖領域、したがって、アダプタ-標的構築物中の二本鎖領域に由来する相補的配列が長いほど、アダプタ-標的構築物が、PCRにおいて使用されるアニーリング条件下で内部自己相補性のこれらの領域で、折り返され、それ自体と塩基対合することができる可能性が高くなる。一般的に、この効果を低減するために、二本鎖領域が20以下、15以下、又は10以下の塩基対の長さであることが好ましい。二本鎖領域の安定性は増加し得、したがって、標準的なワトソン-クリック塩基対よりも強い塩基対合を示す非天然ヌクレオチドを含めることによって、潜在的にその長さが低減する。
好ましい実施形態では、アダプタの2つの鎖は、二本鎖領域で100%相補的である。しかしながら、2つの鎖が標準的なライゲーション条件下で安定な二重鎖を形成することができることを条件に、1つ以上のヌクレオチドミスマッチが二本鎖領域内で許容され得ることが理解されるであろう。
代替的に、本開示の非相同末端結合因子及び方法を使用して二本鎖鋳型上に付加されたアダプタは、二本鎖相補的配列を含む。次いで、結果的に得られたアダプタ/鋳型分子は、PCRによって増幅されて、DNAライブラリ鋳型を形成し得る。更なる実施形態では、スプリントオリゴヌクレオチドが、DNAライブラリ鋳型の末端を結合して環を形成するために使用され得る。エキソヌクレアーゼが、全ての残存する直鎖状一本鎖及び二本鎖DNA産物を除去するために付加される。結果物は、完成した環状DNA鋳型である。
本明細書に開示される方法における使用のためのアダプタは、概して、アダプタの「ライゲーション可能な」末端、すなわち、リガーゼ又は非相同末端結合因子を使用して標的ポリヌクレオチドに結合される末端に隣接する二本鎖領域を含むことになる。アダプタのライゲーション可能な末端は、平滑であり得るか、又は他の実施形態では、1つ以上のヌクレオチドの短い5’又は3’オーバーハングが、ライゲーションを容易にする/促進するために存在し得る。アダプタのライゲーション可能な末端における5’末端ヌクレオチドは、標的ポリヌクレオチド上の3’ヒドロキシル基へのホスホジエステル結合を可能にするためにリン酸化されるべきである。
二本鎖領域を形成する2つの鎖の部分は、典型的には、各鎖上に少なくとも10個、又は少なくとも15個、又は少なくとも20個の連続したヌクレオチドを含む。マッチしていない領域の長さの下限は、典型的には、機能、例えば、PCR及び/又は配列決定のためのプライマの結合に好適な配列を提供する必要性によって決定されることになる。理論的には、マッチしていない領域の長さに上限はないが、例えば、1つ以上のライゲーション工程後の非結合アダプタのアダプタ-標的構築物からの分離を容易にするために、一般にアダプタの全長を最小化することが有利である場合を除く。したがって、マッチしていない領域は、各鎖上で50未満、又は40未満、又は30未満、又は25未満の連続したヌクレオチドの長さであることが好ましい。
アダプタを形成する2つの鎖の全長は、典型的には、25~100ヌクレオチド、より典型的には、30~55ヌクレオチドの範囲となる。
マッチしていない領域を形成する2つの鎖の部分は、好ましくは、同様の長さであるべきであるが、これは、各部分の長さがその所望される機能(例えば、プライマ結合)を果たすのに十分であることを条件に、絶対的に必須ではない。マッチしていない領域を形成する2つの鎖の部分は、アダプタ機能に過度に影響を与えることなく、最大25ヌクレオチドまで異なり得ることが実験によって示されている。
特定の実施形態では、マッチしていない領域を形成する2つのポリヌクレオチド鎖の部分は、完全にミスマッチとなるか、又は100%非相補的となる。しかしながら、いくつかの配列「マッチ」、すなわち、より低い度合いの非相補性は、実質的な程度まで機能に影響することなく、この領域において許容され得る。上述のように、配列ミスマッチ又は非相補性の程度は、マッチしていない領域内の2つの鎖が、上記で定義されたアニーリング条件下で一本鎖形態のままであるような程度である。
アダプタの正確なヌクレオチド配列は、一般に、本開示に対して重要ではなく、所望される配列要素が最終的にアダプタに由来する鋳型のライブラリの共通配列に含まれるようにユーザによって選択され、例えば、ユニバーサル伸長プライマ及び/又は配列決定プライマ(例えば、P7又はP5プライマ)の特定のセットの結合部位を提供し得る。追加の配列要素が、例えば、ライブラリ中の鋳型分子の配列決定において最終的に使用されることになる配列決定プライマ、又は、例えば、固体支持体上における鋳型ライブラリの増幅に由来する産物のための結合部位を提供するために含められ得る。アダプタは、「バーコード」配列を更に含み得、これは、特定の供給源に由来する鋳型分子をバーコード化するために使用され得る。
アダプタの正確なヌクレオチド配列は、一般に、本開示に対して非限定的であるが、マッチしていない領域における個々の鎖の配列は、いずれの個々の鎖も、標準的なアニーリング条件下で自己アニーリング、ヘアピン構造の形成などにつながり得るいかなる内部自己相補性も呈さないようなものであるべきである。マッチしていない領域における鎖の自己アニーリングは、この鎖への増幅プライマの特異的結合を防止又は低減し得るため、回避されるべきである。
ミスマッチアダプタは、好ましくは、DNAの2つの鎖から形成されるが、ホスホジエステル及び非ホスホジエステル骨格結合の混合物によって結合された天然及び非天然ヌクレオチド(例えば、1つ以上のリボヌクレオチド)の混合物を含み得る。以下で更に詳細に考察されるように、例えば、ビオチン部分、ブロッキング基、及び固体表面への付着のためのキャプチャ部分などの、他の非ヌクレオチド修飾が含められ得る。
アダプタがライゲーションされる1つ以上の「標的ポリヌクレオチド二重鎖」は、固相PCRによる増幅、次世代シーケンシング、サブクローニングなどを含む、追加の方法論とともに使用され得る任意のポリヌクレオチド分子であり得る。標的ポリヌクレオチド二重鎖は、二本鎖DNA形態(例えば、ゲノムDNA断片)で生じ得るか、又はDNA若しくはRNAとして一本鎖形態で生じ、ライゲーション前にdsDNA形態に変換されている場合がある。例として、mRNA分子は、当技術分野で既知の標準的な方法論を使用して本開示の方法で使用するのに好適な二本鎖cDNAにコピーされ得る。標的分子の精密な配列は、一般に、本開示に重要ではなく、既知又は不明であり得る。修飾がアダプタへの付加、DNA分子へのアダプタのタグ付け、及び/又はPCRによるコピーを妨げないことを条件に、非天然ヌクレオチド及び/又は非天然骨格結合を含む修飾DNA分子が、標的として役立ち得る。
本明細書で使用される場合、「タグ付け(tagmentation)」、「タグ付け(tagment)」、又は「タグ付け(tagmenting)」という用語は、核酸、例えば、DNAを、核酸が5’及び3’アダプタ分子を含むように修飾されるように、アダプタ修飾鋳型に変換することを指す。このプロセスは、トランスポゾン末端配列を含むアダプタと複合体を形成したトランスポザーゼ酵素を含むトランスポゾン複合体による核酸の修飾を伴うことが多い。タグ付けにより、核酸の断片化と、二本鎖断片の両方の鎖の5’末端へのアダプタのライゲーションを同時にもたらす。トランスポザーゼ酵素を除去するための精製工程に続いて、PCRによって適合された断片の末端に追加の配列が付加され得る。
「トランスポザーゼ(transposase)」は、トランスポゾン末端含有組成物(例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物)を備えた機能複合体を形成し、例えば、インビトロ転位反応で、それがインキュベートされる二本鎖標的核酸へのトランスポゾン末端含有組成物の挿入又は転位を触媒することができる酵素を意味する。本明細書に提示されるトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルスからのインテグラーゼを含み得る。トランスポザーゼ、トランスポソーム及びトランスポソーム複合体は、参照によりその内容全体が本明細書に組み込まれる米国特許出願公開第2010/0120098号の開示によって例示されるように、当業者に一般に知られる。本明細書に記載の多くの実施形態は、Tn5トランスポザーゼ及び/又は過活性Tn5トランスポザーゼに言及するが、意図された目的で標的核酸に5’タグを付けて断片化するのに十分な効率でトランスポゾン末端を挿入し得る任意の転位システムを本発明で使用し得ることが理解される。特定の実施形態では、好ましい転位システムは、トランスポゾン末端をランダムに又はほぼランダムな方法で挿入し、標的核酸に5’タグを付けて断片化することができる。
本明細書で使用される場合、「転位反応(transposition reaction)」という用語は、1つ以上のトランスポゾンが、例えば、ランダム部位又はほぼランダム部位で標的核酸に挿入される反応を指す。転位反応の必須成分は、転送したトランスポゾン配列及びその相補体(転送されないトランスポゾン末端配列)、並びに官能的転位又はトランスポゾン複合体を形成するために必要な他の成分を含む、トランスポゾンのヌクレオチド配列を示すトランスポザーゼ及びDNAオリゴヌクレオチドである。DNAオリゴヌクレオチドは、必要とされる際、又は所望される際、追加の配列(例えば、アダプタ又はプライマ配列)を更に含み得る。いくつかの実施形態では、本明細書で提供される方法は、過活性Tn5トランスポザーゼ及びTn5型トランスポゾン末端(Goryshin and Reznikoff,1998,J.Biol.Chem.,273:7367)により、又はR1及びR2末端配列を含むMuAトランスポザーゼ及びMuトランスポゾン末端(Mizuuchi,1983,Cell,35:785;Savilahti et al.,1995,EMBO J.,14:4893)によって形成される転位複合体を使用することによって例示される。しかし、意図された目的で標的DNAに5’-タグを付け及び断片化するのに十分な効率でランダム又はほぼランダムな方法でトランスポゾン末端を挿入し得る任意の転位システムを本発明で使用し得る。本発明の方法に使用することができ得る当技術分野で知られる転位システムの例としては、黄色ブドウ球菌Tn552((Colegio et al.,2001,J Bacterid.,183:2384-8、Kirby et al.,2002,MoI Microbiol,43:173-86)、TyI(Devine and Boeke,1994,Nucleic Acids Res.,22:3765-72及び国際特許出願第95/23875号)、トランスポゾンTn7(Craig,1996,Science.271:1512、Craig,1996,Review in:Curr Top Microbiol Immunol,204:27-48)、TnIO及びISlO(Kleckner et al.,1996,Curr Top Microbiol Immunol,204:49-82)、マリナートランスポザーゼ(Lampe et al.,1996,EMBO J.,15:5470-9)、Tci(Plasterk,1996,Curr Top Microbiol Immunol,204:125-43)、P要素(Gloor,2004,Methods MoI Biol,260:97-114)、TnJ(Ichikawa and Ohtsubo,1990,J Biol Chem.265:18829-32)、細菌の挿入配列(Ohtsubo and Sekine,1996,Curr.Top.Microbiol.Immunol.204:1-26)、レトロウイルス(Brown et al.,1989,Proc Natl Acad Sci USA,86:2525-9)、及び酵母のレトロトランスポゾン(Boeke and Corces,1989,Annu Rev Microbiol.43:403-34)が挙げられるが、これらに限定されない。トランスポゾン末端を標的配列に挿入するための方法は、好適なインビトロ転位システムが利用可能であるか、又は当技術分野の知識に基づいて開発し得る任意の好適なトランスポゾンシステムを使用してインビトロで実施することができる。一般に、本明細書で提供される方法で使用するための好適なインビトロ転位システムは、少なくとも、十分な純度、十分な濃度、及び十分なインビトロ転位活性のトランスポザーゼ酵素、並びにトランスポザーゼが、転位反応を触媒し得るそれぞれのトランスポザーゼと機能複合体を形成するトランスポザーゼ末端を必要とする。本発明で使用され得る好適なトランスポザーゼトランスポゾン末端配列は、トランスポザーゼの野生型、誘導体又は突然変異体から選択されるトランスポザーゼと複合体を形成する野生型、誘導体又は突然変異体型トランスポゾン末端配列を含むが、それらに限定されない。
本明細書で使用される場合、「トランスポソーム複合体(transposome complex)」という用語は、二本鎖核酸に非共有結合するトランスポザーゼ酵素を指す。例えば、複合体は、非共有結合複合体形成をサポートする条件下で二本鎖トランスポゾンDNAとプレインキュベートされたトランスポザーゼ酵素であり得る。二本鎖トランスポゾンDNAは、Tn5DNA、Tn5DNAの一部、トランスポゾン末端組成物、トランスポゾン末端組成物の混合物、又は過活性Tn5トランスポザーゼなどのトランスポザーゼと相互作用することができる他の二本鎖DNAを含み得るが、それらに限定されない。
「トランスポゾン末端(transposon end)」(TE)という用語は、二本鎖核酸、例えば、インビトロ転位反応で機能するトランスポザーゼ又はインテグラーゼ酵素との複合体を形成するために必要なヌクレオチド配列(「トランスポゾン末端配列」)のみを示す二本鎖DNAを指す。いくつかの実施形態では、トランスポゾン末端は、転位反応においてトランスポザーゼと機能複合体を形成することができる。非限定的な例として、参照によりその全体が本明細書に組み込まれる米国特許出願公開第2010/0120098号の開示に記載されるように、トランスポゾン末端は、19-bpの外側末端(outer end、「OE」)トランスポゾン末端、内末端(inner end、「IE」)トランスポゾン末端、又は野生型若しくは突然変異体型Tn5トランスポザーゼによって認識される「モザイク末端」(mosaic end、「ME」)トランスポゾン末端、又はR1及びR2トランスポゾン末端を含み得る。トランスポゾン末端は、インビトロ転位反応においてトランスポザーゼ又はインテグラーゼ酵素と機能複合体を形成するために好適な任意の核酸又は核酸類似体を含み得る。例えば、トランスポゾン末端は、DNA、RNA、修飾された塩基、非天然の塩基、修飾された骨格を含み得、一本鎖又は二本鎖にニックを含み得る。「DNA」という用語は、トランスポゾン末端組成物に関連して本開示では時々使用されるが、任意の好適な核酸又は核酸類似体がトランスポゾン末端において利用され得ることが理解されるべきである。
各標的ポリヌクレオチドの5’及び3’末端へのアダプタの「ライゲーション」は、共有結合が2つの二本鎖分子の両方の鎖の間に形成されるように、アダプタの2つのポリヌクレオチド鎖を二本鎖標的ポリヌクレオチドに結合することを伴う。この文脈では、「結合」は、以前に共有結合していない2つのポリヌクレオチド鎖の共有結合を意味する。好ましくは、そのような「結合」は、2つのポリヌクレオチド鎖間のホスホジエステル連結の形成によって起こることになるが、他の共有結合手段(例えば、非ホスホジエステル骨格結合)が使用され得る。しかしながら、ライゲーション反応で形成される共有結合は、ポリメラーゼのリードスルーを可能にするはずであり、それにより、結果物である構築物は、アダプタ分子に由来するアダプタ-標的構築物の領域中の配列に結合するプライマを使用して、PCR反応でコピーされ得る。
ライゲーション反応は、典型的には、酵素触媒されることになる。特定の実施形態では、ライゲーション反応は、リガーゼ又は非相同末端結合因子によって触媒されることになる。非酵素的ライゲーション技術(例えば、化学的ライゲーション)もまた、非酵素的ライゲーションが、ポリメラーゼのリードスルーを可能にする共有結合の形成につながることを条件に、結果物である構築物がPCRによってコピーされ得るように、使用され得る。
ライゲーション反応の所望される産物は、アダプタ-標的構築物であり、アダプタは、各標的ポリヌクレオチドの両末端でライゲーションされ、アダプタ-標的-アダプタという構造が与えられる。したがって、ライゲーション反応の条件は、一方の末端のみにアダプタを有する標的に優先して、この産物の形成を最大化するように最適化されるべきである。
アダプタ-標的構築物が更に処理される前に、非結合アダプタ分子を除去するために、タグ付け反応又はライゲーション反応の産物が精製工程に供され得る。過剰な非結合アダプタを除去するために、任意の好適な技術が使用され得、その好ましい例が、以下に更に詳細に説明される。
次いで、アダプタ-標的構築物は、以下に更に詳細に説明されるように、PCRによって増幅される。そのような更なるPCR増幅の産物は、鋳型のライブラリを形成するために収集され得る。特定の実施形態では、PCR増幅のために使用されるプライマは、アダプタのマッチしていない領域における反対の鎖上の異なるプライマ結合配列にアニーリングすることになる。しかしながら、他の実施形態は、アダプタの二本鎖領域中のプライマ結合配列にアニーリングする単の一タイプの増幅プライマの使用に基づき得る。
図1に示されるように、鋳型ライブラリを形成するために所望されない配列を枯渇させるための新規かつ改善された方法は、アダプタ構築物PCR増幅反応における1つ以上のブロッキングオリゴヌクレオチドの包含を提供する。したがって、標準的なRNA-Seqプロトコルとは異なり、cDNAへの変換の前に、RNA試料を処理して、rRNA転写物のRNA試料を枯渇させる必要も、mRNAのためのRNA試料を濃縮する必要もない。望ましくない断片を低減するために本開示の1つ以上のブロッキングオリゴヌクレオチドを使用することの単純さは、試薬及び工程の数を低減させることが単純かつ堅牢なワークフローにとって最重要である自動化ライブラリ調製システムにおいて有利である。本開示の1つ以上のブロッキングオリゴヌクレオチドの使用は、ライブラリ構築後の望ましくない断片の枯渇を促進し、不安定なRNAを用いたハンズオン時間の低減を可能にする。加えて、PCRクランプの使用は、生物学的に多量のrRNA、グロビン転写物、又は他の所望されない転写物を有することが知られている、より困難な試料に対する従来のrRNA枯渇アプローチと組み合わされ得る。
溶液中又は固体支持体上でPCRによって増幅されるアダプタ-標的構築物は、特に増幅産物が最終的に配列決定されることになる場合、ライブラリ内の全ての鋳型分子に共通であるにもかかわらず、それらの5’及び3’末端に「異なる」配列の領域を含むことが一般的に有利である。例えば、ライブラリ中の各鋳型の一方の末端のみの共通の固有の配列の存在は、配列決定プライマの結合部位を提供し得、ライブラリの増幅形態における各鋳型の一方の鎖が、単一のタイプの配列決定プライマを使用して単一の配列決定反応で配列決定されることを可能にする。
PCR反応のアニーリング工程中に遭遇する条件は、一般的に当業者に既知であるが、精密なアニーリング条件は、反応ごとに変化することになる(Sambrook et al.,2001,Molecular Cloning,A Laboratory Manual,3rd Ed,Cold Spring Harbor Laboratory Press,Cold Spring Harbor Laboratory Press,NY;Current Protocols,eds Ausubel et al.)。典型的には、そのような条件は、標準的なPCR反応緩衝液中で約1分間、約40℃~72℃(好ましくは50~68℃)の範囲の温度への曝露(約1分間の約94℃の温度における変性工程の後)を含み得るが、これらに限定されない。
アダプタ-標的構築物の相補的コピーを形成するためのPCR増幅の包含は、いくつかの理由で有利である。第一に、プライマ伸長工程、及びその後のPCR増幅の包含は、特に本開示の方法の場合、所望されない転写物がPCR反応で増幅されないため、両末端にライゲーションされたアダプタを有するアダプタ-標的構築物を選択するための濃縮工程として作用する。両方の末端でライゲーションされたアダプタを有する標的構築物のみが、アダプタ中のプライマ結合配列に特異的な共通又はユニバーサルプライマを使用するPCRのための有効な鋳型を提供し、したがって、PCR増幅の前に二重ライゲーション標的のみを含む鋳型ライブラリを生成することが有利である。
第二に、PCR増幅の包含は、配列決定の前に、標的の5’及び3’末端における共通配列の長さが増加することを可能にする。上記で概説されたように、ライゲーション及びその後の非結合アダプタの除去の効率を最大化するために、アダプタ分子の長さを可能な限り短く保つことが一般に有利である。しかしながら、配列決定の目的のために、増幅されるべき鋳型の5’及び3’末端に、より長い配列共通又は「ユニバーサル」配列を有することが有利であり得る。PCR増幅の包含は、鋳型ライブラリ内のポリヌクレオチドの一方(又は両方)の末端における共通配列の長さが、PCR増幅のために使用されるプライマの5’末端における追加の配列の包含によってライゲーション後に増加され得ることを意味する。
本明細書に開示される方法に従って調製された鋳型ライブラリは、核酸分析の任意の方法、例えば、鋳型又はその増幅産物の配列決定において使用され得る。鋳型ライブラリの例示的な使用としては、全ゲノム増幅、配列決定、サブクローニング、及びPCR増幅のための鋳型(単一鋳型又は複合鋳型ライブラリのいずれかの)を提供することが挙げられるが、これらに限定されない。
全ゲノム又は実質的に全ゲノムを表すゲノムDNA断片の複合混合物から本開示の方法に従って調製された鋳型ライブラリは、いわゆる「全ゲノム」増幅のための好適な鋳型を提供する。「全ゲノム増幅」という用語は、増幅される鋳型が、全体(又は実質的に全ゲノム)を代表する核酸断片の複合混合物を含む、核酸増幅反応(例えば、PCR)を指す。
本明細書に説明される方法に従って調製された鋳型のライブラリは、固相核酸増幅のために使用され得る。本明細書で使用される「固相増幅」という用語は、形成時に増幅産物の全て又は一部分が固体支持体上に固定化されるように、固体支持体上又は固体支持体と会合して実施される任意の核酸増幅反応を指す。具体的には、この用語は、順方向及び逆方向増幅プライマの一方又は両方が固体支持体上に固定化されていることを除いて、標準的な溶液相PCRに類似した反応である固相ポリメラーゼ連鎖反応(固相PCR)を包含する。
「固相」増幅法では、一方の増幅プライマが固定化され得る(他方のプライマは、通常、遊離溶液中に存在する)。代替的に、順方向及び逆方向プライマの両方が固定化され得る。実際には、PCRプロセスは増幅を維持するために過剰なプライマを必要とするため、「複数」の同一の順方向プライマ及び/又は固体支持体上に固定化された「複数」の同一の逆方向プライマが存在するであろう。本明細書における順方向及び逆方向プライマへの言及は、文脈上別段の指示がある場合を除き、「複数の」かかるプライマを包含するものとして解釈されるべきである。
1つのタイプのプライマのみを用いて固相増幅を行うことができ、そのような単一プライマ法は、本開示の範囲内に包含される。他の実施形態は、同一の鋳型特異的配列を含有するが、いくつかの他の構造的特徴において異なる順方向及び逆方向プライマを使用し得る。例えば、一方のタイプのプライマは、他方には存在しない非ヌクレオチド修飾を含み得る。他の実施形態では、順方向プライマ及び逆方向プライマは、異なる配列の鋳型特異的部分を含有し得る。
固相PCR用の増幅プライマは、好ましくは、プライマの5’末端又はその付近で固体支持体への共有結合によって固定され、プライマの鋳型特異的部分をその同族鋳型へのアニーリングのために自由にし、3’ヒドロキシル基をプライマ伸長のために自由にする。当技術分野において既知の任意の好適な共有付着手段が、この目的のために使用され得る。選択された結合化学は、固体支持体の性質、及びそれに適用される任意の誘導体化又は官能化に依存する。プライマ自体は、付着を促進するために非ヌクレオチド化学修飾であり得る部分を含み得る。
固相PCR増幅によって核酸コロニーのクラスタ化アレイを調製するために、本明細書中に開示される方法に従って調製された鋳型のライブラリを使用することが好ましい。「クラスタ」及び「コロニー」という用語は、本明細書において交換可能に使用され、複数の同一の固定化された核酸鎖及び複数の同一の固定化された相補的核酸鎖から構成される、固体支持体上の別個の部位を指す。「クラスタ化アレイ」という用語は、そのようなクラスタ又はコロニーから形成されるアレイを指す。この文脈では、「アレイ」という用語は、クラスタの順序付けられた配置を必要とするものとして理解されるべきではない。
特定の実施形態では、本開示は、PCR増幅によって生成された増幅核酸を配列決定する方法を更に提供する。したがって、本開示は、上記のようなPCRを使用して核酸鋳型のライブラリを増幅することと、核酸配列決定反応を実行して、PCRによって生成された少なくとも1つの増幅核酸鎖の全体又は一部の配列を決定することと、を含む、核酸配列決定の方法を提供する。
配列決定は、任意の好適な「合成による配列決定」技術を使用して実行することができ、ヌクレオチドは、遊離3’ヒドロキシル基に連続的に添加され、5’から3’方向でのポリヌクレオチド鎖の合成をもたらす。付加されたヌクレオチドの性質は、好ましくは、各ヌクレオチド付加後に決定される。
配列決定反応の開始点は、全ゲノムの産物への配列決定プライマのアニーリング又は固相増幅反応によって提供され得る。これに関連して、鋳型ライブラリの形成中に付加されるアダプタのうちの一方又は両方は、全ゲノム又は鋳型ライブラリの固相増幅によって誘導される増幅産物への配列決定プライマのアニーリングを可能にするヌクレオチド配列を含み得る。
順方向及び逆方向増幅プライマの両方が固体表面上に共有結合で固定化される固相増幅反応の産物は、固定化されたポリヌクレオチド鎖及び固定化された相補的鎖の対のアニーリングによって形成されたいわゆる「架橋」構造であり、両方の鎖は、5’末端で固体支持体(例えば、フローセル)に付着している。固定化鎖のうちの1つへの従来の配列決定プライマのハイブリダイゼーションは、ハイブリダイゼーションのための標準的な条件下におけるその固定化された相補的鎖へのこの鎖のアニーリングと比較して好ましくないため、そのような架橋構造から構成されるアレイは、核酸配列決定のための非効率的な鋳型を提供する。
核酸配列決定により好適な鋳型を提供するために、「架橋」構造の固定化鎖の1つの実質的に全部又は少なくとも一部を除去して、少なくとも部分的に一本鎖である鋳型を生成することが好ましい。したがって、一本鎖である鋳型の部分は、配列決定プライマへのハイブリダイゼーションに利用可能である。「架橋」二本鎖核酸構造中の1つの固定化鎖の全部又は一部を除去するプロセスは、本明細書では「線形化」と称され得る。
架橋鋳型構造は、制限エンドヌクレアーゼによる一方若しくは両方の鎖の切断によって、又はニッキングエンドヌクレアーゼによる一方の鎖の切断によって線形化され得る。開裂の他の方法は、制限酵素又はニッキング酵素に対する代替として使用され得、とりわけ、化学的開裂(例えば、過ヨウ素酸を用いたジオール結合の開裂)、エンドヌクレアーゼを用いた開裂による、又は熱若しくはアルカリに曝露することによる、脱塩基部位の開裂、別様に、デオキシリボヌクレオチド、光化学的開裂、又はペプチドリンカーの開裂で構成された増幅産物に組み込まれるリボヌクレオチドの開裂を含む。
固相増幅反応が共有結合で固定化された一方のプライマ及び遊離溶液中の他方のみを用いて実施される場合、線形化工程は、必須でない場合があることが理解されるであろう。
配列決定に好適な線形化された鋳型を生成するために、完全に又は部分的に一本鎖である、配列決定のための線形化された鋳型を残すために、増幅によって形成された架橋構造中の相補的鎖の「等しくない」量を除去することが必要である。最も好ましくは、架橋構造の一方の鎖が実質的に又は完全に除去される。
切断工程に続いて、切断のために使用される方法にかかわらず、切断反応の産物は、固体支持体に付着していない切断された鎖の部分を除去するために、変性条件に供され得る。好適な変性条件は、標準的な分子生物学プロトコル(Sambrook et al.,2001,Molecular Cloning,A Laboratory Manual,3rd Ed,Cold Spring Harbor Laboratory Press,Cold Spring Harbor Laboratory Press,NY;Current Protocols,eds Ausubel et al.)を参照すると、熟練した読者には明らかであろう。
変性(及びその後の切断された鎖の再アニーリング)は、部分的又は実質的に一本鎖である配列決定鋳型の生成をもたらす。次に、配列決定反応は、鋳型の一本鎖部分への配列決定プライマのハイブリダイゼーションによって開始され得る。
したがって、核酸配列決定反応は、線形化された増幅産物の一本鎖領域に配列決定プライマをハイブリダイズし、1つ以上のヌクレオチドを、配列決定される増幅された鋳型鎖の領域に相補的なポリヌクレオチド鎖に連続的に組み込み、組み込まれたヌクレオチドのうちの1つ以上に存在する塩基を識別し、それによって鋳型鎖の領域の配列を決定することを含み得る。
本開示によって使用され得る1つの好ましい配列決定法は、連鎖停止剤として作用し得る修飾されたヌクレオチドの使用に依存する。修飾されたヌクレオチドが、配列決定されている鋳型の領域に相補的な成長ポリヌクレオチド鎖に組み込まれると、更なる配列伸長を誘導するために利用可能な遊離3’-OH基が存在せず、したがって、ポリメラーゼは、更なるヌクレオチドを付加することができない。成長鎖に組み込まれた塩基の性質が決定されると、3’ブロックを除去して、次の連続したヌクレオチドの添加を可能にし得る。これらの修飾ヌクレオチドを使用して誘導される生成物を配列させることにより、DNA鋳型のDNA配列を推定することが可能である。修飾ヌクレオチドの各々が、各組み込み工程で添加された塩基間の識別を容易にするために、特定の塩基に対応することが知られている異なる標識を結合している場合、そのような反応は、単一の実験で行うことができる。代替的に、別個の反応が実行され得、修飾されたヌクレオチドの各々を別々に含有する。
修飾されたヌクレオチドは、それらの検出を容易にするために標識を担持し得る。好ましくは、これは、蛍光標識である。各ヌクレオチドのタイプは、異なる蛍光標識を担持し得る。しかしながら、検出可能な標識は、蛍光標識である必要はない。組み込まれたヌクレオチドの検出を可能にする任意の標識を使用することができる。
蛍光標識されたヌクレオチドを検出するための1つの方法は、標識されたヌクレオチドに特異的な波長のレーザー光を使用すること、又は他の好適な照明源の使用を含む。ヌクレオチド上の標識からの蛍光は、CCDカメラ又は他の好適な検出手段によって検出され得る。
本開示は、ポリヌクレオチド鎖へのヌクレオチドの連続的な組み込みに依存する本質的に任意の配列決定方法論が使用され得るため、上記で概説された配列決定法の使用に限定されない。好適な代替的な技術としては、例えば、Pyrosequencing(商標)、FISSEQ(fluorescent in situ sequencing、蛍光インサイチュ配列決定)、MPSS(massively parallel signature sequencing、大規模並行署名配列決定)、及びライゲーションベースの方法による配列決定が挙げられる。
本開示の方法を使用して配列決定される標的ポリヌクレオチドは、配列決定することが所望される任意のポリヌクレオチドであり得る。本明細書で詳細に説明される鋳型ライブラリ調製方法を使用することは、既知、未知、又は部分的に既知の配列の本質的に任意の二本鎖又は一本鎖標的ポリヌクレオチドから始まる鋳型ライブラリを調製することが可能である。固相増幅によって調製されたクラスタ化されたアレイの使用により、同じ又は異なる配列の複数の標的を並行して配列決定することが可能である。
ここで、本開示の方法の様々な非限定的な特定の実施形態が、添付の図面を参照して更に詳細に説明されることになる。本開示の1つの特定の実施形態に関して好ましいものとして説明されている特徴は、別途記載されない限り、本開示の他の特定の実施形態に必要な変更を加えて適用される。
図1は、上記に詳細に説明されるように、RNA試料からの配列決定ライブラリの生成のためのRNA-Seq技術を提供する。従来のRNAワークフローとは異なり、望ましくないrRNA断片に特異的な1つ以上のブロッキングオリゴヌクレオチドの付加によって可能にされるワークフローは、オンマーケット技術の場合のように、cDNAへのRNAの変換前にrRNAの長い1~2時間の枯渇を必要としない。これは、より速いワークフロー時間を可能にし、いくつかの実装では、様々な試薬の低減された必要性に起因して、より容易な自動化を可能にする。
図2は、本開示の例示的な方法の例示及び概要を提供する。示されるように、PCRクランプは、標的化された所望されないライブラリ断片の増幅を選択的にブロックする(図2A参照)。PCRの初期熱変性工程におけるライブラリの変性に続いて、増幅プライマがライブラリ断片の末端に結合する。望ましくない断片に相補的であるように設計されたPCRクランプはまた、選択ライブラリ断片にハイブリダイズする(図2B参照)。熱安定性ポリメラーゼは、プライマを伸長させ、所望されるライブラリ断片をコピーし得る。しかしながら、PCRにおいて使用される典型的な熱安定性ポリメラーゼは、5’-3’エキソヌクレアーゼ及び鎖置換活性を欠くため、PCRクランプは、所望されない断片のコピーを効果的にブロックする(図2C参照)。数サイクルのPCRの後、所望されるライブラリ断片は、指数関数的に増幅されているが、所望されない断片の増幅は、抑制されている。結果は、所望されないライブラリ断片の低減された提示を有する最終的に増幅されたライブラリである(図2D参照)。本開示の方法は、Kapa HiFiポリメラーゼの5’→3’エキソヌクレアーゼ活性及び鎖置換の欠失に起因して、Kapa HiFiポリメラーゼを用いて良好に機能することが見出された。
図3は、鋳型ライブラリから所望されない転写物を枯渇させるためのブロッキングオリゴヌクレオチドのプールの様々な設計(すなわち、PCRクランプ)を提供する。Design1は、逆平行及び隣接PCRクランプのプールを提供する。Design1+2は、Design1のPCRクランプの同じプールを提供するが、逆相補的PCRクランプがプールに付加されている。Design3は、逆平行重複PCRクランプを提供する。
図4は、Design1のPCRクランプのプール及びDesign1_2のPCRクランプのプールが、非枯渇RNAを使用するRNA-seqプロトコルにおいて、rRNA転写物のパーセンテージを80%から30%に低減したことを示す。追加のワークアップ工程は、必要なかった。
図5は、Design1のPCRクランプのプール及びDesign1_2のPCRクランプのプールが、RPO枯渇RNA試料を使用したRNA-seqプロトコルにおいて、rRNA転写物のパーセンテージを20%から1%に更に低減したことを示す(左パネル)。RPO枯渇RNA試料は、関心対象のライブラリ断片で濃縮されるが、いくらかの望ましくないリボソームrRNAが依然として観察される(20%)。(RPO=RNA Pan-Cancer Oligos(すなわち、Illumina(商標)TruSight RNA Pan-Cancer製品からのオリゴ)。更に、Design1のPCRクランプのプール及びDesign1_2のPCRクランプのプールは、非枯渇RNA試料中のrRNA転写物を、RPO枯渇RNA試料と同等のレベルまで枯渇させることができた(右パネル)。Design3(DesignOffSet)は、rRNA転写物の試料を枯渇させることができなかった。PCRクランプは、rRNAアーチファクトの二次構造を形成するために互いにプライミングオフしていたと仮定される。
図6は、Design1のPCRクランプのプール及びDesign1_2のPCRクランプのプールが、mRNA選択試料を使用するRNA-seqプロトコルにおいて、rRNA転写物のパーセンテージを1.5%から0.25%に更に低減したことを示す。
図8は、Design1のPCRクランプ又はDesign1_2のPCRクランプによって枯渇された試料が、他の枯渇方法と同等であった>0.95の値を呈する100万マッピングリード当たりの転写物1キロベースの断片数(FPKM)によるように、高レベルの遺伝子発現を呈したことを示す。
図9は、ブロッキングオリゴヌクレオチドを使用してrRNAの枯渇された試料対非枯渇試料において、rRNA転写物が大幅に低減されたことを示すトレースを提供する。
図10は、本開示の例示的なブロッキングオリゴヌクレオチドを提示する。ブロッキングオリゴヌクレオチドは、標的断片の内部(すなわち、重複しないプライマ結合部位)領域とハイブリダイズするように設計される。PCRで使用されるほとんどのDNAポリメラーゼが有意な鎖置換活性を欠くため、十分に強く結合したブロッキングオリゴヌクレオチドの存在は、ポリメラーゼの進行を物理的に妨げ、かつ全長アンプリコンの合成を防止するはずである。ブロッキングヌクレオチドについての考慮事項としては、以下が挙げられるが、これらに限定されない。
(1)PCR反応における伸長工程の温度よりも高い融解温度(Tm)を有すること。これは、ブロッキングオリゴヌクレオチドがPCR伸長工程を通して結合したままであることを確保する。
(2)ブロッキングオリゴヌクレオチドは、ポリメラーゼ伸長を防止するために、その3’末端に3’-ブロックを含み得る。この3’-ブロックは、ブロッキングオリゴヌクレオチドがプライマとして作用し、望ましくないPCR副産物を生成することを防止する。これを達成するために、3’スペーサ修飾(例えば、C3)、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基を含む、いくつかの方法が使用され得る。
(3)プルーフリーディングDNAポリメラーゼ(すなわち、強力な3’->5’エキソヌクレアーゼ活性を有するポリメラーゼ)がPCR反応に使用される場合、ブロッキングオリゴが、分解を防止するために3’末端でエキソヌクレアーゼ活性に対して耐性であるべきである。これは、ブロッキングオリゴヌクレオチドの3’末端に1つ以上のホスホロチオエート結合を含むブロッキングオリゴヌクレオチドによって達成され得る。
(4)強力な5’->3’エキソヌクレアーゼ活性を有するポリメラーゼ(例えば、Taq DNAポリメラーゼ)が使用される場合、ブロッキングオリゴは、その5’末端におけるエキソヌクレアーゼ分解に耐性であるべきである。これは、ブロッキングオリゴヌクレオチドの5’末端に1つ以上のホスホロチオエート結合を含むブロッキングオリゴヌクレオチドによって達成され得る。
Tmについての配列依存性に起因して、考慮事項(1)を達成するために必要とされるオリゴの長さは、特にATリッチ配列について、非常に長くなり得る。ロックド核酸(LNA)塩基又はペプチド核酸(PNA)結合などの、追加のオリゴ修飾が、この状況において、ブロッキングオリゴヌクレオチドの長さ又は配列を変化させることなくブロッキングオリゴヌクレオチドのTmを上昇させるために使用され得る。
図11~図12は、RNA-seqライブラリからリボソーム配列を枯渇させるためのブロッキングオリゴヌクレオチドの使用を実証する。ブロッキングオリゴのプールは、5つの主要なrRNA配列(18S、28S、5S、ミトコンドリア12S、及びミトコンドリア16S)の各々からの潜在的なライブラリ断片の大部分が、1つ以上のブロッキングオリゴヌクレオチドによって標的化されるように設計され得る。次いで、ブロッキングオリゴのプールは、ライブラリ調製のPCR増幅工程中に試料に付加され得、結果として、最終ライブラリ中のrRNAアンプリコンの特異的枯渇を生じる。
上記で概説された一般的なブロッキングオリゴヌクレオチドの考慮事項に加えて、rRNAブロッキングオリゴヌクレオチドプール設計のために、いくつかの追加のパラメータが考慮される必要がある。
(1)ブロッキングオリゴヌクレオチドの長さは、標的Tmを維持しながら可能な限り最小化されるべきである。これは、最大数の可能なrRNAライブラリ断片が、ブロッキングオリゴとの端から端までのマッチによってカバーされることを可能にする。
(2)ブロッキングオリゴヌクレオチド間隔は、標的ライブラリの挿入サイズよりも大きいギャップの数を最小化するように選択されるべきである。
(3)ブロッキングオリゴヌクレオチドは、標的化されたrRNA断片のセンス鎖及びアンチセンス鎖の両方を標的化するように設計される必要があり得る。
ヒトRNA-seqライブラリとともに使用するためのrRNAブロッキングオリゴのプールを設計するために、以下の工程を含む計算戦略が実装された。
(1)各rRNA配列の5’末端から出発して、90bpのウィンドウ(RNAライブラリの平均挿入サイズの約0.5倍)が指定され、80℃を上回るTmを有するオリゴについてスキャンされた。オリゴの長さは、最初に15bpに設定され、(a)所望されるTmを有するオリゴが見出されるか、又は(b)オリゴの長さが90bpを超えるまで、反復して増加させた。
(2)一旦オリゴがウィンドウ内で識別されると、新しい90bpウィンドウがオリゴの3’末端から開始して設定され、工程(1)からの検索手順が繰り返される。所与のウィンドウ内にオリゴが見出されない場合、前のウィンドウの3’末端から開始する新しいウィンドウが設定される。
(3)シーケンスの最後に達するまで、工程(1)及び(2)が繰り返される。
このアプローチを使用して、全ての配列にわたって90bpよりも長い、11個のギャップのみを有する5つのヒトrRNAのほぼ全長をカバーしたブロッキングオリゴのセットが設計された(図11及び図12参照)。非枯渇RNAseqライブラリ(すなわち、大部分がrRNAからなる)を使用するシミュレーションは、rRNAライブラリ断片のほぼ90%が、設計されたプールからのブロッキングオリゴヌクレオチドのうちの1つ以上による枯渇のために標的化されることになることを示した。これは、本明細書に説明されるブロッキングオリゴヌクレオチドアプローチが、市販のrRNA枯渇キットに匹敵する枯渇効率(例えば、RiboMinusについて約95%の枯渇)を、非常に簡略化されたワークフロー及び低入力RNA試料に対するより良好な性能を伴って、与え得ることを示唆する。プール設計に対するこのアプローチは、希少な体細胞突然変異の検出、NIPT、メタゲノミクス、又は病原体検出などの、豊富な配列による汚染が問題となる他のNGS法にも適用され得る。
したがって、本明細書に提示される研究では、ブロッキングオリゴヌクレオチドのプール(すなわち、PCRクランプ)が、所望されないライブラリ断片のPCR増幅を選択的に防止したことが示された。ライブラリからの所望されない転写物の枯渇は、ユーザによる余分なワークアップ工程を必要とせず、1つ以上のブロッキングポリヌクレオチドのみがPCR増幅反応に付加される必要がある。研究は、1つの使用が、本開示の1つ以上のブロッキングオリゴヌクレオチド(すなわち、PCRクランプ)を使用することによって、増幅されたRNA-Seqライブラリ内のrRNA含量を選択的に低減させ得ることを明確に実証する。更に、rRNA枯渇剤で処理された試料(RPO処理)及びmRNA選択試料において、1つ以上のブロッキングオリゴヌクレオチドの使用は、これらの試料中のrRNA含量を有意に更に低減させた。例えば、RPO処理試料において、本開示の1つ以上のブロッキングオリゴヌクレオチド(すなわち、PCRクランプ)の使用は、rRNA含量を約10~15%から<1%rRNAまで低減させた。
他のrRNA枯渇技術と比較して、本開示の組成物、方法、及びキットは、RNA-Seqワークフローを使用した枯渇RNAライブラリのより迅速な調製を提供する。更に、本開示の組成物、方法、及びキットは、rRNA含量を80%から30%に枯渇させ、これは、既存のrRNA枯渇技術に匹敵した。本開示の組成物、方法、及びキットは、既存のrRNA枯渇技術と完全に適合し、rRNA含量をかろうじて検出可能なレベルまで更に低減させるためにその技術とともに使用され得る。観察されたオフターゲット効果はほとんどなく、本開示の組成物、方法、及びキットは、Ribozero及びRNase H枯渇法に匹敵した遺伝子レベル発現の高い相関を維持した。PCR反応におけるサイクル数は、結果的に得られたライブラリにおける望ましくない転写物の低減のレベルに相関する。言い換えると、PCRサイクル数が多いほど、結果的に得られるライブラリ内の望ましくない転写物の低減が大きくなる。
3’-ブロックが利用されなかったブロッキングオリゴヌクレオチド(すなわち、PCRクランプ)を用いて研究が実施されたことに留意されるべきである。ブロッキングオリゴヌクレオチドは、所望されない転写物の試料を枯渇させることにおいて、更なる改善を提供し、重複ブロッキングヌクレオチド(Design3)におけるコンカテマーの形成を大きく低減する可能性が高いことが予想される。ブロッキングオリゴヌクレオチドの長さを増加させることなくブロッキングヌクレオチドのTmを増加させる必要がある場合、LNA又はPNAなどの修飾塩基が使用され得る。
研究は、全RNA試料からrRNA転写物を枯渇させることを対象としたが、本開示の方法、組成物、及びキットは、ライブラリ調製物中の望ましくない転写物を低減するために一般的に適用可能であることが予想される。例えば、1つ以上のブロッキングオリゴヌクレオチドが、ATAC-Seq調製物中の望ましくないmtDNAを低減するために、又は疫学試料のための宿主転写物を低減するために、使用することができる。
本開示は、本明細書に開示される1つ以上のブロッキングオリゴヌクレオチドを含むキットを更に提供する。キットは、特定の用途における使用のために調整され得る。例えば、キットは、本開示の方法を使用して鋳型ポリヌクレオチドのライブラリを調製する際の1つ以上のブロッキングオリゴヌクレオチドの使用を対象とし得る。そのようなキットは、少なくとも、本明細書で定義されるアダプタの供給物と、アダプタにアニーリングして伸長産物の合成を開始することができる少なくとも1つの増幅プライマの供給物と、を含み得、伸長産物は、アダプタが使用されているときにアダプタにライゲーションされた任意の標的配列を含むことになる。増幅プライマの構造及び特性は、当業者に周知であろう。キットに含められるアダプタとともに使用するための適切なヌクレオチド配列の好適なプライマは、当技術分野で通例的に使用される標準的な自動核酸合成設備及び試薬を使用して容易に調製され得る。キットは、1つの単一のタイプのプライマの供給物として、又は2つの異なるプライマの別個の供給物として(又は混合物でも)、例えば、溶液相中及び/又は好適な固体支持体上でミスマッチアダプタを用いて修飾された鋳型のPCR増幅(すなわち、固相PCR)に好適なPCRプライマの対を含み得る。
アダプタ、PCRプライマ、及び1つ以上のブロッキングオリゴヌクレオチドは、即座に使用できるキットで、又はより好ましくは、使用前に希釈を必要とする濃縮物として、又は使用前に再構成を必要とする凍結乾燥若しくは乾燥形態で供給され得る。必要に応じて、キットは、プライマの希釈又は再構成のための好適な希釈剤の供給を更に含み得る。任意選択的に、キットは、PCR増幅を実施する際に使用するための試薬、緩衝液、酵素、dNTPなどの供給物を更に含み得る。任意選択的にキット中に供給され得る更なる成分としては、アダプタ及びプライマを使用して調製される鋳型を配列決定するために好適な「ユニバーサル」配列決定プライマが挙げられる。
本開示は、本明細書に説明される方法及び組成物が、以下の態様(態様1~43)によって更に定義され得ることを更に提供する。
態様1.1つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたDNA又はcDNAライブラリから望ましくない断片を選択的に枯渇させる方法であって、
ポリメラーゼ連鎖反応(PCR)反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない望ましくない断片を含む、増幅することを含み、
PCR反応が、複数の断片、ポリメラーゼ、dNTP、PCRプライマ、及び1つ以上のブロッキングオリゴヌクレオチドを含み、1つ以上のブロッキングオリゴヌクレオチドが、(i)、及び/又は(ii)、並びに(iii):
(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
(iii)ブロッキングオリゴヌクレオチドの3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含み、
1つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、PCRによる所望されない断片の増幅をブロックする、方法。
態様2.ブロッキングオリゴヌクレオチドのうちの1つ以上が、15nt~100ntの長さであり、好ましくは、ブロッキングヌクレオチドが、15nt~80nt、15nt~70nt、15nt~60nt、15nt~50nt、15nt~40nt、15nt~30nt、17nt~30nt、又は20nt~30ntの長さである、態様1の方法。
態様3.ポリメラーゼが5’-3’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、5’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含み、好ましくは、5’末端が、ホスホロチオエート結合を含む2~5、3~5、4~5、2~4、又は2~3個のヌクレオチドを含む、態様1又は態様2の方法。
態様4.ポリメラーゼが3’-5’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、3’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含み、好ましくは、3’末端が、ホスホロチオエート結合を含む2~5、3~5、4~5、2~4、又は2~3個のヌクレオチドを含む、態様1~3のいずれか1つの方法。
態様5.1つ以上のブロッキングオリゴヌクレオチドが、(i)、(ii)、及び(iii):
(i)5’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチドを含み、好ましくは、5’末端が、ホスホロチオエート結合を含む2~5、3~5、4~5、2~4、又は2~3個のヌクレオチド。
及び/又は
(ii)3’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチドを含み、好ましくは、3’末端が、ホスホロチオエート結合を含む2~5、3~5、4~5、2~4、又は2~3個のヌクレオチド。
並びに
(iii)ブロッキングオリゴヌクレオチドの3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、態様1~4のいずれか1つの方法。
態様6.3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択され、好ましくは、3’-ブロックが、C-スペーサである、態様1~5のいずれか1つの方法。
態様7.増幅されたライブラリが、cDNA由来の鋳型配列を含む、態様1~6のいずれか1つの方法。
態様8.増幅されたライブラリが、gDNA由来の鋳型配列を含む、態様1~7のいずれか1つの方法。
態様9.アダプタ配列が、鋳型配列の各末端にライゲーションされているY字アダプタに由来する、態様1~8のいずれか1つの方法。
態様10.1つ以上のブロッキングオリゴヌクレオチドが、rRNA及び/又はグロビン由来の鋳型配列に結合する、態様1~9のいずれか1つの方法。
態様11.1つ以上のブロッキングオリゴヌクレオチドが、18S rRNA、5.8S rRNA、及び/又は28S RNA由来の鋳型配列に結合するブロッキングオリゴヌクレオチドのプールを含む、態様1~10のいずれか1つの方法。
態様12.ブロッキングオリゴヌクレオチドのうちの1つ以上が、mtDNA由来の鋳型配列に結合する、態様1~11のいずれか1つの方法。
態様13.増幅されたDNA又はcDNAライブラリが、次世代シーケンシングを使用することによって分析される、態様1~12のいずれか1つの方法。
態様14.PCR増幅工程が、以下の工程:
RNA試料を取得する工程と、
好ましくは、超音波処理、酵素の使用、熱単独、又は高温における二価カチオンへの曝露によって、RNAを断片化する工程と、
RNA断片をcDNAに逆転写する工程と、
cDNAを平滑末端化し、平滑末端化されたcDNAの3’末端にAヌクレオチドを付加する工程と、
Aテール付きcDNAを、3’末端に非相補的Tヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、態様1~13のいずれか1つの方法。
態様15.RNA断片をcDNAに逆転写する前に、RNA試料が、RNA試料からrRNA配列を枯渇させるように処理される、態様14の方法。
態様16.PCR増幅工程が、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を生成するためのタグ付け反応工程によって先行される、態様1~13のいずれか1つの方法。
態様17.1つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたDNA又はcDNAライブラリから望ましくない断片を選択的に枯渇させる方法であって、
ポリメラーゼ連鎖反応(PCR)反応において、アダプタ配列にライゲーションされた二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない鋳型配列を含有する望ましくない断片を含む、増幅することを含み、
PCR反応が、複数の断片、ポリメラーゼ、dNTP、PCRプライマ、及びブロッキングオリゴヌクレオチドのプールを含み、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に結合し、
1つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、PCRによる所望されない断片の増幅をブロックする、方法。
態様18.ブロッキングオリゴヌクレオチドのプールが、15nt~100ntの長さであり、好ましくは、ブロッキングヌクレオチドが、15nt~80nt、15nt~70nt、15nt~60nt、15nt~50nt、15nt~40nt、15nt~30nt、17nt~30nt、又は20nt~30ntの長さである、態様17の方法。
態様19.ブロッキングオリゴヌクレオチドのプールが、非重複かつ隣接様式で、好ましくは、図3のDesign1の様式で、鋳型の鎖に結合するブロッキングオリゴヌクレオチドを含む、態様17の方法。
態様20.ブロッキングオリゴヌクレオチドのプールが、好ましくは、図3のDesign1+2の様式で、他のブロッキングオリゴヌクレオチドに対して逆相補的であるブロッキングオリゴヌクレオチドを含む、態様19の方法。
態様21.ブロッキングオリゴヌクレオチドのプールが、(i)、及び/又は(ii)、並びに(iii):
(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
(iii)ブロッキングオリゴヌクレオチドの3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、態様17~20のいずれか1つの方法。
態様22.ポリメラーゼが5’-3’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、5’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む、態様21の方法。
態様23.ポリメラーゼが3’-5’プルーフリーディング活性を有する場合、ブロッキングオリゴヌクレオチドのうちの1つ以上が、3’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む、態様21の方法。
態様24.1つ以上のブロッキングオリゴヌクレオチドが、(i)、(ii)、及び(iii):
(i)5’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、
(ii)3’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、及び
(iii)ブロッキングオリゴヌクレオチドの3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、態様21の方法。
態様25.3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される、態様21~24のいずれか1つの方法。
態様26.増幅されたライブラリが、cDNA由来の鋳型配列を含む、態様17~25のいずれか1つの方法。
態様27.増幅されたライブラリが、gDNA由来の鋳型配列を含む、態様17~25のいずれか1つの方法。
態様28.アダプタ配列が、鋳型配列の各末端にライゲーションされているY字アダプタに由来する、態様17~27のいずれか1つの方法。
態様29.ブロッキングオリゴヌクレオチドのプールが、rRNA及び/又はグロビン由来の鋳型配列に結合する、態様17~28のいずれか1つの方法。
態様30.ブロッキングオリゴヌクレオチドのプールが、18S rRNA、5.8S rRNA、及び/又は28S RNA由来の鋳型配列に結合する、態様17~29のいずれか1つの方法。
態様31.ブロッキングオリゴヌクレオチドのブロッキングのプールが、mtDNA由来の鋳型配列に結合する、態様17~30のいずれか1つの方法。
態様32.増幅されたDNA又はcDNAライブラリが、次世代シーケンシングを使用することによって分析される、態様17~31のいずれか1つの方法。
態様33.PCR増幅工程が、以下の工程:
RNA試料を取得する工程と、
好ましくは、超音波処理、酵素の使用、熱単独、又は高温における二価カチオンへの曝露によって、RNAを断片化する工程と、
RNA断片をcDNAに逆転写する工程と、
cDNAを平滑末端化し、平滑末端化されたcDNAの3’末端にAヌクレオチドを付加する工程と、
Aテール付きcDNAを、3’末端に非相補的Tヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、態様17~32のいずれか1つの方法。
態様34.RNA断片をcDNAに逆転写する前に、RNA試料が、RNA試料からrRNA配列を枯渇させるように処理される、態様33の方法。
態様35.PCR増幅工程が、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を生成するためのタグ付け反応工程によって先行される、態様17~34のいずれか1つの方法。
態様36.1つ以上のブロッキングオリゴヌクレオチドを含むRNA-Seqベースのライブラリ調製キットであって、1つ以上のブロッキングオリゴヌクレオチドが、(i)、及び/又は(ii)、並びに(iii):
(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
(iii)ブロッキングオリゴヌクレオチドの3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含み、
1つ以上のブロッキングオリゴヌクレオチドが、所望されないライブラリ断片の鋳型配列に結合し、それによって、PCRによる所望されないライブラリ断片の増幅をブロックする、RNA-Seqベースのライブラリ調製キット。
態様37.ライブラリ調製キットが、
A-テーリングミックスと、
増強されたPCRミックスと、
ライゲーションミックスと、
再懸濁緩衝液と、
停止ライゲーション緩衝液と、
Elute,Prime,Fragment High Concentration Mixと、
First strand Synthesis Act D Mixと、
逆転写酵素と、
第2鎖マスタミックスと、を更に含む、態様36のRNA-Seqベースのライブラリ調製キット。
態様38.ブロッキングオリゴヌクレオチドのうちの1つ以上が、15nt~100ntの長さであり、好ましくは、ブロッキングヌクレオチドが、15nt~80nt、15nt~70nt、15nt~60nt、15nt~50nt、15nt~40nt、15nt~30nt、17nt~30nt、又は20nt~30ntの長さである、態様37のRNA-Seqベースのライブラリ調製キット。
態様39.ブロッキングオリゴヌクレオチドのプールを含むRNA-Seqベースのライブラリ調製キットであって、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に非重複かつ隣接様式で結合し、それによって、PCRによる所望されないライブラリ断片の増幅をブロックする、RNA-Seqベースのライブラリ調製キット。
態様40.ライブラリ調製キットが、
A-テーリングミックスと、
増強されたPCRミックスと、
ライゲーションミックスと、
再懸濁緩衝液と、
停止ライゲーション緩衝液と、
Elute,Prime,Fragment High Concentration Mixと、
First strand Synthesis Act D Mixと、
逆転写酵素と、
第2鎖マスタミックスと、を更に含む、態様39のRNA-Seqベースのライブラリ調製キット。
態様41.ブロッキングオリゴヌクレオチドのプールが、15nt~100ntの長さであり、好ましくは、ブロッキングヌクレオチドが、15nt~80nt、15nt~70nt、15nt~60nt、15nt~50nt、15nt~40nt、15nt~30nt、17nt~30nt、又は20nt~30ntの長さである、態様39又は態様40のRNA-Seqベースのライブラリ調製キット。
態様42.ブロッキングオリゴヌクレオチドのプールが、(i)、及び/又は(ii)、並びに(iii):
(i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
(ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
(iii)ブロッキングオリゴヌクレオチドの3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、態様39~41のいずれか1つのRNA-Seqベースのライブラリ調製キット。
態様43.3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される、態様42のRNA-Seqベースのライブラリ調製キット。
本開示の多くの実施形態を説明してきた。しかしながら、本開示の趣旨及び範囲を逸脱することなく、様々な修正が行われ得ることを理解されたい。したがって、他の実施形態は、以下の特許請求の範囲の範囲内にある。

Claims (41)

  1. 1つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたDNA又はcDNAライブラリから望ましくない断片を選択的に枯渇させる方法であって、
    ポリメラーゼ連鎖反応(PCR)反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、前記断片の一部分が、分析されるべきではない望ましくない断片を含む、増幅することを含み、
    前記PCR反応が、複数の断片、ポリメラーゼ、dNTP、PCRプライマ、及び1つ以上のブロッキングオリゴヌクレオチドを含み、前記1つ以上のブロッキングオリゴヌクレオチドが、(i)、及び/又は(ii)、並びに(iii):
    (i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
    (ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
    (iii)前記ブロッキングオリゴヌクレオチドの前記3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含み、
    前記1つ以上のブロッキングプライマが、所望されない断片の前記鋳型配列に結合し、それによって、PCRによる前記所望されない断片の増幅をブロックする、方法。
  2. 前記ブロッキングオリゴヌクレオチドのうちの1つ以上が、15nt~100ntの長さである、請求項1に記載の方法。
  3. 前記ポリメラーゼが5’-3’エキソヌクレアーゼ活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの1つ以上が、5’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む、請求項1に記載の方法。
  4. 前記ポリメラーゼが3’-5’プルーフリーディング活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの1つ以上が、3’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む、請求項1に記載の方法。
  5. 前記1つ以上のブロッキングオリゴヌクレオチドが、(i)、(ii)、及び(iii):
    (i)前記5’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、
    (ii)前記3’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、及び
    (iii)前記ブロッキングオリゴヌクレオチドの前記3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、請求項1に記載の方法。
  6. 前記3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される、請求項1に記載の方法。
  7. 前記増幅されたライブラリが、cDNA由来の鋳型配列を含む、請求項1に記載の方法。
  8. 前記増幅されたライブラリが、gDNA由来の鋳型配列を含む、請求項1に記載の方法。
  9. 前記アダプタ配列が、鋳型配列の各末端にライゲーションされているY字アダプタに由来する、請求項1に記載の方法。
  10. 前記1つ以上のブロッキングオリゴヌクレオチドが、rRNA及び/又はグロビン由来の鋳型配列に結合する、請求項1に記載の方法。
  11. 前記1つ以上のブロッキングオリゴヌクレオチドが、18S rRNA、5.8S rRNA、及び/又は28S RNA由来の鋳型配列に結合するブロッキングオリゴヌクレオチドのプールを含む、請求項10に記載の方法。
  12. 前記ブロッキングオリゴヌクレオチドのうちの1つ以上が、mtDNA由来の鋳型配列に結合する、請求項1に記載の方法。
  13. 前記増幅されたDNA又はcDNAライブラリが、次世代シーケンシングを使用することによって分析される、請求項1に記載の方法。
  14. 前記PCR増幅工程が、以下の工程:
    RNA試料を取得する工程と、
    前記RNAを断片化する工程と、
    前記RNA断片をcDNAに逆転写する工程と、
    前記cDNAを平滑末端化し、前記平滑末端化されたcDNAの3’末端にAヌクレオチドを付加する工程と、
    前記Aテール付きcDNAを、前記3’末端に非相補的Tヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、請求項1に記載の方法。
  15. 前記RNA断片をcDNAに逆転写する前に、前記RNA試料が、前記RNA試料からrRNA配列を枯渇させるように処理される、請求項14に記載の方法。
  16. 1つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたDNA又はcDNAライブラリから望ましくない断片を選択的に枯渇させる方法であって、
    ポリメラーゼ連鎖反応(PCR)反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、前記断片の一部分が、分析されるべきではない鋳型配列を含有する望ましくない断片を含む、増幅することを含み、
    前記PCR反応が、複数の断片、ポリメラーゼ、dNTP、PCRプライマ、及びブロッキングオリゴヌクレオチドのプールを含み、前記ブロッキングオリゴヌクレオチドの前記プールの一部分が、所望されない断片の鋳型配列の各鎖に結合し、
    前記1つ以上のブロッキングプライマが、所望されない断片の前記鋳型配列に結合し、それによって、PCRによる前記所望されない断片の増幅をブロックする、方法。
  17. ブロッキングオリゴヌクレオチドの前記プールが、15nt~100ntの長さである、請求項16に記載の方法。
  18. ブロッキングオリゴヌクレオチドの前記プールが、非重複かつ隣接様式で前記鋳型の前記鎖に結合するブロッキングオリゴヌクレオチドを含む、請求項16に記載の方法。
  19. ブロッキングオリゴヌクレオチドの前記プールが、他のブロッキングオリゴヌクレオチドに対して逆相補的であるブロッキングオリゴヌクレオチドを含む、請求項18に記載の方法。
  20. ブロッキングオリゴヌクレオチドの前記プールが、(i)、及び/又は(ii)、並びに(iii):
    (i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
    (ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
    (iii)前記ブロッキングオリゴヌクレオチドの前記3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、請求項16に記載の方法。
  21. 前記ポリメラーゼが5’-3’エキソヌクレアーゼ活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの1つ以上が、前記5’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む、請求項20に記載の方法。
  22. 前記ポリメラーゼが3’-5’プルーフリーディング活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの1つ以上が、3’末端に、ホスホロチオエート結合を含む1~5個のヌクレオチドを含む、請求項20に記載の方法。
  23. 前記1つ以上のブロッキングオリゴヌクレオチドが、(i)、(ii)、及び(iii):
    (i)前記5’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、
    (ii)前記3’末端に、ホスホロチオエート結合を含む2~5個のヌクレオチド、及び
    (iii)前記ブロッキングオリゴヌクレオチドの前記3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、請求項20に記載の方法。
  24. 前記3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される、請求項20に記載の方法。
  25. 前記増幅されたライブラリが、cDNA由来の鋳型配列を含む、請求項16に記載の方法。
  26. 前記増幅されたライブラリが、gDNA由来の鋳型配列を含む、請求項16に記載の方法。
  27. 前記アダプタ配列が、鋳型配列の各末端にライゲーションされているY字アダプタに由来する、請求項16に記載の方法。
  28. ブロッキングオリゴヌクレオチドの前記プールが、rRNA及び/又はグロビン由来の鋳型配列に結合する、請求項16に記載の方法。
  29. ブロッキングオリゴヌクレオチドの前記プールが、18S rRNA、5.8S rRNA、及び/又は28S RNA由来の鋳型配列に結合する、請求項16に記載の方法。
  30. ブロッキングオリゴヌクレオチドのブロッキングの前記プールが、mtDNA由来の鋳型配列に結合する、請求項16に記載の方法。
  31. 前記増幅されたDNA又はcDNAライブラリが、次世代シーケンシングを使用することによって分析される、請求項16に記載の方法。
  32. 前記PCR増幅工程が、以下の工程:
    RNA試料を取得する工程と、
    前記RNAを断片化する工程と、
    前記RNA断片をcDNAに逆転写する工程と、
    前記cDNAを平滑末端化し、前記平滑末端化されたcDNAの3’末端にAヌクレオチドを付加する工程と、
    前記Aテール付きcDNAを、前記3’末端に非相補的Tヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、請求項16に記載の方法。
  33. 前記RNA断片をcDNAに逆転写する前に、前記RNA試料が、前記RNA試料からrRNA配列を枯渇させるように処理される、請求項32に記載の方法。
  34. 1つ以上のブロッキングオリゴヌクレオチドを含むRNA-Seqベースのライブラリ調製キットであって、前記1つ以上のブロッキングオリゴヌクレオチドが、(i)、及び/又は(ii)、並びに(iii):
    (i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
    (ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
    (iii)前記ブロッキングオリゴヌクレオチドの前記3’末端におけるポリメラーゼ伸長を防止する3’-ブロック、を含み、
    前記1つ以上のブロッキングオリゴヌクレオチドが、所望されないライブラリ断片の鋳型配列に結合し、それによって、PCRによる前記所望されないライブラリ断片の増幅をブロックする、RNA-Seqベースのライブラリ調製キット。
  35. 前記ライブラリ調製キットが、
    A-テーリングミックスと、
    増強されたPCRミックスと、
    ライゲーションミックスと、
    再懸濁緩衝液と、
    停止ライゲーション緩衝液と、
    Elute,Prime,Fragment High Concentration Mixと、
    First strand Synthesis Act D Mixと、
    逆転写酵素と、
    第2鎖マスタミックスと、を更に含む、請求項34に記載のRNA-Seqベースのライブラリ調製キット。
  36. 前記ブロッキングオリゴヌクレオチドのうちの1つ以上が、15nt~100ntの長さである、請求項34に記載のRNA-Seqベースのライブラリ調製キット。
  37. ブロッキングオリゴヌクレオチドのプールを含むRNA-Seqベースのライブラリ調製キットであって、ブロッキングオリゴヌクレオチドの前記プールの一部分が、所望されない断片の鋳型配列の各鎖に非重複かつ隣接様式で結合し、それによって、PCRによる所望されないライブラリ断片の増幅をブロックする、RNA-Seqベースのライブラリ調製キット。
  38. 前記ライブラリ調製キットが、
    A-テーリングミックスと、
    増強されたPCRミックスと、
    ライゲーションミックスと、
    再懸濁緩衝液と、
    停止ライゲーション緩衝液と、
    Elute,Prime,Fragment High Concentration Mixと、
    First strand Synthesis Act D Mixと、
    逆転写酵素と、
    第2鎖マスタミックスと、を更に含む、請求項37に記載のRNA-Seqベースのライブラリ調製キット。
  39. 前記ブロッキングオリゴヌクレオチドの前記プールが、15nt~100ntの長さである、請求項37に記載のRNA-Seqベースのライブラリ調製キット。
  40. ブロッキングオリゴヌクレオチドの前記プールが、(i)、及び/又は(ii)、並びに(iii):
    (i)5’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、及び/又は
    (ii)3’末端に、ホスホロチオエート結合を含む1つ以上のヌクレオチド、並びに
    (iii)前記ブロッキングオリゴヌクレオチドの前記3’末端上のポリメラーゼ伸長を防止する3’-ブロック、を含む、請求項37に記載のRNA-Seqベースのライブラリ調製キット。
  41. 前記3’-ブロックが、C-スペーサ、3’反転塩基、3’リン酸化、3’ジデオキシ塩基、又は3’非相補的オーバーハング塩基から選択される、請求項40に記載のRNA-Seqベースのライブラリ調製キット。
JP2023556903A 2021-03-31 2022-03-30 増幅されたライブラリからの望ましくない断片の選択的枯渇のためのブロッキングオリゴヌクレオチド Pending JP2024512463A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163169185P 2021-03-31 2021-03-31
US63/169,185 2021-03-31
PCT/US2022/022663 WO2022212589A1 (en) 2021-03-31 2022-03-30 Blocking oligonucleotides for the selective depletion of non-desirable fragments from amplified libraries

Publications (1)

Publication Number Publication Date
JP2024512463A true JP2024512463A (ja) 2024-03-19

Family

ID=81346581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023556903A Pending JP2024512463A (ja) 2021-03-31 2022-03-30 増幅されたライブラリからの望ましくない断片の選択的枯渇のためのブロッキングオリゴヌクレオチド

Country Status (9)

Country Link
EP (1) EP4314335A1 (ja)
JP (1) JP2024512463A (ja)
KR (1) KR20230163386A (ja)
CN (1) CN117098855A (ja)
AU (1) AU2022252302A1 (ja)
BR (1) BR112023019999A2 (ja)
CA (1) CA3213037A1 (ja)
IL (1) IL306060A (ja)
WO (1) WO2022212589A1 (ja)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
US5681702A (en) 1994-08-30 1997-10-28 Chiron Corporation Reduction of nonspecific hybridization by using novel base-pairing schemes
US5962271A (en) 1996-01-03 1999-10-05 Cloutech Laboratories, Inc. Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end
US5849497A (en) * 1997-04-03 1998-12-15 The Research Foundation Of State University Of New York Specific inhibition of the polymerase chain reaction using a non-extendable oligonucleotide blocker
US6391592B1 (en) * 2000-12-14 2002-05-21 Affymetrix, Inc. Blocker-aided target amplification of nucleic acids
JP5073967B2 (ja) 2006-05-30 2012-11-14 株式会社日立製作所 単一細胞の遺伝子発現定量方法
CN104619894B (zh) * 2012-06-18 2017-06-06 纽亘技术公司 用于非期望核酸序列的阴性选择的组合物和方法
US20140274729A1 (en) * 2013-03-15 2014-09-18 Nugen Technologies, Inc. Methods, compositions and kits for generation of stranded rna or dna libraries
US20200277651A1 (en) * 2016-02-17 2020-09-03 Admera Health LLC Nucleic Acid Preparation and Analysis
CN110382708A (zh) * 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
AU2018266377A1 (en) * 2017-05-08 2019-11-14 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples

Also Published As

Publication number Publication date
KR20230163386A (ko) 2023-11-30
EP4314335A1 (en) 2024-02-07
CN117098855A (zh) 2023-11-21
BR112023019999A2 (pt) 2023-11-14
IL306060A (en) 2023-11-01
AU2022252302A1 (en) 2023-09-14
CA3213037A1 (en) 2022-10-06
WO2022212589A1 (en) 2022-10-06

Similar Documents

Publication Publication Date Title
US11142789B2 (en) Method of preparing libraries of template polynucleotides
US10006081B2 (en) End modification to prevent over-representation of fragments
CN107922970B (zh) 通过单探针引物延伸的靶标富集
CN112689673A (zh) 转座体使能的dna/rna测序(ted rna-seq)
US20070117121A1 (en) cDNA library preparation
US20120196279A1 (en) Methods and compositions for nucleic acid sample preparation
US20130123117A1 (en) Capture probe and assay for analysis of fragmented nucleic acids
CN109517888B (zh) 使用等位基因特异的反应性引物的核酸扩增方法
CA3163353A1 (en) Controlled strand-displacement for paired-end sequencing
WO2020172199A1 (en) Guide strand library construction and methods of use thereof
US11174511B2 (en) Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture
JP2024512463A (ja) 増幅されたライブラリからの望ましくない断片の選択的枯渇のためのブロッキングオリゴヌクレオチド
JP2023506631A (ja) 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製
US10066262B2 (en) Methods for amplification of nucleic acids utilizing hairpin loop or duplex primers
WO2021156295A1 (en) Methods for amplification of genomic dna and preparation of sequencing libraries
EP3359686A1 (en) Targeted locus amplification using cloning strategies