JP2023548857A - ヘアピンオリゴヌクレオチド及びその使用 - Google Patents

ヘアピンオリゴヌクレオチド及びその使用 Download PDF

Info

Publication number
JP2023548857A
JP2023548857A JP2023526975A JP2023526975A JP2023548857A JP 2023548857 A JP2023548857 A JP 2023548857A JP 2023526975 A JP2023526975 A JP 2023526975A JP 2023526975 A JP2023526975 A JP 2023526975A JP 2023548857 A JP2023548857 A JP 2023548857A
Authority
JP
Japan
Prior art keywords
rna
trna
hairpin
sequence
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023526975A
Other languages
English (en)
Inventor
パン、タオ
ディー. カタンスキ、クリストファー
ピー. ワトキンス、クリストファー
Original Assignee
ザ ユニヴァーシティー オヴ シカゴ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ ユニヴァーシティー オヴ シカゴ filed Critical ザ ユニヴァーシティー オヴ シカゴ
Publication of JP2023548857A publication Critical patent/JP2023548857A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/122Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

いくつかの態様において、本発明は、3’-末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’-末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むヘアピンオリゴヌクレオチドを提供する。いくつかの態様において、本発明は、3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’末端ヌクレオチドの糖位置が糖の2’,3’-ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチドを提供する。いくつかの態様において、本発明は、バイオマーカーの開発におけるヘアピンオリゴヌクレオチドの使用を提供する。いくつかの態様において、本発明は、リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、ヘアピンオリゴヌクレオチドの親和性部分が固体支持体のリガンド部分に結合することを介して該オリゴヌクレオチドが固体支持体に固定化される固体支持体を提供する。いくつかの態様において、本発明はまた、(a)RNA配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することと、(b)RNA配列をcDNA配列として逆転写することと、(c)PCRを用いてcDNA配列を増幅することと、を含むRNA配列ライブラリを調製する方法を提供する。【選択図】図1

Description

関連出願の相互参照
この特許出願は、その全体が参照により本明細書に援用される、2020年11月6日出願の米国仮特許出願第63/110,605号の利益を主張する。
連邦支援の研究又は開発に関する記述
本発明は、米国国立衛生研究所によって与えられた助成金番号HG008935の下で政府の支援を受けて成された。政府は、本発明において一定の権利を有する。
電子的に提出された文献の参照による援用
本明細書と同時に提出され、以下の通り特定されるコンピュータ可読ヌクレオチド配列表は、その全体が参照により本明細書に援用される:2021年11月5日に作成された「757154_ST25.TXT」という名称の32,847バイトのASCII(テキスト)ファイル。
RNAシーケンシング(RNA-seq)で行われる典型的な酵素的及び化学的処理は、特に低分子RNAの場合、サンプル回収において大きな障害となることがある。更に、tRNAの存在量が極めて多いことから、シーケンシングライブラリを構築する前にtRNAと他のRNAとをサイズによって分離することにより低分子RNA-seqを行うことが多く、この分離により、tRNAと他の低分子RNAとのデータの関連性が切り離され、貴重な生物学的情報が失われることがある。また、ライブラリを構築する前に、そして、ライブラリ構築中に再度tRNAをゲル精製する必要があるプロトコルに基づくRNA-seq手順は、効率が悪く、大量のインプット材料を必要とする。
最も一般的に使用されている市販のRNA-seqキットは、転写後修飾も含む低分子RNA(約200ヌクレオチド未満)の研究には適合しない。低分子RNA-seqキットは、多くの場合、逆転写の前に逐次アダプターをライゲーションすることに依存するため、修飾により失敗した逆転写産物が生物学的情報及び解釈を歪めてしまう可能性がある。また、従来のRNA-seq手順及びキットは、多数のサンプルを取り扱うために必要なマルチプレックス化のレベルも不足している。
新規のRNA-seqライブラリ調製戦略及びそれに使用するためのヘアピンオリゴヌクレオチドが必要とされている。
いくつかの態様において、本発明は、3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むヘアピンオリゴヌクレオチドを提供する。
いくつかの態様において、本発明は、3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’末端ヌクレオチドの糖位置が糖の2’,3’-ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチドを提供する。
いくつかの態様において、本発明は、バイオマーカーの開発におけるヘアピンオリゴヌクレオチドの使用であって、該オリゴヌクレオチドが親和性部分及び3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含む使用を提供する。
いくつかの態様において、本発明は、リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、該オリゴヌクレオチドが、親和性部分及び3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含み、該ヘアピンオリゴヌクレオチドの該親和性部分の該固体支持体の該リガンド部分への結合を通じて該オリゴヌクレオチドが該固体支持体に固定化される固体支持体を提供する。
いくつかの態様において、本発明は、(a)RNA配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、該オリゴヌクレオチドが3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むことと、(b)RNA配列をcDNA配列として逆転写することと、(c)PCRを用いて該cDNA配列を増幅させることと、を含むRNA配列ライブラリを調製する方法を提供する。
追加の態様は、本明細書に記載の通りである。
図1は、本発明の態様に係るRNAシーケンシング(RNA-seq)ライブラリの調製を表し、非生産的な最初のライゲーション後にオリゴヌクレオチドヘアピンが受けるプロセスを示す。 図2Aは、本発明の態様に係るRNA-seqライブラリの調製の概略図である。図2Bは、本発明に係る捕捉ヘアピンオリゴ(CHO)の特徴を表し、説明が埋め込まれている。図2Cは、脱メチル化酵素処理の有り無し両方での、全RNA-seqライブラリからの最終PCR産物を示す。DNAサイズマーカーをゲルの左側に示す。ヒトtRNAにおけるm1A58及びm1G37の修飾によって引き起こされる主なRT(逆転写酵素)の停止をゲルの右側に示す。TdTは、RTの異常な末端転移酵素活性に由来する生成物に対応する。図2Dは、脱メチル化酵素処理の有り無し両方での、様々な量のインプット全RNAの量を用いて作製したライブラリの最終PCR産物を示す。図2Eは、脱メチル化酵素及び/又は過ヨウ素酸塩の処理の有り無し両方での、HEK293T全RNA(対照)及びヒトの便の全核酸で出発したライブラリの最終PCR産物を示す。図2Fは、脱メチル化酵素処理の有り無し両方での、マルチプレックス化口腔(舌擦過物)マイクロバイオームライブラリの最終PCR産物を示す。 図3Aは、合成オリゴヌクレオチドのヘアピンオリゴヌクレオチドへのライゲーションの結果を示す。図3Bは、脱メチル化酵素及び/又は過ヨウ素酸塩の処理の有り無し両方での、ライゲーションされたオリゴヌクレオチドが固体支持体ビーズに固定化されている逆転写実験の結果を示す。図3Cは、2回目のライゲーションで追加のプライマーを付加した後に実施したPCRの生成物を示し、インプットRNAが3’-A又は3’-Cで終端した場合、最終生成物にほとんど偏りがないことを示す。図3Dは、脱リン酸化工程の効率を示す。図3Eは、過ヨウ素酸塩処理の有り無し両方での、末端ヌクレオチドが異なるヘアピンオリゴヌクレオチドのライゲーション産物を示す。図3Fは、ワンポットシーケンシングにおけるtRNA荷電の測定の概略図を表す。図3Gは、図3Fに示した処理の有り(+,+)無し(-,-)両方での最終PCR産物を示す。 図4Aは、大腸菌ゲノムにマッピングされたRNA-seq結果を表し、様々な種類のRNAの存在が明らかになった。図4Bは、シーケンシング又はマイクロアレイハイブリダイゼーションによって測定されたtRNAArg又はtRNALeuイソ受容体の相対存在量の比較を表し;各対の左側の薄い色のドットはマイクロアレイデータ、各対の右側の濃い色のドットはRNA-secデータである。図4Cは、脱メチル化酵素処理の有り無し両方での、RNAから作製したライブラリの比較を表す。図4Dは、個々のtRNAに沿った変異率のヒートマップである。図4Eは、脱メチル化酵素の有り無し両方での、rpm(毎分リード数)>1における非コードRNA転写物の存在量を表す。 図5Aは、10分間の3つの急性ストレス条件の有り無し両方での、LBで成長させた大腸菌(E.coli)からの全RNAの生物学的複製間のRNA転写物の存在量の相関を示す。図5Bは、脱メチル化酵素で処理したサンプル及び未処理のサンプルの転写物の存在量間の関係を示す。図5Cは、脱メチル化酵素処理の有り無し両方でのライブラリからのtRNAPro(GGG)に沿った変異率を示す。図5Dは、脱メチル化酵素処理の有り無し両方でのtRNAPro(GGG)に沿ったリード密度を示す。図5Eは、異なるストレス中及び非ストレス対照の3つのストレス応答性低分子非コードRNA及び非応答性対照RNA SRP(シグナル認識粒子RNA、ffsとしても知られている)の存在量を表す。図5Eで解析したストレス応答性配列は、OxyS(+)、酸化ストレスに応答;rhyB(三角)、鉄飢餓に応答;sgrS(四角)、グルコース飢餓に応答;及びffs(SRP;丸)、非応答性対照配列。図5Fは、ストレス中及び非ストレス対照(なし)の3つのストレス応答性低分子非コードRNA及び対照RNA SRP(ffs)のカバレッジ密度を表す。図5Gは、ストレス中の大腸菌RNAの存在量の変化及び修飾を示す。 図6Aは、ヒトゲノムにマッピングされたリードがいかに様々な種類のRNAを明らかにするかを表す。図6Bは、シーケンシング又はマイクロアレイハイブリダイゼーションによって測定されたtRNAArgイソ受容体の相対存在量の比較を表し;各対の左側の薄い色のドットはマイクロアレイデータ、各対の右側の濃い色のドットはRNA-secqデータである。図6Cは、1μg、100ng、又は10ngの全RNAで出発したライブラリからのtRNA存在量の結果の相関を表す。図6Dは、rpm>10における低分子非コードRNA転写物の存在量を表す。 図7Aは、異なるRNAクラスからの転写物の存在量と脱メチル化酵素処理との相関を示す。図7Bは、各クラス内の異なるRNAクラスの生物学的複製の相関を表す。図7Cは、従来の方法を用いて作製した脱メチル化酵素処理したtRNAライブラリの研究に対する、本発明のRNA-seq法を用いた脱メチル化酵素処理したライブラリからのtRNA存在量の相関を表す。図7Dは、脱メチル化酵素処理の有り無し両方で作製したライブラリからのtRNAArg(ACG)に沿った変異率を表す。図7Eは、tRNAArg(ACG)に沿ったリード密度を示す。図7Fは、rpm>2で検出されたマイクロRNAの存在量を表す。図7Gは、ポリ(A)選択されたRNAから作製したRNAシーケンシングライブラリのリード解析を表す。図7Hは、大部分のリードがmRNAにマッピングされ、生物学的複製間の相関が良好であることを示す。 図8Aは、RNA-seqにおけるCMC反応の取り込みの概略図を表す。図8Bは、生物学的複製間でのヒトrRNAの各ヌクレオチド位置における変異率及び停止率を表す。図8Cは、18S rRNAのΨリッチ領域の変異率及び停止率を表す。図8Dは、28S rRNAのΨリッチ領域の変異率及び停止率を表す。図8Eは、18S rRNAの長さに沿った各ヌクレオチド部位におけるリードの変異率を示す。図8Fは、図8Eと同様に解析したリードの停止率を示す。 図9Aは、ヒトの舌擦過物からの主なRNAクラスへのリードの割り当てを示す。図9Bは、様々な細菌の分類学的分類からのSRP RNAと5S rRNAとの相関を示す。値は、log10存在量のZスコアとして計算される。図9Cは、9Bと同様に、細菌の分類学的分類ごとのSRP RNAの存在量と全ての同定されたtRNAの総和との相関を示す。図9Dは、9Bと同様に細菌の分類学的分類ごとの5S rRNAと全ての同定されたtRNAの総和との相関を示す。図9Eは、プレボテラ・メラニノゲニカ(Prevotella melaninogenica)のSRPにマッピングされたリードを示し;リードは、遺伝子のアノテーション付き5’末端(上)にマッピングされるが(大文字)、転写物の3’末端(下)は、遺伝子のアノテーションを1~3塩基超えてゲノム配列に入り(小文字);伸長された3’末端は、SRP構造コンテキストと一致している(中央)。図9Fは、ロシア・ムシラジノーサ(Rothia mucilaginosa)のSRPにマッピングされたリードを示し;リードは、遺伝子のアノテーション付き5’末端(上)の2~5塩基下流にマッピングされるが、3’末端(下)は、アノテーション付き末端から4~8nt短い3’末端を有する個体間の異質性を示す。 図10Aは、tRNA、5S rRNA、SRP RNAのいずれかを用いて算出した又は16Sアンプリコン遺伝子シーケンシングによって測定した、ヒト舌擦過物からの微生物の分類学的組成を示す。図10Bは、tRNA、5S rRNA、SRP RNA、及び16Sアンプリコンシーケンシングによって測定したときの、4名の異なる個体の連続する2日間の舌の微生物存在量の倍率変化を示す。図10Cは、ヒトの便からの異なる主なRNAクラスへのリードの割り当てを示す。図10Dは、tRNA、5S rRNA、SRP RNAのいずれかを用いて算出した又は16Sアンプリコン遺伝子シーケンシングによって測定した、2つのヒト便サンプルからの微生物の分類学的組成を示す。 図11Aは、tRNA、5S rRNA、SRP RNAのいずれかを用いて算出した又は16Sアンプリコン遺伝子シーケンシングによって測定した、4つの異なるヒト舌擦過物からの微生物の分類学的組成を示す。図11Bは、アンチコドン「TTT」又は「CTT」のいずれかを有するtRNAを用いて算出した、ヒト舌擦過物からの微生物の分類学的組成を示す。 図12Aは、ヒト舌擦過物からのロシア(Rothia)属の細菌の個々のtRNAに沿った変異率のヒートマップを示す。図12Bは、Aと同様にヒートマップを示すが、脱メチル化酵素処理に対して感受性である変異を同定する。図12Cは、属からの選択されたtRNAの37位及びその周辺の塩基の変異率を示す。図12Dは、脱メチル化酵素処理の有り無し両方での、ヒト舌からの幾つかの細菌分類群における選択されたtRNAの22位における変異率を示す。図12Eは、Dと同様のヒト舌からの放線菌綱(Actinobacteria)の58位におけるN1-メチアデノシン(m1A)(m1A58)を同定する。図12Fは、連続する2日間の4つのヒト舌擦過物からの脱メチル化酵素処理無しでの選択された細菌綱ごとの22位における変異率を示す。図12Gは、連続する2日間の4つのヒト舌擦過物からの脱メチル化酵素処理無しでの放線菌綱の58位における変異率を示す。図12Hは、ヒトの便からのDと同様の選択された細菌綱におけるm1A22を同定する。図12Iは、ヒトの便からのEと同様の放線菌綱におけるm1A58を同定する。 図13は、SARS-CoV-2感染個体の鼻から得られたサンプルで検出されたtRNAのヒストグラムを表す。 図14は、健常対照、及びインフルエンザ感染患者、及びSARS CoV-2感染患者の鼻咽頭ぬぐい液から得られたサンプルのtRNA分析結果を表す。図14Aは、3つの患者群ごとのtRNA配列に沿った連続領域におけるtRNA断片化パターンを示す。図14Bは、3つの患者群間での特定のtRNAの5’半断片におけるtRNAリードの割合を示す;ns、有意ではない、P値:<0.05;**<0.01;***<10-3、及び****<10-4。図14Cは、3つの患者群間での同一サンプルにおける低分子rRNAに対する特異的tRNAの相対存在量を示す。図14Dは、サンプル間での特定のtRNA塩基修飾プロファイルのパターンを示す。 図15は、結腸直腸がん(CRC)患者6名の腫瘍及び隣接組織におけるtRNA-seqの存在量、修飾、及び断片化の尺度を表す。図15Aは、tRNAAla(TGC)の存在量が、隣接組織よりも腫瘍において一貫して高いことを示す(左図)。対照的に、tRNALeu(AAG)のレベルはばらついており、異なる腫瘍の異質性が強調されている(右図)。図15Bの上図は、特定のtRNAにおける修飾をシーケンシングにおける誤取り込み(変異)によって検出できることを示す。下図は、サンプルを脱メチル化酵素で処理すると、ある種の塩基修飾(m1A)は除去できるが、別の種(I)には影響がないことを示す。図15Cは、異なる細胞条件に応答する細胞性ヌクレアーゼ切断から生成されるtRNA断片を示す。 図16は、個々の患者におけるミトコンドリアtRNAの腫瘍発現パターンを表す。図16Aは、6名中4名の患者について、腫瘍におけるミトコンドリアtRNAの発現が隣接組織と比較して低いことを示す。図16Bは、ミトコンドリアtRNA発現データのより大きなデータセットを含めることにより、高BMI(ボティマスインデックス)患者からの腫瘍では、低BMI患者からの腫瘍と比較してミトコンドリアtRNA遺伝子発現が高いことが明らかになったことを示す。 図17は、CRC患者における5S rRNAの発現によって測定された微生物群の組成を表す。 図18は、ある患者からのフェカリス菌(E.faecalis)tRNATyrデータを表し、亜種の検出を実証する。図18Aは、シーケンシング中の塩基の誤取り込み事象が、tRNAの修飾(m1A)又はマイクロバイオームサンプルにおける遺伝的多様性(SNP)に起因する可能性があることを示す。7位における誤取り込みは、近縁の細菌種間の遺伝的多様性を反映しており、図18Bは、手術後に種の組成が大きく変化することを示す。23位における誤取り込みは、塩基修飾を反映しており、図18Cは、この修飾の割合が手術後に変化することを示す。
いくつかの態様において、本発明は、3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むヘアピンオリゴヌクレオチドを提供する。いくつかの態様において、3’末端ヌクレオチドの糖成分はペントースであり得、ペントースはリボースであり得る。
いくつかの態様において、本発明は、3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’末端ヌクレオチドの糖位置が糖の2’,3’-ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチドを提供する。
本明細書で使用するとき、「オリゴヌクレオチド」は、ポリヌクレオチド鎖であり、典型的には200ヌクレオチド未満長であり、いくつかの態様において10~80ヌクレオチド(例えば、10ヌクレオチド、20ヌクレオチド、30ヌクレオチド、40ヌクレオチド、50ヌクレオチド、60ヌクレオチド、70ヌクレオチド、又は80ヌクレオチド)である。オリゴヌクレオチドは、一本鎖であっても二本鎖であってもよく、DNA、RNA、又はその両方を含み得る。「ヘアピンオリゴヌクレオチド」とは、ポリヌクレオチドを折り返して一本鎖ループと共に二本鎖のステムを有する構造を形成することができるように自己相補的な配列を有するポリヌクレオチドの種類である(例えば、図1及び2を参照)。
いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドは、5’末端リボヌクレオチドを更に含んでいてもよい。5’末端リボヌクレオチドは、5’-リン酸を含み得る。
いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドは、(i)バーコード配列;(ii)親和性部分タグ付きヌクレオチド;及び(iii)プライマー結合部位を更に含んでいてもよい。図2Bに描かれている通り、バーコード及びプライマー結合部位の配列は、本発明のいくつかの態様において、ヘアピンオリゴヌクレオチドのステム領域を形成する一続きのポリヌクレオチド配列内に埋め込まれていてよいが、親和性部分タグ付きヌクレオチドは、本発明のいくつかの態様において、ヘアピンヌクレオチドのループの内部であってよい。
いくつかの態様において、ヘアピンオリゴヌクレオチドは、式(I):5’-Phos-rA CT-X-AGA TCG GAA GAG CAC ACG AT(配列番号86)-LT-AGA CGT GTG CTC TTC CGA TCT(配列番号87)-Z-AG rU-3’-Phos(式中、Xは、少なくとも3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、又は6ヌクレオチドのバーコードであり、LTは、親和性部分でタグ付けされたチミンヌクレオチドであり、Zは、バーコード配列の逆相補鎖であるヌクレオチドの配列である)のヌクレオチド配列を含み得る。いくつかの態様において、式(II)のヌクレオチド配列は、5’-Phos-rA CT-X-GAT CGT CGG ACT GTA GAA CAT(配列番号88)-LT-AG AGT TCT ACA GTC CGA CGA TC(配列番号89)-Z-AG rU-3’-Phos(式中、Xは、少なくとも3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、又は6ヌクレオチドのバーコードであり、LTは、親和性部分でタグ付けされたチミンヌクレオチドであり、Zは、バーコード配列の逆相補鎖であるヌクレオチドの配列である)を含み得る。
以下の表に、上記の例示的なヘアピンオリゴヌクレオチドの完全長DNA配列を提示する:
本明細書で使用するとき、「バーコード」という用語は、そのバーコードが会合しているポリヌクレオチドの何らかの特徴を識別することを可能にする既知の核酸配列を指す。多くの場合、識別されるポリヌクレオチドの特徴は、そのポリヌクレオチドが由来するサンプルである。いくつかの態様において、バーコードは、少なくとも3、4、5、6、又はそれ以上のヌクレオチド長である。いくつかの態様において、バーコードは、3ヌクレオチド長以上である。いくつかの態様において、複数のバーコードを含有する混合物中の各バーコードは、少なくとも2つのヌクレオチド位置、例えば、少なくとも2つ、3つ、4つ、5つ、又はそれ以上の位置が、該複数のバーコードにおける他の全てのバーコードと異なっている。好ましくは、混合物中のバーコードは、少なくとも3つのヌクレオチド位置が互いに異なっている。一般に、バーコードは十分な長さであり、会合しているバーコードに基づいてサンプルを識別できるようにするのに十分に異なる配列を含む。
本明細書で使用するとき、「プライマー」という用語は、相補的ヌクレオチド配列とハイブリダイズすることができ、DNA合成の出発点を提供することができるヌクレオチド配列を指す。プライマーは、その相補的なヌクレオチド配列に特異的に結合するのに十分な長さである。プライマーは、6、7、8、9、10、又はそれ以上の塩基長、典型的には15ヌクレオチド長、16ヌクレオチド長、17ヌクレオチド長、18ヌクレオチド長、19ヌクレオチド長、又は20ヌクレオチド長であってよい。プライマーは、例えば、より長い一本鎖ポリヌクレオチド配列内の配列であってよい。あるいは、プライマーは、一本鎖オリゴヌクレオチドであってもよい。
いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドを固体支持体上に固定化してもよい。固体支持体は、カラムクロマトグラフィー等の生化学的プロセスで使用するのに好適な任意の固体支持体であってよい。例えば、固体支持体は、制御多孔質ガラス、又はポリスチレン支持体等の高分子支持体であってよい。好適な固体支持体は、多くの場合高分子であり、様々な形態及び組成を有し得る。一部の固体支持体は、天然に存在する材料に由来し、その他は、合成的に改質された天然に存在する材料に由来し、その他は、合成材料である。好適な支持体材料の例としては、アガロース及びデキストラン等の多糖類、ポリアクリルアミド、ポリスチレン、ポリビニルアルコール、ヒドロキシエチルメタクリレートとメチルメタクリレートとのコポリマー、シリカ、テフロン、ガラス等が挙げられるが、これらに限定されない。いくつかの態様において、固体支持体は、ビーズを含んでいてもよい。いくつかの態様において、ビーズは、実質的に均一な球状ビーズであってよい。
いくつかの態様において、本明細書に記載の任意のヘアピンオリゴヌクレオチドを、RNA配列ライブラリの調製に使用することができる。いくつかの態様において、ヘアピンオリゴヌクレオチドは、RNA配列ライブラリを調製するマルチプレックス法において使用される。本明細書で使用するとき、「マルチプレックス化」という用語は、多数のサンプルをプールし、プールしたサンプルを同時に1つ以上の生化学的プロセスに供することを指す。以下に例示的な方法を記載する。
いくつかの態様において、本発明は、リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、該オリゴヌクレオチドが、親和性部分及び3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分が、2’-ヒドロキシル及び3’-リン酸を含み、該ヘアピンオリゴヌクレオチドの該親和性部分の該固体支持体の該リガンド部分への結合を通じて、該オリゴヌクレオチドが該固体支持体に固定化される固体支持体を提供する。
オリゴヌクレオチドにおける親和性部分及び固体支持体におけるリガンド部分は、親和性対を形成する。「親和性対」は、例えば、疎水性、親水性、水素結合、極性、電荷、親フッ素性等の固有の特性を介して互いに特異的に結合する親和性部分及びリガンド部分を含む。「親和性部分」及び「リガンド部分」という用語は、それら部分自体の同一性を限定することなく親和性対を形成することができると特定される(例えば、リガンド部分が親和性部分よりも小さい必要はない)。1つの周知の種類の親和性対は、タンパク質及びそのリガンドである。親和性部分及びリガンド部分はそれぞれ、直接又は間接的に、オルトエステルリンカーを介してオリゴヌクレオチド及び固体支持体に別々に結合することができる。いくつかの態様において、親和性部分は、ビオチンタグ、マルトースタグ、グルタチオンタグ、アダマンタンタグ、アリールボロン酸タグ、ポリヒスチジンペプチドタグ、ポリスルフヒドリルタグ、マレイミドタグ、アジドタグ等である。これらのいくつかの態様において、対応するリガンド部分は、アビジン又はストレプトアビジン、マルトース結合タンパク質、グルタチオンS-トランスフェラーゼ(GST)、ククルビツリル又はシクロデキストリン、ジオール含有分子、固定化金属親和性クロマトグラフィー(IMAC)マトリックス、スルフヒドリル含有化合物、アルキン又はシクロオクチン等である。いくつかの態様において、親和性部分はビオチンであってよく、リガンド部分はストレプトアビジンであってよい(例えば、図2A~Bを参照)。当業者であれば、親和性対のどのメンバーをオリゴヌクレオチドに結合させ、どのメンバーを固体支持体に結合させるかを決めることができる。上述した通り、いくつかの態様において、固体支持体は、ビーズであってよい。いくつかの態様において、ビーズは、実質的に均一な球状ビーズであってよい。
固体支持体は、本明細書に記載の任意のヘアピンオリゴヌクレオチドを含んでいてよい。例えば、オリゴヌクレオチドは、(a)リボヌクレオチドとしての5’末端ヌクレオチド、(b)バーコード配列、(c)ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び(d)プライマー結合部位を更に含んでいてもよい。
いくつかの態様において、本発明は、
(a)RNA配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、該オリゴヌクレオチドが3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むことと、
(b)該RNA配列をcDNA配列として逆転写することと、
(c)PCRを用いて該cDNA配列を増幅させることと、
を含むRNA配列ライブラリを調製する方法を提供する。
いくつかの態様において、方法は、(i)リボヌクレオチドとしての5’末端ヌクレオチド、(ii)バーコード配列、(iii)ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び(iv)プライマー結合部位を更に含むヘアピンオリゴヌクレオチドを含み得る。
図2Aは、RNA-seqライブラリの調製において使用される本発明のヘアピンオリゴヌクレオチドの非限定的な態様を概略的に表す。このプロセスは、調製された捕捉ヘアピンオリゴヌクレオチド(CHO)をRNA分子にライゲーションすることから始まり得、該CHOは3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分は2’-ヒドロキシル及び3’-リン酸を含む。ヘアピンオリゴヌクレオチドは、「オンビーズ(on-bead)」RNAシーケンシングライブラリの調製を可能にするように設計してよい。例示的なCHOとして、図2Bに表されるCHOの特徴は、(1)効率的なライゲーションのための5’-リン酸;(2)効率的なRNA-RNAライゲーションのための5’末端リボヌクレオチド;(3)複数サンプルのマルチプレックス化/混合を可能にするバーコード配列;(4)固定化を可能にするためのCHOのループ内部の親和性部分タグ付きヌクレオチド;(5)プライマー結合部位;(6)伸長されていないヘアピンオリゴヌクレオチドへのライゲーションを防ぎ、非生産的ライゲーション産物の酸化を可能にするために糖成分が2’-ヒドロキシルを含む3’末端ヌクレオチド;及び(7)CHOの自己ライゲーションを防ぐための3’-リン酸である。いくつかの態様において、3’末端ヌクレオチドの糖成分はペントースであり得、ペントースはリボースであり得る。
RNA分子は、任意の好適なRNA配列であってよい。いくつかの態様において、RNA配列は、全RNA(例えば、サンプル中の異なる種類のRNAにヘアピンオリゴヌクレオチドがライゲーションすることによって形成される幾つかの異なるコンストラクト)を含み得る。別のいくつかの態様において、RNA配列は、低分子RNAであってよい。低分子RNAとしては、tRNA、マイクロRNA、piRNA、tRNAの断片、rRNA、長鎖非コードRNA(lncRNA)、スプライセオソームRNA(snRNA)、低分子核小体RNA(snoRNA)等が挙げられる。いくつかの態様において、使用されるRNA配列は、tRNAであってよい。
態様として、図1及び2Aは、バーコードを有するCHOのRNAリガーゼを用いたtRNAへのライゲーションを示す。例えば、T4 RNAリガーゼ1又は2等の任意の好適なRNAリガーゼを使用してよい。いくつかの態様において、使用されるリガーゼは、T4 RNAリガーゼ1であってよい。5’末端リボヌクレオチドは、5’-リン酸を含み、ライゲーション効率を促進することができる。3’-リン酸は、第1のライゲーションにおけるヘアピンオリゴヌクレオチドの自己ライゲーションをブロックし、それにより、ヘアピンオリゴヌクレオチドのRNAへのライゲーションの効率を向上させる。
バーコードライゲーション反応後、tRNAを有するCHOを固体支持体上に固定化した後に後続の全ての反応を行うことができる。ヘアピンオリゴヌクレオチドの親和性部分が固体支持体のリガンド部分に結合することを介してオリゴヌクレオチドを固体支持体に固定化してよい。これにより、全ての工程で過剰の試薬を簡単な洗浄で除去することが容易になり、各工程でのサンプルの喪失が大幅に低減される。
方法のいくつかの態様において、固体支持体は、リガンド部分及びヘアピンオリゴヌクレオチドを含み、該オリゴヌクレオチドは、親和性部分及び3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分は、2’-ヒドロキシル及び3’-リン酸を含み、該オリゴヌクレオチドは、該ヘアピンオリゴヌクレオチドの該親和性部分の該固体支持体の該リガンド部分への結合を通じて該固体支持体に固定化される。いくつかの態様において、親和性部分はビオチンであってよく、リガンド部分はストレプトアビジンであってよい(例えば、図2A~Bを参照)。
方法のいくつかの態様において、固体支持体は、ビーズであってよい。いくつかの態様において、固体支持体は、(a)リボヌクレオチドとしての5’末端ヌクレオチド、(b)バーコード配列、(c)ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び(d)プライマー結合部位を更に含むオリゴヌクレオチドを固定化する。いくつかの態様において、固体支持体は、RNA配列ライブラリの調製において使用することができる。他のいくつかの態様において、固体支持体は、RNA配列ライブラリを調製するマルチプレックス法において使用することができる。バーコード付きCHOを固体支持体に固定化した後、サンプルをプールしてよく、それによってマルチプレックス化が可能になる。
tRNAを有するCHOを固体支持体に結合させた後、RNAの修飾をプロファイリングしたりRNA構造をマッピングしたりするために、任意でRNAを酵素的又は化学的に処理してもよい。例えば、脱メチル化酵素処理により、tRNA及びtRNA断片のシーケンシングにおける効率及び定量性が向上し、マイクロバイオームtRNA又はmRNAにおけるN1-メチルアデノシン(m1A)等の新たなRNA修飾を見つけるための検証を提供する。多くのRNA構造マッピングは、例えば、2’-OH(SHAPE)については2-メチルニコチン酸イミダゾリドを又は塩基の高次構造についてはジメチル硫酸/ケトキサールを用いた化学反応を伴う。RNA修飾研究では、シュードウリジン(Ψ)又は5-メチルシトシン(m5C)の部位の同定において化学反応が使用される。例えば、図2Aは、tRNAのワトソン-クリック面のメチル化を除去するための、tRNAを含むビーズに固定化されたCHOの脱メチル化酵素による処理を表す。いくつかの態様において、脱メチル化酵素は、AlkB脱メチル化酵素混合物であってよい。
図1及び2Aは、更に、RNA-seqライブラリの調製において使用することができる他の手順の例を表す。脱メチル化後、アルカリホスファターゼで3’-リン酸基を除去してよい。いくつかの態様において、アルカリホスファターゼは、子ウシの腸(CIP)に由来する。
脱リン酸化後、CHOの3’-OHを逆転写酵素によって伸長させて、RNAのcDNAコピーを作製する。例えば、TGI RT、AMV RT、ThermoScript(商標)RT(Invitrogen(商標))、MMLV RT、SuperScript(商標)IV RT(Invitrogen(商標))等の任意の好適な逆転写酵素(RT)を使用してよい。いくつかの態様において、逆転写酵素は、SuperScript(商標)IV RT(Invitrogen(商標))であってよい。
逆転写後、tRNA配列をRNaseで消化してよい。RNaseH等のDNA/RNA二重鎖におけるRNA鎖を分解することができるエンドヌクレアーゼRNaseが望ましい。いくつかの態様において、RNaseはRNaseHであってよい。
RNase消化後、過ヨウ素酸塩、好ましくは過ヨウ素酸ナトリウム(NaIO)でCHOを酸化してよい。図1に示すように、過ヨウ素酸塩で処理したときにCHOの一部だけが酸化されやすくなるように、CHOは最初のライゲーション工程後に異なる運命を有し得る。
全てのCHOが脱リン酸化を受けることができるが、脱リン酸化の最終生成物は異なることがある。RNAへのライゲーションに成功したCHOは、3’-OHから逆転写酵素による鎖伸長を受ける。次いで、これらCHOは、3’末端デオキシリボヌクレオチドを有する、すなわち、末端3’-OH及び2’-Hを有する。これらCHOは、過ヨウ素酸塩酸化に必要な2’,3’-ジオール構造を有しない。従って、2’-及び3’-OHの両方で終端するCHO、すなわち、ライゲーションを受けず、cDNAで伸長されていないCHOのみが過ヨウ素酸塩によって酸化される(例えば、図1Bを参照)。酸化されたCHOの末端ジアルデヒド(例えば、図1Bを参照)は、これらCHOが次の第2のライゲーションを受けるのを防ぐので、下流の反応における技術的ノイズを低減する。
続いて第2のライゲーションを行って(例えば、図1及び2Aを参照)、PCR中に両方の相補的なDNA鎖が生成されるように、PCR増幅の前に2番目の「逆」プライマー結合部位を付加する。第2のライゲーションオリゴヌクレオチドは、5’末端にUnimolecular Index(UMI)配列を、3’末端にジデオキシヌクレオチドを含み得る(例えば、図1を参照)。3’末端ジデオキシヌクレオチドは、オリゴヌクレオチドの自己ライゲーションをブロックする。UMIは、サンプルライブラリにおける各分子に一意的にタグ付けするために使用される短い配列である。それは、シーケンシング中のエラー補正及び精度向上を提供し、RNAシーケンシング中のPCRアーチファクトの重複排除を可能にする分子バーコード付けの一種である。第2のライゲーション工程で使用するための例示的なオリゴヌクレオチドは、式(III)のオリゴヌクレオチド:5’-Phos-NNN NNN GAT CGT CGG ACT GTA GAA-3ddC(配列番号22)及び式(IV)のオリゴヌクレオチド:5’-Phos-NNN NNN AGA TCG GAA GAG CAC ACG-3ddC(配列番号23)(式中、一連のNは、6ヌクレオチド長のUMI配列を表す)である。
RNA-seqライブラリの調製後、cDNAで伸長されたCHOはPCR増幅を受けることができる。PCRには、任意の好適なPCR試薬系及びサーモサイクラー装置を使用することができる。PCR産物は溶液中で遊離し、容易にDNAシーケンシングに使用することができる。
上記に示した通り、方法は、幾つかの態様を含み得る。いくつかの態様において、方法は、ライゲーション後に3’-リン酸を脱リン酸化し、逆転写後に2’,3’-ジオールを含む3’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含み得る。いくつかの態様において、方法は、ライゲーション後かつ脱リン酸化前に、RNA配列のヌクレオチドにおけるワトソン-クリック面のメチル化を脱メチル化することを含んでいてもよい。いくつかの態様において、方法は、逆転写後にRNA配列を消化し、増幅前に第2のプライマー結合部位を付加するために第2のライゲーションを行うことも含み得る。いくつかの態様において、方法は、第1のライゲーション後に、コンストラクトを固体支持体上に固定化することを更に含み得る。いくつかの態様において、方法は、固定化後に3’-リン酸を脱リン酸化し、逆転写後に2’,3’-ジオールを含む3’末端ヌクレオチドを過ヨウ素酸塩で酸化することも更に含み得る。いくつかの態様において、方法は、固定化後かつ脱リン酸化前に、RNA配列のヌクレオチドにおけるワトソン-クリック面のメチル化を脱メチル化することも含み得る。いくつかの態様において、方法は、逆転写後にRNA配列を消化し、増幅前に第2のプライマー結合部位を付加するために第2のライゲーションを行うことも含み得る。いくつかの態様において、方法は、全RNA、低分子RNA、tRNA、マイクロRNA、piRNA、又はそれらの任意の組み合わせを含むRNAを使用することができる。いくつかの態様において、方法は、マルチプレックス法を含み得る。いくつかの態様において、本発明は、バーコードアダプターのライゲーション、固定化、及び逆転写、続いて、第2のアダプターのライゲーション、及びオンビーズPCRに使用される親和性部分タグ付きオリゴヌクレオチドを必要とし得る。RNA-seqライブラリの構築における複数の工程を統一することにより、同一反応で多くのサンプルをマルチプレックス化することが可能となるので、時間、試薬、及びテクニカルノイズが減少し、スループットが大幅に増加する。また、この設計により、オンビーズでRNAの効率的な酵素的及び化学的処理を含めることも可能にする。
固体支持体をベースとするRNA-seq法の開発により、マルチプレックス化シーケンシングライブラリの調製、オンビーズの酵素的及び化学的処理、ワンポットtRNAの存在量、修飾、及び荷電の測定、並びにDNAの干渉を受けない全核酸マイクロバイオームサンプルの解析が可能になる。
シーケンシングライブラリの構築におけるほとんどの手順を固体支持体上で実施することができる利点は、各手順間のバッファ及び試薬の迅速な交換、夾雑物質の徹底的な除去、並びにサイズ選択又はアダプター/RTプライマーの除去を必要とする全ての手順の省略が可能になることである。また、固体支持プラットフォームにより、RNAのワトソン-クリック面のメチル化を除去するために用いられる脱メチル化酵素等の酵素でRNAをオンビーズ処理することができるようになり、効率的かつ定量的なtRNAシーケンシング及びマイクロバイオームのtRNA修飾の検証が可能になる。
いくつかの態様において、本発明のヘアピンオリゴヌクレオチドは、バイオマーカーの開発において使用することができる。いくつかの態様において、バイオマーカーの開発は、tRNA断片化プロファイルを作成することを含む。いくつかの態様において、バイオマーカーは、固形生検から又は液体生検から開発することができる。いくつかの態様において、バイオマーカーは、液体生検から開発することができる。「液体生検」という用語は、流体生検又は流体相生検としても知られており、血液、血漿、唾液、尿、鼻汁等から採取した物質等の非固体生物学的物質のサンプリング及び分析を指す。いくつかの態様において、バイオマーカーは、ウイルス性疾患の重症度又はがんに関するバイオマーカーであり得る。
本明細書で言及する本発明のヘアピンオリゴヌクレオチド、全RNA、cDNA、プライマー、核酸、タンパク質、ポリペプチド、及び細胞(それらの集団を含む)は、単離及び/又は精製することができる。「単離された」という用語は、本明細書で使用するとき、その天然環境から取り出されていることを意味する。「精製された」という用語は、本明細書で使用するとき、純度が増大していることを意味し、「純度」は相対的な用語であり、必ずしも絶対純度と解釈される訳ではない。例えば、純度は、少なくとも約50%であってよく、約60%超、約70%超、約80%超、約90%超、約95%超であってもよく、約100%であってもよい。
以下は、本発明の特定の態様を含む。
1. 3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むヘアピンオリゴヌクレオチド。
2. 該3’末端ヌクレオチドの糖成分がペントースであり、該ペントースがリボースである、態様1に記載のヘアピンオリゴヌクレオチド。
3. 3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、該3’末端ヌクレオチドの糖位置が糖の2’,3’-ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチド。
4. 5’末端リボヌクレオチドを更に含む、態様1~3のいずれか1つに記載のヘアピンオリゴヌクレオチド。
5.
(a)バーコード配列、
(b)ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
(c)プライマー結合部位
を更に含む、態様1~4のいずれか1つに記載のヘアピンオリゴヌクレオチド。
6. 配列:
5’-Phos-rACT-X-AGA TCG GAA GAG CAC ACG AT(配列番号86)-LT-AGA CGT GTG CTC TTC CGA TCT(配列番号87)-Z-AG rU-3’-Phos
(式中、Xは、少なくとも3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、又は6ヌクレオチドのバーコードであり、LTは、親和性部分タグ付きチミンヌクレオチドであり、Zは、バーコード配列の逆相補鎖であるヌクレオチドの配列である)
を含む、態様5に記載のヘアピンヌクレオチド。
7. 配列:
5’-Phos-rACT-X-GAT CGT CGG ACT GTA GAA CAT(配列番号88)-LT-AG AGT TCT ACA GTC CGA CGA TC(配列番号89)-Z-AG rU-3’-Phos
(式中、Xは、少なくとも3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、又は6ヌクレオチドのバーコードであり、LTは、親和性部分タグ付きチミンヌクレオチドであり、Zは、バーコード配列の逆相補鎖であるヌクレオチドの配列である)
を含む、態様5に記載のヘアピンヌクレオチド。
8. 固体支持体に固定化された、態様1~7のいずれか1つに記載のヘアピンオリゴヌクレオチド。
9. RNA配列ライブラリの調製における、態様1~8のいずれか1つに記載のヘアピンオリゴヌクレオチドの使用。
10. RNA配列ライブラリを調製するマルチプレックス法における、態様1~8のいずれか1つに記載のヘアピンオリゴヌクレオチドの使用。
11. バイオマーカーの開発における、態様1~8のいずれか1つに記載のヘアピンオリゴヌクレオチドの使用。
12. 該バイオマーカーが、液体生検から開発される、態様11に記載の使用。
13. 該バイオマーカーの開発が、tRNA断片化プロファイルを作成することを含む、態様11又は12に記載の使用。
14. ウイルス疾患の重症度についてのバイオマーカーの開発における、態様1~8のいずれか1つに記載のヘアピンオリゴヌクレオチドの使用。
15. 癌についてのバイオマーカーの開発における、態様1~8のいずれか1つに記載のヘアピンオリゴヌクレオチドの使用。
16. リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、該オリゴヌクレオチドが、親和性部分及び3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分が、2’-ヒドロキシル及び3’-リン酸を含み、
該ヘアピンオリゴヌクレオチドの該親和性部分が該固体支持体の該リガンド部分に結合することを介して、該オリゴヌクレオチドが固体支持体に固定化される固体支持体。
17. 該親和性部分がビオチンであり、該リガンド部分がストレプトアビジンである、態様16に記載の固体支持体。
18. ビーズである、態様16又は17に記載の固体支持体。
19. 該オリゴヌクレオチドが、
(a)リボヌクレオチドとしての5’末端ヌクレオチド、
(b)バーコード配列、
(c)ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び
(d)プライマー結合部位
を更に含む、態様16~18のいずれか1つに記載の固体支持体。
20. RNA配列ライブラリの調製における、態様16~19のいずれか1つに記載の固体支持体の使用。
21. RNA配列ライブラリを調製するマルチプレックス法における、態様16~19のいずれか1つに記載の固体支持体の使用。
22.
(a)RNA配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、該オリゴヌクレオチドが3’末端ヌクレオチドを含み、該3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むことと、
(b)該RNA配列をcDNA配列として逆転写することと、
(c)PCRを用いて該cDNA配列を増幅させることと、
を含むRNA配列ライブラリを調製する方法。
23. 該ヘアピンオリゴヌクレオチドが、
(i)リボヌクレオチドとしての5’末端ヌクレオチド、
(ii)バーコード配列、
(iii)ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
(iv)プライマー結合部位
を更に含む、態様22に記載の方法。
24. ライゲーション後に3’-リン酸を脱リン酸化し、逆転写後に2’,3’-ジオールを含む3’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、態様22又は態様23に記載の方法。
25. ライゲーション後かつ脱リン酸化前に、RNA配列のヌクレオチドにおけるワトソン-クリック面のメチル化を脱メチル化することを更に含む、態様24に記載の方法。
26. 逆転写後にRNA配列を消化し、増幅前に第2のプライマー結合部位を付加するために第2のライゲーションを行うことを更に含む、態様22~25のいずれか1つに記載の方法。
27. ライゲーション後に該コンストラクトを固体支持体に固定化することを更に含む、態様22又は態様23に記載の方法。
28. 固定化後に3’-リン酸を脱リン酸化し、逆転写後に2’,3’-ジオールを含む3’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、態様27に記載の方法。
29. 固定化後かつ脱リン酸化前に、RNA配列のヌクレオチドにおけるワトソン-クリック面のメチル化を脱メチル化することを更に含む、態様28に記載の方法。
30. 逆転写後にRNA配列を消化し、増幅前に第2のプライマー結合部位を付加するために第2のライゲーションを行うことを更に含む、態様27~29のいずれか1つに記載の方法。
31. 該RNA配列が、全RNA、低分子RNA、tRNA、マイクロRNA、piRNA、又はそれらの任意の組み合わせを含む、態様22~30のいずれか1つに記載の方法。
32. マルチプレックス法を含む、態様22~31のいずれか1つに記載の方法。
なお、上記は態様の単なる例であるものとする。他の例示的な態様は、本明細書における記載の全体から明らかになる。また、これらの態様の各々を本明細書で提供される他の態様と様々に組み合わせて用いることができることも、当業者であれば理解するであろう。
以下の実施例は、本発明を更に説明するが、無論、いかなる方法でもその範囲を限定すると解釈されるべきではない。
実施例1
方法
本発明の態様に従って、RNA-seqライブラリ調製において以下の方法を使用した。
RNAの調製
tRNAの脱アシル化
まず100mM TrisHCl、pH9.0の溶液中において37℃で30分間脱アシル化し、次いで、最終濃度180mMの酢酸ナトリウム、pH4.8を添加することにより中和することによって、ライブラリ構築のために全RNAを調製した。次いで、脱アシル化されたRNAをエタノール沈殿し、水に再懸濁させるか又はZymo Oligo Clean-and-Concentrator(商標)スピンカラムを使用して脱塩した。
tRNA荷電のためのワンポット脱アシル化及びβ脱離
ライブラリを構築する前に任意でワンポットβ脱離するために、7μL中最大500ngの全RNAを使用した。まず、7μLのインプットRNAに1μLの90mM酢酸ナトリウムバッファ、pH4.8を添加した。次に、1μLの新たに調製した150mM過ヨウ素酸ナトリウム溶液を添加し、混合した;反応条件は、16mM NaIO、10mM NaOAc、pH4.8であった。室温で30分間、過ヨウ素酸塩酸化を進行させた。最終60mMの0.6Mリボース1μLを添加して酸化をクエンチし、5分間インキュベートした。次に、最終濃度が33mMになるように、新たに調製した100mM四ホウ酸ナトリウム、pH9.5を5μL添加した。この反応物を45℃で30分間インキュベートした。β脱離及び3’末端修復を停止させるために、5μLのT4 PNKミックス(200mM TrisHCl pH6.8、40mM MgCl、New England Biolabs(NEB)製の4U/μL T4 PNK)を反応に添加し、37℃で20分間インキュベーションした。次いで、65℃で10分間インキュベートすることによってT4 PNKを熱失活させた。合計20μLのこの反応混合物は、以下に記載するライゲーションマスターミックスを30μL添加することにより、第1のバーコードライゲーションでそのまま使用することができる。
RNA-seqの一般的なプロトコル
第1のバーコードライゲーション
インプット材料は、脱アシル化されていたか、又は上記のようにβ脱離及び末端修復を受けていた。最大1μgの全RNAインプットを、以下の成分と共に50μLのライゲーション反応で使用した:1U/μL T4 RNAリガーゼI(NEB)、1×NEB T4 RNAリガーゼIバッファ、15% PEG 8000、50μM ATP、1mMヘキサアミンコバルト塩化物、及び5% DMSO。ライゲーションミックスをサンプルに添加した後、ヘアピンを最終濃度1μMとなるように添加し、16℃で一晩(12+時間)サンプルをインキュベートした。
ダイナビーズへの結合
溶液の粘度を下げるために、等体積の水を添加することによって、ライゲーション混合物を希釈した。次に、ストレプトアビジンでコーティングしたDynabeads(商標)MyOne(商標)C1(ThermoFisher)を、ヘアピンオリゴ対して1.2:1過剰になるように各サンプルに添加した(例えば、50μLの反応は50pmolのヘアピンオリゴを有しており;ビーズは10mg/mLで供給され、1mgあたり500pmolのビオチン化オリゴの結合能を有していたので、12μLのスラリーを添加した)。ビーズサンプル混合物を室温で15分インキュベートした。結合後、上清を除去し、ビーズを高塩洗浄バッファ(1M NaCl、20mM TrisHCl、pH7.4)で1回、低塩洗浄バッファ(100mM NaCl、20mM TrisHCl、pH7.4)で1回洗浄した。
洗浄後、下流の工程のために、複数の個別にバーコードが付けられたサンプルを組み合わせてもよい。この段階で、AlkB脱メチル化酵素反応又はCMC処理等の酵素的又は化学的処理をライブラリ調製プロトコルに組み込んでもよい(下記の方法を参照)。
脱リン酸化
以下を含有する50μLの脱リン酸化ミックスを、オンビーズのマルチプレックス化サンプルに添加した:0.04U/μL子ウシ腸ホスファターゼ(Roche)、10mM MgCl、0.5mM ZnCl、20mM HEPES、pH7.3。サンプルを、37℃で30分間インキュベートした。次いで、サンプルを高塩洗浄バッファで1回、低塩洗浄バッファで1回洗浄し、次いで、20μLの水に再懸濁させた。
逆転写
5μLのSuperScript(商標)IV VILO 5×マスターミックス(ThermoFisher)を、脱リン酸化されたサンプルに最終体積が25μLになるように添加し、次いで、55℃で10分間インキュベートした。次いで、サンプルを高塩洗浄バッファで1回、低塩洗浄バッファで1回洗浄した。
RNaseH消化
0.4U/uL RNaseH(NEB)及び1×NEB RNaseHバッファを含有するRNaseHマスターミックス50μLにビーズを再懸濁させ、37℃で15分間インキュベートした。次いで、サンプルを高塩洗浄バッファで1回、低塩洗浄バッファで1回洗浄した。次いで、サンプルを40μLの水に再懸濁させた。
過ヨウ素酸塩酸化
新たに調製した0.5M酢酸ナトリウム、pH5中10μLの250mM過ヨウ素酸ナトリウムの5×溶液を、RNaseHで消化したサンプルに添加し、室温で30分間インキュベートした。その後、最終濃度167mMになるようにリボースを添加し、室温で5分間過剰の過ヨウ素酸塩をクエンチした。次いで、サンプルを高塩洗浄バッファで1回、低塩洗浄バッファで1回洗浄した。
第2のライゲーション
ビーズを以下の成分と共に50μLのライゲーションマスターミックスに再懸濁させた:2U/μL T4 RNAリガーゼI(NEB)、1×NEB T4 RNAリガーゼIバッファ、2μM第2のライゲーションオリゴ、25% PEG 8000、50μM ATP、7.5% DMSO、及び1mMヘキサアミンコバルト塩化物。反応物を室温で一晩(12時間以上)インキュベートした。次いで、粘度を下げるために反応を1体積の水で希釈し、高塩洗浄バッファで1回、低塩洗浄バッファで1回洗浄し、次いで、ビーズを約10~20mg/mLで水に再懸濁させた(最初のライゲーション反応あたり6~12μL)。サンプルは4℃で保存してもよく、-20℃で凍結させてもよく、凍結はビーズに損傷を与える場合があるが、次のPCR工程に使用することは可能である。
PCR
Q5 DNAポリメラーゼ(NEB)を使用し、製造者の指示に従って、第2のライゲーション反応からのビーズスラリー生成物のうちの5~10%を用いて、50μLのPCR反応を行った:0.02U/μL Q5 DNAポリメラーゼ、1×Q5反応バッファ、0.2mM dNTP、0.5μM Illuminaインデックスプライマー、及び0.5μM Illuminaマルチプレックスプライマー。典型的なPCRサイクルは、98℃で10秒間、55℃で15秒間、及び72℃で20秒間を9サイクル、12サイクル、及び15サイクルであり、次いで、最適な条件を選択した。次いで、PCR反応物をDNA Clean and Concentrateキット(Zymo)によって処理した。
TBE-PAGEゲル抽出
脱塩後、PCR産物をdsDNAサイズマーカーと共に10%非変性TBEゲルに流した。所望の産物サイズに応じてレーンをカットし、ピペットチップで潰した後、crush-and-soakバッファ(500mM酢酸ナトリウム、pH5.0)に再懸濁させた。ゲル断片を一晩抽出し、次いで、エタノール沈殿させた。
オリゴヌクレオチド配列
本明細書に記載の実験に使用したオリゴヌクレオチド配列は、以下の表にみられる。
表1~3は、本発明に係る例示的なヘアピンオリゴヌクレオチドを提供する。配列には、Integrated DNA Technology,Inc.(IDT)からの発注に適合するフォーマットでアノテーションが付けられている。例えば、「/5Phos/」は、5’-リン酸を示す。各表の最終行に列挙されている短いオリゴヌクレオチド配列(L2)は、RNA-seq法の第2のライゲーション工程で、表の前の方に列挙されているヘアピンオリゴヌクレオチド配列と一緒に使用されるオリゴヌクレオチドである。各L2のUMIは「N」残基によって表され;UMIは、サンプルの複雑さを最大化するためにhexN(6ヌクレオチド長)である。RNA-seqにおける特定のオリゴヌクレオチドの使用から得られた本明細書に示されるデータは、図番号によって識別される。
オリゴヌクレオチドは、ペアエンド又はシングルエンドのDNAシーケンシング・バイ・シンセシス法で使用できるように設計される。ペアエンドシーケンシングでは、DNA断片の両端からシーケンシングが行われる。最初のプライマーがアニーリングし、成長している鎖に後続の塩基が付加されるごとに決定される。これが、フォワード鎖の「リード1」シーケンシングである。次に、UMI配列を含有する別のプライマーがアニーリングし、インデックスを測定する「インデキシングリード(indexing read)」において伸長する。最後に、第3のプライマーがアニーリングし、伸長し、リバース鎖を「リード2」としてシーケンシングする。対照的に、シングルエンドシーケンスでは、リード1及びインデキシングリードのみが行われる。様々なDNAシーケンシング機器及びプラットフォームが市販されている。DNAシーケンシングを実施するための好ましいシステムは、Illumina,Inc.の次世代シーケンシング(NGS)システムである。
2種類のヘアピンオリゴヌクレオチドが設計されており、一方は、バーコードが「リード1」シーケンシングの最初に読まれ、他方は、バーコードが「リード2」シーケンシングの最初に読まれる。一般に、バーコードが「リード2」の先頭である設計が好ましいが、その理由は、ランの開始時における「複雑さ」又は測定される配列の多様性を最大化するためである。リード1のシーケンシングのために設計されたヘアピンオリゴヌクレオチドの配列は、/5Phos/rA CT XXXX GAT CGT CGG ACT GTA GAA CAT /iBiodT/AG AGT TCT ACA GTC CGA CGA TC ZZZZ AG rU/3Phos/(配列番号19)(式中、「X」は、バーコード配列であり(これは少なくとも3ヌクレオチド長であり;本明細書には4ヌクレオチドのバーコードを示す)、「Z」は、「X」バーコードヌクレオチドの逆相補鎖である配列である)である。リード2シーケンシングのために設計されたヘアピンオリゴヌクレオチドの配列は、/5Phos/rA CT XXXX AGA TCG GAA GAG CAC ACG AT/iBiodT/AGA CGT GTG CTC TTC CGA TCT ZZZZ AG rU/3Phos/(配列番号15)(式中、「X」は、バーコード配列であり(これは少なくとも3ヌクレオチド長であり;本明細書には4ヌクレオチドのバーコードを示す)、「Z」は、「X」バーコードヌクレオチドの逆相補鎖である配列である)である。インデキシングリードに使用した対応するL2オリゴヌクレオチドを表1~3の最後の行に示す。バーコードの配列は依然として測定されるので、「リード1」設計は、ペアエンド又はシングルエンドのシーケンシングのいずれにも適合する。この形態では、複雑さに関して特別な注意を払うことができ、これは、複数のバーコードを使用するか又はIlluminaが推奨するスパイクインコントロール(例えば、Phi-XコントロールDNA)を使用することによって支援することができる。
同じ長さの任意の2つの配列を比較する場合、ハミング距離は、対応する記号が異なる配列位置の数である。バーコードのハミング距離は、バーコードを読み取っている間にシーケンサーでエラーが発生した場合、1つのエラーを識別することができ、正しいバーコードを割り当てることができるように選択される。例えば、ハミング距離が1である場合、1つのエラーで1つのバーコードが別のバーコードに変わってしまい、エラーが決して検出されないことになる。ハミング距離が2である場合、1つのエラーを検出することはできるが、誤ったリードが2つのバーコードから同様に発生する可能性があるので、エラーを容易に補正することはできない。ハミング距離が3である場合、1つのエラーを検出し、補正することができる。ハミング距離が3を超えると、複数のエラーを検出することが可能になるが、シーケンサーのエラーは稀であり、二重エラーは二重に稀であるため、無視できる程度であると予測される。小さなバーコード、例えば3ヌクレオチドの場合、わずか4つの異なるバーコードのみでハミング距離3を維持することが可能である。従って、3ヌクレオチド設計(表2)では、少なくとも2のハミング距離が使用されるので、12種のバーコードが存在し得る。
表5は、RNA-seqプロセスの最後のPCR工程で使用されるオリゴヌクレオチド配列を提供する。これらオリゴヌクレオチドは、Illumina TruSeq(商標)Small RNA Indexプライマーを約5塩基超えて伸長する。プライマーは、Illuminaシーケンスプラットフォームに適合するライブラリを作成するために使用される。
32P標識
5’末端標識:5’-リン酸化オリゴヌクレオチド(最終濃度1.25μM)の溶液に32P T4 PNKミックス(最終濃度1U/μL T4 PNK、30mM イミダゾール-HClバッファ、2.5μM[15μCi/μL]γ-32P ATP、1mM ADP)を添加することによって、放射性標識反応を行った。サンプルを37℃で30分間インキュベートし;次いで、65℃で10分間インキュベートすることによって、T4 PNKを熱失活させた。
dTTPの取り込み:1×SuperScript(商標)IV VILOミックス中のサンプル5μLを除去し、これに10μCi/μL α-32P dTTPを1μL添加したことを除いて、RNA-seqの章に記載した通り逆転写を実施した。インキュベーション後、ゲル電気泳動によって分析する前に、サンプルを18mg/mLプロテイナーゼK(Roche)2μLで処理した。
結果に記載されるRNA-seqライブラリの用途のうちの1つ以上において、以下の方法を使用した。
大腸菌の成長、ストレス、RNA抽出
大腸菌MG1655細胞をA600が0.4になるまでLB中で成長させた後、ストレス条件に供した。モック処理した細胞25mLを10分間放置して成長させた。過酸化水素ストレスは、最終濃度が0.5%になるように25mLの細胞に10分間Hを添加することによって誘導した。グルコースリン酸ストレスは、最終濃度が1mMになるように25mLの細胞に10分間α-メチルグルコシド-6-ホスフェート(αMG)を添加することによって誘導した。鉄飢餓ストレスは、最終濃度が250μMになるように25mLの細胞に10分間2,2’-ジピリジル(DIP)を添加することによって誘導した。25mLの培養液を12000rcfで1分間遠心分離し、培地をデカントすることによって細胞を収集した。細胞を0.5mLの氷冷溶解バッファ(150mM KCl、2mM EDTA、20mM HEPES pH7.5)に再懸濁させ、次いで、液体窒素中で急速冷凍した。熱酸フェノールプロトコルによってRNAを抽出した。簡潔に説明すると、0.5mLの酸バッファフェノール(pH4.5クエン酸塩)を凍結サンプルに添加した。50℃で30分間振盪しながらヒートブロックでサンプルをインキュベートした。もう1ラウンドのフェノール抽出及び2ラウンドのクロロホルム抽出のために水相を抽出した後、最終的にグリコブルー、300mM酢酸ナトリウム、及び3体積のエタノールで沈殿させた。サンプルを-80℃で1時間インキュベートし、次いで、最高速度(20k RCF)で45分間遠心分離してRNAをペレット化した。ペレットを70%エタノールで2回洗浄し、次いで、水に再懸濁させた。
HEK細胞の培養及びRNA抽出
標準的な条件下において完全DMEM培地でHEK293T細胞を培養した。簡潔に説明すると、10%FBS及び1%Pen-Strep(ペニシリン-ストレプトマイシン)を含むHyclone(商標)DMEM培地(GE Healthcare Life Sciences、SH30022.01)中で80%コンフルエントになるまでHEK293T細胞を成長させ、継代した。細胞が80~90%コンフルエントに達した時点で細胞を回収し、TRIzol(商標)(ThermoFisher、15596026)を用いて製造者のプロトコルに従って全RNAを抽出した。
MCF7の成長及びRNA抽出
10%FBS(ThermoFisher、10082147)、0.01mg/mLウシインスリン(Sigma-Aldrich、I0516)、及び10nMβ-エストラジオール(Sigma-Aldrich、E2758)を含むEMEM培地(ATCC、30-2003)で80%コンフルエントになるまでMCF7細胞を培養し、1:3の比で継代した。TRIzol(商標)を用いて全RNAを抽出した。
便及び口腔サンプルの回収並びにRNA抽出
口腔:女性1名及び男性3名のボランティアから、2日間連続で舌の背側の擦過物を採取した(ボランティア1名につき2サンプル)[A及びBサンプル]。サンプル採取にはBreathRx Gentle Tongue Scraper(Philips Sonicare)を使用し、飲食又は口腔衛生を実施する前に行った。舌のできる限り奥の方から出発して、スクレーパーを3回連続で前方に向かって表面全体を通過させた。擦過物を500μLのRNAlater(商標)Stabilization溶液(Invitrogen)と合わせ、抽出まで-80℃で保存した。
消化管:便検体は、女性1名及び男性1名のボランティアによって自己採取された。ボランティアには、市販の「トイレハット型」便検体採取キット(Fisherbrand Commode Specimen Collection System;Thermo Fisher Scientific)が提供された。検体は直ちに検査室に運ばれ(<1時間)、十分にホモジナイズされた。滅菌スパチュラを用いて100mgの便をクライオバイアルに移し、次いで、700μLのRNAlater Stabilization溶液を添加した。抽出まで、検体を-80℃で保存した。
全RNA抽出:その後、4℃で10分間、17,200rcfで遠心分離することによって舌の背側及び便のサンプルからRNAを除去した。ペレット化した材料を、等体積の酢酸飽和フェノールクロロホルムpH4.8を含む400μLの0.3M NaOAc/HOAc、10mM EDTA、pH4.8中で溶解させた。1:1の比(ビーズ:サンプルの重量)で1.0mmガラス溶解ビーズ(Bio-Spec Products(Bartlesville,OK))を添加した後、最大強度の往復ビーズビーター(Mini-Beadbeater-16、Bio-Spec Products)にサンプルを1分間隔で2回入れた。サンプルを、4℃で15分間、17,200rcfで遠心分離した後、全RNAの再抽出及びイソプロパノール沈殿を行った。ペレットを75%エタノールで洗浄した後、酸緩衝溶出バッファ(10mM NaOAc、1mM EDTA、pH4.8)に再懸濁させた。
AlkB及びAlkB D135Sの精製
これらプロトコルは、既述のDM-tRNA-seqのプロトコル(Zheng et al.,Nature Methods 12,835,2015)を応用した。簡潔に説明すると、NEB T7 Expression細胞を、37℃、50μMカナマイシンの存在下でA600が0.6~0.8になるまでLB培地で成長させた。細胞が所望の密度に達したら、IPTG及び硫酸鉄をそれぞれ最終濃度が1mM及び5μMになるように添加した。誘導後、細胞を30℃で一晩インキュベートした。細胞を回収し、ペレット化し、次いで、溶解バッファ(10mM Tris、pH7.4、5%グリセロール、2mM CaCl、10mM MgCl、10mM 2-メルカプトエタノール)+300mM NaClに再懸濁させた。超音波処理によって細胞を溶解させ、次いで、17,400×gで20分間遠心分離した。可溶性タンパク質を、まずNi-NTAスーパーフローカートリッジ(Qiagen)を用いて、バッファA(溶解バッファ+洗浄用1M NaCl)及びB(溶解バッファ+溶出用1M NaCl及び500mMイミダゾール)で精製し、次いで、バッファA(溶解バッファ+カラムロード用100mM NaCl)及びB(溶解バッファ+溶出用1.5M NaCl)でイオン交換(Mono S GL、GE Healthcare)することによって更に精製した。
ポリ(A)選択
製造者の指示に従って、NEBNext(登録商標)Poly(A)mRNA Magnetic Isoloation Module(カタログ番号:E7490S)を用いて、HEK mRNAシーケンシングのためのポリ(A)選択を行った。
AlkB処理条件
脱メチル化酵素バッファ条件は、公開されているもの(Li et al.,Nat Struct Mol Biol 25,1047,doi:10.1038/s41594-018-0142-5,2018)から改変した。反応直前に3種の原液を新たに作製した:200mM L-アスコルビン酸、3mM 2-ケトグルテラート、及び5mM硫酸アンモニウム鉄。最終反応バッファは、2mM L-アスコルビン酸、1mM 2-ケトグルテラート、0.3mM硫酸アンモニウム鉄、100mM KCl、50mM MES pH6、50ng/μL BSA、4μM野生型AlkB、及び4μM AlkB-D135Sを含有していた。ライゲーション、固定化、及び洗浄後にデカントしたストレプトアビジンビーズスラリー5~20μLに反応混合物50μLを添加した。37℃で30分間反応を継続した。反応後、ビーズを高塩洗浄バッファ(20mM TrisHCl pH7.4、1M NaCl、0.1%Tween20)で1回、低塩洗浄バッファ(20mM TrisHCl pH7.4、100mM NaCl)で1回洗浄した。
CMC処理/ライブラリの構築
MCF7全RNAシーケンシングライブラリを以下の通り構築した。まず、スピンカラム(Zymo RNA Clean & Concentrator(商標)-5、R1016)を用いて1μg MCF7全RNAから低分子RNA(<200nt)を除去し、微量遠心管において18μLの滅菌HOで高分子RNA(>200nt)を溶出した。RNAをPCRチューブに移し、2μLのMagnesium RNA断片化バッファ(NEB、E6150S)を各チューブに添加し、チューブをサーモサイクラーにおいて94℃で5分間インキュベートしてRNAを約200ntに断片化した。次いで、2μLのRNA断片化停止溶液を各チューブに添加した。サンプルをH2Oで50μLに希釈し、断片化したRNAをZymoスピンカラムを用いて精製し;マイクロ遠心管において16μLの滅菌HOでRNAを溶出した。RNA断片の3’末端修復のため、10×T4 PNKバッファ2μL及び10U/μL T4 PNK(ThermoFisher、EK0032)2μLを添加し、混合物を37℃で30分間インキュベートした。断片化され、末端修復されたRNAを使用して、以下を改変した上記のRNA-seqプロトコルを用いてシーケンシングライブラリを構築した。断片化したRNAをバーコード付きヘアピンオリゴヌクレオチドにライゲーションし、ストレプトアビジンビーズに結合させた。次いで、サンプルをプールし、混合し、±CMC(N-シクロヘキシル-N’-(2-モルホリノエチル)カルボジイミド)処理用に2つに分割した(+CMC:-CMC=1.5:1比)。まず12μLの滅菌H2O及び24μLのTEUバッファ(50mM Tris-HCl(pH8.3)、4mM EDTA、7M尿素)を各チューブに添加し、次いで、新たに調製したTEUバッファ中1M CMC4μLを+CMCサンプルに添加し、滅菌HO4μLを-CMCサンプルに添加した。Eppendorf Thermo Mixerにおいて、30℃で16時間、1400rpm(毎分回転数)でサンプルをインキュベートした。サンプルを高塩バッファで2回、低塩バッファで1回洗浄した。次いで、40μLの50mM炭酸ナトリウム及び2mM EDTA(pH10.4)バッファでサンプルを再懸濁させ、37℃で6時間、1400rpmでインキュベートした。ビーズを高塩バッファで2回、低塩バッファで1回洗浄し、次いで、ホスファターゼ処理及び逆転写等のRNA-seq工程に進めた。
tRNAマイクロアレイ
tRNAマイクロアレイは、cDNA合成を必要としない精製tRNA又は全RNA から出発する4つのプロセスからなる:(i)脱アシル化、(ii)全tRNAの3’-CCAへのT4 DNAリガーゼによるオリゴヌクレオチドのライゲーションを用いたtRNAの選択的フルオロフォア標識、(iii)ハイブリダイゼーション、及び(iv)データ解析。大腸菌及びヒトtRNAマイクロアレイ法の再現性及び結果の検証については、これまでに広く述べられている(Dittmar et al.,EMBO Rep 6,151,2005;Pavon-Eternod et al.,Nucleic Acids Res 37,7268,doi:gkp787[pii]10.1093/nar/gkp787,2009)。
リード処理及びマッピング
Illumina Hi-Seq又はNEXT-seqプラットフォームでライブラリをシーケンシングした。JGI BBtoolsツールセットのbbmergeでペアエンドリードを組み合わせた。サンプルバーコードがリードの開始点に配置されるようにリードをマージした:リード2バーコードを用いて構築されたライブラリでは、bbmergeインプットのためにリード1及びリード2の順序を反対にした。次に、fastXツールキットバーコードスプリッタを用いて、マージされたリードを各インデックスにつき1ファイルずつバーコードによって分割した。カスタムpythonスクリプト(GitHubで入手可能)を使用して、バーコード配列(最初の7nt)を除去し、UMIを使用してリードを崩壊させ、次いで、UMI(最後の6塩基)を除去した。次のリードを、bowtie2を使用して「local」パラメータでマッピングした。ヒトのサンプルは、40を超えるスコアを有し、必要に応じて「CCA」末端を付加して増強されたtRNA-scan SEから予測された成熟tRNAの精選リスト、又はアンサンブルHG19 orf、ncRNA、及び精選tRNAを組み合わせたゲノムのいずれかにマッピングした。大腸菌サンプルは、>40のスコアを有し、必要に応じてCCAが付加されたtRNA-scan SEからの非冗長tRNAの精選リスト、又はアンサンブルORF及びtRNA遺伝子を含むアンサンブルncRNAを含む複合大腸菌ゲノムのいずれかにマッピングした。Bowtie2アウトプットsamファイルをbamファイルに変換し、次いで、samtoolsでソートした。次に、IGVを使用して、リードを1ntのウィンドウに崩壊させた。カスタムPythonスクリプト(GitHubで入手可能)を使用して、IGV output.wigファイルを再フォーマットした。また、pachter labのeXpressでbowtie2アウトプットSamファイルを使用して、各遺伝子にマッピングされた全てのリードを合計した。カスタムRスクリプト(GitHub)を用いてデータを可視化した。
リードカウント及びマッピングレートを表6に提供する。
CMC反応からのリード処理
Illumina Hi-Seq platformから生の100bpペアエンドシーケンシングリードを入手した。カスタムpythonスクリプトを使用して、ペアになったリード2のリードにバーコード配列でバーコードを付けることによって、リード1のリードを分離した。fastx_barcode_splitter(fastx_toolkit、http://hannonlab.cshl.edu/fastx_toolkit/)を用いてバーコードを付けることによって、リード2のリードを分離した。リード1のリードについては、リードの先頭のランダムな6ヌクレオチドの固有の分子識別子(UMI)配列及びリードの末尾のバーコード付きアダプター配列を、15ntカットオフのシングルエンドモードを用いてTrimomaticを使用して除去した。リード2のリードについては、リードの先頭の7ntのバーコード配列並びにリードの末尾のUMI及びアダプター配列を、15ntカットオフのペアエンドモードを用いてTrimomaticによって除去した。次いで、bowtie2を用いてリードをヒトrRNA転写物にマッピングした。アウトプットsamファイルをbamファイルに変換し、次いで、samtoolsを用いてソートし、インデックスを付けた。コマンドラインバージョンの「igvtools count」(IGV、http://software.broadinstitute. org/software/igv/download)を用いて、1塩基の分解能でヌクレオチドの組成、挿入、及び欠失をカウントした。「Bedtools genomecov」(bedtools、https://bedtools.readthedocs.io/en/latest/)を使用して、各位置における全リードの先頭及び末尾をカウントした。全てのアウトプットファイル及び参照配列を各サンプルにつき1つのファイルにまとめ、カスタムpythonスクリプトによって変異率及び停止率を計算した。アウトプットファイルを解析して、標的シュードウリジン部位を同定した。
マイクロバイオームtRNA解析
これらは、既刊のパイプラインに大幅な変更を加えたものであった。75又は100ヌクレオチドの生のペアエンド配列リードをIllumina-utils(https://github.com/merenlab/illumina-utilsで入手可能)によって処理した。インサートには、7ヌクレオチドのサンプルバーコード及びランダムな6ヌクレオチドの固有の分子識別子(UMI)が含まれていた。tRNA分子が74~96ヌクレオチド長の範囲であることに鑑みて、フォワード及びリバースの100ヌクレオチドリードは、一部のtRNA配列を完全にカバーしており、他の配列では部分的に重複していた。Illumina-utilsの「iu-merge-pairs」コマンドをアップグレードして、完全に重複するリード及び部分的に重複するリードの両方をマージしたが、完全な重複を超える場合は、突出しているアダプター配列をトリミングした(flag、「--marker-gene-stringent」は、部分的な重複に加えて完全な重複を検討することを可能にする)。重複領域におけるミスマッチがゼロである一致するリードを保持することによって、修飾によって誘導される変異の解析に重要な誤った塩基コールを最小化した(オプション「-max-num-mismatches0」)。
以下の多くの工程を自動化するためのSnakemakeワークフローを含む、リードからtRNA配列を同定するためのツールをAnvi’oマルチオミクスプラットフォームにおいて開発した(https://github.com/merenlab/anvioで入手可能)。コマンド「anvi-gen-tRNAseq-database」によって、ダイナミックプログラミングアルゴリズム(モジュール「trnaidentifier」)を実行して、リードにおけるtRNAの特徴をプロファイリングし、それによって、成熟及び断片的なtRNAをプレtRNA等の他の関連種と共に選択する。この方法における全てのリードは3’-CCAから始まるので、アクセプターヌクレオチド及びTアームにおける保存ヌクレオチドまでの正確な長さを含む、tRNA選択のための一連の最低基準を定義した(7つのうちの5つがみつけられるはずである)。アルゴリズムは、リードの5’末端に向かってアンチコドンループを含む特徴を検索し続け、完全長リードは、塩基が対合しているアクセプターステム及び中間に全ての特徴を含有する。このアルゴリズムは、可変(V)ループ等の可変長であり得る特徴に遭遇したときに、各可能な配列を検索し、標準的には保存されている位置における「保存されていない」ヌクレオチド及びステムにおける塩基対のミスマッチの最小和を有する特徴プロファイルを返す。
Ensembl Genomes 2016データベースに保存されている4,235個の金標準細菌ゲノム(アセンブリレベルが「染色体」である非内部共生体ゲノム)からtRNAscan-SE(v1.3.1)によって同定された参照tRNA配列のセットを検索するためにGASTツールを用いることによって、tRNA配列に分類学的にアノテーションを付けた。
修飾解析のために、tRNA配列から特定のヌクレオチド位置を選択した。Anvi’oによってプロファイリングされた特徴に関して位置を同定した。例えば、多くのtRNA種でm1A修飾の部位である標準位置22は、アンチコドンステムの5’-ヌクレオチドである標準位置27から5ヌクレオチド離れていると同定されている。Anvi’oワークフローによって、各分類群における対象となる位置のヌクレオチドの分布を解析し、tRNA種をアンチコドンによってグループ化した。脱メチル化及び未処理の両サンプル分割物において少なくとも50リードで表されるtRNA種を選択した。未処理の分割物からのリードの少なくとも5%における3つの異なるヌクレオチドを含むtRNA種のみを考慮することによって、一塩基多型を有する関連tRNA配列等のヌクレオチドバリアントの他のソースから、修飾によって引き起こされた可能性がある変異を分離した。脱メチル化された分割物における変異シグネチャーの有意な減少により、推定上の修飾が確認された(χp値<0.001、脱メチル化実験における4ヌクレオチドの実測数を、未処理実験からの分布に鑑みた4ヌクレオチドの予測数と比較するχ検定による)。
結果
RNA-seqプロセス
図2C~F及び図3A~Gは、RNA-seqプラットフォームの様々な態様について調べるために実施した実験及びRNA-seqライブラリの調製におけるプラットフォームの使用の結果を表す。実験のインプット材料は、特に断りのない限り、HEK293T細胞からの全RNAであった。図は、反応生成物を分析した電気泳動ゲルの画像を示す。DNAサイズマーカーを左側に示す。ヒトtRNAにおけるm1A58及びm1G37の修飾によって引き起こされる主なRT(逆転写酵素)の停止を右側に示す。TdTは、RTの異常な末端転移酵素活性に由来する生成物に対応する。
T4 RNAリガーゼIによるライゲーションは、CHOの二重鎖構造に適合し、3’-A又は3’-Cの末端を有するRNA基質間で偏りがないことを示し(図3A)、これは、後述の荷電tRNAの測定に必要な特性である。
一部はインプットRNAがライゲーションされており、その他はされていない全てのCHOをストレプトアビジンビーズに結合させた後、任意で酵素処理するために、サンプルを2つに分割してもよい。この場合、一方のサンプルをAlkB脱メチル化酵素混合物に曝露してtRNAのワトソン-クリック面のメチル化を除去し、他方を対照として未処理のままにした。それぞれtRNAサンプル中のm1A58及びm1G37のバンドの除去及び減少によって示される通り、オンビーズ酵素反応は高度に効率的であった(図2C)。
ビーズへの固定化によって、耐熱性Superscript(商標)IV RTを用いた逆転写は阻害されなかった(図3B)。cDNA産物にオンビーズで第2のアダプターをライゲーションした後、PCRをそのままオンビーズで行って、シーケンシングの準備が整ったオフビーズ産物を作製した(図3C)。後に3’-OHから逆転写することを可能にするため、アルカリホスファターゼを用いてオンビーズで3’-リン酸を除去した(図3D)。図3Eに示す通り、過ヨウ素酸塩処理により、3’末端にリボースを有するCHOへのライゲーションは阻止されるが、3’末端にデオキシリボースを有する同じオリゴヌクレオチドには影響がないことが確認された。
第1のバーコードライゲーション反応以外は全てオンビーズで実施した。これにより、簡単な洗浄で全ての工程において過剰の試薬を除去することが容易になり、各工程でのサンプル喪失が大幅に減少し、わずか10ngの全RNAインプットでRNA-seqライブラリを構築することが可能になった(図2D)。
また、このRNA-seqプロトコルによって、ヒトの便(図2E)又はヒトの舌(図2F)等の複雑なサンプルから単離された全核酸から高品質のRNA-seqライブラリが作製された。これらサンプル中に存在するかなりの量のDNAは、DNase処理の追加の有無にかかわらず、ライブラリの構築には干渉しなかった(図2E)。便サンプルS1は、第1のライゲーション工程の前にまずDNaseIで処理したが、S1及びS2は、DNase処理を行っていない同じサンプルを使用した。サンプル(+)過ヨウ素酸塩は、第1のライゲーション工程の前に過ヨウ素酸塩酸化を行い、これによってRNA-CHOのライゲーションが阻止された。HEK293Tライブラリではみられたm1A58バンドが便サンプルライブラリにはほとんど存在しないことから、ヒトtRNAはマイクロバイオームシーケンシングライブラリ中に少量しか存在しないことが示唆された。
tRNA荷電試験の設計目標として、図3Fに概略的に示した通り、反応中間体が沈殿せず、精製もされないように、1本のチューブでこれら試薬を逐次添加できるように酸化及びβ脱離のプロトコルを改変した。最終的な混合物を、CHOライゲーションにおいてそのまま使用した。図3Gは、図3Fに示した処理の有り(+,+)無し(-,-)両方での最終PCR産物を示す。
全大腸菌RNA
大腸菌の全RNAの研究におけるRNA-seqの使用を本明細書に示す。当初はtRNAを想定して設計されたが、RNA-seqシステムは、原理上他の種類のRNAを検出することもできる。大腸菌の全RNAからライブラリを構築した。シーケンシングのために、15~150ヌクレオチドのcDNAインサートについて最終PCR産物をサイズ選択した。
図4及び5は、大腸菌の全RNAのシーケンシングからの幾つかの解析結果を表す。
図4Aでは、RNA-seqの結果を大腸菌ゲノムにマッピングした。予想通り、リードの大部分は成熟tRNAにアラインされたが(92%)、残りのリードはrRNA、非コードRNA(ncRNA)、及びmRNAにアラインされた。リードのごく一部が非コードRNAにマッピングされる。ストレスの非存在下では、ncRNAのリードは、十分に特性評価されているffs(SRP RNA)、ssrS(6S RNA)、及びrnpB(RNase P RNA)を含む幾つかの豊富なRNA種に大部分が分配された(図4A)。リードの比率は、各カテゴリーにおける細胞RNA転写物のモル比をほぼ反映しており、tRNAがモルベースで80~90%を構成する。ストレスの非存在下では、ncRNAのリードは、十分に特性評価されているffs(SRP RNA)、ssrS(6S RNA)、及びrnpB(RNase P RNA)を含む幾つかの豊富なRNA種に大部分が分配された(図4A)。転写物のカバレッジに大きな差があることに鑑みて、生物学的複製からの存在量は、tRNA(r2>0.95)、rRNA(r2>0.85)、及びncRNA(r2>0.75)についてはよく相関していたが、mRNAでは低かった(図4C)。tRNAArg及びtRNALeuのイソ受容体ファミリーについてマイクロアレイハイブリダイゼーションによって得られたデータと比較することにより、シーケンシングで得られたtRNA存在量の測定値の定量性を検証した(図4B;各対の左側の薄い色のドットがマイクロアレイデータ、各対の右側の濃い色のドットがRNA-secのデータである)。
tRNAは細菌において高度に修飾されているため、ヒトtRNAにおけるN1-メチルアデノシン(m1A)、N1-メチルグアノシン(m1G)、及びN3-メチルシトシン(m3C)のワトソン-クリック面のメチル化を効率的に除去するAlkB脱メチル化酵素混合物でRNAサンプルをオンビーズ処理した。m1A及びm3Cは大腸菌のtRNAには存在しないので、脱メチル化酵素処理はm1G 20を含有する7つの大腸菌tRNAにしか影響しない可能性がある。予想通り、tRNAの存在量は、AlkB脱メチル化酵素の混合物による処理の有り無し両方でグローバルレベルにおいてよく相関していた(r2>0.95)が、RNAクラスrRNA、ncRNA、及びmRNAの相関は、生物学的複製と同じ範囲内であった(図4C)。mRNAの相関が低いのは、リード数が少ないことに起因する。
図4Dは、個々のtRNAに沿った変異率のヒートマップを表し、少数の変異率の高い部位が明らかになった。ワトソン-クリック面のRNA修飾は、RTの読み過ごしによりcDNAに頻繁に変異シグネチャーを残すことが確立されている。RTは修飾されたヌクレオチドで停止することもある。修飾の化学的性質及びシーケンシングに使用される特定のRTに依存して、個々の修飾部位における変異率及び停止率が広く変動する可能性がある。部位のほとんどは、イノシン(I)、2-チオシトシン(s2C)、4-チオウリジン(s4U)、N1-メチルグアノシン(m1G)、及び3-(3-アミノ-3-カルボキシプロピル)ウリジン(acp3U)等の既知の修飾に対応する。まず、脱メチル化酵素処理に対して感受性であるm1G修飾を解析した(図5C~D)。Superscript(商標)IV RTは、時にはm1Gを読み過ごすが、高い頻度で停止した。脱メチル化酵素処理によりメチル化が除去され、その結果、変異率及び停止率が大幅に低下した。従来法によって調製されたRNA-seqライブラリの解析に用いられたTGI RT(Zheng et al.,Nature Methods 12,835,2015)と比較して、SuperScript(商標)IV RTは、変異率は低いが、mGでの停止率が高い。
ワトソン-クリック面の他の大腸菌tRNA修飾としては、8位の4-チオウリジン(s4U)、32位の2-チオシトシン(s2C)、並びにアンチコドンゆらぎ34位のリジジン、37位の2-メチルチオ-N6-イソペンテニルアデノシン(ms2i6A)、及び47位の3-(3-アミノ-3-カルボキシプロピル)ウリジン(acp3U)等の嵩高い修飾が挙げられる。これら修飾は、変異率及び停止率に非常に大きな差があった(図4D及び5C)。嵩高い34及び37の修飾が最も高い停止率を有していた。acp3U及びm1Gはいずれも同等の変異率を有し、実質的な停止を伴っていた。s4U及びs2Cはいずれも全く停止することなく変異によって検出された(図4D及び5C)。s4U8については、異なるtRNA間で変異率が大きく変動しており、これは、この生物学的条件下における修飾率の差を反映している可能性がある。s2C32修飾では、はるかに高い変異レベルが観察されたが、これは、修飾レベルの高さ及びSuperscript(商標)IV RTのイディオシンクラティックな特性の両方を反映している可能性がある。好熱性グループIIのイントロン3とは異なるRTを用いた以前の研究では、s2C32は大腸菌のtRNAにおいて検出されなかった。
発現レベルが2,000倍程度ばらついている約50種の非コードRNAが大腸菌で観察された(図4E)。ストレスの非存在下では、SRP RNA(ffs)、tmRNA(ssrA)、及びRNase P RNA(rnpB)等の幾つかの保存された細菌RNA種が優勢であったが、大多数は、ストレス応答におけるその予測される役割と一致して、はるかに低いレベルで発現していた。図4Eは、rpm>1における非コードRNA転写物の存在量を表す。このデータは、脱メチル化酵素処理による効果がほんのわずかであることを示す。
この実験及び以下の実験は、tRNA及び低分子非コードRNAの同時解析を示す。tRNAのレベルが極めて高いため、低分子RNAシーケンシングは一般的にtRNAからRNAをサイズ選択することによって行われていた。全RNAで出発することによって、このアプローチでは、全てのRNA種をそれぞれのおおよそのモル比に応じて1つのライブラリに組み込む。
大腸菌のストレス応答
大腸菌を3つの急性ストレス条件に曝すことによる生体応答の研究におけるRNA-seqの用途をここに示す。Hの添加は酸化ストレスに、2,2’-ジピリジル(DIP)は鉄飢餓に、α-メチルグルコシド-6-リン酸(aMG)はグルコース飢餓に対応する。
図5A~Gは、3つの急性ストレス条件に曝した大腸菌の全RNAをシークエンシングした結果を表す。
図5Aは、10分間の3つの急性ストレス条件の有り無し両方での、LBで成長させた大腸菌の全RNAの生物学的複製間のRNA転写量の相関を示す。存在量の相関は、tRNA、rRNA、及びncRNAではよく一致するが、mRNAではカバレッジが非常に低いため一致しない。図5Bは、脱メチル化酵素で処理したサンプル及び未処理のサンプルの転写物の存在量間の関係を示す。図5Cは、脱メチル化酵素処理の有り無し両方でのライブラリのtRNAPro(GGG)に沿った変異率を示す。未処理のサンプルは、既知のmG37及びsU8の修飾に変異ピークを示す。mG37変異は脱メチル化酵素処理によって阻止されるが、sU8変異は影響を受けない。図5Dは、脱メチル化酵素処理の有り無し両方でのtRNAPro(GGG)に沿ったリード密度を示し、m137での強力な停止が脱メチル化酵素処理によってほとんど排除されることを実証する。ストレス条件下で成長させた大腸菌についての図5A~Dに示す結果は、先に述べたストレスなしの大腸菌の結果に酷似している(図4A~D)。
ストレスに対する主な細菌の応答は、特定の非コードRNAのアップレギュレーションである。図5Eで解析したストレス応答性配列は、OxyS(+)、酸化ストレスに応答;rhyB(三角)、鉄飢餓に応答;sgrS(四角)、グルコース飢餓に応答;及びffs(SRP;丸)、非応答性対照配列。図5Fは、ストレス中の3つのストレス応答性低分子非コードRNA及び対照RNA SRP(ffs)並びに対照としてのストレス無負荷(なし)のカバレッジ密度を表す。各ストレスについて、特定のRNAの発現の劇的な増加が検出された:酸化ストレスではoxySが約75倍増加し、鉄飢餓ではryhBが約10倍増加し、グルコース飢餓ではsgrSが約60倍増加した(図5E~G)。対照配列であるffs(SRP RNA)のレベルは、全ての条件下で変化しなかった(図5E~F)。
図5Gは、脱メチル化酵素処理無しのライブラリから検出された全ての低分子非コードRNAの存在量の倍率変化を表すが、文献と一致して個々のストレスに応答した転写物はごく少数であった。
また、酸化ストレス、鉄飢餓、及びグルコース飢餓という同じストレス条件下で、tRNAの存在量、荷電、及び修飾の変化について調べた。これら急性ストレス条件(10分)下におけるtRNA存在量の変化は、1.3倍以内であった。個々のtRNAに沿って変異率を解析すると、αMG及びDIPのストレスのみの後には8位における広範な高修飾が観察されたが、DIPストレスのみでは32位が低修飾となった。
また、セリン及びグリシンのtRNAを除いてほとんどのtRNAの荷電レベルの変化は小さく、バルク範囲内であった。3つのストレス条件全てにおいて、tRNASerの荷電レベルは最大1.8倍増加し、4つのtRNASerイソ受容体は全て同じ傾向に追従した。この結果は、ストレス前に使用した培養条件下においてtRNASerの荷電レベルが低いことが知られていることと一致している。反対に、tRNAGlyのイソ受容体の荷電レベルの変化は、最大1.7倍バルク範囲を下回った。
これら結果は、tRNAを介した急性大腸菌ストレス応答は、tRNAの存在量の変化よりもtRNAの荷電を介してより迅速に生じることを示唆している。しかし、ストレスが持続するとtRNAの存在量の大きな変化が引き継がれる可能性がある。
また、ストレスがtRNA修飾にどのように影響を与えるかについても調べた。各ストレスと非ストレス対照との間の比較変異率を用いて高い信頼性で解析することができた4つの修飾のうち、m1G37レベルはストレス下でほとんど変化しないが、acp3U47レベルは3つのストレス条件全てで増加することが判明した。対照的に、s2C32及びs4U8レベルの大幅な変化はストレス条件に依存する。S2C32レベルは、鉄飢餓下でのみ低下した。S4U8レベルは、鉄飢餓及びグルコース飢餓では増加したが、酸化的ストレスでは増加しなかった。これら変化の正確な役割及び機序は、直ちには明らかにならない。
HEK293T RNA
HEK293T RNAからヒトの全RNAの研究におけるRNA-seqの用途をここに示す。
図6及び7は、ヒトの全RNAのシーケンシングからの幾つかの解析結果を表す。
ヒトの全RNAを用いてRNA-seqライブラリを構築した(図6A)。予想通り、ほとんどのリードはtRNA(95%)からであり、残りはncRNA(2.9%)、rRNA(2%)、及びmRNA(0.1%)からであった。ncRNAのリードには、lncRNA、snRNA、snoRNA等が含まれ、ほとんどがlncRNA及びsnRNAであった。tRNAArgのイソ受容体ファミリーについてマイクロアレイハイブリダイゼーションによって得られたデータと比較することにより、脱メチル化酵素処理されたライブラリによって得られたtRNA存在量の定量性を検証した(図6B;各対の左側の薄い色のドットがマイクロアレイデータ、各対の右側の濃い色のドットがRNA-secのデータである)。
ヒトのtRNAは、多くのtRNA種で複数のワトソン-クリック面のメチル化を有する。これらは、58位におけるm1A、37位におけるm1G、32位におけるm3C、26位における2,2-ジメチルグアノシン(m22G)、及び9位におけるm1Gが含まれる。従って、脱メチル化酵素処理は、tRNAの存在量の測定値に大きな影響を与える可能性がある。実際、脱メチル化酵素処理の有り無し両方でのシーケンシング結果を比較すると、脱メチル化酵素処理の有り無し両方での生物学的複製の優れた相関(図7B、r2>0.95)にもかかわらず、tRNAの全存在量は中程度しか相関していなかった(図7A、r2約0.68)。この矛盾は、特定のヒトtRNAへのリードの割り当ての曖昧性が増大したこと及び/又は未処理サンプルにおいて低修飾tRNAが過剰に出現することに部分的に起因している可能性がある。
RNA-seqのシーケンシング結果を既刊のDM-tRNA-seqの結果(Zheng et al.,Nature Methods 12,835,2015)と比較すると、良好な相関を示した(図7C)。本発明のRNA-seqと以前のDM-tRNA-seqとの主な違いは、異なるRT酵素の使用、ライブラリ構築に含まれる工程、インプットがRNA-seqでは全RNAであるのに対してDM-tRNA-seqではゲル精製されたtRNAであることであった。
10ng、100ng、及び1000ngの全RNAで出発するライブラリを構築することによって、RNA-seq法のロバスト性を試験した(図2D及び6C)。図6Cは、1μg、100ng、又は10ngの全RNAで出発したライブラリからのtRNA存在量の結果の相関を表す。10ngの全RNAインプットでさえも、tRNAの存在量はこれらのライブラリ間でr2約0.94と良好に相関していた。
個々のtRNAに沿った変異率の解析によって広範なtRNA修飾の全容が明らかになり、変異率の高い部位が多数明らかになった。変異部位の多くは、58位におけるN1-メチルアデノシン(m1A)、37位におけるN1-メチルグアノシン(m1G)、32位におけるN3-メチルシトシン(m3C)、26位におけるN2,2-ジメチルグアノシン(m22G)、及び9位におけるm1G/m1A等の既知の修飾に対応していた。m1G37を除いて、ワトソン-クリック面における本質的に全てのメチル化によって、tRNA配列全体にわたって高い変異率がもたらされた(図7D)。
脱メチル化酵素処理後のtRNAにおける変異率を解析した。予想通り、主な変化は全て、m1A、m1G、及びm3C等の脱メチル化酵素感受性修飾部位からであった(図7E参照)。脱メチル化酵素処理により、核にコードされているtRNA及びミトコンドリアにコードされているtRNAの両方において、これら修飾に関連する変異及び停止が消失又は減少したが、多くのtRNAのゆらぎアンチコドン位置におけるイノシン(I)修飾は影響を受けなかった。
tRNAに加えて、多くの低分子非コードRNAも同定された(図6D)。その存在量は2,000倍程度ばらついていた。図6Dは、rpm>10における低分子非コードRNA転写物の存在量を表す。予想通り、これらの大部分はスプライセオソームRNA及びsnoRNAであり、それに加えて、図7Fに示す幾つかの豊富なマイクロRNAも存在していた。tRNA断片については、ここでは解析していなかったので、このカテゴリーから除外した。
RNA-seqは、当初低分子RNAを研究するために設計されたが、原理的にはmRNAの研究にも使用できる。また、ポリ(A)選択され、次いで、断片化されたRNAをインプットして用いて、シーケンシングライブラリを調製した。この場合、リードのほとんどは、実際mRNA及びポリアデニル化ncRNAにマッピングされ(97%)、tRNA(2%)及びrRNA(0.6%)にはごくわずかしかマッピングされなかった(図7G)。mRNAについては複製がよく相関し(r2=0.91)、トランスクリプトームシーケンシングのためのRNA-seq法の有用性が裏付けられた(図7H)。
化学的処理によるシュードウリジン(Ψ)サイトマッピング
RNAの過酷な化学的処理を伴う用途についてのオンビーズプロトコルのロバスト性をここに示す。
図8は、ヒトrRNAにおけるΨ部位を探索するためのRNA-seqの使用を表す。
RNAの化学的処理は、RNA構造のマッピング又はRNA修飾の同定等の多くの用途を有する。Ψ部位を同定するための十分に確立されている方法は、N-シクロヘキシル-N’-β-(4-メチルモルホリニウム)エチルカルボジイミド(CMC)を用いた反応である。Ψは、CMC処理したサンプルを未処理対照と比較した際にみられるRTの停止及び/又はΨ部位の変異の増加によって検出される
ヒトのrRNAは、約100個の既知のΨ部位を有する。それをマッピングするために、全RNAを化学的に断片化し、3’末端を修復し、次いで、ヘアピンオリゴヌクレオチドにライゲーションした。シーケンシングライブラリの構築において、オンビーズ脱メチル化工程をCMC反応に置き換えた(図8A)。各rRNAの位置に停止率及び変異率を割り当てたところ、生物学的複製間で良好な相関がみられた(r2>0.95)(図8B)。18S(図8C)及び28S(図8D)rRNAにおけるΨ部位リッチであることが知られている領域に加えて、完全長18S rRNAについても調べた(図8E~F)。既知のΨ部位は全て、図8C~F中にアスタリスクで示されている。既知のΨ部位において、CMC処理したサンプルでは停止率及び/又は変異率において強いシグナルが同定され、このアプローチの有用性が検証された。
この例は、ストレプトアビジンビーズが、pH8~10で行われる2つの工程及び30~37℃で数時間のインキュベーションを伴うCMC反応等の過酷な化学的処理に耐え得ることを示す。
マイクロバイオームtRNAシーケンシング
マイクロバイオーム等の複雑なサンプルの研究におけるRNA-seqアプローチの有用性をここに示す。
図9~12は、ヒトの便及び舌のマイクロバイオーム探索するためのRNA-seqの使用を表す。
ほとんどのマイクロバイオーム特性評価技術は、DNAの配列を決定するものであり、群のメンバーを決定することはできるが、微生物の活性を求めることはできない。以前の研究によって、マウスの盲腸におけるtRNA発現及びtRNA修飾を測定するマイクロバイオームtRNA-seqアプローチ(Schwartz et al.,Nat Commun 9,5353,doi:10.1038/s41467-018-07675-z,2018)が開発されている。しかし、従来の方法には、大量のインプット材料が必要である、及びライブラリの構築前にtRNAを、構築中にcDNA産物をゲル精製する必要があることを含む多くの制約があった。
以前の研究で使用された大腸菌及びヒトの細胞株は、規定の培養から得られたものであり、インプットサンプルの量は事実上無制限であり、各サンプルを単一の参照ゲノムにアラインすることができたのでデータの複雑性が低かった。対照的に、ヒトの便及び舌からのサンプルは、はるかにより複雑である。これらサンプルからのRNA-seqライブラリが良質であることが証明されたので(図2E~F参照)、RNA-seqライブラリをシーケンシングに用い、既に開発されているデノボtRNA-seqパイプラインを用いてtRNAの存在量及び修飾についてデータを解析した。便及び舌のサンプルでは、全てのtRNA適合性リードの>95%が細菌に割り当てられ、これは、この手順がマイクロバイオームの特性評価について高価値の結果をもたらすことを示す。
図9Aは、ヒトの舌擦過物からの異なる主なRNAクラスへのリードの割り当てを示す。図9Bは、様々な細菌の分類学的分類からのSRP RNAと5S rRNAとの相関を示す。値は、log10存在量のZスコアとして計算される。図9Cは、Bと同様に、細菌の分類学的分類ごとのSRP RNAの存在量と全ての同定されたtRNAの総和との相関を示す。図9Dは、Bと同様に細菌の分類学的分類ごとの5S rRNAと全ての同定されたtRNAの総和との相関を示す。図9Eは、プレボテラ・メラニノゲニカ(Prevotella melaninogenica)のSRPにマッピングされたリードを示し;リードは、遺伝子のアノテーション付き5’末端(上)にマッピングされるが(大文字)、転写物の3’末端(下)は、遺伝子のアノテーションを1~3塩基超えてゲノム配列に入り(小文字);伸長された3’末端は、SRP構造コンテキストと一致している(中央)。図9Fは、ロシア・ムシラジノーサ(Rothia mucilaginosa)のSRPにマッピングされたリードを示し;リードは、遺伝子のアノテーション付き5’末端(上)の2~5塩基下流にマッピングされるが、3’末端(下)は、アノテーション付き末端から4~8nt短い3’末端を有する個体間の異質性を示す。
図10Aは、tRNA、5S rRNA、SRP RNAのいずれかを用いて算出した又は16Sアンプリコン遺伝子シーケンシングによって測定した、ヒト舌擦過物からの微生物の分類学的組成を示す。放線菌綱は、16Sアンプリコンシーケンシングによる検出を回避することが知られており、これによりRNAシーケンシング技術と16S DNAシーケンシング技術との間の差異が説明される。図10Bは、tRNA、5S rRNA、SRP RNA、及び16Sアンプリコンシーケンシングによって測定したときの、4名の異なる個体の連続する2日間の舌の微生物存在量の倍率変化を示す。図10Cは、ヒトの便からの異なる主なRNAクラスへのリードの割り当てを示す。図10Dは、tRNA、5S rRNA、SRP RNAのいずれかを用いて算出した又は16Sアンプリコン遺伝子シーケンシングによって測定した、2つのヒトの便サンプルからの微生物の分類学的組成を示す。
図11Aは、tRNA、5S rRNA、SRP RNAのいずれかを用いて算出した又は16Sアンプリコン遺伝子シーケンシングによって測定した、4つの異なるヒト舌擦過物からの微生物の分類学的組成を示す。図11Bは、「TTT」又は「CTT」のいずれかのアンチコドンを有するtRNAを用いて算出した、ヒト舌擦過物からの微生物の分類学的組成を示す。
tRNAの修飾についても解析した。図12Aは、ヒト舌擦過物からのロシア(Rothia)属の細菌の個々のtRNAに沿った変異率のヒートマップを示す。図12Bは、Aと同様にヒートマップを示すが、脱メチル化酵素処理に対して感受性である変異を同定し、この属に豊富に存在するm1A58修飾を同定する。図12Cは、ロシア属からの選択されたtRNAの37位及びその周辺の塩基の変異率を示し、m1G37を脱メチル化酵素感受性修飾として同定する。図12Dは、脱メチル化酵素処理の有り無し両方での、ヒト舌の幾つかの細菌分類群における選択されたtRNAの22位における変異率を示し、これによって修飾m1A22が同定される。図12Eは、Dと同様にヒト舌からの放線菌綱におけるm1A58を同定する。図12Fは、連続する2日間の4つのヒト舌擦過物からの脱メチル化酵素処理無しでの選択された細菌分類ごとの22位における変異率を示す。図12Gは、2における4つのヒト舌擦過物からの脱メチル化酵素処理無しでの放線菌綱の58位における変異率を示す。図12Hは、ヒトの便から、Dと同様に選択された細菌綱におけるm1A22を同定する。図12Iは、ヒトの便から、Eと同様に放線菌綱におけるm1A58を同定する。
RNA-seqは、一度に多くのサンプルを取り扱う能力、インプットサンプル量の非常に大幅な低減、全てのサイズ選択工程の排除、及びオンビーズ脱メチル化酵素反応を含む幾つかの点でマイクロバイオームtRNA-seqの用途を改善する。
実施例2
SARS-CoV-2
以下の実施例は、本発明の態様に従って有望なSARS-CoV-2バイオマーカーを開発するための、実施例1に一般的に記載され、本明細書に記載のヘアピンオリゴヌクレオチドを使用する、RNAライブラリ調製のRNA-seq法の使用を実証する。
図13は、SARS-CoV-2感染個体の鼻から得られたサンプルで検出されたtRNAのヒストグラムを表す。
既にSARS-CoV-2と診断されている個体から10個の鼻腔ぬぐい液サンプルを入手した。RNA-seq法を適用して、サンプル中のヒト及び微生物のtRNAを検出した。検出されたtRNAに基づいて盲検クラスタリング解析を実施し、入院期間によって判定される患者の転帰と比較した。主なクラスターは、重度の症状(入院>15日)及び軽度/超軽度の症状(<3日)によく対応する。
SARS-CoV-2患者及び対照としての健常個体からの鼻咽頭ぬぐい液をシーケンシングして、COVID19検査に用いられる鼻咽頭ぬぐい液から得ることができるシーケンシングデータの質を判定した。これらサンプルは低バイオマスであり、少量のRNAしか含有していないので、標準的なUV吸光度測定では検出できないことが多い。qPCRベースの診断では、サンプルが低バイオマスであることは問題にならないが、ほとんどのRNAシーケンシング技術では障害となる。
tRNAの断片化は、全てのサンプルで広範囲に生じた。健常対照(n=5)、インフルエンザ感染個体(n=4)、及びSARS-CoV-2感染個体(n=57)について、tRNAに沿った連続領域にマッピングされたリードの割合を示す(図14A)。tRNAの断片化は、患者群ごとに一貫した固有のパターンを示す。断片の切断は、ほとんどがアンチコドン領域で起こる。
特定のtRNAの断片化により、非感染個体、インフルエンザ感染個体、及びSARS-CoV-2感染個体を識別することができる(図14B);ns、有意ではない、P値:<0.05;**<0.01;***<10-3****<10-4。5.8S rRNAに対して正規化した特定の完全長tRNAの存在量の差により、異なるウイルス感染(すなわち、インフルエンザとSARS Cov-2)を区別することができ、更には、軽度(n=36)又は重度(n=21)の症状へと移行したSARS-CoV-2患者を区別することができる(図14C)。症状が軽度の患者は、高い比率の断片化したtRNAを示し、これは、ロバストな自然免疫応答によるRNaseの分泌が多いことと一致している。
同じシークエンシングデータで調べた別のパラメータは、RT変異シグネチャーを通じたRNA修飾の定量的比較である。特異的なtRNA修飾により、健常患者をウイルス感染及びSARS-CoV-2感染の症状発現のいずれとも区別することができた(図14D)。
この結果は、RNA-seq技術が、保存された鼻咽頭ぬぐい液から高品質のtRNAシーケンシング結果を作成できることを実証する。ヒト鼻咽頭領域におけるtRNA断片化プロファイルは、呼吸器ウイルス感染による合併症のリスクが高い患者を特定することによって感染症の転帰を予測するバイオマーカーとなる可能性を有する。
実施例3
結腸直腸がん
以下の実施例は、本発明の態様に従って有望な結腸直腸がん(CRC)バイオマーカーの開発のために、実施例1に一般的に記載され、本明細書に記載のヘアピンオリゴヌクレオチドを使用する、RNAライブラリ調製のRNA-seq法の使用を示す。
CRC患者6名の腫瘍及び隣接組織からのtRNAをシーケンシングした。この実験では、これらサンプルからtRNAを試験することの実現可能性について調べ、腫瘍が均質であるかどうか又は患者の人口統計学的データ(すなわち、肥満度、BMI)に関連したtRNAレベルの変動を示すかどうかを判定した。
これらサンプルから得られたRNAデータの大部分は、予想通りtRNA(71%)であった。残りのRNAは、rRNA(7.3%)、mt_tRNA(2.7%)、及び他のRNA(19%)であった。
高解像度データにより、>300個の染色体にコードされているtRNA遺伝子(図15)及び22個のミトコンドリアにコードされているtRNA遺伝子(図16)について様々な特性を調べることが可能になった。
図15は、結腸直腸がん(CRC)患者6名の腫瘍及び隣接組織におけるtRNA-seqの存在量、修飾、及び断片化の尺度を表す。発現レベル(図15A):tRNAの存在量から、患者間の著しい異質性が明らかになった。例えば、アミノ酸アラニンのコドンを読むtRNAの発現は患者間で比較的一定であり、腫瘍では隣接組織よりも2倍程度高いレベルで発現する(左図)。対照的に、アミノ酸ロイシンのコドンを読むtRNAは、BMI又はtRNAAlaの発現レベルにかかわらず、各患者において異なる発現パターンを示す(右図)。修飾(図15B):tRNA-seqによって、シーケンシングライブラリの構築中にヌクレオチドの誤取り込みを生じさせる転写後メチル化修飾が検出された(上図)。メチル化を除去する脱メチル化酵素でサンプルを処理することによって特定の修飾を検証し、それによって、誤取り込みはなくなった(mA)が、異なる修飾(I)は影響を受けなかった(下図)。断片化(図15C):tRNA断片は、様々な細胞条件に応答して細胞ヌクレアーゼによる切断によって生成され、制御性非コードRNAのそれぞれのファミリーに属している。RNA-seq解析により、異なる3’末端を有するtRNAが区別され、tRNA二次構造領域(例えば、Dループ、アンチコドンループ、Tループ)における切断部位の位置に基づいてグループ化することができる。予想通り、tRNA断片が全tRNAリードの1~10%を占め、アンチコドンループでの切断(30~39)が最も一般的である。予想外なことに、Tループ(50~59)における切断は腫瘍と隣接組織とで著しく異なることから、tRNA断片のプロファイルが有用なバイオマーカーとなり得ることが示唆された。
図16は、個々の患者におけるミトコンドリアtRNAの腫瘍発現パターンを表す。ミトコンドリアtRNAは、患者6名中4名について隣接組織と比べて腫瘍では有意に発現が少なく(図16A)、これはワールブルク効果及びがんにおけるミトコンドリアの機能不全と一致する所見である。これらサンプルでは、低BMI患者からのサンプルと高BMI患者からのサンプルとの間に強いパターンの差は存在しなかった。The Cancer Genome Atlas(TCGA)における数百個のサンプルを含めるように解析を広げたところ、データは、低BMI患者の腫瘍では、高BMI患者と比較してミトコンドリア遺伝子の発現が有意に低いことを示す(図16B)。
また、RNA-seq技術では、tRNAに加えて微生物からの低分子RNAも捕捉されるため、微生物の5S rRNAを用いて個々の患者における微生物群の組成を解析することが可能になった(図17)。患者のうち3名は、高い放線菌門率を示す。3名の患者のうち2名はCRCが再発したことが確認されており、3人目の患者のCRCの状態に変化があるかどうかを確認するために試験を延長している。
また、個々の患者における染色体tRNAの結果を用いて、高分解能で塩基修飾及び種間多型を通して種の違いを同定することもできる。最初の解析では、CRCの再発に関連することが知られている常在性腸内細菌であるフェカリス菌に焦点を当てた。誤取り込みは、tRNAの塩基修飾(m1A)又はマイクロバイオームサンプルにおける遺伝的多様性を反映する塩基多様性(SNP)に起因する可能性がある。手術前、手術中、及び手術後の患者から採取したサンプルにおけるフェカリス菌のtRNATyrに沿った誤取り込みの結果(図18A)から幾つかの知見が得られる。まず、7位及び74位は、誤取り込みの経時的な変化を示す。tRNAの構造及び修飾、並びに脱メチル化酵素処理に対する変異の非感受性に関する確立された知識に基づき、これら変化は、手術後のエンテロコッカス(enterococcus)属の近縁種の差分蓄積に起因する遺伝的多様性を表すと特定された(図18B)。多様性の減少がみられることは、手術後に種の組成が大きく変化したことを示す。対照的に、23位における誤取り込みは脱メチル化酵素処理に対して感受性であり、このことは、それがtRNA、この場合はN1-メチルアデノシンにおける塩基修飾に起因していることを示す(図18C)。誤取り込みの割合は手術後に20%程度増加し、これは、腸内のエンテロコッカス属のこの修飾が治療状態の効果を反映していることを示唆している。
この結果は、RNA-seq技術によって可能になった解析により、腫瘍におけるRNAの変動について多くの異なる知見が得られることを実証する。
本明細書に引用した刊行物、特許出願、及び特許を含む全ての参照文献は、各参照文献が個々にかつ具体的に参照によって援用されると示されており、かつその全体が本明細書に記載されているかのように、参照によって本明細書に援用される。
本発明の説明に関連して(特に以下の特許請求の範囲に関連して)用語「a」及び「an」及び「the」及び「少なくとも1つ」、並びに類似の参照対象の使用は、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、単数形及び複数形の両方を網羅すると解釈されるべきである。1つ以上の項目を列挙した後の用語「少なくとも1つ」の使用(例えば、「A及びBのうちの少なくとも1つ」)は、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、列挙された項目から選択される1つの項目(A又はB)又は列挙された項目のうちの2つ以上の任意の組み合わせ(A及びB)を意味すると解釈される。用語「含む(comprising)」、「有する(having)」、「含む(including)」、及び「含有する(containing)」は、特に断らない限り、オープンエンドな用語である(すなわち、「含むがこれらに限定されない」を意味する)と解釈される。本明細書における値の範囲の列挙は、本明細書において他の指定がない限り、単に範囲内の各別個の値を個々に参照する省略法として機能することを意図し、各別個の値は、本明細書に個々に列挙されているかのように明細書に援用される。本明細書に記載される全ての方法は、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、任意の好適な順序で実施することができる。本明細書に提供される任意の及び全ての例又は例示的な表現(例えば、「等」)の使用は、特に主張しない限り、単に本発明をより深く解明することを意図し、本発明の範囲の限定を提起するものではない。明細書中の表現はいずれも、任意の請求されていない要素が本発明の実施に必須であることを示すと解釈されるべきではない。
本発明を実施するための本発明者らに公知の最良の形態を含む本発明の好ましい態様が、本明細書に記載される。好ましい態様の変形は、前述の記載を読んだときに当業者に明らかになり得る。本発明者らは、当業者がこのような変形を適宜使用すると予想し、そして、本発明者らは、本明細書に具体的に記載されているのとは別の方法で本発明が実施されることを意図している。従って、本発明は、準拠法によって認められている通り、本明細書に添付される特許請求の範囲に列挙される発明主題の全ての変形及び等価物を含む。更に、その全ての可能な変形における上記要素の任意の組み合わせは、本明細書において他の指定がない限り又は文脈から明らかに矛盾していない限り、本発明によって包含される。

Claims (32)

  1. 3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、前記3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むヘアピンオリゴヌクレオチド。
  2. 前記3’末端ヌクレオチドの糖成分がペントースであり、前記ペントースがリボースである、請求項1に記載のヘアピンオリゴヌクレオチド。
  3. 3’末端ヌクレオチドを含むヘアピンオリゴヌクレオチドであって、前記3’末端ヌクレオチドの糖位置が糖の2’,3’-ジアルデヒド酸化生成物を含むヘアピンオリゴヌクレオチド。
  4. 5’末端リボヌクレオチドを更に含む、請求項1~3のいずれか一項に記載のヘアピンオリゴヌクレオチド。
  5. (a)バーコード配列、
    (b)ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
    (c)プライマー結合部位
    を更に含む、請求項1~4のいずれか一項に記載のヘアピンオリゴヌクレオチド。
  6. 配列:
    5’-Phos-rA CT-X-AGA TCG GAA GAG CAC ACG AT(配列番号86)-LT-AGA CGT GTG CTC TTC CGA TCT(配列番号87)-Z-AG rU-3’-Phos、
    (式中、Xは、少なくとも3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、又は6ヌクレオチドのバーコードであり、LTは、親和性部分タグ付きチミンヌクレオチドであり、Zは、バーコード配列の逆相補鎖であるヌクレオチドの配列である)
    を含む、請求項5に記載のヘアピンヌクレオチド。
  7. 配列:
    5’-Phos-rA CT-X-GAT CGT CGG ACT GTA GAA CAT(配列番号88)-LT-AG AGT TCT ACA GTC CGA CGA TC(配列番号89)-Z-AG rU-3’-Phos
    (式中、Xは、少なくとも3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、又は6ヌクレオチドのバーコードであり、LTは、親和性部分タグ付きチミンヌクレオチドであり、Zは、バーコード配列の逆相補鎖であるヌクレオチドの配列である)
    を含む、請求項5に記載のヘアピンヌクレオチド。
  8. 固体支持体に固定化された、請求項1~7のいずれか一項に記載のヘアピンオリゴヌクレオチド。
  9. RNA配列ライブラリの調製における、請求項1~8のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
  10. RNA配列ライブラリを調製するマルチプレックス法における、請求項1~8のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
  11. バイオマーカーの開発における、請求項1~8のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
  12. 前記バイオマーカーが、液体生検から開発される、請求項11に記載の使用。
  13. 前記バイオマーカーの開発が、tRNA断片化プロファイルを作成することを含む、請求項11又は12に記載の使用。
  14. ウイルス疾患の重症度についてのバイオマーカーの開発における、請求項1~8のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
  15. 癌についてのバイオマーカーの開発における、請求項1~8のいずれか一項に記載のヘアピンオリゴヌクレオチドの使用。
  16. リガンド部分及びヘアピンオリゴヌクレオチドを含む固体支持体であって、前記オリゴヌクレオチドが、親和性部分及び3’末端ヌクレオチドを含み、前記3’末端ヌクレオチドの糖成分が、2’-ヒドロキシル及び3’-リン酸を含み、
    前記ヘアピンオリゴヌクレオチドの前記親和性部分が前記固体支持体の前記リガンド部分に結合することを介して、前記オリゴヌクレオチドが前記固体支持体に固定化される固体支持体。
  17. 前記親和性部分がビオチンであり、前記リガンド部分がストレプトアビジンである、請求項16に記載の固体支持体。
  18. ビーズである、請求項16又は17に記載の固体支持体。
  19. 前記オリゴヌクレオチドが、
    (a)リボヌクレオチドとしての5’末端ヌクレオチド、
    (b)バーコード配列、
    (c)ヘアピンのループ内部の親和性部分でタグ付けされたヌクレオチド、及び
    (d)プライマー結合部位
    を更に含む、請求項16~18のいずれか一項に記載の固体支持体。
  20. RNA配列ライブラリの調製における、請求項16~19のいずれか一項に記載の固体支持体の使用。
  21. RNA配列ライブラリを調製するマルチプレックス法における、請求項16~19のいずれか一項に記載の固体支持体の使用。
  22. (a)RNA配列をヘアピンオリゴヌクレオチドにライゲーションしてコンストラクトを形成することであって、前記オリゴヌクレオチドが3’末端ヌクレオチドを含み、前記3’末端ヌクレオチドの糖成分が2’-ヒドロキシル及び3’-リン酸を含むことと、
    (b)前記RNA配列をcDNA配列として逆転写することと、
    (c)PCRを用いて前記cDNA配列を増幅させることと、
    を含むRNA配列ライブラリを調製する方法。
  23. 前記ヘアピンオリゴヌクレオチドが、
    (i)リボヌクレオチドとしての5’末端ヌクレオチド、
    (ii)バーコード配列、
    (iii)ヘアピンのループ内部の親和性部分タグ付きヌクレオチド、及び
    (iv)プライマー結合部位
    を更に含む、請求項22に記載の方法。
  24. ライゲーション後に3’-リン酸を脱リン酸化し、逆転写後に2’,3’-ジオールを含む3’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、請求項22又は23に記載の方法。
  25. ライゲーション後かつ脱リン酸化前に、RNA配列のヌクレオチドにおけるワトソン-クリック面のメチル化を脱メチル化することを更に含む、請求項24に記載の方法。
  26. 逆転写後にRNA配列を消化し、増幅前に第2のプライマー結合部位を付加するために第2のライゲーションを行うことを更に含む、請求項22~25のいずれか一項に記載の方法。
  27. ライゲーション後に前記コンストラクトを固体支持体に固定化することを更に含む、請求項22又は23に記載の方法。
  28. 固定化後に3’-リン酸を脱リン酸化し、逆転写後に2’,3’-ジオールを含む3’末端ヌクレオチドを過ヨウ素酸塩で酸化することを更に含む、請求項27に記載の方法。
  29. 固定化後かつ脱リン酸化前に、RNA配列のヌクレオチドにおけるワトソン-クリック面のメチル化を脱メチル化することを更に含む、請求項28に記載の方法。
  30. 逆転写後にRNA配列を消化し、増幅前に第2のプライマー結合部位を付加するために第2のライゲーションを行うことを更に含む、請求項27~29のいずれか一項に記載の方法。
  31. 前記RNA配列が、全RNA、低分子RNA、tRNA、マイクロRNA、piRNA、又はそれらの任意の組み合わせを含む、請求項22~30のいずれか一項に記載の方法。
  32. マルチプレックス法を含む、請求項22~31のいずれか一項に記載の方法。
JP2023526975A 2020-11-06 2021-11-05 ヘアピンオリゴヌクレオチド及びその使用 Pending JP2023548857A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063110605P 2020-11-06 2020-11-06
US63/110,605 2020-11-06
PCT/US2021/058258 WO2022099010A2 (en) 2020-11-06 2021-11-05 Hairpin oligonucleotides and uses thereof

Publications (1)

Publication Number Publication Date
JP2023548857A true JP2023548857A (ja) 2023-11-21

Family

ID=81458636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023526975A Pending JP2023548857A (ja) 2020-11-06 2021-11-05 ヘアピンオリゴヌクレオチド及びその使用

Country Status (10)

Country Link
US (1) US20230416727A1 (ja)
EP (1) EP4240863A2 (ja)
JP (1) JP2023548857A (ja)
KR (1) KR20230104207A (ja)
CN (1) CN116829713A (ja)
AU (1) AU2021376394A1 (ja)
CA (1) CA3197283A1 (ja)
IL (1) IL302555A (ja)
MX (1) MX2023005263A (ja)
WO (1) WO2022099010A2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6380377B1 (en) * 2000-07-14 2002-04-30 Applied Gene Technologies, Inc. Nucleic acid hairpin probes and uses thereof
US7754475B2 (en) * 2006-01-25 2010-07-13 Agilent Technologies, Inc. Nucleic acid probes and microarrays for analysis of polynucleotides
US7807372B2 (en) * 2007-06-04 2010-10-05 Northwestern University Screening sequence selectivity of oligonucleotide-binding molecules using nanoparticle based colorimetric assay
US20140274729A1 (en) * 2013-03-15 2014-09-18 Nugen Technologies, Inc. Methods, compositions and kits for generation of stranded rna or dna libraries
MA41298A (fr) * 2014-12-30 2017-11-07 X Chem Inc Procédés de marquage de banques codées par de l'adn

Also Published As

Publication number Publication date
WO2022099010A3 (en) 2022-06-23
CN116829713A (zh) 2023-09-29
AU2021376394A1 (en) 2023-06-15
EP4240863A2 (en) 2023-09-13
CA3197283A1 (en) 2022-05-12
IL302555A (en) 2023-07-01
WO2022099010A2 (en) 2022-05-12
WO2022099010A9 (en) 2022-08-18
MX2023005263A (es) 2023-07-18
KR20230104207A (ko) 2023-07-07
US20230416727A1 (en) 2023-12-28
AU2021376394A9 (en) 2024-02-08

Similar Documents

Publication Publication Date Title
CN113166797B (zh) 基于核酸酶的rna耗尽
US11072819B2 (en) Methods of constructing small RNA libraries and their use for expression profiling of target RNAs
Head et al. Library construction for next-generation sequencing: overviews and challenges
JP4651386B2 (ja) 二重鎖プロモーターの一本鎖をコードするプライマーの使用法
US20150105299A1 (en) Method for Differentiation of Polynucleotide Strands
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
JP2010516284A (ja) マイクロrnaの検出のための方法、組成物及びキット
Roberts et al. Identification of methods for use of formalin-fixed, paraffin-embedded tissue samples in RNA expression profiling
WO2012003374A2 (en) Targeted sequencing library preparation by genomic dna circularization
WO2018195217A1 (en) Compositions and methods for library construction and sequence analysis
CN107109698B (zh) Rna stitch测序:用于直接映射细胞中rna:rna相互作用的测定
JP2015516814A (ja) 標的化されたdnaの濃縮および配列決定
EP2961852A1 (en) Methods, compositions and systems for the analysis of nucleic acid molecules
KR20220130592A (ko) 핵산의 정확한 병렬 정량분석을 위한 고감도 방법
WO2012083845A1 (zh) 用于除去测序文库中载体片段的方法及其用途
EP3765478A1 (en) Methods of quantifying rna and dna variants through sequencing employing phosphorothioates
EP4347869A1 (en) Massive generation of chemically ligateable probes for multiplexed fish
JP2023548857A (ja) ヘアピンオリゴヌクレオチド及びその使用
KR20220130591A (ko) 희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법
CN113302301A (zh) 检测分析物的方法及其组合物
US20240132942A1 (en) Methods and compositions for sequencing library normalization
CA3183405A1 (en) Isolation and immobilization of nucleic acids and uses thereof
Head et al. Practical Guide
CN116875668A (zh) 一种捕获特定rna结合蛋白介导的rna-rna相互作用的方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20230817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230817