JP2020519256A - 配列データの正規化のための新規のspike inオリゴヌクレオチド - Google Patents

配列データの正規化のための新規のspike inオリゴヌクレオチド Download PDF

Info

Publication number
JP2020519256A
JP2020519256A JP2019561352A JP2019561352A JP2020519256A JP 2020519256 A JP2020519256 A JP 2020519256A JP 2019561352 A JP2019561352 A JP 2019561352A JP 2019561352 A JP2019561352 A JP 2019561352A JP 2020519256 A JP2020519256 A JP 2020519256A
Authority
JP
Japan
Prior art keywords
sequence
nucleic acid
nucleotides
rna
acid molecules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019561352A
Other languages
English (en)
Other versions
JP7044270B2 (ja
Inventor
ダグラス ノディーン,マイケル
ダグラス ノディーン,マイケル
Original Assignee
ジーエムアイ−グレガー−メンデル−インスティテュート フォー モレキュラー プランツェンバイオロジー ゲゼルシャフト ミット ベシュレンクテル ハフツング
ジーエムアイ−グレガー−メンデル−インスティテュート フォー モレキュラー プランツェンバイオロジー ゲゼルシャフト ミット ベシュレンクテル ハフツング
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジーエムアイ−グレガー−メンデル−インスティテュート フォー モレキュラー プランツェンバイオロジー ゲゼルシャフト ミット ベシュレンクテル ハフツング, ジーエムアイ−グレガー−メンデル−インスティテュート フォー モレキュラー プランツェンバイオロジー ゲゼルシャフト ミット ベシュレンクテル ハフツング filed Critical ジーエムアイ−グレガー−メンデル−インスティテュート フォー モレキュラー プランツェンバイオロジー ゲゼルシャフト ミット ベシュレンクテル ハフツング
Publication of JP2020519256A publication Critical patent/JP2020519256A/ja
Application granted granted Critical
Publication of JP7044270B2 publication Critical patent/JP7044270B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/207Modifications characterised by siRNA, miRNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/101Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control

Abstract

本発明は、特にsmallRNA配列のデータの正規化に使用するための、新規のspike inオリゴヌクレオチドに関する。具体的には、本発明は、それぞれが一本鎖の核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子は、5’ 末端にリン酸塩と、少なくとも3つのランダム化したヌクレオチドの配列と、標的配列と比較して少なくとも1つのミスマッチを含む少なくとも8個のコアヌクレオチドのコア配列と、3’末端に修飾とを含み、各サブセットは、同一のコアヌクレオチド配列および異なるランダム化したヌクレオチドを有する複数の核酸分子を含み、各サブセットの核酸分子は、コアヌクレオチド配列の少なくとも1つのヌクレオチドにおいて異なるセット、ならびに前記セットを含むライブラリーの作製を提供する。また本発明は、サンプル中の標的配列の量を決定するための、ヌクレオチドシーケンシングにおける参照値、および方法に関する。【選択図】なし

Description

本発明は、ヌクレオチド配列データの定量的正規化に使用するための、新規のspike inオリゴヌクレオチドに関する。本発明は、少なくとも2つのサブセットを含むセットであって、各サブセットが複数の一本鎖の核酸分子を含み、各一本鎖の核酸分子が、5’末端にリン酸塩と、少なくとも3つのランダム化したヌクレオチドの配列と、標的配列と相補的ではない少なくとも8個のヌクレオチドのコア配列と、少なくとも3つのランダム化したヌクレオチドの配列と、3’末端に修飾とを含む、セットを提供する。サブセットの核酸分子は、コアヌクレオチド配列の少なくとも1つのヌクレオチドにおいて異なる。また本発明は、上記セットを含むライブラリーの作製、ならびにサンプル中の標的配列の量を決定するためのヌクレオチドシーケンシングにおける参照値および方法に関する。
2005年に初めて市場に導入されてから、超並列シーケンシングまたはディープシーケンシング技術といった次世代シーケンシング(NGS)は、ゲノム研究に多大な影響を与えてきた。この次世代技術は、ゲノムシーケンシングおよび再シーケンシングなどの標準的なシーケンシングへの適用、ならびにサンガーシーケンシングによって以前には探索されなかった新規の応用に、使用されている。全てのNGSプラットフォームは、並行して数百万のDNAの小さなフラグメントのシーケンシングを行い、よって、読み取り(リード:read)の長さは犠牲になるが、費用対効果の高い配列のスループットの顕著な向上を提供する。
smallRNAのNGSライブラリーの構築は、入力(input)としてsmallRNAを採用しており、対応するcDNAのライブラリーをもたらす。このことは、短いヌクレオチドの配列、すなわち読み取りをもたらす。どのRNA分子が元のサンプルに存在しているかを推測するために、読み取りを、参照のゲノムもしくはトランスクリプトームにマッピングもしくはアライメントするか、または配列の重複に基づきde novo構築する。バイオインフォマティクスの解析が、参照ゲノムに対して個々の読み取りをマッピングすることによりこれらフラグメントをまとめてつなぎ合わせるために、使用される。
ハイスループットのsmallRNAのシーケンシング(sRNA−Seq)の実験由来のデータは、通常、正規化され、RPM(reads per million genome−matching reads)などの相対的なタームで記録される。相対的な正規化は、sRNAの下位集合がプロファイリングされる異なる組織種を通して等しい割合を有すると想定される場合に、良好に作用する。しかしながら、この想定は多くの場合無効であり、これは、sRNAの集合が、異なる組織種を通しておよび様々な変異のバックグラウンドにおいて、高頻度で動的であるためである2−7。たとえば、miRNAの定量化において同一の開始材料に基づく解析により、cDNA構築物における別の方法が全く異なるmiRNA発現レベルのプロファイルをもたらすことが示された33。RNAの末端の修飾に関与する酵素は、相対的な発現レベルのバイアスを引き起こす明らかな候補であるが、逆転写およびPCRの増幅のステップも同様に、テンプレートの優先傾向を表す可能性があり、よって、他よりも一部のRNAの増幅を優先させる可能性がある。よって、相対的に正規化したsRNA−Seqの値を比較する標準的な技法は、誤解される結果をもたらす可能性がある。対照的に、sRNA−Seqデータの絶対的な正規化は、ゲノムワイドな規模での、異なる細胞種、変異組織、または疾患状態におけるsmallRNAレベルの正確な比較を可能にする。しかしながら、sRNA−Seqデータの絶対的な正規化のために外来性sRNAオリゴヌクレオチドを使用しようとする以前の試みは、成功にばらつきがあり8−10、よって、幅広くは使用されていない。Locatiらは、大きさの選択をモニタリングするため、およびsRNA−Seqにおいてデータの正規化を行うために、それぞれ11および19のオリゴリボヌクレオチドからなる、合成RNA spike inの2つの別々のセットを使用した(Locati et al. Nucleic Acids Res. 2015 Aug 18;43(14))。特定のsRNA spike inの様々なシーケンシングの有効性は、その固有の特性、たとえば、sRNA−Seqライブラリーの構築の間にそのライゲーション効率に影響を与える可変的な二次構造およびRNAアダプターのコフォールディング(cofolding)によるものである可能性が最も高い11−13。たとえば、以前に、サンプルに添加される外来性sRNA spike inのモル量と対応するシーケンシングした読み取りの数との間の非線形の関係を考慮するため、個々のsRNA spike inの量を調節するためのさらなる補正因子が、必要とされていた10
よって、NGCは、新規の遺伝子の発見および良好に調節された転写のプロファイリングにとって強力なツールではあるが、未だに、現在利用可能な技術を使用しても解決されない以下の問題が存在する。
‐smallRNAに対するアダプターのライゲーションは、二次構造および恐らくはヌクレオチドのバイアスにより、バイアスがかかっており;よって、特定のsmallRNAが、最終的なデータセットにおいて、過剰または過少に提示される場合がある。1つの解決策として、smallRNAにライゲートするアダプターを使用して、ランダム化した末端部分を伴う、数百万のクローン化したsmallRNAの「ライブラリー」を作製することが行われてきた。これらはバイアスの低減を支援するが、いずれのsmallRNAの実験にも重要であろうバイアスが、未だどの程度存在するかは知られていない。
‐RNA−Seqは、単に、絶対数(たとえば分子の数)ではなく、smallRNAレベルの相対的な数(RPM:reads per million genome−matching reads)を記録しており;よって、動的なsmallRNAの集合を備える様々な組織(多くの場合、この事例である)からのsmallRNA−Seqのデータを比較すること、ならびに、これら集合を変える変異体(たとえば異なるsmallRNAのバイオジェネシスのファクターをかく乱する既知の変異体および未知の変異体)の間を比較することは不可能である。
Quailらは、3つの固有のバーコードを付与したDNAフラグメントのセットを、シーケンシングのサンプルに加えて、全ての読み取りが元のサンプルに由来し、混入物質に由来しないことを検証する、SASI−Seqというプロセスを開発した(Quail et al. BMC Genomics 2015, 15:110)。
Jiangらは、様々な長さ、ならびにspike inの対照としての220の濃度範囲を有するGC含有量を有する、96種の合成RNAのプールを使用して、RNA−Seqの実験の感受性、正確性、およびバイアスを測定し、転写物の存在量を定量化するための標準曲線を導出した(Jiang et al. Genome Res. 2011, 21: 1543−1551)。
国際特許公開公報第2016/007951号は、ultra−deep sequencingにおいて少ないコピー数から希少な核酸配列のバリアントを推定するためのインプロセスの対照として人工的な参照配列を使用することを記載している。
国際特許公開公報第2014/082032号は、核酸の標準化されたシーケンシングのための方法であって、当該核酸に関する個々の競合性の内部増幅対照と、サンプル中の少なくとも1つの核酸の少なくとも1つの天然の標的のシーケンシング事象の比例した関係を測定して、核酸のコピー数の再現性を提供する、方法を記載している。
国際特許公開公報第2016/001736号は、合成核酸コンストラクトを含む組成物、特に、少なくとも1つの挿入された野生型または標的の核酸配列を、NGSまたはデジタルPCRのための参照物質または対照として所定のモル比で含むプラスミドを使用することを記載している。
国際特許公開公報第2015/118513号は、とりわけNGSにより、解析されるサンプル物質を含む反応容器に添加され得る対照の核酸の使用を記載している。
Buschmannらは、実験の設計および解析前のサンプルの処理、ライブラリーの調製の標準化、およびシーケンシング反応に関するガイドラインを確立することにより、smallRNA−Seqのワークフローを標準化すること、ならびにデータ解析を容易にすることを目的とした(Buschmann et al. Nucleic Acids Res., 2016 Vol. 44 No. 13, 5995−6018)。
ハイスループットなRNAおよびDNAのシーケンシングデータの正規化は、異なるサンプルを通して、RNAまたはDNA、特にsRNAのレベルを比較するために必要とされている。一般的に使用されている相対的な正規化の手法は、変動するRNAの集合、たとえば組織間のsmallRNAの集合のため、誤った結論を引き起こす可能性がある。よって、より正確であり再現可能なアセスメントを可能にする方法および製品、特にシーケンシングデータの絶対的な正規化が必要とされている。
これら問題は、本発明の主題によって解決される。
本明細書中、一本鎖核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子が、5’から3’への方向に、
a)5’末端にリン酸塩、任意選択で一リン酸塩、二リン酸塩、または三リン酸塩と、
b)少なくとも3つのランダム化したヌクレオチドの配列と、
c)標的配列と相補的ではない少なくとも8つのヌクレオチドのコア配列と、
d)少なくとも3つのランダム化したヌクレオチドの配列と、
e)3’末端に修飾、任意選択で2’−O−メチル化またはヒドロキシル化と
を含み、
各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の一本鎖の核酸分子を含み、
各サブセットの核酸分子が、上記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
セットを、提供する。
一実施形態では、一本鎖核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子が、5’から3’への方向に、
a)5’末端にリン酸塩、任意選択で一リン酸塩、二リン酸塩、または三リン酸塩と、
b)少なくとも3つのランダム化したヌクレオチドの配列と、
c)標的配列と比較して配列が2つ以上のミスマッチを含む少なくとも8つのヌクレオチドのコア配列と、
d)少なくとも3つのランダム化したヌクレオチドの配列と、
e)3’末端に修飾、任意選択で2’−O−メチル化またはヒドロキシル化と
を含み、
各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の核酸分子を含み、
各サブセットの核酸分子が、上記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
セットが、提供される。
本発明は、具体的には、mRNA spike inオリゴヌクレオチドと共に使用される場合は、sRNA:mRNAの化学量論のゲノムワイドな推測を可能にし、かつ、独立した実験を通した、sRNA−Seqデータの絶対的で定量的な正規化を可能にする、sRNA spike inオリゴヌクレオチド(sRNA spike in)のセットを提供する。
サンプルにおけるsmallRNA分子の数の絶対的な定量化は、smallRNA−Seqのデータセット間の比較を可能にするだけでなく、Life Tec製のERCC spike−in mixなどの外来性なspike inも使用する、smallRNA−SeqおよびmRNA−Seqのデータセットの間の比較をも可能にする。
本発明のsmallRNA spike inのセットは、その後の解析のためのアライメント可能な読み取りの1.2%のみを必要とする、sRNA−Seq実験に有用な内部標準となるだけでなく、異なる供給源、たとえば異なる治療、組織の種類、または研究グループからのsRNA−Seqデータを正規化するために使用することもできる。さらに、これらは、前駆体:sRNAおよびsRNA:標的の、分子スケールでこれらの関係を理解するために重要である化学量論の正確な比較およびゲノムワイドな推測に必須であり得る、sRNA分子の絶対的な定量化を可能にする。本発明のsRNA spike inのセットはまた、様々なsRNA−Seqライブラリー作製プロトコルに存在するクローニングのバイアスについて評価および改善するために使用することができる。
また、上記sRNA spike inは、sRNA−SeqおよびmRNA−Seqにより作製される値を比較するために、市販のmRNA−spike inオリゴヌクレオチド混合物と併用して使用することもできる。
本発明の特定の実施形態では、一本鎖核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子が、5’から3’への方向に、
a)5’末端にリン酸塩、任意選択で一リン酸塩、二リン酸塩、または三リン酸塩と、
b)少なくとも3つのランダム化したヌクレオチドの配列と、
c)標的配列と比較して2つ以上のミスマッチを含む少なくとも8つのヌクレオチドのコア配列と、
d)少なくとも3つのランダム化したヌクレオチドの配列と、
e)3’末端に修飾、任意選択で2’−O−メチル化またはヒドロキシル化と
を含み、
各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の核酸分子を含み、
各サブセットの核酸分子が、上記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
セットが、提供される。
一実施形態では、コア配列は、標的配列と相補的ではない。
本発明の一実施形態では、ランダム化したヌクレオチドは、A、C、G、U、またはA、C、G、Tのうちのいずれか1つである。
本発明の一実施形態では、複数の核酸分子は、A、C、G、U、またはA、C、G、Tの全ての4つのヌクレオチドの組み合わせを含むランダム化したヌクレオチド配列を含む。
本発明の一実施形態では、核酸分子は、RNA分子、特には、smallRNAを模倣したRNA分子であり、特にsmallRNAは、siRNA、tasiRNA、snRNA、miRNA、snoRNA、piRNA、およびtRNA、ならびにそれらのいずれかのmicroRNA前駆体である。
本発明の特定の実施形態では、コアヌクレオチド配列は、8〜25個のヌクレオチド、好ましくは10〜20個のヌクレオチド、好ましくは12〜18個のヌクレオチド、好ましくは8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個のヌクレオチドを含む。異なるサブセットのコア配列は、特に、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25個のヌクレオチドにおいて異なっている。
特に、コア配列は、標的配列に対して3つ以上のミスマッチな核酸塩基を含む。
特に、コア配列は、それぞれの標的配列と比較して100%ミスマッチを含む。たとえば、コア配列が8ヌクレオチド長である場合、コアヌクレオチド配列は、標的配列と比較して、8個、特に7、5、4、3、または2個のミスマッチな核酸塩基を含む。さらなる例として、25個のヌクレオチドのコアオリゴヌクレオチドは、標的配列と比較して、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、5、4、3、または2つのミスマッチな核酸塩基を含む。
同様に、目的の生物の遺伝子またはゲノムとは異なる、すなわち相補的ではないコアヌクレオチドも、本明細書中に包有される。特に、コアヌクレオチド配列は、標的配列と比較して少なくとも2つのミスマッチな核酸塩基を含み、より具体的には、コア配列は、目的の生物の遺伝子またはゲノムと比較して、100%、97.5%、95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、またはそれ以上のミスマッチを含む。
特定の実施形態では、ランダム化したヌクレオチドの配列は、3〜7個のヌクレオチド、好ましくは3〜5個のヌクレオチド、好ましくは4個のヌクレオチドを含む。あるいはこれは、3、4、5、6、7個、またはそれ以上のヌクレオチドを含む。
本発明のセットは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24個、またはそれ以上のサブセットを、特にはサブセットあたり0.001〜50000amol、特には0.01〜25000amol、特には1〜10000amol、特には10〜5000amolの量で含むことができる。
本発明により使用される標的配列は、目的の配列のいずれかとすることができ、特にこれは、ウイルス、細菌、動物、植物由来の配列といった生物のゲノムとすることができ、特にこれは、トランスクリプトーム、RNA、smallRNA、動的なsmallRNAの集合とすることができる。
さらに本発明のセットは、サンプル、具体的には、細胞、組織、または臓器のサンプルにおける1つ以上の標的配列の量を決定するための方法に、使用することができる。
別の態様では、シーケンシング方法において使用するための、核酸、特にsmallRNAまたはsRNA模倣体を含む核酸のライブラリーを作製するための方法であって、本発明の1つ以上のセットを、標的の核酸分子と混合する、方法が、本明細書中に提供される。上記ライブラリーは、当然さらに増幅させることができる。
別の態様では、ヌクレオチドのシーケンシングにおける参照値を決定するための方法であって、標的配列の混合物に、本発明に係る1つ以上のセットを添加することにより、核酸分子のライブラリーを作製するステップと、上記核酸分子にアダプターをライゲートするステップと、任意選択で上記ライブラリーを増幅するステップと、ヌクレオチドのシーケンシング法を行うステップと、参照値として各サブセットの核酸分子の量を決定するステップとを含む、方法が、本明細書中に提供される。
別の態様では、標的配列の絶対量を決定するための方法であって、標的の量を参照値と比較する、方法が、本明細書中に提供される。
さらに本発明は、サンプルにおける核酸分子の数を決定するための方法であって、
a.本発明のセットを上記サンプルに添加して、核酸分子の混合物を入手することにより、核酸分子のライブラリーを作製するステップと、
b.上記ライブラリーをライゲートし、任意選択で増幅するステップと、
c.上記核酸分子からのRNA配列の読み取りをもたらす、上記ライブラリーの次世代シーケンシングを行うステップと、
d.上記セットおよび上記サンプルからの読み取りの数を決定するステップと
を含む、方法を包有する。
特には、上記方法は、サンプルにおけるsmallRNA分子の絶対的な定量化のため、より具体的には、異なる供給源からのsRNA配列のデータの絶対的な正規化のために、使用することができる。
代替的な実施形態として、本発明は、一般式:
p−(N)(x)(N)−2’−O−メチル
により記載されるオリゴヌクレオチドを提供する:
(式中、
Nは、A、U、G、C、またはA、T、G、Cのいずれかのランダムなヌクレオチドであり;
Xは、A、U、G、Cのいずれかを含み、標的配列と比較して2つ以上のミスマッチを含む、コアヌクレオチド配列であり;
mは、3、4、または5であり;
nは、8〜67の範囲の整数であり;
pはリン酸塩である)。
特定の実施形態では、コア配列は、標的配列に対して相補的ではない。
別の態様では、シーケンシングのためのspike inを調製するための方法であって、少なくとも2つの異なるオリゴヌクレオチド、具体的には、A、U、C、Gの可能性のある全てのヌクレオチドの組み合わせを含む、上述の複数のオリゴヌクレオチドを使用する、方法が、本明細書中提供される。
クローニングのバイアスを試験するためおよび絶対的なsmallRNAのレベルを推定するためのツールとしての、smallRNA spike inの設計および使用。(a)Col−0の花(バイオロジカルレプリケート1)における絶対的なsmallRNAのレベル(総RNA(μg)あたりの分子)と比較した相対的なsmallRNA spike inのレベル(reads per million genome−matching reads)の散布図。ピアソンのγ値が示されており、プロットした値から導出した線形モデルを表す破線が示されている。(b)花芽の総RNA(μg)あたりの個々のmiRNAファミリー分子の密度のプロット。縦方向の破線は、miRNAファミリーあたりの分子の数の中央値を表す。 smallRNA spike inは、smallRNAのレベルの正確な比較を可能にする。(aおよびb)相対的な単位(a)または絶対的な単位(b)のいずれかにおける個々のmiRNA、tasiRNA、およびsiRNAのファミリーのレベルのバイオリン図。p値は、2つのサンプルのコルモゴロフ−スミルノフ検定に基づくものであった。P<0.05、P<0.01、およびP<0.001は、それぞれ、*、**、および***により表されている。バイオリン図は、各サンプルにおいて1以上のRPMの、93個のmiRNA、14個のtasiRNA、6,361個の20〜22ntのsiRNA、および5,952個の23〜24ntのsiRNAのファミリーから構成されている。25パーセンタイルおよび75パーセンタイルが、バイオリン図の縦方向の黒いバーの下部および上部により表されており、中央値は、縦方向の黒いバーの中の白色の点により表されている。上部および下部の細い線(whisker)は、1.5倍の四分位範囲内にて、縦方向の黒いバーから極値まで延びている。バイオリンの幅は、サンプルの密度に比例している。(cおよびd)相対的なRPM(c)または絶対的なMPU(d)のタームのいずれかにおける、Col−0の花vsCol−0の葉(左)およびCol−0の花vs dcl234の葉(右)のmiRNAファミリーのレベルの散布図。黒色の点は、それぞれ有意に増加したレベルおよび有意に減少したレベルを有するmiRNAファミリーを表す。有意に異なるmiRNAのレベルは、2倍以上異なると定義されており、偽発見率(false discovery rate)は、2つのサンプルのスチューデントt検定に基づきP値<0.05に調節した。 smallRNAおよびポリ(A)RNAのspike inの併用した使用は、smallRNA−SeqのデータとmRNA−Seqのデータとの直接的な比較を可能にする。(a)相対的(TPM:transcripts per million)および絶対的(総RNA(μg)あたりの分子)なERCCのポリ(A)のspike−in(LifeTech)のレベルの散布図。ピアソンのr値が表されており、プロットした値から導出した線形モデルを表す破線が表されている。(b)Col−0の葉、Col−0の花、およびdcl234の花におけるmiRNA/miRNA前駆体およびtasiRNA/tasiRNA前駆体のレベルの1次元の散布図。(c)Col−0の葉、Col−0の花、およびdcl234の花におけるmiRNA/標的およびtasiRNA/標的のレベルのバイオリン図。バイオリン図は、図2の凡例に記載される通りである。P<0.01およびP<0.001は、それぞれ**および***で表されており、2つのサンプルのコルモゴロフ−スミルノフ検定で計算された。試験したmiRNA:標的およびtasiRNA:標的の相互作用の数が、表されている。 smallRNAの集合の長さの分布。Col−0の葉(a)、Col−0の花(b)、およびdcl234の花(c)におけるsRNAの異なる大きさのクラスに関する、RPMの積み重ね棒グラフのプロット。色は表記のヌクレオチドで開始するsRNA−Seqの割合を表す。 総RNA(μg)あたりのmRNA分子の数を推定するために使用した標準曲線。野生型(Col−0)の花(バイオロジカルレプリケート1)(a)、Col−0の葉(バイオロジカルレプリケート1および2)(bおよびc)、ならびにdcl234の花(バイオロジカルレプリケート1および2)(dおよびe)から作製したmRNA−Seqライブラリーにおける、相対的(TPM:transcripts per million)および絶対的(総RNA(μg)あたりの分子)なERCCのポリ(A)のspike−inのレベルの散布図。ピアソンのr値が表されており、プロットした値から導出した線形モデルを表す破線が表されている。
詳細な説明
本明細書を通して使用される特定の用語は、以下の意味を有する。
用語「含む(comprise)」、「含む(contain)」、「有する(have)」、および「含む(include)」は、本明細書中使用される場合、同意語として使用することができ、さらなるメンバーまたは部分または要素を許容する、オープンな定義として理解すべきである。「からなる(consisting)」は、「からなる」の定義の特性のさらなる要素を含まない最も閉鎖的な定義とみなされている。よって、「含む(comprising)」は、これよりも広く、「からなる」の定義を含む。
本明細書中使用される場合、用語「約」は、所定の値の同じ値または±10%異なる値を表す。
本明細書中使用される場合、用語「分子」は、共有結合により複数の原子から構成された単一の実体または粒子を表す。分子は、1つのクラスの物質またはそれらの組み合わせから構成される、異なる部分を含み得る。複数のクラスの物質として、たとえば、限定するものではないが、化学的な修飾を伴うDNAおよび/またはRNAを含む、一本鎖DNA(ssDNA)、一本鎖RNA(ssRNA)、ペプチド、または他の有機化合物がある。分子は、様々な長さ、大きさ、または分子量であってもよく、当業者に知られているかおよび/または望ましいいずれかの活性を有することができる。
本明細書中使用される場合、用語「核酸」、「ポリヌクレオチド」、および「ポリ核酸」は、互換可能に使用することができ、任意の長さのヌクレオチド、リボヌクレオチド、デオキシリボヌクレオチド、ヌクレオチドの化学的に修飾した形態またはアナログのいずれかおよび上記の組み合わせの重合体の形態を表す。核酸は、細胞に対して外来性または内在性であり得る。核酸は、無細胞の環境で存在することができる。核酸は、遺伝子またはそのフラグメントとすることができる。核酸は、DNAとすることができる。核酸は、RNAとすることができる。核酸は、1つ以上のアナログ(たとえば変更された骨格、糖、または核酸塩基)を含み得る。アナログの一部の非限定的な例として、5−ブロモウラシル、ペプチド核酸、ゼノ核酸、モルフォリノ、LNA(locked nucleic acid)、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7−デアザ−GTP、フルオロフォア(たとえば、糖に結合したローダミンまたはフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光ベースのアナログ、CpGアイランド、メチル−7−グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、シュードウリジン(pseudourdine)、ジヒドロウリジン、クエオシン、およびワイオシン(wyosine)が挙げられる。また、一本鎖核酸は、変性した二本鎖のDNAのうちの一本鎖の核酸とすることもできる。あるいは、これは、いずれの二本鎖DNAにも由来しない一本鎖の核酸とすることができる。一態様では、テンプレートの核酸は、RNAである。別の態様では、テンプレートはDNAである。この用語は、RNA、cDNA、ゲノムDNA、それらの合成形態および混合したポリマーのセンス鎖およびアンチセンス鎖を含む。またこの用語は、一本鎖(SS)および二本鎖(ds)の立体構造を含む、いずれかの位相幾何学的な立体構造を含む。
核酸は、新規または改良された特性(たとえば安定性の改善)を有する核酸を提供するために、1つ以上の修飾(たとえば塩基の修飾、骨格の修飾)を含むことができる。核酸は、核酸のアフィニティタグを含み得る。ヌクレオシドは、塩基−糖の組み合わせとすることができる。ヌクレオシドの塩基部分は、複素環式の塩基とすることができる。このような複素環式の塩基の2つの最も一般的なクラスは、プリンおよびピリミジンである。
ヌクレオチドは、ヌクレオシドの糖の部分に共有結合したリン酸基をさらに含むヌクレオシドとすることができる。ペントフラノシル糖を含むこれらヌクレオシドでは、リン酸基は、この糖の、2’、3’、または5’のヒドロキシル部分に結合し得る。核酸を形成する場合、リン酸基は、直鎖重合体の化合物を形成するため、近くのヌクレオシドと互いに共有結合し得る。核酸の中でリン酸基は、一般に、核酸のヌクレオシド間の骨格を形成するとみなすことができる。核酸の結合または骨格は、3’−5’ホスホジエステル結合とすることができる。核酸は、修飾した骨格および/または修飾したヌクレオシド間結合を含み得る。修飾した骨格は、骨格にリン原子を保持する骨格および骨格にリン原子を有さない骨格を含み得る。その中にリン原子を含む適切な修飾した核酸骨格は、たとえば、ホスホロチオエート、キラルなホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、メチルおよび他のアルキルホスホネート、たとえば3’−アルキレンホスホネート、5’−アルキレンホスホネート、キラルなホスホネート、ホスフィナート、ホスホルアミダート(3’−アミノホスホルアミダートおよびアミノアルキルホスホルアミダートを含む)、ホスホロジアミダート、チオノホスホルアミダート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノリン酸塩、および通常の3’−5’結合を有するボラノリン酸塩、2’−5’結合のアナログ、ならびに、1つ以上のヌクレオチド間結合が、3’−3’結合、5’−5’結合、または2’−2’結合である逆極性(inverted polarity)を有するものを含み得る。
核酸は、短鎖のアルキルもしくはシクロアルキルのヌクレオシド間結合、混合したヘテロ原子およびアルキルもしくはシクロアルキルのヌクレオシド間結合、または1つ以上の短鎖のヘテロ原子もしくは複素環式のヌクレオシド間結合により形成されるポリヌクレオチド骨格を含み得る。これらは、モルフォリノ結合(ヌクレオシドの糖部分から部分的に形成される);シロキサン骨格;スルフィド、スルホキシド、およびスルホンの骨格;ホルムアセチルおよびチオホルムアセチルの骨格;メチレンホルムアセチルおよびチオホルムアセチルの骨格;リボアセチルの骨格;アルケン含有骨格;スルファマート骨格;メチレンイミノおよびメチレンヒドラジノの骨格;スルホナートおよびスルホンアミドの骨格;アミドの骨格;ならびに混合した、O、S、およびCHの構成要素部分を有する他のものを含み得る。
また核酸は、核酸塩基(多くの場合単純に「塩基」と呼ばれる)の修飾または置換を含み得る。本明細書中使用される場合、核酸塩基は、プリン塩基(たとえばアデニン(A)およびグアニン(G))、ならびにピリミジン塩基(たとえばチミン(T)、シトシン(C)、およびウラシル(U))を含む。
RNA模倣体は、天然の内在性RNAを模倣する化学的に修飾された二本鎖のRNAである。miRNA模倣体は、天然に存在する成熟したmicroRNAを刺激し、たとえば、これらは、非天然または人工的な二本鎖のmiRNA様のRNAフラグメントを含む。
動的なsmallRNAは、異なる発達段階、組織、細胞種、および細胞区画において差次的に発現するsmallRNAを表す。
用語「核酸分子」は、本明細書中使用される場合、RNA分子、DNA分子、cDNA分子、オリゴヌクレオチド、ポリヌクレオチド、およびそれらのアナログまたは誘導体を含むことが意図されている。この用語は、化学的に合成された核酸分子、化学的に修飾された核酸分子、または組み換え技術により産生された核酸分子などの、合成核酸分子を含む。適切な核酸分子は、これらに限定されるものではないが、たとえばmRNA、siRNA、tasiRNA、snRNA、miRNA、snoRNA、piRNA、およびtRNAといった、いずれかのsmallRNAを含むRNAである。
本発明の核酸分子は、特には、一本鎖(ss)である。特に、この一本鎖の核酸分子は、RNA分子である。一本鎖の核酸分子は、センス鎖またはアンチセンス鎖とすることができる。
本明細書中使用される場合、用語「オリゴヌクレオチド」は、約2〜200ヌクレオチド長、特には2〜100、特には2〜75オリゴヌクレオチド長のヌクレオチドである一本鎖の多量体を表す。オリゴヌクレオチドは、合成のものであってもよく、または酵素によりもたらされてもよい。オリゴヌクレオチドは、リボヌクレオチドのモノマー(すなわちオリゴリボヌクレオチドであり得る)、またはデオキシリボヌクレオチドのモノマー、またはリボヌクレオチドのモノマーおよびデオキシリボヌクレオチドのモノマーの両方を、含み得る。オリゴヌクレオチドは、限定するものではないが、2〜75、4〜50、5〜40、10〜35、15〜30、17〜25、20、21、22、23、24、25、25、27、28、29、30ヌクレオチド長を有し得る。
smallRNAの模倣体はまた、本発明のオリゴヌクレオチドセットに使用することができ、5’末端の一リン酸塩、二リン酸塩、または三リン酸塩を含み、3’末端のOHまたはO−メチル、または2’O−メチルを含む、異なる5’修飾および3’修飾を伴うsmallRNAとすることができる。smallRNAの模倣体は、200未満のヌクレオチド、特に100未満のヌクレオチド、特に75未満のヌクレオチド、特に50未満のヌクレオチド、特に8〜50ヌクレオチド、より具体的には20〜35ヌクレオチドを含む。植物のRNAを模倣した人工的なRNAオリゴヌクレオチドは、たとえば、5’末端に一リン酸塩および3’末端にOHを含むオリゴヌクレオチドとすることができる。
本発明のオリゴヌクレオチドは、以下の一般式:
p−(N)(X)(N)2’−O−メチル
により特徴づけられ得る:
(式中、
pはリン酸塩であり、
Nは、A、U、G、C、またはA、T、G、Cのいずれかのランダムなヌクレオチドであり、
Xは、A、U、G、C;またはA、T、G、Cのいずれかを含む、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67の長さを有する、標的配列と比較して2つ以上の核酸塩基のミスマッチを配列が含むコア配列であり、
m、nは、3、4、または5である)。
特に、ミスマッチの数は、標的配列に相補的ではないコア配列をもたらす方法において決定される。
用語「化学的に修飾したヌクレオチド」は、従来のヌクレオチドと化学的な構造において異なるヌクレオチドであって、塩基、糖、および/またはリン酸塩の化学的な構造に修飾を有する、ヌクレオチドを表す。ヌクレオチドは、これら構造のいずれかの位置で修飾され得る。修飾した核酸塩基は、他の合成核酸塩基および天然の核酸塩基、たとえば、5−メチルシトシン(5−me−C)、5−ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2−アミノアデニン、アデニンおよびグアニンの6−メチルおよび他のアルキル誘導体、アデニンおよびグアニンの2−プロピルおよび他のアルキル誘導体、2−チオウラシル、2−チオチミンおよび2−チオシトシン、5−ハロウラシルおよびシトシン、5−プロピニル(−C=C−CH)ウラシル、シトシンおよび他のピリミジン塩基のアルキニル誘導体、6−アゾウラシル、シトシンおよびチミン、5−ウラシル(偽ウラシル(pseudouracil))、4−チオウラシル、8−ハロ、8−アミノ、8−チオール、8−チオアルキル、8−ヒドロキシル、および他の8−置換型アデニンおよびグアニン、5−ハロ、特に5−ブロモ、5−トリフルオロメチルおよび他の5−置換型ウラシルおよびシトシン、7−メチルグアニンおよび7−メチルアデニン、2−F−アデニン、2−アミノアデニン、8−アザグアニンおよび8−アザアデニン、7−デアザグアニンおよび7−デアザアデニンおよび3−デアザグアニンおよび3−デアザアデニンを含み得る。修飾した核酸塩基は、三環系のピリミジン、たとえばフェノキサジンシチジン(1H−ピリミド(5,4−b)(1,4)ベンゾキサジン−2(3H)−オン)、フェノチアジンシチジン(1H−ピリミド(5,4−b)(1,4)ベンゾチアジン−2(3H)−オン)、Gクランプ、たとえば置換されたフェノキサジンシチジン(たとえば、9−(2−アミノエトキシ)−H−ピリミド(5,4−(b)(1,4)ベンゾキサジン−2(3H)−オン)、カルバゾールシチジン(2H−ピリミド(4,5−b)インドール−2−オン)、ピリドインドールシチジン(H−ピリド(3’,2’:4,5)ピロロ[2,3−d]ピリミジン−2−オン)を含み得る。
本明細書中使用される場合、用語「アダプター(adapterまたはadaptor)」と同義で使用される用語「アダプター配列」は、特に、知られていないDNA配列を探索するための、他のDNA分子の末端に結合するように使用される、短い、化学的に合成された二本鎖のDNA分子を表す。一実施形態として、短い配列が、標的配列のフラグメントの末端に結合され、本発明のセットに含まれるオリゴヌクレオチドに結合される。アダプター配列は、DNAのランダムなフラグメントのシーケンシングに有用である。短いヌクレオチド配列の付加により、次世代シーケンシング用のフローセルに、いずれかのDNAフラグメントを結合させることが可能となる。アダプター配列を使用したライブラリー構築の方法に関する例が、Head S. et al., 2015(Biotechniques, 56(2), 61−passim)に記載されている。例として、アダプターは、NEBNEXT SmallRNA Library Prep set for Illuminaのユーザーのマニュアル(Multiplex Compatible, https://www.neb.com/〜/media/Catalog/All−Products/7D0645075EAA4A07843194C69EB391A7/Datacards%20or%20Manuals/manualE7330.pdf)に記載されるように使用され、特に、3’アダプターは、配列:5’−rAppAGATCGGAAGAGCACACGTCT−NH−3’(SEQ ID NO 9)であり、5’アダプターは、配列5’−rGrUrUrCrArGrArGrUrUrCrUrArCrArGrUrCrCrGrArCrGrArUrC−3’(SEQ ID NO 10)である。別の方法として、当業者が提供できる他のいずれのアダプターも、使用され得る。
用語「相補性」または「相補的な」は、本明細書中使用される場合、従来のワトソン−クリックまたは本明細書中記載される他の非伝統的な種類の結合のいずれかによる、1つの核酸配列と別の核酸配列との間の水素結合の形成または存在を表す。完全なまたは100%の相補性は、核酸配列の全ての連続した残基(核酸塩基)が、第2の相補的な核酸配列における同数の連続した残基と水素結合することを意味する。特定の態様では、第1の核酸配列の連続した残基は、第2の配列の連続した核酸と同一である。「非相補性」は、2つの核酸配列の間にバルジ、ループ、またはオーバーハングをもたらし得る、核酸分子の中の様々なミスマッチまたは塩基対形成されていないヌクレオチド(たとえば2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれ以上のミスマッチ、非ヌクレオチドリンカー、または塩基対形成されていないヌクレオチド)を含む。このような非相補性は、塩基対形成されていないヌクレオチドの数により決定される相補性(%)により表すことができ、すなわち、関与するヌクレオチドの総数の中の、約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%などにより、表すことができる。完全性のため、逆相補性もまた、本明細書中に包有されている。
本明細書中、コア配列に「相補的ではない」との文言は、塩基対形成されていないヌクレオチドの数により決定される相補性(%)により表すことができ、すなわち、目的の標的配列を基準にして、少なくとも50%、特に少なくとも55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%の塩基対形成されていないヌクレオチド、または少なくとも25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%のコア配列のうちの配列のミスマッチを表す。
本明細書中使用される場合、用語「水素結合」は、電気的に陰性の原子と炭素の電気陰性度を超える第2の原子に結合した水素原子と間の結合の形態を表す。水素原子と共有する自由電子対を有する電気陰性の原子は、いわゆる水素結合のアクセプターであり、窒素、酸素、硫黄、またはフッ素であり得る。電気陰性の原子に結合した水素原子は、一般に、水素結合のドナーと呼ばれている。本明細書中使用される場合、用語電気陰性および電気陽性は、非対照的な電子の分布をもたらし、よって双極子モーメントの形成をもたらすように、共有結合の電子対を誘引する原子の傾向を意味することが、当業者によって容易に理解されるであろう。水素結合は、ファンデルワールス相互作用よりも強いが、共有結合またはイオン結合よりも弱い。
用語「ハイブリダイズする(hybridize)」または「アニールする(anneal)」は、平行または好ましくは逆平行の方向にて、特定のハイブリダイゼーションの条件下で一体となる核酸の鎖の性質を表す。これら核酸の鎖は、反対の鎖の塩基間の水素結合を介して相互作用し、安定または準安定(quasi−stable)した二本鎖のらせん構造を形成し、三重または他のより高次の構造の形成をもたらし得る。水素結合は、通常、アデニンとチミンまたはウラシルとの間(AとTまたはUとの間)、またはシトシンとグアニンとの間(CとGとの間)に形成するが、他の塩基対が形成される場合がある(たとえばAdams et al., The Biochemistry of the Nucleic Acids, 11th ed., 1992)。互いにハイブリダイズする2つのヌクレオチド配列の性質は、2つのヌクレオチド配列の相補性の度合いに基づいており、よって、一致する相補的なヌクレオチド対のフラクションに基づく。所定の配列において、別の配列に相補的であるヌクレオチドが多いほど、ハイブリダイゼーションに関する条件がよりストリンジェントになり得、2つの配列の結合性がより特異的になるであろう。ストリンジェンシーの増大は、温度の上昇、共溶媒の割合の増加、塩濃度の低下などにより、達成される。
当業者に明らかであるように、ストリンジェントな条件は、配列に依存しており、異なる状況で異なる。たとえば、長いフラグメントは、短いフラグメントよりも、特定のハイブリダイゼーションに関して高いハイブリダイゼーション温度を必要とし得る。相補的な鎖の塩基の組成および長さ、有機溶媒およびイオンの存在、ならびに塩基のミスマッチの度合いなどの他の要因が、ハイブリダイゼーションのストリンジェンシーに影響を与え得るため、これらパラメータの組み合わせは、いずれか1つのパラメータ単独の絶対的な大きさよりも重要であり得る。一部の実施形態では、ハイブリダイゼーションは、高温または0.1XSCCなどの高いストリンジェンシー条件下で発生させることができる。高いストリンジェントな条件の例は、当該分野で知られており、たとえばSambrook et al., Molecular Cloning: A Laboratory Manual, 2d Edition, 1989、およびShort Protocols in Molecular Biology, ed. Ausubel et alを参照されたい。一般的に、ハイブリダイゼーションを行う温度を上げることは、ストリンジェンシーを増大させる。また、本明細書中記載のハイブリダイゼーションの反応は、望ましいハイブリダイゼーションのストリンジェンシーに応じて異なる温度で行うことができる。ハイブリダイゼーションの温度は、5℃程度、またはさらには5℃未満とすることができるが、通常、22℃超であり、より典型的には、約30℃超であり、さらにより典型的には、37℃超である。他の実施形態では、ハイブリダイゼーションのストリンジェンシーは、さらに、緩衝溶液の成分の添加または除去により変更することができる。一部の実施形態では、中程度(medium)のストリンジェンシーの条件下でのハイブリダイゼーションが容認される。他の実施形態では、低いストリンジェンシー条件下でのハイブリダイゼーションが、容認される。一部の実施形態では、2つ以上のミスマッチが、ハイブリダイズした分子間またはハイブリダイズした分子の一部の間に存在する。
2つ以上の核酸配列の観点からの用語「同一性」または「同一な」は、以下に記載の配列比較のアルゴリズムのうちの1つ(たとえばBLAST、BLAST−2、BLASTN、ALIGN、ALIGN−2、Megalign(DNASTAR)、またはニードルペアワイズシーケンスアライメント(needle pairwise sequence alignment)(EMBOSSソフトウェア)もしくは当業者に利用可能な他のアルゴリズム)を使用するか、または目視の検査により測定される、最大の一致について比較およびアライメントされる際に同じであるヌクレオチドの特定のパーセンテージを有する、2つ以上の配列または下位配列を表す。適用に応じて、「同一性」(パーセント)は、比較される配列の領域にわたり存在し得、たとえば、比較される2つの配列の完全長にわたり存在し得る。配列比較のため、通常、1つの配列は、試験配列と比較される参照配列として作用する。配列比較アルゴリズムを使用して、試験配列および参照配列がコンピュータに入力される場合、必要に応じて、下位配列の座標は指定されており、配列アルゴリズムプログラムのパラメータが指定されている。次に、配列比較アルゴリズムは、指定されたプログラムのパラメータに基づき、参照配列と比較した試験配列に関する配列同一性(パーセント)を計算する。比較に最適な配列のアライメントを、たとえば、Smith & Waterman, Adv. Appl. Math. 2:482(1981)の局地的相同性アルゴリズム(local homology algorithm)により、Needleman & Wunsch, J. Mol. Biol. 48:443 (1970)の相同性アライメントアルゴリズム(homology alignment algorithm)により、Pearson & Lipman, Proc. Nat’l. Acad. Sci. USA 85:2444 (1988)の類似性の方法に関する検索により、これらアルゴリズムのコンピュータ化された実施(Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.におけるGAP、BESTFIT、FASTA、およびTFASTA)により、または目視の検査(一般に以下の(infra)Ausubel et al.,を参照)により、行うことができる。
同一ではないことは、100%未満の核酸の配列同一性が存在すること、すなわち、第1の配列由来の少なくとも2、3、4、5個、またはそれ以上のヌクレオチドが、第2の配列由来のヌクレオチドと異なることを意味する。あるいは、配列同一性は、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%、またはそれ以下である。
本明細書中使用される場合、用語「遺伝子」は、1つ以上の転写物を形成するために転写される配列を含む遺伝子のヌクレオチドに関連する。具体的には、遺伝子は、適切な制御配列に作動可能に結合している場合、in vitroまたはin vivoにおいてRNAに転写するヌクレオチド(DNA)から構成されているDNAの遺伝子座(または領域)を表す。遺伝子は、コード領域の前および後にある制御領域、たとえば、5’非翻訳(5’UTR)配列または「リーダー」配列、および3’UTRまたは「トレイラー」配列、ならびに個々のコードセグメント(エクソン)の間に介在する配列(イントロン)を含み得る。特に、遺伝子は、タンパク質をコードしている(たとえばmRNA)が、microRNA、snoRNA、またはrRNA、ならびにそれらの前駆体、pre−microRNAおよびpre−rRNAを含む、制御RNA(regulatory RNA)または触媒RNAなどの非タンパク質コード転写物も規定されている。
用語「目的の遺伝子」または「目的のゲノム」は、限定するものではないが、ウイルス、細菌、真菌、植物、動物などのいずれかの生物由来のサンプル由来の、遺伝子もしくはその機能的なフラグメントもしくはゲノム、またはいずれかの生物に由来するいずれかの合成遺伝子もしくは修飾した遺伝子を表す。
用語「トランスクリプトーム」は、所定のサンプルもしくは生物におけるメッセンジャーRNA(mRNA)分子、低分子干渉RNA(siRNA)分子、転移RNA(tRNA)分子、リボソーム(rRNA)分子などの転写物の全体的なセット、または特定の細胞種に存在する転写物の特定のサブセットを表す。所定の細胞株に関してほぼ固定されている(変異は除く)ゲノムとは異なり、トランスクリプトームは、外部環境の条件に応じて変動し得る。細胞における全ての転写物を含むため、トランスクリプトームは、転写の減弱などのmRNAの分解現象を除き、所定の時間に活発に発現する遺伝子を反映している。一部の実施形態では、トランスクリプトームは、mRNA種などの転写物の種を表すだけでなく、サンプルにおける各種の量をも表す。一部の実施形態では、トランスクリプトームは、サンプルにおける各mRNA分子、たとえば単一の細胞における全てのmRNA分子を含む。
「標的配列」は、たとえば、限定するものではないが、ウイルス、細菌、真菌、動物、植物から生じるかまたは由来するヌクレオチド配列などの、目的の核酸分子、目的の遺伝子もしくは目的のゲノム、または、それらの一部、誘導体、もしくはフラグメントを含む、目的のヌクレオチド配列を表す。また標的配列は、トランスクリプトーム、RNA配列またはそれらのフラグメント、特に、任意の供給源由来のRNA、総RNA、大きさの選択された総RNA、smallRNAおよび動的なsmallRNAであり得る。特に、標的配列は、非コード配列またはコード配列、またはそれらの組み合わせである。具体的には、標的配列は、代謝経路または生合成経路、またはこのような経路の一部、たとえば当該経路の各酵素または調節因子を、コードまたは制御する。特に、標的配列は、単一の生体分子、たとえば酵素、またはリガンド結合タンパク質、抗体、構造タンパク質、または他の機能を有するタンパク質、リボザイム、リボスイッチ、制御RNA、もしくは他のいずれかのRNA分子、または細胞の経路、制御ネットワーク、代謝経路、もしくは細胞のサブシステムを形成する生体分子のグループ、または上記のいずれかの一部をコードする。
様々な実施形態では、核酸は増幅される。当該分野で知られているいずれかの増幅方法が、使用され得る。使用できる増幅技術の例として、限定するものではないが、PCR、定量的PCR、QF−PCR(quantitative fluorescent PCR)、MF−PCR(multiplex fluorescent PCR)、リアルタイムPCR(RT−PCR)、単一細胞PCR、制限酵素断片長多型PCR(PCR−RFLP)、ホットスタートPCR、ネステッドPCR、in situ polony PCR、in situにおけるローリングサークル増幅(rolling circle amplification:RCA)、ブリッジPCR、ピコタイターPCR(picotiter PCR)およびエマルジョンPCRが挙げられる。他の適切な増幅方法として、リガーゼ連鎖反応(LCR)、転写増幅、自家持続配列複製法(self−sustained sequence replication)、標的のポリヌクレオチド配列の選択的な増幅、コンセンサス配列により刺激されるポリメラーゼ連鎖反応(consensus sequence primed polymerase chain reaction:CP−PCR)、AP−PCR(arbitrarily primed polymerase chain reaction)、DOP−PCR(degenerate oligonucleotide−primed PCR)、およびNABSA(nucleic acid based sequence amplification:NABSA)が挙げられる。
用語「シーケンシング」は、核酸の配列を決定するいずれかの方法を含む。このような方法として、Maxam−Gilbertシーケンシング、チェーン・ターミネーション法、ショットガンシーケンシング、PCRシーケンシング、ブリッジPCR、MPSS(Massively Parallel Signature Sequencing)、Polony Sequencing法、パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、イオン半導体シーケンシング(miconductor sequencing)、DNA nanoballシーケンシング、Heliscope 単一分子シーケンシング(single cell sequencing)、SMRT(Single molecule real time)シーケンシング、Nanopore DNAシーケンシング、ハイブリダイゼーションによるシーケンシング、質量分析を用いるシーケンシング、microfluidic Sangerシーケンシング、顕微鏡ベースの技術、RNAPシーケンシング、(インビトロウイルス)ハイスループットシーケンシング(HTS)が挙げられる。
用語「次世代シーケンシング(NGS)」は、いわゆる並行した合成によるシーケンシング、またはllumina、Life Technologies、およびRocheなどにより現在使用されているライゲーションのプラットフォームによるシーケンシングを表す。次世代シーケンシング法はまた、nanoporeシーケンシング法または電子的検出ベースの方法、たとえば、Life Technologiesにより市販されているIon Torrent技術を含み得る。
具体的には、NGSは、並行して数千または数百万のシーケンシング反応を行うハイスループットシーケンシング技術を表す。異なるNGSプラットフォームは、様々なアッセイ化学を使用するが、これらは全て、多数のテンプレート上で同時に行われる多数のシーケンシング反応から配列データを作成する。通常、配列データは、スキャナを使用して収集され、次に、アセンブルされ、バイオインフォマティクスを用いて解析される。よって、シーケンシング反応は、並行して、行われ、読み取られ、アセンブルされ、解析される;たとえば、Behjati S and Tarpey, P., 2013(Arch.Di.Child Educ Pract Ed 2013, 98, 236−238); Head S. et al., 2015(Biotechniques, 56(2), 61−passim)を参照されたい。
NGS法の中には、テンプレートの増幅を必要とするものと、必要としないものがある。増幅を必要とする方法として、パイロシーケンシング(たとえば米国特許第6,258,568号、Rocheにより商品化);Solexa/Illuminaのプラットフォーム(たとえば米国特許第6,833,246号、同7,115,400号、および同6,969,488号);ならびにSOLiD(Supported Oligonucleotide Ligation and Detection)プラットフォーム(Applied Biosystems;たとえば米国特許第5,912,148号および同6,130,073号)が挙げられる。増幅を必要としない方法、たとえば単一分子のシーケンシング法として、nanoporeシーケンシング(HeliScope)(米国特許第7,169,560号;同7,282,337号;同7,482,120号;同7,501,245号;同6,818,395号;同6,911,345号;および同7,501,245号);合成によるリアルタイムシーケンシング(たとえば米国特許第7,329,492号参照);ZMW(zero−mode waveguides)を使用したSMRT(single molecule real time)DNAシーケンシング法;ならびに、米国特許第7,170,050号;同第7,302,146号;同7,313,308号;および同第7,476,503号、米国特許公開公報第20130274147号;米国特許公開公報第20140038831号;およびMetzker, Nat Rev Genet 11(1):31−46(2010)に記載されるものを含む他の方法が、挙げられる。あるいは、ハイブリダイゼーションベースのシーケンス法または他のハイスループット法、たとえばマイクロアレイ解析、NANOSTRING、ILLUMINA、または他のシーケンシングプラットフォームも使用することができる。
用語「サブセット」は、本明細書中記載される同一のコア配列および異なるランダム化したヌクレオチドを有する一本鎖の核酸分子を表す。各セットの核酸分子はまた、3’位および5’位に、同じまたは異なる修飾を有し得る。特には、1つのセットの核酸分子は、同一の3’および/または5’位の修飾を含む。また、サブセットは、同一のコア配列を有する、特定の量または数の核酸分子を表す。
各サブセットは、約0.001〜50000amol、1〜10000amol、約1〜8000amol、10〜5000amolの量の核酸分子を含み得る。特に、サブセットは、約0.001、0.01、0.1、1、10、25、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000amolの量の核酸分子を含み得る。
用語「セット」は、同じまたは異なる量のオリゴヌクレオチドを含み得る、核酸分子の2つ以上のサブセットを表す。セットのサブセットの数は、2、3、4、5、6、7、8、9、10、またはそれ以上とすることができるが、これらに限定されるものではない。1つ以上のセットを、1つのシーケンシングに使用することができる。
本明細書中使用される場合、「複数の」核酸分子は、少なくとも2つのメンバーを含む。特定の状況では、複数は、少なくとも2、少なくとも5、少なくとも8、少なくとも10、少なくとも100、少なくとも1,000、少なくとも10,000、少なくとも100,000、少なくとも10、少なくとも10、少なくとも10または少なくとも10、またはそれ以上のメンバーを有し得る。特に、用語複数は、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、またはそれ以上のメンバーを表す。
本発明のセットは、実験、特にNGSのようなシーケンシング法における測定値を較正するために使用されるRNA転写物であるspike in プローブとして、使用することができる。spike inは、サンプルのセットを通して一定のレベルの外部参照(external reference)である。spike inは、異なるデータセット間の客観的な正規化を容易にできる、合成の、オリゴヌクレオチド、RNA、またはDNAの配列である。最適化された本発明のspike inは、これらspike inが、標的配列の特定の配列または領域とハイブリダイズしないか、または低いハイブリダイゼーションを示すように設計されている。本発明の既知の量のセットまたはオリゴヌクレオチドが、調製の間に、目的の配列と混合される。異なる量のサブセットを含有するspike inを、spike inカクテルとして使用することができる。好適には、spike inは、特に参照のセットとして、サンプルの調製の間の早い段階、特にアダプターのライゲーションまたは検出または定量化の方法の前に、この参照のセットが全てまたは大部分の調製ステップの間に存在するように添加される。シーケンシングの後に、spike inの配列のリードカウントを使用して、リードカウントと標的配列との間の直接的な対応が決定される。よって、定量化のため、実験用の遺伝子、エクソン、または標的配列の発現レベルを表すシグナル強度(リードカウント)は、既知の量を含み、絶対的な参照として定義された標準物質に関連している。発達の研究では、この技術は、転写の動態を決定するために使用される。本発明の発明のセットを使用することにより、これら遺伝子が全ての発達段階で同じレベルではほとんど発現しないので、内部のRNA標準の使用によるいずれの誤差をも回避する適切な対照を提供することができる。
「ミスマッチ」は、特には標的のヌクレオチド配列であるテンプレートのヌクレオチド配列と比較した、核酸塩基の変化を表す。特に、コアヌクレオチド配列は、セミランダム化(semi−randomized)配列である。特に、核酸塩基のミスマッチまたは点変異(特にコアヌクレオチドに導入されるもの)は、少なくとも2つの核酸塩基またはヌクレオチドの置換、挿入または欠失、コドンの置換、またはそれらの組み合わせからなる群から選択され、特に核酸塩基のミスマッチは、単一、二重、または三重の連続したミスマッチであり得る。
用語「ランダム化」または「ランダム化した配列」は、所定の領域における特定のヌクレオチド配列の修飾を表す。ランダム化は、核酸のレパートリーをもたらす。ランダム化は、原則上は、所定の長さにわたるいずれかの可能性のある配列を有する核酸のセグメントを説明するために使用される用語である。ランダム化した配列は、必要に応じて、約2ヌクレオチドから100超のヌクレオチドの範囲の、様々な長さとすることができる。ランダム配列のセグメントが作製される化学反応または酵素反応は、存在し得る未知のバイアスまたはヌクレオチドの優先度により、数学的にランダムな配列をもたらさない場合がある。現在知られている技術、たとえばシーケンシャルな化学合成において、大きな逸脱が起こることは知られていない。20ヌクレオチド以下の短いセグメントでは、存在し得るいずれかの小さなバイアスは、無視できる結果を有し得る。単一合成の配列が長いほど、いずれのバイアスの効果も大きくなる。
ランダムな核酸は、多くの方法により得ることができる。たとえば、完全なまたは部分的な配列のランダム化は、核酸(もしくはその一部)の直接的な化学合成、または核酸(もしくはその一部)が適切な酵素の使用により調製できるテンプレートの合成により、容易に達成することができる。非限定的な濃度の4つのヌクレオチド三リン酸塩の存在下でターミナルトランスフェラーゼにより触媒される末端の付加は、あるセグメントにランダム化した配列を付加することができる。
また、核酸における配列の多様性を、ゲノムDNA調製物または細胞のRNA調製物などの大きな天然の核酸の部分的に消化された(または切断された)調製物の大きさを選択したフラグメントを使用することにより、もたらすことができる。30ヌクレオチドのランダム化した配列は、計算された、1018個の異なる候補配列を含むであろう。
本発明のランダム配列は、「N」と表される。Nは、2、3、4、5、6、7、8、またはそれ以上の異なるヌクレオチドのランダムなオリゴヌクレオチド配列を含む。6以下、特には5以下、特には4以下のランダムな配列が好ましい。長さXの、可能性のあるヌクレオチド配列の数は、4であり、よって、短い長さであってもランダムなヌクレオチドが、多くの可能性のある固有のヌクレオチド配列をコードし得る。Nは、ヌクレオチドA、C、G、U、Tのいずれかであり得る。
ランダム配列は、それぞれの合成のテンプレートオリゴヌクレオチドを、正確に定量化することが可能である。合成のテンプレートオリゴヌクレオチドのプールを増幅させた後、シーケンシングのアウトプットで観察される固有のランダムヌクレオチド配列は、それぞれ、投入した材料の単一の分子を表す。よって、増幅反応に添加された合成のテンプレートオリゴヌクレオチドの投入された数は、固有のランダムなヌクレオチド配列の数を計測することにより決定することができる。さらに、合成のテンプレートオリゴヌクレオチドの投入された数は、特定のバーコードに関連している。
セミランダム配列は、異なる方法により作製され得る。例示的な、最もmiRNAが多いコア配列のmiRNAの位置(miRNAの5’末端から計測)に関する塩基の同一性の比率からなるマトリックスを、作製することができ、これを使用して、特定の長さ、たとえば8〜21ヌクレオチド、特には、13ヌクレオチドの長さを有する、数百および最大1000以上の配列をセミランダムに選択することができる。目的のゲノムと完全にそろわない配列を、さらに考察してもよく、可能性のある全ての4塩基の組み合わせを、ランダム配列として、5’末端および3’末端の両方に付加することによりセットあたりの全体の配列を作製することができる。全ての合成されたRNAの最小自由エネルギーを、当該分野で知られている方法を使用して決定することができる。これらの最小自由エネルギーの分布を調べることができ、注釈が付されたmiRNAに類似する分布を有するRNA配列のセットを、選択および合成することができる。
一実施形態では、コア配列は、セミランダム化により作製されたヌクレオチド配列を含む。
また、単一のヌクレオチドの変更によりそれぞれが異なる、バリアントオリゴヌクレオチドのプールからなる、セミランダム配列のライブラリーを、使用してもよい。
本発明は、配列データ、特にsmallRNAの配列データの絶対的な正規化のための方法、およびオリゴヌクレオチドサブセットのセットであって、上記セットが、一本鎖核酸分子の少なくとも2つのサブセットを含み、各核酸分子が、5’から3’の方向に、
a)5’末端にリン酸塩と、
b)少なくとも3つのランダム化したヌクレオチドの配列と、
c)標的配列と比較して配列が少なくとも2つのミスマッチを含む少なくとも8つのヌクレオチドのコア配列と、
d)少なくとも3つのランダム化したヌクレオチドの配列と、
e)3’末端に修飾と
を含み、
各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の核酸分子を含み、
各サブセットの核酸分子が、上記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
方法およびセットを提供する。
好ましい実施形態では、コア配列は、標的配列に相補的ではない。特に、コア配列は、標的配列とハイブリダイゼーションを行わないか、または標的配列に結合しない。
5’末端のリン酸塩は、一リン酸塩、二リン酸塩、または三リン酸塩とすることができる。
3’末端の修飾は、2’−Oメチル化、すなわち2’−Oメチル基が3’末端に結合する2’−Oメチル化、またはヒドロキシル化、すなわちヒドロキシル基がオリゴヌクレオチドの3’末端に結合するヒドロキシル化、とすることができる。
コアヌクレオチド配列は、シーケンシングのためのspike inとして使用するために適切な任意の長さとすることができるが、この長さは、8〜25ヌクレオチド、好ましくは10〜20ヌクレオチド、好ましくは12〜18ヌクレオチド、好ましくは12、13、14、15、16、17、または18ヌクレオチドであることが好ましい。
特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−2’−O−メチル
の核酸分子を含む:
(式中、
pは、一リン酸塩であり、
Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
Xは、A、U、G、Cのいずれかであり、
mは、3、4、または5であり
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−2’−O−メチル
の核酸分子を含む:
(式中、
pは、一リン酸塩であり、
Nは、A、T、G、Cのいずれかのランダムヌクレオチドであり、
Xは、A、T、G、Cのいずれかであり、
mは、3、4、または5であり
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−2’−O−メチル
の核酸分子を含む:
(式中、
pは、一リン酸塩であり、
Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
Xは、A、U、G、Cのいずれかであり、
mは、4であり
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−2’−O−メチル
の核酸分子を含む:
(式中、
pは、一リン酸塩であり、
Nは、A、T、G、Cのいずれかのランダムヌクレオチドであり、
Xは、A、T、G、Cのいずれかであり、
mは、4であり
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)XXXXXXXXXXXXX(N)−2’−O−メチル
の核酸分子を含む:
(式中、
pは、一リン酸塩であり、
Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、U、G、Cのいずれかであり、
mは4である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)XXXXXXXXXXXXX(N)−2’−O−メチル
の核酸分子を含む:
(式中、
pは、一リン酸塩であり、
Nは、A、T、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、T、G、Cのいずれかであり、
mは、4である)。
本発明の一実施形態では、(X)または(X)13は、標的配列と比較して少なくとも2つのミスマッチを配列が含むコア配列であり、たとえば、標的配列と相補的ではないか、または同一ではなく、特にこれは、セミランダム配列である。
上記に列挙したサブセットのうちの1つ以上を含むセットは、植物の内在性smallRNAまたはDNAを模倣したspike inとして、有用であり得る。
具体的には、各セットは、SEQ ID NO:1〜8のうちの1つを含む。
さらなる代替的な実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−OH
の核酸分子を含む:
(式中、
pは、二リン酸塩または三リン酸塩であり、
Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、U、G、Cのいずれかであり、
mは、3、4、または5であり、
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−OH
の核酸分子を含む:
(式中、
pは、二リン酸塩または三リン酸塩であり、
Nは、A、T、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、T、G、Cのいずれかであり、
mは、3、4、または5であり、
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−OH
の核酸分子を含む:
(式中、
pは、二リン酸塩または三リン酸塩であり、
Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、U、G、Cのいずれかであり、
mは、4であり、
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)(x)(N)−OH
の核酸分子を含む:
(式中、
pは、二リン酸塩または三リン酸塩であり、
Nは、A、T、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、T、G、Cのいずれかであり、
mは、4であり、
nは、8、9、10、11、12、13、14、15、16、17、18、19、または20である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)XXXXXXXXXXXXX(N)−OH
の核酸分子を含む:
(式中、
pは、二リン酸塩または三リン酸塩であり、
Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、U、G、Cのいずれかであり、
mは、4である)。
さらなる特定の実施形態では、本発明に係るサブセットは、具体的には、5’から3’の方向に、以下の一般式:
p−(N)XXXXXXXXXXXXX(N)−2’−O−メチル
の核酸分子を含む:
(式中、
pは、二リン酸塩または三リン酸塩であり、
Nは、A、T、G、Cのいずれかのランダムヌクレオチドであり、
Xは、互いに独立して、A、T、G、Cのいずれかであり、
mは、4である)。
本発明の一実施形態では、(X)または(X)13は、標的配列と比較して少なくとも2つのミスマッチを含むコア配列であり、たとえば、標的配列に相補的ではないか、または標的配列と同一ではなく、具体的には、これはセミランダム配列である。
上記に列挙したサブセットのうちの1つ以上を含むセットは、動物または植物の内在性smallRNAまたはDNAを模倣したspike inとして、有用であり得る。
シーケンシング方法に使用するための核酸のライブラリーは、所望の長さの標的の核酸分子または標的配列のフラグメントと、オリゴヌクレオチドを含む1つ以上のセットを混合し、この核酸鎖を二本鎖DNAに変換し、フラグメント/オリゴヌクレオチドの末端にアダプターを結合させ、シーケンシングのための最終的なライブラリー産物を定量化することにより、作製することができる。
ヌクレオチドシーケンスにおける参照値は、目的の標的配列の混合物に異なる量の本発明のサブセットを含むセットを添加することにより、核酸分子のライブラリーを作製するステップと、核酸分子にアダプターをライゲートするステップと、ライブラリーの核酸分子を増幅するステップと、核酸分子をシーケンシングするステップと、参照値としての各サブセットの核酸分子の絶対量を決定するステップと、任意に次に、参照値と標的の核酸分子の量を比較するステップとにより、決定することができる。
好適には、ライブラリーは、整合性の高い、コーディングRNA、ノンコーディングRNA、アンチセンスRNA、および遺伝子間のRNAを含む、トランスクリプトーム全体を網羅している。あるいは、ライブラリーは、コーディングmRNA転写物のみを包有しているか、またはさらなる代替策として、smallRNA、たとえばmiRNA、snoRNA、piRNA、snRNA、およびtRNAがプロファイリングされている。
smallRNAは、500未満のnt(ヌクレオチド)長であり、通常、ノンコーディングRNA分子である。RNAのサイレンシングは、多くの場合、これら分子の機能であり、ここで最も一般的な良好に試験された例は、RNA干渉(RNAi)であり、内在性の発現したmicroRNA(miRNA)または外来性の生成された低分子干渉RNA(siRNA)は、相補的なメッセンジャーRNAの分解を誘導する。piRNA(piwi−interacting RNA)、核小体低分子RNA(small nucleolar RNA:snoRNA)、tsRNA(tRNA−derived smallRNA)、srRNA(small rDNA−derived RNA)、核内低分子RNA、およびその亜種のrasiRNA(repeat associated small interfering RNA)、SRP RNA(Signal recognition particle RNA)、7SK 核内低分子RNA、RNase、およびMRPRNAを含む他のクラスのsmallRNAが同定されている。
シーケンシングライブラリーを調製する場合、主な目的は、バイアスを低減することである。
バイアスは、実験の設計による、データの組織的な歪曲として定義することができる。本発明のセットおよびその使用は、好適には、バイアスを著しく最小限にするか、またはバイアスを排除する。絶対数、たとえば分子の数を決定できる方法を提供することにより、動的なsmallRNAの集合またはこれら集合を変える変異と、様々な組織由来のsmallRNAの配列データを比較することが可能である。
よって、本発明のspike inおよび方法は、異なる細胞種由来のsmallRNA分子の複製数を比較することに特に好適である。よって、たとえば、異なる臓器または組織または区画由来のsRNAの下位集合を比較することができ、上記方法は、データ正規化のために使用することができる。特に、異なるsmallRNAの集合を有する組織、臓器、または区画由来のsRNA配列データの絶対的な正規化を決定することができ、よって、全体および個々のsRNAのレベルの正確な比較を可能にすることができる。
本発明は、サンプルにおける核酸の数を決定するための新規の方法であって、本発明のオリゴヌクレオチドのセットを上記サンプルに添加して核酸分子の混合物を入手することにより、核酸分子のライブラリーを作製し、アダプターを上記ライブラリーの核酸分子にライゲートし、任意選択で上記ライブラリーを増幅させ、上記増幅したライブラリーの次世代シーケンシングを行うことにより、上記核酸分子からのRNA配列の読み取りをもたらし、上記セットおよび上記サンプルからの読み取りの数を決定する、方法を提供する。次に、上記セットの読み取りの数を、目的のゲノム由来の標的配列にアライメントしてもよく、同一のコア配列を含む読み取りは、任意選択で、さらなる解析のためまとめてグループ分けされている。
サンプルにおける1つ以上の標的配列の量を、決定することができ、任意選択で、サンプルの核酸分子の相対的な定量化(たとえばreads per million)、またはサンプル中の核酸分子の絶対的な定量化(マイクログラムあたりの分子)を、決定することができる。
さらに、本発明の参照値を決定するための方法は、異なる供給源由来のsRNA配列データを正規化するため、およびsRNAライブラリーの調製の間に起こるクローニングのバイアスを評価するために、使用することができる。
さらに本発明は、以下の付記項を包有する。
1.一本鎖核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子が、5’から3’への方向に、
a)5’末端にリン酸塩と、
b)少なくとも3つのランダム化したヌクレオチドの配列と、
c)標的配列と比較して2つ以上のミスマッチを含む少なくとも8つのヌクレオチドのコア配列と、
d)少なくとも3つのランダム化したヌクレオチドの配列と、
e)3’末端に修飾と
を含み、
各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の核酸分子を含み、
各サブセットの核酸分子が、前記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
セット。
2.一本鎖核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子が、5’から3’への方向に、
a)5’末端にリン酸塩と、
b)少なくとも3つのランダム化したヌクレオチドの配列と、
c)標的配列と比較して配列が2つ以上のミスマッチを含む少なくとも8つのヌクレオチドのコア配列と、
d)少なくとも3つのランダム化したヌクレオチドの配列と、
e)3’末端に修飾と
を含み、
各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の核酸分子を含み、
各サブセットの核酸分子が、前記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
セット。
3.一本鎖核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子が、
a)5’末端にリン酸塩と、
b)少なくとも3つのランダム化したヌクレオチドの配列と、
c)標的配列と比較して2つ以上のミスマッチを含む少なくとも8つのヌクレオチドのコア配列と、
d)少なくとも3つのランダム化したヌクレオチドの配列と、
e)3’末端に修飾と
からなり、
各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の核酸分子を含み、
各サブセットの核酸分子が、前記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
セット。
4.前記ランダム化したヌクレオチド配列が、A、C、G、U、またはA、C、G、Tのいずれか1つである、付記項1〜3のいずれか1項に記載のセット。
5.前記複数の核酸分子が、A、C、G、U、またはA、C、G、Tの全ての4つのヌクレオチドの組み合わせを含むランダム化したヌクレオチド配列を含む、付記項1〜4のいずれか1項に記載のセット。
6.前記核酸分子が、RNA分子、特にはsmallRNAを模倣したRNA分子である、付記項1〜5のいずれか1項に記載のセット。
7.smallRNAが、siRNA、tasiRNA、snRNA、miRNA、snoRNA、piRNA、およびtRNA、またはそれらの前駆体からなる群から選択される、付記項1〜6のいずれか1項に記載のセット。
8.前記コアヌクレオチド配列が、8〜25個のヌクレオチド、好ましくは10〜20個のヌクレオチド、好ましくは12〜18個のヌクレオチド、好ましくは13個のヌクレオチドを含む、付記項1〜7のいずれか1項に記載のセット。
9.前記各サブセットのコアヌクレオチド配列が、1、2、3、4、5、6、7、8、9、10個、またはそれ以上のヌクレオチドにおいて異なる、付記項1〜8のいずれか1項に記載のセット。
10.前記コアヌクレオチド配列が、セミランダム配列である、付記項1〜9のいずれか1項に記載のセット。
11.前記コアヌクレオチド配列が、目的の生物のゲノムまたはトランスクリプトームと異なる、付記項1〜10のいずれか1項に記載のセット。
12.前記ランダム化したヌクレオチドの配列が、3〜7個のヌクレオチド、好ましくは3〜5個のヌクレオチド、好ましくは4個のヌクレオチドを含む、付記項1〜11のいずれか1項に記載のセット。
13.5’末端のリン酸塩が、一リン酸塩、二リン酸塩、および三リン酸塩の群から選択される、付記項1〜12のいずれか1項に記載のセット。
14.3’末端の修飾が、2’−O−メチル化およびヒドロキシル化からなる群から選択される、付記項1〜13のいずれか1項に記載のセット。
15.3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24個、またはそれ以上のサブセットを含む、付記項1〜14のいずれか1項に記載のセット。
16.前記サブセットが、1〜10000amol、好ましくは10〜5000amolの量で存在する、付記項1〜15のいずれか1項に記載のセット、
17.異なる量の各サブセットを含む、付記項1〜16のいずれか1項に記載のセット。
18.前記標的配列が、目的のいずれかの配列、特には生物のゲノムまたはトランスクリプトーム、ウイルス、細菌、動物、植物由来の配列、特には、RNA、特にはsmallRNA、特には動的なsmallRNAとすることができる、付記項1〜17のいずれか1項に記載のセット。
19.シーケンシングデータを正規化するためのspike in プローブとしての、付記項1〜18のいずれか1項に記載のセットの使用。
20.付記項1〜18のいずれか1項に記載のセットを使用して、サンプル、特には細胞、組織、または臓器のサンプルにおける1つ以上の標的配列の絶対量を決定するための方法。
21.シーケンシング法に使用するための核酸のライブラリーを作製するための方法であって、付記項1〜18のいずれか1項に記載の1つ以上のセットを、標的の核酸分子と混合する、方法。
22.前記核酸ライブラリーが、smallRNAを含む、付記項21に記載の方法。
23.さらに前記ライブラリーを増幅する、付記項21または22に記載の方法。
24.ヌクレオチドシーケンシングにおける参照値を決定するための方法であって、
標的配列の混合物に、付記項1〜18のいずれか1項に記載のセットを添加することにより、核酸分子のライブラリーを作製するステップと、
前記ライブラリーにアダプターをライゲートするステップと、
任意選択で前記ライブラリーを増幅するステップと、
ヌクレオチドのシーケンシング法を行うステップと、
参照値として各サブセットの核酸分子の量を決定するステップと
を含む、方法。
25.標的配列の絶対量を決定するための方法であって、前記標的配列の量を、付記項24に記載の方法により得られる参照値と比較する、方法。
26.異なる細胞種由来のsmallRNA分子の複製数を比較する、付記項25に記載の方法。
27.サンプルにおける核酸分子の数を決定するための方法であって、
a)付記項1〜18のいずれか1項に記載のセットを、前記サンプルに添加して、核酸分子の混合物を得ることにより、核酸分子のライブラリーを作製するステップと、
b)前記ライブラリーを増幅するステップと、
c)前記核酸分子からRNA配列の読み取りをもたらす、前記ライブラリーの次世代シーケンシングを行うステップと、
d)前記セットおよび前記サンプルからの読み取りの数を決定するステップと
を含む、方法。
28.前記セットの読み取りの数を、標的配列、たとえば目的のゲノム由来の標的配列にアライメントし、同一のコア配列を含む読み取りを、任意選択で、さらなる解析のためまとめてグループ分けする、付記項26に記載の方法。
29.前記サンプルにおける1つ以上の標的配列の量を決定するための、付記項24〜28のいずれか1項に記載の方法。
30.サンプルにおけるsmallRNA分子の絶対的な定量化のための、付記項24〜28のいずれか1項に記載の方法。
31.異なる供給源由来のsRNA配列データを正規化するための、付記項24〜28のいずれか1項に記載の方法。
32.sRNAライブラリーの調製の間に起こるクローニングのバイアスを評価するための、付記項24〜28のいずれか1項に記載の方法の使用。
33.一般式:
p−(N)(x)(N)−2’−O−メチル
により記載されるオリゴヌクレオチド:
(式中、
Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
Xは、標的配列と比較して、1つ以上のミスマッチを含み、A、U、G、Cのいずれかを含む8、9、10、11、12、13、14、15、16、17、または18ヌクレオチド長を有する、コア配列であり、
mは、3、4、または5である)。
34.付記項33に記載の少なくとも2つの異なるオリゴヌクレオチドを使用する、シーケンシングのためのspike inを調製するための方法。
35.前記spike inが、A、U、C、Gの可能性のある全てのヌクレオチドの組み合わせを含む、付記項32に記載の複数のオリゴヌクレオチドを含む、付記項34に記載の方法。
本発明は、さらに以下の実施例により例示されるが、これらに限定されるものではない。
実施例
方法
植物の材料
dcl234変異体は、以前に記述されているように、dcl2−1、dcl3−1、およびdcl4−2tのアレルから構成されていた17。植物は、16時間の明期/8時間の暗期で、20℃〜22℃に制御された成長チャンバーの中で成長させた。Col−0の葉のサンプルは、ロゼットに由来するものであり、茎生葉を、4〜6週齢の植物から単離した。開花していない花芽を、葉のサンプルと同じ植物(Col−0の花)または同一条件下で成長させたdcl234の植物(dcl234の花)から、回収した。
sRNA spike−inの設計
上位50の、最も豊富なmiRNAの5〜17位(miRNAの5’末端から計測)のmiRNAに関する塩基同一性の割合からなるマトリックスを作製し、1000個の13nt配列をセミランダムに選択するために使用した。シロイヌナズナ(Arabidopsis thaliana)のCol−0のゲノムに完全にアライメントしなかった252の配列をさらに考察し、256個の可能性のある全ての4塩基の組み合わせを、5’末端および3’末端の両方に付加し、セットあたり65,536の総配列を作製した。65,356の配列の252セットの中の全ての21ntのRNA最小自由エネルギーを、RNAfoldを使用して決定した25。次に、最小自由エネルギーの分布を試験し、注釈が付されたmiRNAに類似の分布を有する21ntのRNA配列の8つのセットを、合成に選択し、Integrated DNA Technologies(IDT)から注文した。この混合比は、注釈が付されたArabidopsisのmiRNAの動的な範囲に及ぶように組み立てられた。
smallRNA spike inのオリゴヌクレオチドの設計。smallRNA spike inの鍵となる特性を、この鍵に対応して太線またはイタリック体で示す。総RNA(μg)あたりの付加されたオリゴヌクレオチドのモル量は、括弧で表されている。
Figure 2020519256
5’末端のリン酸塩および2’−O−メチル基を含むRNAオリゴは、内在性smallRNAを模倣しており;この例は、典型的な植物のsmallRNAおよび動物のsi−RNAに関するものであり得るが、2’−O−メチル(2’−O−me)基は、基準の動物のmicroRNAを模倣するために、ヒドロキシル基と置き換えられ得ることが可能であった。
5’末端および3’末端にある4つのランダム化したヌクレオチドは、それぞれのオリゴが4(65,536)個の可能性のある組み合わせを有し、(絶対的な分子の定量化に関する)正確な標準曲線の作製およびクローニングのバイアスの検出を可能にする。
セミランダムなゲノムに一致しない(non−genome−matching)コア 13量体。上記の設計は、Arabidopsisに関するものであり、恐らくは、多くの他の植物に適しているだけでなく、いずれの生物にも適合し得るものであった。
RNAのシーケンシング
図1aで示されるsRNA spike inの混合物を、2倍に希釈し、500ngの総RNAに添加した後、ポリアクリルアミドゲルのサイズセレクション、次いでNEBnext smallRNA library prep kit for Illumina(NEB)を使用してsRNAクローニングを行った。ERCC spike−in mix(LifeTech)を200倍に希釈し、1μlを、500ngの総RNAに添加した。10ngの総RNAを使用して、Picelli et alらが記載する通り26mRNA−Seqライブラリーを作製した。サンプルを、Illumina Hi−Seq 2500のシーケンシング機において、シングルリード50bp(sRNA−Seq)モードまたはペアエンドリード50bp(mRNA−Seq)モードのいずれかでシーケンシングを行った。
データ解析
アダプター配列を除去した後に、sRNA−Seqの読み取りを、完全な一致を必要とし、読み取りあたり最大100のアライメントを可能にするBowtie short−read aligner27を使用して、sRNA spike−inを伴うシロイヌナズナ(Arabidopsis thaliana)Col−0のゲノム(TAIR10)にアライメントした(表1および2)。次に、共通する13nt配列のsRNA spike−inを含む読み取りを、さらなる解析のためまとめてグループ分けした。
Figure 2020519256
Figure 2020519256
次に、smallRNA−Seqの読み取りを、それらが、20〜22nt長であり、それぞれmiRBase2128およびAllen et al.29における注釈に従いmiRNAおよびtasiRNAのセンス鎖の±2nt以内に含まれていた場合、成熟したmiRNAまたはtasiRNAにアライメントした。次に、一般的なファミリーに属している個々のmiRNAまたはtasiRNAに関する値を、合計し、個々のファミリーに関する読み取りの総量を入手した。20〜22nt長または23〜24nt長のいずれかであり、TAIR10の注釈が付されたトランスポゾン(すなわち転位性のエレメントおよび転位性のエレメントの遺伝子)のいずれかの鎖と重複したsmallRNAの読み取りを、マッピングしたトランスポゾンにしたがいグループ分けした。ペアエンドのmRNA−Seqの読み取りを、RSEM30を使用して、シロイヌナズナ(Arabidopsis thaliana) Col−0のゲノム(TAIR10)およびERCC spike−inにアライメントした。最大20のアライメントを伴う読み取りを保持し、Araport11の注釈31に基づき、ERCCのspike inまたは転写物のモデルに割り当てた。統計的な解析およびグラフィックスを、R32を用いて行った。
sRNA−Seqのデータの絶対的な正規化のための外来性sRNA spike−inのセットを作製するために、本出願人らは、3つの主な特性を有する21ヌクレオチド(nt)のRNAオリゴヌクレオチドを設計した(図1a)。第1に、sRNA spike−inは、内在性植物のRNAを模倣するために、5’末端の一リン酸塩および2’−O−メチル基を含んでいた。2’−O−メチル基は、植物のsmallRNAに共通しているが14、この修飾は、たとえば動物のmiRNAを調査する場合には除外することが可能であった。第2に、sRNA spike−inは、目的のゲノム(たとえばこの試験ではシロイヌナズナ(Arabidopsis thaliana))に一致しないセミランダムな13ntのコア配列を含んでいた。第3に、これらのセミランダムな13ntのコア配列は、5’末端および3’末端の両方に、4つのランダム化したヌクレオチドのセットが配置されている。異なる13ntのコア配列を含む8つのsRNA spike−inを設計し、図1aに示すように特定のモル比で混合した。これらを、総RNAに添加した後、sRNA−Seqライブラリーの調製を行った。シーケンシング後に、非ゲノムに一致する13ntの固有のタグを使用して、各sRNA−spike−inに特に由来する読み取りを定量化した。これら13ntのコア配列は、それぞれ、最大65,536の可能性のある21ntの配列により表すことができる。個々のsRNA配列は、様々な特性、たとえば最終的なsRNA−Seqライブラリーにおけるそれらの表示にバイアスをかける二次構造を有するため11−13、それぞれの13ntのsRNAのコア配列に割り当てられ得る多数の様々な配列は、総じて、各spike inのセットのクローニングのバイアスを最小限にすることが予測される。よって、sRNAのspike inは、総RNA(μg)あたりの分子(MPU)の観点から、絶対的なデータの正規化に関する標準曲線の確固たる作製を可能にした(図1b)。ほぼ完全な正の相関(全てが、Pearsonのr値≧0.99およびP<7.42×10−6を有した)が、sRNA−Seqにより記録される相対的なRPMレベル、および各サンプルに添加したsRNAのspike inの既知の絶対的なMPU量をプロットした際に、観察された(図1b)。概念実証として、相対的な値と絶対的な値との間の高度に線形の関係を使用して、野生型(Col−0)の花から単離した総RNA(μg)あたりのmiRNA分子の数を予測するための線形モデルを作製した(図1c)。
sRNAのspike inは、正確なデータの正規化を可能にしたため(図1)、本出願人らは、相対的なRPMおよび絶対的なMPUのタームでsRNAの下位集合を比較して、2つの正規化の手法が異なる結果をもたらすかどうかを判定した。同様の解析がいずれの種でも行うことができたが、本出願人らは、良好に注釈が付されたsRNAおよび転写物、容易に利用可能な異なる組織種、および主要なsRNAの下位集合を欠いている生存可能な変異体のため、sRNAのspike inの有用性を試験するためにシロイヌナズナ(Arabidopsis thaliana)を試験した。植物のsRNAの集合は、4つの主なクラス:タンパク質をコードする遺伝子を転写後に制御する傾向のある20〜22ntのmicroRNA(miRNA)およびtrans−acting siRNA(tasiRNA)、ならびに、通常トランスポゾンから生じ、トランスポゾンをサイレンシングする20〜22ntおよび23〜24ntの低分子干渉RNA(siRNA)からなる15。sRNAの下位集合の割合は、花と葉とで異なり(図4)、相対的に正規化した葉および花のsRNAの値の比較では誤差が生じやすい。たとえば、Col−0の花およびCol−0の葉のそれぞれのsRNAの集合の30%および53%が、20〜22ntの配列から構成されていたが(図4a〜c)、これは、葉に20〜22ntより多くのsRNAが絶対的に存在するかどうか、またはこの相対的な増加が単に花の組織と比較した葉における23〜24ntのsiRNAのレベルの低減によるものであるかどうかを決定することはできない。sRNAのspike inを使用することにより、本出願人らは、Col−0の花および葉におけるsRNAの下位集合に関する相対的な正規化および絶対的な正規化の方法を比較した。この2つの正規化の方法は、異なる結果をもたらした。たとえば、総miRNAのレベルは、Col−0の花と比較してCol−0の葉において有意に高いRPMを有し(1.7倍;;P=3.2×10−3;2つのサンプルのスチューデントt検定)、miRNAの絶対数は、Col−0の花と比較してCol−0の葉において有意ではなく(nonsignificantly)1.5倍低下している(P=0.13;2つのサンプルのスチューデントt検定)(図4e、f)。さらに、相対的ではない、絶対的な正規化は、miRNAのファミリーが、Col−0の葉と比較してCol−0の花において有意に大きなレベルを有することを示している(図2a、b)。(P=4.1×10−3;2つのサンプルコルモゴロフ−スミルノフ検定)。よって、sRNA−Seqの相対的な正規化の後に組織種間の比較を行うことは、誤解を招く結果をもたらす場合があり、このことは、sRNAのspike inの使用を介して軽減される。
さらに、sRNAの集合の変化がどのように相対的な正規化に影響し得るかを試験するために、本出願人らは、siRNA欠失型の花由来のsRNA−Seqライブラリーを作製し、これらを、Col−0の花のデータセットと比較した。より具体的には、本出願人らは、DICER−LIKE2(DCL2)、DCL3、およびDCL4のリボヌクレオチドをコードする3つの遺伝子におけるヌル変異を有する花(すなわちdcl234の花)由来のsRNA−Seqライブラリー作製した。DCL3およびDCL4は、それぞれ、23〜24ntのsiRNAおよびtasiRNAのバイオジェネシスに必要である16−20(図4c)。よって、dcl234の花は、低いレベルのtasiRNAおよび23〜24ntのsiRNAを有することが予測される。20〜24ntのsiRNAのレベルにおける相対的および絶対的な正規化の方法の比較は、同様の結果をもたらした(図4のd、e、および図2のa、b)。しかしながら、総tasiRNAに関する相対的なRPMのレベルは、Col−0の花と比較してdcl234の花において有意に低減せず;対して総tasiRNAに関する絶対的なMPUは、有意に低減した(PRPM=0.08、PMPU=0.04;2つのサンプルのスチューデントt検定)(図4のd、e)。相対的に正規化したtasiRNAのファミリーおよび絶対的に正規化したtasiRNAのファミリーのレベルは、dcl234の花において有意に低減したが、この減少は、絶対的なタームを使用した場合により顕著となる(PRPM=1.0×10−3、PMPU=1.6×10−4;2つのサンプルのコルモゴロフ−スミルノフ検定(図2a、b)。また、本出願人らは、miRNAの総数が、Col−0の花と比較してdcl234の花において有意に高いRPMおよびMPUの両方を有することを見出した(PRPM=0.04、PMPU=0.02;2つのサンプルのスチューデントt検定)(図4のa、b)。よって、siRNAの非存在下では、miRNAは、以前に提案された通り増大した21
個々のsRNAのレベルは、多くの場合、特定のsRNAがいつおよびどこで最も多く存在するかを決定するために、様々な組織種からのRNA−Seqのデータセットを通して比較される。本出願人らは、2つの正規化の方法が異なる結果をもたらすかどうかを判定するために、Col−0の花対Col−0の葉またはscl234の花における93のmiRNAのファミリーに関する、相対的に正規化した値および絶対的に正規化した値を比較した。実際に、RPMベースの値の比較から、13および6つのmiRNAのファミリーが、それぞれ、Col−0の花と比較してCol−0の葉においてそれぞれ増加したレベルおよび減少したレベルを有することが示唆される(図2c)。対照的に、花におけるより高い絶対的なmiRNAレベルのため(図4eおよび図2b)、MPUベースの値の比較は、花と比較してCol−0の葉においてmiRNAファミリーが増加せず、19のmiRNAのファミリーが、Col−0の葉において減少することを表す(図2d)。さらに、35のmiRNAのファミリーは、RPMの値に基づきCol−0の花と比較してdcl234において増加したレベルを有し、対して16のmiRNAのファミリーのみが、比較のためMPU値を使用した際に、Col−0の花と比較してdcl234の花において増加する(図2c、d)。本出願人らの結果に基づき、異なる基本smallRNAの集合を伴う組織由来のsRNA−Seqの絶対的な正規化は、総sRNAのレベルおよび個々のsRNAのレベルのより正確な比較を可能にする。
sRNAのレベルとそれらの前駆体または標的の存在量との間の関係は、miRNAのバイオジェネシスおよび機能を理解するために重要である。smallRNAおよびそれらのより長いRNA前駆体/標的は、選択およびRNA−Seqライブラリーへのクローニングに関して異なる手法を必要とするため、sRNAとそれらの前駆体または標的との間の化学量論を推定するために相対的な正規化の手法を使用することは不可能である。本出願人らは、市販のmRNA spike−in(ERCC spike−in mix;LifeTech)と共にsRNA spike−inが、sRNA−SeqのデータセットとmRNA−Seqのデータセットの間の相互比較を可能にするかどうかを試験した。より具体的には、本出願人らは、上述のsRNA−Seqのデータセットを作製するために使用した同じ総RNAサンプルから、mRNA−Seqのデータセットを作製し、ERCC spike−in mixを総RNAに添加した後に、mRNA−Seqライブラリーの構築を行った。ERCCの転写物の相対数(TPM:transcripts per kilobase million)と、既知の、総RNA(μg)あたり添加された分子の数との間にある強力な正の相関が、少なくとも0.96のピアソンのr値およびP<1.44×10−12を有し、6つ全てのデータセットで観察された(図3aおよび図5a−e)。次に、本出願人らは、これらの関係を使用して線形モデルを作製し、これらをTPM≧1.0のmRNAに適用して、6つ全てのデータセットにおけるゲノムワイドなmRNA MPUを推定した。このことによって、その後本出願人らは、成熟したsRNAのMPUを、それらの前駆体または標的のいずれかのMPUと比較することができた。本出願人らは、miRNA/前駆体の比が、Col−0の葉、Col−0の花、およびdcl234の花において類似している(ここでそれぞれのmiRNA/前駆体の比の中央値は2.1、1.6、および1.5である)ことを見出した(図3b)。tasiRNAとそれらの前駆体との間の比は、Col−0の葉およびCol−0の花におけるmiRNA/前駆体の比よりも高いが、有意に異なるものではなく、ここでのtasiRNA/前駆体の比の中央値は、それぞれ、3.7および4.4であった(図3b)。対照的に、tasiRNA前駆体は、dcl234の花において、成熟したtasiRNAのレベルよりも存在量が多く、ここでの前駆体の中央値は、tasiRNAよりも42.4倍多かった(図3b)。このことは、tasiRNAのバイオジェネシスに関するDCL4の既知の要件、および対応するdcl234の組織におけるtasiRNA前駆体のレベルの増加と一致している16−18,20,22
次に、本出願人らは、ゲノムワイドなmiRNAとそれらの標的との間の化学量論を調査した。本出願人らは、公的に入手可能なCol−0の花由来のsRNA切断産物のデータセット(すなわちdegradomeデータセット)を使用して、miRNAおよびtasiRNAの標的を選択した23、24。miRNAとそれらの標的との間の比は、Col−0およびdcl234の花においては有意に異なるものではなく、それぞれ、3.9および0.63の中央値の値を有していた。対照的に、tasiRNA/標的の比は、予測されるようにCol−0およびdcl234の花において有意に異なっており(P=5.0e−16;2つのサンプルのコルモゴロフ−スミルノフ検定)、ここで、標的のMPUは、tasiRNAのMPUと比較して、それぞれ1.5倍および210.8倍であった(図3c)。よって、mRNA spike−inと組み合わせた、sRNA spike−inは、前駆体:sRNAおよびsRNA:標的の化学量論のゲノムワイドな推定を可能にする。
smallRNA spike−inは、その後の解析のためアライメント可能な読み取りのうち1〜2%のみを必要とするsRNA−Seq実験に有用な内部標準となるだけでなく、異なる治療、組織種、または研究グループ由来のsRNA−Seqデータを正規化するために使用することもできる。さらに、これらは、sRNA分子の絶対的な定量化を可能にし、このことは、正確な比較、ならびに、分子スケールでこれらの関係を理解するために重要である、前駆体:sRNAおよびsRNA:標的の化学量論のゲノムワイドな推定に、重要であり得る。最後に、sRNA spike−inは、様々なsRNA−Seqライブラリーの作製プロトコルに存在するクローニングのバイアスに関して評価および改善するために、使用することができる。
参照文献
1.Meyer, S. U., Pfaffl, M. W. & Ulbrich, S. E. Biotechnol Lett 32, 1777−1788 (2010).
2.Malone, C. D. et al. Cell 137, 522−535 (2009).
3.Farh, K. K. et al. Science 310, 1817−1821 (2005).
4.Stark, A., Brennecke, J., Bushati, N., Russell, R. B. & Cohen, S. M. Cell 123, 1133−1146 (2005).
5.Breakfield, N. W. et al. Genome Research 22, 163−176 (2012).
6.Rajagopalan, R., Vaucheret, H., Trejo, J. & Bartel, D. P. Genes & Development 3407−3425 (2006).
7.Martinez, G., Panda, K., Kohler, C. & Slotkin, R. K. Nature Plants 1−8 (2016).
8.Fahlgren, N. et al. RNA 15, 992−1002 (2009).
9.Powers, J. T. et al. Nature 535, 246−251 (2016).
10.Locati, M. D. et al. Nucleic Acids Research 43, e89−e89 (2015).
11.Hafner, M. et al. RNA 17, 1697−1712 (2011).
12.Jayaprakash, A. D., Jabado, O., Brown, B. D. & Sachidanandam, R. Nucleic Acids Research 39, e141−e141 (2011).
13.Sorefan, K. et al. Silence 3, 1−1 (2012).
14.Yu, B. et al. Science 307, 932−935 (2005).
15.Matzke, M. A. & Mosher, R. A. Nature Reviews Genetics 15, 394−08 (2014).
16.Gasciolli, V., Mallory, A. C., Bartel, D. P. & Vaucheret, H. Current Biology 15, 1494−1500 (2005).
17.Henderson, I. R. et al. Nat Genet 38, 721−725 (2006).
18.Howell, M. D. et al. The Plant Cell 19, 926−942 (2007).
19.Yoshikawa, M. Genes & Development 19, 2164−2175 (2005).
20.Xie, Z. et al. PLoS Biology 2, 0642−0652 (2004).
21.Yu, B. et al. Nucleic Acids Research 38, 5844−5850 (2010).
22.Yoshikawa, M., Peragine, A., Park, M. Y. & Poethig, R. S. Genes & Development 19, 2164−2175 (2005).
23.Addo−Quaye, C., Eshoo, T. W., Bartel, D. P. & Axtell, M. J. Current Biology 18, 758−762 (2008).
24.Addo−Quaye, C., Miller, W. & Axtell, M. J. Bioinformatics 25, 130−131 (2008).
25.Lorenz, R. et al. Algorithms for Molecular Biology 6, 1−14 (2011).
26.Picelli, S. et al. Nat Meth 10, 1096−1098 (2013).
27.Langmead, B., Trapnell, C., Pop, M. & Salzberg, S. L. Genome Biol 10, R25 (2009).
28.Kozomara, A. & Griffiths−Jones, S. Nucleic Acids Research 42, D68−D73 (2013).
29.Allen, E., Xie, Z., Gustafson, A. M. & Carrington, J. C. Cell 121, 207−221 (2005).
30.Li, B. & Dewey, C. N. BMC Bioinformatics 12, 323 (2011).
31.Cheng, C.−Y., Krishnakumar, V., Chan, A., Schobel, S. & Town, C. D. (2016). doi:10.1101/047308
32.R Core Team. www.R−project.org (2016).<http://www.R−project.org/>
33.Raabe, C., Tang, T−H., Brosius J., Rozhdestvensky T.S., Nucleic Acid Research, 42, 3, 1414−1426 (2014)

Claims (15)

  1. 一本鎖核酸分子の少なくとも2つのサブセットを含むセットであって、各核酸分子が、5’から3’への方向に、
    a)5’末端にリン酸塩と、
    b)少なくとも3つのランダム化したヌクレオチドの配列と、
    c)標的配列と比較して配列が2つ以上のミスマッチを含む少なくとも8つのヌクレオチドのコア配列と、
    d)少なくとも3つのランダム化したヌクレオチドの配列と、
    e)3’末端に修飾と
    を含み、
    各サブセットが、同一のコアヌクレオチド配列と、異なるランダム化したヌクレオチドとを有する複数の核酸分子を含み、
    前記各サブセットの核酸分子が、前記コアヌクレオチド配列のうちの少なくとも1つのヌクレオチドにおいて異なる、
    セット。
  2. 前記複数の核酸分子が、A、C、G、U、またはA、C、G、Tの全ての4つのヌクレオチドの組み合わせを含むランダム化したヌクレオチド配列を含む、請求項1に記載のセット。
  3. 前記核酸分子が、RNA分子、特には、特にsiRNA、tasiRNA、snRNA、miRNA、snoRNA、piRNA、およびtRNA、ならびにそれらのいずれかの前駆体からなる群から選択される、smallRNAを特異的に模倣したRNA分子である、請求項1〜2のいずれか1項に記載のセット。
  4. 前記コアヌクレオチド配列が、8〜25個のヌクレオチド、好ましくは10〜20個のヌクレオチド、好ましくは12〜18個のヌクレオチド、好ましくは13個のヌクレオチドを含む、請求項1〜3のいずれか1項に記載のセット。
  5. 前記ランダム化したヌクレオチドの配列が、3〜7個のヌクレオチド、好ましくは3〜5個のヌクレオチド、好ましくは4個のヌクレオチドを含む、請求項1〜4のいずれか1項に記載のセット。
  6. 5’末端のリン酸塩が、一リン酸塩、二リン酸塩、および三リン酸塩の群から選択され、3’末端の修飾が、2’−O−メチル化[2’−O−メチル基]およびヒドロキシル化[ヒドロキシル基]からなる群から選択される、請求項1〜5のいずれか1項に記載のセット。
  7. 前記サブセットが、1〜10000amol、好ましくは10〜5000amolの量で存在し、特に、各サブセットで異なる量を含む、請求項1〜6のいずれか1項に記載のセット。
  8. 前記標的配列が、目的のいずれかの配列、特に、生物のゲノムまたはトランスクリプトーム、ウイルス、細菌、動物、植物から生じる配列とすることができ、特に、RNA、smallRNA、動的なsmallRNAの集合である、請求項1〜7のいずれか1項に記載のセット。
  9. シーケンシングデータを正規化するためのspike inプローブとしての、請求項1〜8のいずれか1項に記載のセットの使用。
  10. 請求項1〜9のいずれか1項に記載のセットを使用して、サンプル、特に細胞、組織、または臓器のサンプルにおける1つ以上の標的配列の絶対量を決定するための方法。
  11. ヌクレオチドシーケンシングにおける参照値を決定するための方法であって、
    標的配列の混合物に、請求項1〜9のいずれか1項に記載のセットを添加することにより、核酸分子のライブラリーを作製するステップと、
    前記ライブラリーにアダプターをライゲートするステップと、
    任意選択で前記ライブラリーを増幅するステップと、
    ヌクレオチドのシーケンシング法を行うステップと、
    参照値として各サブセットの核酸分子の量を決定するステップと
    を含む、方法。
  12. 異なる細胞種由来のsmallRNA分子の複製数を比較する、請求項11に記載の方法。
  13. サンプルにおける核酸分子の数を決定するための方法であって、
    a)請求項1〜9のいずれか1項に記載のセットを前記サンプルに添加して、核酸分子の混合物を得ることにより、核酸分子のライブラリーを作製するステップと、
    b)任意選択で前記ライブラリーを増幅するステップと、
    c)前記核酸分子からRNA配列の読み取りをもたらす、前記ライブラリーの次世代シーケンシングを行うステップと、
    d)前記セットおよび前記サンプルからの読み取りの数を決定するステップと
    を含む、方法。
  14. sRNAライブラリーの調製の間に起こるクローニングのバイアスを評価するための、請求項10〜13のいずれか1項に記載の方法の使用。
  15. 一般式:p−(N)(x)(N)−2’−O−メチル
    のオリゴヌクレオチド:
    (式中、
    pは、リン酸塩であり、
    Nは、A、U、G、Cのいずれかのランダムヌクレオチドであり、
    Xは、A、U、G、Cのいずれかを含む8、9、10、11、12、13、14、15、16、17、または18のヌクレオチド長を有する、標的配列と比較して少なくとも2つのミスマッチを含むコア配列であり、
    mは、3、4、または5である)。
JP2019561352A 2017-01-30 2018-01-29 配列データの正規化のための新規のspike inオリゴヌクレオチド Active JP7044270B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17153689.9 2017-01-30
EP17153689.9A EP3354746B1 (en) 2017-01-30 2017-01-30 Novel spike-in oligonucleotides for normalization of sequence data
PCT/EP2018/052127 WO2018138334A1 (en) 2017-01-30 2018-01-29 Novel spike-in oligonucleotides for normalization of sequence data

Publications (2)

Publication Number Publication Date
JP2020519256A true JP2020519256A (ja) 2020-07-02
JP7044270B2 JP7044270B2 (ja) 2022-03-30

Family

ID=57965671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019561352A Active JP7044270B2 (ja) 2017-01-30 2018-01-29 配列データの正規化のための新規のspike inオリゴヌクレオチド

Country Status (7)

Country Link
US (1) US20200040393A1 (ja)
EP (1) EP3354746B1 (ja)
JP (1) JP7044270B2 (ja)
CN (1) CN110446788B (ja)
CA (1) CA3051720A1 (ja)
DK (1) DK3354746T3 (ja)
WO (1) WO2018138334A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020041449A1 (en) * 2018-08-21 2020-02-27 Zymo Research Corporation Methods and compositions for tracking sample quality
CN111235244A (zh) * 2019-11-28 2020-06-05 广州微远基因科技有限公司 测序内标分子及其制备方法和应用
CN111607639A (zh) * 2020-05-08 2020-09-01 深圳华大因源医药科技有限公司 基于内参进行宏基因组病原定量检测的方法和装置
WO2024017613A1 (en) * 2022-07-20 2024-01-25 Hummingbird Diagnostics Gmbh Artificial small rna spike-in cocktail for process control and normalization

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5637459A (en) * 1990-06-11 1997-06-10 Nexstar Pharmaceuticals, Inc. Systematic evolution of ligands by exponential enrichment: chimeric selex
JP2005536213A (ja) * 2002-08-22 2005-12-02 ディレボ・ビオテク・アーゲー ポリヌクレオチドの選択的組合せランダム化の方法
WO2016084848A1 (ja) * 2014-11-26 2016-06-02 東レ株式会社 小型rnaの発現量の補正方法及び装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69528706T2 (de) 1994-08-19 2003-06-12 Pe Corp Ny Foster City Gekoppeltes ampflikation- und ligationverfahren
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
WO2002004680A2 (en) 2000-07-07 2002-01-17 Visigen Biotechnologies, Inc. Real-time sequence determination
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
JP2008513782A (ja) 2004-09-17 2008-05-01 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 分子解析のための装置及び方法
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
EP1907549A1 (en) * 2005-06-17 2008-04-09 Pioneer-Hi-Bred International, Inc. Methods and compositions for gene silencing
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
WO2008040355A2 (en) * 2006-10-06 2008-04-10 Exiqon A/S Novel methods for quantification of micrornas and small interfering rnas
EP2566985A4 (en) 2010-05-06 2014-08-06 Ibis Biosciences Inc INTEGRATED SAMPLE PREPARATION SYSTEMS AND MIXTURES OF STABILIZED ENZYMES
GB201113214D0 (en) * 2011-07-29 2011-09-14 Univ East Anglia Analysing sequencing bias
US10155941B2 (en) 2012-08-01 2018-12-18 Bernhard Suter High throughput yeast two-hybrid screening method and reagent kit
CA2949622C (en) * 2012-11-26 2019-07-02 The University Of Toledo Methods for standardized sequencing of nucleic acids and uses thereof
GB201402249D0 (en) * 2014-02-10 2014-03-26 Vela Operations Pte Ltd NGS systems control and methods involving the same
GB201411603D0 (en) * 2014-06-30 2014-08-13 Vela Operations Pte Ltd Compositions for quantitative and/or semiquantitative mutation detection methods
US20170211139A1 (en) * 2014-07-11 2017-07-27 Exosome Diagnostics, Inc. Compositions and methods for detecting rare sequence variants in nucleic acid sequencing
CN105648078A (zh) * 2016-03-01 2016-06-08 浙江农林大学 一种山核桃嫁接过程中小rna测序分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5637459A (en) * 1990-06-11 1997-06-10 Nexstar Pharmaceuticals, Inc. Systematic evolution of ligands by exponential enrichment: chimeric selex
JP2005536213A (ja) * 2002-08-22 2005-12-02 ディレボ・ビオテク・アーゲー ポリヌクレオチドの選択的組合せランダム化の方法
WO2016084848A1 (ja) * 2014-11-26 2016-06-02 東レ株式会社 小型rnaの発現量の補正方法及び装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
BUSCHMANN D. ET AL., NUCLEIC ACIDS RESEARCH, vol. 44, no. 13, JPN6021045211, 2016, pages 5995 - 6018, ISSN: 0004640744 *
JIANG L. ET AL., GENOME RESEARCH, vol. 21, JPN6021045217, 2011, pages 1543 - 1551, ISSN: 0004640742 *
LOCATI M. D. ET AL., NUCLEIC ACIDS RESEARCH, vol. 43, no. 14, JPN6021045219, 2015, pages 89, ISSN: 0004640741 *
QUAIL M. A. ET AL., BMC GENOMICS, vol. 15:110, JPN6021045214, 2014, ISSN: 0004640743 *
ZHUANG F. ET AL., JOURNAL OF NUCLEIC ACIDS, vol. 2012, JPN6021045220, 2012, pages 360358, ISSN: 0004640740 *

Also Published As

Publication number Publication date
WO2018138334A1 (en) 2018-08-02
CA3051720A1 (en) 2018-08-02
US20200040393A1 (en) 2020-02-06
CN110446788B (zh) 2024-02-23
EP3354746B1 (en) 2019-05-29
JP7044270B2 (ja) 2022-03-30
DK3354746T3 (da) 2019-09-02
EP3354746A1 (en) 2018-08-01
CN110446788A (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
Behrens et al. High-resolution quantitative profiling of tRNA abundance and modification status in eukaryotes by mim-tRNAseq
Begik et al. Quantitative profiling of pseudouridylation dynamics in native RNAs with nanopore sequencing
US11845986B2 (en) Normalization of nucleic acid libraries
Dard-Dascot et al. Systematic comparison of small RNA library preparation protocols for next-generation sequencing
JP7044270B2 (ja) 配列データの正規化のための新規のspike inオリゴヌクレオチド
KR102405549B1 (ko) Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용
Wang et al. An RNA-cleaving threose nucleic acid enzyme capable of single point mutation discrimination
DK2737086T3 (en) Analyze sequencing bias
Warren et al. Combining tRNA sequencing methods to characterize plant tRNA expression and post-transcriptional modification
Gregory et al. Utilizing tiling microarrays for whole‐genome analysis in plants
Scheepbouwer et al. ALL-tRNAseq enables robust tRNA profiling in tissue samples
Luo Methods to study long noncoding RNA biology in cancer
Sandberg et al. Adaptive evolution of a minimal organism with a synthetic genome
Thomas et al. Construction of small RNA cDNA libraries for deep sequencing
US20210284997A1 (en) Parallel analysis of rna 5' ends from low-input rna
Kong et al. Evolutionary outcomes of diversely functionalized aptamers isolated from in vitro evolution
Devor et al. Methodologies for in vitro cloning of small RNAs and application for plant genome (s)
Grohme et al. cDNA representational difference analysis for identifying transcripts regulated under anhydrobiosis in the tardigrade Milnesium tardigradum
JP7141165B1 (ja) 変異プロファイリングのためのrnaプローブ及びその使用
Pai Studying sequence effects of mRNA 5'cap juxtapositions on translation
Pai Studying sequence effects of mRNA 5'cap juxtapositions on translation initiation rate using randomization strategy of the extreme 5'end of mRNA
Gvozdenov Genome‐Wide Mapping of 5′ Isoforms with 5′‐Seq
Liu et al. Identification of Hammerhead-variant ribozyme sequences in SARS-CoV-2
Roberts et al. CHAPTER TWO: RNA SEQUENCE TO STRUCTURE ANALYSIS FROM COMPREHENSIVE PARWISE MUTAGENESIS OF MULTIPLE SELF-CLEAVING RIBOZYMES
Chelysheva Analysing deep-seq data to reveal the hidden translational features in normal and pathological conditions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220304

R150 Certificate of patent or registration of utility model

Ref document number: 7044270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150