JP2023547394A - オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法 - Google Patents

オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法 Download PDF

Info

Publication number
JP2023547394A
JP2023547394A JP2023524712A JP2023524712A JP2023547394A JP 2023547394 A JP2023547394 A JP 2023547394A JP 2023524712 A JP2023524712 A JP 2023524712A JP 2023524712 A JP2023524712 A JP 2023524712A JP 2023547394 A JP2023547394 A JP 2023547394A
Authority
JP
Japan
Prior art keywords
rna
probe
nucleic acid
compartment
probes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023524712A
Other languages
English (en)
Inventor
ポンボ,アナ
シュパークス,トーマス
Original Assignee
マックス-デルブリュック-ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ-ゲマインシャフト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マックス-デルブリュック-ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ-ゲマインシャフト filed Critical マックス-デルブリュック-ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ-ゲマインシャフト
Publication of JP2023547394A publication Critical patent/JP2023547394A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、単一細胞レベルでの核酸シークエンシング、例えば、単一細胞RNAシークエンシング(scRNA-Seq)の分野に関する。特に、本発明は、真核生物細胞またはその核などの固定または非固定核酸含有区画における核酸を検出する方法であって、複数の一本鎖(ss)DNAオリゴヌクレオチドプローブを該区画内の相補的核酸分子とハイブリダイズさせ;核酸に特異的にハイブリダイズしていないssDNAオリゴヌクレオチドプローブを区画から除去し;そして、シークエンシングまたは増幅により該区画内の核酸分子と特異的にハイブリダイズするssDNAオリゴヌクレオチドプローブを同定し、それにより該区画に存在する対応する核酸を決定する、方法を提供する。方法は、特異性または感受性増加の手段として、同じ標的核酸に対する一連のssDNAプローブハイブリダイゼーションの工程を必要とせず、好ましくはさらにRNA単離およびcDNA産生の工程を必要としない。発明の方法は、実質的に全既知および/または未知核酸種、特にRNA、例えば、タンパク質コード化mRNAならびに非コードRNAを検出する可能性を有する。方法はさらに検出された核酸の空間マッピングを可能とし、ここで、区画は断片のコレクションを得るためにプローブハイブリダイゼーション前に単一細胞懸濁液に切片化または解離され、故に核酸分子は局在化または属する細胞型に依存して互いに分離される。検出された核酸の空間マッピングを、少なくとも1個のDNA座、少なくとも1個のタンパク質の検出またはクロマチン凝縮の解析と組み合わせ得る。発明の方法は、oligo-seqと指定された。

Description

本発明は、単一細胞レベルでの核酸シークエンシング、例えば、単一細胞RNAシークエンシング(scRNA-Seq)の分野に関する。特に、本発明は、真核生物細胞またはその核などの固定または非固定核酸含有区画における核酸を検出する方法であって、複数の一本鎖(ss)DNAオリゴヌクレオチドプローブを該区画内の相補的核酸分子とハイブリダイズさせ;核酸に特異的にハイブリダイズしていないssDNAオリゴヌクレオチドプローブを区画から除去し;そして、シークエンシングまたは増幅により該区画内の核酸分子と特異的にハイブリダイズするssDNAオリゴヌクレオチドプローブを同定し、それにより該区画に存在する対応する核酸を決定する、方法を提供する。本方法は、特異性もしくは感受性増加の手段として同じ標的核酸への一連のssDNAプローブハイブリダイゼーションの工程またはRNA単離およびcDNA産生の工程を必要としない。本発明の方法は、実質的に全既知および/または未知核酸種、特にRNA、例えば、タンパク質コード化mRNAならびに非コードRNAを検出する可能性を有する。本方法は、さらにあまり豊富ではない核酸および細胞内区画におけるその存在量を検出する十分な感受性を有する。本方法はさらに検出された核酸の空間マッピングを可能とし、ここで、区画は断片のコレクションを得るためにプローブハイブリダイゼーション前に切片化されており、故に核酸分子は局在化に依存して互いに分離される。検出された核酸の空間マッピングを、少なくとも1個のDNA座、少なくとも1個のタンパク質の検出または細胞核におけるクロマチン凝縮、クロマチン接触およびクロマチン放射状位置の分析と組み合わせ得る。
リボ核酸(RNA)は、多数の生物学的機能を有する高度に多用途の分子である。遺伝情報のDNAからタンパク質生合成位置、リボソームへの伝達は知られているが、RNA分子は制御、触媒またはプロセシング活性も発揮し得る。RNA分子がいつ、どこで、どのようにそしてなぜ細胞で発現されるかを理解することは、故に、同様に研究者および臨床医にとって非常に興味深い。
その結果、個々の細胞、組織または生物全体におけるRNAを検出、同定および定量する多数の方法が開発されており、最適化され続けている。
ノーザンブロッティングは、電気泳動によりまずRNAがサイズで分けられ、その後、膜に移される方法である。次いで、RNA検出が標識プローブの目的のRNAにハイブリダイズする膜への添加により達成される(Josefsen et al., 2011, Northern Blotting Analysis. Methods Mol Biol. 703, 87-105)。
ヌクレアーゼ保護アッセイは、サンプル中のRNAとアニールする放射標識または非同位体プローブを利用する。ハイブリダイゼーション後、一本鎖のハイブリダイズしていないプローブおよびRNAはヌクレアーゼにより分解され、一方プローブ結合RNA断片は維持され、その後分離され、アクリルアミドゲル上でオートラジオグラフィーにより検出されるようになる(https://www.thermofisher.com/de/de/home/references/ambion-tech-support/ribonuclease-protection-assays/general-articles/the-basics-what-is-a-nuclease-protection-assay.html)。
RNA分子の相補的DNA(cDNA)への逆転写を可能とするレトロウイルス由来酵素である逆転写酵素の発見は、RNA研究を大きく進展させた。RNAのより安定なcDNAへの変換はサンプル分解の割合を減らし、生物学的材料の取り扱いを容易にし、故に、より洗練されたRNA検出方法の開発および適用を可能とした。逆転写定量的ポリメラーゼ連鎖反応(RT-qPCR)は、例えば、RNAがまずcDNAに逆転写され、その後目的のcDNA分子とアニールする特別に設計されたプライマー対を使用して増幅される、PCRベースの方法である。さらなる増幅に適合性の長さまでcDNAとの重合を達成するために、十分なRNA完全性が必要である(約>100nまたは典型的に>200nts)。cDNAの定量は、例えばcDNAに挿入され、qPCRサーマルサイクラー内のセンサーにより検出される、SYBR Greenなどの蛍光色素の存在下のPCR増幅の使用を含み得る。各PCRサイクル後、cDNAコピー数増加が、一定の閾値に到達するまで蛍光シグナルを増加させる。予定した数のPCRサイクル終了後、次いで、コンピューターがこの情報を使用して、サンプル中の各試験した遺伝子の出発RNAの量を計算する。
しかしながら、上記方法の何れも細胞のグローバルトランスクリプトームワイドな解析を可能としない。生物学的サンプルから抽出した何千ものRNAの大量の、ハイスループット並行検出が、ハイブリダイゼーションベースのDNAマイクロアレイの開発により初めて可能となった。簡潔には、単離RNAの逆転写により得られた蛍光標識されたcDNAフラグメンが、マイクロチップ表面の既定の領域(特性)に固定された一本鎖DNAオリゴヌクレオチドプローブと相補的塩基対形成する。これら特性の各々が、特定の目的の遺伝子に対するプローブを含む。結合cDNA配列は蛍光シグナルを生ずる。このシグナル強度は、チップのある特性におけるプローブに結合する標的cDNAの量に依存する。各特性について検出された強度を、異なる条件下、例えば、生物学的サンプルが環境刺激で処理されたときの対応する特性と比較する。その結果、試験遺伝子の発現の変化は、相対的に定量できる(Miller et al., 2009, Basic Concepts of Microarrays and Potential Applications in Clinical Microbiology., Clin Microbiol Rev. 22(4): 611-633)。
次世代シークエンシング(NGS)テクノロジーの改善および手頃な価格の増加は、徐々にマイクロアレイをRNAシークエンシング(RNA-Seq)に置き換えている。その名前にかかわらず、RNA-Seqは、通常RNA分子の直接シークエンシングを含まない。実際、慣用のRNA-Seq方法は、生物学的材料から単離したRNA由来の約200ntのcDNA断片をシークエンシングする。cDNA断片は、特異的シークエンシングアダプターにライゲートされ、シークエンシングライブラリーとなる。本ライブラリーが次にPCR増幅され、その後、断片サイズ選択工程となる。RNA-Seqのあるバリエーションでは、リボソームRNA(総RNAの90%に関し得る)などの非常に豊富な構造RNAが対してポジティブに選択され、方法にさらに費用に掛かる工程が追加される。種々の作業プラットフォームが、実際のシークエンシングのために当分野で知られる。最も一般的に使用されるシークエンシングプラットフォームは、Illumina、Roche 454、Helicos、PacBio、SOLiDおよびComplete Genomicsを含む。Illumina、Roche 454またはPacBioは、シークエンシング・バイ・シンセシスであり、シークエンシング装置により検出できる蛍光標識されたデオキシヌクレオシド三リン酸(dNTP)を利用する。簡潔には、4種の異なる蛍光標識されたdNTPの1種を、シークエンシングするcDNA断片のヌクレオチド配列に相補的な成長中の核酸鎖に加える。各dNTPの蛍光標識が、蛍光色素が造営され、酵素により除去されるまで、鎖のさらなる重合を終了させる。その後別の標識dNTPを鎖に加え得る。蛍光シグナルおよびその強度に基づき、シークエンシング装置は鋳型cDNAに対応する正しい塩基をコールできる(https://www.illumina.com/documents/products/techspotlights/techspotlight_sequencing.pdf)。この種のショートリードcDNAシークエンシングアプローチは、ライブラリーをサンプルあたり平均2000~3000万リードまでシークエンシングする(Stark et al., 2019, RNA sequencing: the teenage years. Nature Reviews Genetics 20, 631-656)。別のシークエンシングプラットフォームで使用される別のアプローチは古典的シークエンシング・バイ・シンセシス方法と異なり、例えばシークエンシング・バイ・ライゲーション(例えばSOLiD)またはNanoporeシークエンシングテクノロジーを使用する。
生シークエンシングデータのその後の生物情報学解析のために、配列リードを、まず品質について試験し、その後参照ゲノムに対してマッピングして、トランスクリプトームをアセンブルする。参照ゲノムが入手不可能であるとき、配列リードのデノボアセンブリを実施し得る。
近年、RNA-Seq分野の急速な改善がみられる。長非断片化cDNAのシークエンシングおよび逆転写の中間工程を省く直接RNAシークエンシングを可能にする新規方法が開発されている(Stark et al., 2019)。単一細胞RNA(scRNA)シークエンシングによる個々の細胞のトランスクリプトームワイドな解析は、近年主要な課題を提供する。ScRNA-Seqにより、研究者が、例えばバルクサンプル中の、別の、より豊富な細胞型によりユニークな転写プロファイルがしばしば不明瞭である稀な細胞型を試験することが可能となった。ScRNA-Seqは、ユニークな転写シグネチャーに基づき以前は知られていなかった細胞の同定を促進している。scRNA-Seqに適する種々の技術および方法は、感受性、精度、解析する細胞数および貨幣原価が種々であることが知られ、故に種々の適用および実験装置で使用され得る(Ziegenhain et al., 2017, Comparative Analysis of Single-Cell RNA Sequencing Methods. Mol Cell. 85(4), 631-643)。一般に、個々の細胞は、単一ウェルまたは微小流体液滴に単離される。各ウェルまたは液滴は、細胞溶解ならびにRNA単離、逆転写およびアダプターライゲーションを含むシークエンシングライブラリー調製に必要な全化学物質を含む(Ziegenhain et al., 2017)。
単一細胞におけるトランスクリプトーム解析は、いくつかの重要な課題に直面している:まず、RNAのディープシークエンシングは、最小量の出発物質を必要とする。しかしながら、単一細胞から単離できるRNAの量は限られ、RNAは単離中非常に分解を受けやすい。その結果、慣用のscRNA-Seq方法の情報価値は、出発物質の入手可能性により変わる。単離scRNAの逆転写は、「線形増幅」などの先の増幅工程と共に、トランスクリプトーム情報内容を、より安定なcDNA分子に変換するが、しばしばシークエンシング結果の評価を最終的に誤らせ得る別のバイアスを導入する。
それ故に、個々の細胞から採取した限られたRNA濃度でのトランスクリプトーム試験は、しばしば、別のRNA検出方法の使用を必要とする。インサイチュで、すなわち天然細胞環境で顕微鏡検出でき、故に、RNA単離の必要性を迂回する、蛍光標識されたオリゴヌクレオチドプローブの使用が、共通のアプローチを代表する。これらの蛍光インサイチュハイブリダイゼーション(FISH)プローブは、固定された組織切片または細胞に相補的RNA分子を局在化およびハイブリダイズする。その後、結合プローブは細胞内解像度で、蛍光顕微鏡または特殊な知覚装置を使用して、検出され得る。今日、オリゴペイント(Beliveau et al., 2012, Versatile design and synthesis platform for visualizing genomes with Oligopaint FISH probes. Proc Natl Acad Sci 109(52), 21301-6)などのRNA-FISHプローブの広範なライブラリーが、ゲノムの大部分をカバーするようバイオインフォマティクスにより設計され、大規模な並行合成により産生され得る。しかしながら、FISHベースのRNA検出方法により同時に解析すべき遺伝子数は、伝統的に並行してモニターできる蛍光タグの量が限られているため、制限される。この問題は、一実験で同時に検出できる遺伝子数を大きく増やす複雑な多色バーコードでの修飾プローブに基づく例えばRNASeqFISH+などの方法により対処される。
同様に、NanoString Technologiesにより提供された多重化nCounterアッセイは、目的のRNA分子とアニールする標的特異的捕捉プローブおよび標的プローブとハイブリダイズする遺伝子特異的色分けレポータープローブからなるプローブ対によるRNA検出に基づく。RNA-捕捉プローブ-レポータープローブ複合体は特異的カートリッジのイメージング表面に固定およびアラインされる。その後、カートリッジは、標識プローブを直接カウントする自動化蛍光検出が可能な特定の顕微鏡的装置で走査される(Geiss et al., 2008, Direct multiplexed measurement of gene expression with color-coded probe pairs. Nat Biotechnol. 26(3), 317-325)。しかしながら、nCounterなどの方法は、プローブを検出できる特定の研究装置を購入する必要がある。必要なプローブは、さらに選択したmRNAおよびmiRNAのパネルにしか結合せず、研究室で単純に産生できない。
nCounterアッセイに基づき、NanoString Technologiesは、さらにGeoMxTM Digital Spatial Profiling(DSP)として知られる方法を開発した。本方法は、組織または細胞切片を蛍光マーカーおよびRNAに対するオリゴヌクレオチド「プロファイリング」プローブで共染色することを含む。各プローブは光開裂性リンカーを介してDSPオリゴヌクレオチドバーコードに結合した標的相補的配列により結合される。組織/細胞切片の個々に選択された目的の領域は、次に、UV光で照射され、該切片からDSP-オリゴ配列を放出する。その後、DSP-オリゴヌクレオチドは吸引され、マイクロタイタープレートのウェルに移される。各ウェル内の情報は、組織上の予め選択した目的の領域の各々にインデックスをつける。最後に、DSP-オリゴヌクレオチドはNanoStringバーコードにハイブリダイズされ、nCounterプラットフォームで定量される(GeoMxTM製品カタログ、https://www.nanostring.com/products/geomx-digital-spatial-profiler/geomx-dspで入手可能)。それ故に、GeoMxTMテクノロジーもまた高価な装置の購入ならびに特別に開発されたソフトウェア一式および特殊化したDSP含有プローブの使用を必要とする。
WO2019/157445およびMerritt et al., 2020(Multiplex digital spatial profiling of proteins and RNA in fixed tissue. Nature Biotechnology 38, 586-599)は、DSPの上記のより詳細な方法に関し、nCounterプラットフォームの代替としてNGSを介するプローブ同定および定量も記載する。NGS解析について、DSPオリゴヌクレオチド(WO2019/157445では「識別子ヌクレオチド」またはMerritt et al.では「インデックス化オリゴヌクレオチド」と称される)は、増幅用に2個のプライマー結合位置およびシークエンシングアダプターの付加ならびにユニークな分子識別子およびRNA標的(すなわちバーコード配列)を同定する特異的核酸配列を含み得る。標的相補的配列のUV誘導放出後、DSPオリゴヌクレオチドはその後PCR増幅およびシークエンシングされる。それ故に、方法はRNA逆転写の必要性を回避し、プローブ同定にNGSを利用する。しかしながら、方法は、相当複雑なプローブ設計を必要とするため、技術的に極めて困難である。DSPオリゴヌクレオチドに存在するユニークなバーコード配列は、さらにオフターゲットアニーリング事象を引き起こし、故に、アッセイの特異性を低減する可能性がある。この問題は、バーコード配列がユニークな分子識別子およびプライマー結合位置に隣接して位置するとの事実によりさらに悪化する。バーコード配列は、PCRバイアスのリスクを増加させることも知られている。さらに、識別子ヌクレオチド放出のために、サンプルは、例えば、UV光にさらされる必要があり、該サンプルに存在する核酸にとって有害な結果となる可能性がある。
SlideSeqおよび/またはVisium Spatial Gene Expression(Rodriques et al., 2019. Science 363(6434):1463-1467)などの空間トランスクリプトーム方法は、近位組織領域から放出されるRNA分子の空間的捕捉およびシーケンシングに短オリゴヌクレオチドプローブおよびNGSの使用を組み合わせる。これら方法は、空間的系統化されかつバーコード付のオリゴd(T)プライマーまたはDNA-バーコード付微粒子の、組織的/局在化/整列様式での顕微鏡スライド表面への結合を含む。細胞または組織がこれらスライドと接触し、処理されて、浸透作用によりRNA内容物を放出したとき、プライマーはその近辺で汎発性のmRNA分子を捕捉する。捕捉mRNAはcDNAに逆転写され、プライマーの空間バーコードに組み込まれ、その後シークエンシングされる。その後の解析中、バーコードは検出されたRNAがもともと発見された細胞内領域の再追跡を可能とする(Stahl et al., 2016, Visualization and analysis of gene expression in tissue sections by spatial transcriptomics. Science 353(6294), 78-82)。
最近公開された、印刷前のMarshall et al.は、Hybridization of Probes to RNA for sequencing(HyPR-Seq; Marshal et al., 2020, HyPR-Seq: Single-cell quantification of chosen RNAs via hybridization and sequencing of DNA probes, BioRxiv preprint doi: https://doi.org/10.1101/2020.06.01.128314, またMarshal et al., 2020, HyPR-Seq: Single-cell quantification of chosen RNAs via hybridization and sequencing of DNA probes. PNAS 117(52), 33404-33413として公開)と名付けた方法を紹介する。本方法は、ハイブリダイゼーション連鎖反応(HCR)smFISHプロトコールに基づく。簡潔には、HyPR-Seqはまず相同塩基対形成を介して標的RNAとアニールするために2個のssDNAイニシエータープローブを必要とする。第二工程で、該イニシエータープローブは、短ヘアピンオリゴプローブのための結合位置として役立ち、その後、特別な「リードアウト」プローブがハイブリダイズされる。該「リードアウト」プローブが次にイニシエータープローブの5’末端とライゲートして、最終的に単一ssDNA断片が得られ、それはまずPCRにより増幅され、その後シークエンシングされる。それ故に、一方HyPR-Seqは、RNA単離および逆転写の必要性を回避するNGSベースの技術であり、転写物検出は少なくとも4個の異なるオリゴヌクレオチドの三層の、一連のハイブリダイゼーションに依存し、故に、一実験で同時に分析できる遺伝子数は、100個以下に限定される(Marshal et al., 2020)。現在まで、次世代シークエンシングに依存するが、RNA単離、cDNA産生または相補的オリゴヌクレオチドプローブの連続的ハイブリダイゼーションによるシグナル増幅の工程を必要としないRNA検出方法はない。慣用のRNA-Seq方法で、RNA分解および逆転写バイアスは避けられず、生物情報学評価中に生シークエンシングデータの評価時考慮しなければならない。従って、特にデータがscRNAなどの低品質出発物質に由来するとき、各細胞のRNA内容物の確率的サンプリングのため、解析にバイアスが導入されるリスクがある。対照的に、RNA転写物の検出についてオリゴヌクレオチドプローブの使用に依存する多くのFISHベースの方法は、細胞内解像度でRNAを検出し得るが、同時にモニターできる遺伝子または転写物の数または特殊化した装置および試薬の購入にかかる高い費用により制限される。
本分野の現状に鑑み、本発明者らは、現在使用される方法の制限の多くを解消する単一細胞解像度でRNA検出し、有利に、配列特異的様式で全ての可能な成熟状態ならびにその選択的スプライシングバリアント、アイソフォーム、融合産物または一塩基多型であらゆるRNA種を検出および定量する能力を有する、新規かつ高度に感受性の方法を提供する課題に取り組んだ。
課題は本発明により、特に特許請求の範囲の主題により解決される。本発明の方法は、指定されたシークエンシングによるオリゴベースのマッピング(oligo-seq)またはPCRによる転写物オリゴベースのマッピング(TOM-PCR)である。RNAだけでなく、サンプルに存在するあらゆるタイプの核酸の検出に適する。
本発明は、核酸を検出する方法であって、
(a)核酸含有区画を準備し;
(b)少なくとも1個の一本鎖DNAオリゴヌクレオチドプローブ、好ましくは、複数の一本鎖DNAオリゴヌクレオチドプローブを該区画内の核酸分子とハイブリダイズさせ;
(c)区画内の何れの核酸とも特異的にハイブリダイズしていない一本鎖DNAオリゴヌクレオチドプローブを区画から除去し;
(d)プローブシークエンシングまたはプローブ増幅により該区画内の核酸分子に特異的にハイブリダイズする一本鎖DNA-オリゴヌクレオチドプローブを同定し;そうして、該区画に存在するプローブに対応する核酸を決定する
工程を含み、
ここで、方法は核酸検出増幅手段として一連のプローブハイブリダイゼーションを含まない、方法を提供する。
核酸は、ヌクレオチドと称されるモノマー構成要素から形成されるバイオポリマーである。各ヌクレオチドは5-炭素糖、リン酸基および含窒素塩基からなる。本発明において、用語核酸は、天然に存在する核酸、すなわち、デオキシリボ核酸(DNA)またはリボ核酸(RNA)をいう。本発明の方法は、特に有利なことに、RNA検出に使用できる。故に、好ましくは、本発明をとおして、核酸はRNAである。
DNAは細胞内で、大部分二本鎖状態で存在し、特徴的二重螺旋形を採る。しかしながら、稀には、DNAは、例えば、Rループと称されるDNA転写中およびDNA複製中形成される中間構造の一部として、一本鎖状態で存在し得る。さらに、ssDNAウイルスは、一本鎖環状DNA分子で遺伝情報をコードする。
リボ核酸(RNA)は、糖リボース、リン酸基および4個の核酸塩基アデニン(A)、グアニン(G)、シトシン(C)およびウラシル(U)の一つにより形成されるヌクレオチド鎖としてアセンブルされるポリマー分子である。大部分の天然に存在するDNAとは対照的に、RNAは、分子内塩基対形成により複雑な二次および三次構造を形成できる一本鎖分子である。機能に応じて、RNAは種々のサブクラスおよび種に割り当てられ得る。
核酸の検出は、ここでは、本発明の方法により、当業者がサンプル中にある核酸が存在するか否かを理解できることを意味すると解釈される。検出はまた核酸の定量、すなわちある核酸のどのくらいのコピーがサンプルに存在するかの発見も含む。さらに、核酸量の比較、すなわち、ある核酸があるサンプル中で他より豊富かまたは別のサンプルと比較して豊富かどうかの試験を含む。本発明の方法は、サンプルに稀に存在する核酸を検出するにも十分高い感受性を示す。検出すべき核酸は、例えばあらゆる興味あるDNAまたはRNAであり得る。好ましい実施態様において、検出すべき核酸は、区画内で内因性に産生されている。しかしながら、核酸は外因性核酸でよく、すなわち区画に、例えばトランスフェクションまたはマイクロインジェクションにより外部から導入されていてよい。外因性核酸は、例えば、タンパク質コード遺伝子をノックダウンするために設計された人工短ヘアピンRNA(shRNA)であり得る。検出すべき外因性核酸はまた、例えばウイルス感染中、区画に天然に導入もされ得る。さらに別の実施態様において、外因性核酸は、別の化学化合物、例えば、タンパク質、炭水化物、脂質または代謝物などの生体分子とコンジュゲートした核酸タグでもあり得る。例えば、好ましい実施態様において、外因性核酸は、下にさらに詳述する抗体とコンジュゲートした核酸タグであり得る。
本発明の核酸含有区画は、臓器、真核生物細胞または細胞クラスター、真核生物細胞の核、真核生物細胞の核小体、真核生物細胞の細胞質、ミトコンドリア、葉緑体、エキソソーム、原核生物細胞またはウイルス内の組織であり得る。
真核生物細胞は、例えば植物細胞、真菌細胞または動物細胞であり得る。好ましい実施態様において、真核生物細胞は哺乳動物細胞である。哺乳動物細胞は、好ましくはヒト由来、ある疾患または障害を有するまたはある障害について診断されるヒト患者または健常対象からの細胞であり得る。細胞は、例えば、腫瘍細胞または幹細胞であり得る。このような細胞は、ここに記載する方法で容易に同定され得るユニークなおよび高度に特徴的な転写シグネチャーを示すため、本発明における使用に特に適する。しかしながら、哺乳動物細胞は、哺乳動物遺伝子モデル生物、例えば、マウス、ラット、ウサギ、モルモット、ブタまたは非ヒト霊長類からの細胞など、非ヒト細胞でもあり得る。
細胞は好ましくはヒト細胞などの哺乳動物細胞であるが、大腸菌、酵母、シロイヌナズ、カエノラブディティス・エレガンス、アフリカツメガエル、ゼブラフィッシュ、ノソブランキウス・ファーザアイ、キイロショウジョウバエまたはプラナリアなどの別の生物の、例えば、RNA発現の、調査、および、所望により、比較も興味の対象であり得る。
核酸含有区画はまた原核生物細胞、すなわち細菌または古細菌由来であり得る。本発明はまた、例えば、FISHの適用が成功しているバイオフィルムまたは腸管腔における微生物叢の空間組織化の試験にも適用され得る(Tropini et al., 2017, The Gut Microbiome: Connecting Spatial Organization to Function. Cell Host & Microbe 21(4), 433-442; Liu et al., 2017, Low-abundant species facilitates specific spatial organization that promotes multispecies biofilm formation. Environ Microbiol. 19, 2893-905; Liu et al., 2019, Deciphering links between bacterial interactions and spatial organization in multispecies biofilms. The ISME Journal 13, 3054-3066にレビュー)。
別の実施態様において、核酸含有区画は、例えば細胞内構造または細胞小器官であり得る。例えば真核生物細胞、例えば、哺乳動物、好ましくは、ヒト細胞の核であり得る。核酸含有区画はまた真核生物細胞核の部分構造、すなわち、核小体であり得る。区画はまた哺乳動物、例えば、ヒト細胞の細胞質も含み得る。区画は細胞の該細胞小器官のみを含んでよいが、あるいはそれらの組み合わせも含んでよく、例えば、核、細胞質およびミトコンドリアを含む完全ヒト細胞であり得る。例えば、細胞質およびミトコンドリアを含むが、核を含んでいなくてもよい。
エキソソームは、細胞間情報伝達に関与し、しばしばカーゴとしてmRNAおよびマイクロRNA(miRNA)を含む、エンドソーム由来、小膜結合細胞外小胞である。
細胞は、細胞培養物由来であってよく、または生存生物または死亡生物、すなわち、死後からの特異的組織からまたは実験生物全体(例えばキイロショウジョウバエ胚全体またはカエノラブディティス・エレガンスの成長段階何れか)からエクスビボで解析されてよい。細胞は、例えば疾患と一般に関連する脳領域の切片から得られ得る。従って、細胞は、複数の種々の細胞型を含む複雑な組織の幹であり得る。細胞の厳密な同一性が解析時に知られていなくても、本発明の方法により決定され得ることは可能である。本方法は、ユニークな転写シグネチャーに基づき、今まで特徴づけされていない細胞型の同定および記載に適当であり得る。
本発明の方法の対象となる細胞は、細胞周期のどの段階でもよい。実験の目的により、転写プロファイルが細胞周期をとおして相当変化し得るため、細胞周期の特定の段階で細胞を単離することが役立ち得る。複数の細胞の遺伝子発現を比較するとき、全細胞が好ましくは共通の細胞周期段階にある、例えば、同調している。段階は間期、例えば、G1、SまたはG2期、有糸分裂期または細胞質分裂期であり得る。好ましくは、段階は間期である。
あるいは、RNA転写を、種々の細胞周期段階の細胞で比較もし得る。細胞は分化状態についても変わり得る。細胞は、例えば、異なる細胞型への分化能を有する分化全能性または多能性幹細胞であり得る。あるいは、本発明の方法により解析される細胞は、完全に分化され、組織中の特異的機能を満たすものであり得る。細胞はまた幹細胞から最終分化した細胞に分化する過程のあらゆる細胞であり得る。
核酸含有区画は、複数細胞またはその一部を包含する組織の切片でもあり得る。
ある実施態様において、工程(b)によるssDNAオリゴヌクレオチドプローブのハイブリダイゼーション前に核酸含有区画は切片化される。これは、複数の断片または切片を提供する。核酸含有区画の切片化は、当分野で知られる何らかの適当な方法、例えば、凍結超薄切または冷凍粉砕、好ましくは凍結超薄切により達成され得る。凍結切片は、好ましくは樹脂包埋非存在下、例えば、Tokuyasu方法(Tokuyasu, K. T., 1973, A technique for ultracryotomy of cell suspensions and tissues. J. Cell Biol. 57, 551-65)により産生される。該方法は、少なくとも約30分または少なくとも約2時間または少なくとも約1日または1週間まで、0~25℃の温度、好ましくは、室温(20~25℃)または約4℃で、例えば、2時間、室温または2時間、室温、続いて1日から1週間まで約4℃での短期保存で飽和スクロース溶液への包埋を使用する固定組織の凍結保護を含む。包埋後、スクロース包埋細胞ペレットまたは組織または生物を、例えばサンプルホルダーとして作用する金属スタブに置き、その後液体窒素で凍結し、細胞型または組織に依存して、好ましくは-80~-110℃、例えば、約-100℃で切片化する。わずかに修飾した方法(Guillot P.V., Xie S.Q., Hollinshead M., Pombo A., 2004 Fixation-induced redistribution of hyperphosphorylated RNA polymerase II in the nucleus of human cells. Exp. Cell Res. 295, 460-468; Pombo A, Hollinshead M, Cook PR, 1999, Bridging the resolution gap: Imaging the same transcription factories in cryosections by light and electron microscopy. J. Histochem. Cytochem. 47, 471-480)は、良好な結果を提供することを示している。これらの方法は、非固定凍結切片で観察されるものに比べて、全体的細胞アーキテクチャを保存し(McDowall et al., 1989, The structure of organelles of the endocytic pathway in hydrated cryosections of cultured cells, Eur. J. Cell Biol. 49, 281 - 294)、活性RNAポリメラーゼおよび核アーキテクチャの最適保存を提供する(Guillot et al., 2004)。 Chen et al., 2014, Small 10:3267の方法をそれに変えて使用し得る。ガラス化に付した非固定切片を、例えば、Lucic V., et al., 2013. J. Cell Biol. 202 (3), 407に記載の方法により調製し得る。
例えば、核の切片は、核5~15マイクロメートル直径について、約70nm~約1000nm、好ましくは、150~220nmまたは180~200nmの厚さを有し得る。本発明において、300nm未満、例えば、150~220nm、好ましくは、約200nmのスライス厚を「超極薄」と称する。固定細胞のためのスクロース媒体で凍結切片化する市販の装置が利用可能である(例えば、Leica UltraCut UCT 52 ultracryomicrotome)。切片は、あるいは4~10μm厚クリオスタット切片(https://www.protocols.io/view/Stellaris-RNA-FISH-Protocol-for-FrozenTissue-iwgs5v)、50~300マイクロメートルのビブラトーム切片(https://www.protocols.io/view/exfish-tissue-slice-n6adhae)、単層上の細胞または懸濁液中の細胞でもあり得る。
細胞の切片から、単離区画の切片、例えば、核プロファイル、核成分非存在下(特に、RNAを検出するため)および所望によりさらにミトコンドリア成分非存在下の切片化細胞質またはミトコンドリアの切片などの単離細胞小器官の切片を調製できる。
切片化は、断片のコレクション、すなわち複数の断片に至る。切片の最適厚は区画サイズによる。5~300断片、10~100断片、より好ましくは、40~60断片または約45~50断片に分け得る。ある実施態様において、断片の厚さは全解析について均一である。別の適用について、例えば、数RNA種の相対量定量のためにまたは較正手段、例えば、その他に相対的(例えば、アクチンに相対的)なあるRNAがあるならば、種々のスライスの厚さは単一区画内でまた変わり得る。好ましくは、DNAオリゴヌクレオチドライブラリーを、DNA-およびRNA-cryoFISHについて先に確立されている条件下、顕微鏡スライド、好ましくはレーザーマイクロダイセクションスライドで超極薄凍結切片を用いて構築する(Branco, M. R. & Pombo, A, 2006, Intermingling of chromosome territories in interphase suggests role in translocations and transcription-dependent associations. PLoS Biol. 4, e138; Xie, S.Q. et al., 2006, Splicing speckles are not reservoirs of RNA polymerase II, but contain an inactive form, phosphorylated on Serine2 residues of the C-terminal domain. Mol. Biol. Cell 17, 1723-1733; Branco, M. R., 2006, Correlative microscopy using Tokuyasu cryosections: applications for immunogold labelling and in situ hybridisation. In “Cell Imaging (Methods Express Series)”, ed. D. Stephens, Scion Publishing Ltd. (Bloxham, UK), 201-217; Ferrai, C., et al., 2010, Poised transcription factories prime silent uPA genes prior to activation. PLoS Biology 8, e1000270.)。
所望により、区画をプローブハイブリダイゼーション前に切片化しない。その代わり、ssDNAオリゴヌクレオチドプローブを、区画全体または完全核または別の細胞小器官であり得るかまたはそれを含み得る、区画全体、例えば、細胞群または細胞全体と接触させる。本発明の区画が、例えば、組織中の、細胞群であるとき、本発明のプローブを懸濁液中で細胞群とハイブリダイズさせ得る。その後、細胞を洗浄して、非結合または弱く結合したプローブを除去し、続いてFACSにより単一細胞断片に分離する。次いで、ハイブリダイズプローブを各個々の細胞から、シークエンシングライブラリー調製のために抽出し得る。次に、個々のライブラリーをプールし、シークエンシングし得る。
あるいは、細胞群を、Droplet-SeqおよびHyPR-Seqで見られるとおり、油滴に区画化し得る。単一細胞を、例えば、Macosko et al. (2015, Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets. Cell 161(5), 1202-1214)において設計され、Chemgenes (https://www.fishersci.com/shop/products/macosko-2011-10-b/nc0927472に提供されるとおり、PCRミックス(例えば1×EvaGreen Supermix)およびバーコード付ビーズと単離し得る。細胞調製は、標的からPCRミックスにプローブを直接的に変性し(95℃の温度で)、その後増幅するのに十分であるため、PCR前に先の細胞溶解が必要ない;PCR増幅は区画化油滴内で実施される。バーコード付ビーズは、同じ細胞からの全プローブを個々にバーコード付けし、単一細胞解像度を提供する。油滴は変性され、全PCR産物はシークエンシングされる。一般的に使用される液滴マシンはBioRad QX200、Quanti3DシステムおよびNadiaシステム(Dolomite Bio)である。
区画は、固体支持体、例えば、サイトスピンにおけるようなスライドまたは細胞単層にあってよくまたは区画は懸濁液にあってよい(図6b)。細胞および/または区画は好ましくは固定され、核酸が保存され、プローブの目的の区画へのアクセスが可能とされる。種々の固定レジメンは、細胞または特異的区画からタンパク質または核酸を喪失させ得て、特異的区画、例えば核におけるRNAの有利な検出に使用され得る(Levsky, J.M. et al., 2002, Single-cell gene expression profiling. Science 297, 836-840; Pombo, A., 2003, Cellular genomics: which genes are transcribed when and where? Trends Biochem. Sci. 28, 6-9.)。本発明のある実施態様において、細胞および/または区画を穏やかな界面活性剤、Triton X-100またはサポニンまたはTween-20、例えば0.05%~5%まで、好ましい0.1~0.5%で、1~120分間、好ましくは10~30分間またはプロテアーゼなどの別の薬剤で処理して、目的の区画内の核酸への一次プローブのアクセスを増強し得る。
工程(b)によるssDNAオリゴヌクレオチドプローブの核酸、例えば、RNAへのハイブリダイゼーションは、核酸含有区画の固定が先行し、ここで、所望により、核酸含有区画は固定後切片化される。
多数の固定方法が当分野で知られる。固定は、例えば、例えばメタノール、エタノールまたはアセトンなどの沈殿固定剤の使用を含み得る。沈殿固定剤は、特に凍結切片の固定に適する。
好ましい実施態様において、核酸含有区画の固定は、ホルムアルデヒドまたはグルタラルデヒドなどの架橋剤を介して達成される。架橋はまたUVまたはイオン化照射を介して達成される。しかしながら、照射は、RNAおよびDNAなどの核酸の完全性を破壊できる強力な変異原であるため、照射による架橋はあまり好ましくない。
ホルムアルデヒドは、好ましくは架橋剤として、例えば、0.5~8%、好ましくは、1~8%、2~8%または最も好ましくは、4~8%(全w/w)の濃度で、例えば、250mM HEPES-NaOH pH7.0~8.0の緩衝化溶液またはPBSまたは細胞骨格(CSK)緩衝液中で、使用される(Tripathi et al., 2015, RNA Fluorescence In Situ Hybridization in Cultured Mammalian Cells. In: Carmichael G. (eds) Regulatory Non-Coding RNAs. Methods in Molecular Biology (Methods and Protocols), vol 1206. Humana Press, New York, NY. https://doi.org/10.1007/978-1-4939-1369-5_11)。哺乳動物細胞について、条件は、好ましくはpH7.6~7.8、10分間~24時間、例えば、10分間、4%ホルムアルデヒド、続いて2時間、8%を含む。例えば、実験生物の場合、組織または生物全体を、HEPES-緩衝化ホルムアルデヒド溶液(例えば、4%)またはPBS-緩衝化ホルムアルデヒド溶液で、好ましくは少なくとも30分間還流し、続いて氷冷250mM HEPES-NaOH pH7.6中4%ホルムアルデヒドで30分間~1時間、続いて氷冷250mM HEPES-NaOH pH7.6中8%ホルムアルデヒドで1~3時間組織切開することにより、架橋され得る(Moeller et al., 2012, Proteomic analysis of mitotic RNA polymerase II complexes reveals novel interactors and association with proteins dysfunctional in disease. Mol. Cell. Proteomics 11(6):M111.011767; Winick-Ng et al., 2020, Cell-type specialization in the brain is encoded by specific long-range chromatin topologies, Biorxiv. https://doi.org/10.1101/2020.04.02.020990; https://www.protocols.io/view/Stellaris-RNA-FISH-Protocol-for-FrozenTissue-iwgs5v; https://www.protocols.io/view/exfish-tissue-slice-n6adhae)。
組織または細胞の固定を、種々の強度で実施し得る。本発明の方法は、4~8%ホルムアルデヒドで、例えば、数時間処理など、極めて強い架橋条件でも核酸の検出を可能とする。高レベルの架橋は、細胞をより効果的に保存し、その後の過程中の核酸種保存に有利である。故に、高架橋は、時間のかかる適用または高機械的ストレスに付されるための細胞を調製する。驚くべきことに、本発明は、特に、切片化と組み合わせたとき、高度に架橋された細胞または組織に適用できる。
別の実施態様において、核酸含有区画はオリゴヌクレオチドプローブハイブリダイゼーション前に固定されず、ここで所望によりガラス化される。ガラス化は、細胞構造を保存し、化学架橋剤(例えばホルムアルデヒド)により導入される可能性のあるあらゆるアーチファクトを避けるための、細胞、組織または生物全体の急速な凍結をいう。
本発明の方法の工程(b)において、核酸含有区画または好ましくは、その断片、例えば、超極薄断片を、複数の一本鎖オリゴヌクレオチドプローブと接触させる。プローブは、サンプル中の核酸の存在の検出に使用できる、DNA、RNAまたは、例えば、LNA(ロック核酸)を含むまたはそれからなる化学修飾オリゴヌクレオチドの切片である。本発明において、プローブは一本鎖DNAオリゴヌクレオチドである。DNAオリゴヌクレオチドは、通常150nt長以下の短DNA分子である。使用者により特定され得るあらゆる配列を有する一本鎖分子として製造され得る。あるいは、配列はランダムでもあり得る。これらのオリゴヌクレオチドは、配列特異的相補的塩基対形成を介して標的核酸と結合し、安定な二本鎖を形成する。オリゴヌクレオチドプローブとその標的配列間の相補的塩基対数が多いほど、二鎖間の非共有結合は強くなる。ストリンジェントな洗浄は非特異的プローブを除去し、互いに結合した強い対形成した鎖のみを保持する。ハイブリダイゼーション性質(融解温度)が増加した、すなわち、LNAを含む化学修飾RNA分子の使用により特異性も増加し、例えば、特異的一塩基多型を検出するまたは臨床サンプル中のあまり豊富ではないRNA種の検出に有利である可能性がある(Domiguez and Kolodney, 2005, Wild-type blocking polymerase chain reaction for detection of single nucleotide minority mutations from clinical specimens. Oncogene 24, 6830-6834)。複数のプローは、1を超えるあらゆる数のDNAオリゴヌクレオチドをいう。本発明のいわゆるプローブライブラリーを形成するプローブの厳密な数は変わり得て、本発明により試験する遺伝子数に対応する。
本発明において、用語「ここで、方法は核酸検出増幅手段として一連のプローブハイブリダイゼーションを含まない」は、標的に結合した初期プローブとハイブリダイズする二次「ヘルパー/さらなる」プローブの使用を除外すると解釈されるべきである。本用語はまた本発明の方法が、初期プローブのその標的からの放出、続いてその後の新規プローブによる置き換えの工程を含まないことも意味する。
これに沿って、本発明の方法は、好ましくはライゲーション工程、すなわち、プローブ増幅および遺伝子検出を促進するための、例えば2以上の本発明のプローブが、例えば化学的または酵素的に互いにライゲートされるまたは1以上の本発明のプローブが別のタイプのプローブとライゲートされる工程を含まない。
好ましい実施態様において、本発明のプローブは、あらゆる分子タグ、例えば、DNA、RNAまたはビオチンタグを含まない。プローブは、好ましくは例えば、制限酵素位置または光開裂性リンカーなどの開裂性モチーフを介してプローブに結合したあらゆる分子タグを含まない。従って、本発明の方法は、DNAまたはRNAタグなどの分子タグをプローブから開裂する工程を含まず、例えば、UV処理または制限酵素処理の必要性を開始するのが好ましい。
好ましい実施態様において、本発明の方法で使用するプローブにより検出すべき核酸、すなわち、標的核酸はRNAである。
ここに記載される方法はRNA分子自体もそこから産生されたcDNA遺伝子も、開裂性(例えば、DNA)標識またはタグもシークエンシングせず、むしろそれに相補的に結合したssDNAオリゴヌクレオチドプローブの直接シークエンシングまたは増幅により目的のRNAを同定する。それ故に、本発明の方法は、好ましくはcDNA産生工程を含まない。工程(b)の接触は、プローブが該区画内のRNA分子と結合(またはハイブリダイズ)することを可能とする条件下で実施する。故に、プローブは、該区画内のRNA分子とハイブリダイズする。条件は、所望によりまだ区画に含まれ得るDNAへのプローブのハイブリダイゼーションが可能とならないように選択してよく、例えば、DNaseを使用して、ssDNAプローブハイブリダイゼーション前に区画を処理し、dsDNAおよびssDNAを除去し得る(Pombo, A., et al., 1994, Adenovirus replication and transcription sites are spatially separated in the nucleus of infected cells. EMBO J. 13(12), 5075-5085)。あるいは、特異的dsDNasesを、dsDNAのためにプローブ後ハイブリダイゼーションに使用し得る。適当なdsDNaseは商業的に、例えばThermoFisher (Cat.No.: EN0771)から得ることができる。
プローブをRNAとハイブリダイズする条件の例は、30~65℃、例えば、37~55℃で、例えば、10~50%、好ましくは30%、ホルムアミドおよび5~20%、好ましくは10%、硫酸デキストランを含む食塩水-クエン酸ナトリウム(SSC)緩衝液中である。所望により、緩衝液に、リボヌクレオシドバナジル複合体(RVC)または、ハイブリダイゼーション緩衝液がホルムアミドを含まないとき、RNaseOUTTMなどの適当なリボヌクレアーゼの阻害剤を添加し得る。緩衝液は、さらにtRNA(例えば酵母から)を、非特異的ブロッカーとして、例えば、約1mg/mLの濃度で含み得る。ハイブリダイゼーションは、例えば、少なくとも15分間~1週間、好ましくは、少なくとも30分間、例えば、少なくとも45分間、少なくとも1時間、少なくとも2時間または少なくとも5時間、行い得る。より長く、例えば一夜、二夜または三夜継続もさせ得る。適当な条件は下の実施例にも記載される。注目すべきは、温度およびホルムアミド濃度がプローブハイブリダイゼーションに影響しないだけでなく、非結合または一部ハイブリダイズしたプローブの除去に使用するストリンジェントな洗浄のストリンジェンシーも調節する。従って、上で選択した条件は、本発明の方法の感受性および特異性に大きく貢献する。
別の実施態様において、本発明の方法により検出すべき核酸は、DNA、好ましくは一本鎖DNAであり得る。
従って、接触工程(b)は、プローブが該区画内のDNA分子とハイブリダイズできる条件下で実施する。例えば、検出すべきDNAがdsDNAであるとき、プローブハイブリダイゼーションにアクセシブルなssDNAを得るために変性されている。所望により、RNaseを、サンプルからRNAを除去するためにプローブハイブリダイゼーション前の区画の前処理にまたは後に使用し得る。プローブハイブリダイゼーションは、RNA検出について上記したのと同じ条件下で行い得る。
正確なDNA検出のために、本発明の方法はさらに二本鎖DNAプローブ複合体と天然に存在するdsDNAの断片(例えばゲノムまたはプラスミドDNA)の信頼できる差別化を可能にするために適合させ得る。例えば、オリゴヌクレオチドプローブを、ここに説明するとおり、同定を促進するためバーコード配列またはユニークな分子タグで修飾し得る。あるいは、シトシンメチル化などのゲノムDNA修飾を、解析からゲノムDNAを除去するために考慮し得る。
さらに別の実施態様において、本発明の方法は区画内のRNAおよびDNA両者の同時検出を可能とする。RNAおよびdsDNA両者の検出のため、例えば、プローブをまず、dsDNAの変性なくRNAとハイブリダイズするように加え、次いで、例えば、種々のバーコード配列またはタグを有する別のセットのプローブをDNAとその変性後ハイブリダイズするように加え得る。RNAおよびssDNAを、ssDNAを破壊する条件を避ける以外、RNA検出について上記のとおり同時に検出もできる。
好ましい実施態様において、本発明の方法はRNA単離工程を含まない。有利に、核酸単離が工程b)前に実施されない。ここに記載される方法は、好ましくは、核酸とインサイチュで、すなわち、核酸が天然に存在する区画内でハイブリダイズする、ssDNAオリゴヌクレオチドプローブを利用する。それ故に、本発明の方法は、区画内の検出核酸の局在化に適する。
別の実施態様において、本発明の方法は、区画から単離されている核酸の検出にも使用し得る。核酸は、例えば、インビトロで、例えば試験管内の適当な緩衝液中で検出され得る。このようなシナリオにおいて、ssDNAオリゴヌクレオチドプローブを、ハイブリダイゼーションするために試験管内の単離核酸に直接加え得る。あるいは、プローブハイブリダイゼーションは、インサイチュで行い、その後核酸および全結合プローブを核酸含有区画から単離し得る。
本発明の方法で使用するssDNAオリゴヌクレオチドプローブは、当分野で知られるあらゆる方法により産生され得る。例えば、各プローブは別々に合成され得る(Femino, A.M., et al., 1998, Visualization of Single RNA Transcripts in Situ. Science, 280(5363), 585-590)。最近、高数のプローブが、所望により、増幅および溶液への放出前に、マイクロチップなどの固体基質上での大規模な並行合成により調製された(Beliveau et al., 2012; Beliveau et al., 2017, In situ super-resolution imaging of genomic DNA with OligoSTORM and OligoDNA-PAINT. Methods Mol Biol. 1663, 231-252; https://oligopaints.hms.harvard.edu/protocols)。
本発明のssDNAオリゴヌクレオチドプローブは、約55~150ヌクレオチド(nt)、好ましくは70~120ntまたは約80~115ntの長さを有し得る。下記実施例および好ましい実施態様において、プローブは75~85ntまたは107~113ntの長さを有し得る。例えば、プローブ長は、故に、約75~85ntであり得る。
各プローブは、典型的に一対のプライマー領域、例えば、ユニバーサルプライマー領域(図1;プローブ構造)が横にある標的核酸(例えば、標的RNA)のヌクレオチド配列に相補的である標的領域を含む。この中心標的領域のヌクレオチド配列は、個々の核酸と特異的にハイブリダイズする。ハイブリダイゼーションは、2個の一本鎖核酸分子が互いに相補的塩基対形成を介してアニールする、すなわち一方の核酸鎖に存在する含窒素塩基アデニンが逆の鎖のチミン(DNA)またはウラシル(RNA)と対形成し、水素結合を形成する、一方シトシンがグアニンと対形成する、過程をいう。重要なことに、本発明のプローブのターゲティング領域は、特異的結合を確実にするためにその各標的核酸に対して高ストリンジェンシーを示すよう、すなわち、異なる核酸とアニールできないように設計される。好ましくは、標的領域は、目的の核酸内の配列と100%相補性を示す。従って、ここに記載される方法は、単一ヌクレオチドで異なる核酸分子を示差的に検出する能力を有する。SNP検出により種々のアレルを区別できる高度に感受性オリゴヌクレオチドプローブを設計する可能な方法は、Beliveau et al., 2014に詳述され、種々の種について存在する公的に利用可能なSNPコレクションデータベースを利用する。プローブの標的領域は、特異的にハイブリダイズしたプローブの変性前、すなわち、プローブがその標的核酸から除去される前、部分的にハイブリダイズしたプローブを除去するために、プローブおよびその標的核酸により形成された二本鎖が、37℃~65℃、例えば、45~50℃またはより好ましくは、47℃の温度でのストリンジェントな洗浄に耐えることを可能にする安定性を有するよう設計する。温度を上げたストリンジェントな洗浄による過剰のプローブの除去は、検出方法の高特異性を確実とする。下記実施例において、ストリンジェントな洗浄を、40%ホルムアミドを含む緩衝液中、47℃で、デキストラン存在下実施した。標的領域は、例えば、20~50nt、好ましくは、30~45nt、例えば、30nt、31nt、32nt、33nt、34nt、35nt、36nt、37nt、38nt、39nt、40nt、41nt、42nt、43nt、44ntまたは45ntの長さを有し得る。2つの特定の好ましい実施態様において、標的領域は約35ntまたは約39~45ntの長さを有し得る。標的領域は45ntより長い、例えば、45~50ntであってよい。標的領域の長さが延長すると、プローブ特異性が増加する。しかしながら、標的領域は、例えば、小標的核酸とハイブリダイズするため、30ntより短い長さでもよい。例えば、成熟miRNAは、わずか20~25nt長である。従って、プローブの標的領域の長さは、故に、標的miRNAの長さに対応する。プローブの標的領域は、標的核酸の特異的および選択的検出をなお確実とするため、最小20ntの長さを有し得る。プローブ長以外に、ハイブリダイゼーションストリンジェンシーは、プローブの厳密なヌクレオチド組成にも依存し得る。高いGC(グアニン/シトシン)含量は、通常高いストリンジェンシーと相関する。
別の実施態様において、標的領域またはプローブは、目的の核酸と100%未満の相補性、例えば、85~99%または90~95%相補性を有する。不完全な相補的は、例えば100%信頼できる標的核酸の正確なゲノム配列が未知であるときの適用に望まれ得る。特にヒトにおいて、種々のアレル間のSNPは未知であり得る。ある量の誤対合を可能とするプローブが、故に、2種の異なるアレルからの複合遺伝子発現の評価に利用され得る。
任意的実施態様において、プローブの標的領域は、既定の標的核酸とハイブリダイズするよう設計されなくてよい。その代わり、標的領域は、ランダムに集められたヌクレオチドのストレッチからなり得る。このような「ランダム」オリゴヌクレオチドプローブを、なお未知のRNAまたはDNA分子とハイブリダイズさせる意図で区画に加え得る。
標的領域の各側のユニバーサルプライマー領域はプローブの増幅を可能とし、シークエンシングアダプターに付加し得る(図5a)。所望により、ユニバーサルプライマー領域を、プローブハイブリダイゼーションの成功の直接的顕微鏡的検証を可能とするために蛍光インサイチュハイブリダイゼーション(FISH)プローブのための標的位置としておよび最適化中使用し得る(図4)。各ユニバーサルプライマーは、15~30nt、好ましくは20~25nt、例えば、21~23ntの長さを有する。所望により、ユニバーサルプライマーは22ntの長さを有する。
好ましくは、一本鎖DNAオリゴヌクレオチドプローブは、さらにユニークな分子識別子(UMI)を含む。UMIは、ユニークな分子タグとして役立つランダムに集められた短ヌクレオチド配列である。各UMIは、特定のプローブを個々に標識し、故に誤りおよび増幅により導入された定量的バイアスを効果的に減らしながら、信頼できるプローブ同定を容易にする。本発明のプローブのUMIでの標識は、区画内の核酸、例えば、RNAを定量すべき適用において好ましい。UMIは、特に全体量が少ないサンプル中のRNAを処理するとき、例えば、稀な転写物バリアントの同定をさらにより容易にし得る。
所望により、ssDNAオリゴヌクレオチドプローブは、さらに少なくとも1個の(例えば、少なくとも2個の)同定バーコード配列を含み得る。バーコードは、個別のプローブのみをユニークに同定するのではなく、共通の特徴によりグループ化され得る異なるプローブのコレクションを標識する点で、UMIと異なる(Beliveau et al., 2012)。例えば、バーコード配列は、同じ目的の特異的遺伝子を標的とする全プローブを標識とし得る。それとは別におよび/またはそれに加えて、遺伝子の同じ遺伝子の領域、例えばエキソンおよびイントロンまたはエキソン/イントロン接合部をターゲティングする全プローブにより共有され得る。バーコードはまた特定の機能または共通の経路を共有する遺伝子のプローブを集約し得る。バーコード配列は、さらにPCRベースの定量中プライマーの結合領域として役立ち得る。
所望により、一本鎖DNAオリゴヌクレオチドプローブはUMIを含まない。所望により、一本鎖DNAオリゴヌクレオチドプローブはバーコード配列を含まない、そしてある実施態様において、UMIもバーコード配列も含まない。プローブのこれらの成分は必要なく、そして本発明の方法でシークエンシングまたは増幅される必要もあるため、回避が有利であり得るバイアスを導入し得る。バーコードは、さらにオフターゲットアニーリング事象を導入する、すなわちターゲティングを意図しないRNAとアニールし、データのノイズをもたらし得るアッセイの特異性を減らす可能性がある。これは、UMIまたはプライマー領域または相同性位置に隣接するとき、さらにオフターゲット結合の機会を増やすかまたは使用するDNAバーコード数が多くなることにより、さらに問題となり得る。故に、プローブがバーコード配列を含まないのが好ましい。
例えば、特異的RNAが細胞で発現されるかを解明するために本発明の方法を一タイプのプローブで実施するのも興味深いが、典型的に、複数のプローブは複数の種々のプローブである、すなわち、本発明の方法で使用する一本鎖DNAオリゴヌクレオチドプローブが区画に存在する複数の標的核酸、例えば、標的RNAまたは一標的核酸上の種々の領域に特異的にハイブリダイズする。例えば、プローブを、特異的細胞型および/または分化マーカーとして役立つ遺伝子から転写されたRNAセットのターゲティングまたはウイルス転写物の検出に使用され得る。プローブは、例えば、Oct4またはSox2などの周知幹細胞マーカーの転写物であり得る。プローブは、異なる細胞型または細胞系譜への幹細胞の分化を表しかつ追跡するマーカー遺伝子の転写物も検出し得る。複数のプローブにより標的とされ得る別の遺伝子のサブセットは、例えば、炎症性サイトカインのセット、特定のシグナル伝達カスケードのメンバーまたは特定のがんマーカーおよび別の疾患マーカーを含む。プローブはまた細胞周期における段階に基づき種々の区画またはその断片を分類するためにサイクリンEまたはBなどの細胞周期マーカー遺伝子を検出するよう特別に設計され得る。解析された細胞型の全てまたは大部分に共通し、環境変化に非応答性である既知ハウスキーピング遺伝子をターゲティングするさらなるプローブを、例えば示差的遺伝子発現の解析を正規化するための対照として含めてよい。
使用し得る典型的プローブライブラリーは、数百の核酸、例えば、マーカー遺伝子などの遺伝子から転写されたmRNAを標的とし得る。このようなプローブライブラリーは、複数適用に適し得る。例えば、プローブライブラリーは、少なくとも2個の核酸、例えば、2~100000個、3~50000個、4~25000個、5~10000個、10~5000個、15~2000個、20~1000個、25~500個、30~250個、40~200個、50~100個の核酸、例えば、mRNAなどのRNAを標的とし得る。少なくとも50個、少なくとも100個、少なくとも200個、少なくとも300個、少なくとも400個、少なくとも500個、少なくとも600個、少なくとも700個、少なくとも800個、少なくとも900または少なくとも1000個核酸、例えば、mRNAなどのRNAも標的とし得る。ある実施態様において、プローブライブラリーは、50個未満の核酸、例えば、RNAも標的とし得る。例えば、プローブが大規模な並行シークエンシングではなくPCRベースのプローブ増幅で検出されるとき、最大5個、最大10個、最大15個、最大20個、最大25個、最大50個、最大75個、最大100個、最大200個、最大300個、最大400個または最大500個の核酸をターゲティングするプローブライブラリーを調製し得る。しかしながら、好ましい実施態様において、共通プローブライブラリーまたは完全共通ライブラリーからのプローブを、プローブがシークエンシングまたは増幅により同定されるかにかかわらず、使用し得る。
本発明の方法により得ることができる情報量を最大化するために、単一核酸、例えば、mRNA転写物を、例えば、複数プローブにより種々の位置で標的化し得る。複数プローブは、異なるスプライシングバリアントを検出するために、単一遺伝子の例えば数エキソン、イントロンならびにエキソン/イントロンまたはエキソン/エキソン接合部をカバーし得る。あるいは、プローブは、例えば、ヌクレオチド欠失、挿入、反転または置換により異なる遺伝子からの転写物のアレルバリアントを標的または認識するよう特別に設計され得る。本方法で使用するプローブは、単一SNPで異なる転写物間を正確に区別するのに十分な特異性を示し得る。遺伝子融合体は、既知融合接合部をターゲティングするプローブの設計またはそれぞれ遺伝子からの転写物の3’または5’末端に結合するプローブの検出レベルの比較により検出され得る。
ある実施態様において、プローブは、全エキソンおよびイントロンを含む完全な範囲でまで核酸、例えば遺伝子からの転写物をカバーし得る。従って、単一転写物に結合できるプローブの数は、コードする遺伝子の長さに依存し得る。例えば、2000nt長の転写物は、500nt長のRNAより多いプローブで標的化され得る。目的の遺伝子の転写物の全長をカバーするプローブの設計は、遺伝子または転写物、特にスプライスバリアント、アイソフォームまたは融合産物の存在の最大量の情報を提供する。例えば、遺伝子の全エキソンおよびイントロン、または、妥当ならば、全スプライス-バリアントのプローブを使用し得る。しかしながら、いくつかの実験において、特に、多数の遺伝子が検討中であるとき、どの遺伝子が活発に転写されているかまたはされていないかを決定するので十分であり得る。それ故に、費用および作業負荷を減らすため、RNA分子は、数プローブのみまたは多くて単一の特異的プローブにより標的かされ得る。RNAの存在を、本発明の方法によりプローブのシークエンシングまたは増幅を介して決定するため、これが可能である。対照的に、顕微鏡法によりRNAを検出するFISHベースの方法は、通常検出可能なFISHシグナルを生じるために複数プローブの転写物とのハイブリダイゼーションを必要とする。同様に、FISHベースのHyPR-Seqは、少なくとも一対のイニシエータープローブの目的のRNAへのハイブリダイゼーション、続いて準安定ヘアピンオリゴおよび「リードアウトオリゴ」の一連のアニーリングを必要とする。
それ故に、核酸、例えば遺伝子からの転写物は、約1~1000個、50~700個、100~500個、150~400個、200~300個のオリゴヌクレオチドプローブだけでなく、わずか1~100個、1~50個、1~20個、1~10個、1~5または1~3個のオリゴヌクレオチドプローブにより標的化され得る。本発明による有効なRNA検出に十分なプローブ濃度は初期プローブライブラリーのサイズおよび複雑さだけでなく、調査下の区画およびプローブハイブリダイゼーション前の処理法に依存し得る。約200nm厚の細胞凍結切片上の有効なRNA検出のために、各オリゴヌクレオチドプローブは、例えば適当な緩衝液溶液(例えば水)中、約0.1~約1μM、好ましくは0.2~0.8μM、0.3~0.7μMまたは0.4~0.6μMの濃度で使用され得る。特に好ましい実施態様において、プローブは0.5μMの濃度を有し得る。好ましくは、ライブラリー中のユニークなプローブあたり約0.1nM。
好ましくは、一本鎖DNAオリゴヌクレオチドプローブは、mRNA、rRNA、snRNA、snoRNAおよびtRNA、miRNA、siRNA、shRNAおよびpiRNAを含む小制御RNA、eRNAおよびlncRNAを含む長制御RNA、circRNA、tracrRNA、crRNA、レトロトランスポゾン、ウイルスRNA、サテライト、TERC、vtRNA、DDRNA、PROMPTまたはそれらの組み合わせを含むタンパク質生合成に関与するRNAを含む群から選択される標的RNAと特異的にハイブリダイズする。
原則として、本発明は、故に、区画に見られる全RNA分子の検出および同定を可能とする。
好ましい実施態様において、標的RNAはmRNAである。mRNAは、DNAブループリントからの遺伝情報をリボソームに伝達し、そこで、コードされた情報がポリペプチド鎖に翻訳される。故に、区画におけるmRNAの検出は、タンパク質コード遺伝子発現について価値ある情報を提供する。ある実施態様において、本発明の一本鎖DNAオリゴヌクレオチドプローブは、区画に存在する実質的に全てのmRNAと特異的にハイブリダイズするライブラリーを形成し得る。このようなプローブライブラリーを使用して、本方法は、それ故に同等な小サブセットの例えばマーカーmRNAの検出のみに限定されず、むしろ、タンパク質コードトランスクリプトーム全体の検出を可能とする。故に、本発明の方法は、例えば、環境条件変化、加齢または変更された(すなわち損なわれたまたは増強された)細胞シグナル伝達に応答する包括的遺伝子発現の差異を試験する手段も提供する。
真核生物細胞において、mRNAは、前駆体mRNA(プレmRNA)として知られる長前駆体転写物としてRNAポリメラーゼにより細胞核内でDNAから転写される。タンパク質への翻訳のために細胞質に輸送される前、プレmRNAは、核内で連続的プロセシング工程を受ける。これらの工程の一つの間、プレmRNAは、非コード遺伝子間領域(イントロン)が新生転写物から切断され、残りのコード領域(エキソン)が互いに融合して成熟mRNAとなるスプライシングと呼ばれる工程に付される。単一プレmRNAは、スプライシング機構(スプライソソーム)によりイントロンまたはエキソンとみなされるセグメントの選択に応じて、種々の方法でスプライスされ得る。例えば、エキソンは伸ばされまたは飛ばされ得て、イントロンが最終転写物に残り得る。選択的スプライシングは、種々の機能的性質を備えた一定範囲のユニークなタンパク質を生じ得る異なる成熟mRNAバリアントをもたらす。本発明において使用されるプローブはプレmRNAおよび/またはこのようなスプライスバリアントを検出し得る。プローブを、遺伝子アイソフォーム、すなわち同じ遺伝子または遺伝子座を生ずるが、例えば異なる転写開始位置(TSS)から転写されたため互いに異なるmRNAを検出するよう、さらに設計され得る。
しかしながら、mRNAは細胞に存在する全RNAのわずかな部分しか表さない。ヒトゲノム全体で2%しかタンパク質をコードしないと推定される。哺乳動物で見られる残り98%のRNA転写物は非コードとみなされる(Dhanoa, J. K., Sethi, R. S., Verma, R., Arora, J. S., & Mukhopadhyay, C. S., 2018, Long non-coding RNA: its evolutionary relics and biological implications in mammals: a review. Journal of animal science and technology, 60, 25)。それ故に、本発明の方法で使用するssDNAオリゴヌクレオチドは、それとは別にまたはそれに加えて非コードRNAとハイブリダイズし、検出し得る。例えば、プローブはトランスファーRNA(tRNA)を検出し得る。tRNAはアミノ酸をリボソームに輸送し、mRNAからポリペプチド鎖への翻訳中、中心的役割を有する。プローブは、リボソームRNA(rRNA)を検出するようにも特別に設計され得る。rRNAは、細胞で最も一般に見られるクラスのRNAを表し、リボソームを形成するためのタンパク質セットと関連する。rRNAは構造機能を果たすだけでなく、ポリペプチド鎖を形成するアミノ酸間のペプチド結合形成の触媒により酵素活性も果たす。故に、rRNAはリボザイムのクラスに属する。偏在的に豊富であるため、rRNAは選択的枯渇または排他的に予め選択されたポリアデニル化転写物によりシークエンシング前に古典的RNA-Seq実験から大部分除外される。しかしながら、種間のrRNA配列の比較は、系統発生学的関係および種多様性について有用な情報を提供する。
本発明の方法におけるプローブで検出可能なリボザイムの別の例は、一群のタンパク質と共にスプライソソームを形成する小核RNA(snRNA)である。snRNAは、スプライシング過程中プレmRNAからのイントロンの除去を触媒する。rRNA、snRNAおよびtRNAプロセシングは、小仁RNA(snoRNA)ファミリーにより、核の小区域、核小体内で調節される。
制御RNAは、種々の生物学的過程を調節する非コードRNAである。このRNA群の中で、小制御RNAは特によく研究されており、故にトランスクリプトーム試験で非常に興味深い。小制御RNAは、40nt以下のサイズを有し、通常遺伝子発現を転写後制御する。これらの小RNA中、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)およびPiwi相互作用RNA(piRNA)が最も理解されている。数百の異なるおよび進化的に保存されたmiRNAが事実上全生体分子経路内の全ヒトタンパク質コード遺伝子の60%超の発現を調節すると推定される(Catalanotto, C., Cogoni, C., & Zardo, G., 2016, MicroRNA in Control of Gene Expression: An Overview of Nuclear Functions. International journal of molecular sciences, 17(10), 1712)。特に細胞死および増殖の制御における特有の役割のため、マイクロRNAは腫瘍サプレッサーまたはがん遺伝子の両者であり得る。故に、一般的に腫瘍マーカーとして使用される。このようながん関連miRNAに特異的にハイブリダイズするよう設計されたプローブは、故に、組織のがん細胞を確実に同定する。miRNAは、ヘアピン構造を形成し、エンドヌクレアーゼ的切断を介して処理される長前駆体転写物から産生される。miRNAは、タンパク質複合体をmRNA分解または翻訳阻害を開始するよう相補的塩基対形成を介して標的mRNAに導く、RNA干渉(RNAi)として知られる分子機構を介して、転写後遺伝子発現をサイレンシングする。低分子干渉RNA(siRNA)は、二本鎖RNA分子から始まる以外、miRNAと類似の生物発生経路を利用する。miRNAに類似して、標的mRNAがタンパク質に翻訳されるのを阻止するためにRNAiを使用する。本発明の方法のプローブは、成熟バージョンのこれら種々の小RNA種を特異的に検出、例えば、処理する。これに加えてまたはこれとは別に、プローブは、長い一次または前駆体転写物を検出するよう設計され得る。短ヘアピンRNA(shRNA)は、RNAi機構(遺伝子ノックダウン)を介して目的の遺伝子の発現を減少するよう、細胞または生物に研究者により外因的に導入された人工的に産生された分子である。本発明の方法は、例えば、モデル生物または細胞でshRNAおよび標的mRNAのレベルを評価することにより、科学者がshRNA導入および遺伝子ノックダウンの有効性を検証することを可能とする。わずかに長いPiwi相互作用RNA(piRNA)は小非コードRNAである。転位因子サイレンシングについて最もよく知られている。
miRNA、siRNAまたはpiRNAなどの短制御RNAに加えて、非コード制御RNAのサブセットは、さらに長非コードRNA(lncRNA)のクラスおよびエンハンサーRNAを含む。lncRNAは、ヒトで高度に発現され、少なくとも200nt長であり、しばしばmRNAと同じ様式で処理される。しかしながら、lncRNAは、通常オープンリーディングフレーム(ORF)を欠く点で、mRNAと異なる。LncRNAは、転写、転写後制御、RNAi、スプライシング、翻訳または後成的制御などの種々の細胞過程を制御する。しかしながら、多くのlncRNAの生物学的関連性は現在不明である(Dhanoa et al., 2018)。例えば、多くのlncRNAは、実際機能が未知のペプチドをコードする(van Heesch et al., 2019, The Translational Landscape of the Human Heart. Cell 178(1), 242-260)。本発明の方法でのlncRNAの解析は、発現、局在化および最終的に、機能についての新規情報を提供する。
eRNAは50~2000nt長であり、エンハンサー領域のDNA配列から転写される。発現は、対応するエンハンサーの活性と相関し、故に、活性および静止エンハンサー間の区別のための適当なマーカーである(Arnold et al., 2020, Diversity and Emerging Roles of Enhancer RNA in Regulation of Gene Expression and Cell Fate. Front. Cell Dev. Biol.)。eRNAは、エンハンサー-プロモーター相互作用、クロマチン修飾または転写機構制御促進によるmRNA転写を制御し得る。
環状RNA(circRNA)は、しばしば不明な分子機能を有する、一本鎖、ループ形成RNA分子である。一部circRNAは、miRNAスポンジとして作用すると考えられ(Kristensen et al., 2019, The biogenesis, biology and characterization of circular RNAs. Nat Rev Genet. 20(11), 675-691)、一方その他はタンパク質をコードすると考えられる(van Heesch et al., 2019)。重要なことに、ヒト脳における特異的circRNAの発現は、神経変性障害、特にアルツハイマー病(AD)の発症および進行と関連づけられている。故に、AD診断のバイオマーカーの可能性があると考えられている(Akhter, 2018, Circular RNA and Alzheimer’s Disease. Adv Exp Med Biol. 2018;1087:239-243)。
本発明はまた細胞中の外来、病原性RNA、例えばウイルスRNAゲノムおよびサテライトまたはその一部の検出にも適し得る。トランス活性化RNA(tracrRNA)などの抗ウイルス免疫防御に関連する細菌RNAまたはCRISPR/Cas介在遺伝子工学に使用するCRISPR-RNA(crRNA)およびそれらの修飾バージョンの検出にさらに適し得る。TERC(テロメラーゼRNA要素の略)は、真核生物に見られる非コードRNAであり、酵素テロメラーゼによるテロメア伸長の鋳型として役立つ(Feng et al.,1995, The RNA component of human telomerase. Science 269(5228), 1236-1241)。DDRNAは、DNA二本鎖切断位置で産生される短非コードRNAであり、細胞におけるDNA損傷応答に必要である(Michelini, F., Pitchiaya, S., Vitelli, V. et al., 2017, Damage-induced lncRNAs control the DNA damage response through interaction with DDRNAs at individual double-strand breaks. Nat Cell Biol 19, 1400-1411)。レトロトランスポゾンは、RNAに転写され、その後逆転写により変換されてDNAに戻り、続いて種々のゲノム位置で挿入される、ゲノム内のDNA配である。ヴォールトRNA(vtRNA)は、細胞内、特に核原形質輸送過程におそらく機能を有するヴォールトとして知られるリボ核タンパク質粒子の一部である。プロモーター上流転写物(PROMPT)は、転写開始位置の約1~1.5kb上流の大部分の活性タンパク質コード遺伝子の逆配向の非コードRNA転写である。PROMPTSは、通常RNAエキソソームにより迅速に分解される(Lloret-Llinares et al., 2016, Relationships between PROMPT and gene expression. RNA Biol. 13(1), 6-14)。要約すると、最近、RNAの多数の新規種の証拠があるが、それらの機能はしばしば完全には理解されていない。本発明の方法は、本発明の方法におけるプローブによる選択的認識を介して、これらのRNA種の新規情報を得るために極めて重要である。
あるいは、一本鎖DNAオリゴヌクレオチドプローブは、染色体DNA、ミトコンドリアDNA、葉緑体DNA、細菌DNA、プラスミドDNA、ウイルスdsDNAまたは二本鎖DNA転位因子(トランスポゾン)を含む二本鎖DNAを含む群から選択される標的DNAに特異的にハイブリダイズし得る。
プラスミドは、染色体DNAから物理的に分離される小環状染色体外DNA分子である。プラスミドは、通常細菌に見られ、しばしば細菌の生存に有益である、例えば抗生物質耐性の遺伝子を運搬する。人工的に産生されたプラスミドは、しばしば細胞もしくは動物全体の遺伝的修飾または分子クローニング実施のためのベクターとして使用される。
ウイルス分類システムの第I群のウイルスは、遺伝子材料としてdsDNAを有する。一部ウイルスにおいて、ウイルスdsDNAゲノムは環状形状を有し(バキュロウイルス科、パルボウイルス科)、その他では、ウイルスDNAは線形である(アデノウイルス科、ヘルペスウイルス科)。
DNAトランスポゾンは、ゲノム内で位置が変わり得るDNA配列である。カットアンドペースト様機構を使用して、dsDNAはトランスポザーゼと称される酵素により新規遺伝子座に移動し、統合される。
本発明のオリゴヌクレオチドプローブのハイブリダイゼーションを可能とするため、dsDNAをまず一本鎖状態に変性しなければならない。天然に存在するdsDNAの変性は、好ましくは熱的に、すなわちDNA含有サンプルの温度を、DNAの含窒素塩基間の水素結合が破壊される点まで上げることにより実施する。厳密な変性温度はdsDNA分子の長さおよびそのGC含量に依存する。あるいは、DNAを、化学的に、例えばNaOHまたは高濃度の塩に曝すことによりまたはDNAe Iで処理して、ssDNA露出することにより変性し得る。
2個のssDNA鎖が元の二本鎖形態に復元する前に、ssDNAオリゴヌクレオチドプローブを、各目的の一本鎖DNA領域に結合するサンプルに加える必要がある。
さらに別の実施態様において、一本鎖DNAオリゴヌクレオチドプローブを、ウイルスssDNAゲノム、ヘリトロンならびに例えばRループに存在する一本鎖ゲノムDNAの一過性に露出されたストレッチまたはDNA損傷位置を含む群から選択される一本鎖DNA種を含む標的DNAに特異的にハイブリダイズするよう設計され得る。ウイルス分類システムの第II群のウイルスは、環状形態を採るssDNAゲノムを有する。本発明のプローブは、区画のウイルスssDNAゲノムを特異的に検出し、検出するよう設計され得る。
同様に、プローブは、ローリングサイクル機構により環状ssDNA中間体の産生に関与するゲノムの位置を切り替えるヘリトロンとして知られる特異的DNAトランスポゾンも検出し得る。
用語Rループは、DNA:RNAハイブリッドおよび非鋳型sDNAからなる三本鎖核酸構造である。Rループは、通常新たに転写されたRNAが撚り戻されて鋳型ガイドDNA鎖とハイブリダイズし、それにより非鋳型パッセンジャーDNA鎖を置き換えるとき、活発な転写の位置で開発される(Allison and Wang, 2019, R-loops: formation, function, and relevance to cell stress. Cell Stress 3(2), 38-47)。伝統的に、DRIP-Seqと称される方法により、Rループは配列無関係であるが、構造特異的抗体を用い、続いてDNAシークエンシングで検出される。本発明の方法において、特別に設計されたssDNAオリゴヌクレオチドプローブは、例えば追い出された非鋳型DNA鎖とハイブリダイズし得る。
ssDNAのストレッチは、別の状況で、例えば、DNA損傷により膠着複製フォークの位置で一過性にも生じ得る。
本発明のオリゴヌクレオチドプローブは、遺跡もしくは先史時代動物から得た古いDNAなどの断片化またはより高度に分解されたDNA分子も検出し得る。
要約すると、本発明は、故に、DNAがプローブハイブリダイゼーション前に一本鎖状態で存在する限り、科学者がDNA含有区画中のあらゆる目的のDNA分子を検出することを可能とする。
従って、ある実施態様において、一本鎖DNAオリゴヌクレオチドプローブのライブラリーは、ここに記載するとおり、区画に存在する、実質的に全RNAまたは全DNAまたはそれらの組み合わせを検出し得る。過去の生物情報学解析は、ヒトゲノム全体の90%超およびカエノラブディティス・エレガンスゲノムの100%が本発明において使用するプローブに類似するオリゴペイントとして知られる特別に設計されたユニークなDNAオリゴヌクレオチドプローブにより、約10プローブ/kbの密度でカバーされることを示差した(Beliveau et al., 2012)。それ故に、本発明は、細胞に存在するゲノムの最大75%、最大80%、最大85%、最大90%、最大95%または最大99%をカバーするRNAを選択的に検出する能力がある。ある実施態様において、本発明の方法のプローブライブラリーは、例えば、試験ゲノムの区画に存在するRNAまたはDNAまたはそれらの組み合わせの少なくとも99%、好ましくは、100%をカバーし得る。次いで、区画に存在する、実質的に全RNAまたは全DNAまたはそれらの組み合わせを検出し得る。
本発明の方法は、核酸修飾の検出に効果的に貢献もし得る。プローブは、例えば稀な編集されたRNA分子を検出するよう設計され得る。RNA編集は、RNAのヌクレオチド配列が、例えば、ヌクレオチドの欠失、挿入または置換を介して、転写後変更する過程に関する。RNA編集は、RNAの活性、安定性および局在化に影響し得る。DNAまたはRNAメチル化または塩基異性化などの別の核酸修飾を、特異的抗体で検出し得る。該核酸修飾の同定と組み合わせた本発明の方法での核酸検出により、当業者は特定の核酸の存在量を、ある空間位置でのその修飾と相関させることができる。
本発明の任意的実施態様において、実験については興味の対象ではない特異的核酸を、ssDNAオリゴヌクレオチドプローブの前または同時に核酸含有区画に「冷オリゴヌクレオチド」を加えることにより、解析から除外し得る。用語「冷オリゴヌクレオチド」は、望まない核酸を競合的に「無力化する」機能を有する非標識オリゴヌクレオチドをいう。例えば、本発明のプローブの使用は、フランキングプライマー領域を欠き、非常に豊富な核酸(例えばrRNAまたは7SK snRNA)と特異的にハイブリダイズするが、ハイブリダイゼーション後の工程で増幅しないオリゴヌクレオチドの添加に関連する。その結果、プローブは非標的核酸にもはや接近および結合できない。冷オリゴヌクレオチドがプライマー領域を欠くため、後の工程でPCRにより増幅されず、結果的に例えばシークエンシング中、同定されない。
標的核酸分子とハイブリダイズしないまたは相同配列の一部とのみハイブリダイズするプローブまたは、所望により、冷オリゴヌクレオチドを、本発明の方法中、工程(c)で区画から除去する。プローブ除去は、適当な溶媒でのストリンジェントな洗浄を含み得る。非ハイブリダイズプローブを、適当な緩衝液で、室温(20~25℃)~約75℃のあらゆる温度で、区画から洗い流し得る。好ましい実施態様において、非ハイブリダイズプローブを、約40%ホルムアミドで、45~49℃、好ましくは、47℃の温度で区画から洗い流す。ストリンジェントな洗浄は、食塩水-クエン酸ナトリウム(SSC)またはリン酸緩衝化食塩水(PBS)緩衝液などのハイブリダイゼーション実験中一般的に使用される別の緩衝液を使用しても実施され得る。緩衝液は界面活性剤、例えば0.1%Tween-20も含み得る。非結合プローブの除去は、少なくとも一回の洗浄工程を含み得る。同じまたは、好ましくは、例えば、ストリンジェンシーが増加した、種々の濃度の洗浄緩衝液を使用する1回を超える洗浄工程、例えば2回、3回、4回または5回の工程も含み得る。別の実施態様において、非ハイブリダイズプローブを、遊離ssDNAオリゴヌクレオチドを特異的に分解するエンドヌクレアーゼ、例えば、エキソヌクレアーゼIを使用して、区画から除去し得る。
所望により、ssDNAオリゴヌクレオチドプローブのRNAへのハイブリダイゼーションは、第二の、蛍光標識されたFISHプローブでハイブリダイズプローブをターゲティングすることにより、シークエンシングベースのまたはPCRベースのプローブ同前に顕微鏡で確認し得る。FISHプローブは、ssDNAオリゴヌクレオチドプローブのバーコード領域と相補的に結合し、蛍光顕微鏡または別の蛍光色素の検出に適する装置で可視化され得る(図4aおよび図4b)。しかしながら、有利に、プローブの存在のイメージングベースの解析は、本発明の方法において必要がない(そして好ましくは、実施されない)。
工程(c)で非ハイブリダイズssDNAオリゴヌクレオチドプローブ除去後かつシークエンシングまたは増幅前、区画内の核酸分子とハイブリダイズしているオリゴヌクレオチドプローブは、典型的に該区画から抽出される。DNA単離の標準的方法が使用され得る。
次いで、ハイブリダイズした一本鎖DNAオリゴヌクレオチドプローブの増幅が実施され得る。まず、ハイブリダイズプローブは、区画の核酸、例えば、RNAから、約85℃、好ましくは約95℃の温度で放出され得る。あるいは、核酸-オリゴヌクレオチドプローブ複合体の変性を、例えば、NaOHを使用する、アルカリ加水分解により達成し得る。プローブがRNA分子にハイブリダイズした場合、プローブ放出は、RNA変性酵素、例えばRNase Hの添加により生じ得る。次いで、プローブの増幅が、典型的に、各プローブに特異的にアニールするプライマーを使用するポリメラーゼ連鎖反応(PCR)により、達成され得る。プライマーは、例えばプローブのユニバーサルプライマー領域および/または標的領域にハイブリダイズするよう設計され得る。好ましくは、プライマーは、目的の核酸と相補的にハイブリダイズしたプローブと直接アニールし、化学リンカー(例えば、光開裂性リンカー)を介して該プローブに結合されている可能性のある何らかの分子タグにアニールしない。
増幅プライマーを、5’末端にシークエンシングアダプター、例えば、IlluminaベースのNGSで提供されるアダプター配列を含むよう設計され得る。故に、シークエンシングアダプターは、PCR反応中増幅プローブの5’末端に加えられ得る。別の実施態様において、プローブを、まず増幅前にシークエンシングアダプターとライゲートし得る。このような場合、増幅プライマーは、容易に使用可能なシークエンシングライブラリーの増幅を可能とするよう、これらシークエンシングアダプターとアニールするよう、特別に設計され得る。これに加えてまたはこれとは別に、増幅プライマーは付加的情報をコードし得て、例えば、SLIDE-Seqおよび10X Visiumで先に実施されたとおり、例えば組織内のサンプルの物理的空間位置をコードするユニークなDNA配列を含み得る(図5c)。付加的サンプル情報はバーコード情報にも含まれ得て(例えば、組織タイプまたは患者識別子)、複数サンプルが同じシークエンシングランで一緒にシークエンシングされ、配列リードの元のサンプルへのシークエンシング後割り当てされることを可能とする。
Taqポリメラーゼまたは、ポリメラーゼにより導入される誤りを最小化するため、当業者に一般に知られる高忠実度ポリメラーゼ、例えば、Q5(登録商標)、Phusion(登録商標)、Platinum(登録商標)またはAccuPrime(登録商標)を使用し得る。別の実施態様において、プローブは、複製バイアスまたは不正確な増幅による同定のその後の問題を防止するため、同定前に増幅されない。
T7介在線形増幅もプローブ増幅の手段として使用し得る。
PCR増幅は、好ましくはそうしなければプローブシークエンシングを妨害するであろう過剰のプライマーの除去が続き得る。プライマー除去は、例えば二本鎖複合体をインタクトのまま残しながら、過剰の一本鎖オリゴヌクレオチドを効果的に分解する適当なエキソヌクレアーゼ(例えば、エキソヌクレアーゼI)とサンプルを接触させることにより、達成され得る。故に、標的核酸またはその増幅産物にハイブリダイズするプローブまたはプローブにアニールするプライマーはサンプルに残ったままであり、その後の工程で同定できる。
ハイブリダイズした一本鎖DNAオリゴヌクレオチドプローブは、好ましくはシークエンシングにより同定される。ここに開示する方法は、標的核酸分子に特異的にハイブリダイズできる一本鎖DNAオリゴヌクレオチドプローブを利用する。FISHベースの検出方法とは対照的に、本発明の方法により検出および同定されたプローブは、イメージングベースの方法、例えば、顕微鏡的方法の使用を必要とせず、好ましくは使用しない。むしろ、標的核酸にハイブリダイズしたプローブは、例えば、シークエンシングにより同定される。プローブは、当分野で知られるあらゆる適当な方法によりシークエンシングされ得る。選択プローブの小セットは、例えばインビトロDNA複製中、鎖停止ジデオキシヌクレオチドの取り込みを使用するシークエンシング方法(例えばサンガーシークエンシング)により、例えば、シークエンシングされ得る。
好ましい実施態様において、プローブは次世代シークエンシング(NGS)により同定される。本発明のオリゴヌクレオチドプローブが短サイズであるため、シークエンシングは、例えば、Illumina、Roche 454、Helicos、PacBio、SOLiDおよびComplete Genomicsで提供される、一般に知られるショートリードハイスループットNGSテクノロジーを使用して実施し得る。使用する厳密なNGSプラットフォームに依存して、それに応じて調製すべきサンプル、すなわち、オリゴヌクレオチドプローブを、適切なシークエンシングアダプターに負荷し、サンプルを適当なフローセルに負荷する必要があり得る。シークエンシングアダプターは、各プローブの末端に容易にライゲートできまたはシークエンシングライブラリーを産生するためにPCRベースのプローブ増幅中に加えられ得る。Illuminaは、例えばシークエンシングライブラリー調製のための複数キットを調製する(例えばNextera Flex Library Prep Kit)。本発明の方法が、RNAに相補的なDNAオリゴヌクレオチドの配列のみを決定するため、本発明の方法がRNAを区画から単離し、それをRNA検出のためにcDNAに逆転写する必要性を回避したのは特に有利である。RNA単離および逆転写の両者とも、材料喪失のリスクがあり、最終解析にバイアスを導入する可能性があることが知られる。
シークエンシングは、目的の核酸、例えば、RNA種のユニークな標的位置あたりプローブ個数をバラバラに提供する。得られた配列リードを、その後プローブ特異的バーコード、プライマーおよび/またはUMIを含む全プローブ配列情報を含むプローブ参照地図にアラインする。次に、プローブを参照ゲノムにおけるゲノム位置により正しく並べ得る。次いで、例えば、転写物全体またはエキソン/イントロンにわたり検出されたプローブ数の生の数に、要約統計量を適用し得る。
好ましい実施態様において、工程c)後および典型的に、区画内の核酸と特異的にハイブリダイズしている一本鎖DNAオリゴヌクレオチドの区画からの抽出後、工程d)において、該区画内の核酸分子と特異的にハイブリダイズしている一本鎖DNA-オリゴヌクレオチドプローブを、プローブ増幅およびプローブシークエンシングにより、この順番で同定し得る。
ある実施態様において、プローブの全長がシークエンシングされる。例えば、シークエンシングをプローブの3’または5’末端から開始し、その後逆の末端まで続け得る。方法の費用を軽減し、スループットを増加するために、プローブは、あるいは部分的にしかシークエンシングされず、すなわち3’または5’末端の同一出発位置から出発して、各プローブの最初の30nt、最初の35nt、最初の40nt、最初の45nt、最初の50nt、最初の55nt、最初の60nt、最初の65nt、最初の70nt、最初の75nt、最初の80nt、最初の85nt、最初の90nt、最初の95ntまたは最初の100ntがシークエンシングされ得る。実施例に記載する実施態様において、シークエンシングは5’末端から開始され、各シークエンシングリードは75ntの長さを有する。それ故に、本発明の方法のシークエンシングリード長は、慣用のRNA-Seq実験で使用される(約200nt)より相当短く、故に、貨幣原価および時間を節約する。プローブがフランキングバーコード配列を含むとき、シークエンシングリード長は、標的RNAの同定に十分なフランキングバーコードの十分な長さのみカバーするようさらに減らされ得る。プローブへのUMI配列取り込みは、さらにPCRにより引き起こされる重複などのアーチファクトの増幅の同定をさらに促進し、サンプルに存在するRNA種の同定を阻止しない。
別の実施態様において、シークエンシング感受性を改善し、技術的PCRバイアスの結果として生じ得る重複を検出するため、各プローブが3’および5’末端両者から同時にシークエンシングされる、ペアエンドシークエンシングが実施され得る。
有利に、本発明の方法において、プローブシークエンシングは、標的核酸とハイブリダイズしている、すなわち、標的領域と相補的な配列を有する、プローブの領域の少なくとも一部、所望により全てをシークエンシングする。複雑なプローブ設計の必要性を回避し、短いプローブを可能とし、例えば、選択的スプライシング事象の検出のための、核酸の特異的セグメントの定量を可能とする。
より手頃な価格となっているにも関わらず、特にサンプルサイズが高いかまたは反復解析が必要であるとき、シークエンシング費用はなお多くの研究室で制限因子を代表する。さらに、シークエンシング結果の解釈は熟練者の作業および高計算能力を必要とする。選択したかつ比較的小さいRNAサブセットの検出および定量はより費用効率がよく、シークエンシング工程を含まないノーザンブロッティングまたは逆転写定量的PCR(RT-qPCR)などのより慣用の方法により実施され得る。しかしながら、何れの技術もRNAが単離され、さらに処理されることが必要であり、故にサンプル分解により貴重な材料を失う可能性がある。ノーザンブロッティングは、さらにしばしばあまり豊富ではない転写物の検出に十分な感受性を欠く。RT-qPCRは、対照的に標的RNAの逆転写を利用する。
別の実施態様において、本発明の方法はまたシークエンシングテクノロジーを必要とせず、増幅、好ましくは定量的PCRによる、ハイブリダイズした一本鎖DNAオリゴヌクレオチドプローブの同定も可能とし得る(図5b、図6aおよび図6b)。プライマーは、目的の特異的遺伝子に相補的なプローブのバーコード配列を特異的に標的とするよう設計でき、PCR、例えば、定量的PCRが増幅をもたらす。核酸のqPCR解析のための種々の適当なプロトコールおよび試薬は当分野で知られる。例えば、Sigma-Aldrich、Thermo-Fisher、Promegaなどの会社から容易に入手可能である。PCRベースの増幅によるオリゴヌクレオチドプローブ検出は、故に、特に数個の選択遺伝子の発現をモニタリングする速い方法を可能とする。同様に、有利に、標的核酸とハイブリダイズしたプローブの領域は増幅される。
本発明の方法は、さらに区画における、検出核酸、例えば、RNAの空間的マッピングを可能にし、さらに、
(i)工程(b)の前に区画を切片化、特に凍結切片化または冷凍粉砕、好ましくは、凍結切片化して断片のコレクションを得て、故に局在化に依存して互いに核酸分子を分離し;
(ii)工程(d)において各断片内の核酸分子と特異的にハイブリダイズする一本鎖DNA-オリゴヌクレオチドプローブを同定し、故に各断片におけるプローブに対応する核酸の存在または非存在を決定し;そして
(iii)核酸を区画でマッピングする
工程を含む。
本発明において、空間マッピングは、核酸の空間局在化または位置が区画内で決定されることを意味すると理解される。細胞または細胞内領域における核酸の空間的マッピングに使用される既存の方法は、しばしば低スループットであるかまたは高価な装置を必要とするFISHベースのイメージング方法を使用する。現在まで、空間トランスクリプトームは、予め設計されたプローブアレイに捕捉されたRNA由来のcDNAの大規模な並行シークエンシングを利用しているが、その使用は組織切片に限定される。
対照的に、本発明の方法は、個別の区画(例えば、単一細胞、細胞質または細胞核)の凍結超薄切と標的核酸の直接検出を、該区画内の核酸とハイブリダイズしたssDNAオリゴヌクレオチドプローブのみのシークエンシングにより組み合わせる。区画の凍結を含まない別のタイプの切片化も本発明と適合し得る。例えば、ある実施態様において、区画はホルマリン固定パラフィン包埋(FFPE)されていてよく、すなわちまず区画の構造的完全性を保持するためにホルムアルデヒドで固定され、その後塊にパラフィン包埋され、その後異なる切片にスライスされ得る。
薄い凍結切片が、ここに記載するとおり、区画をとおして切断されるとき、転写、翻訳または例えば、区画で共通の局所性で制御機能を発揮する、例えばRNA分子に対するプローブが、別の領域で機能するRNA分に対するプローブより頻繁に同じ切片で検出される。凍結切片化、例えば、細胞核の場合、新生プレmRNA転写物の発端位置は、故に、個々の核にわたる切片数における、該プレmRNAのコピーの存在または非存在(すなわちイントロン領域またはエキソン-イントロンおよびイントロン-エキソン接合部をカバーするプローブオリゴの存在量)のスコアリングにより、推測され得る。同様に、単一細胞の細胞質を凍結切片化するとき、故に、方法は、例えば、制御非コードRNAが、優勢にその生物学的機能を発揮し得るまたはmRNAがタンパク質に翻訳される場所の細胞内局在化を推測する(例えば線維芽細胞の最先端または神経軸索もしくは樹状突起の選択により)。本発明の方法はまた区画空間内の個々の核酸、例えば、RNA分子間の相対的距離の情報も提供し得る。故に、この解析の結果を使用して、例えば本発明の方法により検出された全ての別のRNA分子に対する各RNA分子の共分離頻度を計算して、RNA転写物間の相対的距離を推測するマトリクスを作ることができる。
それ故に、本発明のある実施態様において、区画の全切片を本発明の方法により解析し、単一細胞における核酸の空間マッピングをレンダリングすることが可能である。しかしながら、これは必要ではなく、解析された断片を、目的の細胞手段にわたる、複数の区画、例えば、複数の単一細胞または核からサンプリングし得る。本発明の方法を使用して、好ましくは、180を超える断片がある核酸をターゲティングするプローブの存在または非存在について、および、所望により、プローブ共分離について解析される。例えば、約180~約10000断片、好ましくは、約200~5000、約220~4000、約230~3500、約250~3000、300~2000または500~1000断片が解析され得て、ここでこれらの断片は単一核酸含有区画または複数の核酸含有区画から得られ得る。
区画の核酸の空間分布の調査は、空間的近接を決定する統計解析により達成され得る、核酸共分離の解析により補完され得る(例えばWeibel, E.R., 1979, Stereological Methods: Practical Methods for Biological Morphometry. Vol. 1 Academic Press, London, UK; Weibel, E.R., 1980, Stereological Methods: Theoretical Foundations. Vol. 2. Academic Press, London, UK)。これは、例えば、配列類似性を有する2個のRNA分子間の近い空間的近接が、2個のRNAの、例えば共通転写起点の徴候であり得るため、特に興味深い。2個のRNA分子は、例えば共通遺伝子由来の未知スプライスバリアントまたはアイソフォームであり得る。対照的に、核断片の2個の明らかに異なるRNA分子および/または種の近い空間的近接は、2個の独立した遺伝子が互いに近い距離で類似する時点で発現されたことを示差し、これは、ひいては、両遺伝子が共通制御要素を共有することも示唆する。2個のRNA分子の状況および厳密な配列に依存して、近い近接はまたそれらの間の制御的相互作用も示唆し得る。共通細胞質断片におけるウイルスRNA分子および小RNAの共分離は、さらに、例えば活性RNAi応答を示差し得る。統計的方法によるRNA分子の共分離の解析は、故に、複数のRNA分子の空間マッピングに寄与するだけでなく、RNAならびに抗ウイルス宿主応答の転写および転写後関連性についての新たな洞察も提供し得る。さらに、一つの単一細胞、細胞群または組織切片(例えばRNA内容物のサイズが等しい正方形または別の形態でのサンプリングを介する組織サンプリング)での2個以上のRNA種の共検出は、複合組織の細胞型内容物および細胞対細胞空間関係の再構築に使用され得る。本発明の方法において使用される統計的方法は、例えば、推測統計方法であり得る。
ある実施態様において、核酸の位置を、例えば固定アーチファクトまたはRNA/DNA汚染による、領域への核酸分子のミスマッピングを減らすため、該核酸に対するプローブが予め設定した閾値より高頻度で検出されたとき、決定する。閾値は、区画における核酸の予測存在量に応じて調節しなければならないかもしれない。RNA、特に検出頻度が予測閾値を下回るはずである極めて稀な核酸種などの核酸の位置を、該核酸のコピーが、種々の生物学的複製物で同じまたは類似の区画断片で繰り返し検出されるとき、検証し得る。本方法はまた2個の核酸、例えば、RNA間の共分離データと配列相補性データの統合により、無作為に生ずる核酸間、例えば、RNA-RNA相互作用および生理学的機能を有し得るものに区別する可能性がある。
RNAの存在または非存在の決定はまたRNAの量の決定も含み得る。
核酸、例えば、RNA局在化の情報を、例えば、疾患の状況でまたは環境変化により試験し得る。例えば、RNAの空間分布および存在量を、健常ドナーにおける細胞と、医学的状態を有するドナー、例えばヒトがん患者の対応する細胞を比較して試験し得る。比較は、組織内の種々の細胞群、例えば脳組織の全ニューロン対グリア細胞または組織生検サンプルの腫瘍細胞対健常細胞でも実施され得る。
本発明における空間マッピングの結果の解析のために、WO2016156469またはBeagrie et al., 2017 Nature 543(7646), 519-524に記載の方法を、対応する様式で、例えば、ここに記載する統計的方法で使用し得る。
RNAまたはssDNAなどの核酸分子の空間マッピングを、区画内の付加的生物学的分子の検出と組み合わせて、細胞における別の重要な過程との、例えば遺伝子発現の、相互作用の新規洞察を得ることができる。
それ故に、本発明の方法は、さらに区画内の少なくとも1個のDNA座の検出と組み合わせた、好ましくはRNAである核酸の検出および空間マッピングを可能とし、
- 各断片の少なくとも1個のDNA座の存在または非存在を、所望により、シークエンシング、好ましくは次世代シークエンシングにより決定し;そして
- 該少なくとも1個のDNA座と核酸、好ましくはRNAに特異的にハイブリダイズする一本鎖DNAオリゴヌクレオチドプローブの共分離を決定する
付加的工程を含む。
座は遺伝子、DNA配列の特異的位置または染色体上の位置である。故に、座は、例えばタンパク質コード遺伝子、タンパク質をコードしないRNA分子に転写される遺伝子、シュード遺伝子、エンハンサー領域、転位因子、反復配列または機能が未知であるか全く機能しないあらゆるDNA配列の位置である。好ましい実施態様において、少なくとも1個のDNA座はゲノムDNA座である。例えば、真核生物細胞核のゲノムDNAは、ヒストンにより形成されるタンパク質複合体を包むDNAからなる、圧縮されたおよび高密度構造であるクロマチンとして組織化される。
RNA分子が転写遺伝子に由来するため、それ故に、ある実施態様において、区画におけるRNAの検出および空間マッピングを、目的の遺伝子またはその特定の一部の検出と組み合わせ得る。これは、例えば、同じ核断片からのRNAに結合するゲノムDNAおよびssDNAオリゴヌクレオチドプローブ両者を並行して単離およびシークエンシングし、プローブと共分離する座(例えば、遺伝子)を同定することにより、達成され得る。別の実施態様において、検出されたプローブは、遺伝子またはその特定の領域との共分離ではなく、その代わりエンハンサー領域などの制御DNA座との共分離について解析され得る。ゲノムDNA座および目的のDNA(例えばウイルスssDNAまたはRループのssDNA)の共分離を同様にして決定し得る。
好ましくは、核酸、例えば、RNAまたはssDNA、検出および空間マッピングを、1を超えるゲノムDNA座、例えば、2、5、10、50、100、500、1000以上のゲノムDNA座の検出と組み合わせる。特定の実施態様において、RNA検出および空間マッピングを、ゲノム全体の解析と組み合わせる。
本発明者らにより探索された主な興味の対象の一つは、遺伝子発現の制御およびゲノムアーキテクチャの相互作用の理解である。クロマチンは相互作用および非相互作用状態で存在する。クロマチンの構造特性および空間組織化の試験は、遺伝子発現の制御の理解および評価に重要である。Mateo et al., 2019, (Visualizing DNA folding and RNA in embryos at single-cell resolution. Nature 568, 49-54)により開発されたクロマチンアーキテクチャ(ORCA)の光学再構築として知られる方法は、約100~700kbの領域のゲノム組織の三次元的再構築にオリゴペイントプローブを使用する。その試験において、ORCAを30種のRNAの発現を試験し、それを局所クロマチン組織と関連づけるために単一分子RNA-FISHと組み合わせた。それ故に、ORCAなどの既存の方法は、比較的短いゲノム領域からの情報の捕捉および小サブセットのRNAのみの検出に限定されまたは莫大な数の一連のハイブリダイゼーションおよびイメージングの工程を利用する。
本発明者らは、区画全体、例えば単一細胞、核または細胞小器官のDNAの三次元構造解析のために、本発明の方法のハイスループットRNA検出と、最近開発された革新的シークエンシングベースの方法を組み合わせることにより、これらの制限を克服した。該方法は本発明者らによりゲノムアーキテクチャマッピング(GAM)と名付けられた。GAM方法の詳細な説明は、Beagrie et al., 2017 Nature 543(7646), 519-524およびWO2016156469に提供される。簡潔には、GAMは、ゲノムDNAの次世代シークエンシングおよび統計的方法を使用して、区画、好ましくは細胞核断片間の共分離を決定することにより、複数DNA座の空間的近接を計算する。その結果、GAMは、バイアスのない様式でゲノムワイドの結合位置の同定を含む高次元クロマチン相互作用の徹底解析を可能とし、故にゲノムアーキテクチャの詳細なマップを提供する。GAMはまた完全ゲノムハプロタイプ再構築も可能とし(Markowski et al., 2020, GAMIBHEAR: whole-genome haplotype reconstruction from Genome Architecture Mapping data. bioRxiv 2020.01.30.927061, also published as Markowski et al. (2021) GAMIBHEAR: whole-genome haplotype reconstruction from Genome Architecture Mapping data. Bioinformatics 19, 3128-3135.)、これは本発明と組み合わさり、アレル特異的遺伝子発現、すなわち、遺伝子バリアントが遺伝子発現を制御する機構の試験を可能とする。
本発明の方法によるRNA検出とGAM解析の組み合わせにより、区画、例えば細胞核を、好ましくは、例えば凍結切片化により超極薄断片に切片化し得る。単一核プロファイル(NP)(または別の核酸含有区画、例えば、ミトコンドリアのプロファイル)は、例えば、レーザーマイクロダイセクションにより、これら断片から単離される。各プロファイルから、ストリンジェントな洗浄後区画に保持されたゲノムDNAならびにRNA結合DNAオリゴヌクレオチドプローブ両者が、連続的にまたは、好ましくは、同時に、単離およびPCR増幅される。次に、プローブおよびゲノムDNAは別々にインデックスをつけされ、2個の異なるシークエンシングライブラリーが産生され得る(一方はオリゴヌクレオチドプローブおよびもう一方はゲノムDNA)。次いで、2個のライブラリーは一緒にプールされ、シークエンシングされ得る(図3b)。故に、本発明の方法により試験すべき全サンプルは、2個の独立したシークエンシングファイルを作成し得る。オリゴヌクレオチドプローブの回収のリードは、元のRNA含有区画におけるRNA種の相対的存在量のプロキシとして定量的であり得て、ゲノムリードから細胞型/状態特異的三次元的ゲノムトポロジーをデコンボルージョンする前に個々の区画断片をクラスター化するために使用し得る。各断片の検出されたRNA分子およびゲノム座の共分離を決定し得る。故に、個々のNPからの並行RNA検出およびゲノムDNAは、クロマチントポロジーおよび遺伝子発現の制御の相互作用の試験を可能とする。上記ワークフローの変更も可能である。例えば、区画は、DNAおよびRNA両方を含むあらゆる区画、例えばミトコンドリアまたは葉緑体または原核生物細胞であり得る。断片も、複数の区画由来であってよく、RNA分子およびDNA座の共分離を、対応する断片の各々について比較し得る。
好ましくは、異なる区画の、例えば、核断片の複数ゲノムDNA座の共分離頻度を、特異的クロマチン相互作用、座間の相対的および絶対的距離および核内の座の放射状位置の決定のために解析し得る。その結果、情報を使用して、区画、例えば、核のクロマチンアーキテクチャおよびトポロジーを推測し、例えば遺伝子プロモーターおよび遠位エンハンサー領域の近接を決定し得る。同時に、DNA座および検出されたRNA分子の相対的距離を、個々の核にわたるいくつかの切片間の存在または非存在のスコアリングにより推測し得る。その結果、あらゆるDNA座に対する各検出されたRNA分子の共分離頻度を計算して、RNAおよびゲノム座の推測相対的距離のマトリクスを作り得る。RNA分子およびDNA座の共分離の解析に使用する統計的方法は、上記のGAM解析中のDNA座または異なるRNA分子の共分離の解析に使用した方法に対応する。
ゲノムアーキテクチャに関連する遺伝子発現の情報は、いくつかの種々の方法で探索され得る:
ある実施態様において、ゲノムアーキテクチャを発現RNAの空間マッピングと直接相関させて、転写、RNAプロセシングおよびmRNA発現に対するクロマチントポロジーおよびアーキテクチャの影響を決定し得る。例えば、GAM解析が特異的プロモーター-エンハンサー関連性の証拠を提供するとき、本発明は、これらの関連性が転写アプトプット増加と同時に起こるか否かを示し得る。ORCAを使用する先の試験は、驚くべきことに、エンハンサーへのプロモーター近接が、高レベルの新生RNAにより特徴づけられる活性遺伝子位置で、弱いが、存在したことを示差した(Mateo et al., 2019)。しかしながら、この試験は、モデル系キイロショウジョウバエの胚で、比較的短いゲノム領域および数遺伝子に限られた。本発明は、このような試験を、ゲノム全体および哺乳動物または植物細胞に拡張する可能性がある。
別の実施態様において、本方法は、遺伝子発現変化が、クロマチントポロジーにどのように影響し得るかも示し得る。例えば、エンハンサー領域から発現される新生eRNAの検出を、eRNAがクロマチン組織化に改変を誘導する能力、例えば、その対応するエンハンサーを標的プロモーターの近辺にする能力について試験し得る。
さらに別の実施態様において、遺伝子発現の情報を、細胞状態変化およびゲノム構造および遺伝子位置に対する影響のリードアウトとして使用し得る。細胞状態の十分に研究されている例は、細胞周期である。種々の細胞周期段階はゲノム構造全体の劇的変化と関連する(Nagano et al. 2017, Cell-cycle Dynamics of Chromosomal Organization at Single-Cell Resolution. Nature, 547(7661):61-67)。重要な細胞周期マーカー遺伝子のRNAのターゲティングにより、インタクト組織からのレーザー顕微解剖核スライスは、細胞周期の時点に基づき好都合に分類でき、故に、空間分解能を保持しながら、細胞周期の特異的段階での細胞の特定を改善する。同様に、本発明の方法でのRNA検出は、特異的細胞型または幹細胞分化状態の同定を容易にし、それに関連する特徴的クロマチン再編成の試験を可能とし得る。
ヒストン周囲のDNA圧縮の程度により、クロマチンは、多かれ少なかれ凝縮された高次元構造に組織化され得る。そのあまり凝縮されていない形態で、DNAはヒストンタンパク質を包み、互いに均一に離れることができるヌクレオソームを形成し、故に糸上の折りたたまれていないビーズのセットを模倣する。このようなゆるく充填されたクロマチンはユークロマチンと称される。ユークロマチンは、遺伝子が転写機構および補助的転写因子により容易にアクセス可能であるため、遺伝子のRNAへのより活発な転写と関連する。対照的に、ヘテロクロマチンは、個々のヌクレオソームが厚い高次元クロマチン繊維に包装される、高度に凝縮した、きつく充填されたクロマチン構造をいう。その高度の圧縮により、ヘテロクロマチンは転写機構に十分アクセスできず、故に転写的にサイレントのままである。セントロメアおよびテロメアは通常不変のヘテロクロマチン状態であるが、別の染色体部分のクロマチン凝縮は、後生的に遺伝性であり得るヒストンタンパク質の翻訳後修飾を介して制御される高度に動的過程である。GAMはまた数十キロまたはメガベースならびに染色体全体規模でクロマチン凝縮状態の情報を提供できる(Beagrie et al., 2017)。それ故に、指定されたoligo-seqである本発明の方法とGAMを組み合わせることにより、さらにRNA発現とクロマチン凝縮を関連づけ、大規模にリモデリングする(約300kb以上)ことが可能であり得る。
当業者は、GAMおよびoligo-seq解析の組み合わせの多数の付加的適用および使用を想起する。あらゆるこのような適用および使用は、ここで本発明の範囲に含まれる。
表1は、oligo-seqおよびGAM解析の組み合わせのユニークな利点を要約する。
Figure 2023547394000002
GAMおよびoligo-seq評価の組み合わせの可能な適用の大部分または全てを、単一マルチオミクス実験と組み合わせて、本発明の方法を介して得られる情報量を最大化することが可能である。
ここに開示されるRNAなどの核酸を検出する方法は、ゲノムDNA座の検出しか組み合わせられないものではない。別の実施態様において、RNA/DNA検出および空間マッピングはまた外因性源からのDNA、例えばウイルスからのDNAの検出とも組み合わせ得る。ウイルスDNAは一本鎖または二本鎖であってよく、感染細胞のサイトゾルに存在するかまたは宿主細胞のゲノムに統合されていてよい。組織のある細胞に存在し、その他には存在しないかまたは同じ細胞型に、しかし、細胞生理学(細胞状態)が変更されて存在し得る。区画の断片におけるRNA分子およびウイルスDNAの共分離は、細胞内、細胞または組織-レベル細胞相互作用における、ウイルス増殖および転写の程度、局在化および結果の情報を提供し得る。
さらに別の実施態様において、RNAと組み合わせて検出され得る少なくとも1個のDNA座は、区画に存在する核酸以外の生物学的化合物を標識するDNAオリゴヌクレオチドプローブであり得る。例えば、該DNAオリゴヌクレオチドプローブは、目的のタンパク質を特異的に認識する抗体または1個以上の座の死滅Cas9標識と共に使用するガイドRNAにおけるssDNAテイルに結合させ得る。
従って、本発明の方法はまたRNAの検出および空間マッピングと少なくとも1個のタンパク質または該タンパク質の翻訳後修飾の検出を組み合わせるためにも使用でき、
- 区画と、オリゴヌクレオチドプローブで標識され、少なくとも1個のタンパク質または翻訳後修飾に特異的に結合できるオリゴヌクレオチドプローブで標識されたリガンド、例えば、抗体を接触させ、そして
- リガンドを標識する該少なくとも1個のオリゴヌクレオチドプローブ、例えば、抗体およびRNAなどの核酸と特異的にハイブリダイズする一本鎖DNAオリゴヌクレオチドプローブの共分離を決定する
ことを含む。
好ましい実施態様において、少なくとも1個のタンパク質は該方法で検出される。RNAなどの核酸と組み合わせて検出される少なくとも1個のタンパク質は、例えば本発明の方法により検出されたRNAにより直接コードされるタンパク質であり得る。生合成が検出されたRNAにより制御されることが疑われるまたは知られるタンパク質でもあり得る。タンパク質は、さらに本発明の方法で検出されたある核酸と相互作用することが疑われるまたは知られるものであり得る。従って、タンパク質-RNAまたはタンパク質-DNA複合体のメンバーであり得る。しかしながら、タンパク質はまた特定の核酸と先に関連づけられていないタンパク質であり得る。タンパク質は、区画内に内因性発現されていてよくまたは外因性源から、例えばトランスフェクションにより導入されてよい。またウイルス遺伝子発現の結果でもあり得る。所望により、1を超えるタンパク質が区画の核酸と組み合わせて検出される。例えば、少なくとも2個、少なくとも5個、少なくとも10個、少なくとも25個、少なくとも50個または少なくとも100個のタンパク質が核酸と組み合わせて検出され得る。複数のタンパク質の検出を、細胞生理学/状態の評価に使用でき、特異的クロマチン配座(エンハンサー-プロモーター接触)と転写およびタンパク質発現または翻訳後修飾の関連付けを助ける。
リガンドプローブ-コンジュゲート、例えば、抗体プローブ-コンジュゲートを、固定またはガラス化後区画と接触させ得る。好ましくは、接触は、切片化、例えば、凍結切片化後の区画の断片とである。しかしながら、例えば、遺伝子にコードされたプローブまたはフランケンボディの検出により、切片化前に区画と接させ、新生または成熟タンパク質を検出することもできる(Zhao, N., et al. 2019, A Genetically Encoded Probe for Imaging Nascent and Mature HA-tagged Proteins in Vivo. Nat. Commun. 10(10: 2947.))
相補的核酸分子とハイブリダイズしたssDNAオリゴヌクレオチドプローブおよびタンパク質に結合した抗体などのDNAプローブ標識リガンドの並行検出を、上記RNAおよびDNA座検出の組み合わせと比較して類似の方法で、例えば達成し得る。簡潔には、ストリンジェンシー洗浄後、相補的核酸とハイブリダイズしているssDNAオリゴヌクレオチドプローブを、例えば、真核生物細胞全体、核または細胞質からの区画の断片、例えば、凍結切片から単離し得る。並行して、タンパク質に結合した抗体などのリガンドとコンジュゲートしたDNAオリゴヌクレオチドプローブが、例えば、適当な化学溶媒(例えば、ジチオトレイトール(DTT)含有塩緩衝液)を用いてリガンドから放出され、同様に各断片から単離される。こうして得た両DNAオリゴヌクレオチドプローブコレクションを、所望によりPCR増幅して、別々にインデックスをつけて2個の異なるシークエンシングライブラリーを作り得る(一方は検出核酸およびもう一方は検出タンパク質)。次いで、2個のライブラリーを一緒にプールし、シークエンシングし得る。故に、本発明の方法により試験すべき全サンプルは、2個の独立したシークエンシングファイルを作成し得る。断片の核酸分子を検出するプローブおよびタンパク質を検出するプローブの共分離の評価により、核酸およびタンパク質の物理的近接が推測され得る。故に、本発明の方法による例えばRNAおよびタンパク質の検出の組み合わせならびに区画内の全般的および互いの相対的空間分布の決定は、例えばRNAのタンパク質への翻訳速度およびレベルについて結論付けることを可能とする。特定の核酸およびタンパク質の極めて近接は、さらに生物学的に関連するRNA/DNA-タンパク質複合体の相互作用または形成の可能性を示差する。故に、例えば、ヒストン修飾または転写因子リン酸化などのタンパク質エピトープおよび/またはタンパク質翻訳後修飾(PTM)と同時の空間分解能で転写物レベルの検出は、生物学的サンプルからのリードアウトされた情報量を、遺伝子発現シグネチャー以外に細胞同一性に関するものに拡大する。この方法は、例えば、早期疾患診断のために、患者由来サンプルに適用される。
上記のとおりリガンドとコンジュゲートするオリゴヌクレオチドプローブを直接にシークエンシングするのとは別に、本発明の方法はまた該リガンドとコンジュゲートした核酸タグ、例えば抗体または別の親和性タンパク質試薬、好ましくはイムノコンジュゲートと特異的にハイブリダイズできる遊離オリゴヌクレオチドプローブのシークエンシングも含み得る。このような実施態様において、故に、核酸タグそれ自体は直接シークエンシングされず、むしろ、標的エピトープのレベルをDNAリードに変換するためのライブラリーに存在する相補的オリゴヌクレオチドプローブにドッキングするための配列特異的ハイブリダイゼーション接合部分として役立つ。従って、オリゴヌクレオチドプローブのハイブリダイゼーションは、抗体結合後生ずる。核酸標識抗体へのインサイチュプローブハイブリダイゼーション後、リードアウト配列を、上記に類似するパイプラインを使用して、NGSのために増幅および調製し得る。
従って、本発明の方法のこの実施態様は、シークエンシングによるハイブリダイズしたオリゴヌクレオチドプローブの直接検出と組み合わせて、cDNA中間体の産生なく、ハイブリダイゼーション原則を使用するため、多重化免疫検出の既存のアプローチ間の接合部分にある。コンジュゲートした核酸タグ自体を直接に検出する別のシークエンシングベースのアプローチを超える、ハイブリダイズしたオリゴヌクレオチドプローブのシークエンシングを介する例えば、抗体結合の定量の重要な利点は、複数パネルのコンジュゲートまたはそれらの組み合わせの定義のための、工学的応用に依存するリードアウトプローブのオープンエンド型設計および互換性のために、定量に柔軟性が提供されることである。それ故に、種々のレポーター核酸タグの抗体への不可逆性コンジュゲーションが繰り返し必要であることに関連する技術的制約を大きく変える。さらに、かつ、例えば、抗体に結合した短核酸タグが連続する複数回のハイブリダイゼーション、イメージングおよび蛍光標識されたリードアウトプローブのためのハイブリダイゼーションプラットフォームとして役立つ既知のCODEX、IBEXおよびseqFISH+IFなどの一連のイメージングアプローチ(Takei et al., 2021, Integrated spatial genomics reveals global architecture of single nuclei. Nature, 590, 344-350)と対照的に、一回だけのハイブリダイゼーション工程が並行して複数抗体コンジュゲートのために実施され、故に、時間、費用を抑え、重要なことにサンプル完全性および抗体結合の保存を確実とする。
好ましくは、上記の区画内のタンパク質および/またはそれらのPTMの検出は、別の核酸(例えば、RNA)検出またはGAMと並行して実施される。しかしながら、別の核酸の並行検出をせずとも、本発明の方法が区画の核酸タグ付けされた化合物の検出が可能であることは当然理解される。
別の実施態様において、RNAおよび少なくとも1個のタンパク質の並行検出およびマッピングを、さらに、例えば、GAMを介する少なくとも1個のDNA座の検出およびマッピングと組み合わせ得る。このアプローチは、転写および翻訳の制御両者とクロマチン組織化を関連させる能力を有する。故に、相対的タンパク質および/またはRNA内容物により定義される特定の細胞型または状態と関連するゲノムアーキテクチャの再構築を可能とする。さらに3Dゲノムの特性と特異的核ランドマーク(薄膜、核内構造体成分、ヒストン修飾)または事象(例えば、新生遺伝子発現、スプライシング)の関連に有用であることが示され得る。
遺伝子発現レベルはまたクロマチンの転写機構への局所アクセス可能性にも依存する。クロマチンアクセス可能性は、例えば転写因子が、遺伝子転写を促進または抑制するためにDNA座と結合し得る程度で関連する。ゲノム構造のGAM解析は、クロマチンの大規模凝縮および構造組織化について結論を得ることを可能としたが、ATAC-Seqなどの別の方法は、ゲノムにわたる転写機構の単一ヌクレオソームレベルでのクロマチンのアクセス可能性の決定に、より特殊化されている(Buenrostro, J. D., Wu, B., Chang, H. Y., & Greenleaf, W. J., 2015, ATAC-seq: A Method for Assaying Chromatin Accessibility Genome-Wide. Current protocols in molecular biology, 109, 21.29.1-21.29.9)。故に、ATAC-Seqは、転写因子結合位置のマッピングの有用なツールを表す。
本発明による核酸、好ましくはRNAの検出を、区画内の局所クロマチンアクセス可能性の解析とも組み合わせることができ、
(i)断片のコレクションを得るために工程(b)の前に区画を凍結切片化または冷凍粉砕、好ましくは、凍結切片化し、故に局在化に依存して互いに核酸分子を分離し;
(ii)各断片からゲノムDNAを単離し;
(iii)同時に各断片から単離したゲノムDNAを断片化およびタグメンテーションして、ATAC-Seqライブラリーを産生し;
(iv)ATAC-Seqライブラリーを精製および所望により増幅し;
(v)ゲノムDNAのある座について局所クロマチンアクセス可能性の状態を決定し;そして
(vi)マッピングした核酸、好ましくはRNAの存在および/または存在量を解析し、ゲノムDNAのある座でのクロマチンアクセス可能性と関連づける
工程を含む。
ハイスループットシークエンシング(ATAC-Seq)でのトランスポザーゼアクセス可能クロマチンのアッセイは、細胞核におけるクロマチンの制御性ランドスケープの評価に適するNGSベースの方法である。ATAC-Seqは、機能亢進性Tn5トランスポザーゼの活性を使用する。トランスポザーゼは、天然に転位因子のゲノムのある場所から別の場所への移動を、カットアンドペースト機構で触媒する。ATAC-Seq中、NGSアダプターはTn5トランスポザーゼに重点される。次に、充填トランスポザーゼがアクセス可能で、ユークロマチンのクロマチン領域のDNAを開裂し(断片化)、同時にこれらクロマチン断片にNGSアダプターを結合して(タグメンテーション)、ATAC-Seqシークエンシングライブラリーを産生する。ライブラリーを精製し、バーコード付プライマーを使用してPCR増幅して、その後qPCRまたはNGSにより解析され得る。ATAC-Seqは、通常約25,000-75,000細胞で実施される。
ATAC-Seqによる局所クロマチンアクセス可能性の検出を、本発明の方法により検出された核酸、好ましくはRNAと組み合わせ売る。例えば、細胞または細胞切片から単離されたゲノムDNAを、まずATAC-Seqに付して、核の種々のDNA座のクロマチンアクセス可能性状態を決定し得る。次いで、クロマチンアクセス可能性変化を、ある座近辺の先にマッピングされたRNAの存在または非存在を評価することにより、局所転写活性への影響について試験し得る。
好ましい実施態様において、ATAC-SeqシークエンシングライブラリーおよびハイブリダイズしたssDNAオリゴヌクレオチドプローブのライブラリーを同じ区画から産生し、単一シークエンシングランでシークエンシングする。
処理後細胞を異なる状態または時点で評価することにより、本方法はまた、例えばゲノム座のRNAレベル増加が、局所クロマチンアクセス可能性変化による転写増加の結果であるのかまたは、その逆か、発現RNA分子がカエノラブディティス・エレガンスで先に示唆されたとおりクロマチンアクセス可能性に影響するかの決定に役立つ((Fields et al., 2019, Chromatin Compaction by Small RNAs and the Nuclear RNAi Machinery in C. elegans. Scientific reports 9)。その結果、本発明の方法は、クロマチンアクセス可能性および遺伝子発現の動態の解読を可能とする。
本発明はまた本発明の方法の
(a)単一細胞、細胞群または細胞内区画における遺伝子発現の決定;
(b)区画内のRNAのアイソフォームおよびアレル特異的バリアントの同定;
(c)遺伝子転写の定量;
(d)複合異種性組織の細胞型および状態の同定;
(e)区画内の内因性および外因性dsDNAおよびssDNAの同定;
(f)区画における核酸、例えば、RNA位置のマッピング;
(g)区画におけるRNAおよび核酸座位置のマッピング;
(h)区画における核酸、好ましくはRNAおよびタンパク質位置のマッピング;および/または
(i)区画における核酸、好ましくはRNA、タンパク質および核酸座位置のマッピング
のための使用も提供する。
例えば、遺伝子発現は、周囲の組織に照らした単一細胞または周囲の組織に照らした細胞群、所望により、特異的組織の少なくとも1個、例えば、数個の、細胞型の細胞で決定され得る。次いで、解析は、種々の細胞、例えば、種々の細胞型の比較を含み得る。本発明は、故に、組織の2Dまたは3D状況内でのある細胞の空間トランスクリプトームを可能にする。マッピングはまた組織/臓器レベルおよび種々の種、例えば、種々の単一細胞生物または種々の原核生物の種々の個体の集団であり得る。
本発明は、さらに、患者における1以上の遺伝子の誤発現および/または異なる転写プロファイルと関連する疾患を診断する方法であって、該患者から採ったサンプルにおいて、患者特異的転写プロファイルを得るために患者における核酸、特にRNAの存在を同定しおよび/または存在量を分析し、該患者特異的転写プロファイルを該疾患を有すると既に診断された対象の転写プロファイルと比較することを含み、ここで、該転写プロファイルは好ましくはまた健常対象の転写プロファイルとも比較される、方法を提供する。あるいは、転写プロファイルを、同じ患者由来であり得る特異的細胞亜群、例えば、腫瘍細胞および正常組織、好ましくは、腫瘍組織と同じ細胞型の正常組織で比較し得る。
本発明を患者の遺伝子発現障害、例えば、腫瘍原性細胞増殖と関連するがん遺伝子の過剰発現の調査に使用し得るため、遺伝子発現障害と関連する疾患、例えば、がんを有する患者の処置にも貢献し得る。
要約すると、本発明は、サンプルにおける核酸検出のための高度に感受性シークエンシングまたは増幅ベースの方法を提供する。既知のRNAシークエンシング方法とは対照的に、本発明の方法は、RNA検出に必須としてRNA単離またはcDNA産生を利用しない。故に、急速なRNA分解または逆転写中に導入されるバイアスと関係する課題を克服する。その代わり、ここで紹介する方法は、組織、細胞または細胞小器官内で核酸と相補的にハイブリダイズしているssDNAオリゴヌクレオチドプローブをシークエンシングする。
表2は、指定されたoligo-seqである本発明の方法および最先端方法の差異を要約する。
Figure 2023547394000003
最近の試験で、Marshall et al.は、HyPR-Seqの開発時、類似の概念を提案した。しかしながら、本発明は、HyPR-Seqを超える一連の決定的な利点を提供する:まず、本方法の特異性は、使用するプローブの長さおよび数ならびに選択したインキュベーション時間、温度およびストリンジェンシー洗浄に最大に依存する。HyPR-Seqは、25nt長の2個の初期プローブを使用する。本発明の方法において使用するプローブの標的認識位置は、好ましくは少なくとも約32nt長であり、故に、高い特異性を示す。第二に、HyPR-Seqは、増幅およびシークエンシング前に8個の異なる連続的ハイブリダイゼーションおよび洗浄工程を含むため、はるかに時間がかかりかつ労力を要する方法である。比較として、oligo-seqは、単一ハイブリダイゼーション工程、続いてストリンジェントな洗浄しか含まない。HyPR-Seqの開発者が認めているとおり、複数ラウンドのハイブリダイゼーションおよび洗浄は、相当な細胞喪失に至り得る。それ故にHyPR-Seqは、少なくとも100万細胞で実験を開始する必要がある。本発明の方法は、対照的に、哺乳動物細胞の1/20の単一区画で成功裏に実施し得る。さらに、HyPR-Seqプロトコールの多数の洗浄工程および苛酷なエタノール透過化は、核酸含有区画の構造的完全性およびタンパク質内容物に影響を与え得る。それ故に、HyPR-Seqは別のマルチオミクス技術と互換性がない可能性がある。本発明の方法は、さらに、単一層のオリゴヌクレオチドハイブリダイゼーションしか必要とせず、故にHyPR-Seqと比較して、付加的二次または三次オリゴヌクレオチドのハイブリダイゼーションによる一次RNA-DNAハイブリダイゼーション事象の増幅を利用しない。従って、oligo-seqは、HyPR-Seqまたは、ついでに言えば、大部分の別のFISHプローブベースの検出方法より相当に多い数の核酸の並行同定が可能であるか。
表3はまた本発明の方法およびHyPR-Seqの差異を要約する。
Figure 2023547394000004
本発明の方法は、効果的におよび正確に、ごく少量の出発RNA材料を扱ったときでも、例えば遺伝子発現の情報を提供する。それ故に、単一細胞または細胞内レベルでの遺伝子発現の試験に特に適する。組織または細胞切片化と組み合わせて、本発明の方法は、さらに区画内の別の生体分子に対する核酸の空間分布のモニターを可能とし、故に、伝導空間トランスクリプトームに適する高度に感受性の技術を提供する。本発明による核酸の検出は顕微鏡的またはイメージングテクノロジーを何ら利用せず、むしろ、シークエンシングを使用してトランスクリプトームデータを提供する。故に、大型マルチオミクス試験で、当分野で既知の別のシークエンシングベースの方法と容易に組み合わせ得る。
本発明をとおして、用語「約」および「およそ」は、「±10%」として解釈される。「約」または「おおよそ」が範囲に関連するならば、範囲の下限および上限両方をいう。単数表現は、特に断らない限り、「1以上」を意味する。
ここに引用する全文献は、ここに完全に包含させる。本発明を、次の実施例によりさらに説明するが、限定しない。
下の実験で使用した設計(設計AおよびB)およびオリゴ設計Cを含むプローブ設計の模式図。ユニバーサルプライマー(UP)は20ヌクレオチドであり、ライブラリーの全プローブで共有される。UP1、UP2およびUP3は種々のユニバーサルプライマー配列を意味する。ユニークな分子識別子(UMI)は、シークエンシングでユニークな分子を同定する6~15ランダムヌクレオチドのストレッチであり、PCR増幅により繰り返しが発見されたならば、1回のみカウントする。相同性領域(HR)は、目的の標的分子のユニークな核配列を標的とする配列である。ライブラリーの各プローブはユニークな相同性領域を有する。実施例で使用する5’バーコードB1は、同じ遺伝子をターゲティングする全プローブに特異的であり、3’バーコードB2は、同じ遺伝子をターゲティングする全エキソンまたはイントロンに特異的である。
プローブ設計の全般的特性。(a)プローブ設計A(OL66)に含まれる66遺伝子の一覧および、エキソンまたはイントロンの、遺伝子あたりのターゲティングオリゴの数。Hotair、Malat1、Xist、Neat1およびFirreは、長非コードRNAをコードし、別の遺伝子はメッセンジャーRNAをコードする。(b)プローブ設計B(OL1823)に含まれる1823遺伝子のヒストグラム(Y軸)および遺伝子あたりのターゲティングオリゴの数(X軸)。全遺伝子はメッセンジャーRNAをコードする。
本発明の方法の模式図。(a)区画で検出されたRNA。蛍光インサイチュハイブリダイゼーション(FISH)による特異的プローブハイブリダイゼーションの任意的検証を点線四角に示す。(b)区画で検出されたRNAとGAM過程を使用する並行DNA検出の組み合わせ。
RNA-FISHを使用するプローブライブラリーハイブリダイゼーションおよびハイブリダイゼーション前にRNAe処理を使用するハイブリダイゼーション特異性の検証。(a)上部パネルは、mESC(クローンF123)の超極薄(200nm厚)凍結切片と設計RNA-GAMプローブ(濃度0.5μM)のハイブリダイゼーションを示す。下部パネルは、0.25mg/ml RNAe Aで2時間前処理した凍結切片で並行して実施したハイブリダイゼーションを示す。左パネルは核スライスを同定するためのDAPIでのDNA染色を表す。右パネルは、凍結切片のssDNAプローブ(橋)のユニバーサル配列をターゲティングするオリゴとの二次ハイブリダイゼーション、続いて橋とハイブリダイズするAlexaFluor647コンジュゲートオリゴでのアニーリング後検出されたプローブシグナルを示す。スケールバー、10μm。(b)ハイブリダイズしたoligo-seq一次プローブの蛍光ベースの検出の模式図。
(a)実施例で使用するssDNAプローブのシークエンシングに使用するPCR工程の単純化した概要。示されるプローブ設計Aは図2aと同じである。プローブ設計Bについて、同じ設計を、UP1と相動性を有するP5アダプターと共に適用する。IlluminaアダプターP5およびP7は、各プローブ末端でのユニバーサルプライマー領域(それぞれUP1およびUP2)と相補的である。(b)単一遺伝子または特異的遺伝子内の単一領域に特異的であるプローブのみなどの、設計A特異的サブセットのssDNAプローブの増幅に使用するqPCR工程の図式的概観。プローブ設計は図2aと同じである。プローブは目的の区画から抽出される。次いで、プローブをプライマーUP1およびUP2で普遍的に増幅させ、種々のサンプルをqPCR前にDNA濃度により正規化する。次いで、相対的存在量を、プライマーB1およびUP2で5’ B1バーコードと3’ UP2の間の領域の増幅により、同じ遺伝子をターゲティングする全プローブについて決定し得る。あるいは、遺伝子領域を、プライマーB1およびB2でB1とB2の間のプローブ領域を増幅することにより、特異的に増幅し得る。(c)実施例で使用するssDNAプローブ設計A(OL66)をシークエンシングするためのPCR工程の単純化した概要。プローブ設計は図2aと同じである。プローブ設計Bについて、同じ設計を、UP3に相同性を有するP5アダプターおよびUP2に対するP7アダプターと共に適用する。プライマー/二次オリゴは、例えば、組織の2D空間におけるサンプル位置のコード化に使用され得る、付加的情報(I1/I2)を含む。個々のサンプルをまたP5およびP7サンプル-インデックス化バーコードを含む二次/オリゴを使用して、ユニークなDNA配列でバーコード付して、各プローブ末端でのユニバーサルプライマー領域に直接にもし得る。
(a)プローブ設計A(OL66)を使用する凍結切片におけるハイブリダイゼーション後、mESC-F123(+)、XEN細胞(●)およびRNAe処理mESC-F123(▲)の100NPサンプルからのオリゴプローブ増幅のqPCR結果。Y軸はSYBR-Greenシグナル検出に必要な定量サイクル(Cq)数を表す。6個の遺伝子の発現を、独立した反復サンプル(各100NP)で実施した。Sox2およびOct4遺伝子はmESC-F123に特異的に発現する多能性遺伝子であり、Sox17およびGata6遺伝子はXEN細胞に特異的に発現し、Malat1は、mESCおよびXEN両者に豊富にかつ遍在的に発現する長非コードRNAであり、BDNF遺伝子はmESCまたはXENに発現しないニューロン遺伝子である。-1および-2は技術的複製物1および2を表す。(b)プローブ設計A(OL66)を使用した溶液中の細胞全体のオリゴプローブハイブリダイゼーションのqPCR結果。mESC(F123)をトリプシン処理し、オリゴプローブOL66とハイブリダイズし、洗浄した。1-20細胞の結合プローブ内容物を抽出し、増幅した(+)。増幅プローブを浄化し、2.5ng/μlに対して正規化した。バックグラウンド対照として、プローブストックを2.5ng/μlに対して正規化した(●)。Y軸はSYBR-Greenシグナル検出に必要な定量サイクル(Cq)数を表す。Sox2およびOct4遺伝子はmESC-F123に特異的に発現する多能性遺伝子であり、Sox17およびGata6遺伝子はXEN細胞に特異的に発現し、Malat1はmESCおよびXEN細胞両者に豊富にかつ遍在的に発現する長非コードRNAであり、Bdnf遺伝子はmESCまたはXENに発現しないニューロン遺伝子である。プローブバックグラウンドを超える特異的検出がmESC発現遺伝子、Sox2、Oct4および遍在的に発現Malat1で見られる。-1および-2はそれぞれ技術的複製物1および2を表す。
mESCまたはXEN細胞からの100NPサンプルにおけるSox2遺伝子にわたる各相同標的位置におけるハイブリダイズプローブ数。Sox2はmESCに発現され、かつXEN細胞に発現されない。プローブライブラリー(設計A)は、そのコード領域にわたりSox2遺伝子を標的とする計17個のオリゴヌクレオチドのみを含み、ここで、転写開始位置(TSS)から転写末端位置(TES)のゲノム順(位置1~17)で左から右の順に並べた。Y軸は、ユニークな標的位置をターゲティングするプローブ数を表す。
RNA-GAMに存在するRNA存在量およびDNAの並行検出。mESCおよびXEN細胞からの超極薄凍結切片を、洗浄、レーザーマイクロダイセクションならびにオリゴヌクレオチドプローブおよびゲノムDNAの増幅前オリゴヌクレオチドプローブ(設計A、OL66)とハイブリダイズした。オリゴプローブおよびゲノムDNAから別々にライブラリー調製後、サンプルをプールし、シークエンシングした。
(a)100NPサンプルのオリゴヌクレオチドプローブからの生シークエンシングデータのゲノムブラウザトラック。ゲノムブラウザシークエンシングリードトラックの下の四角は、イントロンが急速にスプライスおよび分解ため、予想通りより豊富なプローブがハイブリダイズする、エキソンの位置を表す。トラックは、プローブ参照地図上のプローブ位置にマッピングされたプローブ数を示し、全プローブ参照は線形ゲノム順に並べられる。全4個のトラックを一緒に自動縮尺した。mESCに特異的に発現する3個の遺伝子、ハウスキーピング遺伝子であるYwhae、Oct4およびXEN細胞に特異的に発現するGata4を強調する。
(b)細胞DNAの並行抽出およびシークエンシングからの生シークエンシングデータ。各々1NP、2個のmESCサンプルおよび2個のXEN細胞サンプルから産生した4個のGAMサンプルからのゲノムDNAのトラック。トラックは、薄核スライスから抽出されたDNAから予測されるとおり、染色体の短連続的領域をカバーするゲノムDNAの典型的検出を示す。
(a)mESC-F123およびXEN細胞からの単一超極薄スライスにおけるSox2およびOct4の発現。散布図はオリゴプローブ設計A(OL66)を使用するoligo-seq解析後のmESC-F123(□ - 左パネル;サンプル数=96)およびXEN細胞(☆ - 右パネル;サンプル数=40)から得た個々の1NPサンプルからシークエンシングしたSox2(Y軸)およびOct4(X軸)のリード数の関係を示す。上部パネルは遺伝子にわたる全プローブをカバーする配列リードのカウントを表し、中央パネル最初の5個のプローブのみをカバーする配列リードを表し(TSSから)、下部パネルは各遺伝子の最初のプローブのみをカバーする配列リードを表す(TSSから)。Sox2およびOct4遺伝子はmESCで発現するが、XEN細胞で発現しない。
(b)mESC-F123およびXEN細胞からの単一超極薄スライスにおけるSox2およびSox17の発現。散布図はオリゴプローブ設計A(OL66)を使用するoligo-seq解析後のmESC-F123(□ - 左パネル;サンプル数=(96)およびXEN細胞(☆ - 右パネル;サンプル数=40)から得た個々の1NPサンプルからシークエンシングしたSox2(Y軸)およびSox17(X軸)のリード数の関係を示す。上部パネルは遺伝子にわたる全プローブをカバーする配列リードのカウントを表し、中央パネル最初の5個のプローブのみをカバーする配列リードを表し(TSSから)、下部パネルは各遺伝子の最初のプローブのみをカバーする配列リードを表す(TSSから)。Sox2遺伝子はmESCで発現されるが、XEN細胞で発現されず、Sox17遺伝子はXEN細胞で発現されるが、mESCで発現されない。
種々の細胞型を区別する超極薄凍結切片におけるOligo-seq。単一スライスサンプルからの発現データおよび各細胞スライスにおける特異的遺伝子によりコードされる転写物の発現レベルを使用するmESC-F123およびXEN細胞のクラスタリング。非発現対照遺伝子を含むプローブ設計A(OL66)に存在する全標的化遺伝子を考慮したエキソンをターゲティングするプローブの標準化リードカウントからの全mESC-F123(□)およびXEN(☆)1NPサンプルからのUマップクラスタリング。上部左パネルは、mESCまたはXEN細胞からのスライスを明確に区別する、全1NPサンプルについてY軸およびX軸のUマップ座標を示す。遺伝子Ywhae(ハウスキーピング)、Sox2およびOct4(mESC特異的)およびSox17およびGata6(XEN細胞特異的)の発現は、Zスコア正規化発現(スケールバー、グレイスケールで表した発現強度のZスコア、上部右)に基づき示す。
超極薄凍結切片におけるOligo-seqは、種々の細胞型を区別する。遺伝子あたり非発現対照遺伝子を含み最小6個のプローブを伴うプローブ設計B(OL1823)で表される特異的遺伝子によりコードされる単一スライス1NPサンプルおよび転写物の発現レベル(標準化リードカウント)からの発現データを使用するmESC-F123、肝臓およびXEN細胞のクラスタリング。全mESC-F123(○)、肝臓(×)およびXEN(▽)1NPサンプルのUマップクラスタリング。上部左パネル(A)は、mESC(B)、XEN細胞(C)または肝臓細胞(D)からの単一細胞スライス明確に区別する、全1NPサンプルについてY軸およびX軸のUマップ座標を示す。
(a)mESC-F123からの単一超極薄スライスにおけるGAM(RNA-GAM)と組み合わせたOligo-seqは、細胞状態および発現特異的3Dゲノムアーキテクチャを区別できる。プローブ設計B(OL1823)とハイブリダイズしたmESC-F123 1NPサンプルを、Sox2プローブ回復(最低Sox2回復=269 1NPサンプル、最高Sox2回復=157 1NPサンプル)により群分けした。各NPMI接触地図を、Sox2遺伝子周囲の領域の150kb切片化でプロットした(マウスゲノムアセンブリmm10、染色体3:30~39Mb)。マトリクスのグレイスケールは、2個のゲノム座間の正規化自己相互情報(NPMI)スコアを示す。(b)プローブ設計B(OL1823)においてSox2標的位置の総数により正規化したNPあたり回収されたSox2 UMIの数として表すmESC 1NPサンプルで検出されたSox2 RNAのヒストグラム(総N=507)。
oligo-seqを使用するRNA検出は、転写物レベルで高度にRNAe感受性であり、その高特異性および感受性を示す。Oligo-seqプローブ設計B(OL1823)を、RNAeでの前処理した(R)またはしていない(NR)mESCからの凍結切片に適用した。RNAを1NP(上部、パネルA)および100NP(下部、パネルB)から定量した。遺伝子を、mESC-F123 RNAeqの発現レベルにより5群に分けた(0~1、1~10、10~50、50~100、>100 TPM)。バープロットは集めた全mESC-F123サンプルにわたる各遺伝子の平均プローブスコアを表す(RNAe処理していない(NR))およびRNAe処理した(R)mESCは別のボックスプロットとして表す)。TPM遺伝子サンプルサイズ(N)(0~1:455、1~10:332、10~50:457、50~100:217、>100:285遺伝子)。
プローブ設計B(OL1823)を使用する1NPまたは100NPサンプルからのOligo-seq結果は、遺伝子発現とバルクRNA-Seqおよび1NPと100NPサンプルの高度の相関を示す。全1NP(B)および100NP(A)サンプルにわたり加えた遺伝子あたりの平均oligo-seq由来プローブスコア(log10)を、mESC総RNA-Seqから遺伝子発現(TPM(log10))に対してプロットした(遺伝子数=1823)。RNA-Seqを数百万の細胞、507サンプルからのoligo-seq 1NP(生物学的材料の価値がある約20細胞)および15のoligo-seq 100NPサンプル(生物学的材料の価値がある約50細胞)から計算した。スピアマンの順位相関(R)を>1 TPMで発現される遺伝子で実施した。(C)遺伝子あたりのOligo-seq発現値は、1NPおよび100NPコレクション戦略で高度に再現性があり、1NPはy軸および100NPはx軸である。スピアマンの順位相関(R)を、プローブOL1823に含まれる全遺伝子で実施した。
特異的遺伝子でのRNA存在量のOligo-seq検出。mESC、XEN細胞および肝臓細胞からの超極薄凍結切片を、洗浄、レーザーマイクロダイセクションならびにオリゴヌクレオチドプローブおよびゲノムDNAの増幅前、オリゴヌクレオチドプローブ(設計B;OL1823)とハイブリダイズした。オリゴプローブから別々のライブラリー調製後、サンプルをプールし、シークエンシングした。100NPサンプルのオリゴヌクレオチドプローブからの生シークエンシングデータのゲノムブラウザトラック。X軸は、各示す遺伝子をカバーするセントロメアからテロメア方向でのゲノム座標を表す。x軸下の四角(ゲノムブラウザトラック)は、標的位置重複エキソンの位置を表す。OL1823の全プローブを、排他的にエキソンまたはエキソン-イントロン接合部にマッピングした。遺伝子トラックは、プローブ参照地図にマッピングされたプローブ数を示す。全プローブ参照は線形ゲノム順に並べられる。ハウスキーピング遺伝子であるYwhae、mESCに特異的に発現されるOct4、XEN細胞に特異的に発現される(そして、少数のmESC-F123で)Gata4および肝臓細胞で発現されるAldobの4遺伝子に注目した。
Oligo-seqはmESC-F123からの単一超極薄細胞スライスにおけるOct4およびYwhaeの特異的発現を捕捉する。散布図はオリゴプローブ設計B(OL1823)を使用するoligo-seq解析後、mESC-F123から得た個々の1NPサンプルからシークエンシングされたAldob、Gata4またはBdnf(Y軸)およびOct4、YwhaeまたはAldob(X軸)についてUMI数(または遺伝子あたり標的位置数に対して正規化されたUMI数)の関係を示す。Oct4およびYwhae遺伝子はmESCで発現され、Aldobはされず、Gata4はmESC-F123集団の細胞の小数でのみ発現される。
Oligo-seqはXEN細胞からの単一超極薄スライスにおけるGata4およびYwhaeの特異的発現を捕捉する。散布図はオリゴプローブ設計B(OL1823)を使用するoligo-seq解析後、XEN細胞から得た個々の1NPサンプルからシークエンシングされたAldob、Gata4またはBdnf(Y軸)およびOct4、YwhaeまたはAldob(X軸)についてUMI数(または遺伝子あたり標的位置数に対して正規化されたUMI数)の関係を示す。Gata4およびYwhae遺伝子はmESCで発現され、一方Aldob、Oct4およびBdnfは発現されない。
Oligo-seqは成体肝臓細胞からの単一超極薄スライスにおけるAldobおよびYwhaeの特異的発現を捕捉する。散布図は、オリゴプローブ設計B(OL1823)を使用するoligo-seq解析後、肝臓細胞から得た個々の1NPサンプルからシークエンシングされたAldob、Gata4またはBdnf(Y軸)およびOct4、YwhaeまたはAldob(X軸)についてUMI数(または遺伝子あたり標的位置数に対して正規化されたUMI数)の関係を示す。AldobおよびYwhae遺伝子は肝臓細胞で発現され、一方Gata4、Oct4およびBdnfは発現されない。
指定されたoligo-seqである本発明の方法は、短一本鎖オリゴヌクレオチドの該核酸へのストリンジェントなハイブリダイゼーション、続いてハイブリダイズしたオリゴの単離および最後にシークエンシングまたはPCR増幅後、組織、細胞または区画における核酸、例えば、種々のRNA種の存在または存在量を検出する。オリゴヌクレオチドは、目的の核酸ならびにオリゴ増幅および検出および、例えば、RNA種への割り当ての目的で使用される既知配列のフランキング領域と相同性の領域の両方を含む(図1)。oligo-seqのより高機能の実施は、区画のゲノムDNA内容物の回収およびシークエンシングと並行したRNAハイブリダイズしたオリゴプローブの抽出およびシークエンシングにより、RNA検出とゲノムアーキテクチャマッピングを合わせる(図3b)。別の実施は、類似のオリゴヌクレオチド配列での別のタイプのプローブ(例えば抗体)のタグ付けまたはサンプルのタグ付けを含む(例えば組織切片からの種々の空間座標または診断設定における大規模な並行シークエンシングを可能とするための種々の患者からのサンプル)。
好ましいプローブ構造
各プローブの中心標的領域は、マウスゲノム(mm10アセンブリ)内の1つの個々の標的位置にユニークであり、約35~50bps長である(相同性領域、HR;図1)。各標的配列を、二次構造の形成のあらゆる可能性を除外し、40%ホルムアミドで中47~60℃のストリンジェントな洗浄に耐えるための熱的安定性を有することを確認する。
所望により、標的領域の何れかの側は、OL66ライブラリー原理の証明に示すとおり、配列バーコードである(図1、オリゴ設計A)。5’バーコード(B1)は、ある遺伝子をターゲティングする全プローブにより共有され、3’バーコード(B2)同じ遺伝子のエキソンまたはイントロンをターゲティングする全プローブにより共有される。B1およびB2は、FISHまたはqPCRを介する種々の遺伝子の領域の独立したターゲティングを可能とする。バーコードは、相補性を示さず、故に特異的RNAへのフランキング領域の非特異的結合を回避することを確実にするためにゲノム配列全体(mm10アセンブリ)に対してアラインする。
各プローブ末端に、2個のユニバーサルプライマー領域がある(UP1およびUP2;図1)。まず、これらは元のストックからのプローブの増幅を可能とする。第二に、シークエンシングのための各オリゴへのIllumina互換性プライマーの容易な付加が可能である。さらに、ユニバーサル標的領域を、何れにしても、本発明では必須ではない工程である、最適化段階中の目的の区画におけるプローブハイブリダイゼーションの成功の迅速な検証のためのFISHのための標的位置として使用できる。
別の設計において、プローブ構造は、エキソン/イントロンに割り当てられたバーコードなしに、目的のRNA種および5’および/または3’ユニバーサルプライマー配列と相同性の配列のみ含む。プローブ構造はまたある標的位置性質、FISHによる検出との互換性(検証/最適化目的のため)およびPCR方法(最適化のためおよびスタンドアロン実装として)のための1以上のバーコード配列も含み得る。プローブ構造はまたPCRバイアスを低減し、プローブ存在量測定に解像度を上げるために、UMIも含み得る(図1)。
典型的に4~12塩基対のランダムヌクレオチド糸のであるユニークな分子識別子(UMI)が、これとは別にまたは加えて、含まれ得る(図1、オリゴ設計BおよびC)。無作為の確立で、UMIは、オリゴのハイブリダイズプールの各ターゲティングオリゴにユニークであり、すなわち同じ標的領域をターゲティングするオリゴは種々のUMI配列を有する。UMIを使用して、シークエンシング後精度を高め、サンプルに存在する元のプールRNAを定量的に評価する。
2個のプローブ設計が構築され、2個の別のプローブライブラリーの特性である。プローブライブラリーオリゴ-ロット66(OL66)をオリゴ設計として図1に示し、それは、約35bpの標的領域、2個のフランキングバーコード領域および各末端にユニバーサルプライマー領域を有する。プローブライブラリーオリゴ-ロット1823(OL1823)は、約45bpの標的領域、2個のフランキングユニバーサルプライマーおよび8bp UMIを有する(図1、オリゴ設計B)。
原理の証明:RNA検出
原理の証明ライブラリーOL66について、66遺伝子のサブセットに焦点を当てた(図2a)。その後のライブラリー、OL1823は、1823遺伝子をカバーするよう拡張された(図2b)。
OL66について、この実施方法で使用した細胞型に適した重要な細胞型マーカーを選択した。oligo-seqの異なる細胞型を区別する力について試験することを目的とした。これは、66遺伝子が十分であるかの試験ならびに遺伝子あたり必要なプローブ数、区画における非特異的プローブ保持のレベルおよび高度および低度発現遺伝子に対する感受性の決定を必要とした。マウス胚性幹細胞(mESC;細胞株F123)および胚外内胚葉細胞(XEN細胞株IM8A1)の異なる遺伝子発現プロファイルを有する2個の発達的に近い細胞型ならびに成体組織内のマウス肝臓細胞での作業を選択した。mESCまたはXEN細胞で発現する遺伝子に特異的なプローブを選択した。例えば、Oct4遺伝子はmESCで発現され、かつXEN細胞で発現されず、一方Gata4遺伝子はXEN細胞で発現され、かつmESCで発現されない。非発現転写物に対するプローブのバックグラウンド保持評価のために、ニューロンで発現する遺伝子に特異的なプローブおよびドーパミン作動性ニューロンに特異的ないくつか(例えばTh、チロシンヒドロキシラーゼの富豪である)も含んだ。mESCおよびXEN細胞は活発に分裂する。それ故に、さらに両細胞型で発現されるが、細胞周期段階により分裂細胞集団の異なる細胞で種々のレベルである、細胞周期マーカーの試験を選択した。核亜区画に優先的局在化し、3Dアーキテクチャに役割を有する、高度に発現され、十分に研究されているlncRNAに対するプローブも含めた(Malat1、Firre、Neat1およびXist)。多能性因子をコードするRNAに対するプローブも含めた。例えば、Nanogは、mESC集団内で種々のレベルで発現し、XEN細胞で発現しない転写因子である。oligo-seqの感受性を探索するため、長さに応じて遺伝子について種々の数のプローブも含め、例えば1100プローブ(全プローブの9.8%)を、mESCまたはXEN細胞で発現されない長ニューロン遺伝子であるSatb2に、17プローブをmESCで発現され、XEN細胞でされないやや短い遺伝子Sox2に割り当てた。種々のレベルで発現するハウスキーピング遺伝子に対するプローブも含めた(遺伝子YwhaeおよびEif3hは高度に発現され、遺伝子FaimおよびAlyref2は低レベルで発現される)。試験したハウスキーピング遺伝子全てESC対ドーパミン作動性ニューロンで分化タイムラインにわたり均一発現を示す(Ferrai et al., 2017, RNA polymerase II primes Polycomb-repressed developmental genes throughout terminal neuronal differentiation. Mol. Syst. Biol. 13, 946)。種々の発現レベルの遺伝子の考慮は、目的の遺伝子の発現の検量を助ける可能性があり、成功した実験設計の細胞型非依存的対照を提供する。
第二のプローブライブラリーOL1823(90,941の個々のオリゴプローブ;CustomArray, Inc.から、方法参照)は、Nanostring.comからのマイクロアレイ解析に使用した複数パネルの遺伝子を特徴づけた。OL1823ライブラリーで、意図する標的細胞型および非発現遺伝子の発現範囲を陰性または非特異的バックグラウンド対照をカバーする、遺伝子のはるかに大きな幅を標的化した。選択した遺伝子は、次の細胞周期、誘導型多能性幹(IPS)細胞、幹細胞、幹細胞シグナル伝達、幹細胞転写因子、造血発生、ポリコームとトリソラックス標的遺伝子、神経伝達物質受容体、学習および記憶、DNA損傷修復、クロマチン修飾酵素、クロマチンリモデリング複合体、Notch経路、WNT経路、サイトカイン、Hippo経路、間葉性幹細胞、Notch標的遺伝子、代謝経路のナノストリング遺伝子パネルに集中し、そのうち1310/1823遺伝子は、mESCで100万あたり1を超える転写物で発現し、513/1823は発現しない。
OL66について、イントロンをターゲティングするプローブを減らした極めて長い遺伝子以外、全遺伝子をエキソンおよびイントロンを含む完全な範囲に対して標的化した(図2a)。従って、各遺伝子がターゲティンするプローブ数は遺伝子毎に異なり、これは、遺伝子あたりのターゲティングプローブ数間の関係および発現を検出する能力の評価ならびに各遺伝子からの最大量の情報の回収の手段としてこの原理の証明で意図的であった。例えば、標的RNA領域の転写物または配列組成物の異なる領域が好ましい特異性および感受性を有するか否かの理解を目的とした。
OL1823について、標的位置をエキソンおよびエキソンイントロン重複に限定した。39~45ヌクレオチドの標的位置を、オリゴペイントからの公的に利用可能なデータベース、目的の遺伝子と重複するmm10「ストリンジェント」のゲノム座標により決定し、核酸配列を鎖性について補正した。OL1823標的位置を、mm10ゲノムアセンブリについて47℃ハイブリダイゼーション温度、47~52℃Tmおよび18量体kmer長となるよう設計した(https://www.pnas.org/content/115/10/E2183).(https://oligopaints.hms.harvard.edu/genome-files)。
将来的には頑健な検出能を提供する、適用が異なれば変わり得る最小数のプローブを使用する実施を期待しており、例えば、複合組織における細胞型の組成の定義に必要なプローブまたは遺伝子数は、細胞型の発現プロファイルにおける処置または疾患の影響の定義と異なり得る。
種々の長さ、発現パターン(例えばmESCまたはXEN細胞のみまたは両者または何れでもない、例えばニューロン遺伝子)および発現レベルの66遺伝子をカバーするオリゴヌクレオチドのライブラリー、OL66を、ニューロンに分化したmESCの公開されたRNA-Seqデータに基づき、選択した(Ferrai et al. 2017)(図2)。各遺伝子について、プローブは、イントロンを含まない遺伝子以外、エキソンまたはイントロンをカバーするオリゴヌクレオチドを含んだ。いくつかの例では、遺伝子のエキソン(例えば、H3f3a)は単一オリゴヌクレオチドによってのみカバーされ、他方、Lhx1などの別の遺伝子のエキソンは、99個のオリゴヌクレオチドプローブによりカバーされた。同様に、遺伝子のイントロンは、種々の量のオリゴヌクレオチドプローブによりカバーされた。例えば、Hspa8のイントロンは7個のオリゴヌクレオチドによりカバーされ、他方Satb2のイントロンは、1031個のオリゴヌクレオチドによりカバーされた。ニューロン遺伝子Bdnfは、ESCにおけるRNA検出のバックグラウンドおよび特異性の調査のために、計531個のプローブによりカバーされた。
1823遺伝子をカバーするオリゴヌクレオチドのライブラリー、OL1823について、上記ナノストリングパネルにおける全遺伝子が含まれた。例えば、遺伝子Hmcn1は、最大数313個のプローブによりカバーされ、遺伝子Ubb、Ndufb4、Pcna、Ifna1、Cbx3、Bcl2a1aは最小1個のプローブでカバーされた。
生物学的材料および超極薄凍結切片化
原理の証明として、mESC、XEN細胞および肝臓(組織)細胞からの超極薄凍結切片を使用して、oligo-seqを実装した。薄核凍結切片を樹脂包埋非存在下、修飾Tokuyasu方法により産生した(Tokuyasu, K. T., 1973; Guillot 2004; Pombo et al., 1999)。HEPES緩衝化電子顕微鏡法グレードホルムアルデヒドを使用して固定後、細胞を飽和スクロース溶液に包埋することにより凍結保護し、続いて液体窒素で凍結した。約220nm厚の超極薄凍結切片を、-100℃でLeica Ultracut凍結ミクロトームで切断し、ハイブリダイゼーション検証のためにカバーガラスにまたはoligo-seqのためにレーザーマイクロダイセクションPENスライドに移した。
超極薄凍結切片のRNA-FISHによるオリゴライブラリーハイブリダイゼーションの検証
oligo-seqプローブOL66がマウスESCに効率的にハイブリダイズするか否かを試験するために、初めて超極薄凍結切片に蛍光ベースのインサイチュハイブリダイゼーション(RNA-FISH)を使用した。超極薄凍結切片は、HeLa細胞でFITC標識オリゴ-dTプローブの効率的なハイブリダイゼーションを可能にしながら、核および細胞質両者における細胞RNA内容物を保持し(Xie SQ and Pombo A., 2006, Distribution of different phosphorylated forms of RNA polymerase II in relation to Cajal and PML bodies in human cells: an ultrastructural study. Histochem. Cell Biol. 125, 21-31; Branco et al., 2006)、HepG2細胞で活性化後、uPA/PLAU遺伝子発現として単一短RNAの効率的な検出を提供することが知られる(Ferrai et al., 2010)。
固定およびスクロース包埋mESCからの凍結切片へのoligo-seqライブラリー(OL66)のハイブリダイゼーション後、非結合または部分的にハイブリダイズしたプローブをストリンジェントに洗浄し、切片に保持されるハイブリダイズプローブを、オリゴヌクレオチドプローブにおけるフランキング領域のユニバーサル配列と相同性を有する、蛍光標識された、短いssDNAオリゴヌクレオチドとの二次ハイブリダイゼーションにより確認した(Beliveau et al., 2012)。予想通り、蛍光シグナルは、クロマチン間ドメインまたはスプライシングスペックルと称される核のクロマチンが少ない領域(矢印;図4)を含み、細胞質および核で検出された。ハイブリダイズしたRNAに対するオリゴ検出の特異性を、RNAeで切片を前処理(図4、+RNAe)および、新生および成熟リボソームRNAで多いが、本プローブライブラリーで標的化されるタンパク質コード転写物にはない、核小体におけるプローブシグナルの非存在(アスタリスク;図4)により確認した。
凍結切片のOligo-seqハイブリダイゼーション
原理の証明として、oligo-seqとGAMを組み合わせ、mESC、XENおよび肝臓組織細胞からの超極薄凍結切片を使用した。オリゴヌクレオチドプローブおよび細胞ゲノムDNAを同時に抽出し、GAM過程によるゲノムDNAと並行して、オリゴ配列を増幅した(図3に記載のとおり)(Beagrie et al. (2017); Beagrie et al., 2020, Multiplex-GAM: genome-wide identification of chromatin contacts yields insights not captured by Hi-C. bioRxiv 2020.07.31.230284; doi: https://doi.org/10.1101/ 2020.07.31.230284)。mESCまたはXEN細胞における細胞型特異的転写物の存在または非存在の初めての探索として、図5bに概説する方法により、ユニバーサルプローブ配列と相同のプライマーを使用するqPCRの使用により始めた。レーザーマイクロダイセクション(LMD)プラスチック被覆スライド上のクレシルバイオレット染色凍結切片のLMDを使用して、方法に記載するとおり、RNAeを使用して前処理した(a)mESC-F123、(b)XEN細胞および(c)mESC-F123細胞から数バッチの約100個の単一核スライスを単一PCRチューブに集めた。mESC(Sox2、Oct4)およびXEN細胞(Sox17、Gata6)特異的遺伝子は、各細胞型でより濃縮され(すなわち少ないPCRサイクル増幅値で検出され)(図6a)、両細胞型で発現される高度発現Malat1 lncRNAと等しい濃縮を示した。何れの細胞型でも発現されないニューロンマーカーであるBDNFは、RNAe処理mESCを含む解析された全サンプルで、高数のPCRサイクルを示した。RNAe処理mESCサンプルは、細胞型特異的遺伝子シグネチャーの濃縮はなかった。
次に、図3bに記載するパイプラインを使用するライブラリーの産生により、NGSを使用するoligo-seqを開発した。GAMパイプライン内のゲノムDNAの抽出および増幅のために社内で開発したアプローチを適応した。適応したMalbac方法は、Winick-Ng, et al. 2020 (also published as Winick-Ng et al. (2021) Cell-type specialization is encoded by specific long-range chromatin topologies. Nature, in press)に概説され、下の方法に概要を詳述するオリゴプローブの並行検出のために、MALBAC全ゲノム増幅アプローチ(hong C et al. 2012 Genome-Wide Detection of Single Nucleotide and Copy Number Variations of a Single Human Cell, Science, 338(6114): 1622-1626.)に基づく。
簡潔には、サンプルからのプローブからシークエンシングライブラリーを産生するために、各オリゴの末端にIllumina Nexteraキットと配列互換性が付加されたプライマーを設計した。これらのプライマーは、プローブおよびゲノムDNAが同時に同じ反応でPCR増幅されるよう、社内全ゲノム増幅に直接に組み込まれた。過剰のプライマーをエキソヌクレアーゼIで消化した。次に、増幅オリゴプローブおよびゲノムDNA両者を含むPCR反応物を二つに分け、同じサンプルからのプローブおよびゲノムDNA(1NPまたは100NPを含む)が独立して増幅されるようにした(図3b)。プローブおよびゲノムDNAシークエンシングライブラリーを、別々にインデックスをつけた。所望により、ペプチド核酸(PNA)をプライマーおよびオリゴミスマッチング由来の望まないシークエンシング結果を減らすために、プロトコールのインデックス工程に含めてよい。GAM方法中使用したGAT-COM配列に相補的なPNAを、最終シークエンシングライブラリーにおけるGAT-com配列を含むリードの防止のために含めた。次いで、DNAライブラリーをNextSeq Illuminaシークエンサーの同じランでシークエンシングされるよう、プールした(75bpリード長、シングルエンドシークエンシング)。OL66を使用して、各々1NPを含む96サンプル由来の96ゲノムおよび96プローブライブラリーを含むmESCからの計198個のDNAライブラリー;および各々100NPを含む6サンプル由来の6ゲノムおよび6プローブライブラリーを含む6個のDNAライブラリーを産生した(表4)。また表4に記載するとおり、オリゴハイブリダイゼーション前RNAeで処理したmESCおよびXEN細胞から類似のライブラリーを産生した。シークエンシング後(ゲノムライブラリーについて200万~400万リード、約500,000リード/プローブライブラリー)、リードを逆多重化して、一方はRNA-GAMオリゴプローブおよびもう一方は細胞ゲノムDNAのための、サンプルあたり2個の別のFastqファイルを得た。詳細な記載は下の方法に概説する。
ゲノムシークエンシングファイルを、参照マウスゲノム(アセンブリmm10)にマッピングし、各サンプルは、数パラメータ、特にオーファンウインドウのパーセンテージ(<60%)およびユニークなマッピング可能なリード数(>25000)の、GAMデータ解析に典型的な品質管理解析に合格した(Beagrie et al. 2017, Winick-Ng et al. 2020)。これらのパラメータは、稀に起こる抽出不完全、レーザーマイクロダイセクション失敗または汚染の情報をもたらす(原理の証明実験で集めた154個の1NP生物学的サンプル中、129個がQC合格)。品質管理を、例えば、Winick-Ng et al., 2020に記載のとおり実施し得る。表4は、集めた全サンプルをリストする。プローブセットからの配列リードをマッピングするため、プローブ特異的バーコードおよびプライマーを含む全プローブ配列と並列するプローブ参照配列マップを構築し、プローブをmm10におけるゲノム位置の順番に維持した。Bowtie2で決定してマッピング品質が悪い、すなわち、一つのユニークな位置にマッピングされる確率が低い低品質リードを除いた。各プローブが75bpリード長について同じ出発位置(5’末端)からRNA標的相同性配列にシークエンシングされたため(図1、図7)、oligo-seqから得た生データは、目的のRNA種のユニークな標的位置あたり、プローブに相同な配列リードのカウントがバラバラであった。次いで、RNAの単純要約統計量を、直接にプローブ参照ゲノムにアラインされたリードカウントに基づき適応した。プローブライブラリーOL1823について、UMIツールを使用して、UMIを配列リードからコンピューターにより抽出し、重複排除して、個々のプローブシークエンシングの定量的カウントを得た(https://umi-tools.readthedocs.io/en/latest/index.html)。
Figure 2023547394000005
Figure 2023547394000006

Figure 2023547394000007
Figure 2023547394000008
単一核プロファイル(1NP)または百NP(100NP)の単一PCRチューブへのレーザーマイクロダイセクション後、mESC-F123、RNAe処理mESC-F123およびXEN細胞からなる3個のOL66コレクションを作成した(表4)。100NPサンプルを、各サンプルにおける約3~5細胞の総細胞材料内容物に対応する「バルク」サンプルとして集めた。100NP mESCまたはXEN細胞を含む種々のセットのサンプルのプローブ参照地図へのマッピング後、特にエキソン領域でハウスキーピング遺伝子(Ywhae)にマッピングされたオリゴプローブの検出の明らかな証拠があった。エキソン領域での好ましいオリゴ検出が、発現遺伝子のエキソンが、転写位置(新生RNA)だけでなく、タンパク質への翻訳のために核から細胞質に移動する成熟mRNA分子の両者に存在するため、機体される(図8a)。対照的に、イントロン配列も発現遺伝子のイントロンをとおして検出されたが、イントロンは典型的に短命であり、新生mRNAのスプライシングによりすぐに分解されるため、存在量が少ない。各細胞型に特異的な遺伝子の濃縮もOL1823で見られ、Oct4はmESCで、GATA4はXEN細胞で、Aldobは肝臓で高度に濃縮され、Ywhaeは全細胞型で高度に濃縮された(図15)。
次に、凍結切片におけるRNAのoligo-seqマッピングが、GAMにおけるようなゲノムDNAの検出を妨害するか否かを試験した。1NPサンプルのシークエンシングから得られたリード分布は、予想通りランダム配向での核の切片化によりサンプル間で異なるゲノムDNA検出の稀な、しかし連続的濃縮パッチと共に予測される特性を示すことが発見された(図8b)。この観察は、特に薄い(200nm厚)凍結切片などの細胞内区画からのゲノムDNAの抽出および検出が、特に、生物学的サンプルがDNA抽出前に付加的過程(例えばoligo-seq)に付されるとき、汚染されやすい可能性があるため、重要であった。しかしながら、GAMとoligo-seqの組み合わせの実装は、集めたサンプルの大部分(OL66で約85%およびOL1823で約62%のサンプルが>25,000ユニークにマッピングされたリードおよび<60%オーファンウインドウ)が、GAMデータについての現在のQCフィルタリング工程に合格したため、成功した。
細胞型特異的遺伝子、Aldob(肝臓)、Oct4(mESC)およびGata4(XEN細胞)の濃縮も、個々の1NP由来OL1823について遺伝子全体(図8a)のプローブカウントを合計したとき、明白であった。個々の1NPについて予想通り、ニューロンマーカーBDNFは、XEN細胞、mESCおよび肝臓細胞にわたり検出が低度であった。
OL66について、一部遺伝子について、転写開始位置からの最初の5プローブが細胞型特異的情報の同定に十分であった(図9a)。例えば、Sox2(mESC特異的)と相補的な高存在量のオリゴヌクレオチドおよびSox17(XEN特異的)に相補的なオリゴヌクレオチドとハイブリダイズしたmESCからの凍結切片の比較およびSox17についてその逆(図9b)。
サンプルあたりの各遺伝子のプローブカウントの合計は、UMAP(https://umap-learn.readthedocs.io/en/latest/basic_usage.html)を使用して、mESC、肝臓およびXEN細胞型から作成したサンプルの細胞型特異的クラスターを得ることに成功し、各サンプルがその既知細胞型により発現される転写物が濃縮していることが示された(図10、図11)。クラスタリングは、oligo-seq配列に基づく、先の標準化、遺伝子あたりの生プローブカウント以外のRNA存在量の測定学の改善の探索および低品質プローブおよびサンプルの潜在的フィルタリングによりさらに改善され得る。
OL1823について、mESC、XEN細胞および肝臓細胞の間にある、細胞型特異的転写物の検出の特異性についてさらに確認した(図16~18)。Aldob(肝臓マーカー遺伝子、Gata4(XEN細胞マーカー)およびBdnf(ニューロンマーカー)は単一(1NP)mESC凍結切片から集めたoligo-seqデータでは、予想通り、LIF添加血清におけるmESC培養における3~5%Gata4陽性細胞の存在による少数のデータセットの稀な例外はあったが、発現されなかった。対照的に、Oct4(mESCマーカー)またはYwhae(細胞周期マーカー)(図16)。Aldob、BdnfおよびOct4は単一(1NP)XEN細胞凍結切片で発現されず、一方Gata4およびYwhaeは発現された(図17)。最後に、単一(1NP)肝臓細胞凍結切片において、AldobおよびYwhaeの発現は検出されたが、Oct4またはGata4はされなかった(図18)。
サンプルあたりの各遺伝子のプローブカウントの合計は、UMAP(https://umap-learn.readthedocs.io/en/latest/basic_usage.html)を使用して、mESC、肝臓およびXEN細胞型から作成したサンプルの細胞型特異的クラスターを得ることに成功し、各サンプルがその既知細胞型により発現される転写物が濃縮していることが示された(図10、図11)、重要なことにOligo-seqは、XEN様細胞系譜と区別される3~5%のmESC細胞を捕捉できた(図11)。クラスタリングは、oligo-seq配列に基づく、先の標準化、遺伝子あたりの生プローブカウント以外のRNA存在量の測定学の改善の探索および低品質プローブおよびサンプルの潜在的フィルタリングによりさらに改善され得る。
oligo-seqにより検出されるトランスクリプトーム発現の直線性を調査するために、mESCにおける100NPまたは1NPのOL1823を使用して、各遺伝子から検出された発現値と、同じ細胞型のバルク合計RNA-Seqを相関させた。図14に見られるとおり、1NPおよび100NPデータは両者ともバルクRNA-Seqによる数百万の細胞から定量された遺伝子発現と高度に相関し、1TPM(スピアマンの順位検定R=0.85)を超え、ノイズは、典型的に、遺伝子発現の最低閾値と考えられる1TPM未満のバルクRNA-Seqおける遺伝子発現の低いかつ一定レベルであった。oligo-seqの特異性を、oligo-seqハイブリダイゼーションおよびさらなるプロセシング前にRNAe Aで前処理したサンプルからの発現の定量により試験した(図13)。100NPおよび1NP両者で、最低発現範囲(1~10TPM)の遺伝子を含む、RNAe処理サンプルを超える高い遺伝子発現が、発現レベルと無関係に、発現遺伝子について検出される(片側t検定P<0.001)。RNAe処理サンプルでoligo-seqにより検出された重要でないバックグラウンド遺伝子発現レベルは、遺伝子発現と無関係であり、アッセイの特異性および感受性を示す。
oligo-seqとGAM(RNA-GAM)の組み合わせがどのように細胞状態特異的3Dゲノム情報を提供できるかを例示するために、その発現により染色体3上のSox2座を含むゲノム領域の3Dゲノム配座を調査した(図12)。Sox2転写物が最も高度に検出されたRNA-GAMサンプル(157/507)と、低/非検出RNA-GAMサンプル(269/507)を分けることにより(図12b)、Sox2座が、最低Sox2プローブカウントを有した細胞で高度に圧縮され(強い接触を伴う)、最高Sox2転写物発現の細胞で高度に脱凝縮されていることを発見した(図12a)。
本データから、RNA存在量および遺伝子発現情報が、oligo-seqを使用して、単一細胞からの単一薄スライスまたは百のこのようなスライスを含む各サンプルから回収できると結論付けられる。重要なことに、oligo-seq配列リードのみに基づき、胚の最初の細胞系譜関与を表す細胞株からの2個の極めて近い細胞型を使用して、起源細胞型によりサンプルをバイアスなくクラスターすることが可能であり、おそらく、複合異種性組織からの細胞型クラスタリングを可能とし得る。一つの驚くべきアウトカムは、発現検出に必要なプローブが少ない、約5であることであった(図9a、下部パネル;図9b、下部パネル)。
液滴単一細胞シークエンシングテクノロジーへの拡張の可能性を有するoligo-seqの独立した適用として、懸濁液中の細胞を使用するoligo-seqの適用を試験した。溶液に細胞全体(mESC、クローン46C)を集め、細胞を下記方法により集め、oligo-seqハイブリダイゼーションを溶液中OL66で実施した。ポストハイブリダイゼーションおよびストリンジェントな洗浄後、細胞をPBSに再懸濁し、約1~20 mESCを異なるPCRウェルに別々に分注し、細胞型特異的遺伝子に対するオリゴプローブの存在を、方法において詳述するとおりqPCRにより解析した。予想通り、mESCは、初期プローブライブラリー組成物(ストックから直接のプローブ)と比較して、mESC発現遺伝子(Sox2およびOct4)および遍在的に発現される遺伝子lncRNA Malat1の濃縮を示した。予想通り、mESCは、XEN細胞で発現される遺伝子(Sox17およびGata6)に特異的なオリゴプローブのわずかに検出可能な濃縮およびニューロンマーカーBdnfの濃縮無しを示した(図6b)。
フローサイトメトリー技術を単一細胞の単離のために組み込んだ。細胞全体のハイブリダイゼーション後産生したOligo-seqサンプルは、薄い凍結切片から産生したものと同等であり、それ故にまた上に示す結果により示されるとおり、同じオリゴライブラリーおよび構造(図1)でシークエンシングするためにハイブリダイズ、抽出および増幅されたため、次世代シークエンシングのために増幅された。シークエンシングの生物学的結果も一貫したままである。
材料および方法
標的位置同定
遺伝子本体およびエキソンを標的とするプローブ配列を、FASTA形式でゲノム配列にコンパイルした。ゲノム配列をまず反復配列を除外するためにスクリーニングし得る(http://repeatmasker.org/)。潜在的標的位置をホモポリマーラン、「N」塩基、標的位置長、GC内容物ならびに最近傍動態により予測される好都合のおよび一貫した融解温度についてフィルタリングされ得る(SantaLucia J, Jr (1998) A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics. Proc Natl Acad Sci USA 95:1460-1465)。これらのフィルターを通過した全候補位置をFASTQ形式にコンパイルでき、次いで、標的種の全ゲノムに対してアラインし、各候補位置がユニークであり、ゲノムの複数位置にアラインされていないことを確認できる;NGSデータのための公的に利用可能な一般的に使用されるアライナはBowtieおよびBWAである(Langmead B, Trapnell C, Pop M, Salzberg SL (2009) Bowtie: An ultrafast memory efficient short read aligner. Genome Biol 10:R25. 46; Langmead B, Salzberg SL (2012) Fast gapped-read alignment with Bowtie 2. Nat Methods 9:357-359. 47; Li H, Durbin R (2010) Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics 26:589-595)。NGSアライナはまた設計プローブの標的位置へのマッピング可能性についても情報をもたらす。フィルターしたかつユニークなセットの標的位置を、二次構造についてフィルター(Dirks RM, Pierce NA (2003) A partition function algorithm for nucleic acid secondary structure including pseudoknots. J Comput Chem 24:1664-1677)、重複標的位置および過剰なkmerを除去または連結するため、公的に利用可能なソフトウェアで確認し得る(Marcais G, Kingsford C (2011) A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27:764-770)。標的位置をRNAターゲティングに必要なDNA鎖の何れかの側を標的とするよう、逆相補に変換できる。標的位置配列およびゲノム範囲を、標準的BED形式にフォーマット化でき、ゲノムブラウザの表示およびデータ取り扱いを容易にし得る(Quinlan AR, Hall IM (2010) BEDTools: A flexible suite of utilities for comparing genomic features. Bioinformatics 26:841-842)。各oligo-seqプローブの特異性を、最終的に適切な対照(例えばRNAe処理または生物学的関連する組織)を使用して実験的に検証し、部分的または完全に非特異的であるならば、データ解析から計算的に除去される。別々のレベルのオリゴで同定された非特異的結合事象を除去する能力は、検出方法で個々のオリゴ間の区別ができない、FISHおよびナノストリングにより例示されるマイクロアレイベースのテクノロジーなどの別のISH技術を超える明確な利点である。
プローブ合成
ssDNAオリゴを CustomArray, Inc.(Bothell, WA 98011, US)からオーダーした。CustomArrayは、CMOS半導体テクノロジーを使用して同時に合成される、数千のオリゴヌクレオチドを含むライブラリーを提供する。
オリゴライブラリーの元のストックを、ライブラリーUP1およびUP2内の全プローブに存在するユニバーサルプライマー末端に相補的なプライマーを使用して、PCR増幅し、dsDNAライブラリーに安全に貯蔵した(図1)。オリゴライブラリーを、Beliveau et al. 2017に概説のとおり、T7増幅および逆転写反応によりハイブリダイゼーションのためにssDNAプローブストックに変換した。別の増幅方法は、例えば、https://oligopaints.hms.harvard.edu/protocolsから得ることができる。
UMIを、次のとおり、先のPCRにより各オリゴの5’末端に付加した:(KAPA GC緩衝液(KB2501) 20μl、配列番号10プライマー100μMストック0.5μl、配列番号4 100μMストック0.5μl、dNTPs(KN1009)ミックス10mM 4μl、KAPA HiFiポリメラーゼ(KE2004) 1U/μlストック5μl、50ngオリゴライブラリーストック、水を100μlまで)。PCRを次のとおり実施した:95℃で5分間、(95℃で30秒間、58℃で30秒間、72℃で45秒間)×12、72℃で5分間。次いで、付加オリゴライブラリーを上記のとおり続けて、ssDNAプローブストックを作成した。
細胞増殖および固定
薄い凍結切片でoligo-seqで使用したマウスES細胞(mESC)は、F123系列であった。懸濁液中の細胞全体でoligo-seqしたマウスES細胞(mESC)は、E14tg2aのSox1-GFP誘導体である46C系列であった。
mESC(クローンF123)を、有糸分裂不活性化されているフィーダーマウス胚線維芽細胞(MEF)層で培養した(GSC-6201G, Global Stem)。フィーダー細胞を、37℃でフィーダー培地(90%DMEM(11995-065, Gibco)、10%FBS)で増殖させ、播種後最大10日で使用した。mESC培養1日前、皿を0.1%ゼラチンで被覆し、不活性化フィーダー細胞を約1500細胞/mm2の密度で播種した。フィーダーが落ち着いた後(播種約4~12時間後)、mESCをフィーダー層に播種し、15%ノックアウト血清代用物(KSR, 10828028, Invitrogen)、1×Glutamax(35050, Gibco)、10mM 非必須アミノ酸(11140-050, Gibco)、50μM ベータ-メルカプトエタノール(31350010, Gibco)、1000U/ml LIF(GFM200, Cell Guidance Systems)添加mESC-F123培地(DMEM(11995-065, Gibco)で37℃で増殖した。細胞を48時間毎に新規フィーダー被覆皿に分け、培地を24時間毎に変えた。典型的に、2継代後、フィーダー細胞を、細胞を非被覆皿に30分間分けることにより、mESC培養から除去した。MEFは速く沈降し、一方mESCは懸濁したままである。細胞懸濁液を、さらに30分間新規非被覆プレートに移し、フィーダー除去効率を上げ、その後細胞をゼラチン被覆皿に播種した(ESGRO Complete Gelatine; SF008, Merck)。フィーダー除去を48時間後繰り返した。その後mESCを収集のために播種した。フィーダー除去により培養中のLIFレベルが減少するため、細胞が無フィーダー培養条件にあるとき、培地のLIF濃度を倍増させた。細胞を、約48時間後、70~80%コンフルエンシーで収集した。
mESC、クローン46C、細胞を、37℃で5%(v/v)CO2インキュベーターで、ゼラチン被覆(0.1%(v/v))Nunc T25フラスコで、10%(v/v)ウシ胎児血清(FCS; PAA, # A15-151)、2U/mL LIF(Millipore, # ESG1107)、0.1mM β-メルカプトエタノール(Invitrogen, # 31350-010)、2mM L-グルタミン(Invitrogen, # 25030- 024)、1mM ピルビン酸ナトリウム(Invitrogen, # 11360039)、1%ペニシリン-ストレプトマイシン(Invitrogen # 15140122)、1%MEM 非必須アミノ酸(Invitrogen, # 11140035)添加GMEM培地(Invitrogen, # 21710025)で増殖させた。培地を毎日交換し、細胞を隔日で分けた。サンプル取得前、mESCを1U/mL LIF含有無血清ESGRO Complete Clonal Grade培地(Millipore, # SF001-500)で、ゼラチン被覆(0.1%(v/v))Nunc 10cm皿に播種した。細胞を48時間増殖させ、培地を24時間で交換した。
マウス胚外内胚葉(XEN)細胞は、原始内胚葉由来である(Kunath et al., 2005, Imprinted X-inactivation in extra-embryonic endoderm cell lines from mouse blastocysts. Development 132, 1649-1661)。XEN細胞(クローンIM8A1、Kunath et al., 2005)を、0.1%ゼラチン被覆表面上、20%FCS、2mM L-グルタミン、1mM ピルビン酸ナトリウムおよび0.1mM β-メルカプトエタノール添加RPMI中、37℃で5%CO2インキュベーター中培養した。
肝臓組織をMoeller A et al (2012 Mol. Cell. Proteomics, 10.1074/mcp.M111.011767-2)に記載のとおり処理した。簡潔には、肝臓組織を、PBS、続いて0.25M HEPES-NaOH溶液中4%の新たに脱重合したパラホルムアルデヒドで心臓内還流後採取した。組織を冷4%PFA/HEPES溶液中1.5mm片に解剖し、8%PFA/HEPESで固定(2時間)した。固定組織を2.1Mスクロース/PBS溶液に包埋し、oligo-seqのための凍結切片まで液体窒素で凍結し、保存した。
凍結切片調製
細胞を、先に記載のとおり凍結切片化のために調製した(Beagrie et al. 2017)。簡潔には、細胞を、250mM HEPES-NaOH中4%および8%パラホルムアルデヒドで
固定し(pH7.6;それぞれ10分間および2時間)、ペレット化し、PBS中2.1Mスクロースに包埋し(2時間)、銅スタブ上液体窒素で凍結した。凍結細胞を、無限に液体窒素中で保存し得る。金属製フレーム付スライド(Leica)のLMD 4μm PEN膜を、疎水性ペンで約1×2cmの小矩形を描くことにより調製した。凍結切片化前、凍結切片切断に使用したガラスナイフおよび凍結切片移動のためのLMD PEN膜をUV処理した(45分間、λ=385nm)。超極薄凍結切片をUltraCutUCT 52ウルトラクライオミクロトーム(Leica, Milton Keynes, UK)で、ガラスナイフで約220nm厚に切断した。切片をPBS滴中無RNAe2.1Mスクロースの液滴に捕捉し、銅ループに保持し、レーザーマイクロダイセクション(Leica, Milton Keynes, UK)のためのLMD 4μm PEN膜被覆ガラススライドまたはRNA-FISHのためのカバーガラスに移した。
LMD PEN膜上の細胞/組織凍結切片のオリゴプローブハイブリダイゼーション
インキュベーションのためのハイブリダイゼーションオーブンを、チャンバーを徹底的に綺麗にし、無菌水で湿らせた吸い取り紙を導入し、その後37℃に温めた(または30℃~60℃であるが、理想的には37℃、温度が高いほど、特異性が上がる)。全工程を無RNAe条件で実施し、全試薬は分子生物学グレードであった。
LMDスライド(oligo-seqのため)またはカバーガラス(RNA-FISHのため)上の凍結切片を、0.2μm濾過分子生物学グレードPBSで洗浄し(3回、各5分間)、凍結切片からスクロース溶液を洗い流した。凍結切片を、PBS中0.5%(V/V) Triton X-100で透過処理し(10分間)、続いてPBSで洗浄した(3回、各5分間)。
陰性対照サンプルについて、凍結切片を、Triton X-100処理後RNAeで処理した。先の工程からの2回目のPBS洗浄後、凍結切片を2×SSCで濯ぎ、加湿チャンバー中、2×SSC中250マイクログラム/mL RNAe A中、インキュベートした(2時間、37℃)。未処理サンプルを、2×SSC中、室温(約20℃)または4℃に置いた。
一次プローブハイブリダイゼーション混合物(2×SSC、30%ホルムアミド、2mM バナジルリボヌクレオシド複合体、1mg/mL 酵母tRNA、10%硫酸デキストラン、0.1μM一次プローブ)を78℃(3分間)で変性し、氷塊で冷却し、透過化およびRNAe処理完了まで、最大4時間、4℃に維持した。
プローブでのハイブリダイゼーション前、凍結切片を、PEN膜の凍結切片を含む側のみ洗浄緩衝液(30%ホルムアミド、2×SSC、2mM バナジルリボヌクレオシド複合体)で濯ぎ(2回)、洗浄緩衝液でインキュベートした(5分間、室温)。洗浄緩衝液を注意深く除去し、過剰の緩衝液を、UV処理濾紙を使用してLMDスライドの端から除去した。一次プローブハイブリダイゼーション混合物(40μL)を、凍結切片位置上のLMD側に置いた。RNAse-Free Hybrislip(Invitrogen)を注意深く一次プローブハイブリダイゼーション混合物に重層し、次いでラバーセメントで密封した。ハイブリダイゼーション後Hybrislip(Molecular Probes)の除去を助けるため、豊富な量のラバーセメントを適用し、スライドの金属縁まで拡張した。サンプルを、ハイブリダイゼーションオーブン中、加湿チャンバーでOL66は37℃またはOL1823は47℃(または30℃~60℃、理想的には37℃)でインキュベートした(36時間または4~48時間)。
ハイブリダイゼーション後、LMDスライドのラバーセメント層を、洗浄緩衝液で軽く覆うことにより、緩め、Hybrislipと共に注意深く除いた。PEN膜上の凍結切片をすぐに洗浄緩衝液で濯いで、乾燥を避けた。過剰の一次プローブを除去するためのストリンジェントな洗浄を、OL66について47℃で洗浄緩衝液で実施した(3回、各20分間)。OL1823について、ストリンジェントな洗浄を2×SSCで室温で実施した(4回、各5分間)。洗浄緩衝液または2×SSCをPBSで洗浄して(3回、各5分間)除去した。LMDスライドを1回水で濯ぎ、1%クレシルバイオレット水溶液中インキュベートした(20分間)。過剰のクレシルバイオレットを、LMDスライドの表および裏を水で洗浄し(各3回)、乾燥させて、その後すぐにLMDに進んだ(レーザーマイクロダイセクション前のハイブリダイズしたサンプルの保存は、例えばPBS中、4℃で可能であるかもしれないが、保存について現在試験していない)。
核プロファイルの単離
個々のNPを、63倍乾燥対物を使用する、Leicaレーザーマイクロダイセクション顕微鏡(Leica Microsystems、LMD7000)を使用して、レーザーマイクロダイセクションにより凍結切片から単離した。個々の細胞からのスライスを、明視野イメージング下に同定し、レーザーを使用して、各細胞周囲のスライド膜を切断した。切断細胞スライスを、PCR接着式キャップ(AdhesiveStrip 8C opaque; Carl Zeiss Microscopy #415190-9161-000)に集めた。各プレートコレクションにおいて、100NPまたは1NPに等しい面積の2個の空膜領域を陰性対照として集めた。これらの陰性対照を、品質管理目的でシークエンシングライブラリーの製造にも使用した。AdhesiveStripキャップ上のレーザー顕微解剖サンプルを、さらに使用するまで-20℃で貯蔵した。
WGA
GAT-7N:GTGAGTGATGGTTGAGGTAGTGTGGAGNNNNNNN(配列番号1)
GAT-COM:GTGAGTGATGGTTGAGGTAGTGTGGAG(配列番号2)
OL66プローブプライマーフォワード:GGCACAACGTTGCAGCACAG(配列番号3)
OL66/OL1823プローブプライマーリバース:CACCAACGCTACCAGCTCCG(配列番号4)
OL66プローブプライマーA MeRevフォワード:
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGCACAACGTTGCAGCACAG(配列番号5)
OL66/OL1823プローブプライマーB MeRevリバース:
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCACCAACGCTACCAGCTCCG(配列番号6)
OL1823プローブプライマーフォワード:GACCAGCCCACATCGCACTG(配列番号7)
OL1823プローブプライマーA MeRevフォワード:
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGACCAGCCCACATCGCACTG(配列番号8)
PNA配列:GTGAGTGATGGTTGAGGTAGTGTGGAG(配列番号9)
OL1823UMI添付 - GACCAGCCCACATCGCACTGNNNNNNNNGGCACAACGTTGCAGCACAG(配列番号10)
溶解ミックス:(21mM Tris-HCl pH=8.0、1.4nM EDTA pH=8、グアニジニウム-HCl pH=8.5、3.5%Tween 20、0.35%Triton X-100、123μgのQiagenプロテアーゼ(19157)、合計体積10μl
2×DeepVent緩衝液:2×Thermo Pol反応緩衝液(B9004s)、4mM MgSO4(B1003s)、400μM dNTPs(N0447L)
PCRミックス1(OL66):1.333×DeepVent緩衝液、0.666μM GAT-7n、0.0066μM OL66プローブプライマーフォワード(配列番号3)、0.0066μM OL66プローブプライマーリバース(配列番号4)、80U/mL DeepVentポリメラーゼ
PCRミックス1(OL1823):1.333×DeepVent緩衝液、0.666μM GAT-7n、0.0066μM OL1823プローブプライマーフォワード(配列番号7)、0.0066μM OL1823プローブプライマーリバース(配列番号4)、80U/mL DeepVentポリメラーゼ
PCRミックス2(OL66):1×DeepVent緩衝液、1.2μM GAT-COM、0.12μM OL66プローブプライマーフォワード(配列番号3)、0.12μM OL66プローブプライマーリバース(配列番号4)、60U/mL DeepVentポリメラーゼ、0.4mM dNTPs。
PCRミックス2(OL1823):1×DeepVent緩衝液、1.2μM GAT-COM、0.12μM OL1823プローブプライマーフォワード(配列番号7)、0.12μM OL66プローブプライマーリバース(配列番号4)、60U/mL DeepVentポリメラーゼ、0.4mM dNTPs。
プローブPCRミックス(OL66):1×DeepVent緩衝液、1μM OL66プローブプライマーA MeRevフォワード(配列番号5)、1μM OL66プローブプライマーB MeRevリバース(配列番号6)、30U/mL DeepVentポリメラーゼ
プローブPCRミックス(OL1823):1×DeepVent緩衝液、1μM OL1823プローブプライマーA MeRevフォワード(配列番号8)、1μM OL1823プローブプライマーB MeRevリバース(配列番号6)、30U/mL DeepVentポリメラーゼ
ゲノムPCRミックス:1×DeepVent緩衝液、1μM GAT-COM、30U/mL DeepVentポリメラーゼ
溶解ミックス(10μL)を96ウェルプレートの各ウェルに添加した。96ウェルプレートをレーザー顕微解剖サンプルを含むLMDキャップで閉じ、しっかり密封した。96ウェルプレートを倒置し、溶解ミックスを、倒置プレートを200×gで2分間穏やかに回転させることにより、キャップの蓋に集めた。サンプルを、一夜、60℃でインキュベートして、サンプルを消化させた。
翌日、96ウェルプレート緩衝液を、2分間、200×gで遠心分離することにより、ウェルの底に集めた。プロテアーゼを、PCR機械で75℃で30分間、熱不活性化した。
ゲノムDNAの線形増幅および同時プローブ増幅のために、30μLのPCRミックス1を各ウェルに加え、次のとおりインキュベートした:95℃-5分間、11×(60℃-50秒間、20℃-50秒間、30℃-50秒間、40℃-45秒間、50℃-45秒間、65℃-7分間、95℃-20秒間)、72℃-5分間。一般に、本発明の方法において、この工程のプライマー濃度は並外れて低くてよく、例えば、フォワードおよびリバースプライマー各々0.001μM未満でよい。
ゲノムDNAおよびプローブの同時増幅のために、20μLのPCRミックス2を各ウェルに加えた。これを次のとおりインキュベートした[95℃-3分間、3x(95℃-20秒間、58℃-30秒間、72℃-3分間)、72℃-3分間]。
過剰のプライマーを、各ウェルに5μLのエキソヌクレアーゼ溶液[1×エキソヌクレアーゼ緩衝液(M0293L)、10Uエキソヌクレアーゼ1(M0293L)]を加えて除去し、37℃で40分間インキュベートし、続いて72℃で20分間、エキソヌクレアーゼを熱不活性化した。
プローブのPCR増幅のために、30μLの各ウェルからの反応ミックスを新規96ウェルプレートに移し、20μLのプローブプライマーミックスを新規96ウェルプレートの各ウェルに加え、次のとおりインキュベートした、95℃-3分間、18×(95℃-20秒間、60℃-30秒間、72℃-1分間)72℃-3分間。並行して、ゲノムDNAのPCR増幅のために、20μLのゲノムPCRミックスを約30μLの元の反応ミックスを含む元のプレートの各ウェルに加え、次のとおりインキュベートした:95℃-3分間、24×(95℃-20秒間、58℃-30秒間、72℃-3分間)、72℃-3分間)。プレートをさらに使用するまで-20℃に維持した。
シークエンシングまで:
ゲノムDNAプレートおよびプローブDNAプレートを、1.7×および1.8×SPRIビーズで浄化し、20μLの超純水(Sigma)で溶出した。DNA濃度を、Quant-iT Picogreen dsDNA定量アッセイで定量した。
各サンプルのゲノムDNA濃度を1ng/μL濃度に正規化した。ゲノムDNAを、直接Illuminaシステムと互換性の社内Tn5ライブラリー調製プロトコールを使用して、インデックスをつけ、ライブラリーにした(Winick-Ng, W., et al., 2020, Cell-type specialization in the brain is encoded by specific long-range chromatin topologies, Biorxiv. https://doi.org/10.1101/2020.04.02.02099)。簡潔には、計5μLで(250mM TAPS-HCl pH8.5、10%PEG、250μM MgCl2、1ngゲノムDNA)を含む反応ミックスで、タグメンテーションミックスを、55℃で7分間、転位反応のためにインキュベーションした。Tn5を、70℃で5分間、さらにインキュベートすることにより、熱不活性化した。96ウェルプレートのゲノムDNAを、Nextera XTシステムからのSet A I5およびI7 Illuminaバーコードに対応するプライマーでインデックスをつけた。PCRミックス(5μL)を、直接に転置されたDNAに加えた(PCRミックスは2.5×KAPA GC緩衝液(KB2501)、0.9mM dNTPs(KN1009)、0.06U/μL KAPA HiFiポリメラーゼ(KE2004)、2.5μM i5プライマー、2.5μM i7プライマーからなった)。PCRを、次のとおりインキュベートした(95℃-30秒間、12×(95℃-10秒間、55℃-30秒間、72℃-30秒間)、72℃-5分間)。
ミラー96ウェルPCRプレートのオリゴプローブからのDNA増幅を、KAPA Biosystems HiFiキットを使用するIllumina Set B I5 I7 Set Bインデックスに付加することにより、PCRにより直接にインデックスをつけた。PCRミックスは、計10μLで1×KAPA GC緩衝液(KB2501)、0.45mM dNTPs(KN1009)、0.03U/μL KAPA HiFiポリメラーゼ(KE2004)、1.25μM i5プライマー、1.25μM i7プライマー)および1μLのプローブDNAサンプルからなった。所望によりGAT-Com配列(配列番号9)と相補のPNAを、ここで、最終PCR溶液に20μM濃度で加えて、OL1823ライブラリーに加えた、最終ライブラリーにおけるGAT-Com含有DNA断片を減らした。PCR反応を次のとおり実施した(95℃-30秒間、9×(95℃-20秒間、60℃-30秒間、72℃-2分間)、72℃-5分間)。
インデックスをつけたゲノムDNAプレートおよびプローブDNAプレートを1.7×SPRIビーズで浄化し、20μL 超純水(Sigma)で溶出した。DNA濃度を、Quant-iT Picogreen dsDNA定量アッセイで定量した。
ゲノムDNAライブラリーサンプルを等濃度で合わせた(計96ライブラリー)。別に、プローブサンプルも等濃度で合わせた(計96ライブラリー)。各プールしたシークエンシングライブラリーを2回1.6×SPRIビーズ精製で純化し、50μL 超純水で溶出した。合わせたプールの濃度を、Qubit高感受性dsDNAアッセイで決定した。平均断片サイズをBioAnalyzerで決定した。次いで、合わせたゲノムおよびプローブライブラリーをシークエンシング前に等モル濃度で一緒にプールした。ライブラリーを、Illumina NextSeq500シークエンサーで単一ハイスループットシークエンシングランでシークエンシングした(75bpシングルエンド)。
ローブおよびゲノムDNAマッピングプ
各ゲノムDNAライブラリーからのシークエンシングリードを、Bowtie2をデフォルト設定で使用してマウスゲノムアセンブリGRCm38(Dec. 2011、mm10)にマッピングした。全ユニークにマッピングされていないリード、マッピング品質<20のリードおよびPCR重複を除外し、さらなる解析から除いた。
DNAライブラリー由来の各プローブからのシークエンシングリードを、Bowtie2をデフォルト設定で使用して既知プローブ配列にマッピングした。全ユニークにマッピングされていないリードおよびマッピング品質<20のリードを除外し、さらなる解析から除いた。各プローブのカウントを、各リードの最初の75bp内のリード数として各遺伝子について定義された。Bedtools‘マップ’機能を、各位置の各プローブのカウントに使用した。
OL1823ライブラリーのUMI重複排除のため、UMI_toolsを使用した。UMI-tools dedup機能をデフォルト設定で使用して、まずUMIを、各シークエンシングリード(umi_tools抽出 -- --bc-パターン=CCCCCCCCCCCCCCCCCCCCNNNNNNNNCCCCCCCCCCCCCCCCCCCC)、配列番号11から抽出し、UMIを各BAMファイルについて重複排除した。
ssDNAのPCRベースの検出
核凍結切片を4mm AdhesiveStrip 8C不透明ZEISS LMDキャップで、-20℃でさらに使用するまで保存した。
10μLの溶解ミックスを、96ウェルプレートの各サンプルウェルに加えた。プレートを凍結切片を含むLMDキャップで閉め、しっかり密封した。96ウェルプレートを倒置し、溶解ミックスを、倒置プレートを200×gで2分間穏やかに回転させることにより、キャップの蓋に集めた。サンプルを一夜、60℃でインキュベートした。
翌日、96ウェルプレート緩衝液を、2分間、200×gで遠心分離することにより、ウェルの底に集めた。プロテアーゼを、PCR機械で75℃で30分間、熱不活性化した。
30μLのPCRミックス(20μL 2×DeepVentポリメラーゼ、0.16μLフォワードプライマー、0.16μLリバースプライマー、1.8μL 100U/ml DeepVentポリメラーゼ)を各ウェルに加えた。これを増幅した(95℃-3分間、30x(95℃-20秒間、58℃-30秒間、72℃-1分間)、72℃-3分間)。PCRミックスを1.8×SPRIビーズで浄化し、Qubit hsDNAアッセイにより濃度を決定した。全サンプルを0.2ng/μLに正規化した。qPCRを次のとおりミックスした(2.5μL正規化サンプル、12.5μL 2×Sybr-Green PCRマスターミックス、0.75μL 10μMプライマーストック(フォワードおよびリバースプライマー両者を含む)、PCR反応体積25μL 水で調節、分子生物学グレード)。qPCRを次のとおり実施した:95℃-5分間、40×(95℃-30秒間、60℃-15秒間、72℃-30秒間)。
検証および最適化手段としてのssDNAの蛍光ベースの検出
oligo-seqプローブを使用するRNA-FISHのために、一次プローブの同じストックおよびハイブリダイゼーション条件を使用した。蛍光顕微鏡でハイブリダイズしたoligo-seqプローブを可視化するために、凍結切片を橋および二次プローブでハイブリダイズした(図4b)。
一次:[ユニバーサルプライマー1][バーコード1][標的相同性][バーコード2][ユニバーサルプライマー2]
橋:[バーコード相同性][TTヒンジ][二次相同性]
二次:[AlexaFluor647][AA][橋相同性][AA][AlexaFlour647]
mESC-F123凍結サンプルからの凍結切片(220nm厚)をカバーガラス(1cm直径)に移し、PBSで洗浄し(3回、各5分間)、PBS中0.1%(V/V)Triton X-100で透過処理し(10分間)、PBSで洗浄した(3回、各5分間)。サンプルを2×SSCで濯ぎ、2×SSC中、4℃で2時間保存するかまたは加湿チャンバーで2×SSC中250μg/ml RNAe Aでインキュベートした(2時間、37℃)。
一次プローブハイブリダイゼーション混合物(2×SSC、30%ホルムアミド、2mM バナジルリボヌクレオシド複合体、1mg/mL 酵母tRNA、10%硫酸デキストラン、0.1μM一次プローブ)を78℃(3分間)で変性し、氷塊で冷却し、凍結切片の準備ができるまで、最大4時間、4℃で維持した。
プローブでのハイブリダイゼーション前、凍結切片を、洗浄緩衝液(30%ホルムアミド、2×SSC、2mM バナジルリボヌクレオシド複合体)で濯ぎ(2回)、洗浄緩衝液でインキュベートした(5分間、室温)。洗浄緩衝液を注意深く除去し、過剰の緩衝液を、UV処理濾紙を使用して、カバーガラスの端から除去した。一次プローブハイブリダイゼーション混合物(8μL)をRNAse-Free Hybrislip(Invitrogen)に置き、カバーガラスを一次プローブハイブリダイゼーション混合物に注意深く重層し、次いでラバーセメントで密封した。サンプルを、ハイブリダイゼーションオーブン内の加湿チャンバーで37℃(または30℃~60℃、理想的には37℃)でインキュベートした(36時間(二夜)または4~48時間)。
ラバーセメントを、洗浄緩衝液で軽く覆うことにより、緩めた。その後、ラバーセメントを注意深く除去した。凍結切片をすぐに洗浄緩衝液で濯いで、乾燥を避けた。過剰の一次プローブを除去するためのストリンジェントな洗浄を、47℃(または37℃~65℃、理想的には47℃;温度が上がると、特異性が上がる)で洗浄緩衝液で実施した(3回、各20分間)。
洗浄緩衝液を、2×SSCでの洗浄(3回)により除去した。過剰の緩衝液を注意深くUV処理濾紙で除去した。二次ハイブリダイゼーション緩衝液(8μL)を、UV光から保護されたパラフィルムに乗せ、凍結切片を含むカバーガラスの側を、(30%ホルムアミド、2×SSC、1.6μM 二次オリゴ、1.4μM 橋オリゴ)を含む二次ハイブリダイゼーション緩衝液とインキュベートした。過剰の二次オリゴを除去するためのストリンジェントな洗浄を、2×SSC、40%ホルムアミド(3回、各5分間)で室温で、穏やかに振盪させながら実施した。次いで、カバーガラスを2×SSCで5分間洗浄した。カバーガラスを最後に1×PBS(3回、各5分間)で洗浄し、4℃で保存するかまたはDAPI-Vectashieldにマウントし、Leica共焦点顕微鏡で造影した。凍結切片からの画像を、405nmダイオードおよび白色光レーザーを備えた共焦点レーザー走査顕微鏡(Leica TCS SP8;63×対物、NA 1.4)で、1 Airyディスクに等しいピンホールを使用して、獲得した。種々のチャネルからの画像を連続的に集め、蛍光裏抜けを回避した。
溶液内oligo-seq詳細
mESC(クローン46C)をNunc T75フラスコに播種し(4.5×106細胞)、48時間、mESC-46C培地+LIFで増殖させた。細胞をPBS中0.05%トリプシン(2個のNunc T75フラスコ各2.5mL)でトリプシン処理した(2分間、37℃)。トリプシン処理を、10mlのLIF不含mESC-46C培養培地で停止させた。次いで、2個のフラスコの内容物を、50mL三角フラスコ(25mLの単一細胞懸濁液)にプールし、3分間、280×gで遠心分離した。細胞をScepterTM 2.0 Handheld自動化細胞カウンターでカウントした(PBS中1:10希釈)。上清を除去し、細胞をmESC-46C培養培地+LIFに5×106細胞/mL濃度で再懸濁した。細胞を1.5mLチューブに、5×106細胞/チューブで等分した。
トリプシン分離mESCを、900×gで10分間、4℃でペレット化した。次いで、細胞を1×PBSで洗浄し、500μLの1×PBSに再懸濁した。細胞を4%電子顕微鏡法グレードホルムアルデヒドのPBS溶液(1mL)で20分間、室温で、500μLの8%ホルムアルデヒドの1×PBS溶液を、回転輪にRTで加えることにより固定した。細胞を300×gで6分間、4℃でペレット化し、濯ぎ、1×PBSで5分間洗浄した。細胞を300×gで6分間、4℃でペレット化して、細胞を再ペレット化した。細胞を再懸濁し、200μLの0.5%Triton X-100のPBS溶液で、10分間、氷上、穏やかに振盪させながら透過処理した。700μLのPBSを加え、細胞を300×gで6分間、4℃でペレット化した。この工程の間、一次プローブを78℃で3分間変性させ、直接に急速に冷却するために氷塊に移動させて、復元を回避した。
細胞を再懸濁し、5分間穏やかに振盪させながら1×洗浄緩衝液(30%ホルムアミド、2×SSC、2mM バナジルリボヌクレオシド複合体)中インキュベートし、300×gで6分間、4℃で遠心分離した。全緩衝液を注意深く除去し、細胞を穏やかに100μLの一次プローブハイブリダイゼーション混合物(30%ホルムアミド、2×SSC、2mM バナジルリボヌクレオシド複合体、0.1μM一次プローブ、1mg/ml 酵母tRNA、10%硫酸デキストラン)に再懸濁し、一夜、37℃で穏やかに回転する加湿チャンバーでインキュベートした。
900μLの1×EWBを直接に1.5mLチューブに加え、500×gで6分間ペレット化した。上清を除去し、細胞500μLの1×EWBに再懸濁し、20分間、47℃で洗浄した。細胞を2000×gで3分間ペレット化し、上清を除去し、500μL 1×EWBに再懸濁し、20分間、47℃で洗浄した。細胞を2000×gで3分間ペレット化し、濯ぎ、1×PBSで洗浄した(2洗浄各5分間)。細胞を50μLの1×PBSに再懸濁した。約1-20細胞を96ウェルプレートの別のウェルにPBSの5μL溶液で等分し、-20℃でさらに使用するまで保存した。
17μLの溶解緩衝液(30mM Tris-HCl pH8.0、2mM EDTA pH8.0、0.8 M グアニジニウム-HCl pH8.5、5%Tween-20、0.5%Triton X-100)および3μLのQiagenプロテアーゼ(Cat 19157)を各サンプルウェルに加えた。サンプルを一夜、60℃でオービタル振盪しながらインキュベートした。プロテアーゼを、翌日75℃で30分間熱不活性化した。40μLのPCRミックス(2x DeepVent溶液、0.24μLの100μMフォワードプライマー、0.24μL 100μMリバースプライマー、1.8μL DeepVentポリメラーゼ、8μL 超純水)を各ウェルに加えた。PCRを次のとおり実施した:95℃-3分間、30x(95℃-20秒間、58-30秒間、72℃-1分間)、72℃-3分間)。
PCRミックスを1.8×SPRIビーズで浄化し、濃度を、Qubit hsDNAアッセイを実施して決定した。全サンプルを0.2ng/μLに正規化した。qPCRミックスを次のとおり製造した(2.5μL正規化サンプル(0.5ng 合計)、12.5μL Sybr-Green[TS1]、0.75μL 10μMプライマーストック(フォワードおよびリバースプライマー両者を含むfor目的の遺伝子)、PCR-Clean水を25μL)。qPCRを次のとおり実施した:95℃-5分間、40x(95℃-30秒間、60℃-15秒間、72℃-30秒間、Sybr-greenのためのプレートリード)。
RNA-Seqデータ
mESC-F123からの総RNA-Seqデータを、Kempfer(2020, Chromatin folding in health and disease: exploring allele-specific topologies and the reorganization due to the 16p11.2 deletion in autism-spectrum disorder. PhD thesis, Humboldt University of Berlin. doi:10.18452/22071)に記載のとおり、産生した。RNAをTRIzol Reagentで抽出し、DNaseで処理した。RNA-Seqライブラリーを、製造業者の指示に従い、Illumina TruSeq Stranded総RNAライブラリー調製キットを使用して作製した。ライブラリーは、NextSeq500シークエンサーでペアエンド75bpでシークエンシングした。
参考文献
1. Josefsen, K. and Nielsen, H. (2011) Northern Blotting Analysis. Methods Mol Biol. 703, 87-105.
2. https://www.thermofisher.com/de/de/home/references/ambion-tech-support/ribonuclease-protection-assays/general-articles/the-basics-what-is-a-nuclease-protection-assay.html).
3. Miller, M.B. and Tang, Y.-W. (2009) Basic Concepts of Microarrays and Potential Applications in Clinical Microbiology., Clin Microbiol Rev. 22(4): 611-633.
4. https://www.illumina.com/documents/products/techspotlights/techspotlight_sequencing.pdf
5. Stark R., Grzelak, M. and Hadfield, J. (2019) RNA sequencing: the teenage years. Nature Reviews Genetics 20, 631-656.
6. Ziegenhain C., Vieth, B., Parekh, S., Reinius, B., Guillaumet-Adkins, A., Smets, M., Leonhardt, H., Heyn, H., Hellmann, I. and Enard, W. (2017) Comparative Analysis of Single-Cell RNA Sequencing Methods. Mol Cell. 85(4), 631-643.
7. Beliveau, B.J., Joyce, E.F., Apostolopolous, N., Yilmaz, F., Fonseka, C.Y., McCole, R.B., Chang, Y., Li, J.B., Senaratne, T., N., Williams, B.R., Rouillard, J.M. and Wu, C.T. (2012) Versatile design and synthesis platform for visualizing genomes with Oligopaint FISH probes. Proc Natl Acad Sci 109(52), 21301-6.
8. Geiss GK, Bumgarner RE, Birditt B, et al. (2008) Direct multiplexed measurement of gene expres-sion with color-coded probe pairs. Nat Biotechnol. 26(3), 317-325.
9. Stahl PL, Salmen F, Vickovic S et al. (2016) Visualization and analysis of gene expression in tissue sections by spatial transcriptomics. Science 353(6294), 78-82.
10. WO2019/157445
11. Merritt et al. (2020) Multiplex digital spatial profiling of proteins and RNA in fixed tissue. Nature Biotechnology 38, 586-599.
12. Marshal et al. (2020) HyPR-Seq: Single-cell quantification of chosen RNAs via hybridization and sequencing of DNA probes. BioRxiv preprint doi: https://doi.org/10.1101/2020.06.01.128314 (also published as Marshal et al., 2020, HyPR-Seq: Single-cell quantification of chosen RNAs via hybridization and sequencing of DNA probes. PNAS 117(52), 33404-33413).
13. Tropini et al. (2017) The Gut Microbiome: Connecting Spatial Organization to Function. Cell Host & Microbe 21(4), 433-442.
14. Liu et al. (2017) Low-abundant species facilitates specific spatial organization that promotes multispecies biofilm formation. Environ Microbiol. 19, 2893-905.
15. Liu et al. (2019) Deciphering links between bacterial interactions and spatial organization in multispecies biofilms. The ISME Journal 13, 3054-3066.
16. Tokuyasu, K. T. (1973) A technique for ultracryotomy of cell suspensions and tissues. , J. Cell Biol. 57, 551-65.
17. Guillot P.V., Xie S.Q., Hollinshead M., Pombo A. (2004) Fixation-induced redistribution of hyperphosphorylated RNA polymerase II in the nucleus of human cells. Exp. Cell Res. 295, 460-468.
18. Pombo A, Hollinshead M, Cook PR (1999) Bridging the resolution gap: Imaging the same transcription factories in cryosections by light and electron microscopy. J. Histochem. Cytochem. 47, 471-480.
19. McDowall et al. (1989) The structure of organelles of the endocytic pathway in hydrated cryosections of cultured cells, Eur. J. Cell Biol. 49, 281 - 294.
20. Chen et al. (2014) Nano-Dissection and Sequencing of DNA at Single Sub-Nuclear Structures. Small 10:3267.
21. Lucic V., et al. (2013) Cryo-electron tomography: The challenge of doing structural biology in situ. J Cell Biol 202 (3), 407.
22. https://www.protocols.io/view/Stellaris-RNA-FISH-Protocol-for-FrozenTissue-iwgs5v
23. https://www.protocols.io/view/exfish-tissue-slice-n6adhae
24. Branco, M. R. & Pombo, A. (2006) Intermingling of chromosome territories in interphase suggests role in translocations and transcription-dependent associations. PLoS Biol. 4, e138.
25. Xie, S.Q. et al. (2006) Splicing speckles are not reservoirs of RNA polymerase II, but contain an inactive form, phosphorylated on Serine2 residues of the C-terminal domain. Mol. Biol. Cell 17, 1723-1733.
26. Branco, M. R. (2006) Correlative microscopy using Tokuyasu cryosections: applications for immunogold labelling and in situ hybridisation. Cell Imaging (Methods Express Series)」, ed. D. Stephens, Scion Publishing Ltd. (Bloxham, UK), 201-217.
27. Ferrai, C., et al. (2010) Poised transcription factories prime silent uPA genes prior to activation. PLoS Biology 8, e1000270.
28. Macosko et al. (2015) Highly Parallel Genome-wide Expression Profiling of Individual Cells Using Nanoliter Droplets. Cell 161(5), 1202-1214.
29. Levsky, J.M. et al. (2002) Single-cell gene expression profiling. Science 297, 836-840.
30. Tripathi et al., 2015, RNA Fluorescence In Situ Hybridization in Cultured Mammalian Cells. In: Carmichael G. (eds) Regulatory Non-Coding RNAs. Methods in Molecular Biology (Methods and Protocols), vol 1206. Humana Press, New York, NY. https://doi.org/10.1007/978-1-4939-1369-5_11.
31. Pombo, A. (2003) Cellular genomics: which genes are transcribed when and where? Trends Biochem. Sci. 28, 6-9.
32. Winick-Ng, W., et al., 2020, Cell-type specialization in the brain is encoded by specific long-range chromatin topologies, Biorxiv. https://doi.org/10.1101/2020.04.02.020990.
33. Moeller et al. (2012) Proteomic analysis of mitotic RNA polymerase II complexes reveals novel in-teractors and association with proteins dysfunctional in disease. Mol. Cell. Proteomics 11(6):M111.011767.
34. https://www.protocols.io/view/Stellaris-RNA-FISH-Protocol-for-FrozenTissue-iwgs5v
35. https://www.protocols.io/view/exfish-tissue-slice-n6adhae
36. Domiguez and Kolodney (2005) Wild-type blocking polymerase chain reaction for detection of single nucleotide minority mutations from clinical specimens. Oncogene 24, 6830-6834.
37. Pombo, A., et al. (1994) Adenovirus replication and transcription sites are spatially separated in the nucleus of infected cells. EMBO J. 13(12), 5075-5085.
38. Femino, A.M., et al. (1998) Visualization of Single RNA Transcripts in Situ. Science, 280(5363).
39. Beliveau et al. (2017) In situ super-resolution imaging of genomic DNA with OligoSTORM and OligoDNA-PAINT. Methods Mol Biol. 1663, 231-252.
40. https://oligopaints.hms.harvard.edu/protocols
41. Dhanoa, J. K., Sethi, R. S., Verma, R., Arora, J. S., & Mukhopadhyay, C. S. (2018). Long non-coding RNA: its evolutionary relics and biological implications in mammals: a review. Journal of animal science and technology, 60, 25.
42. Catalanotto, C., Cogoni, C., & Zardo, G. (2016) MicroRNA in Control of Gene Expression: An Overview of Nuclear Functions. International journal of molecular sciences, 17(10), 1712.
43. van Heesch et al. (2019) The Translational Landscape of the Human Heart. Cell 178(1), 242-260.
44. Arnold et al., (2020) Diversity and Emerging Roles of Enhancer RNA in Regulation of Gene Ex-pression and Cell Fate. Front. Cell Dev. Biol. 7.
45. Kristensen et al. (2019) The biogenesis, biology and characterization of circular RNAs. Nat Rev Genet. 20(11), 675-691.
46. Akhter et al. (2018) Circular RNA and Alzheimer's Disease. Adv Exp Med Biol. 2018;1087:239-243.
47. Michelini, F., Pitchiaya, S., Vitelli, V. et al. (2017) Damage-induced lncRNAs control the DNA dam-age response through interaction with DDRNAs at individual double-strand breaks. Nat Cell Biol 19, 1400-1411.
48. Lloret-Llinares et al. (2016) Relationships between PROMPT and gene expression. RNA Biol. 13(1), 6-14.
49. Feng et al.,1995, The RNA component of human telomerase. Science 269(5228), 1236-1241.
50. Weibel, E.R. (1979) Stereological Methods: Practical Methods for Biological Morphometry. Vol. 1 Academic Press, London, UK.
51. Weibel, E.R. (1980) Stereological Methods: Theoretical Foundations. Vol. 2. Academic Press, London, UK.
52. Mateo et al. (2019) Visualizing DNA folding and RNA in embryos at single-cell resolution. Nature 568, 49-54.
53. Zhao, N., et al. (2019) A Genetically Encoded Probe for Imaging Nascent and Mature HA-tagged Proteins in Vivo. Nat. Commun. 10(10) 2947.
54. Beagrie et al. (2017). Complex multi-enhancer contacts captured by genome architecture mapping. Nature. 543, 519-524.
55. Markowski et al. (2020) GAMIBHEAR: whole-genome haplotype reconstruction from Genome Architecture Mapping data. bioRxiv 2020.01.30.927061, also published as Markowski et al. (2021) GAMIBHEAR: whole-genome haplotype reconstruction from Genome Architecture Mapping data. Bioinformatics 19, 3128-3135.
56. Nagano et al. (2017) Cell-cycle Dynamics of Chromosomal Organization at Single-Cell Resolution. Nature, 547(7661),61-67.
57. van Buggenum et al. (2018) Immuno-detection by sequencing enables large-scale high-dimensional phenotyping in cells. Nature Communications.
58. Buenrostro, J. D., et al. (2015) ATAC-Seq: A Method for Assay-ing Chromatin Accessibility Genome-Wide. Current protocols in molecular biology, 109, 21.29.1-21.29.9.
59. WO 2016156469
60. Beliveau et al. (2018) OligoMiner provides a rapid, flexible environment for the design of genome-scale oligonucleotide in situ hybridization probes. PNAS 115(10), 183-192
61. GeoMxTM product brochure, available on https://www.nanostring.com/products/geomx-digital-spatial-profiler/geomx-dsp
62. Ferrai et al. (2017) RNA polymerase II primes Polycomb-repressed developmental genes throughout terminal neuronal differentiation. Mol. Syst. Biol. 13, 946.
63. Xie SQ and Pombo A. (2006) Distribution of different phosphorylated forms of RNA polymerase II in relation to Cajal and PML bodies in human cells: an ultrastructural study. Histochem. Cell Biol. 125, 21-31.
64. Beagrie et al. (2020) Multiplex-GAM: genome-wide identification of chromatin contacts yields insights not captured by Hi-C. bioRxiv 2020.07.31.230284; doi: https://doi.org/10.1101/ 2020.07.31.230284.
65. Kunath et al. (2005) Imprinted X-inactivation in extra-embryonic endoderm cell lines from mouse blastocysts. Development 132, 1649-1661.
66. http://repeatmasker.org/
67. SantaLucia J, Jr (1998) A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics. Proc Natl Acad Sci USA 95:1460-1465.
68. Langmead B, Trapnell C, Pop M, Salzberg SL (2009) Bowtie: An ultrafast memoryefficient short read aligner. Genome Biol 10:R25. 46.
69. Langmead B, Salzberg SL (2012) Fast gapped-read alignment with Bowtie 2. Nat Methods 9:357-359. 47.
70. Li H, Durbin R (2010) Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics 26:589-595
71. Dirks RM, Pierce NA (2003) A partition function algorithm for nucleic acid secondary structure including pseudoknots. J Comput Chem 24:1664-1677.
72. Marcais G, Kingsford C (2011) A fast, lock-free approach for efficient parallel counting of occurrences of k-mers. Bioinformatics 27:764-770.
73. Quinlan AR, Hall IM (2010) BEDTools: A flexible suite of utilities for comparing genomic features. Bioinformatics 26:841-842.
74. Kempfer, Rieke. (2020). Chromatin folding in health and disease: exploring allele-specific topologies and the reorganization due to the 16p11.2 deletion in autism-spectrum disorder. PhD thesis, Humboldt University of Berlin. doi:10.18452/22071. (https://edoc.hu-berlin.de/handle/18452/22777参照).
75. Takei et al. (2021) Integrated spatial genomics reveals global architecture of single nuclei. Nature, 590, 344-350.

Claims (19)

  1. 核酸を検出する方法であって、
    (a)核酸含有区画を準備し;
    (b)複数の一本鎖DNAオリゴヌクレオチドプローブと該区画内の核酸分子をハイブリダイズし;
    (c)区画内の何れの核酸とも特異的にハイブリダイズしていない一本鎖DNAオリゴヌクレオチドプローブを区画から除去し;
    (d)プローブシークエンシングまたはプローブ増幅により該区画内の核酸分子と特異的にハイブリダイズしている一本鎖DNA-オリゴヌクレオチドプローブを同定し;そして故に該区画に存在するプローブに対応する核酸を決定する
    工程を含み、
    核酸検出増幅手段として一連のプローブハイブリダイゼーションを含まない、方法。
  2. 方法がRNA単離工程を含まない、請求項1の方法。
  3. 方法がcDNA産生工程を含まない、請求項1または2の方法。
  4. 核酸がRNA、所望により、mRNAである、請求項1~3の何れかの方法。
  5. 核酸がssDNAまたはdsDNA、所望により、ssDNAである、請求項1~3の何れかの方法。
  6. 核酸含有区画が真核生物細胞、真核生物細胞の核、真核生物細胞の細胞質、ミトコンドリア、葉緑体、エキソソーム、原核生物細胞、組織における細胞群またはウイルスである、請求項1~5の何れかの方法。
  7. 核酸含有区画が工程(b)の前に切片化される、請求項1~6の何れかの方法。
  8. 核酸含有区画または細胞が工程(b)の前に生化学的に分離または解離される、請求項1~7の何れかの方法。
  9. 工程(b)の前に核酸含有区画の固定があり、ここで、所望により、核酸含有区画が固定後切片化される、請求項1~の何れかの方法。
  10. 核酸含有区画が固定されず、所望によりガラス化される、請求項1~7の何れかの方法。
  11. 一本鎖DNAオリゴヌクレオチドプローブが一対のユニバーサルプライマー領域が横にある標的核酸のヌクレオチド配列と相補的な標的領域を含み、
    ここで、所望により、一本鎖DNAオリゴヌクレオチドプローブがさらにユニークな分子識別子を含む、請求項1~10の何れかの方法。
  12. 一本鎖DNAオリゴヌクレオチドプローブが区画に存在する複数の標的核酸と特異的にハイブリダイズする、請求項1~11の何れかの方法。
  13. 一本鎖DNAオリゴヌクレオチドプローブが区画に存在する実質的に全mRNA、所望により、実質的に全RNAと特異的にハイブリダイズするライブラリーを形成する、請求項1~4および6~11の何れかの方法。
  14. 工程(c)と(d)の間に、結合一本鎖DNAオリゴヌクレオチドプローブの増幅が実施される、請求項1~13の何れかの方法。
  15. 結合一本鎖DNAオリゴヌクレオチドプローブがシークエンシング、好ましくは次世代シークエンシングにより同定される、請求項1~14の何れかの方法。
  16. 結合一本鎖DNAオリゴヌクレオチドプローブが増幅、好ましくは定量的PCRにより同定される、請求項1~13の何れかの方法。
  17. 該区画における検出された核酸をさらに空間的マッピングすることを含み、
    (i)断片のコレクションを得るために工程(b)の前に区画を切片化、凍結切片化または冷凍粉砕、好ましくは、凍結切片化し、故に局在化に依存して互いに核酸分子を分離し;
    (ii)工程(d)において各断片内の核酸分子と特異的にハイブリダイズする一本鎖DNA-オリゴヌクレオチドプローブを同定し、故に各断片におけるプローブに対応するRNAの存在または非存在を決定し;そして
    (iii)区画内に核酸をマッピングする
    工程を含む、請求項1~16の何れかの方法。
  18. 核酸、好ましくはRNAの検出を、該区画内の少なくとも1個のDNA座の検出と組み合わせ、
    - 各断片の少なくとも1個のDNA座の存在または非存在を、所望により、シークエンシング、好ましくは次世代シークエンシングにより決定し;そして
    - 該少なくとも1個のDNA座およびRNAに特異的にハイブリダイズする一本鎖DNAオリゴヌクレオチドプローブの共分離を決定する
    付加的工程を含む、請求項17の方法。
  19. (a)単一細胞、細胞群または細胞内区画における遺伝子発現の決定;
    (b)区画内のRNAのアイソフォームおよびアレル特異的バリアントの同定;
    (c)遺伝子転写の定量;そして
    (d)複合異種性組織の同定細胞型;
    (e)区画内の内因性および外因性dsDNAおよびssDNAの同定
    (f)区画におけるRNA位置のマッピング
    (g)区画におけるRNAおよび核酸座位置のマッピング
    (h)区画におけるRNAおよびタンパク質位置のマッピング
    (i)区画におけるRNA、タンパク質および核酸座位置のマッピング
    のための、請求項1~18の何れかの方法の使用。
JP2023524712A 2020-10-22 2021-10-22 オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法 Pending JP2023547394A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20203357.7A EP3988669A1 (en) 2020-10-22 2020-10-22 Method for nucleic acid detection by oligo hybridization and pcr-based amplification
EP20203357.7 2020-10-22
PCT/EP2021/079393 WO2022084528A1 (en) 2020-10-22 2021-10-22 Method for nucleic acid detection by oligo hybridization and pcr-based amplification

Publications (1)

Publication Number Publication Date
JP2023547394A true JP2023547394A (ja) 2023-11-10

Family

ID=73013259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023524712A Pending JP2023547394A (ja) 2020-10-22 2021-10-22 オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法

Country Status (7)

Country Link
US (1) US20230383336A1 (ja)
EP (2) EP3988669A1 (ja)
JP (1) JP2023547394A (ja)
CN (1) CN116391046A (ja)
CA (1) CA3195267A1 (ja)
IL (1) IL302275A (ja)
WO (1) WO2022084528A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024081869A1 (en) * 2022-10-14 2024-04-18 10X Genomics, Inc. Methods for analysis of biological samples
CN116694820A (zh) * 2023-05-25 2023-09-05 卡秋(江苏)生物科技有限公司 用于检测cmv病毒的原位杂交探针、探针组、试剂盒及检测方法
CN116994645B (zh) * 2023-08-01 2024-04-09 西安理工大学 基于交互式推理网络的piRNA与mRNA靶标对的预测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102449169B (zh) * 2009-04-01 2016-03-16 德克斯特里蒂诊断公司 化学连接依赖性的探针扩增(clpa)
US11091810B2 (en) * 2015-01-27 2021-08-17 BioSpyder Technologies, Inc. Focal gene expression profiling of stained FFPE tissues with spatial correlation to morphology
EP3031929A1 (en) * 2014-12-11 2016-06-15 Mdc Max-Delbrück-Centrum Für Molekulare Medizin Berlin - Buch Genome architecture mapping
WO2016156469A1 (en) 2015-03-31 2016-10-06 Max-Delbrück-Centrum für Molekulare Medizin Genome architecture mapping on chromatin
AU2019216973A1 (en) 2018-02-12 2020-08-27 Nanostring Technologies, Inc Biomolecular probes and methods of detecting gene and protein expression

Also Published As

Publication number Publication date
EP4200439A1 (en) 2023-06-28
CA3195267A1 (en) 2022-04-28
IL302275A (en) 2023-06-01
EP3988669A1 (en) 2022-04-27
CN116391046A (zh) 2023-07-04
WO2022084528A1 (en) 2022-04-28
US20230383336A1 (en) 2023-11-30

Similar Documents

Publication Publication Date Title
AU2021229232B2 (en) Transposition into native chromatin for personal epigenomics
CN113166797B (zh) 基于核酸酶的rna耗尽
JP2023547394A (ja) オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法
Shibata et al. Detection of DNA fusion junctions for BCR-ABL translocations by Anchored ChromPET
WO2019060914A2 (en) METHODS AND SYSTEMS FOR PERFORMING THE ANALYSIS OF A SINGLE CELL OF MOLECULAR MOLECULES AND MOLECULAR COMPLEXES
JP2019509724A (ja) ヌクレアーゼ保護を使用する直接標的シーケンシングの方法
Wang et al. Capture, amplification, and global profiling of microRNAs from low quantities of whole cell lysate
US20240150830A1 (en) Phased genome scale epigenetic maps and methods for generating maps
Smith Genetic and Epigenetic Identity of Centromeres

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20240502